Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18220
Title: Επαύξηση δεδομένων: Εξετάζοντας την αποτελεσματικότητα της τεχνικής mixup σε προβλήματα συναισθηματικής αναγνώρισης του πραγματικού κόσμου
Authors: Ψαρουδάκης, Ανδρέας
Κόλλιας Στέφανος
Keywords: Αναγνώριση συναισθήματος in-the-wild
Κατηγοριοποίηση στα βασικά συναισθήματα
Νευρωνικά Δίκτυα Βαθιάς Μάθησης
Επαύξηση δεδομένων
mixup
Issue Date: 2-Feb-2022
Abstract: Το ανθρώπινο συναίσθημα αποτελεί μια συνειδητή υποκειμενική εμπειρία η οποία μπορεί να εκδηλωθεί με ποικίλους τρόπους. Την τελευταία δεκαετία, με την ραγδαία εξέλιξη στον τομέα της Τεχνητής Νοημοσύνης, έχουν πραγματοποιηθεί πολυάριθμες μελέτες για την ανάπτυξη συστημάτων και ρομπότ που θα είναι σε θέση να αντιλαμβάνονται αυτόματα ανθρώπινα συναισθήματα και συμπεριφορές. Απώτερος στόχος είναι η δημιουργία ψηφιακών βοηθών που θα εμφανίζουν ανθρωποκεντρικό χαρακτήρα και θα αλληλεπιδρούν με τους χρήστες με όσο το δυνατόν πιο φυσικό τρόπο. Πρόκειται για ένα πολύ σύνθετο και απαιτητικό εγχείρημα μιας και η συναισθηματική αναγνώριση σε συνθήκες πραγματικού κόσμου εμπεριέχει πολλούς αστάθμητους παράγοντες. Στο πλαίσιο αυτό φαίνεται πως μπορούν να συνεισφέρουν ιδιαίτερα τα Νευρωνικά Δίκτυα Βαθιάς Μάθησης, σύγχρονα υπολογιστικά εργαλεία που έχουν την ικανότητα να διαχειρίζονται αποτελεσματικά μεγάλα σύνολα πληροφοριών. Παρά τη σημαντική ισχύ τους, τα δίκτυα αυτά είναι επιρρεπή στο φαινόμενο της υπερεκπαίδευσης. Αυτό σημαίνει πως συχνά καταλήγουν να απομνημονεύουν τα δεδομένα εισόδου, αδυνατώντας να γενικεύσουν επιτυχημένα το εξεταζόμενο πρόβλημα. Μια καλή λύση είναι η επέκταση του συνόλου εκπαίδευσης, με την προσθήκη νέων δειγμάτων. Ωστόσο, σε πολλές εφαρμογές η συγκέντρωση νέων εικόνων και η αντίστοιχη επισημείωσή τους αποτελούν μια αρκετά χρονοβόρα και δαπανηρή διαδικασία. Για το λόγο αυτό έχουν προταθεί διάφορες τεχνικές επαύξησης δεδομένων, δηλαδή μέθοδοι οι οποίες παράγουν τεχνητά νέα δείγματα, αξιοποιώντας αυτά που υπάρχουν ήδη διαθέσιμα. Μια αρκετά πρόσφατη τέτοια τεχνική, η οποία έχει συνεισφέρει θετικά σε διάφορα προβλήματα κατηγοριοποίησης, είναι η mixup. Σύμφωνα με αυτή, η εκπαίδευση ενός δικτύου πραγματοποιείται πάνω σε κυρτούς συνδυασμούς των δεδομένων εκπαίδευσης και των αντίστοιχων ετικετών τους. Με τον τρόπο αυτό επεκτείνεται η κατανομή των διαθέσιμων δεδομένων και το δίκτυο παρουσιάζει καλύτερη ικανότητα γενίκευσης. Στα πλαίσια της παρούσας διπλωματικής, εξετάζουμε την αποτελεσματικότητα της τεχνικής mixup στο πρόβλημα της συναισθηματικής αναγνώρισης σε πραγματικές, μη-ελεγχόμενες συνθήκες (in-the-wild). Συγκεκριμένα, εκπαιδεύουμε δίκτυα Βαθιάς Μάθησης με την εν λόγω τεχνική για κατηγοριοποίηση εικόνων εκφράσεων προσώπου στα 7 βασικά συναισθήματα. Παράλληλα, προτείνουμε και μια παραλλαγή της mixup, την Addmixup, με βάση την οποία το δίκτυο εκπαιδεύεται ταυτόχρονα πάνω σε εικονικά και πραγματικά παραδείγματα. Συγκρίνουμε τις δύο αυτές μεθόδους με την κλασική αρχή Ελαχιστοποίησης Εμπειρικού Ρίσκου ενώ παράλληλα εξετάζουμε και την επίδραση του dropout, μιας μορφής κανονικοποίησης του δικτύου, σε όλες τις προαναφερθείσες τεχνικές. Από την πειραματική μας μελέτη εξάγονται χρήσιμα συμπεράσματα ενώ παράλληλα τίθενται οι βάσεις για πολλές ακόμα μελλοντικές επεκτάσεις.
URI: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18220
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
Andreas_Psaroudakis_thesis.pdf4.88 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.