Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18015
Full metadata record
DC FieldValueLanguage
dc.contributor.authorΤερζάκη Παπαδοπούλου, Στυλιανή-
dc.date.accessioned2021-07-16T09:54:06Z-
dc.date.available2021-07-16T09:54:06Z-
dc.date.issued2021-07-14-
dc.identifier.urihttp://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18015-
dc.description.abstractΗ παρούσα διπλωματική εργασία πραγματεύεται το θέμα της αυτόματης Αναγνώρισης Συναισθήματος χρησιμοποιώντας μεθόδους Βαθιάς Μάθησης που εξάγουν πληροφορία από οπτικά και ακουστικά δεδομένα. Το αντικείμενο της ανάλυσης της συναισθηματικής συμπεριφοράς έχει εφαρμογή στην αλληλεπίδραση ανθρώπου-υπολογιστή, στην αυτόματη παρακολούθηση ασθενών, στην ασφάλεια, κ.α. Η προσέγγιση του προβλήματος αναγνώρισης συναισθημάτων από οπτικοακουστικά δεδομένα γίνεται με την χρήση σύγχρονων Συνελικτικών Νευρωνικών Δικτύων και την εκμετάλλευση της μεθόδου της μεταφοράς μάθησης από προεκπαιδευμένα μοντέλα. Συγκεκριμένα, στη παρούσα εργασία καλούμαστε να επιλύσουμε δύο είδη προβλημάτων Επιβλεπόμενης Μάθησης, ένα πρόβλημα ταξινόμησης και ένα πρόβλημα παλινδρόμησης. Τα δύο αυτά προβλήματα προκύπτουν από τα είδη ετικετών που περιέχει το σύνολο δεδομένων, το οποίο χρησιμοποιείται για την εκπαίδευση των μοντέλων. Το σύνολο αυτό ονομάζεται Aff-Wild2 και απαρτίζεται από μία συλλογή βίντεο που έχουν δημιουργηθεί σε πραγματικές συνθήκες ή όπως αναφέρεται χαρακτηριστικά "in-the-wild". Το συγκεκριμένο σύνολο έχει χαρακτηρισθεί με ετικέτες που βασίζονται σε δύο διαφορετικά μοντέλα αναπαράστασης συναισθημάτων. Το πρώτο μοντέλο είναι κατηγορικό και χωρίζει το πλήθος των συναισθημάτων σε 7 βασικές κατηγορίες, οι οποίες είναι ο Φόβος, ο Θυμός, η Αηδία, η Χαρά, η Λύπη, η Έκπληξη και η Ουδετερότητα. Συνεπώς, οι ετικέτες αυτές χρησιμοποιούνται για την ανάπτυξη μοντέλων ταξινόμησης πολλαπλών κλάσεων. Το δεύτερο μοντέλο είναι διαστατικό και εντάσσει τα συναισθήματα σε ένα δισδιάστατο χώρο με άξονες το σθένος και τη διέγερση. Οι ετικέτες του σθένους και της διέγερσης παίρνουν συνεχόμενες τιμές στο διάστημα [-1,1] και η πρόβλεψή τους από τα μοντέλα μάθησης αποτελεί πρόβλημα παλινδρόμησης. Για το κάθε πρόβλημα μάθησης αναπτύσσονται διαφορετικά μοντέλα, τα οποία δέχονται οπτικά ή ακουστικά δεδομένα ή και τον συνδυασμό τους. Τα συνελικτικά νευρωνικά δίκτυα που χρησιμοποιούνται ως βάση για τα παραπάνω μοντέλα είναι τα δίκτυα VGG, τα Διαφορικά δίκτυα (Residual Networks) και τα Πυκνά Συνδεδεμένα δίκτυα (Dense Networks). Μετά τη σχεδίαση των μοντέλων γίνεται η εκπαίδευση και η τελική αξιολόγησή τους στο συγκεκριμένο σύνολο δεδομένων.en_US
dc.languageelen_US
dc.subjectαναγνώριση συναισθήματοςen_US
dc.subjectανάλυση συναισθηματικής συμπεριφοράςen_US
dc.subjectμηχανική μάθησηen_US
dc.subjectνευρωνικά δίκτυαen_US
dc.subjectβαθιά μάθησηen_US
dc.subjectσυνελικτικά νευρωνικά δίκτυαen_US
dc.subjectενσωμάτωση δεδομένωνen_US
dc.subjectemotion recognitionen_US
dc.subjectaffective behavior analysisen_US
dc.subjectdeep learningen_US
dc.subjectdata fusionen_US
dc.titleΠολυτροπική Προσέγγιση Αναγνώρισης Συναισθήματος Βασισμένη σε Δίκτυα Βαθιάς Μάθησηςen_US
dc.description.pages90en_US
dc.contributor.supervisorΚόλλιας Στέφανοςen_US
dc.departmentΤομέας Τεχνολογίας Πληροφορικής και Υπολογιστώνen_US
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
Emotion_Recognition_Terzaki.pdf4.79 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.