Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/13210
Title: Συναισθηματική Ανάλυση Προτάσεων Με Χρήση Τεχνικών Θεματικής Μοντελοποίησης
Authors: Χριστοπούλου Ευσταθία
Ποταμιάνος Αλέξανδρος
Keywords: συναισθηματική αναλύση προτάσεων
θεματική μοντελοποίηση
lda
σημασιολογικά μοντέλα
word2vec
συναισθηματικά μοντέλα
προσαρμογή
Issue Date: 22-Jul-2016
Abstract: Η συναισθηματική ανάλυση κειμένου, είναι ένας κλάδος της Μηχανικής Μάθησης που αποσκοπεί στην αυτόματη αναγνώριση υποκειμενικής πληροφορίας σε γραπτές πηγές. Λόγω της ανάπτυξης του διαδικτύου και συνεπώς του όγκου πληροφοριών που διανέμονται στα κοινωνικά δίκτυα, πολλαπλές εφαρμογές χρησιμοποιούν αυτή την τεχνολογία για να βελτιόσουν την λήψη των αποφάσεών τους.Σκοπός αυτής της Διπλωματικής εργασίας είναι η διερεύνηση μιας μεθόδου προσαμοργής για την βελτίωση της αυτόματης, δυαδικής αναγνώρισης συναισθήματος σε προτάσεις (θετική/αρνητική), με τη βοήθεια τεχνικών Θεματικής Μοντελοποίησης. Σε σύγκριση με τις κλασσικές μεθόδους που χρησιμοποιούν μια ποκιλια λεξιλογικών χαρακτηριστικών και λεξικών σαν είσοδο σε ταξινομητές, τα θεματικά μοντέλα έχουν την ικανότητα να συλλαμβάνουν το νοηματικό πλαίσιο στο οποίο ανήκει μια πρόταση και έτσι να εκτιμούν τη σημασία της με μεγαλύτερη λεπτομέρεια.Το πρώτο μέρος της Διπλωματικής εργασίας, ασχολείται με τις τεχνικές Θεματικής μοντελοποίησης οι οποίες διευκολύνουν την εξαγωγή πληροφορίας από αδόμητες συλλογές κειμένων. Περιγράφεται η Latent Dirichlet Allocation (LDA) τεχνική, που προσπαθεί να ανακατασκευάσει την διαδικασία συγγραφής ενός κειμένου και συνεπώς να παράγει τις θεματικές ενότητες από τις οποίες αποτελείται. Στο δεύτερο μέρος, τα μοντέλα διανυσματικού χώρου διερευνόνται, τα οποία στοχεύουν στο να εκφράσουν τη σημασιολογική ομοιότητα μεταξύ λέξεων, κωδικοποιώντας τη γλώσσα ως μια μαθηματική κατανομή και συνεπώς σχηματίζοντας ένα σημασιολογικό χώρο. Επιπλέον, παρουσιάζονται μοντέλα στο χώρο των συναισθημάτων, τα οποία κωδικοποιούν το συναίσθημα των λέξεων, και συγκεκριμένα πώς είναι εφικτό το πέρασμα από το σημασιολογικό στον συναισθηματικό χώρο μέσω ενός μοντέλου αντιστοίχισης, χρησιμοποιώντας ένα λεξικό, ώστε να εκτιμηθεί το συναίσθημα νέων λέξεων.Ο αλγόριθμος που παρουσιάζεται επικεντρώνεται κυρίως στην προσαρμογή του Σημασιολογικού χώρου, και ονομάζεται Σημασιολογικό Μοντέλο Προσαρμογής (ΣΜΠ). Στην προσέγγιση αυτή, ο σημασιολογικός χώρος μιας πρότασης αναπαρίσταται ως ένα ζυγισμένο μείγμα από διαφορετικά θεματικά-σημασιολογικά μοντέλα με βάση την εκτίμηση ενός εκπαιδευμένου πιθανοτικού θεματικού μοντέλου. Η τελική εκτίμηση του συναισθήματος μια πρότασης είναι το αποτέλεσμα ενός σημασιολογικού-συναισθηματικού μοντέλου που ενώνει τον σημασιολογικό και συναισθηματικό χώρο μέσω μιας αντιστοίχισης και ενός υπάρχοντος συναισθηματικού λεξικού. Η απόδοση του ΣΜΠ μοντέλου μπορεί να εκτιμηθεί τόσο σε εφαρμογές σημασιολογικής ομοιότητας λέξεων αλλά και σε αναγνώριση συναισθήματος προτάσεων, δείχνοτας μια βελτίωση στη μέτρηση της συσχέτισης με τιμές ομοιότητας δοσμένες από ανθρώπους, παράλληλα με μια αύξηση της ακρίβειας ταξινόμησης για προτάσεις, σε δεδομένα γενικού περιεχομένου αλλά και από το Twitter σε σύγκριση με ένα σύστημα που δεν χρησιμοποιεί θεματικές ενότητες.Η αντίστοιχη εργασία μπορεί να βρεθεί στα αγγλικά στο σύνδεσμο https://bitbucket.org/fenchri/diploma-thesis/raw/22ac4e37fb6d918be1c766a1e37c824dbdf30769/Sentence-level%20Sentiment%20Analysis%20using%20Topic%20Modeling.pdf.
URI: http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/13210
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File SizeFormat 
DT2016-0193.pdf8.47 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.