Please use this identifier to cite or link to this item:
http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/13093
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.author | Όμηρος Πανταζής | |
dc.date.accessioned | 2018-07-23T08:54:28Z | - |
dc.date.available | 2018-07-23T08:54:28Z | - |
dc.date.issued | 2016-4-4 | |
dc.date.submitted | 2016-4-1 | |
dc.identifier.uri | http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/13093 | - |
dc.description.abstract | Στη σημερινή εποχή, το ποσοστό των Χρηστών κοινωνικών δικτύων που εκμεταλλεύονται την ευκαιρία που τους δίνεται από αυτά να εκφράσουν την άποψη τους πάνω σε ένα συγκεκριμένο Θέμα αυξάνεται καθημερινά. Αντικείμενο μελέτης αυτής της διπλωματικής εργασίας είναι η συσχέτιση απόψεων διαφόρων Χρηστών πάνω σε Θέματα της επικαιρότητας. Τα Θέματα αυτά μπορεί να αναφέρονται σε πολιτική, οικονομικά, αθλητισμό, στα μέσα μαζικής ενημέρωσης κλπ. Το κοινωνικό δίκτυο ενδιαφέροντος για αυτή την έρευνα είναι το Twitter. Για την συλλογή των δεδομένων έγινε χρήση των δυνατοτήτων του προγραμματιστικού περιβάλλοντος Twitter API και για την αποθήκευση τους η Μη-Σχεσιακή βάση δεδομένων τύπου γράφου, Neo4j. Ακολούθως πετύχαμε αυτόματη Μοντελοποίηση των δεδομένων σε Θέματα με χρήση των αλγορίθμων μη-επιβλεπόμενης μηχανικής μάθησης, Latent Dirichlet Allocation (LDA) και K-Means. Για την επίτευξη του παραπάνω χρησιμοποιήσαμε Απλό Κείμενο, Επισημασμένα Ονόματα Χρηστών του Twitter και Hashtags. Τα αποτελέσματα της μελέτης μπορούν να ερμηνευτούν εύκολα μέσω της οπτικοποίησης τους σε διάγραμμα διασποράς. Το σύστημα έχει αναπτυχθεί κατά μεγάλο βαθμό με τη γλώσσα προγραμματισμουύ Python και τις ποικίλες βιβλιοθήκες που αυτή προσφέρει. Τέλος, η οπτικοποίηση των αποτελεσμάτων των παραπάνω αλγορίθμων καθώς και η δυνατότητα εφαρμογής τεχνικών ανάλυσης πάνω στα δεδομένα μας, προσφέρονται στο χρήστη μέσω Web Εφαρμογής που δημιουργήθηκε με το πλαίσιο Flask. | |
dc.language | Greek | |
dc.subject | κοινωνικά δίκτυα | |
dc.subject | ||
dc.subject | μηχανική μάθηση | |
dc.subject | συσταδοποίηση | |
dc.subject | εξόρυξη δεδομένων | |
dc.subject | ανάλυση δεδομένων | |
dc.subject | συσταδοποίηση εγγράφων | |
dc.subject | βάσεις δεδομένων γράφου | |
dc.subject | neo4j | |
dc.subject | cypher | |
dc.subject | lda | |
dc.subject | k-means | |
dc.subject | python | |
dc.title | Εξόρυξη Δεδομένων Από Το Twitter Και Εφαρμογή Αλγορίθμων Μη-επιβλεπόμενης Μηχανικής Μάθησης Για Συσταδοποίηση Κειμένων | |
dc.type | Diploma Thesis | |
dc.description.pages | 123 | |
dc.contributor.supervisor | Βασιλείου Ιωάννης | |
dc.department | Τομέας Τεχνολογίας Πληροφορικής & Υπολογιστών | |
dc.organization | ΕΜΠ, Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών | |
Appears in Collections: | Διπλωματικές Εργασίες - Theses |
Files in This Item:
File | Size | Format | |
---|---|---|---|
DT2016-0073.pdf | 3.32 MB | Adobe PDF | View/Open |
Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.