Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18897
Title: Ανίχνευση bot στο Twitter με τεχνικές Μηχανικής Μάθησης
Authors: Τσιγγέλης, Κωνσταντίνος
Ασκούνης Δημήτριος
Keywords: Twitter
Bot
Νευρωνικά Δίκτυα
Μηχανική Μάθηση
GNN
Επεξεργασία φυσικής γλώσσας
Issue Date: 19-Oct-2023
Abstract: Η διπλωματική αυτή εργασία ασχολείται με την ανάπτυξη ενός μοντέλου ανίχνευσης bot λογαριασμών στο Twitter με τεχνικές μηχανικής μάθησης. Το Twitter είναι ένα μέσο κοινωνικής δικτύωσης το οποίο επιτρέπει την αλληλεπίδραση των χρηστών μέσω σύντομων μηνυμάτων τα οποία ονομάζονται τουιτς (tweets). Έχει εδραιωθεί στην σημερινή κοινωνία ως ένα από τα κυρίαρχα μέσα κοινωνικής δικτύωσης ενώ συχνά παρομοιάζεται ως μία ‘παγκόσμια εφημερίδα’ η οποία επηρεάζει το κοινωνικοπολιτικό γίγνεσθαι και διαμορφώνει την κοινή γνώμη. Η άνθιση αυτή βέβαια του Twitter αντιμετωπίσθηκε σαν ευκαιρία από πολλούς χρήστες οι οποίοι προσπάθησαν να εκμεταλλευτούν την δύναμή του για να υλοποιήσουν δικούς τους, συχνά κακοπροαίρετους σκοπούς. Ως επακόλουθο, εμφανίστηκαν τα bots δηλαδή χρήστες οι οποίοι προκύπτουν από αυτοματοποιημένα λογισμικά και αποσκοπούν στην υπονόμευση της αξιοπιστίας και ανεξαρτησίας του Twitter. Βασικά χαρακτηριστικά τους, το οποία καθιστούν την ανίχνευσή τους πολύ απαιτητική, είναι η ποικιλομορφία και η εξελισσιμότητά τους. Διαφορετικά είδη Bot αξιοποιούν διαφορετικά χαρακτηριστικά και μέσα του Twitter προκειμένου να προωθήσουν την ατζέντα τους. Κάποιοι τύποι επιθέσεων είναι οι ακόλουθοι: διανέμουν κακόβουλους συνδέσμους, προσποιούνται τους κοινωνικούς φίλους σε χρήστες για να αποσπάσουν επικίνδυνες και ζημιογόνες πληροφορίες, αναδημοσιεύουν ειδήσεις με μεροληπτικό περιεχόμενο προκειμένου να επηρεάσουν την κοινή γνώμη κτλ. Παράλληλα τα bot εξελίσσονται συνέχεια ώστε να ξεπερνούν τα είδη υπάρχοντα μέτρα ανίχνευσης αλλά και για να αναβαθμίσουν την αληθοφάνεια τους και ως επακόλουθο να αυξήσουν την επιρροή τους. Με τον καιρό λοιπόν γίνονται όλο και πιο ευφυή, προσομοιώνοντας την συμπεριφορά ρεαλιστικών χρηστών. Η εργασία ανίχνευσης bot λογαριασμών είναι πολύ ουσιώδης και απαιτητική. Οι ήδη υπάρχουσες μέθοδοι γενικά μπορούν να διαιρεθούν σε δύο κατηγορίες: μέθοδοι που βασίζονται στην μηχανικη εξαγωγής χαρακτηριστικών και μέθοδοι που χρησιμοποιούν δίκτυα βαθιάς μάθησης. Οι πρώτες εξάγουν τα χαρακτηριστικα των χρηστών από τα tweets και από την πληροφορία του λογαριασμού τους και τα τροφοδοτούν σε κλασικούς ταξινομητές μηχανικής μάθησης ενώ οι μετέπειτα στηρίζονται σε αρχιτεκτονικές βαθιών νευρωνικών δικτύων. Παρά το αρχικό θετικό αποτέλεσμα, η αναζήτηση ενός μοντέλου που θα αντιμετωπίζει αποδοτικά τις απαιτήσεις του ζητήματος και θα γενικεύει στην πραγματική σφαίρα του Twitter παραμένει ανοιχτή. Στο μοντέλο που προτείνουμε χρησιμοποιούμε παράλληλα πολυτροπικές πληροφορίες για κάθε χρήστη χωρίς μηχανική χαρακτηριστικών. Συνδυάζουμε τεχνικές επιβλεπόμενης και μη επιβλεπόμενης μηχανικής μάθησης ούτως ώστε να κατηγοριοποιήσουμε τους χρήστες σε Bot ή γνήσιους χρήστες. Ιδιαίτερα εφαρμόζουμε μοντέλα Επεξεργασίας Φυσικής Γλώσσας (Natural Language Processing), ώστε να επιτευχθεί η εξαγωγή πληροφορίας από αδόμητες πηγές δεδομένων (tweets) και νευρωνικά δίκτυα για να βρούμε την αναπαράσταση των χαρακτηριστικών κάθε χρήστη, επιλέγοντας αυτά που βελτιστοποιουν το μοντέλο μας. Ακολούθως, κατασκευάζουμε έναν ετερογενή γράφο που καλύπτει τις σχέσεις ακολουθησης που αναπτύσσονται στο Twitter (follower και following) και εφαρμόζουμε δομές νευρωνικών δικτύων σε γράφους (Graph Neural Networks) ούτως ώστε να συμπεριλάβουμε στην πρόβλεψή μας και την κοινωνική δραστηριότητα των χρηστών. Τέλος, βασισμένοι στο ολοκληρωμένο σύνολο δεδομένων Twibot-20 που αποτελεί σημείο αναφοράς εκτελούμε πειράματα που αναδεικνύουν την αποδοτικότητα του μοντέλου μας και την ανταγωνιστική του επίδοση σε σχέση με τις υπάρχουσες υλοποιήσεις.
URI: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18897
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
Κωνσταντίνος Τσιγγέλης _ Twitter bot detection using GNN's.pdf4.33 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.