Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17775
Title: Ανίχνευση Κακόβουλων Χρηστών σε Κοινωνικά Δίκτυα μέσω Μεθόδων Βαθιάς Μάθησης
Authors: Ηλίας, Λουκάς
Ρουσσάκη Ιωάννα
Keywords: Μέσα Κοινωνικής Δικτύωσης
Twitter
Ανίχνευση bots
Μηχανική Μάθηση
Επιστήμη Δεδομένων
Εξόρυξη Δεδομένων
Ανάλυση Δεδομένων
Τεχνητή Νοημοσύνη
Επιλογή Χαρακτηριστικών
Μέθοδοι Δειγματοληψίας
Επεξεργασία Φυσικής Γλώσσας
Βαθιά Μάθηση
Issue Date: 2020
Abstract: Αναμφισβήτητα, τα μέσα κοινωνικής δικτύωσης, όπως το Facebook και το Twitter, αποτελούν αναπόσπαστο κομμάτι της καθημερινότητάς μας λόγω των ποικίλων δυνατοτήτων, που προσφέρουν. Ειδικότερα, το Twitter παρέχει τη δυνατότητα στους χρήστες μέσω των tweets, σύντομων κειμένων μήκους έως 280 χαρακτήρες, να εκφράζουν τις απόψεις και τις σκέψεις τους σε θέματα της επικαιρότητας, διαμορφώνοντας κατ' αυτόν τον τρόπο τις τάσεις ή ακόμα και να συνομιλούν με χρήστες από όλο τον κόσμο άμεσα και χωρίς κανένα κόστος. Ωστόσο, το Twitter και γενικότερα τα μέσα κοινωνικής δικτύωσης αποτελούν αντικείμενο έλξης αυτοματοποιημένων λογαριασμών, γνωστών ως bots, οι οποίοι έχουν ως απώτερο στόχο την παραπληροφόρηση του χρήστη μέσω της διάδοσης ψευδών ειδήσεων, την προώθηση συγκεκριμένων προϊόντων και ιδεών καθώς και τη διακίνηση, πολλές φορές, υλικού πορνογραφικού περιεχομένου μέσω των ιστοσελίδων, που δημοσιεύουν στα tweets τους. Καθίσταται, λοιπόν, σαφές ότι αποτελεί αδήριτη ανάγκη η έγκαιρη ανίχνευση των bots. Αντικείμενο της παρούσας διπλωματικής εργασίας αποτελεί η προστασία των χρηστών του Twitter από κακόβουλους χρήστες. Συγκεκριμένα, προτείνονται δύο μέθοδοι κατηγοριοποίησης των χρηστών του Twitter σε αληθινούς χρήστες και αυτοματοποιημένους λογαριασμούς. Κατά την πρώτη μέθοδο συλλέγεται ένας μεγάλος αριθμός χαρακτηριστικών ανά χρήστη, που έχουν χρησιμοποιηθεί σε πρόσφατες ερευνητικές εργασίες για την ανίχνευση των bots. Αφού υλοποιούμε διάφορες τεχνικές επιλογής χαρακτηριστικών και μεθόδους δειγματοληψίας με σκοπό την εύρεση του βέλτιστου υποσυνόλου χαρακτηριστικών και τη δημιουργία ενός ομοιόμορφου συνόλου δεδομένων αντίστοιχα, αξιολογούμε την επίδοση του κάθε υποσυνόλου με χρήση αλγορίθμων Μηχανικής Μάθησης. Κατά τη δεύτερη μέθοδο, κάνοντας χρήση μόνο των tweets των χρηστών υλοποιούμε μία αρχιτεκτονική Βαθιάς Μάθησης, η οποία αποτελείται από Αμφίδρομα Αναδρομικά Νευρωνικά Δίκτυα Μακράς Βραχυπρόθεσμης Μνήμης (BiLSTM) με μηχανισμό προσοχής ακολουθούμενα από dense layers. Με αυτόν τον τρόπο αποφεύγουμε τη χρονοβόρα διαδικασία της εξαγωγής χαρακτηριστικών. Αξιολογούμε την επίδοση του μοντέλου Βαθιάς Μάθησης με διάφορες μετρικές αξιολόγησης. Και στις δύο μεθόδους χρησιμοποιούμε δύο δημόσια διαθέσιμα σύνολα δεδομένων και παρατηρούμε ότι οι τεχνικές, που εφαρμόζουμε, επιτυγχάνουν ανταγωνιστικές επιδόσεις συγκριτικά με τα αποτελέσματα των ερευνητικών εργασιών περί ανίχνευσης των bots, που έχουν δημοσιευτεί έως τώρα.
URI: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17775
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
LoukasIlias_Thesis.pdf6.39 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.