Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο:
http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17775
Τίτλος: | Ανίχνευση Κακόβουλων Χρηστών σε Κοινωνικά Δίκτυα μέσω Μεθόδων Βαθιάς Μάθησης |
Συγγραφείς: | Ηλίας, Λουκάς Ρουσσάκη Ιωάννα |
Λέξεις κλειδιά: | Μέσα Κοινωνικής Δικτύωσης Ανίχνευση bots Μηχανική Μάθηση Επιστήμη Δεδομένων Εξόρυξη Δεδομένων Ανάλυση Δεδομένων Τεχνητή Νοημοσύνη Επιλογή Χαρακτηριστικών Μέθοδοι Δειγματοληψίας Επεξεργασία Φυσικής Γλώσσας Βαθιά Μάθηση |
Ημερομηνία έκδοσης: | 2020 |
Περίληψη: | Αναμφισβήτητα, τα μέσα κοινωνικής δικτύωσης, όπως το Facebook και το Twitter, αποτελούν αναπόσπαστο κομμάτι της καθημερινότητάς μας λόγω των ποικίλων δυνατοτήτων, που προσφέρουν. Ειδικότερα, το Twitter παρέχει τη δυνατότητα στους χρήστες μέσω των tweets, σύντομων κειμένων μήκους έως 280 χαρακτήρες, να εκφράζουν τις απόψεις και τις σκέψεις τους σε θέματα της επικαιρότητας, διαμορφώνοντας κατ' αυτόν τον τρόπο τις τάσεις ή ακόμα και να συνομιλούν με χρήστες από όλο τον κόσμο άμεσα και χωρίς κανένα κόστος. Ωστόσο, το Twitter και γενικότερα τα μέσα κοινωνικής δικτύωσης αποτελούν αντικείμενο έλξης αυτοματοποιημένων λογαριασμών, γνωστών ως bots, οι οποίοι έχουν ως απώτερο στόχο την παραπληροφόρηση του χρήστη μέσω της διάδοσης ψευδών ειδήσεων, την προώθηση συγκεκριμένων προϊόντων και ιδεών καθώς και τη διακίνηση, πολλές φορές, υλικού πορνογραφικού περιεχομένου μέσω των ιστοσελίδων, που δημοσιεύουν στα tweets τους. Καθίσταται, λοιπόν, σαφές ότι αποτελεί αδήριτη ανάγκη η έγκαιρη ανίχνευση των bots. Αντικείμενο της παρούσας διπλωματικής εργασίας αποτελεί η προστασία των χρηστών του Twitter από κακόβουλους χρήστες. Συγκεκριμένα, προτείνονται δύο μέθοδοι κατηγοριοποίησης των χρηστών του Twitter σε αληθινούς χρήστες και αυτοματοποιημένους λογαριασμούς. Κατά την πρώτη μέθοδο συλλέγεται ένας μεγάλος αριθμός χαρακτηριστικών ανά χρήστη, που έχουν χρησιμοποιηθεί σε πρόσφατες ερευνητικές εργασίες για την ανίχνευση των bots. Αφού υλοποιούμε διάφορες τεχνικές επιλογής χαρακτηριστικών και μεθόδους δειγματοληψίας με σκοπό την εύρεση του βέλτιστου υποσυνόλου χαρακτηριστικών και τη δημιουργία ενός ομοιόμορφου συνόλου δεδομένων αντίστοιχα, αξιολογούμε την επίδοση του κάθε υποσυνόλου με χρήση αλγορίθμων Μηχανικής Μάθησης. Κατά τη δεύτερη μέθοδο, κάνοντας χρήση μόνο των tweets των χρηστών υλοποιούμε μία αρχιτεκτονική Βαθιάς Μάθησης, η οποία αποτελείται από Αμφίδρομα Αναδρομικά Νευρωνικά Δίκτυα Μακράς Βραχυπρόθεσμης Μνήμης (BiLSTM) με μηχανισμό προσοχής ακολουθούμενα από dense layers. Με αυτόν τον τρόπο αποφεύγουμε τη χρονοβόρα διαδικασία της εξαγωγής χαρακτηριστικών. Αξιολογούμε την επίδοση του μοντέλου Βαθιάς Μάθησης με διάφορες μετρικές αξιολόγησης. Και στις δύο μεθόδους χρησιμοποιούμε δύο δημόσια διαθέσιμα σύνολα δεδομένων και παρατηρούμε ότι οι τεχνικές, που εφαρμόζουμε, επιτυγχάνουν ανταγωνιστικές επιδόσεις συγκριτικά με τα αποτελέσματα των ερευνητικών εργασιών περί ανίχνευσης των bots, που έχουν δημοσιευτεί έως τώρα. |
URI: | http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17775 |
Εμφανίζεται στις συλλογές: | Διπλωματικές Εργασίες - Theses |
Αρχεία σε αυτό το τεκμήριο:
Αρχείο | Περιγραφή | Μέγεθος | Μορφότυπος | |
---|---|---|---|---|
LoukasIlias_Thesis.pdf | 6.39 MB | Adobe PDF | Εμφάνιση/Άνοιγμα |
Όλα τα τεκμήρια του δικτυακού τόπου προστατεύονται από πνευματικά δικαιώματα.