Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/19143
Τίτλος: Fairness Constraints and Reward Manipulation in Stochastic Multi-Armed Bandits
Συγγραφείς: Κονταλέξη, Μαρίνα
Φωτάκης Δημήτριος
Λέξεις κλειδιά: online learning
regret
multi-armed bandits
fairness
strategic manipulation
adversarial corruption
Ημερομηνία έκδοσης: 12-Ιου-2024
Περίληψη: Η παρούσα διπλωματική μελετά το multi-armed bandit πρόβλημα με στοχαστικές ανταμοιβές, όπου ένας learner παίζει ένα σειριακό παιχνίδι με ένα περιβάλλον για T γύρους. Σε κάθε γύρο, ο learner διαλέγει ένα από τα K "χέρια" μίας μηχανής slot και λαμβάνει μία ανταμοιβή που προέρχεται από κάποια στοχαστική κατανομή. Ο στόχος του learner είναι να παίξει όσο καλά θα έπαιζε η καλύτερη στρατηγική (δηλαδή η βέλτιστη γνωρίζοντας όλες τις κατανομές μέχρι τον τρέχοντα γύρο). Οι βέλτιστοι αλγόριθμοι εγγυώνται πως το regret του learner είναι φραγμένο από O(\sqrt{KT}), το οποίο είναι το καλύτερο δυνατό φράγμα σύμφωνα με τη θεωρία πληροφορίας. Οι Joseph et al. [1] επιβάλλουν έναν επιπλέον περιορισμό δικαιοσύνης στον learner, που δεν του επιτρέπει να ευνοήσει ένα "χέρι" έναντι ενός άλλου εκτός εάν είναι σίγουρος για τη σχετική τους σύγκριση. Η εργασία μας προτείνει μία ε-χαλάρωση του ορισμού τους και έναν δίκαιο αλγόριθμο που πετυχαίνει eO(\sqrt{1/\varepsilon} \sqrt({KT}) regret. Οι εφαρμογές όπου έχει νόημα αυτός ο περιορισμός (όπως τα recommendation systems) είναι ευ- αίσθητες σε ανταγωνιστικές επιθέσεις (π.χ., ψεύτικες κριτικές), γι’ αυτόν τον λόγο παρουσιάζουμε πώς συμπεριφέρονται γνωστοί αλγόριθμοι σε αυτό το μοντέλο και φιλοδοξούμε να καταλάβουμε τη σχέση ανάμεσα στους δίκαιους αλγόριθμους και σε αυτούς που είναι ανεκτικοί στις παραπάνω επιθέσεις.
URI: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/19143
Εμφανίζεται στις συλλογές:Διπλωματικές Εργασίες - Theses

Αρχεία σε αυτό το τεκμήριο:
Αρχείο Περιγραφή ΜέγεθοςΜορφότυπος 
Thesis.pdf1.24 MBAdobe PDFΕμφάνιση/Άνοιγμα


Όλα τα τεκμήρια του δικτυακού τόπου προστατεύονται από πνευματικά δικαιώματα.