Causal Transfer Learning for Personalized Recommendation Systems

Κόντη, Πολυξένη Ειρήνη

Εθνικό Μετσόβιο Πολυτεχνείο

Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Καλώς ήρθατε στο Άρτεμις

Σκοπός του Άρτεμις είναι η συστηματική αρχειοθέτηση και διαδοση της πνευματικής παραγωγής της Σχολής Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών του Εθνικού Μετσόβιου Πολυτεχνείου, με τη βοήθεια της τεχνολογίας των ψηφιακών βιβλιοθηκών.

Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18403

Τίτλος:	Causal Transfer Learning for Personalized Recommendation Systems
Συγγραφείς:	Κόντη, Πολυξένη Ειρήνη Στάμου Γιώργος
Λέξεις κλειδιά:	Εξατομικευμένο Σύστημα Συστάσεων Ομαδοποίηση χρηστών Συνεργατική μάθηση Μεταφορά μάθησης Αιτιότητα Causal bounds
Ημερομηνία έκδοσης:	13-Ιου-2022
Περίληψη:	Σε αυτή την εργασία μελετάμε ένα πρόβλημα μεταφοράς μάθησης για εξατομικευμένα συστήματα συστάσεων, που θα επιτρέπει σε διαφορετικές ομάδες χρηστών να μαθαίνουν συνεργατικά τις προτιμήσεις τους χωρίς να μοιράζονται ιδιωτικές πληροφορίες μεταξύ τους. Συγκεκριμένα, θεωρούμε έναν server που έχει πρόσβαση μόνο σε δεδομένα που προκύπτουν από την αλληλεπίδραση των χρηστών με το σύστημα και όχι από τα υπόλοιπα προσωπικά τους χαρακτηριστικά. Μοντελοποιούμε αυτό το σύστημα ως ένα Multi-armed bandit πρόβλημα (MAB) με ξεχωριστές μηχανές συστάσεως για κάθε ομάδα χρηστών. Στόχος του συστήματος είναι να προσδιορίσει τις προτιμήσεις της κάθε ομάδας χρηστών, να κατατάξει τους χρήστες στις ομάδες αυτές, και ανάλογα με την κατάταξη αυτή να τους κάνει τις κατάλληλες συστάσεις ώστε να μεγιστοποιησει την ανταμοιβή τους προς το σύστημα. Ωστόσο, λαμβάνοντας υπόψιν την απουσία γνώσης σχετικά με τα χαρακτηριστικά των ομάδων αλλα και ειδικότερα των χρηστών, γίνεται αντιληπτό ότι ο server δεν μπορεί να υπολογίσει τα πραγματικά rewards της κάθε ομάδας προς τις πιθανές συστάσεις (arms) του συστήματος. Αντ’ αυτού, κρίνεται σκόπιμος ο υπολογισμός causal bounds για το reward που προσίδει στο σύστημα το κάθε arm. Μέσω των ορίων αυτών μπορεί να γίνει μεταφορά γνώσης μεταξύ των ομάδων και να προκύψει έτσι ένας νέος causal-constrained UCB αλγόριθμος, που θα επιτρέπει σε κάθε ομάδα χρηστών να μάθει την καλύτερη επιλογή που μπορεί να της προσφέρει το σύστημα αξιοποιώντας πληροφορίες από τις υπόλοιπες ομάδες. ΄Ενα βασικό χαρακτηριστικό του αλγορίθμου μας είναι η ικανότητά του να αντιμετωπίζει σφάλματα κατά την ομαδοποίηση των χρηστών σε διαφορετικές ομάδες χρηστών, γεγονός πιθανό μιας και η ομάδα στην οποία ανήκει ο κάθε χρήστης θεωρείται πληροφορία άγνωστη στον server. Τέτοια σφάλματα μπορεί να οδηγήσουν σε user selection bias που μπορεί να επηρεάσει την διαδικασία εκμάθησης. Για να αντιμετωπίσουμε αυτήν την πρόκληση, εφαρμόζουμε μια ϵ-greedy μέθοδο, πουκειμένου τόσο να επιτραπεί η δίκαιη εξερεύνηση όων των arms του συστήματος όσο και να βελτιωθεί η ακρίβεια ομαδοποίησης κατά τη διάρκεια της εκμάθησης. Μέσω της διεξαγωγής αριθμητικών πειραμάτων αποδεικνύεται ότι ο προτεινόμενος αλγόριθμος ξεπερνά μεθόδους μάθησης που δεν λαμβάνουν υπόψη ούτε την ύπαρξη αιτιότητας (causality) στο σύστημα, αλλά ούτε και την ύπαρξη λάθους ομαδοποίησης των χρηστών του συστήματος.
URI:	http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18403
Εμφανίζεται στις συλλογές:	Διπλωματικές Εργασίες - Theses

Αρχεία σε αυτό το τεκμήριο:

Αρχείο	Περιγραφή	Μέγεθος	Μορφότυπος
Διπλωματική Εργασία (2).pdf		1.25 MB	Adobe PDF	Εμφάνιση/Άνοιγμα

Δείξε την πλήρη περιγραφή του τεκμηρίου

Όλα τα τεκμήρια του δικτυακού τόπου προστατεύονται από πνευματικά δικαιώματα.