Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18403
Title: Causal Transfer Learning for Personalized Recommendation Systems
Authors: Κόντη, Πολυξένη Ειρήνη
Στάμου Γιώργος
Keywords: Εξατομικευμένο Σύστημα Συστάσεων
Ομαδοποίηση χρηστών
Συνεργατική μάθηση
Μεταφορά μάθησης
Αιτιότητα
Causal bounds
Issue Date: 13-Jul-2022
Abstract: Σε αυτή την εργασία μελετάμε ένα πρόβλημα μεταφοράς μάθησης για εξατομικευμένα συστήματα συστάσεων, που θα επιτρέπει σε διαφορετικές ομάδες χρηστών να μαθαίνουν συνεργατικά τις προτιμήσεις τους χωρίς να μοιράζονται ιδιωτικές πληροφορίες μεταξύ τους. Συγκεκριμένα, θεωρούμε έναν server που έχει πρόσβαση μόνο σε δεδομένα που προκύπτουν από την αλληλεπίδραση των χρηστών με το σύστημα και όχι από τα υπόλοιπα προσωπικά τους χαρακτηριστικά. Μοντελοποιούμε αυτό το σύστημα ως ένα Multi-armed bandit πρόβλημα (MAB) με ξεχωριστές μηχανές συστάσεως για κάθε ομάδα χρηστών. Στόχος του συστήματος είναι να προσδιορίσει τις προτιμήσεις της κάθε ομάδας χρηστών, να κατατάξει τους χρήστες στις ομάδες αυτές, και ανάλογα με την κατάταξη αυτή να τους κάνει τις κατάλληλες συστάσεις ώστε να μεγιστοποιησει την ανταμοιβή τους προς το σύστημα. Ωστόσο, λαμβάνοντας υπόψιν την απουσία γνώσης σχετικά με τα χαρακτηριστικά των ομάδων αλλα και ειδικότερα των χρηστών, γίνεται αντιληπτό ότι ο server δεν μπορεί να υπολογίσει τα πραγματικά rewards της κάθε ομάδας προς τις πιθανές συστάσεις (arms) του συστήματος. Αντ’ αυτού, κρίνεται σκόπιμος ο υπολογισμός causal bounds για το reward που προσίδει στο σύστημα το κάθε arm. Μέσω των ορίων αυτών μπορεί να γίνει μεταφορά γνώσης μεταξύ των ομάδων και να προκύψει έτσι ένας νέος causal-constrained UCB αλγόριθμος, που θα επιτρέπει σε κάθε ομάδα χρηστών να μάθει την καλύτερη επιλογή που μπορεί να της προσφέρει το σύστημα αξιοποιώντας πληροφορίες από τις υπόλοιπες ομάδες. ΄Ενα βασικό χαρακτηριστικό του αλγορίθμου μας είναι η ικανότητά του να αντιμετωπίζει σφάλματα κατά την ομαδοποίηση των χρηστών σε διαφορετικές ομάδες χρηστών, γεγονός πιθανό μιας και η ομάδα στην οποία ανήκει ο κάθε χρήστης θεωρείται πληροφορία άγνωστη στον server. Τέτοια σφάλματα μπορεί να οδηγήσουν σε user selection bias που μπορεί να επηρεάσει την διαδικασία εκμάθησης. Για να αντιμετωπίσουμε αυτήν την πρόκληση, εφαρμόζουμε μια ϵ-greedy μέθοδο, πουκειμένου τόσο να επιτραπεί η δίκαιη εξερεύνηση όων των arms του συστήματος όσο και να βελτιωθεί η ακρίβεια ομαδοποίησης κατά τη διάρκεια της εκμάθησης. Μέσω της διεξαγωγής αριθμητικών πειραμάτων αποδεικνύεται ότι ο προτεινόμενος αλγόριθμος ξεπερνά μεθόδους μάθησης που δεν λαμβάνουν υπόψη ούτε την ύπαρξη αιτιότητας (causality) στο σύστημα, αλλά ούτε και την ύπαρξη λάθους ομαδοποίησης των χρηστών του συστήματος.
URI: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18403
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
Διπλωματική Εργασία (2).pdf1.25 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.