Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17275
Title: Πρόβλεψη τιμών δημοπρασιών online διαφημίσεων με ευφυείς τεχνικές
Authors: Hadjiharalambous, Georgios
Σταφυλοπάτης Ανδρέας-Γεώργιος
Keywords: Real Time Bidding (RTB)
Click-Through Rate (CTR)
Factorization Machine (FM)
Νευρωνικά δίκτυα
Μείωση διάστασης
Issue Date: 10-Jun-2019
Abstract: Τα τελευταία χρόνια με την άνοδο και κυριαρχία του διαδικτύου, οι εταιρείες έχουν αλλάξει τελείως τον τρόπο που διαφημίζουν τα προϊόντα τους. Οι διαφημίσεις πλέον γίνονται κυρίως με χρήση του διαδικτύου και πιο συγκεκριμένα, μέσω προβολής τους σε μικρά παράθυρα των ιστοσελίδων. Λόγω της εκτενούς χρήσης του διαδικτύου επήλθε μεγάλη ανάπτυξη στην ηλεκτρονική προβολή διαφημίσεων αλλά ταυτόχρονα, αποτέλεσε σημαντικό τομέα έρευνας. Ο μηχανισμός που παρέχει τις δημοπρασίες και βοηθά την αγορά και πώληση ηλεκτρονικών διαφημίσεων ονομάζεται Real Time Bidding (RTB). Περαιτέρω, καθώς ζούμε στη εποχή των Big Data, ο κλάδος του RTB επωφελείται και εκμεταλλεύεται τα πολλά δεδομένα που υπάρχουν στην αγορά για τη δημιουργία ατομικών profile, ώστε να παράγονται στοχευμένες και ουσιαστικές διαφημίσεις που ενδιαφέρουν το συγκεκριμένο χρήστη. Παρόλη την ανάπτυξη του κλάδου αυτού, υπάρχουν πολλά προβλήματα στον ορίζοντα. Ειδικότερα, τα δεδομένα που υπάρχουν είναι ιδιαίτερα πολύπλοκα και χρειάζονται σημαντική επεξεργασία για να μπορούν να αξιοποιηθούν από τους διαφημιστές. Επίσης, η διάσταση τους είναι πολύ μεγάλη για να μπορούν οι αλγόριθμοι να τα χρησιμοποιήσουν στην αρχική τους μορφή, καθώς απαιτούν μεγάλη υπολογιστική ισχύ. Αξίζει να τονιστεί όμως, ότι τα σημαντικότερα προβλήματα εντοπίζονται στη διαδικασία της δημοπρασίας. Συγκεκριμένα, σε κάθε δημοπρασία, απαιτείται να αποφασιστεί αν θα συμμετάσχει ή όχι ο κάθε διαφημιστής και ποια θα είναι η τιμή προσφοράς της διαφήμισης. Συνάμα, απαραίτητος είναι και ο έλεγχος του προϋπολογισμού κάθε διαφημιστή, ούτως ώστε να επιτευχθούν τα καλύτερα αποτελέσματα σε βάθος χρόνου. Σκοπός της διπλωματικής αυτής είναι η μελέτη του οικοσυστήματος του RTB σε ηλεκτρονικές διαφημίσεις και η εύρεση λύσεων στα προαναφερθέντα προβλήματα επιλογής των τιμών τους στις δημοπρασίες μέσω πρόβλεψης της απόκρισης του χρήστη. Έμφαση δίνεται στην πρόβλεψη του Click-Through Rate (CTR), που πραγματοποιείται με δύο μεθόδους. Η δημοφιλής μέθοδος των νευρωνικών δικτύων χρησιμοποιείται για την πρόβλεψη του CTR, ενώ επιπλέον μελετάται και παρουσιάζεται μια πρόσφατα δημοσιευμένη μέθοδος που τη χρησιμοποιούμε και για μείωσης της διάστασης των δεδομένων σε προβλήματα μηχανικής μάθησης, που ονομάζεται μηχανή παραγοντοποίησης - Factorization Machine (FM). Εφαρμόσαμε και συγκρίναμε αυτές τις δύο μεθόδους για πρόβλεψη του CTR, χρησιμοποιόντας το σύνολο δεδομένων IPinYou. Επίσης, μερικές δοκιμές της FM έγιναν και στο σύνολο δεδομένων Criteo για πρόβλεψη CTR. Παρατηρούμε ότι τα αποτελέσματα μας τόσο με τη FM όσο και με τα νευρωνικά δίκτυα είναι αρκετά ικανοποιητικά, και αντίστοιχης ακρίβειας με τα τελευταία τεχνολογικά μοντέλα. Τα αποτελέσματα αξιολογήθηκαν με βάση δύο διαδεδομένες μετρικές αξιολόγησης, την Area Under the Curve (AUC) και Root Mean Square Error (RMSE). Σημαντικό ρόλο στα αποτελέσματα φαίνεται να έχει το μέγεθος του διανύσματος παραγοντοποίσης κάθε χαρακτηριστικού της FM των δεδομένων μας, συνεπώς για την εκπαίδευση του μοντέλου της μηχανής παραγοντοποίησης, διερευνήσαμε διάφορα μεγέθη διανύσματος και καταλήξαμε ότι με ένα μικρό σχετικά διάνυσμα (k=20), μπορούμε να αναπαραστήσουμε εξαιρετικά τα χαρακτηριστικά εισόδου. Αξίζει να σημειώσουμε ότι τα δικά μας μοντέλα είναι αρκετά πιο απλά στην υλοποίηση αλλά και πιο αποδοτικά από θέμα υπολογιστικής ισχύς, σε σχέση με τα υπάρχοντα μοντέλα. Συνεπώς, αποτελεί σημαντικό πλεονέκτημα αλλά και συμπέρασμα ότι τα μοντέλα που χρησιμοποιήθηκαν σε αυτή την εργασία, παράγουν αντίστοιχης ποιότητας αποτελέσματα, αλλά με πιο απλό και αποδοτικό τρόπο. Ταυτόχρονα, καθότι τα μοντέλα είναι απλά, υπάρχει μεγάλο περιθώριο βελτίωσης με χρήση συνδυασμού μεθόδων αλλά και πιο πολύπλοκων μοντέλων, δημιουργώντας σημαντικές ευκαιρίες για μελλοντική συνέχιση αυτής της μελέτης. Τέλος, μέσω της παρούσας διπλωματικής αναδεικνύεται η δύναμη της μηχανής παραγοντοποίησης τόσο για γενική χρήση σαν αλγόριθμος μηχανικής μάθησης αλλά και για μείωση της διάστασης δεδομένων, με πολλές δυνατότητες για μεγάλο εύρος εφαρμογών.
URI: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17275
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
Georgios_Hadjiharalambous_ECE.pdf4.08 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.