Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17275
Τίτλος: Πρόβλεψη τιμών δημοπρασιών online διαφημίσεων με ευφυείς τεχνικές
Συγγραφείς: Hadjiharalambous, Georgios
Σταφυλοπάτης Ανδρέας-Γεώργιος
Λέξεις κλειδιά: Real Time Bidding (RTB)
Click-Through Rate (CTR)
Factorization Machine (FM)
Νευρωνικά δίκτυα
Μείωση διάστασης
Ημερομηνία έκδοσης: 10-Ιου-2019
Περίληψη: Τα τελευταία χρόνια με την άνοδο και κυριαρχία του διαδικτύου, οι εταιρείες έχουν αλλάξει τελείως τον τρόπο που διαφημίζουν τα προϊόντα τους. Οι διαφημίσεις πλέον γίνονται κυρίως με χρήση του διαδικτύου και πιο συγκεκριμένα, μέσω προβολής τους σε μικρά παράθυρα των ιστοσελίδων. Λόγω της εκτενούς χρήσης του διαδικτύου επήλθε μεγάλη ανάπτυξη στην ηλεκτρονική προβολή διαφημίσεων αλλά ταυτόχρονα, αποτέλεσε σημαντικό τομέα έρευνας. Ο μηχανισμός που παρέχει τις δημοπρασίες και βοηθά την αγορά και πώληση ηλεκτρονικών διαφημίσεων ονομάζεται Real Time Bidding (RTB). Περαιτέρω, καθώς ζούμε στη εποχή των Big Data, ο κλάδος του RTB επωφελείται και εκμεταλλεύεται τα πολλά δεδομένα που υπάρχουν στην αγορά για τη δημιουργία ατομικών profile, ώστε να παράγονται στοχευμένες και ουσιαστικές διαφημίσεις που ενδιαφέρουν το συγκεκριμένο χρήστη. Παρόλη την ανάπτυξη του κλάδου αυτού, υπάρχουν πολλά προβλήματα στον ορίζοντα. Ειδικότερα, τα δεδομένα που υπάρχουν είναι ιδιαίτερα πολύπλοκα και χρειάζονται σημαντική επεξεργασία για να μπορούν να αξιοποιηθούν από τους διαφημιστές. Επίσης, η διάσταση τους είναι πολύ μεγάλη για να μπορούν οι αλγόριθμοι να τα χρησιμοποιήσουν στην αρχική τους μορφή, καθώς απαιτούν μεγάλη υπολογιστική ισχύ. Αξίζει να τονιστεί όμως, ότι τα σημαντικότερα προβλήματα εντοπίζονται στη διαδικασία της δημοπρασίας. Συγκεκριμένα, σε κάθε δημοπρασία, απαιτείται να αποφασιστεί αν θα συμμετάσχει ή όχι ο κάθε διαφημιστής και ποια θα είναι η τιμή προσφοράς της διαφήμισης. Συνάμα, απαραίτητος είναι και ο έλεγχος του προϋπολογισμού κάθε διαφημιστή, ούτως ώστε να επιτευχθούν τα καλύτερα αποτελέσματα σε βάθος χρόνου. Σκοπός της διπλωματικής αυτής είναι η μελέτη του οικοσυστήματος του RTB σε ηλεκτρονικές διαφημίσεις και η εύρεση λύσεων στα προαναφερθέντα προβλήματα επιλογής των τιμών τους στις δημοπρασίες μέσω πρόβλεψης της απόκρισης του χρήστη. Έμφαση δίνεται στην πρόβλεψη του Click-Through Rate (CTR), που πραγματοποιείται με δύο μεθόδους. Η δημοφιλής μέθοδος των νευρωνικών δικτύων χρησιμοποιείται για την πρόβλεψη του CTR, ενώ επιπλέον μελετάται και παρουσιάζεται μια πρόσφατα δημοσιευμένη μέθοδος που τη χρησιμοποιούμε και για μείωσης της διάστασης των δεδομένων σε προβλήματα μηχανικής μάθησης, που ονομάζεται μηχανή παραγοντοποίησης - Factorization Machine (FM). Εφαρμόσαμε και συγκρίναμε αυτές τις δύο μεθόδους για πρόβλεψη του CTR, χρησιμοποιόντας το σύνολο δεδομένων IPinYou. Επίσης, μερικές δοκιμές της FM έγιναν και στο σύνολο δεδομένων Criteo για πρόβλεψη CTR. Παρατηρούμε ότι τα αποτελέσματα μας τόσο με τη FM όσο και με τα νευρωνικά δίκτυα είναι αρκετά ικανοποιητικά, και αντίστοιχης ακρίβειας με τα τελευταία τεχνολογικά μοντέλα. Τα αποτελέσματα αξιολογήθηκαν με βάση δύο διαδεδομένες μετρικές αξιολόγησης, την Area Under the Curve (AUC) και Root Mean Square Error (RMSE). Σημαντικό ρόλο στα αποτελέσματα φαίνεται να έχει το μέγεθος του διανύσματος παραγοντοποίσης κάθε χαρακτηριστικού της FM των δεδομένων μας, συνεπώς για την εκπαίδευση του μοντέλου της μηχανής παραγοντοποίησης, διερευνήσαμε διάφορα μεγέθη διανύσματος και καταλήξαμε ότι με ένα μικρό σχετικά διάνυσμα (k=20), μπορούμε να αναπαραστήσουμε εξαιρετικά τα χαρακτηριστικά εισόδου. Αξίζει να σημειώσουμε ότι τα δικά μας μοντέλα είναι αρκετά πιο απλά στην υλοποίηση αλλά και πιο αποδοτικά από θέμα υπολογιστικής ισχύς, σε σχέση με τα υπάρχοντα μοντέλα. Συνεπώς, αποτελεί σημαντικό πλεονέκτημα αλλά και συμπέρασμα ότι τα μοντέλα που χρησιμοποιήθηκαν σε αυτή την εργασία, παράγουν αντίστοιχης ποιότητας αποτελέσματα, αλλά με πιο απλό και αποδοτικό τρόπο. Ταυτόχρονα, καθότι τα μοντέλα είναι απλά, υπάρχει μεγάλο περιθώριο βελτίωσης με χρήση συνδυασμού μεθόδων αλλά και πιο πολύπλοκων μοντέλων, δημιουργώντας σημαντικές ευκαιρίες για μελλοντική συνέχιση αυτής της μελέτης. Τέλος, μέσω της παρούσας διπλωματικής αναδεικνύεται η δύναμη της μηχανής παραγοντοποίησης τόσο για γενική χρήση σαν αλγόριθμος μηχανικής μάθησης αλλά και για μείωση της διάστασης δεδομένων, με πολλές δυνατότητες για μεγάλο εύρος εφαρμογών.
URI: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17275
Εμφανίζεται στις συλλογές:Διπλωματικές Εργασίες - Theses

Αρχεία σε αυτό το τεκμήριο:
Αρχείο Περιγραφή ΜέγεθοςΜορφότυπος 
Georgios_Hadjiharalambous_ECE.pdf4.08 MBAdobe PDFΕμφάνιση/Άνοιγμα


Όλα τα τεκμήρια του δικτυακού τόπου προστατεύονται από πνευματικά δικαιώματα.