Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17644
Title: Decoupling Emergent Strategies in Task-Oriented Negotiation Dialogue Systems
Authors: Χατζούδης, Γεράσιμος
Ποταμιάνος Αλέξανδρος
Keywords: διάλογος
ενισχυτική μάθηση
διαπραγμάτευση
μηχανική μάθηση
στρατηγική
μεταφορά μάθησης
Issue Date: 17-Jul-2020
Abstract: Μία από τις σπουδαιότερες προκλήσεις της Τεχνητής Νοημοσύνης είναι η δημιουργία συστημάτων που μπορούν να συνδιαλέγονται με τον άνθρωπο. Αυτό το ζήτημα μελετάται από τον κλάδο της Επεξεργασίας Φυσικής Γλώσσας που γνώρισε μεγάλη άνθιση κυρίως χάρη στη ραγδαία εξέλιξη της Μηχανικής Μάθησης και των Βαθιών Νευρωνικών Δικτύων. Στην παρούσα διπλωματική εργασία, ενστερνιστήκαμε την άποψη οτι η γλώσσα συγκροτείται ως ένα αυστηρό μέσο επικοινωνίας πρακτόρων που αλληλεπιδρούν εντός ενός περιβάλλοντος με σκοπό την ικανοποίηση κάποιας ανάγκης τους. Για το λόγο αυτό, εστιάζουμε σε διαλογικά προβλήματα προκαθορισμένου σκοπού. Ένα από τα δυσκολότερα είναι αυτό της διαπραγμάτευσης διότι απαιτεί γλωσσική επάρκεια και συλλογιστική ικανότητα. Το υπό μελέτη πρόβλημα Deal Or No Deal εισάγεται από τη Facebook και εστιάζει στη διαπραγμάτευση δύο πρακτόρων με δεδομένο πλήθος αντικειμένων μέσω γραπτού λόγου. Το πρόβλημα αναλύεται σε ένα πρόβλημα Ταξινόμησης και σε ένα Γλωσσικής Μοντελοποίησης. Αρχικά, αναπαράξαμε και τροποποιήσαμε τον διαθέσιμο κώδικα της υλοποίησης. Στη συνέχεια, θεωρήσαμε πως η ακρίβεια είναι η κατάλληλη μετρική του προβλήματος ταξινόμησης και μελετήσαμε παραδοσιακές μεθόδους μοντέλων μηχανικής μάθησης. Έπειτα και στα δύο προβλήματα, αποδεικνύουμε πως η χρήση Μεταφοράς Μάθησης και συγκεκριμένα των Transformers BERT και GPT-2 προσδίδουν εξαιρετικά αποτελέσματα και παρουσιάζουμε κάποιες μεθόδους παραγωγής διαλόγων αξιοποιώντας το βελτιστοποιημένο GPT-2. Η πολιτική λήψης αποφάσεων και στρατηγικών ως τώρα αγνοούνταν ή λαμβάνονταν υπόψη σε μεταγενέστερο στάδιο. Θεωρούμε πως η απόφαση και η ενέργεια προϋπάρχει του μηνύματος και για αυτό σχεδιάσαμε και υλοποιήσαμε ένα περιβάλλον προσομοίωσης αυτόματων διαπραγματευτών που εκπαιδεύονται με χρήση Ενισχυτικής Μάθησης. Συγκεκριμένα, διαμορφώνουμε τις συμπεριφορές των πρακτόρων, εξετάζουμε το βέλτιστο τρόπο απεικόνισης της διαπραγματευτικής πληροφορίας, δημιουργούμε συστήματα που επιχειρούν να εκμεταλλευτούν συγκεκριμένες συμπεριφορές των "αντιπάλων", μελετάμε το δίλημμα Εξερεύνησης-Αξιοποίησης και παρουσιάζουμε πώς η διαπραγμάτευση μεταξύ άπληστων πρακτόρων μπορεί να οδηγήσει σε μία κοινωνική ισορροπία. Τέλος, ένα από τα σημαντικότερα προβλήματα της Μηχανικής Μάθησης είναι η οπτικοποίηση και η ερμηνευσιμότητα των αποτελεσμάτων. Προς αυτή την κατεύθυνση, προτείνεται και υλοποιείται μια μέθοδος αναγνώρισης και οπτικοποίησης των στρατηγικών των αυτόματων διαπραγματευτών.
URI: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17644
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
thesis_v4_chatzoudis.pdf2.68 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.