Please use this identifier to cite or link to this item:
Title: Παρακολούθηση Διαλογικής Κατάστασης με αρχιτεκτονική Encoder-Decoder και χρήση Pointer-Generator Δικτύου
Authors: Μιάμης, Χρήστος
Σταφυλοπάτης Ανδρέας-Γεώργιος
Keywords: Παρακολούθηση Διαλογικής Κατάστασης
Dialogue State Tracking
Παρακολούθηση Πεποιθήσεων
Belief Tracking
Επεξεργασία Φυσικής Γλώσσας
Natural Language Processing
Μηχανική Μάθηση
Machine Learning
Νευρωνικά Δίκτυα
Neural Networks
Issue Date: 19-Nov-2019
Abstract: Το αντικείμενο της παρούσας διπλωματικής είναι η ανάπτυξη ενός μοντέλου παρακολούθησης της διαλογικής κατάστασης (Dialogue State Tracking). To Dialogue State Tracking είναι ένα ανοιχτό πρόβλημα στην ερευνητική κοινότητα με συνεχώς αναπτυσσόμενες μεθόδους και αποτελεί μέρος μιας ευρύτερης ροής εργασίας στον τομέα της Επεξεργασίας Φυσικής Γλώσσας. Πιο αναλυτικά, η παρακολούθηση της κατάστασης πεποιθήσεων (belief tracking) εντοπίζεται στην εκτίμηση του στόχου του χρήστη κατά την (χρονική) εξέλιξη του διαλόγου. Η ακριβής εκτίμηση της κατάστασης κατά την εξέλιξη του διαλόγου είναι επιθυμητή καθώς παρέχει ευρωστία σε σφάλματα που εμφανίζονται σε προ στάδια της επεξεργασίας γλώσσας όπως σφάλματα στην αναγνώριση ομιλίας ή σφάλματα εξαιτίας της ασάφειας που είναι ένα εγγενές χαρακτηριστικό της γλώσσας. Πρόσφατα, έχουν προταθεί πολλά μοντέλα για την παρακολούθηση της κατάστασης διαλόγου. Ωστόσο, οι συγκρίσεις μεταξύ μοντέλων είναι σπάνιες και διαφορετικές ερευνητικές ομάδες χρησιμοποιούν διαφορετικά δεδομένα από διαφορετικούς τομείς. Επιπλέον, δεν υπάρχει επί του παρόντος κοινό σύνολο δεδομένων που να επιτρέπει πειράματα πάνω στην παρακολούθηση κατάστασης διαλόγου, με αποτέλεσμα να πρέπει να γίνει συλλογή και προεπεξεργασία τέτοιων δεδομένων από διαφορετικές πηγές, κάτι το οποίο είναι δαπανηρό και χρονοβόρο καθώς δεν υπάρχει κοινή γραμμή στην αναπαράσταση τέτοιου είδους δεδομένων. Στην παρούσα διπλωματική αναπτύσσεται ένα Dialogue State Tracking μοντέλο, η αρχιτεκτονική του οποίου βασίζεται στο μοντέλο του κωδικοποιητή-αποκωδικοποιητή (encoder-decoder) και κάνει χρήση Pointer-Generator Δικτύου. Η αξιολόγηση γίνεται πάνω σε ένα ευρέως χρησιμοποιούμενο και γνωστό σύνολο δεδομένων. Τέλος, αναλύονται οι βασικότερες αδυναμίες που συναντώνται και προτείνονται επιπλέον τροποποιήσεις στο σχεδιασμό της αρχιτεκτονικής του μοντέλου με σκοπό την περαιτέρω βελτίωση των τελικών αποτελεσμάτων. The subject of this thesis is the development of a Dialog State Tracking model (DST). DST is an open problem in the constantly evolving research community and is part of a broader workflow in the field of Natural Language Processing. More specifically, in dialog systems, state tracking (also called belief tracking) refers to the evaluation of the user's goal as the dialogue progresses (over time). Accurate assessment of the dialog state is desirable as it provides robustness to errors that occur during the stages of natural language processing such as speech recognition errors or ambiguity errors that are inherent characteristic of the language. Recently, many models have been proposed for Dialog State Tracking. However, comparisons between models are rare and different research groups use different data from different domains. In addition, there is currently no common data set that allows experiments on dialog state tracking, as a result, such data must be collected and pre-processed from different sources, which is expensive and time consuming as there is no common line in the representation of such data. The current thesis develops a DST model whose architecture is based on Encoder-Decoder method and uses a Pointer-Generator network. The evaluation of the model takes place in a widely-used and well-known dataset. Finally, the main weaknesses encountered are analyzed and further design modifications are proposed to further improve the results of the model.
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
Dialogue_State_Tracking.pdf2.87 MBAdobe PDFView/Open

Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.