Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/8818
Τίτλος: Μοντελοποίηση Γλώσσας Για Συστήματα Μηχανικής Μετάφρασης Με Μονόγλωσσο Σώμα Κειμένων
Συγγραφείς: Σωκράτης Σοφιανόπουλος
Καραγιάννης Γεώργιος
Λέξεις κλειδιά: μηχανική μετάφραση
αναγνώριση προτύπων
γενετικοί αλγόριθμοι
πολυκριτιριακοί εξελικτικοί αλγόριθμοι
Ημερομηνία έκδοσης: 12-Ιαν-2011
Περίληψη: Η διδακτορική διατριβή του υποψηφίου είχε ως αντικείμενο την εύρεση ενός αποδοτικού τρόπου ανάλυσης της γλώσσας ώστε να εφαρμοσθεί σε ένα σύστημα μηχανικής μετάφρασης με μονόγλωσσο σώμα κειμένων, καθώς και η βελτιστοποίηση των παραμέτρων του γλωσσικού μοντέλου εφαρμόζοντας εξελικτικούς αλγόριθμους και η αξιοποίηση υπαρχόντων μετρικών αυτόματης αξιολόγησης, ώστε μέσα από το συνδυασμό τους να αξιολογούνται αντικειμενικότερα τα αποτελέσματα της μεταφραστικής διαδικασίας.Αναλυτικότερα στο πρώτο μέρος της διατριβής προτάθηκε το μοντέλο της γλώσσας για το μεταφραστικό σύστημα. Το μοντέλο επιτρέπει την αντιστοίχηση μιας πρότασης στη γλώσσα-πηγή σε προτάσεις από το σώμα κειμένων της γλώσσας-στόχου, μέσα από μια σύνθετη διαδικασία σύγκρισης ανάμεσα σε προτάσεις των δυο γλωσσών σε δύο επίπεδα: σε επίπεδο λέξεων και σε επίπεδο φράσεων οι οποίες προκύπτουν μετά από συντακτική ανάλυση των προτάσεων. Οι συγκρίσεις εκτελούνται με τη χρήση του αλγόριθμου αναγνώρισης προτύπων Hungarian σε συνδυασμό με μια σειρά αριθμητικών παραμέτρων του μεταφραστικού μοντέλου. Αρχικά περιγράφεται το μεταφραστικό σύστημα METIS-II και η μέθοδος αναπαράστασης και αποθήκευσης κάθε πληροφορίας αναφορικά με το μονόγλωσσο σώμα κειμένων και στη συνέχεια η διαδικασία εφαρμογής του μοντέλου της γλώσσας στο μεταφραστικό σύστημα., συνοδευόμενη από τα αποτελέσματα της αξιολόγησης της ποιότητας της μετάφρασης χρησιμοποιώντας καθιερωμένες μετρικές αυτόματης αξιολόγησης, καθώς και σύγκριση με ένα καθιερωμένα εμπορικό σύστημα μηχανικής μετάφρασης.Στο δεύτερο μέρος της διατριβής παρουσιάζεται η μέθοδος βελτιστοποίησης των παραμέτρων του μοντέλου. Εξαιτίας τις ιδιαίτερης φύσης του γλωσσικού μοντέλου, δεν μπορούν να εφαρμοσθούν άμεσα οι κλασσικές τεχνικές βελτιστοποίησης των στατιστικών συστημάτων μηχανικής μετάφρασης. Για τον λόγο αυτό επιλέξαμε να υλοποιήσουμε μια πρωτότυπη μέθοδο για τη βελτιστοποίηση των παραμέτρων , η οποία βασίζεται στους εξελικτικούς αλγόριθμους (Evolutionary Algorithms), και πιο συγκεκριμένα τους Γενετικούς Αλγόριθμους (Genetic Algorithms) και τον πολυκριτηριακό εξελικτικό αλγόριθμο SPEA2. Αν και η φύση των αλγορίθμων αυτών τους καθιστά ιδανικούς για το συγκεκριμένο πρόβλημα, στον τομέα της μηχανικής μετάφρασης δεν έχουν χρησιμοποιηθεί για τη βελτιστοποίηση της ποιότητας της μετάφρασης. Με την εφαρμογή των εξελικτικών αλγορίθμων στη βελτιστοποίηση των παραμέτρων του μεταφραστικού συστήματος, εκτελέστηκαν πειράματα που αφορούσαν την αξιοποίηση και τον συνδυασμό σύγχρονων μετρικών αυτόματης αξιολόγησης της ποιότητας της μετάφρασης ως συναρτήσεις καταλληλότητας των αλγορίθμων. Αν και στη βιβλιογραφία υπάρχουν αναφορές συνδυασμού τέτοιων μετρικών για την εκπαίδευση στατιστικών μοντέλων σε μεταφραστικά συστήματα, δεν υπάρχουν αναφορές για το συνδυασμό τους ως διακριτά κριτήρια στα πλαίσια μιας προσέγγισης Pareto. Εφαρμόζοντας τον αλγόριθμο SPEA2 στη βελτιστοποίηση των παραμέτρων, παρουσιάζουμε μια μέθοδο ταυτόχρονης αξιοποίησης δυο σύγχρονων κριτηρίων αυτόματης αξιολόγησης για την αξιολόγηση της ποιότητας της μετάφρασης ενός μεταφραστικού συστήματος. Η παρουσίαση της προταθείσας μεθόδου βελτιστοποίησης συνοδεύεται από μια σειρά διεξοδικών πειραμάτων, που έχουν ως σκοπό την αντικειμενική αξιολόγηση της μεθόδου και την συγκέντρωση ικανού μεγέθους αριθμητικών δεδομένων τα οποία να αποδεικνύουν την επιτυχημένη εφαρμογή της μεθόδου στο πρόβλημα της βελτιστοποίησης των παραμέτρων του μεταφραστικού συστήματος.
URI: http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/8818
Εμφανίζεται στις συλλογές:Διδακτορικές Διατριβές - Ph.D. Theses

Αρχεία σε αυτό το τεκμήριο:
Αρχείο ΜέγεθοςΜορφότυπος 
PD2011-0004.pdf1.13 MBAdobe PDFΕμφάνιση/Άνοιγμα


Όλα τα τεκμήρια του δικτυακού τόπου προστατεύονται από πνευματικά δικαιώματα.