Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17936
Title: Αυτόματη Παραγωγή Περίληψης Κειμένου στην Ελληνική Γλώσσα με Αναδρομικά Νευρωνικά Δίκτυα Βαθιάς Μάθησης
Authors: Μήτρο, Νίκο
Βενιέρης Ιάκωβος
Keywords: Αυτόματη Περίληψη Κειμένων
Επεξεργασία Φυσικής Γλώσσας
Βαθιά Μάθηση
Αναδρομικά Νευρωνικά Δίκτυα
Μετρικές ROUGE
Αρχιτεκτονική κωδικοποιητή αποκωδικοποιητή
Περίληψη Ελληνικών Κειμένων
Automatic Text Summarization
Greek Text Summarization
Recurrent Neural Networks
Issue Date: 14-Apr-2021
Abstract: Σύστημα αυτόματης παραγωγής περίληψης ονομάζεται ένα σύστημα, το οποίο με τη χρήση κάποιου λογισμικού, παράγει ένα κείμενο μικρότερης έκτασης του αρχικού, και ταυτοχρόνως διατηρεί το αρχικό και βασικό νόημα του. Ο ολοένα και αυξανόμενος όγκος των δεδομένων που συναντάται στη σημερινή εποχή, καθιστά την ανάγκη ενός τέτοιου αυτόματου συστήματος ακόμα πιο αισθητή και ταυτοχρόνως ενθαρρύνει την ανάπτυξη λογισμικού για την προσπέλαση αυτού του μεγάλου όγκου δεδομένων. Ο σχεδιασμός ενός εύρωστου συστήματος ικανό να παράγει νοηματικά, συντακτικά και γραμματικά ορθές περιλήψεις συγκεντρώνει μεγάλο ερευνητικό ενδιαφέρον, με αποτέλεσμα διάφοροι μηχανισμοί και εργαλεία λογισμικού να έχουν υλοποιηθεί για την επίλυση αυτού του προβλήματος. Κανένα όμως από αυτά τα εργαλεία δεν έχουν επιτύχει μέχρι σήμερα τη δημιουργία ενός γενικευμένου και ιδανικού συστήματος αυτόματης παραγωγής περίληψης, λόγω της δυσκολίας και της πολυπλοκότητας που εμφανίζει το συγκεκριμένο πρόβλημα. Ωστόσο, η ραγδαία ανάπτυξη της μηχανικής και ιδιαιτέρως της βαθιάς μάθησης, έχει συστήσει νέες τεχνικές αντιμετώπισης του προβλήματος, επιφέροντας βελτιωμένα αποτελέσματα. Στη συγκεκριμένη εργασία, πραγματοποιείται μια πρώτη απόπειρα υλοποίησης ενός αποδοτικού συστήματος αυτόματης παραγωγής περίληψης για την ελληνική γλώσσα. Η υλοποίηση βασίζεται σε μηχανισμούς βαθιάς μάθησης και συγκεκριμένα σε αναδρομικά νευρωνικά δίκτυα και στην αρχιτεκτονική κωδικοποιητή-αποκωδικοποιητή. Για την προσαρμογή του συστήματος στην ελληνική γλώσσα, πραγματοποιείται σύγκρισή της με την αγγλική και μελέτη των ιδιομορφιών της σε συντακτικό και γραμματικό επίπεδο. Οι ιδιομορφίες αυτές αντιμετωπίζονται μέσω του λογισμικού στο στάδιο της προ-επεξεργασίας και στο στάδιο της παραγωγής των αριθμητικών αναπαραστάσεων των λέξεων. Για την αξιολόγηση των σχεδιαστικών επιλογών που πάρθηκαν κατά την υλοποίηση του συστήματος και την εύρεση του βέλτιστου συνδυασμού τους, διερευνάται η επίδραση διάφορων βασικών παραμέτρων στην επίδοση του. Οι μετρήσεις της επίδοσης του συστήματος βασίζονται στις καθιερωμένες σε προβλήματα παραγωγής περίληψης μετρικές ROUGE. Από τα πειραματικά αποτελέσματα εξάγονται χρήσιμα συμπεράσματα για την λειτουργία και την αποτελεσματικότητα του συστήματος και αναδεικνύονται κάποιες ορθές κατευθύνσεις για το σχεδιασμό παρόμοιων συστημάτων. Τέλος, παρουσιάζεται ένας πιθανός τρόπος ενσωμάτωσης του υλοποιημένου συστήματος σε μια έξυπνη εφαρμογή για κινητά και προτείνονται κάποιες μελλοντικές κατευθύνσεις προώθησης της έρευνας πάνω στο αντικείμενο.
URI: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17936
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
Nikos_Mitro_Thesis.pdfAutomatic Greek Text Summarization with Recurrent Neural Networks2.14 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.