Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17223
Title: Αυτόματη Περίληψη Κειμένου με Χρήση Νευρωνικών Δικτύων Βαθιάς Μάθησης
Authors: Αλέξανδρος Νικόπουλος
Σταφυλοπάτης Ανδρέας-Γεώργιος
Keywords: Νευρωνικά Δίκτυα Βαθιάς Μάθησης
Αυτόματη Περίληψη
Αρχιτεκτονική Κωδικοποιητή Αποκωδικοποιητή
Μετρικές Rouge
Issue Date: 13-Mar-2019
Abstract: Αυτόματη περίληψη κειμένου ονομάζεται η διαδικασία παραγωγής περίληψης με χρήση κάποιου λογισμικού, ώστε να διατηρείται το αρχικό και κύριο νόημα του κειμένου. Στην σημερινή εποχή όπου ο όγκος της πληροφορίας ολοένα και αυξάνεται, η ανάπτυξη αποτελεσματικού λογισμικού για αυτόματη περίληψη καθιστά εφικτή τη προσπέλαση μεγάλου όγκου πληροφορίας με αποδοτικό τρόπο. Για την παραγωγή νοηματικά σωστής περίληψης κειμένου, που παράλληλα θα διατηρεί ορθή σύνταξη και γραμματική, έχουν αναπτυχθεί διάφορα εργαλεία λογισμικού τα οποία βρίσκονται ακόμα υπό έρευνα. Λόγω της εγγενώς δύσκολης φύσης του προβλήματος τα εργαλεία που έχουν αναπτυχθεί έως σήμερα απέχουν αρκετά από την παραγωγή μιας ιδανικής περίληψης. Ωστόσο, η πρόσφατη έξαρση συγκεκριμένων ευφυών τεχνικών έχει επιφέρει κάποια βελτίωση στην αυτόματη παραγωγή περίληψης. Στην συγκεκριμένη διπλωματική εργασία σχεδιάζεται ένας μηχανισμός που βασίζεται σε νευρωνικά δίκτυα βαθιάς μάθησης για την αντιμετώπιση του προβλήματος της αυτόματης περίληψης κειμένου. Στα πλαίσια αυτού του μηχανισμού, διερευνώνται και συγκρίνονται μεταξύ τους διάφορες σχεδιαστικές επιλογές με στόχο την μεγιστοποίηση της επίδοσης. Πιο συγκεκριμένα, αρχικά πραγματοποιείται επεξεργασία των συνόλων δεδομένων που χρησιμοποιούνται με στόχο την ελαχιστοποίηση του θορύβου που περιέχουν. Στη συνέχεια παρουσιάζεται η αρχιτεκτονική του μηχανισμού παραγωγής της περίληψης και μελετάται ως προς τις διάφορες κρίσιμες παραμέτρους. Στα πλαίσια αντιμετώπισης της εγγενούς δυσκολίας που υπάρχει στο συγκεκριμένο πρόβλημα λόγω της αναγκαιότητας χειρισμού πολύ μεγάλου πλήθους λέξεων, παρουσιάζεται και αναλύεται ένας καινοφανής μηχανισμός αντιμετώπισης των πιθανών άγνωστων λέξεων που εμφανίζονται κατά την διαδικασία παραγωγής της περίληψης. Για την εφαρμογή και αξιολόγηση του συστήματος αυτόματης περίληψης κειμένου χρησιμοποιούνται δύο γνωστά σύνολα δεδομένων. Οι μετρήσεις επίδοσης βασίζονται στην καθιερωμένη μετρική Rouge η οποία πραγματοποιεί συγκρίσεις ομοιότητας μεταξύ των παραγόμενων και των δοσμένων περιλήψεων. Από τα πειραματικά αποτελέσματα εξάγονται χρήσιμα συμπεράσματα για τη βελτίωση της απόδοσης ενός συστήματος αυτόματης περίληψης κειμένου. Τέλος, παρουσιάζονται κάποιες μελλοντικές κατευθύνσεις για την περαιτέρω προώθηση της έρευνας.
URI: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17223
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
Diplwmatikh.pdf1.35 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.