Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/16482
Τίτλος: Εξαγωγή Σχέσεων Μεταξύ Οντοτήτων Από Το Αρχείο Της Εφημερίδας "τα Νεα" Με Χρήση Τεχνικών Μη Επιβλεπόμενης Μάθησης
Συγγραφείς: Νικόλαος Παπασαραντόπουλος
Γεώργιος Θεοφίλου
Σταφυλοπάτης Ανδρέας-Γεώργιος
Λέξεις κλειδιά: εξαγωγή σχέσεων μεταξύ οντοτήτων
εξαγωγή πληροφορίας
ταξινόμηση
ομαδοποίηση
μηχανική μάθηση
γραμματική επισημείωση όρων
Ημερομηνία έκδοσης: 11-Νοε-2012
Περίληψη: Η παρούσα διπλωματική εργασία έχει ως αντικείμενο τη μελέτη και την ανάπτυξη ενός συστήματος εξαγωγής σχέσεων μεταξύ οντοτήτων από αδόμητο, ποικίλης θεματολογίας και δομής κείμενο, με χρήση τεχνικών μη επιβλεπόμενης μάθησης. Το σύστημα ακολουθεί το πρότυπο του open relation extraction, δηλαδή δεν απαιτεί καμία πληροφορία εισόδου πέρα από το σώμα κειμένου από το οποίο επιχειρεί να εξάγει σχέσεις. Η εξαγωγή σχέσεων μεταξύ οντοτήτων συνίσταται στην συστηματική εξαγωγή τριάδων της μορφής (e1 , r, e2), όπου e1, e2 οντότητες και r η (ρηματική) σχέση με την οποία συνδέονται.Το σύστημα αντιμετωπίζει κείμενα τα οποία είναι γραμμένα στην ελληνική γλώσσα. Για την υλοποίηση και τον έλεγχο ορθής λειτουργίας του χρησιμοποιήθηκε το αρχείο της εφημερίδας «ΤΑ ΝΕΑ» · μια επιλογή η οποία εξασφάλισε ένα μεγάλου μεγέθους και ποικίλης θεματολογίας και μορφής σώμα κειμένου. Η εξαγωγή σχέσεων επιτυγχάνεται με τη χρήση τεχνικών συντακτικής ανάλυσης κειμένου και ο διαχωρισμός τους σε θετικές (σημασιολογικά ορθές) ή μη γίνεται με τη χρήση ταξινομητή. Ο ταξινομητής εκπαιδεύεται με ένα σύνολο επισημειωμένων δεδομένων, τα οποία προκύπτουν από την εφαρμογή ενός συνόλου κανόνων.
URI: http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/16482
Εμφανίζεται στις συλλογές:Διπλωματικές Εργασίες - Theses

Αρχεία σε αυτό το τεκμήριο:
Αρχείο ΜέγεθοςΜορφότυπος 
DT2012-0274.pdf1.45 MBAdobe PDFΕμφάνιση/Άνοιγμα


Όλα τα τεκμήρια του δικτυακού τόπου προστατεύονται από πνευματικά δικαιώματα.