Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/16482
Title: Εξαγωγή Σχέσεων Μεταξύ Οντοτήτων Από Το Αρχείο Της Εφημερίδας "τα Νεα" Με Χρήση Τεχνικών Μη Επιβλεπόμενης Μάθησης
Authors: Νικόλαος Παπασαραντόπουλος
Γεώργιος Θεοφίλου
Σταφυλοπάτης Ανδρέας-Γεώργιος
Keywords: εξαγωγή σχέσεων μεταξύ οντοτήτων
εξαγωγή πληροφορίας
ταξινόμηση
ομαδοποίηση
μηχανική μάθηση
γραμματική επισημείωση όρων
Issue Date: 11-Nov-2012
Abstract: Η παρούσα διπλωματική εργασία έχει ως αντικείμενο τη μελέτη και την ανάπτυξη ενός συστήματος εξαγωγής σχέσεων μεταξύ οντοτήτων από αδόμητο, ποικίλης θεματολογίας και δομής κείμενο, με χρήση τεχνικών μη επιβλεπόμενης μάθησης. Το σύστημα ακολουθεί το πρότυπο του open relation extraction, δηλαδή δεν απαιτεί καμία πληροφορία εισόδου πέρα από το σώμα κειμένου από το οποίο επιχειρεί να εξάγει σχέσεις. Η εξαγωγή σχέσεων μεταξύ οντοτήτων συνίσταται στην συστηματική εξαγωγή τριάδων της μορφής (e1 , r, e2), όπου e1, e2 οντότητες και r η (ρηματική) σχέση με την οποία συνδέονται.Το σύστημα αντιμετωπίζει κείμενα τα οποία είναι γραμμένα στην ελληνική γλώσσα. Για την υλοποίηση και τον έλεγχο ορθής λειτουργίας του χρησιμοποιήθηκε το αρχείο της εφημερίδας «ΤΑ ΝΕΑ» · μια επιλογή η οποία εξασφάλισε ένα μεγάλου μεγέθους και ποικίλης θεματολογίας και μορφής σώμα κειμένου. Η εξαγωγή σχέσεων επιτυγχάνεται με τη χρήση τεχνικών συντακτικής ανάλυσης κειμένου και ο διαχωρισμός τους σε θετικές (σημασιολογικά ορθές) ή μη γίνεται με τη χρήση ταξινομητή. Ο ταξινομητής εκπαιδεύεται με ένα σύνολο επισημειωμένων δεδομένων, τα οποία προκύπτουν από την εφαρμογή ενός συνόλου κανόνων.
URI: http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/16482
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File SizeFormat 
DT2012-0274.pdf1.45 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.