Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/14856
Πλήρες αρχείο μεταδεδομένων
Πεδίο DC ΤιμήΓλώσσα
dc.contributor.authorΦραγκιαδάκη Αικατερίνη
dc.date.accessioned2018-07-23T15:03:26Z-
dc.date.available2018-07-23T15:03:26Z-
dc.date.issued2007-8-28
dc.date.submitted2007-12-28
dc.identifier.urihttp://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/14856-
dc.description.abstractΗ ραγδαία εξάπλωση του Παγκοσμίου Ιστού και των άλλων υπηρεσιών του διαδικτύου τα τελευταία χρόνια επιτείνουν την ανάγκη ανάπτυξης συστημάτων που να βοηθούν τους χρήστες να εκμεταλλευτούν τον τεράστιο όγκο κειμένου που είναι διαθέσιμος στο διαδίκτυο. Μία ελπιδοφόρα διέξοδος για την αντιμετώπιση της πληροφοριακής αυτής έκρηξης αποτελούν τα συστήματα εξαγωγής πληροφορίας (information extraction). Η χρήση τεχνικών μηχανικής μάθησης (machine learning) διευκολύνει την ανάπτυξη συστημάτων εξαγωγής πληροφορίας, καθώς και τη μεταφερσιμότητά τους σε νέες θεματικές περιοχές ενδιαφέροντος. Στην εργασία αυτή αρχικά μελετάται η απόδοση του πιθανοτικού ακολουθιακού μοντέλου Conditional Random Fields στο πρόβλημα της εξαγωγής πληροφορίας από ιστοσελίδες του παγκόσμιου Ιστού. Επίσης μελετάται εκτενώς ο αλγόριθμος επιλογής χαρακτηριστικών και η γραφική δομή του CRF και παραθέτονται παρατηρήσεις σχετικά με τη διευκόλυνση του μοντέλου στην αναγνώριση πεδίων χωρίς ιδιαίτερη τυπογραφική δομή. Στη συνέχεια μελετάται μία νέα μεθοδολογία συνδυασμού συστημάτων εξαγωγής πληροφορίας όπου οι προβλέψεις των αλγορίθμων βασικού επιπέδου εισάγονται ως επιπλέον πληροφορία σε CRF μετά-επιπέδου, με τη μορφή χαρακτηριστικών πρόβλεψης. Σκοπός είναι να διαπιστωθεί αν το CRF μπορεί να βοηθηθεί από τα χαρακτηριστικά αυτά, να τα αξιοποιήσει για βελτίωση της απόδοσής του. Παρουσιάζονται και σχολιάζονται αποτελέσματα αξιολόγησης των αλγορίθμων βασικού επιπέδου που χρησιμοποιήσαμε καθώς και του συνδυαστικού συστήματος σε 2 θεματικές περιοχές ενδιαφέροντος.
dc.languageGreek
dc.subjectconditional random fields
dc.subjectσυνδυασός συστημάτων εξαγωγής πληροφορίας
dc.titleΣυνδυασμός Συστημάτων Εξαγωγής Πληροφορίας Με Χρήση Χαρακτηριστικών Πρόβλεψης Σε Crf Μετα-επιπέδου
dc.typeDiploma Thesis
dc.description.pages77
dc.contributor.supervisorΣελλής Τιμολέων
dc.departmentΤομέας Τεχνολογίας Πληροφορικής & Υπολογιστών
dc.organizationΕΜΠ, Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών
Εμφανίζεται στις συλλογές:Διπλωματικές Εργασίες - Theses

Αρχεία σε αυτό το τεκμήριο:
Αρχείο ΜέγεθοςΜορφότυπος 
DT2007-0097.doc967.5 kBMicrosoft WordΕμφάνιση/Άνοιγμα


Όλα τα τεκμήρια του δικτυακού τόπου προστατεύονται από πνευματικά δικαιώματα.