Please use this identifier to cite or link to this item:
http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/14856
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.author | Φραγκιαδάκη Αικατερίνη | |
dc.date.accessioned | 2018-07-23T15:03:26Z | - |
dc.date.available | 2018-07-23T15:03:26Z | - |
dc.date.issued | 2007-8-28 | |
dc.date.submitted | 2007-12-28 | |
dc.identifier.uri | http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/14856 | - |
dc.description.abstract | Η ραγδαία εξάπλωση του Παγκοσμίου Ιστού και των άλλων υπηρεσιών του διαδικτύου τα τελευταία χρόνια επιτείνουν την ανάγκη ανάπτυξης συστημάτων που να βοηθούν τους χρήστες να εκμεταλλευτούν τον τεράστιο όγκο κειμένου που είναι διαθέσιμος στο διαδίκτυο. Μία ελπιδοφόρα διέξοδος για την αντιμετώπιση της πληροφοριακής αυτής έκρηξης αποτελούν τα συστήματα εξαγωγής πληροφορίας (information extraction). Η χρήση τεχνικών μηχανικής μάθησης (machine learning) διευκολύνει την ανάπτυξη συστημάτων εξαγωγής πληροφορίας, καθώς και τη μεταφερσιμότητά τους σε νέες θεματικές περιοχές ενδιαφέροντος. Στην εργασία αυτή αρχικά μελετάται η απόδοση του πιθανοτικού ακολουθιακού μοντέλου Conditional Random Fields στο πρόβλημα της εξαγωγής πληροφορίας από ιστοσελίδες του παγκόσμιου Ιστού. Επίσης μελετάται εκτενώς ο αλγόριθμος επιλογής χαρακτηριστικών και η γραφική δομή του CRF και παραθέτονται παρατηρήσεις σχετικά με τη διευκόλυνση του μοντέλου στην αναγνώριση πεδίων χωρίς ιδιαίτερη τυπογραφική δομή. Στη συνέχεια μελετάται μία νέα μεθοδολογία συνδυασμού συστημάτων εξαγωγής πληροφορίας όπου οι προβλέψεις των αλγορίθμων βασικού επιπέδου εισάγονται ως επιπλέον πληροφορία σε CRF μετά-επιπέδου, με τη μορφή χαρακτηριστικών πρόβλεψης. Σκοπός είναι να διαπιστωθεί αν το CRF μπορεί να βοηθηθεί από τα χαρακτηριστικά αυτά, να τα αξιοποιήσει για βελτίωση της απόδοσής του. Παρουσιάζονται και σχολιάζονται αποτελέσματα αξιολόγησης των αλγορίθμων βασικού επιπέδου που χρησιμοποιήσαμε καθώς και του συνδυαστικού συστήματος σε 2 θεματικές περιοχές ενδιαφέροντος. | |
dc.language | Greek | |
dc.subject | conditional random fields | |
dc.subject | συνδυασός συστημάτων εξαγωγής πληροφορίας | |
dc.title | Συνδυασμός Συστημάτων Εξαγωγής Πληροφορίας Με Χρήση Χαρακτηριστικών Πρόβλεψης Σε Crf Μετα-επιπέδου | |
dc.type | Diploma Thesis | |
dc.description.pages | 77 | |
dc.contributor.supervisor | Σελλής Τιμολέων | |
dc.department | Τομέας Τεχνολογίας Πληροφορικής & Υπολογιστών | |
dc.organization | ΕΜΠ, Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών | |
Appears in Collections: | Διπλωματικές Εργασίες - Theses |
Files in This Item:
File | Size | Format | |
---|---|---|---|
DT2007-0097.doc | 967.5 kB | Microsoft Word | View/Open |
Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.