Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/14741
Τίτλος: Μέθοδοι Αυτόματου Εντοπισμού Σφαλμάτων Και Βελτίωσης Wrappers Με Χρήση Επαυξητικών Μεθόδων Μάθησης (wrapper Maintenance)
Συγγραφείς: Χαράλαμπος Τσουρακάκης
Σελλής Τιμολέων
Λέξεις κλειδιά: μηχανική μάθηση
μάθηση προτύπων
wrapper maintenance
wrapper verification
wrapper reinduction
έλεγχος υποθέσεων
ολοκλήρωση δεδομένων
Ημερομηνία έκδοσης: 13-Νοε-2006
Περίληψη: Οι Web wrappers είναι εξειδικευμένα προγράμματα που εξάγουν αυτόματα πληροφορία από ιστοσελίδες βασιζόμενα στη δομή τους. Λόγω των συχνών αλλαγών που γίνονται τόσο στη δομή όσο και στο περιεχόμενο των ιστοσελίδων, οι wrappers συχνά αποτυχαίνουν να εξάγουν την επιθυμητή πληροφορία. Το πρόβλημα που προκύπτει είναι ο αυτόματος εντοπισμός του σφάλματος της λειτουργίας ενός wrapper ( Wrapper Verification ) καθώς και η διόρθωση του εσφαλμένου wrapper (Wrapper Reinduction). Η κύρια συνεισφορά αυτής της εργασίας είναι ένας νέος, αλγόριθμος για Wrapper Verification που σε αντίθεση με τους ήδη υπάρχοντες αλγόριθμους δεν βασίζεται στην πυκνότητα των HTML χαρακτηριστικών, αλλά σε χαρακτηριστικά του εξαγόμενου περιεχομένου ( content-based) , καθιστώντας το verification σύστημα εύρωστο αφού δεν απαιτείται καθαρισμός δεδομένων. Πειράματα έδειξαν ότι το προτεινόμενο σύστημα ARMAGEDDON είναι ένα αξιόπιστο σύστημα Wrapper Maintenance με πολύ καλά ποσοστά αναγνώρισης των σφαλμάτων ενός wrapper.
URI: http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/14741
Εμφανίζεται στις συλλογές:Διπλωματικές Εργασίες - Theses

Αρχεία σε αυτό το τεκμήριο:
Αρχείο ΜέγεθοςΜορφότυπος 
DT2006-0262.pdf1.72 MBAdobe PDFΕμφάνιση/Άνοιγμα


Όλα τα τεκμήρια του δικτυακού τόπου προστατεύονται από πνευματικά δικαιώματα.