Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/14741
Title: Μέθοδοι Αυτόματου Εντοπισμού Σφαλμάτων Και Βελτίωσης Wrappers Με Χρήση Επαυξητικών Μεθόδων Μάθησης (wrapper Maintenance)
Authors: Χαράλαμπος Τσουρακάκης
Σελλής Τιμολέων
Keywords: μηχανική μάθηση
μάθηση προτύπων
wrapper maintenance
wrapper verification
wrapper reinduction
έλεγχος υποθέσεων
ολοκλήρωση δεδομένων
Issue Date: 13-Nov-2006
Abstract: Οι Web wrappers είναι εξειδικευμένα προγράμματα που εξάγουν αυτόματα πληροφορία από ιστοσελίδες βασιζόμενα στη δομή τους. Λόγω των συχνών αλλαγών που γίνονται τόσο στη δομή όσο και στο περιεχόμενο των ιστοσελίδων, οι wrappers συχνά αποτυχαίνουν να εξάγουν την επιθυμητή πληροφορία. Το πρόβλημα που προκύπτει είναι ο αυτόματος εντοπισμός του σφάλματος της λειτουργίας ενός wrapper ( Wrapper Verification ) καθώς και η διόρθωση του εσφαλμένου wrapper (Wrapper Reinduction). Η κύρια συνεισφορά αυτής της εργασίας είναι ένας νέος, αλγόριθμος για Wrapper Verification που σε αντίθεση με τους ήδη υπάρχοντες αλγόριθμους δεν βασίζεται στην πυκνότητα των HTML χαρακτηριστικών, αλλά σε χαρακτηριστικά του εξαγόμενου περιεχομένου ( content-based) , καθιστώντας το verification σύστημα εύρωστο αφού δεν απαιτείται καθαρισμός δεδομένων. Πειράματα έδειξαν ότι το προτεινόμενο σύστημα ARMAGEDDON είναι ένα αξιόπιστο σύστημα Wrapper Maintenance με πολύ καλά ποσοστά αναγνώρισης των σφαλμάτων ενός wrapper.
URI: http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/14741
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File SizeFormat 
DT2006-0262.pdf1.72 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.