Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/15123
Title: Ημι-αυτόματη Γεωκωδικοποίηση Ιστοσελίδων
Authors: Χαρίκλεια Λόντου
Σελλής Τιμολέων
Keywords: χειρονακτική γεωκωδικοποίηση
ημι-αυτόματη γεωκωδικοπίηση
απεικόνιση
Issue Date: 18-Jul-2008
Abstract: Η παρούσα διπλωματική εργασία αναπτύσσει την μεθοδολογία της ημι-αυτόματης γεωκωδικοποίησης ιστοσελίδων που μακροπρόθεσμα το περιεχόμενο τους δεν αλλάζει, δηλαδή την απόδοση γεωγραφικών συντεταγμένων στις γεωγραφικές οντότητες πουυπάρχουν στο κείμενο τους χρησιμοποιώντας έναν συνδυασμό αυτόματης και βασιζόμενη στον άνθρωπο γεωκωδικοποίησης.Οι αλγόριθμοι που χρησιμοποιούνται για το geoparsing και την γεωκωδικοποίηση έχουν εξαιρετικά αποτελέσματα όταν εφαρμόζονται για τον προσδιορισμό αριθμών τηλεφώνων και διευθύνσεων, όμως σε πιο γενικευμένα δεδομένα, οι αλγόριθμοι αυτοί εμφανίζουν ένα σημαντικό ποσοστό λάθους τόσο στο να βρίσκουν οντότητες που δεν θα έπρεπε (Ελ. Βενιζέλος είναι πρόσωπο), όσο και να μην βρίσκουν άλλες που θα έπρεπε(Ελ.Βενιζέλος- το διεθνές αεροδρόμιο της Αθήνας).Η παρούσα διπλωματική εργασία χρησιμοποιεί την ανθρώπινη παρέμβαση ώστε να βελτιώσει τα αποτελέσματα της αυτόματης γεωκωδικοποίησης. Για τον σκοπό αυτό αναπτύχθηκε ένα Web browser extension το οποίο α) επιτρέπει την χειρωνακτικήγεωκωδικοποίηση λέξεων ή φράσεων και β) την βελτίωση των αποτελεσμάτων, συμπεριλαμβανομένης και της διαγραφής των λανθασμένων αποτελεσμάτων. Αυτή η προτεινόμενη προσέγγιση είναι ιδιαίτερα χρήσιμη για ιστοσελίδες όπως η Βικιπαιδεία, δηλ., σελίδες που έχουν μια ορισμένη αξία στην κοινότητα, ιδιαίτερα προσεγμένες και που το περιεχόμενο τους αλλάζει σχετικά αργά. Εδώ, η γεωκωδικοποίηση μπορεί να αποτελέσειμέρος της δημιουργίας μιας ιστοσελίδας.Τα αποτελέσματα από την γεωκωδικοποίηση αποθηκεύονται σε μια βάση δεδομένων, δηλ., αποθηκεύονται το URL της ιστοσελίδας, η θέση της λέξης ή της φράσης και οι αντίστοιχες συντεταγμένες και τέλος η μέρα της γεωκωδικοποίησης, δηλ., η έκδοση της ιστοσελίδας. Τα αποτελέσματα απεικονίζονται υπογραμμίζοντας τις αντίστοιχες λέξεις ή φράσεις και αντιστοιχίζοντας τους χάρτες που τις περιγράφουν. Στην περίπτωση μας χρησιμοποιήθηκαν οι χάρτες της Google. Στο τεχνικό μέρος, χρησιμοποιήθηκαν ένα αυτόματο εργαλείο γεωκωδικοποίησης, που αναπτύχθηκε από τον σπουδαστή Αλβέρτο-Δαυίδ, Α. Άντζελ, ο Apache Web server καθώς και ένα browser extension σε γλώσσα JavaScript και τέλος η γλώσσα java για την θεμελίωση της επικοινωνίας.
URI: http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/15123
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
DT2008-0130.pdf5.39 MBAdobe PDFView/Open
DT2008-0130.doc9.69 MBMicrosoft WordView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.