Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/15463
Title: Ανάκτηση Πληροφορίας Στον Ιστό Με Χρήση Ταξινόμησης Όψεων Και Συσταδοποίησης
Authors: Παναγιωτας Γεωργιου
Σελλής Τιμολέων
Keywords: χειρισμός αποτελεσμάτων αναζήτησης
ταξινόμηση μέσω όψεων
συσταδοποίηση web search results manipulation
faceted classification
clustering
Issue Date: 24-Jul-2009
Abstract: Σκοπός της παρούσας διπλωματικής εργασίας είναι η ανάπτυξη μιας εφαρμογής ανάκτησης πληροφοριών στον Ιστό, με χρήση ταξινόμησης μέσω όψεων και συσταδοποίησης, η οποία θα αποτελεί συνέχεια της διπλωματικής εργασίας με τίτλο "Εργαλείο Συλλογής και Οργάνωσης Γνώσης με Μηχανισμούς Μετα-Αναζήτησης στον Ιστό" (Αργύρης Κόλλιας, Μάρτιος 2009) και θα επεκτείνει το εργαλείο χαρτογράφησης σκέψεων Freemind προσθέτοντας επιπλέον λειτουργικότητες σε αυτό.Η εφαρμογή επικεντρώνεται στην ανάκτηση επιστημονικών δημοσιεύσεων από τον Ιστό και στη δημιουργία όψεων και συστάδων πάνω σε αυτές. Οι όψεις αφορούν τα πεδία ‘ημερομηνία’, ‘συγγραφείς’, ‘δημοσίευση σε’, ‘τύπος δημοσίευσης’, ‘γενικοί όροι’ και ‘θεματική ενότητα’. Οι τέσσερις πρώτες όψεις δημιουργούνται με βάση πληροφορίες που αντλούμε από τη Βάση Δεδομένων του DBLP, ενώ οι δύο τελευταίες προκύπτουν από πληροφορίες που παίρνουμε απευθείας από το κείμενο των δημοσιεύσεων. Κάθε όψη αποτελεί στην ουσία ένα κριτήριο το οποίο ο χρήστης θέτει στα αποτελέσματα και ανά πάσα στιγμή μπορούν να προστεθούν, να αφαιρεθούν και να τροποποιηθούν κριτήρια. Η επιλογή της τιμής μιας όψης επηρεάζει τόσο τα εμφανιζόμενα αποτελέσματα όσο και τις τιμές στις υπόλοιπες όψεις. Η δημιουργία των συστάδων πραγματοποιείται θεωρώντας ως κριτήριο στοιχεία που επίσης αντλούνται απ’ ευθείας από την εκάστοτε δημοσίευση. Οι συστάδες εμφανίζονται στο χρήστη με τρόπο παρόμοιο με αυτό των όψεων και επηρεάζουν και αυτές τα τελικά αποτελέσματα.The aim of this thesis is to develop a faceted classification and clustering system for results of web searches. The system has been built on top of Freemind, a mind-mapping editor tool. With our system, the user is able to create a map of thoughts and search for information concerning a topic of this map in the World Wide Web. Our system focuses on retrieving papers. For a resulting list of papers, facets and clusters are created. The facets concern fields such as ‘date’, ‘authors’, ‘published in’, ‘publication type’, ‘general terms’ and ‘categories and subject descriptors’. The first four facets are created based on information retrieved from the DBLP database, whereas the last two are based on information retrieved directly after parsing and processing the content of papers (where available). In fact, each facet imposes a filtering criterion on the results. The user can add, remove or change such criteria, by changing the values of each facet. The clustering task is performed using text content from the papers. Papers are organized in groups. Papers in each group are considered to be relevant to the same topic.
URI: http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/15463
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File SizeFormat 
DT2009-0200.pdf2.43 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.