Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/15899
Title: Γνωσιολογική Ανάλυση Αναφορών: Η Eννοιολογική Bάση Komisnet
Authors: Μενέλαος Τσαγκαράκης
Ασκούνης Δημήτριος
Keywords: komis
έννοια
γνωσιολογικό δίκτυο
tokenization
pos tagging
tagger
chunker
chunking
tagging
parsing
stop word list
montylingua
mit media lab
hugo liu
bcs
αναφορές
text mining
data mining
concept mining
mining
wordnet
conceptnet
treebank
συνώνυμα
αντίθετα
Issue Date: 21-Dec-2010
Abstract: Σκοπός της Διπλωματικής αυτής εργασίας είναι η ανάπτυξη ενός Εννοιολογικού Δικτύου αποκλειστικά με πληροφορία που λαμβάνεται από τεχνικές αναφορές επιβλεπόντων μηχανικών για έργα που χρηματοδοτούνται από την Ευρωπαϊκή Ένωση. Οι τεχνικές αναφορές(BCS) εμπεριέχονται στη βάση KOMIS του Εργαστηρίου Συστημάτων Αποφάσεων του Εθνικού Μετσόβιου Πολυτεχνείου. Η διαδικασία που ακολουθείται είναι ημι-αυτόματη. Αρχικά, πραγματοποιείται συλλογή όλων των BCS προς ανάλυση, βάσει των βαθμολογιών τους στις επιμέρους ερωτήσεις και με προτεραιότητα σε αυτές με πολύ χαμηλό και πολύ υψηλό βαθμό. Στη συνέχεια κρίνεται από τον αναγνώστη των BCS ποίες εκφράσεις ενδέχεται να επηρεάζουν τη βαθμολογία. Οι συγκεκριμένες εκφράσεις συλλέγονται σε διαφορετικά αρχεία ανάλογα με τη βαθμολογία και την ερώτηση. Εν συνεχεία, γίνεται η γραμματική ανάλυση αυτών. Με αυτή τη διαδικασία κάθε έκφραση χωρίζεται στις ονοματικές εκφράσεις, σε φράσεις μεταβλητών και σε ρηματικές εκφράσεις. Οτιδήποτε από τα εξαγόμενα δεδομένα (ονοματικές εκφράσεις, φράσεις μεταβλητών, ρηματικές εκφράσεις) θεωρείται από τον αναγνώστη που εφαρμόζει τον αλγόριθμο ότι επηρεάζει τη βαθμολογία(θετικά ή αρνητικά) που έχει πάρει το BCS σημειώνεται ως μεταβλητή βαθμολογίας (score modifier). Όλα τα εξαγόμενα δεδομένα τέλος, περνούν μέσα από τη βάση του WordNet με σκοπό την επέκταση της γνώσης των BCS με (συνώνυμη ή παρεμφερή) πληροφορία που έχει το WordNet και σχετίζεται με τους τεχνικούς όρους που αφορούν στη διαδικασία. Εάν τα εξαγόμενα δεδομένα είναι μεγάλες εκφράσεις τότε διαχωρίζονται σε μικρότερες που ονομάζονται δευτερεύουσες έννοιες. Όλα τα δεδομένα συγκεντρώνονται σε μία βάση που περιέχει όλες τις αναγκαίες συνδέσεις. Η βάση αυτή είναι το KOMISNet.
URI: http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/15899
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File SizeFormat 
DT2010-0316.pdf3.25 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.