Please use this identifier to cite or link to this item:
http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/15899
Title: | Γνωσιολογική Ανάλυση Αναφορών: Η Eννοιολογική Bάση Komisnet |
Authors: | Μενέλαος Τσαγκαράκης Ασκούνης Δημήτριος |
Keywords: | komis έννοια γνωσιολογικό δίκτυο tokenization pos tagging tagger chunker chunking tagging parsing stop word list montylingua mit media lab hugo liu bcs αναφορές text mining data mining concept mining mining wordnet conceptnet treebank συνώνυμα αντίθετα |
Issue Date: | 21-Dec-2010 |
Abstract: | Σκοπός της Διπλωματικής αυτής εργασίας είναι η ανάπτυξη ενός Εννοιολογικού Δικτύου αποκλειστικά με πληροφορία που λαμβάνεται από τεχνικές αναφορές επιβλεπόντων μηχανικών για έργα που χρηματοδοτούνται από την Ευρωπαϊκή Ένωση. Οι τεχνικές αναφορές(BCS) εμπεριέχονται στη βάση KOMIS του Εργαστηρίου Συστημάτων Αποφάσεων του Εθνικού Μετσόβιου Πολυτεχνείου. Η διαδικασία που ακολουθείται είναι ημι-αυτόματη. Αρχικά, πραγματοποιείται συλλογή όλων των BCS προς ανάλυση, βάσει των βαθμολογιών τους στις επιμέρους ερωτήσεις και με προτεραιότητα σε αυτές με πολύ χαμηλό και πολύ υψηλό βαθμό. Στη συνέχεια κρίνεται από τον αναγνώστη των BCS ποίες εκφράσεις ενδέχεται να επηρεάζουν τη βαθμολογία. Οι συγκεκριμένες εκφράσεις συλλέγονται σε διαφορετικά αρχεία ανάλογα με τη βαθμολογία και την ερώτηση. Εν συνεχεία, γίνεται η γραμματική ανάλυση αυτών. Με αυτή τη διαδικασία κάθε έκφραση χωρίζεται στις ονοματικές εκφράσεις, σε φράσεις μεταβλητών και σε ρηματικές εκφράσεις. Οτιδήποτε από τα εξαγόμενα δεδομένα (ονοματικές εκφράσεις, φράσεις μεταβλητών, ρηματικές εκφράσεις) θεωρείται από τον αναγνώστη που εφαρμόζει τον αλγόριθμο ότι επηρεάζει τη βαθμολογία(θετικά ή αρνητικά) που έχει πάρει το BCS σημειώνεται ως μεταβλητή βαθμολογίας (score modifier). Όλα τα εξαγόμενα δεδομένα τέλος, περνούν μέσα από τη βάση του WordNet με σκοπό την επέκταση της γνώσης των BCS με (συνώνυμη ή παρεμφερή) πληροφορία που έχει το WordNet και σχετίζεται με τους τεχνικούς όρους που αφορούν στη διαδικασία. Εάν τα εξαγόμενα δεδομένα είναι μεγάλες εκφράσεις τότε διαχωρίζονται σε μικρότερες που ονομάζονται δευτερεύουσες έννοιες. Όλα τα δεδομένα συγκεντρώνονται σε μία βάση που περιέχει όλες τις αναγκαίες συνδέσεις. Η βάση αυτή είναι το KOMISNet. |
URI: | http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/15899 |
Appears in Collections: | Διπλωματικές Εργασίες - Theses |
Files in This Item:
File | Size | Format | |
---|---|---|---|
DT2010-0316.pdf | 3.25 MB | Adobe PDF | View/Open |
Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.