Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/15899
Τίτλος: Γνωσιολογική Ανάλυση Αναφορών: Η Eννοιολογική Bάση Komisnet
Συγγραφείς: Μενέλαος Τσαγκαράκης
Ασκούνης Δημήτριος
Λέξεις κλειδιά: komis
έννοια
γνωσιολογικό δίκτυο
tokenization
pos tagging
tagger
chunker
chunking
tagging
parsing
stop word list
montylingua
mit media lab
hugo liu
bcs
αναφορές
text mining
data mining
concept mining
mining
wordnet
conceptnet
treebank
συνώνυμα
αντίθετα
Ημερομηνία έκδοσης: 21-Δεκ-2010
Περίληψη: Σκοπός της Διπλωματικής αυτής εργασίας είναι η ανάπτυξη ενός Εννοιολογικού Δικτύου αποκλειστικά με πληροφορία που λαμβάνεται από τεχνικές αναφορές επιβλεπόντων μηχανικών για έργα που χρηματοδοτούνται από την Ευρωπαϊκή Ένωση. Οι τεχνικές αναφορές(BCS) εμπεριέχονται στη βάση KOMIS του Εργαστηρίου Συστημάτων Αποφάσεων του Εθνικού Μετσόβιου Πολυτεχνείου. Η διαδικασία που ακολουθείται είναι ημι-αυτόματη. Αρχικά, πραγματοποιείται συλλογή όλων των BCS προς ανάλυση, βάσει των βαθμολογιών τους στις επιμέρους ερωτήσεις και με προτεραιότητα σε αυτές με πολύ χαμηλό και πολύ υψηλό βαθμό. Στη συνέχεια κρίνεται από τον αναγνώστη των BCS ποίες εκφράσεις ενδέχεται να επηρεάζουν τη βαθμολογία. Οι συγκεκριμένες εκφράσεις συλλέγονται σε διαφορετικά αρχεία ανάλογα με τη βαθμολογία και την ερώτηση. Εν συνεχεία, γίνεται η γραμματική ανάλυση αυτών. Με αυτή τη διαδικασία κάθε έκφραση χωρίζεται στις ονοματικές εκφράσεις, σε φράσεις μεταβλητών και σε ρηματικές εκφράσεις. Οτιδήποτε από τα εξαγόμενα δεδομένα (ονοματικές εκφράσεις, φράσεις μεταβλητών, ρηματικές εκφράσεις) θεωρείται από τον αναγνώστη που εφαρμόζει τον αλγόριθμο ότι επηρεάζει τη βαθμολογία(θετικά ή αρνητικά) που έχει πάρει το BCS σημειώνεται ως μεταβλητή βαθμολογίας (score modifier). Όλα τα εξαγόμενα δεδομένα τέλος, περνούν μέσα από τη βάση του WordNet με σκοπό την επέκταση της γνώσης των BCS με (συνώνυμη ή παρεμφερή) πληροφορία που έχει το WordNet και σχετίζεται με τους τεχνικούς όρους που αφορούν στη διαδικασία. Εάν τα εξαγόμενα δεδομένα είναι μεγάλες εκφράσεις τότε διαχωρίζονται σε μικρότερες που ονομάζονται δευτερεύουσες έννοιες. Όλα τα δεδομένα συγκεντρώνονται σε μία βάση που περιέχει όλες τις αναγκαίες συνδέσεις. Η βάση αυτή είναι το KOMISNet.
URI: http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/15899
Εμφανίζεται στις συλλογές:Διπλωματικές Εργασίες - Theses

Αρχεία σε αυτό το τεκμήριο:
Αρχείο ΜέγεθοςΜορφότυπος 
DT2010-0316.pdf3.25 MBAdobe PDFΕμφάνιση/Άνοιγμα


Όλα τα τεκμήρια του δικτυακού τόπου προστατεύονται από πνευματικά δικαιώματα.