Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο:
http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/15899
Τίτλος: | Γνωσιολογική Ανάλυση Αναφορών: Η Eννοιολογική Bάση Komisnet |
Συγγραφείς: | Μενέλαος Τσαγκαράκης Ασκούνης Δημήτριος |
Λέξεις κλειδιά: | komis έννοια γνωσιολογικό δίκτυο tokenization pos tagging tagger chunker chunking tagging parsing stop word list montylingua mit media lab hugo liu bcs αναφορές text mining data mining concept mining mining wordnet conceptnet treebank συνώνυμα αντίθετα |
Ημερομηνία έκδοσης: | 21-Δεκ-2010 |
Περίληψη: | Σκοπός της Διπλωματικής αυτής εργασίας είναι η ανάπτυξη ενός Εννοιολογικού Δικτύου αποκλειστικά με πληροφορία που λαμβάνεται από τεχνικές αναφορές επιβλεπόντων μηχανικών για έργα που χρηματοδοτούνται από την Ευρωπαϊκή Ένωση. Οι τεχνικές αναφορές(BCS) εμπεριέχονται στη βάση KOMIS του Εργαστηρίου Συστημάτων Αποφάσεων του Εθνικού Μετσόβιου Πολυτεχνείου. Η διαδικασία που ακολουθείται είναι ημι-αυτόματη. Αρχικά, πραγματοποιείται συλλογή όλων των BCS προς ανάλυση, βάσει των βαθμολογιών τους στις επιμέρους ερωτήσεις και με προτεραιότητα σε αυτές με πολύ χαμηλό και πολύ υψηλό βαθμό. Στη συνέχεια κρίνεται από τον αναγνώστη των BCS ποίες εκφράσεις ενδέχεται να επηρεάζουν τη βαθμολογία. Οι συγκεκριμένες εκφράσεις συλλέγονται σε διαφορετικά αρχεία ανάλογα με τη βαθμολογία και την ερώτηση. Εν συνεχεία, γίνεται η γραμματική ανάλυση αυτών. Με αυτή τη διαδικασία κάθε έκφραση χωρίζεται στις ονοματικές εκφράσεις, σε φράσεις μεταβλητών και σε ρηματικές εκφράσεις. Οτιδήποτε από τα εξαγόμενα δεδομένα (ονοματικές εκφράσεις, φράσεις μεταβλητών, ρηματικές εκφράσεις) θεωρείται από τον αναγνώστη που εφαρμόζει τον αλγόριθμο ότι επηρεάζει τη βαθμολογία(θετικά ή αρνητικά) που έχει πάρει το BCS σημειώνεται ως μεταβλητή βαθμολογίας (score modifier). Όλα τα εξαγόμενα δεδομένα τέλος, περνούν μέσα από τη βάση του WordNet με σκοπό την επέκταση της γνώσης των BCS με (συνώνυμη ή παρεμφερή) πληροφορία που έχει το WordNet και σχετίζεται με τους τεχνικούς όρους που αφορούν στη διαδικασία. Εάν τα εξαγόμενα δεδομένα είναι μεγάλες εκφράσεις τότε διαχωρίζονται σε μικρότερες που ονομάζονται δευτερεύουσες έννοιες. Όλα τα δεδομένα συγκεντρώνονται σε μία βάση που περιέχει όλες τις αναγκαίες συνδέσεις. Η βάση αυτή είναι το KOMISNet. |
URI: | http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/15899 |
Εμφανίζεται στις συλλογές: | Διπλωματικές Εργασίες - Theses |
Αρχεία σε αυτό το τεκμήριο:
Αρχείο | Μέγεθος | Μορφότυπος | |
---|---|---|---|
DT2010-0316.pdf | 3.25 MB | Adobe PDF | Εμφάνιση/Άνοιγμα |
Όλα τα τεκμήρια του δικτυακού τόπου προστατεύονται από πνευματικά δικαιώματα.