Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/8723
Τίτλος: Ανάπτυξη Αλγορίθμων Για Την Επεξεργασία Δεδομένων Φυσικής Γλώσσας
Συγγραφείς: Δετοράκης Ζαχαρίας
Καραγιάννης Γεώργιος
Λέξεις κλειδιά: ομαδοποίηση; μορφολογική ανάλυση; γενετικοί αλγόριθμοι
Ημερομηνία έκδοσης: 20-Οκτ-2009
Περίληψη: Στα πλαίσια της Διδακτορικής Διατριβής αναπτύχθηκε ένα σύστημα αυτόματης κατασκευής μορφολογικών λεξικών. Το σύστημα αυτό αποτελείται από τρία επιμέρους υποτμήματα συνδεδεμένα σειριακά, ώστε καθένα να λαμβάνει ως είσοδο την έξοδο του προηγουμένου.Το πρώτο υποσύστημα δέχεται ως είσοδο τη συλλογή κειμένων που θα αποτελέσει τη βάση δημιουργίας του μορφολογικού λεξικού και αναγνωρίζει τις λέξεις που υπάρχουν σε αυτήν δημιουργώντας μια λίστα μοναδικών λέξεων. Η λίστα αυτή αποτελεί την είσοδο του δεύτερου υποσυστήματος, που στοχεύει στο χωρισμό των λέξεων που έχουν αναγνωριστεί σε δύο τμήματα, το θέμα και την κατάληξη. Για την υλοποίηση του δεύτερου υποσυστήματος αναπτύχθηκαν τρεις διαφορετικές παραλλαγές: α. ένα ευρετικό σύστημα, β. ένα σύστημα που βασίζεται στην απόσταση Levenshtein και γ. ένα σύστημα που βασίζεται στους γενετικούς αλγορίθμους. Η τρίτη παραλλαγή είναι εκείνη που δίνει τα βέλτιστα αποτελέσματα και επιτρέπει μέσω ενός περιορισμένου συνόλου εκπαίδευσης την εύκολη προσαρμογή στις απαιτήσεις του χρήστη σε ότι αφορά την μορφολογική ανάλυση. Η έξοδος του δεύτερου υποσυστήματος, με οποιαδήποτε από τις τρεις παραλλαγές και αν υλοποιηθεί είναι η λίστα λέξεων της εισόδου χωρισμένη σε θέματα και καταλήξεις. Το τρίτο και τελευταίο υποσύστημα παίρνει ως είσοδο τις χωρισμένες λέξεις και επιχειρεί να ομαδοποιήσει τα θέματά τους με τρόπο τέτοιο που να προσομοιώνει τα κλιτικά παραδείγματα ενός μορφολογικού λεξικού. Κάθε θέμα αποτελεί ξεχωριστό στοιχείο εισόδου με χαρακτηριστικά τις καταλήξεις που απαντώνται στο σύνολο των λέξεων. Τα θέματα ομαδοποιούνται σταδιακά χρησιμοποιώντας έναν συσσωρευτικό αλγόριθμο δημιουργώντας ομάδες με παρόμοια χαρακτηριστικά.
URI: http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/8723
Εμφανίζεται στις συλλογές:Διδακτορικές Διατριβές - Ph.D. Theses

Αρχεία σε αυτό το τεκμήριο:
Αρχείο ΜέγεθοςΜορφότυπος 
PD2009-0052.pdf4.27 MBAdobe PDFΕμφάνιση/Άνοιγμα


Όλα τα τεκμήρια του δικτυακού τόπου προστατεύονται από πνευματικά δικαιώματα.