Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/14634
Τίτλος: Μέθοδοι Εκμάθησης Ταξινομητών Από Θετικά Παραδείγματα Με Αριθμητικά Χαρακτηριστικά
Συγγραφείς: Τρογκάνης Νικόλαος
Σελλής Τιμολέων
Λέξεις κλειδιά: μηχανική μάθηση
ταξινόμηση
μάθηση με πλήρη επίβλεψη
μάθηση με μερική επίβλεψη
περιγραφή έννοιας
μάθηση από θετικά και μη ταξινομημένα δεδομένα
μάθηση από μη ισοζυγισμένα σώματα δεδομένων
Ημερομηνία έκδοσης: 26-Ιου-2006
Περίληψη: Η εργασία αυτή μελετά δύο κύριες κατηγορίες μάθησης: μάθηση με πλήρη επίβλεψη και μάθηση με μερική επίβλεψη για το πρόβλημα της ταξινόμησης. Ιδιαίτερη έμφαση δίνεται όταν έχουμε ταξινομημένα παραδείγματα μόνο από την μια κλάση που μας ενδιαφέρει (θετική κλάση), οπότε έχουμε την περιγραφή έννοιας και την μάθηση από θετικά και μη ταξινομημένα παραδείγματα αντίστοιχα. Από την τελευταία αυτή κατηγορία περιγράφουμε τους αλγόριθμους: Naive Bayes Positive (NBP), Naive Bayes Multinomial Positive (NBMP), και Biased-SVM. Ο NBP αναπτύχθηκε στα πλαίσια της εργασίας για την αντιμετώπιση οποιουδήποτε σώματος δεδομένων με διακριτά και κυρίως συνεχή-αριθμητικά χαρακτηριστικά. Το μειονέκτημα των δύο Naive Bayes Positive αλγορίθμων είναι ότι απαιτούν από τον χρήστη να δίνει μια εκτίμηση της εκ των προτέρων πιθανότητας της θετικής κλάσης, η οποία σε αρκετά προβλήματα μπορεί να μην είναι γνωστή, και για αυτό υλοποιήσαμε τέσσερις μεθόδους για τον υπολογισμό της. Οι παραπάνω αλγόριθμοι, αξιολογούνται πειραματικά σε επτά προβλήματα ταξινόμησης μη ισοζυγισμένων σωμάτων δεδομένων, και συγκρίνονται με τους αντίστοιχους αλγορίθμους μάθησης με πλήρη επίβλεψη. Τα αποτελέσματα τους αναδεικνύουν ιδιαίτερα ανταγωνιστικούς. Με ένα πολύ μικρότερο αριθμό ταξινομημένων παραδειγμάτων εκπαίδευσης, και μάλιστα μόνο από την κατηγορία που μας ενδιαφέρει, κάνοντας παράλληλα χρήση μη ταξινομημένων από τον εκπαιδευτή παραδειγμάτων, είναι δυνατόν να κατασκευαστεί ταξινομητής με ισάξια ή ακόμα και καλύτερη απόδοση. Οπότε το κέρδος είναι τεράστιο, αν αναλογιστούμε ότι η ταξινόμηση του σώματος εκπαίδευσης που γίνεται συνήθως χειροκίνητα από τον εκπαιδευτή αποτελεί μια επίπονη και χρονοβόρα διαδικασία. Εξετάζονται επίσης πειραματικά οι μέθοδοι υπολογισμού της εκτίμησης της εκ των προτέρων πιθανότητας της θετικής κλάσης, όπου και βρέθηκε ότι παρουσιάζουν πάρα πολύ καλά αποτελέσματα.
URI: http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/14634
Εμφανίζεται στις συλλογές:Διπλωματικές Εργασίες - Theses

Αρχεία σε αυτό το τεκμήριο:
Αρχείο ΜέγεθοςΜορφότυπος 
DT2006-0152.pdf716.41 kBAdobe PDFΕμφάνιση/Άνοιγμα


Όλα τα τεκμήρια του δικτυακού τόπου προστατεύονται από πνευματικά δικαιώματα.