Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/14634
Title: Μέθοδοι Εκμάθησης Ταξινομητών Από Θετικά Παραδείγματα Με Αριθμητικά Χαρακτηριστικά
Authors: Τρογκάνης Νικόλαος
Σελλής Τιμολέων
Keywords: μηχανική μάθηση
ταξινόμηση
μάθηση με πλήρη επίβλεψη
μάθηση με μερική επίβλεψη
περιγραφή έννοιας
μάθηση από θετικά και μη ταξινομημένα δεδομένα
μάθηση από μη ισοζυγισμένα σώματα δεδομένων
Issue Date: 26-Jul-2006
Abstract: Η εργασία αυτή μελετά δύο κύριες κατηγορίες μάθησης: μάθηση με πλήρη επίβλεψη και μάθηση με μερική επίβλεψη για το πρόβλημα της ταξινόμησης. Ιδιαίτερη έμφαση δίνεται όταν έχουμε ταξινομημένα παραδείγματα μόνο από την μια κλάση που μας ενδιαφέρει (θετική κλάση), οπότε έχουμε την περιγραφή έννοιας και την μάθηση από θετικά και μη ταξινομημένα παραδείγματα αντίστοιχα. Από την τελευταία αυτή κατηγορία περιγράφουμε τους αλγόριθμους: Naive Bayes Positive (NBP), Naive Bayes Multinomial Positive (NBMP), και Biased-SVM. Ο NBP αναπτύχθηκε στα πλαίσια της εργασίας για την αντιμετώπιση οποιουδήποτε σώματος δεδομένων με διακριτά και κυρίως συνεχή-αριθμητικά χαρακτηριστικά. Το μειονέκτημα των δύο Naive Bayes Positive αλγορίθμων είναι ότι απαιτούν από τον χρήστη να δίνει μια εκτίμηση της εκ των προτέρων πιθανότητας της θετικής κλάσης, η οποία σε αρκετά προβλήματα μπορεί να μην είναι γνωστή, και για αυτό υλοποιήσαμε τέσσερις μεθόδους για τον υπολογισμό της. Οι παραπάνω αλγόριθμοι, αξιολογούνται πειραματικά σε επτά προβλήματα ταξινόμησης μη ισοζυγισμένων σωμάτων δεδομένων, και συγκρίνονται με τους αντίστοιχους αλγορίθμους μάθησης με πλήρη επίβλεψη. Τα αποτελέσματα τους αναδεικνύουν ιδιαίτερα ανταγωνιστικούς. Με ένα πολύ μικρότερο αριθμό ταξινομημένων παραδειγμάτων εκπαίδευσης, και μάλιστα μόνο από την κατηγορία που μας ενδιαφέρει, κάνοντας παράλληλα χρήση μη ταξινομημένων από τον εκπαιδευτή παραδειγμάτων, είναι δυνατόν να κατασκευαστεί ταξινομητής με ισάξια ή ακόμα και καλύτερη απόδοση. Οπότε το κέρδος είναι τεράστιο, αν αναλογιστούμε ότι η ταξινόμηση του σώματος εκπαίδευσης που γίνεται συνήθως χειροκίνητα από τον εκπαιδευτή αποτελεί μια επίπονη και χρονοβόρα διαδικασία. Εξετάζονται επίσης πειραματικά οι μέθοδοι υπολογισμού της εκτίμησης της εκ των προτέρων πιθανότητας της θετικής κλάσης, όπου και βρέθηκε ότι παρουσιάζουν πάρα πολύ καλά αποτελέσματα.
URI: http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/14634
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File SizeFormat 
DT2006-0152.pdf716.41 kBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.