Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/16781
Title: Ανασκόπηση της εφαρμογής των μεθόδων μηχανικής μάθησης  Στη βιοπληροφορική
Authors: Χαρίδημος Τζεδάκης
Κουτσούρης Διονύσιος-Δημήτριος
Keywords: τεχνητή νοημοσύνη
 μηχανική μάθηση
 προεπεξεργασία δεδομένων
επιλογή χαρακτηριστικών
 παραγωγή χαρακτηριστικών
 καμπύλες roc
 στατιστικός έλεγχος υπόθεσης
 ταξινόμηση
 γραμμική διαχωριστική ανάλυση
 ταξινομητές κοντινότερου γείτονα
 μπεϋζιανοί ταξινομητές
 μπεϋζιανά δίκτυα
 δέντρα απόφασης
νευρωνικά δίκτυα
 νευρωνικά δίκτυα εμπρόσθιας τροφοδότησης
 νευρωνικά δίκτυα ακτινικής βάσης
 πιθανοτικά νευρωνικά δίκτυα
 νευρωνικά δίκτυα ανατροφοδότησης
μηχανές διανυσμάτων υποστήριξης
 γενετικοί αλγόριθμοι
 νευρο-ασαφή συστήματα
συλλογική μάθηση
 συλλογικοί ταξινομητές
 bagging
 συλλογικός ταξινομητής random forest
 boosting
 αλγόριθμος adaboost
Issue Date: 15-Jan-2014
Abstract: Η παρούσα εργασία αποσκοπεί στο να συγκεντρώσει και να παρουσιάσει μεθόδους Μηχανικής Μάθησης που βρίσκουν εφαρμογή στη Βιοπληροφορική, καθώς και συγκεκριμένες εφαρμογές των τεχνικών αυτών. Οι τεχνικές που παρουσιάζονται ανήκουν στο ευρύτερο επιστημονικό πεδίο της Τεχνητής Νοημοσύνης.Η Τεχνητή Νοημοσύνη διαθέτει διάφορες διαδικασίες αυτοματοποίησης τωνδραστηριοτήτων που συσχετίζονται με την ανθρώπινη σκέψη, όπως η λήψη αποφάσεων, η επίλυση προβλημάτων, η μάθηση. Η Μηχανική Μάθηση εκφράζει την προσπάθεια δημιουργίας συστημάτων που έχουν τη δυνατότητα να μαθαίνουν από την ήδη υπάρχουσα γνώση, να συλλέγουν γνώση από το περιβάλλον τους  και να αξιοποιούν τη γνώση αυτή για τη λήψη αποφάσεων και την εξαγωγή συμπερασμάτων. Η Μηχανική Μάθηση χρησιμοποιείται σε πολλές εφαρμογές Βιοπληροφορικής καιείναι ένα πολύτιμο εργαλείο στη διάθεση των ειδικών, για τη διαχείριση τηςπολυπλοκότητας και του τεράστιου όγκου των δεδομένων που προκύπτουν σε διάφορεςεφαρμογές Ιατρικής, Βιοϊατρικής και Βιολογίας. Μέθοδοι Μηχανικής Μάθησης έχουνχρησιμοποιηθεί για διάγνωση και πρόγνωση ασθενειών, για διαχείριση ασθενών, για τηνυποστήριξη λήψης ιατρικών αποφάσεων, για επεξεργασία και ανάλυση βιοϊατρικώνσημάτων, για διαχείριση βιολογικών, κυτταρικών δεδομένων και για εξαγωγή μοντέλων καισυμπερασμάτων από τα δεδομένα αυτά.Η πολυπλοκότητα και το μέγεθος της πληροφορίας που είναι διαθέσιμη γιααξιοποίηση ολοένα και αυξάνει, επομένως είναι μεγαλύτερη η ανάγκη για αποδοτικότερηχρήση των διαθέσιμών δεδομένων και για αυτόματη εξαγωγή συμπερασμάτων. Ταδεδομένα που σχετίζονται με εφαρμογές Βιοπληροφορικής εξαρτώνται από πολλούςπαράγοντες και έχουν πολλές παραμέτρους - πολλές φορές ο άνθρωπος-ειδικός αδυνατείνα βρει κρυμμένα πρότυπα που υπάρχουν ή να εντοπίσει τις παραμέτρους στις οποίες θαπρέπει να εστιάσει. Για το λόγο αυτό έχουν αναπτυχθεί κατάλληλες τεχνικέςπροεπεξεργασίας δεδομένων, ώστε να απομακρυνθεί ο θόρυβος και η πληροφορία πουδεν είναι χρήσιμη. Με αυτόν τον τρόπο, επιλέγονται οι παράμετροι που θα οδηγήσουνεπιτυχώς στη δημιουργία του μοντέλου και στην εξαγωγή των συμπερασμάτων. Στις περισσότερες εφαρμογές προκύπτει το πρόβλημα της Ταξινόμησης, δηλαδή ηεύρεση των κατηγοριών/κλάσεων στις οποίες ανήκουν τα δεδομένα, με βάση τις τιμές σεσυγκεκριμένα χαρακτηριστικά τους. Η ταξινόμηση επιτυγχάνεται με τη βοήθεια κάποιουμοντέλου το οποίο μπορεί να σχηματιστεί από μια διαδικασία εκμάθησης,χρησιμοποιώντας δεδομένα για τα οποία οι κλάσεις είναι γνωστές εκ των προτέρων. Αφούδημιουργηθεί το σύστημα ταξινόμησης, θα πρέπει στη συνέχεια να αξιολογηθεί ηικανότητά του να προβλέπει σωστά τις κλάσεις για νέα δεδομένα του προβλήματος.Στην εργασία αυτή, αρχικά παρουσιάζονται απλές μέθοδοι ταξινόμησης, όπως ηΓραμμική Διαχωριστική Ανάλυση, οι Ταξινομητές Κοντινότερου Γείτονα και ο ΑπλοϊκόςΜπεϋζιανός Ταξινομητής. Έπειτα, σταδιακά γίνεται αναφορά σε περισσότερο σύνθετεςμεθόδους: Μπεϋζιανά Δίκτυα, Δέντρα Απόφασης, Νευρωνικά Δίκτυα και ΜηχανέςΔιανυσμάτων Υποστήριξης. Στη συνέχεια γίνεται μια περιγραφή των υβριδικώνσυστημάτων ταξινόμησης που μπορεί να προκύψουν με συνδυασμό διάφορων μεθόδωνκαι παρουσιάζονται οι βασικότερες μέθοδοι σχεδίασης συλλογικών ταξινομητών. Για ταΜπεϋζιανά Δίκτυα, τα Δέντρα Απόφασης, τα Νευρωνικά δίκτυα, τις Μηχανές ΔιανυσμάτωνΥποστήριξης, τα υβριδικά συστήματα και τους συλλογικούς ταξινομητές παρατίθεται μιαανασκόπηση των εφαρμογών τους στη Βιοπληροφορική.
URI: http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/16781
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File SizeFormat 
DT2014-0016.pdf4.11 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.