Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/14699
Title: Αλγόριθμοι Προεπεξεργασίας Και Ταξινόμησης Δεδομένων Φασματογραφίας Μάζας
Authors: Ξενοφών Ε. Φλώρος
Νικήτα Κωνσταντίνα
Keywords: φασματογραφία μάζας
προεπεξεργασία δεδομένων φασματογραφίας μάζας
εξαγωγή χαρακτηριστικών
ταξινόμηση
πρώιμη διάγνωση
ανακάλυψη βιοσημαντών
καρκίνος ωοθηκών
Issue Date: 23-Oct-2006
Abstract: Η φασματογραφία μάζας εξελίσσεται ως ένα από τα σημαντικότερα εργαλεία στις βιοεπιστήμες. Δείγματα ιστών ή βιολογικά υγρά τα οποία μπορούν εύκολα να αποκτηθούν, όπως το πλάσμα και η ουρίνη, αναλύονται μέσω τεχνικών φασματογραφίας μάζας και παράγουν φάσματα, τα οποία χαρακτηρίζονται από υψηλή διάσταση και παρουσία θορύβου. Στην εργασία αυτή προτείνουμε μια μέθοδο εξαγωγής χαρακτηριστικών από δεδομένα φασματογραφίας μάζας, η οποία αποτελείται από δύο κύρια μέρη: Στο πρώτο, εφαρμόζεται ένας αλγόριθμος προεπεξεργασίας των φασμάτων, ο οποίος περιλαμβάνει επαναδειγματοληψία, αποθορυβοποίηση με χρήση του Shift-Invariant Discrete Wavelet Transform (SIDWT), ομαλοποίηση, διόρθωση της βασικής γραμμής, ανίχνευση κορυφών και κανονικοποίηση των παραγόμενων συνόλων κορυφών. Μετά από αυτό το μέρος, έχουμε επιτύχει ελάττωση της διάστασης του χώρου των φασματικών χαρακτηριστικών καθώς και της πλεονάζουσας πληροφορίας που υπήρχε στα αρχικά φάσματα, διατηρώντας παράλληλα τα χαρακτηριστικά που απαιτούνται, ώστε να εξάγουμε πρωτεϊνικά μοτίβα που συνδέονται με τις παθογενείς καταστάσεις. Στο δεύτερο μέρος, οι εξαχθείσες λίστες κορυφών ευθυγραμμίζονται και η διάσταση τους ελαττώνεται περαιτέρω μέσω ενός βήματος επιλογής χαρακτηριστικών. Για την ταξινόμηση των παραγόμενων διανυσμάτων χαρακτηριστικών επιλέχτηκε Support Vector Machine (SVM) γραμμικού πυρήνα. Για την αξιολόγηση της προτεινόμενης μεθόδου χρησιμοποιήθηκαν δεδομένα από φασματογράφο SELDI-QqTOF, τα οποία προέρχονται από δείγματα πλάσματος γυναικών που πάσχων από καρκίνο των ωοθηκών, καθώς και υγιών γυναικών. Μελετάται, επίσης, η επίδραση των παραμέτρων, οι οποίες εμπλέκονται στη διαδικασία, στην απόδοση της ταξινομησης και επισημαίνονται οι πιο σημαντικές από αυτές. Για τον προσδιορισμό των τιμών των κρίσιμων παραμέτρων που μεγιστοποιούν την απόδοση της ταξινόμησης χρησιμοποιήθηκε ένα σχήμα 10-fold cross validation. Οι υπολογιζόμενες βέλτιστες τιμές οδηγούν σε ακρίβεια 0.994 και AUC (Area Under Curve) 0.997 .
URI: http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/14699
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File SizeFormat 
DT2006-0219.pdf3.54 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.