Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/14699
Full metadata record
DC FieldValueLanguage
dc.contributor.authorΞενοφών Ε. Φλώρος
dc.date.accessioned2018-07-23T14:53:08Z-
dc.date.available2018-07-23T14:53:08Z-
dc.date.issued2006-10-23
dc.date.submitted2006-12-18
dc.identifier.urihttp://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/14699-
dc.description.abstractΗ φασματογραφία μάζας εξελίσσεται ως ένα από τα σημαντικότερα εργαλεία στις βιοεπιστήμες. Δείγματα ιστών ή βιολογικά υγρά τα οποία μπορούν εύκολα να αποκτηθούν, όπως το πλάσμα και η ουρίνη, αναλύονται μέσω τεχνικών φασματογραφίας μάζας και παράγουν φάσματα, τα οποία χαρακτηρίζονται από υψηλή διάσταση και παρουσία θορύβου. Στην εργασία αυτή προτείνουμε μια μέθοδο εξαγωγής χαρακτηριστικών από δεδομένα φασματογραφίας μάζας, η οποία αποτελείται από δύο κύρια μέρη: Στο πρώτο, εφαρμόζεται ένας αλγόριθμος προεπεξεργασίας των φασμάτων, ο οποίος περιλαμβάνει επαναδειγματοληψία, αποθορυβοποίηση με χρήση του Shift-Invariant Discrete Wavelet Transform (SIDWT), ομαλοποίηση, διόρθωση της βασικής γραμμής, ανίχνευση κορυφών και κανονικοποίηση των παραγόμενων συνόλων κορυφών. Μετά από αυτό το μέρος, έχουμε επιτύχει ελάττωση της διάστασης του χώρου των φασματικών χαρακτηριστικών καθώς και της πλεονάζουσας πληροφορίας που υπήρχε στα αρχικά φάσματα, διατηρώντας παράλληλα τα χαρακτηριστικά που απαιτούνται, ώστε να εξάγουμε πρωτεϊνικά μοτίβα που συνδέονται με τις παθογενείς καταστάσεις. Στο δεύτερο μέρος, οι εξαχθείσες λίστες κορυφών ευθυγραμμίζονται και η διάσταση τους ελαττώνεται περαιτέρω μέσω ενός βήματος επιλογής χαρακτηριστικών. Για την ταξινόμηση των παραγόμενων διανυσμάτων χαρακτηριστικών επιλέχτηκε Support Vector Machine (SVM) γραμμικού πυρήνα. Για την αξιολόγηση της προτεινόμενης μεθόδου χρησιμοποιήθηκαν δεδομένα από φασματογράφο SELDI-QqTOF, τα οποία προέρχονται από δείγματα πλάσματος γυναικών που πάσχων από καρκίνο των ωοθηκών, καθώς και υγιών γυναικών. Μελετάται, επίσης, η επίδραση των παραμέτρων, οι οποίες εμπλέκονται στη διαδικασία, στην απόδοση της ταξινομησης και επισημαίνονται οι πιο σημαντικές από αυτές. Για τον προσδιορισμό των τιμών των κρίσιμων παραμέτρων που μεγιστοποιούν την απόδοση της ταξινόμησης χρησιμοποιήθηκε ένα σχήμα 10-fold cross validation. Οι υπολογιζόμενες βέλτιστες τιμές οδηγούν σε ακρίβεια 0.994 και AUC (Area Under Curve) 0.997 .
dc.languageGreek
dc.subjectφασματογραφία μάζας
dc.subjectπροεπεξεργασία δεδομένων φασματογραφίας μάζας
dc.subjectεξαγωγή χαρακτηριστικών
dc.subjectταξινόμηση
dc.subjectπρώιμη διάγνωση
dc.subjectανακάλυψη βιοσημαντών
dc.subjectκαρκίνος ωοθηκών
dc.titleΑλγόριθμοι Προεπεξεργασίας Και Ταξινόμησης Δεδομένων Φασματογραφίας Μάζας
dc.typeDiploma Thesis
dc.description.pages91
dc.contributor.supervisorΝικήτα Κωνσταντίνα
dc.departmentΤομέας Συστημάτων Μετάδοσης Πληροφορίας & Τεχνολογίας Υλικών
dc.organizationΕΜΠ, Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File SizeFormat 
DT2006-0219.pdf3.54 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.