Please use this identifier to cite or link to this item:
http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/19690
Title: | Μέθοδοι βαθιάς μάθησης και άμβλυνσης προκαταλήψεων για την ανίχνευση της νόσου COVID-19 με χρήση ηχητικών καταγραφών βήχα |
Authors: | Κωσταβασίλη, Δήμητρα Νικήτα Κωνσταντίνα |
Keywords: | COVID-19 Βαθιά Μάθηση Επεξεργασία ήχου Αμεροληψία Εξάλειψη των διακρίσεων Μηχανική Μάθηση |
Issue Date: | 4-Jul-2025 |
Abstract: | Η πανδημία της COVID-19 και οι σοβαρές επιπτώσεις της νόσου αποτελούν σημαντική πρόκληση για την επιστημονική κοινότητα, καθώς δημιουργούν την ανάγκη για ταχύτερα διαγνωστικά μέσα. Το γεγονός αυτό, ωθεί την ανάπτυξη καινοτόμων τεχνολογικών εργαλείων που στοχεύουν κυρίως στον περιορισμό του ιού και τη διερεύνηση της διασποράς του. Η μηχανική μάθηση αποτελεί βασικό πυλώνα της εξέλιξης των εργαλείων αυτών, συμβάλλοντας σημαντικά στη βελτίωση της διαδικασίας διάγνωσης. Παρά την υποχώρηση του πανδημικού χαρακτήρα της νόσου, η καινοτομία των συγκεκριμένων εφαρμογών δεν χάνει τη χρησιμότητά της καθώς αποτελεί πρόοδο στον κλάδο της βιοϊατρικής με σημαντικές προεκτάσεις στα πεδία της αυτοδιάγνωσης και της τηλεϊατρικής, αλλά και γενικότερα στην εξέλιξη των μοντέλων μηχανικής μάθησης. Σημαντικό κριτήριο στην αξιολόγηση της αποτελεσματικότητας των διαγνωστικών εργαλείων που βασίζονται στη μηχανική μάθηση πέρα από την ακρίβεια της πρόβλεψης, αποτελεί και η έννοια της αμεροληψίας. Η αμεροληψία συνοψίζεται στην δίκαιη εξαγωγή προβλέψεων από ένα μοντέλο μηχανικής μάθησης ανάμεσα σε άτομα ή υποομάδες του πληθυσμού, ανεξάρτητα από πιθανές διαφορές στα ευαίσθητα χαρακτηριστικά τους. Στόχος της παρούσας διπλωματικής εργασίας, είναι η ανάπτυξη μοντέλων μηχανικής μάθησης για τη διάγνωση της νόσου COVID-19 με τη χρήση ηχητικών καταγραφών βήχα και τη βελτίωση της αμεροληψίας των μοντέλων αυτών με την εφαρμογή μεθόδων εξάλειψης των διακρίσεων. Ειδικότερα, αναπτύσσεται ένας απλός ταξινομητής τυχαίου δάσους και ένα τεχνητό νευρωνικό δίκτυο βασισμένο στο προεκπαιδευμένο μοντέλο βαθιάς μάθησης VGGish. Το σύνολο δεδομένων που χρησιμοποιήθηκε προήλθε από τη βάση δεδομένων COVID-19 Sounds του πανεπιστημίου Cambridge που περιλαμβάνει μια σειρά ηχογραφήσεων ανθρώπινων ήχων όπως ο βήχας, η αναπνοή και η ομιλία από νοσούντες και μη, συνοδευόμενων από πληροφορίες για τα ευαίσθητα χαρακτηριστικά του ατόμου στο οποίο αντιστοιχεί κάθε ηχογράφηση. Για τη βελτίωση του βαθμού αμεροληψίας των μοντέλων, εφαρμόστηκαν: ως μέθοδος προεπεξεργασίας η αφαίρεση συσχετίσεων, μέθοδοι κατά την επεξεργασία όπως η εκθετική κλίση και η ανταγωνιστική εκπαίδευση και ο βελτιστοποιητής κατωφλίου που αποτελεί μέθοδο μετά την επεξεργασία. Έπειτα από σύγκριση των αποτελεσμάτων των μοντέλων πριν και μετά την εφαρμογή κάθε μεθόδου, παρατηρείται ότι επιτυγχάνεται βελτίωση της αμεροληψίας των αποτελεσμάτων σε αρκετές κατηγορίες ευαίσθητων χαρακτηριστικών. Ενδεικτικά, οι καλύτερες τιμές της αναλογίας ίσης ευκαιρίας, που αποτελεί βασική μετρική της αμεροληψίας και έχει ιδανική τιμή 1, είναι: ως προς το φύλο 0,969, ως προς την ηλικία 0,998, ως προς το ιατρικό ιστορικό 0,972, ως προς τα συμπτώματα 0,997 και ως προς την πηγή συλλογής των δεδομένων 0,88. Αντίστοιχα, για τις συνδυαστικές κατηγορίες, τα βέλτιστα αποτελέσματα για την ίδια μετρική είναι: για το φύλο σε συνδυασμό με την ηλικία 0,943, για την ηλικία σε συνδυασμό με τα συμπτώματα 0,951, για το φύλο σε συνδυασμό με τα συμπτώματα 0,91, για την ηλικία σε συνδυασμό με το ιατρικό ιστορικό 0,911 και για το φύλο σε συνδυασμό με το ιατρικό ιστορικό 0,913. Ωστόσο, λαμβάνοντας υπόψη και την ακρίβεια των προβλέψεων, συχνά επιλέγονται μέθοδοι που επιτυγχάνουν καλύτερη ισορροπία μεταξύ ακρίβειας και αμεροληψίας, ακόμα και με κάποιο κόστος εξετάζοντας τα μεγέθη μεμονωμένα. |
URI: | http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/19690 |
Appears in Collections: | Διπλωματικές Εργασίες - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Διπλωματική Κωσταβασίλη Δήμητρα (τελικό κείμενο).pdf | 9.13 MB | Adobe PDF | View/Open |
Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.