Κατηγοριοποίηση Ιατρικών Εικόνων µε χρήση Υβριδικών CNN-ViT µοντέλων

Παντελαίος, Δημήτριος

Εθνικό Μετσόβιο Πολυτεχνείο

Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Καλώς ήρθατε στο Άρτεμις

Σκοπός του Άρτεμις είναι η συστηματική αρχειοθέτηση και διαδοση της πνευματικής παραγωγής της Σχολής Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών του Εθνικού Μετσόβιου Πολυτεχνείου, με τη βοήθεια της τεχνολογίας των ψηφιακών βιβλιοθηκών.

Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18772

Τίτλος:	Κατηγοριοποίηση Ιατρικών Εικόνων µε χρήση Υβριδικών CNN-ViT µοντέλων
Συγγραφείς:	Παντελαίος, Δημήτριος Κόλλιας Στέφανος
Λέξεις κλειδιά:	Vision Transformers, Συνελικτικά Νευρωνικά ∆ίκτυα, Κατηγοριοποίηση ιατρικών εικόνων, COVID-19, Ιογενής Πνευµονία, Βακτηριακή Πνευµονία, Υβριδικά µοντέλα ViT-CNN, DeiT, CeiT, Compact Transformers, Conformer, LocalViT, Convolutional vision Transformers
Ημερομηνία έκδοσης:	27-Ιου-2023
Περίληψη:	Παρακινούµενοι από την επιτυχία των µετασχηµατιστών στον τοµέα της επεξεργασίας ϕυσικής γλώσσας, έγιναν προσπάθειες να εφαρµοστούν αντίστοιχα µοντέλα και στον τοµέα της όρασης υπολογιστών. Γι΄ αυτό το λόγο δηµιουργήθηκαν οι Vision Transformers, οι οποίοι παρουσιάζουν κορυφαίες επιδόσεις σε τοµείς όπως η κατηγοριοποίηση εικόνων. Ωστόσο, οι Vision Transformers συλλαµβάνουν µακρινές καθολικές εξαρτήσεις µέσω των επιπέδων προσοχής, αλλά δεν διαθέτουν επαγωγικές προκαταλήψεις, ώστε να µπορούν να γενικευθούν όταν εκπαιδεύονται σε µικρό σύνολο δεδοµένων, µε αποτέλεσµα να απαιτούνται µεγαλύτερα σύνολα δεδοµένων για την εκπαίδευση τους. Αυτό αποτελεί ένα σηµαντικό εµπόδιο στην κατηγοριοποίηση ιατρικών εικόνων, καθώς είναι δύσκολη η εύρεση µεγάλων ιατρικών συνόλων δεδοµένων. Η παρούσα µελέτη ασχολείται µε την κατηγοριοποίηση ακτινογραφιών ϑώρακος, που αντιστοιχούν σε διαφορετικές ασθένειες που επηρεάζουν τους πνεύµονες, όπως είναι ο COVID-19. Πιο συγκεκριµένα, COVID-19 είναι µια αρκετά µεταδοτική µολυσµατική ασθένεια που προσβάλει το αναπνευστικό σύστηµα και οφείλεται στον ιό SARS-CoV- 2. Πολλοί ασθενείς που προσβάλλονται από αυτή χρειάζονται άµεση ιατρική ϐοήθεια και αυτό καθιστά επιτακτική την άµεση ανιχνευση της. Για την επίλυση των παραπάνω προβληµάτων επινοήθηκαν τα υβριδικά µοντέλα, τα οποία προσπαθούν να προσθέσουν κάποια πλεονεκτήµατα των συνελικτικών νευρωνικών δικτύων στους Vision Transformer, προκειµένου να γίνει δυνατή η εκπαίδευση των µοντέλων σε µικρότερα σύνολα δεδοµένων. Στην µελέτη αυτή επικεντρωνόµαστε στην σύγκριση των υβριδικών µοντέλων προεκπαιδευµένων στο ImageNet1k µε τον παραδοσιακό Vision Transformer προεκπαιδευµένο στο ImageNet-21k, αλλά και στην εκπαίδευση των µοντέλων από την αρχή κάνοντας χρήση τόσο ενός µέρους, όσο και ολόκληρου του διαθέσιµου συνόλου δεδοµένων COVID-QU-Ex. Τα αποτελέσµατα που προκύπτουν δείχνουν την υπεροχή των υβριδικών µοντέλων τόσο όσον αφορά την ακρίβεια, τον χρόνο εκπαίδευσης, αλλά και τον αριθµό των δεδοµένων που απαιτείται για την εκπαίδευση.
URI:	http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18772
Εμφανίζεται στις συλλογές:	Διπλωματικές Εργασίες - Theses

Αρχεία σε αυτό το τεκμήριο:

Αρχείο	Περιγραφή	Μέγεθος	Μορφότυπος
Κατηγοριοποίηση_Ιατρικών_Εικόνων_με_χρήση_Υβριδικών_CNN_ViT_μοντέλων.pdf		2.86 MB	Adobe PDF	Εμφάνιση/Άνοιγμα

Δείξε την πλήρη περιγραφή του τεκμηρίου

Όλα τα τεκμήρια του δικτυακού τόπου προστατεύονται από πνευματικά δικαιώματα.