Κατηγοριοποίηση Ιατρικών Εικόνων µε χρήση Υβριδικών CNN-ViT µοντέλων

Παντελαίος, Δημήτριος

National Technical University of Athens

School of Electrical and Computer Engineering

Artemis is Live!

Welcome to our digital repository! The aim of Artemis is the systematic archiving and dissemination of the scientific work produced in the School of Electrical and Computer Engineering, National Technical University of Athens, Greece, using the technology of digital libraries.

Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18772

Full metadata record

DC Field	Value	Language
dc.contributor.author	Παντελαίος, Δημήτριος	-
dc.date.accessioned	2023-07-28T06:14:01Z	-
dc.date.available	2023-07-28T06:14:01Z	-
dc.date.issued	2023-07-27	-
dc.identifier.uri	http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18772	-
dc.description.abstract	Παρακινούµενοι από την επιτυχία των µετασχηµατιστών στον τοµέα της επεξεργασίας ϕυσικής γλώσσας, έγιναν προσπάθειες να εφαρµοστούν αντίστοιχα µοντέλα και στον τοµέα της όρασης υπολογιστών. Γι΄ αυτό το λόγο δηµιουργήθηκαν οι Vision Transformers, οι οποίοι παρουσιάζουν κορυφαίες επιδόσεις σε τοµείς όπως η κατηγοριοποίηση εικόνων. Ωστόσο, οι Vision Transformers συλλαµβάνουν µακρινές καθολικές εξαρτήσεις µέσω των επιπέδων προσοχής, αλλά δεν διαθέτουν επαγωγικές προκαταλήψεις, ώστε να µπορούν να γενικευθούν όταν εκπαιδεύονται σε µικρό σύνολο δεδοµένων, µε αποτέλεσµα να απαιτούνται µεγαλύτερα σύνολα δεδοµένων για την εκπαίδευση τους. Αυτό αποτελεί ένα σηµαντικό εµπόδιο στην κατηγοριοποίηση ιατρικών εικόνων, καθώς είναι δύσκολη η εύρεση µεγάλων ιατρικών συνόλων δεδοµένων. Η παρούσα µελέτη ασχολείται µε την κατηγοριοποίηση ακτινογραφιών ϑώρακος, που αντιστοιχούν σε διαφορετικές ασθένειες που επηρεάζουν τους πνεύµονες, όπως είναι ο COVID-19. Πιο συγκεκριµένα, COVID-19 είναι µια αρκετά µεταδοτική µολυσµατική ασθένεια που προσβάλει το αναπνευστικό σύστηµα και οφείλεται στον ιό SARS-CoV- 2. Πολλοί ασθενείς που προσβάλλονται από αυτή χρειάζονται άµεση ιατρική ϐοήθεια και αυτό καθιστά επιτακτική την άµεση ανιχνευση της. Για την επίλυση των παραπάνω προβληµάτων επινοήθηκαν τα υβριδικά µοντέλα, τα οποία προσπαθούν να προσθέσουν κάποια πλεονεκτήµατα των συνελικτικών νευρωνικών δικτύων στους Vision Transformer, προκειµένου να γίνει δυνατή η εκπαίδευση των µοντέλων σε µικρότερα σύνολα δεδοµένων. Στην µελέτη αυτή επικεντρωνόµαστε στην σύγκριση των υβριδικών µοντέλων προεκπαιδευµένων στο ImageNet1k µε τον παραδοσιακό Vision Transformer προεκπαιδευµένο στο ImageNet-21k, αλλά και στην εκπαίδευση των µοντέλων από την αρχή κάνοντας χρήση τόσο ενός µέρους, όσο και ολόκληρου του διαθέσιµου συνόλου δεδοµένων COVID-QU-Ex. Τα αποτελέσµατα που προκύπτουν δείχνουν την υπεροχή των υβριδικών µοντέλων τόσο όσον αφορά την ακρίβεια, τον χρόνο εκπαίδευσης, αλλά και τον αριθµό των δεδοµένων που απαιτείται για την εκπαίδευση.	en_US
dc.language	el	en_US
dc.subject	Vision Transformers, Συνελικτικά Νευρωνικά ∆ίκτυα, Κατηγοριοποίηση ιατρικών εικόνων, COVID-19, Ιογενής Πνευµονία, Βακτηριακή Πνευµονία, Υβριδικά µοντέλα ViT-CNN, DeiT, CeiT, Compact Transformers, Conformer, LocalViT, Convolutional vision Transformers	en_US
dc.title	Κατηγοριοποίηση Ιατρικών Εικόνων µε χρήση Υβριδικών CNN-ViT µοντέλων	en_US
dc.description.pages	112	en_US
dc.contributor.supervisor	Κόλλιας Στέφανος	en_US
dc.department	Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών	en_US
Appears in Collections:	Διπλωματικές Εργασίες - Theses

Files in This Item:

File	Description	Size	Format
Κατηγοριοποίηση_Ιατρικών_Εικόνων_με_χρήση_Υβριδικών_CNN_ViT_μοντέλων.pdf		2.86 MB	Adobe PDF	View/Open

Show simple item record