Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18772
Title: Κατηγοριοποίηση Ιατρικών Εικόνων µε χρήση Υβριδικών CNN-ViT µοντέλων
Authors: Παντελαίος, Δημήτριος
Κόλλιας Στέφανος
Keywords: Vision Transformers, Συνελικτικά Νευρωνικά ∆ίκτυα, Κατηγοριοποίηση ιατρικών εικόνων, COVID-19, Ιογενής Πνευµονία, Βακτηριακή Πνευµονία, Υβριδικά µοντέλα ViT-CNN, DeiT, CeiT, Compact Transformers, Conformer, LocalViT, Convolutional vision Transformers
Issue Date: 27-Jul-2023
Abstract: Παρακινούµενοι από την επιτυχία των µετασχηµατιστών στον τοµέα της επεξεργασίας ϕυσικής γλώσσας, έγιναν προσπάθειες να εφαρµοστούν αντίστοιχα µοντέλα και στον τοµέα της όρασης υπολογιστών. Γι΄ αυτό το λόγο δηµιουργήθηκαν οι Vision Transformers, οι οποίοι παρουσιάζουν κορυφαίες επιδόσεις σε τοµείς όπως η κατηγοριοποίηση εικόνων. Ωστόσο, οι Vision Transformers συλλαµβάνουν µακρινές καθολικές εξαρτήσεις µέσω των επιπέδων προσοχής, αλλά δεν διαθέτουν επαγωγικές προκαταλήψεις, ώστε να µπορούν να γενικευθούν όταν εκπαιδεύονται σε µικρό σύνολο δεδοµένων, µε αποτέλεσµα να απαιτούνται µεγαλύτερα σύνολα δεδοµένων για την εκπαίδευση τους. Αυτό αποτελεί ένα σηµαντικό εµπόδιο στην κατηγοριοποίηση ιατρικών εικόνων, καθώς είναι δύσκολη η εύρεση µεγάλων ιατρικών συνόλων δεδοµένων. Η παρούσα µελέτη ασχολείται µε την κατηγοριοποίηση ακτινογραφιών ϑώρακος, που αντιστοιχούν σε διαφορετικές ασθένειες που επηρεάζουν τους πνεύµονες, όπως είναι ο COVID-19. Πιο συγκεκριµένα, COVID-19 είναι µια αρκετά µεταδοτική µολυσµατική ασθένεια που προσβάλει το αναπνευστικό σύστηµα και οφείλεται στον ιό SARS-CoV- 2. Πολλοί ασθενείς που προσβάλλονται από αυτή χρειάζονται άµεση ιατρική ϐοήθεια και αυτό καθιστά επιτακτική την άµεση ανιχνευση της. Για την επίλυση των παραπάνω προβληµάτων επινοήθηκαν τα υβριδικά µοντέλα, τα οποία προσπαθούν να προσθέσουν κάποια πλεονεκτήµατα των συνελικτικών νευρωνικών δικτύων στους Vision Transformer, προκειµένου να γίνει δυνατή η εκπαίδευση των µοντέλων σε µικρότερα σύνολα δεδοµένων. Στην µελέτη αυτή επικεντρωνόµαστε στην σύγκριση των υβριδικών µοντέλων προεκπαιδευµένων στο ImageNet1k µε τον παραδοσιακό Vision Transformer προεκπαιδευµένο στο ImageNet-21k, αλλά και στην εκπαίδευση των µοντέλων από την αρχή κάνοντας χρήση τόσο ενός µέρους, όσο και ολόκληρου του διαθέσιµου συνόλου δεδοµένων COVID-QU-Ex. Τα αποτελέσµατα που προκύπτουν δείχνουν την υπεροχή των υβριδικών µοντέλων τόσο όσον αφορά την ακρίβεια, τον χρόνο εκπαίδευσης, αλλά και τον αριθµό των δεδοµένων που απαιτείται για την εκπαίδευση.
URI: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18772
Appears in Collections:Διπλωματικές Εργασίες - Theses



Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.