Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18772
Full metadata record
DC FieldValueLanguage
dc.contributor.authorΠαντελαίος, Δημήτριος-
dc.date.accessioned2023-07-28T06:14:01Z-
dc.date.available2023-07-28T06:14:01Z-
dc.date.issued2023-07-27-
dc.identifier.urihttp://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18772-
dc.description.abstractΠαρακινούµενοι από την επιτυχία των µετασχηµατιστών στον τοµέα της επεξεργασίας ϕυσικής γλώσσας, έγιναν προσπάθειες να εφαρµοστούν αντίστοιχα µοντέλα και στον τοµέα της όρασης υπολογιστών. Γι΄ αυτό το λόγο δηµιουργήθηκαν οι Vision Transformers, οι οποίοι παρουσιάζουν κορυφαίες επιδόσεις σε τοµείς όπως η κατηγοριοποίηση εικόνων. Ωστόσο, οι Vision Transformers συλλαµβάνουν µακρινές καθολικές εξαρτήσεις µέσω των επιπέδων προσοχής, αλλά δεν διαθέτουν επαγωγικές προκαταλήψεις, ώστε να µπορούν να γενικευθούν όταν εκπαιδεύονται σε µικρό σύνολο δεδοµένων, µε αποτέλεσµα να απαιτούνται µεγαλύτερα σύνολα δεδοµένων για την εκπαίδευση τους. Αυτό αποτελεί ένα σηµαντικό εµπόδιο στην κατηγοριοποίηση ιατρικών εικόνων, καθώς είναι δύσκολη η εύρεση µεγάλων ιατρικών συνόλων δεδοµένων. Η παρούσα µελέτη ασχολείται µε την κατηγοριοποίηση ακτινογραφιών ϑώρακος, που αντιστοιχούν σε διαφορετικές ασθένειες που επηρεάζουν τους πνεύµονες, όπως είναι ο COVID-19. Πιο συγκεκριµένα, COVID-19 είναι µια αρκετά µεταδοτική µολυσµατική ασθένεια που προσβάλει το αναπνευστικό σύστηµα και οφείλεται στον ιό SARS-CoV- 2. Πολλοί ασθενείς που προσβάλλονται από αυτή χρειάζονται άµεση ιατρική ϐοήθεια και αυτό καθιστά επιτακτική την άµεση ανιχνευση της. Για την επίλυση των παραπάνω προβληµάτων επινοήθηκαν τα υβριδικά µοντέλα, τα οποία προσπαθούν να προσθέσουν κάποια πλεονεκτήµατα των συνελικτικών νευρωνικών δικτύων στους Vision Transformer, προκειµένου να γίνει δυνατή η εκπαίδευση των µοντέλων σε µικρότερα σύνολα δεδοµένων. Στην µελέτη αυτή επικεντρωνόµαστε στην σύγκριση των υβριδικών µοντέλων προεκπαιδευµένων στο ImageNet1k µε τον παραδοσιακό Vision Transformer προεκπαιδευµένο στο ImageNet-21k, αλλά και στην εκπαίδευση των µοντέλων από την αρχή κάνοντας χρήση τόσο ενός µέρους, όσο και ολόκληρου του διαθέσιµου συνόλου δεδοµένων COVID-QU-Ex. Τα αποτελέσµατα που προκύπτουν δείχνουν την υπεροχή των υβριδικών µοντέλων τόσο όσον αφορά την ακρίβεια, τον χρόνο εκπαίδευσης, αλλά και τον αριθµό των δεδοµένων που απαιτείται για την εκπαίδευση.en_US
dc.languageelen_US
dc.subjectVision Transformers, Συνελικτικά Νευρωνικά ∆ίκτυα, Κατηγοριοποίηση ιατρικών εικόνων, COVID-19, Ιογενής Πνευµονία, Βακτηριακή Πνευµονία, Υβριδικά µοντέλα ViT-CNN, DeiT, CeiT, Compact Transformers, Conformer, LocalViT, Convolutional vision Transformersen_US
dc.titleΚατηγοριοποίηση Ιατρικών Εικόνων µε χρήση Υβριδικών CNN-ViT µοντέλωνen_US
dc.description.pages112en_US
dc.contributor.supervisorΚόλλιας Στέφανοςen_US
dc.departmentΤομέας Τεχνολογίας Πληροφορικής και Υπολογιστώνen_US
Appears in Collections:Διπλωματικές Εργασίες - Theses



Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.