Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/19199
Full metadata record
DC FieldValueLanguage
dc.contributor.authorΒαγενάς, Νικηφόρος-
dc.date.accessioned2024-07-19T10:26:33Z-
dc.date.available2024-07-19T10:26:33Z-
dc.date.issued2024-07-11-
dc.identifier.urihttp://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/19199-
dc.description.abstractΗ αναγνώριση ανθρώπινης δράσης σε βίντεο αποτελεί έναν από τα κυριότερα προβλήματα του τομέα της όρασης υπολογιστών και έχει συγκεντρώσει το ενδιαφέρον πολλών ερευνητών λόγω της δυνατότητας εφαρμογής της σε διάφορους τομείς της ανθρώπινης δραστηριότητας, από την ιατρική έως τον κόσμο του κινηματογράφου και της μόδας. Διαχρονικά έχουν χρησιμοποιηθεί πολλά μοντέλα βαθιάς μάθησης με σκοπό την ορθή πρόβλεψη της κλάσης, στην οποία ανήκει η δράση που αναπαρίσταται σε ένα βίντεο. Η βασική αρχιτεκτονική, που εφαρμόζεται για την ανάλυση εικόνων και βίντεο είναι τα συνελικτικά νευρωνικά δίκτυα, τα οποία διαθέτουν την ικανότητα εξαγωγής χαρακτηριστικών, όπως ακμές και υφές, από τα οπτικό υλικό, μέσω της εφαρμογής ειδικών φίλτρων στα δεδομένα. Πρόσφατα μεγάλο ενδιαφέρον παρουσιάζουν οι μετασχηματιστές, μοντέλο, που δανείστηκαν οι ερευνητές της όρασης υπολογιστών από τον τομέα επεξεργασίας φυσικής γλώσσας. Οι μετασχηματιστές απαιτούν περισσότερα δεδομένα, γεγονός που αυξάνει το υπολογιστικό κόστος, αλλά μπορούν να μάθουν τους συσχετισμούς μεταξύ των διαφορετικών τμημάτων μίας εικόνας ή βίντεο. Τέλος, οι αποκρύπτοντες αυτοκωδικοποιητές είναι αρχιτεκτονικές νευρωνικών δικτύων για την αναγνώριση δράσης σε βίντεο των τελευταίων δύο χρόνων, που χρησιμοποιούν τεχνικές απόκρυψης μέρους των δεδομένων και τους οπτικούς μετασχηματιστές, για να κάνουν ταξινόμηση στα δεδομένα εισόδου. Στόχος αυτής της διπλωματικής εργασίας είναι η αναπαραγωγή σε προγραμματιστικό περιβάλλον της εκπαίδευσης τριών από τα μοντέλα αποκρύπτοντων αυτοκωδικοποιητών, ώστε να παρουσιαστούν οι καλές τους επιδόσεις στο πρόβλημα αναγνώρισης ανθρώπινης δράσης σε βίντεο. Επιπλέον, εκτελούμε ένα πείραμα, όπου προεπεξεργαζόµαστε τα δεδομένα εισόδου με τέτοιο τρόπο, ώστε να αποκρύψουμε και στη διάσταση του χρόνου τμήματα αυτών. Με αυτόν τον τρόπο, θέλουμε να αναδείξουμε πως μπορεί στις συγκεκριμένες αρχιτεκτονικές δικτύου να μειωθεί ο χρόνος εκπαίδευσης με ελάχιστες απώλειες στην ορθότητα πρόβλεψηςen_US
dc.languageelen_US
dc.subjectHuman Action Recognitionen_US
dc.subjectSpatiotemporal Data Analysisen_US
dc.subjectTransformeren_US
dc.subjectMasked Autoencoderen_US
dc.subjectMasken_US
dc.titleΧωροχρονική Αναγνώριση Δράσηςen_US
dc.description.pages114en_US
dc.contributor.supervisorΒουλόδημος Αθανάσιοςen_US
dc.departmentΤομέας Τεχνολογίας Πληροφορικής και Υπολογιστώνen_US
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
Διπλωματική Εργασία Νικηφόρος Βαγενάς 03118215.pdfΔιπλωματική Εργασία Νικηφόρου Βαγενά7.12 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.