Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17272
Title: Συγκριτική Μελέτη Αλγορίθμων Βαθιάς Μηχανικής Μάθησης για Ανίχνευση Αντικειμένων
Authors: Φαντάκης, Αναστάσιος
Σταφυλοπάτης Ανδρέας-Γεώργιος
Keywords: Τεχνητή Νοημοσύνη
Βαθιά Μάθηση
Ανίχνευση Αντικειμένων
Faster R-CNN
You Only Look Once (YOLO)
Networks of Residual Networks (RoR)
Group Normalization
Issue Date: 10-May-2019
Abstract: Τις τελευταίες δεκαετίες έχει παρατηρηθεί ιδιαίτερη ανάπτυξη στην έρευνα των τεχνικών της όρασης υπολογιστών (computer vision) ενώ και η ραγδαία εξέλιξη στον τομέα της υπολογιστικής ισχύς έχει δώσει μεγάλη ώθηση στον τομέα της βαθιάς μάθησης (deep learning). Η ανάπτυξη αυτή έχει αποδώσει σημαντικό έργο με σκοπό, μεταξύ άλλων, στη διευκόλυνση της καθημερινότητας των πολιτών σε όλο τον κόσμο. Ένα επιμέρους τμήμα της όρασης υπολογιστών που αξιοποιεί τεχνικές βαθιάς μάθησης αποτελεί η ανίχνευση αντικειμένων (object detection), υποχώρος της ανάλυσης ει- κόνας. Η ανίχνευση αντικειμένων χρησιμοποιείται σε μια σειρά από εφαρμογές, όπως η αναγνώριση προσώπου και τα συστήματα ελέγχου οδικής κυκλοφορίας. Σκοπός της παρούσας διπλωματικής εργασίας είναι η συνοπτική παρουσίαση και σύγκριση βασι- κών αλγορίθμων στον χώρο της ανίχνευσης αντικειμένων αλλά και η βελτιστοποίησή τους με χρήση καινοτόμων τεχνικών από το πεδίο της βαθιάς μάθησης και της ανάλυσης εικόνας. Σε πρώτο στάδιο έγινε η ανάλυση των 2 διαφορετικών μεθόδων ανίχνευσης, δηλαδή αλγορίθμων δύο σταδίων και ενός σταδίου. Δύο χαρακτηριστικά παραδείγματα αυτών αποτελούν ο Faster R-CNN και ο You Only Look Once (YOLO). Για την εκπαίδευση χρησιμοποιήθηκε μια μικρή συλλογή δεδομένων, που είναι διαθέ- σιμη στον ιστότοπου Kaggle. Τα αποτελέσματα έδειξαν μεγάλο χάσμα κυρίως στο χρόνο εκπαίδευσης με τον αλγόριθμο YOLO να κυριαρχεί σε αυτό το κομμάτι. Σε επόμενο στάδιο, με βάση τον αλγόριθμο YOLO, επιβεβαιώσαμε τη σημασία των residual blocks στη χρήση τεχνικών βαθιάς μάθησης και επιχειρήσαμε την επέκταση τους. Αναλυτικότερα, δοκιμάσαμε το συνδυασμό της αρχιτεκτονικής του αλγορίθμου YOLO με την τεχνική των Residual Networks of Residual Networks (RoR). Επιπροσθέτως, έγινε δοκιμή της εκπαίδευσης του αλγορίθ- μου YOLO, με χρήση group normalization αντί batch normalization, μιας τεχνικής που στοχεύει στην άρση των περιορισμών εκπαίδευσης σε περιπτώσεις μικρού batch size. Για τους σκοπούς αυτούς, αξιοποιήθηκαν συλλογές δεδομένων που είναι διαθέσιμες από τον εκπαιδευτικό οργανισμό Udacity και πιο συγκεκριμένα που περιέχουν καταγραφή οδικής κυκλοφορίας. Τα αποτελέσματα έδειξαν μια αισθητή βελτίωση στην απόδοση του νέου δικτύου σε κάθε περίπτωση ανοίγοντας νέες προοπτικές για περαιτέρω μελέτη των νέων αυτών τεχνικών στο τομέα της ανάλυσης εικόνας.
URI: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17272
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
Fantakis_thesis.pdf8 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.