Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/12963
Full metadata record
DC FieldValueLanguage
dc.contributor.authorΠαναγιώτης Μελέτης
dc.date.accessioned2018-07-23T08:50:13Z-
dc.date.available2018-07-23T08:50:13Z-
dc.date.issued2015-10-28
dc.date.submitted2015-10-26
dc.identifier.urihttp://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/12963-
dc.description.abstractΤα τελευταία χρόνια η αφθονία της οπτικοακουστικής πληροφορίας και η ταχεία αύξηση των υπολογιστικών δυνατοτήτων των μηχανών έστρεψαν το ενδιαφέρον πολλών ερευνητών σε μεθόδους αντιμετώπισης προβλημάτων οδηγούμενες από μεγάλες ποσότητες δεδομένων. Ο προσανατολισμός αυτός, οδήγησε σε μεγάλη ανάπτυξη των Τεχνικών Βαθιάς Μάθησης και ιδιαίτερα του κλάδου των Συνελικτικών Νευρωνικών Δικτύων (ΣΝΔ). Τα Δίκτυα αυτά εμπνέονται από τη δομή και τη λειτουργικότητα του ανθρώπινου εγκεφάλου και έχουν τη δυνατότητα να αυτορρυθμίζουν τη βαρύτητα των συνδέσεών τους μέσω επιβλεπόμενης εκπαίδευσης σε πολύ μεγάλα σύνολα δεδομένων. Στόχοι της Διπλωματικής Εργασίας είναι η ανάλυση των σύγχρονων ΣΝΔ και η παρουσίαση των τελευταίων εξελίξεων, αλλά και η εφαρμογή ενός, τελευταίας τεχνολογίας, ΣΝΔ για τον εντοπισμό προσώπων σε εικόνες. Αρχικά, γίνεται αναφορά των βασικών στοιχείων της Μηχανικής Μάθησης, που είναι απαραίτητα για την ανάπτυξη των ΣΝΔ, ενώ μεγάλο μέρος της Εργασίας αφιερώνεται στην ανάλυση της αρχιτεκτονικής, των ιδιοτήτων και του τρόπου εκπαίδευσης των σύγχρονων ΣΝΔ. Η παρουσίαση γίνεται με υπόβαθρο το θεμελιώδες πρόβλημα της ταξινόμησης εικόνων και ως εφαρμογή υλοποιείται ένα σύστημα εντοπισμού προσώπων ανεξαρτήτου γωνίας λήψης σε εικόνες, με τη χρήση του επιτυχημένου ΣΝΔ ταξινόμησης AlexNet. Κατασκευάζεται, με έξυπνες τεχνικές επαύξησης, ένα σύνολο δεδομένων 1 εκατομμυρίου εικόνων από τις βάσεις δεδομένων AFLW και FaceScrub, που έχουν συνολικά 100,000 εικόνες. Το σύνολο αυτό χρησιμοποιείται για την ειδική προσαρμογή του προεκπαιδευμένου AlexNet από το σύνολο ILSVRC. Για τον εντοπισμό χρησιμοποιείται πολυκλιμακωτή ανάλυση εικόνων και το εξειδικευμένο AlexNet, ώστε να προκύψουν οι τοποθεσίες των προσώπων σε οποιαδήποτε κλίμακα.
dc.languageGreek
dc.subjectτεχνικές βαθιάς μάθησης
dc.subjectσυνελικτικά νευρωνικά δίκτυα
dc.subjectεντοπισμός προσώπων
dc.subjectειδική προσαρμογή
dc.subjectπυκνή ταξινόμηση
dc.subjectεπαύξηση συνόλου δεδομένων
dc.subjectπολυκλιμακωτή ανάλυση
dc.titleΤεχνικές Βαθιάς Μάθησης Και Εφαρμογές Στην Ανίχνευση Προσώπων Σε Εικόνες
dc.typeDiploma Thesis
dc.description.pages103
dc.contributor.supervisorΚόλλιας Στέφανος
dc.departmentΤομέας Τεχνολογίας Πληροφορικής & Υπολογιστών
dc.organizationΕΜΠ, Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών
dc.description.notesDeep Learning, Convolutional Neural Networks, Multiview Face Detection, Fine-tuning, Dense Classification, Dataset Augmentation, Multiscale Analysis
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File SizeFormat 
DT2015-0317.pdf13.43 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.