Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18128
Full metadata record
DC FieldValueLanguage
dc.contributor.authorΓιαννιός, Γεώργιος-Ταξιάρχης-
dc.date.accessioned2021-11-02T09:39:25Z-
dc.date.available2021-11-02T09:39:25Z-
dc.date.issued2021-10-26-
dc.identifier.urihttp://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18128-
dc.description.abstractΗ αναγνώριση φωνητικών εντολών απο ένα υπολογιστικό σύστημα και η επικοινωνία ανθρώπου-μηχανής μέσω της ομιλίας, συνιστούν ένα δυναμικό και συνάμα συνεχώς εξελισσσόμενο πεδίο για περισσότερο από 70 χρόνια. Τα τελευταία χρόνια βέβαια, οι εξελίξεις στην τεχνολογία ολοκληρωμένων κυκλωμάτων, στους αλγορίθμους DSP (Digital Signal Processing) και στην αρχιτεκτονική υπολογιστών ευθυγραμμίστηκαν και δημιούργησαν πρόσφορο έδαφος για καινοτομία και έρευνα γύρω απο την αναγνώριση ομιλίας. Αντικείμενο λοιπόν της παρούσας διπλωματικής εργασίας αποτελεί ο σχεδιασμός, η υλοποίηση καθώς και η αξιολόγηση ενός συστήματος το οποίο θα συμβάλει στην γόνιμη αλληλεπίδραση ενός ατόμου με ένα ρομποτικό όχημα. Η αλληλεπίδραση αυτή θα πραγματοποιείται με την χρήση συγκεκριμένων φωνητικών εντολών (πχ. ‘stop’, ‘go’, ‘right’...), μέσω των οποίων θα ελέγχεται η κατεύθυνση του οχήματος. Αρχικά συγκεντρώθηκαν ορισμένα ηχογραφημένα ακουστικά μηνύματα για κάθε μια απο τις εντολές. Τα δείγματα αυτά μετατράπηκαν σε κατάλληλη αναπαράσταση, ώστε να τροφοδοτηθούν σε ένα μοντέλο βαθιάς μηχανικής μάθησης. Ο πειραματισμός αφορούσε τόσο την εξαγωγή χαρακτηριστικών, όσο και τη σύνθεση της αρχιτεκτονικής του νευρωνικού δικτύου. Ως προς την εξαγωγή χαρακτηριστικών, αρχικά πραγματοποιήθηκε ένας πειραματισμός στο πεδίο του χρόνου, με το κάθε ακουσικό σήμα να μελετάται σαν μια χρονοσειρά. Γρήγορα αναδείχτηκαν ορισμένες αδυναμίες, που έκαναν επιτακτική την ανάγκη μετάβασης στο πεδίο της συχνότητας. Στο πεδίο αυτό, μετά απο πειράματα αναδείχτηκε το μοντέλο αλλά και τα χαρακτηριστικά που επιτυγχάνουν το μεγαλύτερο ποσοστό ακρίβειας.en_US
dc.languageelen_US
dc.subjectΑναγνώριση φωνής, Χρονοσειρά, Πεδίο της Συχνότητας, Φασματογράφημα, Μετασχηματισμός Fourier, MFCC, Βαθιά Μηχανική Μάθηση, Συνελικτικά Δίκτυα, Αναδρομικά Νευρωνικά Δίκτυα, Μεταφορά Μάθησηςen_US
dc.titleΈλεγχος Ρομποτικού Οχήματος με τεχνικές Μηχανικής Μάθησης και Αναγνώρισης Φωνήςen_US
dc.description.pages97en_US
dc.contributor.supervisorΣταφυλοπάτης Ανδρέας-Γεώργιοςen_US
dc.departmentΤομέας Τεχνολογίας Πληροφορικής και Υπολογιστώνen_US
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
Thesis_Giorgos_Giannios.pdf6.01 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.