Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18128
Title: Έλεγχος Ρομποτικού Οχήματος με τεχνικές Μηχανικής Μάθησης και Αναγνώρισης Φωνής
Authors: Γιαννιός, Γεώργιος-Ταξιάρχης
Σταφυλοπάτης Ανδρέας-Γεώργιος
Keywords: Αναγνώριση φωνής, Χρονοσειρά, Πεδίο της Συχνότητας, Φασματογράφημα, Μετασχηματισμός Fourier, MFCC, Βαθιά Μηχανική Μάθηση, Συνελικτικά Δίκτυα, Αναδρομικά Νευρωνικά Δίκτυα, Μεταφορά Μάθησης
Issue Date: 26-Oct-2021
Abstract: Η αναγνώριση φωνητικών εντολών απο ένα υπολογιστικό σύστημα και η επικοινωνία ανθρώπου-μηχανής μέσω της ομιλίας, συνιστούν ένα δυναμικό και συνάμα συνεχώς εξελισσσόμενο πεδίο για περισσότερο από 70 χρόνια. Τα τελευταία χρόνια βέβαια, οι εξελίξεις στην τεχνολογία ολοκληρωμένων κυκλωμάτων, στους αλγορίθμους DSP (Digital Signal Processing) και στην αρχιτεκτονική υπολογιστών ευθυγραμμίστηκαν και δημιούργησαν πρόσφορο έδαφος για καινοτομία και έρευνα γύρω απο την αναγνώριση ομιλίας. Αντικείμενο λοιπόν της παρούσας διπλωματικής εργασίας αποτελεί ο σχεδιασμός, η υλοποίηση καθώς και η αξιολόγηση ενός συστήματος το οποίο θα συμβάλει στην γόνιμη αλληλεπίδραση ενός ατόμου με ένα ρομποτικό όχημα. Η αλληλεπίδραση αυτή θα πραγματοποιείται με την χρήση συγκεκριμένων φωνητικών εντολών (πχ. ‘stop’, ‘go’, ‘right’...), μέσω των οποίων θα ελέγχεται η κατεύθυνση του οχήματος. Αρχικά συγκεντρώθηκαν ορισμένα ηχογραφημένα ακουστικά μηνύματα για κάθε μια απο τις εντολές. Τα δείγματα αυτά μετατράπηκαν σε κατάλληλη αναπαράσταση, ώστε να τροφοδοτηθούν σε ένα μοντέλο βαθιάς μηχανικής μάθησης. Ο πειραματισμός αφορούσε τόσο την εξαγωγή χαρακτηριστικών, όσο και τη σύνθεση της αρχιτεκτονικής του νευρωνικού δικτύου. Ως προς την εξαγωγή χαρακτηριστικών, αρχικά πραγματοποιήθηκε ένας πειραματισμός στο πεδίο του χρόνου, με το κάθε ακουσικό σήμα να μελετάται σαν μια χρονοσειρά. Γρήγορα αναδείχτηκαν ορισμένες αδυναμίες, που έκαναν επιτακτική την ανάγκη μετάβασης στο πεδίο της συχνότητας. Στο πεδίο αυτό, μετά απο πειράματα αναδείχτηκε το μοντέλο αλλά και τα χαρακτηριστικά που επιτυγχάνουν το μεγαλύτερο ποσοστό ακρίβειας.
URI: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18128
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
Thesis_Giorgos_Giannios.pdf6.01 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.