Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18128
Τίτλος: Έλεγχος Ρομποτικού Οχήματος με τεχνικές Μηχανικής Μάθησης και Αναγνώρισης Φωνής
Συγγραφείς: Γιαννιός, Γεώργιος-Ταξιάρχης
Σταφυλοπάτης Ανδρέας-Γεώργιος
Λέξεις κλειδιά: Αναγνώριση φωνής, Χρονοσειρά, Πεδίο της Συχνότητας, Φασματογράφημα, Μετασχηματισμός Fourier, MFCC, Βαθιά Μηχανική Μάθηση, Συνελικτικά Δίκτυα, Αναδρομικά Νευρωνικά Δίκτυα, Μεταφορά Μάθησης
Ημερομηνία έκδοσης: 26-Οκτ-2021
Περίληψη: Η αναγνώριση φωνητικών εντολών απο ένα υπολογιστικό σύστημα και η επικοινωνία ανθρώπου-μηχανής μέσω της ομιλίας, συνιστούν ένα δυναμικό και συνάμα συνεχώς εξελισσσόμενο πεδίο για περισσότερο από 70 χρόνια. Τα τελευταία χρόνια βέβαια, οι εξελίξεις στην τεχνολογία ολοκληρωμένων κυκλωμάτων, στους αλγορίθμους DSP (Digital Signal Processing) και στην αρχιτεκτονική υπολογιστών ευθυγραμμίστηκαν και δημιούργησαν πρόσφορο έδαφος για καινοτομία και έρευνα γύρω απο την αναγνώριση ομιλίας. Αντικείμενο λοιπόν της παρούσας διπλωματικής εργασίας αποτελεί ο σχεδιασμός, η υλοποίηση καθώς και η αξιολόγηση ενός συστήματος το οποίο θα συμβάλει στην γόνιμη αλληλεπίδραση ενός ατόμου με ένα ρομποτικό όχημα. Η αλληλεπίδραση αυτή θα πραγματοποιείται με την χρήση συγκεκριμένων φωνητικών εντολών (πχ. ‘stop’, ‘go’, ‘right’...), μέσω των οποίων θα ελέγχεται η κατεύθυνση του οχήματος. Αρχικά συγκεντρώθηκαν ορισμένα ηχογραφημένα ακουστικά μηνύματα για κάθε μια απο τις εντολές. Τα δείγματα αυτά μετατράπηκαν σε κατάλληλη αναπαράσταση, ώστε να τροφοδοτηθούν σε ένα μοντέλο βαθιάς μηχανικής μάθησης. Ο πειραματισμός αφορούσε τόσο την εξαγωγή χαρακτηριστικών, όσο και τη σύνθεση της αρχιτεκτονικής του νευρωνικού δικτύου. Ως προς την εξαγωγή χαρακτηριστικών, αρχικά πραγματοποιήθηκε ένας πειραματισμός στο πεδίο του χρόνου, με το κάθε ακουσικό σήμα να μελετάται σαν μια χρονοσειρά. Γρήγορα αναδείχτηκαν ορισμένες αδυναμίες, που έκαναν επιτακτική την ανάγκη μετάβασης στο πεδίο της συχνότητας. Στο πεδίο αυτό, μετά απο πειράματα αναδείχτηκε το μοντέλο αλλά και τα χαρακτηριστικά που επιτυγχάνουν το μεγαλύτερο ποσοστό ακρίβειας.
URI: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18128
Εμφανίζεται στις συλλογές:Διπλωματικές Εργασίες - Theses

Αρχεία σε αυτό το τεκμήριο:
Αρχείο Περιγραφή ΜέγεθοςΜορφότυπος 
Thesis_Giorgos_Giannios.pdf6.01 MBAdobe PDFΕμφάνιση/Άνοιγμα


Όλα τα τεκμήρια του δικτυακού τόπου προστατεύονται από πνευματικά δικαιώματα.