Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/13439
Title: Πολλαπλών Όψεων Συνδυασμός Ακουστικών Χαρακτηριστικών Με Χαρακτηριστικά Παραγωγής Ομιλίας Για Αναγνώριση Φωνημάτων Στη Βάση Δεδομένων Rtmri-timit
Authors: Δούρος Ιωάννης
Μαραγκός Πέτρος
Keywords: χαρακτηριστικά παραγωγής ομιλίας
προσέγγιση πολλαπλών όψε- ων
αναγνώριση φωνημάτων
κρυφά μαρκοβιανά μοντέλα
ανάλυση κανονικής συσχέτισης
μηχανές διανυσματικής υποστήριξης
χαρακτηριστικά sift
βάση δεδομένων rtmri-timit
bag of visual words
smote
Issue Date: 11-Jun-2017
Abstract: Σε αυτήν τη διπλωματική εργασία ερευνούμε τη χρήση πληροφοριών άρθρωσης, καιπιο συγκεκριμένα δεδομένων rt-MRI της φωνητικής οδού, για τη βελτίωσητης απόδοσης αναγνώρισης ομιλίας. Για τον σκοπό των πειραμάτων μαςχρησιμοποιούμε δεδομένα από τη βάση δεδομένων rtMRI-TIMIT. Αρχικά, ταχαρακτηριστικά SIFT εξάγονται για κάθε πλαίσιο του βίντεο. Έπειτα οιSIFT περιγραφείς του κάθε πλασίου μετασχηματίζονται σε ένα μεμονωμένοιστόγραμμα ανά εικόνα, με χρήση της μεθοδολογίας Bag of Visual Words.Εφόσον αυτό το είδος πληροφοριών άρθρωσης είναι δύσκολο να εξαχθεί σε μιατυπική εγκατάσταση αναγνώρισης ομιλίας, θεωρούμε ότι είναι διαθέσιμο μόνο στοστάδιο της εκπαίδευσης. Συνεπώς χρησιμοποιούμε μια προσέγγιση πολλαπλών όψεωνμε εφαρμογή canonical correlation analysis (CCA) σε οπτικά και ηχητικάδεδομένα. Με χρήση του πίνακα μετασχηματισμού που εξήχθη κατά τη διάρκεια τουσταδίου εκπαίδευσης, μετασχηματίζουμε τα ηχητικά δεδομένα της εκπαίδευσης καιτης δοκιμής για να παράγουμε τα τελικά χαρακτηριστικά (συνδυασμός ακουστικώνχαρακτηριστικών με χαρακτηριστικά του συστήματος παραγωγής ομιλίας) τα οποίααποτελούν την είσοδο του συστήματος αναγνώρισης. Τα πειραματικά αποτελέσματαεπιδεικνύουν βελτιώσεις στην αναγνώριση φωνής συγκριτικά με την χρήση μόνοακουστικών χαρακτηριστικών.
URI: http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/13439
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File SizeFormat 
DT2017-0097.pdf3.64 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.