Please use this identifier to cite or link to this item:
http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/14847
Title: | Κατάτμηση Και Κατηγοριοποίηση Φωνής, Θορύβου Και Σιωπής Με Χρήση Μετρικών Κριτηρίων Και Στατιστικών Ημμ/gmm Μοντέλων, Με Εφαρμογές Σε Ηχητικά Τμήματα Από Δελτία Ειδήσεων |
Authors: | Μεταλληνού Αγγελική Μαραγκός Πέτρος |
Keywords: | σηματοδότηση ηχητικών αρχείων κατάτμηση ηχητικών αρχείων μετρικά κριτήρια κατάτμησης bayesian information criterion mel frequency cepstral coeffiecients teager energy cepstral coefficients φράκταλς φράκταλ διάσταση ηχητικού σήματος κατηγοριοποίηση ηχητικών αρχείων στατιστική μοντελοποίηση κρυφά μαρκοβιανά μοντέλα γκαουσιανά μοντέλα μιγμάτων δελτία ειδήσεων. |
Issue Date: | 25-Jul-2007 |
Abstract: | Στην παρούσα διπλωματική εργασία μελετάται το πρόβλημα επεξεργασίας ηχητικών αρχείων και συγκεκριμένα το πεδίο του εντοπισμού αλλαγών και συνακόλουθης κατάτμησης των αρχείων αλλά και το πεδίο της στατιστικής μοντελοποίησης ηχητικών κλάσεων με σκοπό την κατηγοριοποίηση ηχητικών τμημάτων. Αρχικά γίνεται μία αναλυτική παρουσίαση των μεθόδων και των συστημάτων που παρουσιάζονται στην βιβλιογραφία για την κατάτμηση και την κατηγοριοποίηση ηχητικών αρχείων. Ακολούθως, αναφορικά με το πρόβλημα της κατάτμησης,παρουσιάζονται ποικίλα χαρακτηριστικά που μπορούν να εξαχθούν από το ηχητικό σήμα, κριτήρια κατάτμησης, με έμφαση στα μετρικά κριτήρια, και αλγόριθμοι κατάτμησης. Προτείνεται επίσης ένας νέος αλγόριθμος με σκοπό τη βελτίωση των αποτελεσμάτων της κατάτμησης. Αναφορικά με το πρόβλημα της στατιστικής μοντελοποίησης με στόχο την κατηγοριοποίηση, παρουσιάζονται τα βήματα και οι σχεδιαστικές αποφάσεις για τη δημιουργία ενός συστήματος κατάτμησης και κατηγοριοποίησης βασισμένου σε στατιστικά Κρυφά Μαρκοβιανά Μοντέλα και Γκαουσιανά Μοντέλα Μιγμάτων. Στη συνέχεια αναλύονται, υλοποιούνται και συγκρίνονται θεωρητικά και πειραματικά διάφορες προσεγγίσεις για την κατάτμηση και κατηγοριοποίηση τμημάτων και εισάγεται μία καινούρια ιδέα, η έννοια των καμπύλων ποσοστών. Εντέλει, παρουσιάζεται ένα συνολικό σύστημα που συνδυάζει τις επιμέρους υπομονάδες που υλοποιήθηκαν και μπορεί να εφαρμοστεί για την κατάτμηση και κατηγοριοποίηση πραγματικών ηχητικών αρχείων από δελτία ειδήσεων. |
URI: | http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/14847 |
Appears in Collections: | Διπλωματικές Εργασίες - Theses |
Files in This Item:
File | Size | Format | |
---|---|---|---|
DT2007-0088.pdf | 2 MB | Adobe PDF | View/Open |
Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.