Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17060
Title: Αυτόματη Αναγνώριση Συγχορδίας με Μεθόδους Μηχανικής Μάθησης
Authors: Ντερβάκος, Έντμοντ - Γρηγόρης
Στάμου Γιώργος
Keywords: Τεχνητά Νευρωνικά Δίκτυα
Artificial Neural Networks
Συγχορδίες
Chords
Ανάκτηση Μουσικής Πληροφορίας
Music Information Retrieval
Αναδρομικά Νευρωνικά Δίκτυα
Recurrent Neural Networks
Συνελικτικά Νευρωνικά Δίκτυα
Convolutional Neural Networks
Issue Date: 3-Jul-2018
Abstract: Η Αυτόματη Αναγνώριση Συγχορδίας είναι κομβικό έργο για τον τομέα της ανάκτησης πληροφορίας από μουσική. Οι συγχορδίες κωδικοποιούν την αρμονική πληροφορία ενός κομματιού και καθορίζουν σε μεγάλο βαθμό το μεταδιδόμενο συναίσθημα. Για μουσικούς είναι ίσως το αποδοτικότερο μέσο επικοινωνίας όταν αυτοί παίζουν σε σύνολο, ενώ σε κάποιες περιπτώσεις οι αλληλουχίες συγχορδιών αντικαθιστούν την αναλυτική παρτιτούρα. Όπως με τα περισσότερα έργα του τομέα ανάκτησης πληροφορίας από μουσική, τα συστήματα αυτόματης αναγνώρισης συγχορδίας ακολουθούν την τάση να αντικαθιστούν στάδια επεξεργασίας σήματος, εξαγωγής χαρακτηριστικών και στατιστικών μοντέλων με αρχιτεκτονικές βαθιάς μηχανικής μάθησης. Στην παρούσα εργασία ακολουθήθηκε ο πιο παραδοσιακός δρόμος, και για την πρόβλεψη χρησιμοποιήθηκαν υψηλού επιπέδου χαρακτηριστικά - αυτά που παρέχει το Spotify μέσω του API του. Αυτά περιέχουν τμηματοποιήσεις του κομματιού μουσικής, με επιπλέον χαρακτηριστικά να αντιστοιχούν σε κάθε τμήμα. Για το πειραματικό μέρος της εργασίας εκπαιδεύτηκαν διαφορετικά νευρωνικά δίκτυα με σκοπό να αναγνωρίζουν τη συγχορδία που ακούγεται σε κάθε τμήμα από την τμηματοποίηση που παρέχει το Spotify. Συγκεκριμένα χρησιμοποιήθηκαν: Απλό Multi Layer Perceptron ή Feedforward Νευρωνικά Δίκτυα ή FNN, Συνελικτικά Νευρωνικά Δίκτυα ή CNN, η παραλλαγή του Αναδρομικού Νευρωνικού δικτύου Μακράς Βραχυπρόθεσμης Μνήμης ή LSTM καθώς και μια πιο πολύπλοκη αρχιτεκτονική, τον Κωδικοποιητή -Αποκωδικοποιητή LSTM - (LSTM Encoder Decoder). Το σύνολο εκπαίδευσης αποτελούνταν από συνδυασμό συνόλων δεδομένων επισημειωμένων με συγχορδίες ανά χρονική στιγμή, που χρησιμοποιούνται ευρέως στη βιβλιογραφία. Αξιολογήθηκε η συμπεριφορά των μοντέλων με διαφορετικές παραμέτρους, διαφορετικά χαρακτηριστικά καθώς και η αποτελεσματικότητα τεχνικών προ-επεξεργασίας δεδομένων όπως η επαύξηση και το φιλτράρισμα των δεδομένων.
URI: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17060
Appears in Collections:Διπλωματικές Εργασίες - Theses



Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.