Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17358
Title: Αυτόματη Σύνθεση Μουσικής Σε Συμβολική Μορφή Με Αναδρομικά Νευρωνικά Δίκτυα
Authors: Φιλανδριανός, Γεώργιος
Στάμου Γιώργος
Keywords: Τεχνητά Νευρωνικά Δίκτυα
Βαθιά Μάθηση
Αναδρομικά Νευρωνικά Δίκτυα
Αρχιτεκτονική Κωδικοποιήτη- Αποκωδικοποιητή
Συγκέντρωση
Πόλωση
Μουσικά Όργανα
Νότες
Εξισορρόπηση Δεδομένων
Issue Date: 16-Jul-2019
Abstract: Η Αυτόματη Σύνθεση Μουσικής αποτελεί ίσως ένα από τα πλέον κομβικά αλλά και δύσκολα έργα στον τομέα της ανακατασκευής πληροφορίας. Για τους ειδικούς αποτελεί το αποδοτικότερο μέσο επικοινωνίας τους ενώ για τους υπολοίπους χρήστες είναι ένα από τα καλύτερα μέσα έκφρασης των συναισθημάτων τους. Παρόλα αυτά η σύνθεση νέων και ενδιαφέροντών κομματιών είναι μια διεργασία η όποια απαιτεί βαθιά γνώση, εμπειρία και εξειδίκευση. Αντίστοιχη δυσκολία συναντάται και στους υπολογιστές όπου, παρόλες τις προσπάθειες, έχει αποδειχθεί μια εργασία ιδιαίτερα απαιτητική η όποια έχει γνωρίσει ως την ώρα επιτυχία μόνο σε μερικές κατηγορίες ακουσμάτων. Όπως και με τα περισσότερα έργα ανάκτησης και ανακατασκευής πληροφορίας στον τομέα της μουσικής, έτσι και τα συστήματα αυτόματης σύνθεσης που κατασκευάστηκαν στα πλαίσια αυτής της διατριβής ακολουθούν την τάση να αντικαθιστούν τα στάδια επεξεργασίας σήματος και εξαγωγής χαρακτηριστικών από στατιστικά μοντέλα με αρχιτεκτονικές βαθιάς μηχανικής μάθησης. Για τον λόγο αυτόν στην παρούσα εργασία επιλέχθηκε ο παραδοσιακός δρόμος όσο αναφορά την αναπαράσταση της μουσικής, ο οποίος είναι η κωδικοποίησή της σε ακολουθιακή μορφή και συγκεκριμένα η κωδικοποίησή της με το πρωτόκολλο Midi. Για το πειραματικό μέρος της εργασίας εκπαιδεύτηκαν διαφορετικές αρχιτεκτονικές νευρωνικών δικτύων με σκοπό δοσμένης μιας αρχικής μελωδίας να συνθέτουν κάποια πρωτότυπη συνέχειά της. Συγκεκριμένα χρησιμοποιήθηκαν: ένα Αναδρομικό Νευρωνικό Δίκτυο Βαθιάς Μακροπρόθεσμής Μνήμης (LSTM) με Πολλαπλά επίπεδα, μια αρχιτεκτονική Κωδικοποιητή- Αποκωδικοποιητή (LSTM Encoder- Decoder) καθώς και μια Αρχιτεκτονική Κωδικοποιητή- Αποκωδικοποιητή με Συγκέντρωση (LSTM Encoder- Decoder with Attention). Παράλληλα με την αρχιτεκτονική άλλαζε και το σύνολό εκπαίδευσης όπου χρησιμοποιήθηκαν σύνολα: πιάνου, κιθάρας καθώς και συνδυασμοί αλλά και παραλλαγές αυτών. Τέλος στα παραπάνω δίκτυα αλλάχθηκαν και ορισμένες υπερπαράμετροι τους όπως: το μέγεθος της μνήμης του LSTM και η μέθοδος πρόβλεψης, με σκοπό μα διερευνηθεί ο ρόλος και η επίδρασή τους στις παραγόμενες συνθέσεις.
URI: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17358
Appears in Collections:Διπλωματικές Εργασίες - Theses



Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.