Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18050
Full metadata record
DC FieldValueLanguage
dc.contributor.authorΚοφινάκος, Ορφεύς-
dc.date.accessioned2021-07-25T10:19:23Z-
dc.date.available2021-07-25T10:19:23Z-
dc.date.issued2021-07-15-
dc.identifier.urihttp://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18050-
dc.description.abstractΗ εκτεταμένη χρήση τής Τεχνητής Νοημοσύνης στη μουσική, όπως και σε όλα τα πεδία καλλιτεχνικής δημιουργίας, έχει οδηγήσει σε αυξημένη ζήτηση από τους δημιουργούς για εργαλεία που θα επιτρέψουν την ακόμη πιο άμεση και ολοκληρωμένη παραγωγή έργων. Ένα δυνητικά πραγματοποιήσιμο τέτοιο εργαλείο είναι η μεταφορά μουσικών κομματιών από είδος σε είδος. Η διερεύνηση των πολλαπλών συνεργειών τής Τεχνητής Νοημοσύνης με τη μουσική και ειδικότερα αυτού τού εγχειρήματος έχει γίνει συχνό αντικείμενο έρευνας στο παρελθόν, με τη χρήση ηχητικών αρχείων. Η προσέγγιση που παρουσιάζεται σε αυτήν την εργασία διαφοροποιείται από τις προηγούμενες στο βαθμό που επιλέγει να εργαστεί με αρχεία συμβολικών δεδομένων (\en{MIDI}). Η επιλογή αυτή επιβάλλει την ανάλυση τής μουσικής σε επίπεδο σύνθεσης, καθώς μεταβλητές που εμφανίζονται στα ηχητικά αρχεία, όπως το ηχόχρωμα, απουσιάζουν. Η διαδικασία που ακολουθήσαμε ήταν να επιλέξουμε απλοποίηση τής κωδικοποίησης πληροφοριών σε μορφή επαρκή για την εκπαίδευση νευρωνικού δικτύου με αρχιτεκτονικές βαθιάς μηχανικής μάθησης. Οργανώσαμε πειράματα με ένα γενικό μοντέλο \en{autoencoder} με χρήση ξεχωριστών \en{decoder} για κάθε είδος και έναν καθολικό \en{encoder}. Το μοντέλο ακολουθεί το πρωτόκολλο ενός συνηθισμένου \en{encoder-decoder model} το οποίο αποτελεί τρόπο οργάνωσης επαναλαμβανόμενων νευρωνικών δικτύων \en{(RNN)} για χρήση σε προβλήματα πρόβλεψης \en{sequence-to-sequence} με χρήση \en{LSTM} με πολλαπλά \en{layers}, για εκπαίδευση σε μουσικά κομμάτια από το \en{Lakh Pianoroll Dataset}. Χρησιμοποιήθηκε στρατηγική \en{Teacher Forcing}, προκειμένου να βελτιστοποιηθεί η παραγωγή χρήσιμων αποτελεσμάτων. Το μοντέλο εφαρμόστηκε με κοινά γενικά χαρακτηριστικά αρχιτεκτονικής σε δύο μορφές αναπαράστασης. Παρήχθησαν πειράματα, τα οποία αξιολογήθηκαν με ταξινομητή, ενώ όσα έδωσαν ενδιαφέροντα αποτελέσματα υπεβλήθησαν και σε ανθρώπινη αξιολόγηση. Κατά την ολοκλήρωση τής εργασίας προέκυψαν σφάλματα, τα οποία εξηγούνται από την ποιότητα και την οργάνωση τού \en{dataset} αλλά και τού εύρους των επιλεγμένων μουσικών ειδών προς ανάλυση. Προέκυψε το συμπέρασμα ότι το εγχείρημα έχει εμφανή περιθώρια βελτίωσης, ενώ παρέχει χρήσιμες πληροφορίες για στοχευμένες μελλοντικές έρευνες που αργά ή γρήγορα θα οδηγήσουν στην παραγωγή τού εύχρηστου εργαλείου μεταποίησης το οποίο θελήσαμε να μελετήσουμε.en_US
dc.languageelen_US
dc.subjectΤεχνητά Νευρωνικά Δίκτυαen_US
dc.subjectΜεταφορά Είδουςen_US
dc.subjectΜεταφορά Ύφουςen_US
dc.subjectΑνάκτηση Μουσικής Πληροφορίαςen_US
dc.subjectΣυμβολική Μουσική Αναπαράστασηen_US
dc.subjectΑναγνώριση Τονικήςen_US
dc.subjectΑναδρομικά Νευρωνικά Δίκτυαen_US
dc.subjectΡυθμόςen_US
dc.subjectΝότεςen_US
dc.titleΑυτόματη Αλλαγή Μουσικού Είδους σε Συμβολική Μορφή Αναπαράστασης με Χρήση Βαθιών Νευρωνικών Δικτύωνen_US
dc.description.pages61en_US
dc.contributor.supervisorΣτάμου Γιώργοςen_US
dc.departmentΤομέας Τεχνολογίας Πληροφορικής και Υπολογιστώνen_US
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
thesisfin.pdf782.12 kBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.