Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο:
http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17610
Πλήρες αρχείο μεταδεδομένων
Πεδίο DC | Τιμή | Γλώσσα |
---|---|---|
dc.contributor.author | Κανιούρας, Χρυσόστομος | - |
dc.date.accessioned | 2020-07-15T09:23:52Z | - |
dc.date.available | 2020-07-15T09:23:52Z | - |
dc.date.issued | 2020-07-15 | - |
dc.identifier.uri | http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17610 | - |
dc.description.abstract | Τα τελευταία χρόνια, έχει γίνει εμφανές πως το πεδίο της Ενισχυτικής Μηχανικής Μάθησης μπορεί να επιλύσει προβλήματα υψηλών διαστάσεων δεδομένηςνκαλής συνάρτησης κόστους και απεριόριστου χρόνου να διαδράσει με το περιβάλλον. Ωστόσο , αν και αυτή τα στοιχεία αποτελούν κλειδί στην εκμάθηση των πρακτόρων δεν είναι πρακτικά εφικτά ούτε μοναδικά. Ιδανικά ένας έξυπνος πράκτορας θα είναι σε θέση να γενικεύει μεταξύ καθηκόντων που του ανατίθενται και να χρησιμοποιεί προγενέστερες εμπειρίες προκειμένου να αποκτήσει νέες δυνατότητες πιο γρήγορα. Στο πλαίσιο αυτής της εργασίας εξετάστηκε η απόδοση των πιο πρόσφατων αλγόριθμων ενισχυτικής μάθησης, Rainbow και PPO, στα video games της σειράς Sonic the Hedgehog και η δυνατότητά τους για μαθησιακή μεταφορά (transfer learning) σε αυτό το περιβάλλον. Δηλαδή να μάθουν να επιλύουν και να κερδίζουν σε περιβάλλοντα που δεν έχουν συναντήσει προηγουμένως εφόσον έχουν εκπαιδευτεί προηγουμένως σε παρόμοια. | en_US |
dc.language | el | en_US |
dc.subject | Τεχνητή Νοημοσύνη | en_US |
dc.subject | Ενισχυτική Μάθηση | en_US |
dc.subject | Βαθιά Ενισχυτική Μάθηση | en_US |
dc.subject | Νευρωνικά Δίκτυα | en_US |
dc.subject | DQN | en_US |
dc.subject | Rainbow | en_US |
dc.subject | Policy Gradient | en_US |
dc.subject | PPO | en_US |
dc.subject | Transfer Learning | en_US |
dc.subject | Video Games | en_US |
dc.subject | Sonic Retro Contest | en_US |
dc.title | Εφαρμογή Αλγορίθμων Ενισχυτικής Μάθησης και Μεταφορά Μάθησης στο Sonic the Hedgehog | en_US |
dc.description.pages | 83 | en_US |
dc.contributor.supervisor | Σταφυλοπάτης Ανδρέας-Γεώργιος | en_US |
dc.department | Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών | en_US |
Εμφανίζεται στις συλλογές: | Διπλωματικές Εργασίες - Theses |
Αρχεία σε αυτό το τεκμήριο:
Αρχείο | Περιγραφή | Μέγεθος | Μορφότυπος | |
---|---|---|---|---|
Chrysostomos_Kaniouras_Thesis.pdf | 1.49 MB | Adobe PDF | Εμφάνιση/Άνοιγμα |
Όλα τα τεκμήρια του δικτυακού τόπου προστατεύονται από πνευματικά δικαιώματα.