Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18389
Full metadata record
DC FieldValueLanguage
dc.contributor.authorΙωάννης, Βονδικάκης-
dc.date.accessioned2022-07-21T10:08:28Z-
dc.date.available2022-07-21T10:08:28Z-
dc.date.issued2022-07-08-
dc.identifier.urihttp://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18389-
dc.description.abstractΗ ενισχυτική μάθηση αφορά έναν πράκτορα που αλληλεπιδρά με το περιβάλλον, μαθαίνοντας μια βέλτιστη πολιτική, μέσω δοκιμής και λάθους, για διαδοχικά προβλήματα λήψης αποφάσεων, σε ένα ευρύ φάσμα πεδίων όπως τις φυσικές επιστήμες, τις κοινωνικές επιστήμες και τη μηχανική. Η βαθιά μάθηση ή αλλιώς τα βαθιά νευρωνικά δίκτυα, έχουν γνωρίσει μεγάλη άνθιση τα τελευταία χρόνια και έχουν επικρατήσει στην ενισχυτική μάθηση. Στόχος της παρούσας διπλωματικής εργασίας είναι η παρουσίαση των βασικών εννοιών της ενισχυτικής μάθησης και η εφαρμογή αλγορίθμων βαθιάς ενισχυτικής μάθησης για την δημιουργία πρακτόρων ικανών να τερματίσουν τα επίπεδά στο βιντεοπαιχνίδι Sυper Mario Bros. Οι πράκτορες μπορούν να μάθουν διάφορες πολιτικές ελέγχου από ακατέργαστα δεδομένα εικονοστοιχείων με τη χρήση βαθιάς ενισχυτικής μάθησης. Στην εργασία εξετάζονται και συγκρίνονται αλγόριθμοι Q-μάθησης (Q-learning) DQN,DDQN και βελτιστοποίησης πολιτικής ( Policy Optimization) PPO, A3C.en_US
dc.languageelen_US
dc.subjectΤεχνητή Νοημοσύνηen_US
dc.subjectΕνισχυτική Μάθησηen_US
dc.subjectΒαθιά Ενισχυτική Μάθησηen_US
dc.subjectΝευρωνικά Δίκτυαen_US
dc.subjectDQNen_US
dc.subjectDDQNen_US
dc.subjectPolicy Gradienten_US
dc.subjectPPOen_US
dc.subjectA3Cen_US
dc.subjectVideo Gamesen_US
dc.subjectSuper Mario Brosen_US
dc.titleΕφαρμογή μεθόδων ενισχυτικής μάθησης στο βίντεο-παιχνίδι Super Marioen_US
dc.description.pages82en_US
dc.contributor.supervisorΚόλλιας Στέφανοςen_US
dc.departmentΤομέας Τεχνολογίας Πληροφορικής και Υπολογιστώνen_US
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
final_edition.pdfIoannis-Vondikakis-thesis1.16 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.