Εφαρμογή μεθόδων ενισχυτικής μάθησης στο βίντεο-παιχνίδι Super Mario

Ιωάννης, Βονδικάκης

National Technical University of Athens

School of Electrical and Computer Engineering

Artemis is Live!

Welcome to our digital repository! The aim of Artemis is the systematic archiving and dissemination of the scientific work produced in the School of Electrical and Computer Engineering, National Technical University of Athens, Greece, using the technology of digital libraries.

Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18389

Title:	Εφαρμογή μεθόδων ενισχυτικής μάθησης στο βίντεο-παιχνίδι Super Mario
Authors:	Ιωάννης, Βονδικάκης Κόλλιας Στέφανος
Keywords:	Τεχνητή Νοημοσύνη Ενισχυτική Μάθηση Βαθιά Ενισχυτική Μάθηση Νευρωνικά Δίκτυα DQN DDQN Policy Gradient PPO A3C Video Games Super Mario Bros
Issue Date:	8-Jul-2022
Abstract:	Η ενισχυτική μάθηση αφορά έναν πράκτορα που αλληλεπιδρά με το περιβάλλον, μαθαίνοντας μια βέλτιστη πολιτική, μέσω δοκιμής και λάθους, για διαδοχικά προβλήματα λήψης αποφάσεων, σε ένα ευρύ φάσμα πεδίων όπως τις φυσικές επιστήμες, τις κοινωνικές επιστήμες και τη μηχανική. Η βαθιά μάθηση ή αλλιώς τα βαθιά νευρωνικά δίκτυα, έχουν γνωρίσει μεγάλη άνθιση τα τελευταία χρόνια και έχουν επικρατήσει στην ενισχυτική μάθηση. Στόχος της παρούσας διπλωματικής εργασίας είναι η παρουσίαση των βασικών εννοιών της ενισχυτικής μάθησης και η εφαρμογή αλγορίθμων βαθιάς ενισχυτικής μάθησης για την δημιουργία πρακτόρων ικανών να τερματίσουν τα επίπεδά στο βιντεοπαιχνίδι Sυper Mario Bros. Οι πράκτορες μπορούν να μάθουν διάφορες πολιτικές ελέγχου από ακατέργαστα δεδομένα εικονοστοιχείων με τη χρήση βαθιάς ενισχυτικής μάθησης. Στην εργασία εξετάζονται και συγκρίνονται αλγόριθμοι Q-μάθησης (Q-learning) DQN,DDQN και βελτιστοποίησης πολιτικής ( Policy Optimization) PPO, A3C.
URI:	http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18389
Appears in Collections:	Διπλωματικές Εργασίες - Theses

Files in This Item:

File	Description	Size	Format
final_edition.pdf	Ioannis-Vondikakis-thesis	1.16 MB	Adobe PDF	View/Open

Show full item record