Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17948
Title: Τεχνικές Επιβλεπόμενης και Ενισχυτικής Μάθησης στο Παιχνίδι Checkers
Authors: Θεοδοσίου, Ιωάννης
Σταφυλοπάτης Ανδρέας-Γεώργιος
Keywords: Επιβλεπόμενη μάθηση
Ενισχυτική μάθηση
Βαθιά Ενισχυτική Μάθηση
Τεχνητά Νευρωνικά Δίκτυα
Αλγόριθμοι αναζήτησης δέντρου
Θεωρία Παιγνίων
Policy iteration
Monte Carlo Tree Search
Issue Date: 8-Jun-2021
Abstract: Τα τελευταία χρόνια έχει γίνει εμφανές ότι η μηχανική και η ενισχυτική μάθηση αποτελούν ισχυρό τρόπο αντιμετώπισης παιχνιδιών ανάμεσα σε δύο παίκτες και γενικότερα περιβάλλοντα στα οποία υπάρχει εναλλαγή κινήσεων και η πλεονεκτική θέση του ενός φέρνει σε μειονεκτική θέση τον άλλο. Συγκεκριμένα το 2016 έχουμε ίσως ένα από τα μεγαλύτερα επιτεύγματα στον χώρο της επιστήμης των υπολογιστών όταν μηχανή σχεδιασμένη από τη DeepMind της Google κατάφερε για πρώτη φορά να νικήσει σε μία σειρά αγώνων Go τον νυν παγκόσμιο πρωταθλητή. Κάτι τέτοιο θεωρούνταν από πολλούς ακατόρθωτο μέσω κλασικών τεχνικών Τεχνητής νοημοσύνης κυρίως λόγω της αχανής φύσης του παιχνιδιού με περισσότερες από 10^172 διαφορετικές θέσεις, περισσότερες δηλαδή από όσα είναι τα άτομα στο σύμπαν. Σκοπός της παρούσας εργασίας είναι η μελέτη των αλγορίθμων μάθησης, επιβλεπόμενης και ενισχυτικής, πάνω στο παιχνίδι checkers ,γνωστό και ως ντάμα, το οποίο αν και απλούστερο, με 10^20 θέσεις παρουσιάζει μεγάλο υπολογιστικό ενδιαφέρον.
URI: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17948
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
mythesis.pdf1.95 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.