Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17948
Τίτλος: Τεχνικές Επιβλεπόμενης και Ενισχυτικής Μάθησης στο Παιχνίδι Checkers
Συγγραφείς: Θεοδοσίου, Ιωάννης
Σταφυλοπάτης Ανδρέας-Γεώργιος
Λέξεις κλειδιά: Επιβλεπόμενη μάθηση
Ενισχυτική μάθηση
Βαθιά Ενισχυτική Μάθηση
Τεχνητά Νευρωνικά Δίκτυα
Αλγόριθμοι αναζήτησης δέντρου
Θεωρία Παιγνίων
Policy iteration
Monte Carlo Tree Search
Ημερομηνία έκδοσης: 8-Ιου-2021
Περίληψη: Τα τελευταία χρόνια έχει γίνει εμφανές ότι η μηχανική και η ενισχυτική μάθηση αποτελούν ισχυρό τρόπο αντιμετώπισης παιχνιδιών ανάμεσα σε δύο παίκτες και γενικότερα περιβάλλοντα στα οποία υπάρχει εναλλαγή κινήσεων και η πλεονεκτική θέση του ενός φέρνει σε μειονεκτική θέση τον άλλο. Συγκεκριμένα το 2016 έχουμε ίσως ένα από τα μεγαλύτερα επιτεύγματα στον χώρο της επιστήμης των υπολογιστών όταν μηχανή σχεδιασμένη από τη DeepMind της Google κατάφερε για πρώτη φορά να νικήσει σε μία σειρά αγώνων Go τον νυν παγκόσμιο πρωταθλητή. Κάτι τέτοιο θεωρούνταν από πολλούς ακατόρθωτο μέσω κλασικών τεχνικών Τεχνητής νοημοσύνης κυρίως λόγω της αχανής φύσης του παιχνιδιού με περισσότερες από 10^172 διαφορετικές θέσεις, περισσότερες δηλαδή από όσα είναι τα άτομα στο σύμπαν. Σκοπός της παρούσας εργασίας είναι η μελέτη των αλγορίθμων μάθησης, επιβλεπόμενης και ενισχυτικής, πάνω στο παιχνίδι checkers ,γνωστό και ως ντάμα, το οποίο αν και απλούστερο, με 10^20 θέσεις παρουσιάζει μεγάλο υπολογιστικό ενδιαφέρον.
URI: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17948
Εμφανίζεται στις συλλογές:Διπλωματικές Εργασίες - Theses

Αρχεία σε αυτό το τεκμήριο:
Αρχείο Περιγραφή ΜέγεθοςΜορφότυπος 
mythesis.pdf1.95 MBAdobe PDFΕμφάνιση/Άνοιγμα


Όλα τα τεκμήρια του δικτυακού τόπου προστατεύονται από πνευματικά δικαιώματα.