Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο:
http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17948
Τίτλος: | Τεχνικές Επιβλεπόμενης και Ενισχυτικής Μάθησης στο Παιχνίδι Checkers |
Συγγραφείς: | Θεοδοσίου, Ιωάννης Σταφυλοπάτης Ανδρέας-Γεώργιος |
Λέξεις κλειδιά: | Επιβλεπόμενη μάθηση Ενισχυτική μάθηση Βαθιά Ενισχυτική Μάθηση Τεχνητά Νευρωνικά Δίκτυα Αλγόριθμοι αναζήτησης δέντρου Θεωρία Παιγνίων Policy iteration Monte Carlo Tree Search |
Ημερομηνία έκδοσης: | 8-Ιου-2021 |
Περίληψη: | Τα τελευταία χρόνια έχει γίνει εμφανές ότι η μηχανική και η ενισχυτική μάθηση αποτελούν ισχυρό τρόπο αντιμετώπισης παιχνιδιών ανάμεσα σε δύο παίκτες και γενικότερα περιβάλλοντα στα οποία υπάρχει εναλλαγή κινήσεων και η πλεονεκτική θέση του ενός φέρνει σε μειονεκτική θέση τον άλλο. Συγκεκριμένα το 2016 έχουμε ίσως ένα από τα μεγαλύτερα επιτεύγματα στον χώρο της επιστήμης των υπολογιστών όταν μηχανή σχεδιασμένη από τη DeepMind της Google κατάφερε για πρώτη φορά να νικήσει σε μία σειρά αγώνων Go τον νυν παγκόσμιο πρωταθλητή. Κάτι τέτοιο θεωρούνταν από πολλούς ακατόρθωτο μέσω κλασικών τεχνικών Τεχνητής νοημοσύνης κυρίως λόγω της αχανής φύσης του παιχνιδιού με περισσότερες από 10^172 διαφορετικές θέσεις, περισσότερες δηλαδή από όσα είναι τα άτομα στο σύμπαν. Σκοπός της παρούσας εργασίας είναι η μελέτη των αλγορίθμων μάθησης, επιβλεπόμενης και ενισχυτικής, πάνω στο παιχνίδι checkers ,γνωστό και ως ντάμα, το οποίο αν και απλούστερο, με 10^20 θέσεις παρουσιάζει μεγάλο υπολογιστικό ενδιαφέρον. |
URI: | http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17948 |
Εμφανίζεται στις συλλογές: | Διπλωματικές Εργασίες - Theses |
Αρχεία σε αυτό το τεκμήριο:
Αρχείο | Περιγραφή | Μέγεθος | Μορφότυπος | |
---|---|---|---|---|
mythesis.pdf | 1.95 MB | Adobe PDF | Εμφάνιση/Άνοιγμα |
Όλα τα τεκμήρια του δικτυακού τόπου προστατεύονται από πνευματικά δικαιώματα.