Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17319
Πλήρες αρχείο μεταδεδομένων
Πεδίο DC ΤιμήΓλώσσα
dc.contributor.authorΣταυρουλάκης, Στυλιανός - Ανδρέας-
dc.date.accessioned2019-07-16T08:18:03Z-
dc.date.available2019-07-16T08:18:03Z-
dc.date.issued2019-07-12-
dc.identifier.urihttp://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17319-
dc.description.abstractΈνας από τους κλάδους της μηχανικής μάθησης, ο οποίος παρουσιάζει μεγάλη πρόοδο τα τελευταία χρόνια, είναι η βαθιά ενισχυτική μάθηση. Προγράμματα που στοχεύουν στη μεγιστοποίηση κάποιας σωρευτικής ανταμοιβής αποδεικνύονται ελπιδοφόρα στην προσπάθεια να επεκταθεί το εύρος των επιλύσιμων προβλημάτων μεγάλης πολυπλοκότητας. Ωστόσο, το εκάστοτε περιβάλλον με το οποίο αλληλεπιδρά κάποιος πράκτορας βαθιάς ενισχυτικής μάθησης, ενδέχεται να περιέχει μια ευρύτερη ποικιλία πιθανών σημάτων ανταμοιβής κατά την εκπαίδευση. Ένα παράδειγμα συνδυαστικού προβλήματος με αραιές ανταμοιβές αποτελεί και ο φημισμένος κύβος του Ρούμπικ. Η αντιμετώπιση των αραιών ανταμοιβών καθώς και το γεγονός ότι δεν υπάρχει εγγύηση τερματισμού του προβλήματος, είναι μια από τις μεγαλύτερες προκλήσεις στην βαθιά ενισχυτική μάθηση. Στόχος της διπλωματικής εργασίας είναι η εισαγωγή της έννοιας της εντροπίας του κύβου του Ρούμπικ, και η μερική χρήση του σαν οδηγό από έναν πράκτορα, ο οποίος χρησιμοποιεί έναν αλγόριθμο αυτοδιδασκόμενης επανάληψης κατά την εκπαίδευση του, με απώτερο σκοπό την αποδοτικότερη λύση του κύβου.en_US
dc.languageelen_US
dc.subjectΒαθιά Ενισχυτική Μάθησηen_US
dc.subjectΑυτοδιδασκόμενη Επανάληψηen_US
dc.subjectΕλαχιστοποίηση Εντροπίαςen_US
dc.subjectΑναζήτηση Μόντε Κάρλοen_US
dc.subjectΝευρωνικά Δίκτυαen_US
dc.subjectΚύβος Ρούμπικen_US
dc.titleΧρήση βαθιάς ενισχυτικής μάθησης για την επίλυση του Rubik’s Cubeen_US
dc.description.pages97en_US
dc.contributor.supervisorΣταφυλοπάτης Ανδρέας-Γεώργιοςen_US
dc.departmentΤομέας Τεχνολογίας Πληροφορικής και Υπολογιστώνen_US
Εμφανίζεται στις συλλογές:Διπλωματικές Εργασίες - Theses

Αρχεία σε αυτό το τεκμήριο:
Αρχείο Περιγραφή ΜέγεθοςΜορφότυπος 
Thesis - Stelios Stavroulakis - Solving the Rubik's Cube using Deep RL.pdf3.45 MBAdobe PDFΕμφάνιση/Άνοιγμα


Όλα τα τεκμήρια του δικτυακού τόπου προστατεύονται από πνευματικά δικαιώματα.