Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο:
http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18277
Τίτλος: | Πάρκινγκ Αυτόνομου Οχήματος με χρήση Αλγορίθμων Βαθιάς Ενισχυτικής Μάθησης |
Συγγραφείς: | Κόρδα, Ζωή Σταφυλοπάτης Ανδρέας-Γεώργιος |
Λέξεις κλειδιά: | Ενισχυτική Μάθηση Νευρωνικά Δίκτυα Αυτόνομη Πλοήγηση Βαθιά Ενισχυτική Μάθηση Exploration-Exploitation dilemma Τεχνητή Νοημοσύνη Cross-Entropy method DQN Soft Actor-Critic HER Δράστης-Κριτής |
Ημερομηνία έκδοσης: | 14-Φεβ-2022 |
Περίληψη: | Ένα ρομποτικό όχημα που πλοηγείται αυτόνομα αποτελεί έναν μακροχρόνιο στόχο τεχνητής νοημοσύνης. Γενικότερα, η οδήγηση ενός οχήματος είναι μια εργασία που απαιτεί υψηλό επίπεδο δεξιοτήτων, προσοχής και εμπειρίας από έναν άνθρωπο οδηγό. Αν και οι υπολογιστές έχουν αναπτύξει οξύτερες ικανότητες εστίασης από αυτές των ανθρώπων, η πλήρως αυτόνομη οδήγηση απαιτεί ένα επίπεδο πληροφοριών που ξεπερνούν αυτό που έχει επιτευχθεί μέχρι στιγμής από πράκτορες τεχνητής νοημοσύνης. Εντούτοις, ο τομέας της ενισχυτικής μάθησης (RL) συνιστά ένα ισχυρό μαθησιακό εργαλείο, ικανό πλέον να μαθαίνει πολύπλοκες πολιτικές σε περιβάλλοντα υψηλών διαστάσεων. Στην παρούσα διπλωματική εργασία, μελετάται η λειτουργία πάρκινγκ ενός αυτόνομου οχήματος στο περιβάλλον προσομοίωσης highway-env με τη χρήση αλγορίθμων βαθιάς ενισχυτικής μάθησης. Για τον σκοπό αυτό, σχεδιάστηκαν τέσσερις πράκτορες: ένας βελτιστοποιητής τροχιάς βασισμένος σε μοντέλο (model-based CEM planner) και τρεις πράκτορες ενισχυτικής μάθησης χωρίς μοντέλο (DQN, SAC, SAC with HER). Ειδικότερα, μελετήθηκε η συμπεριφορά καθενός από τους παραπάνω πράκτορες στο περιβάλλον, όπως και τα αποτελέσματα των προσομοιώσεων με βάση τις επιβραβεύσεις των επιμέρους πρακτόρων κατά την προσέγγιση κάποιας τυχαίας θέσης-στόχου, χωρίς την ύπαρξη άλλων πρακτόρων ή εμποδίων. |
URI: | http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18277 |
Εμφανίζεται στις συλλογές: | Διπλωματικές Εργασίες - Theses |
Αρχεία σε αυτό το τεκμήριο:
Αρχείο | Περιγραφή | Μέγεθος | Μορφότυπος | |
---|---|---|---|---|
Thesis_Zoi_Korda.pdf | 2.87 MB | Adobe PDF | Εμφάνιση/Άνοιγμα |
Όλα τα τεκμήρια του δικτυακού τόπου προστατεύονται από πνευματικά δικαιώματα.