Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18277
Full metadata record
DC FieldValueLanguage
dc.contributor.authorΚόρδα, Ζωή-
dc.date.accessioned2022-03-16T10:19:56Z-
dc.date.available2022-03-16T10:19:56Z-
dc.date.issued2022-02-14-
dc.identifier.urihttp://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18277-
dc.description.abstractΈνα ρομποτικό όχημα που πλοηγείται αυτόνομα αποτελεί έναν μακροχρόνιο στόχο τεχνητής νοημοσύνης. Γενικότερα, η οδήγηση ενός οχήματος είναι μια εργασία που απαιτεί υψηλό επίπεδο δεξιοτήτων, προσοχής και εμπειρίας από έναν άνθρωπο οδηγό. Αν και οι υπολογιστές έχουν αναπτύξει οξύτερες ικανότητες εστίασης από αυτές των ανθρώπων, η πλήρως αυτόνομη οδήγηση απαιτεί ένα επίπεδο πληροφοριών που ξεπερνούν αυτό που έχει επιτευχθεί μέχρι στιγμής από πράκτορες τεχνητής νοημοσύνης. Εντούτοις, ο τομέας της ενισχυτικής μάθησης (RL) συνιστά ένα ισχυρό μαθησιακό εργαλείο, ικανό πλέον να μαθαίνει πολύπλοκες πολιτικές σε περιβάλλοντα υψηλών διαστάσεων. Στην παρούσα διπλωματική εργασία, μελετάται η λειτουργία πάρκινγκ ενός αυτόνομου οχήματος στο περιβάλλον προσομοίωσης highway-env με τη χρήση αλγορίθμων βαθιάς ενισχυτικής μάθησης. Για τον σκοπό αυτό, σχεδιάστηκαν τέσσερις πράκτορες: ένας βελτιστοποιητής τροχιάς βασισμένος σε μοντέλο (model-based CEM planner) και τρεις πράκτορες ενισχυτικής μάθησης χωρίς μοντέλο (DQN, SAC, SAC with HER). Ειδικότερα, μελετήθηκε η συμπεριφορά καθενός από τους παραπάνω πράκτορες στο περιβάλλον, όπως και τα αποτελέσματα των προσομοιώσεων με βάση τις επιβραβεύσεις των επιμέρους πρακτόρων κατά την προσέγγιση κάποιας τυχαίας θέσης-στόχου, χωρίς την ύπαρξη άλλων πρακτόρων ή εμποδίων.en_US
dc.languageelen_US
dc.subjectΕνισχυτική Μάθησηen_US
dc.subjectΝευρωνικά Δίκτυαen_US
dc.subjectΑυτόνομη Πλοήγησηen_US
dc.subjectΒαθιά Ενισχυτική Μάθησηen_US
dc.subjectExploration-Exploitation dilemmaen_US
dc.subjectΤεχνητή Νοημοσύνηen_US
dc.subjectCross-Entropy methoden_US
dc.subjectDQNen_US
dc.subjectSoft Actor-Criticen_US
dc.subjectHERen_US
dc.subjectΔράστης-Κριτήςen_US
dc.titleΠάρκινγκ Αυτόνομου Οχήματος με χρήση Αλγορίθμων Βαθιάς Ενισχυτικής Μάθησηςen_US
dc.description.pages85en_US
dc.contributor.supervisorΣταφυλοπάτης Ανδρέας-Γεώργιοςen_US
dc.departmentΤομέας Ηλεκτρομαγνητικών Εφαρμογών Ηλεκτροοπτικής και Ηλεκτρονικών Υλικώνen_US
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
Thesis_Zoi_Korda.pdf2.87 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.