Πάρκινγκ Αυτόνομου Οχήματος με χρήση Αλγορίθμων Βαθιάς Ενισχυτικής Μάθησης

Κόρδα, Ζωή

National Technical University of Athens

School of Electrical and Computer Engineering

Artemis is Live!

Welcome to our digital repository! The aim of Artemis is the systematic archiving and dissemination of the scientific work produced in the School of Electrical and Computer Engineering, National Technical University of Athens, Greece, using the technology of digital libraries.

Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18277

Full metadata record

DC Field	Value	Language
dc.contributor.author	Κόρδα, Ζωή	-
dc.date.accessioned	2022-03-16T10:19:56Z	-
dc.date.available	2022-03-16T10:19:56Z	-
dc.date.issued	2022-02-14	-
dc.identifier.uri	http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18277	-
dc.description.abstract	Ένα ρομποτικό όχημα που πλοηγείται αυτόνομα αποτελεί έναν μακροχρόνιο στόχο τεχνητής νοημοσύνης. Γενικότερα, η οδήγηση ενός οχήματος είναι μια εργασία που απαιτεί υψηλό επίπεδο δεξιοτήτων, προσοχής και εμπειρίας από έναν άνθρωπο οδηγό. Αν και οι υπολογιστές έχουν αναπτύξει οξύτερες ικανότητες εστίασης από αυτές των ανθρώπων, η πλήρως αυτόνομη οδήγηση απαιτεί ένα επίπεδο πληροφοριών που ξεπερνούν αυτό που έχει επιτευχθεί μέχρι στιγμής από πράκτορες τεχνητής νοημοσύνης. Εντούτοις, ο τομέας της ενισχυτικής μάθησης (RL) συνιστά ένα ισχυρό μαθησιακό εργαλείο, ικανό πλέον να μαθαίνει πολύπλοκες πολιτικές σε περιβάλλοντα υψηλών διαστάσεων. Στην παρούσα διπλωματική εργασία, μελετάται η λειτουργία πάρκινγκ ενός αυτόνομου οχήματος στο περιβάλλον προσομοίωσης highway-env με τη χρήση αλγορίθμων βαθιάς ενισχυτικής μάθησης. Για τον σκοπό αυτό, σχεδιάστηκαν τέσσερις πράκτορες: ένας βελτιστοποιητής τροχιάς βασισμένος σε μοντέλο (model-based CEM planner) και τρεις πράκτορες ενισχυτικής μάθησης χωρίς μοντέλο (DQN, SAC, SAC with HER). Ειδικότερα, μελετήθηκε η συμπεριφορά καθενός από τους παραπάνω πράκτορες στο περιβάλλον, όπως και τα αποτελέσματα των προσομοιώσεων με βάση τις επιβραβεύσεις των επιμέρους πρακτόρων κατά την προσέγγιση κάποιας τυχαίας θέσης-στόχου, χωρίς την ύπαρξη άλλων πρακτόρων ή εμποδίων.	en_US
dc.language	el	en_US
dc.subject	Ενισχυτική Μάθηση	en_US
dc.subject	Νευρωνικά Δίκτυα	en_US
dc.subject	Αυτόνομη Πλοήγηση	en_US
dc.subject	Βαθιά Ενισχυτική Μάθηση	en_US
dc.subject	Exploration-Exploitation dilemma	en_US
dc.subject	Τεχνητή Νοημοσύνη	en_US
dc.subject	Cross-Entropy method	en_US
dc.subject	DQN	en_US
dc.subject	Soft Actor-Critic	en_US
dc.subject	HER	en_US
dc.subject	Δράστης-Κριτής	en_US
dc.title	Πάρκινγκ Αυτόνομου Οχήματος με χρήση Αλγορίθμων Βαθιάς Ενισχυτικής Μάθησης	en_US
dc.description.pages	85	en_US
dc.contributor.supervisor	Σταφυλοπάτης Ανδρέας-Γεώργιος	en_US
dc.department	Τομέας Ηλεκτρομαγνητικών Εφαρμογών Ηλεκτροοπτικής και Ηλεκτρονικών Υλικών	en_US
Appears in Collections:	Διπλωματικές Εργασίες - Theses

Files in This Item:

File	Description	Size	Format
Thesis_Zoi_Korda.pdf		2.87 MB	Adobe PDF	View/Open

Show simple item record