Reachability Analysis Optimal Control

Κωστόπουλος, Κωνσταντίνος

Εθνικό Μετσόβιο Πολυτεχνείο

Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Καλώς ήρθατε στο Άρτεμις

Σκοπός του Άρτεμις είναι η συστηματική αρχειοθέτηση και διαδοση της πνευματικής παραγωγής της Σχολής Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών του Εθνικού Μετσόβιου Πολυτεχνείου, με τη βοήθεια της τεχνολογίας των ψηφιακών βιβλιοθηκών.

Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18797

Τίτλος:	Reachability Analysis Optimal Control
Συγγραφείς:	Κωστόπουλος, Κωνσταντίνος Ψυλλάκης Χαράλαμπος
Λέξεις κλειδιά:	Βέλτιστος Έλεγχος Ενισχυτική Μάθηση Hamilton-Jacobi Reachability Q-Learning Reachability Decomposition Actor-Critic
Ημερομηνία έκδοσης:	12-Σεπ-2023
Περίληψη:	Αυτή η διπλωµατική διερευνά το Βέλτιστο ΄Ελεγχο (Optimal Control) µέσω Ανάλυσης Προσπελασιµότητας (Reachability Analysis). Αποσαφηνίζει κατάρχάς τα ϐασικά στοιχεία του ϐέλτιστου ελέγχου και την αξία που προσδίδει στον έλεγχο συστηµάτων. Συνεχίζει µε ϑεωρία και εφαρµογές στα Προσπελάσιµα Συνόλα (Reachable Sets), καθώς και στη χρήση του δυναµικού προγραµµατισµού στην Reach-Avoid ανάλυση, µια µέθοδο επίλυσης προβληµάτων ϐέλτιστου ελέγχου µε στόχο την επίτευξη ενός στόχου µε παράκαµψη εµποδίων. Συζητείται επίσης η έννοια της Αποσύνθεσης Προσπελασιµότητας (Reachability Decomposition), η οποία απλοποιεί τα προβλήµατα προσπελασιµότητας υψηλών διαστάσεων. Η µελέτη εφαρµόζει αυτές τις ϑεωρίες σε ένα σύστηµα quadrotor 6 διαστάσεων, συγκρίνοντας τα αποτελέσµατα της παραδοσιακής ανάλυσης προσπελασιµότητας µε την αποσύνθεση προσπελασιµότητας, αναδεικνύοντας την αποτελεσµατικότητα της τελευταίας. Στη συνέχεια, διερευνά πώς η Ενισχυτική Μάθηση (RL), µια τεχνική µηχανικής µάθησης λήψης αποφάσεων, µπορεί να ενσωµατωθεί στην Ανάλυση Προσπελασιµότητας. Παρουσιάζεται η προσοµοίωση ενός συστήµατος 6∆ σεληνιακής προσεδάφισης, µε τη χρήση RL Reachability Analysis και RL Reachability Decomposition. Τα ευρήµατα αναδεικνύουν τα πλεονεκτήµατα και τα µειονεκτήµατα κάθε µεθόδου. Στο κύριο µέρος αυτής της διατριβής, χρησιµοποιούµε την ανάλυση προσπελασιµότητας για να επινοήσουµε ένα zero-sum game µε model-free, actor-critic Q-learning προσέγγιση για τον υπολογισµό προσπελάσιµων συνόλων σε γραµµικά ή γραµµικοποιήσιµα συστήµατα, ακόµη και παρουσία διαταραχών. Αρχικά παρουσιάζουµε το δίκτυο κριτικών (critic network) που χρησιµοποιείται στην προσέγγισή µας, το οποίο αποτελείται από έναν κριτικό και δύο ηθοποιούς : έναν για τον ελεγκτή και έναν για τη διαταραχή. Στη συνέχεια, εισάγουµε µια επαυξηµένη κατάσταση που ξαναγράφει τη συνάρτηση πλεονεκτήµατος που εξαρτάται από τη δράση των προϐληµάτων προσπελασιµότητας σε συµπαγή µορφή. Στη συνέχεια, σχεδιάζουµε έναν αλγόριθµο που προσεγγίζει τη ϐέλτιστη πολιτική, υπολογίζει το προσβάσιµο σύνολο και είναι ϐελτιστοποιηµένος ως προς τη χρονική πολυπλοκότητα. Τέλος, δείχνουµε την αποτελεσµατικότητα του πλαισίου µας µέσω παραδειγµάτων προσοµοίωσης.
URI:	http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18797
Εμφανίζεται στις συλλογές:	Διπλωματικές Εργασίες - Theses

Αρχεία σε αυτό το τεκμήριο:

Αρχείο	Περιγραφή	Μέγεθος	Μορφότυπος
DiplomaThesisKostopoulos03117043.pdf		2.13 MB	Adobe PDF	Εμφάνιση/Άνοιγμα

Δείξε την πλήρη περιγραφή του τεκμηρίου

Όλα τα τεκμήρια του δικτυακού τόπου προστατεύονται από πνευματικά δικαιώματα.