Please use this identifier to cite or link to this item:
http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/19096
Title: | Σχεδιασμός ρομποτικής κίνησης βάσει ανάδρασης δύναμης σε διαδραστικές εργασίες χειρισμού με εφαρμογή μεθόδων ενισχυτικής μάθησης |
Authors: | Παπαδημητρίου, Ευθύμιος Τζαφέστας Κωνσταντίνος |
Keywords: | Eπιδέξιος ρομποτικός χειρισμός Ανάδραση δύναμης Δυναμική εκρίζωσης και συγκομιδής μανιταριών Ενισχυτική μάθηση αγνώστου μοντέλου Προσαρμοστική εξερεύνηση και ρυθμός μάθησης Αλγόριθμος μάθησης SARSA Προσέγγιση συνάρτησης Radial Basis Function Προσομοίωση Ρομποτικός βραχίονας Panda |
Issue Date: | 26-Apr-2024 |
Abstract: | Η αυτοματοποιημένη ρομποτική συγκομιδή καρπών αποτελεί σημαντικό πεδίο εφαρμογής για επιδέξιους ρομποτικούς μηχανισμούς χειρισμού εύθραυστων και ευαίσθητων αντικειμένων. Ειδικά το αντικείμενο της συγκομιδής μανιταριών έχει ειδικές απαιτήσεις και η εφαρμογή επιδέξιων ρομποτικών συστημάτων για την αυτοματοποίηση κάποιων σταδίων της διαδικασίας έχει αποκτήσει σημαντικό ενδιαφέρον κατά τα τελευταία χρόνια. Η συγκομιδή συνδυάζει πολλούς διαφορετικούς τομείς όπως ο Επιδέξιος Χειρισμός και η Ενισχυτική Μάθηση, για την επίτευξη μιας σύνθετης διαδικασίας εκρίζωσης του μανιταριού, χωρίς ταυτόχρονα να του προκληθεί ζημιά. Σε αυτή τη Διπλωματική Εργασία υλοποιείται μια μέθοδος Ενισχυτικής Μάθησης Αγνώστου Μοντέλου, η Episodic Linear Semi-gradient SARSA, για το συνδυασμό των ενεργειών της στρέψης και κάμψης (γύρω από συγκεκριμένο άξονα), που αποτελούν θεμελιώδεις ανεξάρτητες κινήσεις για την συμβατική δράση εκρίζωσης και συγκομιδής, αποφεύγοντας την επιβολή μεγάλων ροπών στο μανιτάρι μέσω κινήσεων που αντιτίθενται στη δυναμική του. Οι ροπές θα γίνονται αντιληπτές μέσω ανάδρασης δύναμης. Η συγκεκριμένη δράση επενέργησης σε δύο βαθμούς ελευθερίας ανάγεται αρχικά στην εκπαίδευση ενός κυκλικού πράκτορα να δραπετεύει από έναν διδιάστατο διάδρομο, ο οποίος ορίζεται από τοίχους. Η διείσδυση προκαλεί δυνάμεις επαναφοράς. Ο διάδρομος αντιπροσωπεύει τη δυναμική εκρίζωσης του μανιταριού, και οι δύο διαστάσεις τους δύο βαθμούς ελευθερίας στο πραγματικό πρόβλημα. Στη συνέχεια, ακολουθεί εφαρμογή της μεθόδου σε πραγματική διάταξη ενός αντικειμένου που προσομοιάζει ένα μανιτάρι, με εκπαίδευση του ρομποτικού βραχίονα Panda. |
URI: | http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/19096 |
Appears in Collections: | Διπλωματικές Εργασίες - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Diploma_Thesis_Papadimitriou_Efthymios.pdf | 11.59 MB | Adobe PDF | View/Open |
Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.