Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/19096
Title: Σχεδιασμός ρομποτικής κίνησης βάσει ανάδρασης δύναμης σε διαδραστικές εργασίες χειρισμού με εφαρμογή μεθόδων ενισχυτικής μάθησης
Authors: Παπαδημητρίου, Ευθύμιος
Τζαφέστας Κωνσταντίνος
Keywords: Eπιδέξιος ρομποτικός χειρισμός
Ανάδραση δύναμης
Δυναμική εκρίζωσης και συγκομιδής μανιταριών
Ενισχυτική μάθηση αγνώστου μοντέλου
Προσαρμοστική εξερεύνηση και ρυθμός μάθησης
Αλγόριθμος μάθησης SARSA
Προσέγγιση συνάρτησης
Radial Basis Function
Προσομοίωση
Ρομποτικός βραχίονας Panda
Issue Date: 26-Apr-2024
Abstract: Η αυτοματοποιημένη ρομποτική συγκομιδή καρπών αποτελεί σημαντικό πεδίο εφαρμογής για επιδέξιους ρομποτικούς μηχανισμούς χειρισμού εύθραυστων και ευαίσθητων αντικειμένων. Ειδικά το αντικείμενο της συγκομιδής μανιταριών έχει ειδικές απαιτήσεις και η εφαρμογή επιδέξιων ρομποτικών συστημάτων για την αυτοματοποίηση κάποιων σταδίων της διαδικασίας έχει αποκτήσει σημαντικό ενδιαφέρον κατά τα τελευταία χρόνια. Η συγκομιδή συνδυάζει πολλούς διαφορετικούς τομείς όπως ο Επιδέξιος Χειρισμός και η Ενισχυτική Μάθηση, για την επίτευξη μιας σύνθετης διαδικασίας εκρίζωσης του μανιταριού, χωρίς ταυτόχρονα να του προκληθεί ζημιά. Σε αυτή τη Διπλωματική Εργασία υλοποιείται μια μέθοδος Ενισχυτικής Μάθησης Αγνώστου Μοντέλου, η Episodic Linear Semi-gradient SARSA, για το συνδυασμό των ενεργειών της στρέψης και κάμψης (γύρω από συγκεκριμένο άξονα), που αποτελούν θεμελιώδεις ανεξάρτητες κινήσεις για την συμβατική δράση εκρίζωσης και συγκομιδής, αποφεύγοντας την επιβολή μεγάλων ροπών στο μανιτάρι μέσω κινήσεων που αντιτίθενται στη δυναμική του. Οι ροπές θα γίνονται αντιληπτές μέσω ανάδρασης δύναμης. Η συγκεκριμένη δράση επενέργησης σε δύο βαθμούς ελευθερίας ανάγεται αρχικά στην εκπαίδευση ενός κυκλικού πράκτορα να δραπετεύει από έναν διδιάστατο διάδρομο, ο οποίος ορίζεται από τοίχους. Η διείσδυση προκαλεί δυνάμεις επαναφοράς. Ο διάδρομος αντιπροσωπεύει τη δυναμική εκρίζωσης του μανιταριού, και οι δύο διαστάσεις τους δύο βαθμούς ελευθερίας στο πραγματικό πρόβλημα. Στη συνέχεια, ακολουθεί εφαρμογή της μεθόδου σε πραγματική διάταξη ενός αντικειμένου που προσομοιάζει ένα μανιτάρι, με εκπαίδευση του ρομποτικού βραχίονα Panda.
URI: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/19096
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
Diploma_Thesis_Papadimitriou_Efthymios.pdf11.59 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.