Please use this identifier to cite or link to this item:
http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/19743
Title: | Αξιολόγηση Εφαρμογών Πολλαπλών Πρακτόρων με Μεγάλα Γλωσσικά Μοντέλα |
Authors: | Παράνομος, Ιωάννης Μέντζας Γρηγόρης |
Keywords: | Μεγάλα Γλωσσικά Μοντέλα, Τεχνητή Νοημοσύνη, Πολυπρακτορικά Συστήματα, Αξιολόγηση |
Issue Date: | 3-Jul-2025 |
Abstract: | Τα τελευταία χρόνια, η εξέλιξη των Μεγάλων Γλωσσικών Μοντέλων (Large Language Models: LLMs) οδήγησε στη δημιουργία σύνθετων Πολυπρακτορικών Συστημάτων (Multi Agent Systems: MAS), όπου πράκτορες με πυρήνα τα LLMs συνεργάζονται για την επίτευξη ενός κοινού στόχου. Τα συστήματα αυτά αξιοποιούν τα πλεονεκτήματα των LLMs, επεκτείνοντάς τα με δυνατότητες όπως η μνήμη, ο προγραμματισμός, η χρήση εργαλείων και η επικοινωνία με άλλους πράκτορες και τον πραγματικό κόσμο. Ωστόσο, η συνεχώς αυξανόμενη πολυπλοκότητα αυτών των συστημάτων καθιστά την κατασκευή και τη συστηματική τους αξιολόγηση ιδιαίτερα απαιτητική. Η παρούσα διπλωματική εργασία προτείνει και εφαρμόζει μια συστηματική μεθοδολογία αξιολόγησης τέτοιων πολυπρακτορικών εφαρμογών που στηρίζεται στην ανάλυσή τους σε τρία επίπεδα: μοντέλο, πράκτορας, σύστημα. Η προσέγγισή μας είναι επαναληπτική, αναδεικνύοντας τη σημασία της διασταυρωμένης αξιολόγησης μεταξύ των επιπέδων και οδηγώντας έτσι σε μια πιο ολιστική αποτίμηση του συστήματος. Για την ανάδειξη της πρακτικής της αξίας, η μεθοδολογία μας εφαρμόζεται στην κατασκευή και αξιολόγηση δύο παραδειγμάτων: ενός “Question Answering Assistant” και ενός “Reading Assistant”. |
URI: | http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/19743 |
Appears in Collections: | Διπλωματικές Εργασίες - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Evaluation_In_Multi_Agent_Systems_Based_On_LLMs_Paranomos_Ioannis_Diploma_Thesis_Update_2.pdf | 2.37 MB | Adobe PDF | View/Open |
Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.