Αξιολόγηση Εφαρμογών Πολλαπλών Πρακτόρων με Μεγάλα Γλωσσικά Μοντέλα

Παράνομος, Ιωάννης

National Technical University of Athens

School of Electrical and Computer Engineering

Artemis is Live!

Welcome to our digital repository! The aim of Artemis is the systematic archiving and dissemination of the scientific work produced in the School of Electrical and Computer Engineering, National Technical University of Athens, Greece, using the technology of digital libraries.

Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/19743

Title:	Αξιολόγηση Εφαρμογών Πολλαπλών Πρακτόρων με Μεγάλα Γλωσσικά Μοντέλα
Authors:	Παράνομος, Ιωάννης Μέντζας Γρηγόρης
Keywords:	Μεγάλα Γλωσσικά Μοντέλα, Τεχνητή Νοημοσύνη, Πολυπρακτορικά Συστήματα, Αξιολόγηση
Issue Date:	3-Jul-2025
Abstract:	Τα τελευταία χρόνια, η εξέλιξη των Μεγάλων Γλωσσικών Μοντέλων (Large Language Models: LLMs) οδήγησε στη δημιουργία σύνθετων Πολυπρακτορικών Συστημάτων (Multi Agent Systems: MAS), όπου πράκτορες με πυρήνα τα LLMs συνεργάζονται για την επίτευξη ενός κοινού στόχου. Τα συστήματα αυτά αξιοποιούν τα πλεονεκτήματα των LLMs, επεκτείνοντάς τα με δυνατότητες όπως η μνήμη, ο προγραμματισμός, η χρήση εργαλείων και η επικοινωνία με άλλους πράκτορες και τον πραγματικό κόσμο. Ωστόσο, η συνεχώς αυξανόμενη πολυπλοκότητα αυτών των συστημάτων καθιστά την κατασκευή και τη συστηματική τους αξιολόγηση ιδιαίτερα απαιτητική. Η παρούσα διπλωματική εργασία προτείνει και εφαρμόζει μια συστηματική μεθοδολογία αξιολόγησης τέτοιων πολυπρακτορικών εφαρμογών που στηρίζεται στην ανάλυσή τους σε τρία επίπεδα: μοντέλο, πράκτορας, σύστημα. Η προσέγγισή μας είναι επαναληπτική, αναδεικνύοντας τη σημασία της διασταυρωμένης αξιολόγησης μεταξύ των επιπέδων και οδηγώντας έτσι σε μια πιο ολιστική αποτίμηση του συστήματος. Για την ανάδειξη της πρακτικής της αξίας, η μεθοδολογία μας εφαρμόζεται στην κατασκευή και αξιολόγηση δύο παραδειγμάτων: ενός “Question Answering Assistant” και ενός “Reading Assistant”.
URI:	http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/19743
Appears in Collections:	Διπλωματικές Εργασίες - Theses

Files in This Item:

File	Description	Size	Format
Evaluation_In_Multi_Agent_Systems_Based_On_LLMs_Paranomos_Ioannis_Diploma_Thesis_Update_2.pdf		2.37 MB	Adobe PDF	View/Open

Show full item record