Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/19932
Τίτλος: Μελέτη των Κατανομών Δεδομένων κατα την Εκπαίδευση Γλωσσικών Μοντέλων σε Ομοσπονδιακό Περιβάλλον Εκπαίδευσης
Συγγραφείς: Τσακουμάγκου, Γραμματική
Κοζύρης Νεκτάριος
Λέξεις κλειδιά: Feredated machine learning
Large Language Models
Fine-tuning
Ομοσπονδιακή Μάθηση
Μεγάλα Γλωσσικά Μοντέλα
LoRA
TinyLlama
Ημερομηνία έκδοσης: 30-Οκτ-2025
Περίληψη: Η παρούσα εργασία εξετάζει την επίδραση διαφορετικών στρατηγικών κατανοµής δεδοµένων στην απόδοση ενός οµοσπονδιακά εκπαιδευµένου γλωσσικού µοντέλου. Η µελέτη εστιάζει στις προκλήσεις που προκύπτουν από την ανοµοιογένεια,τις ποσοτικές διαφορές και τις επικαλύψεις των δεδοµένων µεταξύ των πελατών, ένα φαινόµενο που επηρεάζει την αποτελεσµατικότητα και τη γενίκευση των συστηµάτων οµοσπονδιακής µάθησης. Για την υλοποίηση των πειραµάτων χρησιµοποιήθηκε το µοντέλο TinyLlama, το οποίο προσαρµόστηκε µε τη µέθοδο LoRA fine-tuning, ενώ η διαδικασία εκπαίδευσης υλοποιήθηκε µέσω του πλαισίου Flower. ∆οκιµάστηκαν πολλαπλά σενάρια κατανοµής δεδοµένων, συµπεριλαµβανοµένων των Natural, Dirichlet, IID και Shard partitioning, καθώς και τϱεις επεκτάσεις µε τροποποιηµένα σύνολα δεδοµένων (Double STEM ,Partially Double General Knowledge,Redacted General Knowledge). Η αξιολόγηση πραγµατοποιήθηκε µε βάση την ακρίβεια του τελικού µοντέλου σε θεµατικές κατηγορίες του συνόλου MMLU (STEM, Humanities, Social Sciences).
URI: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/19932
Εμφανίζεται στις συλλογές:Διπλωματικές Εργασίες - Theses

Αρχεία σε αυτό το τεκμήριο:
File Description SizeFormat 
Tsakoumagkou_thesis_final.pdf7.12 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.