Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/19932
Title: Μελέτη των Κατανομών Δεδομένων κατα την Εκπαίδευση Γλωσσικών Μοντέλων σε Ομοσπονδιακό Περιβάλλον Εκπαίδευσης
Authors: Τσακουμάγκου, Γραμματική
Κοζύρης Νεκτάριος
Keywords: Feredated machine learning
Large Language Models
Fine-tuning
Ομοσπονδιακή Μάθηση
Μεγάλα Γλωσσικά Μοντέλα
LoRA
TinyLlama
Issue Date: 30-Oct-2025
Abstract: Η παρούσα εργασία εξετάζει την επίδραση διαφορετικών στρατηγικών κατανοµής δεδοµένων στην απόδοση ενός οµοσπονδιακά εκπαιδευµένου γλωσσικού µοντέλου. Η µελέτη εστιάζει στις προκλήσεις που προκύπτουν από την ανοµοιογένεια,τις ποσοτικές διαφορές και τις επικαλύψεις των δεδοµένων µεταξύ των πελατών, ένα φαινόµενο που επηρεάζει την αποτελεσµατικότητα και τη γενίκευση των συστηµάτων οµοσπονδιακής µάθησης. Για την υλοποίηση των πειραµάτων χρησιµοποιήθηκε το µοντέλο TinyLlama, το οποίο προσαρµόστηκε µε τη µέθοδο LoRA fine-tuning, ενώ η διαδικασία εκπαίδευσης υλοποιήθηκε µέσω του πλαισίου Flower. ∆οκιµάστηκαν πολλαπλά σενάρια κατανοµής δεδοµένων, συµπεριλαµβανοµένων των Natural, Dirichlet, IID και Shard partitioning, καθώς και τϱεις επεκτάσεις µε τροποποιηµένα σύνολα δεδοµένων (Double STEM ,Partially Double General Knowledge,Redacted General Knowledge). Η αξιολόγηση πραγµατοποιήθηκε µε βάση την ακρίβεια του τελικού µοντέλου σε θεµατικές κατηγορίες του συνόλου MMLU (STEM, Humanities, Social Sciences).
URI: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/19932
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
Tsakoumagkou_thesis_final.pdf7.12 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.