Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/13142
Title: Dataflow Acceleration With Maxeler Technologies For Machine Learning Applications
Authors: Δούκας Μιχαήλ-χρήστος
Σούντρης Δημήτριος
Keywords: machine learning
dataflow computing
maxeler
dfe acceleration
scikit-learn acceleration
Issue Date: 2-Jul-2016
Abstract: Στις μέρες μας οι επιχειρήσεις και οι οργανώσεις συλλέγουν δεδομένα από πλήθος πηγών, όπως επιχειρησιακές δοσοληψίες, μέσα κοινωνικής δικτύωσης και αισθητήρες. Ο όρος Big data περιγράφει αυτόν τον μεγάλο όγκο δεδομένων, τα οποία μπορούν να αναλυθούν ώστε να παρθούν έξυπνες αποφάσεις βασιζόμενες σε μοτίβα των δεδομένων. Η ανάλυση των Big data βοηθά τις επιχειρήσεις και τους οργανισμούς να εμεταλλευτούν τα δεδομένα τους και να τα χρησιμοποιήσουν ώστε να εντοπίσουν αποδοτικότερες επιχειρησιακές κινήνεις, αποτελεσματικότερες δράσεις, καλύτερες υπηρεσίες και να αποκομίσουν μεγαλύτερα κέρδη.Ο μεγάλος αυτός όγκος δεδομένων που παράγεται συνεχώς έχει πυροδοτήσει την ευρεία χρήση της μηχανικής μάθησης (machine learning), η οποία είναι μια μέθοδος ανάλυσης δεδομένων. Οι διεργασίες μηχανικής μάθησης είναι πολύ απαιτητικές από άποψη υπολογιστικής ισχύος. Η αποθήκευση και η επεξεργασία μεγάλου όγκου δεδομένων σε ένα λογικό χρονικό διάστημα είναι πολύ σημαντικές, και το γεγονός αυτό πιέζει τους προγραμματιστές και τους αρχιτέκτονες υπολογιστών να αναπτύξουν αποδοτικότερα υπολογιστικά συστήματα που ναανταποκρίνονται στις απαιτήσεις υψηλής απόδοσης. Πολλές λύσεις έχουν προταθεί, συμπεριλαμαμβανομένων και τών επιταχυντών GPU, παρ’ολα αυτά ο παράγοντας της χαμηλήςκατανάλωσης ισχύος δεν έχει ληφθεί υπόψιν.Μια πιθανή λύση θα μπορούσε να είναι το υπολογιστικό μοντέλο ροής δεδομένων (dataflow computing), ένας εντελώς διαφορετικός τρόπος επεξεργασίας δεδομένων. Η εταιρία Maxeler Technologies χρησιμοποιεί ολοκληρωμένα κυκλώματα FPGAs για να υλοποίησει το υπολογιστικό μοντέλο ροής δεδομένων και παρέχει τάξεις μεγέθους βελτίωση στην απόδοση και την κατανάλωση ισχύος. Σκοπός της εργασίας αυτής είναι η χρήση του υπολογιστικού μοντέλου ροής δεδομένων της Maxeler Technologies, για την επιτάχυνση επιλεγμένων προγραμμάτων μηχανικής μάθησης της Python βιβλιοθήκης scikit-learn, με στόχο την επίτευξη υψηλότερης απόδοσης και χαμηλότερης κατανάλωσης ισχύος.Αρχικά, εκτελούμε μια ανάλυση του χρόνου εκτέλεσης διάφορων αλγορίθμων μηχανικής μάθησης, ώστε να εντοπίσουμε τους υπολογιστικά απαιτητικότερους. Στη συνέχεια, παρουσιάζουμε το μαθηματικό μοντέλο και τους αλγορίθμους των Gaussian process regression, Gaussian process classification και Kernel ridge regression, τα οποία προγμάμματα επιλέχθηκαν να επιταχυνθούν. Ύστερα, αναλύουμε τα προγμάμματα αυτά και εντοπίζουμε ποιές συναρτήσεις των Python βιβλιοθηκών numpy και scipy μπορούν να υλοποιηθούν στο υπολογιστικό μοντέλο ροής δεδομένων της Maxeler. Τέλος περιγράφουμε τις υλοποιήσεις στο μοντέλο ροής δεδομένων και παρουσιάζουμε τα αποτελέσματα του χρόνου εκτέσης των προγμαμμάτων.
URI: http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/13142
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File SizeFormat 
DT2016-0122.pdf636.41 kBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.