Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/13525
Title: Fpga-acceleration Of Machine Learning In Cloud Computing, A Case Study Using Logistic Regression
Authors: Ηλίας Κορομηλάς
Σούντρης Δημήτριος
Keywords: μηχανική μάθηση
ετερογενής συστάδα
σύνθεση υψηλού-επιπέδου
λογιστική παλινδρόμηση
machine learning
heterogeneous cluster
apache spark
zynq apsoc
high-level synthesis
logistic regression
Issue Date: 27-Jul-2017
Abstract: Η Μηχανική Μάθηση έχει φέρει επανάσταση στους τρόπους με τους οποίους αλληλεπιδρούμε με τα μεγάλης κλίμακας, ατελή δεδομένα του πραγματικού κόσμου και χρησιμοποιείται όλο και πιο εκτεταμένα σε ένα ευρύ φάσμα εφαρμογών, και σε ένα ευρύ φάσμα συστημάτων (από ενσωματωμένα συστήματα μέχρι κέντρα δεδομένων). Ωστόσο, αποδεικνύεται ότι τα παραδοσιακά υπολογιστικά συστήματα δεν ταιριάζουν στις απίστευτα υψηλές υπολογιστικές απαιτήσεις των σύγχρονων προσεγγίσεων Μηχανικής Μάθησης. Καθώς οι αρχιτεκτονικές ηλεκτρονικών υπολογιστών εξελίσσονται σε ετερογενείς πολυπύρηνες που αποτελούνται από ένα μίγμα από πυρήνες και επιταχυντές υλικού, ο σχεδιασμός επιταχυντών υλικού για τεχνικές Μηχανικής Μάθησης μπορεί ταυτόχρονα να επιτύχει υψηλή απόδοση αλλά και ευρύ πεδίο εφαρμογής.Στο υπολογιστικό νέφος, ένα από τα πιο ευρέως χρησιμοποιούμενα πλαίσια για εφαρμογές ανάλυσης δεδομένων, όπως αυτές της Μηχανικής Μάθησης, είναι το Apache Spark. Στο πλαίσιο αυτής της μελέτης αξιολογούμε ένα νέο σχήμα, το SPynq: Ένα πλαίσιο για την αποτελεσματική δρομολόγηση και επιτάχυνση εφαρμογών του Spark σε ετερογενείς πλατφόρμες που βασίζονται σε επαναπρογραμματιζόμενα συστήματα σε ψηφίδα, όπως το Zynq. Για αυτή την αξιολόγηση, χρησιμοποιούμε τη Λογιστική Παλινδρόμηση, η οποία είναι μια ευρέως χρησιμοποιούμενη τεχνική Μηχανικής Μάθησης για ταξινόμηση. Σε αυτή την εργασία εστιάζουμε κυρίως στη χρήση των δυνατοτήτων Σύνθεσης Υψηλού-Επιπέδου για την παραγωγή ενός αποδοτικού επιταχυντή υλικού για τη Λογιστική Παλινδρόμηση, καθώς και στην ανάπτυξη των απαιτούμενων βιβλιοθηκών στο Spark που επιτρέπουν την απρόσκοπτη χρήση της επαναπρογραμματιζόμενης λογικής.Η μελέτη περίπτωσής μας είναι ένα πρόβλημα αναγνώρισης χειρόγραφων ψηφίων χρησιμοποιώντας τη γνωστή βάση δεδομένων MNIST. Έχει υλοποιηθεί μια συστάδα τεσσάρων worker κόμβων με βάση το Zynq All-Programmable SoC, στην πλακέτα PYNQ-Z1, και συγκρίνεται με έναν επεξεργαστή Xeon υψηλής απόδοσης που συχνά χρησιμοποιείται στο υπολογιστικό νέφος. Η αξιολόγηση της απόδοσης δείχνει ότι η ετερογενής συστάδα μπορεί να επιτύχει έως και 2 φορές επιτάχυνση συστήματος σε σύγκριση με ένα σύστημα Xeon και 18 φορές καλύτερη ενεργειακή απόδοση. Για εφαρμογές σε ενσωματωμένα συστήματα, το προτεινόμενο σύστημα μπορεί να επιτύχει μέχρι και 36 φορές επιτάχυνση σε σύγκριση με τους ενσωματωμένους επεξεργαστές χαμηλής ισχύος και 29 φορές χαμηλότερη κατανάλωση ενέργειας.
URI: http://artemis-new.cslab.ece.ntua.gr:8080/jspui/handle/123456789/13525
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File SizeFormat 
DT2017-0183.pdf2.36 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.