DESIGN AND EVALUATION OF CNNs ON FPGA BY EXPLORING AND COMBINING APPROXIMATION TECHNIQUES

Χατζητσομπάνης, Γεώργιος

National Technical University of Athens

School of Electrical and Computer Engineering

Artemis is Live!

Welcome to our digital repository! The aim of Artemis is the systematic archiving and dissemination of the scientific work produced in the School of Electrical and Computer Engineering, National Technical University of Athens, Greece, using the technology of digital libraries.

Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17652

Title:	DESIGN AND EVALUATION OF CNNs ON FPGA BY EXPLORING AND COMBINING APPROXIMATION TECHNIQUES
Authors:	Χατζητσομπάνης, Γεώργιος Σούντρης Δημήτριος
Keywords:	FPGA Design VHDL Design Machine Learning Approximate Computing Approxinmate Multipliers FPGA Accelerator Block Floating Point Prototype Design
Issue Date:	17-Jul-2020
Abstract:	Η παγκόσμια απαίτηση για γρηγορότερες εφαρμογές με χαμηλότερη κατανάλωση ισχύος έχει φέρει στην επιφάνεια αρκετούς επιταγχυντές Συνελικτικών Νευρωνικών Δικτύων (CNNs) σε εξειδικευμένες μονάδες επεργασίας όπως είναι όπως είναι οι κάρτες γραφικών (GPUs), τα FPGAs (Field Programmable Gate Arrays) και οι TPUs (Tensor Processing Units). Η κύρια πρόκληση είναι να αναπτύξουμε γενικούς κινητήρες επτιτάχυνσης οι οποίοι βελτιώνουν την απόδοση οποιουδήποτε δωσμένου συνελικτικού δικτύου. Στην παρούσα διπλωματική η διαδικασία της συνέλιξης η οποία είναι η πιο απαιτητική σε πόρους σε κάθε συνελικτικό δίκτυο σχεδιάστηκε με γλώσσα περιγραφής υλικού (VHDL) κάνοντας μια σε βάθος ανάλυση και εξε- ρεύνηση της αρχιτεκτονικής για να βρούμε τις καλύτερες δυνατές λύσεις. Πιο συγκεκριμένα, σχεδιάσαμε έναν κλασσικό κινητήρα συνέλιξης που εκτελεί την κλασσική μαθηματική διαδι- κασία της συνέλιξης και έναν κινητήρα συνέλιξης ο οποίος βασίζεται στην προσέγγιση του αλγορίθμου Winograd και συγκρίναμε τις βελτιώσεις σε πόρους και απόδοση μεταξύ τους. Ως επόμενο βήμα, αναπτύξαμε προσεγγιστικούς πολλαπλασιαστές με υβριδική κωδικοποίη- ση στα μερικά γινόμενα για διάφορα μεγέθη δεδομένων, μια τεχνική Block Floating Point (BFP) και διάφορες τεχνικές απλής αποκοπής των χαμηλότερων σημασίας bit ενός αριθμού. Συνδυασμοί αυτών των προσεγγιστικών τεχνικών εξερευνήθηκαν και στις δύο προσεγγίσεις κινητήρων και εξετάστηκαν τα διάφορα πλεονεκηματα τους σε σχέση με τον ρυθμό λειτουργίας, την κατανάλωση, την ακρίβεια κατηγοριοποίησης και τα μέγιστα δυνατά πλεονεκτήματα της κάθε αρχιτεκτονικής. Η επαλήθευση πραγματοποιήθηκε με την χρήση τριών διαφορεκτικών συνελικτικών δικτύων : CIFAR-10, MNIST και ένα δίκτυο για την αναγνώριση πλοίων από εικόνες δορυφόρων Ship Detection. Η επαλήθευση της ακρίβειας έγινε με την βοήθεια ενός μοντέλου λογισμικού σε C/C++ το οποίο εκτελούσε τις πράξεις σε επίπεδο bit. Τα τελικά αποτελέσματα μας δείχνουν οτι η ακρίβεια κατιγοριοποίησης μειώνεται κατά μόνο 0.1%-0.4% ανεξαιρέτου του μεγέθους της εικόνας εισόδου και του αριθμού των κλάσεων. Χρησιμοπιόντας την προσέγγιση BFP , καταφέραμε να τετραπλασιάσουμε την απόδοση των συνελικτικών δι- κτύων με floating point δεδομένα και να την διπλασιάσουμε σε αυτά με fixed-point δεδομένα στο Zynq-7020. Η προτεινόμενη μίξη κινητήρων μειώνει τις απαιτήσεις σε πόρους από 7% εώς 41% και βελτιώνει την απόδοση κάθε δωσμένου δικτύου χωρίς να χρειάζεται επανεκπαίδευση ή αλλαγή στη δομή του σε σύγκριση με άλλες μεθόδους συμπίεσης. Τέλος τα αποτελέσματα από τις τελικές αρχιτεκτονικές συγκρίθηκαν με την κάρτα γραφικών Jetson Nano (204 FPS 1 σε σύγκριση με 720 FPS) και επιτεύχθηκε δέκα φορές καλύτερη απόδοση/Watt.
URI:	http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17652
Appears in Collections:	Διπλωματικές Εργασίες - Theses

Files in This Item:

File	Description	Size	Format
FinalThesisGeorgeChatzitsompanis.pdf		4.58 MB	Adobe PDF	View/Open

Show full item record