Please use this identifier to cite or link to this item:
http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18598
Title: | Τεχνικές κανονικοποίησης συνέπειας για την ηµιεπιβλεπόµενη σηµασιολογική κατάτµηση εικόνας |
Authors: | Σπύρου, Νικόλαος Κόλλιας Στέφανος |
Keywords: | σηµασιολογική κατάτµηση εικόνας ϐαθιά συνελικτικά δίκτυα δίκτυα κωδικοποιητή- αποκωδικοποιητή ηµιεπιβλεπόµενη µάθηση κανονικοποίηση συνέπειας διαταραχές εισόδου ψευδοετικέτα ισχυρή επαύξηση ασθενής επαύξηση ClassMix CutMix image semantic segmentation deep convolutional networks encoder-decoder architectures semi-supervised learning consistency regularization input perturbations pseudo-label strong augmentation weak augmentation |
Issue Date: | 12-Mar-2023 |
Abstract: | Η ευρεία ανάπτυξη των ϐαθιών συνελικτικών δικτύων και ειδικότερα των αρχιτεκτονικών κωδικοποιητή-αποκωδικοποιητή έχει οδηγήσει στην εκτεταµένη χρήση τους για την επίλυση του προβλήµατος της σηµασιολογικής κατάτµησης εικόνας. Παρόλα αυτά, προκειµένου να εκπαιδευτούν µοντέλα µε ικανοποιητική ικανότητα γενίκευσης για το συγκεκριµένο πρόβληµα απαιτούνται µεγάλου πλήθους σύνολα επισηµασµένων δεδοµένων. Στην περίπτωση της σηµασιολογικής κατάτµησης η επισήµανση δεδοµένων είναι µια αρκετά χρονοβόρα διαδικασία, καθώς σε κάθε εικονοστοιχείο πρέπει να ανατεθεί µία σηµασιολογική κλάση. Για αυτόν τον λόγο, ιδιαίτερη έµφαση δίνεται σε ανάπτυξη µεθόδων ηµιεπιβλεπόµενης µάθησης, όπου το δίκτυο εκπαιδεύεται πάνω σε λιγότερα επισηµασµένα και σε περισσότερα µη επισηµασµένα δεδοµένα, µε στόχο να µπορεί να παρουσιάζει εξίσου καλή ικανότητα γενίκευσης. Στην παρούσα διπλωµατική εξετάζεται η µέθοδος της κανονικοποίησης συνέπειας (consistency regularization) για την αξιοποίηση των µη επισηµασµένων δεδοµένων, σύµφωνα µε την οποία το δίκτυο καλείται να παράγει όµοιες προβλέψεις για διαταραγµένες (perturbed) εκδοχές της εικόνας εισόδου (διαταραχές εισόδου). Συγκεκριµένα, χρησιµοποιούµε το παϱάδειγµα εκπαίδευσης της ασθενούς-ισχυρής συνέπειας (weak-to-strong consistency), κατά το οποίο το δίκτυο δέχεται στην είσοδο µία ασθενώς διαταραγµένη εκδοχή (λιγότερο έντονη επαύξηση, ασθενής επαύξηση) και η πρόβλεψη του για αυτή χρησιµοποιείται ως ψευδοετικέτα για την επίβλεψη της αντίστοιχης εξόδου της ισχυρά διαταραγµένης εκδοχής (πιο έντονη επαύξηση, ισχυρή επαύξηση). Για τη δηµιουργία της ισχυρά επαυξηµένης εκδοχής µιας εικόνας, πειραµατιζόµαστε µε διάφορες µεθόδους επαύξησης, όπως µε µετασχηµατισµούς χρώµατος (color distortions, color augmentation), καθώς και µε τεχνικές µίξης ζευγών εικόνων, όπως οι ClassMix, CutMix, οι οποίες συνδυάζουν εικόνες µε σκοπό την παϱαγωγή νέων πιο πολύπλοκων τεχνητών εικόνων µε διευρυµένο σηµασιολογικό περιεχόµενο. Παράλληλα, πειραµατιζόµαστε και µε την περίπτωση όπου το δίκτυο τροφοδοτείται µε δύο ισχυρά επαυξηµένες εκδοχές που έχουν παραχθεί είτε µε την ίδια, είτε και µε διαφορετική µέθοδο επαύξησης. Αναφέρουµε και συγκρίνουµε τα πειραµατικά αποτελέσµατα στα σύνολα δεδοµένων Pascal VOC 2012, CelebAMask-HQ και QaTa-COV19-v2. |
URI: | http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18598 |
Appears in Collections: | Διπλωματικές Εργασίες - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Thesis_Nikos_Spyrou.pdf | 30.97 MB | Adobe PDF | View/Open |
Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.