Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18931
Full metadata record
DC FieldValueLanguage
dc.contributor.authorΧατζηγιαννάκης, Παναγιώτης-
dc.date.accessioned2023-11-21T13:52:45Z-
dc.date.available2023-11-21T13:52:45Z-
dc.date.issued2023-11-16-
dc.identifier.urihttp://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/18931-
dc.description.abstractΗ Επεξεργασία Φυσικής Γλώσσας είναι μία περιοχή της Τεχνητής Νοημοσύνης που προσελκύει όλο και περισσότερο επιστημονικό ενδιαφέρον και σταδιακά γίνεται μέρος της καθημερινής ζωής του ανθρώπου. Από τα πιο θεμελιώδη προβλήματα που αντιμετωπίζει είναι το πρόβλημα της κατηγοριοποίησης κειμένου, δηλαδή της κατάταξης εγγράφων κειμένου σε προκαθορισμένες ομάδες. Η υποπεριοχή του προβλήματος που μας απασχολεί στην εργασία αυτή είναι η κατηγοριοποίηση νομικών κειμένων. Από την πλευρά των δικηγόρων, η κατηγοριοποίηση νομικών κειμένων μπορεί να βοηθήσει στην γρήγορη αναγνώριση σχετικών νομικών προηγουμένων και καταστατικών, γλιτώνοντας έτσι πολύτιμο χρόνο στην νομική έρευνα. Από την πλευρά των πολιτών, καθιστά ευκολότερη την πρόσβαση σε νομικές πληροφορίες, δίνοντάς τους έτσι την δυνατότητα και το κίνητρο να κατανοήσουν τα δικαιώματά τους και τις υποχρεώσεις τους. Το ακριβές αντικείμενο της διπλωματικής είναι η σύγκριση αλγορίθμων μηχανικής μάθησης στο πλαίσιο της Κατηγοριοποίησης Πολλαπλών Ετικετών Ελληνικών νομικών κειμένων. Στο πρόβλημα της Κατηγοριοποίησης κειμένου Πολλαπλών Ετικετών είσοδος είναι ένα κείμενο και έξοδος πολλαπλές, μη αμοιβαία αποκλειόμενες ετικέτες - κατηγορίες. Εκτελούμε ένα πείραμα σε κείμενα Ελληνικής νομοθεσίας όπου οι ετικέτες προέρχονται από τον θησαυρό Eurovoc και ένα πείραμα σε κείμενα νομολογίας όπου οι ετικέτες προέρχονται από τον Άρειο Πάγο. Οι αλγόριθμοι ταξινόμησης τους οποίους υλοποιούμε εκτείνονται από παραδοσιακή μηχανική μάθηση (Naïve Bayes, K-Nearest Neighbor, Decision Tree, Random Forest, Bagging) μέχρι και μοντέλα που βασίζονται στους μετασχηματιστές (BERT – Bidirectional Encoder Representations from Transformers). Ύστερα από την εκτέλεση των πειραμάτων, αξιολογούμε τις επιδόσεις των αλγορίθμων με βάση μετρικών. Το συμπέρασμα στο οποίο καταλήγουμε είναι ότι στην κατηγοριοποίηση νομοθεσίας την καλύτερη επίδοση έχουν οι αλγόριθμοι Naïve Bayes και BERT, ενώ στην κατηγοριοποίηση νομολογίας την καλύτερη επίδοση έχουν οι αλγόριθμοι BERT και K-Nearest Neighbor.en_US
dc.languageelen_US
dc.subjectΝομικά Κείμεναen_US
dc.subjectΚατηγοριοποίηση πολλαπλών ετικετώνen_US
dc.subjectμηχανική μάθησηen_US
dc.subjectμετασχηματιστέςen_US
dc.titleΑξιολόγηση Μηχανισμών Αυτόματης Κατηγοριοποίησης Ελληνικών Νομικών Κειμένωνen_US
dc.description.pages68en_US
dc.contributor.supervisorΤσανάκας Παναγιώτηςen_US
dc.departmentΤομέας Τεχνολογίας Πληροφορικής και Υπολογιστώνen_US
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
Διπλωματική-Παναγιώτης_Χατζηγιαννάκης.pdf2.17 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.