Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17595
Full metadata record
DC FieldValueLanguage
dc.contributor.authorΚεφάλας, Γεώργιος-
dc.date.accessioned2020-07-07T09:07:37Z-
dc.date.available2020-07-07T09:07:37Z-
dc.date.issued2020-03-10-
dc.identifier.urihttp://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17595-
dc.description.abstractΗ σύγχρονη τάση στον τομέα της μηχανικής μάθησης και της εξόρυξης δεδομένων οδηγεί στην ανάγκη για καλύτερες επιδόσεις στα προβλήματα αναλυτικής επεξεργασίας άμεσης επικοινωνίας (OLAP scenarios). Οι συμβατικές βάσεις δεδομένων αποθήκευσης κατά γραμμή και κατά στήλη, καθώς και οι βάσεις γράφων, δεν μπορούν να ανταποκριθούν ικανοποιητικά στις απαιτήσεις των προβλημάτων αυτών. Στην εργασία αυτή μελετάμε τη δομή και τη λειτουργία της GQ-Fast μιας βάσης δεδομένων βασισμένης σε δείκτες. Η GQ-Fast φτιάχτηκε για να ανταποκρίνεται σε μια κατηγορία ερωτημάτων που ονομάζουμε “ερωτήματα συσχετίσεων”, τα οποία ασχολούνται με την ανάλυση γράφων σε μοτίβα δεντρικών δομών καθώς και στον έλεγχο της προσβασιμότητας μεταξύ διαφόρων κόμβων. Συγκεντρώνει τα πλεονεκτήματα της οργάνωσης κατά στήλη (column organizing), της δεικτοδότησης και της συμπίεσης δεδομένων, ενώ κατασκευάζει με έξυπνο τρόπο πίνακες γειτνίασης για να μοντελοποιήσει τα δεδομένα που της δίνονται. Το ιδιαίτερο χαρακτηριστικό της είναι η εξαγωγή πηγαίου κώδικα σε C++ για κάθε ένα από τα ερωτήματα που επιλύει. Tα ερωτήματα αυτά είναι πολύ σημαντικά για την επίλυση προβλημάτων αναλυτικής επεξεργασίας άμεσης επικοινωνίας (OLAP scenarios). Στόχος μας είναι να περιγράψουμε τις λειτουργικές επεκτάσεις που προσθέσαμε στη GQ-Fast, καθώς και τις εφαρμογές που αυτές έχουν στην εξόρυξη δεδομένων στη Βιοϊατρική βιβλιογραφία. Για το σκοπό αυτό χρησιμοποιούμε τη βάση δεδομένων του εκδοτικού οίκου PubMed, επεξεργάζοντας τα δεδομένα της και εφαρμόζοντας σε αυτά μια ομάδα από ερωτήματα SQL τα οποία επιστρέφουν χρήσιμη ερευνητική πληροφορία με τρόπο σαφώς πιο αποδοτικό από τις συμβατικές μεθόδους που έχουμε για να την ανακαλύψουμε. Παραθέτουμε αναλυτικά πειραματικά δεδομένα εστιασμένα σε αλληλεπιδραστικά ερωτήματα που απαιτούν ταχύτατη απόκριση αναφορικά με τις επιδόσεις της GQ-Fast έναντι της βάσης PostgreSQL, όταν όλες οι βάσεις είναι φορτωμένες στη \en RAM \gr του δοκιμαστικού συστήματος. Επιδεικνύουμε τις παραπάνω επεκτάσεις μέσω ενός γραφικού περιβάλλοντος χρήστη (User Interface) που σχεδιάσαμε και υλοποιήσαμε για τον φυλλομετρητή ιστού. Στο περιβάλλον αυτό, εφαρμόζονται άμεσα οι δυνατότητες της GQ-Fast για την ταχύτατη ανάκτηση πληροφοριών σχετικά με την Βιοϊατρική βιβλιογραφία καθώς και η αποτελεσματική απεικόνισή τους.en_US
dc.languageelen_US
dc.subjectSQLen_US
dc.subjectRelationship Queriesen_US
dc.subjectPubMeden_US
dc.subjectOLAPen_US
dc.subjectGQ-Fasten_US
dc.subjectKnowledge Discoveryen_US
dc.subjectGraph Explorationen_US
dc.subjectBiomedical Literatureen_US
dc.titleΒελτιστοποίηση Ερωτημάτων Συσχετίσεων με Εφαρμογές στη Βιοϊατρική Βιβλιογραφίαen_US
dc.description.pages85en_US
dc.contributor.supervisorΚοζύρης Νεκτάριοςen_US
dc.departmentΤομέας Τεχνολογίας Πληροφορικής και Υπολογιστώνen_US
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
thesis_kefalas.pdfthesis_kefalas2.8 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.