Please use this identifier to cite or link to this item: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17595
Title: Βελτιστοποίηση Ερωτημάτων Συσχετίσεων με Εφαρμογές στη Βιοϊατρική Βιβλιογραφία
Authors: Κεφάλας, Γεώργιος
Κοζύρης Νεκτάριος
Keywords: SQL
Relationship Queries
PubMed
OLAP
GQ-Fast
Knowledge Discovery
Graph Exploration
Biomedical Literature
Issue Date: 10-Mar-2020
Abstract: Η σύγχρονη τάση στον τομέα της μηχανικής μάθησης και της εξόρυξης δεδομένων οδηγεί στην ανάγκη για καλύτερες επιδόσεις στα προβλήματα αναλυτικής επεξεργασίας άμεσης επικοινωνίας (OLAP scenarios). Οι συμβατικές βάσεις δεδομένων αποθήκευσης κατά γραμμή και κατά στήλη, καθώς και οι βάσεις γράφων, δεν μπορούν να ανταποκριθούν ικανοποιητικά στις απαιτήσεις των προβλημάτων αυτών. Στην εργασία αυτή μελετάμε τη δομή και τη λειτουργία της GQ-Fast μιας βάσης δεδομένων βασισμένης σε δείκτες. Η GQ-Fast φτιάχτηκε για να ανταποκρίνεται σε μια κατηγορία ερωτημάτων που ονομάζουμε “ερωτήματα συσχετίσεων”, τα οποία ασχολούνται με την ανάλυση γράφων σε μοτίβα δεντρικών δομών καθώς και στον έλεγχο της προσβασιμότητας μεταξύ διαφόρων κόμβων. Συγκεντρώνει τα πλεονεκτήματα της οργάνωσης κατά στήλη (column organizing), της δεικτοδότησης και της συμπίεσης δεδομένων, ενώ κατασκευάζει με έξυπνο τρόπο πίνακες γειτνίασης για να μοντελοποιήσει τα δεδομένα που της δίνονται. Το ιδιαίτερο χαρακτηριστικό της είναι η εξαγωγή πηγαίου κώδικα σε C++ για κάθε ένα από τα ερωτήματα που επιλύει. Tα ερωτήματα αυτά είναι πολύ σημαντικά για την επίλυση προβλημάτων αναλυτικής επεξεργασίας άμεσης επικοινωνίας (OLAP scenarios). Στόχος μας είναι να περιγράψουμε τις λειτουργικές επεκτάσεις που προσθέσαμε στη GQ-Fast, καθώς και τις εφαρμογές που αυτές έχουν στην εξόρυξη δεδομένων στη Βιοϊατρική βιβλιογραφία. Για το σκοπό αυτό χρησιμοποιούμε τη βάση δεδομένων του εκδοτικού οίκου PubMed, επεξεργάζοντας τα δεδομένα της και εφαρμόζοντας σε αυτά μια ομάδα από ερωτήματα SQL τα οποία επιστρέφουν χρήσιμη ερευνητική πληροφορία με τρόπο σαφώς πιο αποδοτικό από τις συμβατικές μεθόδους που έχουμε για να την ανακαλύψουμε. Παραθέτουμε αναλυτικά πειραματικά δεδομένα εστιασμένα σε αλληλεπιδραστικά ερωτήματα που απαιτούν ταχύτατη απόκριση αναφορικά με τις επιδόσεις της GQ-Fast έναντι της βάσης PostgreSQL, όταν όλες οι βάσεις είναι φορτωμένες στη \en RAM \gr του δοκιμαστικού συστήματος. Επιδεικνύουμε τις παραπάνω επεκτάσεις μέσω ενός γραφικού περιβάλλοντος χρήστη (User Interface) που σχεδιάσαμε και υλοποιήσαμε για τον φυλλομετρητή ιστού. Στο περιβάλλον αυτό, εφαρμόζονται άμεσα οι δυνατότητες της GQ-Fast για την ταχύτατη ανάκτηση πληροφοριών σχετικά με την Βιοϊατρική βιβλιογραφία καθώς και η αποτελεσματική απεικόνισή τους.
URI: http://artemis.cslab.ece.ntua.gr:8080/jspui/handle/123456789/17595
Appears in Collections:Διπλωματικές Εργασίες - Theses

Files in This Item:
File Description SizeFormat 
thesis_kefalas.pdfthesis_kefalas2.8 MBAdobe PDFView/Open


Items in Artemis are protected by copyright, with all rights reserved, unless otherwise indicated.