ΕΡΕΥΝΗΤΙΚΟ ΚΕΝΤΡΟ ΚΑΙΝΟΤΟΜΙΑΣ ΣΤΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ & ΤΗΣ ΓΝΩΣΗΣ «ΑΘΗΝΑ» ΙΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ LODGOV

Σχετικά έγγραφα
ΕΡΕΥΝΗΤΙΚΟ ΚΕΝΤΡΟ ΚΑΙΝΟΤΟΜΙΑΣ ΣΤΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ & ΤΗΣ ΓΝΩΣΗΣ «ΑΘΗΝΑ» ΙΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ LODGOV

Παραδοτέο Π.2.1. Υπερχώρος και διαχείριση μοντέλων

Εισαγωγή στο RDF. Το Resource Description Framework (RDF) Σταύρος Πολυβίου

Μεταπτυχιακή Διατριβή

ΕΡΕΥΝΗΤΙΚΟ ΚΕΝΤΡΟ ΚΑΙΝΟΤΟΜΙΑΣ ΣΤΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ & ΤΗΣ ΓΝΩΣΗΣ «ΑΘΗΝΑ» ΙΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ LODGOV

Linked Data for the Masses: Η προσέγγιση και το λογισμικό

"Αθηνά" - Ερευνητικό Κέντρο Καινοτομίας στις Τεχνολογίες της Πληροφορίας, των Επικοινωνιών και της Γνώσης

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού

Διαλειτουργικότητα μεταξύ αρχείων (1/2)

Μεταδεδομένα στο Ψηφιακό περιβάλλον

Εργαστήριο Σημασιολογικού Ιστού

Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού

Εργαστήριο Σημασιολογικού Ιστού

ΕΡΕΥΝΗΤΙΚΟ ΚΕΝΤΡΟ ΚΑΙΝΟΤΟΜΙΑΣ ΣΤΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ & ΤΗΣ ΓΝΩΣΗΣ «ΑΘΗΝΑ» ΙΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ LODGOV

ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ(M.I.S.)

Διαχείριση, Δημοσίευση και Διάθεση Ανοικτών Εκπαιδευτικών Πόρων

Δεδομένα και Πληροφορίες

Οντολογία για την περιγραφή των προσωπικοτήτων της Σάμου, την κατηγοριοποίηση και τις σχέσεις τους

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ. Διαχείριση Κατανεμημένων Δεδομένων στο. Διαδίκτυο

ΕΡΕΥΝΗΤΙΚΟ ΚΕΝΤΡΟ ΚΑΙΝΟΤΟΜΙΑΣ ΣΤΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ & ΤΗΣ ΓΝΩΣΗΣ «ΑΘΗΝΑ» ΙΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ LODGOV

Σχεδιασµός Ανάπτυξη Οντολογίας

ΥΠΗΡΕΣΙΑ. Ηλεκτρονική ιαχείριση Τάξης. Οδηγίες χρήσης για τον µαθητή.

ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΤΕΧΝΟΛΟΓΙΩΝ ΔΙΑΔΙΚΤΥΑΚΩΝ ΥΠΗΡΕΣΙΩΝ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗ ΤΗΣ ΤΕΧΝΟΛΟΓΙΑΣ REST ΠΛΑΣΤΑΡΑΣ ΕΥΡΙΠΙΔΗΣ

ΜΑΘΗΜΑ 6. Σχήµατα ιαλειτουργικότητας Μεταδεδοµένων. Το RDF Το Warwick Framework. Ιόνιο Πανεπιστήµιο - Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας

Αναπαράσταση Γνώσης και Αναζήτηση στον Σηµασιολογικό Ιστό

./mydiz {-c -a -x -m -d -p -j} <archive-file> <list-of-files/dirs>

Εργαστήριο Σημασιολογικού Ιστού

ΑΝΑΠΑΡΑΣΤΑΣΗ ΓΝΩΣΗΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ

Διασύνδεση και Άνοιγμα Δεδομένων του Α.Π.Θ. Καραογλάνογλου Κωνσταντίνος Μονάδα Σημασιολογικού Ιστού Α.Π.Θ 18/3/2014

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος Κεφάλαιο 1 ο Αρχές Διαχείρισης πληροφορίας στον Παγκόσμιο Ιστό... 15

Τεχνολογίες RDF για τον Ιστό Δεδοµένων

Aναπαράσταση Γνώσης στο Σημασιολογικό Ιστό

Ιόνιο Πανεπιστήμιο - Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας

Τεχνολογία Διοίκησης Επιχειρησιακών Διαδικασιών

Αναφορά εργασιών για το τρίμηνο Μάρτιος 2013 Μάιος 2013 Όνομα : Παπαχριστόπουλος Λεωνίδας

Ιστορικοί χάρτες στον Παγκόσμιο Ιστό

Πολιτισμική Τεχνολογία. Πολυμέσα & Διαδίκτυο Παράμετροι Δικαίου Μέρος Α

Διαχείριση Ειδοποιήσεων με Κινητές Συσκευές

Αναφορά εργασιών για το τρίμηνο Σεπτέμβριος Νοέμβριος 2012 Όνομα : Μπελούλη Αγάθη

Διαδίκτυο είναι ένα σύστημα διασυνδεδεμένων δικτύων και υπολογιστών που απλώνεται σε όλο τον κόσμο και έχουν πρόσβαση σε αυτό εκατομμύρια χρήστες.

Θεωρητική προσέγγιση του Σημασιολογικού Ιστού στο χώρο της πολιτισμικής πληροφορίας: μία πρότυπη εφαρμογή στη βιβλιοθηκονομία

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ. Συνδεδεμένα Δεδομένα: Δημοσίευση, Σύνδεση, Προσπέλαση. (Linked Data)

Εργαλεία ανάπτυξης εφαρμογών internet Ι

Εννοιολογική Ομοιογένεια

Ψηφιακή Εκπαιδευτική Πλατφόρμα, Διαδραστικά Βιβλία και Αποθετήριο Μαθησιακών Αντικειμένων

Αναφορά εργασιών για το τρίμηνο Δεκέμβριος 2012 Φεβρουάριος 2013

Ενότητα 3: Διαχείριση πληροφοριακών πόρων με τη χρήση βάσεων δεδομένων

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Σε παγκόσμιο επίπεδο, οιμηχανέςαναζήτησηςτουinternet αναπτύχθηκαν για να κάνουν αναζήτηση πληροφοριών σε πολλαπλές τοποθεσίες ιστού.

Web and HTTP. Βασικά Συστατικά: Web Server Web Browser HTTP Protocol

«Μητρώο Ανοικτών Δεδομένων του Δημοσίου» Οδηγός Διαχειριστή Φορέα για το

Εγχειρίδιο Χρήσης. Greek-Albanian cross border cooperation in Biomass Exploitation (GABE)

ΑΝΑΠΤΥΞΗ ΥΠΟΔΟΜΩΝ ΑΝΟΙΚΤΗΣ ΠΡΟΣΒΑΣΗΣ ΙΔΡΥΜΑΤΙΚΟ ΑΠΟΘΕΤΗΡΙΟ «ΟΛΥΜΠΙΑΣ» Διαλειτουργικότητα Ιδρυματικών Αποθετηρίων

Ενιαία Αναζήτηση σε ψηφιακό πολιτιστικό περιεχόμενο

GET SDI PORTAL v1. Οδηγός Βοήθειας

Οι βασικές λειτουργίες (ή πράξεις) που γίνονται σε μια δομή δεδομένων είναι:

ΔΕΛΤΙΟ ΤΥΠΟΥ Open Data Day 2013

Unified search of digital cultural content: Searching culture

Αναφορά εργασιών για το τρίμηνο Σεπτέμβριος Νοέμβριος 2012

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ. Παρουσίαση της SPARQL με χρήση του Jena Adapter για Oracle. Αρ. Μητρώου: 04/2566

Περιεχόμενα. Κατάλογος εικόνων 13. Πρόλογος Το όραμα του Σημασιολογικού Ιστού 19

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΨΥΧΟΛΟΓΙΑ (ΨΧ 00)

ΕΙΔΗ ΕΡΕΥΝΑΣ I: ΠΕΙΡΑΜΑΤΙΚΗ ΕΡΕΥΝΑ & ΠΕΙΡΑΜΑΤΙΚΟΙ ΣΧΕΔΙΑΣΜΟΙ

Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών

ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι

Ανάπτυξη & Σχεδίαση Λογισμικού (ΗΥ420)

ΚΩΔΙΚΟΠΟΙΗΣΗ ONEGEOLOGY - EUROPE ΔΕΔΟΜΕΝΩΝ ΓΙΑ ΤΗΝ ΠΑΡΟΧΗ WMS WFS ΥΠΗΡΕΣΙΩΝ KATA INSPIRE ΜΕ ΒΑΣΗ ΤΟ ΠΡΟΤΥΠΟ GeoSciML 4.0

ΕΚΤ και καινοτομία με ανοιχτά δεδομένα και APIs

Αναφορά εργασιών για το τρίμηνο Δεκέμβριος 2012 Φεβρουάριος 2013 Όνομα : Μπελούλη Αγάθη

Περιεχόμενο του μαθήματος

Διαδίκτυο: δίκτυο διασυνδεμένων δικτύων Ξεκίνησε ως ένα μικρό κλειστό στρατιωτικό δίκτυο, απόρροια του Ψυχρού Πολέμου μεταξύ ΗΠΑ και ΕΣΣΔ.

ΠΛΗΡΟΦΟΡΙΚΗ Ι JAVA Τμήμα θεωρίας με Α.Μ. σε 3, 7, 8 & 9 25/10/07

Εργαστήριο Σημασιολογικού Ιστού

Κεφάλαιο 2ο. Κατανοώντας την αντικειμενοστρέφεια

Μια ολοκληρωμένη, διαχρονική και μόνιμη συλλογή δεδομένων οργανωμένη κατά αντικείμενο ανάλυσης με στόχο τη διαδικασία υποστήριξης λήψης αποφάσεων -

ΟΠΣ-ΕΣΠΑ : Ειδική Υπηρεσία Ολοκληρωμένου Πληροφοριακού Συστήματος ΕΚΠΑΙΔΕΥΤΙΚΟΣ ΟΔΗΓΟΣ ΓΙΑ ΤΗ ΛΕΙΤΟΥΡΓΙΑ ΤΟΥ ΚΕΝΤΡΙΚΟΥ ΛΟΓΑΡΙΑΣΜΟΥ

EBSCOhost Research Databases

ιαχείριση Γνώσης σε Ενδοεπιχειρισιακά ίκτυα και το ιαδίκτυο (ΗΥ-566)

Πληροφορική Τμήμα Σχεδιασμού & Τεχνολογίας Ξύλου & Επίπλου Αντώνιος Καραγεώργος Ευανθία Τσιλιχρήστου. Μάθημα 5 ο Τεχνολογίες Διαδικτύου: HTML I

Π Τ Υ Χ Ι Α Κ Η / Δ Ι Π Λ Ω Μ ΑΤ Ι Κ Η Ε Ρ ΓΑ Σ Ι Α

Atlantis Orders on android

Ο Σημασιολογικός Ιστός και τα Ανοιχτά Διασυνδεδεμένα Δεδομένα στην Εκπαίδευση

Δημοσίευση Δεδομένων Επιστημονικών Δημοσιεύσεων ως Ανοιχτά Διασυνδεδεμένα Δεδομένα. Λιοτήρη Ευαγγελία. Σχολή Θετικών Επιστημών Τμήμα Πληροφορικής

Εργαστήριο «Τεχνολογία Πολιτισμικού Λογισμικού» Ενότητα. Επεξεργασία πινάκων

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Βάσεις Δεδομένων ΙΙ. Διάλεξη 5 η XML και ΒΔ στο Διαδίκτυο

ΑΣΚΗΣΗ. Συγκομιδή και δεικτοδότηση ιστοσελίδων

Τα κύρια χαρακτηριστικά που καθιστούν τον δικτυακό κόµβο «καλή πρακτική», σε σχέση µε τις επιλεγµένες περιοχές είναι:

Π3.1 ΣΧΕΔΙΟ ΑΞΙΟΛΟΓΗΣΗΣ

Τι είναι ένα δίκτυο υπολογιστών; Αρχιτεκτονική επιπέδων πρωτοκόλλων. Δικτυακά πρωτόκολλα

Διαχείριση Πολιτισμικών Δεδομένων

Asset Management Software Client Module. Οδηγός χρήσης

Τα κύρια χαρακτηριστικά που καθιστούν τον δικτυακό κόµβο «καλή πρακτική», σε σχέση µε τις επιλεγµένες περιοχές είναι:

Επικοινωνία με μηνύματα. Κατανεμημένα Συστήματα 1

Διασύνδεση Βιβλιογραφικών Αναφορών της DBpedia σε άλλες Βιβλιογραφικές Βάσεις

MEDLAB: Mediterranean Living Lab for Territorial Innovation

ΠΑΝΕΠΙΣΤΗΜΙΟ ΔΥΤΙΚΗΣ ΑΤΤΙΚΗΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ

Διαχρονικές δομές δεδομένων

Διαγράμματα UML στην Ανάλυση. Μέρος Γ Διαγράμματα Επικοινωνίας Διαγράμματα Ακολουθίας Διαγράμματα Μηχανής Καταστάσεων

Transcript:

ΕΡΕΥΝΗΤΙΚΟ ΚΕΝΤΡΟ ΚΑΙΝΟΤΟΜΙΑΣ ΣΤΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ & ΤΗΣ ΓΝΩΣΗΣ «ΑΘΗΝΑ» ΙΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ LODGOV Διακυβέρνηση Δεδομένων στην εποχή του Ιστού Δεδομένων: δημιουργία, διαχείριση, διατηρησιμότητα, κοινοχρησία και προστασία πόρων στον Ιστό. ΔΡΑΣΗ «ΑΡΙΣΤΕΙΑ» Παραδοτέο 5.1: Τεχνική Αναφορά

ΔΡΑΣΗ «ΑΡΙΣΤΕΙΑ» Παραδοτέο 5.1: Τεχνική Αναφορά Βέλτιστες πρακτικές βιώσιμων Ανοιχτών Διασυνδεδεμένων Δεδομένων Γκίρτζου Κ., Καρόζος Κ., Αλεξίου, Γ., Χατζόπουλος Σ., Χριστοφίδης Β., Βασσάλος Β. και Δαλαμάγκας Θ. Παραδοτέο 5.1: Τεχνική Αναφορά 1

Περιεχόμενα 1 Εισαγωγή... 3 2 MicroRNA... 3 3 Γενικές πρακτικές βιώσιμων ΑΔΔ... 4 3.1 Ανακτήσιμα URIs... 4 3.2 Σχετικά URIs... 5 3.3 Ιεραρχικά URIs... 5 3.4 Πρωτογενή URIs: απόκριση και σύγκριση... 5 3.5 Χρήση της ιδιότητας rdf:type... 5 3.6 Επαναχρησιμοποίηση υπαρχόντων λεξιλογίων... 6 3.7 Προτίμηση προκαθορισμένων τύπων δεδομένων... 7 3.8 Σύνδεση με εξωγενής RDF δεδομένα... 7 4 Πρακτικές διαχρονικών βιώσιμων ΑΔΔ... 8 4.1 Οντότητες και ιδιότητες συσχετιζόμενες με τις εκδόσεις... 9 4.2 Διαχείριση Αλλαγών... 10 4.2.1 Αλλαγή σε ιδιότητα με αντικείμενο κυριολεκτική αξία... 10 4.2.2 Αλλαγή σε ιδιότητα που συνδέει δύο RDF πόρους... 11 5 Επίλογος... 12 Παραδοτέο 5.1: Τεχνική Αναφορά 2

1 Εισαγωγή Το τελευταίο διάστημα όλο και περισσότερα σύνολα δεδομένων σπάνε το φραγμό την ιδιωτικής διαχείρισης από επιμέρους οργανισμούς και μεταφέρονται σε ανοιχτό και δημόσιο χώρο. Τα Διασυνδεδεμένα Δεδομένα (Linked Data) είναι μια ευρέως διαδεδομένη τεχνική για τη δημοσίευση και διάδοση των δεδομένων που διευκολύνει ιδιαίτερα στην επαναχρησιμοποίηση από πιθανούς καταναλωτές, όπως άτομα, κοινότητες ακόμα και εφαρμογές. Για να μπορεί αυτό να επιτευχθεί, το παράδειγμα των διασυνδεδεμένων δεδομένων περιλαμβάνει μια σειρά από γενικές πρακτικές δημοσίευσης, διάδοσης και σύνδεσης. Οι πρακτικές αυτές όμως δεν εξασφαλίζουν τις απαραίτητες προϋποθέσεις για επαναχρησιμοποίηση των δεδομένων όταν τα δεδομένα εξελίσσονται. Χαρακτηριστικό παράδειγμα δεδομένων που αλλάζουν είναι τα επιστημονικά δεδομένα. Στην περίπτωση αυτή προκύπτουν νέες προκλήσεις που σχετίζονται με την δυναμικότητα των δεδομένων και οι οποίες πρέπει να αντιμετωπιστούν. Ενδεικτικά οι καταναλωτές των δεδομένων (1) πρέπει να έχουν πρόσβαση όχι μόνο στην τελευταία έκδοση των δεδομένων, αλλά και σε όλες τις προηγούμενες και (2) πρέπει να μπορεί να ιχνηλατηθούν οι αλλαγές ανάμεσα στις διαφορετικές εκδόσεις των δεδομένων, καθώς και οι αιτίες και τα αποτελέσματά τους. Η παρούσα εργασία οργανώνεται ως εξής: στην Ενότητα 2 παρουσιάζουμε τα επιστημονικά δεδομένα που χρησιμοποιούνται για την μελέτη των προτεινόμενων πρακτικών για την βιωσιμότητα των διασυνδεδεμένων δεδομένων (ΔΔ). Στην Ενότητα 3 παρουσιάζουμε αναλυτικά τις πρακτικές για την βιωσιμότητα των διασυνδεδεμένων δεδομένων που απαντώνται στην βιβλιογραφία. Τέλος, στην Ενότητα 4 παρουσιάζουμε το μοντέλο που προτείνουμε, ένα μοντέλο αλλαγών που στηρίζεται στην RDF το οποίο σκιαγραφεί τις αλλαγές και υποστηρίζει εκδόσεις και στις RDF οντότητες. 2 MiRNA Τα τελευταία χρόνια, το Ερευνητικό Κέντρο «Αθηνά» σε συνεργασία με τον Πανεπιστήμιο Θεσσαλίας (και παλαιότερα με το ΕΚΕΒΕ «Α. Φλέμινγκ») έχει αναπτύξει τις υποδομές αποθήκευσης και ανάλυσης δεδομένων επιστημών ζωής DIANA 1, οι οποίες παρέχουν εξειδικευμένες διαδικτυακές εφαρμογές με σκοπό την υποβοήθηση της έρευνας πάνω στα βιολογικά μόρια microrna. Τα microrna είναι μικρά μόρια RNA που έχουν ρυθμιστικό ρόλο μέσα στο κύτταρο. Επιπλέον, η βιογένεσή τους περιέχει δύο βασικά στάδια, τη μεταγραφή του mirna γονιδίου στο πρόδρομο μόριο mirna (hairpin mirna) και την παραγωγή του ώριμου και ενεργού μορίου mirna (mature mirna) από το πρόδρομο. Στις υποδομές DIANA βρίσκονται συγκεντρωμένα δεδομένα γύρω από τα mirnas από διάφορες βάσεις, όπως τη βάση mirbase 2 που καταγράφει πληροφορίες για τα ίδια τα mirna μόρια, τη συλλογή KEGG pathways 3 που περιέχει πληροφορίες βιολογικών μονοπατιών με περιγραφές κειμένων που αναπαριστούν την γνώση των βιολόγων σχετικά με τις μοριακές αλληλεπιδράσεις και τα δίκτυα αλληλεπίδρασης, και τη βάση mirgen 4 που περιέχει πληροφορίες σχετικά με τη θέση των γονιδίων και των παράγωγων μορίων. 1 http://diana.imis.athena-innovation.gr/dianatools/index.php 2 http://www.mirbase.org 3 http://www.genome.jp/kegg/pathway.html 4 http://carolina.imis.athena-innovation.gr/index.php?r=mirgenv3%2findex Παραδοτέο 5.1: Τεχνική Αναφορά 3

Καθώς προκύπτουν νέα πειράματα, η υπάρχουσα καταγεγραμμένη γνώση εξελίσσεται. Χαρακτηριστικό παράδειγμα είναι η βάση mirbase που περιέχει πληροφορίες για τα mirna μόρια και η οποία δημοσιεύεται σε εκδόσεις. Οι αλλαγές που παρατηρούνται στα δεδομένα ανάμεσα στις διάφορες εκδόσεις της βάσης mirbase απεικονίζονται αναλυτικά στον Πίνακα 1. Από αριστερά προς τα δεξιά βλέπουμε τον τύπο αλλαγής, την περιγραφή της αλλαγής και αν αυτή επηρεάζει τα πρόδρομα ή τα ώριμα μόρια microrna. Η υποστήριξη της δυναμικής των δεδομένων είναι ζωτικής σημασίας όσο αφορά την βιωσιμότητα της υπάρχουσας επιστημονικής γνώσης ως διασυνδεδεμένα δεδομένα. Πίνακας 1. Οι αλλαγές που παρατηρούνται στην βάση mirbase για τα πρόδρομα και ώριμα μόρια mirna. Τύπος Αλλαγή Περιγραφή Hairpin Mature NEW Ένα νέο μόριο mirna δημιουργείται NAME Το mirna αλλάζει όνομα SEQUENCE Το mirna αλλάζει ακολουθία NAME/SEQUENCE Το mirna αλλάζει όνομα και ακολουθία DELETE Το mirna διαγράφεται ADD HAIRPIN PARENT REMOVE HAIRPIN PARENT Ένα πρόδρομο mirna προστίθεται στην λίστα που παράγουν το ώριμο mirna Ένα πρόδρομο mirna αφαιρείται από τη λίστα που παράγουν το ώριμο mirna 3 Γενικές πρακτικές βιώσιμων ΑΔΔ 3.1 Ανακτήσιμα URIs Γνωρίζουμε ότι τα URIs (Unique Resource Identifier) χρησιμοποιούνται στο σημασιολογικό ιστό για να ταυτοποιήσουν μοναδικά RDF πόρους, ενώ τα URLs (Uniform Resource Locator) για τον εντοπισμό πόρων στο διαδίκτυο, αλλά και για την ανάκτηση του πραγματικού πόρου από τον εξυπηρετητή. Επίσης, το URI μπορεί να είναι και URL αλλά όχι πάντα, δηλαδή πολλές φορές χαρακτηρίζει ένα RDF πόρο που έχει μια μη ανακτήσιμη αναπαράσταση. Εφόσον όμως ο σκοπός των διασυνδεδεμένων δεδομένων είναι να μπορούμε να μοιραζόμαστε δομημένες πληροφορίες στο διαδίκτυο με την ίδια ευκολία όπως σήμερα μοιραζόμαστε έγγραφα, και μία από τις θεμελιώδεις ιδέες των διασυνδεδεμένων δεδομένων είναι να μπορούν οι RDF πόροι να ανακτούνται με το HTTP πρωτόκολλο, τότε συνίσταται η χρήση URIs που είναι ανακτήσιμα. Συνεπώς, προτείνεται οι πάροχοι διασυνδεδεμένων δεδομένων να παρέχουν ανακτήσιμα URIs για τους RDF πόρους, ενώ για τις RDF ιδιότητες θα πρέπει να παρέχεται τουλάχιστον η αναπαράσταση του RDF σχήματος, όπου αυτό είναι δυνατόν. Η κοινή πρακτική επαναχρησιμοποίησης RDF ιδιοτήτων από ανοιχτά λεξιλόγια που είναι δημόσια διαθέσιμα (βλέπε επίσης την Ενότητα 3.6), μπορεί να δημιουργήσει πρόβλημα εφόσον οι πάροχοι σε αυτή την περίπτωση δεν έχουν έλεγχο πάνω στο αποτέλεσμα απόπειρας ανάκτησης του URI της ιδιότητας που προέρχεται από ανοιχτά λεξιλόγια. Γι' αυτό τον λόγο, οι εκδότες που επιθυμούν να διαθέσουν το λεξιλόγιό τους για διασυνδεδεμένα δεδομένα, θα πρέπει να προσπαθούν να παρέχουν ανακτήσιμες αναπαραστάσεις των ιδιοτήτων που ορίζονται στα λεξιλόγιά τους. Και κατ επέκταση, η απόδοση ενός λεξιλογίου για διασυνδεδεμένα δεδομένα μπορεί να αξιολογηθεί και με βάση την πρόσβαση και ανάκτηση του. Παραδοτέο 5.1: Τεχνική Αναφορά 4

3.2 Σχετικά URIs Εφόσον προτείνεται τα URIs να είναι ανακτήσιμα, δηλαδή να εντοπίζουν, και όχι μόνο να ταυτοποιούν, RDF πόρους, όπως είδαμε και στην Ενότητα 3.1, η χρήση σχετικών URIs είναι εξίσου χρήσιμη σε πλατφόρμες διασυνδεδεμένων δεδομένων, όπως η χρήση σχετικών URLs στον παραδοσιακό ιστό. Συνεπώς, όσοι υλοποιούν πλατφόρμες για διασυνδεδεμένα δεδομένα καλό θα είναι να υποστηρίζουν σχετικά URIs όπου αυτό είναι δυνατόν και κατάλληλο. Εκτός από την οικειότητα που προσφέρουν, αφού στηρίζονται στην ίδια λογική όπως και τα σχετικά URLs, έχουν επίσης και τα παρακάτω προτερήματα: έχουν μικρότερο μέγεθος από τα απόλυτα URIs, κάνουν τους RDF πόρους και τις RDF ιδιότητες πιο φορητές, διευκολύνουν κατά την διάρκεια της ανάπτυξης και υποστηρίζουν ευκολότερα την δημιουργία αυτόματων αναπαραγομένων URIs. 3.3 Ιεραρχικά URIs Η χρήση ιεραρχικών URIS συνίσταται ιδιαίτερα για γενικευμένες δομές (containers) αλλά και για σχέσεις ιεραρχίας, π.χ. σχέση κηδεμόνας-παιδί όπου το παιδί λογικά ανήκει στον πατέρα. Ένα παράδειγμα που ακολουθεί αυτό το μοντέλο μπορεί να βρεθεί στα διασυνδεδεμένα δεδομένα DIANA για τις κλάσεις Hairpin και Mature για την μοντελοποίηση των διαφορετικών εκδόσεων τον οντοτήτων. Το URI της γενικής οντότητας για το πρόδρομο mirna μόριο (hairpin) με accession MI0000039 στην βάση mirbase έχει την μορφή.../hairpins/mi0000039/, ενώ το URI της ίδιας οντότητας για την έκδοση 6.0 της mirbase έχει την μορφή.../hairpins/mi0000039/6.0. 3.4 Πρωτογενή URIs: απόκριση και σύγκριση Οι πελάτες (clients) ενός διακομιστή διασυνδεδεμένων δεδομένων μπορούν να έχουν πρόσβαση στα δεδομένα χρησιμοποιώντας πιθανώς πολλαπλά URIs, για παράδειγμα θα μπορούσε το πρωτόκολλο των URIs να διαφέρει μεταξύ HTTP και HTTPS. Ο ίδιος ο διακομιστής υποχρεούται να απαντάει σε κάθε ένα από αυτά τα αιτήματα (requests) με ένα συνεπή και μοναδικό URL, το πρωτογενή URL (primary URL). Αυτό το πρωτογενή URL μπορεί να βρεθεί με την απόκριση του ίδιου του URL, ή και στο περιεχόμενα τον επικεφαλίδων (headers), ακόμα και σε πιθανή αναπαράσταση του σχήματος από τον διακομιστή. Στις περισσότερες περιπτώσεις URLs που διαφέρουν μονάχα από το πρωτόκολλο πρόσβασης, αναφέρονται στό ίδιο πόρο και ο διακομιστής πρέπει να αποκριθεί με τον πρωτογενές URL. Οι πελάτες επίσης είναι προτιμότερο να χρησιμοποιούν το πρωτογενές URL ως αναγνωριστικό του πόρου. Για παράδειγμα, ας υποθέσουμε ότι θέλουμε να δούμε κατά πόσο δύο URLs αναφέρονται στον ίδιο RDF πόρο. Στην περίπτωση αυτή είναι προτιμότερο να συγκριθούν τα πρωτογενή URLs των πόρων που είναι μοναδικά, από τα URLs που χρησιμοποιήθηκαν για να αποκτηθεί πρόσβαση στους πόρους. Με τον τρόπο αυτό αποφεύγονται τυχόν λάθη που μπορούν να προκύψουν από την χρήση πολλαπλών URLs να αναφέρονται στον ίδιο πόρο, π.χ. χρήση σχετικών και απόλυτων URLs. 3.5 Χρήση της ιδιότητας rdf:type Σε πολλές περιπτώσεις η ρητή δήλωση του τύπου (class) ενός RDF πόρου είναι πολύ χρήσιμη, αν και όχι απαραίτητη για τις δυνατότητες αλληλεπίδρασης που προσφέρει ένας Παραδοτέο 5.1: Τεχνική Αναφορά 5

διακομιστής διασυνδεδεμένων δεδομένων. Η ρητή γνώση του τύπου ενός πόρου μέσω της ιδιότητας rdf:type επιτρέπει αυτή την γνώση ακόμα και σε πελάτες που δεν μπορούν να εκτελέσουν κάποια επιπλέον επεξεργασία για να την μάθουν, π.χ., επαγωγική συλλογιστική, και δεν χρειάζεται επιπλέον επερωτήσεις μέσω το πρωτοκόλλου HTTP. Για παράδειγμα, αν ο πελάτης δεν μπορεί να συμπεράνει τον τύπο ενός πόρου, γιατί δεν υποστηρίζει επαγωγική λογική, μπορεί να επωφεληθεί από την κατηγορηματική δήλωση του τύπου, όπως φαίνεται παρακάτω: PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX d2r: <http://sites.wiwiss.fu-berlin.de/suhl/bizer/d2rserver/config.rdf#> PREFIX diana: <http://web.imis.athena-innovation.gr/projects/diana/> PREFIX owl: <http://www.w3.org/2002/07/owl#> PREFIX xsd: <http://www.w3.org/2001/xmlschema#> PREFIX map: <http://snf-541101.vm.okeanos.grnet.gr:2020/resource/#> PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX meta: <http://www4.wiwiss.fu-berlin.de/bizer/d2r-server/metadata#> <http://web.imis.athenainnovation.gr/projects/diana/resource/hairpins/mi0000095> a diana:hairpin; diana:name "hsa-mir-93"; diana:accesion "MI0000095"; diana:produces_mature <http://web.imis.athenainnovation.gr/projects/diana//resource/matures/mimat0004509>. Να σημειωθεί εδώ ότι η χρήση της λεκτικής μονάδας a στη θέση ιδιότητας στην γλώσσα Turtle αναπαριστά το http://www.w3.org/1999/02/22-rdf-syntax-ns#type. Στο παραπάνω παράδειγμα το a diana:hairpin είναι ισοδύναμο με rdf:type diana:hairpin και ουσιαστικά δηλώνει ότι ο πόρος είναι τύπου Hairpin mirna. 3.6 Επαναχρησιμοποίηση υπαρχόντων λεξιλογίων Για να διευκολυνθεί η χρήση ενός νέο συνόλου διασυνδεδεμένων δεδομένων από εφαρμογές-πελάτες είναι επιθυμητό να επαναχρησιμοποιούνται όροι (terms) που προέρχονται από υπάρχοντα γνωστά λεξιλόγια, όποτε αυτό είναι δυνατόν και να ορίζονται νέοι όροι εάν δεν μπορεί να βρεθεί ικανοποιητικός όρος σε ήδη υπάρχοντα λεξιλόγια. Καθώς η κοινότητα του σημασιολογικού ιστού εξελίσσεται, ένα σύνολο από γνωστά λεξιλόγια έχει δημιουργηθεί, ανάμεσά τους: RDF Syntax 5 : λεξιλόγιο για την αναπαράσταση RDF μεταδεδομένων. RDF Schema 6 : λεξιλόγιο για την μοντελοποίηση λεξιλογίων για RDF δεδομένα. Dublin Core (DC) 7 : λεξιλόγιο περιγραφής γενικών μεταδεδομένων. Friend-of-a-Friend (FOAF) 8 : λεξιλόγιο για την περιγραφή ανθρώπων. 5 http://www.w3.org/tr/rec-rdf-syntax/ 6 http://www.w3.org/tr/rdf-schema/ 7 http://dublincore.org/ 8 http://www.foaf-project.org/ Παραδοτέο 5.1: Τεχνική Αναφορά 6

Semantically-Interlinked Online Communities (SIOC) 9 : λεξιλόγιο για την αναπαράσταση κοινοτήτων στο διαδίκτυο. Description of a Project (DOAP) 10 : λεξιλόγιο για την περιγραφή εργασιών (projects). Simple Knowledge Organization System (SKOS) 11 : λεξιλόγιο για την αναπαράσταση ταξινομιών και ελαφρώς δομημένων δεδομένων. Ένα δείγμα από ιδιότητες από γνωστά λεξιλόγια φαίνεται στον Πίνακας 2. Πίνακας 2. Ένα δείγμα από ιδιότητες από γνωστά λεξιλόγια. Ιδιότητα Σύνολο τιμών Λεξιλόγιο rdf:type rdfs:class RDF Syntax rdfs:member rdfs:resource RDF Schema dcterms:description rdf:xmlliteral Dublin Core dcterms:title rdf:xmlliteral Dublin Core dcterms:relation rdfs:resource Dublin Core dcterms:creator dcterms:agent Dublin Core dcterms:created xsd:datetime Dublin Core 3.7 Προτίμηση προκαθορισμένων τύπων δεδομένων Όπως συνίσταται η επαναχρησιμοποίηση υπαρχόντων λεξιλογίων για να διευκολύνεται η χρήση νέων συνόλων διασυνδεδεμένων δεδομένων, ομοίως προτείνεται η χρήση προκαθορισμένων τύπων για τα δεδομένα. Επειδή η RDF δεν ορίζει τύπους δεδομένων για να χρησιμοποιούνται στις αξίες των τιμές (literal values) των ιδιοτήτων, οι προκαθορισμένη τύποι δεδομένων βασίζονται στην XMLSchema. Στο Πίνακα 3 φαίνεται ένα σύνολο τύπων και η περιγραφή τους. Πίνακας 3. Ένα δείγμα από τύπους δεδομένων από την XML Schema. Τύπος Δεδομένων XMLSchema#boolean XMLSchema#date XMLSchema#dateTime XMLSchema#decimal XMLSchema#double XMLSchema#float XMLSchema#hexBinary XMLSchema#integer XMLSchema#string Περιγραφή Τύπος δεδομένων Αληθείας (Boolean). Ημερομηνία Ημερομηνία και ώρα Δεκαδικός αριθμός Πραγματικός αριθμός διπλής ακρίβειας Πραγματικός αριθμός μονής ακρίβειας Δεκαεξαδικός αριθμός Ακέραιος Συμβολοσειρά 3.8 Σύνδεση με εξωγενής RDF δεδομένα Μία από τις θεμελιώδης αρχές των διασυνδεδεμένων δεδομένων είναι η δημιουργία συνδέσεων με ήδη υπάρχοντα RDF δεδομένα. Αυτό επιτυγχάνεται με την επαναχρησιμοποίηση υπάρχοντων λεξιλογίων, όπως εξετάσαμε στην Ενότητα 3.6, αλλά και 9 http://sioc-project.org/ 10 http://lov.okfn.org/dataset/lov/vocabs/doap 11 http://www.w3.org/2004/02/skos/ Παραδοτέο 5.1: Τεχνική Αναφορά 7

με την δημιουργία συνδέσμων (links) σε συσχετισμένα RDF δεδομένα. Μια κοινή πρακτική είναι η χρήση της ιδιότητας owl:sameas η οποία δηλώνει ότι οι δύο RDF πόροι αναφέρονται στο ίδιο αντικείμενο. Συνεπώς η ιδιότητα owl:sameas χρησιμοποιείται για να δημιουργήσει αντιστοιχήσεων μεταξύ πόρων. Ένα παράδειγμα χρήσης της ιδιότητας owl:sameas στα ανοιχτά διασυνδεδεμένα δεδομένα DIANA φαίνεται στην Εικόνα 1. Εικόνα 1. Παράδειγμα της ιδιότητας owl:sameas στο DIANA LOD. 4 Πρακτικές διαχρονικών βιώσιμων ΑΔΔ Ένα πολύ ενδιαφέρον πρόβλημα είναι η δημοσιοποίηση διασυνδεδεμένων δεδομένων που εξελίσσονται στον χρόνο. Στην γενική περίπτωση, οι αλλαγές είναι πολύπλοκα αντικείμενα που αλληλεπιδρούν με τα δεδομένα και έχουν δομικά, χρονικά και πιθανοκρατικά χαρακτηριστικά. Συνεπώς δεν είναι δυνατόν να τις διαχειριστούμε ούτε μέσω από απλές διαφορές πάνω στα δεδομένα, ούτε με τελεστές μετασχηματισμού, αλλά απαιτείται μια πιο πολύπλοκη διαδικασία. Αυτή η απαίτηση είναι ιδιαίτερα προφανής σε διασυνδεδεμένα δεδομένα επιστημών υγείας, όπου η απλή μετατροπή των υπάρχοντων επιστημονικών δεδομένων σε διασυνδεδεμένα δεν ικανοποιεί τις απαιτήσεις επαναχρησιμοποίησης των δεδομένων. Για να εξασφαλίσουμε την επαναχρησιμοποίηση των δεδομένων, αλλά και για να επιτρέψουμε την περαιτέρω εκμετάλλευση και επαλήθευση των επιστημονικών αποτελεσμάτων, οι χρήστες των δεδομένων (είτε άνθρωποι, είτε υπηρεσίες) θα πρέπει να μπορούν: 1. να έχουν πρόσβαση όχι μόνο στις τελευταίες εκδόσεις των διασυνδεδεμένων δεδομένων, αλλά και σε όλες τις προηγούμενες και 2. να έχουν πρόσβαση και στις αλλαγές που συντελέστηκαν ανάμεσα στις διαφορετικές εκδόσεις, καθώς και στις αιτίες και στα αποτελέσματα των αλλαγών αυτών. Για να μπορέσουμε να υποστηρίξουμε τις παραπάνω απαιτήσεις, υιοθετούμε οντότητες RDF που εμπεριέχουν πληροφορίες σχετικά με την έκδοσή τους και ιδιότητες που δηλώνουν τις εκδόσεις, καθώς επίσης μοντελοποιούμε τις αλλαγές ως RDF πόρους στα διασυνδεδεμένα δεδομένα. Με βάση το προτεινόμενο μοντέλο, οι υπηρεσίες επερωτήσεων (π.χ. SPARQL) και πλοήγησης (δηλαδή η πλοήγηση μέσω URIs που μοντελοποιούν τις διαφορετικές εκδόσεις των δεδομένων) μπορούν να αναπτυχθούν πάνω στα διαχρονικά σύνολα ΔΔ. Παραδοτέο 5.1: Τεχνική Αναφορά 8

4.1 Οντότητες και ιδιότητες συσχετιζόμενες με τις εκδόσεις Για να αναπαραστήσουμε ενημερωμένες οντότητες (π.χ. έναν mirna πόρο που βρίσκεται στην τελευταία του έκδοση), χρησιμοποιούμε ένα γενικό URI που βασίζεται στην κλάση του πόρου, δηλαδή στην πληροφορία που παρέχεται από την ιδιότητα rdf:type (concept) και στο μοναδικό αναγνωριστικό του πόρου http://{domain}/{concept}/{identifier}. Με την χρήση τέτοιας μορφής URIs, μπορεί να ανακτηθεί η περιγραφή RDF της πιο σύγχρονης έκδοσης του RDF πόρου που ζητείται. Για την ανάκτηση μιας RDF περιγραφής του ίδιου RDF πόρου που βρίσκεται σε κάποια προηγούμενη έκδοση από το σύνολο των ΔΔ, αρκεί να επεκτείνουμε το γενικό URI με μια χρονική σήμανση (timestamp) που δηλώνει την ζητούμενη έκδοση των ΔΔ http://{domain}/{concept}/{identifier}/{timestamp}. Για παράδειγμα, το /matures/mimat0009477 είναι το URI ενός ώριμου μορίου mirna με αναγνωριστικό MIMAT0009477 στην βάση της mirbase στην τρέχουσα έκδοσή της, ενώ το /matures/mimat0009477/17 είναι το URI του ίδιου μορίου mirna για την έκδοση 17 της mirbase. Ενώ η χρήση αυτής της μορφής URIs μας επιτρέπει την υποστήριξη πλοήγησης ανάμεσα σε διαφορετικές εκδόσεις των οντοτήτων απλά ακολουθώντας τα ίδια τα URIs, η χρήση ιδιοτήτων έκδοσης διευκολύνει τις επερωτήσεις διαχρονικών ΔΔ, δηλαδή την ανάκτηση RDF περιγραφών συγκεκριμένων εκδόσεων των ΔΔ. Προτείνουμε την χρήση τεσσάρων ιδιοτήτων που σχετίζονται με τις εκδόσεις: (1) την ιδιότητα :label με σταθερή τιμή "now", (2) την ιδιότητα :version με τιμές χρονικής σήμανσης, (3) :previous_version, και (4) :next_version. Η πρώτη ιδιότητα μπορεί να χρησιμοποιηθεί σε επερωτήσεις SPARQL για να ανακτηθούν RDF πόροι που βρίσκονται στην τρέχουσα έκδοση μόνο, ενώ η δεύτερη ιδιότητα μπορεί να χρησιμοποιηθεί για να μορφοποιηθούν διαχρονικές επερωτήσεις, δηλαδή επερωτήσεις που επεκτείνονται σε ένα διάφορες εκδόσεις των ΔΔ. Οι άλλες δύο ιδιότητες επιτρέπουν την πλοήγηση ανάμεσα σε προηγούμενη και επόμενη έκδοση του RDF πόρου, αντίστοιχα. Στην Εικόνα 2 παρουσιάζεται ο RDF υπογράφος των mirna δεδομένων, όταν αυτά εκδίδονται ως ΔΔ χρησιμοποιώντας την προτεινόμενη μεθοδολογία. Στην αριστερή στήλη, από πάνω προς τα κάτω, είναι οι τρεις RDF πόροι για το πρόδρομο μόριο mirna με αναγνωριστικό στην mirbase MI0000095 για τις εκδόσεις 16, 17 και 18, με URIs.../resource/hairpins/MI0000095/16,.../resource/hairpins/MI0000095/1 7 και.../resource/hairpins/mi0000095/18 αντίστοιχα. Ομοίως η δεξιά στήλη από πάνω προς τα κάτω δείχνει τους RDF πόρους για το ώριμο μόριο mirna με αναγνωριστικό στη βάση mirbase MIMAT0004509 για τις εκδόσεις 16, 17 και 18 της βάση με URIs.../resource/matures/MIMAT0004509/16,.../resource/matures/MIMAT0004509/1 7 και.../resource/matures/mimat0004509/18 αντίστοιχα. Το ώριμο μόριο mirna MIMAT0004509 παράγεται από το πρόδρομο μόριο mirna MI0000095, μια σχέση που αντανακλάται και από το γράφο RDF μέσα από την ιδιότητα diana:produces_mature. Στην Εικόνα 2 επίσης παρουσιάζονται μερικές από τις ιδιότητες που σχετίζονται με τις κλάσεις Hairpin και Mature, όπως οι diana:name και diana:accession. Η ιδιότητα diana:name αναπαριστά το όνομα του κάθε mirna μορίου, μια ιδιότητα που εξελίσσεται στο χρόνο καθώς προκύπτουν νέα πειραματικά δεδομένα, ενώ η ιδιότητα diana:accession αναπαριστά το μοναδικό αναγνωριστικό που δίνεται σε κάθε μόριο mirna από την βάση mirbase, μια ιδιότητα που παραμένει σταθερή σε όλη την διάρκεια ζωής του μορίου. Παραδοτέο 5.1: Τεχνική Αναφορά 9

Εικόνα 2. Ένας RDF υπογράφος των mirna ΔΔ που δείχνει τις οντότητες και τις σχέσεις που συσχετίζονται με τις εκδόσεις. 4.2 Διαχείριση Αλλαγών Μια απαραίτητη προϋπόθεση όταν κάποιος δουλεύει με ΔΔ που εξελίσσονται είναι η ανάγκη καταγραφής της καταγωγής των δεδομένων αλλά και των αλλαγών που υφίστανται. Η σκιαγράφηση των ίδιων των αλλαγών σε ΔΔ χώρους (linked data spaces) και οι δυνατότητες επερωτήσεων πάνω στις αλλαγές, μας δίνει στην πραγματικότητα τη δυνατότητα να εξετάσουμε πως, πότε και γιατί συνέβησαν οι αλλαγές που παρατηρούμε. Με άλλα λόγια, ανοίγει ο δρόμος για τα πολύ ενδιαφέροντα προβλήματα της υποστήριξης της διαφύλαξης και της προέλευσης των ΔΔ. Προτείνουμε δύο διαφορετικές στρατηγικές ανάλογα αν η αλλαγή υφίσταται σε μια RDF τριπλέτα η οποία περιλαμβάνει μια ιδιότητα που οδηγεί σε αντικείμενο με κυριολεκτική αξία ή αν η αλλαγή υφίσταται σε μια σχέση που συνδέει δύο RDF πόρους μεταξύ τους 12. 4.2.1 Αλλαγή σε ιδιότητα με κυριολεκτική αξία Οι αλλαγές σε μία ιδιότητα που συνδέεται με αντικείμενα με κυριολεκτική αξία (literals) σημαίνει ότι η κυριολεκτική αξία αντικαθίσταται από μια νέα τιμή. Μοντελοποιούμε αυτή την αλλαγή προσθέτοντας στο RDF Schema μια επιπλέον ιδιότητα, την :change. H Εικόνα 3 δείχνει έναν RDF υπογράφο από τα DIANA ΔΔ, όπου αλλαγή υφίσταται η ιδιότητα diana:name. Η ιδιότητα που αλλάζει απεικεινίζεται με κόκκινο και αφορά το πρόδρομο μόριο mirna με αναγνωριστικό στη βάση mirbase MI0000069. Η αλλαγή συμβαίνει στην έκδοση 2.0. Στην αριστερή πλευρά βλέπουμε την RDF περιγραφή του ίδιου μορίου για την προηγούμενη έκδοση, την έκδοση 1.5, στην οποία επίσης φαίνεται και η προηγούμενη τιμή της ιδιότητας diana:name, hsa-mir-15. Στην δεξιά πλευρά βλέπουμε την RDF περιγραφή του μορίου για την έκδοση 2.0 με την νέα πλέον τιμή hsa-mir-15a καθώς και την επιπλέον ιδιότητα diana:change. Η κυριολεκτική αξία της νέας αυτής ιδιότητας δηλώνει την αλλαγή που παρατηρήθηκε, που σε αυτή την περίπτωση ήταν NAME, και που εμφανίζεται στην Εικόνα 3 με πράσινο. 12 Χωρίς απώλεια της γενίκευσης, θεωρούμε ότι και ένας κενός κόμβος (blank node) μπορεί να θεωρηθεί ως μιας RDF περιγραφή Παραδοτέο 5.1: Τεχνική Αναφορά 10

Εικόνα 3. Ένας RDF υπογράφος από τα mirna ΔΔ όπου φαίνεται η μοντελοποίηση μιας αλλαγής σε ιδιότητα με αντικείμενο κυριολεκτική αξία. Εικόνα 4. Ένας RDF υπογράφος από τα mirna ΔΔ όπου μοντελοποιείται η αλλαγή σε ιδιότητα που συνδέει δύο πόρους. 4.2.2 Αλλαγή σε ιδιότητα που συνδέει δύο RDF πόρους Στην περίπτωση που η αλλαγή αφορά μια ιδιότητα που συνδέει δύο RDF πόρους, τότε η αλλαγή μοντελοποιείται ως ένας νέος RDF πόρος. Ο πόρος αυτός συνδέεται με τους δύο πόρους της ιδιότητας (υποκείμενο και αντικείμενο της ιδιότητας) που υπέστη αλλαγή. Στην περίπτωσή μας, αυτός ο πόρος αλλαγής εκτός από συνδέσεις με τους αντίστοιχους πόρους, μπορεί να περιέχει χρονική πληροφορία για το πότε συνέβη η αλλαγή. Άλλα χαρακτηριστικά, όπως είναι τα πιθανοκρατικά, μπορούν εύκολα να μοντελοποιηθούν προσθέτοντας επιπλέον ιδιότητες στην πόρο της αλλαγής. Στη Εικόνα 4 φαίνεται ένα παράδειγμα αλλαγής σε ιδιότητα από τα DIANA ΔΔ. Η αλλαγή έγινε στην έκδοση της βάσης mirbase 17 στην ιδιότητα diana:produces_mature ανάμεσα στο πρόδρομο μόριο mirna MI0000769 και για το ώριμο μόριο mirna MIMAT0009199. Στην κορυφή της εικόνας, βλέπουμε τους δύο RDF πόρους για την έκδοση 16, όπου οι δύο πόροι συνδέονταν μέσω της σχέσης diana:produces_mature. Στο κάτω μέρος της εικόνας βλέπουμε τους πόρους για τα ίδια μόρια για την έκδοση 17, όπου η σχέση δεν υφίσταται πλέον. Η αλλαγή αυτή μοντελοποιείται μέσω από τον νέο RDF πόρο τύπου diana:removehairpinparent, όπου απεικονίζεται με πράσινο. Ο νέος αυτός πόρος περιέχει συνδέσεις προς τους δυο πόρους πρόδρομου και ώριμου μορίου mirna της νέας έκδοσης 17, καθώς και πληροφορίες για την χρονική στιγμή που συνέβει η αλλαγή, μέσω της ιδιότητας diana:version. Παραδοτέο 5.1: Τεχνική Αναφορά 11

5 Επίλογος Στην εργασία αυτή εξετάσαμε διάφορες πρακτικές για την βιωσιμότητα των διασυνδεδεμένων δεδομένων. Αρχικά εξετάσαμε γενικές πρακτικές που σχετίζονται κυρίως με τα URIs. Κατόπιν, εξετάσαμε το προτεινόμενο μας μοντέλο για δεδομένων που εξελίσσονται. Με αυτήν την μεθοδολογία μοντελοποιούνται όχι μόνο τα ίδια τα δεδομένα σε όλες τους εκδόσεις, αλλά και οι ίδιες οι αλλαγές που υφίστανται επιτρέποντάς μας με αυτό τον τρόπο στην ιχνηλάτιση των αλλαγών, αλλά και των επιπτώσεών τους πάνω στα δεδομένα. Παραδοτέο 5.1: Τεχνική Αναφορά 12