ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΔΙΠΛΩΜΑ ΕΙΔΙΚΕΥΣΗΣ (MSc) στα ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΠΛΩΜΑΤΙKH ΕΡΓΑΣΙΑ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΔΙΠΛΩΜΑ ΕΙΔΙΚΕΥΣΗΣ (MSc) στα ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΠΛΩΜΑΤΙKH ΕΡΓΑΣΙΑ"

Transcript

1 ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΔΙΠΛΩΜΑ ΕΙΔΙΚΕΥΣΗΣ (MSc) στα ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΠΛΩΜΑΤΙKH ΕΡΓΑΣΙΑ Πλατφόρμα Διαχείρισης Συνδεδεμένων Δεδομένων Βιβλιοθηκών Σταύρακας Αλέξανδρος ΑΘΗΝΑ, Δεκέμβριος 2017

2 2

3 Περιεχόμενα ΠΕΡΙΛΗΨΗ... 5 ABSTRACT Εισαγωγή Σημασιολογικός Ιστός Συνδεδεμένα Δεδομένα Λεξικά Επερωτήσεις Το Πρότυπο RDF Η χρήση του RDF Προτύπου στο Σημασιολογικό Ιστό Αποθήκευση Συνδεδεμένων Δεδομένων Neo4J MongoDB Apache Jena Επιλογή κατάλληλης βάσης δεδομένων Σύγκριση Jena με Neo4j Σύγκριση Jena με MongoDB Καταλογογράφηση και Πρότυπα Το Πρότυπο BIBFRAME Δομή του BIBFRAME Το Πρότυπο FRBR Δομή του FRBR Οντότητες FRBR Ο Ρόλος του VIAF στις ψηφιακές Βιβλιοθήκες Τεκμηρίωση Υλοποίησης Πλατφόρμας Ομαδοποίηση Δεδομένων BIBFRAME από Δεδομένα MARCXML Ομαδοποίηση Δεδομένων από MARCXML σε FRBR Μετατροπή Δεδομένων από FRBR σε BIBFRAME Σύγκριση Αποτελεσμάτων 1 ου και 3 ου βήματος με το πρότυπο Dataset. Ανάλυση Recall Precision Διαδικασία εκτέλεσης ηλεκτρονικής πλατφόρμας Βήματα εκτέλεσης της ηλεκτρονικής πλατφόρμας BIB2Jena FRBR2Jena Mapping Golden

4 6.1.5 Evaluation Επίλογος Μελλοντικές επεκτάσεις Βιβλιογραφία

5 ΠΕΡΙΛΗΨΗ Η χρήση των σύγχρονων τεχνολογιών και του Διαδικτύου των Πάντων υποχρεώνει την επιστήμη της πληροφορικής προς αναζήτηση νέων τεχνικών για τη δημιουργία, διαχείριση και ανάκτηση του τεράστιου όγκου δεδομένων. Μία κατηγορία που διαχειρίζεται ένα μεγάλο όγκο δεδομένων είναι η βιβλιοθηκονομία. Σκοπός της διπλωματικής είναι η ανάπτυξη μίας πλατφόρμας διαχείρισης συνδεδεμένων δεδομένων βιβλιοθηκών προκειμένου να γίνει η συλλογή, η καταχώριση και η διαχείριση δεδομένων που αφορούν βιβλία, έντυπα, δοκίμια και οτιδήποτε άλλο σχετίζεται με την επιστήμη της βιβλιοθηκονομίας. Η διπλωματική εργασία απαρτίζεται από την έρευνα για τη βέλτιστη βάση δεδομένων συνδεδεμένων δεδομένων, τη μελέτη των υπαρχόντων μοντέλων συνδεδεμένων δεδομένων που αφορούν τη βιβλιοθηκονομία, τη μελέτη για τη διασύνδεση αυτών των μοντέλων, τη δημιουργία μίας πλατφόρμας που θα μπορεί να διαχειρίζεται αυτά τα μοντέλα με τον καλύτερο δυνατό τρόπο και τέλος την αξιολόγηση των αποτελεσμάτων που εξάγονται από τη χρήση της πλατφόρμας. 5

6 ABSTRACT The use of modern technologies and the existence of Internet of Things obligates the Science of Information Technology to search new techniques for the creation, the management and the retrieval of Big Data. A category which already handles a big amount of data is Library Science. The scope of this Thesis is the development of a platform that handles librarian linked data for the collection, registration and managing data pertained to books, printed matters, essays and anything else related to the Library Science. The Thesis consists of the research for the most efficient Linked Data Database, the study of the existing librarian Linked Data Models, the study of interfacing these Models, the development of a platform which will manage these Models with the best possible way and finally the evaluation of the results derived from the usage of this platform. 6

7 1. Εισαγωγή 1.1 Σημασιολογικός Ιστός Στον συμβατικό Παγκόσμιο Ιστό οι πληροφορίες και τα δεδομένα που ανταλλάσσονται καθημερινά μεταξύ χιλιάδων ανθρώπων δεν παρέχουν τη δυνατότητα να κατανοηθεί τι περιέχει η κάθε πληροφορία. Με την διαρκή αύξηση των αναγκών των ανθρώπων που χρησιμοποιούν τον παγκόσμιο ιστό και σε συνάθροιση με την άνοδο του «Διαδικτύου των Πάντων» τα δεδομένα αποκτούν όλο και περισσότερη σημασία. Ο Σημασιολογικός Ιστός (Semantic Web) είναι μία επέκταση του Παγκόσμιου Ιστού (world wide web ή www) και αυτή η επέκταση θα δίνει ένα νόημα στις ιστοσελίδες. Νόημα όχι για τον άνθρωπο, ο οποίος επεξεργάζεται εγκεφαλικά τα δεδομένα μίας ιστοσελίδας, αλλά νόημα στους υπολογιστές. Ο Παγκόσμιος Ιστός στην τωρινή του μορφή δεν μπορεί να αναγνωρίσει το περιεχόμενο μιας ιστοσελίδας. Το πρόβλημα αυτό απασχόλησε και συνεχίζει να απασχολεί τον ίδιο τον δημιουργό του Παγκόσμιου Ιστού, Tim Berners Lee ο οποίος προσπάθησε να βρει τη βέλτιστη δυνατή λύση και αυτή δεν ήταν άλλη από τον Σημασιολογικό Ιστό. Ο όρος Σημασιολογικός Ιστός δόθηκε από τον ίδιο τον Lee και η βασική ιδέα του εγχειρήματος είναι να επεκταθούν οι συμβατικές ιστοσελίδες και να αποδοθούν για κάθε μία από αυτές μία πλήρη απεικόνιση για το ποια δεδομένα περιέχουν και σε ποια άλλα δεδομένα αναφέρονται. Θα υπάρχει δηλαδή για κάθε δημοσιευμένη πληροφορία ένας όγκος μεταδεδομένων, τα οποία θα μπορούν να καταλαβαίνουν οι υπολογιστές. (Berners-Lee, 2009) Η εφαρμογή του μοντέλου του Σημασιολογικού Ιστού θα βελτιώσει την λειτουργία του Παγκόσμιου Ιστού καθώς θα λύσει μία σωρεία ελλείψεων. Κλάδοι οι οποίοι θα επωφεληθούν από την ύπαρξη του Σημασιολογικού Ιστού: Επιχειρηματικότητα. Θα μειωθεί κατά πολύ το υψηλό κόστους λειτουργίας πολλαπλών συλλεκτών πληροφορίας (crawlers) που χρησιμοποιούνται καθημερινά για τη συλλογή πληροφορίων και την επεξεργασία αυτών. Στατιστική. Με την άνθιση του Internet of Everything, τα δεδομένα που λαμβάνονται για στατιστική ανάλυση θα είναι πιο έμπιστα καθώς θα περιέχεται όλη η πληροφορία σχετικά με αυτά. Οι στατιστικές μελέτες θα γίνουν πιο ακριβείς με πιο έγκυρα αποτελέσματα αφού το λαμβανόμενο δείγμα θα είναι ποιοτικότερο. Δημόσια Διοίκηση. Στον τομέα αυτό μειώνεται κατά πολύ η γραφειοκρατία αφού κάθε πολίτης θα αναγνωρίζεται στο κεντρικό σύστημα διαχείρισης δεδομένων του εκάστοτε κράτους ως οντότητα, οπότε αυτόματα θα περιέχεται για αυτόν όλη η απαιτούμενη πληροφορία. Η ενοποίηση όλων των ψηφιακών συστημάτων ενός κράτους γίνεται πιο εύκολα με τη χρήση των μεταδεδομένων. Υγεία. Με τη δημιουργία μίας παγκόσμιας ιατρικής ορολογίας γίνεται σαφώς ευκολότερη η αντιμετώπιση ενός περιστατικού. Αν το περιστατικό 7

8 αντιμετωπιστεί ως οντότητα, ο επιβλέπων γιατρός θα έχει τη δυνατότητα να πάρει πληροφορίες για αυτό όπως επιτυχημένοι τρόποι αντιμετώπισης, συνταγογράφηση φαρμάκων, συμπτώματα κλπ. Βιβλιοθήκες. Στις ψηφιακές βιβλιοθήκες γίνεται μία προσπάθεια κατηγοριοποίησης συγγραμμάτων, συγγραφέων, εκδοτικών οίκων και άλλων συντελεστών. Επίσης και δημιουργία οικογενειών συγγραμμάτων. Θα αναφερθεί αναλυτικότερα στη συνέχεια της εργασίας. Ασφάλεια. Στον κλάδο της ασφάλειας, η εφαρμογή του Σημασιολογικού Ιστού θα αποτελέσει πολύ θεμελιώδης παράγοντας. Από την στιγμή που οι ιστοσελίδες δεν θα αντιμετωπίζονται ως απλά κείμενα, αλλά ως έννοιες συνδεδεμένες με άλλες έννοιες, η αξιολόγηση αυτών ως επιβλαβείς θα γίνεται με πιο εύκολο τρόπο. Επίσης θα περιοριστεί κατά πολύ η ύπαρξη spam μηνυμάτων ηλεκτρονικού ταχυδρομείου. Καθημερινότητα. Στο κομμάτι αυτό οι καθημερινοί χρήστες του διαδικτύου θα έχουν μια πολύ βελτιωμένη απόκριση αποτελεσμάτων από τις μηχανές αναζήτησης που χρησιμοποιούν καθώς αυτές δεν θα βασίζονται σε λέξεις κλειδιά, αλλά σε σημασιολογικούς όρους. Επίσης θα γίνει πιο εύκολη η αναζήτηση εικόνων και μουσικής. Ο απόλυτος στόχος του Σημασιολογικού Ιστού είναι να θέσει τους υπολογιστές να κάνουν όλη τη χρήσιμη δουλειά. Δηλαδή να αντιλαμβάνονται αυτόματα τι δεδομένα επεξεργάζονται, από που, πόσο έγκυρα είναι και να τα ενημερώνουν με καινούργια πληροφορία. Εν ολίγοις η προσπάθεια του Σημασιολογικού Ιστού επικεντρώνεται στο να αναπτυχθούν νέα υπολογιστικά συστήματα που θα υποστηρίζουν έμπιστες διαδράσεις στο διαδίκτυο. Οι τεχνολογία του Σημασιολογικού Ιστού επιτρέπει στους ανθρώπους να δημιουργούν αποθήκες δεδομένων στο διαδίκτυο, να φτιάχνουν δικά τους λεξικά και να γράφουν πολιτικές για την διαχείριση των δεδομένων. Όπως ισχύει και στον συμβατικό Παγκόσμιο Ιστό, έτσι και ο Σημασιολογικός Ιστός είναι μια τεχνολογία ανταλλαγής δεδομένων. Στον συμβατικό Ιστό αυτή η ανταλλαγή γίνεται μέσω των ιστοσελίδων με τη μορφή του Hypertext Markup Language (HTML). Ο προγραμματιστής που γράφει σε HTML ή σε άλλη γλώσσα προγραμματισμού που παράγει HTML αρχεία όπως PHP, Javascript ή Java, έχει τη δυνατότητα να συνδέσει επιλεγμένους πόρους με σκοπό να προσθέσει άμεση αξία με την ιστοσελίδα του. Παρόλα αυτά δεν προστίθεται σημασιολογική αξία. (Berners-Lee, 2009) Αυτό που κάνει ο Σημασιολογικό Ιστός είναι να προσθέτει σημασιολογική αξία. Για να το καταφέρει κάνει χρήση μοναδικών αναγνωριστικών, τα URI s. Το ακρωνύμιο URI σημαίνει Uniform Resource Identifier και επιτρέπει, σύμφωνα με την χρήση πρωτοκόλλων που έχουν θεσπιστεί από τον Παγκόσμιο Φορέα W3C, την μοναδική αναπαράσταση ενός πόρου του Διαδικτύου. Για να έχουν σημασιολογικό νόημα τα URI s απαιτείται η χρήση κάποιου εννοιολογικού μοντέλου. Το Resource Description Framework (RDF) είναι ένα τέτοιο εννοιολογικό μοντέλο. Αναπτύχθηκε αρχικά ως 8

9 μοντέλο μεταδεδομένων, αλλά λόγω της ευχρηστίας του βασίστηκε πάνω του η ανάπτυξη του Σημασιολογικού Ιστού. Βασίζεται στην ιδέα της δημιουργίας καταστάσεων που αφορούν τους πόρους (URI s) με τη μορφή τριάδων (υποκείμενο κατηγόρημα - αντικείμενο). Το υποκείμενο δηλώνει τον πόρο, το κατηγόρημα τη σχέση ενώ το αντικείμενο είτε αναφέρεται σε πόρο είτε σε οποιαδήποτε τιμή. Με την χρήση λοιπόν μοναδικών URI s, ως υποκείμενα και ενδεχομένως αντικείμενα, μέσω του εννοιολογικού μοντέλου RDF δομείται ο Σημασιολογικός Ιστός. Εικόνα 1 Η Διαφορά μεταξύ συμβατικού και σημασιολογικού Ιστού Ο Σημασιολογικός Ιστός απαρτίζεται από τα εξής χαρακτηριστικά: 1.2 Συνδεδεμένα Δεδομένα Ως συνδεδεμένα δεδομένα ορίζεται η μέθοδος δημοσιοποίησης δομημένων δεδομένων που μπορούν να αλληλοσυνδέονται και να γίνουν πιο χρήσιμα μέσω των σημασιολογικών επερωτήσεων. Αφορούν το πώς το διαδίκτυο μπορεί να δημιουργεί δεσμούς μεταξύ πόρων διαφορετικών πηγών. Οι πηγές αυτές μπορεί να είναι είτε πολλαπλές βάσεις δεδομένων πολλαπλών οργανισμών σε διαφορετικά μέρη του κόσμου, είτε απλών ετερογενών συστημάτων ενός οργανισμού που σε επίπεδο δεδομένων δεν διασυνδέονται με ευκολία. Τεχνικά τα Συνδεδεμένα Δεδομένα αναφέρονται στα δεδομένα που δημοσιεύονται στο διαδίκτυο με τέτοιο τρόπο που να είναι αναγνώσιμα από υπολογιστές, το νόημά τους να είναι σαφές, να είναι συνδεδεμένα με άλλες συλλογές δεδομένων και να είναι δυνατή η διασύνδεσή τους με εξωτερικές συλλογές. Για τη χρήση Συνδεδεμένων Δεδομένων έχουν θεσπιστεί τέσσερις κανόνες από το W3C: 9

10 Η χρήση των URI s σαν ονόματα των οντοτήτων. Σαν οντότητα ορίζεται οτιδήποτε υπαρκτό, πρόσωπο, αντικείμενο, τοποθεσία κλπ. Δηλαδή οτιδήποτε έχει κάποια αξία σαν ύπαρξη. Σύμφωνα με τον ίδιο τον δημιουργό, Burnes Lee, αν δεν υπάρχουν URI τότε δεν υφίστανται Σημασιολογικός Ιστός και κατ επέκταση Συνδεδεμένα Δεδομένα. Η χρήση HTTP URI s ώστε οι άνθρωποι να αναζητούν αυτά τα ονόματα. Αυτό σημαίνει ότι κάποιος χρήστης θα μπορεί να στείλει ένα αίτημα HTTP σε κάποιον εξυπηρετητή και εκείνος να αποκριθεί με τον ίδιο τρόπο. Ο μηχανισμός διαπραγμάτευσης του HTTP πρωτόκολλου επικοινωνίας είναι αρκετά εξελιγμένος δίνοντας πολλές δυνατότητες στον πελάτη για την αναζήτηση περιγραφών, όπως για παράδειγμα κάποιο βάρος προτίμησης. Όταν κάποιος άνθρωπος αναζητά ένα URI να του παρέχονται και χρήσιμες πληροφορίες για το συγκεκριμένο URI με χρήση είτε RDF είτε SPARQL. Γίνεται κατανοητή η ανάγκη δημιουργίας ενός νέου προτύπου για τη διάθεση των Δομημένων Δεδομένων (αντίστοιχο με το HTML). Ένα τέτοιο πρότυπο είναι το RDF, καθώς είναι ένα απλό μοντέλο δεδομένων που βασίζεται στη δημιουργία και επεξεργασία γράφων. Όπως και να έχει, οποιοδήποτε μοντέλο μπορεί να χρησιμοποιηθεί, με αυστηρή προϋπόθεση ότι μπορεί να αναγνωρίζεται και να επεξεργάζεται από μηχανές. Με την έννοια αναγνώριση και επεξεργασία, νοείται ότι γίνεται ευκρινή διάκριση των οντοτήτων. Να περιέχονται σύνδεσμοι σε άλλα URI s ώστε να μπορούν να εξερευνήσουν περισσότερους πόρους. Ο συγκεκριμένος κανόνας δημιουργεί στον χρήστη ένα γράφο με όλους τους διαθέσιμους πόρους αρχής γενομένης από τον πόρο που αναζήτησε. Δηλαδή αναφέρεται στην πραγματική έννοια του Σημασιολογικού Ιστού, που είναι η συσχέτιση των οντοτήτων. Με αυτόν τον κανόνα δίνεται αξία στις έννοιες των σχέσεων μεταξύ των οντοτήτων και η γνώση περνάει από ανθρώπινο επίπεδο σε επίπεδο κατανόησης από τις μηχανές. Η βασική ιδέα των Συνδεδεμένων Δεδομένων είναι η εφαρμογή μιας γενικής αρχιτεκτονικής του Παγκοσμίου Ιστού, στο να γίνουν διαθέσιμα όλα τα δομημένα δεδομένα. (Berners-Lee, 2009) 1.3 Λεξικά Στον Σημασιολογικό Ιστό, τα λεξικά χρησιμοποιούνται για να ορίσουν τις έννοιες και τις σχέσεις των οντοτήτων. Περιγράφουν και αναπαριστούν μία περιοχή ενδιαφέροντος. Επίσης κατηγοριοποιούν τους όρους που χρησιμοποιούνται σε μία συγκεκριμένη εφαρμογή, χαρακτηρίζουν πιθανές σχέσεις και καθορίζουν πιθανούς περιορισμούς στη χρήση αυτών των όρων. Πρακτικά τα λεξικά μπορεί να είναι πολυσύνθετα με χιλιάδες όρους είτε πάρα πολύ απλά (υπάρχουν λεξικά που περιγράφουν μόνο μία έννοια). Ο ρόλος των λεξικών είναι να βοηθούν στην ενσωμάτωση των δεδομένων του Σημασιολογικού Ιστού, όπως για παράδειγμα να συνενώσουν πόρους που προέρχονται 10

11 από διαφορετικές συλλογές δεδομένων με κάποιες ασάφειες μεταξύ τους είτε σε περιπτώσεις όπου αν σε κάποιον πόρο υπάρχει παραπάνω γνώση για κάποιο δεδομένο του, τότε αυτό μπορεί να οδηγήσει στη δημιουργία νέων σχέσεων. Χαρακτηριστικό παράδειγμα είναι οι εφαρμογές στην ιατρική και στη φαρμακευτική. Ο κλάδος της ιατρικής αναπτύσσει γνώση γύρω από τις ασθένειες, τα συμπτώματα και τις θεραπείες ενώ ο κλάδος της φαρμακευτικής αναπτύσσει γνώση στο κομμάτι των φαρμάκων, τη δοσολογία και τα τις παρενέργειες. Ο συνδυασμός των δύο κλάδων με χρήση των δεδομένων των ασθενών ανοίγει ένα νέο φάσμα σε ανάπτυξη «έξυπνων» εφαρμογών και εργαλείων. Τα εργαλεία αυτά βασίζονται στη δημιουργία των σχέσεων που προκύπτουν από την σύμπραξη των δύο αυτών κλάδων. Μία άλλη χρήση των λεξικών είναι για την οργάνωση της γνώσης. Οργανισμοί οι οποίοι διαχειρίζονται τεράστιους όγκους δεδομένων όπως οι βιβλιοθήκες, τα μέσα κοινωνικής δικτύωσης, τα μουσεία, οι εφημερίδες για να διαχειριστούν αυτόν τον όγκο προσφεύγουν στα λεξικά, χρησιμοποιώντας φορμαλιστικά πρότυπα με σκοπό να αξιοποιήσουν στο έπακρο την πρακτική των Συνδεδεμένων Δεδομένων. Τα λεξικά δίνουν την ευελιξία σε αυτόν που τα χρησιμοποιεί, να αποφασίσει το μέγεθός τους. Μερικές εφαρμογές προτιμούν να χρησιμοποιούν απλά λεξικά και να αναθέσουν στο περιβάλλον του Σημασιολογικού Ιστού που θα χρησιμοποιήσουν την επιπρόσθετη πληροφορία για να προσδιορίσουν τους όρους. Άλλες εφαρμογές προτιμούν να μην χρησιμοποιήσουν καθόλου λεξικά και να βασιστούν καθαρά στη λογική του προγράμματος τους. Υπάρχουν επίσης εφαρμογές που ενδέχεται να χρειάζονται περίπλοκες οντολογίες με περίπλοκες διαδικασίες αιτιολόγησης. Οπότε ανεξάρτητα με το τι θέλει να πετύχει κάθε εφαρμογή και με το τι απαιτήσεις έχει θέσει, το W3C δίνει τη δυνατότητα να οριστεί το ανάλογο λεξιλόγιο με μία τυπική μορφή. Μερικές μορφές λεξιλογίων είναι το RDFS, το SKOS, το OWL και το RIF όπου κάποια εφαρμογή μπορεί να χρησιμοποιήσει και συνδυασμούς αυτών. (Berners-Lee, 2009) 1.4 Επερωτήσεις Όπως και στις συμβατικές βάσεις δεδομένων, έτσι και στο Σημασιολογικό Ιστό, οι επερωτήσεις χρησιμοποιούνται προγραμματιστικά για την ανάκτηση πληροφοριών. Ο Σημασιολογικός Ιστός απαρτίζεται από δεδομένα, ημερομηνίες, τίτλους και οποιαδήποτε άλλη πληροφορία. Η δομή του RDF μπορεί να συνδέει όλα τα προαναφερθέντα δεδομένα αλλά δεν δίνει τη δυνατότητα για την ανάκτησή τους από τις βάσεις δεδομένων που είναι αποθηκευμένα. Όπως έχει αναφερθεί η δομή του RDF βασίζεται στην τριάδα υποκείμενο κατηγόρημα αντικείμενο. Αυτόματα λοιπόν οι σχεσιακές βάσεις δεδομένων δεν καθίστανται ικανές να αποθηκεύουν τα δεδομένα αυτά στους πίνακες τους. (Berners-Lee, 2009) Για αυτόν ακριβώς τον λόγο έχουν υλοποιηθεί βάσεις δεδομένων για το μοντέλο των τριάδων. Αντίστοιχα έχουν υλοποιηθεί και γλώσσες επερωτήσεων για αυτές τις βάσεις. 11

12 Τέτοια γλώσσα είναι η SPARQL. Αντίστοιχα με την παραδοσιακή SQL, η SPARQL στέλνει τις επερωτήσεις στη βάση και λαμβάνει αποτελέσματα μέσω των πρωτοκόλλων του HTTP ή του SOAP. Η SPARQL αποθηκεύει όλα τα δεδομένα με την μορφή Key - Value, δηλαδή των τριάδων όπως τα διαβάζει από το RDF. Η λογική της είναι πανομοιότυπη με αυτή των NoSQL βάσεων δεδομένων οι οποίες χρησιμοποιούν το Document Key Value μοντέλο (Αναφορά), όπως η MongoDB. Εικόνα 2 Αναπαράσταση SPARQL επερώτησης 12

13 2. Το Πρότυπο RDF Το πρότυπο RDF κάνει την εμφάνισή του για πρώτη φορά το 1995 από την κοινοπραξία του Παγκόσμιου Ιστού (W3C) ως επέκταση της πλατφόρμας του PICS (Platform for Internet Content Selection) για την επιλογή περιεχομένου στο διαδίκτυο. Το PICS, ήταν ένας μηχανισμός που αποσκοπούσε στην περιγραφή περιεχομένων των ιστοσελίδων και στην αξιολόγησή τους. Εν ολίγοις, για κάθε πληροφορία που ανταλλάσσονταν μεταξύ πελάτη και εξυπηρετητή, υπήρχε αξιολόγηση από τον κάθε οργανισμό ή άτομο ανάλογα με τις απαιτήσεις που έθεταν. Με αυτό το πρόγραμμα γεννήθηκε η ιδέα ότι η ανταλλαγή πληροφοριών μεταξύ των ανθρώπων πρέπει να γίνεται κατανοητή και από τις μηχανές, αφού μέχρι και εκείνη τη στιγμή οι πληροφορίες ήταν κατανοητές μόνο από τον άνθρωπο και οι μηχανές ήταν απλά το μέσο για τη μεταφορά της πληροφορίας. Το 2004 το W3C αποφάσισε την τελική μορφή του που θα έχει το RDF. Στην ουσία το RDF περνάει από το στάδιο της έρευνας σε στάδιο εφαρμογής και πλέον αρχίζει να χρησιμοποιείται μαζικά από διάφορους εμπορικούς και μη οργανισμούς με σκοπό την κατανόηση και αξιολόγηση της πληροφορίας που ανταλλάσσουν οι πελάτες με τους εξυπηρετητές τους. (Klyne & Carroll, 2004) Εικόνα 3 Αναπαράσταση RDF γράφου Το πρότυπο RDF έχει διάφορες μορφές συντακτικού. Αυτό γίνεται για τον λόγο ότι κάθε εργαλείο ανάλυσης γράφων αναπαριστά το συντακτικό των γράφων με δικό του τρόπο. Οι μορφές αναπαράστασης συντακτικού του παραπάνω γράφου είναι: RDF/XML. Είναι το αρχικό πρότυπο που δομήθηκε πάνω το RDF και βασίζεται στη γλώσσα XML. Είναι το πρότυπο το οποίο υποστηρίζεται σχεδόν από όλα τα εργαλεία αναπαράστασης RDF, με μειονέκτημα ότι περιέχει αρκετές περιττές πληροφορίες και δεν είναι εύκολα αναγνώσιμο από τον άνθρωπο. 13

14 Στην προηγούμενη εικόνα η αναπαράσταση του RDF/XML συντακτικού θα ήταν: <rdf:rdf xmlns:rdf=" xmlns:foaf=" xmlns=" <foaf:person rdf:about=" <foaf:mbox <foaf:homepage rdf:resource=" <foaf:family_name>smith</foaf:family_name> <foaf:givenname>joe</foaf:givenname> </foaf:person> </rdf:rdf> N- triples. Είναι ο πιο άμεσος τρόπος αναπαράστασης RDF γράφων καθώς οι πόροι του αναπαρίστανται υπό τη μορφή τριάδων. Κάθε τριάδα γράφεται σε κάθε γραμμή του προτύπου και σε αντίθεση με το RDF/XML είναι ευανάγνωστο από τον άνθρωπο. Στο ίδιο παράδειγμα η μορφή του προηγουμένου RDF/XML σε N triples θα είναι: < < < < < "Smith". < < <mailto:joe.smith@example.org>. < < "Joe". < < < Turtle. Το Turtle πρότυπο είναι πανομοιότυπο με το N triples καθώς χρησιμοποιεί και αυτό τους πόρους υπό τη μορφή τριάδων, με τη διαφορά ότι έχει πιο απλή δομή. Η αναπαράσταση του παραπάνω παραδείγματος σε foaf: < < a foaf:person ; foaf:mbox <mailto:joe.smith@example.org> ; foaf:homepage < ; foaf:family_name "Smith" ; foaf:givenname "Joe". RDFa. Το συγκεκριμένο πρότυπο είναι ένα mark up σχήμα το οποίο έχει τη δυνατότητα να ενσωματώνει τις RDF περιγραφές σε HTML και XHTML πρότυπα. Δίνει τη δυνατότητα δημοσίευσης δεδομένων RDF σε ιστοσελίδες, από τις οποίες μπορούν να συλλέξουν οι μηχανές αναζήτησης την πληροφορία που διατίθεται. Η αναπαράσταση του προηγουμένου παραδείγματος με μορφή RDFa είναι: <div xmlns=" prefix=" foaf: rdf: rdfs: > <div typeof="foaf:person" about=" <div property="foaf:family_name" content="smith"></div> <div property="foaf:givenname" content="joe"></div> <div rel="foaf:homepage" resource=" <div rel="foaf:mbox" resource="mailto:joe.smith@example.org"></div> 14

15 </div> </div> RDF/JSON. Το συγκεκριμένο πρότυπο βασίζεται στην αναπαράσταση με μορφή JSON των RDF δεδομένων. Δεν είναι τίποτα άλλο παρά η ίδια πληροφορία σε άλλη μορφή. Το μεγαλύτερο πλεονέκτημα που διαθέτει το συγκεκριμένο πρότυπο είναι ότι βρίσκεται στην κορυφή των επιλογών για ανταλλαγή δεδομένων στον Ιστό και επίσης είναι πολύ εύκολα κατανοητό από τον άνθρωπο. Η αναπαράσταση του προηγουμένου παραδείγματος σε μορφή JSON: { "@context": { "foaf": " "rdf": " "rdfs": " "xsd": " }, "@id": " "@type": "foaf:person", "foaf:family_name": "Smith", "foaf:givenname": "Joe", "foaf:homepage": { "@id": " }, "foaf:mbox": { "@id": "mailto:joe.smith@example.org" } } 2.1 Η χρήση του RDF Προτύπου στο Σημασιολογικό Ιστό Για την υλοποίηση του Σημασιολογικού Ιστού, η βασική ιδέα ήταν η Στοίβα του Σημασιολογικού Ιστού. Σαν Στοίβα αναφέρεται η πυραμίδα με τις τεχνολογίες, τα πρότυπα και τις έννοιες που πρέπει να στηριχτεί ο Σημασιολογικός Ιστός. (Berners- Lee, 2009) Εικόνα 4 Στοίβα Σημασιολογικού Ιστού 15

16 Στο χαμηλότερο στρώμα της πυραμίδας βρίσκεται το πρότυπο Unicode μαζί με το URI. Αυτά τα δύο πρότυπα είναι η βάση όλου του οικοδομήματος που θα χτιστεί επάνω του όλη η ιδέα του Σημασιολογικού Ιστού. Το πρότυπο του Unicode χρησιμοποιείται για την κωδικοποίηση κειμένου ενώ το URI χρησιμοποιείται για την απόδοση της μοναδικότητας των πόρων στο μοντέλο. Στο αμέσως επόμενο στρώμα βρίσκεται η γλώσσα σήμανσης XML, τα Namespaces και το XMLscema. Η γλώσσα XML, κάνει χρήση του Unicode για την αναπαράσταση των κειμένων που περιέχει, η χρήση της είναι κυρίως για την αναπαράσταση δεδομένων και για τη μεταφορά τους στον Ιστό. Τα Namespaces είναι ένα σύνολο συμβόλων και χαρακτήρων που χρησιμοποιούνται για την οργάνωση αντικειμένων από διάφορα είδη, με σκοπό η αναφορά τους σε αυτά να γίνεται με έναν εύκολο και άμεσο τρόπο χρησιμοποιώντας μόνο το όνομα που έχει οριστεί. Το XMLscema περιγράφει τη δομή ενός αρχείου XML. Τυπικά εκφράζεται με όρους σταθερών στη δομή και το περιεχόμενο των αρχείων τύπου XML, σε ένα παραπάνω επίπεδο από το βασικό συντακτικό που περιέχη η γλώσσα XML. Αυτές οι σταθερές σε γενικές γραμμές εκφράζονται χρησιμοποιώντας κάποιο συνδυασμό γραμματικών κανόνων που καθορίζουν τη σειρά των αντικειμένων που περιέχει το αρχείο, δυαδικά κατηγορήματα (Boolean Predicates) που πρέπει να ικανοποιεί το περιεχόμενο, τύπους δεδομένων που ορίζουν το περιεχόμενο των αντικειμένων και των ιδιοτήτων και άλλους κανόνες. Στο τρίτο στρώμα βρίσκεται το πρότυπο του RDF και το RDFscema. Το RDFscema είναι ένα σύνολο κλάσεων με συγκεκριμένες ιδιότητες που κάνουν χρήση του μοντέλου δεδομένων για γνωσιακή αναπαράσταση RDF, παρέχοντας βασικά στοιχεία για την περιγραφή των οντολογιών με σκοπό τη δόμηση των RDF πόρων. Στο τέταρτο στρώμα βρίσκεται το Λεξιλόγιο Οντολογιών το οποίο αποσκοπεί στη θέσπιση ενός ενιαίου και κοινού λεξιλογίου καθώς και τη δημιουργία μιας μεθοδολογίας για τον έλεγχο πιστότητας και συμπερασμάτων για τους χρήστες. Στο πέμπτο στρώμα βρίσκεται η λογική που διέπει τα υπάρχοντα δεδομένα. Στο έκτο στρώμα βρίσκεται η απόδειξη που αφορά τις δηλώσεις και τις επικυρώσεις των νέων συστημάτων. Στο έβδομο και τελευταίο στρώμα βρίσκεται η εμπιστοσύνη. Η εμπιστοσύνη ορίζει ότι όλες οι δηλώσεις στον Ιστό βρίσκονται σε ένα περιβάλλον το οποίο μπορεί να οριστεί ως έγκυρο Μεταξύ του τρίτου και του έκτου στρώματος υπάρχει η ψηφιακή υπογραφή, η οποία είναι μία τεχνολογία που χρησιμοποιείται από τους δημιουργούς των εγγράφων με σκοπό τη διασφάλιση της εγκυρότητάς τους και την αποποίηση επεξεργασία τους από τρίτους χωρίς την απαραίτητη έγκρισή τους. 16

17 Το μοντέλο του RDF περιγράφει μία δομημένη πληροφορία, ακολουθεί τη δομή ενός γράφου και χρησιμοποιεί τα URI s για να αναφέρεται με μονοσήμαντο τρόπο στους πόρους. Βασικό χαρακτηριστικό του RDF είναι ότι είναι φτιαγμένο επάνω στη λογική του Σημασιολογικού Ιστού και των Συνδεδεμένων Δεδομένων και αποτελεί ένα από τα σημαντικότερα μέσα αναπαράστασης και περιγραφής των πληροφοριών. Η δομή του RDF είναι ότι πάντα δημιουργεί τριάδες για τις σχέσεις που πραγματώνει. Σαν τριάδα ορίζεται η πρόταση με χαρακτηριστικά: υποκείμενο, κατηγόρημα και αντικείμενο. Το υποκείμενο είναι ο πόρος για τον οποίο γίνεται μία δήλωση, το κατηγόρημα περιγράφει τις ιδιότητες, τα χαρακτηριστικά ή τις σχέσεις μεταξύ υποκείμενου και αντικείμενου, ενώ το αντικείμενο είναι ο πόρος που προσδιορίζει την τιμή του κατηγορήματος. (Σπανός, 2015) Εικόνα 5 Παράδειγμα αναπαράστασης τριάδων RDF μοντέλου Όπως φαίνεται στο παραπάνω σχήμα το υποκείμενο έχει δύο κατηγορήματα, εκ των οποίων το πρώτο κατηγόρημα δείχνει σε ένα αντικείμενο πόρο, ενώ το δεύτερο κατηγόρημα δείχνει σε ένα αντικείμενο που περιέχει μόνο μία τιμή. Κάλλιστα το παραπάνω σχήμα θα μπορούσε να έχει ως υλοποίηση το εξής σχήμα: Alexandros 17

18 Στο παραπάνω παράδειγμα ο πόρος αντικατοπτρίζει έναν άνθρωπο ο οποίος από το κατηγόρημα δείχνει ότι γεννήθηκε στο αντικείμενο με URI το οποίο δηλώνει ότι είναι η πόλη της Αθήνας, και το δεύτερο κατηγόρημα δηλώνει ότι το πρόσωπο που βρίσκεται στο υποκείμενο έχει σαν μικρό όνομα την τιμή του αντικειμένου Alexandros. Όπως φάνηκε και από το παράδειγμα η χρήση των URI s είναι ζωτικής σημασίας για το RDF μοντέλο. Οι πόροι που χρησιμοποιήθηκαν στο παραπάνω παράδειγμα είχαν μοναδικά αναγνωριστικά. Για παράδειγμα ο πόρος URI θα μπορούσε σε κάποια άλλη τριάδα να βρίσκεται σαν υποκείμενο, το οποίο να έχει κάποιες άλλες ιδιότητες που να το περιγράφουν. Πιο συγκεκριμένα μία τριάδα που θα μπορούσε να χρησιμοποιηθεί σαν υποκείμενο η πόλη της Αθήνας είναι: Prefix demo: <demo:athens> < <demo:greece> Η παραπάνω τριάδα δείχνει ότι η πόλη της Αθήνας βρίσκεται στην χώρα Ελλάδα. Γενικά στην ιδέα των URI s δεν είναι μόνο η μοναδικότητα που προσφέρουν για να αναπαραστήσουν ένα πόρο, αλλά και η δυνατότητα που προσφέρει το μοντέλο για επαναχρησιμοποίηση των ίδιων URI s είτε σαν υποκείμενα είτε σαν αντικείμενα. Επίσης το μοντέλο RDF δίνει τη δυνατότητα στο χρήστη να μην γράφει κάθε φορά όλο το URI του κάθε πόρου της τριάδας. Όπως φάνηκε στη παραπάνω τριάδα χρησιμοποιήθηκε η λέξη κλειδί prefix. Με το prefix δύναται ο χρήστης να δηλώσει στην αρχή του RDF κάποια URL s ώστε να μπορεί να τα επαναχρησιμοποιεί συνέχεια κατά τη διάρκεια του RDF εγγράφου. Έτσι εάν χρησιμοποιηθεί η δήλωση prefix demo: κάθε φορά που θα αναφέρεται σε κάποια τοποθεσία θα μπορεί να γράφει το όνομα του prefix που είναι το demo και μετά την άνω κάτω τελεία θα βάζει το όνομα της τοποθεσίας που θέλει. Οπότε για να χρησιμοποιηθεί η πόλη της Αθήνας, το μόνο που θα αρκεί θα είναι demo: Athens. Όπως έχει ήδη αναφερθεί, ο στόχος του μοντέλου RDF είναι να δημιουργούνται τριάδες οι οποίες είναι εύκολα κατανοητές από τον άνθρωπο, αλλά και από τις μηχανές. Για να γίνει αυτό το W3C έχει θεσπίσει δύο κανόνες: Να υπάρχουν URI s τα οποία θα προσδιορίζουν το υποκείμενο, το κατηγόρημα και το αντικείμενο (αν αυτό δεν είναι κάποια τιμή) με μοναδικό τρόπο ώστε να μην υπάρχουν διπλότυπες δηλώσεις αυτών στον Ιστό. 18

19 Να υπάρχει μια κατανοητή και επεξεργάσιμη γλώσσα από τις μηχανές προκειμένου να γίνεται δυνατή η αναπαράσταση και η ανταλλαγή των τριάδων ανάμεσα τους. (Berners-Lee, 2009) Το RDF χρησιμοποιείται επίσης για την αναπαράσταση μοντέλου κατευθυνόμενων γράφων με ετικέτες στις ακμές και τους κόμβους του, στους οποίους γράφους συνδυάζονται πολλά και διαφορετικά λεξικά. Επίσης οι γράφοι είναι επεκτάσιμοι καθώς μπορούν να προστεθούν σε αυτούς νέοι κόμβοι και ακμές. Στο μοντέλο οι κόμβοι είναι οι πόροι, οι αλφαριθμητικές τιμές ή οι κενοί κόμβοι ενώ οι ακμές είναι οι σχέσεις μεταξύ των κόμβων. Οι αλφαριθμητικές τιμές των κόμβων ορίζουν την κλάση Literal, η οποία κλάση περιέχει ένα απλό αλφαριθμητικό κείμενο, το οποίο μπορεί να αντικαταστήσει το αντικείμενο σε μία τριάδα του RDF μοντέλου. Οι κενοί κόμβοι ορίζουν την κλάση Black Nodes, οι οποίοι είτε δεν περιέχουν κάποια τιμή είτε το περιεχόμενό τους είναι άγνωστο. Εικόνα 6 Παράδειγμα Blank Node Όπως φαίνεται στο παραπάνω σχήμα ο πόρος έχει σχέση την με έναν κενό κόμβο, ο οποίος με τη σειρά του έχει τρεις σχέσεις με τα Literals 346 Board Street, Athens, Georgia και αντίστοιχες σχέσεις Γενικά είναι μία τακτική που χρησιμοποιείται αρκετά συχνά σε περιπτώσεις που ο χρήστης του RDF δεν θέλει να ορίσει πολλές σχέσεις μεταξύ του υποκειμένου και πολλών αντικειμένων, οπότε ορίζει μόνο μία σχέση με έναν κενό κόμβο και εκείνος με τη σειρά του ορίζει τις σχέσεις με τους υπόλοιπους πόρους. Μία επίσης πολύ σημαντική ιδιότητα που έχει το RDF είναι η υποστατικοποίηση. Υποστασιοποίηση είναι η διαδικασία κατά την οποία μπορούν κάποιες δηλώσεις να διατυπωθούν σε άλλες. Στο RDF μοντέλο υπάρχει το ενσωματωμένο λεξιλόγιο ιδιοτήτων, οι οποίες ιδιότητες είναι το rdf: subject, rdf: predicate, rdf: object και το rdf: type. Οπότε για κάθε νέο πόρο στο μοντέλο που περιέχει τις τέσσερες προαναφερθείσες ιδιότητες, αναπαριστά την αρχική δήλωση και μπορεί να χρησιμοποιηθεί σαν 19

20 αντικείμενο άλλης ιδιότητας. Έτσι ο πόρος δεν αντικαθιστά την αρχική δήλωση, αλλά είναι μια υποστασιοποιημένη δήλωση. (Σπανός, 2015) Εικόνα 7 Παράδειγμα Υποστασιοποίησης σε RDF μοντέλο Στο παραπάνω παράδειγμα διακρίνεται η δήλωση ότι η Ιστοσελίδα κοστίζει 0,05 λίρες και μέχρι το Σεπτέμβρη του Αυτό πρακτικά σημαίνει ότι η συγκεκριμένη δήλωση θα έχει ισχύ μέχρι τότε. Οπότε στο μοντέλο αναπαρίσταται: < cost 0.05 και όλη αυτή η δήλωση έχει σαν κατηγόρημα το validuntil και σαν αντικείμενο το Στο RDF υπάρχουν επίσης τα περιβλήματα (containers), τα οποία χρησιμοποιούνται για την αναπαράσταση ομάδων αντικειμένων. Το περίβλημα είναι επί της ουσίας ένας πόρος που αποτελείται από άλλες οντότητες που μπορούν με τη σειρά τους να είναι και αυτοί πόροι. Στο RDF υπάρχουν τρεις τύποι περιβλημάτων: Bag. Πρόκειται για τον πόρο τύπου rdf: bag ο οποίος αναπαριστά μια ομάδα από πόρους ή Literals στην οποία τα μέλη της ομάδας δεν ακολουθούν συγκεκριμένη διάταξη. Sequence ή Seq. Πρόκειται για έναν πόρο τύπου rdf: seq ο οποίος αναπαριστά μία ομάδα από πόρους ή Literals που τα μέλη της ακολουθούν μία συγκεκριμένη διάταξη. Alternative ή Alt. Πρόκειται για έναν πόρο τύπου rdf: alt ο οποίος αναπαριστά μια ομάδα από πόρους ή Literals με εναλλακτικές τιμές ενός άλλου αντικειμένου, όπως για παράδειγμα ο εναλλακτικός τίτλος ενός βιβλίου. Τα περιβλήματα δεν έχουν κάποιο συγκεκριμένο περιορισμό ως προς τη μοναδικότητα των τιμών τους. Ο μοναδικός περιορισμός που υπάρχει είναι ότι τα ίδια τα περιβλήματα δεν είναι σε θέση να επιβεβαιώνουν την ύπαρξη άλλων μελών μέσα σε έναν πόρο. Όπως αναφέρθηκε σε προηγούμενο κομμάτι, ένα από τα πιο σημαντικά πρότυπα υλοποίησης του RDF είναι το RDF/XML. Το συγκεκριμένο πρότυπο έχει τη δυνατότητα να επεξεργάζεται από τις μηχανές και μέσω των URI s συνδέει την πληροφορία μέσα στον Ιστό. Οι διαφορές μεταξύ του XML και του RDF δεν είναι τόσο 20

21 σε επίπεδο σύνταξης αλλά που εξυπηρετεί το κάθε πρότυπο. Το XML έχει τη δυνατότητα να περιγράφει την πληροφορία, ενώ το RDF έχει τη δυνατότητα να εξετάζει το σημασιολογικό επίπεδο αυτής. Στην ουσία το RDF κάνει χρήση του XML για να αναπαραστήσει την εννοιολογική πληροφορία που έχει. Η αναπαράσταση αυτή χωρίζεται σε δύο κατηγορίες: Τη σειριακή, όπου το μοντέλο εκφράζεται με έναν συστηματικό τρόπο. Τη συντετμημένη, όπου το μοντέλο αναπαρίσταται με έναν πιο συντομογραφικό τρόπο. Στη σειριακή γίνεται η ομαδοποίηση πολλών δηλώσεων που αφορούν τον ίδιο πόρο με τη χρήση της ετικέτας Description. Για παράδειγμα: <?xml version="1.0"?> <rdf:rdf xmlns:rdf=" xmlns:ex=" <rdf:description rdf:about=" <ex:title>a title</ex:title> <ex:author>alexandros Stavrakas</ex:author> </rdf:description> </rdf:rdf> Στο παράδειγμα ο πόρος που περιγράφεται είναι ο Σαν περιγραφή περιέχει τον τίτλο που δίνεται από την ιδιότητα ex: title και την τιμή A Title και τον συγγραφέα που δίνεται από την ιδιότητα ex: author που έχει σαν τιμή το Alexandros Stavrakas. Στη συντετμημένη υπάρχουν δύο τμήματα. Στο πρώτο τμήμα περιλαμβάνονται μόνο οι ιδιότητες που δεν επαναλαμβάνονται μέσα σε ένα Description και αναπαρίστανται ως γνωρίσματα της XML και στο δεύτερο τμήμα περιλαμβάνονται όλα τα εμφωλευμένα στοιχεία του Description. Το προηγούμενο παράδειγμα αποτελεί το πρώτο τμήμα μιας συντετμημένης αναπαράστασης, ενώ ένα παράδειγμα δευτέρου τμήματος είναι: <?xml version="1.0"?> <rdf:rdf xmlns:rdf=" xmlns:ex=" <rdf:description rdf:about=" <ex:title>a title</ex:title> 21

22 <ex:author> </ex:author> </rdf:description> </rdf:rdf> <rdf:description rdf:about=" </rdf:description> <ex:name>alexandros</ex:name> <ex:surname>stavrakas</ex:surname> <ex:yearborn>1990</ex:yearborn> Στο συγκεκριμένο παράδειγμα υπάρχει ένα Description για τον συγγραφέα που έχει σαν πόρο το και σαν ιδιότητες τα ex: name, ex: surname, ex: yearborn με τιμές Alexandros, Stavrakas και 1990 αντιστοίχως. Η ανάγκη για επέκταση στο αρχικό σημασιολογικό σχήμα του RDF, έκανε τους δημιουργούς του να φτιάξουν το RDFS (RDF schema). Το RDFS είναι επέκταση του RDF και παρέχει μηχανισμούς για την περιγραφή ομάδων πόρων του Ιστούς καθώς και τις σχέσεις ανάμεσα σε αυτούς τους πόρους. Πέραν της παροχής των μηχανισμών, το RDFS προσδιορίζει τη σημασιολογία των πόρων σε αντίθεση με το RDF που απλά παρείχε ένα μοντέλο για την περιγραφή τους. (Klyne & Carroll, 2004) Το RDFS είναι δομημένο σε κλάσεις και ιδιότητες. Με τη δομή του γίνεται πλέον εύκολη υπόθεση η κατηγοριοποίηση των πόρων σε κλάσεις και ταυτόχρονα η ιεράρχησή των κλάσεων αυτών με σκοπό την ύπαρξη απλών οντολογιών. Η ύπαρξη ιδιοτήτων πλέον δεν είναι απλά περιγραφική όπως συνέβαινε με το RDF, αλλά οι ιδιότητες έχουν εννοιολογική σημασία και ορίζονται πλέον και ξέχωρα από τις κλάσεις. Γενικά η RDFS δημιουργήθηκε με σκοπό την εξαγωγή συμπερασμάτων και δημιουργία οντολογιών. Σαν οντολογία έχει οριστεί ένα σχήμα δεδομένων το οποίο περιγράφει ένα λεξιλόγιο εννοιών που είναι κοινό για όλα τα δεδομένα και επίσης η σημασιολογία του είναι προσδιορισμένη έτσι ώστε να είναι επεξεργάσιμη από όλες τις μηχανές. Τέλος το RDFS περιέχει μικρά λεξιλόγια για το RDF όπως το Class, subclassof, type, Property, subpropertyof, domain, range τα οποία λεξιλόγια είναι βάση για τη δημιουργία νέων λεξιλογίων όπως το Bibframe. 22

23 3. Αποθήκευση Συνδεδεμένων Δεδομένων Στο πλαίσιο της διπλωματικής εργασίας, έγινε έρευνα στις αποθήκες συνδεδεμένων δεδομένων που υπάρχουν. Οι αποθήκες δεδομένων λειτουργούν στο πρότυπο του κατευθυνόμενου Γράφου. Κάθε Γράφος απαρτίζεται από Κόμβους και Ακμές. Ο κάθε Κόμβος αναπαριστά μία λογική οντότητα ή μία τιμή ενώ κάθε Ακμή αναπαριστά τη λογική σχέση που υπάρχει μεταξύ δύο Κόμβων. Επειδή ο Γράφος είναι κατευθυνόμενος, η σχέση έχει ένα πεδίο ορισμού (Domain) και μία εμβέλεια (Range). Εικόνα 8 Παράδειγμα Γράφου Συνδεδεμένων Δεδομένων Όπως φαίνεται από το σχήμα υπάρχουν οι λογικές Οντότητες Person, Twitter, Blog, Content, Term Post Date, Headline και οι τιμές String. Σύμφωνα με τον Γράφο η Οντότητα Person έχει τις σχέσεις realname και καταλήγει σε μία τιμή String. Αυτό σημαίνει ότι η σχέση ξεκινάει από την Οντότητα Person και καταλήγει σε μία τιμή String. Επίσης η Οντότητα Person έχει μία σχέση hastwitter και καταλήγει σε μία άλλη Οντότητα Twitter. Το σημαντικό στο παράδειγμα που εξετάζεται είναι ότι αυτό το Μοντέλο μπορεί να υλοποιηθεί για πολλά πρόσωπα. Πρακτικά αν η Οντότητα Person υλοποιηθεί από κάποιο Αντικείμενο (Instance) με μοναδικό αναγνωριστικό κάποιο Uri πχ. θα έχει realname Bob Something, ένα hastwitter τον λογαριασμό του όπως και μία σχέση 23

24 hasblog που καταλήγει σε ένα Blog Uri Όλες αυτές οι σχέσεις αναπαρίστανται υπό τη μορφή τριάδων. Στον Παγκόσμιο Ιστό τα δεδομένα αποθηκεύονται σε συμβατικές βάσεις δεδομένων όπως οι σχεσιακές και οι ιεραρχικές. Οι σχεσιακές βάσεις δεδομένων οργανώνουν τα δεδομένα σε έναν ή περισσότερους πίνακες (σχέσεις) που απαρτίζονται από γραμμές και στήλες, με κάθε μοναδικό κλειδί για κάθε γραμμή. Στα ιεραρχικά μοντέλα αποθήκευσης, τα δεδομένα οργανώνονται σε μία δενδρική δομή. Τα δεδομένα αποθηκεύονται σαν εγγραφές και συνδέονται με μεταξύ τους με συνδέσμους. Κάθε εγγραφή είναι μία συλλογή από πεδία, όπου κάθε πεδία περιέχει μία και μόνο τιμή. (Tomaszuk, 2010) Εικόνα 9 Τρόποι αποθήκευσης Δεδομένων Σε αντίθεση με τις Σχεσιακές Βάσεις Δεδομένων, οι Βάσεις Δεδομένων Γράφων (Graph Databases) δεν έχουν κάποια μορφή που να αποθηκεύουν τα δεδομένα. Αυτό σημαίνει ότι τα δεδομένα αποθηκεύονται απευθείας στη Βάση με μορφή τριάδων και έτσι επιτρέπεται η απευθείας σύνδεση των δεδομένων αυτών και σε ορισμένες περιπτώσεις η ανάκτησή τους γίνεται με μία ενέργεια. Μία άλλη σημαντική διαφορά είναι ότι επιτρέπεται η επεξεργασία των δεδομένων στη φυσική τους δομή, όπου μεταξύ άλλων, οι σύνδεσμοι μεταξύ των δεδομένων αποθηκεύονται μαζί με τα δεδομένα στο λογικό επίπεδο και γίνεται χρήση σχεσιακών αλγεβρικών πράξεων (ένωση, τομή, κλπ.) που είναι αναγκαίες για την επιστροφή σχετικών δεδομένων σε λογική μορφή. Επίσης, η σημαντικότητα των Graph Databases έγκειται στο ότι η σχέση που συνδέει δύο κόμβους μεταξύ τους πολλές φορές είναι πολύ πιο χρήσιμη ακόμη και από τα δεδομένα των ίδιων των κόμβων. Η ανάκτηση των δεδομένων σε Graph Databases γίνεται με χρήση γλωσσών επερωτήσεων που διαφέρουν από την τυπική 24

25 SQL που είναι καθαρά σχεδιασμένη για την ανάκτηση δεδομένων σε Σχεσιακές Βάσεις. Ενδεικτικά κάποιες Γλώσσες Επερωτήσεων σε Graph Databases, πέραν της SPARQL, είναι η Cypher και η Gremlin. Σε πρακτικό επίπεδο, οι σχεσιακές βάσεις είναι ιδανικές στη χρήση για επίπεδη διάταξη δεδομένων, όπου οι σχέσεις μεταξύ των δεδομένων είναι σε βάθος ενός ή δύο επιπέδων. Στον αντίποδα οι Graph databases αποσκοπούν σε συστήματα κοινωνικής δικτύωσης ή σε συστήματα μεγάλων δεδομένων. (Kumar, 2011) Στον πίνακα που ακολουθεί φαίνονται οι διαφορές μεταξύ των Σχεσιακών βάσεων και των βάσεων Γράφων ΣΧΕΣΙΑΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Πίνακες Γραμμές Στήλες και Δεδομένα Περιορισμοί (Constraints) Ένωση (Joins) ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΓΡΑΦΩΝ Γράφοι Κόμβοι Ιδιότητες και οι τιμές τους Σχέσεις Διαδρομή ακμών (Traversal) Στο πλαίσιο της Διπλωματικής εργασίας ερευνήθηκαν οι παρακάτω Βάσεις Δεδομένων: Neo4J MongoDB Apache Jena 3.1. Neo4J To Neo4J είναι ένα προϊόν της Neo4J Inc. που κυκλοφόρησε το Είναι ένα σύστημα διαχείρισης Graph Database και αρκετά δημοφιλές στο ευρύ κοινό. Είναι ένα προϊόν ανοιχτού λογισμικού με πάρα πολλές δυνατότητες επέκτασης μέσω των διαθέσιμων plugins που κυκλοφορούν και βρίσκονται διαθέσιμα στο repository του Neo4J. Αναπτύχθηκε σε γλώσσα προγραμματισμού Java και είναι διαθέσιμο από άλλες γλώσσες προγραμματισμού κάνοντας χρήση της Cypher, μέσω ενός HTTP endpoint. Η Cypher είναι μια γλώσσα επερωτήσεων που αναπτύχθηκε ειδικά για το Neo4J. Το Neo4J είναι επεκτάσιμο και δεν διαθέτει συγκεκριμένο σχήμα (ανήκει στις NoSQL βάσεις δεδομένων). Το Neo4J παρέχει τις εξής δυνατότητες: Μοντέλου Δεδομένων. Ακολουθεί ένα μοντέλο δεδομένων που ονομάζεται μοντέλο Γράφου εγγενών ιδιοτήτων. Σε αυτό το μοντέλο, ο γράφος περιέχει κόμβους (οντότητες) και αυτοί οι κόμβοι συνδέονται με άλλους κόμβους με 25

26 συσχετίσεις. Οι κόμβοι και οι σχέσεις τους αποθηκεύουν δεδομένα σαν ζεύγη key-value, γνωστά ως ιδιότητες. ACID Ιδιότητες. Το Neo4J ακολουθεί πλήρως το ACID. Το συγκεκριμένο ακρωνύμιο προκύπτει από τους όρους: Atomicity (Ατομικότητα), Consistency (Συνέπεια), Isolation (Απομόνωση) και Durability (Μονιμότητα). o Η Ατομικότητα καθορίζεται από το γεγονός ότι αν για οποιοδήποτε λόγο ένα μέρος μιας συναλλαγής αποτύχει, αποτυγχάνει στο σύνολό της όλη η συναλλαγή και η Βάση παραμένει στο αρχικό της στάδιο (όπως ακριβώς ήταν πριν εκτελεστεί η συναλλαγή). o Η Συνέπεια καθορίζεται από τους κανόνες που θέτονται σε μια Βάση Δεδομένων και πως αυτοί δεν παραβιάζονται από μια κατάσταση της Βάσης με μια μεταγενέστερη κατάσταση. Μία συναλλαγή όταν τελειώνει πρέπει να θεωρείται έγκυρη και να έχει ισχύ. o Η Απομόνωση είναι η απαίτηση ότι όλες οι ενέργειες δεν μπορούν να έχουν πρόσβαση σε δεδομένα τα οποία τροποποιούνται εκείνη τη στιγμή από μία μη ολοκληρωμένη συναλλαγή. Κάθε συναλλαγή για να εκτελεστεί θα πρέπει προγενέστερα να έχει τελειώσει η προηγούμενη. o Η Μονιμότητα είναι η βεβαίωση ότι κάθε συναλλαγή όταν ολοκληρωθεί επιτυχώς, τα αποτελέσματα της δεν θα χαθούν. Ευελιξία και Αξιοπιστία. Στο Neo4J υπάρχει η δυνατότητα να αυξηθεί ο αριθμός των reads/writes και ο χώρος αποθήκευσης χωρίς να επηρεαστεί η ταχύτητα επεξεργασίας μιας επερώτησης και η ακεραιότητα των δεδομένων. Γλώσσα Επερωτήσεων Cypher. Η Cypher είναι μια δηλωτική γλώσσα επερωτήσεων κατασκευασμένη για το Neo4J. Χρησιμοποιεί ASCII art για την απεικόνιση των γράφων της Βάσης. Είναι αρκετά εύκολη στην εκμάθηση καθώς μπορεί να επιστρέφει αποτελέσματα και τις σχέσεις τους χωρίς να απαιτούνται σύνθετα επερωτήματα. Ενσωματωμένη Εφαρμογή Ιστού. Το Neo4J παρέχει μία ενσωματωμένη εφαρμογή ιστού, τον Neo4J Browser. Μέσω αυτού, μπορεί ο χρήστης να δημιουργήσει και να επερωτήσει τα δεδομένα του. Οδηγοί. Το Neo4J έχει τη δυνατότητα να επικοινωνεί με γλώσσες προγραμματισμού, μέσω REST APIs, όπως η Java, Spring, Scala και η Javascript μέσω του framework NodeJS. Υποστηρίζονται δύο τύποι Java API: το Cypher API και το τοπικό Java API. Επιπρόσθετα μπορεί να λειτουργήσει και με άλλες βάσεις δεδομένων όπως η MongoDB, η Cassandra κλπ. Ευρετηρίαση. Υποστηρίζεται η ευρετηρίαση στο Neo4J μέσω του εργαλείου Lucene της Apache. Η Βάση Γράφων του Neo4J περιέχει τα ακόλουθα συστατικά μέρη: 26

27 Τον Κόμβο που είναι θεμελιώδης μονάδα για ένα Γράφο. Περιέχει ιδιότητες με ζεύγη Κλειδιών Τιμών. Τις Ιδιότητες που είναι τα ζεύγη Κλειδιών Τιμών για την περιγραφή των Κόμβων και των Σχέσεων. Τις Σχέσεις που είναι επίσης θεμελιώδεις πυλώνες για την κατασκευή ενός Γράφου. Οι Σχέσεις ενώνουν δύο Κόμβους μεταξύ τους και είναι κατευθυνόμενες. Ξεκινούν δηλαδή από έναν αρχικό και καταλήγουν σε έναν τελικό Κόμβο. Επίσης οι σχέσεις μπορούν να περιλαμβάνουν Ιδιότητες που είναι ζεύγη κλειδιών τιμών. Τις Ετικέτες, που συσχετίζουν ένα απλό όνομα με μία συλλογή από Κόμβους ή Σχέσεις. Κάθε Κόμβος ή σχέση μπορεί να περιλαμβάνει μία ή και περισσότερες ετικέτες. Επίσης μπορούν να δημιουργηθούν ετικέτες σε κάθε υπάρχον Κόμβο ή Σχέση, όπως επίσης και να διαγραφούν από αυτούς. Στις δυνατότητες που παρέχονται από το Neo4J, συμπεριλαμβάνεται η εξαγωγή των δεδομένων από τον Γράφο που έχει δημιουργηθεί με μορφή είτε CSV είστε JSON αλλά και η δυνατότητα γραφικής αναπαράστασης ενός Γράφου. Εικόνα 10 Γραφική Αναπαράσταση Γράφου στο Neo4J Όπως φαίνεται από το σχήμα παραπάνω, έχει γίνει μία επερώτηση στο Γράφο και εκείνος επέστρεψε (σε γραφική μορφή) τα αποτελέσματα αυτού του επερωτήματος. Οι επερωτήσεις σε Neo4J γίνονται με την Γλώσσα Cypher. Η Cypher έχει πολύ απλή σύνταξη, η οποία παρουσιάζει αρκετά κοινά με την SQL. Για να γίνει ανάκτηση δεδομένων από ένα Γράφο, η γενική σύνταξη του επερωτήματος είναι: 27

28 MATCH (node:label) RETURN node.property MATCH (node1:label1)-[]->(node2:label2) WHERE node1.propertya = {value} RETURN node2.propertya, node2.propertyb Όπου στις παρενθέσεις ορίζονται οι Κόμβοι, οι Ετικέτες αυτών (αν επιθυμεί ο χρήστης μπορεί να επιλέξει να βάλει καμία ή και περισσότερες ετικέτες) και οι Ιδιότητες αυτών. Στις αγκύλες τοποθετούνται οι Σχέσεις που ενώνουν δύο Κόμβους καθώς επίσης και οι Ετικέτες και οι Ιδιότητες των Σχέσεων αυτών. Στα άγκιστρα τοποθετούνται οι τιμές των Ιδιοτήτων. Οι σύνταξη (a) [:rel] (b) αναπαριστά ένα μονοπάτι του Γράφου. Τέλος οι δεσμευμένες λέξεις Match, Where, Return αναπαριστούν αντίστοιχα το ταίριασμα, τη συνθήκη και το τι θέλει ο χρήστης να επιστραφεί. (Neo4j Team, 2018) 3.2 MongoDB Η Βάση Δεδομένων MongoDB ανήκει στην κατηγορία των Βάσεων Δεδομένων με προσανατολισμό στα έγγραφα (Document Oriented Database). Αυτή κατηγορία Βάσεων Δεδομένων κατατάσσεται στις NoSQL βάσεις δεδομένων. Οι Document Oriented Databases ονομάζονται και Αποθήκες Εγγράφων (Document Store) και είναι σχεδιασμένες για αποθήκευση, ανάκτηση και επεξεργασία Document Oriented πληροφορίας, γνωστή και ως ημιδομημένα δεδομένα. Στις υποκατηγορίες των Document Oriented βάσεων δεδομένων ανήκουν οι XML βάσεις δεδομένων, οι οποίες βελτιστοποιούν τις διεργασίες για τα XML έγγραφα. Υπάρχουν κοινά με τις Graph Databases, αλλά προσθέτουν άλλο ένα επίπεδο, τη σχέση, που επιτρέπει να σχετίζονται τα έγγραφα μεταξύ τους για γρηγορότερη προσπέλαση. Όπως και στις Graph Databases, οι Document Oriented βάσεις είναι υποκατηγορία αποθήκης βασισμένη στο μοντέλο κλειδιών τιμών, όπως όλες οι NoSQL βάσεις δεδομένων. Η διαφορά τους έγκειται στον τρόπο που επεξεργάζονται τα δεδομένα. Στις αποθήκες κλειδιών τιμών, τα δεδομένα θεωρούνται εγγενώς αδιαφανή για τη βάση δεδομένων, ενώ ένα σύστημα Document Oriented βασίζεται στην εσωτερική δομή του εγγράφου με σκοπό την εξαγωγή των μεταδεδομένων, που η βάση χρησιμοποιεί για τη μετέπειτα βελτιστοποίηση. Όπως έχει αναφερθεί, οι Σχεσιακές Βάσεις Δεδομένων αποθηκεύουν τα δεδομένα σε ξεχωριστούς πίνακες που ορίζονται από τους σχεδιαστές Βάσεων Δεδομένων, ένα απλό αντικείμενο μπορεί να βρίσκεται παράλληλα σε διάφορους πίνακες. Εν αντιθέσει οι Document Oriented βάσεις, αποθηκεύουν όλη την πληροφορία για ένα αντικείμενο σε ένα μοναδικό στιγμιότυπο στη βάση και κάθε άλλο αποθηκευμένο αντικείμενο διαφέρει από τα υπόλοιπα. Με αυτόν τον τρόπο μπορούν τα αντικείμενα να αντιστοιχίζονται με μία απλή διεργασία (Object Mapping) αποκλείοντας έτσι τα διπλότυπα. Αυτή η δυνατότητα που παρέχουν οι Document Oriented Βάσεις τις κάνουν 28

29 αρκετά ελκυστικές για την ανάπτυξη εφαρμογών ιστού καθώς η ταχύτητα των αλλαγών στη βάση είναι αρκετά μεγάλη. Θεμελιώδη συστατικό των Document Oriented Βάσεων είναι το έγγραφο. Κάθε Document Oriented βάση διαφέρει από υλοποίηση σε υλοποίηση, αλλά σε γενικό πλαίσιο όλες έχουν ένα κοινό μοτίβο στην επεξεργασία και κωδικοποίηση των εγγράφων που επεξεργάζονται. Κωδικοποιήσεις που υλοποιούνται από τέτοιες βάσεις είναι τα XML, YAML, JSON και BSON. Τα έγγραφα που αποθηκεύονται σε μία τέτοια βάση είναι αντίστοιχα με τα αντικείμενα σε μία αντικειμενοστραφή γλώσσα προγραμματισμού. Δεν έχουν κάποιο τυπικό σχήμα, ούτε έχουν κοινά τμήματα ή κλειδιά. Οι αποθήκες τέτοιου είδους παρέχουν πρόσθετα μεταδεδομένα τα οποία σχετίζονται με τα ήδη αποθηκευμένα δεδομένα των άλλων εγγράφων. Τα μεταδεδομένα αυτά μπορούν επίσης να είναι σχετιζόμενα με άλλες λειτουργίες που παρέχει η εκάστοτε βάση ώστε να παρέχεται οργάνωση, ασφάλεια και άλλες διαδικασίες υλοποίησης. Οι λειτουργίες που παρέχει μία Document Oriented Database είναι: Δημιουργία (εισαγωγή νέων εγγράφων) Ανάκτηση (επερώτηση στη βάση) Ενημέρωση (επεξεργασία υπαρχόντων εγγράφων) Διαγραφή (απομάκρυνση εγγράφων) Εικόνα 11 Διαδικασία συσχέτισης εγγράφων σε Document Oriented Βάση Δεδομένων Το MongoDB είναι μία Document Oriented βάση δεδομένων. Αναπτύχθηκε από την εταιρεία 10gen το 2007 και γράφτηκε σε C++ και JavaScript. Παρέχει υψηλές 29

30 αποδόσεις, διαθεσιμότητα και εύκολη επεκτασιμότητα. Η Βάση που έχει αναπτυχθεί για το MongoDB είναι ένα φυσικό αποθετήριο συλλογών. Οι συλλογές είναι μία ομάδα εγγράφων. Λειτουργεί αντίστοιχα με τους πίνακες σχεσιακών βάσεων δεδομένων. Κάθε συλλογή βρίσκεται μέσα σε μία και μοναδική βάση δεδομένων. Παρόλα αυτά, οι συλλογές δεν υλοποιούν κάποιο σχήμα. Αυτό συμβαίνει γιατί τα έγγραφα που βρίσκονται μέσα στις συλλογές μπορούν να έχουν διαφορετικά πεδία. Τυπικά όμως, τα έγγραφα σε μία συλλογή είναι συνήθως όμοια ή έχουν κάποια σχέση το ένα με το άλλο. Εικόνα 12 Παράδειγμα Συλλογής Εγγράφων στο MongoDB Το έγγραφο, όπως έχει αναφερθεί, είναι μία συλλογή κλειδιών τιμών και έχει δυναμικό σχήμα. Το δυναμικό σχήμα επιτρέπει να έχουν τα έγγραφα, σε μία συλλογή, διαφορετική δομή αλλά και στα κοινά πεδία να έχουν διαφορετικούς τύπους δεδομένων. Εικόνα 13 Ενσωματωμένα έγγραφα μέσα σε ένα έγγραφο Ο παρακάτω πίνακας δείχνει τις διαφορές του MongoDB από μία απλή σχεσιακή βάση δεδομένων. 30

31 ΣΧΕΣΙΑΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Βάση Δεδομένων Πίνακες Εγγραφές/Γραμμές Στήλες Ένωση Πινάκων (Join) Πρωτεύον Κλειδί MongoDB Βάση Δεδομένων Συλλογές Έγγραφα Πεδία Ένθετα Έγγραφα Προεπιλεγμένο Κλειδί ( _id το οποίο προστίθεται αυτόματα από το MongoDB) Το _id που προστίθεται αυτόματα από το MongoDB είναι μεγέθους 12 bytes και διασφαλίζει την μοναδικότητα του κάθε εγγράφου. Ο χρήστης έχει τη δυνατότητα να προσθέτει εκείνος το δικό του μοναδικό κλειδί. Η δομή του είναι: στα 4 πρώτα bytes μπαίνει η χρονοσφραγίδα, στα επόμενα 3 το κλειδί του υπολογιστή, στα επόμενα 2 το κλειδί της διεργασίας του MongoDB εξυπηρετητή και στα 3 εναπομένοντα μία αύξουσα τιμή. (MongoDB Inc) Στα πλεονεκτήματα που παρέχει το MongoDB, μεταξύ των προαναφερθέντων, προστίθεται ότι δεν απαιτούνται περίπλοκες ενώσεις, δεν χρειάζεται καθορισμός των σχέσεων των εγγράφων στη βάση και παρέχονται εύκολες επερωτήσεις στη βάση. Εικόνα 14 Επερωτήσεις εισαγωγής, εύρεσης και ενημέρωσεις στο MongoDB 31

32 3.3 Apache Jena Το Apache Jena είναι ένα εργαλείο αποθήκευσης και διαχείρισης αρχείων RDF. Αναπτύχθηκε από την Apache Software Foundation το 2009 και η τελευταία του έκδοση βγήκε τον Ιούλιο του Είναι ένα εργαλείο ανοιχτού λογισμικού γραμμένο σε Java γλώσσα προγραμματισμού. Παρέχει μία προγραμματιστική διεπαφή (API) με σκοπό την εξαγωγή δεδομένων ή την δημιουργία αυτών σε RDF Γράφους. Ο κάθε Γράφος αναπαρίσταται από μία αφηρημένη δομή, δεν υπάρχει δηλαδή κάποιο συγκεκριμένο μοντέλο στην υλοποίηση του. Κάθε δομή απαρτίζεται από δεδομένα που βρίσκονται σε αρχεία, βάσεις δεδομένων, URLs ή σε συνδυασμό των προαναφερθέντων. Το Jena είναι εξέλιξη του Sesame με τη διαφορά ότι το Jena υποστηρίζει τη χρήση OWL. Για να γίνουν οι κατάλληλες επερωτήσεις στη βάση δεδομένων ενός RDF αποθετηρίου έχει αναπτυχθεί η SPARQL και η πιο πρόσφατη έκδοσή της, η 1.1. (McCarthy, 2005) Μαζί με το Jena, αναπτύχθηκε και το Fuseki. Το Fuseki είναι μία REST τύπου HTTP διεπαφή για τα RDF δεδομένα και λειτουργεί ως SPARQL εξυπηρετητής για επερωτήσεις και ενημερώσεις. Μπορεί να λειτουργήσει επίσης ως υπηρεσία ενός λειτουργικού συστήματος, ως διαδικτυακή εφαρμογή της Java, και σαν stand alone εξυπηρετητής. Παρέχει ασφάλεια χρησιμοποιώντας το Apache Shiro (framework της Java που επιτυγχάνει αυθεντικοποίηση, εξουσιοδότηση, κρυπτογραφία και διαχείριση συνεδρίας) και έχει διεπαφή χρήστη για εποπτεία και διαχείριση του εξυπηρετητή. Το Jena χρησιμοποιείται από τον Σημασιολογικό Ιστό για την κατασκευή εφαρμογών. Παρέχει μεγάλο εύρος βιβλιοθηκών για τη γλώσσα προγραμματισμού Java, ώστε να παρέχει βοήθεια και υποστήριξη στους προγραμματιστές που διαχειρίζονται πρότυπα RDF, RDFS, RDFa, OWL και SPARQL σύμφωνα με τις δημοσιευμένες υποδείξεις της W3C. Περιλαμβάνει επίσης μία διεπαφή βασισμένη σε κανόνες για την αιτιολόγηση OWL και RDFS οντοτήτων καθώς επίσης και ποικιλία στρατηγικών αποθήκευσης RDF τριάδων στον σκληρό δίσκο ή στη μνήμη. Σαν αποθηκευτικό μέσο, το Jena, λειτουργεί σαν Triplestore βάση δεδομένων και κατ επέκταση δεν παρέχει δυνατότητα αποθήκευσης άλλων μορφών δεδομένων. 32

33 Εικόνα 15 Αρχιτεκτονική Apache Jena Σε επίπεδο Jena, τα συστατικά μέρη του RDF είναι οι Πόροι (Resources) που έχουν ένα μοναδικό URI. Κάθε Πόρος έχει κάποιες Ιδιότητες (Properties) και κάθε Ιδιότητα έχει μία Τιμή (Literal) που είναι μία ακολουθία χαρακτήρων. Επίσης στο Jena Γράφος ονομάζεται το Μοντέλο (Model) που υλοποιείται από το Model interface. Για κάθε ακμή σε έναν RDF Γράφο, το Jena αποδίδει τον όρο Statement. Σαν Statement ορίζεται επί της ουσίας η κάθε τριάδα του RDF και περιέχει τα εξής μέρη: Υποκείμενο (Subject) που είναι ένας Πόρος (Resource) από τον οποίο ξεκινάει μία ακμή. Κατηγόρημα (Predicate) που είναι η Ιδιότητα (Property) που χαρακτηρίζει την ακμή. Αντικείμενο (Object) που είναι είτε ένας Πόρος (Resource) είτε μία Τιμή (Literal) που καταλήγει η ακμή. Το Jena επίσης δίνει τη δυνατότητα να δημιουργήσει κάποιος ένα Model, να διαβάσει ένα ήδη υπάρχον και να γράψει σε αυτό. Επίσης μπορεί να κάνει και επερωτήσεις πάνω σε ένα Model αλλά και να ενώσει (Union) δύο ή και περισσότερα Models μεταξύ τους. Οι Βιβλιοθήκες που παρέχονται από το Jena για την Java είναι: 33

34 Πακέτο Περιγραφή oaj.jena.rdf.model Ο πυρήνας του Jena. Δημιουργεί και διαχειρίζεται RDF Γράφους oaj.riot Διαβάζει και γράφει RDF oaj.jena.datatypes Παρέχει στον πυρήνα διεπαφές με τις οποίες περιγράφονται τα είδη των δεδομένων oaj.jena.ontology Αφαιρετικές κλάσεις και κλάσεις ευκολίας για την πρόσβαση και τον χειρισμό των οντολογιών που αντιπροσωπεύονται σε επίπεδο RDF oaj.jena.rdf.listeners Επιβλέπει τις αλλαγές στις δηλώσεις του μοντέλου που επεξεργάζεται oaj.jena.reasoner Το υποσύστημα που υποστηρίζει μια σειρά συμπερασμάτων και παράγει πρόσθετη πληροφορία για το RDF μοντέλο oaj.jena.shared Κοινές κλάσεις ωφέλειας oaj.jena.vocabulary Το πακέτο αυτό περιέχει σταθερές κλάσεις με προκαθορισμένα σταθερά αντικείμενα για κλάσεις και τις ιδιότητές τους που ορίζονται στα γνωστά λεξικά oaj.jena.xmloutput Γράφει σε RDF/XML Το Jena υποστηρίζει επερωτήσεις μέσω της γλώσσας SPARQL μέσω της κλάσης Query, όπου υλοποιείται από την κλάση QueryFactory. Με αυτόν τον τρόπο μπορούν να γίνονται κατά τη διάρκεια της επεξεργασίας ενός RDF Μοντέλου επερωτήσεις στη Βάση Δεδομένων όπως ανάκτηση, εισαγωγή/ενημέρωση και διαγραφή τριάδων. (The Apache Software Foundation) Στον παρακάτω πίνακα γίνεται μια συνοπτική σύγκριση των τριών Βάσεων Δεδομένων που ερευνήθηκαν. Όνομα Jena MongoDB Neo4J Περιγραφή Εργαλείο από την Apache για Βάση Δεδομένων με Βάση Δεδομένων εφαρμογές συνδεδεμένων προσανατολισμό τα Γράφων δεδομένων στο Σημασιολογικό Έγγραφα Ιστό Χρήση της Βάσης Αποθήκευση δεδομένων RDF Αποθήκευση Εγγράφων Σύστημα Διαχείρισης Βάσης Δεδομένων Γράφων Ιστοσελίδα jena.apache.org neo4j.com Προγραμματιστής Apache Software Foundation MongoDB Inc. Neo4J Inc. Έτος δημιουργίας Τελευταία έκδοση 3.4.0, Ιούλιος , Σεπτέμβριος , Ιούνιος 2017 Άδεια Ανοιχτό Λογισμικό Ανοιχτό Λογισμικό Ανοιχτό Λογισμικό Γλώσσα Προγραμματισμού Ανάπτυξης Java C++ Java και Scala 34

35 Λειτουργικά Συστήματα Εξυπηρετητή Linux, OS X, Unix, Windows Linux, OS X, Solaris, Windows Linux, OS X, Solaris, Windows Σχήμα Δεδομένων RDF Σχήμα Όχι Όχι Ευρετηρίαση Ναι Ναι Ναι (μέσω του Apache Lucene) Μέθοδοι πρόσβασης και APIs Υποστηριζόμενες Γλώσσες Προγραμματισμού για ανάπτυξη εφαρμογών Μέθοδοι για αποθήκευση διαφορετικών δεδομένων σε Fuseki, SPARQL JSON Cypher, Spring Data Neo4J, Restfull HTTP API Java C, C#, C++, Groovy, Java, Javascript, Lisp, Matlab, Perl, PHP, Prolog, Python, R, Ruby, Scala Ναι Ναι Ναι διαφορετικούς κόμβους MapReduce Όχι Ναι Όχι Ξένα Κλειδιά Όχι Όχι Ναι Υποστήριξη Ναι Ναι Ναι μόνιμης αποθήκευσης δεδομένων Υποστήριξη προσωρινής αποθήκευσης δεδομένων μνήμη Πίνακας πρόσβασης στη Ναι Ναι Ναι Μέσω του Jena Security Δικαιώματα πρόσβασης για χρήστες και ρόλους.net, Elixir, Groovy, Java, Javascript, Perl, PHP, Python, Rudy, Scala Χρήστες ρόλοι και άδειες 35

36 3.4 Επιλογή κατάλληλης βάσης δεδομένων Στο κομμάτι της επιλογής για την κατάλληλη βάση δεδομένων, αξιολογήθηκαν οι τρεις προαναφερθείσες επιλογές: το Neo4J, το MongoDB και το Apache Jena. Και οι τρεις αυτές υλοποιήσεις παρουσιάζουν θετικά και αρνητικά στοιχεία η κάθε μία έναντι της άλλης. Τα κριτήρια που έγινε η αξιολόγηση ήταν: Η πολυπλοκότητα του κάθε εργαλείου από τη σκοπιά της ταχύτητας ανάκτησης, εισαγωγής και ενημέρωσης της πληροφορίας. Η δυνατότητα που παρέχει το κάθε εργαλείο με σκοπό να χάνεται όσο το δυνατόν λιγότερη πληροφορία κατά την επεξεργασία των δεδομένων. Η καλύτερη κατανόηση των δεδομένων από τον ανθρώπινο παράγοντα. Η καλύτερη δυνατή συνεργασία με γλώσσα προγραμματισμού με σκοπό την διασύνδεση των επεξεργασμένων δεδομένων στο περιβάλλον αποθήκευσής τους. Με γνώμονα τα παραπάνω κριτήρια επιλέχθηκε ως καταλληλότερη βάση αποθήκευσης δεδομένων για την υλοποίηση της πλατφόρμας το Apache Jena. Αρχικά πρέπει να τονιστεί ότι επιλέχθηκε το Jena έναντι των υπολοίπων RDF Triplestores λόγω της ευκολίας στον προγραμματιστή που δίνει το συγκεκριμένο εργαλείο έναντι των υπολοίπων Triplestores όπως το Virtuoso ή το Marklogic. Η Apache έχει εφοδιάσει το Jena με μία πληθώρα βιβλιοθηκών της Java για εύκολη διαχείριση και επεξεργασία τόσο των RDF αρχείων, όσο και των ερωτημάτων προς έναν Fuseki εξυπηρετητή. Μέσω αυτών των βιβλιοθηκών γίνεται άμεση προσπέλαση όλων των δηλώσεων του RDF καθώς επίσης και οποιαδήποτε προσθήκη ή επεξεργασία πόρου, ιδιότητας ή Literal στο μοντέλο που υφίσταται επεξεργασία. Τόσο το Virtuoso όσο και το Marklogic δεν είχαν τόσο μεγάλη υποστήριξη σε Java όπως είχε το Jena. Στη σύγκριση λοιπόν μεταξύ μίας RDF triplestorage όπως το Jena, μίας Document Database όπως το MongoDB ή μιας Property Graph Database όπως το Neo4j η επιλογή δεν είναι καθόλου εύκολη. Όπως επισημάνθηκε νωρίτερα η κάθε επιλογή είχε θετικά και αρνητικά στοιχεία έναντι της άλλης. Σε πρώτη φάση θα γίνει ανάλυση επιλογής του Jena έναντι του Neo4j και σε δεύτερη φάση θα γίνει ανάλυση της επιλογής του Jena έναντι του MongoDB. Επίσης, όπως θα αναφερθεί και εκτενέστερα στο κομμάτι του Bibframe, τα δεδομένα που θα δέχεται σαν είσοδο η πλατφόρμα είναι της μορφής RDF. (Maharajan, 2012) 36

37 3.4.1 Σύγκριση Jena με Neo4j Αρχικά πρέπει να αναφερθεί ότι και οι δύο βάσεις δεδομένων είναι σχεδιασμένες να αποθηκεύουν συνδεδεμένα δεδομένα. Έχουν αρκετά κοινά αλλά και αρκετές διαφορές. Στα κοινά τους είναι ότι τόσο το Jena, όσο και το Neo4J, επικεντρώνονται στη συσχέτιση μεταξύ των δεδομένων στα οποία αναφέρονται στην ορολογία τους ως συνδεδεμένα δεδομένα. Αποτελούνται στη δομή τους από πόρους οι οποίοι αποτελούν τους κόμβους και τις σχέσεις που αποτελούν τις ακμές. Ο συνδυασμός κόμβων και ακμών δημιουργούν τον γράφο. Στις διαφορές των δύο τεχνικών είναι: Υπάρχει διαφορά στις γλώσσες επερωτήσεων που χρησιμοποιούν τα δύο εργαλεία. Το Jena κάνει χρήση μόνο της γλώσσας SPARQL, ενώ το Neo4J, παρόλο που έχει τη δυνατότητα να χρησιμοποιήσει τη SPARQL μέσω επεκτάσεων, επικεντρώνεται περισσότερο στη Cypher. Το Jena αποθηκεύει μόνο τις τριάδες ενός RDF εγγράφου ενώ το Neo4J έχει τη δυνατότητα να αποθηκεύσει πληθώρα τύπων γράφων όπως οι γράφοι χωρίς κατεύθυνση, οι γράφοι με βάρη κλπ. Μία θεμελιώδη διαφορά στη δομή των δύο εργαλείων είναι ότι το Neo4J έχει στο επίκεντρο τους κόμβους ή τις ιδιότητες ενώ το Jena έχει στο επίκεντρό του τις σχέσεις μεταξύ των κόμβων. Επίσης μία σημαντική διαφορά στην απόδοση είναι ότι, το Neo4J βελτιστοποιεί την απόδοση για την προσπέλαση των κόμβων σε ένα γράφο καθώς κάνει χρήση αλγορίθμων εύρεσης κοντινότερου μονοπατιού. Στον αντίποδα, στο Jena το κόστος για την προσπέλαση των ακμών ενός γράφου τείνει σε λογαριθμική τιμή. Αυτό συμβαίνει καθαρά λόγο της δομής του γράφου που υλοποιείται σε κάθε περίπτωση. Στο Neo4J υπάρχει η δυνατότητα προσπέλασης σε κάθε ακμή και από τους δύο κόμβους, ενώ στο Jena η προσπέλαση γίνεται μόνο από τον κόμβο αρχής προς τον κόμβο τέλους. Το Jena έχει τη δυνατότητα εξαγωγής συμπερασμάτων για τα δεδομένα, κάτι το οποίο στο Neo4J είναι αδύνατο να γίνει. Για παράδειγμα στη πρόταση, εάν οι άνθρωποι είναι μια υποκατηγορία θηλαστικών και ο άνδρας είναι μια υποκατηγορία του ανθρώπου, τότε στο Jena βγαίνει το συμπέρασμα ότι ο άνδρας είναι υποκατηγορία των θηλαστικών, ενώ στο Neo4J όχι. Η χρήση του Jena και γενικότερα του RDF βοηθάει σε πολύ μεγάλο βαθμό την εξέλιξη του Σημασιολογικού Ιστού και την ενημέρωση των ανοιχτών προτύπων όπως το Schema.org, το RDFa και το JSON-LD. Με κάθε καινούργια τριάδα που προστίθεται σε ένα RDF αποθετήριο, αφού επεξεργαστεί, τότε ενημερώνεται και το αντίστοιχο πρότυπο. Το αντίθετο συμβαίνει με το Neo4J καθώς δεν απασχολεί τόσο τους χρήστες του η εξέλιξη του Σημασιολογικού Ιστού καθώς στην πλειοψηφία τους κάνουν χρήση του Neo4J για καθαρά εμπορικούς σκοπούς. 37

38 Το Jena καθώς αποθηκεύει τριάδες του RDF, σχετίζεται πιο άμεσα με τον όρο του Σημασιολογικού Ιστού όπως έχει ορισθεί από το W3 και έχει καθολική εφαρμογή σε ακαδημαϊκά έργα ενώ το Neo4J έχει εφαρμογή σε εμπορικές λύσεις και όχι σε ακαδημαϊκές. Σε τεχνικό επίπεδο το πρόβλημα της διαχείρισης των κενών κόμβων (blank nodes) στο Jena μπορεί να αντιμετωπισθεί με κάποια δυσκολία, ενώ στο Neo4J δεν είναι καθόλου εύκολη η διαχείριση των κενών κόμβων. Οπότε σε συνάρτηση με τα κριτήρια αξιολόγησης που τέθηκαν και τις διαφορές των δύο βάσεων δεδομένων το Jena υπερτερεί έναντι του Neo4J γιατί: Το Neo4J αν και γρηγορότερο δεν θα ωφελήσει σε κάτι παραπάνω στην προσπέλαση των πόρων από το Jena. Αυτό συμβαίνει καθώς στην προσπέλαση όπου είναι η ουσιώδης διαφορά των εργαλείων, καθώς τα επερωτήματα που γίνονται στη βάση για ανάκτηση της πληροφορίας δεν είναι περίπλοκα, συνεπώς ο χρόνος απόκρισης δεν έχει μεγάλη διαφορά. Η αρχική πληροφορία των δεδομένων είναι σε μορφή RDF. Συνεπώς είναι προτιμότερη η χρήση του Jena έναντι του Neo4J. Ο ένας λόγος είναι ότι η πληροφορία αποθηκεύεται στη βάση χωρίς επεξεργασία, άρα δεν χάνεται η οποιαδήποτε πληροφορία και ο δεύτερος λόγος είναι ότι το Neo4J δεν είναι σε θέση να διαχειριστεί τους κενούς κόμβους. Στο κριτήριο της κατανόησης των δεδομένων από τον άνθρωπο, η θεωρία δείχνει ότι υπερτερεί και πάλι το Jena. Ο τρόπος γραφής του RDF μοιάζει πάρα πολύ με την πρόταση σε οποιαδήποτε ανθρώπινη γλώσσα. Σε καμία περίπτωση η σύνταξη του Neo4J είναι δύσκολη, αλλά σε γενικές γραμμές το RDF είναι σαφέστατα πιο κατανοητό. Παρόλο που το Neo4J δίνει τη δυνατότητα να διασυνδεθούν με αυτό πληθώρα γλωσσών προγραμματισμού, το Jena θεωρήθηκε αρκετά καλύτερο καθώς περιείχε υποστήριξη από μία μεγάλη γκάμα βιβλιοθηκών στη γλώσσα προγραμματισμού Java. (Maharajan, 2012) 38

39 3.4.2 Σύγκριση Jena με MongoDB Το Jena όπως έχει ήδη ειπωθεί παραπάνω είναι ένα RDF triplestore και ανήκει στην κατηγορία των Βάσεων Δεδομένων Γράφων. Στον αντίποδα το MongoDB είναι ένα Document Oriented Database και ανήκει στην κατηγορία των NoSQL βάσεων δεδομένων. Μία από τις σημαντικότερες διαφορές των δύο αυτών κατηγοριών είναι ότι το μεν Jena ακολουθεί μία δομημένη αρχιτεκτονική στην αποθήκευση των δεδομένων, ενώ το MongoDB ακολουθεί μία ημί δομημένη αρχιτεκτονική. Επίσης μία δεύτερη μεγάλη διαφορά είναι ότι το Jena δέχεται αρχεία της μορφής RDF ενώ το MongoDB δέχεται αρχεία της μορφής JSON και στη συνέχεια αυτά μετατρέπονται σε BSON προκειμένου να γίνει η απαραίτητη μοντελοποίηση στις ιδιότητες των δεδομένων, στις εμφολευμένες οντότητες και στους δείκτες των άλλων αρχείων. Σε αντίθεση με του Neo4J η διαχείριση των κενών κόμβων ήταν εύκολη καθώς και γενικότερα η μετατροπή από RDF σε JSON-LD είναι μία μέθοδος που εγκρίνεται από το W3 για τη διαχείριση συνδεδεμένων δεδομένων. Από άποψη ευκολίας στην ανάγνωση του ανθρώπου δεν μπορεί να κριθεί αν το RDF είναι δυσκολότερο από το JSON. Το JSON ίσως υπερτερεί σε ελάχιστο βαθμό από τη σκοπιά της ομαδοποίησης της πληροφορίας που παρέχεται για κάθε πόρο, ενώ το RDF υπερτερεί από την άποψη της ομαδοποίησης των σχέσεων μεταξύ δύο πόρων. Από πλευράς απόδοσης, το Jena ήταν ελαφρώς γρηγορότερο από το MongoDB τόσο στα δοκιμαστικά δεδομένα που εξετάστηκαν, όσο και από διεθνής μετρήσεις που έχουν γίνει στα εργαλεία. (Maharajan, 2012) Το πρόβλημα που παρουσιάστηκε με το MongoDB ήταν στις αναφορές των άλλων αρχείων. Κατά τη διάρκεια της μετατροπής των RDF σε JSON και με δεδομένο ότι το ID έπρεπε να περνάει με χειροκίνητο τρόπο απορρίφθηκε η χρήση του MongoDB. (Kumar, 2011) (Tomaszuk, 2010) 39

40 4. Καταλογογράφηση και Πρότυπα Μία από τις μεγαλύτερες ανακαλύψεις του ανθρώπου ήταν η γραφή. Η γραφή είναι η αναπαράσταση μίας γλώσσας με την τέχνη του κειμένου με χρήση ενός συνόλου σημείων ή συμβόλων. Κάθε λαός ή φυλή από την απαρχή της ανθρώπινης ιστορίας ανέπτυξε το δικό του σύστημα γραφής με χρήση διάφορων εικόνων εμπνευσμένων κυρίως από κομμάτια της φύσης ή του ζωικού βασιλείου. Κατά το πέρασμα των αιώνων η γραφή εξελίχθηκε και από εικονογραφική μετατράπηκε σε ιδεογραφική. Στην ιδεογραφική γραφή κάθε σύμβολο αναπαριστά μία προφορική λέξη ή κάποιο κομμάτι αυτής. Κάποιοι μεταγενέστεροι πολιτισμοί ανέπτυξαν συλλαβογραφική γραφή, όπως οι Ιάπωνες ή οι Ινδοί, μέσω της οποίας αναπαριστούσαν ολόκληρες προτάσεις με ιδεογράμματα. Στις σύγχρονες κοινωνίες ως επί το πλείστων γίνεται χρήση της φθογγογραφικής γραφής όπου κάθε σύμβολο αναπαριστά τον εκάστοτε φθόγγο της προφορικής γλώσσας. Η γραφή ανακαλύφθηκε ως εναλλακτικός τρόπος επικοινωνίας μεταξύ των ανθρώπων. Ως μέσο γραφής ήταν οι λίθοι στους πρώιμους πολιτισμούς και οι πάπυροι στους αρχαίους, ενώ στη σύγχρονη κοινωνία γίνεται η χρήση χαρτιού ή ηλεκτρονικών μέσων. Επίσης μέσω της γραφής θεσπίζονταν οι κανόνες της προφορικής γλώσσας. Η γραφή κάνει μία γλώσσα αναγνώσιμη. Απαρτίζεται από το λεξιλόγιο, τη γραμματική και το συντακτικό. Ο συνδυασμός όλων των παραπάνω δημιουργεί τις προτάσεις. Τα κείμενα αποτελούνται από λέξεις του λεξιλογίου, τοποθετημένες με σωστή σειρά σύμφωνα με τους κανόνες του συντακτικού και της γραμματικής. Ο συνδυασμός των προτάσεων που έχουν μεταξύ τους κάποια λογική σημασία απαρτίζουν το κείμενο. Τα κείμενα κατ επέκταση αν συνδυαστούν δημιουργούν το βιβλίο. Το βιβλίο είναι ο υλικός φορέας του γραπτού λόγου. Στην παγκόσμια ορολογία βιβλίο ορίζεται ως η βασική κατηγορία έντυπου λόγου και αποτελείται από αριθμό συνδεδεμένων τεμαχίων χαρτιού και εξώφυλλο. Επίσης βιβλίο θεωρείται και το σύνολο του περιεχομένου του αντικειμένου αυτού ως πνευματικό έργο. Το βιβλίο άρχισε να διαδίδεται με την εφεύρεση της τυπογραφίας του Ιωάννου Γουτεμβέργιου τον 15 ο αιώνα. Μέχρι εκείνη την περίοδο η δημιουργία βιβλίων αποτελούνταν αποκλειστικά είτε στα χειρόγραφα των συγγραφέων είτε στα χειρόγραφα των γραφέων που αντέγραφαν τα πρωτότυπα. Με αυτόν τον τρόπο δεν ήταν καθόλου εύκολη η πρόσβαση στα περιεχόμενα των χειρόγραφων από τον οποιοδήποτε. Με την τυπογραφία υπήρξε η δυνατότητα για μαζική δημιουργία αντιτύπων με σκοπό τη διάθεσή τους σε εκείνους που είχαν ανάγκη να διαβάσουν το περιεχόμενο του πρωτότυπου έργου. Το πρώτο έργο που τυπώθηκε ήταν η Βίβλος σε Λατινική μετάφραση το 1455 και ακολούθησε η τύπωση διαφόρων έργων αρχαίων Ελλήνων και Ρωμαίων συγγραφέων. Με την αύξηση των αντιτύπων, οι υπάρχουσες βιβλιοθήκες της εποχής ξεκίνησαν να φιλοξενούν χιλιάδες αντίτυπα. Το σημαντικό πρόβλημα που έπρεπε να λυθεί εκείνη τη 40

41 στιγμή ήταν το πώς θα κατανεμηθούν τα βιβλία και με ποιο τρόπο θα γίνει η ταξινόμησή τους. Για το εν λόγω πρόβλημα δημιουργήθηκε η καταλογογράφηση. Η καταλογογράφηση είναι η διαδικασία κατά την οποία γίνεται η δημιουργία βιβλιογραφικών εγγραφών. Κατά τη διαδικασία της καταλογογράφησης γίνεται κωδικοποίηση των πληροφοριών που αφορούν ένα βιβλιογραφικό τεκμήριο και δημιουργούνται οι βιβλιογραφικές εγγραφές. Οι βιβλιογραφικές εγγραφές υφίστανται το βιβλιογραφικό έλεγχο και στη συνέχεια οργανώνονται σε βιβλιογραφικούς καταλόγους. (Vasilov & Viventensky, 1979) Ο βιβλιογραφικός έλεγχος είναι το σύνολο των πρακτικών ενεργειών που πραγματοποιούν για να οργανώσουν τα τεκμήρια και τις περιγραφές τους, ώστε να είναι δυνατός ο εντοπισμός των πιο σχετικών τεκμηρίων που ταιριάζουν στα ερωτήματα των χρηστών. Ο κατάλογος πρέπει να υποστηρίζει τον εντοπισμό των αντικειμένων που ικανοποιούν τις πληροφοριακές ανάγκες των χρηστών. Ο κάθε κατάλογος πρέπει να πληροί κάποιους συγκεκριμένους στόχους: Να καθιστά ικανό κάποιον να βρει ένα βιβλίο του οποίου είναι γνωστά είτε ο τίτλος, είτε ο συγγραφέας είτε το θέμα. Να δείχνει τι έργα διαθέτει η βιβλιοθήκη ενός δοθέντος συγγραφέα, περί ενός δεδομένου θέματος ή σε ένα δεδομένο είδος. Να βοηθάει στην επιλογή ενός βιβλίου όσον αφορά την έκδοσή του ή όσον αφορά στο χαρακτήρα του. Για να εφαρμοστεί σωστά η διαδικασία της καταλογογράφησης βασική προϋπόθεση είναι η ύπαρξη κανόνων. Οι κανόνες θεσπίστηκαν προκειμένου οι άνθρωποι που επεξεργάζονται και διαχειρίζονται βιβλιογραφικά έγγραφα σε διαφορετικές χρονικές περιόδους, σε διαφορετικές βιβλιοθήκες να μπορούν να καταλογογραφούν με διαχρονική συνέπεια τα νέα βιβλιογραφικά δεδομένα που δέχονται προκειμένου να γίνονται κατανοητά και να εντοπίζονται με ευκολία. Οι κανόνες καθορίζουν: Ποιες πληροφορίες από το βιβλιογραφικό τεκμήριο πρέπει να συμπεριλαμβάνονται στην εγγραφή. Πώς αυτές οι πληροφορίες θα παρουσιάζονται στον καρτοκατάλογο ή στην ηλεκτρονική εγγραφή. Με ποια σειρά θα πρέπει να τοποθετούνται οι εγγραφές στον κατάλογο. Στον 20 ο αιώνα και σε συνάρτηση με την τεχνολογική εξέλιξη εκτός από τους παραδοσιακούς καρτοκαταλόγους άρχιζαν να προστίθενται στις βιβλιοθήκες και ηλεκτρονικά μέσα αποθήκευσης οι ηλεκτρονικοί κατάλογοι. Είτε σε έντυπη μορφή είτε σε ηλεκτρονική ο τρόπος καταλογογράφησης δεν είχε ιδιαίτερες διαφορές καθώς και στις δύο περιπτώσεις γινόταν χρήση κωδικών. Σε βιβλιογραφικές εγγραφές, τα στοιχεία που καταλογογραφούνται είναι ο τίτλος του έργου, τα φυσικά πρόσωπα που 41

42 σχετίζονται με τη δημιουργία, τη μετάφραση, την έκδοση, την εικονογράφηση κ.α, τα στοιχεία της έκδοσης ή κάποιος γενικός αριθμός όπως το ISBN ή το LCCN. Σαν στόχο έχει τη διαφοροποίηση του τεκμηρίου από άλλα έργα του ίδιου συγγραφέα ή άλλα έργα που φέρουν τον ίδιο τίτλο ή ακόμα και άλλα έργα που αφορούν το ίδιο θέμα. (Καπιδάκης, Λαζαρίδης, & Τοράκη, 2015) 4.1 Το Πρότυπο BIBFRAME Το Bibframe είναι ένα μοντέλο δεδομένων για βιβλιογραφικές περιγραφές. Σχεδιάστηκε για να αντικαταστήσει το MARC πρότυπο, και χρησιμοποιεί τις αρχές Συνδεδεμένων Δεδομένων με σκοπό να κάνει τα βιβλιογραφικά δεδομένα πιο χρήσιμα τόσο στο εσωτερικό των βιβλιοθηκών από τη σκοπιά των υπαλλήλων, όσο και στο εξωτερικό από τη σκοπιά των χρηστών που χρησιμοποιούν αυτά τα δεδομένα. Το πρότυπο MARC αναπτύχθηκε το 1960 από την εθνική βιβλιοθήκη του Κογκρέσου. Το 1971 εδραιώθηκε σαν εθνικό πρότυπο για τα βιβλιογραφικά δεδομένα στις Ηνωμένες Πολιτείες και το 1973 εδραιώθηκε σαν παγκόσμιο πρότυπο. Το ακρωνύμιο MARC σημαίνει Machine Readable Cataloging. Σαν πρότυπο έχει πολλές εκδόσεις με κυρίαρχη της έκδοση MARC 21 που δημιουργήθηκε το 1999 από τη σύμπραξη Αμερικανικών, Καναδικών και Ευρωπαϊκών MARC εκδόσεων. Το 2002 η βιβλιοθήκη του Κογκρέσου ανέπτυξε το σχήμα MARCXML ως εναλλακτική δομή MARC εγγραφών, το οποίο επέτρεπε επί της ουσίας την αναπαράσταση των MARC εγγραφών σε μορφή XML. (Suominen & Hyvönen) Το πρόβλημα με το MARC πρότυπο είναι ότι είναι σχετικά παλιό και δεν καλύπτει όλες τις σύγχρονες ανάγκες των βιβλιοθηκών, χρησιμοποιείται αποκλειστικά από τη βιβλιοθηκονομική κοινότητα καθώς είχε σχεδιαστεί με σκοπό να εμφανίζει πληροφορίες για μία εγγραφή παρά να αποθηκεύει ή να ανακτά δεδομένα. (Tennant, 2002) Για τους παραπάνω λόγους δημιουργήθηκε το Bibframe. Στην πρώτη του εμφάνιση ονομαζόταν MARC Resources αλλά ένα χρόνο αργότερα όταν κυκλοφόρησε η πλήρης έκδοση μετονομάστηκε σε Bibframe 1.0. Το 2016 η βιβλιοθήκη του Κογκρέσου κυκλοφόρησε την πιο πρόσφατη έκδοση, το Bibframe 2.0. Με τη χρήση του Bibframe οι βιβλιοθήκες ανά τον κόσμο εξελίσσονται και εκσυγχρονίζονται στις τωρινές ανάγκες του Internet of Things και του κόσμου των Συνδεδεμένων Δεδομένων. Όπως γίνεται αντιληπτό πλέον τα βιβλιογραφικά δεδομένα δεν θα είναι απλές εγγραφές αλλά θα έχουν «νόημα», δηλαδή θα μπορεί να εξάγεται πληροφορία για τον συγγραφέα, τον εκδότη, το περιεχόμενο του βιβλίου, την κατηγορία που ανήκει κλπ, αποκτά κοινώς εννοιολογική αξία. 42

43 Ο τρόπος που επιλέχθηκε το Bibframe για να εκφράζεται σύμφωνα με ένα εννοιολογικό σχήμα, είναι μέσω του RDF σχήματος. Με τη χρήση του μοντέλου RDF επιτυγχάνεται η διασύνδεση και με άλλες αρχές όπως το VIAF,η Wikipedia, το ORCID και το ISNI που επίσης χρησιμοποιούν RDF υλοποιήσεις με δικά τους Λεξικά. Στα πλεονεκτήματα χρήσης του RDF συγκαταλέγεται και η ευκολία που προσφέρουν οι μηχανές αναζήτησης όπως το Google, το Bing και το Yahoo, η χρήση των ελεύθερων δεδομένων που προσφέρουν οι εκάστοτε κυβερνήσεις και τέλος η διασύνδεση που μπορεί να επιτευχθεί με τη DBpedia και διάφορα έγκριτα ενημερωτικά πρακτορεία όπως το BBC και το CNN. (Meehan) Δίνει τη δυνατότητα στις βιβλιοθήκες που το υιοθετούν να αποκτούν μία κοινή δομή και βάση, με ένα κοινό λεξικό και την ευελιξία που παρέχει το μοντέλο του RDF. Η χρήση ενός κοινού αποθετηρίου για την εύρεση πληροφορίας ενός έργου πλέον είναι εύκολη και κοινή για όλες τις βιβλιοθήκες. Τέλος στα οφέλη χρήσης του Bibframe από τις βιβλιοθήκες εντάσσεται η διόρθωση λαθών που έχουν γίνει από αμέλεια από ανθρώπινο παράγοντα στο επίπεδο του MARC καθώς και η δημοσιοποίηση όλης της πληροφορίας στο διαδίκτυο με σκοπό την ενημέρωση των ενδιαφερομένων για τα έργα της εκάστοτε βιβλιοθήκης Δομή του BIBFRAME Το Bibframe έχει σχεδιαστεί για να ενσωματώνεται και να συμμετέχει στην ευρύτερη πληροφοριακή κοινότητα όπως και να εξυπηρετεί τις πολύ συγκεκριμένες ανάγκες των βιβλιοθηκών. Το Bibframe συμβάλει με τους ακόλουθους τρόπους στην βιβλιογραφική περιγραφή: Γίνεται σαφής διάκριση ανάμεσα στο εννοιολογικό περιεχόμενο του βιβλιογραφικού υλικού και της φυσικής ή ψηφιακής μορφής του. Προσδιορίζονται οι πληροφοριακές οντότητες όπως οι εκδόσεις. Εκθέτει και αξιοποιεί τις σχέσεις ανάμεσα στις οντότητες. Το μοντέλο του Bibframe αντιλαμβάνεται πλήρως τη σημαντικότητα της διάκρισης και διαφοροποίησης της εννοιολογικής σημασίας όπως ο τίτλος ή ο συγγραφέας από τις φυσικές λεπτομέρειες σχετικά με την εμφάνιση του εκάστοτε έργου όπως ο αριθμός των σελίδων του. Επίσης παράγει βιβλιογραφικά δεδομένα προκειμένου να προσδιοριστεί με σαφήνεια ο εκάστοτε φορέας που συμμετέχει στη δημιουργίας μιας πηγής (συγγραφέας, εκδότης, κλπ) και οι έννοιες που συνδέονται με την ίδια την πηγή. Σκοπός του άλλωστε είναι να αφομοιώσει όλες τις MARC εγγραφές και να τις μετατρέψει στα πρότυπα του. Η βιβλιοθήκη του Κογκρέσου διακρίνει το Bibframe σε δύο υποομάδες, το λεξιλόγιο του Bibframe και το μοντέλο του Bibframe. Το μοντέλο του Bibframe είναι το εννοιολογικό μοντέλο που αναπαριστά όλες τις απαιτήσεις των χρηστών του για πλήρη και λεπτομερή περιγραφή βιβλιογραφικών εννοιών, επίσης τις ανάγκες των χρηστών που περιγράφουν άλλα πολιτιστικά υλικά και τις ανάγκες των χρηστών που δεν 43

44 απαιτούν κάποια λεπτομερή περιγραφή. Το λεξικό του Bibframe έχει ένα συγκεκριμένο αριθμό κλάσεων και ιδιοτήτων. Οι ιδιότητες του λεξικού εξυπηρετούν ένα μέσο για περαιτέρω περιγραφή του Bibframe πόρου, όπως ακριβώς τα πεδία του MARC που προσδιορίζουν περισσότερο τις πτυχές μιας ιδέας. (IFLA Study Group on the Functional Requirements for Bibliographic Records, 2009) Το Bibframe έχει επίσης την ιδιότητα να σχετίζει τους πόρους του μεταξύ τους. Για παράδειγμα ένα Έργο δύναται να σχετίζεται με ένα άλλο Έργο με μία ή και περισσότερες σχέσεις από το λεξιλόγιο. Με αυτόν τον τρόπο, το μοντέλο ξεφεύγει από την τετριμμένη μορφή του MARC και προσθέτει την έννοια των συνδεδεμένων δεδομένων. (Suominen & Hyvönen) Για το μοντέλο του Bibframe έχουν παραχθεί δύο εκδόσεις. Στην έκδοση 1.0 το Bibframe ήταν δομημένο στις εξής βασικές οντότητες: Work, ένας πόρος που αντικατοπτρίζει εννοιολογικά ένα στοιχείο καταλογογράφησης. Instance, ένας πόρος που αντικατοπτρίζει μια ατομική, υλική ενσωμάτωση ενός Work. Authority, ένας πόρος που αντικατοπτρίζει έννοιες βασικών αρχών που έχουν καθορίσει οι σχέσεις που αλληλοεπιδρούν με τα Works και Instances. Τέτοιου είδους πόροι είναι τα άτομα, οι τοποθεσίες, οι οργανισμοί κλπ. Annotation, ένας πόρος που παρέχει πρόσθετες πληροφορίες για άλλους πόρους, όπως για παράδειγμα σχόλια, πληροφορίες εξωφύλλου κλπ. 44

45 Εικόνα 16 Μοντέλο Bibframe 1.0 Το 2016 το μοντέλο αυτό τροποποιήθηκε από τη Βιβλιοθήκη του Κογκρέσου. Στο τωρινό μοντέλο οι βασικές οντότητες άλλαξαν και πλέον οι βασικές οντότητες είναι: Work. Στο υψηλότερο επίπεδο αφαιρετικότητας, το έργο στο πλαίσιο του Bibframe που αντικατοπτρίζει εννοιολογικά ένα στοιχείο καταλογογράφησης. Σε αυτό περιλαμβάνονται οι συγγραφείς, οι γλώσσες και το περιεχόμενο του. Instance. Κάθε έργο μπορεί να έχει μία ή και περισσότερες ατομικές και υλικές ενσωματώσεις όπως για παράδειγμα μία συγκεκριμένη βιβλιογραφική έκδοση. Το Instance αντικατοπτρίζει πληροφορίες όπως ο εκδοτικός οίκος, ο εκδότης, ο τόπος που εκδόθηκε, η ημερομηνία έκδοσης και το μορφότυπο του αναγνώσματος. Item. Το Item είναι το πραγματικό αντίτυπο, σε υλική ή ψηφιακή μορφή, ενός Instance. Αντικατοπτρίζει πληροφορίες όπως ο τόπος, το αποτύπωμά του και ο κωδικός του. Αυτές τις βασικές οντότητες συμπληρώνουν οι βοηθητικές: 45

46 Agents. Οι Agents είναι άνθρωποι, οργανισμοί κλπ που αλληλοεπιδρούν με το Work ή το Instance μέσω των ρόλων που τους έχουν αποδοθεί. Τέτοιοι ρόλοι είναι ο συγγραφέας, ο εκδότης, ο διορθωτής, ο ήρωας ενός έργου, ο φωτογράφος κλπ. Subjects. Κάθε έργο μπορεί να αφορά ένα ή και περισσότερα θέματα. Τα Subjects περιλαμβάνουν πληροφορία που έχει να κάνει με το περιεχόμενο, τη θεματική ομάδα που ανήκει το έργο, τα μέρη, προσωρινές εκφράσεις, γεγονότα κλπ. Events. Παρουσίες, η καταγραφή των οποίων μπορεί να υπάρχει στο περιεχόμενο ενός Έργου. Εικόνα 17 Μοντέλο Bibframe

47 Πέραν όμως των βασικών οντοτήτων του Bibframe υπάρχουν και οι σχέσεις που ενώνουν τις οντότητες μεταξύ τους. Οι ακμές του Bibframe καθορίζουν καλύτερα τις σχέσεις μεταξύ Works, μεταξύ Instance και μεταξύ Items καθώς και τους συνδυασμούς Works Instances και Instances Items. Επίσης συσχετίζουν και τις βοηθητικές οντότητες μεταξύ τους καθώς και με τις βασικές οντότητες. Εικόνα 18 Παράδειγμα χρήσης Bibframe 2.0 Γενικά οι αλλαγές από το μοντέλο 1.0 σε σχέση με το μοντέλο 2.0 είναι οι εξής: Η απαλοιφή της οντότητας Authority καθώς οι άνθρωποι, οι οργανισμοί και τα μέρη αναπαρίστανται πλέον ως αντικείμενα του πραγματικού κόσμου και δεν ορίζονται πλέον από το όνομά τους. Απαλοιφή της οντότητας Annotation. Η οντότητα πλέον μπορεί να εκφραστεί ως ιδιότητα μια άλλης οντότητας. Εισαγωγή της οντότητας Item. Ένα κομμάτι της οντότητας Annotation πλέον απορροφήθηκε από την Item και έγινε καλύτερος διαχωρισμός της Instance με τη χρήση της Item. Εισαγωγή της οντότητας Event. Επαναπροσδιορισμός των τίτλων. Επαναπροσδιορισμός των αναγνωριστικών. Οι αναγνωριστικοί τύποι διακρίνονται πλέον από την οντότητα παρά από τις ιδιότητες. Σε αντίθεση με την έκδοση 1.0 που είχε πολλές αναγνωριστικές ιδιότητες και μία οντότητα 47

48 αναγνώρισης, η έκδοση 2.0 έχει μόνο μία ιδιότητα και πολλές αναγνωριστικές οντότητες. Επαναπροσδιορισμός των Notes. Επαναπροσδιορισμός των Roles. Οντολογία. Η έκδοση 2.0 εκφράζεται πλέον ως OWL απ ότι RDFS οντολογία. Πολλές ιδιότητες ορίζονται ως ιδιότητες αντικειμένων. Περισσότερες από τις ιδιότητες και τις οντότητες εκφράζονται καλύτερα σύμφωνα με τα πρότυπα της καταλογογράφησης. 4.2 Το Πρότυπο FRBR Το FRBR είναι ένα εννοιολογικό μοντέλο οντοτήτων συσχετίσεων το οποίο αναπτύχθηκε από τη Διεθνή Ομοσπονδία Ενώσεων και Ιδρυμάτων Βιβλιοθηκών. Το ακρωνύμιο FRBR σημαίνει Functional Requirements for Bibliographic Records και δημιουργήθηκε το Σεπτέμβρη του 1997 σαν προσπάθεια να συσχετίσει τις απαιτήσεις του χρήστη για ανάκτηση και πρόσβαση σε διαδικτυακές βάσεις δεδομένων και ψηφιακών καταλόγων βιβλιοθηκών από τη σκοπιά του χρήστη. Αντιπροσωπεύει μια πιο ολιστική προσέγγιση στην ανάκτηση και πρόσβαση καθώς οι σχέσεις μεταξύ των οντοτήτων παρέχουν συνδέσμους για την περιήγηση μέσω της ιεραρχίας των συσχετίσεων. Το μοντέλο είναι σημαντικό σε μεγάλο βαθμό γιατί διαχωρίζεται από τα υπάρχοντα πρότυπα καταλογογράφησης όπως οι Άγγλο Αμερικάνικοι Κανόνες Καταλογογράφησης (AACR) ή το Διεθνές Πρότυπο Βιβλιογραφικών Περιγραφών (ISBD). (IFLA Study Group on the Functional Requirements for Bibliographic Records, 2009) Σκοπός του FRBR είναι να δημιουργηθεί ένα αυστηρά καθορισμένο και δομημένο εργαλείο για τη συσχέτιση δεδομένων σε βιβλιογραφικές εγγραφές με τις απαιτήσεις των χρηστών για τις συγκεκριμένες εγγραφές. Επίσης είναι να προτείνει ένα επίπεδο λειτουργικότητας για εγγραφές που δημιουργούν οι διεθνής βιβλιογραφικοί οργανισμοί. Η τελευταία αναθεώρηση του μοντέλου FRBR το 2009, εστίασε στις ενέργειες που επιτελούν οι χρήστες όταν αναζητούν πληροφορίες σε υπηρεσίες βιβλιογραφικών και ηλεκτρονικών καταλόγων. Οι ενέργειες αυτές είναι: 1. Εντοπισμός μίας ή και περισσοτέρων οντοτήτων που αντιστοιχούν στα κριτήρια του χρήστη. 2. Ταυτοποίηση των σχετικών οντοτήτων μέσα από τα δεδομένα που ανακτήθηκαν. 3. Επιλογή μιας οντότητας που ικανοποιεί τις απαιτήσεις του χρήστη σε σχέση με το περιεχόμενο, τα φυσικά χαρακτηριστικά κλπ. 4. Απόκτηση πρόσβασης στην επιλεγμένη οντότητα. Οι βιβλιογραφικές πληροφορίες του μοντέλου του FRBR υλοποιούνται με ιεραρχική δομή. Με αυτόν τον τρόπο επιτυγχάνεται η περιγραφή από το υψηλότερο επίπεδο στο χαμηλότερο. 48

49 4.2.1 Δομή του FRBR Το FRBR απαρτίζεται από Ομάδες Οντοτήτων: 1. Ομάδα Οντοτήτων 1 είναι τα Έργα (works), οι Εκφράσεις αυτών (expressions), οι Ενδείξεις (manifestations), και τα Αντικείμενα (items), όπου όλα τα μέλη της συγκεκριμένης ομάδας αντιπροσωπεύουν τα προϊόντα πνευματικής ή καλλιτεχνικής δημιουργίας. 2. Ομάδα Οντοτήτων 2 είναι τα άτομα, τα οικογενειακά ή νομικά πρόσωπα όπου τα μέλη της συγκεκριμένης ομάδας είναι οι υπεύθυνοι για τη διαφύλαξη της πνευματικής ή καλλιτεχνικής δημιουργίας της Ομάδας Ομάδα Οντοτήτων 3 είναι τα υποκείμενα των Ομάδων 1 και 2 και περιλαμβάνουν τις έννοιες, τα αντικείμενα, τα γεγονότα ή τα μέρη. Εικόνα 19 Διάγραμμα Ομάδων Μοντέλου FRBR Η πρώτη Ομάδα Οντοτήτων του FRBR αποτελεί και τη σημαντικότερη ομάδα όλων. Το Έργο αντικατοπτρίζει μία μοναδική πνευματική ή καλλιτεχνική δημιουργία και η Έκφραση ένα πνευματικό ή καλλιτεχνικό περιεχόμενο ενός έργου ενώ η Υλοποίηση και το Στοιχείο αντικατοπτρίζουν τη φυσική μορφή ενός Έργου. 49

50 Εικόνα 20 Ομάδα Οντοτήτων 1 του FRBR Όπως φαίνεται από το παραπάνω διάγραμμα, μεταξύ των Οντοτήτων υπάρχουν κάποιες σχέσεις που τις συνδέουν. Ένα Έργο μπορεί να πραγματοποιηθεί μέσω ενός ή και περισσοτέρων Εκφράσεων. Ισχύει και το ανάποδο καθώς υπάρχει η αμφίδρομη σχέση, με τη διαφορά ότι μία Έκφραση πραγματώνει ένα και μόνο Έργο. Η Έκφραση ενσωματώνεται σε μία ή και περισσότερες Υλοποιήσεις, ενώ μία Υλοποίηση ενσωματώνει μία και μόνο Έκφραση και τέλος μία Έκφραση διευκρινίζεται από ένα ή και περισσότερα Στοιχεία, ενώ ένα Στοιχείο διευκρινίζει μία και μόνο Έκφραση. Με αυτόν τον τρόπο επιτυγχάνεται η ιεραρχική δομή του μοντέλου FRBR η οποία επιτρέπει σε κάποιον οργανισμό ή βιβλιοθήκη μία συνολική εικόνα για το τι μέλη γενέσθαι σε αυτόν. Επιπρόσθετα, στις σχέσεις της πρώτης ομάδας υπάρχει η δυνατότητα να υπάρχουν και σχέσεις μεταξύ των Οντοτήτων. Τέτοιες σχέσεις είναι οι Σχέσεις Έργου με Έργο, οι οποίες αποτελούνται από ζεύγη Έργων που επιτρέπουν τελικά τη συσχέτιση Έργων όπως για παράδειγμα η Οδύσσεια του Ομήρου με κάποια ανάλυση της Οδύσσειας από κάποιον άλλο συγγραφέα. Σε παρόμοιες σχέσεις υπάρχει και η σχέση Έκφρασης με Έκφραση που επιτρέπουν τις συσχετίσεις διαφόρων εκφράσεων όπως η μετάφραση ενός δοκιμίου. (Dunsire, 2013) Τέλος το μοντέλο επιτρέπει την ύπαρξη σχέσεων ολότητας ή τμήματος σε επίπεδο Έργου, Έκφρασης και Υλοποίησης. Τέτοιες σχέσεις σε βιβλιογραφικό επίπεδο είναι οι τόμοι μίας εγκυκλοπαίδειας ή κάποιο τεύχος περιοδικού. Η δεύτερη Ομάδα Οντοτήτων του FRBR περιέχει όλους του συντελεστές που είναι υπεύθυνοι για το πνευματικό ή καλλιτεχνικό περιεχόμενο, τη φυσική παραγωγή ή τη φύλαξη των Οντοτήτων της πρώτης Ομάδας. Περιλαμβάνουν ένα πρόσωπο ή μία ομάδα προσώπων ή οργανισμό. 50

51 Εικόνα 21Διάγραμμα σχέσεων πρώτης και δεύτερη Ομάδας Οντοτήτων FRBR Στο παραπάνω διάγραμμα γίνεται αντιληπτή η σχέση μεταξύ των Οντοτήτων της πρώτης και της δεύτερης Ομάδας. Ένα Έργο δύναται να δημιουργείται από ένα ή και περισσότερα πρόσωπα ή οργανισμούς και αντίστροφα. Μία Έκφραση μπορεί να πραγματοποιηθεί από ένα ή και περισσότερα άτομα ή οργανισμούς και αντιστρόφως. Μία Υλοποίηση μπορεί να παράγεται από ένα ή και περισσότερα άτομα ή οργανισμούς και αντιστρόφως. Ένα στοιχείο μπορεί να ανήκει σε ένα ή και περισσότερα άτομα ή οργανισμούς και αντίστροφα. Στη Τρίτη Ομάδα υπάγονται οι Οντότητες που εξυπηρετούν τη θεματογραφία ενός Έργου. Περιέχονται Οντότητες όπως Έννοια η οποία είναι μία ιδέα ή μία αφαιρετική σημείωση, Γεγονός που είναι μία ενέργεια ή ένα περιστατικό, Αντικείμενο που είναι κάποιο υλικό πράγμα κα τέλος ένα Μέρος που είναι μια τοποθεσία. 51

52 Εικόνα 22 Διάγραμμα Σχέσεων μεταξύ Έργου και τρίτης Ομάδας Οντοτήτων Σε αυτή την ομάδα η μόνη σχέση που υπάρχει είναι το θέμα μεταξύ των Οντοτήτων αυτής και της Οντότητας του Έργου. Ένα Έργο έχει σαν θέμα μία ή και περισσότερες Έννοιες, Αντικείμενα, Γεγονότα και Τόπους. Αντίστροφα, μία Έννοια, ένα Αντικείμενο, ένα Γεγονός και ένας Τόπος μπορούν να λειτουργούν ως θέματα σε ένα ή και περισσότερα Έργα. Επίσης ένα Έργο μπορεί να έχει σαν θέμα ένα ή και περισσότερα Έργα, Εκφράσεις, Υλοποιήσεις και Στοιχεία που ανήκουν στην πρώτη Ομάδα και αντιστρόφως. Καθώς μπορεί να έχει σαν θέμα ένα ή και περισσότερα πρόσωπα ή οργανισμούς και αντίστροφα Οντότητες FRBR Έργο Το Έργο είναι μία αφηρημένη οντότητα. Δεν υπάρχει κάποιο υλικό αντικείμενο που να αναγνωρίζεται ως Έργο. Ένα Έργο αναγνωρίζεται από τις Εκφράσεις του, αλλά το ίδιο το Έργο υπάρχει μόνο στο κοινό περιεχόμενο μεταξύ των διαφόρων Εκφράσεων του. Για παράδειγμα όταν γίνεται λόγος για την Ιλιάδα του Ομήρου σαν έργο αναφέρεται 52

53 στην πνευματική δημιουργία του Ομήρου και όχι σε κάποιο συγκεκριμένο κείμενο. Στο Έργο είναι δύσκολο να οριστούν συγκεκριμένα όρια λόγω της αφαιρετικότητας του όρου Έργο. Σαν έργο ορίζεται η δημιουργία κάποιου και το κείμενο σαν οντότητα ορίζεται από την Έκφραση αυτού του έργου. Σε περιπτώσεις διαφορετικών εκδόσεων κάποιου έγγραφου όπως περιληπτικές συγγραφές ή μεταφράσεις, αναφέρονται όλες στο ίδιο Έργο με διαφορετικές Εκφράσεις μεταξύ τους. Σαν έργο μπορεί να θεωρεί για παράδειγμα: Ο Χριστός ξανασταυρώνεται του Νίκου Καζαντζάκη. Οι Άθλιοι του Βίκτωρ Ουγκώ. Σαν ιδιότητες της Οντότητας του Έργου ορίζονται οι εξής: Ο τίτλος Η μορφή Η ημερομηνία Κάποιο άλλο ιδιαίτερο ξεχωριστό χαρακτηριστικό Ο επιδιωκόμενος τερματισμός του Το κοινό που απευθύνεται Για μουσικά Έργα, το μέσο εκτέλεσής του, ο αριθμητικός προσδιορισμός των μέσων εκτέλεσης και το κλειδί Για χαρτογραφικά Έργα, οι συντεταγμένες και η ισημερία Σε κάθε Έργο δεν είναι υποχρεωτική η ύπαρξη όλων των παραπάνω ιδιοτήτων. Έκφραση Η Έκφραση είναι η φυσική αναπαράσταση ενός έργου σε οποιαδήποτε μορφή. Με τον όρο μορφή εννοείται το κείμενο που αποτελείται από λέξεις, προτάσεις παραγράφους κλπ, διαλόγους σε θεατρική παράσταση, εικόνες, βίντεο κ.α. Οι μεταφράσεις κειμένων αποτελούν διαφορετικές Εκφράσεις μεταξύ τους με κοινό σημείο αναφοράς ότι αναπαριστούν όλες το ίδιο Έργο. Σαν Έκφραση του Έργου οι Άθλιοι του Ουγκώ μπορεί να χαρακτηριστεί: Η μεταφρασμένη έκδοση στα ελληνικά από τα γαλλικά. Το πρωτότυπο κείμενο στα γαλλικά. Η ακουστική αφήγηση του Έργου. Σύμφωνα με το μοντέλο του FRBR ως νέα Έκφραση θεωρείται οποιαδήποτε Έκφραση που περιλαμβάνει για παράδειγμα, συγκεκριμένες λέξεις, προτάσεις ή σκέψεις που προκύπτουν από την υλοποίηση του Έργου με τη μορφή κειμένου, ήχου κλπ. Δηλαδή αν ένα Έργο εκφράζεται σε κάποια μορφή που διαφέρει από τις προηγούμενες εκδόσεις ως προς τον τρόπο έκφρασης του περιεχομένου, αποτελεί νέα Έκφραση. Για τον λόγο που αναφέρθηκε οι μεταφράσεις των Έργων ορίζονται ως διαφορετικές Εκφράσεις καθώς χρησιμοποιούνται διαφορετικές λέξεις και προτάσεις για την αναπαράσταση 53

54 ενός Έργου. Επίσης ως διαφορετική έκφραση θεωρείται το ίδιο Έργο μεταφρασμένο σε μία συγκεκριμένη γλώσσα από διαφορετικό μεταφραστή καθώς δεν περιέχονται οι ίδιες ακριβώς λέξεις και προτάσεις. Επίσης ένα μείζον ζήτημα στο FRBR μοντέλο είναι η κατανόηση του πότε δημιουργείται καινούριο Έργο ή πότε δημιουργείται καινούρια Έκφραση. Το FRBR έχει αναπτύξει συγκεκριμένους κανόνες για το πότε δημιουργούνται καινούριες Εκφράσεις: Αναθεωρήσεις κειμένου. Συμπτύξεις και διευρύνσεις του υπάρχοντος κειμένου. Μεταφράσεις από μία γλώσσα σε άλλη. Μεταγλωττισμένες ταινίες και εκδόσεις μιας ταινίας με υπότιτλους. Μουσικές παραγωγές με βάση το υπάρχον κείμενο. Οι τροποποίηση κάποιων Έργων μπορεί από μία άποψη να θεωρηθεί ως νέο Έργο, αν και μόνο υπάρχει ανεξαρτησία από την αρχική πνευματική ή καλλιτεχνική δημιουργία. Έτσι ως νέο Έργο στο FRBR ορίζεται: Παραφράσεις, προσαρμογές για παιδιά και παρωδίες. Προσαρμογές ενός Έργου από ένα λογοτεχνικό είδος ή μορφή τέχνης σε ένα άλλο. Περιλήψεις και αποσπάσματα. Αναλύσεις πάνω σε συγκεκριμένα Έργα. Έτσι η ταινία των Άθλιων που γυρίστηκε το 1999 αποτελεί νέο Έργο από τους Άθλιους του Ουγκώ καθώς αποτελεί διαφορετική απόδοση και ανεξάρτητη καλλιτεχνική δημιουργία από το πρωτότυπο κείμενο, ενώ η μετάφραση από το πρωτότυπο γαλλικό κείμενο στο αντίστοιχο ελληνικό αποτελεί διαφορετική Έκφραση. Κάποιες από τις ιδιότητες των Εκφράσεων: Ο τίτλος Η μορφή Η ημερομηνία Η γλώσσα Η επεκτασιμότητα Η αναθεωρησιμότητα Η έκταση Η περίληψη του περιεχομένου Το πλαίσιο για την Έκφραση Για περιοδικά, το μοτίβο της ακολουθίας, η αναμενόμενη κανονικότητα του τεύχους και η αναμενόμενη συχνότητα του τεύχους Όπως και στο Έργο κάποιες από τις παραπάνω ιδιότητες μπορεί να παραλείπονται. 54

55 Υλοποιήσεις Οι Ενδείξεις είναι οι φυσικές υλοποιήσεις μίας Έκφρασης ενός Έργου. Η συγκεκριμένη Οντότητα περιέχει ένα μεγάλο εύρος υλικών όπως, τα σενάρια, τα βιβλία, τα περιοδικά, οι χάρτες, οι εικόνες, τα φιλμ κλπ. Αναπαριστά κοινώς όλα τα φυσικά αντικείμενα που φέρουν τα ίδια χαρακτηριστικά ώστε να υλοποιηθεί ένα μία Έκφραση ενός Έργου, τόσο σε φυσική όσο και σε πνευματική μορφή. Σε συνέχεια του προηγούμενου παραδείγματος το βιβλίο Άθλιοι που εκδόθηκε το 1932 από τον εκδοτικό οίκο Χ είναι διαφορετική Υλοποίηση της ίδιας Έκφρασης από την νέα έκδοση του ίδιου εκδοτικού οίκου με σκληρό εξώφυλλο το Γενικά ως διαφορετικές Υλοποιήσεις θεωρεί το μοντέλο τις αναδημοσιεύσεις του κειμένου, τα διαφορετικά μέσα που εκφράζουν την ίδια Έκφραση και τη διαφορετικές μορφές των ίδιων Εκφράσεων. Μερικές από τις ιδιότητες των Υλοποιήσεων είναι: Ο τίτλος Η δήλωση υπευθυνότητας Ο προσδιορισμός έκδοσης ή τεύχους Ο τόπος δημοσίευσης ή διανομής Ο κατασκευαστής Η έκταση του φορέα Το φυσικό μέσο Ο τρόπος λήψης Οι χαρακτήρες εκτύπωσης, όταν αφορά έντυπο βιβλίο Η αντιπαραβολή, όταν αφορά χειρόγραφο βιβλίο Για περιοδικά, το καθεστώς δημοσίευσης και ο σειριακός αριθμός Για ηχογράφηση, ο τύπος εγγραφής δίσκου, η διαμόρφωση της μαγνητικής ταινίας και το είδος του ήχου Το χρώμα, όταν πρόκειται για εικόνα Η αναλογία σμίκρυνσης όταν πρόκειται και microform. Στοιχεία Τα Στοιχεία αναφέρονται σε μεμονωμένα υλικά πράγματα τα οποία υλοποιούν τις Ενδείξεις. Τέτοιες περιπτώσεις είναι το αντίγραφο ενός σεναρίου, ένα βιβλίο, μία κασέτα. Σαν μεμονωμένο βιβλίο αναφέρεται ένα συγκεκριμένο αντίτυπο και όχι ολόκληρη η έκδοση, κάτι το οποίο ισχύει για όλα τα Στοιχεία. Για παράδειγμα ένα αντίτυπο όταν είναι υπογεγραμμένο από το συγγραφέα είναι άλλο Στοιχείο από το ίδιο αντίτυπο που δεν έχει υπογραφή. Σε γενικές γραμμές τα χαρακτηριστικά που διαχωρίζουν τα Στοιχεία που αφορούν την ίδια Υλοποίηση μπορεί να είναι η κατάσταση του αντικειμένου (να λείπουν κάποιες σελίδες ή να έχει καταστραφεί το εξώφυλλο), να λείπει κάποιο παράρτημα, κλπ. Κατά κύριο λόγο, τα Στοιχεία είναι εξαιρετικά χρήσιμα στις μεγάλες βιβλιοθήκες που έχουν στην κατοχή τους πολλά 55

56 αντίτυπα του ίδιου βιβλίου και θα πρέπει να γνωρίζουν οι βιβλιοθηκονόμοι την κατάσταση αυτών. Μερικές από τις ιδιότητες του Στοιχείου είναι: Το αναγνωριστικό του αντιτύπου Το αποτύπωμα Η προέλευση Οι ετικέτες/λεζάντες Η ιστορία έκθεσης Η κατάσταση Η ιστορία αποκατάστασης Η προγραμματισμένη αποκατάσταση Οι περιορισμοί πρόσβασης Πρόσωπο Το πρόσωπο αναφέρεται σε κάποιον άνθρωπο. Η Οντότητα Πρόσωπο μπορεί να έχει σχέσεις με όλες τις Οντότητες του Μοντέλου FRBR όπως ότι ένα Έργο έχει σαν δημιουργό ένα πρόσωπο, ότι για μία Έκφραση είναι υπεύθυνο κάποιο Πρόσωπο κλπ. Η οντότητα Πρόσωπο έχει κάποιες ιδιότητες όπως το όνομα του προσώπου, σημαντικές ημερομηνίες (γέννηση, θάνατος, κλπ), τον τίτλο που έχει κάποιο πρόσωπο όπως Βασιλιάς, Sir κλπ και τέλος άλλοι προσδιορισμοί που συνδέονται με ένα πρόσωπο. Εταιρικό Σώμα Λειτουργεί ακριβώς όπως και στην περίπτωση του Προσώπου, με τη διαφορά ότι δεν αναφέρεται σε έναν μεμονωμένο άνθρωπο, αλλά σε μία ομάδα ατόμων ή οργανισμό. Οι ιδιότητες που έχει η Οντότητα Εταιρικό Σώμα μοιάζουν πολύ με του Προσώπου, δηλαδή, το όνομα του οργανισμού, ένας αριθμός που σχετίζεται με τον οργανισμό, ο τόπος που σχετίζεται με τον οργανισμό, η ημερομηνία που είναι σημαντική όπως η ημερομηνία ίδρυσης, και τέλος οποιοσδήποτε άλλος συσχετισμός με τον οργανισμό. Έννοια Με την Οντότητα έννοια ορίζεται στο μοντέλο οποιαδήποτε αφηρημένη θεωρία ή ιδέα. Περιλαμβάνει μια περιεκτική αφαιρετικότητα που μπορεί να είναι στο περιεχόμενο ενός Έργου όπως για παράδειγμα πεδία γνώσης, κλάδους, σχολές σκέψης, θεωρίες, διαδικασίες, τεχνικές, πρακτικές κ.α. Μία Έννοια μπορεί να είναι ευρεία ή στενά καθορισμένη και ακριβής. Αντικείμενο Το Αντικείμενο ορίζεται οτιδήποτε υλικό πράγμα στη φύση. Με την Οντότητα Αντικείμενο ορίζεται στο μοντέλο οτιδήποτε έμψυχο ή άψυχο φυσικό αντικείμενο, που 56

57 ενδεχομένως να είναι προϊόν ανθρώπινης δημιουργίας αλλά και όχι. Επίσης αναφέρεται και σε πράγματα που μπορεί να μην υπάρχουν πια. Γεγονός Το Γεγονός είναι μια δραστηριότητα ή κάποιο συμβάν. Αναφέρεται κυρίως σε ιστορικά γεγονότα και περιόδους όπως μάχες, σημαντικές περιόδους τις ανθρώπινης ιστορίας κλπ. Τόπος Αναφέρεται σε κάποια συγκεκριμένη τοποθεσία που περιέχει γεωγραφικό μήκος και πλάτος. (Riva, Le Boeuf, & Žumer, 2016) (Tillett) 4.3 Ο Ρόλος του VIAF στις ψηφιακές Βιβλιοθήκες Το VIAF (Virtual International Authority File) είναι ένα διεθνές αρχείο καθιερωμένων όρων. Αποτελεί το κοινό εγχείρημα πολλών διεθνών βιβλιοθηκών ανά τον κόσμο και λειτουργεί σύμφωνα με το πρότυπο του OCLC (Online Computer Library Center). Το εγχείρημα του VIAF ξεκίνησε στα τέλη της δεκαετίας του 1990 ως έρευνα και με πρωτοβουλία της Βιβλιοθήκης του Κογκρέσου, της Εθνικής Βιβλιοθήκης της Γερμανίας και του OCLC και ξεκίνησε η υλοποίησή του το 2003 για τη δημιουργία μιας κοινής παγκόσμιας αρχή. Το συγκεκριμένο εγχείρημα βασίστηκε στην ιδέα της διασύνδεσης των δεδομένων όλων των βιβλιοθηκών παγκοσμίως ώστε να υπάρχει ένα κοινό σημείο αναφοράς μεταξύ τους. Με αυτόν τον τρόπο θα επωφελούνταν καθώς δεν θα χρειαζόταν πολύτιμος χρόνος για την έρευνα των οντοτήτων. Για παράδειγμα εάν έπρεπε να γίνει μια καταχώρηση του προσώπου Όμηρος στην ηλεκτρονική βιβλιοθήκη της Ελλάδας αντί να γίνει ολόκληρη έρευνα γύρω από αυτό το πρόσωπο, αρκεί απλά να γίνει αναζήτηση στο VIAF και να διασυνδεθεί με τα δεδομένα των υπολοίπων βιβλιοθηκών. Από το 2003 και μετά πολλές βιβλιοθήκες συμμετέχουν στο VIAF και με τα δεδομένα τους ενημερώνουν σε συνεχή βάση την παγκόσμια αρχή. 57

58 Εικόνα 23 Οι Βιβλιοθήκες ανά τον κόσμο που συμμετέχουν στο VIAF Το VIAF για κάθε οντότητα προσθέτει ένα μοναδικό κωδικό. Η αναζήτηση όρων στο VIAF είναι αρκετά εύχρηστη και δίνει πολλές δυνατότητες στον χρήστη να φιλτράρει το επερώτημα που θέτει στη βάση του VIAF. Για παράδειγμα στα πεδία της αναζήτησης περιέχει τις επιλογές: Αναζήτηση σαν εταιρικό όνομα. Αναζήτηση σαν γεωγραφικό όνομα. Αναζήτηση σαν όνομα προσώπου. Αναζήτηση σαν προτιμώμενη επικεφαλίδα. Αναζήτηση σαν βιβλιογραφικός τίτλος. Αναζήτηση σαν ακριβή επικεφαλίδα. Αναζήτηση έργου (σε επίπεδο FRBR). Αναζήτηση έκφρασης (σε επίπεδο FRBR). Με την αναζήτηση του όρου το VIAF επιστρέφει τα αποτελέσματα με την εξής μορφή: 58

59 Εικόνα 24 Αποτελέσματα επερώτησης στο VIAF Όπως φαίνεται και στο σχήμα, τα αποτελέσματα στο επερώτημα Gritzalis Dimitris επιστρέφει αποτελέσματα από 3 διαφορετικά μοναδικά VIAF ID. Κάθε βιβλιοθήκη έχει τη δυνατότητα να ενημερώσει τα δεδομένα της με βάση τα IDs των άλλων βιβλιοθηκών είτε να δημιουργήσει καινούρια οντότητα. Αυτό συμβαίνει είτε σε περίπτωση συνωνυμίας μεταξύ δύο προσώπων, είτε από επιλογή της εκάστοτε βιβλιοθήκης είτε σε λάθος των MARC δεδομένων. Εάν επιλεγεί η πρώτη εγγραφή για μελέτη από τον χρήστη τα αποτελέσματα που δίνονται είναι: Εικόνα 25 Αναπαράσταση εγγραφής στο VIAF 59

60 Στο παραπάνω σχήμα διακρίνονται οι τίτλοι Preferred Forms, Alternative Name Forms, Related Names. Αυτά τα πεδία αντιπροσωπεύουν τις τιμές από τις MARC εγγραφές όπου έγινε η ανάκτηση των συγκεκριμένων τιμών. Στο Preferred Form αντιστοιχεί η τιμή Dimitris Gritzalis που βρέθηκε στο πεδίο 100 μιας MARC εγγραφής μίας συγκεκριμένης βιβλιοθήκης, όπου δηλαδή εμφανίζεται ως συγγραφέας. Αντίστοιχα στο Alternative Name Form αντιστοιχίζεται το πεδίο 4ΧΧ και στο Related Name αντιστοιχίζεται το πεδίο 5ΧΧ. Μαζί με τα παραπάνω πεδία υπάρχουν και τα εξής: Εικόνα 26 Πρόσθετα πεδία του VIAF Τα πεδία Works, Selected Co authors, Countries and Regions of Publication, Publication Statistics, Selected Publishers, About, Record Views και History of VIAF ID. Στο πεδίο Works εμφανίζονται τα έργα που συμμετέχει, στο πεδίο Co authors εμφανίζονται οι υπόλοιποι συγγραφείς που συνεργάστηκαν μαζί του, στο Countries and Regions of Publication εμφανίζεται ο χάρτης με τις χώρες που έχουν γίνει οι δημοσιεύσεις, στο Selected Publishers εμφανίζονται οι εκδοτικοί οργανισμοί που εξέδωσαν τα παραπάνω έργα και στο History of VIAF ID εμφανίζεται το ιστορικό της καταχώρησης ή διαγραφής του όρου από την εκάστοτε βιβλιοθήκη 60

61 5. Τεκμηρίωση Υλοποίησης Πλατφόρμας Η υλοποίηση της Πλατφόρμας χωρίστηκες στις εξής φάσεις: 1. Ομαδοποίηση Δεδομένων BIBFRAME από δεδομένα MARCXML. 2. Ομαδοποίηση Δεδομένων FRBR από δεδομένα MARCMXL. 3. Μετατροπή Δεδομένων από FRBR σε BIBFRAME. 4. Σύγκριση αποτελεσμάτων μετατροπής μεταξύ 1 ου και 3 ου βήματος με βάση τη σωστή ομαδοποίηση των δεδομένων. 5.1 Ομαδοποίηση Δεδομένων BIBFRAME από Δεδομένα MARCXML Για τη διαδικασία της ομαδοποίησης ακολουθήθηκε η εξής διαδικασία. 1. Μετατροπή των MARCXML εγγράφων από το αρχικό Dataset σε έγγραφα RDF σύμφωνα με το πρότυπο του BIBFRAME. Για αυτή τη διαδικασία χρησιμοποιήθηκε το εργαλείο μετατροπής δεδομένων από MARC σε BIBFRAME του εργαλείου της Βιβλιοθήκης του Κογκρέσου (Marc2Bibframe) μέσω της πλατφόρμας του Ιονίου Πανεπιστημίου που βρίσκεται στη διεύθυνση Το αρχικό Dataset που δόθηκε αποτελούταν από MARC εγγραφές των έργων: 100 χρόνια μοναξιάς, Μαντάμ Μποβαρί, Έγκλημα και τιμωρία, DQ, Φάουστ, Ιλιάδα, Αδελφοί Καραμαζόφ, Οδύσσεια, Σκάρλετ Λέτερ, Τομ Σόγιερ, Ανεμοδαρμένα ύψη. Ο συνολικός αριθμός των έργων που υπήρχαν στο Dataset ήταν Επεξεργασία των δεδομένων του RDF με χρήση της γλώσσας προγραμματισμού Java και της βιβλιοθήκης του Apache Jena. Μέσω των βιβλιοθηκών που παρέχονται από το Apache Jena, γίνεται επεξεργασία όλων των τριάδων που προκύπτουν από τη σχέση υποκείμενο κατηγόρημα αντικείμενο. Με τον όρο επεξεργασία ορίζεται η αποθήκευση των τριάδων (στη βιβλιοθήκη του Apache Jena δηλώνονται ως αντικείμενα τύπy Statement) που διαβάζονται από το RDF αρχείο μέσα σε γράφο του Apache Jena Fuseki, τροποποίηση όλων των μερών μιας τριάδας και πιο συγκεκριμένα το υποκείμενο, το κατηγόρημα και το αντικείμενο. Παρέχεται επίσης η δυνατότητα για δημιουργία νέας τριάδας καθώς και η διαγραφή μίας υπάρχουσας. Όλα τα είδη της επεξεργασίας υλοποιούνται μέσω συναρτήσεων που υπάρχουν στις κλάσεις αντικειμένων του Apache Jena και πιο συγκεκριμένα στις κλάσεις Statement, Resource, RDFNode και Property. 3. Αποθήκευση και ενημέρωση της βάσης δεδομένων συνδεδεμένων δεδομένων Jena Fuseki από τα επεξεργασμένα δεδομένα του βήματος 2. Κάθε παραγόμενο RDF αρχείο από τον μετατροπέα του βήματος 1, περιέχει εξής χαρακτηριστικά: 61

62 Για τα Works: About Το URI του Έργου. AdminMetadata Σε αυτό το κομμάτι αναφέρονται πληροφορίες για το διαχειριστικό μέρος του BIBFRAME αρχείου, όπως σε ποια κατάσταση βρίσκεται, τη κωδικοποίηση χρησιμοποιεί, τον κωδικό του, από ποια πηγή προήλθε, η ημερομηνία επεξεργασίας και δημιουργίας κλπ. Type Σε αυτό το κομμάτι αναφέρεται ο τύπος του Έργου. Αν είναι σε μορφή κειμένου, σε μορφή ήχου κλπ. 62

63 Language Note Σε αυτό το κομμάτι αναφέρεται η γλώσσα που είναι γραμμένο το Έργο. Σε αυτό το κομμάτι γίνονται αναφορές για πρόσθετες πληροφορίες του Έργου. Στο συγκεκριμένο παράδειγμα, στο πεδίο Note προστίθεται η πληροφορία ότι το έργο περιέχει μετάφραση, πληροφορία που προκύπτει από το tag 041 του MARCXML αρχείου και από τον Indicator του tag που έχει τη τιμή 1. Language Σε αυτό το κομμάτι αναφέρονται οι γλώσσες που είναι γραμμένο το έργο. Όπως σημειώθηκε στο προηγούμενο κομμάτι το Έργο φαίνεται να έχει μετάφραση, άρα περιέχει και μία γλώσσα που είναι γραμμένο το πρωτότυπο Έργο και άλλη μία που είναι γραμμένο το Έργο που επεξεργάζεται. Classification 63

64 Σε αυτό το κομμάτι γίνεται η αναφορά της κατηγοριοποίησης του Έργου ανάλογα τη θέμα του. Contribution Σε αυτό το κομμάτι γίνεται η αναφορά στον κύριο συντελεστή ενός Έργου και στις πληροφορίες αυτού. Label Σε αυτό το κομμάτι αναγράφεται η ετικέτα του Έργου. Title 64

65 Σε αυτό το κομμάτι γίνεται η επισκόπηση του τίτλου ενός Έργου. Όπως φαίνεται από τον πίνακα, υπάρχουν διάφορες εκδοχές του τίτλου, ανάλογα με ποια Tags και για αυτά τα Tags, ποιοι Indicators υπάρχουν. Language Και σε αυτό το κομμάτι γίνεται αναφορά της γλώσσας του Έργου, αυτή τη φορά με χρήση ετικέτας και όχι URI όπως ήταν σε προηγούμενο πίνακα. TranslationOf (αν υπάρχει) Η σχέση TranslationOf προστίθεται στο RDF μόνο σε περίπτωση που το Tag 041 του MARCXML έχει Indicator 1. H πληροφορία του μεταφρασμένου έργου προκύπτει από το Tag 240 και το Subfield με κωδικό a. Σε αυτό το πεδίο κατά την μετατροπή από MARC σε BIBFRAME, δημιουργείται ένα νέο έργο το οποίο αποτελεί την αρχική έκδοση του έργου πάνω στο οποίο έγινε η μετάφραση. Το πρωτότυπο έργο επίσης δεν περιλαμβάνει τον συγγραφέα παρά μόνο τον τίτλο του έργου. Contribution 65

66 Σε αυτό το κομμάτι του Contribution υπάρχει πληροφορία για συντελεστή του έργου. Πάλι δίδονται πρόσθετες πληροφορίες για αυτόν καθώς και ο ρόλος του. 66

67 Subject Σε αυτό το κομμάτι γίνεται αναφορά για το περιεχόμενο του έργου. Δίνονται πληροφορίες για τους ήρωες αυτού, σε ποια λογοτεχνική ομάδα ανήκει, αν ανήκει σε συλλογή έργων ή είναι ατομική οντότητα κλπ. HasInstance Σε αυτό το κομμάτι γίνεται αναφορά ότι το Έργο που επεξεργάζεται έχει κάποιο Instance και ποιο είναι αυτό. Για τα Instances: About Το URI του Στιγμιότυπου. Issuance 67

68 Σε αυτό το κομμάτι δίνονται οι πληροφορίες για το αν το Στιγμιότυπο υλοποιείται σε ένα ή είναι κομμάτι περισσοτέρων Στιγμιότυπων. ProvisionActivity Σε αυτό το κομμάτι γίνεται αναφορά για την έκδοση του Στιγμιότυπου. Αναφέρονται πληροφορίες όπως ο τόπος έκδοσης και η ημερομηνία. IdentifiedBy Σε αυτό το κομμάτι αναφέρεται το μοναδικό αναγνωριστικό του Στιγμιότυπου. Label Η ετικέτα του Στιγμιότυπου. Title Σε αυτό το κομμάτι αναφέρονται πληροφορίες για τον τίτλο του Στιγμιότυπου. ResponsibilityStatement 68

69 ProvisionActivity Σε αυτό το ProvisionActivity γίνεται αναφορά για τον εκδότη, το όνομά του, την έδρα του και την ημερομηνία έκδοσης του Στιγμιότυπου. ProvisionActivityStatement Σε αυτό το κομμάτι αναφέρεται αναλυτικά όλη η διεύθυνση του εκδότη. Extent Dimensions Σε αυτό το κομμάτι γίνεται αναφορά για τις διαστάσεις του βιβλίου. InstanceOf Στη σχέση InstanceOf γίνεται αναφορά σε ποιο Έργο ανήκει το Στιγμιότυπο. Είναι η αμφίδρομη σχέση HasInstance του Έργου προς το Στιγμιότυπο. 69

70 HasItem Σε αυτό το κομμάτι γίνεται αναφορά για το αν ένα Στιγμιότυπο έχει Item και τι πληροφορίες περιέχει αυτό όπως το URI του, η ετικέτα του κλπ. Σύμφωνα με τους παραπάνω πίνακες βγαίνει το συμπέρασμα ότι σε κάθε έγγραφο MARCXML όταν αυτό μετατρέπεται σε BIBFRAME, υπάρχει τουλάχιστον ένα BIBFRAME Work, το οποίο ενδεχομένως περιέχει ένα BIBFRAME Instance και αυτό κατ επέκταση ενδεχομένως περιέχει ένα Item. Για να γίνει η διαχείριση τους αυτά τα δεδομένα από τα BIBFRAME έγγραφα πρέπει να καταχωρηθούν σε μία βάση συνδεδεμένων δεδομένων. Η βάση που εξυπηρετεί καλύτερα τέτοιο σκοπό είναι το Fuseki της Apache. Καθώς τα δεδομένα που παράγονται από τον μετατροπέα του Ιονίου Πανεπιστημίου είναι σε μορφή RDF, η καλύτερη επιλογή ώστε να μην χαθεί καθόλου πληροφορία σε μετέπειτα μετατροπές είναι να αποθηκευτούν σε ένα RDF αποθετήριο. Στο πλαίσιο της διπλωματικής, στο κομμάτι της ομαδοποίησης των Works και των Instances του Bibframe αρχικά μετατράπηκαν όλα τα MARCXML έγγραφα του δοθέντος Dataset σε RDF έγγραφα. Σε επόμενο στάδιο δημιουργήθηκε η βάση δεδομένων στο Fuseki και κατ επέκταση ο γράφος με όνομα BIBFRAME στον οποίο θα περάσουν τα δεδομένα του Dataset. Σύμφωνα με τον αλγόριθμο που αναπτύχθηκε, τα δεδομένα των RDF εγγραφών ομαδοποιούνται με συγκεκριμένα κριτήρια όπως περιγράφονται αναλυτικότερα από τη διπλωματική του Παπαϊωάννου Άγγελου. Οπότε για κάθε Bibframe Work του RDF αρχείου συγκρίνεται με τα υπόλοιπα Bibframe Works του υπόλοιπου αρχείου και της βάσης. Άρα για κάθε Work που υπάρχει στο αρχείο RDF δημιουργείται ένα Creative Work ενώ για κάθε Instance δημιουργείται ένα Creative Instance. Ο όρος CreativeWork και Creative Instance χρησιμοποιήθηκε για να δοθεί η έννοια του ομαδοποιημένου Work και του ομαδοποιημένου Instance αντίστοιχα. Οι δύο αυτοί όροι δεν αναγράφονται στη βιβλιογραφία και χρησιμοποιούνται αποκλειστικά στο πλαίσιο της διπλωματικής προκειμένου να γίνει κατανοητό ότι κάθε CreativeWork αντικατοπτρίζει μία ομάδα Works με μοναδικό URI και τα χαρακτηριστικά που περιγράφηκαν στον αλγόριθμο ομαδοποίησης του BIBFRAME από τον Παπαϊωάννου Άγγελο. Αντίστοιχη είναι και η διαδικασία για τα CreativeInstances. 70

71 Επίσης γίνεται έρευνα για τους συντελεστές αν υπάρχει το όνομα τους στη βάση δεδομένων του Viaf. Σε περίπτωση που υπάρχει του ανατίθεται και ένα Viaf Uri. Στη συνέχεια, για κάθε Creative Work του αρχείου, ερευνάται σε πρώτη φάση αν υπάρχει κάποιο άλλο Creative Work στο ίδιο αρχείο με ίδιο τίτλο, ίδιο Πρωτεύων Συντελεστή (πχ συγγραφέας), ίδιο τύπο και ίδια γλώσσα, τότε ενημερώνει το Creative Work που εξετάζεται με τη σχέση sameas με το Work του Creative Work που βρήκε ίδιο. Όταν ολοκληρωθεί ο έλεγχος των Creative Works εντός του αρχείου, η πλατφόρμα κρατάει στη μνήμη της μία λίστα με τα ενημερωμένα Creative Works. Αυτή η λίστα στη συνέχεια συγκρίνεται με την ίδια διαδικασία με τα Creative Works του γράφου και σε περίπτωση που βρεθεί Creative Work ίδιο με της βάσης, τότε το Creative Work της βάσης ενημερώνεται με το Work του αρχείου. Σε περίπτωση που δεν βρεθεί κάποιο ίδιο τότε το Creative Work της λίστας του αρχείου προστίθεται στο γράφο. (Zapounidou, Sfakakis, & Papatheodorou, 2017) Όταν ολοκληρωθούν όλες οι εισαγωγές στο γράφο test, ο γράφος έχει την εξής μορφή: 71

72 Όπως φαίνεται από το σχήμα του γράφου τα δεδομένα έχουν ομαδοποιηθεί σύμφωνα με τα κριτήρια που έχουν τεθεί. Στο Dataset της Ιλιάδας υπάρχουν 43 CreativeWorks και 24 CreativeInstances. Από τα 43 CreativeWorks, τα 15 είναι ομαδοποιημένα έργα από τα αρχεία της Ιλιάδας. Τα υπόλοιπα 28 είναι έργα που είναι είτε μεταφράσεις Έργων είτε σχετιζόμενα έργα που προκύπτουν από τα tags των MARC εγγραφών στη μετατροπή τους. 72

73 5.2 Ομαδοποίηση Δεδομένων από MARCXML σε FRBR Η μετατροπή των αρχείων από MARC σε FRBR έγινε με χρήση του αντίστοιχου εργαλείου της Βιβλιοθήκης του Κογκρέσου (FRBR Display Tool) και πιο συγκεκριμένα το FRBR Display Tool Version 2.0. Το συγκεκριμένο εργαλείο έχει τη δυνατότητα να δέχεται σαν είσοδο αρχεία τύπου MARC και να τα μετατρέπει σε αρχεία μορφής XML σύμφωνα με το πρότυπο του FRBR. Καθώς τα δεδομένα του Dataset ήταν ήδη σε μορφή MARCXML και όχι σε MARC, συνεπώς δεν χρειάζονταν κάποια τροποποίηση, το συγκεκριμένο εργαλείο τροποποιήθηκε αναλόγως. (Zapounidou, Sfakakis, & Papatheodorou, 2017) Σε μία σύντομη επισκόπηση του τροποποιημένου εργαλείου, αρχικά δίδεται το MARCXL που θέλει ο χρήστης να μετατραπεί σύμφωνα με το FRBR πρότυπο. Το αρχικό MARCXML έχει την εξής μορφή: Στη συνέχεια, το αρχείο SLIM2FRBR.bat, το οποίο είναι αρχείο δέσμης ενεργειών για τα λειτουργικά συστήματα της Microsoft και περιέχει τις εξής μακροεντολές: 73

74 Σύμφωνα με τις παραπάνω εντολές, το εισερχόμενο MARCXML αρχείο κάνει χρήση του saxon7.jar και του Stylesheet clean.xsl. Αφού ολοκληρωθεί η διαδικασία του clean.xls, το προσωρινό αρχείο που προκύπτει, το clean.xml, επεξεργάζεται από το match.xsl και παράγεται το προσωρινό αρχείο match.xml. Τέλος το match.xml επεξεργάζεται από το FRBRize.xsl και παράγεται το τελικό αποτέλεσμα που είναι το xml σύμφωνα με το πρότυπο του FRBR. Όπως αναφέρθηκε, γίνεται χρήση τριών αρχείων xsl. Η γλώσσα xsl (xml Style Language) είναι σχεδιασμένη ειδικά για τον μετασχηματισμό ενός κειμένου από τη μορφή xml σε HTML. Παρόλα αυτά δίνει τη δυνατότητα για μετατροπή κειμένων xml σε διαφορετική δομή όπως κάνει το εργαλείου της Βιβλιοθήκης του Κογκρέσου (FRBR Display Tool). Αναλυτικότερα οι διαδικασίες clean, match και FRBRize: Η διαδικασία του clean είναι να κόβει τους ειδικούς χαρακτήρες από το αρχικό MARCXML αρχείο και να παράγει το αντίστοιχο χωρίς αυτούς. Στη διαδικασία του match ερευνώνται οι ειδικές ταμπέλες του MARC όπως το 100, 110, 111, 130, 240, 243 και 245 και οι ανάλογοι κωδικοί που μπορούν να εξάγουν πληροφορία για το τι είναι η κάθε μία ταμπέλα. Στη διαδικασία FRBRize ερευνώνται οι οντότητες και οι σχέσεις του μοντέλου FRBR και εξάγεται το τελικό μοντέλο. Οπότε μετά το πέρας της επεξεργασίας από το εργαλείου της Βιβλιοθήκης του Κογκρέσου (FRBR Display Tool), το παραπάνω MARCXML αρχείο, έχει εξαχθεί με τη μορφή: 74

75 Από τη στιγμή που τα δεδομένα μετατράπηκαν σύμφωνα με το πρότυπο του FRBR, το επόμενο βήμα είναι να ομαδοποιηθούν σε έναν γράφο. Όπως και στην ομαδοποίηση των δεδομένων του BIBFRAME, γίνεται χρήση του server Fuseki της Apache και ως όνομα για το γράφο ορίζεται το FRBR. Χρησιμοποιήθηκαν τα ίδια δεδομένα όπως και στην περίπτωση του BIBFRAME. Στην εφαρμογή σε πρώτη φάση διαβάζεται το xml που περιέχει το εκάστοτε FRBR μοντέλο και προκειμένου να γίνει αναγνώσιμο από την εφαρμογή κάνοντας χρήση των βιβλιοθηκών της Java για την μετατροπή αρχείων καθώς και το XmlToRDFConv.xsl το οποίο διαβάζει ένα ένα όλα τα συστατικά μέρη του xml αρχείου και επιστρέφει το μοντέλο σε μορφή rdf από xml. Οπότε πλέον η επεξεργασία γίνεται στο rdf αρχείο, κάτι το οποίο μας επιτρέπει να γίνει μέσω της βιβλιοθήκης του Jena. Σε επόμενο βήμα γίνεται ανάγνωση όλων των τριάδων που προκύπτουν από το rdf αρχείο, εντοπίζονται τα Works, Expressions των Works και τα Manifestations των Expressions καθώς και τα πρόσωπα ή οι οργανισμοί που σχετίζονται με τις οντότητες του FRBR. Για τα πρόσωπα ή τους οργανισμούς γίνεται έρευνα στο Viaf αν είναι καταχωρημένοι και σε περίπτωση που είναι γίνεται ο ανάλογος συσχετισμός. Επίσης σε αυτό το σημείο πρέπει να γίνει αναφορά περί των όρων που χρησιμοποιήθηκαν για τον αλγόριθμο ομαδοποίησης των συστατικών μερών του FRBR. Για τα ομαδοποιημένα FRBR Works, δηλαδή τα έργα που έχουν κοινά χαρακτηριστικά (τίτλο και συγγραφέα) χρησιμοποιήθηκε ο όρος CreativeWork ο οποίος δεν αναφέρεται στη βιβλιογραφία και αποτελεί δήλωση της διπλωματικής εργασίας. Επίσης δεν πρέπει να γίνεται κάποιος συσχετισμός μεταξύ των όρων CreativeWork που αναφέρεται στον 75

76 αλγόριθμο ομαδοποίησης του BIBFRAME και του όρου CreativeWork που αναφέρεται στον αλγόριθμο ομαδοποίησης του FRBR. Αντίστοιχα για τη διαδικασία δημιουργήθηκαν οι όροι CreativeExpressions, CreativeManifestations που ομαδοποιούν τα κοινά Expressions και Manifestations αντίστοιχα. Για τις οντότητες ακολουθείται η εξής διαδικασία: Για κάθε work δημιουργείται ένα προσωρινό CreativeWork σε επίπεδο FRBR το οποίο σχετίζεται με το αρχικό έργο με σχέση owl: sameas. Για κάθε expression δημιουργείται ένα προσωρινό CreativeExpression το οποίο σχετίζεται με τη σχέση owl: sameas με το αρχικό expression και δημιουργείται αντίστοιχα η σχέση realizationof προς το CreativeWork που εκφράζει και η αμφίδρομη σχέση realization από το CreativeWork. Για κάθε manifestation δημιουργείται ένα προσωρινό CreativeManifestation το οποίο σχετίζεται με τη σχέση owl: sameas με το αρχικό manifestation. Επίσης δημιουργείται αντίστοιχα η σχέση embodimentof προς το CreativeManifestation που ενσωματώνει και η αμφίδρομη σχέση από το CreativeManifestation. Για κάθε προσωρινό CreativeWork γίνεται έλεγχος στο γράφο FRBR αν υπάρχει οντότητα τύπου CreativeWork που να έχει τον ίδιο τίτλο και ίδιο συγγραφέα. Αν πληρούνται οι συγκεκριμένες προϋποθέσεις τότε γίνεται ο επόμενος έλεγχος που αφορά τα CreativeExpressions του αρχείου και του γράφου. Γίνεται έλεγχος αν το CreativeWork που βρέθηκε στο γράφο έχει κάποιο CreativeExpression που να έχει ίδια γλώσσα, ίδιο τύπο και αν υπάρχει να ελέγχει και τον μεταφραστή. Σε περίπτωση που έχει βρεθεί κάποιο CreativeExpression που πληροί τις παραπάνω προϋποθέσεις γίνεται έλεγχος και στα CreativeManifestations του αρχείου και του γράφου. Οπότε να βρεθεί στο γράφο ίδιο CreativeWork με ίδιο CreativeExpression και CreativeManifestation με ίδιες ημερομηνίες έκδοσης και ίδιο εκδότη, τότε το CreativeManifestation του γράφου ενημερώνεται με τη σχέση owl: sameas με το manifestation του αρχείου, το CreativeExpression του γράφου ενημερώνεται με τη σχέση owl: sameas με το Expression του γράφου και το CreativeWork του γράφου ενημερώνεται με τη σχέση owl: sameas με το Work του αρχείου. Σε περίπτωση που δεν πληρείται κάποια προϋπόθεση από το CreativeManifestation, ενημερώνεται η οντότητα CreativeWork με το Work του αρχείου, η οντότητα CreativeExpression με το Expression του αρχείου και προστίθεται στο γράφο η οντότητα του CreativeManifestation του αρχείου στο CreativeExpression του γράφου. Αντίστοιχη είναι η διαδικασία σε περίπτωση που βρεθεί ίδιο CreativeWork στο αρχείο και το γράφο, όπου εκεί ενημερώνεται το CreativeWork του γράφου με την καινούρια οντότητα του CreativeExpression του αρχείου. Σε περίπτωση που δεν βρεθεί ίδιο CreativeWork μεταξύ αρχείου και γράφου, τότε προστίθεται το CreativeWork του αρχείου στο γράφο μαζί με τα CreativeExpressions και CreativeManifestations που το απαρτίζουν. (Zapounidou, Sfakakis, & Papatheodorou, 2016) 76

77 5.3 Μετατροπή Δεδομένων από FRBR σε BIBFRAME Στο συγκεκριμένο κομμάτι ερευνήθηκε η διαδικασία για την μετατροπή των οντοτήτων από το μοντέλο του FRBR σε μοντέλο BIBFRAME. Η ανάποδη διαδικασία (από BIBFRAME σε FRBR) δεν επιλέχθηκε καθώς η μετατροπή των δεδομένων σε FRBR θα είχε ως αποτέλεσμα να χαθεί αρκετά χρήσιμη πληροφορία καθώς επίσης δεν θα μπορούσε να αποδοθούν σωστά οι συσχετίσεις μεταξύ των οντοτήτων. Ο βασικός αλγόριθμος στον οποίο έγινε η συσχέτιση μεταξύ των δύο μοντέλων είναι: 1. Εντοπισμός των FRBR CreativeWorks από τον γράφο FRBR (για τον ορισμό του CreativeWork στο FRBR βλέπε κεφάλαιο 5.2 σελ. 75). 2. Για κάθε ένα FRBR CreativeWork εντοπίζεται ο τίτλος και το όνομα του συγγραφέα του και δημιουργείται ένα BIBFRAME AbstractCreativeWork το οποίο θα αποθηκευτεί στο γράφο MAPPING. 3. Στη συνέχεια ερευνώνται πάλι τα FRBR CreativeWorks του γράφου FRBR αυτή τη φορά για να εντοπισθούν οι σχέσεις realization με τα FRBR CreativeExpressions τους. Άρα για κάθε ένα FBR CreativeWork του γράφου εντοπίζονται όλα τα FRBR CreativeExpressions που έχουν σαν κατηγόρημα realization. 4. Για κάθε FRBR CreativeExpression εντοπίζεται ο τύπος του, η γλώσσα του, ο μεταφραστής του, τα Expressions του που έχουν σχέση sameas με το FRBR CreativeExpression. Οπότε δημιουργείται ένα νέο υποκείμενο BIBFRAME CreativeWork (για τον ορισμό του CreativeWork στο BIBFRAME βλέπε κεφάλαιο 5.1 σελ. 70) το οποίο περιλαμβάνει τον τίτλο, το όνομα του συγγραφέα, τον τύπο του έργου, τη γλώσσα του και τον μεταφραστή του και αυτό το BIBFRAME CreativeWork συνδέεται με το BIBFRAME AbstractCreativeWork με τη σχέση hasexpression. 5. Για κάθε FRBR CreativeExpression επίσης εντοπίζονται τα FRBR CreativeManifestations σύμφωνα με το κατηγόρημα embodiment. 6. Για κάθε FRBR CreativeManifestation εντοπίζεται ο εκδότης, η ημερομηνία κυκλοφορίας ο σύντομος τίτλος καθώς και όλα τα Manifestations που προκύπτουν από τη σχέση sameas. 7. Κάθε ένα FRBR CreativeManifestation μετατρέπεται σε BIBRFRAME CreativeInstance καθώς και κάθε Manifestation μετατρέπεται σε Instance με σχέση sameas με το FRBR CreativeManifestation με σκοπό να εισαχθεί στο μοντέλο του Bibframe και πιο συγκεκριμένα στο γράφο του MAPPING. Ο αλγόριθμος που αναλύθηκε παραπάνω αποτελεί έμπνευση του αλγορίθμου από το άρθρο Preserving bibliographic relationships in mappings from FRBR to BIBFRAME 2.0. Οπότε συνοψίζοντας ο αλγόριθμος που υλοποιείται λειτουργεί σύμφωνα με το ακόλουθο σχήμα με την προσθήκη των AbstractCreativeWorks: 77

78 Εικόνα 27 Διαδικασία Μετατροπής FRBR εγγραφών σε BIBFRAME εγγραφές (Zapounidou, Sfakakis, & Papatheodorou, 2017) Τα αποτελέσματα σύμφωνα με τον αλγόριθμο ομαδοποίησης που υλοποιήθηκε είναι τα εξής: Στο παραπάνω σχήμα φαίνεται η συσχέτιση μεταξύ AbstractCreativeWorks CreativeWorks CreativeInstances. Ενώ η κάθε μία οντότητα ενδεικτικά περιέχει τις εξής ιδιότητες: AbstractCreativeWork: 78

79 CreativeWork: CreativeInstance: 79

80 5.4 Σύγκριση Αποτελεσμάτων 1 ου και 3 ου βήματος με το πρότυπο Dataset. Ανάλυση Recall Precision Ο αλγόριθμος που υλοποιήθηκε ήταν στη βάση να βρεθούν όλα τα ομαδοποιημένα CreativeWorks και CreativeInstances του BIBFRAME γράφου καθώς και όλα τα ομαδοποιημένα CreativeWorks και CreativeInstances του MAPPING γράφου και να συγκριθούν αντίστοιχα με τα CreativeWorks και τα CreativeInstances του Golden γράφου. Το Golden Dataset είναι το επεξεργασμένο αρχικό Dataset (σελ 61) στο οποίο περιλαμβάνονται όλες οι συσχετίσεις μεταξύ των οντοτήτων όπως για παράδειγμα οι σχέσεις translationof, relatedto κλπ. Η επεξεργασία έγινε από τη κα. Σοφία Ζαπουνίδου και αποσκοπούσε στο να γίνει η αξιολόγηση των αποτελεσμάτων της πλατφόρμας που αναπτύχθηκε σε σύγκριση με τα αποτελέσματα που έπρεπε να παραχθούν. Ο αλγόριθμος αξιολόγησης, είχε ως σκοπό την παραγωγή ποσοστών precision και recall. Η διαδικασία του αλγορίθμου είναι η ακόλουθη: Σύγκριση για κάθε ένα από τα CreativeWorks του BIBFRAME με αυτά του GOLDEN. Η σύγκριση γινόταν παρόμοια με τον αλγόριθμο ομαδοποίησης. Δηλαδή: Ίδιος Τίτλος. Ίδιος Author. Ίδιος Τύπος Έργου. Ίδια γλώσσα Έργου. Τουλάχιστον ένας ίδιος contributor με ίδιο ρόλο. Αν δεν υπήρχε author ή contributor τότε, αν ήταν όλα τα υπόλοιπα πεδία ίδια, θεωρούνταν ίδια και τα CreativeWorks. Για κάθε ένα ίδιο CreativeWork, αυξάνονταν το True Positive. Αν το CreativeWork δεν υπήρχε στη βάση GOLDEN, τότε αυξάνονταν το False Positive. Σύγκριση για κάθε ένα από τα CreativeInstances του BIBFRAME με αυτά του GOLDEN. Η σύγκριση γινόταν και εδώ παρόμοια με τον αλγόριθμο ομαδοποίησης. Δηλαδή: Ίδιος Τίτλος. Ίδιο Date. Ίδιος Publisher. Ίδιο Publisher Place. Και εδώ αντίστοιχα αυξάναμε το True Positive και το False Positive για τα CreativeInstances. Για το Recall κάναμε ακριβώς την ανάποδη διαδικασία, δηλαδή συγκρίναμε κάθε ένα CreativeWork και CreativeInstance από τη βάση GOLDEN με τη βάση BIBFRAME και αντί για την αύξηση του False Positive, είχαμε την αύξηση του False Negative. 80

81 Η ίδια ακριβώς διαδικασία εφαρμόστηκε και για την αξιολόγηση του Mapping γράφου. Για τη διαδικασία της αξιολόγησης των αποτελεσμάτων έγινε χρήση της μεθόδου Recall Precision. Από τη θεωρία οι σχέσεις που ορίζουν το Recall και το Precision είναι οι: Precision = tp tp + fp Recall = tp tp + fn Όπου: Tο tp (True Positive) σημαίνει ότι το CreativeWork ή το CreativeInstance έπρεπε να ομαδοποιηθεί και ομαδοποιήθηκε. To fp (False Positive) σημαίνει ότι το CreativeWork ή το CreativeInstance ομαδοποιήθηκε ενώ δεν έπρεπε να ομαδοποιηθεί. Το fn (False Negative) σημαίνει ότι το CreativeWork ή το CreativeInstance δεν ομαδοποιήθηκε ενώ έπρεπε να ομαδοποιηθεί. Σύμφωνα με του κανόνες της διαδικασίας του Recall Precision, έβγαινε το συγκεντρωτικό αποτέλεσμα της αξιολόγησης. Τα αποτελέσματα της διαδικασίας αξιολόγησης αναφέρονται στο επόμενο κεφάλαιο στο πεδίο Evaluation. 81

82 6. Διαδικασία εκτέλεσης ηλεκτρονικής πλατφόρμας Σε αυτή την ενότητα θα γίνει επισκόπηση της διαδικασίας εκτέλεσης της ηλεκτρονικής πλατφόρμας διαχείρισης συνδεδεμένων δεδομένων Βιβλιοθηκών. Η πλατφόρμα χωρίζεται σε 4 online projects και ένα project offline. Για την υποστήριξη των online έργων διαμορφώθηκε κατάλληλα ο server που δόθηκε για την εκπόνηση της διπλωματικής εργασίας από το Ιόνιο Πανεπιστήμιο. Ο server είναι διαθέσιμος από την διεύθυνση και οι πληροφορίες του συστήματος είναι: Λειτουργικό Σύστημα: Ubuntu LTS Επεξεργαστής: Intel Xeon E v.3 Συχνότητα επεξεργαστή: 2,30 GHz Αριθμός επεξεργαστών: 2 Αρχιτεκτονική συστήματος: x64 Μνήμη RAM: 4 Gigabyte Μέγεθος σκληρού δίσκου: 53,7 Gigabyte Για τις ανάγκες της υλοποίησης της ηλεκτρονικής πλατφόρμας έγινε εγκατάσταση στα ακόλουθα προγράμματα: Apache Tomcat version Apache Jena Fuseki version Java version Το Apache Jena Fuseki εγκαταστάθηκε προκειμένου να γίνεται αποθήκευση των RDF εγγραφών σε μία βάση δεδομένων γράφων. Για τις ανάγκες της διπλωματικής δημιουργήθηκαν οι ακόλουθοι γράφοι: BIBFRAME, για την αποθήκευση των ομαδοποιημένων BIBFRAME εγγραφών όπως εκτελούνται από τη διαδικασία BIB2Jena. FRBR, για την αποθήκευση των FRBR εγγραφών όπως εκτελούνται από τη διαδικασία FRBR2Jena. MAPPING, για την μετατροπή και ομαδοποίηση των εγγραφών του FRBR γράφου σύμφωνα με το πρότυπο του BIBFRAME και εκτελείται όπως ορίζει η διαδικασία Mapping. GOLDEN_BIBFRAME, για την αποθήκευση των ομαδοποιημένων BIBFRAME εγγραφών του ολοκληρωμένου Dataset που δόθηκε για την αξιολόγηση της πλατφόρμας και των αλγορίθμων που υλοποιήθηκαν. 82

83 Το Apache Tomcat εγκαταστάθηκε προκειμένου να υλοποιηθούν τα projects σε ένα server και να είναι διαθέσιμα από όλους τους χρήστες ανά πάσα στιγμή. Για την υλοποίηση των αλγορίθμων χρησιμοποιήθηκε η πλατφόρμα NetBeans ώστε να γίνει η μετατροπή τους από offline εφαρμογές σε online με χρήση JSP και Java Servlets. Η χρήση των αρχείων JSP αποσκοπεί στη δημιουργία ενός web UI, ενώ μέσω των Java Servlets επιτεύχθηκε το σωστό ανέβασμα των RDF και XML αρχείων στον server. Στο Apache Tomcat φορτώθηκαν τα ακόλουθα έργα: BIB2Jena, όπου είναι η διαδικασία για την ομαδοποίηση και αποθήκευση των BIBFRAME εγγραφών. FRBR2Jena, όπου είναι η διαδικασία μετατροπής και αποθήκευσης από το μοντέλο του FRBR σε γράφο. Mapping, όπου είναι η διαδικασία μετατροπής, ομαδοποίησης και αποθήκευσης από τον FRBR γράφο σε πρότυπο του BIBFRAME στον MAPPING γράφο. Golden, όπου είναι η διαδικασία ομαδοποίησης και αποθήκευσης του πρότυπου Dataset σύμφωνα με το πρότυπο του BIBFRAME. 83

84 6.1 Βήματα εκτέλεσης της ηλεκτρονικής πλατφόρμας Στη συνέχεια γίνεται η εκτέλεση της εφαρμογής βήμα προς βήμα BIB2Jena Στο πρώτο βήμα πρέπει να εκτελεστεί η διαδικασία BIB2Jena. Η ηλεκτρονική διεύθυνση της εφαρμογής είναι η και το user interface που προσφέρεται στο χρήστη είναι το εξής: Όπως φαίνεται από τις λειτουργίες της εφαρμογής δίνεται η δυνατότητα επιλογής των αρχείων BIBFRAME από το χρήστη και στη συνέχεια η εντολή να φορτωθούν τα αρχεία στο server καθώς επίσης και η δυνατότητα αναζήτησης τριάδων στο γράφο του BIBFRAME με χρήση της γλώσσας SPARQL όπως φαίνεται από το παρακάτω σχήμα. 84

85 Στην περίπτωση που τρέξει ο χρήστης το παραπάνω επερώτημα, η εφαρμογή αποκρίνεται: 85

86 6.1.2 FRBR2Jena Αφού ολοκληρωθεί η διαδικασία BIB2Jena, στη συνέχεια πρέπει να εκτελεστεί η διαδικασία FRBR2Jena. Η διεύθυνση της εφαρμογής είναι η και το user interface που προσφέρεται στο χρήστη είναι: Όπως και στην εφαρμογή BIB2Jena, έχει προστεθεί πάλι το πεδίο αναζήτησης στο γράφο με χρήση της γλώσσας SPARQL. Όπως και στην προηγούμενη εφαρμογή, ο χρήστης επιλέγει τα αρχεία XML του πρότυπου FRBR και ανεβαίνουν στον server με σκοπό να τα διαβάσει η εφαρμογή και να τα αποθηκεύσει στο γράφο FRBR Mapping Όταν ολοκληρωθεί η διαδικασία ανεβάσματος των εγγραφών στη βάση του FRBR, έπεται η διαδικασία του mapping. Στη διαδικασία του mapping οι εγγραφές από το γράφο του FRBR μετατρέπονται σύμφωνα με το πρότυπο του BIBFRAME, ομαδοποιούνται και τέλος αποθηκεύονται στο γράφο MAPPING. Η διεύθυνση της εφαρμογής είναι και το user interface είναι: 86

87 6.1.4 Golden Στη διαδικασία του Golden γίνεται ακριβώς η ίδια διαδικασία που γίνεται στο BIB2Jena με τη διαφορά ότι η συγκεκριμένη διαδικασία αναφέρεται στο πρότυπο Dataset που έχει δοθεί για την αξιολόγηση των αλγορίθμων της πλατφόρμας. Η διεύθυνση της εφαρμογής είναι και το user interface είναι: Evaluation Work Series Η διαδικασία του Evaluation είναι μία offline εφαρμογή, γραμμένη σε java και αποσκοπεί στην αξιολόγηση των αλγορίθμων ομαδοποίησης και mapping που εφαρμόστηκαν. Μετά το πέρας όλων των εκτελέσεων της πλατφόρμας, ακολουθεί η ανάλυση και η αξιολόγηση του Dataset. Οι αξιολόγηση έγινε με βάση τις κατηγορίες των έργων που υπήρχαν στο Dataset. Τα συγκεντρωτικά αποτελέσματα που προέκυψαν από την εκτέλεση της εφαρμογής δίνονται από τον ακόλουθο πίνακα: CW Bibframe - Golden Precision CW Mapping - Golden Precision CW Bibframe - Golden Recall CW Mapping - Golden Recall CI Bibframe - Golden Precision CI Mapping - Golden Precision CI Bibframe - Golden Recall 87 CI Mapping - Golden Recall 100 anos de soledad 37.50% 33.30% 42.85% 28.57% 93.30% 60.00% 93.30% 60.00% Madam Bovary 69.23% 33.30% 69.23% 15.38% 87.50% 59.37% 87.50% 59.37% Crime and 35.00% 53.33% 35.00% 25.00% 55.17% 44.82% 61.53% 50.00% Punishment DQ 0.00% 0.00% 0.00% 0.00% % 45.45% % 45.45% Faust 48.14% 20.00% 50.00% 15.38% 78.57% 53.57% 81.48% 55.55% Iliad 13.33% 0.00% 11.76% 0.00% 83.33% 20.00% 86.95% 21.73% Karamazov 18.75% 15.38% 18.75% 12.50% 90.47% 9.52% 90.47% 9.52% Odyssey 33.33% 16.66% 33.33% 8.33% 80.00% 15.00% % 18.75% Scarlet Letter 30.00% 36.84% 30.00% 35.00% 70.83% 4.16% 73.91% 4.34% Tom Sawyer 37.03% 23.80% 40.00% 20.00% 74.19% 25.80% 76.66% 26.66% Wuthering Heights 47.05% 38.46% 47.05% 29.41% 90.00% 30.00% 90.00% 30.00% M.O % 24.64% 34.36% 17.23% 82.12% 33.43% 85.62% 34.67%

88 Σύμφωνα με τα αποτελέσματα του πίνακα, σε γενικές γραμμές υπήρχε χαμηλό ποσοστό στο Precision και στο Recall τόσο του Bibframe σε σύγκριση με το Golden Dataset, όσο και του Mapping σε σχέση με το Golden. Το πρόβλημα που προέκυψε ήταν κυρίως στους τίτλους των CreativeWorks του Golden. Παρατηρήθηκε ότι οι τίτλοι των Works που μετατρέπονταν σε CreativeWorks πρόκυπταν από τους τίτλους των Instances (δηλαδή από το πεδίο 245 MARC). Επίσης ένα άλλο πρόβλημα που προέκυψε κυρίως στο Mapping ήταν λόγω των συντελεστών των έργων καθώς έλειπαν κάποιοι ή ήταν ελλιπής η πληροφορία για τον ρόλο τους. Τα ποσοστά Recall και Precision των CreativeInstances του Bibframe σε σύγκριση με το Golden Dataset ήταν σε πολύ ικανοποιητικά επίπεδα (82% - 86%) ενώ παρουσιάστηκαν κάποια θέματα στο Mapping λόγω της δομής της ημερομηνίας των Instances σε σύγκριση με το Golden. Ακολουθεί το ραβδόγραμμα των Recall και Precision των CreativeWorks και CreativeInstances. 88

89 Wuthering Heights 30.00% 90.00% 30.00% 90.00% 29.41% 47.05% 38.46% 47.05% Tom Sawyer 26.66% 76.66% 25.80% 74.19% 20.00% 40.00% 23.80% 37.03% Scarlet Letter 4.34% 73.91% 4.16% 70.83% 35.00% 30.00% 36.84% 30.00% Odyssey 18.75% % 15.00% 80.00% 8.33% 33.33% 16.66% 33.33% Karamazov 9.52% 90.47% 9.52% 90.47% 12.50% 18.75% 15.38% 18.75% Iliad 21.73% 86.95% 20.00% 83.33% 0.00% 11.76% 0.00% 13.33% Faust 55.55% 81.48% 53.57% 78.57% 15.38% 50.00% 20.00% 48.14% DQ 45.45% % 45.45% % 0.00% 0.00% 0.00% 0.00% Crime and Punishment 50.00% 61.53% 44.82% 55.17% 25.00% 35.00% 53.33% 35.00% Madam Bovary 15.38% 59.37% 87.50% 59.37% 87.50% 69.23% 33.30% 69.23% 100 anos de soledad 60.00% 93.30% 60.00% 93.30% 28.57% 42.85% 33.30% 37.50% 0.00% 20.00% 40.00% 60.00% 80.00% % % CI Mapping - Golden Recall CI Bibframe - Golden Recall CI Mapping - Golden Precision CI Bibframe - Golden Precision CW Mapping - Golden Recall CW Bibframe - Golden Recall CW Mapping - Golden Precision CW Bibframe - Golden Precision 89

90 Σε προσπάθεια επίλυσης του προβλήματος των τίτλων έγινε αλλαγή των τίτλων σύμφωνα με το πεδίο 240 του MARC προτύπου. Ο πίνακας των αποτελεσμάτων διαμορφώθηκε ως εξής: Work Series CW Bibframe - Golden Precision CW Mapping - Golden Precision CW Bibframe - Golden Recall CW Mapping - Golden Recall CI Bibframe - Golden Precision CI Mapping - Golden Precision CI Bibframe - Golden Recall CI Mapping - Golden Recall 100 anos de soledad 75.00% 50.00% 85.71% 42.85% 93.30% 73.33% 93.30% 73.33% Madam Bovary 80.76% 33.30% 80.76% 15.38% 87.50% 62.50% 87.50% 62.50% Crime and 72.72% 46.66% 42.10% 21.05% 61.11% 48.27% 42.10% 53.84% Punishment DQ 62.50% 0.00% 50.00% 0.00% % 45.45% % 45.45% Faust 77.77% 20.00% 77.77% 14.81% 85.71% 57.14% 85.71% 57.14% Iliad 80.00% 0.00% 85.71% 0.00% 79.16% 16.00% 86.36% 18.18% Karamazov 87.50% 30.76% 87.50% 25.00% 90.47% 9.52% 90.47% 9.52% Odyssey 66.66% 16.66% 72.72% 9.09% 80.00% 15.00% % 18.75% Scarlet Letter 80.00% 52.63% 80.00% 45.00% 73.91% 4.16% 73.91% 4.34% Tom Sawyer 70.37% 42.85% 73.07% 34.61% 74.19% 25.80% 76.66% 26.66% Wuthering Heights 76.47% 53.84% 76.47% 41.17% 90.00% 30.00% 90.00% 30.00% M.O % 31.52% 73.80% 22.63% 83.21% 35.20% 84.18% 36.34% Μετά τις αλλαγές των τίτλων και μόνο βελτιώθηκαν κατά πολύ τα ποσοστά του Recall και Precision παρατηρώντας την αδυναμία του εργαλείου της Βιβλιοθήκης του Κογκρέσου (Marc2Bibframe) όσον αφορά τη διαδικασία μετατροπής του τίτλου. Οι παραπάνω συγκεντρωτικοί πίνακες προέκυψαν από τα αποτελέσματα της εφαρμογής του Evaluation όπως φαίνεται στην ακόλουθη εικόνα: 90

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού Εργαστήριο Σημασιολογικού Ιστού Ενότητα 5: Resource Description Framework (RDF) Μ.Στεφανιδάκης 16-3-2015. Τα επίπεδα του Σημασιολογικού Ιστού RDF: Το κύριο πρότυπο του Σημασιολογικού Ιστού, χρησιμοποιεί

Διαβάστε περισσότερα

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού Εργαστήριο Σημασιολογικού Ιστού Ενότητα 4: Χρησιμοποιώντας Ενιαία Αναγνωριστικά URIs και IRIs Μ.Στεφανιδάκης 28-2-2016. Η έννοια της οντότητας Στον Σημασιολογικό Ιστό οι τριάδες μπορούν να εκληφθούν ως

Διαβάστε περισσότερα

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού Εργαστήριο Σημασιολογικού Ιστού Ενότητα 5: Resource Description Framework (RDF) Μ.Στεφανιδάκης 13-3-2016. Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του

Διαβάστε περισσότερα

Μεταδεδομένα στο Ψηφιακό περιβάλλον

Μεταδεδομένα στο Ψηφιακό περιβάλλον Μεταδεδομένα στο Ψηφιακό περιβάλλον Μονάδα Αριστείας Ανοικτού Λογισμικού - Χαροκόπειο Πανεπιστήμιο Ψηφιακό Τεκμήριο Οτιδήποτε υπάρχει σε ηλεκτρονική μορφή και μπορεί να προσπελαστεί μέσω υπολογιστή Μεταδεδομένα

Διαβάστε περισσότερα

Τεχνολογίες RDF για τον Ιστό Δεδοµένων

Τεχνολογίες RDF για τον Ιστό Δεδοµένων 1 Τεχνολογίες RDF για τον Ιστό Δεδοµένων The Semantic Web is Dead? Hardly! The reports of my death are greatly exaggerated. Mark Twain Διαχείριση δεδοµένων στον Ιστό 2 Έστω ένας φανταστικός ιστός! html

Διαβάστε περισσότερα

Μεταπτυχιακή Διατριβή

Μεταπτυχιακή Διατριβή Πανεπιστήμιο Πειραιώς Τμήμα Πληροφορικής Πρόγραμμα Μεταπτυχιακών Σπουδών «Πληροφορική» Μεταπτυχιακή Διατριβή Τίτλος Διατριβής Υπηρεσία Αυτόματης Ανάκτησης Συνδεδεμένης Δομής Θεματικών Επικεφαλίδων μέσω

Διαβάστε περισσότερα

Διασύνδεση και Άνοιγμα Δεδομένων του Α.Π.Θ. Καραογλάνογλου Κωνσταντίνος Μονάδα Σημασιολογικού Ιστού Α.Π.Θ 18/3/2014

Διασύνδεση και Άνοιγμα Δεδομένων του Α.Π.Θ. Καραογλάνογλου Κωνσταντίνος Μονάδα Σημασιολογικού Ιστού Α.Π.Θ 18/3/2014 Διασύνδεση και Άνοιγμα Δεδομένων του Α.Π.Θ. Καραογλάνογλου Κωνσταντίνος Μονάδα Σημασιολογικού Ιστού Α.Π.Θ 18/3/2014 Ανοικτά και Συνδεδεμένα Δεδομένα Ανοικτά Δεδομένα Πληροφορίες, δημόσιες ή άλλες, στις

Διαβάστε περισσότερα

Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας. 2 ο Μάθημα: Βασικά Θέματα Βάσεων Δεδομένων. Δρ. Κωνσταντίνος Χ.

Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας. 2 ο Μάθημα: Βασικά Θέματα Βάσεων Δεδομένων. Δρ. Κωνσταντίνος Χ. Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας 2 ο Μάθημα: Βασικά Θέματα Βάσεων Δεδομένων Δρ. Κωνσταντίνος Χ. Γιωτόπουλος Βασικά θέματα Βάσεων Δεδομένων Ένα Σύστημα Βάσης Δεδομένων

Διαβάστε περισσότερα

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

1 Συστήματα Αυτοματισμού Βιβλιοθηκών 1 Συστήματα Αυτοματισμού Βιβλιοθηκών Τα Συστήματα Αυτοματισμού Βιβλιοθηκών χρησιμοποιούνται για τη διαχείριση καταχωρήσεων βιβλιοθηκών. Τα περιεχόμενα των βιβλιοθηκών αυτών είναι έντυπα έγγραφα, όπως βιβλία

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13. Κεφάλαιο 1 ο Αρχές Διαχείρισης πληροφορίας στον Παγκόσμιο Ιστό... 15

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13. Κεφάλαιο 1 ο Αρχές Διαχείρισης πληροφορίας στον Παγκόσμιο Ιστό... 15 ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος... 13 Κεφάλαιο 1 ο Αρχές Διαχείρισης πληροφορίας στον Παγκόσμιο Ιστό... 15 1.1 Εισαγωγή... 16 1.2 Διαδίκτυο και Παγκόσμιος Ιστός Ιστορική αναδρομή... 17 1.3 Αρχές πληροφοριακών συστημάτων

Διαβάστε περισσότερα

ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: ΣΥΓΓΡΑΦΕΑΣ:

ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: ΣΥΓΓΡΑΦΕΑΣ: ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: Υπολογιστικά Συστήµατα & Τεχνολογίες Πληροφορικής ΣΥΓΓΡΑΦΕΑΣ: Γιώργος Γιαννόπουλος, διδακτορικός φοιτητής

Διαβάστε περισσότερα

Ενότητα 3: Διαχείριση πληροφοριακών πόρων με τη χρήση βάσεων δεδομένων

Ενότητα 3: Διαχείριση πληροφοριακών πόρων με τη χρήση βάσεων δεδομένων Ενότητα 3: Διαχείριση πληροφοριακών πόρων με τη χρήση βάσεων δεδομένων YouTube Ιδρύθηκε το 2005 Στόχος του ήταν να δημιουργήσει μία παγκόσμια κοινότητα Βάση δεδομένων βίντεο Μέσα σε ένα χρόνο από τη δημιουργία

Διαβάστε περισσότερα

Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών

Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών Λίνα Μπουντούρη - Μανόλης Γεργατσούλης Ιόνιο Πανεπιστήμιο 15ο Πανελλήνιο Συνέδριο Ακαδημαϊκών Βιβλιοθηκών Διαδίκτυο και Επίπεδα ετερογένειας δεδομένων

Διαβάστε περισσότερα

Πληροφοριακά Συστήματα Διοίκησης

Πληροφοριακά Συστήματα Διοίκησης Πληροφοριακά Συστήματα Διοίκησης Μεγάλα Δεδομένα ΠΜΣ Λογιστική Χρηματοοικονομική και Διοικητική Επιστήμη ΤΕΙ Ηπείρου Bytes 1KB = 2 10 1MB = 2 20 1GB = 2 30 1TB = 2 40 1PB = 2 50 1EB = 2 60 1ZB = 2 70 1YB

Διαβάστε περισσότερα

Παραδοτέο Π.2.1. Υπερχώρος και διαχείριση μοντέλων

Παραδοτέο Π.2.1. Υπερχώρος και διαχείριση μοντέλων Έργο: Τίτλος Υποέργου: «ΘΑΛΗΣ: Ενίσχυση της Διεπιστημονικής ή και Διιδρυματικής έρευνας και καινοτομίας με δυνατότητα προσέλκυσης ερευνητών υψηλού επιπέδου από το εξωτερικό μέσω της διενέργειας βασικής

Διαβάστε περισσότερα

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΣΠΟΥ ΑΣΤΗΣ: Γιαννόπουλος Γεώργιος ΕΠΙΒΛΕΠΩΝ: Καθ. Ι. Βασιλείου ΒΟΗΘΟΙ: Α. ηµητρίου, Θ. αλαµάγκας Γενικά Οι µηχανές αναζήτησης

Διαβάστε περισσότερα

Πληροφοριακά Συστήματα Διοίκησης

Πληροφοριακά Συστήματα Διοίκησης Πληροφοριακά Συστήματα Διοίκησης Μεγάλα Δεδομένα ΠΜΣ Λογιστική Χρηματοοικονομική και Διοικητική Επιστήμη ΤΕΙ Ηπείρου @ 2017 Bytes 1KB = 2 10 1MB = 2 20 1GB = 2 30 1TB = 2 40 1PB = 2 50 1EB = 2 60 1ZB =

Διαβάστε περισσότερα

Αναπαράσταση Γνώσης και Αναζήτηση στον Σηµασιολογικό Ιστό

Αναπαράσταση Γνώσης και Αναζήτηση στον Σηµασιολογικό Ιστό Αναπαράσταση Γνώσης και Αναζήτηση στον Σηµασιολογικό Ιστό Αλέξανδρος Βαλαράκος (alexv@iit.demokritos.gr) (alexv@aegean.gr) Υποψήφιος ιδάκτορας Τµήµα Μηχανικών Υπολογιστικών και Πληροφοριακών Συστηµάτων.

Διαβάστε περισσότερα

ΜΑΘΗΜΑ 6. Σχήµατα ιαλειτουργικότητας Μεταδεδοµένων. Το RDF Το Warwick Framework. Ιόνιο Πανεπιστήµιο - Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας

ΜΑΘΗΜΑ 6. Σχήµατα ιαλειτουργικότητας Μεταδεδοµένων. Το RDF Το Warwick Framework. Ιόνιο Πανεπιστήµιο - Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας ΜΑΘΗΜΑ 6 195 Σχήµατα ιαλειτουργικότητας Μεταδεδοµένων Το RDF Το Warwick Framework 196 1 Resource Data Framework RDF Τα πολλαπλά και πολλαπλής προέλευσης σχήµατα παραγωγής δηµιουργούν την ανάγκη δηµιουργίας

Διαβάστε περισσότερα

Θεωρητική προσέγγιση του Σημασιολογικού Ιστού στο χώρο της πολιτισμικής πληροφορίας: μία πρότυπη εφαρμογή στη βιβλιοθηκονομία

Θεωρητική προσέγγιση του Σημασιολογικού Ιστού στο χώρο της πολιτισμικής πληροφορίας: μία πρότυπη εφαρμογή στη βιβλιοθηκονομία Θεωρητική προσέγγιση του Σημασιολογικού Ιστού στο χώρο της πολιτισμικής πληροφορίας: μία πρότυπη εφαρμογή στη βιβλιοθηκονομία Σοφία Ζαπουνίδου, Αρχειονόμος Βιβλιοθηκονόμος, Πανεπιστήμιο Θεσσαλίας Κεντρική

Διαβάστε περισσότερα

Σημασιολογικός Ιστός RDF(S) OWL Οντολογίες. Pervasive Computing Research Group

Σημασιολογικός Ιστός RDF(S) OWL Οντολογίες. Pervasive Computing Research Group Σημασιολογικός Ιστός RDF(S) OWL Οντολογίες Ο Παγκόσμιος Ιστός Εφαρμογή του Internet Δημοσίευση εγγράφων και υπερσύνδεσμοι Δυναμικό περιεχόμενο Αναζήτηση πληροφοριών - Κατανοητός μόνο από ανθρώπους (έμφαση

Διαβάστε περισσότερα

Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων ..?????? Εργαστήριο ΒΑΣΕΙΣ????????? ΔΕΔΟΜΕΝΩΝ Βάσεων Δεδομένων?? ΙΙ Εισαγωγικό Μάθημα Βασικές Έννοιες - . Γενικά Τρόπος Διεξαγωγής Ορισμός: Βάση Δεδομένων (ΒΔ) είναι μια συλλογή από σχετιζόμενα αντικείμενα

Διαβάστε περισσότερα

Σε παγκόσμιο επίπεδο, οιμηχανέςαναζήτησηςτουinternet αναπτύχθηκαν για να κάνουν αναζήτηση πληροφοριών σε πολλαπλές τοποθεσίες ιστού.

Σε παγκόσμιο επίπεδο, οιμηχανέςαναζήτησηςτουinternet αναπτύχθηκαν για να κάνουν αναζήτηση πληροφοριών σε πολλαπλές τοποθεσίες ιστού. Τζίτζικας Αγαπητός Τζίτζικας Αγαπητός Σε παγκόσμιο επίπεδο, οιμηχανέςαναζήτησηςτουinternet αναπτύχθηκαν για να κάνουν αναζήτηση πληροφοριών σε πολλαπλές τοποθεσίες ιστού. Δυστυχώς, αυτές οι μηχανές αναζήτησης

Διαβάστε περισσότερα

. Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων

. Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων .. Εργαστήριο Βάσεων Δεδομένων Εισαγωγικό Μάθημα Βασικές Έννοιες - . Ύλη Εργαστηρίου ΒΔ Ύλη - 4 Ενότητες.1 - Σχεδιασμός Βάσης Δεδομένων.2 Δημιουργία Βάσης Δεδομένων Δημιουργία Πινάκων Εισαγωγή/Ανανέωση/Διαγραφή

Διαβάστε περισσότερα

Βάσεις Δεδομένων. Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα

Βάσεις Δεδομένων. Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα Βάσεις Δεδομένων Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα Στέργιος Παλαμάς, Υλικό Μαθήματος «Βάσεις Δεδομένων», 2015-2016 Κεφάλαιο 2: Περιβάλλον Βάσεων Δεδομένων Μοντέλα Δεδομένων 2.1

Διαβάστε περισσότερα

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων Εργαστήριο Βάσεων Δεδομένων Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων Τρόπος Διεξαγωγής #1 Ύλη (4 Ενότητες) 1. Ανάλυση Απαιτήσεων -Σχεδιασμός Βάσης Δεδομένων 2. Δημιουργία βάσης a) Create

Διαβάστε περισσότερα

Εισαγωγή στο RDF. Το Resource Description Framework (RDF) Σταύρος Πολυβίου

Εισαγωγή στο RDF. Το Resource Description Framework (RDF) Σταύρος Πολυβίου Εισαγωγή στο RDF Σταύρος Πολυβίου Το Resource Description Framework (RDF) RDF: µία γλώσσα περιγραφής πληροφοριών (metadata) που αφορούν πόρους (resources) στο world wide web. Παραδείγµατα: ο τίτλος, ο

Διαβάστε περισσότερα

Aναπαράσταση Γνώσης στο Σημασιολογικό Ιστό

Aναπαράσταση Γνώσης στο Σημασιολογικό Ιστό Aναπαράσταση Γνώσης στο Σημασιολογικό Ιστό Οι γλώσσες RDF(S) και OWL Γ. Στάμου Περιγραφή Μεταδεδομένων με την RDF Η RDF χρησιμοποιείται για την απλή περιγραφή πόρων (resources) του διαδικτύου o Περιγράφει

Διαβάστε περισσότερα

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού Εργαστήριο Σημασιολογικού Ιστού Ενότητα 6: RDF Schema (RDFS) Μ.Στεφανιδάκης 21-3-2016. Τι μπορούμε να εκφράσουμε με την RDF; Δηλώσεις σε μορφή τριάδων (s,p,o) Χωρίς οποιαδήποτε έννοια δομής... Παράδειγμα:

Διαβάστε περισσότερα

ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΤΕΧΝΟΛΟΓΙΩΝ ΔΙΑΔΙΚΤΥΑΚΩΝ ΥΠΗΡΕΣΙΩΝ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗ ΤΗΣ ΤΕΧΝΟΛΟΓΙΑΣ REST ΠΛΑΣΤΑΡΑΣ ΕΥΡΙΠΙΔΗΣ

ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΤΕΧΝΟΛΟΓΙΩΝ ΔΙΑΔΙΚΤΥΑΚΩΝ ΥΠΗΡΕΣΙΩΝ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗ ΤΗΣ ΤΕΧΝΟΛΟΓΙΑΣ REST ΠΛΑΣΤΑΡΑΣ ΕΥΡΙΠΙΔΗΣ ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΤΕΧΝΟΛΟΓΙΩΝ ΔΙΑΔΙΚΤΥΑΚΩΝ ΥΠΗΡΕΣΙΩΝ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗ ΤΗΣ ΤΕΧΝΟΛΟΓΙΑΣ REST ΠΛΑΣΤΑΡΑΣ ΕΥΡΙΠΙΔΗΣ ΘΕΣΣΑΛΟΝΙΚΗ, 2016 ΕΙΣΑΓΩΓΗ Μια διαδικτυακή υπηρεσία μπορεί να περιγραφεί απλά σαν μια οποιαδήποτε

Διαβάστε περισσότερα

ΑΝΑΠΑΡΑΣΤΑΣΗ ΓΝΩΣΗΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ

ΑΝΑΠΑΡΑΣΤΑΣΗ ΓΝΩΣΗΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ ΑΝΑΠΑΡΑΣΤΑΣΗ ΓΝΩΣΗΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ RDF (Resource Description Framework) Ι. Χατζηλυγερούδης Ανεπάρκεια της XML Η XML είναι Μετα-γλώσσα ορισμού σήμανσης για ανταλλαγή δεδομένων και μεταδεδομένων μεταξύ

Διαβάστε περισσότερα

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων Εργαστήριο Βάσεων Δεδομένων Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων Τρόπος Διεξαγωγής #1 Ύλη (4 Ενότητες) 1. Ανάλυση Απαιτήσεων - Σχεδιασμός Βάσης Δεδομένων 2. Δημιουργία βάσης a)

Διαβάστε περισσότερα

της πληροφορίας Λίνα Μπουντούρη Εθνικό Κέντρο Τεκμηρίωσης 13ο ΠανελλήνιοΣυνέδριοΑκαδημαϊκών Βιβλιοθηκών - Κέρκυρα 2004

της πληροφορίας Λίνα Μπουντούρη Εθνικό Κέντρο Τεκμηρίωσης 13ο ΠανελλήνιοΣυνέδριοΑκαδημαϊκών Βιβλιοθηκών - Κέρκυρα 2004 example Αξιοποιώντας την τεχνολογία XML στη διαχείριση της πληροφορίας Λίνα Μπουντούρη Εθνικό Κέντρο Τεκμηρίωσης 13ο ΠανελλήνιοΣυνέδριοΑκαδημαϊκών Βιβλιοθηκών - Κέρκυρα 2004 Πρότυπα και XML Πρότυπα ενιαίο

Διαβάστε περισσότερα

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ - ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΣΒΔ - ΕΙΣΑΓΩΓΗ ΣΤΟ ΜΟΝΤΕΛΟ ΟΝΤΟΤΗΤΩΝ ΣΥΣΧΕΤΙΣΕΩΝ ΤΜΗΜΑ ΠΟΛΙΤΙΣΜΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΣ

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ - ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΣΒΔ - ΕΙΣΑΓΩΓΗ ΣΤΟ ΜΟΝΤΕΛΟ ΟΝΤΟΤΗΤΩΝ ΣΥΣΧΕΤΙΣΕΩΝ ΤΜΗΜΑ ΠΟΛΙΤΙΣΜΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Χειμερινό Εξάμηνο 2013 - ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΣΒΔ - ΕΙΣΑΓΩΓΗ ΣΤΟ ΜΟΝΤΕΛΟ ΟΝΤΟΤΗΤΩΝ ΣΥΣΧΕΤΙΣΕΩΝ Δρ. Βαγγελιώ Καβακλή ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ, ΤΜΗΜΑ ΠΟΛΙΤΙΣΜΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΣ 1 Αρχιτεκτονική

Διαβάστε περισσότερα

ΕΠΛ 012 Εισαγωγή στο Παγκόσμιο Πλέγμα Πληροφοριών

ΕΠΛ 012 Εισαγωγή στο Παγκόσμιο Πλέγμα Πληροφοριών ΕΠΛ 012 Εισαγωγή στο Παγκόσμιο Πλέγμα Πληροφοριών World Wide Web (WWW) Θέματα Επεξεργασία δεδομένων στο Web Δημιουργία απλών σελίδων HTML Περιγραφή κάποιων XHTML στοιχείων (tags) Εξέλιξης του WWW Το WWW

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΗ ΠΡΟΣΦΟΡΑ ΣΧΕ ΙΑΣΗΣ ΚΑΙ ΚΑΤΑΣΚΕΥΗΣ web εφαρµογής - ηλεκτρονικού κατατήµατος για έξυπνα κινητά

ΟΙΚΟΝΟΜΙΚΗ ΠΡΟΣΦΟΡΑ ΣΧΕ ΙΑΣΗΣ ΚΑΙ ΚΑΤΑΣΚΕΥΗΣ web εφαρµογής - ηλεκτρονικού κατατήµατος για έξυπνα κινητά ΟΙΚΟΝΟΜΙΚΗ ΠΡΟΣΦΟΡΑ ΣΧΕ ΙΑΣΗΣ ΚΑΙ ΚΑΤΑΣΚΕΥΗΣ web εφαρµογής - ηλεκτρονικού κατατήµατος για έξυπνα κινητά Για την STUDIO KOSTA BODA ILLUM Χανίων Πέµπτη, 9 Φεβρουαρίου 2012 Για την εταιρεία ACTS : Παπαγεωργίου

Διαβάστε περισσότερα

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων Εργαστήριο Βάσεων Δεδομένων Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων Βάσεις Δεδομένων - Γενικά Ορισμός: Βάση Δεδομένων (ΒΔ) είναι μια συλλογή από σχετιζόμενα αντικείμενα. Τα περιεχόμενα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΠΡΟΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΜΑΘΗΜΑ: ΤΕΧΝΟΛΟΓΙΑ ΛΟΓΙΣΜΙΚΟΥ ΜΟΝΤΕΛΑ ΣΥΣΤΗΜΑΤΟΣ Διδάσκων: Γ. Χαραλαμπίδης, Επ. Καθηγητής

Διαβάστε περισσότερα

Τεχνολογία Διοίκησης Επιχειρησιακών Διαδικασιών

Τεχνολογία Διοίκησης Επιχειρησιακών Διαδικασιών ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ Τεχνολογία Διοίκησης Επιχειρησιακών Διαδικασιών Οδηγός Εργαστηρίου:

Διαβάστε περισσότερα

Βασίλειος Κοντογιάννης ΠΕ19

Βασίλειος Κοντογιάννης ΠΕ19 Ενότητα3 Επικοινωνία και Διαδίκτυο Κεφ9: Διαδίκτυο, Web2.0, WebX.0 9.1 Ιστορικά στοιχεία Από πού, πότε με ποια μορφή και με ποια αφορμή ξεκίνησε η λειτουργία του Διαδικτύου; Ξεκίνησε στην Αμερική, το 1969,

Διαβάστε περισσότερα

Linked Data for the Masses: Η προσέγγιση και το λογισμικό

Linked Data for the Masses: Η προσέγγιση και το λογισμικό Linked Data for the Masses: Η προσέγγιση και το λογισμικό Γιώργος Αναδιώτης, Πάνος Ανδριόπουλος, Πάνος Αλεξόπουλος, ημήτρης Βεκρής, Αριστοτέλης Ζωσάκης IMC Technologies S.A. 15/05/2010 Linked Data for

Διαβάστε περισσότερα

Τεχνικές Προδιαγραφές ιαλειτουργικότητας

Τεχνικές Προδιαγραφές ιαλειτουργικότητας ΤΕΧΝΙΚΕΣ ΠΡΟ ΙΑΓΡΑΦΕΣ ΕΙΓΜΑ ΠΑΡΑΡΤΗΜΑΤΟΣ ΙΑΓΩΝΙΣΜΟΥ ΚΟΙΝΟΤΙΚΟ ΠΛΑΙΣΙΟ ΣΤΗΡΙΞΗΣ 2000-2006 ΕΠΙΧΕΙΡΗΣΙΑΚΟ ΠΡΟΓΡΑΜΜΑ «Κοινωνία της Πληροφορίας» http://www.infosociety.gr Μάιος 2003 Τεχνικές Προδιαγραφές ιαλειτουργικότητας

Διαβάστε περισσότερα

Πολιτισμική Τεχνολογία. Πολυμέσα & Διαδίκτυο Παράμετροι Δικαίου Μέρος Α

Πολιτισμική Τεχνολογία. Πολυμέσα & Διαδίκτυο Παράμετροι Δικαίου Μέρος Α Πολιτισμική Τεχνολογία Πολυμέσα & Διαδίκτυο Παράμετροι Δικαίου Μέρος Α Δυνατότητες: Σύλληψη, συντήρηση, ανάδειξη Χρήση : Ψηφιακών βίντεο, ήχων, εικόνων, γραφικών παραστάσεων Οι συλλογές καθίστανται διαθέσιμες

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΔΥΤΙΚΗΣ ΑΤΤΙΚΗΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΔΥΤΙΚΗΣ ΑΤΤΙΚΗΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΔΥΤΙΚΗΣ ΑΤΤΙΚΗΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ T.E. ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Ανάλυση του Περιεχομένου της Ελληνικής Wikipedia μέσω των Ιδιοτήτων

Διαβάστε περισσότερα

Σχεδιασµός Ανάπτυξη Οντολογίας

Σχεδιασµός Ανάπτυξη Οντολογίας Σχεδιασµός Ανάπτυξη Οντολογίας ΈλεναΜάντζαρη, Γλωσσολόγος, Ms.C. ΙΑΤΡΟΛΕΞΗ: Ανάπτυξη Υποδοµής Γλωσσικής Τεχνολογίας για το Βιοϊατρικό Τοµέα Τι είναι η οντολογία; Μιαοντολογίαείναιέναλεξικόόρωνπου διατυπώνονται

Διαβάστε περισσότερα

Βάσεις Δεδομένων ΙΙ. Διάλεξη 5 η XML και ΒΔ στο Διαδίκτυο

Βάσεις Δεδομένων ΙΙ. Διάλεξη 5 η XML και ΒΔ στο Διαδίκτυο Βάσεις Δεδομένων ΙΙ Διάλεξη 5 η XML και ΒΔ στο Διαδίκτυο Δ. Χριστοδουλάκης - Α. Φωκά Τμήμα Μηχανικών Η/Υ & Πληροφορικής - Εαρινό Εξάμηνο 2007 Εισαγωγή Πολλές εφαρμογές διαδικτύου υποστηρίζουν web διεπαφές

Διαβάστε περισσότερα

ΕΡΓΑΣΙΑ. (στο µάθηµα: Τεχνολογίες Εφαρµογών ιαδικτύου του Η εξαµήνου σπουδών του Τµήµατος Πληροφορικής & Τηλ/νιών)

ΕΡΓΑΣΙΑ. (στο µάθηµα: Τεχνολογίες Εφαρµογών ιαδικτύου του Η εξαµήνου σπουδών του Τµήµατος Πληροφορικής & Τηλ/νιών) ΕΡΓΑΣΙΑ (στο µάθηµα: Τεχνολογίες Εφαρµογών ιαδικτύου του Η εξαµήνου σπουδών του Τµήµατος Πληροφορικής & Τηλ/νιών) Τίτλος: Εφαρµογή ιαδικτύου ιαχείρισης Αποθήκων (Warehouse Management Web Application) Ζητούµενο:

Διαβάστε περισσότερα

Ημερομηνία Παράδοσης: 4/4/2013

Ημερομηνία Παράδοσης: 4/4/2013 Δράση 9.14 / Υπηρεσία εντοπισμού λογοκλοπής Κυρίως Παραδοτέο / Σχεδιασμός και ανάπτυξη λογισμικού (λογοκλοπής) και βάσης δεδομένων (αποθετηρίου) Επιμέρους Παραδοτέο 9.14.1.4 / Πληροφοριακό σύστημα υπηρεσίας

Διαβάστε περισσότερα

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού Εργαστήριο Σημασιολογικού Ιστού Ενότητα 1: Σημασιολογία και Μεταδεδομένα Μ.Στεφανιδάκης 10-2-2017 Η αρχή: Το όραμα του Σημασιολογικού Ιστού Tim Berners-Lee, James Hendler and Ora Lassila, The Semantic

Διαβάστε περισσότερα

Ανάπτυξη πλήρους διαδικτυακής e-commerce εφαρμογής με χρήση του CMS WordPress

Ανάπτυξη πλήρους διαδικτυακής e-commerce εφαρμογής με χρήση του CMS WordPress ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Ανάπτυξη πλήρους διαδικτυακής e-commerce εφαρμογής με χρήση του CMS WordPress ΚΟΤΣΟΓΙΑΝΝΙΔΗΣ ΛΑΖΑΡΟΣ Επιβλέπων καθηγητής Σφέτσος Παναγιώτης ΗΛΕΚΤΡΟΝΙΚΟ ΕΜΠΟΡΙΟ Ως Ηλεκτρονικό Εμπόριο ή

Διαβάστε περισσότερα

Αναφορά εργασιών για το τρίμηνο Σεπτέμβριος Νοέμβριος 2012

Αναφορά εργασιών για το τρίμηνο Σεπτέμβριος Νοέμβριος 2012 Στο πλαίσιο της πράξης «Αναβάθμιση και Εμπλουτισμός των Ψηφιακών Υπηρεσιών της Βιβλιοθήκης του Παντείου Πανεπιστημίου». Η Πράξη συγχρηματοδοτείται από το Ευρωπαϊκό Ταμείο Περιφερειακής Ανάπτυξης (ΕΤΠΑ).

Διαβάστε περισσότερα

Σχεδίαση και Ανάπτυξη Ιστότοπων

Σχεδίαση και Ανάπτυξη Ιστότοπων Σχεδίαση και Ανάπτυξη Ιστότοπων Ιστορική Εξέλιξη του Παγκόσμιου Ιστού Παρουσίαση 1 η 1 Βελώνης Γεώργιος Καθηγητής Περιεχόμενα Τι είναι το Διαδίκτυο Βασικές Υπηρεσίες Διαδικτύου Προηγμένες Υπηρεσίες Διαδικτύου

Διαβάστε περισσότερα

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού Εργαστήριο Σημασιολογικού Ιστού Ενότητα 3: Από το μοντέλο EAV στους γράφους Μ.Στεφανιδάκης 4-3-2015. Το μοντέλο EAV σχηματικά Τα δεδομένα ως τώρα έχουν τη μορφή μεμονωμένων νιφάδων Είναι όμως πράγματι

Διαβάστε περισσότερα

Εφαρμογές που χρησιμοποιούν το πρότυπο DCAT. Γιάννης Ξυδιάς

Εφαρμογές που χρησιμοποιούν το πρότυπο DCAT. Γιάννης Ξυδιάς Εφαρμογές που χρησιμοποιούν το πρότυπο DCAT Γιάννης Ξυδιάς johnnyxidias@gmail.com Data Catalog Vocabulary (DCAT) λεξιλόγιο RDF έχει σχεδιαστεί για να διευκολύνει τη διαλειτουργικότητα μεταξύ των datasets

Διαβάστε περισσότερα

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού Εργαστήριο Σημασιολογικού Ιστού Ενότητα 1: Σημασιολογία και Μεταδεδομένα Μ.Στεφανιδάκης 5-2-2016. Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα.

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΙΚΗ ΠΡΟΣΦΟΡΑ ΣΧΕ ΙΑΣΗΣ ΚΑΙ ΚΑΤΑΣΚΕΥΗΣ ΙΑ ΙΚΤΥΑΚΟΥ ΠΛΗΡΟΦΟΡΙΑΚΟΎ ΣΥΣΤΗΜΑΤΟΣ. Τρίτη, 7 Φεβρουαρίου 2012

ΟΙΚΟΝΟΜΙΚΗ ΠΡΟΣΦΟΡΑ ΣΧΕ ΙΑΣΗΣ ΚΑΙ ΚΑΤΑΣΚΕΥΗΣ ΙΑ ΙΚΤΥΑΚΟΥ ΠΛΗΡΟΦΟΡΙΑΚΟΎ ΣΥΣΤΗΜΑΤΟΣ. Τρίτη, 7 Φεβρουαρίου 2012 ΟΙΚΟΝΟΜΙΚΗ ΠΡΟΣΦΟΡΑ ΣΧΕ ΙΑΣΗΣ ΚΑΙ ΚΑΤΑΣΚΕΥΗΣ ΙΑ ΙΚΤΥΑΚΟΥ ΠΛΗΡΟΦΟΡΙΑΚΟΎ ΣΥΣΤΗΜΑΤΟΣ Τρίτη, 7 Φεβρουαρίου 2012 Για την εταιρεία ACTS : Παπαγεωργίου Κων/νος Ποτιέ 21/ Χανιά, ΤΚ 73100 AΦΜ: 065439343 Τηλ./Fax:

Διαβάστε περισσότερα

Μια καλή επιλογή θα ήταν www.epipla-onomasas.gr (χωρίζοντας τις λέξεις με παύλα -) ή

Μια καλή επιλογή θα ήταν www.epipla-onomasas.gr (χωρίζοντας τις λέξεις με παύλα -) ή Τι είναι ένα CMS CMS ή Σύστημα Διαχείρισης Περιεχομένου (Content Management System) ονομάζουμε ένα λογισμικό που μας βοηθά να ελέγχουμε και να διαχειριζόμαστε έναν ιστότοπο δημόσιας ή περιορισμένης πρόσβασης.

Διαβάστε περισσότερα

Περιεχόμενα. Πρόλογος... xiii

Περιεχόμενα. Πρόλογος... xiii Περιεχόμενα Πρόλογος... xiii Κεφάλαιο 1 ο Εισαγωγή στις τεχνολογίες Διαδικτύου... 1 1.1 Σύντομη ιστορία του Διαδικτύου... 3 1.2 Σύνδεση στο Διαδίκτυο μέσω Παρόχου (ISP)... 6 1.3 Μοντέλα Επικοινωνίας...

Διαβάστε περισσότερα

Οντολογία για την περιγραφή των προσωπικοτήτων της Σάμου, την κατηγοριοποίηση και τις σχέσεις τους

Οντολογία για την περιγραφή των προσωπικοτήτων της Σάμου, την κατηγοριοποίηση και τις σχέσεις τους Οντολογία για την περιγραφή των προσωπικοτήτων της Σάμου, την κατηγοριοποίηση και τις σχέσεις τους Επιμέλεια: Καρανικολάου Θεοδώρα Επιβλέπων καθηγητής: Δενδρινός Μάρκος Αθήνα, 2017 Σκοπός Στόχος της πτυχιακής

Διαβάστε περισσότερα

ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΑ ΕΡΓΑΛΕΙΑ ΓΙΑ ΤΟ ΔΙΑΔΙΚΤΥΟ

ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΑ ΕΡΓΑΛΕΙΑ ΓΙΑ ΤΟ ΔΙΑΔΙΚΤΥΟ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΑ ΕΡΓΑΛΕΙΑ ΓΙΑ ΤΟ ΔΙΑΔΙΚΤΥΟ Κεφάλαιο 2. Το περιβάλλον του παγκόσμιου Ιστού Επιμέλεια: Καραγιάννης Σπύρος Καθηγητής ΠΕ19 Πλεονεκτήματα παγκόσμιου Ιστού Εξυπηρετητής Ιστού & Ιστοσελίδες Κύριες

Διαβάστε περισσότερα

Διαδίκτυο: δίκτυο διασυνδεμένων δικτύων Ξεκίνησε ως ένα μικρό κλειστό στρατιωτικό δίκτυο, απόρροια του Ψυχρού Πολέμου μεταξύ ΗΠΑ και ΕΣΣΔ.

Διαδίκτυο: δίκτυο διασυνδεμένων δικτύων Ξεκίνησε ως ένα μικρό κλειστό στρατιωτικό δίκτυο, απόρροια του Ψυχρού Πολέμου μεταξύ ΗΠΑ και ΕΣΣΔ. ΚΕΦΑΛΑΙΟ 9 Διαδίκτυο: δίκτυο διασυνδεμένων δικτύων Ξεκίνησε ως ένα μικρό κλειστό στρατιωτικό δίκτυο, απόρροια του Ψυχρού Πολέμου μεταξύ ΗΠΑ και ΕΣΣΔ. Το 1966 αρχίζει ο σχεδιασμός του ARPANET, του πρώτου

Διαβάστε περισσότερα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: 2012 2013

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: 2012 2013 ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013 Τι είναι η γλωσσική τεχνολογία;

Διαβάστε περισσότερα

Πανεπιστήμιο Πειραιώς Τμήμα Πληροφορικής

Πανεπιστήμιο Πειραιώς Τμήμα Πληροφορικής Πανεπιστήμιο Πειραιώς Τμήμα Πληροφορικής Πρόγραμμα Μεταπτυχιακών Σπουδών «Πληροφορική» Μεταπτυχιακή Διατριβή Τίτλος Διατριβής Ανοικτά Συνδεδεμένα Δεδομένα και το πρότυπο Bibframe Linked Open Data and Bibframe

Διαβάστε περισσότερα

Πληροφοριακού Συστήματος Ενημέρωσης Καιρικών Συνθηκών

Πληροφοριακού Συστήματος Ενημέρωσης Καιρικών Συνθηκών Τι είναι Πληροφοριακό Σύστημα και Βάση Δεδομένων Πληροφοριακό σύστημα Είναι το σύστημα, που επεξεργάζεται εισόδους, συντηρεί αρχεία και παράγει πληροφορίες κάθε μορφής. Είναι ο συνεκτικός κρίκος των υποσυστημάτων

Διαβάστε περισσότερα

Διαχείριση Πολιτισμικών Δεδομένων

Διαχείριση Πολιτισμικών Δεδομένων Διαχείριση Πολιτισμικών Δεδομένων Μάθημα 1 Εισαγωγή στις Βάσεις Δεδομένων Τζανέτος Πομόνης ΤΕΙ Ιονίων Νήσων Τμήμα Τεχνολόγων Περιβάλλοντος Κατεύθυνση Συντήρησης Πολιτισμικής Κληρονομιάς Τι είναι οι Βάσεις

Διαβάστε περισσότερα

Διαδίκτυο είναι ένα σύστημα διασυνδεδεμένων δικτύων και υπολογιστών που απλώνεται σε όλο τον κόσμο και έχουν πρόσβαση σε αυτό εκατομμύρια χρήστες.

Διαδίκτυο είναι ένα σύστημα διασυνδεδεμένων δικτύων και υπολογιστών που απλώνεται σε όλο τον κόσμο και έχουν πρόσβαση σε αυτό εκατομμύρια χρήστες. Διαδίκτυο είναι ένα σύστημα διασυνδεδεμένων δικτύων και υπολογιστών που απλώνεται σε όλο τον κόσμο και έχουν πρόσβαση σε αυτό εκατομμύρια χρήστες. Για να επιτευχθεί αυτό όλοι οι υπολογιστές και τα επιμέρους

Διαβάστε περισσότερα

Information Technology for Business

Information Technology for Business Information Technology for Business! Lecturer: N. Kyritsis, MBA, Ph.D. Candidate!! e-mail: kyritsis@ist.edu.gr Διαχείριση Επιχειρηματικών Δεδομένων - Databases Ορισμός Βάσης Δεδομένων Συλλογή συναφών αρχείων

Διαβάστε περισσότερα

Εισαγωγή στις ΤΠΕ ΙΙ Γιάννης Βρέλλης ΠΤΔΕ-Πανεπιστήμιο Ιωαννίνων. World Wide Web. Παγκόσμιος Ιστός

Εισαγωγή στις ΤΠΕ ΙΙ Γιάννης Βρέλλης ΠΤΔΕ-Πανεπιστήμιο Ιωαννίνων. World Wide Web. Παγκόσμιος Ιστός Εισαγωγή στις ΤΠΕ ΙΙ Γιάννης Βρέλλης ΠΤΔΕ-Πανεπιστήμιο Ιωαννίνων World Wide Web Παγκόσμιος Ιστός Internet - WWW Internet: παγκόσμιο δίκτυο υπολογιστών που βασίζεται στο πρωτόκολο επικοινωνίας TCP/IP και

Διαβάστε περισσότερα

Εισαγωγή στην Πληροφορική

Εισαγωγή στην Πληροφορική Εισαγωγή στην Πληροφορική Βάσεις Δεδομένων ΤΕΙ Ιονίων Νήσων Τμήμα Τεχνολόγων Περιβάλλοντος Κατεύθυνση Συντήρησης Πολιτισμικής Κληρονομιάς Τι είναι οι Βάσεις Δεδομένων; Σύστημα για αποθήκευση, μετάδοση

Διαβάστε περισσότερα

Π Τ Υ Χ Ι Α Κ Η Ε Ρ Γ Α Σ Ι Α

Π Τ Υ Χ Ι Α Κ Η Ε Ρ Γ Α Σ Ι Α ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΠΕΙΡΑΙΑ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΟΜΕΑΣ ΑΡΧΙΤΕΚΤΟΝΙΚΗΣ Η/Υ, ΠΛΗΡΟΦΟΡΙΚΗΣ & ΙΚΤΥΩΝ Εργ. Τεχνολογίας Λογισμικού & Υπηρεσιών S 2 E Lab Π Τ Υ Χ Ι

Διαβάστε περισσότερα

ΥΠΗΡΕΣΙΑ «TAXISNET» - ΗΛΕΚΤΡΟΝΙΚΗ ΥΠΟΒΟΛΗ ΤΩΝ ΦΟΡΟΛΟΓΙΚΩΝ ΔΗΛΩΣΕΩΝ ΓΙΑ ΤΟ ΤΜΗΜΑ ΕΣΩΤΕΡΙΚΩΝ ΠΡΟΣΟΔΩΝ ΚΑΙ ΤΗΝ ΥΠΗΡΕΣΙΑ ΦΟΡΟΥ ΠΡΟΣΤΙΘΕΜΕΝΗΣ ΑΞΙΑΣ ΤΟΥ

ΥΠΗΡΕΣΙΑ «TAXISNET» - ΗΛΕΚΤΡΟΝΙΚΗ ΥΠΟΒΟΛΗ ΤΩΝ ΦΟΡΟΛΟΓΙΚΩΝ ΔΗΛΩΣΕΩΝ ΓΙΑ ΤΟ ΤΜΗΜΑ ΕΣΩΤΕΡΙΚΩΝ ΠΡΟΣΟΔΩΝ ΚΑΙ ΤΗΝ ΥΠΗΡΕΣΙΑ ΦΟΡΟΥ ΠΡΟΣΤΙΘΕΜΕΝΗΣ ΑΞΙΑΣ ΤΟΥ ΥΠΗΡΕΣΙΑ «TAXISNET» - ΗΛΕΚΤΡΟΝΙΚΗ ΥΠΟΒΟΛΗ ΤΩΝ ΦΟΡΟΛΟΓΙΚΩΝ ΔΗΛΩΣΕΩΝ ΓΙΑ ΤΟ ΤΜΗΜΑ ΕΣΩΤΕΡΙΚΩΝ ΠΡΟΣΟΔΩΝ ΚΑΙ ΤΗΝ ΥΠΗΡΕΣΙΑ ΦΟΡΟΥ ΠΡΟΣΤΙΘΕΜΕΝΗΣ ΑΞΙΑΣ ΤΟΥ ΥΠΟΥΡΓΕΙΟΥ ΟΙΚΟΝΟΜΙΚΩΝ ΤΗΣ ΚΥΠΡΙΑΚΗΣ ΔΗΜΟΚΡΑΤΙΑΣ Οδηγίες

Διαβάστε περισσότερα

Ιόνιο Πανεπιστήμιο - Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας

Ιόνιο Πανεπιστήμιο - Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας Μεταδεδομένα για Ψηφιακές Βιβλιοθήκες Γ. Δ. Μπώκος Μεταδεδομένα: Ο όρος Μεταδεδομένα: «Δεδομένα σχετικά με Δεδομένα» Αναλυτικότερα: «Το σύνολο όσων θα μπορούσε να πει κανείς για ένα πληροφοριακό αντικείμενο

Διαβάστε περισσότερα

Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού

Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Διπλωματική Εργασία με θέμα: Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού Καραγιάννης Ιωάννης Α.Μ.

Διαβάστε περισσότερα

ίκτυα - Internet Υπηρεσίες Internet O Παγκόσµιος Ιστός (World Wide Web) Ηλεκτρονική Αλληλογραφία (E-mail) Υπηρεσία FTP (File Transfer Protocol)

ίκτυα - Internet Υπηρεσίες Internet O Παγκόσµιος Ιστός (World Wide Web) Ηλεκτρονική Αλληλογραφία (E-mail) Υπηρεσία FTP (File Transfer Protocol) Ιόνιο Πανεπιστήµιο Τµήµα Αρχειονοµίας-Βιβλιοθηκονοµίας Κέρκυρα ίκτυα - Internet 2 Υπηρεσίες Internet O Παγκόσµιος Ιστός (World Wide Web) ΜηχανέςΑναζήτησηςστοWeb Ηλεκτρονική Αλληλογραφία (E-mail) Υπηρεσία

Διαβάστε περισσότερα

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές Μεταπτυχιακό Δίπλωμα Ειδίκευσης Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές Δρ. Κακαρόντζας Γεώργιος Επίκουρος Καθηγητής Τμ. Μηχανικών Πληροφορικής Τ.Ε. Μηχανική Λογισμικού για Διαδικτυακές

Διαβάστε περισσότερα

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams Αλέκα Σεληνιωτάκη Ηράκλειο, 26/06/12 aseliniotaki@csd.uoc.gr ΑΜ: 703 1. Περίληψη Συνεισφοράς

Διαβάστε περισσότερα

ΤΕΙ ΚΑΒΑΛΑΣ. Πτυχιακή εργασία ΕΙΣΑΓΩΓΗ. Μιλτιάδης Κακλαμάνης

ΤΕΙ ΚΑΒΑΛΑΣ. Πτυχιακή εργασία ΕΙΣΑΓΩΓΗ. Μιλτιάδης Κακλαμάνης Σελίδα 1από ΤΕΙ ΚΑΒΑΛΑΣ Πτυχιακή εργασία Δικτυακή Εφαρμογή διαχείρισης ηλεκτρονικών εγγράφων υπηρεσίας. ΕΙΣΑΓΩΓΗ Μιλτιάδης Κακλαμάνης Σελίδα 2από Κατάλογος περιεχομένων ΕΙΣΑΓΩΓΗ...1 Σχετιζόμενα πρόσωπα...3

Διαβάστε περισσότερα

Ενότητα 12 (κεφάλαιο 28) Αρχιτεκτονικές Εφαρμογών

Ενότητα 12 (κεφάλαιο 28) Αρχιτεκτονικές Εφαρμογών ΕΠΛ362: Τεχνολογία Λογισμικού ΙΙ (μετάφραση στα ελληνικά των διαφανειών του βιβλίου Software Engineering, 9/E, Ian Sommerville, 2011) Ενότητα 12 (κεφάλαιο 28) Αρχιτεκτονικές Εφαρμογών Οι διαφάνειες αυτές

Διαβάστε περισσότερα

Σύστημα υποβολής αιτήσεων υποψήφιων συνεργατών ΕΚΤ

Σύστημα υποβολής αιτήσεων υποψήφιων συνεργατών ΕΚΤ Σύστημα υποβολής αιτήσεων υποψήφιων συνεργατών ΕΚΤ 1 Λειτουργικές απαιτήσεις Το σύστημα υποβολής αιτήσεων υποψήφιων συνεργατών στοχεύει στο να επιτρέπει την πλήρως ηλεκτρονική υποβολή αιτήσεων από υποψήφιους

Διαβάστε περισσότερα

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Ανάκτηση Πληροφορίας Διδάσκων: Φοίβος Μυλωνάς fmylonas@ionio.gr Διάλεξη #02 Ιστορική αναδρομή Σχετικές επιστημονικές περιοχές 1 Άδεια χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Διαδικασίες παραγωγής λογισμικού. Βασικές αρχές Τεχνολογίας Λογισμικού, 8η αγγ. έκδοση

Διαδικασίες παραγωγής λογισμικού. Βασικές αρχές Τεχνολογίας Λογισμικού, 8η αγγ. έκδοση Διαδικασίες παραγωγής λογισμικού Περιεχόμενα Παρουσίαση μοντέλων διεργασίας ανάπτυξης λογισμικού Περιγραφή τριών γενικών μοντέλων διεργασίας ανάπτυξης λογισμικού Γενική περιγραφή των διαδικασιών που περιλαμβάνονται

Διαβάστε περισσότερα

Γραφικό Περιβάλλον Οπτικής Απεικόνισης Οντολογιών RDF Schema στο Σημασιολογικό Ιστό

Γραφικό Περιβάλλον Οπτικής Απεικόνισης Οντολογιών RDF Schema στο Σημασιολογικό Ιστό ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ (Master in Information Systems) Γραφικό Περιβάλλον Οπτικής Απεικόνισης Οντολογιών RDF Schema στο Σημασιολογικό Ιστό

Διαβάστε περισσότερα

Εισαγωγή στις βάσεις δεδομένων - Η ανατομία μιας βάσης δεδομένων

Εισαγωγή στις βάσεις δεδομένων - Η ανατομία μιας βάσης δεδομένων ΕΣΔ516 Τεχνολογίες Διαδικτύου Εισαγωγή στις βάσεις δεδομένων - Η ανατομία μιας βάσης δεδομένων Περιεχόμενα - Βιβλιογραφία Ενότητας Περιεχόμενα Ορισμοί Συστατικά στοιχεία εννοιολογικής σχεδίασης Συστατικά

Διαβάστε περισσότερα

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού Εργαστήριο Σημασιολογικού Ιστού Ενότητα 3: Από το μοντέλο EAV στους γράφους Μ.Στεφανιδάκης 23-2-2016. Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα.

Διαβάστε περισσότερα

Αναφορά εργασιών για το τρίμηνο Δεκέμβριος 2012 Φεβρουάριος 2013 Όνομα : Μπελούλη Αγάθη

Αναφορά εργασιών για το τρίμηνο Δεκέμβριος 2012 Φεβρουάριος 2013 Όνομα : Μπελούλη Αγάθη Στο πλαίσιο της πράξης «Αναβάθμιση και Εμπλουτισμός των Ψηφιακών Υπηρεσιών της Βιβλιοθήκης του Παντείου Πανεπιστημίου». Η Πράξη συγχρηματοδοτείται από το Ευρωπαϊκό Ταμείο Περιφερειακής Ανάπτυξης (ΕΤΠΑ).

Διαβάστε περισσότερα

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού Εργαστήριο Σημασιολογικού Ιστού Ενότητα 8: Εισαγωγή στη SPARQL Βασική Χρήση Μ.Στεφανιδάκης 3-5-2015. Η γλώσσα ερωτημάτων SPARQL Ερωτήσεις (και ενημερώσεις) σε σετ δεδομένων RDF Και σε δεδομένα άλλης μορφής

Διαβάστε περισσότερα

Σχεδίαση Βάσεων Δεδομένων

Σχεδίαση Βάσεων Δεδομένων Σχεδίαση Βάσεων Δεδομένων Βασική Χαρτογράφηση: Η Διαδικασία Μετασχηματισμού Basic Mapping: The Transformation Process 1 Copyright 2013, Oracle and/or its affiliates. All rights reserved. Στόχοι Το μάθημα

Διαβάστε περισσότερα

Orchid: Integrating Schema Mapping and ETL ICDE 2008

Orchid: Integrating Schema Mapping and ETL ICDE 2008 Orchid: Integrating Schema Mapping and ETL ICDE 2008 Δομουχτσίδης Παναγιώτης Γενικά Data warehouse (DW): Είναι μία αποθήκη πληροφοριών οργανωμένη από ένα ενοποιημένο μοντέλο. Τα δεδομένα συλλέγονται από

Διαβάστε περισσότερα

Επισκόπηση Μαθήµατος

Επισκόπηση Μαθήµατος Βάσεις εδοµένων 5 ο Εξάµηνο ηµήτρης Λέκκας Επίκουρος Καθηγητής dlekkas@env.aegean.gr Τµήµα Στατιστικής & Αναλογιστικών-Χρηµατοοικονοµικών Μαθηµατικών Επισκόπηση Μαθήµατος Εισαγωγή (Σ Β ) Το µοντέλο σχέσεων

Διαβάστε περισσότερα

E-LIS: E-prints για τη Βιβλιοθηκονομία και την Επιστήμη της Πληροφόρησης (ΒΕΠ)

E-LIS: E-prints για τη Βιβλιοθηκονομία και την Επιστήμη της Πληροφόρησης (ΒΕΠ) E-LIS: E-prints για τη Βιβλιοθηκονομία και την Επιστήμη της Πληροφόρησης (ΒΕΠ) Τι είναι το E-LIS E-LIS = E-prints in Library and Information Services (Ηλεκτρονικά κείμενα με θέμα τη Βιβλιοθηκονομία και

Διαβάστε περισσότερα

Τεχνολογίες Παγκόσμιου Ιστού. 1η διάλεξη

Τεχνολογίες Παγκόσμιου Ιστού. 1η διάλεξη Τεχνολογίες Παγκόσμιου Ιστού 1η διάλεξη Χαρακτηριστικά Μαθήματος Μάθημα προγραμματισμού (και όχι μόνον) Μπορεί να εξελιχθεί σε εφιάλτη αν δεν έχετε καλή γνώση και αρκετή εμπειρία προγραμματισμού (Java)

Διαβάστε περισσότερα

Ανάπτυξη Υπηρεσίας Καταλόγου LDAP με τα στοιχεία του προσωπικού του TEI Πειραιά. Νίκος Πασσαράς. Εισηγητής: Πρεζεράκος Γεώργιος

Ανάπτυξη Υπηρεσίας Καταλόγου LDAP με τα στοιχεία του προσωπικού του TEI Πειραιά. Νίκος Πασσαράς. Εισηγητής: Πρεζεράκος Γεώργιος ΑΝΩΤΑΤΟ ΤΕΧΝΟΛΟΓΙΚΟ ΙΔΡΥΜΑ ΠΕΙΡΑΙΑ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Ανάπτυξη Υπηρεσίας Καταλόγου LDAP με τα στοιχεία του προσωπικού του TEI Πειραιά Νίκος Πασσαράς

Διαβάστε περισσότερα

Παρουσίαση Παρεχόμενων Υπηρεσιών Πληροφορικής της DBS AE

Παρουσίαση Παρεχόμενων Υπηρεσιών Πληροφορικής της DBS AE Παρουσίαση Παρεχόμενων Υπηρεσιών Πληροφορικής της DBS AE Βασικές Παρεχόμενες Υπηρεσίες Α. Διαδικασία Μετάπτωσης Δεδομένων Β. Μεθοδολογία Ψηφιοποίησης Εγγράφων Γ. Οργάνωση και Τεκμηρίωση Υλικού Δ. Διαχείριση

Διαβάστε περισσότερα

TEC610 Δυναμικές Εφαρμογές Διαδικτύου (ΣΤ εξάμηνο)

TEC610 Δυναμικές Εφαρμογές Διαδικτύου (ΣΤ εξάμηνο) TEC610 Δυναμικές Εφαρμογές Διαδικτύου (ΣΤ εξάμηνο) Διδάσκων: Ανδρέας Γιαννακουλόπουλος Εαρινό εξάμηνο 2014-2015 Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου

Διαβάστε περισσότερα

Βασικές Έννοιες Web Εφαρμογών

Βασικές Έννοιες Web Εφαρμογών ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΔΙΟΙΚΗΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ Τεχνολογίες και Εφαρμογές Διαδικτύου Βασικές Έννοιες Web Εφαρμογών Κατερίνα Πραματάρη Τεχνολογίες και Εφαρμογές Διαδικτύου Περιεχόμενα

Διαβάστε περισσότερα

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ. Παρουσίαση της SPARQL με χρήση του Jena Adapter για Oracle. Αρ. Μητρώου: 04/2566

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ. Παρουσίαση της SPARQL με χρήση του Jena Adapter για Oracle. Αρ. Μητρώου: 04/2566 ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Παρουσίαση της SPARQL με χρήση του Jena Adapter για Oracle Του φοιτητή Επιβλέπων καθηγητής Πατσίκα Κωνσταντίνου Δρ. Ευκλείδης Κεραμόπουλος Αρ. Μητρώου: 04/2566 Θεσσαλονίκη 2011 ΠΡΟΛΟΓΟΣ

Διαβάστε περισσότερα

ΜΑΘΗΜΑ: Εργαλεία Ανάπτυξης εφαρμογών internet.

ΜΑΘΗΜΑ: Εργαλεία Ανάπτυξης εφαρμογών internet. ΜΑΘΗΜΑ: Εργαλεία Ανάπτυξης εφαρμογών internet. ΩΡΕΣ ΔΙΔΑΣΚΑΛΙΑΣ: ΕΙΔΟΣ ΜΑΘΗΜΑΤΟΣ: Μικτό Γενικός σκοπός είναι να αποκτήσει ο καταρτιζόμενος τις αναγκαίες γνώσεις σχετικά με εργαλεία και τις τεχνικές για

Διαβάστε περισσότερα

ÈÛ ÁˆÁ ÛÙÈ μ ÛÂÈ Â ÔÌ ÓˆÓ

ÈÛ ÁˆÁ ÛÙÈ μ ÛÂÈ Â ÔÌ ÓˆÓ ΕΝΟΤΗΤΑ 1.1 ÈÛ ÁˆÁ ÛÙÈ μ ÛÂÈ Â ÔÌ ÓˆÓ ΔΙΔΑΚΤΙΚΟI ΣΤOΧΟΙ Στο τέλος της ενότητας αυτής πρέπει να μπορείτε: να επεξηγείτε τις έννοιες «βάση δεδομένων» και «σύστημα διαχείρισης βάσεων δεδομένων» να αναλύετε

Διαβάστε περισσότερα

Σχεδιασμός Βάσεων Δεδομένων

Σχεδιασμός Βάσεων Δεδομένων Πανεπιστήμιο Πειραιώς Τμήμα Ψηφιακών Συστημάτων Σχεδιασμός Βάσεων Δεδομένων Εργαστήριο 4 Δρ. Βασιλική Κούφη Περιεχόμενα Υλοποίηση Βάσεως Δεδομένων Εκτέλεση ερωτημάτων SQL στην Βάση Δεδομένων BHMA 1. Σχεδιασμός

Διαβάστε περισσότερα

Είδη Groupware. Λογισμικό Συνεργασίας Ομάδων (Groupware) Λογισμικό Groupware. Υπάρχουν διάφορα είδη groupware ανάλογα με το αν οι χρήστες εργάζονται:

Είδη Groupware. Λογισμικό Συνεργασίας Ομάδων (Groupware) Λογισμικό Groupware. Υπάρχουν διάφορα είδη groupware ανάλογα με το αν οι χρήστες εργάζονται: Μάθημα 10 Συστήματα Διάχυσης και Διαχείρισης Γνώσης Chapter 10 Knowledge Transfer In The E-world Chapter 13 Knowledge Management Tools and Knowledge Portals Συστήματα Διάχυσης και Διαχείρισης Γνώσης Λογισμικό

Διαβάστε περισσότερα