ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ



Σχετικά έγγραφα
Μάθημα: Δ3. Δίκτυα Γνώσης και Σημασιολογικός Ιστός. Διάλεξη 02 & 03. Δρ. Γεώργιος Χρ. Μακρής

Μάθημα: Δ3. Δίκτυα Γνώσης και Σημασιολογικός Ιστός. Διάλεξη 01 & 02. Δρ. Γεώργιος Χρ. Μακρής

Description Logics. Γεώργιος Χρ. Μακρής MSc, MEd

Σχεδιασµός Ανάπτυξη Οντολογίας

ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: ΣΥΓΓΡΑΦΕΑΣ:

Ανάπτυξη Οντολογικής Γνώσης για Τεκμηρίωση Οπτικοακουστικού Περιεχομένου ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

Αναπαράσταση Γνώσης και Αναζήτηση στον Σηµασιολογικό Ιστό

Μεταδεδομένα στο Ψηφιακό περιβάλλον

Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών

ΟΝΤΟΛΟΓΙΕΣ, ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΙΣΤΟΣ ΚΑΙ ΕΦΑΡΜΟΓΕΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΔΙΑΚΥΒΕΡΝΗΣΗΣ

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Βάσεις Δεδομένων. Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα

Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων

. Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΜΗΧ/ΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΝΑΠΑΡΑΣΤΑΣΗ ΓΝΩΣΗΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ ΕΚΠΟΝΗΣΗ ΕΡΓΑΣΙΑΣ

Σημασιολογικός Ιστός RDF(S) OWL Οντολογίες. Pervasive Computing Research Group

Οντολογία για την περιγραφή των προσωπικοτήτων της Σάμου, την κατηγοριοποίηση και τις σχέσεις τους

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Διαδικτυακές Εφαρμογές Ενότητα 1: JPA

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

Διασύνδεση και Άνοιγμα Δεδομένων του Α.Π.Θ. Καραογλάνογλου Κωνσταντίνος Μονάδα Σημασιολογικού Ιστού Α.Π.Θ 18/3/2014

Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Φροντιστήριο Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας. 2 ο Μάθημα: Βασικά Θέματα Βάσεων Δεδομένων. Δρ. Κωνσταντίνος Χ.

Διαχείριση οντολογιών: μελέτη και εμβάθυνση στα βασικά προβλήματα που την αφορούν και παρουσίαση υπαρχουσών βιβλιοθηκών οντολογιών

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ

ΜΑΘΗΜΑ 6. Σχήµατα ιαλειτουργικότητας Μεταδεδοµένων. Το RDF Το Warwick Framework. Ιόνιο Πανεπιστήµιο - Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας

ΠΑΝΕΠΙΣΤΗΜΙΟ ΥΤΙΚΗΣ ΜΑΚΕ ΟΝΙΑΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ

Υποστήριξη στη ιαχείριση Γνώσης

της πληροφορίας Λίνα Μπουντούρη Εθνικό Κέντρο Τεκμηρίωσης 13ο ΠανελλήνιοΣυνέδριοΑκαδημαϊκών Βιβλιοθηκών - Κέρκυρα 2004

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ - ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΣΒΔ - ΕΙΣΑΓΩΓΗ ΣΤΟ ΜΟΝΤΕΛΟ ΟΝΤΟΤΗΤΩΝ ΣΥΣΧΕΤΙΣΕΩΝ ΤΜΗΜΑ ΠΟΛΙΤΙΣΜΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑΣ

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Μάθημα: Εργαστήριο «Πληροφορική Υγείας» ΕΙΣΑΓΩΓΗ ΣΤΗΝ ACCESS

Παραδοτέο Π.2.1. Υπερχώρος και διαχείριση μοντέλων

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές

Linked Data for the Masses: Η προσέγγιση και το λογισμικό

Εργαστήριο Σημασιολογικού Ιστού

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση

Π Τ Υ Χ Ι Α Κ Η Ε Ρ ΓΑ Σ Ι Α

Ανάκτηση Πληροφορίας

Εργαστήριο Σημασιολογικού Ιστού

Database System Concepts and Architecture (Αρχιτεκτονική, οµές, και Μοντέλα)

A ΕΠΑ.Λ ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 5 η ΕΝΟΤΗΤΑ: ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Εκπαιδευτικοί: ΓΑΛΑΝΟΣ ΓΕΩΡΓΙΟΣ ΜΠΟΥΣΟΥΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ

Αρχιτεκτονική Συστημάτων Βάσεων Δεδομένων. Κατηγορίες χρηστών ΣΔΒΔ Αρχιτεκτονική ANSI/SPARC Γλώσσες ερωτημάτων Μοντέλα δεδομένων Λειτουργίες ΣΔΒΔ

Πληροφορική ΙΙ Εισαγωγή στις Βάσεις Δεδομένων. Τμήμα Λογιστικής

Μεταπτυχιακή Διατριβή

Αυτοματοποιημένη χαρτογραφία

«Ανάπτυξη μηχανής παραγωγής φυσικής γλώσσας για οντολογίες OWL»

Τεχνολογία ανάπτυξης νέων ιστοσελίδων στο Semantic Web.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ Δ.Π.Μ.Σ. ΣΤΑ ΣΤΑΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ

Aναπαράσταση Γνώσης στο Σημασιολογικό Ιστό

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος Κεφάλαιο 1 ο Αρχές Διαχείρισης πληροφορίας στον Παγκόσμιο Ιστό... 15

Θεωρητική προσέγγιση του Σημασιολογικού Ιστού στο χώρο της πολιτισμικής πληροφορίας: μία πρότυπη εφαρμογή στη βιβλιοθηκονομία

Τεχνολογίες Αναπαράστασης Γνώσης και Συμπερασμού: Η Περίπτωση ενός Έξυπνου Βοηθού Προπονητή Ποδοσφαίρου

Απεικόνιση Οντολογιών Σε Σχήµατα Σχεσιακών Βάσεων εδοµένων Με Σκοπό Την Ανάκτηση εδοµένων Σηµασιολογικού Περιεχοµένου ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Διαχείριση Πολιτισμικών Δεδομένων

Εργαστήριο Σημασιολογικού Ιστού

Βάσεις Δεδομένων. Εισαγωγή Ανάλυση Απαιτήσεων. Φροντιστήριο 1 ο

Επαγωγικός Λογικός Προγραμματισμός και Aσαφείς Λογικές Περιγραφής

Εργαστήριο Σημασιολογικού Ιστού

Σε παγκόσμιο επίπεδο, οιμηχανέςαναζήτησηςτουinternet αναπτύχθηκαν για να κάνουν αναζήτηση πληροφοριών σε πολλαπλές τοποθεσίες ιστού.

Συστήματα Γνώσης. Θεωρητικό Κομμάτι Μαθήματος Ενότητα 2: Βασικές Αρχές Αναπαράστασης Γνώσης και Συλλογιστικής

Ιστορικοί χάρτες στον Παγκόσμιο Ιστό

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Ενότητα 1: Εισαγωγή στις Βάσεις Δεδομένων. Αθανάσιος Σπυριδάκος Διοίκηση Επιχειρήσεων

Π Τ Υ Χ Ι Α Κ Η Ε Ρ Γ Α Σ Ι Α

Εργαστήριο Σημασιολογικού Ιστού

Σηµασιολογικό Ιστό. Αλέξανδρος Βαλαράκος Αιγαίου.

Περιγραφικές Λογικές. Αναπαράσταση γνώσης στο Σημασιολογικό Ιστό. Γ. Στάμου

Σύστημα υποβολής αιτήσεων υποψήφιων συνεργατών ΕΚΤ

ΑΝΑΚΤΗΣΗ ΠΟΛΥΜΕΣΙΚΟΥ ΠΕΡΙΕΧΟΜΕΝΟΥ ΚΑΙ ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΙΣΤΟΣ Γ.Τ.Π

Εισαγωγή στα Συστήματα Βάσεων Δεδομένων. Βάσεις Δεδομένων Ευαγγελία Πιτουρά 1

Εννοιολογική Διεύρυνση Ερωτημάτων με τη Χρήση Θησαυρού: μια εμπειρική μελέτη

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ασκήσεις και ερωτήσεις

Αρχές Προγραμματισμού Υπολογιστών

Πίνακας Προτεινόμενων Πτυχιακών Εργασιών

8ο Πανελλήνιο Συμποσιο Ωκεανογραφίας & Αλιείας 637

Ανάπτυξη Οντολογίας για τη δομή και τη λειτουργία Τηλεπικοινωνιακού Οργανισμού

Ενότητα 3: Διαχείριση πληροφοριακών πόρων με τη χρήση βάσεων δεδομένων

Ανάπτυξη Εφαρμογών σε Προγραμματιστικό Περιβάλλον

Εισαγωγή στο RDF. Το Resource Description Framework (RDF) Σταύρος Πολυβίου

Τεχνολογίες Αναπαράστασης Γνώσης και Συµπερασµού: Η Περίπτωση ενός Έξυπνου Βοηθού Προπονητή Ποδοσφαίρου

Οντολογία σύμφωνα με τη Φιλοσοφία

Orchid: Integrating Schema Mapping and ETL ICDE 2008

EBSCOhost Research Databases

Περιεχόμενα. Κατάλογος εικόνων 13. Πρόλογος Το όραμα του Σημασιολογικού Ιστού 19

Μοντέλα Κυβερνητικής Πληροφορίας

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ

Υπηρεσιοστρεφής Αρχιτεκτονική SOA (Service Oriented Architecture)

SGA Διαχείριση Πρωτόκολλου

Ανάπτυξη Συστήματος Σημασιολογικού Ιστού για την Παρακολούθηση της τήρησης του Εσωτερικού Κανονισμού του ΔΠΜΣ «Πληροφορική και Διοίκηση»

Βάσεις Δεδομένων Ενότητα 4

ΑΝΑΛΥΣΗ ΑΠΑΙΤΗΣΕΩΝ ανάλυση απαιτήσεων Σε αυτό το μάθημα θα ασχοληθούμε με : Δημιουργία μοντέλων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΑ

Εισαγωγή στην πληροφορική

Αναφορά εργασιών για το τρίμηνο Σεπτέμβριος Νοέμβριος 2012 Όνομα : Μπελούλη Αγάθη

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ

ΑΝΑΠΑΡΑΣΤΑΣΗ ΓΝΩΣΗΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ

Υπάρχουν διάφοροι ορισμοί. Η οντολογία (ontology), ως μια τυποποιημένη περιγραφή ενός συγκεκριμένου τομέα γνώσης η οποία πρέπει να είναι αποδεκτή από

Εισαγωγή στην Πληροφορική

Transcript:

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Εικονομία Ολοκληρωμένο Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης Διπλωματική εργασία του Βαβλιάκη Κωνσταντίνου Α.Ε.Μ. 4707 υπό την επίβλεψη του καθηγητή κ. Περικλή Α. Μήτκα Θεσσαλονίκη, 2007

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 2 Ευχαριστίες Μέσω αυτού του βήματος επιθυμώ να ευχαριστήσω όλους όσους διαδραμάτισαν κάποιο ρόλο σε αυτή τη διπλωματική: Στον Καθηγητή, κ. Περικλή Α. Μήτκα, για την εμπιστοσύνη που μου επέδειξε κατά την ανάθεση της διπλωματικής εργασίας και στην επίβλεψή του κατά τη διάρκεια αυτής, Στον επιστημονικό συνεργάτη κ. Ανδρέα Συμεωνίδη, που καθ όλη τη διάρκεια του χρόνου με καθοδήγησε και ενέπνευσε ώστε να ολοκληρώσω την διπλωματική μου εργασία, που πάντα είχε μια λύση να προτείνει και ήταν πάντα εκεί, Στον κ. Γιώργο Καραγιάννη, υπεύθυνο του Διαγνωστικού Κέντρου Έργων Τέχνης "ΟΡΜΥΛΙΑ", που με μύησε στον κόσμο της διαχείρισης γνώσης της Βυζαντινής Τέχνης Σε όλους τους φίλους που με βοήθησαν να αναπτύξω το θέμα και με υπέμειναν καθ όλη τη διάρκεια ανάπτυξής του.

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 3 Abstract Over the past few years the exponential increase of the information stored in the Internet and the inability to access its semantics has led to the development of tools and technologies that are envisioned to be the core of the so-called Semantic Web. The cornerstone of the Semantic web is the Ontology, which assists in semantically annotating strings and regular expressions. May one exploit tools adopting Description Logics, he/she can infer relationships that are not explicitly stated. Powerful semanticaware querying languages have also been developed to access the semantic information. The present diploma thesis deals with the semantic processing of information related Byzantine Artwork, available at ORMYLIA Art Diagnosis Centre. Prior to EIKONOMIA, data were stored in a legacy RDBMS. Within the context of the thesis an ontology describing Byzantine artwork has been developed, along with the interfaces for synchronization to and from the RDBMS. The ontology has been linked to a reasoning tool (Pellet reasoner), thus ensuring data validation, while a dynamic interface for the automated creation of semantic queries in SPARQL was developed. Finally, all the appropriate interfaces were developed, in order to allow for easy ontology manipulation and query results projection. Keywords: Ontology, Semantic Internet, Ontology Web Language (OWL), Description Logic, Simple Protocol And RDF Query Language (SPARQL), Relational Legacy Database, CIDOC Conceptual Reference Model, Reasoner, Inferencing. Στοιχεία Συγγραφέα: Ο Βαβλιάκης Κωνσταντίνος είναι προπτυχιακός φοιτητής του Τμήματος Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών του Αριστοτέλειου Πανεπιστημίου Θεσσαλονίκης. Διεύθυνση: Τριανταφυλλοπούλου 9, 54352 Άνω Τούμπα, Θεσσαλονίκη Ηλ. Διεύθυνση: kvavliak@ee.auth.gr

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 4 Abstract Τα τελευταία χρόνια η εκθετική αύξηση της πληροφορίας που βρίσκεται στο Διαδίκτυο και η δυσκολία πρόσβασης σε αυτήν με σημασιολογικά κριτήρια έχει οδηγήσει στην ανάπτυξη εργαλείων και τεχνολογιών που πρόκειται να αποτελέσουν τον πυρήνα του λεγόμενου Σημασιολογικού Ιστού. Βασική οντότητα του Σημασιολογικού Ιστού είναι η οντολογία, με τη βοήθεια της οποίας προσδίδουμε σημασιολογικό περιεχόμενο στις εκφράσεις. Στην συνέχεια, με τη βοήθεια εργαλείων που βασίζονται στην Περιγραφική Λογική μπορούμε να εξάγουμε λογικά συμπεράσματα για τις έννοιες της οντολογίας και για τις σχέσεις μεταξύ των. Για την πρόσβαση στη γνώση αυτή, μάλιστα, έχουν αναπτυχθεί ισχυρές γλώσσες σημασιολογικών επερωτημάτων. Στην παρούσα διπλωματική εργασία γίνεται η προσπάθεια σημασιολογικής διαχείρισης πληροφορίας σχετικής με την ανάλυση και τεκμηρίωση Βυζαντινών Έργων τέχνης, με βάση τα δεδομένα που έχει στην κατοχή του το Διαγνωστικό Κέντρο Έργων Τέχνης "ΟΡΜΥΛΙΑ". Στην προγενέστερη του ΕΙΚΟΝΟΜΙΑ φάση, τα δεδομένα αυτά ήταν αποθηκευμένα σε ένα κλασικό σύστημα Διαχείρισης Βάσεων Δεδομένων (Oracle RDBMS). Στα πλαίσια της παρούσας διπλωματικής ανάπτυχθηκε μια οντολογία που περιγράφει τα Βυζαντινά έργα τέχνης, καθώς και ο μηχανισμός για τον αυτόματο συγχρονισμό της Βάσης Δεδομένων με αυτήν. Στη συνέχεια η οντολογία διασυνδέθηκε με ένα εργαλείο εξαγωγής συμπερασμάτων (Pellet Reasoner) για τη δυνατότητα επικύρωσης της εισαγόμενης πληροφορίας, ενώ αναπτύχθηκε και ένα δυναμικό περιβάλλον διεπαφής για την αυτόματη δημιουργία σημασιολογικών επερωτημάτων σε γλώσσα SPARQL και την εξαγωγή συμπερασμάτων. Τέλος, δημιουργήθηκαν όλες οι κατάλληλες διεπαφές για την εύκολη διαχείριση της οντολογίας και την προβολή των αποτελεσμάτων των επερωτημάτων. Λέξεις-Κλειδιά: Οντολογία, Σημασιολογικός Ιστός, Γλώσσα Σημασιολογικού Ιστού (OWL), Περιγραφική Λογική, Γλώσσα Σημασιολογικών Επερωτημάτων (SPARQL), Σχεσιακή Βάση Δεδομένων, Εννοιολογικό Μοντέλο Αναφοράς CIDOC CRM, Εργαλείο Λογικής (Reasoner), Εξαγωγή Λογικών Συμπερασμάτων (Inferencing).

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 5 Συντομογραφίες Abbreviations ΒΔ (DB) RDBMS CRM GUI SW DL API OWL RDF W3C XML URI SPARQL SWRL KDD Βάση Δεδομένων (Database) Relational Database Management System Conceptual Reference Model Graphical User Interface Semantic Web Description Logic Application Programming Interface Ontology Web Language Resource Description Framework World Wide Consortium Extensible Markup Language Uniform Resource Identifier SPARQL Protocol and RDF Query Language Semantic Web Rule Language Knowledge Discovery in Databases

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 6 Περιεχόμενα 1 Εισαγωγή... 12 1.1 Σκοπός Διπλωματικής... 13 1.2 Επιγραμματικός ορισμός του προβλήματος... 13 1.3 Συνοπτική περιγραφή της εφαρμογής... 14 1.4 Οργάνωση κεφαλαίων... 15 2 Μεθοδολογία και Έρευνα... 17 2.1 Σημασιολογικός Ιστός - Οντολογία... 17 2.2 Γλώσσες εννοιολογικής αναπαράστασης... 18 2.3 Εργαλεία ανάπτυξης και διαχείρισης οντολογιών... 22 2.3.1 Protégé... 22 2.3.2 TopBraid Composer... 22 2.4 Περιγραφική Λογική... 23 2.4.1 Reasoners - RacerPro... 26 2.4.2 Reasoners Pellet... 28 2.5 Εξαγωγή γνώσης από οντολογίες... 30 2.5.1 Ontology Querying - SPARQL... 30 2.5.2 Measuring Similarity for Conceptual Querying... 31 2.5.3 Ontology Aware Classifiers... 37 2.6 Περιβάλλοντα ανάπτυξης σημασιολογικά ενήμερων συστημάτων... 43 2.6.1 Jena A Semantic Web Framework for Java... 43 2.6.2 Sesame... 44 2.7 Διασύνδεση ΒΔ και οντολογιών... 44 2.7.1 D2RQ... 44 2.7.2 Oracle Spatial RDF Data Model... 45 2.8 CIDOC Conceptual Reference Model... 46 2.9 Γλώσσα Αντικειμενοστραφούς Προγραμματισμού Java... 48 2.10 Τεχνολογίες που χρησιμοποιήθηκαν στο Εικονομία... 48 2.11 Ανασκόπηση Κεφαλαίου... 49 3 Περιγραφή του προβλήματος... 50 3.1 Ορισμός του προβλήματος... 50 3.2 Ανάλυση απαιτήσεων... 51 3.2.1 Ομάδες Χρηστών... 51 3.2.2 Απαιτήσεις Χρηστών... 51 3.2.3 Απαιτήσεις Συστήματος... 53 3.3 Ανασκόπηση Κεφαλαίου... 53 4 Αναλυτική περιγραφή συστήματος... 54

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 7 4.1 CIDOC Extension Ontology... 54 4.2 Αντιστοίχηση της Βάσης Art-e-Fact σε οντολογία... 56 4.2.1 Δημιουργία πραγματώσεων... 56 4.2.2 Σύνδεση πραγματώσεων με ιδιότητες με βάση την κοινή γραμμή στην βάση... 58 4.2.3 Σύνδεση πραγματώσεων με ιδιότητες με βάση το ξένο κλειδί... 59 4.3 Διεπαφές του συστήματος... 62 4.3.1 Διεπαφή Εισαγωγής στοιχείων του χρήστη... 62 4.3.2 Κεντρικό Παράθυρο Εφαρμογής... 63 4.3.3 Διεπαφές Πραγματώσεων... 69 4.3.4 Διεπαφές Κλάσεων... 74 4.3.5 Λοιπές Επαφές... 78 4.4 Ανασκόπηση Κεφαλαίου... 84 5 Επικύρωση καλής λειτουργίας του συστήματος... 85 5.1 Οντολογία People... 85 5.2 Χρήση του Εικονομία για την περιήγηση στην οντολογία... 87 5.3 Δημιουργία ερωτημάτων με το Εικονομία... 88 5.4 Άλλες δημιουργίες επικύρωσης της καλής λειτουργίας του συστήματος... 93 5.5 Ανασκόπηση Κεφαλαίου... 93 6 Συμπεράσματα Μελλοντική εργασία... 94 6.1 Σύνοψη... 94 6.2 Συμπεράσματα... 94 6.3 Προτάσεις για μελλοντική επέκταση... 95 7 Βιβλιογραφία... 96

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 8 Λίστα Πινάκων Πίνακας 2-1: Οι πιο συνηθισμένοι τελεστές στην γλώσσα DAML+OIL.... 24 Πίνακας 2-2: Βάση Δεδομένων με τις αγορές των πελατών. Οι πελάτες ανάλογα με τις αγορές τους.... 38 Πίνακας 2-3: Υψηλού επιπέδου κανόνες ταξινόμησης... 38 Πίνακας 2-4: Αποτελέσματα του επερωτήματος.... 42 Πίνακας 4-5: Λειτουργίες πλήκτρων διεπαφής νέου περιορισμού.... 77 Πίνακας 4-6: JDBC settings για Oracle... 80 Πίνακας 4-7: JDBC settings για MySQL... 81

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 9 Λίστα Σχημάτων Σχήμα 2-1:Η αρχιτεκτονική του Σημασιολογικού Ιστού... 19 Σχήμα 2-2: Οι τρεις υπογλώσσες της γλώσσας OWL.... 21 Σχήμα 2-3: Ορισμός κλάσης στην OWL.... 21 Σχήμα 2-4: Βασικό Περιβάλλον Χρήσης του Protégé... 22 Σχήμα 2-5 : Το βασικό περιβάλλον χρήσης του TopBraid... 23 Σχήμα 2-6: Αναπαράσταση της ιεραρχίας των ιδιοτήτων του T-Box στο RacerPorter.... 27 Σχήμα 2-7: Εμφάνιση στο Protégé των σχέσεων που προκύπτουν από επαγωγή από τον υπολογισμό.... 28 Σχήμα 2-8: Αρχιτεκτονική του Pellet... 29 Σχήμα 2-9: Επίδειξη της σχέσης ISA.... 32 Σχήμα 2-10: Η οντολογία έχει μετασχηματιστεί σε ένα κατευθυνόμενο γράφο με βάρη. Ο συντελεστής... 33 Σχήμα 2-11: Η οντολογία ως ένας κατευθυνόμενος γράφος με βάρη παίρνοντας υπόψη και τις... 34 Σχήμα 2-12: Κοινοί κόμβοι.... 36 Σχήμα 2-13: Ιεραρχία Όρων ποτών. Οι έννοιες αναψυκτικό και χυμός φρούτων ανήκει στο πρώτο... 38 Σχήμα 2-14: Για κάθε κλάση εμφανίζονται οι συχνότητες εμφάνισης των κλάσεων ταξινόμησης:... 40 Σχήμα 2-15: Ταξινομία εννοιών των Frito... 42 Σχήμα 2-16: Η ταξινομία «Ποτά», μετά την μείωση της από το εκτεταμένο επερώτημα.... 43 Σχήμα 2-17: Αρχιτεκτονική του Sesame.... 44 Σχήμα 2-18 : Αρχείο αντιστοίχησης του D2RQ.... 45 Σχήμα 2-19: Βασικές οντότητες του CIDOC-CRM.... 47 Σχήμα 4-1: Οι κλάσεις της οντολογίας μέσω της οποίας εκφράζεται σημασιολογικά η Βάση του Art.... 55 Σχήμα 4-2: Παράδειγμα αρχείου ορισμού για την δημιουργία πραγματώσεων.... 57 Σχήμα 4-3: Στοιχεία στήλης PLACE του πίνακα ΙΤΕΜ της βάσης Art-e-Fact.... 57 Σχήμα 4-4: Μετατροπή των στοιχείων του σχήματος 4-3 σε πραγματώσεις της κλάσης... 57 Σχήμα 4-5: Παράδειγμα αρχείου ορισμού για την σύνδεση πραγματώσεων με ιδιότητες με βάση τα... 58 Σχήμα 4-6: Στοιχεία της στήλης ITEM_ID και TITLE του πίνακα ΙΤΕΜ της βάσης Art-e-Fact.... 59 Σχήμα 4-7: Διασύνδεση των πραγματώσεων που προκύπτουν από το Σχήμα 4-5 με την ιδιότητα... 59 Σχήμα 4-8 : Παράδειγμα αρχείου ορισμού για την σύνδεση πραγματώσεων με ιδιότητες με βάση τα... 60 Σχήμα 4-9: Στοιχεία της στήλης TITLE και THEME_ID του πίνακα ΙΤΕΜ της βάσης Art-e-Fact.... 61 Σχήμα 4-10 : Στοιχεία της στήλης THEM_ID και THEME_DESCR του πίνακα THEMES της βάσης... 61 Σχήμα 4-11 : Διασύνδεση των πραγματώσεων που προκύπτουν από το Σχήμα 4-8 και 4-9 με την... 62 Σχήμα 4-12: Διεπαφή login... 62 Σχήμα 4-13: Το κεντρικό παράθυρο της εφαρμογής.... 63 Σχήμα 4-14: Το δέντρο κλάσεων της οντολογίας... 64 Σχήμα 4-15: Επιλογές για προβολή του δέντρου κλάσεων η ιδιοτήτων... 64 Σχήμα 4-16: Το δέντρο ιδιοτήτων της οντολογίας.... 65 Σχήμα 4-17: Διεπαφή Δημιουργίας Σημασιολογικού Ερωτήματος... 66

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 10 Σχήμα 4-18: Διεπαφή Δημιουργίας Σημασιολογικού Ερωτήματος Παράδειγμα περιορισμού των... 66 Σχήμα 4-19: Διεπαφή Δημιουργίας Σημασιολογικού Ερωτήματος Επιλογή πραγμάτωσης... 67 Σχήμα 4-20: Διεπαφή Δημιουργίας Σημασιολογικού Ερωτήματος Σύνθετο ερώτημα... 67 Σχήμα 4-21: Διεπαφή εμφάνισης και επεξεργασίας σημασιολογικού ερωτήματος... 68 Σχήμα 4-22: Διεπαφή επεξήγησης σημασιολογικού ερωτήματος.... 68 Σχήμα 4-23: Διεπαφή εμφάνισης αποτελεσμάτων σημασιολογικού ερωτήματος.... 68 Σχήμα 4-24: Διεπαφή εμφάνισης πραγμάτωσης... 69 Σχήμα 4-25: Διεπαφή εμφάνισης πραγμάτωσης... 70 Σχήμα 4-26: Διεπαφή μενού επιλογής εμφάνισης πραγματώσεων κλάσης.... 70 Σχήμα 4-27: Διεπαφή κομβίων επιλογής εμφάνισης πραγματώσεων κλάσης Λεπτομέρεια.... 70 Σχήμα 4-28: Διεπαφή δημιουργίας νέας πραγμάτωσης.... 71 Σχήμα 4-29: Διεπαφή εμφάνισης λεπτομέρειας πραγμάτωσης χωρίς δυνατότητας επεξεργασίας... 71 Σχήμα 4-30: Διεπαφή εμφάνισης και επεξεργασίας λεπτομερειών πραγμάτωσης.... 72 Σχήμα 4-31: Διεπαφή εμφάνισης και επεξεργασίας λεπτομερειών πραγμάτωσης.... 72 Σχήμα 4-32: Διεπαφή δημιουργίας νέας κλάσης για σύνδεση με την επιλεγόμενη πραγμάτωση.... 73 Σχήμα 4-33: Διεπαφή επιλογής κλάσης και πραγμάτωσης για σύνδεση με την επιλεγόμενη... 73 Σχήμα 4-34: Διεπαφή εμφάνισης κλάσεων που συνδέονται με επιλεγόμενη ιδιότητα... 74 Σχήμα 4-35: Διεπαφή Κομβίων Επιλογής Δέντρου Κλάσεων... 74 Σχήμα 4-36: Διεπαφή προβολής και επεξεργασίας περιορισμών κλάσης χωρίς reasoning... 75 Σχήμα 4-37: Διεπαφή προβολής και επεξεργασίας περιορισμών κλάσης με reasoning.... 76 Σχήμα 4-38: Διεπαφή μεταβολής περιορισμού... 76 Σχήμα 4-39: Διεπαφή δημιουργίας περιορισμού.... 77 Σχήμα 4-40: Διεπαφή επιλογής κλάσης... 78 Σχήμα 4-41: Διεπαφή επιλογής πραγμάτωσης... 78 Σχήμα 4-42: Μενού επιλογής.... 78 Σχήμα 4-43: Επιλογή File του μενού επιλογής... 79 Σχήμα 4-44: Επιλογή File του μενού επιλογής... 79 Σχήμα 4-45: Επιλογή Configuration του μενού επιλογής... 80 Σχήμα 4-46: Διεπαφή εμφάνισης μη έγκυρων κλάσεων σύμφωνα με τον reasoner.... 80 Σχήμα 4-47: Διεπαφή επιλογής ρυθμίσεων για οντολογία που βρίσκεται σε βάση δεδομένων.... 81 Σχήμα 4-48: Διεπαφή επιλογής ρυθμίσεων για αποθήκευση αρχείου owl σε βάση δεδομένων... 82 Σχήμα 4-49: Διεπαφή επιλογής ρυθμίσεων για μετασχηματισμό της βάσης Art-e-Fact σε οντολογία.... 82 Σχήμα 4-50: Διεπαφή διαχείρισης λογαριασμών χρηστών... 83 Σχήμα 4-51: Επιλογή Help του μενού επιλογής.... 83 Σχήμα 4-52: Διεπαφή about... 83 Σχήμα 4-53: Διεπαφή κομβίων επιλογής.... 84 Σχήμα 4-54: Διεπαφή Επιβεβαίωσης εξόδου... 84 Σχήμα 5-1: Ιεραρχία κλάσεων της οντολογίας People... 86 Σχήμα 5-2: Ιεραρχία ιδιοτήτων της οντολογίας People.... 86

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 11 Σχήμα 5-3: Περιορισμοί κλάσης GoodEntity.... 86 Σχήμα 5-4: Ιεραρχία κλάσεων της οντολογίας People χωρίς reasoning.... 87 Σχήμα 5-5: Ιεραρχία ιδιοτήτων της οντολογίας People χωρίς reasoning... 87 Σχήμα 5-6: Ιεραρχία κλάσεων της οντολογίας People με reasoning.... 87 Σχήμα 5-7:Εμφάνιση των πραγματώσεων της κλάσης Living_Things με χρήση reasoning.... 88 Σχήμα 5-8:Εμφάνιση λεπτομερειών της πραγμάτωσης Kostas.... 88 Σχήμα 5-9: Δημιουργία ερωτήματος «Βρες όλους τους ανθρώπους που τρώνε οτιδήποτε»... 89 Σχήμα 5-10: Έκφραση ερωτήματος «Βρες όλους τους ανθρώπους που τρώνε οτιδήποτε» σε γλώσσα... 89 Σχήμα 5-11: Αποτελέσματα ερωτήματος «Βρες όλους τους ανθρώπους που τρώνε οτιδήποτε»... 89 Σχήμα 5-12: Δημιουργία ερωτήματος «Βρες όλους τους ανθρώπους που τρώνε πίτσα»... 90 Σχήμα 5-13: Έκφραση ερωτήματος «Βρες όλους τους ανθρώπους που τρώνε πίτσα» σε γλώσσα... 90 Σχήμα 5-14: Αποτελέσματα ερωτήματος «Βρες όλους τους ανθρώπους που τρώνε πίτσα»... 90 Σχήμα 5-15: Δημιουργία ερωτήματος «Βρες όλους τους ανθρώπους που τρώνε πίτσα και σπαγγέτι»... 90 Σχήμα 5-16: Έκφραση ερωτήματος «Βρες όλους τους ανθρώπους που τρώνε πίτσα και σπαγγέτι» σε... 91 Σχήμα 5-17: Αποτελέσματα ερωτήματος «Βρες όλους τους ανθρώπους που τρώνε πίτσα και σπαγγέτι.. 91 Σχήμα 5-18: Επεξήγηση του ερωτήματος «Βρες όλους τους ανθρώπους που τρώνε πίτσα και σπαγγέτι. 91 Σχήμα 5-19: Πληροφορία που εμφανίζεται στην κονσόλα εξόδου κατά την διάρκεια μετατροπή της... 93

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων ΒυζαντινήςΤέχνης 12 1 Εισαγωγή «Όλοι οι άνθρωποι από τη φύση τους διψούν για γνώση.» Αριστοτέλης Ο τομέας ανάλυσης και τεκμηρίωσης Βυζαντινών Εικόνων έχει σκοπό τη διατήρηση της πολιτιστικής μας κληρονομιάς και τη γνωριμία και κατανόηση του παρελθόντος μας. Επίσης λόγου της ιδιαίτερης φύσης της συγκεκριμένης τέχνης και διασύνδεσής της με την θρησκεία και την Ορθοδοξία, έχει ιδιαίτερο αντίκτυπο στο θρησκευτικό συναίσθημα και τον ψυχικό κόσμο των ανθρώπων. Η πληροφορία που απαιτείται για την ολοκληρωμένη τεκμηρίωση κάθε εικόνας είναι τεράστια και για την εύκολη πρόσβαση σε αυτήν απαιτείται η αποθήκευση αυτής σε Βάση Δεδομένων. Ως γνωστόν η τεχνολογία των Βάσεων Δεδομένων προσφέρει έναν δομημένο τρόπο για την διαχείριση της γνώσης καθιστώντας εύκολη την πρόσβαση σε αυτήν. Παρόλα αυτά οι κλασσικές βάσεις δεδομένων δεν μπορούν να δώσουν σημασιολογική έννοια στο περιεχόμενό τους, το κενό αυτό καλύπτει ο επερχόμενος Σημασιολογικός Ιστός και η χρήση οντολογιών.

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 13 1.1 Σκοπός Διπλωματικής Στόχος της διπλωματικής αυτής εργασίας ήταν η ανάπτυξη ενός συστήματος σημασιολογικής περιγραφής και επεξεργασίας της τεχνοτροπικής δομής έργων τέχνης, αξιοποιώντας τις δυνατότητες των τεχνολογιών του Σημασιολογικού Ιστού. Το σύστημα αναμενόταν να αποτελέσει τμήμα ενός γενικότερου συστήματος λήψης και επεξεργασίας φασμάτων σε διάφορα σημεία ενός έργου τέχνης σε καθεστώς διαχεόμενης ανάκλασης στην περιοχή του υπεριώδους, ορατού και κοντινού υπερύθρου του η/μ φάσματος. Το σύστημα προσπαθεί από τα φάσματα αυτά με τεχνικές επεξεργασίας σήματος να κατηγοριοποίηση τα υλικά που υπάρχουν στα εξεταζόμενα σημεία. Χρησιμοποιώντας και την σημασιολογική πληροφορία, το γενικευμένο αυτό πλαίσιο φιλοδοξεί να παρέχει ολοκληρωμένη πληροφορία για τα έργα τα οποία μελετά. Στην παρούσα υλοποίηση το σύστημα συνδέεται με μια σχεσιακή βάση δεδομένων (ΒΔ) Oracle RDBMS, η οποία περιλαμβάνει τεχνικές πληροφορίες για το συγκεκριμένο γνωστικό αντικείμενο. Στα πλαίσια της διπλωματικής αυτής, στόχος ήταν η ανάπτυξη ενός μηχανισμού απεικόνισης του σχήματος και του περιεχομένου της ΒΔ σε μια οντολογία, αποδίδοντας έτσι στα αντικείμενα σημασιολογικό περιεχόμενο. Με τη χρήση ήδη ανεπτυγμένων εργαλείων εξαγωγής συμπερασμάτων (Reasoners), είναι δυνατή η περαιτέρω εξαγωγή σχέσεων που δεν έχουν ρητά δηλωθεί, είτε στο σχήμα της ΒΔ, είτε στην οντολογία. Απώτερος στόχος την παρούσας διπλωματικής ήταν να αναπτυχθεί ένα φιλικό γραφικό περιβάλλον (graphical user interface - GUI) μέσω του οποίου θα είναι δυνατή η περιήγηση στην οντολογία και στην πληροφορία που αυτή περιέχει. Επίσης να παρέχεται ένας αποδοτικός τρόπος για τη δημιουργία απλών και σύνθετων ερωτημάτων στην οντολογία και να εμφανίζονται αποτελέσματα με τέτοιον τρόπο, ώστε ο χρήστης να μπορεί να εισάγει τις πληροφορίες για την τεχνοτροπία της εξεταζόμενης εικόνας, να εμπλουτίζει την οντολογία και με τον τρόπο αυτό να βελτιώνει το σημασιολογικό περιεχόμενο. Παρατηρήσεις: Η συγκεκριμένη διπλωματική εκπονήθηκε σε συνεργασία με το Διαγνωστικό Κέντρο Έργων Τέχνης «ΟΡΜΥΛΙΑ» του ΙΔΡΥΜΑΤΟΣ «ΟΡΜΥΛΙΑ» στα πλαίσια της ανάπτυξης ενός συστήματος διαχείρισης γνώσης η οποία προέρχεται από τη διαγνωστική μελέτη έργων τέχνης με μη καταστρεπτικές μεθόδους ανάλυσης. 1.2 Επιγραμματικός ορισμός του προβλήματος Το πρόβλημα που καλείται η παρούσα διπλωματική να αντιμετωπίσει μπορεί να αναλυθεί σε τρεις συνιστώσες: 1. Να εξερευνήσει τις δυνατότητες των τεχνολογιών του Σημασιολογικού Ιστού.

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 14 2. Να αναπτύξει μια οντολογία που βασίζεται στην οντολογία CIDOC-CRM, μια διαδεδομένη οντολογία για την περιγραφή και απεικόνιση πολιτιστικής γνώσης, ικανή να περιγράψει την πληροφορία που απαιτείται για την τεκμηρίωση και συντήρηση Έργων Βυζαντινής Τέχνης, καθώς και να αντιστοιχίσει την ΒΔ Arte-Fact, μία ήδη υπάρχουσα Σχεσιακή Βάση Δεδομένων ανεπτυγμένη σε ένα σύστημα Oracle RDBMS στην παραπάνω οντολογία. 3. Να αναπτύξει ένα πρόγραμμα που να επιτρέπει την προβολή του σχήματος της οντολογίας, καθώς και την προβολή και επεξεργασία των πραγματώσεων που αυτή περιέχει. Το πρόγραμμα θα πρέπει να επιτρέπει ακόμα την χρήση ενός εργαλείου εξαγωγής συμπερασμάτων, για τη δημιουργία σημασιολογικών ερωτημάτων με απλό τρόπο και τη λήψη απαντήσεων. 1.3 Συνοπτική περιγραφή της εφαρμογής Στα πλαίσια της διπλωματικής εργασίας αναπτύχθηκε το σύστημα Εικονομία, μια εφαρμογή που έχει την δυνατότητα να μετατρέπει την ήδη υπάρχουσα ΒΔ Art-e-Fact του ιδρύματος ΟΡΜΥΛΙΑ σε οντολογία και συγκεκριμένα σε ένα αρχείο owl. Στη συνέχεια η εφαρμογή μπορεί να δουλέψει με βάση αυτό το αρχείο.owl, το οποίο είτε μπορεί πρώτα να το αποθηκεύσει σε μία βάση δεδομένων (persistent storage), είτε να το προσπελάσει άμεσα. Η οντολογία προβάλλεται σε μορφή δέντρου, όπου φαίνονται οι κλάσεις και οι ιδιότητές της. Ο χρήστης μπορεί να προβάλλει τις πραγματώσεις (instances) κάθε κλάσης, καθώς και την πληροφορία που περιλαμβάνει κάθε πραγμάτωση, μπορεί επίσης να δημιουργεί ή να διαγράφει πραγματώσεις καθώς και να μεταβάλλει τις σχέσεις μεταξύ αυτών. Επίσης μέσω κάποιων πλαισίων επιλογής, ο χρήστης μπορεί να διατυπώνει ερωτήματα που να έχουν την μορφή υποκείμενο κατηγορούμενο αντικείμενο, να δει την επεξήγησή τους σε φυσική γλώσσα, και στην συνέχεια η εφαρμογή μπορεί να τα μετατρέψει σε επερωτήματα της σημασιολογικά ενήμερης γλώσσας επερωτημάτων SPARQL και να προβάλλει τα αποτελέσματά τους. Μέσω του Εικονομία είναι δυνατή η προβολή, διαγραφή και εισαγωγή μέσω ενός απλού περιβάλλοντος των περιορισμών που ορίζονται στην γλώσσα OWL, έτσι ώστε να είναι δυνατή η διαχείριση των ικανών ή ικανών-και-αναγκαίων συνθηκών που κάθε κλάση πρέπει να ικανοποιεί. Η εφαρμογή προσφέρει ακόμα τη δυνατότητα χρήσης ενός εργαλείου εξαγωγής συμπερασμάτων (reasoner), το οποίο μπορεί να ενεργοποιείται κατά βούληση, καθιστώντας έτσι δυνατή την δημιουργία προτάσεων που δεν έχουν ρητά οριστεί. Αν και η εφαρμογή έχει σχεδιαστεί και βελτιστοποιηθεί ώστε να δουλεύει με την οντολογία που απεικονίζει την ΒΔ του Art-e-fact, μπορεί να λειτουργήσει και με άλλες οντολογίες, δίνοντας στο χρήστη τις ίδιες δυνατότητες. Στην περίπτωση αυτήν όμως κάποιες λειτουργίες που έχουν σχεδιαστεί ειδικά για το συγκεκριμένο πρόβλημα, όπως για παράδειγμα η προβολή των φωτογραφιών που συνδέονται με κάποια εικόνα, δεν θα λειτουργούν.

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 15 1.4 Οργάνωση κεφαλαίων Το παρόν σύγγραμμα επιχειρεί να παρουσιάσει μια όσο το δυνατό σύντομη αλλά σαφή περιγραφή κάθε πτυχής της ανάπτυξης του συστήματος και των δυνατοτήτων του. Η δομή που ακολουθείται είναι ως εξής: Κεφάλαιο 2 - Μεθοδολογία και Έρευνα: Πριν την υλοποίηση του Εικονομία έγινε μια ενδελεχής έρευνα για τις τεχνολογίες και τα εργαλεία του σημασιολογικού ιστού τα οποία και παρουσιάζονται σε αυτό το κεφάλαιο. Πιο συγκεκριμένα αναλύονται η έννοια της οντολογίας [2.1] και οι γλώσσες σημασιολογικής αναπαράστασης [2.2] καθώς και οι δύο πιο γνωστοί επεξεργαστές οντολογιών, το Protégé [2.3.1] και το TopBraid [2.3.2].,ενώ στην συνέχεια παρουσιάζεται η περιγραφική λογική [2.4] και δύο εργαλεία που βασίζονται σε αυτήν για την εξαγωγή συμπερασμάτων, το RacerPro [2.4.1] και το Pellet [2.4.2]. Η σημασιολογική γλώσσα επερωτημάτων SPARQL παρουσιάζεται στην ενότητα [2.5.1], ενώ στις επόμενες δύο ενότητες [2.5.2 & 2.5.3] αναλύονται δύο τεχνικές για τον υπολογισμό της ομοιότητας των εννοιών και κατηγοριοποίησης τους με την βοήθεια οντολογίας. Στις ενότητες [2.6.1 & 2.6.2] αναφέρονται τα σημασιολογικά APIs Jena και Sesame. Στην συνέχεια, αναλύονται το D2RQ [2.7.1], που μετατρέπει μια σχεσιακή βάση δεδομένων σε οντολογία μετατρέποντας σχεσιακά ερωτήματα σε ερωτήματα SQL σε πραγματικό χρόνο, καθώς και το Oracle Spatial RDF Model [2.7.2], που αποτελεί την πρόταση της Oracle για την αποθήκευση σημασιολογικών δεδομένων ενώ στην επόμενη ενότητα παρουσιάζεται το εννοιολογικό μοντέλο CIDOC-CRM [02.8]. Στην ενότητα [2.9] αναφέρεται η γλώσσα Java με την οποία αναπτύχθηκε το Εικονομία. Το κεφάλαιο κλείνει με την ενότητα [02.10], στην οποία αναφέρονται οι τεχνολογίες που τελικά χρησιμοποιήθηκαν και οι λόγοι για τους οποίους αυτές επιλέχθηκαν ανάμεσα στις άλλες. Κεφάλαιο 3 - Περιγραφή του προβλήματος: Σε αυτό το κεφάλαιο γίνεται η περιγραφή του προβλήματος [3.1] και η ανάλυση των απαιτήσεων [3.2], όπου αναφέρονται οι ομάδες χρηστών [3.2.1], οι απαιτήσεις τους [3.2.2], καθώς και οι απαιτήσεις του συστήματος [3.2.3]. Κεφάλαιο 4 - Αναλυτική περιγραφή συστήματος: Στο παρόν κεφάλαιο γίνεται η παρουσίαση του Εικονομία, των λειτουργιών του και των διεπαφών που αυτό προσφέρει. Αρχικά παρουσιάζεται η οντολογία που αναπτύχθηκε [4.1] για τις ανάγκες του Art-e-Fact και η οποία βασίστηκε στο CIDOC-CRM. Στη συνέχεια παρουσιάζεται ο τρόπος με τον οποίο η βάση Art-e-Fact αντιστοιχίζεται στην παραπάνω οντολογία [4.2]. Στην τελευταία ενότητα [4.3] παρουσιάζονται αναλυτικά οι διεπαφές του Εικονομία μέσω των οποίων παρέχεται πρόσβαση σε όλες τις λειτουργίες του. Κεφάλαιο 5 - Επικύρωση καλής λειτουργίας του συστήματος: Στο πέμπτο κεφάλαιο επιβεβαιώνεται η ορθή λειτουργία του συστήματος, χρησιμοποιείται μία απλή οντολογία [5.1], και εξετάζεται αν τα αποτελέσματα του Εικονομία

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 16 είναι τα αναμενόμενα, όσον αφορά την περιήγηση στην οντολογία [5.2], τη δημιουργία και προβολή επερωτημάτων [5.3], καθώς και τις υπόλοιπες λειτουργίες του Εικονομία [5.4]. Κεφάλαιο 6 - Συμπεράσματα Μελλοντική εργασία: Τέλος στο κεφάλαιο αυτό γίνεται μία σύνοψη της διπλωματικής εργασίας [6.1] και αναφέρονται τα συμπεράσματα του συγγραφέα [6.2] καθώς και προτάσεις για τη μελλοντική βελτίωση του συστήματος [6.3].

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 17 2 Μεθοδολογία και Έρευνα 2.1 Σημασιολογικός Ιστός - Οντολογία Οι οντολογίες πρόκειται να αποτελέσουν τον πυρήνα του σημασιολογικού διαδικτύου, η ανάπτυξη του οποίου βρίσκεται σε εξέλιξη. Ο όρος Σημασιολογικός Ιστός χρησιμοποιήθηκε πρώτη φορά το 1998 από τον Tim Berners-Lee, δημιουργό του πρώτου φυλλομετρητή ιστοσελίδων και είναι μία εξέλιξη του σημερινού διαδικτύου. Στο Semantic Web (SW) τα δεδομένα (resources) θα περιγράφονται από μεταδεδομένα (metadata), τα οποία θα έχουν καλά ορισμένες έννοιες, θα υποδηλώνουν συσχετίσεις μεταξύ των δεδομένων, αλλά δεν θα είναι άμεσα ορατά στο χρήστη. Έτσι, οι υπολογιστές θα μπορούν να επεξεργαστούν τα δεδομένα γνωρίζοντας τις έννοιες που αυτά αντιπροσωπεύουν, ανεξάρτητα από την εκάστοτε εφαρμογή. Επίσης θα προσφέρουν ένα μεγάλο πλεονέκτημα στην αναζήτηση πληροφορίας, η οποία πλέον θα γίνεται με βάση έννοιες (concepts) και όχι αλφαριθμητικά (strings). Με τη βοήθεια των οντολογιών καθίσταται δυνατός ο συνδυασμός πληροφορίας από πολλαπλές ετερογενείς πηγές, ενώ δίνεται η δυνατότητα εξατομίκευσης της πληροφορίας σύμφωνα με τις ανάγκες κάθε χρήστη. Έχουν δοθεί πολλοί ορισμοί για το τι είναι οντολογία, ανάλογα με το πεδίο εφαρμογής της. Οι πιο ισχυροί, από αυτούς είναι οι παρακάτω: «Οντολογία είναι ένας επίσημος, σαφής και λεπτομερής ορισμός ενός πεδίου γνώσης» 1 «Οντολογία είναι ένα μοντέλο δεδομένων που αναπαριστά ένα πεδίο γνώσης και χρησιμοποιείται για να εξαχθούν λογικά συμπεράσματα σχετικά με τις έννοιες του συγκεκριμένου πεδίου και τις σχέσεις μεταξύ τους» 2 «Οντολογία είναι η κοινή αντίληψη ενός πεδίου γνώσης» 3 1 Thomas Gruber, 1993 2 Wikipedia 3 Mike Uschold and Michael Gruninger, 1996

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 18 Στη δομή τους οι οντολογίες αποτελούνται από κλάσεις (classes) και την ιεραρχία τους (class-hierarchy), ιδιότητες (properties) και τις πραγματώσεις τους (instances, individuals), ενώ υποστηρίζουν κληρονομικότητα, περιορισμούς στα δεδομένα, σχέσεις μεταξύ των κλάσεων (π.χ. μη αλληλοεπικάλυψη), καθώς και την εφαρμογή λογικών σχέσεων (reasoning tasks), όπως ταξινόμηση (classification) και υπαγωγή (subsumption). 2.2 Γλώσσες εννοιολογικής αναπαράστασης Η χρήση της γλώσσας XML (extensible Markup Language) τα τελευταία χρόνια έχει εισάγει ένα νέο τρόπο ανταλλαγής των δεδομένων μεταξύ των συστημάτων, επιτρέποντας την ολοκλήρωσή τους στο βασικό επίπεδο. Αυτό που απαιτείται επιπλέον για να είναι δυνατή η κωδικοποίηση της σημασιολογίας των δεδομένων, χωρίς την εισαγωγή ασαφειών στη δομή, είναι η χρήση κατάλληλων γλωσσών που θα επιτρέπουν τη διατύπωση αυξημένης σημασιολογίας και δομής. Παρακάτω παρουσιάζονται οι γλώσσες RDF/S και OWL, οι οποίες αποτελούν τις επικρατέστερες προτάσεις του W3C (World Wide Web Consortium) το οποίο συντονίζει τις προσπάθειες για την ανάπτυξη του Σημασιολογικού Ιστού. RDF/S Resource Description framework/ schema language Το RDF [33] αποτελεί μέλος των προτύπων για τη διαχείριση μεταδεδομένων στον Παγκόσμιο Ιστό και απαρτίζει τη βάση για την κωδικοποίηση, ανταλλαγή, επεξεργασία και επαναχρησιμοποίηση μεταδεδομένων. Η βασική επιδίωξη του RDF είναι να επιτρέψει τον ορισμό της σημασιολογίας που εγκλείεται σε πληροφοριακούς πόρους με τυπικό, διαλειτουργικό και αναγνώσιμο τρόπο. Αυτό επιτυγχάνεται μέσω ενός μηχανισμού για την περιγραφή πληροφοριακών πόρων, ο οποίος δεν κάνει καμία υπόθεση για τη φύση του συγκεκριμένου πεδίου εφαρμογής ή τη δομή του εγγράφου που περιέχει την πληροφορία. Εκτός από τη διαλειτουργικότητα μεταξύ συστημάτων το RDF στοχεύει στην επαναχρησιμοποίηση, διαμοιρασμό και επεκτασιμότητα των μεταδεδομένων και κατά συνέπεια, στην αυτόματη επεξεργασία πόρων που ανταλλάσσονται μέσω του Διαδικτύου. Τα δομικά στοιχεία του μοντέλου δεδομένων του RDF και της αντίστοιχης Γλώσσας Σχήματος (RDFS) επιτρέπουν στους χρήστες που μοιράζονται τις πληροφορίες ενός τομέα γνώσης και ένα σύνολο από πληροφοριακούς πόρους, να ορίζουν ανεξάρτητα και χωρίς κεντρικό έλεγχο τη δική τους σημασιολογία μέσω μιας σαφώς ορισμένης εννοιολογικής υποδομής. Αν και η σημασιολογία που αποδίδεται στους ίδιους πληροφοριακούς πόρους μπορεί να διαφέρει ακόμα και εντός της ίδιας κοινότητας χρηστών, η κοινή αυτή εννοιολογική υποδομή επιτρέπει τη συνεπή κωδικοποίηση, ανταλλαγή, και επεξεργασία των μεταδεδομένων. Η σημασιολογία κωδικοποιείται σε ένα σύνολο από τριάδες (N-Triples), οι οποίες αποτελούν το ανάλογο του υποκειμένου, κατηγορουμένου και αντικειμένου (subject, predicate, object) μιας στοιχειώδους

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 19 πρότασης, η οποία μπορεί να γραφτεί με τη χρήση XML ετικετών. Η δομή αυτή αποδεικνύεται ένας φυσικός τρόπος για την περιγραφή της συντριπτικής πλειοψηφίας των πληροφοριακών πόρων (resources) που μπορούν να βρεθούν σε επιχειρησιακά περιβάλλοντα ή το Διαδίκτυο. Ο ορισμός των γνωρισμάτων/σχέσεων που χρησιμοποιούνται για την περιγραφή των πόρων και της σημασιολογίας που φέρουν, επιτυγχάνεται μέσω του RDFS. Ένα RDF σχήμα (schema) αποτελείται από τις δηλώσεις κλάσεων, γνωρισμάτων και σχέσεων μεταξύ των κλάσεων, όπου μία κλάση χρησιμοποιείται για να ομαδοποιήσει λογικά ομοειδείς πόρους. Με άλλα λόγια, ο μηχανισμός των RDF σχημάτων προσφέρει ένα σύστημα τύπων για τα RDF μοντέλα, ένα λεξιλόγιο για τους έγκυρους όρους που μπορούν να χρησιμοποιηθούν για την περιγραφή των πληροφοριακών πόρων. Τα λεξιλόγια αυτά δημιουργούνται ανεξάρτητα, ενώ κοινότητες χρηστών μπορούν να επαναχρησιμοποιήσουν λεξιλόγια άλλων χρηστών είτε αυτούσια είτε εκλεπτύνοντάς τα σύμφωνα με τις ανάγκες της εκάστοτε κοινότητας. Ένας πολύ σημαντικός μηχανισμός για την ανάπτυξη RDF σχημάτων και τη δημιουργία RDF περιγραφών είναι ο μηχανισμός ονοματοδοσίας XML (XML namespace) [29], ο οποίος επιτρέπει την επαναχρησιμοποίηση όρων από διαφορετικά σχήματα. Ένας χώρος ονοματοδοσίας είναι ένα σύνολο από κλάσεις και/ή ιδιότητες στον οποίον αποδίδεται ένα μοναδικό αναγνωριστικό (URI). Έτσι, ένα RDF σχήμα αποτελεί ένα χώρο ονοματοδοσίας που προσδιορίζεται μοναδικά από ένα URI. Με τη χρήση ενός XML χώρου ονοματοδοσίας, περιγραφικοί όροι (δηλαδή ονόματα κλάσεων ή/και ιδιοτήτων) αναγνωρίζονται μοναδικά από το URI του σχήματος, στο οποίο ορίζονται (το οποίο παίζει το ρόλο ενός προθέματος) ως κανονικοί πόροι στο Διαδίκτυο, γεγονός που επιτρέπει την επαναχρησιμοποίησή τους. Σχήμα 2-1:Η αρχιτεκτονική του Σημασιολογικού Ιστού. Το Σχήμα2-1 απεικονίζει την αρχιτεκτονική του Σημασιολογικού Ιστού, σε σχέση με τις εμπλεκόμενες τεχνολογίες.

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 20 OWL - Web ontology language Όπως έχουμε προαναφέρει, ο Σημασιολογικός Ιστός αποτελεί ένα όραμα για το μέλλον του Διαδικτύου, στο οποίο η πληροφορία αποκτά σαφή σημασιολογία, καθιστώντας την ευκόλως επεξεργάσιμη από υπολογιστικά συστήματα. Ο Σημασιολογικός Ιστός κτίζεται πάνω στην ικανότητα της XML να ορίζει προσαρμοσμένα σχήματα ετικετών και στην ευέλικτη προσέγγιση της RDF στην αναπαράσταση δεδομένων. Η XML, όμως αποτελεί απλά μία σύνταξη για δομημένα έγγραφα, χωρίς να επιβάλλει σημασιολογικούς περιορισμούς στη σημασιολογία αυτών των εγγράφων. Αν και το XML Schema αποτελεί μία γλώσσα που περιορίζει τη δομή των XML εγγράφων, επεκτείνει απλώς την XML με τύπους δεδομένων. Η RDF, από την άλλη πλευρά, αποτελεί ένα μοντέλο δεδομένων για αντικείμενα («πόρους») και των συσχετίσεών τους, που παρέχει δομές για την έκφραση απλής σημασιολογίας, διατυπωμένης με το συντακτικό της XML, ενώ το RDF Schema που χρησιμοποιείται είναι ένα λεξιλόγιο για την περιγραφή ιδιοτήτων και κλάσεων για δικτυακούς πόρους, με τη δυνατότητα έκφρασης απλών ιεραρχιών γενίκευσης ιδιοτήτων και κλάσεων. Το πρώτο επίπεδο πάνω από την RDF που απαιτείται για το Σημασιολογικό Ιστό είναι μία γλώσσα οντολογιών, η οποία θα μπορεί να περιγράψει τυπικά τη σημασιολογία της ορολογίας που χρησιμοποιείται σε δικτυακά έγγραφα. Αυτή η αναπαράσταση όρων και των αλληλοσυσχετίσεών τους αποκαλείται οντολογία. Εάν τα υπολογιστικά συστήματα αναμένονται να εκτελέσουν χρήσιμες συλλογιστικές διεργασίες σε αυτά τα έγγραφα, η γλώσσα που θα χρησιμοποιηθεί θα πρέπει να εκτείνεται πέρα από τη βασική σημασιολογία που μπορεί να εκφράσει ένα RDF σχήμα. Η OWL (Web Ontology Language) [8] σχεδιάστηκε για να αντιμετωπίσει αυτή την ανάγκη και αποτελεί μέρος των προτάσεων του W3C που σχετίζονται με τον Σημασιολογικό Ιστό. Αποτελεί βελτίωση της γλώσσας DAML+OIL, ενσωματώνοντας εμπειρία από το σχεδιασμό και την εφαρμογή της, και είναι σχεδιασμένη για χρήση από εφαρμογές που πρέπει να επεξεργαστούν το περιεχόμενο της πληροφορίας, αντί απλώς να το προβάλλουν στο χρήστη. Η OWL υποστηρίζει τη δυνατότητα διατύπωσης πλουσιότερης σημασιολογίας από τις γλώσσες XML, RDF, και RDF Schema, παρέχοντας επιπλέον λεξιλόγιο και τυπική σημασιολογία για την περιγραφή των ιδιοτήτων και των κλάσεων. Μεταξύ άλλων είναι σε θέση να εκφράσει σχέσεις μεταξύ κλάσεων (π.χ. μη αλληλοεπικάλυψη), πληθικότητα (π.χ. «ακριβώς ένα»), ισοδυναμία, πλουσιότερους τύπους ιδιοτήτων και χαρακτηριστικά ιδιοτήτων (π.χ. συμμετρία). Η OWL χωρίζεται σε τρεις υπογλώσσες με αυξανόμενη εκφραστικότητα, τις OWL Lite, OWL DL και OWL Full.

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 21 Σχήμα 2-2: Οι τρεις υπογλώσσες της γλώσσας OWL. Η OWL Lite πρωτίστως μία ιεραρχία ταξινόμησης και απλούς περιορισμούς. Για παράδειγμα, ενώ υποστηρίζει περιορισμούς πληθικότητας, επιτρέπει μόνο τις τιμές πληθικότητας 0 και 1. Λόγω της απλότητάς της και της μικρής της πολυπλοκότητας, η OWL Lite παρέχει απλούς μηχανισμούς για την δημιουργία θησαυρών και ταξινομίων. Η OWL DL υποστηρίζει μεγαλύτερη εκφραστικότητα, εξασφαλίζοντας ταυτόχρονα υπολογιστική πληρότητα (όλα τα συμπεράσματα είναι υπολογίσιμα) και τη δυνατότητα εξαγωγής συμπερασμάτων (όλοι οι υπολογισμοί τερματίζουν σε πεπερασμένο χρόνο). Η OWL DL περιλαμβάνει όλα τα δομικά στοιχεία της γλώσσας, αλλά αυτά μπορούν να χρησιμοποιηθούν μόνο κάτω από συγκεκριμένους περιορισμούς (για παράδειγμα, ενώ μία κλάση μπορεί να είναι υποκλάση πολλών κλάσεων, μία κλάση δεν μπορεί να είναι στιγμιότυπο μίας άλλης κλάσης). Η OWL Full υποστηρίζει τη μέγιστη εκφραστικότητα και τη συντακτική ελευθερία της RDF, χωρίς υπολογιστικές εγγυήσεις. Για παράδειγμα, στην OWL Full μία κλάση μπορεί να θεωρηθεί τόσο ως μία συλλογή ατομικών στοιχείων, όσο και ως ατομικό στοιχείο από μόνη της. Κάθε μία από τις υπογλώσσες αυτές αποτελεί μία επέκταση της πιο απλής προκατόχου της τόσο σε όρους που δύναται να εκφράσει όσο και στο τι μπορεί έγκυρα να συμπεράνει. Στο Σχήμα 2-3 δίνεται ένα παράδειγμα ορισμού μιας κλάσης στην γλώσσα OWL. <rdf:rdf xml:base="http://ormylia"> <owl:ontology rdf:about=""/> <owl:class rdf:id="e46_section_definition"> <rdfs:subclassof> <owl:class rdf:id="e44_place_appellation"/> </rdfs:subclassof> </owl:class> Σχήμα 2-3: Ορισμός κλάσης στην OWL.

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 22 2.3 Εργαλεία ανάπτυξης και διαχείρισης οντολογιών 2.3.1 Protégé Το Protégé [20] αποτελεί ένα ευρέως διαδεδομένο εργαλείο δημιουργίας οντολογιών που έχει αναπτυχθεί στο πανεπιστήμιο του Stanford. Μέσω ενός γραφικού περιβάλλοντος επιτρέπει την δημιουργία σύνθετων οντολογιών και την περιήγηση σε αυτές. Η ευρεία χρήση του Protégé σε συνδυασμό με την ανοικτή του αρχιτεκτονική έχει οδηγήσει στην δημιουργία ενός μεγάλου αριθμού από plug-ins που επεκτείνουν τις δυνατότητές του και το καθιστούν μια ολοκληρωμένη σουίτα ανάπτυξης και διαχείρισης οντολογιών. Σχήμα 2-4: Βασικό Περιβάλλον Χρήσης του Protégé 2.3.2 TopBraid Composer O TopBraid Composer [30],[31] της εταιρείας Top Quadrant αποτελεί ένα ολοκληρωμένο εμπορικό εργαλείο ανάπτυξης και επεξεργασίας οντολογιών. Τα βασικά του πλεονεκτήματά του σε σχέση με το Protégé είναι το πιο σταθερό περιβάλλον του και η δυνατότητα για import και export από ένα πλήθος πηγών, όπως απλών αλλά και σημασιολογικά ενήμερων ΒΔ. Εκτός αυτών, οι δυνατότητές του είναι παρόμοιες με το Protégé. (το οποίο και τελικά προτιμήθηκε για την ανάπτυξη της αρχικής μας οντολογίας γιατί σε αντίθεση με το TopBraid το Protégé είναι open-source και προσφέρεται δωρεάν.)

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 23 Σχήμα 2-5 : Το βασικό περιβάλλον χρήσης του TopBraid. 2.4 Περιγραφική Λογική Η Περιγραφική Λογική (Description Logic - DL) [3],[9] εμπεριέχει μία οικογένεια από γλώσσες αναπαράστασης γνώσης που μπορούν να χρησιμοποιηθούν για να αναπαραστήσουν την πληροφορία για ένα πεδίο γνώσης με έναν δομημένο, μεθοδικό και καλά κατανοητό τρόπο. Το όνομα Περιγραφική Λογική προέρχεται από το γεγονός ότι οι βασικές έννοιες του πεδίου γνώσης αναφέρονται με περιγραφικές έννοιες που υπάρχουν στην συγκεκριμένη γλώσσα DL, καθώς και ότι οι DLs διαφέρουν από τους προκατόχους τους (σημασιολογικά δίκτυα και πλαίσια) γιατί χρησιμοποιούν επίσημες, βασισμένες στην λογική έννοιες. Για παράδειγμα η έκφραση «Ένας άντρας είναι νυμφευμένος με μία γιατρό, έχει τουλάχιστον πέντε παιδιά, από τα οποία όλα είναι καθηγητές» μπορεί να περιγραφεί με την βοήθεια μιας γλώσσας DL ως εξής: Human Female married.doctor ( 5childs) child.professor Η παραπάνω έκφραση χρησιμοποιεί τις Boolean εκφράσεις ένωση ( ) και συμπλήρωμα ( ), τον περιορισμό ύπαρξης ( ) και τον περιορισμό ύπαρξης για όλες τις τιμές ( ), καθώς και τον αριθμητικό περιορισμό ( ). Στον Πίνακας 2-1 φαίνονται οι τελεστές που χρησιμοποιούνται στην γλώσσα DAML+OIL, από την οποία προήρθε η γλώσσα OWL και αποτελούν τους πιο συνηθισμένους τελεστές των DLs.

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 24 Πίνακας 2-1: Οι πιο συνηθισμένοι τελεστές στην γλώσσα DAML+OIL. Constructor DL Syntax Example intersectionof C 1 C n Human Male unionof C 1 C n Doctor Lawyer complementof C Male one of { i 1 i n } { john, mary } hasclass P.C haschild.laywer toclass P.C haschild.lawyer hasvalue P.{i} citizenof.{usa} mincardinality n P.C 2hasChild.Lawyer maxcardinality n P.C 1 haschild.male cardinality = n P.C = hasparent.female Στην DL γίνεται ένας διαχωρισμός μεταξύ του T-Box (terminological box) και του A-Box (assertional box). To T-Box περιλαμβάνει προτάσεις που περιγράφουν τη δομή των εννοιών (π.χ. σχέσεις μεταξύ των εννοιών), ενώ το A-Box περιλαμβάνει προτάσεις που δηλώνουν σε ποιο σημείο της ιεραρχίας ανήκουν τα άτομα (πχ σχέσεις μεταξύ των ατόμων). Για παράδειγμα η πρόταση: ανήκει στο Τ-Box, ενώ η πρόταση: ανήκει στο A-Box. Κάθε υπάλληλος είναι ένας άνθρωπος Ο Κώστας είναι υπάλληλος Προσοχή πρέπει να δοθεί στο γεγονός πως ο διαχωρισμός μεταξύ Τ-Box και A-Box δεν είναι πάντα σαφής. Οι δύο προτάσεις δεν αντιμετωπίζονται διαφορετικά. Ο κύριος λόγος που έχουν εισαχθεί αυτές οι δύο έννοιες είναι γιατί ο διαχωρισμός είναι χρήσιμος όταν περιγράφουμε και διατυπώνουμε διαδικασίες αποφάσεων (decision procedures) για τα διάφορα DLs. Για παράδειγμα, ένα εργαλείο λογικής (reasoner) μπορεί να επεξεργαστεί το A-Box και το Τ-Box με διαφορετικές τεχνικές, κυρίως γιατί για διαφορετικά προβλήματα που χρειάζεται να εξαχθούν λογικά συμπεράσματα απαιτούνται και διαφορετικές είδους λύσεις, για παράδειγμα η κατηγοριοποίηση (classification) σχετίζεται με το Τ-Box, ενώ ο έλεγχος σωστής αντιστοίχησης των ατόμων στις έννοιες με το A-Box. Ένας άλλος λόγος είναι πως η πολυπλοκότητα και το μέγεθος του Τ-Box μπορούν να έχουν μεγάλη επίπτωση στην απόδοση μίας συγκεκριμένης εργασίας, ανεξάρτητα από το A-Box. Επιπροσθέτως οι DLs περιέχουν και έναν ονοματολογικό (terminological) και έναν δηλωτικό φορμαλισμό (assertional formalism). Τα ονοματολογικά αξιώματα χρησιμοποιούνται για να δηλώσουν συντομεύσεις για περίπλοκες περιγραφές. Για παράδειγμα θα μπορούσαμε να αντιστοιχίσουμε την παραπάνω έκφραση από το

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 25 παράδειγμα μας στην συντόμευση «HappyMan», ή ένα πιο εκφραστικό παράδειγμα θα ήταν ένας περιορισμός όπως ο: child.human Human που δηλώνει πως μόνο οι άνθρωποι μπορούν να αποκτήσουν παιδιά. Ένας δηλωτικός φορμαλισμός μπορεί να χρησιμοποιηθεί για να δηλώσει ιδιότητες ατόμων. Για παράδειγμα οι δηλώσεις: HappyMan(BOB), child(bob,mary) δηλώνουν πως ο Bob ανήκει στην έννοια HappyMan και πως η Mary είναι ένα από τα παιδιά του Bob. Τα DL συστήματα παρέχουν στους χρήστες τους τη δυνατότητα να εξάγουν ένα πλήθος συμπερασμάτων, από τη γνώση που κρύβεται σε ένα σαφές ορισμένο πεδίο γνώσης. Ο μηχανισμός που χρησιμοποιούν εφαρμόζει 3 διαφορετικούς τύπους αλγορίθμων: υπαγωγής, κατηγοριοποίησης και συνοχής. Ο αλγόριθμος υπαγωγής προσδιορίζει τις βασικές έννοιες και τη λογική του μοντέλου που μελετά. Για παράδειγμα το C υπάγεται στο D αν και μόνο αν όλα τα στοιχεία του C είναι αναγκαία και στοιχεία του D, δηλαδή το C πάντα εξετάζεται ως υποσύνολο του D. Αναφερόμενοι στο παράδειγμά μας ο ορισμός HappyMan υπάγεται στον child.professor, αφού όλα τα στοιχεία του HappyMan έχουν τουλάχιστον πέντε παιδιά, όλα από τα οποία είναι καθηγητές και συνεπώς έχουν ένα παιδί που είναι καθηγητής. Ο αλγόριθμος κατηγοριοποίησης των πραγματώσεων (instance algorithm) καθορίζει τις σχέσεις των ατόμων: η ατομική έννοια i ανήκει στην κλάση C, εάν-ν το i ερμηνεύεται πάντα ως στοιχείο του C. Για παράδειγμα, σύμφωνα με τα παραπάνω το άτομο Mary είναι ένα στοιχείο της έννοιας Professor. Ο αλγόριθμος συνοχής (consistency algorithm) εξακριβώνει αν ένα γνωσιολογικό μοντέλο, που αποτελείται από ένα σύνολο περιορισμών και ονοματολογικών αξιωμάτων είναι έγκυρο, δηλαδή πως δεν υπάρχουν δηλώσεις που αλληλοσυγκρούονται. Για παράδειγμα, αν είχαμε προσθέσει τον περιορισμό Professor(MARY) στο παράδειγμά μας, τότε το γνωσιακό μας μοντέλο θα είχε δηλώσεις που έρχονται σε αντιπαράθεση και δεν θα ήταν έγκυρο. Για να εξασφαλίσουμε μία λογική και προβλέψιμη συμπεριφορά ενός DL συστήματος, προβλήματα που προέρχονται από εξαγωγή συμπερασμάτων μέσω λογικής ανάλυσης (inference),όπως το παραπάνω, πρέπει να μπορούν να αναγνωριστούν από το σύστημά μας. Για να είναι δυνατόν αυτό πρέπει η περιγραφική δύναμη της γλώσσας που θα χρησιμοποιήσουμε να είναι περιορισμένη. Σε αυτό το σημείο χρειάζεται να επιδείξουμε προσοχή: αν οι περιορισμοί που θα υποβάλλουμε τη γλώσσα Περιγραφικής Λογικής είναι πολύ αυστηροί, σημαντικές έννοιες της εφαρμογής ίσως να μην είναι δυνατόν να εκφραστούν. Χρειάζεται λοιπόν, ένας συμβιβασμός μεταξύ εκφραστικής δύναμης και αποφυγής προβλημάτων λογικής ανάλυσης. Η αναζήτηση του καλύτερου συμβιβασμού για το εκάστοτε πρόβλημα είναι ένα από τα σημαντικότερα προβλήματα της DL έρευνας.

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 26 Διάφορα συστήματα Περιγραφικής Λογικής έχουν αναπτυχθεί (Pellet,FACT, RACE, DLP), τα οποία είναι ιδιαιτέρως περιγραφικά και έχουν καλή συμπεριφορά σε αρκετές εφαρμογές. ακόμα και σε μεγάλες γνωσιακές βάσεις. Στην συνέχεια περιγράφονται τα πιο διαδομένα από συστήματα αυτά. Σημείωση: Ο όρος έννοια (concept) στην Περιγραφική Λογική αναφέρεται ως κλάση (class) στην γλώσσα OWL, και ο όρος ρόλος (role) ως ιδιότητα (property). Εμείς αναφέρουμε και τους δύο όρους ανεξάρτητα από την γλώσσα που εξετάζουμε. 2.4.1 Reasoners - RacerPro Τα εργαλεία λογικής (Reasoners) χρησιμοποιούν την Περιγραφική Λογική για εξάγουν λογικά συμπεράσματα από τις οντολογίες. Παρακάτω θα εξετάσουμε τις δυνατότητες του εργαλείου RacerPro [17], [18] (Renamed A-Box and Concept Expression Reasoner Professional). To RacerPro μπορεί να επεξεργαστεί οντολογίες γραμμένες σε OWL Lite και OWL DL. Επίσης συμπεριλαμβάνει σε δοκιμαστικό στάδιο μία έκδοση της γλώσσας SWRL (Semantic Web Rule Language). Το RacerPro έχει τις παρακάτω δυνατότητες: Ελέγχει τη συνέπεια της OWL οντολογίας στην περιγραφή των δεδομένων. Ανακαλύπτει υποκλάσεις ήδη ορισμένων κλάσεων σύμφωνα με τον ορισμό της οντολογίας. Ανακαλύπτει συνώνυμα για τους πόρους της οντολογίας, είτε αυτά αφορούν κλάσεις, είτε άτομα. Προσφέρει ένα open-source API (application programming interface) για τη δημιουργία επερωτήσεων μέσω ενός συστήματος OWL-QL επεξεργασίας ερωτημάτων για την επεξεργασία πληροφορίας που υπάρχει στα OWL κείμενα. Προσφέρει ένα HTTP Interface για την ανάκτηση πόρων που εισάγονται από τον Παγκόσμιο Ιστό (πρωτόκολλο βασισμένο σε XML). Προσφέρει την δυνατότητα να δίνει απαντήσεις σε διαδικασίες ανάκτησης πληροφορίας (information retrieval), για παράδειγμα να ανακτά τα n επόμενα αποτελέσματα μίας επερώτησης. Επίσης, το RacerPro υποστηρίζει μία έξυπνη μηχανή απάντησης ερωτημάτων, η οποία τα κατηγοριοποιεί με βάση την πολυπλοκότητά τους, εξυπηρετεί τα απλά ενώ στη συνέχεια δίνει στην εφαρμογή του χρήστη τη δυνατότητα να αποφασίσει αν θα υπολογιστούν και τα επόμενα. Μελλοντικές επεκτάσεις της OWL (OWL-E) ήδη υποστηρίζονται από το RacerPro, καθώς και τροποποιημένους περιορισμούς στον αριθμό των στοιχείων ως μία επέκταση της OWL DL.

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 27 To RacerPro είναι ένα σύστημα αναπαράστασης της γνώσης (knowledge representation system) που χρησιμοποιεί ένα βελτιστοποιημένο αλγόριθμο για πολύ εκφραστικές γλώσσες Περιγραφικής Λογικής. Το σύστημα προσφέρει υπηρεσίες εξαγωγής λογικών συμπερασμάτων για ένα πλήθος T-Boxes καθώς και A-Boxes, υλοποιώντας την περιγραφική λογική SHIQ [12]. Δεδομένου ενός T-Box, ένας μεγάλος αριθμός ερωτημάτων μπορεί να απαντηθεί, ανάλογα με τη σημασιολογική λογική της γλώσσας αναπαράστασης. Υπάρχει ένα πλήθος διαφορετικών ερωτημάτων που μπορούν να οριστούν ως προβλήματα εξαγωγής λογικών συμπερασμάτων, όπως: η επικύρωση της συνέπειας του μοντέλου εννοιών, η εύρεση των ασαφών όρων το T-Box, έλεγχος του A-Box με βάση του T-Box κ.α. Σχήμα 2-6: Αναπαράσταση της ιεραρχίας των ιδιοτήτων του T-Box στο RacerPorter. Το RacerPro παρέχει και άλλες σημασιολογικές γλώσσες επερωτήσεων (nrql, new Racer Query Language), οι οποίες υποστηρίζουν την πλειονότητα των παραπάνω χαρακτηριστικών. Επίσης υποστηρίζει ειδικές δυνατότητες για επερωτήσεις στην γλώσσα OWL οι οποίες έχουν ενσωματωθεί στη γλώσσα nrql. Η γλώσσα επερωτήσεων OWL-QL [26] αποτελεί πρόταση του W3C και έχει βασιστεί σε μεγάλο βαθμό στη γλώσσα nrql.

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 28 Σχήμα 2-7: Εμφάνιση στο Protégé των σχέσεων που προκύπτουν από επαγωγή από τον υπολογισμό του RacerPro. 2.4.2 Reasoners Pellet Αν και ο RacerPro reasoner παρέχει πολλές δυνατότητες, έχει δύο βασικά μειονεκτήματα. Α) Είναι εμπορικό προϊόν (παρέχεται όμως ελεύθερα η άδεια για ακαδημαϊκή χρήση, η οποία όμως και πρέπει να ανανεώνεται κάθε εξάμηνο). Β) Η επικοινωνία με το σημασιολογικό ΑΡΙ (Jena) που χρησιμοποιήσαμε παρέχεται μόνο μέσο ενός DIG Interface [37] το οποίο θέτει κάποιους περιορισμούς στα ερωτήματα που μπορούν να διαμορφωθούν. Ο Pellet Reasoner [25] από την άλλη παρέχει εκτός από το DIG interface και ένα interface επικοινωνίας το οποίο δεν θέτει τους περιορισμούς του DIG και είναι ο reasoner που συνίσταται από τους δημιουργούς του Jena, ενός από τα πιο διαδεδομένα σημασιολογικά APIs. Οι δυνατότητες του Pellet περιγράφονται παρακάτω: Επιτρέπει την ανάλυση και επιδιόρθωση της οντολογίας. H OWL-DL επιτρέπει την ύπαρξη κάποιων κανόνων που έχουν σκοπό να εξασφαλίσουν τη λογική συνοχή της οντολογίας. Το Pellet μπορεί να ελέγξει την εγκυρότητα των κανόνων αυτών και έτσι να «διορθώσει» την οντολογία. Υποστηρίζει την εξαγωγή συμπερασμάτων με βάση την συνεπαγωγή. Υποστηρίζει αλγόριθμους που βελτιώνουν την ταχύτητα των ερωτημάτων. Οι αλγόριθμοι έχουν ως σκοπό να μειώσουν τον αριθμό των ελέγχων εγκυρότητας που απαιτούνται, οδηγώντας έτσι σε ταχύτερα αποτελέσματα.

Εικονομία Σύστημα Σημασιολογικής Περιγραφής και Αναζήτησης Δεδομένων Έργων Βυζαντινής Τέχνης 29 Επιτρέπει reasoning σε δεδομένα τύπου datatype. Η γλώσσα XML, περιέχει ένα πλούσιο λεξιλόγιο που συμπεριλαμβάνει αλφαριθμητικά, ακεραίους και αριθμούς κινητής υποδιαστολής και τύπους ημερομηνίας και ώρας. Το Pellet μπορεί να θέσει περιορισμούς στα παραπάνω δεδομένα και να ελέγξει την εγκυρότητά τους. Επιτρέπει την εξαγωγή συμπερασμάτων από πολλαπλές οντολογίες με τη βοήθεια της γλώσσας αναπαράστασης γνώσης E-Connections. Υποστηρίζει την εύρεση, όχι μόνο των μη έγκυρων κλάσεων, αλλά και των εσφαλμένων αξιωμάτων ή υπερκλάσεων στην οντολογία που προκαλούν την ασάφεια. Αρχιτεκτονική του Pellet: H αρχιτεκτονική του Pellet φαίνεται στο Σχήμα 2-8. Ο πυρήνας του είναι το ταμπλό εξαγωγής συμπερασμάτων που ελέγχει τη σαφήνεια του γνωσιολογικού μοντέλου, δηλαδή το ζεύγος A-Box και Τ-Βοχ. Ο reasoner έχει τη δυνατότητα να ελέγχει τη σαφήνεια των δεδομένων. Οι οντολογίες OWL φτάνουν στον reasoner μετά από μια φάση επικύρωσης του τύπου τους και επιδιόρθωσης αυτών. Όσο ο reasoner φορτώνει την οντολογία τα αξιώματα για τις κλάσεις τοποθετούνται στο T-Box, ενώ η πληροφορία για τα instances αποθηκεύεται στο A-Box. Τα αξιώματα του T-Box οδηγούνται στον DL προ-επεξεργαστή πριν οδηγηθούν στον βασικό επεξεργαστή. Ο θεμελιώδης επεξεργαστής έχει μόνο την δυνατότητα να ελέγχει την εγκυρότητα του A- Box με βάση ένα T-Box. Όλες οι υπόλοιπες διεργασίες εξαγωγής συμπερασμάτων μπορούν να μετασχηματιστούν με την βοήθεια του SPI (System Programming Interface) σε ελέγχους εγκυρότητας. Υπάρχουν τρεις τύποι διασύνδεσης με άλλες εφαρμογές: α) Υπάρχει το DIG Interface, β) το Jena Interface και το γ)owl-api Applications interface. Σχήμα 2-8: Αρχιτεκτονική του Pellet.