Παραδοτέο Π1.2 Νέες τεχνολογίες αναπαράστασης και στοίχισης οντολογιών

Σχετικά έγγραφα
Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

Μάθημα: Δ3. Δίκτυα Γνώσης και Σημασιολογικός Ιστός. Διάλεξη 02 & 03. Δρ. Γεώργιος Χρ. Μακρής

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΔΙΑ ΒΙΟΥ ΜΑΘΗΣΗΣ & ΘΡΗΣΚΕΥΜΑΤΩΝ

Μάθημα: Δ3. Δίκτυα Γνώσης και Σημασιολογικός Ιστός. Διάλεξη 01 & 02. Δρ. Γεώργιος Χρ. Μακρής

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

Οντολογίες και περιγραφικές λογικές

Σχεδιασµός Ανάπτυξη Οντολογίας

ΠΡΟΔΙΑΓΡΑΦΕΣ - ΟΔΗΓΙΕΣ ΔΙΑΜΟΡΦΩΣΗΣ ΘΕΜΑΤΩΝ ΓΙΑ ΤΟ ΜΑΘΗΜΑ

Περιεχόμενα 1 Πρωτοβάθμια Λογική Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά και Πληροφορικής Μαθηματικά Πανεπιστήμιο ΙΙ Ιωαννίνων ) / 60

Περιγραφικές Λογικές. Αναπαράσταση γνώσης στο Σημασιολογικό Ιστό. Γ. Στάμου

Προβλήματα, αλγόριθμοι, ψευδοκώδικας

ΔΙΑΧΕΙΡΙΣΗ ΥΔΑΤΙΚΩΝ ΠΟΡΩΝ

Π3.1 ΣΧΕΔΙΟ ΑΞΙΟΛΟΓΗΣΗΣ

Περιγραφικές Λογικές. Αλγόριθμοι αυτόματης εξαγωγής συμπερασμάτων. Γ. Στάμου

P-Μiner : ιαχείριση Πυλών Καταλόγων (Portals) µε Υποστήριξη ιαδικασιών Εξόρυξης εδοµένων Χρήσης

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3

Αυτόματη συλλογιστική σε οντολογίες

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΥΠΟΛΟΓΙΣΤΩΝ

Ψευδοκώδικας. November 7, 2011

Επαγωγικός Λογικός Προγραμματισμός και Aσαφείς Λογικές Περιγραφής

Παραδοτέο Π2.2 Υπηρεσία σημασιολογικής αντιστοίχισης

Διαχείριση Πολιτισμικών Δεδομένων

Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων Ι Σύνολο- Περιεχόμενο Μαθήματος

ΕΡΩΤΗΣΕΙΣ ΚΛΕΙΣΤΟΥ Ή ΑΝΤΙΚΕΙΜΕΝΙΚΟΥ ΤΥΠΟΥ

Description Logics. Γεώργιος Χρ. Μακρής MSc, MEd

Γεώργιος Φίλιππας 23/8/2015

4.4 Μετατροπή από μία μορφή δομής επανάληψης σε μία άλλη.

Σου προτείνω να τυπώσεις τις επόμενες τέσσερις σελίδες σε ένα φύλο διπλής όψης και να τις έχεις μαζί σου για εύκολη αναφορά.

Εισαγωγή στις Περιγραφικές Λογικές

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ

ΕΙΔΗ,ΤΕΧΝΙΚΕΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΑ ΠΡΟΓΡΑΜΜΑΤΙ- ΣΜΟΥ

ΕΝΙΑΙΟ ΠΛΑΙΣΙΟ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ

Εθνικό Μετσόβιο Πολυτεχνείο. Βελτιστοποιημένοι Αλγόριθμοι Επαναγραφής Ερωτημάτων για Εκφραστικές Περιγραφικές Λογικές

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ & ΕΠΙΧΕΙΡΗΣΕΩΝ

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Ενότητα 1: Εισαγωγή στις Βάσεις Δεδομένων. Αθανάσιος Σπυριδάκος Διοίκηση Επιχειρήσεων

ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: ΣΥΓΓΡΑΦΕΑΣ:

Παραδοτέο Π.2.1. Υπερχώρος και διαχείριση μοντέλων

ΕΙΔΗ ΕΡΕΥΝΑΣ I: ΠΕΙΡΑΜΑΤΙΚΗ ΕΡΕΥΝΑ & ΠΕΙΡΑΜΑΤΙΚΟΙ ΣΧΕΔΙΑΣΜΟΙ

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Εισαγωγικές Έννοιες. ημήτρης Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Εθνικό Μετσόβιο Πολυτεχνείο

Εννοιολογική Ομοιογένεια

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Λογική. Δημήτρης Πλεξουσάκης

Παραδοτέο Π5.4. Διαχείριση Δικαιωμάτων Διανοητικής Ιδιοκτησίας. (2 η έκδοση) ΔΡΑΣΗ ΕΘΝΙΚΗΣ ΕΜΒΕΛΕΙΑΣ «ΣΥΝΕΡΓΑΣΙΑ» «ΣΥΝΕΡΓΑΣΙΑ»

Περιεχόμενα. Ανάλυση προβλήματος. Δομή ακολουθίας. Δομή επιλογής. Δομή επανάληψης. Απαντήσεις. 1. Η έννοια πρόβλημα Επίλυση προβλημάτων...

Υπολογιστικό Πρόβληµα

ΙΑΤΡΟΛΕΞΗ. Neurosoft A.E. --- ΕΑΙΤΥ. ΓΓΕΤ, ΚτΠ, Πρόγραµµα «ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΩΝ, ΗΧΟΥ ΚΑΙ ΓΛΩΣΣΑΣ»

Aναπαράσταση Γνώσης στο Σημασιολογικό Ιστό

Τμήμα Μηχανικών Πληροφορικής ΤΕ Δυϊκότητα. Γκόγκος Χρήστος ΤΕΙ Ηπείρου Επιχειρησιακή Έρευνα. τελευταία ενημέρωση: 1/12/2016

Περιγραφή του εκπαιδευτικού/ μαθησιακού υλικού (Teaching plan)

Οι βασικές λειτουργίες (ή πράξεις) που γίνονται σε μια δομή δεδομένων είναι:

Συγγραφή ερευνητικής πρότασης

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΡΟΓΡΑΜΜΑΤΑ «ΑΝΤΑΓΩΝΙΣΤΙΚΟΤΗΤΑ & ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΤΗΤΑ» ΚΑΙ ΠΕΡΙΦΕΡΕΙΩΝ ΣΕ ΜΕΤΑΒΑΣΗ

Εισαγωγή στις Περιγραφικές Λογικές

Σημασιολογική διαχείριση μεταδεδομένων πολιτιστικού περιεχομένου ΜΑΡΘΑΣ Μ. ΙΜΠΡΙΑΛΟΥ Επιβλέπων:

Βάσεις δεδομένων. (4 ο μάθημα) Ηρακλής Βαρλάμης

Α. Ερωτήσεις Ανάπτυξης

ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ

Τεχνικές σχεδίασης προγραμμάτων, Προγραμματιστικά Περιβάλλοντα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Περιεχόμενα Ορισμός και λειτουργία των μηχανών Turing Θεωρία Υπολογισμού Ενότητα 20: Μηχανές Turing: Σύνθεση και Υπολογισμοί Επ. Καθ. Π. Κατσαρός Τμήμ

Κεφάλαιο 10 ο Υποπρογράµµατα

Μέθοδος Ελαχίστων Διαδρομών για τον αυτόματο καθορισμό του ορίου μαζών στη μαστογραφική απεικόνιση

Ενδεικτικές Ερωτήσεις Θεωρίας

nr.c ( (n+1)r.c) Όποτε αρκεί να αποδείξουμε την ισοδυναμία ενός εκ των δυο περιορισμών.

Σχεδιασμός Αρχιτεκτονικής

Μία μέθοδος προσομοίωσης ψηφιακών κυκλωμάτων Εξελικτικής Υπολογιστικής

ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0

5 η ΕΝΟΤΗΤΑ ΠΟΛΥΚΡΙΤΗΡΙΑΚΟΣ ΜΗ ΓΡΑΜΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

Ανάλυση της Ορθότητας Προγραμμάτων (HR Κεφάλαιο 4)

Λογική Δημήτρης Πλεξουσάκης Ασκήσεις στον Κατηγορηματικό Λογισμό Τμήμα Επιστήμης Υπολογιστών

ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι

Εκπαίδευση Ενηλίκων: Εμπειρίες και Δράσεις ΑΘΗΝΑ, Δευτέρα 12 Οκτωβρίου 2015

Περιεχόμενα. Ανάλυση προβλήματος. Δομή ακολουθίας. Δομή επιλογής. Δομή επανάληψης. Απαντήσεις. 1. Η έννοια πρόβλημα Επίλυση προβλημάτων...

Κατηγορηματικός Λογισμός (ΗR Κεφάλαιο )

Α2. Να γράψετε στο τετράδιο απαντήσεών σας το κατάλληλο τμήμα κώδικα, κάνοντας τις απαραίτητες αλλαγές σύμφωνα με την εκάστοτε εκφώνηση:

5. Απλή Ταξινόμηση. ομές εδομένων. Χρήστος ουλκερίδης. Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων

Έστω ένας πίνακας με όνομα Α δέκα θέσεων : 1 η 2 η 3 η 4 η 5 η 6 η 7 η 8 η 9 η 10 η

ΑΕΠΠ Ερωτήσεις θεωρίας

Θεωρητική προσέγγιση του Σημασιολογικού Ιστού στο χώρο της πολιτισμικής πληροφορίας: μία πρότυπη εφαρμογή στη βιβλιοθηκονομία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ Τμήμα Πληροφορικής και Τηλεπικοινωνιών

Αυτοματοποιημένη Επαλήθευση

ΑΚΕΡΑΙΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ & ΣΥΝΔΥΑΣΤΙΚΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΚΕΦΑΛΑΙΟ 1

Εργασία «Διαχείριση Δικτύων» Ιούνιος 2014, Θεσ/νίκη

Λογική. Φροντιστήριο 3: Συνεπαγωγή/Ισοδυναμία, Ταυτολογίες/Αντινομίες, Πλήρης Αλγόριθμος Μετατροπής σε CNF

Πληρότητα της μεθόδου επίλυσης

Δομές Δεδομένων & Αλγόριθμοι

Πρόσβαση σε δεδομένα με χρήση οντολογιών

4. Συντακτικό μιας γλώσσας είναι το σύνολο των κανόνων που ορίζει τις μορφές με τις οποίες μια λέξη είναι αποδεκτή.

Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας. 2 ο Μάθημα: Βασικά Θέματα Βάσεων Δεδομένων. Δρ. Κωνσταντίνος Χ.

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

2 ΟΥ και 7 ΟΥ ΚΕΦΑΛΑΙΟΥ

Εισαγωγή στα Πληροφοριακά Συστήματα

Σειρά Προβλημάτων 4 Λύσεις

A ΕΠΑ.Λ ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 5 η ΕΝΟΤΗΤΑ: ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Εκπαιδευτικοί: ΓΑΛΑΝΟΣ ΓΕΩΡΓΙΟΣ ΜΠΟΥΣΟΥΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ

Transcript:

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΔΙΑ ΒΙΟΥ ΜΑΘΗΣΗΣ & ΘΡΗΣΚΕΥΜΑΤΩΝ ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΡΟΓΡΑΜΜΑΤΑ «ΑΝΤΑΓΩΝΙΣΤΙΚΟΤΗΤΑ & ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΤΗΤΑ» ΚΑΙ ΠΕΡΙΦΕΡΕΙΩΝ ΣΕ ΜΕΤΑΒΑΣΗ ΕΘΝΙΚΟ ΣΤΡΑΤΗΓΙΚΟ ΠΛΑΙΣΙΟ ΑΝΑΦΟΡΑΣ ΕΣΠΑ 2007-2013 Παραδοτέο Π1.2 Νέες τεχνολογίες αναπαράστασης και στοίχισης οντολογιών Κωδικός Έργου: 09ΣΥΝ-72-922 Τίτλος του Έργου: IS-HELLEANA - Intelligent System for HELLEnic Audiovisual National Aggregator ΕΥΦΥΕΣ ΣΥΣΤΗΜΑ ΣΗΜΑΣΙΟΛΟΓΙΚΗΣ ΕΝΟΠΟΙΗΣΗΣ ΚΑΙ ΑΝΑΔΕΙΞΗΣ TΟΥ ΕΛΛΗΝΙΚΟΥ ΟΠΤΙΚΟΑΚΟΥΣΤΙΚΟΥ ΑΠΟΘΕΜΑΤΟΣ ΔΡΑΣΗ ΕΘΝΙΚΗΣ ΕΜΒΕΛΕΙΑΣ «ΣΥΝΕΡΓΑΣΙΑ» ΕΥΡΩΠΑΪΚΗ ΕΝΩΣΗ ΕΥΡΩΠΑΪΚΟ ΤΑΜΕΙΟ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΑΝΑΠΤΥΞΗΣ Υπουργείο Παιδείας, Δια Βίου Μάθησης και Θρησκευμάτων ΓΓΕΤ ΕΥΔΕ-ΕΤΑΚ (Ε. Π. Ανταγωνιστικότητα και Επιχειρηματικότητα (ΕΠΑΝ ΙΙ), ΠΕΠ Μακεδονίας Θράκης, ΠΕΠ Κρήτης και Νήσων Αιγαίου, ΠΕΠ Θεσσαλίας Στερεάς Ελλάδας Ηπείρου, ΠΕΠ Αττικής)

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ 1 Εισαγωγή... 3 2 Οντολογίες πάνω από βάσεις δεδομένων... 4 3 Περιγραφικές λογικές... 5 3.1 Κλασικές περιγραφικές λογικές... 5 3.2 Ασαφείς περιγραφικές λογικές... 5 3.2.1 Ασαφής DL-Lite... 6 4 Αντιστοίχιση οντολογιών... 6 5 Απάντηση ερωτημάτων με χρήση οντολογιών... 9 5.1Απάντηση ερωτημάτων σε οντολογίες περιγραφικών λογικών... 9 5.1.1 Επανεγγραφή ερωτημάτων... 10 5.1.2 Επανεγγραφή με τη μέθοδο της ανάλυσης... 10 5.2 Ασαφής απάντηση ερωτημάτων με χρήση οντολογιών... 11 5.2.1 Απάντηση ερωτημάτων με ασαφείς περιγραφικές λογικές... 12 5.2.2 Απάντηση ερωτημάτων με χρήση ασαφών αντιστοιχίσεων... 12 5.2.3 Επικύρωση αντιστοιχίσεων... 14 6 Συμπεράσματα... 15 7 Βιβλιογραφία... 16

1 Εισαγωγή Βασικός στόχος του παρόντος έργου είναι η διάθεση της πληροφορίας που συνοδεύει το οπτικοακουστικό υλικό ώστε να είναι εφικτή η αξιοποίησή της στα πλαίσια των υπηρεσιών ενοποιημένης αναζήτησης. Προκειμένου να επιτευχθεί ο στόχος του έργου χρησιμοποιούνται τεχνολογίες οντολογιών που αποδίδουν σημασιολογικό περιεχόμενο στα δεδομένα που συνοδεύουν το οπτικοακουστικό υλικό. Η σύνδεση των μεταδεδομένων με την οντολογική γνώση εξασφαλίζει υψηλά επίπεδα διαλειτουργικότητας και αποδοτικές υπηρεσίες σύνθετης αναζήτησης. Δεδομένου ότι το οπτικοακουστικό υλικό συλλέγεται συνήθως από αρκετές πηγές και διαφορετικούς φορείς, οι οποίοι είναι πιθανόν να ακολουθούν διαφορετικά πρότυπα περιγραφής για τα μεταδεδομένα, υπάρχει ανομοιομορφία στον τρόπο περιγραφής τους. Προκειμένου να επιλύσουμε το συγκεκριμένο πρόβλημα και να λάβουμε υπόψιν τους διαφορετικούς τρόπους αναπαράστασης και οργάνωσης των δεδομένων, εκμεταλλευόμαστε ένα σύνολο οντολογιών κάθε μία από τις οποίες μοντελοποιεί τη γνώση διαφορετικού πεδίου. Οι οντολογίες στη συνέχεια συνενώνονται σε ένα δίκτυο που περιγράφει με ενιαίο τρόπο τη διαθέσιμη πληροφορία και καθιστά εφικτή την ενοποιημένη αναζήτηση στα πλαίσια του έργου. Επιπλέον, υπάρχει η δυνατότητα μελλοντικής επέκτασης του σχήματος με πρόσθετες οντολογίες για την περιγραφή νέας πληροφορίας που σχετίζεται με το πεδίο της εφαρμογής. Απαραίτητη προϋπόθεση για την κατασκευή του δικτύου και την ενοποιημένη περιγραφή των δεδομένων είναι η αντιστοίχιση των επιμέρους οντολογιών του. Με αυτό τον τρόπο το δίκτυο είναι δυνατό να αντιμετωπιστεί σαν ένα ενιαίο σχήμα βάσει του οποίου υποστηρίζονται υπηρεσίες σύνθετης αναζήτησης που ξεφεύγουν από τη λογική της απλής ανάκτησης δεδομένων. Πράγματι, σκοπός της εφαρμογής που αναπτύσσεται στα πλαίσια του παρόντος έργου είναι η παροχή υπηρεσιών που θα επιτρέπουν τη διατύπωση σύνθετων ερωτημάτων χρησιμοποιώντας την ορολογία των οντολογιών. Η ανάκτηση των απαντήσεων σε εφαρμογές αυτού του είδους εξασφαλίζεται με την αντιστοίχιση των διαθέσιμων δεδομένων με τις έννοιες που περιγράφονται στο σχήμα του δικτύου. Στην παρούσα εργασία παρουσιάζουμε τους πιθανούς τρόπους σύνδεσης διαφορετικών οντολογιών μεταξύ τους, ώστε να συνθέσουν ένα ενιαίο σχήμα για την περιγραφή της διαθέσιμης βάσης δεδομένων. Στη συνέχεια, παρουσιάζουμε τον τρόπο σύνδεσης των δεδομένων με τις οντολογίες ώστε να καθίσταται εφικτή η ανάκτηση των απαντήσεων από τα συστήματα αναζήτησης. Για το σκοπό αυτό εξηγούμε τη χρησιμότητα των οντολογιών στην περιγραφή της γνώσης ενός πεδίου, καθώς και τον τρόπο που μπορούν να αξιοποιηθούν για τη διατύπωση εκφραστικών ερωτημάτων που αφορούν στα δεδομένα που περιγράφουν. Σελίδα 3 από 18

2 Οντολογίες πάνω από βάσεις δεδομένων Ο Σημασιολογικός Ιστός [1] αποτελεί εξέλιξη του παγκόσμιου ιστού [2], όπου η πληροφορία δομείται με τρόπο κατανοητό στις μηχανές που επιτρέπει την απόδοση σημασιολογικού περιεχομένου και την αυτοματοποιημένη επεξεργασία τους από τα συστήματα του διαδικτύου. Σε αυτό το πλαίσιο, οι οντολογίες κατέχουν εξέχουσα θέση, καθώς παρέχουν ένα λεξιλόγιο συνοδευόμενο από μία γραμματική για την περιγραφή των εννοιών και των σχέσεων μεταξύ τους που επιτρέπει την αναπαράσταση της γνώσης του πεδίου ενδιαφέροντος με τυπικό, μαθηματικό τρόπο. Δεδομένου ότι η πληροφορία που είναι διαθέσιμη στο διαδίκτυο είναι αποθηκευμένη κατά κύριο λόγο σε βάσεις δεδομένων, η χρήση των οντολογιών για την επέκταση του σχήματος της βάσης και τη σημασιολογική περιγραφή των αποθηκευμένων δεδομένων είναι πλέον μια προσέγγιση με ιδιαίτερο ενδιαφέρον, γνωστή ως πρόσβαση σε δεδομένα μέσω οντολογίας (Ontology Based Data Access) [3,4]. Η πρόσβαση σε δεδομένα με χρήση οντολογιών διευκολύνει τη διαχείριση μεγάλου όγκου πληροφορίας παρέχοντας υπηρεσίες σύνθετης σημασιολογικής αναζήτησης και αποτελεί αντικείμενο έρευνας πολλών σύγχρονων εφαρμογών [5,6,7]. Μία οντολογία σχετίζεται με μία βάση δεδομένων προκειμένου να περιγράψει τη γνώση του σχετικού πεδίου ενδιαφέροντος, ενώ την ίδια στιγμή καθιστά εφικτό τον έλεγχο των δεδομένων ώστε αυτά να δομούνται σύμφωνα με το σχήμα της βάσης. Για παράδειγμα, τα αξιώματα μιας οντολογίας που προσδιορίζουν το πεδίο τιμών ή ορισμού μίας σχέσης είναι δυνατό να χρησιμοποιηθούν για τον έλεγχο της ορθής εισαγωγής των δεδομένων. Έτσι, η οντολογία πάνω από μία βάση δεδομένων που περιλαμβάνει για παράδειγμα ταινίες είναι εύλογο να περιγράφει ένα αξίωμα το οποίο διασφαλίζει ότι κάθε ταινία που εισάγεται στη βάση συνοδεύεται από δεδομένα για τον τίτλο και την ημερομηνία παραγωγής της. Το αξίωμα ερμηνεύεται ως μία συνθήκη που πρέπει να είναι αληθής προκειμένου να μην παραβιάζεται η συνέπεια των δεδομένων σε σχέση με την οντολογία. Η δυνατότητα επαλήθευσης της συνέπειας των δεδομένων που εισάγονται στη βάση είναι ιδιαίτερα σημαντική στα πλαίσια της εφαρμογής που εξετάζουμε. Ο λόγος είναι ότι με αυτόν τον τρόπο καθίσταται δυνατή η επέκταση της βάσης με στέρεο τρόπο με μεταδεδομένα από νέο πρωτογενές υλικό, καθώς και με επιπλέον πληροφορία που προκύπτει από τις βάσεις που είναι διαθέσιμες στο διαδίκτυο. Πέρα όμως από τη χρησιμότητα των οντολογιών κατά την εισαγωγή των δεδομένων στη βάση, η σημαντική συνεισφορά τους σχετίζεται με την απόδοση σημασιολογικού περιεχομένου στα δεδομένα γεγονός που επιτρέπει την επεξεργασία τους και τη διατύπωση σύνθετων και εκφραστικών ερωτημάτων που ξεφεύγει από τα πλαίσια της απλής ανάκτησης δεδομένων. Έτσι, μπορούμε για παράδειγμα, εκμεταλλευόμενοι τη γνώση που παρέχει η οντολογία που περιγράφει το σχήμα της βάσης, να αναζητήσουμε ταινίες που έχουν συγκεκριμένα χαρακτηριστικά όπως είναι το ίδιο όνομα σκηνοθέτη και πλάνα από κάποια συγκεκριμένη πόλη. Προκειμένου μία οντολογία να περιγράφει τα δεδομένα στη βάση πρέπει να υπάρχει συσχέτιση των εννοιών της με τους πίνακες της βάσης. Κάτι τέτοιο επιτυγχάνεται με τη σαφή αντιστοίχιση εννοιών με πίνακες, ώστε για κάθε νέα εισαγωγή δεδομένων να γίνεται ο σχετικός έλεγχος που υπαγορεύει το αξίωμα της οντολογίας στο οποίο συμμετέχουν οι αντίστοιχες έννοιες. Έτσι για παράδειγμα, όταν εισάγεται μία νέα ταινία στη βάση δεδομένων γίνεται έλεγχος εάν ενημερώθηκαν οι πίνακες που σχετίζονται με τον τίτλο και την ημερομηνία παραγωγής ώστε να ικανοποιείται το αξίωμα που περιγράφει ότι όλες οι ταινίες πρέπει συνοδεύονται από τίτλο και ημερομηνία παραγωγής. Επιπλέον, κατά την εκτέλεση ενός εκφραστικού ερωτήματος που διατυπώνεται κάνοντας χρήση του λεξιλογίου της οντολογίας, η ανάκτηση των δεδομένων πραγματοποιείται σύμφωνα με την αντιστοίχιση των εννοιών με τους πίνακες της βάσης. Για παράδειγμα, έστω ότι χρησιμοποιώντας το λεξιλόγιο της οντολογίας διατυπώνουμε το ερώτημα Q(x) Actor(Actor_Name), PlaysIn(Actor_Name,y) για να αναζητήσουμε όλες τις ταινίες στις οποίες εμφανίζεται ο συγκεκριμένος ηθοποιός Actor_Name. Η ανάκτηση των απαντήσεων του ερωτήματος θα γίνει από τους πίνακες της βάσης που αντιστοιχίζονται στην έννοια Actor και το ρόλο PlaysIn. Πριν περιγράψουμε τις μεθόδους απάντησης ερωτημάτων με βάση οντολογίες παρουσιάζουμε στις επόμενες ενότητες το απαραίτητο θεωρητικό υπόβαθρο για την περιγραφή του προβλήματος και τα αποτελέσματα της σχετικής έρευνας στο χώρο. Σελίδα 4 από 18

3 Περιγραφικές λογικές 3.1 Κλασικές περιγραφικές λογικές Οι Περιγραφικές Λογικές (ΠΛ) [8] αποτελούν το θεωρητικό υπόβαθρο για πολλά φράγματα της γλώσσας OWL [9] που χρησιμοποιείται κατά κόρον στην περιγραφή των δεδομένων σε σύγχρονες εφαρμογές του Σημασιολογικού Ιστού. Μάλιστα, υπάρχει άμεση συσχέτιση μεταξύ της συναρτησιακής σύνταξης της OWL και της σύνταξης των περιγραφικών λογικών [10, 11]. Αποτελούν ένα εκφραστικό και εύρωστα αποφασίσιμο υποσύνολο της Λογικής Πρώτης Τάξης [12]. To αλφάβητό τους αποτελείται από τα άτομα, τις ατομικές έννοιες και τους ατομικούς ρόλους. Επιπλέον, το αλφάβητό τους διαθέτει τους κατασκευαστές με τους οποίους οι ατομικές έννοιες συνδυάζονται για να περιγράψουν σύνθετες έννοιες. Το σύνολο των κατασκευαστών που υποστηρίζει η ΠΛ καθορίζει την εκφραστικότητά της. Μια από τις πιο βασικές γλώσσες Περιγραφικής Λογικής είναι η ALC [13] που υποστηρίζει το σύνολο των κατασκευαστών {,,, }. Η σύνταξη της ALC ορίζεται: A A C D R.C R., όπου A είναι μία ατομική έννοια, R ένας ατομικός ρόλος, C, D σύνθετες έννοιες, είναι η καθολική έννοια και είναι η κενή έννοια. Έτσι για παράδειγμα, αν θεωρήσουμε την ατομική έννοια Ηθοποιός, και τον ρόλο έχειρόλο μπορούμε να περιγράψουμε τον ηθοποιό που παίζει σε κάποια ταινία με τη σύνθετη έννοια Ηθοποιός έχειρόλο. Η εκφραστικότητα της γλώσσας αυξάνεται καθώς αυξάνεται και το πλήθος των κατασκευαστών που διαθέτει. Οι ΠΛ πέρα από την περιγραφή σύνθετων εννοιών προσδιορίζουν και τις σχέσεις μεταξύ τους. Για παράδειγμα, μπορούμε να περιγράψουμε ότι ο πρωταγωνιστής μιας ταινίας είναι ηθοποιός με το αξίωμα υπαγωγής Πρωταγωνιστής Ηθοποιός. Οι σχέσεις μεταξύ των εννοιών με τη μορφή αξιωμάτων συνθέτουν το σώμα ορολογίας ή αλλιώς TBox (Terminological Box). Οι ΠΛ επιτρέπουν επίσης να καθορίσουμε τις σχέσεις ανάμεσα σε άτομα και έννοιες ή ρόλους με τους ισχυρισμούς (assertions). Έτσι, δηλώνουμε ότι ο 'α' είναι ηθοποιός με τον ισχυρισμό Ηθοποιός(α). Το σύνολο των ισχυρισμών ορίζει το σω μα ισχυρισμω ν (assertional component) ή αλλιώς ABox (Assertion Box) μιας ΠΛ. Το σώμα ορολογίας Tbox, μαζί με το σώμα ισχυρισμών Abox, αποτελούν μια Βάση Γνώσης (ΒΓ) (Knowledge Base KB) που περιγράφει ένα συγκεκριμένο επιστημονικό πεδίο ή εφαρμογή. Το σώμα ορολογίας TBox αναφέρεται και ως οντολογία (ontology). Η σημασιολογία μιας γλώσσας ΠΛ δίνεται από την ερμηνεία (interpretation) της I, επί ενός πεδίου I. Μία ερμηνεία αντιστοιχίζει τα άτομα σε αντικείμενα του πεδίου I, τις έννοιες σε υποσύνολά του και τους ρόλους σε σύνολα από ζεύγη αντικειμένων του πεδίου. Η καθολική έννοια αντιστοιχίζεται στο I και η κενη έννοια στο κενό σύνολο. Τα αξιώματα και οι ισχυρισμοί ερμηνεύονται με τον προφανή τρόπο. Επομένως, για παράδειγμα το αξίωμα Πρωταγωνιστής Ηθοποιός δηλώνει ότι οι πωταγωνιστές είναι υποσύνολο του συνόλου των ηθοποιών (Πρωταγωνιστής Ηθοποιός) Ι = (Πρωταγωνιστής) Ι (Ηθοποιός) Ι. Ομοίως, σύμφωνα με την ερμηνεία ενός ισχυρισμού Ηθοποιός(α) το αντικείμενο α Ι ανήκει στο σύνολο Ηθοποιός Ι. Μια ερμηνεία που ικανοποιεί όλα τα αξιώματα του TBox καθώς και όλους τους ισχυρισμούς του ABox λέγεται μοντέλο (model) της βάσης γνώσης. Παρά την υψηλή τους εκφραστικότητα οι γλώσσες περιγραφικής λογικής στα πλαίσια ορισμένων εφαρμογών έχουν περιορισμούς και πιο συγκεκριμένα, δεν είναι σε θέση να αναπαραστήσουν ασαφή γνώση η οποία περιγράφεται από τις Ασαφείς Περιγραφικές Λογικές [14,15]. 3.2 Ασαφείς περιγραφικές λογικές Στην ενότητα αυτή παρουσιάζουμε μια επέκταση των κλασικών περιγραφικών λογικών. Η επέκταση αφορά στην ενσωμάτωση ενός πραγματικού αριθμού στους ισχυρισμούς του σώματος ισχυρισμών, ο οποίος αποδίδει κάποιο βαθμό ασάφειας. Η γλώσσα αναπαράστασης που περιγράφουμε ονομάζεται f (fuzzy)-πλ και βασίζεται στα ασαφή σύνολα και την ασαφή λογική [16]. Σελίδα 5 από 18

Οι ασαφείς περιγραφικές λογικές διαθέτουν ένα αλφάβητο που αποτελείται από ατομικές έννοιες, ατομικούς ρόλους και άτομα. Διαθέτουν επίσης κατασκευαστές ακριβώς όπως στην περίπτωση των κλασικών λογικών, ενώ η εκφραστικότητά τους καθορίζεται από το πλήθος των κατασκευαστών που υποστηρίζουν. Η βάση γνώσης σε γλώσσα ασαφούς περιγραφικής λογικής διαθέτει σώμα ορολογίας με αξιώματα, όπως στις κλασικές περιγραφικές λογικές, ενώ το σώμα ισχυρισμών διαφοροποιείται καθώς περιλαμβάνει ασαφείς ισχυρισμούς της μορφής C(a) n, R(a, b) n, όπου n [0, 1]. Η σημασιολογία μιας f-πλ βασίζεται στις ασαφείς ερμηνείες. Μια ασαφής ερμηνεία I είναι ένα ζευγάρι ( Ι, Ι) όπου το πεδίο ορισμού Ι ορίζεται, όπως στις κλασικές ΠΛ, και η συνάρτηση Ι είναι μια συνάρτηση ασαφούς ερμηνείας που αντιστοιχίζει ένα άτομο ο σε ένα αντικείμενο o Ι Ι, μία έννοια C σε μία συνάρτηση συμμετοχής C Ι : Ι [0, 1] και ένα ρόλο R σε μία συνάρτηση R Ι : Ι Ι [0, 1]. Οι σύνθετες έννοιες και ρόλοι καθώς και τα αξιώματα ερμηνεύονται επεκτείνοντας την ασαφή ερμηνεία, χρησιμοποιώντας ασαφείς θεωρητικούς τελεστές και έννοιες από τη βιβλιογραφία των ασαφών συνόλων. Τέλος, αναφέρουμε ότι όπως και στην περίπτωση των κλασικών περιγραφικών λογικών, μια ασαφής βάση γνώσης είναι ικανοποιήσιμη αν υπάρχει ασαφής ερμηνεία I που να ικανοποιεί όλα τα αξιώματά της. Στην επόμενη παράγραφο δίνουμε μια σύντομη περιγραφή της ασαφούς περιγραφικής λογικής f-dl-lite. 3.2.1 Ασαφής DL-Lite Στην ενότητα αυτή παραθέτουμε ως παράδειγμα ασαφούς περιγραφικής λογικής τη γλώσσα ασαφής-dl- Lite (f-dl-lite). Όπως είναι προφανές από το όνομά της, αποτελεί επέκταση της DL-Lite [17, 18] με ασαφείς ισχυρισμούς της μορφής C(a) n, R(a, b) n όπου C είναι το όνομα μιας έννοιας, R το όνομα ρόλου, a, b είναι άτομα, ενώ το n είναι ένας πραγματικός αριθμός με τιμές στο πεδίο [0,1]. Η σημασιολογία της γλώσσας ορίζεται στα πλαίσια των ασαφών ερμηνειών. Θεωρούμε την t νόρμα του Godel, t(a,b)=min(a,b), για την ερμηνεία των συζεύξεων, καθώς και την άρνηση του Lukasiewicz, c(a)=1-a. Τα αξιώματα υπαγωγής C B ερμηνεύονται με τη σχέση C Ι (a Ι ) B Ι (a Ι ) που υποδηλώνει ότι η συνάρτηση συμμετοχής κάθε στιγμιότυπου μίας έννοιας C πρέπει να είναι μικρότερη από τη συνάρτηση συμμετοχής του ίδιου στιγμιότυπου μιας έννοιας B. Αναλυτικά η σημασιολογία της f-dl-lite υπάρχει στο [19]. Σημαντικές περιπτώσεις συστημάτων που έχουν αναπτυχθεί ώστε να υποστηρίζουν ασαφείς περιγραφικές λογικές είναι το σύστημα FiRE [20] που υλοποιεί επεκτάσεις των αλγορίθμων tableaux, το σύστημα fuzzydl [21], καθώς και το DeLorean [22] σύστημα που μεταφράζει τις ασαφείς σε κλασικές περιγραφικές λογικές. 4 Αντιστοίχιση οντολογιών Στις σύγχρονες εφαρμογές όπου υπάρχει ανάγκη για αποτελεσματική διαχείριση και αναζήτηση μεγάλου όγκου πληροφορίας είναι ιδιαίτερα σύνηθες τα δεδομένα να προέρχονται από διαφορετικές πηγές και επομένως να περιγράφονται από διαφορετικές οντολογίες. Στις περιπτώσεις αυτές πρέπει να σημειωθεί και να αντιμετωπιστεί η ετερογένεια μεταξύ των οντολογιών. Πιο συγκεκριμένα, δύο οντολογίες που περιγράφουν ένα κοινό πεδίο ενδιαφέροντος ενδέχεται να δηλώνουν το ίδιο αντικείμενο-ολότητα με διαφορετικό τρόπο, για παράδειγμα ένα αντικείμενο περιγράφεται από μία μόνο έννοια στην πρώτη οντολογία, ενώ στη δεύτερη περιγράφεται από την ένωση δύο εννοιών. Μία άλλη περίπτωση ενδεικτική της ετερογένειας των οντολογιών είναι η χρήση διαφορετικής γλώσσας για την περιγραφή του ίδιου πεδίου. Προκειμένου να εξασφαλιστεί η διαλειτουργικότητα των οντολογιών είναι απαραίτητη η συσχέτιση των εννοιών που περιλαμβάνουν που επιτυγχάνεται με την (ημι-)αυτόματη αντιστοίχιση. Με τον τρόπο αυτό καθίσταται δυνατή η διατύπωση ερωτημάτων με βάση τις αντιστοιχίσεις, δηλαδή η διατύπωση ερωτήματος χρησιμοποιώντας τους όρους μίας οντολογίας και η ανάκτηση απαντήσεων από το δίκτυο οντολογιών που καθορίζεται από τις αντιστοιχίσεις. Προκειμένου να υποστηρίζεται η διατύπωση και η απάντηση ερωτημάτων σε εφαρμογές όπου τα δεδομένα συλλέγονται από διαφορετικές πηγές και άρα περιγράφονται από οντολογίες με διαφορετική ορολογία είναι απαραίτητο να ληφθεί υπόψιν η ετερογένεια των οντολογιών. Οι υπηρεσίες διαχείρισης των δεδομένων και Σελίδα 6 από 18

απάντησης ερωτημάτων είναι αποτελεσματικές μόνο εφόσον θεωρήσουν τις αντιστοιχίσεις μεταξύ των διαφορετικών οντολογιών αλλά και μεταξύ της οντολογίας και της βάσης δεδομένων [3]. Σε αυτό το πλαίσιο είναι φανερό ότι ανακύπτουν αρκετά προς επίλυση προβλήματα στα συστήματα που εκμεταλλεύονται δίκτυα οντολογιών. Ένα από τα σημαντικότερα προβλήματα σχετίζεται με τις ασυνέπειες που ενδέχεται να ανακύψουν κατά τη διαδικασία αντιστοίχισης, οι οποίες περιορίζουν την ανάκτηση των δεδομένων [23]. Ας θεωρήσουμε το επόμενο παράδειγμα, ώστε να καταστήσουμε το πρόβλημα περισσότερο κατανοητό. Δεδομένων δύο οντολογιών, έστω ότι η πρώτη περιλαμβάνει την έννοια ΦορητόςΥπολογιστής ενώ η δεύτερη περιγράφει του φορητούς υπολογιστές με επεξεργαστή τελευταίας γενιάς με την έννοια ΦορητόςΝέαςΓενιάς. Επιπλέον, η έννοια ΦορητόςΝέαςΓενιάς ορίζεται υποσύνολο της ΦθηνόςΥπολογιστής που είναι συμπληρωματική της ΑκριβόςΥπολογιστής. Ας θεωρήσουμε επίσης τις εξής αντιστοιχίσεις μεταξύ των οντολογιών: (ΦορητόςΥπολογιστής, ΦορητόςΝέαςΓενιάς, 0.6, ), (ΦορητόςΥπολογιστής, ΦθηνόςΥπολογιστής, 0.8, ), (ΦορητόςΥπολογιστής, ΑκριβόςΥπολογιστής, 0.4, ), όπου οι αριθμοί 0.6, 0.8, 0.4 ορίζουν το βαθμό στον οποίο οι έννοιες που αντιστοιχίζονται περιγράφουν πράγματι το ίδιο αντικείμενο, και η υπαγωγή προσδιορίζει τη σχέση μεταξύ των εννοιών που αντιστοιχίζονται. Σύμφωνα με τις αντιστοιχίσεις αυτές κάποιοι υπολογιστές που είναι φορητοί με βάση την πρώτη οντολογία είναι επίσης νέας γενιάς, φθηνοί και ακριβοί με βάση τη δεύτερη. Η συγκεκριμένη αντιστοίχιση ενδεχομένως να προκαλέσει την παραβίαση του αξιώματος ασυνέπειας, σύμφωνα με το οποίο ένας υπολογιστής δεν μπορεί να είναι ακριβός και φθηνός την ίδια στιγμή. Το πρόβλημα που περιγράφουμε οφείλεται στο γεγονός ότι οι τεχνικές αντιστοίχισης ενδέχεται να μην λαμβάνουν υπόψιν τη σημασιολογία των οντολογιών που συσχετίζονται. Επομένως, οι τελικές αντιστοιχίσεις δεν αντιμετωπίζονται ως σχέσεις με σημασιολογικό περιεχόμενο κάτι που αποτελεί απαραίτητη προϋπόθεση προκειμένου να πραγματοποιηθεί η συνένωση των οντολογιών και κατόπιν αυτής η απάντηση σε ερωτήματα επί του δικτύου των οντολογιών. Οι περισσότερες τεχνικές που έχουν προταθεί προς αυτή την κατεύθυνση λαμβάνουν υπόψιν μόνο τις αντιστοιχίσεις ανάμεσα στην οντολογία και το σχήμα της βάσης και εξετάζουν πώς επηρεάζεται η σημασιολογία κατά την απάντηση ερωτημάτων [23]. Μία διαφορετική προσέγγιση, την οποία θα παρουσιάσουμε σε επόμενη ενότητα, αφορά στην απόδοση βαθμού εμπιστοσύνης στους ισχυρισμούς που προκύπτουν από τη συνένωση οντολογιών λαμβάνοντας υπόψιν το βαθμό της κάθε αντιστοίχισης και κάνοντας χρήση της θεωρίας των ασαφών περιγραφικών λογικών. Η αντιστοίχιση οντολογιών αφορά στη διαδικασία εύρεσης συσχετίσεων μεταξύ των οντολογιών σε μία προσπάθεια να ξεπεραστεί η ετερογένεια και να εξασφαλιστεί η διαλειτουργικότητα. Αποτελεί βασική προυπόθεση για παροχή αξιόπιστων υπηρεσιών σε εφαρμογές χρησιμοποιούν κάποιο δίκτυο οντολογιών. Τυπικά το πρόβλημα μπορεί να οριστεί ως εξής: δεδομένων δύο οντολογιών που κάθε μια περιγράφει ένα σύνολο από διακριτά αντικείμενα ζητείται να βρεθούν οι σχέσεις (όπως ισοδυναμία ή υπαγωγή) που ισχύουν μεταξύ των αντικειμένων αυτών. Το συγκεκριμένο πρόβλημα έχει μελετηθεί ιδιαίτερα καταλήγοντας σε μία πληθώρα μεθόδων [24]. Συγκεκριμένα, έχουν προταθεί μέθοδοι αντιστοίχισης που βασίζονται στην ορολογία και συγκρίνουν τις ετικέτες των εννοιών της οντολογίας είτε με τεχνικές σύγκρισης συμβολοακολουθιών είτε με χρήση θησαυρών, μέθοδοι εσωτερικής δομής που συγκρίνουν την εσωτερική δομή των εννοιών, όπως είναι το πεδίο τιμών τους ή η πληθικότητα των χαρακτηριστικών τους, μέθοδοι εξωτερικής δομής που συγκρίνουν τις σχέσεις των εννοιών με άλλες στην ίδια οντολογία, μέθοδοι σημασιολογικής σύγκρισης που συγκρίνουν μοντέλα καθώς και πολλές άλλες. Επιπλέον, ιδιαίτερη προσπάθεια έχει γίνει στην ερευνητική κοινότητα ώστε να αναπτυχθούν εργαλεία που επιτρέπουν την αντιστοίχιση οντολογιών. Μερικά από τα πιο γνωστά εργαλεία αντιστοίχισης οντολογιών είναι το Alignment API [25], το σύστημα Chimaera [26] που πρόκειται για ένα περιβάλλον για τη συγχώνευση οντολογιών μεγάλης κλίμακας, το Cupid [27] που υλοποιεί ένα γενετικό αλγόριθμο αντιστοίχισης σχήματος που συνδυάζει γλωσσικές και δομικές τεχνικές αντιστοίχισης και υπολογίζει κανονικοποιημένους συντελεστές αντιστοίχισης με τη βοήθεια θησαυρού, το S-Match [28] που είναι σύστημα αντιστοίχισης οντολογιών το οποίο υλοποιεί μια τεχνική σημασιολογικής αντιστοίχισης που παρουσιάζεται στα [28, 29], το Coma [30], εργαλείο που υλοποιεί σύνθετους γενετικούς αλγορίθμους αντιστοίχισης, το Glue [31] που έχει ως στόχο την ημιαυτόματη αντιστοίχιση σχημάτων, το Bricks API [http://www.brickscommunity.org/] μία δομή που παρέχει γνώση και πληροφορία στον τομέα της πολιτιστικής κληρονομιάς, το Anchor-Prompt [32], ένα εργαλείο συγχώνευσης και αντιστοίχισης οντολογιών με μηχανισμό πιθανού ταιριάσματος όρων, IF-MAP [33] που είναι μια αυτόματη μέθοδος για αντιστοίχιση που βασίζεται στην θεωρία των Barwise-Seligman για ροή πληροφορίας [34], το T-tree [35] Σελίδα 7 από 18

που είναι ένα περιβάλλον για τη δημιουργία ιεραρχιών και κλάσεων από στιγμιότυπα και το Alimo [36] ένα σύστημα το οποίο δίνει ιδιαίτερη σημασία στα διαφορετικά μέρη του σχήματος μίας οντολογίας για την περιγραφή πολυμέσων και το H-Match [37] για δυναμική αντιστοίχιση οντολογιών σε επίπεδα διαφορετικού βάθους. Όλα τα ανωτέρω συστήματα επιστρέφουν αντιστοιχίσεις που προσδιορίζονται από ένα βαθμό εμπιστοσύνης. Οι αλγόριθμοι αντιστοίχισης πρωτίστως χρησιμοποιούν τις σχέσεις της ισοδυναμίας ή υπαγωγής θέλοντας έτσι να δηλώσουν ότι οι οντότητες που έχουν αντιστοιχιστεί είναι ίδιες ή ισοδύναμες ή ότι η μία υπάγεται στην άλλη. Στη σχέση που ορίζεται ανάμεσα σε δύο οντότητες ανατίθεται, όπως είδαμε και στο παράδειγμά μας, ένας βαθμός που αποτελεί το μέτρο εμπιστοσύνης ως προς την ισχύ της σχέσης. Έτσι, μία αντιστοίχιση που επιστρέφεται από ένα από τα παραπάνω εργαλεία που έχει τη μορφή C A: n ή εναλλακτικά (C, A, n, ) που υποδηλώνει ότι η έννοια C είναι ισοδύναμη με την έννοια A με βαθμό εμπιστοσύνης n. Επομένως, η αντιστοίχιση δύο οντολογιών O και O' ορίζεται ως το σύνολο των αντιστοιχίσεων για (πιθανώς) όλες τις οντότητες που ανήκουν στις O και O' αντίστοιχα. Σκοπός του συγκεκριμένου έργου είναι η ανάπτυξη ενός δικτύου οντολογιών με στόχο την υιοθέτηση ενός ενιαίου σχήματος για την περιγραφή δεδομένων που αφορούν στο διαθέσιμο οπτικοακουστικό υλικό. Οι επιμέρους οντολογίες του δικτύου αναμένεται να διαθέτουν αρκετά κοινά χαρακτηριστικά μιας και καλούνται να περιγράψουν εν μέρει παρόμοιου είδους μεταδεδομένα. Προκειμένου οι οντολογίες να μπορέσουν να ενταχθούν σε ένα κοινό δίκτυο θα πρέπει οι έννοιες και οι ρόλοι που ορίζουν να συσχετιστούν. Η ανομοιογένεια των οντολογιών και η ανάγκη για τη συσχέτισή τους γίνεται ακόμα περισσότερο αισθητή, εάν εκμεταλλευτούμε τις υπάρχουσες τεχνολογίες οντολογιών ώστε να συνδέσουμε τα δεδομένα της εφαρμογής με πληροφορία που είναι διαθέσιμη στο διαδίκτυο και περιγράφεται από άλλες οντολογίες. Όπως γίνεται κατανοητό από όλα τα παραπάνω, προκειμένου να προκύψει το ζητούμενο ενιαίο σχήμα είναι απαραίτητο οι περιγραφές των διαφορετικών οντολογιών να συνδεθούν μεταξύ τους ώστε να καθίσταται εφικτή η ενοποιημένη διαχείριση ολόκληρου του περιεχομένου του συστήματος. Προκειμένου να καταστήσουμε περισσότερο κατανοητή την ανάγκη για αντιστοίχιση των οντολογιών περιγράφουμε τον τρόπο με τον οποίο μπορούμε να αντιστοιχίσουμε τις οντολογίες του δικτύου της εφαρμογής μας στα πλαίσια του έργου. Όπως είναι προφανές, έννοιες διαφορετικών οντολογιών με κοινή σημασιολογία πρέπει να δηλωθούν ισοδύναμες, ενώ κατάλληλες δηλώσεις πρέπει να γίνουν για όσες έννοιες συσχετίζονται μέσω κάποιου ρόλου. Έτσι για παράδειγμα, έστω ότι το δίκτυο της εφαρμογής μας περιλαμβάνει την οντολογία ScriptOntology η οποία περιγράφει τους χαρακτήρες μιας ταινίας με κάποια έννοια MovieCharacter. Επιπλέον, έστω ότι το δίκτυο περιλαμβάνει την οντολογία extramovieontology η οποία χρησιμοποιεί την έννοια Character για τον ίδιο σκοπό. Οι δύο έννοιες πρέπει θα δηλωθούν ισοδύναμες μέσω κάποιας αντιστοίχισης. Γνωρίζουμε επίσης ότι η έννοια Character της extramovieontology συνδέεται με την έννοια Actor της οντολογίας MovieOntology του δικτύου μέσω του ρόλου isplayedby που συσχετίζει έναν ηθοποιό με το χαρακτήρα που υποδύεται. Από την αντιστοίχιση των εννοιών διαφορετικών οντολογιών προκύπτει νέα γνώση που πρέπει να συμπεριληφθεί στη βάση δεδομένων της εφαρμογής. Τέλος, σημειώνουμε ότι στα πλαίσια της εφαρμογής του έργου θα πρέπει να υποστηρίζεται η συσχέτιση εννοιών που προκύπτουν από οντολογίες διαθέσιμες στο διαδίκτυο πέραν από αυτές που συμπεριλαμβάνονται στο δίκτυο του συστήματος. Για παράδειγμα, η έννοια Actor της οντολογίας MovieOntology που περιλαμβάνεται στο δίκτυο μπορεί να συνδεθεί με την περιγραφή του ηθοποιού που είναι διαθέσιμη στην οντολογία της dbpedia. Πέραν από την αντιστοίχιση των διαφορετικών οντολογιών είναι αναγκαία για τους σκοπούς της εφαρμογής η σύνδεση των δεδομένων με τις έννοιες των οντολογιών. Πράγματι, η σύνδεση των δεδομένων με τη γνώση του σχήματος είναι βασική προϋπόθεση για τη σημασιολογική αναζήτηση της πληροφορίας. Στόχος είναι οι αποδοτικές υπηρεσίες αναζήτησης που αξιοποιούν τη σημασιολογική απόδοση περιεχομένου με τη χρήση οντολογιών. Στην επόμενη ενότητα παρουσιάζουμε τον τρόπο με τον οποίο οι οντολογίες χρησιμοποιούνται σε εφαρμογές πάνω από τις βάσεις δεδομένων προκειμένου να διευκολύνουν τη διαχείριση και ανάκτηση της πληροφορίας. Σελίδα 8 από 18

5 Απάντηση ερωτημάτων με χρήση οντολογιών Οι ανάγκες των σύγχρονων εφαρμογών για σημασιολογική αναπαράσταση των δεδομένων οδήγησαν στην υιοθέτηση των οντολογιών για την περιγραφή των δεδομένων. Οι σύγχρονες εφαρμογές που διαχειρίζονται μεγάλο όγκο πληροφορίας που βρίσκεται σε κάποια βάση δεδομένων μπορούν να αναπαραστήσουν τη γνώση του πεδίου ενδιαφέροντος και να αποδώσουν σημασιολογικό περιεχόμενο στα δεδομένα χρησιμοποιώντας οντολογικές περιγραφές. Επιπλέον, όπως έχουμε αναφέρει η χρήση των οντολογιών σε εφαρμογές που συγκεντρώνουν δεδομένα από διαφορετικές πηγές εξασφαλίζει τη συνέπεια των δεδομένων και την ακεραιότητα της βάσης. Οι απαιτήσεις για την αποτελεσματική διαχείριση μεγάλου όγκου πληροφορίας οδήγησαν στη μελέτη του προβλήματος της απάντησης ερωτημάτων με βάση τις οντολογίες [38, 6, 13]. Το πρόβλημα αυτό αφορά στις εφαρμογές όπου η γνώση του σχετικού πεδίου περιγράφεται από κάποια οντολογία και οι απαντήσεις στα ερωτήματα των χρηστών ανακλούν τόσο τα αποθηκευμένα δεδομένα της εφαρμογής όσο και τα αξιώματα της οντολογίας. Όπως θα δούμε και παρακάτω, η μελέτη της απάντησης ερωτημάτων με χρήση οντολογιών έχει οδηγήσει στην ανάπτυξη πληθώρας συστημάτων. Στα πλαίσια του παρόντος έργου σκοπός είναι η ανάπτυξη ενός συστήματος που θα παρέχει υπηρεσίες απάντησης εκφραστικών και σύνθετων ερωτημάτων με βάση οντολογίες εκφρασμένες στη γλώσσα OWL/RDFS. Ως παράδειγμα του προβλήματος που μας απασχολεί ας θεωρήσουμε τα παρακάτω αξιώματα υπαγωγής που δηλώνουν ότι ο ρόλος hasactor διαθέτει τους υπορόλους hasactress και hasmaleactor, καθώς και το αξίωμα που ορίζει τους δύο υπορόλους ξένους μεταξύ τους: <owl:objectproperty rdf:about="&mo;hasactress"> <rdfs:subpropertyof rdf:resource="&mo;hasactor"/> <owl:propertydisjointwith rdf:resource="&mo;hasmaleactor"/> <rdfs:range rdf:resource="&www;movieontology.owl#actress"/> </owl:objectproperty> <owl:objectproperty rdf:about="&mo;hasactress"> <rdfs:subpropertyof rdf:resource="&mo;hasactor"/> <owl:propertydisjointwith rdf:resource="&mo;hasmaleactor"/> <owl:inverseof rdf:resource="&mo;isactressin"/> <rdfs:range rdf:resource="&www;movieontology.owl#actress"/> </owl:objectproperty> Θεωρούμε επίσης ότι στη βάση δεδομένων μας οι ηθοποιοί που εμφανίζονται σε μία ταινία σχετίζονται με το όνομα της ταινίας μέσω του ρόλου hasactress, εάν πρόκειται για γυναίκες, ή hasmaleactor εάν πρόκειται για άνδρες. Διατυπώνουμε ένα ερώτημα της μορφής Q(x) hasactor(movie_name, x). Αναμένουμε ως απάντηση όλους τους ηθοποιούς που εμφανίζονται στη συγκεκριμένη ταινία «movie_name» ανεξάρτητα από το αν είναι καταχωρημένοι ως άντρες ή γυναίκες ηθοποιοί. Πιο συγκεκριμένα, η απάντηση του ερωτήματος είναι όλα τα αντικείμενα της βάσης που σχετίζονται με το στιγμιότυπο «movie_name» της έννοιας Movie με κάποιο από τους ρόλους hasactor, hasactress, hasmaleactor. 5.1 Απάντηση ερωτημάτων σε οντολογίες περιγραφικών λογικών Η απάντηση ερωτημάτων με χρήση οντολογιών, όπως προαναφέραμε, έχει προσελκύσει ιδιαίτερο ενδιαφέρον στο χώρο της έρευνας. Παρόλα αυτά η απάντηση ερωτημάτων σε οντολογίες εκφρασμένες στη γλώσσα OWL αποτελεί ιδιαίτερα δύσκολο εγχείρημα λόγω της υψηλής υπολογιστικής πολυπλοκότητας. Έτσι, τα συστήματα που επιλύουν το πρόβλημα ακόμα και με την υιοθέτηση πληθώρας βελτιστοποιήσεων αντιμετωπίζουν δυσκολίες στο χειρισμό μεγάλου όγκου δεδομένων. Προκειμένου τα συστήματα να ανταποκρίνονται στην πράξη και να είναι αποτελεσματικά, έχει αναπτυχθεί η οικογένεια γλωσσών DL-Lite που αποτελεί το θεωρητικό υπόβαθρο της OWL QL. Επιπλέον, ιδιαίτερη έμφαση έχει δοθεί στη μελέτη μεθόδων απάντησης ερωτημάτων που υποστηρίζουν την εκφραστικότερη περιγραφική λογική EL, το θεωρητικό υπόβαθρο της OWL 2 EL. Πέρα από τις θεωρητικές μελέτες έχουν αναπτυχθεί συστήματα που καλούνται να επιλύσουν το πρόβλημα της απάντησης ερωτημάτων σε οντολογίες. Παραδείγματα τέτοιων συστημάτων είναι το Mastro [39], Presto [40], Quest [41], Nyaya [42], IQUAROS [43], Ontop [44], που υποστηρίζουν την εκφραστικότητα της DL-Lite, το Requiem [45], Rapid [46] που υποστηρίζουν την ELHI Σελίδα 9 από 18

και το Clipper [47] που υποστηρίζει την πιο εκφραστική Horn-Shiq. 5.1.1 Επανεγγραφή ερωτημάτων Μία σημαντική προσέγγιση του προβλήματος της απάντησης ερωτημάτων είναι η μέθοδος της επανεγγραφής. Σύμφωνα με την τεχνική της επανεγγραφής η δεδομένη οντολογία και το ερώτημα τροποποιούνται ώστε να αναπαρασταθούν με φορμαλισμούς τους οποίους είναι σε θέση να διαχειριστούν υπάρχουσες τεχνολογίες ανάκτησης δεδομένων. Για παράδειγμα, ας θεωρήσουμε την οντολογία ScriptOntology που περιλαμβάνει μεταξύ άλλων αξιώματα υπαγωγής που αφορούν στο πλάνο μιας σκηνής. Έτσι, η έννοια CloseUpShot που περιγράφει την κοντινή λήψη, υπάγεται στην Shot: <owl:class rdf:about="closeupshot"> <rdfs:subclassof rdf:resource="shot"/> </owl:class> Παρόμοια καθορίζεται και η σχέση μεταξύ της Shot και των LowAngleShot, HighAngleShot κλπ. Έστω ότι κάποιος χρήστης της εφαρμογής μας αναζητά όλα τα πλάνα μιας ταινίας (την κωδική τους ονομασία) με ένα ερώτημα της μορφής Q(x) Shot(x). Κατά τη διαδικασία απάντησης του ερωτήματος θα πρέπει να επιστραφούν από τη βάση δεδομένων όλα τα πλάνα που είναι στιγμιότυπα των εννοιών CloseUpShot, LowAngleShot και γενικά όλων των εννοιών που υπάγονται στην Shot. Με αυτόν τον τρόπο αξιοποιείται η γνώση που περιγράφεται στην οντολογία που εν προκειμένω αφορά σε μία απλή σχέση υπαγωγής εννοιών. Σύμφωνα με την τεχνική της επανεγγραφής το ερώτημα διατυπώνεται εκ νέου λαμβάνοντας υπόψιν τα αξιώματα του σώματος ορολογίας. Έτσι, προκύπτουν τα ερωτήματα Q(x) CloseUpShot(x), Q(x) LowAngleShot(x) κλπ. Κατόπιν, εφόσον η γνώση που περιγράφεται στην οντολογία έχει αξιοποιηθεί πλήρως, η ανάκτηση των δεδομένων μπορεί να ανατεθεί σε κάποια από τις εξελιγμένες τεχνολογίες βάσεων δεδομένων. Περιγράφουμε τη μέθοδο επανεγγραφής ερωτημάτων με τυπικό τρόπο στα παρακάτω. Σύμφωνα με τη μέθοδο της επανεγγραφής το δεδομένο ερώτημα καθώς και η οντολογία τροποποιούνται ώστε να αναπαρασταθούν από φορμαλισμούς τους οποίους μπορούν έυκολα να διαχειριστούν συστήματα ανάκτησης δεδομένων. Πιο τυπικά, ένα ερώτημα Q και μία οντολογία Ο μετατρέπονται σε ένα σύνολο από προτάσεις R που ονομάζεται επανεγγραφή, ώστε για κάθε σύνολο δεδομένων D, οι απαντήσεις του Q με βάση τα D και Ο να συμπίπτουν με τις απαντήσεις του Q με βάση τα R και D, χωρίς να λαμβάνεται δηλαδή υπόψιν το Ο. Η τεχνική της Επανεγγραφής έχει μελετηθεί για διαφορετικά φράγματα της γλώσσας OWL. Ηη εν λόγω μέθοδος αποτελεί πλέον τη συνηθέστερη ίσως πρακτική απάντησης ερωτημάτων με βάση κάποια οντολογία για γλώσσες αναπαράστασης γνώσης χαμηλότερης εκφραστικότητας, όπως είναι η DL-Lite. Σημειώνουμε ότι η μέθοδος αυτή είναι ιδιαίτερα σχετική με το πεδίο ενδιαφέροντος στα πλαίσια του παρόντος έργου μιας και οι οντολογίες που θα συμπεριληφθούν στο δίκτυο καλούνται να περιγράψουν δεδομένα που δεν είναι ιδιαίτερα σύνθετα και άρα η εκφραστικότητά τους μπορεί να παραμείνει χαμηλή. Παρόλα αυτά ο μηχανισμός που πρόκειται να χρησιμοποιηθεί στο σύστημά μας για την απάντηση ερωτημάτων θα είναι σε θέση να υποστηρίξει και υψηλότερες εκφραστικότητες κάτι που γίνεται εφικτό με τη μέθοδο της ανάλυσης που περιγράφουμε σε επόμενη ενότητα. Όπως προαναφέραμε, η συνηθέστερη τεχνική για την απάντηση ερωτημάτων στη γλώσσα περιγραφικής λογικής DL-Lite είναι η μέθοδος της επανεγγραφής. Η εκφραστικότητα της DL-Lite επιτρέπει κωδικοποίηση των αξιωμάτων και του σώματος της ορολογίας σε ένα σύνολο συζευκτικών ερωτημάτων, τα οποία μπορούν να εκτελεστούν επί του σώματος ισχυρισμών. Το σύνολο των συζευκτικών ερωτημάτων μπορεί να μετατραπεί εύκολα σε ένα σύνολο από SQL ερωτήματα τα οποία εκτελούνται πάνω στη βάση ανεξάρτητα από το σώμα ορολογίας. 5.1.2 Επανεγγραφή με τη μέθοδο ανάλυσης Σύμφωνα με την επανεγγραφή με τη μέθοδο της ανάλυσης [48] η δεδομένη οντολογία και το ερώτημα μετατρέπονται σε ένα σύνολο προτάσεων στις οποίες εφαρμόζεται εξαντλητικά ο κανόνας της ανάλυσης για την εξαγωγή νέας γνώσης. Η συγκεκριμένη τεχνική μπορεί να αποδειχθεί ιδιαίτερα χρήσιμη, καθώς επιτρέπει πληθώρα βελτιστοποιήσεων που έχουν προταθεί στη θεωρία των αποδείξεων. Επιπλέον, ένας Σελίδα 10 από 18

αλγορίθμος Επανεγγραφής ερωτημάτων που εφαρμόζει την τεχνική της ανάλυσης έχει το πλεονέκτημα ότι μπορεί επεκταθεί, ώστε να υποστηρίζει γλώσσες αναπαράστασης υψηλότερης εκφραστικότητας τη στιγμή που έχουν ήδη αναπτυχθεί διαδικασίες βασιζόμενες στην ανάλυση και αφορούν σε εκφραστικά σύνολα της λογικής πρώτης τάξης. Παρά τα πλεονεκτήματά της, η τεχνική της ανάλυσης διαθέτει χαρακτηριστικά που καθιστούν την αποτελεσματικότητά της αμφισβητήσιμη. Το βασικό της μειονέκτημα είναι ότι είναι πιθανό να παράγει ενδιάμεσα ερωτήματα-προτάσεις που δεν είναι δυνατό να συμπεριληφθούν στην έξοδο του συστήματος επανεγγραφής. Οι εν λόγω προτάσεις δυσχεραίνουν ακόμα περισσότερο τη διαδικασία, όταν συμμετέχουν σε διαδοχικές εφαρμογές του κανόνα της ανάλυσης για να παράγουν προτάσεις που επίσης δε συνεισφέρουν στην έξοδο του συστήματος. Το αποτέλεσμα σε αυτές τις περιπτώσεις είναι μεγάλες αλυσίδες παραγωγής προτάσεων οι οποίες κοστίζουν σε χώρο μνήμης και σε χρόνο εκτέλεσης του ερωτήματος. Λαμβάνοντας υπόψιν τα μειονεκτήματα αυτά έχουν αναπτυχθεί μέθοδοι που εφαρμόζουν τον κανόνα της ανάλυσης με βέλτιστο τρόπο και μόνο όταν πρόκειται να παραχθούν χρήσιμες προτάσεις διευκολύνοντας έτσι κατά πολύ τη διαδικασία παραγωγής του αποτελέσματος της επανεγγραφής. Όλα όσα έχουμε περιγράψει μέχρι στιγμής αφορούν στην περίπτωση που τα δεδομένα που έχουμε στη διάθεσή μας είναι συνεπή με βάση τη γνώση που περιγράφει η οντολογίας μας. Υπάρχουν όμως περιπτώσεις που τα δεδομένα προκαλούν ασυνέπειες στη βάση γνώσης, οι οποίες είναι μάλιστα περισσότερο πιθανό να εμφανιστούν σε σενάρια αντιστοίχισης οντολογιών όπως είναι και η περίπτωση που εξετάζουμε στα πλαίσια του έργου. Στην επόμενη ενότητα περιγράφουμε τον τρόπο με τον οποίο ένα δίκτυο οντολογιών μπορεί να χρησιμοποιηθεί κατά την απάντηση ερωτημάτων στην περίπτωση που τα δεδομένα που περιγράφει προκαλούν ασυνέπειες. 5.2 Ασαφής απάντηση ερωτημάτων με χρήση οντολογιών Σε αυτή την ενότητα παρουσιάζουμε έναν διαφορετικό τρόπο αξιοποίησης των οντολογιών από συστήματα που παρέχουν υπηρεσίες απάντησης ερωτημάτων. Εξετάζουμε την περίπτωση όπου ένα σύνολο από διαφορετικές οντολογίες συνενώνονται σε ένα δίκτυο για την περιγραφή δεδομένων με διαφορετική πηγή προέλευσης. Στο σενάριο που μας απασχολεί οι οντολογίες δεν εξασφαλίζουν με τον κλασικό τρόπο την ακεραιότητα της βάσης που προκύπτει από τη συγκομιδή δεδομένων από διαφορετικές πηγές. Πιο αναλυτικά, οι αντιστοιχίσεις μεταξύ εννοιών των διαφορετικών οντολογιών ενδέχεται να εισάγουν ασυνέπειες που θέτουν περιορισμούς κατά την εισαγωγή των δεδομένων στη βάση. Στόχος της συγκεκριμένης προσέγγισης είναι η περιγραφή των οντολογιών με γλώσσες ασαφούς λογικής έτσι ώστε να επιτρέπουν την εισαγωγή δεδομένων που θα ήταν ασυνεπή ως προς τις ίδιες οντολογίες σε όρους κλασικής περιγραφικής λογικής. Τα συστήματα που υιοθετούν τη συγκεκριμένη προσέγγιση παρέχουν υπηρεσίες ασαφούς απάντησης ερωτημάτων. Όπως έχουμε περιγράψει, οι οντολογίες κατέχουν εξέχουσα θέση στην οργάνωση και αναπαράσταση της πληροφορίας. Σε περιπτώσεις όπως είναι και αυτή που αφορά στο συγκεκριμένο έργο, όπου τα δεδομένα προέρχονται από διαφορετικές πηγές, είναι δυνατό να χρησιμοποιηθούν για την περιγραφή της πληροφορίας περισσότερες από μία οντολογίες οι οποίες μοντελοποιούν διαφορετικά πεδία γνώσης. Γίνεται κατανοητό ότι τα δεδομένα που προκύπτουν από τις διαφορετικές πηγές είναι απαραίτητο να συσχετιστούν σύμφωνα με την αντιστοίχιση που έχει γίνει στις έννοιες των διαφορετικών οντολογιών. Παρόλα αυτά η συγκεκριμένη διαδικασία ενέχει αρκετές δυσκολίες, καθώς η συσχέτιση των δεδομένων μπορεί να προκαλέσει ασυνεπή δεδομένα με βάση κάποια από τις οντολογίες. Οι ασυνέπειες που περιγράφουμε οφείλονται στον τρόπο αντιστοίχισης των εννοιών. Για παράδειγμα, ας θεωρήσουμε ότι σε κάποια οντολογία χρησιμοποιείται η έννοια Ηθοποιός για να περιγράψει τους ηθοποιούς που είναι είτε άντρες είτε γυναίκες ενώ η ίδια έννοια σε μία δεύτερη οντολογία περιγράφει αποκλειστικά τους άντρες ηθοποιούς. Κατά τη συγκομιδή δεδομένων κάποιος άντρας ηθοποιός δηλώνεται ως στιγμιότυπο της έννοιας Ηθοποιός με αποτέλεσμα να προκύπτει ασυνέπεια σύμφωνα με τη δεύτερη οντολογία. Η ασυνέπεια όπως είναι προφανές προέκυψε από τον τρόπο που πραγματοποιείται η αντιστοίχιση των οντολογιών, ενώ οι ισχυρισμοί που συμπεραίνουμε από τη συγκεκριμένη αντιστοίχιση (των εννοιών Ηθοποιός) θα πρέπει να εξαιρούνται από την ενιαία τελική βάση δεδομένων για λόγους εξασφάλισης της συνέπειας. Σύμφωνα με τη μέθοδο της ασαφούς απάντησης ερωτημάτων τέτοιου είδους ισχυρισμοί συμπεριλαμβάνονται στη βάση με Σελίδα 11 από 18

την προσθήκη ενός δείκτη που υποδηλώνει το βαθμό εμπιστοσύνης στον ισχυρισμό. Προς αυτή την κατεύθυνση οι οντολογίες και τα σώματα ισχυρισμών εκφράζονται σε γλώσσες ασαφούς λογικής. 5.2.1 Απάντηση ερωτημάτων με ασαφείς περιγραφικές λογικές Η απάντηση ερωτημάτων με ασαφείς περιγραφικές λογικές όπως είναι η f-dl-lite που περιγράψαμε, πραγματοποιείται όπως και στην περίπτωση των κλασικών περιγραφικών λογικών. Στην περίπτωση της επανεγγραφής ερωτημάτων, λαμβάνεται υπόψιν το σώμα ορολογίας της οντολογίας ώστε το αρχικό ερώτημα επί της οντολογίας να μετατραπεί σε ένα σύνολο συζευκτικών ερωτημάτων. Στη συνέχεια, ακολουθεί η ανάκτηση των απαντήσεων των συζευκτικών ερωτημάτων από τους ασαφείς ισχυρισμούς του σώματος ισχυρισμών της οντολογίας. Δεδομένου ότι το σώμα ισχυρισμών περιλαμβάνει ασαφείς ισχυρισμούς, η διαδικασία διαφοροποιείται κάπως σε σχέση με την περίπτωση των κλασικών ισχυρισμών. Συγκεκριμένα, οι απαντήσεις έχουν ένα βαθμό εμπιστοσύνης, ο οποίος προκύπτει από το βαθμό εμπιστοσύνης του κάθε ατόμου όταν αντικατασταθούν οι μεταβλητές του [19]. Έτσι για παράδειγμα θεωρούμε ένα ερώτημα της μορφής Q(x) A(x), R(x,y) και τους ισχυρισμούς Α(a):0.6, R(a,b):0.8. Η απάντηση 'a' έχει βαθμό εμπιστοσύνης 0.6 που είναι ο ελάχιστος βαθμός των δύο ατόμων Α(a) και R(a,b). Στην επόμενη ενότητα παρουσιάζουμε μία μέθοδο απάντησης ερωτημάτων που διατυπώνονται πάνω από ένα δίκτυο οντολογιών που βασίζεται στη θεωρία των Ασαφών Περιγραφικών Λογικών. 5.2.2 Απάντηση ερωτημάτων με χρήση ασαφών αντιστοιχίσεων Αρχικά, επεξηγούμε την προτεινόμενη προσέγγιση απάντησης ερωτημάτων σε δίκτυο οντολογιών αναφερόμενοι στο παράδειγμα προηγούμενης ενότητας. Έστω δύο οντολογίες Ο1=(Τ1, Α1), Ο2=(Τ2, Α2) με σώμα ορολογίας Τ1 = Τ2 = ΦορητόςΥπολογιστής ΗλεκτρονικόςΥπολογιστής ΦορητόςΝέαςΓενιάς Υπολογιστής ΦορητόςΝέαςΓενιάς ΦθηνόςΥπολογιστής ΦθηνόςΥπολογιστής ΑκριβόςΥπολογιστής και σώμα ισχυρισμών Α1= {ΦορητόςΥπολογιστής(φυ), ΗλεκτρονικόςΥπολογιστής(ηυ), διαθέσιμος(φυ, κατάστημα1)}, Α2={Υπολογιστής(υ), ΦορητόςΝέαςΓενιάς(φνγ), διαθέσιμοςυπολογιστής(φνγ, κατάστημα2), ΑκριβόςΥπολογιστής(αυ), διαθέσιμος(αυ, κατάστημα3)}. Θεωρούμε, επίσης, τις παρακάτω αντιστοιχίσεις που προκύπτουν με χρήση κάποιου από τα εργαλεία που περιγράψαμε σε προηγούμενη ενότητα: 1. (ΗλεκτρονικόςΥπολογιστής, Υπολογιστής, 0.6, ) 2. (ΦορητόςΥπολογιστής, ΦορητόςΝέαςΓενιάς, 0.7, ) 3. (ΦορητόςΥπολογιστής, ΦθηνόςΥπολογιστής, 0.8, ) 4. (ΦορητόςΥπολογιστής, ΑκριβόςΥπολογιστής, 0.4, ) Έστω επίσης ότι διατυπώνουμε ένα ερώτημα Q(x,y) Υπολογιστής(χ), διαθέσιμος(χ,y) προκειμένου να εντοπίσουμε τους υπολογιστές που είναι διαθέσιμοι σε κάθε κατάστημα. Το ερώτημα διατυπώνεται επί των δύο οντολογιών Ο1 και Ο2. Προκειμένου να απαντηθεί το ερώτημα είναι απαραίτητο να επικυρωθούν οι αντιστοιχίσεις με βάσει τις δύο οντολογίες που συμμετέχουν στο δίκτυο. Σύμφωνα με τις αντιστοιχίσεις τα στιγμιότυπα της έννοιας της μίας οντολογίας μεταβιβάζονται και στην αντίστοιχη έννοια της άλλης. Έτσι, λαμβάνοντας υπόψιν τους ισχυρισμούς της οντολογίας Ο1 σκοπός μας είναι να προσθέσουμε στην Ο2 τους ισχυρισμούς Υπολογιστής(φυ), Υπολογιστής(ηυ), ΦορητόςΝέαςΓενιάς(φυ), ΦθηνόςΥπολογιστής(φυ), ΑκριβόςΥπολογιστής(φυ). Παρατηρούμε ότι με βάση το αξίωμα ΦθηνόςΥπολογιστής ΑκριβόςΥπολογιστής οι δύο τελευταίοι Σελίδα 12 από 18

ισχυρισμοί ΦθηνόςΥπολογιστής(φυ), ΑκριβόςΥπολογιστής(φυ), είναι ασυνεπείς. Η ασυνέπεια που προκύπτει στην οντολογία Ο2 με την εισαγωγή των νέων ισχυρισμών καθιστά αδύνατη την απάντηση του ερωτήματος. Προκειμένου να αντιμετωπιστεί το συγκεκριμένο πρόβλημα η προσέγγιση που παρουσιάζουμε χρησιμοποιεί τη θεωρία Ασαφών Συνόλων και Ασαφούς Λογικής προκειμένου να επικυρώσει τις αντιστοιχίσεις διατηρώντας την ασαφή τους φύση. Θεωρώντας ότι η αντιστοίχιση μεταξύ δύο εννοιών διαφορετικών οντολογιών αποδίδει τη σημασιολογική ομοιότητα των εννοιών κάνουμε την παραδοχή ότι τα στιγμιότυπα της μίας έννοιας μπορούν να θεωρηθούν στιγμιότυπα της άλλης με ένα βαθμό εμπιστοσύνης που καθορίζεται από την ίδια την αντιστοίχιση. Χρησιμοποιώντας λοιπόν τις αντιστοιχίσεις ορίζουμε ασαφείς ισχυρισμούς. Έπειτα, πριν οι ισχυρισμοί συμπεριληφθούν στην τελική οντολογία εξετάζουμε εάν προκαλούνται ασυνέπειες τις οποίες και επιλύουμε με τη βελτιστοποίηση των αντιστοιχίσεων [49]. Παρατηρούμε όμως ότι η συγκεκριμένη διαδικασία επικυρώνει τις αντιστοιχίσεις ως προς τη μία από τις δύο οντολογίες. Για το λόγο αυτό η διαδικασία χρειάζεται να επαναληφθεί επιλέγοντας αυτή τη φορά ως οντολογία εκκίνησης-αναφοράς τη δεύτερη οντολογία. Παρακάτω ορίζουμε τυπικά την ασαφή ερμηνεία των αντιστοιχίσεων που επιτρέπει τον προσδιορισμό των ασαφών ισχυρισμών. Ονομάζουμε ασαφή μια αντιστοίχιση της μορφής m= (C, C, n, R), όπου το n δηλώνει το βαθμό εμπιστοσύνης στην αντιστοίχιση. Έστω μία ασαφής ερμηνεία I και μία κλασική ερμηνεία Ic. Ορίζουμε τις παρακάτω συνθήκες: I =C C' : n b.b C Ιc C Ι (b) = n I =C C' : n b.b C Ιc C Ι (b) n I =C C' : n b.b C Ιc C Ι (b) n Οι παραπάνω ορισμοί υπονοούν μία διαδικασία που μεταφέρει στιγμιότυπα από τη μία οντολογία στην άλλη στην οποία αντιστοιχίζεται δημιουργώντας με αυτόν τον τρόπο ασαφείς ισχυρισμούς. Η βασική ιδέα των παραπάνω ορισμών είναι η δημιουργία ασαφών ισχυρισμών από τις υπάρχουσες αντιστοιχίσεις των εννοιών. Η προσέγγιση αυτή καθιστά δυνατή τη χρήση μιας μηχανής εξαγωγής συμπερασμάτων που βασίζεται στη θεωρία των ασαφών περιγραφικών λογικών, ώστε να εντοπίζονται οι ασαφείς ισχυρισμοί- αντιστοιχίσεις που προκαλούν ασυνέπειες και να διορθώνονται κατάλληλα οι βαθμοί εμπιστοσύνης των αντιστοιχίσεων. Πιο συγκεκριμένα, δεδομένων δύο οντολογιών Ο1, Ο2 η προτεινόμενη μέθοδος δημιουργεί μία οντολογία Ο' με σώμα ορολογίας Τ' που ταυτίζεται με το αυτό της Ο2 και σώμα ισχυρισμών που προκύπτει από την ένωση του σώματος ισχυρισμών της Ο2 και το ΑΜ12, A' = A2 AM12, όπου το AM12 ορίζεται ως εξής: AM12 = {a : C n (C,C,n, ) M,O1 = C(a)} {a : C = n (Ci,Ci,n,= ) M,O1 = C(a)} {a : C n (C,C,n, ) M,O1 = C(a)}. Όπως φαίνεται από τον παραπάνω ορισμό λαμβάνονται υπόψιν οι ισχυρισμοί της O1 που δεν είναι σαφώς δηλωμένοι, O1 = C(a), γεγονός που επιτυγχάνεται με χρήση οποιασδήποτε μηχανής εξαγωγής συμπερασμάτων για περιγραφικές λογικές. Επιστρέφοντας στο παράδειγμά μας έχουμε ότι το AM12 αποτελείται από τους παρακάτω ισχυρισμούς: ΦθηνόςΥπολογιστής(φυ)=0.8 ΦορητόςΝέασΓενιάς(φυ)=0.7 ΑκριβόςΥπολογιστής(φυ)=0.4 Υπολογιστής(φυ)=0.6, Υπολογιστής(ηυ)=0.6 Παρατηρούμε ότι ο ισχυρισμός ΦορητόςΥπολογιστής(φυ) και το αξίωμα ΦορητόςΥπολογιστής ΗλεκτρονικόςΥπολογιστής υπονοούν τον ισχυρισμό ΗλεκτρονικόςΥπολογιστής(φυ) που σε συνδυασμό με Σελίδα 13 από 18

την πρώτη αντιστοίχιση (1) προσθέτει τον ασαφή ισχυρισμό Υπολογιστής(φυ)=0.6. Όπως είναι προφανές, το αξίωμα ΦορητόςΝέαςΓενιάς Υπολογιστής παραβιάζεται με βάση την ασαφή ερμηνεία των αξιωμάτων υπαγωγής ΦορητόςΝέαςΓενιάς Ι (a Ι ) Υπολογιστής Ι (a Ι ). Το ίδιο συμβαίνει και με το αξίωμα ΦθηνόςΥπολογιστής ΑκριβόςΥπολογιστής καθώς σύμφωνα με την ερμηνεία στις ασαφείς λογικές θα πρέπει να ισχύει ΦθηνόςΥπολογιστής Ι (a Ι ) 1-ΑκριβόςΥπολογιστής Ι (a Ι ). Προκειμένου να αντιμετωπίσουμε τις ασυνέπειες που εισάγουν οι νέοι ισχυρισμοί, έτσι όπως προκύπτουν απευθείας από τις αντιστοιχίσεις, είναι απαραίτητο να γίνει επικύρωση των αντιστοιχίσεων. Στην επόμενη ενότητα παρουσιάζουμε την προσέγγιση που προτάθηκε στο [49]. 5.2.3 Επικύρωση αντιστοιχίσεων Η διαδικασία επικύρωσης δέχεται ως είσοδο δύο οντολογίες Ο1, Ο2 και το σύνολο αντιστοιχίσεών τους Μ και επιστρέφει ένα νέο σύνολο Μ' το οποίο περιλαμβάνει τις επικυρωμένες αντιστοιχίσεις. Αρχικά, ο αλγόριθμος της διαδικασίας ταξινομεί τις αντιστοιχίσεις με φθίνουσα σειρά βαθμών εμπιστοσύνης. Έτσι, υψηλότερα στην ιεραρχία βρίσκονται οι αντιστοιχίσεις με τον μεγαλύτερο βαθμό εμπιστοσύνης. Ξεκινώντας από την κορυφή της ιεραρχίας ο αλγόριθμος κατασκευάζει τον αντίστοιχο ασαφή ισχυρισμό ο οποίος προστίθεται προσωρινά στην οντολογία Ο2. Στη συνέχεια, ένας μηχανισμός εξαγωγής συμπερασμάτων για ασαφείς περιγραφικές λογικές ενεργοποιείται προκειμένου να ανιχνεύσει πιθανές ασυνέπειες. Στην περίπτωση που ο νέος ισχυρισμός που προστέθηκε προκαλεί ασυνέπεια η αντιστοίχιση από την οποία προέκυψε υφίσταται τις κατάλληλες τροποποιήσεις που αφορούν στο βαθμό εμπιστοσύνης. Συγκεκριμένα, στην περίπτωση που η ασυνέπεια εντοπίζεται στην παραβίαση ενός αξιώματος υπαγωγής τότε ο μικρότερος βαθμός εμπιστοσύνης αυξάνεται ώστε να ικανοποιείται το αξίωμα. Εάν παραβιάζεται ένα αξίωμα συμπληρωματικών εννοιών, ο μικρότερος βαθμός μειώνεται ώστε να ικανοποιείται η συνθήκη που ορίζει η ασαφής ερμηνεία του αξιώματος. Ο αλγόριθμος ενημερώνει την ιεραρχία των αντιστοιχίσεων και επανεκκινεί τη διαδικασία. Στην περίπτωση που η οντολογία Ο2 παραμένει συνεπής, η αντιστοίχιση από την οποία προέκυψε ο νέος ισχυρισμός παραμένει αμετάβλητη και ο αλγόριθμος συνεχίζει με την επόμενη αντιστοίχιση της ιεραρχίας. Τελικά, επιστρέφει ένα νέο σύνολο Μ' που έχει προκύψει αναθεωρώντας τους βαθμούς των αντιστοιχίσεων. Επιστρέφοντας στο παράδειγμά μας, η πρώτη προς εξέταση αντιστοίχιση είναι η (3) που μεταφράζεται στον ισχυρισμό ΦθηνόςΥπολογιστής(φυ)=0.8. Εφόσον δεν προκύπτουν ασυνέπειες στην Ο2 με τον νέο ισχυρισμό η διαδικασία συνεχίζεται με την επόμενη αντιστοίχιση που είναι η (2) και μεταφράζεται στον ισχυρισμό ΦορητόςΝέαςΓενιάς(φυ)=0.7 οποίος επίσης δεν επηρεάζει την συνέπεια της οντολογίας. Συνεχίζοντας με την αντιστοίχιση (1) προκαλείται ασυνέπεια από τον ισχυρισμό Υπολογιστής(φυ)=0.6 καθώς δεν ικανοποείται η συνθήκη ΦορητόςΝέαςΓενιάς Ι (φυ Ι ) Υπολογιστής Ι (φυ Ι ). Για την επίλυση του προβλήματος ο βαθμός της (1) αυξάνεται και η αντιστοίχιση γίνεται (ΗλεκτρονικόςΥπολογιστής, Υπολογιστής, 0.8). Η διαδικασία ξεκινάει εκ νέου με την ενημερωμένη ιεράρχηση των αντιστοιχίσεων. Οι ισχυρισμοί που εισάγονται στην οντολογία είναι οι Υπολογιστής(φυ)=0.8, Υπολογιστής(ηυ)=0.8, ΦθηνόςΥπολογιστής(φυ)=0.8, ΦορητόςΝέαςΓενιάς(φυ)=0.7 και τέλος ΑκριβόςΥπολογιστής(φυ)=0.4 που παραβιάζει όμως τη συνθήκη που ορίζει η ασαφής ερμηνεία του αξιώματος ΦθηνόςΥπολογιστής ΑκριβόςΥπολογιστής, δηλαδή δεν ισχύει η συνθήκη ΦθηνόςΥπολογιστής Ι (φυ Ι ) 1-ΑκριβόςΥπολογιστής Ι (φυ Ι ). Για το λόγο αυτό η αντιστοίχιση (4) αλλάζει σε (ΦορητόςΥπολογιστής, ΑκριβόςΥπολογιστής, 0.2). Το τελικό σύνολο αντιστοιχίσεων έχει τη μορφή: M' = (ΦορητόςΥπολογιστής, ΦθηνόςΥπολογιστής, 0.8, ) (ΦορητόςΥπολογιστής, ΦορητόςΝέαςΓενιάς, 0.7, ) (ΗλεκτρονικόςΥπολογιστής, Υπολογιστής, 0.8, ) (ΦορητόςΥπολογιστής, ΑκριβόςΥπολογιστής, 0.2, ) Μέχρι στιγμής έχουμε επικυρώσει τις αντιστοιχίσεις με βάση την οντολογία Ο2. Προκειμένου όμως να απαντηθεί ένα ερώτημα επί του δικτύου των οντολογιών, πρέπει να εξασφαλίσουμε ότι οι αντιστοιχίσεις και οι ισχυρισμοί στους οποίους μεταφράζονται είναι συνεπείς ως προς όλες τις οντολογίες του δικτύου. Για το σκοπό αυτό η ίδια διαδικασία, όπως περιεγράφηκε παραπάνω, επαναλαμβάνεται για την οντολογία Ο1 με Σελίδα 14 από 18

αποτέλεσμα ένα νέο σύνολο αντιστοιχίσεων Μ'' που έχει την παρακάτω μορφή: M'' = (ΦορητόςΥπολογιστής, ΦθηνόςΥπολογιστής, 0.8, ) (ΦορητόςΥπολογιστής, ΦορητόςΝέαςΓενιάς, 0.7, ) (ΗλεκτρονικόςΥπολογιστής, Υπολογιστής, 0.8, ) (ΦορητόςΥπολογιστής, ΑκριβόςΥπολογιστής, 0.4, ) Δεδομένου ότι επιθυμούμε οι ισχυρισμοί που θα συμπεριλάβουμε στο δίκτυό μας να μη δημιουργούν ασυνέπειες σε καμία από τις οντολογίες επιλέγουμε το σύνολο αντιστοιχίσεων Μf: Mf = (ΦορητόςΥπολογιστής, ΦθηνόςΥπολογιστής, 0.8, ) (ΦορητόςΥπολογιστής, ΦορητόςΝέαςΓενιάς, 0.7, ) (ΗλεκτρονικόςΥπολογιστής, Υπολογιστής, 0.8, ) (ΦορητόςΥπολογιστής, ΑκριβόςΥπολογιστής, 0.2, ) Εν τέλει, το δίκτυο οντολογιών που προκύπτει διαθέτει σώμα ορολογίας Τ'= Τ1 T2 και σώμα ισχυρισμών Α' = Α1 Α2 ΑM όπου ΑM = {ΦθηνόςΥπολογιστής(φυ), ΦορητόςΝέαςΓενιάς(φυ)=0.7, ΑκριβόςΥπολογιστής(φυ)=0.2, Υπολογιστής(φυ)=0.8, Υπολογιστής(ηυ)=0.8, ΗλεκτρονικόςΥπολογιστής(υ)=0.8, ΦορητόςΥπολογιστής(φνγ)=0.7, ΗλεκτρονικόςΥπολογιστής(φνγ)=0.8, ΦορητόςΥπολογιστής(αυ)=0.2, ΦορητόςΥπολογιστής(φνγ)=0.8}. Επομένως το ερώτημα Q(x,y) Υπολογιστής(χ) διαθέσιμος(χ,y) επιστρέφει τις απαντήσεις: {(φνγ, κατάστημα2):1.0, (αυ, κατάστημα3):1.0, (φυ, κατάστημα1):0.8}. 6 Συμπεράσματα Συνοψίζοντας, στόχος του παρόντος έργου είναι η παροχή υπηρεσιών σημασιολογικής αναζήτησης με την εκτέλεση εκφραστικών ερωτημάτων, τα οποία διατυπώνονται κάνοντας χρήση του λεξιλογίου των οντολογιών πάνω σε μία βάση δεδομένων που έχει προκύψει συλλέγοντας δεδομένα από διαφορετικές πηγές. Η απάντηση τέτοιου είδους ερωτημάτων αποτελεί ένα από τα σύγχρονα προβλήματα έρευνας στο χώρο των τεχνολογιών γνώσης και βάσεων δεδομένων. Στην περίπτωση που εξετάζουμε σκοπός είναι το τελικό σύστημα να παρέχει μία βάση δεδομένων που συγκεντρώνει πληροφορία από τα διαθέσιμα δεδομένα που συνοδεύουν το οπτικοακουστικό υλικό καθώς και από πηγές του διαδικτύου. Η βάση δεδομένων συνδυάζεται με ένα δίκτυο οντολογιών που περιγράφει το σχήμα της βάσης και αποδίδει σημασιολογικό περιεχόμενο στα δεδομένα αυτής. Σε σενάρια διατύπωσης ερωτημάτων από κάποιο χρήστη σκοπός είναι να λαμβάνονται υπόψιν οι περιγραφές της οντολογίας και όχι μόνο τα αποθηκευμένα δεδομένα. Με αυτόν τον τρόπο εκμεταλλευόμαστε τη γνώση που περιγράφουν τα αξιώματα της οντολογίας και δεν περιοριζόμαστε σε απλή ανάκτηση δεδομένων από τη βάση. Μία από τις πιο δημοφιλείς μεθόδους αντιμετώπισης του προβλήματος της απάντησης ερωτημάτων επί των οντολογιών υποστηρίζει την επανεγγραφή του ερωτήματος, την επέκτασή του δηλαδή σύμφωνα με τα αξιώματα της οντολογίας ώστε τελικά να αποτιμηθεί το σύνολο των ερωτημάτων που προκύπτουν επί της βάσης δεδομένων. Όπως έχουμε σημειώσει, εφόσον τα ερωτήματα του χρήστη διατυπώνονται σύμφωνα με το λεξιλόγιο της οντολογίας το σύνολο των ερωτημάτων που προκύπτει από μία πιθανή εφαρμογή του μηχανισμού της επανεγγραφής περιλαμβάνει έννοιες και ρόλους της οντολογίας. Προκειμένου να είναι δυνατή η εκτέλεση των ερωτημάτων επί της βάσης δεδομένων είναι αναγκαίο να υπάρχει σαφής αντιστοίχιση του λεξιλογίου της οντολογίας με τα δεδομένα που βρίσκονται στη βάση δεδομένων της εφαρμογής. Έτσι, κάθε ένα από τα ερωτήματα που προκύπτουν θα αποτιμάται λαμβάνοντας υπόψιν την Σελίδα 15 από 18