Ε νικό Μετσό ιο Πο υτε νείο. Α όρι μοι Επανε ραφής Τροποποιημέν ν Ερ τημάτ ν ια Βατές Περι ραφικές Λο ικές

Save this PDF as:
 WORD  PNG  TXT  JPG

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Ε νικό Μετσό ιο Πο υτε νείο. Α όρι μοι Επανε ραφής Τροποποιημέν ν Ερ τημάτ ν ια Βατές Περι ραφικές Λο ικές"

Transcript

1 dummy line Ε νικό Μετσό ιο Πο υτε νείο ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΥΠΟΛΟΓΙΣΤΩΝ Α όρι μοι Επανε ραφής Τροποποιημέν ν Ερ τημάτ ν ια Βατές Περι ραφικές Λο ικές ΔΙΔΑΚΤΟΡΙΚΗ ΔΙΑΤΡΙΒΗ του ΑΝΑΣΤΑΣΙΟΥ Γ. ΒΕΝΕΤΗ Διπ ματού ου Η εκτρο ό ου Μη ανικού & Μη ανικού Υπο ο ιστών Ε.Μ.Π. (2005) Α ήνα, Ιανουάριος 2014

2

3 dummy line ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΥΠΟΛΟΓΙΣΤΩΝ Α όρι μοι Επανε ραφής Τροποποιημέν ν Ερ τημάτ ν ια Βατές Περι ραφικές Λο ικές ΔΙΔΑΚΤΟΡΙΚΗ ΔΙΑΤΡΙΒΗ του ΑΝΑΣΤΑΣΙΟΥ Γ. ΒΕΝΕΤΗ Διπ ματού ου Η εκτρο ό ου Μη ανικού & Μη ανικού Υπο ο ιστών Ε.Μ.Π. (2005) Συμ ου ευτική Επιτροπή: Γιώρ ος Στάμου Στέφανος Κό ιας Ανδρέας-Γεώρ ιος Σταφυ οπάτης Ε κρί ηκε από την επταμε ή εξεταστική επιτροπή την 21 η Ιανουαρίου Γ. Στάμου Σ. Κό ιας Α-Γ. Σταφυ οπάτης Επίκουρος Κα η ητής Ε.Μ.Π. Κα η ητής Ε.Μ.Π. Κα η ητής Ε.Μ.Π Π. Τσανάκας Κ. Κοντο ιάννης Μ. Κουμπαράκης Κα η ητής Ε.Μ.Π. Αναπ ηρ τής Κα η ητής Ε.Κ.Π.Α. Κα η ητής Ε.Μ.Π.... Β. Βασσά ος Αναπ ηρ τής Κα η ητής Ο.Π.Α. Α ήνα, Ιανουάριος 2014

4 ... ΑΝΑΣΤΑΣΙΟΣ Γ. ΒΕΝΕΤΗΣ Διδάκτ ρ Η εκτρο ό ος Μη ανικός και Μη ανικός Υπο ο ιστών Ε.Μ.Π. c All rights reservedαπα ορεύεται η αντι ραφή, απο ήκευση και διανομή της παρούσας ερ ασίας, εξ ο οκ ήρου ή τμήματος αυτής, ια εμπορικό σκοπό. Επιτρέπεται η ανατύπ ση, απο ήκευση και διανομή ια σκοπό μη κερδοσκοπικό, εκπαιδευτικής ή ερευνητικής φύσης, υπό την προϋπό εση να αναφέρεται η πη ή προέ ευσης και να διατηρείται το παρόν μήνυμα. Ερ τήματα που αφορούν τη ρήση της ερ ασίας ια κερδοσκοπικό σκοπό πρέπει να απευ ύνονται προς τον συ ραφέα.

5 Learn from yesterday, live for today, hope for tomorrow. The important thing is to not stop questioning. Albert Einstein i

6 ii

7 Ευ αριστίες Ο οκ ηρώνοντας τη διδακτορική μου διατρι ή α ή ε α να εκφράσ τις ει ικρινείς μου ευ αριστίες σε ό α τα άτομα που με στήριξαν ψυ ο ο ικά, η ικά και πρακτικά ια την εκπόνηση της. Αρ ικά α ή ε α να ευ αριστήσ τον κ. Γιώρ ο Στάμου, Επίκουρο Κα η ητή Ε.Μ.Π. που ήταν και ο επι έπ ν της διδακτορικής μου διατρι ής ια την πο ύτιμη κα οδή ηση του, τη δυνατότητα που μου έδ σε να ασ ο η ώ με τον τομέα της έρευνας κα ώς και ια την προ υμότητα του να οη ήσει στην επί υση τ ν προ ημάτ ν που παρουσιάζονταν. Επιπ έον α ή ε α να ευ αριστήσ τον κ. Στέφανο Κό ια, Κα η ητή Ε.Μ.Π. και διευ υντή του Ερ αστηρίου Ψηφιακής Επεξερ ασίας Εικόνας, Βίντεο και Πο υμέσ ν, ο οποίος παρεί ε την αμέριστη υποστήριξη του οποτεδήποτε αυτό ρειαζόταν. Ιδιαίτερες ευ αριστίες οφεί στον Δρ. Γιώρ ο Στοΐ ο ια την αμέριστη συμπαράσταση και τη όνιμη συνερ ασία που εί αμε κα ό η τη διάρκεια της διδακτορικής μου διατρι ής. Οι καίριες παρατηρήσεις του και οι κατευ υντήριες ραμμές που μου έδινε ήταν ια μένα πο ύτιμες και εποικοδομητικές. Επιπ έον α ή ε α να ευ αριστήσ τα μέ η του Ερ αστηρίου Ψηφιακής Επεξερ- ασίας Εικόνας, Βίντεο και Πο υμέσ ν ια τη δημιουρ ία ενός ευ άριστου περι ά - οντος ερ ασίας. Τους Δρ. Γιώρ ο Καρυδάκη, Δρ. Νίκο Σίμου, Δρ. Θεόφι ο Μαΐ η, Δρ. Στέ ιο Αστεριάδη, Δρ. Γιώρ ο Τό ια, α ά και τους Γιώρ ο Γουδέ η, Γιάννη Κα αντίδη, Χρήστο Βαρυτιμίδη, την Ε ένη Τσα απάτη, τη Δέσποινα Τρι έ α, την Σαρ ίν Χονδρού και κυρί ς τη Θέμιδα Ζερ ού η οποία παρεί ε απ ό ειρα τη οή εια της ια την εύρυ μη ειτουρ ία του ερ αστηρίου. Τέ ος α ή ε α να αφιερώσ την ερ ασία μου και να ευ αριστήσ α ύτατα τη σύντροφο μου Ι άννα Βέρροιου ια την αμέριστη συμπαράσταση της και την υπομονή της κα ώς και την οικο ένεια μου που ό α αυτά τα ρόνια αποτε εί κύριο αρ ό τ ν προσπα εί ν μου. Αναστάσιος Βενέτης Α ήνα, Ιανουάριος 2014 iii

8

9 ΠΕΡΙΛΗΨΗ Το πρό ημα συ ο ιστικής της απάντησης συζευκτικών ερ τημάτ ν πάν από άσεις νώσης Περι ραφικών Λο ικών, μέσ της επανε ραφής ερ τημάτ ν, έ ει παρουσιάσει ιδιαίτερη άν ιση τα τε ευταία ρόνια. Δεδομένου ενός συζευκτικού ερ τήματος και μιας άσης νώσης (TBox και ABox) μια διαδικασία επανε ραφής ερ τημάτ ν παρά ει ένα νέο ερώτημα που ενσ ματώνει τους περιορισμούς της άσης νώσης που περιέ ονται στο TBox, έτσι ώστε ια οποιοδήποτε ABox (σύνο ο δεδομέν ν) η αποτίμηση του αρ ικού ερ τήματος πάν στο TBox και το ABox να μπορεί να υπο ο ιστεί με την αποτίμηση μόνο του νέου ερ τήματος πάν στο ABox. Επειδή η πο υπ οκότητα απάντησης ερ τημάτ ν σε εκφραστικές Περι ραφικές Λο ικές είναι απα ορευτική έ ουν αναπτυ εί ώσσες Περι ραφικών Λο ικών που είναι ατές, όπ ς η οικο ένεια σσών DL-Lite, η EL και η οικο ένεια της Datalog ± ια τις οποίες έ ει παρουσιαστεί π η ώρα α ορί μ ν/συστημάτ ν επανε ραφής ερ τημάτ ν. Όμ ς, ό οι οι α όρι μοι που ν ρίζουμε εκτε ούνται κά ε φορά από την αρ ή ρίς να αμ άνουν υπ όψιν και να εκμετα εύονται προη ούμενες εκτε έσεις, ακόμα και εάν διαδο ικά ερ τήματα έ ουν πο ύ μικρές διαφορές, κάτι το οποίο είναι ιδιαίτερα συ νό στο διαδίκτυο. Στην παρούσα διατρι ή με ετάμε το πρό ημα της επανε ραφής ερ τημάτ ν τα οποία έ ουν τροποποιη εί με διάφορους τρόπους. Οι τρόποι αυτοί αφορούν στην προσ ήκη ή αφαίρεση διακεκριμέν ν μετα ητών ή ατόμ ν. Πιο συ κεκριμένα, με ετάμε το πρό ημα υπο ο ισμού της επανε ραφής ενός τροποποιημένου ερ τήματος εκμετα ευόμενοι την επανε ραφή που έ ει υπο ο ιστεί ια το αρ ικό ερώτημα, αποφεύ οντας έτσι να την υπο ο ίσουμε εξαρ ής. Στη συνέ εια παρουσιάζουμε ε τιστοποιήσεις οι οποίες αυξάνουν σημαντικά την απόδοση τ ν α ορί μ ν μας. Ακο- ού ς, μειώνουμε την εκφραστικότητα τ ν οντο ο ιών που με ετάμε στη ώσσα DL-Lite R έτσι ώστε να ε τιστοποιήσουμε περαιτέρ το πρό ημα του υπο ο ισμού της επανε ραφής ενός ερ τήματος στο οποίο έ ει προστε εί ένα άτομο. Αυτό που παρουσιάζει ιδιαίτερο ενδιαφέρον είναι π ς οι τε νικές μας έτουν τις άσεις ια έναν πρ τότυπο επαυξητικό α όρι μο επανε ραφής στα ερών ερ τημάτ ν ια οντο ο- ίες DL-Lite R. Πιο συ κεκριμένα, το ερώτημα μπορεί να ανα υ εί στα άτομα του και στη συνέ εια να επεξερ αστούμε κά ε άτομο επαυξητικά. Παρουσιάζουμε ανα- υτικούς α όρι μους κα ώς και ένα σύνο ο από ε τιστοποιήσεις οι οποίες όπ ς φαίνεται και από την πειραματική μας αξιο ό ηση ε τιώνουν την απόδοση του συστήματος μας και το κα ιστούν τα ύτερο από ό α τα ν στά συστήματα. Τέ ος, στη διατρι ή αυτή με ετάμε το πρό ημα απάντησης ερ τημάτ ν πάν από ένα δίκτυο οντο ο ιών. Ειδικότερα, με ετάμε π ς η Ασαφής Συνο ο ε ρία και v

10 η Ασαφής Λο ική μπορούν να ρησιμοποιη ούν ια την απόδοση σημασιο ο ίας και την επικύρ ση τ ν αντιστοι ίσε ν ανάμεσα σε δύο οντο ο ίες ώστε να μπορέσουμε να επι ύσουμε ασυνέπειες που μπορεί να προκύψουν από την αντιστοί ιση τους. Αφού οιπόν επι ύσουμε τις ασυνέπειες αυτές ρησιμοποιούμε τις δύο αυτές οντο- ο ίες ια να κατασκευάσουμε μια νέα (ασαφή) οντο ο ία η οποία είναι συνεπής και το ABox της οποίας περιέ ει ανα έσεις που έ ουν προκύψει από την ερμηνεία τ ν ασαφών αντιστοι ίσε ν και από τις δύο αρ ικές οντο ο ιές κάνοντας έτσι εφικτή την απάντηση ερ τημάτ ν.

11 ABSTRACT The reasoning problem of answering conjunctive queries over Description Logic knowledge bases via query rewriting has gained a lot of attention in the last few years. Given a conjunctive query and a knowledge base (TBox and ABox) a query rewriting procedure computes a new query that incorporates the constraints of the knowledge base that are described in its TBox, such that for any ABox (dataset) the evaluation of the initial query over the TBox and the ABox can be computed by evaluating only the new query over the ABox. Because the computational complexity in expressive Description Logics is prohibitive tractable Description Logics languages have been developed, such as the DL-Lite family, EL and the Datalog ± family for which there have been presented many rewriting algorithms/systems. However, all these algorithms run from scratch without taking into consideration previous runs, even if successive queries are pretty similar, which is a very common scenario in the Web. In this thesis we study the problem of query rewriting for queries that have been refined in various ways. These are the addition and removal of distinguished variables or atoms. More precisely, we study the problem of computing the rewriting of a query that has been refined taking into account the initial query without having to recompute it from scratch. In the following we present various optimisations that drastically increase the performance of our algorithms. Moreover, we limit the ontology language expressivity to DL-Lite R in order to further optimise the problem of query rewriting for queries that have been refined by the addition of an atom. Interestingly, our approach implies a novel incremental algorithm for computing the rewriting of a fixed query. More precisely, the query can be decomposed into its atoms and then incrementally process each atom. We present detailed algorithms as well as several optimisations that as depicted by our experimental evaluation improve the performance of our system and show that it is faster than all the other systems. Finally in this thesis we study the problem of query answering over an ontology network. Namely, given two ontologies and a set of mappings among them we study how Fuzzy Sets and Fuzzy Logic can be used to provide semantics for the mappings so that we can resolve inconsistencies that might arise from them. After resolving these inconsistencies a new (fuzzy) ontology that is consistent is created with an ABox that contains assertions, interpreted using the fuzzy mappings, from both the initial ontologies. vii

12

13 Περιε όμενα Κατά ο ος Σ ημάτ ν Κατά ο ος Πινάκ ν Κατά ο ος Α ορί μ ν xiii xv xvii I Θεμέ ια 1 1 Εισα ή Περι ραφικές Λο ικές Υπηρεσίες Συ ο ιστικής Απάντηση Ερ τημάτ ν Παρουσίαση Προ ήματος Συνεισφορά και Δομή της Διατρι ής Θε ρητικό Υπό α ρο Υπαρξιακοί Κανόνες και Προτάσεις Κανόνας Συμπερασμού Ανά υσης Συζευκτικά Ερ τήματα Η Οικο ένεια Γ σσών της DL-Lite DL-Lite F και DL-Lite R Υπηρεσίες Συ ο ιστικής Απάντηση Ερ τημάτ ν μέσ Επανε ραφής Ο Α όρι μος Επανε ραφής PerfectRef Κατευ υνόμενοι Γράφοι II Επανε ραφή Τροποποιημέν ν Ερ τημάτ ν 33 3 Επανε ραφή Τροποποιημέν ν Ερ τημάτ ν Μεί ση Ερ τημάτ ν με Διακεκριμένες Μετα ητές Επέκταση Ερ τημάτ ν με Διακεκριμένες Μετα ητές Μεί ση Ερ τημάτ ν με Άτομα Επέκταση Ερ τημάτ ν με Άτομα Βε τιστοποιήσεις ix

14 3.5.1 Βε τιστοποιώντας τον Α όρι μο Επέκτασης Ερ τημάτ ν με Διακεκριμένες Μετα ητές Βε τιστοποιώντας τον Α όρι μο Μεί σης Ερ τημάτ ν με Άτομα Βε τιστοιποίηση Επανε ραφής Ερ τημάτ ν μέσ της Επέκτασης με Άτομα Επισκόπηση Α ορί μου Α όρι μος Επέκτασης Ερ τημάτ ν Ορ ότητα Επαυξητική Επανε ραφή Ερ τημάτ ν Α όρι μος Βε τιστοποιήσεις Βε τιστοποιώντας το Τε ευταίο Βήμα Βε τιστοποιώντας την Απα οιφή Περιττών Ερ τημάτ ν III Πρακτικά Ζητήματα 97 6 Αξιο ό ηση Σύνο ο Δεδομέν ν Αξιο ό ησης Αξιο ό ηση Επανε ραφής Τροποποιημέν ν Ερ τημάτ ν Μεί ση Ερ τημάτ ν με Διακεκριμένες Μετα ητές Επέκταση Ερ τημάτ ν με Διακεκριμένες Μετα ητές Μεί ση Ερ τημάτ ν με Άτομα Αξιο ό ηση Επαυξητικής Επανε ραφής Συ κρίνοντας τους PerfectRef και PerfectRef Συ κρίνοντας το IQAROS και τον PerfectRef Συ κρίνοντας τα IQAROS, Rapid, Nyaya, και Presto IV Απάντηση ερ τημάτ ν πάν από ένα Δίκτυο Οντο- ο ιών Απάντηση Ερ τημάτ ν πάν από ένα Δίκτυο Οντο ο ιών Ασαφείς Περι ραφικές Λο ικές Απάντηση Ερ τημάτ ν Aντιστοί ιση Οντο ο ιών και Ασαφής Ερμηνεία Αντιστοι ίσε ν Απάντηση Ερ τημάτ ν μέσ Αντιστοι ίσε ν Α όρι μος Επικύρ σης Αντιστοι ίσε ν Α όρι μος Απάντησης Ερ τημάτ ν μέσ Αντιστοι ίσε ν

15 V Επί ο ος Σ ετική Βι ιο ραφία Συνεισφορά και Θέματα προς Έρευνα 133 Αʹ Ερ τήματα Αξιο ό ησης 137 Βʹ Αποδόσεις Ξέν ν Όρ ν 141 Γʹ Γ σσάριο Συμ ό ν 145 Δʹ Γ σσάριο Εννοιών 147 Βι ιο ραφία 149 Ευρετήριο Όρ ν 167

16

17 Κατά ο ος Σ ημάτ ν 4.1 Γράφοι επανε ραφής ια το Παράδει μα Μέσος ρόνος επανε ραφής ια ό α τα ερ τήματα ια κά ε οντο ο ία xiii

18

19 Κατά ο ος Πινάκ ν 2.1 Σημασιο ο ία DL-Lite core -εννοιών και ρό ν Μετάφραση εννοιών και ρό ν σε φόρμου ες Λο ικής Πρώτης Τάξης Μετάφραση αξι μάτ ν και οντο ο ιών σε προτάσεις Λο ικής Πρώτης Τάξης Αρι μός εννοιών, ρό ν και αξι μάτ ν τ ν δεδομέν ν ε έ ου Αξιο ό ηση του Α ορί μου 3 ρησιμοποιώντας DL-Lite οντο ο ίες Αξιο ό ηση του Α ορί μου 3 ρησιμοποιώντας ELHI οντο ο ίες Αξιο ό ηση του Α ορί μου 4 ρησιμοποιώντας DL-Lite οντο ο ίες Αξιο ό ηση του Α ορί μου 4 ρησιμοποιώντας ELHI οντο ο ίες Αξιο ό ηση του Α ορί μου 5 ρησιμοποιώντας DL-Lite οντο ο ίες Αξιο ό ηση του Α ορί μου 5 ρησιμοποιώντας ELHI οντο ο ίες Σύ κριση μεταξύ τ ν PerfectRef και PerfectRef Σύ κριση του PerfectRef + και διαφόρ ν εκδόσε ν του IQAROS Σύ κριση μεταξύ Rapid, Nyaya, Presto και IQAROS Σημασιο ο ία f-dl-lite-εννοιών και ρό ν xv

20

21 Κατά ο ος Α ορί μ ν 1 removeredundant(q) PerfectRef(Q, T ) RemoveVars(T, R, R, π j1,...,j n ) ExtendRewritingForNewVars(Q, R, R, y) removeatom(t, Q, R, R, α) ExtendRewritingForNewAtoms(Q, T, R, R, α) removeredundantopt(r, NS, NR) PerfectRef + (Q, T ) ExtendRewritingForNewAtom(T, G, α) ex-perfectref(q, T ) joingraphs(g, G α, jv, av) buildchildren(q c, Q, Q α, G, G, av, jv) IncrementalRew(Q, T ) OptimisedExtensionStep(G, u α, jv, av) fuzzyvalidation(m, O 1, O 2 ) computestrength(m i, O 1, O 2 ) QueryAnsweringOverMappings(Q, M, O 1, O 2 ) xvii

22

23 Κατά ο ος Συντμήσε ν ανν : αν και μόνο αν μ..τ. : με άση το ΠΛ : Περι ραφικές Λο ικές ΣΕ : Συζευκτικό Ερώτημα ΣΣΕ : Σύνο ο Συζευκτικών Ερ τημάτ ν τ.. : τέτοιο ώστε ABox : Assertional Box ALC : Attributive Language with Complement: A C R.C R.C DL : Description Logics DL-Lite core : Η ώσσα Περι ραφικών Λο ικών DL-Lite core DL-Lite F : Η ώσσα Περι ραφικών Λο ικών DL-Lite core με αξιώματα συναρτησιακών ρό ν func(r) DL-Lite R : Η ώσσα Περι ραφικών Λο ικών DL-Lite core με αξιώματα υπα - ής ρό ν R E EL : Η ώσσα Περι ραφικών Λο ικών EL ELHI : Η ώσσα Περι ραφικών Λο ικών EL με αξιώματα υπα ής ρό ν H : R S και αντίστροφους ρό ους (I) : R OWL : Web Ontology Language OWL 2 QL : OWL 2 Query Language S : Η ώσσα Περι ραφικών Λο ικών ALC με αξιώματα μετα ατικών ρό ν (ALC R +) : Trans(R) SI : Η ώσσα Περι ραφικών Λο ικών S με αντίστροφους ρό ους (I) : R SHI : Η ώσσα Περι ραφικών Λο ικών SI με αξιώματα υπα ής ρό ν (H) : R S SHIN : Η ώσσα Περι ραφικών Λο ικών SHI με περιορισμούς π η υκότητας (N ) : nr, nr SHIQ : Η ώσσα Περι ραφικών Λο ικών SHI με προσοντού ους περιορισμούς π η υκότητας (Q) : nr.c, nr.c SHOIN : Η ώσσα Περι ραφικών Λο ικών SHIN με ονοματικές έννοιες (O) : {o} SHOIQ : Η ώσσα Περι ραφικών Λο ικών SHI με ονοματικές έννοιες (O) : {o} και προσοντού ους περιορισμούς π η υκότητας (Q) : nr.c, nr.c xix

24 SROIQ : Η ώσσα Περι ραφικών Λο ικών SHOIQ με πο ύπ οκα αξιώματα υπα ής ρό ν (R) : R 1... R n S, αξιώματα ανακ αστικών (Ref(R)), μη-ανακ αστικών (Irr(R)), συμμετρικών (Sym(R)), αντίσυμμετρικών (ASym(R)), ξέν ν (Dis(R, S)) ρό ν, απ ής άρνησης ρό ν (a, b) : R και αυτοπα ών εννοιών R.Self SW : Semantic Web TBox : Terminological Box WWW : World Wide Web W3C : World Wide Web Consortium

25 Μέρος I Θεμέ ια 1

26

27 Κεφά αιο 1 Εισα ή Ένα από τα προ ήματα με τα οποία ασ ο είται η Επιστήμη τ ν Υπο ο ιστών και πιο συ κεκριμένα ο τομέας της Τεχνητής Νοημοσύνης (Artificial Intelligence) είναι αυτό της αναπαράστασης γνώσης και της συλλογιστικής (knowledge representation and reasoning) [24]. Το πρό ημα αυτό αφορά στον τρόπο με τον οποίο η νώση που απαντάται σε ένα επιστημονικό πεδίο ή εφαρμο ή πρέπει να αποτυπώνεται, να ορ ανώνεται και να δια ειρίζεται, έτσι ώστε μέσ της διαδικασίας της συ ο ιστικής να είναι εφικτή η διενέρ εια σύν ετ ν ερ ασιών, που π ησιάζουν σε ποιότητα αυτές της αν ρώπινης σκέψης, και έ ουν ς αποτέ εσμα την εξα ή ρήσιμ ν συμπερασμάτ ν. Το πρό ημα αυτό έ ει απασ ο ήσει από αρ αιοτάτ ν ρόν ν πο ούς μα ηματικούς και φι οσόφους πρώτος από τους οποίους ο Αριστοτέ ης έ εσε τις άσεις ια αυτό που στις μέρες μας ονομάζεται τυπική λογική (formal logic) [81, 135]. Η τυπική ο ική αφορά στην με έτη με όδ ν εξα ής συμπερασμάτ ν με τη ρήση ενός τυπικού φορμα ισμoύ. Με την έννοια του τυπικού φορμα ισμού εννοούμε ένα κα ώς ορισμένο συντακτικό (syntax) και μια κα ώς ορισμένη σημασιολογία (semantics). Το συντακτικό αφορά στον ορισμό τ ν συμ ό ν που ρησιμοποιούνται από το φορμα ισμό κα ώς και τους κανόνες με άση τους οποίους τα σύμ ο α αυτά είναι δυνατόν να συνδυαστούν. Από την ά η, η σημασιολογία αφορά στον ορισμό τ ν ερμηνειών που αποδίδονται στα σύμ ο α αυτά α ά και στους διάφορους συνδυασμούς τους που είναι επιτρεπτοί από το συντακτικό. Κατά τη διάρκεια τ ν ρόν ν έ ει αναπτυ εί μια π η ώρα από τυπικές ο ικές και ώσσες αναπαράστασης νώσης όπ ς είναι η Λο ική Πρώτης Τάξης (First Order Logic) [100, 167, 12], τα Σημασιο ο ικά Δίκτυα (Semantic Networks) [42], οι Τροπικές Λο ικές (Modal Logics) [92], οι Μη-Μονότονες Λο ικές (Non-Monotonic Logics) [55, 5], οι Χρονικές Λο ικές (Temporal Logics) [119] και ά ες. Στην παρούσα διατρι ή ασ ο ούμαστε με μια συ κεκριμένη οικο ένεια φορμα ισμών που ονομάζονται Περιγραφικές Λογικές (Description Logics) [9] και ρησιμοποιούνται ς το ο ικό υπό α ρο ια την ώσσα ανάπτυξης οντο ο ιών OWL (Web Ontology Language) [14, 115], οι οποίες αποτε ούν ακρο νιαίο ί ο ια τη έ ευση του ε όμενου Σημασιολογικού Ιστού (Semantic Web SW) [19, 137]. Ο Σημασιο ο ικός Ιστός αποτε εί μια νέα μορφή του Παγκόσμιου Ιστού (World Wide Web - WWW ) [17, 16, 18] στην οποία η π ηροφορία ορ ανώνεται με τρόπο κατανοητό από τους υπο ο ιστές δίνοντας τη δυνατότητα σε διάφορους πράκτορες (agents) να φέρουν εις πέρας πο ύπ οκες, ση- 3

28 Περιγραφικές Λογικές μασιο ο ικά ορισμένες ερ ασίες, με ημι-αυτόματο τρόπο, παρέ οντας ταυτό ρονα σημασιο ο ική δια ειτουρ ικότητα. Ο ό ος ια τον οποίο οι Περι ραφικές Λο ικές είναι ιδιαίτερα σημαντικές ια το Σημασιο ο ικό Ιστό είναι ότι οι πρώτες αποτε ούν ένα εκφραστικό και ταυτό- ρονα εύρωστα αποφασίσιμο (robustly decidable) υποσύνο ο της Λο ικής Πρώτης Τάξης [22]. Αυτό έ ει ς αποτέ εσμα τα συστήματα συ ο ιστικής Περι ραφικών Λο ικών [52, 146, 71, 105], που ονομάζονται α ιώς και μηχανές συλλογιστικής (reasoners), να συμπεριφέρονται πο ύ κα ά σε πρακτικές εφαρμο ές και να είναι σε έση να δια ειριστούν με ά ο ό κο π ηροφορίας και νώσης. Όπ ς είναι φυσιο- ο ικό συνεπώς, ρησιμοποιούνται ευρέ ς σε διάφορες εφαρμο ές, όπ ς σε π ηροφοριακά συστήματα [72, 43], στη ρύ μιση παραμέτρ ν σε τη επικοιν νιακά συστήματα [15, 98], στην επεξερ ασία πο υμεσικών κειμέν ν [13, 99, 142, 21, 118, 7, 113, 141, 143], στην ανά υση εικόν ν [102, 107] στη ιο ο ία [140, 150, 61, 136], στη ε ο ία [122, 95], στην ιατρική [62, 124], στη ε ραφία [63, 96] και σε ά ες. 1.1 Περι ραφικές Λο ικές Οι Περι ραφικές Λο ικές (ΠΛ) είναι μια οικο ένεια φορμα ισμών που περι ράφουν τη νώση ενός επιστημονικού πεδίου ή εφαρμο ής με τη ρήση ατόμων (individuals), εννοιών (concepts) που αναπαριστούν σύνο α από άτομα, και ρόλων (roles) που αναπαριστούν δυαδικές σ έσεις ανάμεσα στα άτομα. Οι έννοιες και οι ρό οι μπορεί να είναι ατομικοί (atomic) που ορίζονται ονομαστικά ή σύνθετοι (complex) που ορίζονται με τη ρήση κατασκευαστών πάν σε έννοιες και ρό ους (ατομικούς ή σύν- ετους). Οι κατασκευαστές αυτοί αρακτηρίζουν την εκφραστικότητα κά ε ΠΛ. Για παράδει μα ρησιμοποιώντας την ΠΛ ALC [134] μπορούμε να ορίσουμε την έννοια τ ν μα ημάτ ν ενός πανεπιστημίου ς το σύνο ο τ ν προπτυ ιακών και μεταπτυ ιακών μα ημάτ ν, την έννοια τ ν προπτυ ιακών φοιτητών ς το σύνο ο τ ν φοιτητών που δεν παίρνουν κανένα μεταπτυ ιακό μά ημα κα ώς και ότι όποιος είναι συμφοιτητής με κάποιον τότε είναι φοιτητής, ρησιμοποιώντας τα παρακάτ αξιώματα: Μάθημα Προπτυχιακό Μεταπτυχιακό ΠροπτυχιακόςΦοιτητής Φοιτητής ( παρακολουθεί.μεταπτυχιακό) συμφοιτητήςμε. Φοιτητής όπου ονομάζεται σ έση υπα ής, παρακολουθεί και συμφοιτητήςμε είναι ρό οι (δυαδικές σ έσεις) και ονομάζεται υπαρξιακός ποσοδείκτης ( ια την τυπική σημασιο- ο ία τ ν κατασκευαστών τ ν εννοιών και τ ν ρό ν ο ανα νώστης παραπέμπεται στην ενότητα 2.4). Προσ έτοντας επιπ έον κατασκευαστές στην ΠΛ ALC μπορούμε να δημιουρ ήσουμε περισσότερο εκφραστικές ώσσες. Εάν ια παράδει μα έ ουμε να εκφράσουμε ότι ο ρό ος συμφοιτητήςμε είναι μεταβατικός (transitive) κα ώς ότι οι ρό οι διδάσκει και διδάσκεται είναι αντίστροφοι (inverse) τότε ρειαζόμαστε την ΠΛ SI [76] η οποία μπορεί να επεκτα εί περαιτέρ στην ώσσα SHI [76] με ρήση της σ έσης 4 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

29 Κεφάλαιο 1. Εισαγωγή υπα ής ρό ν, επιτρέποντας δη αδή αξιώματα υπα ής ρό ν, όπ ς το παρακολουθείπροπτυχιακό παρακολουθεί που δη ώνει ότι ο ρό ος παρακολουθείπροπτυχιακό είναι υπο-ρόλος (sub-role) του ρό- ου παρακολουθεί. Επιπ έον, επεκτείνοντας την SHI με ονοματικές έννοιες (nominals) (O) όπ ς η έννοια {Πολυτεχνείο} και οι περιορισμοί πληθυκότητας (number restrictions) (N ) με τους οποίους μπορούμε να εκφράσουμε έννοιες αμ άνοντας υπ όψιν το π ή ος τ ν συνδέσε ν ενός ατόμου με ά α σε μια σ έση, παίρνουμε την ΠΛ SHOIN [78]. Τέ ος, ακόμα πιο εκφραστικές είναι οι ώσσες SHOIQ [77] και SROIQ [75]. Το σύνο ο τ ν αξι μάτ ν με άση τα οποία ορίζονται νέες έννοιες και ρό οι ορίζουν την ορολογία (terminology) ή α ιώς TBox (Terminological Box) μιας ΠΛ και συμ ο ίζεται με T. Εκτός όμ ς από τη δυνατότητα ορισμού σ έσε ν μεταξύ εννοιών και ρό ν οι ΠΛ μας επιτρέπουν να κάνουμε και υπο έσεις όσον αφορά τον κόσμο που μοντε οποιούμε. Οι υπο έσεις αυτές ίνονται με τον κα ορισμό σχέσεων στιγμιοτύπου (instance relations) ανάμεσα σε ένα άτομο (ζευ άρι ατόμ ν) και μια έννοια (ρό ο) και ονομάζονται ισχυρισμοί (assertions). Για παράδει μα, εάν ε ρήσουμε τα άτομα Γιώργος, Μαθηματικά και Ιωάννα, μπορούμε να κάνουμε ισ υρισμούς πάν στις έννοιες και τους ρό ους που εισά αμε στο TBox της νώσης ύρ από ένα πανεπιστήμιο, όπ ς Μάθημα(Μαθηματικά), Φοιτητής(Γιώργος), συμφοιτητήςμε(ιωάννα, Γιώργος), παρακολουθεί(ιωάννα, Μαθηματικά) και παρακολουθεί(γιώργος, Μαθηματικά). Το σύνο ο τ ν ισ υρισμών ορίζουν το σώμα ισχυρισμών (assertional component) ή α ιώς ABox (Assertion Box) μιας ΠΛ και συμ ο ίζεται με A. Τέ ος, το σύνο ο τ ν αξι μάτ ν που ορίζονται στο TBox και το σύνο ο τ ν ισ υρισμών που ορίζονται στο ABox αποτε ούν μια Βάση Γνώσης (ΒΓ) (Knowledge Base KB) ή α ιώς μια οντολογία (ontology), που περι ράφει ένα συ κεκριμένο επιστημονικό πεδίο ή εφαρμο ή. 1.2 Υπηρεσίες Συ ο ιστικής Πέρα από την μοντε οποίηση νώσης ια ένα επιστημονικό πεδίο ή μια εφαρμο ή ένα σύστημα συ ο ιστικής ΠΛ παρέ ει υπηρεσίες συ ο ιστικής όσον αφορά σε μια συ κεκριμένη οντο ο ία. Οι υπηρεσίες αυτές αφορούν στην εξα ή συμπερασμάτ ν ( νώσης) που δεν είναι ρητά δη μένα. Συνή η προ ήματα συ ο ιστικής που αφορούν στο TBox είναι ο κα ορισμός εάν μια έννοια υπάγει (subsumes) μια ά η εάν δη αδή το σύνο ο τ ν ατόμ ν που ανήκουν στην πρώτη ανήκουν κατ ανά κη και στη δεύτερη, ή εάν μια έννοια είναι ικανοποιήσιμη (satisfiable) εάν δη αδή υπάρ ουν άτομα που να μπορούν να ανήκουν σε αυτή. Συνή η προ ήματα συ ο ιστικής που αφορούν στο ABox περι αμ άνουν τον κα ορισμό εάν ένα συ κεκριμένο άτομο αποτε εί στι μιότυπο μιας έννοιας, ή εάν ένα ζεύ ος από άτομα αποτε ούν στι μιότυπα ενός ρό ου. Τα προ ήματα συ ο ιστικής αυτά τί ενται υπό μορφή ερώτησης στη μη ανή συ ο ιστικής και μπορούν να ανα ούν σε μια ερώτηση ανάκτησης στι μιοτύπ ν ια μια έννοια ή ένα ρό ο. Παρό α αυτά είναι ιδιαίτερα συ νό το φαινόμενο που οι ρήστες επι υμούν να υπο ά ουν πιο σύν ετες ερ τήσεις οι οποίες να μη μπορούν να ανα ούν σε μια τέτοια ερώτηση ανάκτησης στι μιοτύπ ν. Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 5

30 Υπηρεσίες Συλλογιστικής Απάντηση Ερ τημάτ ν Η εκφραστικότητα ια την υπο ο ή τέτοι ν σύν ετ ν ερ τήσε ν παρέ εται από τα Συζευκτικά Ερωτήματα (ΣΕ) (Conjunctive Queries CQ) [1]. Για παράδει μα, με άση το TBox που έ ουμε ορίσει προη ουμέν ς κάποιος α μπορούσε να ζητήσει να ανακτη ούν δύο φοιτητές που παρακο ου ούν ίδια μα ήματα, κα ώς και τα μα ήματα αυτά. Το ερώτημα αυτό μπορεί να εκφραστεί με το παρακάτ Συζευκτικό Ερώτημα: Φοιτητής(x) Φοιτητής(y) παρακολουθεί(x, z) παρακολουθεί(y, z) Q A (x, y, z) όπου οι μετα ητές x, y α αντικαταστα ούν με τα άτομα τ ν φοιτητών και η μετα ητή z με το άτομο του κοινού μα ήματος της οντο ο ίας, ενώ τα Φοιτητής και παρακολουθεί είναι μια έννοια και ένας ρό ος αντίστοι α, που απαντώνται στην οντο- ο ία. Η απάντηση του ερ τήματος αποτε είται από τις τριάδες ατόμ ν της οντο ο- ίας ια τις οποίες μετά την αντικατάσταση τ ν μετα ητών (x, y και z) με αυτές, οι ισ υρισμοί που προκύπτουν από τις έννοιες και τους ρό ους του ερ τήματος ισ ύουν στην οντο ο ία. Έτσι ρησιμοποιώντας την οντο ο ία που έ ουμε περι ράψει μέ- ρι στι μής η τριάδα (Γιώργος, Ιωάννα, Μαθηματικά) είναι μια απάντηση. Πιο συ κεκριμένα, από την οντο ο ία δη ώνεται ρητά ότι ισ ύουν οι ισ υρισμοί Φοιτητής(Γιώργος), παρακολουθεί(γιώργος, Μαθηματικά) και παρακολουθεί(ιωάννα, Μαθηματικά) ενώ με άση το αξί μα συμφοιτητήςμε. Φοιτητής προκύπτει ο ισ υρισμός Φοιτητής(Ιωάννα), εφόσον ισ ύει συμφοιτητήςμε(ιωάννα, Γιώργος). Ο υπο ο ισμός τ ν απαντήσε ν ενός ερ τήματος με άση μια οντο ο ία αποτε εί ένα ιδιαίτερα σημαντικό πρό ημα συ ο ιστικής που ονομάζεται απάντηση ερωτημάτων (query answering). Το πρό ημα αυτό σ ετίζεται άμεσα με την πρα ματοποίηση ερ ασιών συ ο ιστικής σε πο ύ με ά α ABox και συνδέεται άρρηκτα με την περιο ή της Πρόσβασης σε Δεδομένα πάνω από Οντολογίες (Ontology Based Data Access) [120]. Η ενική ιδέα πίσ από την περιο ή αυτή είναι π ς μια οντο ο ία ρησιμοποιείται ια να παρέ ει την εννοιο ο ική περι ραφή του πεδίου ενδιαφέροντος μιας εφαρμο ής ενώ ό οι οι ισ υρισμοί της οντο ο ίας (δεδομένα) ρίσκονται απο- ηκευμένοι σε μια Βάση Δεδομένων (ΒΔ) (Database DB), διασφα ίζοντας έτσι πιο αποδοτική πρόσ αση σε αυτούς. Στο π αίσιο αυτό η άση δεδομέν ν ε ρείται π ς δεν είναι π ήρης ια κάποιο ερώτημα ς προς τη νώση του κόσμου μας, εφόσον με ρήση της νώσης αυτής μπορούν να προκύψουν νέοι ισ υρισμοί. Για το ό ο αυτό, και ια να μπορέσουμε να τη διορ ώσουμε, ρησιμοποιούμε τα αξιώματα της εκάστοτε οντο ο ίας, που περι ράφουν τον κόσμο αυτό, ώστε να πρα ματοποιη ούν διερ ασίες συ ο ιστικής πάν στο ερώτημα και να παρα ούν ό ες οι απαντήσεις που ικανοποιούν την οντο ο ία και τα δεδομένα. Για το ό ο αυτό ο Motik [103] στην προσπά εια του να με ετήσει αποδοτικούς α όρι μους συ ο ιστικής σε με ά α ABox με έτησε τη σ έση μεταξύ τ ν ΠΛ και τ ν επα ικών άσε ν δεδομέν ν (deductive databases) [37] και πρότεινε μια μέ- οδο ανα ής/μετατροπής μιας SHIQ οντο ο ίας σε ένα πρό ραμμα διαζευκτικής Datalog (disjunctive Datalog) η οποία ασίζεται στη μέ οδο της ανά υσης (resolution) [10]. Επίσης έδειξε ότι τόσο η οντο ο ία όσο και το προκύπτ ν πρό ραμμα διαζευκτικής Datalog συνεπά ονται το ίδιο σύνο ο από ασικά ε ονότα (ground 6 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

31 Κεφάλαιο 1. Εισαγωγή facts). Ο α όρι μος αυτός υ οποιή ηκε στο σύστημα KAON2 1 και έδειξε ότι ασικά προ ήματα συ ο ιστικής τ ν ΠΛ μπορούν να υ ούν με τη ρήση τε νικών επα- ικών άσε ν δεδομέν ν. Παρόμοιες ερ ασίες αποτε ούν η δου ειά τ ν Krötsch et al. [89], οι οποίοι πρότειναν ένα α όρι μο ανα ής (reduction algorithm) ια ELP οντο ο ίες σε κανόνες Datalog. Τέ ος ο Kazakov [84] όρισε μια σειρά από με όδους ανά υσης ια ποικί ες Περι ραφικές Λο ικές της οικο ένειας EL. Οι παραπάν ερ ασίες έδειξαν ότι τε νικές που στηρίζονται στη μέ οδο της ανά υσης (resolution) α ά και στις (επα ικές) άσεις δεδομέν ν μπορούν να ρησιμοποιη ούν αποτε εσματικά ια την διεκπεραί ση υπηρεσιών συ ο ιστικής στις Περι ραφικές Λο ικές. Κα ώς όμ ς η πο υπ οκότητα της συ ο ιστικής σε πο ύ εκφραστικές ώσσες Περι ραφικών Λο ικών είναι στην ειρότερη περίπτ ση co-np-π ήρης [93] ως προς τα δεδομένα (data complexity) σε σ έση δη αδή με το μέ ε ος του ABox η πο υπ οκότητα απάντησης Συζευκτικών Ερ τημάτ ν είναι απα ορευτική ια πρακτικές εφαρμο ές. Για να είναι εφικτή η απάντηση Συζευκτικών Ερ τημάτ ν πάν σε πο ύ με ά α ABox είναι απαραίτητο οι α όρι μοι απάντησης να είναι βατοί (tractable) ς προς τα δεδομένα, όταν δη αδή το ερώτημα και η οντο ο ία είναι δεδομένες. Για το ό ο αυτό αναπτύ ηκαν ώσσες Περι ραφικών Λο ικών που είναι ατές, όπ ς η οικο ένεια σσών DL-Lite [34, 33, 31], η EL [8] και η οικο ένεια της Datalog ± [25, 28]. Η ανάπτυξη τ ν σσών αυτών ασίστηκε στην ιδιότητα της επανεγγραψιμότητας (rewritability) ια τις Περι ραφικές Λο ικές. Η ιδιότητα αυτή ορίζει ότι δεδομένου ενός Συζευκτικού Ερ τήματος και μιας οντο ο ίας, το ερώτημα μπορεί να μετασ ηματιστεί σε ένα νέο ερώτημα, που ονομάζεται επανεγγραφή (rewriting), το οποίο περιέ ει τους περιορισμούς της οντο ο ίας. Πιο συ κεκριμένα, η οικο ένεια σσών της DL-Lite είναι επανεγγράψιμη σε πρώτη-τάξη (first-order rewritability) με το αρ ικό Συζευκτικό Ερώτημα να μετασ ηματίζεται σε μια επανε ραφή Συνό ου Συζευκτικών Ερ τημάτ ν, ενώ οι οικο ένειες της EL και της Datalog ± είναι επανεγγράψιμες σε Datalog (Datalog rewritable) με το αρ ικό Συζευκτικό Ερώτημα να μετασ ηματίζεται στην ειρότερη περίπτ ση σε ένα πρό ραμμα Datalog. Στη συνέ- εια, ια κά ε ABox, το οποίο όπ ς αναφέραμε και προη ουμέν ς μπορεί να είναι απο ηκευμένο και σε μια άση δεδομέν ν, σ εσιακή ή επα ική αντίστοι α, η απάντηση του ερ τήματος προκύπτει από την αποτίμηση του επανε ραμμένου ερ τήματος πάν στα δεδομένα. Για παράδει μα επανε ραφή του ερ τήματος Φοιτητής(x) Φοιτητής(y), παρακολουθεί(x, z) παρακολουθεί(y, z) Q A (x, y, z) που παρουσιάσαμε παραπάν, με άση το TBox T = { συμφοιτητήςμε. Φοιτητής} είναι το σύνο ο τ ν ερ τημάτ ν: Φοιτητής(x) Φοιτητής(y) παρακολουθεί(x, z) παρακολουθεί(y, z) Q A (x, y, z) Φοιτητής(x) συμφοιτητήςμε(y, z 1 ) παρακολουθεί(x, z) παρακολουθεί(y, z) Q A (x, y, z) συμφοιτητήςμε(x, z 2 ) Φοιτητής(y) παρακολουθεί(x, z) παρακολουθεί(y, z) Q A (x, y, z) συμφοιτητήςμε(x, z 2 ) συμφοιτητήςμε(y, z 1 ) παρακολουθεί(x, z) παρακολουθεί(y, z) Q A (x, y, z) με τις z 1, z 2 να είναι νέες μετα ητές. Παρατηρούμε ότι το σύνο ο τ ν ερ τημάτ ν αυτών προκύπτει από την αντικατάσταση του ατόμου Φοιτητής(k) με το άτομο 1 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 7

32 Παρουσίαση Προβλήματος συμφοιτητήςμε(k, z i ), όπου k {x, y} και i = {1, 2}. Η διαδικασία ια την κατασκευή της επανε ραφής ενός ερ τήματος ονομάζεται επανεγγραφή ερωτημάτων (query rewriting) και αποτε εί το κύριο έμα που α μας απασ ο ήσει στη συνέ εια της διατρι ής. Η πο υπ οκότητα ια την αποτίμηση ερ τημάτ ν πρώτης-τάξης ανήκει στην κ άση πο υπ οκότητας AC 0 [112, 166, 31] που περιέ εται στην LOGSPACE, ενώ η πο υπ οκότητα ια την αποτίμηση προ ραμμάτ ν Datalog είναι PTIMEπ ήρης [112, 166, 129, 88, 90], σε σ έση με τα δεδομένα. Συνεπώς, η απάντηση ερ τημάτ ν ια ο ικές που είναι επανε ράψιμες είναι αμη ής πο υπ οκότητας. Τα τε ευταία ρόνια η με έτη της επανε ραψιμότητας έ ει παρουσιάσει ιδιαίτερη άν ιση τόσο από άποψη με έτης πο υπ οκότητας [33, 67, 85, 109] όσο και στην κατασκευή διαφορετικών α ορί μ ν και συστημάτ ν επανε ραφής ερ τημάτ ν [31, 116, 132, 40, 64, 108, 49, 127]. 1.3 Παρουσίαση Προ ήματος Ό οι οι α όρι μοι επανε ραφής ερ τημάτ ν που ν ρίζουμε εκτε ούνται κά ε φορά από την αρ ή ρίς να αμ άνουν υπ όψιν και να εκμετα εύονται προη ούμενες εκτε έσεις, ακόμα και αν διαδο ικά ερ τήματα έ ουν πο ύ μικρές διαφορές, το οποίο είναι πο ύ συ νό φαινόμενο. Για παράδει μα, σε διάφορα σενάρια στο Διαδίκτυο [19] έ ει αποδει εί ότι οι ρήστες συνή ς έτουν πρώτα ένα ενικό ερώτημα και στη συνέ εια, ανά ο α με την απάντηση που παίρνουν, το τροποποιούν προσ έτοντας ή αφαιρώντας κάποιους περιορισμούς, κάνοντας το ερώτημα τους πιο συ κεκριμένο ή πιο ενικό [80, 114, 79]. Συνεπώς, το τε ικό ερώτημα ενδε ομέν ς να είναι ν στό μόνο ύστερα από αρκετές τροποποιήσεις. Για παράδει μα, κάποιος ρήστης μπορεί αρ ικά να ζητήσει από μια άση δεδομέν ν με φοιτητές να ανακτη ούν ό οι οι φοιτητές ρησιμοποιώντας το παρακάτ συζευκτικό ερώτημα: Φοιτητής(x) Q A (x) Στη συνέ εια ο ρήστης μπορεί να τροποποιήσει την αναζήτηση του ζητώντας μόνο εκείνους τους φοιτητές που παρακο ου ούν ένα οποιοδήποτε μά ημα, επεκτείνοντας το προη ούμενο ερώτημα με το άτομο παρακολουθεί(x, y) έτοντας έτσι το παρακάτ συζευκτικό ερώτημα: Φοιτητής(x) παρακουλουθεί(x, y) Q A (x) Ακο ού ς, το νέο ερώτημα μπορεί να τροποποιη εί επιπ έον ζητώντας εκτός από τους φοιτητές να ανακτη εί και το μά ημα που παρακο ου ούν. Αυτό μπορεί να ίνει με την προσ ήκη της μετα ητής y στις διακεκριμένες μετα ητές (μετα ητές απάντησης), οπότε έ ουμε το παρακάτ συζευκτικό ερώτημα: Φοιτητής(x) παρακουλουθεί(x, y) Q A (x, y) Επιπ έον, ο ρήστης μπορεί να τροποποιήσει και πά ι το ερώτημα του ζητώντας να επιστραφούν μόνο τα μα ήματα τα οποία παρακο ου εί κάποιος φοιτητής, αφαιρώντας 8 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

33 Κεφάλαιο 1. Εισαγωγή δη αδή την μετα ητή x από τις διακεκριμένες μετα ητές και έτοντας το παρακάτ συζευκτικό ερώτημα: Φοιτητής(x) παρακουλουθεί(x, y) Q A (y) Τέ ος, το νέο αυτό ερώτημα μπορεί να τροποιη εί περαιτέρ ζητώντας να επιστραφούν τα μα ήματα που παρακο ου εί κάποιος ρίς να είναι απαραίτητα φοιτητής, αφαιρώντας δη αδή από το προη ούμενο ερώτημα το άτομο Φοιτητής(x) και έτοντας συνεπώς το παρακάτ συζευκτικό ερώτημα: παρακουλουθεί(x, y) Q A (y) Σε ό ες αυτές τις περιπτώσεις ό α τα υπάρ οντα συστήματα επανε ραφής παρά ουν μια επανε ραφή ια κά ε ερώτημα που έ ει τροποποιη εί εκτε ώντας κά ε φορά τον α όρι μο τους εξαρ ής, ρίς να ρησιμοποιήσουν την π ηροφορία που μό ις έ ουν παρά ει, παρό ο που τα ερ τήματα αυτά παρουσιάζουν πο ύ μικρές διαφορές μεταξύ τους. Στην παρούσα διατρι ή με ετάμε το πρό ημα της επανε ραφής ερ τημάτ ν που έ ουν τροποποιη εί με ό ους τους τρόπους που περι ράψαμε παραπάν ρησιμοποιώντας όσο το δυνατόν περισσότερο την επανε ραφή που έ ει κατασκευαστεί ια το αρ ικό ερώτημα. Πιο συ κεκριμένα, ια ένα TBox T, ένα ερώτημα Q, και μια επανε ραφή R που έ ει υπο ο ιστεί προη ούμενα ια τα Q, T με ετάμε πώς μπορούμε να υπο ο ίσουμε μια επανε ραφή ια ένα νέο ερώτημα που προκύπτει από το Q προσ έτοντας ή αφαιρώντας κάποια μετα ητή στις μετα ητές απάντησης του ή κάποιο άτομο στο σώμα του, εκμετα ευόμενοι όσο το δυνατόν περισσότερο τη δο είσα επανε ραφή R, αποφεύ οντας να την υπο ο ίσουμε εξαρ ής. Στη συνέ εια, ια να ε τιώσουμε την απόδοση τ ν α ορί μ ν αυτών παρουσιάζουμε μια σειρά από ε τιστοποιήσεις. Αυτό που παρουσιάζει ιδιαίτερο ενδιαφέρον είναι το ε ονός π ς οι τε νικές μας ια την επανε ραφή ερ τημάτ ν που έ ουν επεκτα εί με νέα άτομα έτουν τις άσεις ια έναν πρ τότυπο (επαυξητικό) α όρι μο ια την επανε ραφή στα ερών ερ τημάτ ν. Πιο συ κεκριμένα, δεδομένου ενός (προκα ορισμένου) ερ τήματος μπορεί κανείς να επι έξει ένα από τα άτομα του, να υπο ο ίσει μια επανε ραφή ια αυτό, και στη συνέ εια επανα ηπτικά να προσ έσει τα υπό οιπα άτομα επεκτείνοντας κά ε φορά την προη ουμέν ς υπο ο ισμένη επανε ραφή. Όταν έ ουμε επεξερ αστεί ό α τα άτομα τότε α έ ουμε υπο ο ίσει μια επανε ραφή ια το αρ ικό ερώτημα. Βασιζόμενοι σε αυτή την ιδέα παρουσιάζουμε ένα ανα υτικό α όρι μο επανε ραφής ερ τημάτ ν ια συζευκτικά ερ τήματα πάν από οντο ο ίες DL-Lite κα ώς και ένα σύνο ο από ε τιστοποιήσεις οι οποίες αυξάνουν σημαντικά την αποδοτικότητα του α ορί μου μας. Αξίζει να σημειώσουμε ότι απ όσο ν ρίζουμε αυτή είναι η πρώτη ε ρητική και πρακτική με έτη του προ ήματος αυτού, τόσο στον ώρο τ ν οντο ο ιών όσο και στον ώρο της ε ρίας άσε ν δεδομέν ν και πιο συ κεκριμένα στον ώρο της απάντησης ερ τημάτ ν με άση περιορισμούς. Τέ ος, στην παρούσα διατρι ή με ετάμε ένα ά ο πρό ημα που συνδέεται άρρηκτα με την απάντηση ερ τημάτ ν. Πρόκειται ια το πρό ημα της απάντησης ερ τημάτ ν πάν από ένα δίκτυο οντο ο ιών [121, 82, 57, 50, 139]. Είναι ιδιαίτερα Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 9

34 Συνεισφορά και Δομή της Διατριβής σύνη ες στο π αίσιο του Σημασιο ο ικού Ιστού, να υπάρ ουν οντο ο ίες που περι- ράφουν το ίδιο, ή επικα υπτόμενα πεδία ενδιαφέροντος, α ά παρό α αυτά να είναι ετερο ενείς. Πιο συ κεκριμένα, μια οντότητα, έννοια ή ρό ος, μπορεί να ορίζεται με διαφορετικά ονόματα, α ά και διαφορετικούς τρόπους σε δύο οντο ο ίες. Για παράδει μα η έννοια του κινητού τη εφώνου μπορεί να ορίζεται σε μια οντο ο ία από την έννοια ΚινητόΤηλέφωνο ενώ σε μια ά η από την έννοια ΚινΤηλέφωνο, ή ακόμα και από την έννοια Τηλέφωνο ΦορητήΣυσκευή. Για να μπορέσει να επιτευ εί σημασιολογική διαλειτουργικότητα (semantic interoperability) που είναι απαραίτητη στο π αίσιο του Σημασιο ο ικού Ιστού, οι ετερο ενείς αυτές οντο ο ίες πρέπει να αντιστοι ιστούν κατασκευάζοντας έτσι ένα δίκτυο οντο ο ιών. Παρό α αυτά, οι περισσότερες τε νικές αντιστοί ισης [50] δεν αμ άνουν υπ όψιν τη σημασιο ο ία τ ν οντο ο- ιών οδη ώντας έτσι στην κατασκευή αντιστοι ίσε ν που προκα ούν ασυνέπειες. Με ά α ό ια, οι αντιστοι ίσεις που προκύπτουν δεν μπορούν να ερμηνευτούν ς σημασιο ο ικές σ έσεις ανάμεσα στις οντότητες τους, ε ονός που είναι απαραίτητο ια την ολοκλήρωση οντολογιών (ontology integration) και την απάντηση ερ τημάτ ν πάν από ένα δίκτυο οντο ο ιών. Για το ό ο αυτό τα τε ευταία ρόνια έ ουν υπάρξει διάφορες προσπά ειες ια την επικύρ ση τ ν αντιστοι ίσε ν ρησιμοποιώντας κυρί ς πι ανοτικές προσε ίσεις [30, 36]. Οι προσε ίσεις αυτές όμ ς, υποφέρουν από περιορισμούς ό της φύσης τ ν αντιστοι ίσε ν και του τρόπου με τον οποίο υπο ο ίζονται οι πι ανότητες. Έτσι, στην διατρι ή αυτή παρουσιάζουμε μια τε εί ς διαφορετική προσέ ιση ια να μπορέσουμε να ερμηνεύσουμε τις αντιστοι ίσεις. Υπο έτοντας ότι μια αντιστοί ιση δη ώνει την ομοιότητα ανάμεσα σε δύο οντότητες, μπορούμε να ανα έσουμε τα άτομα που ανήκουν στην πρώτη έννοια, και στην δεύτερη με ένα συ κεκριμένο α μό, που είναι ακρι ς η σημασιο ο ία τ ν συναρτήσ ν συμμετο ής της Ασαφούς Συνο ο ε ρίας [168, 86] και της Ασαφούς Λο ικής [73]. Ο α μός συμμετο ής κα- ορίζεται από το α μό της σ έσης ομοιότητας της αντιστοί ισης, και υπο ο ίζεται από κάποια τε νική αντιστοί ισης. Έτσι οιπόν, ρησιμοποιώντας τις αντιστοι ίσεις που παρά ονται ια να κατασκευάσουμε ασαφείς ισ υρισμούς, παρέ ουμε μια τυπική ερμηνεία τ ν αντιστοι ίσε ν. Επιπ έον, ρησιμοποιώντας το π αίσιο τ ν ασαφών ΠΛ [156, 157, 155] έ ουμε τη δυνατότητα να εντοπίσουμε και να ύσουμε τυ όν ασυνέπειες. 1.4 Συνεισφορά και Δομή της Διατρι ής Η κύρια συνεισφορά της διατρι ής μας αφορά στο πρό ημα της επανε ραφής ερ τημάτ ν. Τα αποτε έσματα μας σ ετικά με το πρό ημα αυτό έ ουν πο ές ε ρητικές και πρακτικές συνέπειες και παρέ ουν δυνατότητες ια περαιτέρ με οντική έρευνα. Αρ ικά δεί νουν ότι η επανε ραφή ερ τημάτ ν τα οποία έ ουν τροποποιη- εί μπορεί να πρα ματοποιη εί ιδιαίτερα αποδοτικά ια ό ες τις επανε ράψιμες ΠΛ, ρησιμοποιώντας την π ηροφορία, επανε ραφή, που έ ει ήδη υπο ο ιστεί ια το αρ- ικό ερώτημα. Επιπ έον, όσον αφορά στην DL-Lite τα αποτε έσματα μας δεί νουν π ς η επανε ραφή στα ερών, προκα ορισμέν ν, ερ τημάτ ν μπορεί να πρα ματο- 10 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

35 Κεφάλαιο 1. Εισαγωγή ποιη εί σε με ά ο α μό παρά η α, κάτι το οποίο από όσο ν ρίζουμε δεν ήταν προτέρ ς ν στό. Επιπρόσ ετα, η ανεξάρτητη επεξερ ασία τ ν ατόμ ν έδειξε ότι ένα πο ύ ν στό πρό ημα του πρ τότυπου α ορί μου ια την DL-Lite [31], αυτό του ήματος μεί σης, μπορεί να ε τι εί σημαντικά. Ακο ού ς, τα αποτε έσματα μας δίνουν τη δυνατότητα ια την με έτη αποδοτικών με όδ ν ια την απάντηση ερ τημάτ ν, εφόσον ενδε ομέν ς να μπορούμε να εκμετα ευτούμε τα π εονεκτήματα που αποκομίζουμε από την επαυξητική επανε ραφή ερ τημάτ ν. Τέ ος, τα ιδιαίτερα εν αρρυντικά αποτε έσματα ια την αποδοτικότητα του επαυξητικού α όρι μου επανε ραφής που παρουσιάζουμε δίνουν τη δυνατότητα ια με έτη α ορί μ ν που ρησιμοποιούν την επαυξητική αυτή τε νική ια επανε ραφή ερ τημάτ ν ια πιο εκφραστικές οντο ο ίες όπ ς ELHI και Horn-SHIQ σε επανε ραφές Datalog και Disjunctive Datalog αντίστοι α. Τέ ος, όσον αφορά στην απάντηση ερ τημάτ ν μέσ δικτύου οντο ο ιών η με- έτη μας δεί νει π ς η Ασαφής Συνο ο ε ρία και η Ασαφής Λο ική μπορούν να ρησιμοποιη ούν ια την απόδοση σημασιο ο ίας στις αντιστοι ίσεις ανάμεσα σε οντο ο ίες, και π ς μετά την επικύρ ση τ ν αντιστοι ίσε ν μπορεί να πρα ματοποιη εί απάντηση ερ τημάτ ν. Η διατρι ή αυτή ορ ανώνεται ς εξής: Στο κεφά αιο 2 παρουσιάζουμε το μα ηματικό υπό α ρο που είναι απαραίτητο ια την κατανόηση του υπό οιπου της διατρι ής. Πιο συ κεκριμένα, αρ ικά παρουσιάζουμε μια σύντομη περι ραφή τ ν υπαρξιακών κανόν ν με τους οποίους μπορούμε να εκφράσουμε ΠΛ που είναι επανε ράψιμες. Συνε ίζοντας, κάνουμε μια σύντομη εισα ή στους κανόνες συμπερασμού ανά υσης η ρήση τ ν οποί ν δίνει τη δυνατότητα ια εξα ή νέας νώσης από την ήδη υπάρ- ουσα. Στη συνέ εια, εισά ουμε τα Συζευκτικά Ερ τήματα, ενώ ακο ού ς παρουσιάζουμε μια σύντομη εισα ή στην οικο ένεια τ ν Περι ραφικών Λο- ικών DL-Lite κα ώς και στα προ ήματα συ ο ιστικής τ ν Περι ραφικών Λο ικών ενικότερα. Τέ ος, ορίζουμε το πρό ημα της απάντησης ερ τημάτ ν μέσ επανε ραφής, ενώ παρουσιάζουμε και τον α όρι μο επανε ραφής ερ τημάτ ν PerfectRef [31]. Στο κεφά αιο 3 με ετάμε το πρό ημα του υπο ο ισμού μιας επανε ραφής ια ερ τήματα που έ ουν τροποποιη εί, αποφεύ οντας να την υπο ο ίσουμε εξαρ ής, ρησιμοποιώντας όσο το δυνατόν περισσότερη π ηροφορία από την επανε ραφή που έ ει υπο ο ιστεί προη ουμέν ς ια το αρ ικό ερώτημα. Παρουσιάζουμε μια σειρά από παραδεί ματα που μας κα οδη ούν διαισ ητικά ια την κατασκευή α ορί μ ν ια ερ τήματα που έ ουν τροποποιη εί με προσ ήκη ή αφαίρεση διακεκριμέν ν μετα ητών ή ατόμ ν. Τέ ος, παρουσιάζουμε μια σειρά από ιδιότητες που ε τιστοποιούν την απόδοση τ ν α ορί μ ν μας, όπου αυτό κρίνεται απαραίτητο, και αφορούν στην ανα νώριση (μη-)περιττών και μη-υπα όντ ν ερ τημάτ ν. Στο κεφά αιο 4 εστιάζουμε στο πρό ημα της επέκτασης ενός ερ τήματος με άτομα ια την ΠΛ DL-Lite R. Πιο συ κεκριμένα, με ετάμε το πρό ημα υπο ο- ισμού μιας επανε ραφής ια ερ τήματα που έ ουν επεκτα εί με νέα άτομα, Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 11

36 Συνεισφορά και Δομή της Διατριβής δεδομένης μιας επανε ραφής ια το αρ ικό ερώτημα, και παρουσιάζουμε μια σειρά από παραδεί ματα που μας κα οδη ούν διαισ ητικά στον α όρι μο μας. Επίσης παρουσιάζουμε ανα υτικούς α όρι μους και τέ ος πώς μπορούμε να ε τιστοποιήσουμε το ήμα μεί σης που εμφανίζεται στον πρ τότυπο α όρι μο PerfectRef που προτά ηκε ια την DL-Lite. Στο κεφά αιο 5 με ετάμε το πρό ημα της επαυξητικής επανε ραφής ερ τημάτ ν ια την ΠΛ DL-Lite R που στηρίζεται στην σταδιακή επεξερ ασία τ ν ατόμ ν ενός ερ τήματος και παρουσιάζουμε ανα υτικούς α όρι μους. Επίσης παρουσιάζουμε μια σειρά από ε τιστοποιήσεις που αφορούν στο ήμα κατά το οποίο επεξερ άζεται το τε ευταίο άτομο του ερ τήματος και στην ανα νώριση (μη-)περιττών και μη-υπα όντ ν ερ τημάτ ν. Οι ε τιστοποιήσεις αυτές όπ ς α φανεί και στο επόμενο κεφά αιο αυξάνουν σημαντικά την αποδοτικότητα του α ορί μου μας. Στο κεφά αιο 6 παρέ ουμε μια ανα υτική αξιο ό ηση τ ν προτεινόμεν ν α - ορί μ ν, αντιπαρα ά οντάς τους με υπάρ οντα συστήματα. Αρ ικά, συ κρίνουμε τους α όρι μους επανε ραφής τροποποιημέν ν ερ τημάτ ν που παρουσιάζουμε στο κεφά αιο 3 ρησιμοποιώντας ένα π αίσιο που αφορά σε οντο- ο ίες DL-Lite R και ένα π αίσιο που αφορά σε οντο ο ίες ELHI. Τα αποτε έσματα μας δεί νουν π ς οι α όρι μοι μας παρουσιάζουν εφάμι η, και σε μερικές περιπτώσεις κα ύτερη απόδοση από τα πιο ρή ορα συστήματα ια επανε ραφή ερ τημάτ ν ια οντο ο ίες DL-Lite R και ELHI, αντίστοι α. Στη συνέ εια, όσον αφορά στους α ορί μους που σ ετίζονται με την επαυξητική επανε ραφή στα ερών ερ τημάτ ν ια οντο ο ίες εκφραστικότητας DL-Lite R, που περι ράφουμε στα κεφά αια 4 και 5, συ κρίνουμε αρ ικά τον πρ τότυπο α όρι μο PerfectRef με μια έκδοσή του η οποία ρησιμοποιεί το ε τιστοποιημένο ήμα μεί σης. Επίσης συ κρίνουμε τον α όρι μο PerfectRef (με το ε τιστοποιημένο ήμα μεί σης) με διάφορες εκδόσεις του δικού μας συστήματος. Τέ ος, συ κρίνουμε το σύστημα μας με ά α υπάρ οντα συστήματα επανε ραφής ερ τημάτ ν που υποστηρίζουν την ίδια (ή και με α ύτερη) εκφραστικότητα και ήταν ε εύ ερα δια έσιμα. Τα αποτε έσματα μας δεί νουν ότι ο επαυξητικός υπο ο ισμός της επανε ραφής είναι στην π ειονότητα τ ν περιπτώσε ν η πιο αποδοτική μέ οδος ια την ΠΛ DL-Lite R. Ειδικά, όταν τον συ κρίνουμε με τον αρ ικό α όρι μο ια την DL-Lite R [31], στον οποίο στηρίζεται ο α όρι μος μας, τα αποτε έσματα δεί νουν ότι η προσέ ιση μας είναι πιο ρή ορη ια αρκετές τάξεις με έ ους. Κάτι τέτοιο μπορεί να δικαιο- ο η εί από τη πιο στο ευμένη στρατη ική που επεξερ άζεται ένα άτομο τη φορά σε αντί εση με την μή προσέ ιση που ακο ου είται από τα περισσότερα συστήματα. Στο κεφά αιο 7 με ετάμε το πρό ημα της απάντησης ερ τημάτ ν πάν από ένα δίκτυο οντο ο ιών. Για την κατασκευή ενός δικτύου οντο ο ιών είναι απαραίτητη η ρήση κάποιου α όρι μου αντιστοί ισης οντο ο ιών. Οι περισσότεροι όμ ς α όρι μοι αντιστοί ισης δεν αμ άνουν υπ όψιν τη σημασιο ο ία 12 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

37 Κεφάλαιο 1. Εισαγωγή τ ν οντο ο ιών παρά οντας αντιστοι ίσεις που οδη ούν τις οντο ο ίες σε ασυνέπειες. Για το ό ο αυτό στο κεφά αιο αυτό παρουσιάζουμε έναν α όρι μο επικύρ σης αντιστοι ίσε ν που στηρίζει τη ειτουρ ία του στην ερμηνεία τ ν αντιστοι ίσε ν με ρήση της Ασαφούς Συνο ο ε ρίας και της Ασαφούς Λο ικής. Τέ ος, παρουσιάζουμε τον α όρι μο μας ια την απάντηση ερ τημάτ ν μέσ αντιστοι ίσε ν. Στο κεφά αιο 8 παρουσιάζουμε με με α ύτερη επτομέρεια ι ιο ραφία σ ετική με τα προ ήματα που πρα ματευόμαστε, ενώ το κεφά αιο 9 κ είνει τη διατρι ή συζητώντας πά ι τη συνεισφορά μας και παρουσιάζοντας έματα ια με οντική έρευνα. Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 13

38 Συνεισφορά και Δομή της Διατριβής 14 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

39 Κεφά αιο 2 Θε ρητικό Υπό α ρο Στο κεφά αιο αυτό κάνουμε μια σύντομη εισα ή στην απαραίτητη ορο ο ία και παρουσιάζουμε ε ρίες, ορισμούς και αποτε έσματα που είναι απαραίτητα ια την κατανόηση του υπο οίπου της διατρι ής. Πιο συ κεκριμένα στην ενότητα 2.1 παρουσιάζουμε κάποιους ασικούς ορισμούς από τη Λο ική Πρώτης Τάξης και κάνουμε μια εισα ή στους υπαρξιακούς κανόνες που μπορούν να ρησιμοποιη ούν ια την αναπαράσταση οντο ο ιών. Συνε ίζοντας στην ενότητα 2.2 παρουσιάζουμε τον κανόνα συμπερασμού ανά υσης ο οποίος ρησιμοποιείται ια την εξα ή συμπερασμάτ ν από δοσμένες υπο έσεις. Στη συνέ εια, στην ενότητα 2.3 κάνουμε μια εισα ή στα Συζευκτικά Ερ τήματα παρουσιάζοντας τη σύνταξη και τη σημασιο ο- ία τους. Ακο ού ς, στην ενότητα 2.4 παρουσιάζουμε τη σύνταξη, τη σημασιο ο ία και τις υπηρεσίες συ ο ιστικής της οικο ένειας σσ ν DL-Lite. Παρουσιάζουμε τις ώσσες DL-Lite core, DL-Lite F και την DL-Lite R κα ώς και κάποια από τα προ- ήματα συ ο ιστικής που υποστηρίζουν οι ΠΛ (ενότητα 2.4.2). Επιπ έον παρουσιάζουμε το πρό ημα απάντησης συζευκτικών ερ τημάτ ν μέσ της διαδικασίας της επανε ραφής (ενότητα 2.5) και στην ενότητα παρουσιάζουμε μια ανασκόπηση του α όρι μου επανε ραφής ερ τημάτ ν PerfectRef ο οποίος μπορεί να εφαρμοστεί σε ώσσες της οικο ένειας DL-Lite. Τέ ος στην ενότητα 2.6 παρουσιάζουμε μια μικρή εισα ή στους κατευ υνόμενους ράφους. 2.1 Υπαρξιακοί Κανόνες και Προτάσεις Στην ενότητα αυτή παρουσιάζουμε κάποιους ασικούς ορισμούς από τη Λο ική Πρώτης Τάξης που α μας οη ήσουν στον κατανόηση του υπο οίπου της διατρι ής. Για πιο εκτενή ανά υση ο ενδιαφερόμενος ανα νώστης παραπέμπεται στα [148, 53, 4, 123]. Έστ P πεπερασμένο ή μετρήσιμο σύνο ο από κατηγορήματα (predicates), F περεπασμένο ή μετρήσιμο σύνο ο από συναρτησιακά σύμβολα (function symbols), C πεπερασμένο ή μετρήσιμο σύνο ο από σταθερές (constants), και V άπειρο σύνο ο από μεταβλητές (variables). Κά ε κατη όρημα σ ετίζεται με ένα ετικό ακέραιο n που ονομάζεται βαθμός του κατηγορήματος (arity). Με Σ(P, F, C, V) δη ώνουμε τη ώσσα Λο ικής Πρώτης Τάξης που ορίζεται από τα P, F, C και V. Το σύνο ο τ ν όρων (terms) T (Σ) είναι το μικρότερο σύνο ο ια το οποίο 15

40 Υπαρξιακοί Κανόνες και Προτάσεις ισ ύει C V T (Σ) ή εάν f F έ ει α μό n και t i T (Σ) ια 1 i n, τότε f(t 1,..., t n ) T (Σ). Όροι της μορφής f(t 1,..., t n ) ονομάζονται συναρτησιακοί όροι (functional terms). Για τη συνέ εια της διατρι ής ε ρούμε μόνο συναρτησιακούς όρους που έ ουν α μό 1. Ένας όρος είναι βασικός (ground term) εάν δεν περιέ ει μετα ητές. Μια ατομική φόρμουλα (atomic formula) ή α ιώς άτομο (atom) είναι μια έκφραση της μορφής P (t 1,..., t n ), όπου το P είναι ένα κατη όρημα α μού n και t i T (Σ) ια 1 i n είναι όροι. Το σύνο ο τ ν ατόμων A(Σ) είναι το μικρότερο σύνο ο ια το οποίο εάν P P τότε P (t 1,..., t n ) A(Σ). Για ένα πεπερασμένο σύνο ο από άτομα {P 1,..., P n }, ορίζουμε με {P 1,..., P n } τη φόρμου α P 1... P n. Επίσης, ένα λεκτικό (literal) L ειναι ένα άτομο ή η άρνηση ενός ατόμου. Στην πρώτη περίπτ ση έ ουμε ένα ετικό εκτικό ενώ στη δεύτερη ένα αρνητικό εκτικό. Μια αντικατάσταση (substitution) είναι μια συνάρτηση με πεδίο ορισμού το V και πεδίο τιμών το T (Σ) η οποία μπορεί να αναπαραστα εί ς το σύνο ο τ ν αντιστοι ίσε ν {x 1 t 1,..., x n t n }, όπου x i V και t i T (Σ). Η εφαρμο ή μιας αντικατάστασης σ σε έναν όρο t, ράφεται tσ και ορίζεται με cσ = c εάν c C, και xσ = σ(x) εάν x V. Η εφαρμο ή μιας αντικατάστασης σ σε ένα άτομο P (t 1,..., t n ) ορίζεται ς P (t 1 σ,..., t n σ). Η σύνθεση των αντικαταστάσεων (composition of substitutions) δ και σ, ράφεται ς δ σ ή δσ, και ια κάποιο όρο t ορίζεται ς tδ σ = tδσ = (tδ)σ. Μια αντικατάσταση σ είναι πιο γενική (more general) από μια αντικατάσταση δ εάν υπάρ ει μια αντικατάσταση λ τ.. δ = σλ. Επιπ έον, μια αντικατάσταση σ ονομάζεται ενοποιητής (unifier) τ ν όρ ν s και t εάν ισ ύει sσ = tσ ενώ εάν η σ είναι πιο ενική από κά ε ά ο ενοποιητή ( ια τα άτομα αυτά) τότε ονομάζεται πιο γενικός ενοποιητής (most general unifier mgu). Επιπ έον η αντικατάσταση σ = {} ονομάζεται ταυτοτική αντικατάσταση (identity substitution). Επιπρόσ ετα, κά ε αντικατάσταση σ επά ει ένα κατευ υνόμενο ράφο G = V, E, όπου t V ανν ο t είναι ένας όρος στην σ και x, t E ανν x t σ. 1 Τέ ος με dom(σ) = {x 1,..., x n } αναπαριστούμε το σύνο ο μετα ητών του πεδίου ορισμού της αντικατάστασης. Μια πρόταση (clause) είναι μια διάζευξη εκτικών L 1... L n Μια πρόταση α έ εται πρόταση Horn (Horn clause) εάν το πο ύ ένα από τα εκτικά είναι ετικό. Για παράδει μα η πρόταση παρακολουθεί(x, y) Μεταπτυχιακό(y) ΜεταπτυχιακόςΦοιτητής(x) είναι μια πρόταση Horn, όπου τα παρακολουθεί(x, y) και Μεταπτυχιακό(y) είναι αρνητικά εκτικά ια τα κατη ορήματα παραλοκουθεί και Μεταπτυχιακό αντίστοι α, και το ΜεταπτυχιακόςΦοιτητής(x) είναι ετικό εκτικό ια το κατη όρημα ΜεταπτυχιακόςΦοιτητής. Η πρόταση αυτή ράφεται ισοδύναμα και ς: παρακολουθεί(x, y) Μεταπτυχιακό(y) ΜεταπτυχιακόςΦοιτητής(x) που δη ώνει π ς εάν κάποιος παρακο ου εί κάποιο μεταπτυ ιακό μά ημα, τότε είναι μεταπτυ ιακός φοιτητής. Σε μια πρόταση Horn ε ρούμε π ς οι ε εύ ερες μετα ητές τ ν εκτικών προέρ ονται από κα ο ικούς ποσοδείκτες που εμφανίζονται στην αρ ή του τύπου. 1 Μια μικρή εισα ή στους κατευ υνόμενους ράφους δίνεται στην ενότητα Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

41 Κεφάλαιο 2. Θεωρητικό Υπόβαθρο Ένας υπαρξιακός κανόνας (existential rule) (ή απ ά κανόνας) [11, 26], που συ νά ονομάζεται και αξίωμα, είναι μια φόρμου α της μορφής x. z.[ϕ( x, z) y.ψ( x, y)] όπου ϕ( x, z) και ψ( x, y) είναι συζεύξεις από άτομα που δεν περιέ ουν συναρτησιακούς όρους και τα x, y και z είναι ανά δύο διαφορετικά. Η φόρμου α ϕ ονομάζεται σώμα, η φόρμου α ψ ονομάζεται κεφαλή και οι κα ο ικοί ποσοδείκτες συ νά παρα είπονται. Για παράδει μα οι φόρμου ες Καθηγητής(x) y.διδάσκει(x, y) Μάθημα(y) (2.1) ΠροπτυχιακόςΦοιτητής(x) Φοιτητής(x) (2.2) είναι υπαρξιακοί κανόνες. Ο πρώτος δη ώνει π ς εάν κάποιος είναι κα η ητής τότε υπάρ ει κάποιο μά ημα το οποίο διδάσκει, ενώ ο δεύτερος π ς εάν κάποιος είναι προπτυ ιακός φοιτητής τότε α είναι και φοιτητής ενικότερα. Όπ ς φαίνεται και από το παράδει μα οι κα ο ικές μετα ητές παρα είπονται ρίς ά η της ενικότητας. Όταν το διάνυσμα y είναι κενό τότε o κανόνας ονομάζεται κανόνας Datalog (Datalog rule). Για ένα κανόνα Datalog r, ορίζουμε με bd(r) το σύνο ο τ ν ατόμ ν του σώματος του r, και με hd(r) τα άτομα της κεφα ής του. Ένα πρόγραμμα Datalog (Datalog program) είναι ένα πεπερασμένο σύνο ο από κανόνες Datalog. Αξίζει να σημει εί ότι εξ ορισμού οι κανόνες Datalog είναι ασφαλείς (safe) δη αδή, ό ες οι μετα ητές που εμφανίζονται στο διάνυσμα x της κεφα ής του εμφανίζονται και στο σώμα του. Ένας υπαρξιακός κανόνας μπορεί να μετατραπεί σε μια πρόταση (Horn) εάν μετατραπεί σε Κανονική Μορφή Skolem (Skolem Normal Form) [147, 74] με την αφαίρεση τ ν υπαρξιακών ποσοδεικτών και την εισα ή νέ ν συναρτησιακών συμ ό ν. Για παράδει μα ο υπαρξιακός κανόνας (2.1) μπορεί να εκφραστεί με τις παρακάτ προτάσεις Καθηγητής(x) διδάσκει(x, f(x)) Καθηγητής(x) Μάθημα(f(x)) στις οποίες αντί της μετα ητής y έ ουμε τον (ίδιο) συναρτησιακό όρο f(x), ενώ ο υπαρξιακός κανόνας (2.2) μπορεί να εκφραστεί με την πρόταση ΠροπτυχιακόςΦοιτητής(x) Φοιτητής(x) Πάρα πο ές ώσσες οντο ο ιών Horn, όπ ς είναι και η οικο ένεια σσών της DL-Lite [31] (που α περι ραφεί στη συνέ εια), η ELHI [117], κα ώς και η Datalog ± [26] μπορούν να αναπαραστα ούν με τη ρήση υπαρξιακών κανόν ν. Για το ό ο αυτό στη συνέ εια της διατρι ής μας οι υπαρξιακοί κανόνες πο ές φορές α ρησιμοποιούνται αντί τ ν αξι μάτ ν υπα ής ια τον ορισμό μιας οντο ο ίας. 2.2 Κανόνας Συμπερασμού Ανά υσης Ο λογισμός της ανάλυσης (resolution calculus) [125], είναι μια μέ οδος που ρησιμοποιείται ευρέ ς στην απόδειξη θεωρημάτων (theorem proving). Σύμφ να με αυτόν Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 17

42 Κανόνας Συμπερασμού Ανάλυσης από κά ε σύνο ο μη-ικανοποιήσιμ ν προτάσε ν μπορεί να παρα εί μια αντίφαση. Ο ο ισμός της ανά υσης στηρίζεται σε δύο κανόνες συμπερασμού (inference rules). Τον κανόνα της ανάλυσης (resolution) C A D B (C D)σ και τον κανόνα της παραγοντοποίησης (factoring) C A B (C A)σ όπου και στις δύο περιπτώσεις, σ είναι ένας πιο ενικός ενοποιητής τ ν ατόμ ν A και B. Οι κανόνες αυτοί δο έντ ν κάποι ν υπο έσε ν παρέ ουν τη δυνατότητα εξα ής νέ ν προτάσε ν (συμπερασμάτ ν) που ικανοποιούν τις υπο έσεις αυτές. Για τους σκοπούς της παρούσας διατρι ής ένας κανόνας συμπερασμού ανάλυσης (resolution inference rule) είναι μια σ έση ανάμεσα σε προτάσεις η οποία υποσημειώνεται με μια αντικατάσταση και μια ίστα από σύνο α ατόμ ν. Τα στοι εία της σ έσης αυτής μαζί με την αντίστοι η αντικατάσταση και τις ίστες ράφοναι ς εξής: C C 1... C n C [σ, Υ] όπου C είναι μια πρόταση που ονομάζεται κύρια υπόθεση (main premise), C 1,..., C n είναι διακριτές προτάσεις που ονομάζονται παράπλευρες υποθέσεις (side premises), και C είναι το συμπέρασμα (conclusion). Ένας συμπερασμός ορίζεται επίσης από μια π ειάδα της μορφής C, C 1,..., C n, C. Για ένα συμπερασμό C, C 1,..., C n, C, το C απαιτείται να είναι ένα ανα υ έν της C με τις C 1,..., C n μέσ της σύν εσης του πιο ενικού ενοποιητή θ και μιας μετονομασίας ρ. Το ε ονός αυτό εξασφα- ίζει ουσιαστικά ότι το C δεν μοιράζεται μετα ητές με καμία από τις υπο έσεις. Επιπρόσ ετα, σ είναι μια αντιστοί ιση από τις μετα ητές της C σε αυτές του C μέσ της οποίας εσπίζεται μια σύνδεση μεταξύ τους. Πιο συ κεκριμένα, ορίζεται ς το υποσύνο ο τ ν ανα έσε ν στο θ ρ που αντιστοι ίζει μετα ητές από την C σε μη-συναρτησιακούς όρους του C. Επιπ έον, Υ είναι μια ίστα από ζεύ η από σύνο α της μορφής A i, B i που περιέ ουν όρους σ ετικούς με τον συμπερασμό. Πιο συ κεκριμένα, A i είναι ό οι οι όροι από την C που εννοποιούνται με όρους από την i-οστή παράπ ευρη υπό εση C i, ενώ B i είναι οι όροι της C i που εισά ονται στο συμπέρασμα C (μετά την εφαρμο ή της θ ρ). Τυπικά, C = [(C \ i A i)θ ρ i B i], όπου B i C i θ ρ. Για παράδει μα, εάν έ ουμε τις προτάσεις C = ΠροπτυχιακόςΦοιτητής(x) Φοιτητής(x) C 1 = παρακολουθεί(x 1, y 1 ) Προπτυχιακό(y 1 ) ΠροπτυχιακόςΦοιτητής(x 1 ) τότε εφαρμόζοντας τον κανόνα συμπερασμού με κύρια υπό εση την πρόταση C και παράπ ευρη την C 1 παρά εται η πρόταση C = παρακολουθεί(x, y ) Προπτυχιακό(y ) Φοιτητής(x ) 18 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

43 Κεφάλαιο 2. Θεωρητικό Υπόβαθρο με σ = {x x } και Υ = { A, B }, με A = {ΠροπτυχιακόςΦοιτητής(x)} και B = {παρακολουθεί(x, y ), Προπτυχιακό(y )}. Επιπρόσ ετα ένας κανόνας παραγοντοποίησης (factoring inference rule) είναι ένας συμπερασμός ια τον οποίο ισ ύει n = 0, δη αδή μια σ έση ανάμεσα σε δύο προτάσεις η οποία υποσημειώνεται με μια αντικατάσταση και μια ίστα από σύνο α ατόμ ν. Αυτή ράφεται ς εξής: C [σ, Υ] C και ορίζεται επίσης από μια π ειάδα της μορφής C, C. Το σ ορίζεται όπ ς και πριν ενώ εφόσον n = 0 έ ουμε Υ = {, } με αποτέ εσμα το συμπέρασμα C να δίνεται από τη σ έση C = [Cθ ρ]. Για παράδει μα εάν έ ουμε την πρόταση C = διδάσκει(x, y) διδάσκει(z, y) Καθηγητής(x) τότε εφαρμόζοντας τον κανόνα παρα οντοποίησης παρά εται η πρόταση C = διδάσκει(x, y ) Καθηγητής(x ) με σ = {x x, z x }. Ένα σύστημα συμπερασμού Γ είναι μια συ ο ή από κανόνες συμπερασμού ια ένα σύνο ο από προτάσεις N. Για ένα σύνο ο προτάσε ν N με Γ(N) ορίζουμε το σύνο ο ό ν τ ν συμπερασμών που προκύπτουν από το σύστημα Γ και έ ουν ό ες τις υπο έσεις τους στο N. 2.3 Συζευκτικά Ερ τήματα Στην ενότητα αυτή κάνουμε μια εισα ή στη σύνταξη και σημασιο ο ία τ ν συζευκτικών ερ τημάτ ν (ΣΕ) (Conjunctive Queries CQ). Ένα ερώτημα (query) Q είναι ένα πεπερασμένο σύνο ο από κανόνες Datalog (πρό ραμμα Datalog) που περιέ ουν ένα διακριτό κατη όρημα ερ τήματος Q A στο άτομο κεφα ής. Ένα ερώτημα Q αποτε εί ένα Σύνολο από Συζευκτικά Ερωτήματα (ΣΣΕ) (Union of Conjunctive Queries UCQ) εάν είναι ένα πρό ραμμα Datalog ό οι οι κανόνες του οποίου περιέ ουν το κατη όρημα Q A στην κεφα ή α ά ό ι στο σώμα τους. Ένα ΣΣΕ Q ονομάζεται Συζευκτικό Ερώτημα (ΣΕ) (Conjunctive Query CQ) εάν αποτε είται από ακρι ώς έναν κανόνα. Στη συνέ εια της διατρι ής μας κάνουμε συ νά κατά ρηση του συμ ο ισμού και ρησιμοποιούμε το Q ια να αναφερ ούμε στον μοναδικό κανόνα ενός ΣΕ. Ό ες οι μετα ητές που εμφανίζονται στην κεφα ή ενός ΣΕ ονομάζονται διακεκριμένες ή μεταβλητές απάντησης (distinguished ή answer variables). Ό ες οι ά ες μετα ητές του ερ τήματος ονομάζονται μη-διακεκριμένες (undistinguished). Για ένα ερώτημα Q, var(q) είναι το σύνο ο ό ν τ ν μετα ητών που εμφανίζονται στο Q και avar(q) το σύνο ο ό ν τ ν διακεκριμέν ν μετα ητών του. Μια μετα ητή που είναι είτε διακεκριμένη ή εμφανίζεται στο Q του ά ιστον δύο φορές ονομάζεται δεσμευμένη (bound), α ιώς ονομάζεται μη-δεσμευμένη (unbound). Για παράδει μα στο ερώτημα Q 1 = Φοιτητής(x) συμφοιτητήςμε(x, y) Q A (x) Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 19

44 Συζευκτικά Ερωτήματα η μετα ητή x είναι διακεκριμένη (και συνεπώς δεσμευμένη) ενώ η μετα ητή y είναι μη-διακεκριμένη και επειδή εμφανίζεται μόνο μια φορά στο σώμα του ερ τήματος μη-δεσμευμένη. Από την ά η στο ερώτημα Q 2 = Φοιτητής(x) συμφοιτητήςμε(x, y) παρακολουθεί(y, z) Q A (x) η μετα ητή x είναι διακεκριμένη και άρα δεσμευμένη όμοια με πριν, η μετα ητή y είναι μη-διακεκριμένη και δεσμευμένη, εφόσον εμφανίζεται δύο φορές στο σώμα του ερ τήματος και τέ ος, η μετα ητή z είναι μη-διακεκριμένη και μη-δεσμευμένη, αφού εμφανίζεται μόνο μια φορά. Έστ ένα ΣΕ ϕ( x, z) Q A ( x), όπου x = (x 1,..., x n ) και επίσης έστ ένα διάνυσμα μετα ητών y = (y 1,..., y m ). Τότε με την έκφραση ϕ( x, z) Q A ( x, y) ε ρούμε το νέο ερώτημα ϕ( x, z) Q A ( k), όπου k = (x 1,..., x n, y 1,..., y m ). Έστ τώρα ένα ΣΕ Q = ϕ( x, z) Q A ( x), όπου x = (x 1,..., x n ). Έστ επίσης μια ακο ου ία από ετικούς ακεραίους j 1,..., j m ια την οποία n max{j 1,..., j m }. Η προβολή (projection) ενός ΣΕ Q στην ακο ου ία j 1,..., j m, ράφεται π j1,...,j m (Q), και είναι το νέο ΣΕ ϕ( x, z) Q A ( x ) όπου x = (x j1,..., x jm ). Η σ έση π j1,...,j m ονομάζεται τελεστής προβολής (projection operator). Εφαρμόζοντας ια παράδει μα τον τε εστή προ ο ής π 2 στο ερώτημα παίρνουμε το ερώτημα Q 3 = συμφοιτητήςμε(x, y) Q A (x, y) π 2 (Q 3 ) = συμφοιτητήςμε(x, y) Q A (y). Δεδομέν ν δύο ΣΕ Q, Q με διακεκριμένες μετα ητές x και y αντίστοι α, έμε ότι το Q υπάγει (subsumes) το Q [38, 1], εάν υπάρ ει αντικατάσταση σ από τις μετα ητές του Q στις μετα ητές του Q τ.. το σύνο ο Qσ να είναι υποσύνο ο του Q, δη Qσ Q. Για παράδει μα το ερώτημα Q 1 που ορίσαμε παραπάν υπά ει το ερώτημα Q 2 με την ταυτοτική αντικατάσταση. Επιπ έον α έμε ότι δύο ερ τήματα Q και Q είναι ισοδύναμα (equivalent) εάν το Q υπά ει το Q και το Q υπά ει το Q. Από τις ιδιότητες της σ έσης υπά ει [38] έ ουμε ότι εάν το ερώτημα Q υπά ει το Q τότε μπορεί να συμ αίνουν δύο τινά. Είτε το Q υπά ει ένα ερώτημα που προκύπτει από την εφαρμο ή ενός κανόνα συμπερασμού στο Q, έστ Q, είτε το ερώτημα που προκύπτει από την εφαρμο ή ενός κανόνα συμπερασμού στο Q υπά ει το Q. Επιπ έον, ια ένα ΣΣΕ Q και ένα ΣΕ Q 1, έμε ότι το Q 1 είναι περιττό (redundant) στο Q εάν υπάρ ει κάποιο ερώτημα Q 2 Q τ.. Q 2 Q 1 και το Q 2 υπά ει το Q 1. Διαφορετικά έμε ότι το Q 1 είναι μη-περιττό (non-redundant) στο Q. Ακόμα, ια ένα ΣΣΕ Q και ένα ΣΕ Q 1, έμε ότι το Q 1 είναι μη-υπάγον (non-subsumer) στο Q εάν δεν υπάρ ει κάποιο ερώτημα Q 2 Q τ.. Q 2 Q 1 και το Q 1 υπά ει το Q 2. Επιπ έον έμε ότι το Q 1 είναι ισοδύναμο (equivalent) με το Q 2 εάν το ένα υπά ει το ά ο και αντίστροφα. Τέ ος, ια ένα ΣΣΕ Q έμε ότι είναι μη-περιττό ΣΣΕ (nonredundant UCQ) εάν δεν υπάρ ουν Q 1, Q 2 Q τ.. Q 1 Q 2 και το Q 1 υπά ει το 20 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

45 Α όρι μος 1 removeredundant(q) Είσοδος: Ένα ΣΣΕ Q. 1: Αρ ικοποίησε ένα ΣΣΕ Q = Q 2: for all Q 1 Q do 3: for all Q 2 Q με Q 1 Q 2 do 4: if το Q 1 υπά ει τo Q 2 και Q 1 Q then 5: Αφαίρεσε τo Q 2 από το Q 6: end if 7: end for 8: end for 9: return Q Κεφάλαιο 2. Θεωρητικό Υπόβαθρο Q 2. Για να μπορέσουμε να υπο ο ίσουμε ένα μη-περιττό ΣΣΕ ρησιμοποιούμε τον α όρι μο απα οιφής περιττών ερ τημάτ ν removerudantant [116] που φαίνεται στον Α όρι μο 1. Σύμφ να με τον α όρι μο αυτό ια να πάρουμε το μη-περιττό ΣΣΕ εξετάζουμε ό α τα ερ τήματα του ΣΣΕ εισόδου (ανά ζεύ η) και όταν ένα ερώτημα Q 1 υπά εται από κάποιο ά ο Q 2 τότε το αφαιρούμε από το ΣΣΕ. Για τη συνέ εια της διατρι ής μας ε ρούμε ότι ό α τα ΣΕ είναι συνδεδεμένα (connected) [58]. Πιο συ κεκριμένα, έστ ΣΕ Q. Λέμε ότι το Q είναι συνδεδεμένο εάν, ια ό ους τους όρους t, t, υπάρ ει ακο ου ία t 1,..., t n τ.. t 1 = t, t n = t και, ια ό α τα 1 i < n, υπάρ ει ρό ος R τ.. R(..., t i,..., t i+1,...) Q. 2.4 Η Οικο ένεια Γ σσών της DL-Lite Οι Περι ραφικές Λο ικές (ΠΛ) (Description Logics DLs) [9] είναι μια οικο- ένεια σσών αναπαράστασης νώσης, που ασίζονται στη ο ική (logic-based), και έ ουν σ εδιαστεί έτσι ώστε η κατα ραφή της νώσης και η διενέρ εια ερ ασιών συ ο ιστικής πάν σε αυτές να ίνεται με ένα δομημένο και κατανοητό τρόπο. Η κατα ραφή της νώσης στις ΠΛ ίνεται με τη ρήση ατόμων (individuals), εννοιών (concepts) που αναπαριστούν σύνο α από άτομα και ρόλων (roles) που αναπαριστούν δυαδικές σ έσεις ανάμεσα στα άτομα κα ώς και με τη ρήση κατασκευαστών (constructors) που επενερ ούν πάν στις έννοιες και τους ρό ους κατασκευάζοντας ά ες πιο σύν ετες. Για παράδει μα η σύν ετη έννοια Φοιτητής παρακολουθεί.μάθημα αναπαριστά εκείνους τους φοιτητές που παρακο ου ούν του ά ιστον ένα μά ημα. Το σύνο ο τ ν κατασκευαστών που μπορούν να ρησιμοποιη ούν ια την περι ραφή νώσης είναι αρακτηριστικό ια κά ε ΠΛ. Στη συνέ εια με ρήση διαφόρ ν υπηρεσιών συ ο ιστικής μπορούμε να εξά ουμε νέα, υπονοούμενη νώση από την περι ραφείσα. Οι ό οι ια τους οποίους οι ΠΛ έ ουν ίνει ιδιαίτερα ν στές και ρησιμοποιούνται σε πάρα πο ές εφαρμο ές είναι εκτός από το ότι είναι πο ύ απ ές στη ρήση, ακόμα και από μη ειδικούς, το ε ονός ότι είναι εύρωστα αποφασίσιμες (robustly decidable). Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 21

46 Η Οικογένεια Γλωσσών της DL-Lite Ορισμός Έστ C, R και I μετρήσιμα και ανά ζεύ η διαφορετικά σύνο α από ατομικές έννοιες, ατομικούς ρό ους, και άτομα. Οι DL-Lite core -ρό οι κατασκευάζονται με άση τον παρακάτ κανόνα σύνταξης, όπου R ένας ρό ος που έ εται βασικός (basic role), E ένας ρό ος που έ εται γενικός (general role) και P R: R ::= P P E ::= R R Ένας ασικός ρό ος της μορφής P ονομάζεται αντίστροφος (inverse) ρό ος του P. Οι DL-Lite core -έννοιες κατασκευάζονται με άση τον παρακάτ κανόνα σύνταξης, όπου B μια βασική έννοια (basic concept), C μια γενική έννοια (general concept), A C και R ένας ασικός ρό ος: B ::= A R. C ::= B B Η έννοια ονομάζεται καθολική (top) έννοια, ενώ η έννοια R. (που από εδώ και στο εξής α εμφανίζεται και ς R) ονομάζεται απροσδιόριστος υπαρξιακός περιορισμός (unqualified existential restriction). Ένα από τα αρακτηριστικά που κάνει τις ώσσες αναπαράστασης νώσης να διαφέρουν από τις φυσικές ώσσες είναι το ε ονός ότι είναι τυπικές. Αυτό σημαίνει ότι τα δομικά στοι εία τ ν σσών αυτών ερμηνεύονται με ένα τυπικό, μα ηματικό τρόπο, έτσι ώστε το νόημα μιας δή σης να μπορεί να οριστεί αυστηρά/τυπικά, κάτι το οποίο δεν συμ αίνει με τις φυσικές ώσσες, στις οποίες οι δη ώσεις μπορεί να εμπεριέ ουν αμφισημία. Μια ερμηνεία (interpretation) Περι ραφικής Λο ικής I ορίζεται από ένα ζεύ ος ( I, I), όπου I είναι ένα μη-κενό σύνο ο που ονομάζεται χώρος ερμηνείας (domain of interpretation) που περιέ ει στοι εία που ονομάζονται αντικείμενα (objects), και I είναι μια συνάρτηση ερμηνείας (interpretation function) που απεικονίζει: κά ε άτομο a I σε ένα αντικείμενο a I I, κά ε ατομική έννοια A C σε ένα υποσύνο ο A I I, και κά ε ατομικό ρό ο P R σε μια δυαδική σ έση P I I I. Τέ ος η συνάρτηση ερμηνείας μπορεί να επεκτα εί ια να δώσει ερμηνεία και στις σύν ετες έννοιες και ρό ους της DL-Lite core. Οι ερμηνείες αυτές φαίνονται στον Πίνακα 2.1. Β έπουμε οιπόν ότι κά ε DL-Lite core -έννοια ερμηνεύεται ς ένα υποσύνο ο του I. Για παράδει μα, η έννοια ερμηνεύεται ς το σύνο ο το οποίο περιέ ει ό α τα αντικείμενα του ώρου ερμηνείας. Επιπ έον, η ερμηνεία της έννοιας R περιέ ει το σύνο ο τ ν αντικειμέν ν τα οποία συμμετέ ουν στη σ έση R I με κάποιο ά ο αντικείμενο του I. Για να έ ει νόημα μια έννοια α πρέπει να υπάρ ει κάποια ερμηνεία η οποία να ικανοποιεί τα αξιώματα του T, να είναι δη αδή μοντέ ο του T, έτσι ώστε η έννοια να ερμηνεύεται σε ένα μη-κενό σύνο ο. Μια έννοια που ικανοποιεί αυτή 22 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

47 Κεφάλαιο 2. Θεωρητικό Υπόβαθρο Πίνακας 2.1: Σημασιο ο ία DL-Lite core -εννοιών και ρό ν Κατασκευαστής Σύνταξη Σημασιο ο ία κα ο ική έννοια I άρνηση έννοιας B I \ B I υπαρξιακός περιορισμός R. {x I y.(x, y) R I } αντίστροφοι ρό οι P { x, y y, x P I } άρνηση ρό ου R I I \ R I την ιδιότητα έ εται ικανοποιήσιμη (satisfiable) σε σ έση με το T, ενώ διαφορετικά έ εται μη-ικανοποιήσιμη (unsatisfiable). Μέ ρι στι μής έ ουμε δει πώς μπορούμε να ρησιμοποιούμε τους κατασκευαστές που μας προσφέρει η DL-Lite core σε συνδυασμό με τις ατομικές έννοιες και ρό ους με σκοπό τη δημιουρ ία σύν ετ ν εννοιών και ρό ν. Οι ΠΛ όμ ς μας προσφέρουν τη δυνατότητα, να μπορούμε να αποδίδουμε ονόματα στις σύν ετες έννοιες που έ ουμε να περι ράψουμε κα ώς επίσης και να περι ράψουμε σ έσεις ανάμεσα σε αυτές. Οι σ έσεις αυτές παρουσιάζονται με τη μορφή αξι μάτ ν που ονομάζονται αξιώματα ορολογίας (terminological axioms), συ έ ονται στο σώμα ορολογίας (terminological box TBox), που συμ ο ίζεται με T και είναι ένα σύνο ο από ισ υρισμούς της μορφής B C όπου B και C είναι DL-Lite core -έννοιες, όπ ς αυτές έ ουν οριστεί στον Ορισμό Τα αξιώματα αυτά ονομάζονται και αξιώματα υπαγωγής (subsumption axioms ή inclusion axioms). Διαισ ητικά ένα αξί μα της μορφής B C δη ώνει ότι η έννοια C είναι πιο ενική της έννοιας B ή α ιώς ότι η έννοια B είναι υποέννοια της έννοιας C. Συνεπώς, εφόσον οι έννοιες B και C ερμηνεύονται σαν σύνο α είναι φυσικό να πούμε ότι μια ερμηνεία I ικανοποιεί (satisfies) ένα αξί μα υπα ής B C εάν B I C I, δη αδή εάν η ερμηνεία I ερμηνεύει την έννοια C ς υπερσύνο ο της έννοιας B. Μια ερμηνεία I ικανοποιεί ένα σώμα ορο ο ίας T εάν ικανοποιεί ό α τα αξιώματα στο T. Τότε έμε ότι η I είναι μοντέλο (model) του T και ράφουμε I = T. Τέ ος, μπορούμε να δημιουρ ήσουμε και αξιώματα ατόμ ν, που ονομάζονται σχέσεις στιγμιοτύπου (instance relations) ή α ιώς ισχυρισμοί (assertions) ανάμεσα σε άτομα (ζεύ η ατόμ ν) και έννοιες (ρό ους) τα οποία συ έ ονται στα σώματα ισ υρισμών. Ένα DL-Lite core σώμα ισχυρισμών (assertional box ABox), συμ ο ίζεται με A και αναπαριστά ένα σύνο ο από ισ υρισμούς της μορφής a : A ή A(a) που ονομάζονται ισχυρισμοί εννοιών (concept assertions) και (a, b) : P ή P (a, b) που ονομάζονται ισχυρισμοί ρόλων (role assertions), όπου τα a, b είναι άτομα, η A μια ατομική έννοια και ο P ένας ατομικός ρό ος. Οι ισ υρισμοί αυτοί δη ώνουν ότι το άτομο a αποτε εί στι μιότυπο της έννοιας A και ότι τα άτομα a, b αποτε ούν στι μιότυπα του ρό ου P. Μια ερμηνεία I ικανοποιεί τον ισ υρισμό a : A εάν a I A I και τον ισ υρισμό (a, b) : P εάν (a I, b I ) P I. Μια ερμηνεία ικανοποιεί ένα DL-Lite core ABox A εάν ικανοποιεί κά ε αξί μα στο A. Στην περίπτ ση αυτή έμε ότι η I είναι μοντέ ο Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 23

48 Η Οικογένεια Γλωσσών της DL-Lite του A και ράφουμε I = A. Μια DL-Lite core οντολογία (ontology) O = T, A αποτε είται από ένα TBox και από ένα ABox. Μια ερμηνεία ικανοποιεί μια DL-Lite core οντο ο ία O, και α ράφουμε I = O, εάν ικανοποιεί κά ε αξί μα της O, εάν δη αδή I = T και I = A. Στην περίπτ ση αυτή έμε ότι η I είναι μοντέ ο της O DL-Lite F και DL-Lite R Στη συνέ εια παρουσιάζουμε δύο Περι ραφικές Λο ικές που επεκτείνουν την DL-Lite core. Η πρώτη από αυτές είναι η DL-Lite F που επεκτείνει την DL-Lite core με την ικανότητα να δη ώνουμε συναρτησιακούς ρόλους (functional roles). Για ένα ασικό ρό ο R ο ισ υρισμός (func R) δη ώνει ότι ο ρό ος R είναι συναρτησιακός. Μια ερμηνεία I αποτε εί μοντέ ο του ισ υρισμού (func R) εάν η δυαδική σ έση R I είναι μια συνάρτηση, ήτοι εάν (a, b 1 ) R I και (a, b 2 ) R I συνεπά ονται ότι b 1 = b 2. Η δεύτερη ώσσα επεκτείνει την DL-Lite core με τον ορισμό αξιωμάτων υπαγωγής ρόλων (role inclusion axioms) είναι η DL-Lite R. Τα αξιώματα αυτά είναι της μορφής R E όπου R ένας ασικός και E ένας ενικός ρό ος. Μια ερμηνεία I αποτε εί μοντέ ο ενός αξιώματος υπα ής R E εάν R I E I. Η δυνατότητα ορισμού τέτοι ν αξι μάτ ν στην DL-Lite R επιτρέπει την προσομοί ση προσδιορισμένων υπαρξιακών περιορισμών (qualified existential restriction) στο δεξί μέ ος τ ν αξι μάτ ν υπα - ής εννοιών [33]. Έστ ια παράδει μα ότι έ ουμε το αξί μα υπα ής B R.C. Το αξί μα αυτό μπορεί να ραφεί ισοδύναμα ς το σύνο ο τ ν παρακάτ αξι μάτ ν B R aux R aux C R aux R όπου R aux ένας οη ητικός ρό ος που δεν εμφανίζεται μέσα στην οντο ο ία. Όπ ς φαίνεται από τα παραπάν η οικο ένεια σσών της DL-Lite είναι αρκετά απ ή. Παρά την απ ότητα της όμ ς μπορεί να συ ά ει τις ασικές ιδέες (ό ι όμ ς ό ες, προφανώς) τόσο τ ν οντο ο ιών όσο και τ ν φορμα ισμών μοντε οποίησης εννοιών που ρησιμοποιούνται στις άσεις δεδομέν ν (ήτοι, το μοντέ ο Οντοτήτ ν-συσ ετίσε ν). Πιο συ κεκριμένα, οι ισ υρισμοί της DL-Lite μας δίνουν τη δυνατότητα να ορίσουμε τις σ έσεις: isa, να δη ώσουμε δη αδή ότι μια έννοια A 1 υπά εται από μια ά η έννοια A 2, με τη ρήση του αξιώματος υπα ής A 1 A 2, ξένων εννοιών, να δη ώσουμε δη αδή ότι δύο έννοιες A 1 και A 2 είναι ξένες μεταξύ τους, με τη ρήση του αξιώματος υπα ής A 1 A 2, τύπου ρόλου (role-typing), να δη ώσουμε δη αδή ότι το πρώτο (δεύτερο) συστατικό του ρό ου P είναι στι μιότυπο της έννοιας A 1 (A 2 ), με τη ρήση του αξιώματος P A 1 ( P A 2 ), 24 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

49 Κεφάλαιο 2. Θεωρητικό Υπόβαθρο Πίνακας 2.2: Μετάφραση εννοιών και ρό ν σε φόρμου ες Λο ικής Πρώτης Τάξης. γ x (B) = B(x) γ x,y (R) = R(x, y) γ x,y (R ) = R(y, x) γ x ( R) = y.γ x,y (R) Πίνακας 2.3: Μετάφραση αξι μάτ ν και οντο ο ιών σε προτάσεις Λο ικής Πρώτης Τάξης. γ(b 1 B 2 ) = x.(γ x (B 1 ) γ x (B 2 )) γ(r 1 R 2 ) = x, y.(γ x,y (R 1 ) γ x,y (R 2 )) γ(func R 1 ) = x, y 1, y 2.(γ x,y1 (R 1 ) γ x,y2 (R 1 ) y 1 = y 2 ) γ(a(a)) = A(a) γ(p (a, b)) = P (a, b) γ(o) = γ(i) I O υποχρεωτικής συμμετοχής (mandatory participation), να δη ώσουμε δη αδή ότι ό α τα στι μιότυπα μιας έννοιας A συμμετέ ουν στον ρό ο P ς το πρώτο (δεύτερο) όρισμα, με τη ρήση του αξιώματος A P (A P ), υποχρεωτικής μη-συμμετοχής (mandatory non-participation), ρησιμοποιώντας τα A P και A P, συναρτησιακού περιορισμού (functionality restrictions) σε ρό ους, με ρήση τ ν ανα έσε ν (func P ) και (func P ). Εκτός από τη ρήση μοντε ο ε ρητικής σημασιο ο ίας, όπ ς δείξαμε παραπάν, οι ώσσες που ανήκουν στην οικο ένεια σσών της DL-Lite μπορούν να ερμηνευ ούν και με τη ρήση της σημασιο ο ίας της Λο ικής Πρώτης Τάξης, μέσ του μετασ ηματισμού τους σε υπαρξιακούς κανόνες. Στους Πίνακες 2.2 και 2.3 παρουσιάζουμε τους μετασ ηματισμούς αυτούς ια τις ώσσες DL-Lite F και DL-Lite R, όπου γ( ) είναι η συνάρτηση μετάφρασης. Σημειώνουμε τέ ος ότι η DL-Lite F αποτε εί αυστηρό υποσύνο ο της ώσσας οντο ο ιών OWL 2, και πιο συ κεκριμένα της OWL Lite, ενώ η DL-Lite R αποτε εί το ο ικό υπό α ρο της ώσσας OWL 2 QL, που αποτε εί ένα ν στό ατό προφί της OWL 2 [104] Υπηρεσίες Συ ο ιστικής Όπ ς αναφέρ ηκε και στην εισα ή ένα σύστημα αναπαράστασης νώσης παρέ- ει τη δυνατότητα ό ι μόνο της απο ήκευσης νώσης, α ά και της ρήσης υπηρεσιών συλλογιστικής (inference services) με τις οποίες μπορούμε να εξά ουμε νέα νώση 2 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 25

50 Απάντηση Ερωτημάτων μέσω Επανεγγραφής και νέα συμπεράσματα από τη νώση που έ ουμε περι ράψει. Οι ΠΛ μας προσφέρουν ενικά τις παρακάτ υπηρεσίες: Ικανοποιησιμότητα μιας οντο ο ίας: Μια οντο ο ία O είναι ικανοποιήσιμη (satisfiable) ανν υπάρ ει μοντέ ο I ια την O, δη αδή αν και μόνο αν (ανν) I = O. Αντίστοι α ορίζεται και η έννοια της μη-ικανοποιησιμότητας (unsatisfiability). Ικανοποιησιμότητα μιας έννοιας: Μια έννοια C είναι ικανοποιήσιμη μ..τ. O ανν υπάρ ει ερμηνεία I = ( I, I) και ένα στοι είο a I τ.. I = O και a C I. Υπα ή μιας έννοιας σε μια ά η: Μια έννοια D υπάγει (subsumes) μια έννοια C εάν ια κά ε μοντέ ο I τ.. I = O έ ουμε C I D I. Συνέπεια ενός σώματος ισ υρισμών: Ένα σώμα ισ υρισμών (ABox) A είναι συνεπές εάν υπάρ ει κάποιο μοντέ ο I τ.. I = A. Τα προ ήματα συ ο ιστικής αυτά τί ενται υπό μορφή ερώτησης στη μη ανή συ ο ιστικής και μπορούν να ανα ούν σε μια ερώτηση ανάκτησης στι μιοτύπ ν ια μια έννοια ή ρό ο. Παρό α αυτά είναι ιδιαίτερα συ νό το φαινόμενο που οι ρήστες επι υμούν να υπο ά ουν πιο σύν ετες ερ τήσεις οι οποίες να μη μπορούν να ανα ούν σε μια τέτοια ερώτηση ανάκτησης στι μιοτύπ ν. Η εκφραστικότητα ια την υπο ο ή τέτοι ν σύν ετ ν ερ τήσε ν παρέ εται από τα Συζευκτικά Ερωτήματα (ΣΕ). Έ οντας ορίσει τα ΣΕ μπορούμε τώρα να ορίσουμε τα ΣΕ πάν σε μια οντο ο ία ΠΛ. Ένα ΣΕ πάν σε μια οντο ο ία O είναι ένα ΣΕ τα άτομα του οποίου είναι της μορφής A(z) ή P (z 1, z 2 ), με A, P ατομικές έννοιες και ατομικούς ρό ους αντίστοι α που εμφανίζονται στην O, και z, z 1, z 2 είτε στα ερές που εμφανίζονται στην O είτε μετα ητές. Με τον ίδιο τρόπο μπορούμε να ορίσουμε και ένα ΣΣΕ πάν σε μια οντο ο ία O. Μια απάντηση (certain answer) σε ένα ΣΕ Q σε σ έση με μια οντο ο ία O είναι μια π ειάδα c = (c 1,..., c n ) από άτομα τ.. η O να επάγει (entails) τη φόρμου α Λο ικής Πρώτης Τάξης που κατασκευάζεται από τη σύζευξη ό ν τ ν ατόμ ν του σώματος στο Q, αντικα ιστώντας κά ε διακεκριμένη μετα ητή x j με c j και κά ε μηδιακεκριμένη με μια υπαρξιακή μετα ητή. Ορίζουμε με cert(q, O) το σύνο ο ό ν τ ν απαντήσε ν του Q μ..τ. O. Με άση τα παραπάν μπορούμε να ορίσουμε ακόμα μια υπηρεσία συ ο ιστικής, την απάντηση ερωτημάτων (query answering) σύμφ να με την οποία ια μια οντο- ο ία O και ένα ερώτημα Q στην O πρέπει να υπο ο ιστεί το σύνο ο cert(q, O). 2.5 Απάντηση Ερ τημάτ ν μέσ Επανε ραφής Η απάντηση ερωτημάτων (query answering) ίνεται μέσ μιας διαδικασίας που ονομάζεται επανεγγραφή ερωτημάτων (query rewriting) [31, 117] και στηρίζεται στην 26 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

51 Κεφάλαιο 2. Θεωρητικό Υπόβαθρο ιδιότητα της επανεγγραψιμότητας (rewritability). Διαισ ητικά, η επανε ραψιμότητα εκφράζει την ιδιότητα σύμφ να με την οποία η απάντηση ερ τημάτ ν με άση μια οντο ο ία (TBox και ABox) μπορεί να ανα εί στον υπο ο ισμό ενός ερ τήματος που ονομάζεται επανε ραφή σε ένα ABox A το οποίο ε ρούμε ς μια (επα ική) άση δεδομέν ν. Έτσι οιπόν, δεδομένου ενός TBox T και ενός ερ τήματος Q, με την τε νική της επανε ραφής ερ τημάτ ν υπο ο ίζεται ένα νέο ερώτημα, που ονομάζεται επανεγγραφή (rewriting). Ανά ο α με την εκφραστικότητα της ΠΛ η επανε ραφή ρειάζεται να εκφραστεί σε διαφορετικούς φορμα ισμούς. Εάν το T είναι εκφραστικότητας ELHIO, τότε η επανε ραφή ενός ερ τήματος Q μ..τ. T είναι στη ειρότερη περίπτ ση μια επανε ραφή Datalog, εάν το T είναι εκφραστικότητας ραμμικής Datalog ± [26, 66], τότε η επανε ραφή ενός ερ τήματος Q μ..τ. T είναι στη ειρότερη περίπτ ση μια επανε ραφή μη-αναδρομικής Datalog, εάν το T είναι εκφραστικότητας DL-Lite + [6], τότε η επανε ραφή αποτε είται στη ειρότερη περίπτ ση από μια επανε ραφή ΣΣΕ και από μια επανε ραφή ραμμικής Datalog, ενώ τέ ος εάν το T είναι εκφραστικότητας DL-Lite R, τότε η επανε ραφή ενός ερ τήματος Q μ..τ. T είναι στη ειρότερη περίπτ ση μια επανε ραφή ΣΣΕ. Το πρό ημα της αποτίμησης ενός προ ράμματος Datalog εμφανίζει πο υπ οκότητα PTIME ς προς τα δεδομένα, ενώ αυτό της απάντησης ενός ΣΣΕ ανήκει στην κ άση πο υπ οκότητας AC 0 [112, 166, 165, 54], που περιέ εται στην LOGSPACE, ς προς τα δεδομένα. Παρατηρούμε δη αδή, ότι η απάντηση ερ τημάτ ν ια ατές ΠΛ είναι αμη ής πο- υπ οκότητας. Στη συνέ εια ορίζουμε την επανε ραφή Datalog που κα ύπτει ό ες τις προη ούμενες περιπτώσεις. Ορισμός Μια επανεγγραφή Datalog (Datalog rewriting) ια ένα ΣΕ Q μ..τ. TBox T είναι ένα πρό ραμμα Datalog R το οποίο μπορεί να ριστεί σε δύο ανεξάρτητα σύνο α R D R Q, με R D ένα σύνο ο από κανόνες Datalog που δεν περιέ ουν το κατη όρημα Q A και R Q ένα ΣΣΕ με κατη όρημα ερ τήματος Q A του οποίου τα άτομα του σώματος αναφέρουν μόνο κατη ορήματα που περιέ ονται στο T, και που ια κά ε ABox A με τη ρήση κατη ορημάτ ν από το T έ ουμε cert(q, T A) = cert(r Q, R D A). (2.3) Η επανε ραφή R είναι μια επανεγγραφή ΣΣΕ (UCQ rewriting) εάν R D =. Στην περίπτ ση αυτή αναφερόμαστε στην επανε ραφή ρησιμοποιώντας μόνο το σύνο ο R Q. Μια επανε ραφή μπορεί να υπο ο ιστεί εφαρμόζοντας μετασ ηματισμούς που διατηρούν την ισοδυναμία (equivalence preserving transformations) ια τα δεδομένα εισόδου T και Q. Διάφορες τε νικές και α όρι μοι έ ουν προτα εί μέ ρι στι μής στην ι ιο ραφία ια διάφορες ώσσες οντο ο ιών όπ ς είναι η DL-Lite, η ELHI, τα ραμμικά TGDs και ά ες [31, 117, 132, 40, 64, 87, 108, 25] και πο οί από αυτούς διαφέρουν σημαντικά μεταξύ τους. Στη συνέ εια και ια να μπορέσουμε να αποστασιοποιη ούμε από τις ιδιαιτερότητες του κά ε α ορί μου επανε ραφής, παρουσιάζουμε έναν ενικό ορισμό ο οποίος συ αμ άνει την έννοια τ ν περισσότερ ν α ορί μ ν επανε ραφής που εμφανίζονται στη ι ιο ραφία ρησιμοποιώντας κανόνες συμπερασμού. Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 27

52 Απάντηση Ερωτημάτων μέσω Επανεγγραφής Ορισμός Ένας αλγόριθμος επανεγγραφής (rewriting algorithm) rew ια μια ΠΛ L είναι ένας α όρι μος ο οποίος ια κά ε L-οντο ο ία T και ΣΕ Q: 1. Μετασ ηματίζει το TBox T σε ένα σύνο ο από προτάσεις N 1 στο οποίο προσ έτει και το ερώτημα Q. 2. Χρησιμοποιεί ένα σύστημα συμπερασμού Γ ια να υπο ο ίσει μια ακο ου ία N 1, σ 1, Υ 1 N i, σ i, Υ i π ειάδ ν κά ε μια από τις οποίες αποτε είται από ένα σύνο ο από προτάσεις N i, μια αντικατάσταση σ i και μια ίστα από ζεύ η Υ i ια τα οποία ια i = 1 έ ουμε σ 1 =, Υ 1 = {, }. Επιπ έον, ια κά ε i {1,..., m 1}, το N i+1 επεκτείνει το N i με ένα συμπέρασμα ενός συμπερασμού στο Γ(N i ) και σ i+1, Υ i+1 είναι οι υποσημειώσεις του συ κεκριμένου συμπερασμού. 3. Επιστρέφει μια π ειάδα rew(q, O) = R, R, όπου R = R D R Q είναι υποσύνο o του N m τ.. να είναι επανε ραφή ια το Q μ..τ. T, και R είναι η σ έση που ορίζεται ς εξής: ια x var(q), Q R Q, y var(q ), έ ουμε ότι x R y ανν x(σ 1... σ j ) = y, όπου j είναι ο μικρότερος ακέραιος ια τον οποίο ισ ύει Q N j. Ένας α όρι μος επανε ραφής ονομάζεται Q-προσανατολισμένος (Q-oriented) εάν ό α τα Q i R Q που είναι διαφορετικά από το Q παρά ονται από κάποιο Q j R Q από ένα συμπερασμό της μορφής Q j, C 1,..., C n, Q i. Οι περισσότεροι α όρι μοι επανε ραφής είτε στηρίζονται στον κανόνα της ανά- υσης ή μπορούν να ανα ούν εύκο α στο π αίσιο της ανά υσης, και συνεπώς ο παραπάν ορισμός ισ ύει ια αυτούς. Για τη συνέ εια της διατρι ής α ε ρήσουμε επίσης ότι οι επανε ραφές υπο ο ίζονται από α όρι μους που είναι Q- προσανατο ισμένοι. Πάρα πο οί διάσημοι α όρι μοι και συστήματα επανε ραφής, όπ ς το PerfectRef, το Nyaya, και το Rapid, στηρίζονται σε α όρι μους που είναι Q-προσανατο ισμένοι. Παρό α αυτά, ά α πο ύ ν στά συστήματα, όπ ς το Requiem, δεν είναι Q-προσανατο ισμένα. Για παράδει μα στο Requiem ένα ερώτημα Q i R Q μπορεί να υπο ο ιστεί από ένα ερώτημα Q j R Q ρησιμοποιώντας περισσότερους του ενός συμπερασμούς που περι αμ άνουν ενδιάμεσες προτάσεις που περιέ ουν το κατη όρημα του ερ τήματος α ά περιέ ουν επίσης και συναρτησιακούς όρους. Για παράδει μα, ια T = {A(x) y.r(x, y) C(y), R(x, y) S(x, y)} και Q = S(x, y) C(y) Q A (x) το Requiem πράττει τα ακό ου α: Αρ ικά, μετασ ηματίζει το TBox T στο παρακάτ σύνο ο από προτάσεις: όπου f είναι μια νέα συνάρτηση skolem [138]. A(x) R(x, f(x)) (2.4) A(x) C(f(x)) (2.5) R(x, y) S(x, y) (2.6) 28 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

53 Κεφάλαιο 2. Θεωρητικό Υπόβαθρο Στη συνέ εια, εφαρμόζει τον κανόνα της ανά υσης με ε εύ ερη επι ο ή (resolution with free selection) και μια πι ανή κατά ηξη μπορεί να είναι η παρακάτ : από το Q και την εξίσ ση (2.5) να προκύψει το Q 1 f = S(x, f(x)) A(x) Q A (x), από το Q 1 f και την εξίσ ση (2.6) να προκύψει το Q2 f = R(x, f(x)) A(x) Q A (x), και τέ ος, από το Q 2 f και την εξίσ ση (2.4) να προκύψει το Q = A(x) Q A (x). Η επανε ραφή του Q μ..τ. T είναι το σύνο ο από τις προτάσεις που δεν πειρέ ουν συναρτησιακούς όρους, δη αδή, R = {Q, Q }. Είναι προφανές ότι ο α όρι μος Requiem δεν είναι Q-προσανατο ισμένος κα ώς το Q προκύπτει από το ερώτημα Q μέσα από περισσότερα του ενός ήματα που περι- αμ άνουν ενδιάμεσες προτάσεις που περιέ ουν συναρτησιακούς όρους και οι οποίες δεν ανήκουν στην τε ική επανε ραφή. Παρό α αυτά τα αποτε έσματα που παρουσιάζουμε στη συνέ εια της διατρι ής μας μπορούν να εφαρμοστούν και σε τέτοια συστήματα ρησιμοποιώντας την παρακάτ προσέ ιση: Αντί να δε όμαστε σαν είσοδο μια επανε ραφή R, οι α όρι μοι που α παρουσιάσουμε μπορούν να δέ ονται σαν είσοδο το όριο N m της ακο ου- ίας παρα ής που προκύπτει από τον α όρι μο επανε ραφής. Για παράδει μα, στην προη ούμενη περίπτ ση οι α όρι μοι μας α δε ούν σαν είσοδο το σύνο ο N 3 = {Q, Q 1 f, Q2 f, Q }. Αντικα ιστώντας μια επανε ραφή με το όριο N m σε ό ους τους ορισμούς και ό ους τους α ορί μους τα αποτε έσματα εφαρμόζονται ρίς περαιτέρ τροποποιήσεις Ο Α όρι μος Επανε ραφής PerfectRef Στη συνέ εια παρουσιάζουμε τον α όρι μο επανε ραφής PerfectRef που προτά- ηκε από τους Calvanese et al. [31] κα ώς μέρος τ ν α ορί μ ν που περι ράφουμε στη συνέ εια της διατρι ής μας στηρίζεται σε αυτόν. Ο α όρι μος αυτός, που φαίνεται στον Α όρι μο 2, εφαρμόζει εξαντ ητικά δύο ήματα: ένα βήμα αναδιατύπωσης (reformulation step) ( ραμμές 8 16) και ένα βήμα μείωσης (reduction step) ( ραμμές 17 22). Κά ε ήμα παίρνει ς είσοδο ένα ΣΕ και πι ανώς κάποιο αξί μα I από το T και παρά ει ένα νέο ΣΕ. Η διαδικασία τερματίζει όταν δεν παρά εται κανένα νέο ερώτημα. Πιο συ κεκριμένα, στο ήμα αναδιατύπ σης, ια ένα άτομο α ενός ερ τήματος Q και ένα αξί μα I T, η συνάρτηση gr(α, I) επιστρέφει ένα νέο άτομο. Πιο τυπικά: Ορισμός Έστ I αξί μα υπα ής και α άτομο του ερ τήματος Q. Τότε η συνάρτηση gr(α, I) ορίζεται ς εξής: Εάν α = A(x) και 1. I = B(x) A(x), τότε gr(α, I) = B(x), 2. I = y.p (x, y) A(x), τότε gr(α, I) = P (x, y) ια μια νέα μετα ητή y στο Q, 3. I = y.p (y, x) A(x), τότε gr(α, I) = P (y, x) ια μια νέα μετα ητή y στο Q. Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 29

54 Απάντηση Ερωτημάτων μέσω Επανεγγραφής Α όρι μος 2 PerfectRef(Q, T ) Είσοδος: Ένα ΣΕ Q και ένα DL-Lite R -TBox T 1: Αρ ικοποίησε μια επανε ραφή ΣΣΕ R Q := {Q} 2: repeat 3: R Q := R Q 4: for all Q 1 R Q do 5: for all α Q 1 do 6: for all I T do 7: if I είναι εφαρμόσιμο στο α then 8: Πρόσ εσε το Q 2 := Q 1 [α/gr(α, I)] στο R Q 9: end if 10: end for 11: end for 12: for all α 1, α 2 στο Q 1 do 13: if υπάρ ει mgu σ ια τα α 1 και α 2 then 14: Πρόσ εσε το Q 1 σ στο R Q 15: end if 16: end for 17: end for 18: until R Q = R Q 19: return R Q Εάν α = P (x, z), με z μη-δεσμευμένη στο Q και 1. I = A(x) y.p (x, y), τότε gr(α, I) = A(x), 2. I = y.s(x, y) z.p (x, z), τότε gr(α, I) = S(x, y) ια μια νέα μετα- ητή y στο Q, 3. I = y.s(y, x) z.p (x, z), τότε gr(α, I) = S(y, x), ια μια νέα μετα- ητή y στο Q. Εάν α = P (z, x), με z μη-δεσμευμένη στο Q, και 1. I = A(x) z.p (z, x), τότε gr(α, I) = A(x), 2. I = y.s(x, y) z.p (z, x), τότε gr(α, I) = S(x, y), ια μια νέα μετα- ητή y στο Q, 3. I = y.s(y, x) z.p (z, x), τότε gr(α, I) = S(y, x), ια μια νέα μετα- ητή y στο Q. Εάν α = P (x, y) και 1. I = S(x, y) P (x, y), τότε gr(α, I) = S(x, y); 2. I = S(y, x) P (x, y), τότε gr(α, I) = S(y, x). 30 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

55 Κεφάλαιο 2. Θεωρητικό Υπόβαθρο Εάν ια κάποιο αξί μα I και κάποιο άτομο α η συνάρτηση gr(α, I) επιστρέφει κάποια τιμή, όπ ς φαίνεται και από τον Ορισμό 2.5.3, τότε έμε ότι το I είναι εφαρμόσιμο (applicable) στο α, και η εφαρμο ή αυτή σε κάποιο ΣΕ Q παρά ει ένα νέο ΣΕ της μορφής Q[α/gr(α, I)], δη αδή ένα νέο ερώτημα που περιέ ει το άτομο gr(α, I) αντί του ατόμου α. Για παράδει μα, ια το ΣΕ Q 3 = διδάσκει(x, y) διδάσκει(y, z) Q A (x) και το αξί μα I 1 = ΜεταπτυχιακόςΦοιτητής(y) z.διδάσκει(y, z) το ήμα αναδιατύπ σης αντικα ιστά το άτομο διδάσκει(y, z) με το ΜεταπτυχιακόςΦοιτητής(y) παρά οντας το νέο ερώτημα Q 4 = διδάσκει(x, y) ΜεταπτυχιακόςΦοιτητής(y) Q A (x). Παρατηρούμε ότι το αξί μα I 1 δεν είναι εφαρμόσιμο στο άτομο διδάσκει(x, y) εφόσον η μετα ητή y είναι δεσμευμένη στο ερώτημα Q 3. Στη συνέ εια, ια το αξί μα της μορφής I 2 = w.διδάσκει(w, y) ΜεταπτυχιακόςΦοιτητής(y) το ήμα αναδιατύπ σης αντικα ιστά το άτομο ΜεταπτυχιακόςΦοιτητής(y) στο Q 4 παρά οντας το Συζευκτικό Ερώτημα Q 5 = διδάσκει(x, y) διδάσκει(w, y) Q A (x), με w μια νέα μετα ητή που δεν εμφανίζεται στο Q 4. Στο ήμα μεί σης, παρά εται ένα νέο ΣΕ από την εφαρμο ή του πιο ενικού ενοποιητή (most general unifier mgu) ανάμεσα σε δύο από τα άτομα κάποιου ΣΕ Q. Το ήμα αυτο ρησιμοποιείται επειδή κάποια αξιώματα μπορούν να εφαρμοστούν μόνο στη μεί ση ενός ερ τήματος, αφού με αυτό μια μετα ητή που ήταν δεσμευμένη μπορεί να ίνει μη-δεσμευμένη. Για παράδει μα, έστ το ερώτημα Q 5. Παρατηρούμε ότι το αξί μα I 1 δεν μπορεί να εφαρμοστεί στο Q 5 αφού η μετα ητή y (του Q 5 ) είναι δεσμευμένη. Εφαρμόζοντας όμ ς το ήμα της μεί σης παρά εται το νέο ερώτημα Q 6 = διδάσκει(x, y) Q A (x), εφόσον το άτομο διδάσκει(w, y) ενοποιείται με το διδάσκει(x, y), με τον ενοποιητή w x και στη συνέ εια το αξί μα I 1 είναι εφαρμόσιμο παρά οντας το ερώτημα Q 7 = ΜεταπτυχιακόςΦοιτητής(x) Q A (x). Παρό α αυτά υπάρ ουν περιπτώσεις που ενώ εφαρμόζεται το ήμα της μεί σης καμία δεσμευμένη μετα ητή δεν ίνεται μη-δεσμευμένη. Όπ ς ια παράδει μα στο ΣΕ Q 8 = διδάσκει(x, y) διδάσκει(y, z) Q A (x) όπου το ήμα μεί σης παρά ει το ερώτημα Q 9 = διδάσκει(x, x) Q A (x) με τον πιο ενικό εννοποιητή {z y, y x} στο οποίο δεν μπορεί να εφαρμοστεί το αξί μα I 1. Αυτό έ ει ς αποτέ εσμα την αύξηση του με έ ους της επανε ραφής ΣΣΕ με ερ τήματα τα οποία δεν πρόκειται να παρά ουν νέα και ενδε ομέν ς είναι περιττά, όπ ς το ερώτημα Q 9 που υπά εται από το Q 8. Από τα παραπάν, έπουμε ότι ια το ερώτημα Q 3 και το T = {I 1, I 2 } ο α - όρι μος PerfectRef παρά ει την επανε ραφή ΣΣΕ R Q = {Q 3, Q 4, Q 5, Q 6, Q 7 }. Ο α όρι μος αυτός είναι Q-προσανατο ισμένος (Q-oriented) κα ώς τα ήματα αναδιατύπ σης και μεί σης μπορούν να προκύψουν από ήματα συμπερασμού. Πιο συ- κεκριμένα, το ήμα αναδιατύπ σης ουσιαστικά περι ράφει τη διαδικασία που ακο- ου είται στον κανόνα συμπερασμού ανά υσης αφού το άτομο α που αντικα ίσταται ουσιαστικά είναι το άτομο που ανήκει στο A i. Όσον αφορά στο ήμα μεί σης αυτό παρουσιάζει ομοιότητες με το ήμα παρα οντοποίησης στον οποίο άτομα από την κύρια υπό εση ενοποιούνται με ρήση του πιο ενικού ενοποιητή που είναι ίσος με την αντικατάσταση σ. Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 31

56 Κατευθυνόμενοι Γράφοι 2.6 Κατευ υνόμενοι Γράφοι Ένας (κατευ υνόμενος) ράφος είναι μια π ειάδα G = V, E, όπου V είναι ένα μη-κενό σύνο ο από κόμ ους και ια το ό ο αυτό έ εται σύνολο κόμβων και E V V ένα ενδε ομέν ς κενό σύνο ο από δυαδικές σ έσεις, τις ακμές που ορίζονται πάν στο V και έ εται σύνολο ακμών. Στη συνέ εια της διατρι ής μας κάνουμε συ νά κατά ρηση του συμ ο ισμού και ρησιμοποιούμε τον ράφο G ια να αναφερ ούμε στο σύνο ο σ έσε ν του ράφου. Στην περίπτ ση αυτή το V είναι ακρι ώς το σύνο ο τ ν κόμ ν που συμμετέ ουν στην E. Συνεπώς, προσ έτοντας ένα ζευ άρι a, b στον G προκύπτει ο νέος ράφος G = V {a, b}, E { a, b }. Το καρτεσιανό γινόμενο (cartesian product) δύο ράφ ν G 1 και G 2 που απεικονίζεται με G 1 G 2 ορίζεται ς το καρτεσιανό ινόμενο του συνό ου τ ν κόμ ν τους. Δη αδή, ορίζεται ς ο ράφος G 1 G 2 = V G1 V G2 = {(x, y) x V G1 και y V G2 } στον οποίο τα στοι εία (x, y) και (x, y ) σ ηματίζουν ακμή, δη αδή (x, y), (x, y ) E G1 G 2 εάν και μόνο εάν: x = x και y, y E G2, ή y = y και x, x E G1. Για τους κόμ ους a, b V, έμε ότι ο b είναι προσβάσιμος (reachable) από τον a στον G, και ράφουμε a G b, εάν υπάρ ουν c 0,..., c n με n 0 όπου c 0 = a, c n = b και c i, c i+1 E ια κά ε 0 i < n. 3 Ένα στοι είο c V κα είται κόμβος κορυφής (top vertice) στον G εάν ια κά ε c V έ ουμε c G c. Τέ ος, εάν ισ ύει a, b G έμε ότι ο κόμ ος b είναι παιδί του κόμ ου a. 3 Σημειώνουμε ότι σύμφ να με αυτό τον ορισμό κά ε κόμ ος c V είναι προσ άσιμος από τον εαυτό του. 32 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

57 Μέρος II Επανε ραφή Τροποποιημέν ν Ερ τημάτ ν 33

58

59 Κεφά αιο 3 Επανε ραφή Τροποποιημέν ν Ερ τημάτ ν Στο κεφά αιο αυτό με ετάμε το πρό ημα του υπο ο ισμού μιας επανε ραφής ια ερ τήματα τα οποία έ ουν τροποποιη εί. Για ένα συζευκτικό ερώτημα, ένα TBox και μια επανε ραφή που έ ει υπο ο ιστεί ια αυτά, δεί νουμε πώς μπορούμε να υπο- ο ίσουμε μια επανε ραφή ια ένα νέο ερώτημα το οποίο προκύπτει με τροποποίηση του αρ ικού ρησιμοποιώντας την ήδη υπο ο ισμένη επανε ραφή και αποφεύ οντας να υπο ο ίσουμε μια νέα εξαρ ής. Πιο συ κεκριμένα, με ετάμε ερ τήματα τα οποία έ ουν τροποποιη εί με προσ ήκη ή αφαίρεση διακεκριμέν ν μετα ητών ή ατόμ ν. Για κα ύτερη κατανόηση στην αρ ή κά ε ενότητας δίνουμε μια σειρά από παραδεί ματα που περι ράφουν διαισ ητικά τους α ορί μους μας. Στη συνέ εια, τους παρουσιάζουμε ανα υτικά και αποδεικνύουμε την ορ ότητα τους. Τέ ος, παρουσιάζουμε μια σειρά από ε τιστοποιήσεις που έ ουν ς στό ο την ε τί ση της απόδοσής τους. 3.1 Μεί ση Ερ τημάτ ν με Διακεκριμένες Μετα ητές Στην ενότητα αυτή με ετάμε το πρό ημα του υπο ο ισμού μιας επανε ραφής ια ένα ερώτημα του οποίου οι διακεκριμένες μετα ητές έ ουν μει εί, εκμετα ευόμενοι όσο το δυνατόν περισσότερη π ηροφορία από την ήδη υπάρ ουσα επανε ραφή ια το αρ ικό ερώτημα. Το παρακάτ παράδει μα περι ράφει τις ασικές ιδέες στις οποίες στηρίζεται ο α όρι μος που α παρουσιάσουμε στη συνέ εια. Παράδει μα Έστ ένα TBox T που περι ράφει μα ήματα και κα η ητές: διδάσκειμεταπτυχιακό(x, y) διδάσκει(x, y) Έστ επίσης το ερώτημα Καθηγητής(x) y.διδάσκειμεταπτυχιακό(x, y). Q 1 = διδάσκει(x 1, y 1 ) Q A (x 1, y 1 ) το οποίο ανακτά ό ους όσους διδάσκουν κάποιο μά ημα μαζί με το μά ημα αυτό. Το σύνο ο R = {Q 1, Q 2 }, όπου Q 2 = διδάσκειμεταπτυχιακο(x 2, y 2 ) Q A (x 2, y 2 ) 35

60 Μείωση Ερωτημάτων με Διακεκριμένες Μεταβλητές αποτε εί επανε ραφή του Q 1 μ..τ. T. Πιο συ κεκριμένα, μετασ ηματίζοντας τα αξιώματα του T στις παρακάτ προτάσεις διδάσκειμεταπτυχιακό(x, y) διδάσκει(x, y) (3.1) Καθηγητής(x) διδάσκειμεταπτυχιακό(x, f(x)) (3.2) έ ουμε ότι το Q 2 είναι το συμπέρασμα ενός συμπερασμού με υπο έσεις το ερώτημα Q 1 και την πρόταση (3.1), και υποσημεί ση Υ = A 1, B 1, στην οποία A 1 = {διδάσκει(x 1, y 1 )} και B = {διδάσκειμεταπτυχιακό(x 2, y 2 )}. Επιπ έον, η σ έση R = { x 1, x 2, y 1, y 2 } δη ώνει ότι κατά τον υπο ο ισμό του R η μετα ητή x 1 μετονομάστηκε στην x 2 και η y 1 στην y 2. Έστ τώρα, ότι μετά την ανάκτηση τ ν αποτε εσμάτ ν ια το Q 1 έ ουμε να ανακτήσουμε μόνο όσους διδάσκουν κάποιο μά ημα ρίς όμ ς να ανακτήσουμε και το συ κεκριμένο μά ημα, έτουμε δη αδή το ερώτημα Q 1 = διδάσκει(x 1, y 1 ) Q A (x 1 ) το οποίο αποτε εί την προ ο ή του Q 1 πάν στην πρώτη μετα ητή x 1, δη αδή, Q 1 = π 1 (Q 1 ). Το σύνο ο R = {Q 1, Q 2, Q 3}, όπου Q 2 = διδάσκειμεταπτυχιακό(x 2, y 2 ) Q A (x 2 ) και Q 3 = Καθηγητής(x 3 ) Q A (x 3 ), αποτε εί μια επανε ραφή ια το Q 1 μ..τ. T, με R = { x 1, x 2, y 1, y 2, x 1, x 3 }. Η επανε ραφή R μπορεί να υπο ο ιστεί ρησιμοποιώντας οποιοδήποτε σύ - ρονο σύστημα επανε ραφής ερ τημάτ ν. Παρό α αυτά, κά ε τέτοιο σύστημα α εφήρμοζε τους κανόνες συμπερασμού στα Q 1 και T εξαρ ής ρίς να αμ άνει υπ όψιν ότι ένα με ά ο μέρος της π ηροφορίας έ ει ήδη παρα εί ια το ερώτημα Q 1, και ότι το Q 1 είναι διαφορετικό μόνο κατά μια μετα ητή. Πρά ματι, το Q 2, που αποτε εί μέ ος του R, μπορεί να παρα εί απ ευ είας από το R ς την προ ο ή του ερ τήματος Q 2 στην πρώτη μετα ητή, δη αδή, Q 2 = π 1 (Q 2 ). Στην πρα ματικότητα, εάν τα Q 1 και Q 2 έ ουν αποτιμη εί σε μια άση δεδομέν ν τότε μπορούμε επίσης να υπο ο ίσουμε απ ευ είας την αποτίμηση τ ν Q 1 και Q 2 ρησιμοποιώντας μια προ ο ή στα αποτε έσματα που επιστρέφονται ια τα Q 1 και Q 2, αντίστοι α. Παρό α αυτά, παρατηρούμε ότι το ερώτημα Q 3 της επανε ραφής R δεν μπορεί να υπο ο ιστεί ρησιμοποιώντας τον παραπάν απ ό τε εστή. Αντί αυτού, είναι απαραίτητο να ρησιμοποιη ούν οι κανόνες συμπερασμού ενός συστήματος έτσι ώστε να το υπο ο ίσουν. Πιο συ κεκριμένα, το Q 3 μπορεί να υπο ο ιστεί από ένα συμπερασμό, ια παράδει μα με τη ρήση συστημάτ ν όπ ς το PerfectRef ή το Requiem, με υπο έσεις το ερώτημα Q 2 και την πρόταση (3.2). Διαισ ητικά, αυτό ίνεται επειδή μετά την εφαρμο ή του τε εστή της προ ο ής η μετα ητή y 2 ίνεται μη-δεσμευμένη (εμφανίζεται μόνο μια φορά), συνεπώς ενερ οποιούνται νέοι συμπερασμοί. Από το παραπάν παράδει μα παρατηρούμε π ς εάν δίνονται ένα ερώτημα Q και μια επανε ραφή R του Q με άση κάποιο TBox T, μια επανε ραφή ια το ερώτημα Q που αποτε εί προ ο ή του Q (δη αδή, Q = π j1,...,j n (Q) ια κάποιο τε εστή προ ο ής π j1,...,j n ) μπορεί να υπο ο ιστεί ρησιμοποιώντας την επανε ραφή R και εφαρμόζοντας δύο ασικές ασικές ειτουρ ίες: 36 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

61 Α όρι μος 3 RemoveVars(T, R, R, π j1,...,j n ) Κεφάλαιο 3. Επανεγγραφή Τροποποιημένων Ερωτημάτων Είσοδος: Ένα TBox T, μια επανε ραφή R με διαμερίσεις R D R Q και μια σ έση R που αποτε ούν την έξοδο ενός α όρι μου επανε ραφής ια ένα ΣΕ Q μ..τ. T, και ένας τε εστής προ ο ής π j1,...,j n. 1: Αρ ικοποίησε μια επανε ραφή R := R D και μια σ έση R := R 2: for all Q i R Q do 3: Προσέ εσε το Q i στην R, όπου Q i := π j1,...,j n (Q i ) 4: if needsrewriting(q i, π j1,...,j n, T ) then 5: R n, Rn := rew(q i, T ) 6: R := R R n και R := R Rn 7: end if 8: end for 9: return R, R 1. προ ο ή ό ν τ ν ερ τημάτ ν από το R ρησιμοποιώντας τον τε εστή π j1,...,j n, και στη συνέ εια, 2. πι ανώς εφαρμο ή επιπ έον συμπερασμών πάν στα ερ τήματα που έ ουν προκύψει έτσι ώστε να υπο ο ιστούν αυτά που υπο είπονται. Γενικά, είναι δυνατό να εφαρμόσουμε τους κανόνες συμπερασμού ενός συστήματος επανε ραφής εξαντ ητικά σε ό α τα προ η έντα ερ τήματα. Κάτι τέτοιο όμ ς, μπορεί ενδε ομέν ς να επηρεάσει την επίδοση του α ορί μου. Αντι έτ ς ο α όρι μος μας ε έ ει εάν έ ει ενερ οποιη εί ένας νέος συμπερασμός ρησιμοποιώντας την παρακάτ συνάρτηση. Ορισμός Έστ T TBox, έστ Q ΣΕ, και έστ π j1,...,j n τε εστής προ ο- ής. Τότε η συνάρτηση needsrewriting(q, π j1,...,j n, T ) επιστρέφει αληθές εάν υπάρ ει συμπερασμός με το ερώτημα π j1,...,j n (Q) ς κύρια υπό εση και υποσημειώσεις σ π, Υ π και υπάρ ει A π, B π Υ π τέτοια ώστε ια κά ε συμπερασμό με το ερώτημα Q ς κύρια υπό εση και κά ε A, B Υ είτε A = A π ή B = B π, διαφορετικά επιστρέφει ψευδές. Ο α όρι μος μας ια τον υπο ο ισμό μιας επανε ραφής ια ερ τήματα που έ ουν προκύψει με ρήση του τε εστή της προ ο ής ρησιμοποιώντας μια επανε - ραφή που έ ει υπο ο ιστεί προη ούμενα φαίνεται στον Α όρι μο 3. Ο α όρι μος δέ εται ς είσοδο ένα TBox T, την επανε ραφή R ια ένα ερώτημα Q μ..τ. T που έ ει υπο ο ιστεί ν ρίτερα, τη σ έση R, και έναν τε εστή προ ο ής ια το ερώτημα Q. Εσ τερικά, ρησιμοποιεί επίσης έναν α όρι μο επανε ραφής rew έτσι ώστε να μπορεί να εφαρμόζει τον κανόνα συμπερασμού όπου αυτό κρίνεται απαραίτητο. Στην αρ ή, ο α όρι μος αρ ικοποιεί μια νέα επανε ραφή R με το σύνο ο R D και τη σ έση R με την R. Στη συνέ εια, προσπε αύνει ό α τα ερ τήματα Q i στο R και υπο ο ίζει τις προ ο ές π j1,...,j n (Q i ) προσ έτοντας τις στο αποτέ εσμα. Επιπ έον, ια κά ε ερώτημα στο οποίο έ ει εφαρμοστεί ο τε εστής της προ ο ής ε έ ει εάν ρειάζεται επιπ έον επανε ραφή με τη ρήση της συνάρτησης needsrewriting και Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 37

62 Μείωση Ερωτημάτων με Διακεκριμένες Μεταβλητές εάν κάτι τέτοιο είναι απαραίτητο κα εί τον α όρι μο rew με εισόδους το ερώτημα π j1,...,j n (Q i ) και το TBox T. Θεώρημα Έστω Q ΣΕ, έστω T TBox, έστω π j1,...,j n ένας τελεστής προβολής στο Q, και έστω R και R η έξοδος ενός αλγόριθμου επανεγγραφής όταν εφαρμοστεί στα Q και T. Όταν τα T, R, R, και π j1,...,j n δίνονται ως είσοδος ο Αλγόριθμος 3 τερματίζει. Έστω R, R η έξοδος του αλγορίθμου, τότε το σύνολο R είναι μια επανεγγραφή για το π j1,...,j n (Q) μ.β.τ. T. Απόδειξη: Ο τερματισμός προκύπτει από το ε ονός ότι ο Α όρι μος 3 προσπε αύνει κά ε μέ ος ενός πεπερασμένου συνό ου (R Q ) μόνο μια φορά και επειδή ο α όρι μος επανε ραφής rew τερματίζει. Έστ, T, R, R, Q, και π j1,...,j n οι είσοδοι του Α όρι μου 3, όπου η π ειάδα R, R υπο ο ίζεται από κάποιο α όρι μο επανε ραφής rew. Υπο έτουμε τώρα ότι η έξοδος του Α όρι μου 3 είναι το ζευ άρι R, R κα ώς και ότι το ζευ άρι R i, Ri είναι η επανε ραφή που παρά εται ύστερα από i ήματα του α όρι μου rew όταν αυτός εφαρμόζεται στα Q και T. Η π ηρότητα του α ορί μου στηρίζεται στην παρακάτ ιδιότητα, την οποία δεί- νουμε με ρήση επα ής πάν στο i: (VR): Για κά ε i 0 και ια ό α τα Q l R i υπάρ ει Q l R τέτοιο ώστε ια το Q π l = π j1,...,j n (Q l ) ισ ύει μια από τις παρακάτ συν ήκες: 1. το Q π l υπά ει το Q l, ή 2. η συνάρτηση needsrewriting(q l, π j1,...,j n, T ) επιστρέφει αληθές και κάποιο ερώτημα Q l rew(q π l, T ) υπά ει το Q l. Βασική Περίπτωση (i = 0): Αρ ικά R 0 = {Q } όπου Q = π j1,...,j n (Q), συνεπώς η Ιδιότητα (VR) ικανοποιείται. Βήμα Επαγωγής: Υπο έτουμε ότι η Ιδιότητα (VR) ισ ύει ια το ήμα i ια κά ε Q l R i δη αδή, είτε το 1. είτε το 2. ισ ύουν από την Ιδιότητα (VR). Στη συνέ εια, υπο έτουμε ότι στο ήμα i + 1 ο α όρι μος rew εφαρμόζει ένα ήμα συμπερασμού σε κάποιο ερώτημα Q l παρά οντας το ερώτημα Q l+1 που δεν περιέ ει συναρτησιακά σύμ ο α. Εξετάζουμε τώρα ξε ριστά τις δύο περιπτώσεις της επα ικής υπό εσης: 1. Το Q π l υπά ει το Q l. Από τις ιδιότητες της υπα ής α ισ ύει ότι είτε το Qπ l υπά ει το Q l+1 ή ένας συμπερασμός είναι εφαρμόσιμος στο Qπ l και το αποτέ εσμα, έστ Q π 0, υπά ει το Q l+1. Εάν η πρώτη περίπτ ση είναι α η ής τότε όντ ς υπάρ ει ερώτημα Q l R τ.. το Q π l να υπά ει το Q l+1. Υπο έτουμε ότι ισ ύει η δεύτερη περίπτ ση. Υπεν υμίζουμε ότι το Q l περιέ ει τα ίδια άτομα σώματος με το Q π l. Εφόσον οι α όρι μοι επανε ραφής πρα ματοποιούν συμπερασμούς ρησιμοποιώντας μόνο τα άτομα του σώματος τ ν ερ τημάτ ν, προκύπτει ότι ο ίδιος συμπερασμός μπορεί να εφαρμοστεί στο Q l παρά οντας το Q 0. Παρό α αυτά, εφόσον το Q l περιέ ει περισσότερες διακεκριμένες μετα ητές από το Q π l, το Q 0 μπορεί να περιέ ει συναρτησιακούς όρους στις μετα ητές αυτές στο άτομο της κεφα ής οι οποίες όμ ς έ ουν απα ειφ εί από την προ ο ή 38 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

63 Κεφάλαιο 3. Επανεγγραφή Τροποποιημένων Ερωτημάτων στο Q π l. Εάν δεν περιέ ει, τότε Q 0 R και συνεπώς Q π 0 = π j1,...,j n (Q 0 ) κα- ώς η μόνη διαφορά ανάμεσα στα Q 0 και Q π 0 είναι οι διακεκριμένες μετα ητές οι οποίες έ ουν απα ειφ εί από την προ ο ή. Εάν περιέ ει συναρτησιακούς όρους στην κεφα ή, τότε α ισ ύει ότι Q 0 R εφόσον ένας α όρι μος Q- προσανατο ισμένος παρά ει μόνο ερ τήματα που δεν περιέ ουν συναρτησιακούς όρους. Τότε όμ ς, η συνάρτηση needsrewriting(q l, π j1,...,j n, T ) επιστρέφει αληθές και είναι προφανές ότι Q π 0 rew(q π l, T ). Συνεπώς, σε κά ε περίπτ ση η Ιδιότητα (VR) ισ ύει. 2. Η needsrewriting(q l, π j1,...,j n, T ) επιστρέφει αληθές και υπάρ ει ερώτημα Q l rew(q π l, T ) που υπά ει το Q l. Και πά ι, είτε το Q l υπά ει το Q l+1 ή μπορεί να εφαρμοστεί ένας συμπερασμός στο Q l και το αποτέ εσμα, έστ Q 0 υπά ει το Q l. Σε κά ε περίπτ ση το 2. α ισ ύει κα ώς α έ ουμε είτε Q l rew(q π l, T ) ή Q 0 rew(q π l, T ). Ό α αυτά αποδεικνύουν την Ιδιότητα (VR). Υπο έτουμε τώρα ότι όταν εφαρμόζεται ια τα Q, T, ο α όρι μος επανε ραφής rew τερματίζει ύστερα από n ήματα έ οντας υπο ο ίσει την επανε ραφή R n. Η Ιδιότητα (VR) υποδη ώνει ότι με τον τερματισμό του Α ορί μου 3 ια κά ε ερώτημα Q l R n α υπάρ ει ένα ερώτημα Q R το οποίο υπά ει το Q l. Ένα σημείο του Α ορί μου 3 που είναι υπο ο ιστικά ακρι ό είναι στη ραμμή 5 όπου κα είται ο α όρι μος επανε ραφής rew. Εάν αυτός κα είται αρκετές φορές τότε η απόδοση του α ορί μου μας μπορεί να επηρεαστεί σημαντικά. Συνεπώς ια να είναι αποδοτικός ο Α όρι μος 3 είναι απαραίτητο ο rew να κα είται όσο το δυνατόν ι ότερες φορές. Μια προσέ ιση που έ ει ρησιμοποιη εί στο πρ τότυπο σύστημα που α παρουσιασουμε στο κεφά αιο 6 είναι η ακό ου η. Έστ Q i η προ ο ή ενός ερ τήματος Q i και έστ ότι το Q i ικανοποιεί τις συν ήκες της ραμμής 4. Στην περίπτ ση αυτή αντί να επανε ράψουμε άμεσα το ερώτημα Q i το προσ έτουμε σε ένα σύνο ο torew. Τότε, όταν τερματίσει ο εξ τερικός ρό ος επανά ηψης ( ραμμές 2 8), αφαιρούμε από το torew ό α τα ερ τήματα που είναι περιττά σε αυτό και συνεπώς εκτε ούμε τον rew μόνο ια τα μη-περιττά ερ τήματα. Επιπρόσ ετα, μια επανε ραφή που έ ει ήδη υπο ο ιστεί ια κάποιο ερώτημα Q i torew μπορεί να ρησιμοποιη εί ια να αφαιρε ούν ερ τήματα από το torew ια τα οποία δεν έ ει εκτε εστεί ακόμα ο rew. Τέ ος, μια ά η ευριστική μέ οδος είναι να ε έ ξουμε εάν η προ ο ή του ερ τήματος Q ια το οποίο έ ει υπο ο ιστεί η R ρίσκεται στο torew. Στην περίπτ ση αυτή ο α όρι μος μπορεί να σταματήσει την εκτέ εση του και να εκτε έσει τον rew μόνο ια το π j1,...,j n (Q) κα ώς κάτι τέτοιο α παρά ει την επι υμητή επανε ραφή. 3.2 Επέκταση Ερ τημάτ ν με Διακεκριμένες Μετα ητές Στην ενότητα αυτή με ετάμε το πρό ημα του υπο ο ισμού μιας επανε ραφής ια ένα ερώτημα του οποίου οι διακεκριμένες μετα ητές (μετα ητές απάντησης) έ ουν επεκτα εί με νέες, εκμετα ευόμενοι και πά ι όσο το δυνατόν περισσότερη Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 39

64 Επέκταση Ερωτημάτων με Διακεκριμένες Μεταβλητές π ηροφορία από την επανε ραφή που έ ει ήδη υπο ο ιστεί ια το αρ ικό ερώτημα. Το παρακάτ παράδει μα περι ράφει τις ασικές ιδέες στις οποίες στηρίζεται ο α - όρι μος που α παρουσιάσουμε στη συνέ εια. Παράδει μα Έστ το TBox T, το ερώτημα Q 1, η επανε ραφή R = {Q 1, Q 2, Q 3} και η σ έση R από το Παράδει μα Υπο έτουμε τώρα ότι έ- ουμε να επεκτείνουμε το ερώτημα αυτό και να ανακτήσουμε επιπ έον και τα αντίστοι α μα ήματα, δη αδή, έ ουμε να υπο ο ίσουμε την επανε ραφή του ερ τήματος Q 1 από το Παράδει μα η οποία όπ ς δείξαμε προη ουμέν ς αποτε- είται από το σύνο ο R = {Q 1, Q 2 } που μπορεί να υπο ο ιστεί από τα Q 1 και T ρησιμοποιώντας έναν οποιοδήποτε α όρι μο επανε ραφής. Παρό α αυτά, αξίζει να σημειώσουμε ότι και πά ι αντί να εκτε έσουμε έναν α - όρι μο επανε ραφής εξαρ ής μπορούμε να εκμετα ευτούμε την προη ουμέν ς υπο ο ισμένη επανε ραφή R του Q 1 μ..τ. T. Πιο συ κεκριμένα, το Q 1 μπορεί να υπο ο ιστεί από το Q 1 αντικα ιστώντας το άτομο κεφα ής Q A (x 1 ) του Q 1 με το άτομο Q A (x 1, y 1 ) (η y 1 είναι η νέα διακεκριμένη μετα ητή που ρησιμοποιείται ια να ανακτήσουμε τα μα ήματα που διδάσκονται). Επιπ έον, το Q 2 μπορεί να υπο ο ιστεί αντικα ιστώντας το άτομο κεφα ής Q A (x 2 ) του Q 2 με το άτομο Q A (x 1, y 1 )τ, όπου η αντικατάσταση τ = {x 1 x 2, y 1 y 2 } υπο ο ίζεται από την σ έση R. Τέ ος, παρατηρούμε ότι το ερώτημα Καθηγητής(x 3 ) Q A (x 3, y 1 ) που παρά εται από το Q 3 ρησιμοποιώντας την παραπάν διαδικασία δεν προκύπτει από το T Q, συνεπώς δεν πρέπει να παρα εί κανένα ερώτημα από το Q 3. Το παραπάν παράδει μα υποδη ώνει ότι δο έντος ενός ερ τήματος Q που έ ει άτομο κεφα ής το Q A ( x), μιας επανε ραφής R και σ έσης R ια το Q με άση κάποιο TBox T και ένα νέο διάνυσμα y που περιέ ει διακεκριμένες μετα ητές τ.. y var(q), ο α όρι μος μας ια να υπο ο ίσει μια επανε ραφη ια το ερώτημα bd(q) QA ( x, y) ρειάζεται να ερ αστεί ς ακο ού ς: ια κά ε ερώτημα Q i R εάν yτ var(q i ), όπου η αντικατάσταση τ κατασκευάζεται από τη σ έση R, τότε επεκτείνει τις διακεκριμένες μετα ητές του Q i προσ έτοντας τις yτ. Διαφορετικά α πρέπει να απορρίψει το Q i. Η διαδικασία αυτή ίνεται σαφής στον παρακάτ ορισμό. Ορισμός Έστ T TBox, έστ Q ΣΕ με διακεκριμένες μετα ητές x, και έστ R D R Q, R έξοδος ενός α ορί μου επανε ραφής όταν εφαρμόζεται ια τα Q, T. Επιπ έον, έστ z διάνυσμα μετα ητών τ.. z var(q), έστ Q R Q, και έστ τ := {x y x var(q), y var(q ) και x R y}. Η επέκταση του Q με το z είναι η πρόταση Q που ορίζεται ς εξής: Q = bd(q ) Q A ( x, z)τ (3.3) Η επέκταση ονομάζεται ασφαλής (safe) εάν zτ var(q ). Στο Παράδει μα υπο ο ίσαμε την επανε ραφή του ερ τήματος Q 1 που είναι η επέκταση του Q 1 υπο ο ίζοντας ό ες τις ασφα είς επεκτάσεις τ ν ερ τημάτ ν από την επανε ραφή R ρίς να ρειαστεί να εφαρμόσουμε συμπερασμούς. Κάτι τέτοιο, όμ ς, δεν είναι πάντα δυνατό, και όπ ς δεί νει και το παρακάτ παράδει μα εξαρτάται σε με ά ο α μό από την επανε ραφή εισόδου. 40 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

65 Κεφάλαιο 3. Επανεγγραφή Τροποποιημένων Ερωτημάτων Παράδει μα Έστ το παρακάτ TBox και ερώτημα: T = {A(x) y.r(x, y)} Q 1 = A(x 1 ) R(x 1, y 1 ) Q A (x 1 ). Το σύνο ο R = {Q 1, Q 2 }, όπου Q 2 = A(x 2 ) Q A (x 2 ), είναι μια επανε ραφή του Q 1 μ..τ. T. Παρό α αυτά, παρατηρούμε ότι το ερώτημα Q 2 υπά ει το Q 1, συνεπώς το Q 1 μπορεί να αφαιρε εί και το σύνο ο R = {Q 2 } είναι επίσης μια επανε ραφή του Q 1 μ..τ. T. Έστ τώρα ότι έ ουμε να επεκτείνουμε το ερώτημα Q 1 προσ έτοντας την μετα- ητή y 1 στη ίστα τ ν διακεκριμέν ν μετα ητών και ότι έ ουμε να υπο ο ίσουμε μια επανε ραφή ια το επεκτεταμένο ερώτημα, δη αδή, το Q 1 = A(x 1 ) R(x 1, y 1 ) Q A (x 1, y 1 ). Χρησιμοποιώντας την R το μόνο ερώτημα που μπορεί να επεκτα εί με την y 1 είναι το Q 2, όμ ς, η επέκταση του δεν είναι ασφα ής. Συνεπώς, ρησιμοποιώντας την R προκύπτει το άδειο σύνο ο. Αντι έτ ς ρησιμοποιώντας την R η επέκταση του Q 1 με την y 1 είναι το ερώτημα Q 1 και το σύνο ο {Q 1} η επι υμητή επανε ραφή. Διαισ ητικά, το πρό ημα με το προη ούμενο παράδει μα είναι ότι ενώ το Q 2 υπά ει το Q 1 στην R, οι επεκτάσεις του ερ τήματος Q 2 με κάποια μετα ητή μπορεί να μην είναι ασφα είς και συνεπώς δεν αποτε ούν μέρος της εξόδου. Συνεπώς, οι επεκτάσεις του Q 1 δεν α είναι περιττές και α πρέπει να προστε ούν στο αποτέ εσμα. Κάτι τέτοιο είναι δυνατό εάν το Q 1 δεν έ ει αφαιρε εί από την R ό του Q 2. Εάν αφαιρούνται περιττά ερ τήματα τότε ο α όρι μος μας α πρέπει να εφαρμόζει επιπ έον συμπερασμούς στα επεκτεταμένα ερ τήματα κα ώς και στην επέκταση του αρ ικού ερ τήματος Q. Όμ ς, αυτό ενικά συνεπά εται ότι μια διαδικασία επανε - ραφής α πρέπει να εφαρμοστεί εξαρ ής ακυρώνοντας έτσι όποια οφέ η προέκυψαν από την π ηροφορία που έ ει υπο ο ιστεί προη ουμέν ς. Στη συνέ εια, ορίζουμε μια ιδιότητα ια τις επανε ραφές που ρησιμοποιούνται ς είσοδοι η οποία είναι επαρκής ια τον υπο ο ισμό μιας επανε ραφής ρησιμοποιώντας μόνο ασφα είς επεκτάσεις. Ορισμός Έστ Q ΣΕ, έστ T TBox, και έστ R επανε ραφή ια το Q μ..τ. T με διαμερίσεις R D R Q υπο ο ισμένη από ένα α όρι μο επανε ραφής που στηρίζεται σε ένα σύστημα συμπερασμών Γ. Λέμε ότι η R είναι κλειστή ως προς το συμπερασμό (inference-closed) ια τα Q, T εάν Q R και εάν επιπ έον, ια κά ε ερώτημα Q 1 R Q εάν ένα ερώτημα Q 2 προκύπτει από το T Q 1 μέσ του Γ, τότε επίσης Q 2 R Q. Εύκο α παρατηρούμε ότι η επανε ραφή R από το Παράδει μα δεν είναι κ ειστή ς προς το συμπερασμό κα ώς Q 1 R, ενώ η R είναι. Διαισ ητικά, μια επανε ραφή R είναι κ ειστή ς προς το συμπερασμό εάν ό α τα ερ τήματα πο παρά ονται από τον α όρι μο κατά την παρα ή της R ανήκουν επίσης στην R. Αυτό συνή ς συνεπά εται ότι η R υπο ο ίζεται ρίς τη ρήση ε τιστοποιήσε ν όπ ς η απα οιφή περιττών ερ τημάτ ν που αφαιρεί ερ τήματα που προκύπτουν από το Γ, ή ότι τέτοιες ε τιστοποιήσεις έ ουν απενερ οποιη εί. Παρό ο που κάτι τέτοιο συνεπά εται ότι η παρα ή μιας επανε ραφής, που ρησιμοποιείται στη συνέ εια ς είσοδος στον α όρι μο μας, δεν είναι αποδοτική υπάρ ουν συστήματα όπ ς α δείξουμε στη συνέ εια της διατρι ής μας που μπορούν να υπο ο ίσουν Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 41

66 Επέκταση Ερωτημάτων με Διακεκριμένες Μεταβλητές Α όρι μος 4 ExtendRewritingForNewVars(Q, R, R, y) Είσοδος: Ένα ΣΕ Q, μια επανε ραφή R με διαμέριση R D R Q και μια σ έση R που αποτε ούν την έξοδο ενός α ορί μου επανε ραφής ια το Q με άση ένα TBox T, και ένα διάνυσμα μετα ητών y τ.. y var(q). 1: Αρ ικοποίησε μια επανε ραφή R := R D και μια σ έση R := R 2: for all Q i R Q do 3: το Q i := είναι η επέκταση του Q i με το y 4: if το Q i είναι ασφα ές then 5: Προσέ εσε το Q i στην R 6: end if 7: end for 8: return R, R τέτοιες επανε ραφές πο ύ αποδοτικά. Επιπρόσ ετα, η ιδιότητα της κ ειστότητας ς προς τον συμπερασμό φαίνεται π ς είναι σ ετική και με ά α προ ήματα στην απάντηση ερ τημάτ ν, όπ ς η επανε ραφή ερ τημάτ ν ια οντο ο ίες που έ ουν τροποποιη εί [161]. Ο Α όρι μος 4 παρουσιάζει την προσέ ιση μας ια τον υπο ο ισμό μιας επανε ραφής ια ερ τήματα που έ ουν επεκτα εί με νέες διακεκριμένες μετα ητές συνοψίζοντας όσα παρουσιάσαμε παραπάν. Δέ εται ς είσοδο ένα ερώτημα Q, μια επανε ραφή R, R ια το Q μ..τ. T, και ένα διάνυσμα μετα ητών y. Στη συνέ εια προσπε αύνει ό α τα ΣΕ Q i R Q και υπο ο ίζει την επέκταση Q i του Q i με το διάνυσμα y όπ ς στον Ορισμό Εάν η επέκταση είναι ασφα ής τότε το Q i προστί εται στην R ( ραμμή 5), α ιώς το Q i απορρίπτεται. Θεώρημα Έστω T TBox, έστω Q ΣΕ, έστω y διάνυσμα μεταβλητών τ.ω. y var(q) και έστω R μια επανεγγραφή κλειστή ως προς το συμπερασμό για το Q μ.β.τ. T μαζί με μια σχέση R. Όταν εφαρμόζεται ο Αλγόριθμος 4 στα Q, R, R, και y τερματίζει. Έστω R η έξοδος του αλγορίθμου. Τότε η R είναι μια επανεγγραφή κλειστή ως προς το συμπερασμό για την επέκταση του Q με το διάνυσμα y μ.β.τ. T. Απόδειξη: Ο τερματισμός προκύπτει από το ε ονός ότι ο Α όρι μος 4 προσπε αύνει μια φορά κά ε μέ ος του πεπερασμένου συνό ου R. Έστ, T, R, R, Q, και y, η είσοδος του Α όρι μου 4, όπου η π ειάδα R, R υπο ο ίζεται από κάποιο α όρι μο επανε ραφής rew και το y είναι ένα διάνυσμα μετα ητών τ.. y var(q). Έστ τώρα ότι η έξοδος του Α ορί μου 4 είναι το ζευ άρι R, R και έστ επίσης ότι το ζευ άρι R i, Ri είναι η επανε ραφή που προκύπτει ύστερα από i ήματα του α όρι μου επανε ραφής rew όταν αυτός εφαρμόζεται στην επέκταση του Q με το y, το οποίο στη συνέ εια α αναφέρεται ς Q. Η απόδειξη του παραπάν ε ρήματος προκύπτει από την παρακάτ ιδιότητα, την οποία δεί νουμε με ρήση επα ής στο ήμα i: (VE): Για κά ε i 0 και ια κά ε Q l R i υπάρ ει Q l R τ.. η επέκταση Q e του Q l με το y είναι ασφα ής και υπά ει το Q l. 42 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

67 Κεφάλαιο 3. Επανεγγραφή Τροποποιημένων Ερωτημάτων Βασική Περίπτωση (i = 0): Αρ ικά R 0 = {Q } όπου Q είναι η επέκταση του Q με το y, συνεπώς η Ιδιότητα (VE) ικανοποιείται. Βήμα Επαγωγής: Έστ ότι η Ιδιότητα (VE) ισ ύει ια το ήμα i ια κά ε Q l R i. Επιπ έον, έστ ότι στο ήμα i + 1 παρά εται το ερώτημα Q l+1 από το Q l με την εφαρμο ή ενός ήματος συμπερασμού ενός Q-προσανατο ισμένου α όρι μου επανε ραφής rew. Εφόσον το Q e υπά ει το Q l από τις ιδιότητες της υπα ής α έ ουμε ότι είτε το Q e υπά ει το Q l+1 ή ότι ένας συμπερασμός μπορεί να εφαρμοστεί στο Q e και το αποτέ εσμα Q e υπά ει το Q l+1. Εάν ισ ύει η πρώτη περίπτ ση τότε η ιδιότητα ισ ύει. Συνεπώς ε ρούμε ότι ισ ύει η δεύτερη περίπτ ση. Εφόσον ό ες οι μετα ητές στο διάνυσμα y εμφανίζονται στην κεφα ή του Q e ο συμπερασμός που παρά ει το Q e πρέπει να είναι τέτοιος ώστε να μην απα είφει ή αντιστοι εί μετα ητές από το y σε συναρτησιακούς όρους. Αξίζει τώρα να υπεν υμίσουμε ότι το Q l είναι όπ ς το Q e, α ά το δεύτερο περιέ ει ό ες τις μετα ητές y στην κεφα ή του. Συνεπώς, οι ίδιοι συμπερασμοί είναι εφαρμόσιμοι στο Q l, παρά οντας το Q 0. Επιπρόσ ετα, όπ ς έ ει τονιστεί προη ούμενα, οι μετα ητές y var(q l ) δεν επηρεάζονται από αυτό τον συμπερασμό και συνεπώς α πρέπει να έ ουμε y var(q 0 ). Άρα, η επέκταση του Q 0 με το y είναι ασφα ής και προφανώς η επέκταση του είναι το ερώτημα Q e. Ακόμη, εφόσον η R είναι κ ειστή ς προς το συμπερασμό έ ουμε επίσης ότι Q 0 R. Συνεπώς, υπάρ ει ένα ερώτημα Q 0 στην R τ.. η επέκταση του με το y είναι ασφα ής και υπά ει το Q l+1. Από τα παραπάν προκύπτει η απόδειξη της Ιδιότητας (VE).Έστ τώρα ότι όταν εφαρμόζεται στα Q, T, ο α όρι μος rew τερματίζει ύστεα από n ήματα έ οντας παρά ει την R n. Η Ιδιότητα (VE) υποδη ώνει ότι κατά τον τερματισμό του Α ορί μου 4 ια κά ε ερώτημα Q l R n α υπάρ ει ένα ερώτημα Q στην R το οποίο α υπά ει το Q l. Τέ ος, είναι προφανές ότι η έξοδος του α ορί μου α είναι επίσης κ ειστή προς το συμπερασμό. 3.3 Μεί ση Ερ τημάτ ν με Άτομα Ακο ού ς, στην ενότητα αυτή με ετάμε το πρό ημα υπο ο ισμού μιας επανε ραφής ια ένα ερώτημα του οποίου έ ουν αφαιρε εί κάποια άτομα από το σώμα του, ρησιμοποιώντας και πά ι όσο το δυνατόν περισσότερη π ηροφορία από την επενε ραφή που έ ει υπο ο ιστεί προη ούμενα ια το αρ ικό ερώτημα. Το παρακάτ παράδει μα περι ράφει τις ασικές ιδέες στις οποίες στηρίζεται ο α όρι μος που α παρουσιάσουμε στη συνέ εια. Παράδει μα Έστ το TBox T που δίνεται στη συνέ εια σε μορφή προτάσε ν: και έστ επίσης το ερώτημα ΜεταπτυχιακόςΦοιτητής(x) Φοιτητής(x), (3.4) Τενίστας(x) Αθλητής(x) (3.5) Q 1 = Φοιτητής(x 1 ) Αθλητής(x 1 ) Q A (x 1 ). Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 43

68 Μείωση Ερωτημάτων με Άτομα Το σύνο ο R = {Q 1, Q 2, Q 3, Q 4 }, όπου τα Q i ορίζονται στη συνέ εια, αποτε εί επανε ραφή ια το Q 1 μ..τ. T και μπορεί να υπο ο ιστεί ρησιμοποιώντας συστήματα όπ ς το PerfectRef, το Rapid, και το Requiem: Q 2 = Φοιτητής(x 2 ) Τενίστας(x 2 ) Q A (x 2 ), Q 3 = ΜεταπτυχιακόςΦοιτητής(x 3 ) Αθλητής(x 3 ) Q A (x 3 ), Q 4 = ΜεταπτυχιακόςΦοιτητής(x 4 ) Τενίστας(x 4 ) Q A (x 4 ) Επιπρόσ ετα, R = { x 1, x 2, x 1, x 3, x 1, x 4 }, η οποία δεί νει π ς σ ετίζεται η μετα ητή x 1 με τις μετα ητές x 2, x 3, και x 4. Πιο συ κεκριμένα, έ ουμε τους παρακάτ συμπερασμούς και τις αντίστοι ες υποσημειώσεις Υ i = { A i, B i }: Q 1, (3.5), Q 2 με A 2 = {Αθλητής(x 1 )} και B 2 = {Τενίστας(x 2 )} Q 1, (3.4), Q 3 με A 3 = {Φοιτητής(x 1 )} και B 3 = {ΜεταπτυχιακόςΦοιτητής(x 3 )} Q 2, (3.4), Q 4 με A 4 = {Φοιτητής(x 2 )} και B 4 = {ΜεταπτυχιακόςΦοιτητής(x 4 )} Q 3, (3.5), Q 4 με A 5 = {Αθλητής(x 3 )} και B 5 = {Τενίστας(x 4 )} Έστ τώρα ότι στη συνέ εια ο ρήστης έ ει να ανακτήσει ό α τα αντικείμενα που είναι φοιτητές δη αδή, να έσει το ερώτημα Q 1 = Φοιτητής(x 1) Q A (x 1). Εύκο α μπορεί να δει εί ότι R = {Q 1, Q 2}, με Q 2 = ΜεταπτυχιακόςΦοιτητής(x 2) Q A (x 2), είναι επανε ραφή του Q 1 μ..τ. T που μπορεί να υπο ο ιστεί από οποιοδήποτε α όρι μο/σύστημα. Παρό α αυτά, παρατηρούμε ότι μια επανε ραφή ια το Q 1 μ..τ. T μπορεί να υπο- ο ιστεί ρησιμοποιώντας την π ηροφορία που έ ει υπο ο ιστεί προη ούμενα ια το R. Πιο συ κεκριμένα, ένα ερώτημα ισοδύναμο με το Q 1 μπορεί να παρα εί αφαιρώντας το άτομο Αθλητής(x 1 ) από το ερώτημα Q 1, ενώ ένα ερώτημα ισοδύναμο με το Q 2 μπορεί να παρα εί αφαιρώντας από το Q 3 το άτομο Αθλητής(x 1 )τ 3, όπου η αντικατάσταση τ 3 = {x 1 x 3 } ορίζεται με άση τη σ έση R. Τέ ος, παρατηρούμε ότι τα ερ τήματα Q 2 και Q 4 πρέπει να απορριφ ούν κα ώς ια κά ε αντικατάσταση σ έ ουμε ότι Αθλητής(x 1 )σ bd(q 2 ) και Αθλητής(x 1 )σ bd(q 4 ). Διαισ ητικά, αυτό οφεί εται στο ε ονός ότι το άτομο Αθλητής(x 1 ) που αφαιρείται συμμετέ ει στο συμπερασμό Q 1, (3.5), Q 2, δη αδή, Αθλητής(x 1 ) A 2, και στο συμπερασμό Q 3, (3.5), Q 4, δη αδή, Αθλητής(x 1 )τ 3 A 5, όπου τ 3 = {x 1 x 3 }. Άρα, στο μει μένο ερώτημα οι συμπερασμοί αυτοί δεν είναι δυνατοί. Παρατηρούμε ακόμα ότι το Q 4 παρά εται και από το συμπερασμό Q 2, (3.4), Q 4, α ά εφόσον το Q 2 αφαιρείται ο συμπερασμός αυτός δεν είναι εφικτός. Το παραπάν παράδει μα δεί νει ότι δεδομένης μιας επανε ραφής R ια ένα ερώτημα Q, μια ασική ειτουρ ία ια τον υπο ο ισμό μιας επανε ραφής ια ένα ερώτημα Q ια το οποίο ισ ύει bd(q ) = bd(q) \ {α} είναι η αφαίρεση του ατόμου ατ από κά ε ΣΕ Q i R τ.. ατ bd(q i ), όπου η αντικατάσταση τ προκύπτει από 44 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

69 Κεφάλαιο 3. Επανεγγραφή Τροποποιημένων Ερωτημάτων τη σ έση R. Διαφορετικά το Q i α πρέπει να απορρίπτεται. Επιπ έον, δεί νει ότι ο α όρι μος μπορεί να ρησιμοποιήσει επιπ έον π ηροφορία που παρά εται κατά την κατασκευή της επανε ραφής R, όπ ς είναι τα σύνο α A i, έτσι ώστε να μπορεί να αποφαν εί εάν ένας συμπερασμός είναι εφικτός ακόμα και με την αφαίρεση κάποι ν ατόμ ν. Το παρακάτ παράδει μα καταδεικνύει ένα δεύτερο τε νικό σημείο που μπορεί να προκύψει όταν υπο ο ίζουμε την επανε ραφή ενός ερ τήματος που έ ει μει εί, που και πά ι ρειάζεται επιπ έον π ηροφορία από την είσοδο. Παράδει μα Έστ το παρακάτ TBox και ερώτημα: T = {Φοιτητής(x) y.παρακολουθεί(x, y), ΜεταπτυχιακόςΦοιτητής(x) Φοιτητής(x)} Q 1 = Φοιτητής(x 1 ) παρακολουθεί(x 1, y 1 ) Q A (x 1 ) Μια επανε ραφή ια το Q 1 μ..τ. T αποτε είται από το σύνο ο R = {Q 1, Q 2, Q 3 }, όπου Q 2 = Φοιτητής(x 2 ) Q A (x 2 ) και Q 3 = ΜεταπτυχιακόςΦοιτητής(x 3 ) Q A (x 3 ). Πιο συ κεκριμένα, τα αξιώματα του T μετασ ηματίζονται στις παρακάτ προτάσεις Φοιτητής(x) παρακολουθεί(x, f(x)), (3.6) ΜεταπτυχιακόςΦοιτητής(x) Φοιτητής(x) (3.7) και το Q 2 παρά εται από ένα συμπερασμό με κύρια υπό εση το Q 1, παράπ ευρη πρόταση την (3.6) και Υ 2 = { A 2, B 2 } όπου A 2 = {παρακολουθεί(x 1, y 1 )} και B 2 = {Φοιτητής(x 2 )}, ενώ το Q 3 παρά εται από ένα συμπερασμό με το Q 2 ς κύρια υπό εση, την (3.7) ς παράπ ευρη υπό εση και Υ 3 = { A 3, B 3 }, όπου A 3 = {Φοιτητής(x 2 )} και B 3 = {ΜεταπτυχιακόςΦοιτητής(x 3 )}. Επιπ έον, έ ουμε R = { x 1, x 2, x 1, x 3 }. Έστ τώρα ότι έ ουμε να αφαιρέσουμε το άτομο α = Φοιτητής(x 1 ) και συνεπώς να υπο ο ίσουμε μια επανε ραφή ια το ερώτημα Q 1 = παρακολουθεί(x 1, y 1) Q A (x 1) όπ ς είναι ια παράδει μα η επανε ραφή R = {Q 1, Q 2, Q 3 }. Έστ ότι έ ουμε να υπο ο ίσουμε την επανε ραφή R ρησιμοποιώντας την προσέ ιση μας. Πρώτα, αφαιρούμε το άτομο Φοιτητής(x 1 ) από το Q 1 και συνεπώς παίρνουμε το Q 1. Στη συνέ εια, ια τ = {x 1 x 2 } μπορούμε να αφαιρέσουμε το Φοιτητής(x 1 )τ από το Q 2, όμ ς, κάτι τέτοιο έ ει ς αποτέ εσμα την παρα ή μιας πρότασης που δεν είναι έ υρη. Ο ό ος είναι ότι το άτομο Φοιτητής(x 1 )τ εμφανίζεται στο Q 2 επειδή έ ει προστε εί από ένα συμπερασμό με το Q 1 ς κύρια υπό εση πάν στο άτομο του Q 1 που είναι διαφορετικό από αυτό που αφαιρείται, δη αδή, A 2 = {παρακολουθεί(x 1, y 1 )} Φοιτητής(x 1 )τ και Φοιτητής(x 1 )τ B 2. Διαισ ητικά, αυτό συνεπά εται ότι η κατασκευή αυτού του κομματιού του ερ τήματος από το σύστημα συμπερασμού είναι ανεξάρτητη από την αφαίρεση του ατόμου α. Συνεπώς, ο α όρι μος μας α πρέπει να αντι ράψει τα αντίστοι α ερ τήματα, δη αδή, τα Q 2 και Q 3 (το Q 3 παρά εται από το Q 2 ) στο αποτέ εσμα, παρά οντας την επι υμητή επανε ραφή. Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 45

70 Μείωση Ερωτημάτων με Άτομα Μια παρόμοια κατάσταση προκύπτει όταν έ ουμε ένα συμπερασμό της μορφής Q 1, C, Q 2 όπου Q 1 = R(x, y) R(z, y) Q A (x), C = A(x) R(x, f(x)), Q 2 = A(x) Q A (x) και A 1 = {R(x, y), R(z, y)}, ενώ το άτομο που αφαιρείται είναι το R(z, y). Παρό ο που R(z, y) bd(q 2 ) και R(z, y) A 1, δη αδή, το άτομο που αφαιρείται συμμετέ ει στο συμπερασμό που παρά ει το ερώτημα Q 2, ο συμπερασμός είναι δυνατός ακόμα και μετά την αφαίρεση του ατόμου, και συνεπώς ο α όρι μος α πρέπει και πά ι να αντι ράψει το A(x) Q A (x) στο αποτέ εσμα. Τόσο στην περίπτ ση αυτή όπ ς και στο Παράδει μα η διαίσ ηση είναι ότι υπάρ ουν ερ τήματα που είναι ανεξάρτητα από την αφαίρεση κάποιου ατόμου και συνεπώς αυτά α πρέπει να να αντι ράφονται στο αποτέ εσμα. Στη συνέ εια ορίζουμε τυπικά αυτή την ιδιότητα. Ορισμός Έστ Q ΣΕ, έστ T TBox, και έστ R = R D R Q επανε ραφή ια το Q μ..τ. T που προκύπτει από ένα α όρι μο επανε ραφής ρησιμοποιώντας ένα σύστημα συμπερασμού Γ. Ένα ερώτημα Q R Q α έ εται ανεξάρτητο (independent) από το α εάν ισ ύει μια από τις παρακάτ συν ήκες: το Q είναι το αποτέ εσμα ενός συμπερασμού με υπό εση ένα ερώτημα Q R Q και υποσημεί ση Υ τ.. ια την αντικατάσταση τ := {x y x var(q), y var(q ), x R y} έ ουμε ατ bd(q ) και ια καποια A, B Υ και τ := {x y x var(q), y var(q ), x R y} ισ ύει A {ατ } ή ατ B, ή υπάρ ει Q j R Q τ.. το Q j είναι ανεξάρτητο από το α και το Q προκύπτει από το T {Q j } στο Γ. Στο Παράδει μα 3.3.2, το ερώτημα Q 2 είναι ανεξάρτητο από το άτομο Φοιτητής(x 1 ) κα ώς προκύπτει από ένα συμπερασμό με κύρια υπό εση το Q 1, επίσης Φοιτητής(x 1 ) bd(q 1 ) (τ είναι η ταυτοτική αντικατάσταση) και ια τ = {x 1 x 2 } και Υ 2 = { A 2, B 2 } (υποσημεί ση του συ κεκριμένου συμπερασμού) έ ουμε Φοιτητής(x 1 )τ B 2. Επιπ έον, το Q 3 είναι επίσης ανεξάρτητο από το Φοιτητής(x 1 ), εφόσον το Q 3 παρά εται από το Q 2 που όπ ς έ ει δει εί προη ουμέν ς είναι ανεξάρτητο από το Φοιτητής(x 1 ). Όπ ς δεί νει το επόμενο παράδει μα, οι πράξεις που περι ράψαμε παραπάν μπορεί να μην είναι αρκετές ια τον υπο ο ισμό μιας επανε ραφής ια το νέο (μει μένο) ερώτημα. Επιπρόσ ετα, όπ ς στην περίπτ ση της προ ο ής ερ τήματος, υπάρ ουν περιπτώσεις που επιπ έον συμπερασμοί είναι απαραίτητοι ια την κατασκευή μιας π ήρους επανε ραφής ια τα μει μένα ερ τήματα. Παράδει μα Έστ το παρακάτ TBox και ερώτημα: T = {A(x) y.r(x, y)} Q 1 = R(x 1, y 1 ) B(y 1 ) Q A (x 1 ) Το σύνο ο R = {Q 1 } είναι μια επανε ραφή ια το Q 1 μ..τ. T. Έστ τώρα ότι έ ουμε να υπο ο ίσουμε μια επανε ραφή ια το ερώτημα Q 1 = R(x 1, y 1) Q A (x 1) ρησιμοποιώντας την προσέ ιση μας. Κάτι τέτοιο α 46 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

71 Κεφάλαιο 3. Επανεγγραφή Τροποποιημένων Ερωτημάτων εί ε ς αποτέ εσμα την παρα ή του συνό ου R = {Q 1} το οποίο όμ ς δεν είναι επανε ραφή ια το ερώτημα Q 1 μ..τ. T. Πιο συ κεκριμένα, ια το αντικείμενο I = {A(a)} έ ουμε cert(q 1, T I) = {a}, ενώ cert(r, I) =. Για να υπο ο ίσουμε μια επανε ραφή ια το Q 1 πρέπει αρ ικά να μετασ ηματίσουμε το μοναδικό αξί μα του T στην πρόταση A(x) R(x, f(x)) (3.8) Στη συνέ εια, ρειάζεται να εφαρμόσουμε κανόνες συμπεραμού από ένα α όρι μο επανε ραφής ια το ερώτημα Q 1. Αυτό α έ ει ς αποτέ εσμα την παρα ή του ερ τήματος Q 2 = A(x 2) Q A (x 2) από το Q 1 και την πρόταση (3.8). Τότε μπορεί να επα η ευτεί ότι το σύνο ο R = {Q 1, Q 2} είναι επανε ραφή ια τα Q 1, T. Και πά ι ο α όρι μος μας στηρίζεται στην παρακάτ συνάρτηση ια να μπορεί να ανα ν ρίσει τις περιπτώσεις ια τις οποίες είναι απαραίτητη η εφαρμο ή επιπ έον κανόν ν συμπερασμού. Ορισμός Έστ Q ΣΕ, έστ α άτομο του Q και έστ T TBox. Τότε, η συνάρτηση needsrewriting(q, α, T ) επιστρέφει αληθές εάν υπάρ ει συμπερασμός με κύρια υπό εση το ερώτημα bd(q) \ {α} hd(q) και υποσημειώσεις σ α, Υ α και υπάρ ει A α, B α Υ α τ.. ια κά ε συμπερασμό με κύρια υπό εση το Q και υποσημειώσεις σ, Υ και κά ε A, B Υ είτε A A α ή B = B α. Διαφορετικά επιστρέφει ψευδές. Τέ ος, όπ ς στην περίπτ ση της επέκτασης ερ τημάτ ν με νέες μετα ητές, το επόμενο παράδει μα δεί νει ότι η επανε ραφή που ρησιμοποιείται στην είσοδο του α ορί μου πρέπει να είναι κ ειστή ς προς το συμπερασμό, διαφορετικά είναι απαραίτητη η εφαρμο ή συμπερασμών ια ό α τα μει μένα ερ τήματα. Παράδει μα Έστ τα T και Q από το Παράδει μα κα ώς και η κ ειστή ς προς το συμπερασμό επανε ραφή R = {Q 1, Q 2 }, όπου Q 2 = A(x 2 ) Q A (x 2 ) και η επανε ραφή R = {Q 2 } που δεν είναι κ ειστή ς προς το συμπερασμό. Έστ τώρα ότι έ ουμε να αφαιρέσουμε το άτομο α = A(x 1 ), δη αδή, έ ουμε να υπο ο ίσουμε την επανε ραφή ια το ερώτημα Q 1 = R(x 1, y 1 ) Q A (x 1 ). Μια τέτοια επανε ραφή είναι η R = {Q 1, Q 2 } που μπορεί να υπο ο ιστεί από ό α τα σύ ρονα συστήματα επανε ραφής. Παρό α αυτά, είναι εύκο ο να παρατηρήσουμε ότι ρησιμοποιώντας τη μέ οδο που περι ράψαμε παραπάν δεν μπορούμε να πάρουμε την R από την R. Μπορεί όμ ς, να υπο ο ιστεί ρησιμοποιώντας την R. Ο Α όρι μος 5 παρουσιάζει την προσέ ιση μας ια τον υπο ο ισμό μιας επανε ραφής ια ένα μει μένο ερώτημα εκμετα ευόμενοι την π ηροφορία που έ ει παρα εί προη ούμενα και στηρίζεται στα σημεία που παρουσιάζουμε στη συνέ εια. Ο α όρι μος δέ εται ς είσοδο ένα TBox T, ένα ερώτημα Q, μια επανε ραφή R ια το Q μ..τ. T και ένα άτομο α Q. Επιπ έον στηρίζει τη ειτουρ ία του σε ένα οποιοδήποτε α όρι μο επανε ραφής rew έτσι ώστε να μπορεί να παρά ει επανε ραφές όποτε αυτό κρίνεται απαραίτητο. Ο α όρι μος αρ ικοποιεί πρώτα μια νέα επανε ραφή R με την R D και τη σ έση R με την R, περιορισμένη όμ ς στις μετα ητές που εμφανίζονται στα Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 47

72 Μείωση Ερωτημάτων με Άτομα Α όρι μος 5 removeatom(t, Q, R, R, α) Είσοδος: Ένα TBox T, ένα ερώτημα Q, μια επανε ραφή R, R ια το Q μ..τ. T με διαμέριση R D R Q, και ένα άτομο α bd(q). 1: Αρ ικοποίησε μια επανε ραφή R := R D 2: R := { x, y x R y και x var(bd(q) \ {α})} 3: Έστ ένας τε εστής προ ο ής π που περι αμ άνει τις έσεις k ια ό ες τις μετα ητές του avar(q) 4: if y var(α) with y avar(q) y var(bd(q) \ {α}) then 5: Αφαίρεσε από το π κά ε έση j k ια την οποία x jk = y 6: end if 7: for Q i R Q do 8: τ := {x y x var(q), y var(q i ) και x R y} 9: if Q i ανεξάρτητο από το α then 10: Προσέ εσε το Q i στο R Q 11: else if ατ bd(q i ) then 12: Q i := π( bd(q i ) \ {ατ} hd(q i )) 13: Προσέ εσε το Q i στο R Q 14: if needsrewriting(q i, ατ, T ) then 15: R n, Rn := rew(q i, T ) 16: R := R R n και R := R Rn 17: end if 18: end if 19: end for 20: return R, R άτομα bd(q) \ {α}. Πριν συνε ίσουμε στην περι ραφή του α ορί μου, αξίζει να σημει εί π ς ο α όρι μος ε έ ει πρώτα εάν το άτομο που πρόκειται να αφαιρε εί περιέ ει μια διακεκριμένη μετα ητή του Q που δεν εμφανίζεται σε κανένα ά ο άτομο του Q ( ραμμή 4). Στην περίπτ ση αυτή, εκτός από την αφαίρεση του ατόμου από κά ε ερώτημα, ο α όρι μος ρειάζεται να αφαιρέσει επίσης τη μετα ητή αυτή από την κεφα ή κά ε ερ τήματος. Κάτι τέτοιο είναι εφικτό με την κατασκευή ενός κατά η ου τε εστή προ ο ής π. Στη συνέ εια, ο α όρι μος εισέρ εται στον κεντρικό ρό ο. Προσπε αύνει κά ε ερώτημα Q i R Q και παρά ει κατά η ες αντιστοι ήσεις τ τ ν μετα ητών του Q i μ..τ. τις μετα ητές του Q ( ραμμή 8). Στη συνέ εια, ε έ ει εάν το Q i είναι ανεξάρτητο από το α ( ραμμή 9) και εάν κάτι τέτοιο ισ ύει τότε προσ έτει το Q i στο αποτέ εσμα. Διαφορετικά εάν το α εμφανίζεται στο σώμα του Q i ( ραμμή 11) κατασκευάζει το νέο ερώτημα Q i := bd(q i ) \ {ατ} hd(q i ) ( ραμμή 12) και το προσ έτει στο αποτέ εσμα. Τέ ος, ρησιμοποιεί τη συνάρτηση needsrewriting ια να ε έ ξει εάν το Q i ρειάζεται να επανε ραφεί περισσότερο και εάν ρειάζεται προσ έτει την παρα όμενη επανε ραφή στο αποτέ εσμα ( ραμμές 14 17). Θεώρημα Έστω Q ΣΕ, έστω T TBox, έστω α άτομο τ.ω. α bd(q) και έστω R, R έξοδος ενός αλγόριθμου επανεγγραφής όταν εφαρμόζεται στα Q, T 48 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

73 Κεφάλαιο 3. Επανεγγραφή Τροποποιημένων Ερωτημάτων έτσι ώστε η R να είναι κλειστή ως προς το συμπερασμό. Έστω R επανεγγραφή που παράγεται από τον Αλγόριθμο 5 όταν εφαρμόζεται στα T, Q, R, R, και α. Τότε το σύνολο R είναι μια επανεγγραφή κλειστή ως προς το συμπερασμό για το ερώτημα bd(q) \ {α} hd(q) μ.β.τ. T. Απόδειξη: Ο τερματισμός του α ορί μου προκύπτει από το ε ονός ότι ο Α όρι μος 5 προσπε αύνει μόνο μια φορά κά ε ερώτημα που είναι μέ ος ενός πεπερασμένου συνό ου (R Q ) κα ώς και επειδή ο α όρι μος επανε ραφής rew τερματίζει. Έστ, T, R, R, Q, και α είσοδος ια τον Α όρι μο 5, όπου R, R είναι επανε ραφη κ ειστή ς προς το συμπερασμό που υπο ο ίζεται από κάποιο α όρι μο rew και έστ α bd(q). Έστ ότι η έξοδος του Α όρι μου 5 είναι ένα ζευ άρι R, R και έστ επίσης ότι R i, Ri είναι η επανε ρφαή που υπο ο ίζεται ύστερα από i ήματα του α ορί μου επανε ραφής rew όταν αυτός εφαρμόζεται ια τα Q = bd(q)\{α} hd(q) και T. Η απόδειξη του παραπάν ε ρήματος προκύπτει από την παρακάτ ιδιότητα, την οποία α δείξουμε ρησιμοποιώντας επα ή πάν στον αρι μό ημάτ ν i. Για να απ οποιήσουμε τον συμ ο ισμό και ρίς ά η της ενικότητας υπο έτουμε ότι ο τε εστής προ ο ής δεν ρειάζεται. (AR): Για κά ε i 0 και Q l R i υπάρ ει Q l R τέτοιο ώστε ισ ύει μια από τις παρακάτ συν ήκες: 1. το Q l είναι ανεξάρτητο από το α και υπά ει το Q l, ή 2. ια την αντικατάσταση τ που ορίζεται από τη ραμμή 8 του Α ορί μου 5 έ ουμε ατ bd(q l ) και ια Q r l = bd(q l ) \ {ατ} hd(q l ) ισ ύει ένα από τα παρακάτ : (αʹ) το Q r l υπά ει το Q l, ή ( ʹ) η needsrewriting(q l, α, T ) επιστρέφει αληθές και κάποιο Q l rew(q r l, T ) υπά ει το Q l. Βασική Περίπτωση (i = 0): Αρ ικά R 0 = {Q } όπου Q = bd(q) \ {α} hd(q), συνεπώς, η Ιδιότητα (AR) ικανοποιείται. Βήμα Επαγωγής: Έστ ότι η Ιδιότητα (AR) ισ ύει ύστερα από i ήματα ια κά ε Q l R i δη αδή, ισ ύει είτε το 1., είτε το 2(a), είτε το 2(b). Στη συνέ εια, έστ ότι στο ήμα i + 1 ο α όρι μος rew εφαρμόζει ένα ήμα συμπερασμού σε κάποιο ερώτημα Q l παρά οντας το Q l+1. Στη συνέ εια εξετάζουμε κά ε περίπτ ση του ήματος επα ής ξε ριστά: 1. το Q l είναι ανεξάρτητο από το α και υπά ει το Q l. Από τις ιδιότητες της υπα ής αυτό συνεπά εται ότι είτε το Q l υπά ει το Q l+1 ή ότι μπορεί να εφαρμοστεί ένας συμπερασμός στο Q l και το αποτέ εσμα, που α κα ούμε Q 0, υπά ει το Q l+1. Εάν ισ ύει η πρώτη περίπτ ση τότε η ιδιότητα ικανοποιείται. Εάν ισ ύει η δεύτερη περίπτ ση τότε και πά ι ισ ύει η ιδιότητα κα ώς α έ ουμε ότι Q 0 R και επιπ έον, ό του Ορισμού το Q 0 α είναι επίσης Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 49

74 Μείωση Ερωτημάτων με Άτομα ανεξάρτητο από το α (παρά εται από ένα ερώτημα που είναι ανεξάρτητο από το α). 2. ατ bd(q l ), όπου τ := {x y x var(q), y var(q l ) και x R y} και είτε το Q r l υπά ει το Q l ή η needsrewriting(q l, α, T ) επιστρέφει αληθές και υπάρ ει ερώτημα Q l rew(q r l, T ) που υπά ει το Q l. Εξετάζουμε τις δύο αυτές περιπτώσεις ξε ριστά: (αʹ) το Q r l υπά ει το Q l. Αυτό συνεπά εται είτε ότι το Qr l υπά ει το Q l+1 ή π ς μπορεί να εφαρμοστεί ένας συμπερασμός στο Q r l και το αποτέ εσμα Q r 0 να υπά ει το Q l+1. Στην πρώτη περίπτ ση η ιδιότητα ισ ύει. Έστ τώρα ότι ισ ύει η δεύτερη περίπτ ση. Υπεν υμίζουμε ότι το Q l περιέ ει τα ίδια άτομα σώματος με το Q r l εκτός από το ατ. Εφόσον οι α όρι μοι επανε - ραφής εφαρμόζουν συμπερασμούς ρησιμοποιώντας μόνο άτομα από το σώμα ενός ερ τήματος, έ ουμε ότι ό οι οι συμπερασμοί που εφαρμόζονται στο Q r l μπορούν επίσης να εφαρμοστούν και στο Q l παρά οντας το Q l+1. Για τους συμπερασμούς αυτούς το bd(q l+1 ) \ {ατ } hd(q l+1 ) υπά ει το Q l+1, όπου τ = {x y x var(q), y var(q l+1 ) και x R y}. Παρό α αυτά, στο Q l ένας συμπερασμός μπορεί να εφαρμοστεί και στο ατ. Τέ ος, στην περίπτ ση που ένας συμπερασμός μπορεί να ερφαμοστεί σε ένα άτομο διαφορετικό από το ατ που δεν μπορεί να εφαρμοστεί στο Q l η συνάρτηση needsrewriting(q l, α, T ) επιστρέφει αληθές και τότε έ ουμε Q r 0 rew(q r l, T ). Συνεπώς, η Ιδιότητα (AR) ισ ύει. ( ʹ) Παρόμοια με την περίπτ ση 2. από την απόδειξη του Θε ρήματος Ό α αυτά δεί νουν την Ιδιότητα (AR). Έστ ότι όταν ένας α όρι μος επανε ραφής rew εφαρμόζεται στα Q, T, τερματίζει ύστερα από n ήματα παρά οντας την επανε ραφή R n. Η Ιδιότητα (AR) συνεπά εται ότι κατά τον τερματισμό του Α ορί μου 4 ια κά ε ερώτημα Q l R n α υπάρ ει ένα ερώτημα Q στο R το οποίο α υπά ει το Q l. Ένα σημείο του Α ορί μου 5 το οποίο είναι υπο ο ιστικά ακρι ό είναι ο έ ε ος εάν ένα ερώτημα είναι ανεξάρτητο από το άτομο α ( ραμμή 9), όπου ίνεται έ ε ος τ ν συν ηκών του Ορισμού Όπ ς φαίνεται και από τον ορισμό κάτι τέτοιο περι- αμ άνει τον έ ε ο διαφόρ ν σ έσε ν παρα ής ανάμεσα στα μέ η του συνό ου R Q. Για να μπορέσουμε να υ οποιήσουμε το ήμα αυτό αποδοτικά υπο έτουμε ότι ο α όρι μος επανε ραφής που ρησιμοποιείται ια να παρά ει την επανε ραφή R παρέ ει επίσης και την επιπ έον π ηροφορία που παρά εται κατά την κατασκευή της R. Πιο συ κεκριμένα, εκτός από την επανε ραφή R και τη σ έση R υπο έτουμε ότι ο α όρι μος επανε ραφής επιστρέφει επίσης μια σ έση H και μια αντιστοί ιση S τ.. εάν το Q είναι το συμπέρασμα ενός συμπερασμού με κύρια υπό εση το Q και υποσημεί ση Υ, τότε ισ ύει Q, Q H και S( Q, Q ) = Υ. Ο α όρι μος μας μπορεί να εκμετα ευτεί την επιπ έον αυτή π ηροφορία ια να ε έ ξει εάν ένα ερώτημα Q i μπορεί να παρα εί από το T {Q j }, ε έ οντας ια παράδει μα εάν το Q i είναι προσ άσιμο από το Q j στη σ έση H. Επιπ έον, μπορεί να ρησιμοποιήσει τη σ έση S ια να έ ει πρόσ αση σε διάφορες υποσημειώσεις ρίς να είναι απαραίτητο 50 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

75 Κεφάλαιο 3. Επανεγγραφή Τροποποιημένων Ερωτημάτων να εφαρμόσει συμπερασμούς. Όσον αφορά στη ρήση της υπο-ρουτίνας rew και εδώ ισ ύουν όσα έ ουν συζητη εί στην ενότητα Επέκταση Ερ τημάτ ν με Άτομα Τέ ος, στην ενότητα αυτή με ετάμε το πρό ημα υπο ο ισμού μιας επανε ραφής ια ένα ερώτημα το οποίο έ ει επεκτα εί με νέα άτομα, ρησιμοποιώντας και πά ι όσο το δυνατόν περισσότερη π ηροφορία από την επενα ραφή που έ ει υπο- ο ιστεί προη ούμενα ια το αρ ικό ερώτημα. Το παρακάτ παράδει μα περι ράφει τις ασικές ιδέες στις οποίες στηρίζεται ο α όρι μος που α παρουσιάσουμε στη συνέ εια. Παράδει μα Έστ το TBox T που δίνεται στη συνέ εια: Καθηγητής(x) y.διδάσκει(x, y), y.διδάσκει(y, x) Φοιτητής(x) και το ΣΕ Q 1 = διδάσκει(x 1, y 1 ) Q A (x 1 ) που ανακτά ό α τα άτομα που διδάσκουν κάποιον. Το σύνο ο R = {Q 1, Q 2 }, με Q 2 = Καθηγητής(x 2 ) Q A (x 2 ) αποτε εί μια επανε ραφή ια τα Q 1, T και μπορεί να υπο ο ιστεί με ένα οποιοδήποτε α όρι μο επανε ραφής. Επιπρόσ ετα η σ έση R = { x 1, x 2 } δεί νει π ς σ ετίζεται η μετα ητή x 1 με την x 2. Πιο συ κεκριμένα, τα αξιώματα του T μετασ ηματίζονται στις παρακάτ προτάσεις Καθηγητής(x) διδάσκει(x, f(x)), (3.9) διδάσκει(y, x) Φοιτητής(x) (3.10) και το ΣΕ Q 2 παρά εται εφαρμόζοντας ένα συμπερασμό με υπο έσεις το ερώτημα Q 1 και την πρόταση (3.9). Έστ τώρα ότι στη συνέ εια ο ρήστης έ ει να ανακτήσει ό α τα άτομα που διδάσκουν φοιτητές, δη αδή, το ερώτημα Q 1 επεκτείνεται με το άτομο α = Φοιτητής(y 1) και το νέο ΣΕ είναι το ακό ου ο: Q 1 = διδάσκει(x 1, y 1) Φοιτητής(y 1) Q A (x 1). Και πά ι, ρησιμοποιώντας έναν οποιοδήποτε α όρι μο επανε ραφής μπορούμε να υπο ο ίσουμε την επανε ραφή R = {Q 1, Q 2, Q 1, Q 2 } με Q 1 και Q 2 ίδια με αυτά που έ ουν υπο ο ιστεί προη ουμέν ς και Q 2 = διδάσκει(x 2, y 2) διδάσκει(z 2, y 2) Q A (x 2), με R = { x 1, x 2, x 1, x 1, x 1, x 2, y 1, y 2 }. Και σε αυτή την περίπτ ση όμ ς, μπορούμε, αντί να εκτε έσουμε έναν α όρι μο επανε ραφής εξαρ ής, να εκμετα ευτούμε την π ηροφορία που έ ει παρα εί προη- ουμέν ς, δη αδή την επανε ραφή R ια τα Q 1 και T. Πρά ματι, το ερώτημα Q 1 μπορεί να παρα εί απ ευ είας από το R εάν στο σώμα του ερ τήματος Q 1 προστε εί Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 51

76 Επέκταση Ερωτημάτων με Άτομα το άτομο Φοιτητής(y 1). Παρατηρούμε όμ ς, ότι το ερώτημα Q 2 δεν μπορεί να επεκτα- εί με το άτομο α μιας και το Καθηγητής(x 2) Φοιτητής(y 2) Q A (x 2) που παρά εται δεν είναι συνδεδεμένο. Επιπ έον, παρατηρούμε ότι ρησιμοποιώντας αυτή τη μέ οδο δεν μπορούν να παρα ούν τα ερ τήματα Q 1, Q 1 και Q 2. Για το ό ο αυτό είναι απαραίτητο να ρησιμοποιη ούν οι κανόνες συμπερασμού ενός συστήματος έτσι ώστε να τα υπο ο ίσουν. Πιο συ κεκριμένα το Q 1 μπορεί να παρα εί από ένα κανόνα παρα οντοποίησης με το Q 1 ς κύρια υπό εση, το Q 1 μπορεί να παρα εί από ένα συμπερασμό με υπο έσεις το ερώτημα Q 1 και την πρόταση (3.10), ενώ το Q 2 μπορεί να παρα εί από ένα συμπερασμό με υπο έσεις το ερώτημα Q 1 και την πρόταση (3.9). Ό α τα παραπάν υποδη ώνουν ότι δεδομένου ενός ατόμου α και μιας επανε ραφής R ια τα Q 1, T, μια επανε ραφή ια τα bd(q 1 ) {α} hd(q 1 ), T μπορεί να υπο ο ιστεί εάν επεκτείνουμε κατά η α κά ε ερώτημα Q i R ια το οποίο ισ ύει var(ατ) var(q i ) με το άτομο ατ, όπου η αντικατάσταση τ κατασκευάζεται από τη σ έση R, και στη συνέ εια, εφαρμόζοντας (πι ανώς) επιπ έον συμπερασμούς στα ερ τήματα που έ ουν προκύψει ώστε να υπο ο ιστούν αυτά που υπο είπονται. Για να μπορέσουμε να ανα ν ρίσουμε περιπτώσεις που είναι απαραίτητη η εφαρμο ή επιπ έον κανόν ν συμπερασμού ρησιμοποιούμε και πά ι τη συνάρτηση needsrewriting που δίνεται στον Ορισμό στην οποία όμ ς τώρα το πρώτο όρισμα αντικα ίσταται από το επεκτεταμένο ερώτημα. Τέ ος, όπ ς στην περίπτ ση της επέκτασης ερ τημάτ ν με νέες μετα ητές και της μεί σης ερ τημάτ ν με άτομα, το επόμενο παράδει μα δεί νει ότι η επανε ραφή που ρησιμοποιείται στην είσοδο του α ορί μου πρέπει να είναι κ ειστή ς προς το συμπερασμό, διαφορετικά είναι απαραίτητη η εφαρμο ή συμπερασμών ια ό α τα επεκτεταμένα ερ τήματα. Παράδει μα Έστ το παρακάτ TBox και ΣΕ: T = {A(x) y.r(x, y)} Q 1 = R(x 1, y 1 ) Q A (x 1 ) Τότε από την πρόταση A(x) R(x, f(x)) που προκύπτει από το αξί μα του T, και το Q προκύπτει η επανε ραφή R = {Q 1, Q 2 }, με το Q 2 = A(x 2 ) Q A (x 2 ) να παρά εται από ένα συμπερασμό στο Q 1 και R = { x 1, x 2 }. Παρό α αυτά, παρατηρούμε ότι το ερώτημα Q 2 υπά ει το Q 1, συνεπώς το Q 1 μπορεί να αφαιρε εί και το σύνο ο R = {Q 2 } είναι επίσης μια επανε ραφή ια τα Q 1, T η οποία όμ ς δεν είναι κ ειστή ς προς το συμπερασμό. Έστ τώρα ότι έ ουμε να επεκτείνουμε το ερώτημα Q 1 με το άτομο B(y 1 ), έ ουμε δη αδή να υπο ο ίσουμε μια επανε ραφή ια το ερώτημα Q 1 = B(y 1 ) R(x 1, y 1 ) Q A (x 1 ). Μια τέτοια επανε ραφή είναι η R = {Q 1, Q 2 } που μπορεί να υπο ο ιστεί από ό α τα σύ ρονα συστήματα επανε ραφής. Παρατηρούμε όμ ς, ότι ρησιμοποιώντας τη μέ οδο που περι ράψαμε παραπάν δεν μπορούμε να πάρουμε την R από την R. Κάτι τέτοιο είναι δυνατό μόνο με ρήση της R που είναι κ ειστή ς προς το συμπερασμό. Ο Α όρι μος 6 παρουσιάζει την προσέ ιση μας ια τον υπο ο ισμό μιας επανε ραφής ια ένα ερώτημα που επεκτείνεται με ένα νέο άτομο εκμετα ευόμενος 52 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

77 Κεφάλαιο 3. Επανεγγραφή Τροποποιημένων Ερωτημάτων Α όρι μος 6 ExtendRewritingForNewAtoms(Q, T, R, R, α) Είσοδος: Ένα ΣΕ Q, μια επανε ραφή R με διαμέριση R D R Q, και μια σ έση R που αποτε ούν την έξοδο ενός α ορί μου επανε ραφής ια το Q με άση ένα TBox T και ένα άτομο α τ.. var(α) var(q). 1: Αρ ικοποίησε μια επανε ραφή R := R D και μια σ έση R := R 2: for all Q i R Q do 3: τ := {x y x var(q), y var(q i ) και x R y} 4: if var(ατ) var(q i ) then 5: Q i := Q i {ατ} hd(q i ) 6: Προσέ εσε το Q i στην R 7: if needsrewriting(q i, ατ, T ) then 8: R n, Rn := rew(q i, T ) 9: R := R R n και R := R Rn 10: end if 11: end if 12: end for 13: return R, R την π ηροφορία που έ ει παρα εί προη ούμενα. Ο α όρι μος δέ εται ς είσοδο ένα ΣΕ Q, ένα TBox T, μια επανε ραφή R = R D R Q που είναι κ ειστή ς προς το συμπερασμό και μια σ έση R που αποτε ούν την έξοδο ενός α ορί μου επανε ραφής ια τα Q, T, και ένα άτομο α τέτοιο ώστε var(α) var(q). Επιπ έον, ο α όρι μος μας ρησιμοποιεί εσ τερικά έναν α όρι μο επανε ραφής rew έτσι ώστε να μπορεί να εφαρμόζει τον κανόνα συμπερασμού όπου αυτό κρίνεται απαραίτητο. Αρ ικά, ο α όρι μος μας αρ ικοποιεί μια νέα επανε ραφή R με το σύνο ο R D και τη σ έση R με την R. Στη συνέ εια, ο α όρι μος εισέρ εται στον κεντρικό ρό ο. Προσπε αύνει κά ε ερώτημα Q i R Q και παρά ει κατά η ες αντιστοι ήσεις τ τ ν μετα ητών του Q i μ..τ. τις μετα ητές του Q ( ραμμή 3) με ρήση τ ν οποί ν ε έ ει εάν το α έ ει κοινές μετα ητές με το Q i. Εάν κάτι τέτοιο ισ ύει προσ έτει το επεκτεταμένο ερώτημα bd(q i ) {ατ} hd(q i ) στο τε ικό αποτέ εσμα. Τέ ος ρησιμοποιεί τη συνάρτηση needsrewriting ια να ε έ ξει εάν το Q i ρειάζεται να επανε ραφεί περισσότερο και εάν κάτι τέτοιο είναι απαραίτητο προσ έτει την παρα όμενη επανε ραφή στο αποτέ εσμα ( ραμμές 7 10). Θεώρημα Έστω Q ΣΕ, έστω T TBox, έστω α άτομο τ.ω. var(α) var(q) και έστω R, R έξοδος ενός αλγόριθμου επανεγγραφής όταν εφαρμόζεται για τα Q, T έτσι ώστε η R να είναι κλειστή ως προ το συμπερασμό. Όταν εφαρμόζεται ο Αλγόριθμος 6 στα Q, T, R, R, και α τερματίζει. Έστω R η έξοδος του αλγορίθμου. Τότε το σύνολο R είναι μια επανεγγραφή κλειστή ως προς το συμπερασμό για το ερώτημα bd(q) {α} hd(q) μ.β.τ. T. Απόδειξη: Ο τερματισμός του α ορί μου προκύπτει από το ε ονός ότι ο Α όρι μος 6 προσπε αύνει μόνο μια φορά κά ε ερώτημα που είναι μέ ος ενός πεπερασμένου συνό ου (R Q ) κα ώς και επειδή ο α όρι μος επανε ραφής rew τερ- Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 53

78 Επέκταση Ερωτημάτων με Άτομα ματίζει. Έστ, T, R, R, Q, και α είσοδος ια τον Α όρι μο 6, όπου R, R είναι επανε ραφη που υπο ο ίζεται από κάποιο α όρι μο rew και έστ var(α) var(q). Έστ ότι η έξοδος του Α όρι μου 6 είναι ένα ζευ άρι R, R και έστ επίσης ότι R i, Ri είναι η επανε ραφή που υπο ο ίζεται ύστερα από i ήματα του α ορί μου επανε ραφής rew όταν αυτός εφαρμόζεται ια τα Q = bd(q) {α} hd(q) και T. Η απόδειξη του παραπάν ε ρήματος προκύπτει από την παρακάτ ιδιότητα, την οποία α δείξουμε ρησιμοποιώντας επα ή πάν στον αρι μό ημάτ ν i. (AE): Για κά ε i 0 και Q l R i υπάρ ει Q l R τέτοιο ώστε εάν ια την αντικατάσταση τ που ορίζεται από τη ραμμή 3 του Α ορί μου 6 ισ ύει var(ατ) var(q l ) και Q e l = Q l {ατ} hd(q l ) είναι η επέκταση του Q l με το α, ισ ύει μια από τις παρακάτ συν ήκες: 1. το Q e l υπά ει το Q l, ή 2. η needsrewriting(q e l, α, T ) επιστρέφει αληθές και κάποιο Q l rew(q e l, T ) υπά ει το Q l. Βασική Περίπτωση (i = 0): Αρ ικά R 0 = {Q } όπου Q = bd(q) {α} hd(q), συνεπώς, η Ιδιότητα (AE) ικανοποιείται. Βήμα Επαγωγής: Έστ ότι η Ιδιότητα (AE) ισ ύει ύστερα από i ήματα ια κά ε Q l R i δη αδή, ισ ύει είτε το 1. είτε το 2. Στη συνέ εια, έστ ότι στο ήμα i + 1 ο α όρι μος rew εφαρμόζει ένα ήμα συμπερασμού σε κάποιο ερώτημα Q l παρά οντας το Q l+1. Στη συνέ εια εξετάζουμε κά ε περίπτ ση του ήματος επα ής ξε ριστά: 1. Το Q e l υπά ει το Q l. Από τις ιδιότητες της υπα ής α ισ ύει ότι είτε το Qe l υπά ει το Q l+1, ή ότι ένας συμπερασμός είναι εφαρμόσιμος στο Qe l και το αποτέ εσμα, έστ Q e 0 υπά ει το Q l+1. Εάν ισ ύει η πρώτη περίπτ ση τότε όντ ς υπάρ ει ερώτημα Q l R τέτοιο ώστε το Q e l να υπά ει το Q l+1. Υπο έτουμε τώρα ότι ισ ύει η δεύτερη περίπτ ση, ότι δη αδή, το Q e 0 υπά ει το Q l+1. Έστ ότι το ερώτημα Q e 0 παρά εται από κάποιο κανόνα συμπερασμού στο Q e l που δεν αφορά το άτομο α. Τότε ο κανόνας αυτός μπορεί να είναι εφαρμόσιμος και στο Q l και α έ ει ς αποτέ εσμα την παρα ή του Q 0. Στην περίπτ ση αυτή α ισ ύει ότι το Q e 0 = Q 0 {ατ} hd(q l ), ια κατά η η αντιστοί ιση τ. Στην περίπτ ση τώρα που ο κανόνας συμπερασμού εφαρμόζεται στο άτομο α, αυτό συνεπά εται ότι αυτός ο κανόνας συμπερασμού δεν α μπορεί να εφαρμοστεί στο Q l ια την παρα ή του Q 0 α ά α ενερ οποιήσει τη συνάρτηση needsrewriting(q e l, α, T ) και συνεπώς α έ ουμε Qe 0 rew(q e l, T ). Συνεπώς, σε κά ε περίπτ ση η Ιδιότητα (AE) ισ ύει. 2. Η needsrewriting(q e l, α, T ) επιστρέφει αληθές και υπάρ ει ερώτημα Q l τ.. το Q l rew(q e l, T ) να υπά ει το Q l. Και πά ι, είτε το Q l υπά ει το Q l+1 ή μπορεί να εφαρμοστεί ένας συμπερασμός στο Q l και το αποτέ εσμα, έστ Q 0 υπά ει το Q l. Σε κά ε περίπτ ση το 2. α ισ ύει κα ώς α έ ουμε είτε Q l rew(q e l, T ) ή Q 0 rew(q e l, T ). 54 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

79 Κεφάλαιο 3. Επανεγγραφή Τροποποιημένων Ερωτημάτων Έστ ότι όταν ένας α όρι μος επανε ραφής rew εφαρμόζεται στα Q, T, τερματίζει ύστερα από n ήματα παρά οντας την επανε ραφή R n. Η Ιδιότητα (AE) συνεπά εται ότι κατά τον τερματισμό του Α ορί μου 6 ια κά ε ερώτημα Q l R n α υπάρ ει ένα ερώτημα Q στο R το οποίο α υπά ει το Q l. Αξίζει να σημει εί ότι όσον αφορά στη ρήση της υπο-ρουτίνας rew και εδώ ισ ύουν όσα έ ουν συζητη εί στην ενότητα Βε τιστοποιήσεις Εκτός από τον υπο ο ισμό μιας επανε ραφής, ιδιαίτερα σημαντική όσον αφορά το πρό ημα της απάντησης ερ τημάτ ν είναι η αποτίμηση τ ν ερ τημάτ ν σε μια (επα ική) άση δεδομέν ν. Όπ ς δη ώνεται και από τα Θε ρήματα 3.2.5, και 3.4.3, οι Α όρι μοι 4, 5 και 6 επιστρέφουν μια επανε ραφή R που είναι κ ειστή ς προς το συμπερασμό, κάτι το οποίο συνεπά εται ότι η R ενδε ομέν ς περιέ ει περιττά ερ τήματα. Όπ ς έ ει εξη η εί προη ούμενα τα επιπ έον αυτά ερ τήματα είναι σημαντικά εάν σκοπεύουμε να κα έσουμε πά ι τους α ορί μους αυτούς ια να προσ έσουμε περισσότερες διακεκριμένες μετα ητές ή να προσ έσουμε/αφαιρέσουμε και ά α άτομα από το ερώτημα. Παρό α αυτά, όταν έ ουμε να αποτιμήσουμε την R σε μια άση δεδομέν ν, είναι προτιμότερο να υπο ο ίσουμε μια ε ά ιστη επανε ραφή R που να είναι ισοδύναμη με την R. Αυτό μπορεί να πρα ματοποιη εί εφαρμόζοντας τον πο ύ ν στό α όρι μο απα οιφής περιττών ερ τημάτ ν removeredundant(r ), ο οποίος φαίνεται στον Α όρι μο 1 (ενότητα 2.3) και ε έ ει εάν ένα ερώτημα Q i R υπά ειται από κάποιο ά ο ερώτημα Q j R (και αντίστροφα) και στη συνέ εια αφαιρεί το κατά η ο ερώτημα από την τε ική επανε ραφή [116]. Στη διατρι ή αυτή δεν ασ ο ούμαστε με ά ες τε νικές που στηρίζονται στην δομή και το σ εδιασμό της άσης δεδομέν ν [127, 130]. Οι τε- νικές αυτές είναι ανεξάρτητες από τον α όρι μο επανε ραφής και μπορούν να ρησιμοποιη ούν και ια τους α ορί μους μας. Συνεπώς, πριν αποτιμήσουμε την επανε ραφή που επιστρέφεται από τους Α ορί μους 4, 5 και 6 μπορούμε να ρησιμοποιήσουμε τον Α όρι μο 1 ια να απα είψουμε περιττά ερ τήματα. Όπ ς έ ει δει εί όμ ς [116, 40] η μέ οδος αυτή συνή ς δεν αποδίδει κα ά στην πράξη κα ώς αποτε είται από δύο εμφ ευμένους ρό ους επανά ηψης πάν σε μια πι ανότατα με ά η επανε ραφή R. Για να ε τιστοποιήσουμε την απόδοση του Α ορί μου 1 οι α όρι μοι μας ρησιμοποιούν μια σειρά από προσε ίσεις με τις οποίες προσπα ούν να μειώσουν το μέ ε ος τ ν συνό ν τα οποία α παρά ουν κατά την εφαρμο ή τους. Πρώτα, προσπα ούν να ανα ν ρίσουν κατά τη διάρκεια του τρεξίματος τους, ερ τήματα που εάν παρα ούν και προστε ούν στο σύνο ο R πρόκειται να είναι περιττά. Όσο περισσότερα περιττά ερ τήματα ανα ν ριστούν τόσο μικρότερο α είναι το μέ- ε ος του συνό ου R ια το οποίο α πρέπει να εφαρμοστεί ο Α όρι μος 1. Παρό α αυτά, το R μπορεί και πά ι να είναι πο ύ με ά ο. Συνεπώς, κατά δεύτερον, προσπα oύν να ανα ν ρίσουν ερ τήματα που πρόκειται να είναι μη-περιττά στο σύνο ο R που υπο ο ίζεται. Τέτοια ερ τήματα μπορούν στη συνέ εια να αποκ ειστούν Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 55

80 Βελτιστοποιήσεις από τον τε ικό έ ε ο μειώνοντας το μέ ε ος του πρώτου ρό ου της με όδου removeredundant. Πιο συ κεκριμένα, εάν NR είναι το σύνο ο τ ν μη-περιττών ερ τημάτ ν τότε ρειάζεται να ε ε ούν μόνο τα ΣΕ από το σύνο ο R \ NR σε σ έση με τα ΣΕ από το R. Τέ ος, προσπα ούν να ανα ν ρίσουν ερ τήματα που είναι μη-υπά οντα. Αυτά μπορούν να ρησιμοποιη ούν στη συνέ εια ια να μειώσουν το μέ ε ος του δεύτερου ρό ου. Πιο συ κρεκριμένα, εάν το NS περιέ ει ό α αυτά τα ερ τήματα τότε κά ε ΣΕ στο σύνο ο R \ NS πρέπει να ε ε εί μόνο με τα ΣΕ R \ NR. Στη συνέ εια παρουσιάζουμε τις προσε ίσεις αυτές ια κά ε έναν από τους Α ορί μους 4 και Βε τιστοποιώντας τον Α όρι μο Επέκτασης Ερ τημάτ ν με Διακεκριμένες Μετα ητές Στην ενότητα αυτή παρουσιάζουμε μια σειρά από προτάσεις με ρήση τ ν οποί ν μπορούμε να ε τιστοποιήσουμε την εκτέ εση του α ορί μου απα οιφής περιττών ερ τημάτ ν (Α όρι μος 1) ια τον Α όρι μο 4. Απα οίφοντας Περιττά Ερ τήματα Η παρακάτ πρόταση παρουσιάζει μια ιδιότητα με ρήση της οποίας μπορούμε να ανα ν ρίσουμε εάν ένα ερώτημα που κατασκευάζεται κατά την εκτέ εση του Α ορί μου 4 α είναι περιττό στην τε ική επανε ραφή R. Πρόταση Έστω T TBox, έστω Q ΣΕ, έστω R = R D R Q επανεγγραφή για τα Q και T, και έστω R έξοδος του Αλγόριθμου 4 όταν αυτός εκτελείται για την R και κάποια αυθαίρετη πλειάδα μεταβλητών y τ.ω. y var(q). Έστω ΣΕ Q 1 R που υπάγεται από κάποιο ΣΕ Q 2 R. Τότε, εάν οι επεκτάσεις τους με την y, Q 1 και Q 2 αντίστοιχα, είναι ασφαλείς, το ΣΕ Q 1 είναι περιττό στην R. Η ισ ύς της Πρότασης είναι ξεκά αρη. Η Πρόταση αυτή μπορεί να ρησιμοποιη εί ια την αποφυ ή της προσ ήκης περιττών ερ τημάτ ν στο αποτέ εσμα R του Α ορί μου 4. Παρό α αυτά, ια να μπορέσουμε να ε έ ξουμε την ισ ύ της ιδιότητας αυτής είναι απαραίτητο να ν ρίζουμε τις σ έσεις υπα ής που ισ ύουν ανάμεσα στα ΣΕ της επανε ραφής εισόδου R, κάτι το οποίο μπορεί επίσης (όπ ς και η επανε ραφή R) να έ ει υπο ο ιστεί προη ούμενα με ρήση του Α ορί μου 1. Στη συνέ εια, ο Α όρι μος 4 ρησιμοποιεί την Πρόταση έτσι ώστε να μην προσ έσει την ασφα ή επέκταση Q i ενός ερ τήματος Q i R στο σύνο ο R ( ραμμή 5) εάν έ ει ήδη προστε εί στο R η ασφα ής επέκταση κάποιου ΣΕ Q j το οποίο υπά ει το Q i. Παράδει μα Έστ ότι ια κάποιο ΣΕ και TBox υπάρ ει επανε ραφή R που περιέ ει τα ερ τήματα Q 1 = R(x 1, y 1 ) S(y 1, z 1 ) Q A (x 1 ) και Q 2 = R(x 2, y 2 ) Q A (x 2 ), με R = { x 1, x 2, y 1, y 2, z 1, y 2 }. Είναι προφανές ότι το Q 2 υπά ει το Q 1. Έστ τώρα ότι κα είται ο Α όρι μος 4 ια την μετα ητή y 1. Είναι εύκο ο να παρατηρήσει κανείς π ς η επέκταση Q 2 του Q 2 με την μετα ητή y 1 υπά ει 56 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

81 Κεφάλαιο 3. Επανεγγραφή Τροποποιημένων Ερωτημάτων την επέκταση Q 1 του Q 1 με την ίδια μετα ητή. Έτσι οιπόν όταν ο Α όρι μος 4 προσπε άσει το Q 1 ια να το επεκτείνει, στην περίπτ ση που η επέκταση Q 2 του Q 2 έ ει ήδη προστε εί στην τε ική επανε ραφή με ρήση της Πρότασης α απορρίψει το Q 1 και δε α το επεξερ αστεί περαιτέρ. Εντοπισμός μη-περιττών Ερ τημάτ ν Η παρακάτ πρόταση παρουσιάζει μια ιδιότητα με ρήση της οποίας μπορούμε να ανα ν ρίσουμε εάν ένα ερώτημα που κατασκευάζεται κατά την εκτέ εση του Α ορί μου 4 α είναι μη-περιττό στην τε ική επανε ραφή R. Πρόταση Έστω T TBox, Q ΣΕ, έστω R = R D R Q επανεγγραφή για τα Q και T, και έστω R έξοδος του Αλγόριθμου 4 όταν αυτός εκτελείται για την R και κάποια αυθαίρετη πλειάδα μεταβλητών y τ.ω. y var(q). Έστω ΣΕ Q 1 R που είναι μη-περιττό στην R και έστω Q 1 η επέκταση του με την y. Εάν το Q 1 είναι ασφαλές τότε θα είναι και μη-περιττό στην R. Η ισ ύς και αυτής της πρότασης είναι ξεκά αρη. Για να μπορεί να ρησιμοποιη εί η Πρόταση ο Α όρι μος 4 τροποποιείται ς εξής: Στην αρ ή αρ ικοποιεί ένα άδειο σύνο ο NR που περιέ ει μη-περιττά ερ τήματα. Στη ραμμή 5, εάν το Q i είναι μη-περιττό στην R προσ έτει το Q i στο NR. Τέ ος επιστρέφει την R και το σύνο ο NR. Στη συνέ εια, το σύνο ο NR που έ ει επιστραφεί ρησιμοποιείται από τον Α όρι μο 1 ς εξής: Ό α τα ερ τήματα που ανήκουν στο σύνο ο NR αποκ είονται από τον έ ε ο απα οιφής όπ ς φαίνεται και στον Α όρι μο 7. Παράδει μα Έστ το ΣΕ, TBox και η επανε ραφή R από το Παράδει μα Εάν η R δεν περιέ ει ά α ερ τήματα τότε εφόσον η επέκταση Q 1 του Q 1 είναι ασφα ής οι συν ήκες της Πρότασης ικανοποιούνται και συνεπώς το Q 1 είναι μη-περιττό στην τε ική επανε ραφή R που προκύπτει από την εφαρμο ή του Α ορί μου 4 ια την μετα ητή y 1. Εντοπισμός μη-υπα όντ ν Ερ τημάτ ν Τέ ος, η παρακάτ πρόταση παρουσιάζει μια ιδιότητα την οποία μπορούμε να ρησιμοποιήσουμε ια να ανα ν ρίσουμε εάν ένα ερώτημα που κατασκευάζεται κατά την εκτέ εση του Α ορί μου 4 α είναι μη-υπά ον στην τε ική επανε ραφή R. Πρόταση Έστω T TBox, Q ΣΕ, έστω R = R D R Q επανεγγραφή για τα Q και T, και έστω R έξοδος του Αλγόριθμου 4 όταν αυτός εκτελείται για την R και κάποια αυθαίρετη πλειάδα μεταβλητών y τ.ω. y var(q). Έστω ΣΕ Q 1 R που είναι μη-υπάγον στην R και έστω Q 1 η επέκταση του με την y. Εάν το Q 1 είναι ασφαλές τότε θα είναι και μη-υπάγον στην R. Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 57

82 Βελτιστοποιήσεις Α όρι μος 7 removeredundantopt(r, NS, NR) Είσοδος: Μια επανε ραφή R = R D R Q. 1: Αρ ικοποίησε μια επανε ραφή R = R 2: Αρ ικοποίησε μια επανε ραφή ΣΣΕ R NS = R \ NS 3: Αρ ικοποίησε μια επανε ραφή ΣΣΕ R NR = R \ NR 4: for all Q R NS do 5: for all Q R NR με Q = Q do 6: if το Q υπά ει το Q και Q R then 7: Αφαίρεσε το Q από το R 8: end if 9: end for 10: end for 11: return R Η ισ ύς και αυτής της πρότασης είναι ξεκά αρη. Όμοια με πριν, ο Α όρι μος 4 ρησιμοποιεί επιπ έον σύνο α (το NS) ια να απο ηκεύσει τέτοια ερ τήματα τα οποία στη συνέ εια εξαιρούνται από τον ρό ο της συνάρτησης remοveredundant όπ ς φαίνεται και στον Α όρι μο 7. Παράδει μα Έστ το ΣΕ, TBox από το Παράδει μα και έστ ότι η επανε ραφή R περιέ ει επίσης το ερώτημα Q 3 = K(x 3, y 3 ) Q A (x 3 ). Τότε, εφόσον το Q 3 δεν υπά ει κανένα ερώτημα στην R και επειδή η επέκταση του Q 3 = K(x 3, y 3 ) Q A (x 3, y 3 ) είναι ασφα ής το ερώτημα Q 3 α είναι μη-υπά ον στην τε ική επανε ραφή R Βε τιστοποιώντας τον Α όρι μο Μεί σης Ερ τημάτ ν με Άτομα Στην ενότητα αυτή παρουσιάζουμε μια σειρά από προτάσεις που έ ουν ς στό ο τη ε τιστοποίηση της εκτέ εσης του Α ορί μου 1 όταν αυτός εκτε είται ια τον Α όρι μο 5. Απα οιφή Περιττών Ερ τημάτ ν Η παρακάτ πρόταση παρουσιάζει δύο ιδιότητες με ρήση τ ν οποί ν μπορούμε να ανα ν ρίσουμε εάν ένα ερώτημα που κατασκευάζεται κατά την εκτέ εση του Α - όρι μου 5 α είναι περιττό στην τε ική επανε ραφή R. Πρόταση Έστω Q ΣΕ, έστω T TBox, έστω R, R έξοδος ενός αλγορίθμου επανεγγραφής όταν εκτελείται για τα Q, T, και έστω α άτομο του Q. Έστω επίσης R, R έξοδος του Αλγορίθμου 5 όταν εκτελείται για τα T, R, R, και α, έστω Q i R ΣΕ, και έστω τ = {x y x var(q), y var(q i ) και x R y}, και έστω ότι ο Αλγόριθμος 5 δεν εκτελεί ποτέ την γραμμή 15. Εάν υπάρχει Q j R τ.ω. να υπάγει το Q i, τότε ισχύουν οι παρακάτω ιδιότητες, όπου τ = {x y x var(q), y var(q j ) και x R y}: 58 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

83 Κεφάλαιο 3. Επανεγγραφή Τροποποιημένων Ερωτημάτων (ARR1) Εάν Q j R ή bd(q j ) \ {ατ } hd(q) R, τότε το Q i είναι περιττό στην R, (ARR2) Εάν Q j R ( bd(q j ) \ {ατ } hd(q) R ) και για κάθε α bd(q j ) (α bd(q j ) \ {ατ }) το άτομο α έχει διαφορετικό κατηγόρημα από το α τότε το ερώτημα bd(q i ) \ {ατ} hd(q) είναι περιττό. Απόδειξη: (Ιδιότητα (ARR1)) Εφόσον το Q i υπά ειται από το Q j υπάρ ει αντικατάσταση θ τέτοια ώστε ια κά ε At Q j θ να έ ουμε At Q i. Τώρα, η Ιδιότητα (ARR1) προκύπτει ευ έ ς εφόσον ια την ίδια αντικατάσταση θ ια την οποία ια κά ε At Q j θ (ή At [ bd(q j ) \ {ατ } hd(q)]θ) α έ ουμε At Q i. (Ιδιότητα (ARR2)) Έστ ότι Q j R (η περίπτ ση με το bd(q j ) \ {ατ } R είναι παρόμοια). Από την υπό εση έ ουμε ότι ια κά ε At Q j θ έ ουμε επίσης At Q i. Έστ ένα αυ αίρετο άτομο At. Μπορούμε να έ ουμε At bd(q i ) \ {ατ} εάν At = ατ, δη αδή, το άτομο που αφαιρείται είναι κάποιο άτομο από το Q j θ. Από την υπό εση όμ ς το At έ ει διαφορετικό κατη όρημα από το α, συνεπώς α έ ουμε ότι At ατ ια κά ε τ. Παρόμοια με πριν, η Πρόταση μπορεί να ρησιμοποιη εί ια την αποφυ ή προσ ήκης περιττών ερ τημάτ ν στο αποτέ εσμα R του Α ορί μου 5. Για να ίνει κάτι τέτοιο ο Α όρι μος 5 τροποποιείται ς εξής: Στη ραμμή 10 δεν προσ έτει κανένα ερώτημα Q i στο R εάν το Q i υπά εται από κάποιο ερώτημα Q j R και είτε Q j R ή bd(q j ) \ {ατ } hd(q) R. Έστ Q i ΣΕ που επι έ εται στη ραμμή 7. Εάν το Q i υπά εται από κάποιο Q j R και είτε αυτό είτε η μεί ση του έ ει προστε εί στην τε ική επανε - ραφή R και ια κά ε α bd(q j ) ή α bd(q j ) \ {ατ } το άτομο α έ ει διαφορετικό κατη όρημα από το α τότε προσπερνάει τις ραμμές και συνε ίζει ια το επόμενο ερώτημα. Παράδει μα Έστ ΣΕ και TBox από τα οποία παρά εται επανε ραφή R που περιέ ει τα ΣΕ Q 1 = A(x 1 ) Q A (x 1 ) και Q 2 = A(x 2 ) R(x 2, y 2 ) S(x 2, y 2 ) Q A (x 2 ). Είναι προφανές ότι το Q 1 υπά ει το Q 2 στην R. Έστ τώρα ότι κα είται ο Α όρι μος 5 ια το άτομο α = R(x, y) και έστ ότι το Q 1 είναι ανεξάρτητο από το α, συνεπώς Q 1 R. Παρατηρούμε ότι τόσο η Ιδιότητα (ARR1) όσο και η Ιδιότητα (ARR2) ικανοποιούνται συνεπώς εάν το Q 2 ή το Q 2 = A(x 2 ) S(x 2, y 2 ) Q A (x 2 ) προστε εί στο τε ικό αποτέ εσμα R, τότε αυτό α είναι περιττό. Εντοπισμός μη-περιττών Ερ τημάτ ν Η παρακάτ πρόταση παρουσιάζει με όδους ια την ανα νώριση μη-περιττών ερ τημάτ ν κατά τη διάρκεια εκτέ εσης του Α όρι μου 5 υπο έτοντας ότι ν ρίζουμε τις σ έσεις υπα ής από την επανε ραφή της εισόδου. Πρόταση Έστω Q ΣΕ, έστω T TBox, έστω R, R έξοδος ενός αλγορίθμου επανεγγραφής όταν εκτελείται για τα Q και T, και έστω α άτομο του Q. Έστω επίσης Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 59

84 Βελτιστοποιήσεις R, R έξοδος του Αλγορίθμου 5 όταν εκτελείται για τα T, R, R, και α, έστω Q i R ΣΕ, και έστω τ = {x y x var(q), y var(q i ) και x R y}, και έστω ότι ο Αλγόριθμος 5 δεν εκτελεί ποτέ την γραμμή 15. Εάν το Q i είναι μη-περιττό στην R και για κάθε Q j R η αντιστοίχιση τ i που ορίζεται ως {x y x var(q), y var(q j ) και x R y} είναι ένα-προς-ένα, τότε ισχύουν οι παρακάτω ιδιότητες: (ARN1) Εάν ατ bd(q i ), τότε το Q i είναι μη περιττό στην R, (ARN2) το bd(q i ) \ {ατ} hd(q i ) είναι μη-περιττό στην R. Απόδειξη: (Ιδιότητα (ARN1)) Έστ Q j αυ αίρετο ΣΕ στην R διάφορο του Q i. Κατά τον τερματισμό του Α ορί μου 5 είτε το Q j ή το bd(q j ) \ {ατ j } hd(q), ια μια αντικατάσταση τ j που αντιστοι εί τις μετα ητές του Q σε αυτές του Q j, προστί εται στην R. Εφόσον το Q i είναι μη-περιττό στην R, το Q j δεν μπορεί να υπά ει το Q i. Άρα, πρέπει να δειξουμε ότι και το bd(q j ) \ {ατ j } hd(q) δεν υπά ει επίσης το Q i. Εφόσον το Q i είναι μη-περιττό αυτό σημαίνει ότι ια κά ε Q j στην R και κά ε αντικατάσταση θ υπάρ ει At Q j τ.. Atθ Q i. Έστ θ τέτοια ώστε τ = τ j θ. Αυτό είναι πι ανό εφόσον η τ j είναι ένα-προς-ένα, άρα υπάρ ει μια αντίστροφη αντικατάσταση τ j και τότε μπορούμε να ορίσουμε θ = τ j τ. Από τη συν ήκη της μη-περιττότητας του Q i έ ουμε επίσης ότι ια την θ αυτή υπάρ ει At Q j τ.. Atθ Q i. Έστ τώρα αυτό το συ κεκριμένο At. Αρκεί να δείξουμε ότι At Q j \ατ j. Έστ ότι ισ ύει το αντίστροφο, δη αδή ότι At Q j \ ατ j. Εφόσον At Q j αυτό συνεπά εται ότι At = ατ j. Επειδή Atθ Q i έ ουμε επίσης ότι ατ j θ Q i, όμ ς, ό κατασκευής της θ έ ουμε ατ bd(q i ) που μας οδη εί σε άτοπο. (Ιδιότητα (ARN2)) Η ιδιότητα αυτή προκύπτει από την Ιδιότητα (ARN1) επειδή εφόσον το bd(q j ) \ {ατ j } hd(q) δεν υπά ει το Q i τότε είναι προφανές ότι δεν α υπά ει επίσης και το bd(q i ) \ {ατ} hd(q). Για να μπορούν να ρησιμοποιη ούν οι Ιδιότητες (ARN1) και (ARN2) ο Α όρι μος 5 τροποποιείται ς εξής: Στην αρ ή αρ ικοποιεί ένα άδειο σύνο ο NR που περιέ ει μη-περιττά ερ τήματα. Στην ραμμή 10 εάν το Q i περιέ ει το άτομο ατ τότε το προσ έτει στο σύνο ο NR. Στη ραμμή 12 που κατασκευάζει τη μεί ση bd(q i ) \ {ατ} hd(q i ) του μη-περιττού ερ τήματος Q i, την προσ έτει στο σύνο ο NR. Στη συνέ εια, όπ ς προη ούμενα, το σύνο ο NR που έ ει επιστραφεί ρησιμοποιείται από τον Α όρι μο 1 ια να αποκ είσει από τον έ ε ο απα οιφής ό α τα ερ τήματα που ανήκουν στο NR, όπ ς φαίνεται και από τον Α όρι μο 7. Παράδει μα Έστ ΣΕ και TBox από τα οποία παρά εται επανε ραφή R που περιέ ει τα ερ τήματα Q 1 = A(x 1 ) R(x 1, y 1 ) Q A (x 1 ) και Q 2 = A(x 2 ) R(x 2, y 2 ) S(x 2, y 2 ) Q A (x 2 ) με R = { x 1, x 2, y 1, y 2 }. Τότε παρατηρούμε ότι 60 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

85 Κεφάλαιο 3. Επανεγγραφή Τροποποιημένων Ερωτημάτων το Q 1 είναι μη-περιττό στην R. Έστ τώρα ότι εφαρμόζεται ο Α όρι μος 5 ια το άτομο α = R(x 1, y 1 ) και η επανε ραφή που παρά εται είναι η R. Εάν η R δεν περιέ ει ά α ερ τήματα τότε το ερώτημα Q 1 (Q 1 = A(x 1 ) Q A (x 1 )) α είναι μη-περιττό στην τε ική επανε ραφή κα ώς η Ιδιότητα (ARN1) (Ιδιότητα (ARN2)) ικανοποιείται. Εντοπισμός μη-υπα όντ ν Ερ τημάτ ν Τέ ος, η παρακάτ πρόταση παρουσιάζει μια ιδιότητα με ρήση της οποίας μπορούμε να ανα ν ρίσουμε εάν ένα ερώτημα που κατασκευάζεται κατά την εκτέ εση του Α ορί μου 5 α είναι μη-υπά ον στην τε ική επανε ραφή R. Πρόταση Έστω Q ΣΕ, έστω T TBox, έστω R, R έξοδος ενός αλγορίθμου επανεγγραφής όταν εκτελείται για τα Q και T, και έστω α άτομο του Q. Έστω επίσης R, R έξοδος του Αλγορίθμου 5 όταν εκτελείται για τα T, R, R, και α, έστω Q i R ΣΕ, και έστω ότι ο Αλγόριθμος 5 δεν εκτελεί ποτέ την γραμμή 15. Εάν το Q i είναι μη-υπάγον στην R τότε θα είναι μη-υπάγον και στην R. Απόδειξη: Εφόσον το Q i δεν υπά ει κανένα ΣΕ στην R, έ ουμε ότι Q i θ Q j ια ό α τα Q j R που είναι διάφορα από το Q i και ια ό ες τις αντικαταστάσεις θ. Συνεπώς, ια κά ε θ υπάρ ει του ά ιστον ένα άτομο At στο σώμα του Q i ια το οποίο At Q i θ και At Q j. Κατά τον τερματισμό του Α ορί μου 5 η τε ική επανε ραφή R μπορεί να περιέ ει είτε το Q j ή το bd(q j ) \ {ατ } hd(q j ), ια μια αντικατάσταση τ που αντιστοι εί τις μετα ητές του Q στις μετα ητές του Q j. Είναι προφανές ότι και στις δύο περιπτώσεις και ια κά ε θ α υπάρ ει ένα άτομο At Q i θ τέτοιο ώστε At Q j ή At bd(q j ) \ {ατ } hd(q j ). Ο Α όρι μος 5 ρησιμοποιεί επιπ εόν το σύνο ο NS ια να απο ηκεύσει τέτοια ερ τήματα τα οποία στη συνέ εια ρησιμοποιούνται από τον Α όρι μο 7 ια να ε τιώσουν την απόδοση του. Παράδει μα Έστ η επανε ραφή R από το Παράδει μα Εάν το ερώτημα Q 2 προστε εί από τον Α όρι μο 5 στην R, εάν δη αδή είναι ανεξάρτητο από το α, τότε εφόσον είναι μη-υπά ον στην R α είναι μη-υπά ον και στην R. Πρά ματι, όποιο από τα ερ τήματα Q 1 ή Q 1 και να προστε εί στην R το Q 2 δεν πρόκειται να το υπά ει. Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 61

86 Βελτιστοποιήσεις 62 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

87 Κεφά αιο 4 Βε τιστοιποίηση Επανε ραφής Ερ τημάτ ν μέσ της Επέκτασης με Άτομα Στο προη ούμενο κεφά αιο με ετήσαμε το πρό ημα του υπο ο ισμού μιας επανε ραφής ια ερ τήματα που έ ουν τροποποιη εί με προσ ήκη/αφαίρεση διακεκριμέν ν μετα ητών ή με προσ ήκη/αφαίρεση ατόμ ν. Οι α όρι μοι που παρουσιάσαμε δέ ονται ς είσοδο ένα ΣΕ Q, ένα TBox T, μια επανε ραφή R ια τα Q, T και μια μετα ητή ή ένα άτομο και παρά ουν μια επανε ραφή ια το νέο τροποποιημένο ερώτημα, εκμετα ευόμενοι όσο το δυνατόν περισσότερη από την ήδη υπο ο ισμένη π ηροφορία. Τα TBox ια τα οποία μπορούν να εφαρμοστούν οι α όρι μοι αυτοί περιέ ουν αξιώματα εκφραστικών σσών, την εκφραστικότητα τ ν οποί ν κατα- ράφουν οι υπαρξιακοί κανόνες. Παρό α αυτά, οι α όρι μοι αυτοί (εκτός από τον α όρι μο επέκτασης διακεκριμέν ν μετα ητών) παρουσιάζουν ένα σημαντικό μειονέκτημα. Η ειτουρ ία τους στηρίζεται στην ρήση ενός α ορί μου επανε ραφής rew ια την παρα ή αποτε εσμάτ ν που είναι π ήρη. Κάτι τέτοιο όμ ς, όπ ς α φανεί και από την αξιο ό ηση που πρα ματοποιήσαμε (κεφά αιο 6), περιορίζει την αποδοτικότητα τους. Για να αντιμετ πιστεί αυτό πρέπει η κ ήση του α ορί μου rew να ε α ιστοποιη εί ει δυνατόν να μην κα είται κα ό ου. Η με έτη κατασκευής α ορί μ ν παρα ής επανε ραφών ια τροποποιημένα ερ τήματα οι οποίοι δεν ρησιμοποιούν κάποιον α όρι μο επανε ραφής rew είναι ιδιαίτερα δύσκο η ια ο- ικές που φτάνουν στην εκφραστικότητα τ ν υπαρξιακών κανόν ν. Για το ό ο αυτό, στα π αίσια αυτής της διατρι ής, προτιμήσαμε να με ετήσουμε το πρό ημα αυτό ια ώσσες αμη ότερης εκφραστικότητας. Έτσι, στο κεφά αιο αυτό περιορίζουμε την εκφραστικότητα τ ν σσών που με ετάμε σε αυτήν της DL-Lite R και με ετάμε το πρό ημα υπο ο ισμού μιας επανε ραφής ια ερ τήματα που έ ουν επεκτα εί με νέα άτομα. Από ό α τα προ ήματα που με ετήσαμε επι έ ουμε να με ετήσουμε το πρό ημα της επέκτασης ερ τημάτ ν με άτομα, επειδή παρουσιάζει ιδιαίτερο ενδιαφέρον μιας και συνεπά εται τη δυνατότητα κατασκευής ενός επαυξητικού α ορί μου επανε ραφής ια στα ερά ερ τήματα. Πιο συ κεκριμένα, ια μια DL-Lite R οντο ο ία, ένα συζευκτικό ερώτημα, μια ήδη υπο ο ισμένη επανε ραφή, που αποτε είται μόνο από την επανε ραφή ΣΣΕ, 63

88 Επισκόπηση Αλγορίθμου ια το ερώτημα αυτό και ένα άτομο που α προστε εί στο ερώτημα παρουσιάζουμε πώς μπορούμε να υπο ο ίσουμε ένα σύνο ο συζευκτικών ερ τημάτ ν ια το νέο ερώτημα επεκτείνοντας την επανε ραφή ΣΣΕ που έ ουμε σαν είσοδο, αποφεύ οντας να το υπο ο ίσουμε εξαρ ής. Ο α όρι μος που παρουσιάζουμε είναι αρκετά σύν ετος και ια το ό ο αυτό στην ενότητα 4.1 ρησιμοποιούμε μια σειρά από παραδεί ματα ια να παρουσιάσουμε μια επισκόπησή του, δίνοντας έμφαση σε διάφορα τε νικά σημεία. Τα παραδεί ματα αυτά, όπ ς είναι φυσιο ο ικό παρουσιάζουν επικα ύψεις με τα παραδεί ματα που παρουσιάσαμε στην ενότητα 3.4, α ά ια ό ους π ηρότητας και ευκο ίας κατανόησης του α ορί μου μας τα παρουσιάζουμε πά ι, με μικρές τροποποιήσεις. Στη συνέ εια, στην ενότητα 4.2 περι ράφουμε ανα υτικά τον α όρι μο επέκτασης μιας επανε ραφής ΣΣΕ και τέ ος αποδεικνύουμε την ορ- ότητα του (ενότητα 4.2.1). Αξίζει να σημει εί ότι εφόσον οι α όρι μοι που παρουσιάζουμε στη συνέ εια αναφέρονται σε οντο ο ίες εκφραστικότητας DL-Lite ια την παρα ή τ ν διαφόρ ν επανε ραφών α ρησιμοποιήσουμε την ορο ο ία που παρουσιάστηκε στην ενότητα και ια κά ε επανε ραφή R = R D R Q α έ ουμε R D =. 4.1 Επισκόπηση Α ορί μου Έστ το παρακάτ DL-Lite R TBox και το ΣΕ που ανακτά ό α τα άτομα που διδάσκουν κάποιον: T = {Καθηγητής(x) y.διδάσκει(x, y), y.διδάσκει(y, x) Φοιτητής(x)} Q = διδάσκει(x, y) Q A (x) Το παρακάτ σύνο ο αποτε εί επανε ραφή ΣΣΕ ια τα Q, T και έ ει υπο ο ιστεί με τον α όρι μο PerfectRef: R Q = {Q, Q 1 }, με Q 1 = Καθηγητής(x) Q A (x) Πιο συ κεκριμένα, το ΣΕ Q 1 παρά εται εφαρμόζοντας το πρώτο αξί μα του TBox στο άτομο διδάσκει(x, y) του Q, αντικα ιστώντας το με το Καθηγητής(x). Έστ τώρα ότι το αρ ικό ερώτημα επεκτείνεται έτσι ώστε να ανακτήσει ό α τα άτομα που διδάσκουν φοιτητές, δη αδή, το ερώτημα Q επεκτείνεται με το άτομο α = Φοιτητής(y) και το νέο ΣΕ είναι το ακό ου ο: Q = διδάσκει(x, y) Φοιτητής(y) Q A (x). Και πά ι, ρησιμοποιώντας τον α όρι μο PerfectRef, μπορούμε να υπο ο ίσουμε την επανε ραφή ΣΣΕ ια τα Q, T : R Q = {Q, Q 1, Q, Q 1 } με Q, Q και Q 1 ερ τήματα ίδια με αυτά που έ ουν υπο ο ιστεί προη ουμέν ς, και Q 1 = διδάσκει(x, y) διδάσκει(z, y) Q A (x). 64 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

89 Κεφάλαιο 4. Βελτιστοιποίηση Επανεγγραφής Ερωτημάτων μέσω της Επέκτασης με Άτομα Πιο συ κεκριμένα, το Q 1 παρά εται από το Q εφαρμόζοντας το δεύτερο αξί μα του TBox στο άτομο Φοιτητής(y), αντικα ιστώντας το με το διδάσκει(z, y), με z μια νέα μετα ητή, ενώ το Q προκύπτει από το Q 1 εφαρμόζοντας το ήμα μεί σης στα δύο άτομα του. Αξίζει να παρατηρήσουμε ότι η μετα ητή y στο ερώτημα Q 1 είναι δεσμευμένη, εφόσον εμφανίζεται και στα δύο άτομα διδάσκει(x, y) και διδάσκει(z, y), ενώ μετά το ήμα μεί σης ίνεται μη-δεσμευμένη. Συνεπώς, τε ικά ο α όρι μος μπορεί να παρά ει το ερώτημα Q 1 από το Q όπ ς δείξαμε προη ουμέν ς. Από το παραπάν παράδει μα παρατηρούμε π ς όταν ο α όρι μος PerfectRef εκτε- είται ια τα Q, T ρειάζεται να επαναϋπο ο ίσει τα ερ τήματα Q και Q 1, παρό ο που αυτά έ ουν ήδη υπο ο ιστεί ια τα Q, T. Για να αποφύ ουμε την επανά ηψη αυτού του υπο ο ισμού α ήταν ευερ ετικό οποιαδήποτε ερ ασία επανε ραφής να εφαρμοστεί μόνο ια το νεοεισα έν άτομο και στη συνέ εια να συνδυάσουμε κατά η α το αποτέ εσμα με την ήδη υπο ο ισμένη επανε ραφή, στην οποία στη συνέ εια α αναφερόμαστε ς επανεγγραφή αναφοράς (reference rewriting). Έστ το ερώτημα Q α = Φοιτητής(y) Q A (y). Το σύνο ο R α = {Q α, Q α}, όπου Q α = διδάσκει(z, y) Q A (y) ια μια νέα μετα ητή z, είναι μια επανε ραφή ΣΣΕ ια τα Q α, T που μπορεί να υπο ο ιστεί με τον α όρι μο PerfectRef. Είναι εύκο α ορατό ότι το ερώτημα Q του R Q μπορεί να παρα εί προσ έτοντας τα άτομα του Q α στο Q (το οποία έ ουν υπο ο ιστεί προη ουμέν ς στο R Q ), ενώ το ερώτημα Q 1 μπορεί επίσης να παρα εί προσ έτοντας τα άτομα του Q α στο Q. Παρό α αυτά, πρέπει να σημει εί ότι η προσ ήκη τ ν ατόμ ν του Q α στο Q 1 R Q παρά ει το ΣΕ Καθηγητής(x) Φοιτητής(y) Q A (x) που δεν αποτε εί κομμάτι του R Q. Ό α τα παραπάν υποδη ώνουν ότι δεδομένου ενός ατόμου α και μιας επανε ραφής R Q ια τα Q, T, μια επανε ραφή ια τα bd(q) {α} hd(q), T μπορεί να υπο ο ιστεί υπο ο ίζοντας μια επανε ραφή R α ια ένα ειδικό ερώτημα Q α και στη συνέ εια επεκτείνοντας κατά η α τα ερ τήματα στο R Q με τα άτομα του σώματος τ ν ερ τημάτ ν από το R α. Πιο συ κεκριμένα, ια τα α, R Q, Q και T ο α όρι μος α υπο ο ίσει μια επανε ραφή ΣΣΕ R α ια το ερώτημα Q α = α Q A (var(α) var(q)) και το T και στη συνέ εια α προσ έσει τα άτομα κά ε ερ τήματος Q α R α στα άτομα κα ε ερ τήματος Q R εάν avar(q α) var(q ). Διαισ ητικά η παραπάν προσέ ιση είναι εφικτή επειδή η διαδικασία της επανε - ραφής στον α όρι μο PerfectRef είναι σε πο ύ με ά ο α μό τοπική σε σ έση με τα άτομα του ερ τήματος. Για παράδει μα, η εφαρμο ή του ήματος αναδιατύπ σης σε κάποιο άτομο ενός ερ τήματος είναι ανεξάρτητη από τα ά α άτομα του ερ τήματος. Δυστυ ώς όμ ς, το δεύτερο ήμα του αρ ικού α ορί μου, αυτό της μεί σης, περι αμ άνει περισσότερα από ένα άτομα του ερ τήματος και ια αυτό το επι είρημα της ανεξαρτησίας σπάει. Μια ευ εία προσέ ιση α ήταν να ρησιμοποιείται το ήμα της μεί σης μεταξύ τ ν ερ τημάτ ν από τις δύο επανε ραφές. Στο τρέ ον παράδει μα, το άτομο διδάσκει(x, y) στο ερώτημα Q μπορεί να ενοποιη εί με το άτομο διδάσκει(z, y) στο ερώτημα Q α. Το αποτέ εσμα της ενοποίησης αυτής παρά ει όντ ς το ερώτημα Q του R Q. Παρό α αυτά, η προσέ ιση αυτή εμφανίζει δύο ασικά μειονεκτήματα. Πρώτον, όπ ς δείξαμε και στην ενότητα είναι ευρέ ς ν στό ότι όσον αφορά στην απόδοση, το ήμα της μεί σης δεν είναι αποδοτικό αφού μπορεί να έ ει ς αποτέ εσμα την παρα ή εκ ετικού αρι μού (πι ανώς περιττών) ερ τημά- Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 65

90 Επισκόπηση Αλγορίθμου τ ν [117, 132, 29]. Κατά δεύτερον, ακόμα και με αυτή την προσέ ιση το ερώτημα Q 1 R Q δε α μπορούσε να παρα εί. Το ήμα μεί σης παρουσιάστηκε στον α όρι μο PerfectRef επειδή ένα αξί μα I μπορεί να είναι εφαρμόσιμο μόνο στη μεί ση κάποιου ΣΕ. Στο τρέ ον παράδει μα, το ερώτημα Q 1 παρά εται από το Q επειδή η μετα ητή y που ήταν δεσμευμένη στο Q 1 ίνεται μη-δεσμευμένη μετά το ήμα της μεί σης. Ένα π εονέκτημα στη δική μας περίπτ ση είναι π ς ν ρίζουμε ήδη από την επανε ραφή αναφοράς ότι το Q 1 μπορεί να παρα εί από το Q. Για το ό ο αυτό, ο α όρι μος μας ρειάζεται μόνο να ε έ ει εάν ένα ΣΕ του R α μπορεί να συ νευ εί με το ΣΕ Q με τέτοιο τρόπο ώστε ό α τα ερ τήματα που έ ουν παρα εί ό του Q στην επανε ραφή αναφοράς να μπορούν να παρα ούν και πά ι. Εάν ισ ύει αυτό, τότε το Q, α ά και ό α αυτά τα ερ τήματα (στην περίπτ ση μας μόνο το Q 1 ) α πρέπει να είναι μέρος του αποτε έσματος. Ο α όρι μος που παρουσιάζεται στην επόμενη ενότητα ανα- ν ρίζει τέτοιες περιπτώσεις ρησιμοποιώντας τη συνάρτηση mergecqs που ορίζεται στη συνέ εια. Ορισμός Έστ Q, Q δύο ΣΕ. Τότε, η συνάρτηση mergecqs(q, Q) επιστρέφει μια αντικατάσταση Σ που ορίζεται ς εξής: Εάν υπάρ ει α bd(q) bd(q ), τότε η Σ περιέ ει την αντικατάσταση {x x x var(α)}, Εάν υπάρ ει R(z, y) Q, R(x, y) Q ή R(y, z) Q, R(y, x) Q και οι μετα- ητές x, y, z είναι ανά δύο διαφορετικές, τότε το Σ περιέ ει την αντικατάσταση {z x}. Με τη ρήση της συνάρτησης mergecqs ο α όρι μος PerfectRef μπορεί να επεκτα εί στον PerfectRef + που δίνεται από τον Α όρι μο 8, ο οποίος ρησιμοποιεί ένα περιορισμένο βήμα μείωσης (reduced reduction step), ε α ιστοποιώντας τις περιπτώσεις παρα ής μει μέν ν ερ τημάτ ν. Αξίζει να σημει εί π ς το περιορισμένο ήμα μεί σης είναι παρόμοιο με το βήμα παραγοντοποίησης (factorization step) που προτά ηκε από τους Gottlob et al. [64]. Παρό α αυτά, εφόσον η DL-Lite επιτρέπει την ύπαρξη κατη ορημάτ ν που περιέ ουν το πο ύ δύο μετα ητές οι έ ε οι που ρειάζεται να πρα ματοποιήσουμε (αυτοί που δίνονται από τον Ορισμό 4.1.1) είναι πιο στο ευμένοι και απαιτούν μικρότερο υπο ο ιστικό κόστος. Από την ά η, ια την υ οποίηση του ήματος παρα οντοποίησης είναι απαραίτητο να ίνει έ ε ος ια το εάν αυτό είναι δυνατό να εφαρμοστεί ια συ κεκριμένα αξιώματα του TBox όσον αφορά κάποιο άτομο, κάτι το οποίο είναι (σ εδόν) ισοδύναμο με την εφαρμο ή ενός ήματος επανε ραφής. Όπ ς δεί νει το επόμενο παράδει μα, η αντικατάσταση που επιστρέφεται από τη συνάρτηση mergecqs υποδεικνύει τον τρόπο με τον οποίο ένα ερώτημα μπορεί να συ νευ εί με ένα ά ο και αποτε εί καίριο σημείο ια τον α όρι μο μας. Παράδει μα Έστ το παρακάτ TBox και ΣΕ: T = {A(x) y.r(x, y)} Q = R(x, y) Q A (x). 66 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

91 Κεφάλαιο 4. Βελτιστοιποίηση Επανεγγραφής Ερωτημάτων μέσω της Επέκτασης με Άτομα Α όρι μος 8 PerfectRef + (Q, T ) Είσοδος: Ένα ΣΕ Q και ένα DL-Lite R -TBox T 1: Αρ ικοποίησε μια επανε ραφή ΣΣΕ R Q := {Q} 2: repeat 3: R Q := R Q 4: for all Q 1 R Q do 5: for all α Q 1 do 6: for all I T do 7: if I είναι εφαρμόσιμο στο α then 8: Πρόσ εσε το Q 2 := Q 1 [α/gr(α, I)] στο R Q 9: end if 10: end for 11: end for 12: for all α 1, α 2 στο Q 1 do 13: σ = mergecqs(α 1 hd(q 1 ), α 2 hd(q 1 )) 14: if σ then 15: Πρόσ εσε το Q 1 σ στο R Q 16: end if 17: end for 18: end for 19: until R Q = R Q 20: return R Q που έ ουν την παρακάτ επανε ραφή ΣΣΕ: R Q = {Q, Q 1 }, με Q 1 = A(x) Q A (x) Έστ τώρα ότι επεκτείνουμε το ΣΕ Q με το άτομο α 1 = R(z, y) και ότι έ ουμε να υπο ο ίσουμε μια επανε ραφή ΣΣΕ ια τα Q = bd(q) {R(z, y)} hd(q) και T, ρησιμοποιώντας την προσέ ιση που περι ράψαμε προη ουμέν ς. Πρώτα, κατασκευάζουμε το ερώτημα Q α1 = R(z, y) Q A (y) και στη συνέ εια την επανε - ραφή ΣΣΕ R α1 = {Q α1 } ια τα Q α1, T. Τέ ος, ένα ΣΣΕ R Q κατασκευάζεται όπ ς φαίνεται παρακάτ : Τα άτομα του Q α1 προστί ενται στο Q κατασκευάζοντας το ΣΕ Q = bd(q) {R(z, y)} hd(q), ενώ το ερώτημα Q α1 συ νεύεται με το Q με mergecqs(q α1, Q) = {z x}, συνεπώς τα ερ τήματα Q και Q 1 προστί ενται στο R Q. Μπορεί να επα η ευτεί ότι το R Q = {Q, Q, Q 1 } είναι μια επανε ραφή ΣΣΕ ια τα Q, T. Έστ τώρα ότι έ ουμε να επεκτείνουμε περαιτέρ το Q με το άτομο α 2 = B(z) και ότι έ ουμε να υπο ο ίσουμε μια επανε ραφή ΣΣE ια τα Q = bd(q ) {B(z)} hd(q ) και T. Μια τέτοια επανε ραφή, που έ ει υπο ο ιστεί με τον α όρι μο PerfectRef είναι το ακό ου ο σύνο ο: R Q = {Q, Q 1, Q 2}, με Q 1 = R(x, y) B(x) Q A (x) και Q 2 = A(x) B(x) Q A (x) Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 67

92 Επισκόπηση Αλγορίθμου Έστ τώρα ότι έ ουμε να υπο ο ίσουμε το R Q ρησιμοποιώντας την προσέ - ιση μας. Για το ό ο αυτό, κατασκευάζουμε το ερώτημα Q α2 := B(z) Q A (z), την επανε ραφή ΣΣE R α2 := {Q α2 } ια τα Q α2, T και στη συνέ εια συνδυάζουμε τα ερ τήματα από το R Q και το R α 2. Προσ έτοντας τα άτομα του Q α2 στο Q κατασκευάζεται το ερώτημα Q, ενώ, ια ό α τα ά α ερ τήματα Q i R Q έ ουμε ότι avar(q α2 ) var(q i ) και συνεπώς κανένα ά ο ερώτημα του R Q δεν μπορεί να παρα εί. Το πρό ημα στο προη ούμενο παράδει μα είναι ότι μετά την συ ώνευση του Q α1 με το Q η αναφορά μας στη μετα ητή z ά ηκε κα ώς αυτή αντικαταστά ηκε από την μετα ητή x. Η π ηροφορία αυτή είναι ιδιαίτερα σημαντική στις περιπτώσεις που έ ουμε να επεκτείνουμε περαιτέρ ένα ερώτημα και να αποφασίσουμε εάν είναι εφικτό να επεκτα εί ένα ερώτημα από το R Q με άτομα από τα ερ τήματα του R α 2. Για να δια ειριστούμε σ στά αυτές τις περιπτώσεις, αντί του ε έ ου υποσυνό ου ανάμεσα στις μετα ητές, ο α όρι μος μας ρησιμοποιεί την πιο σύν ετη μέ οδο canbejoined που ορίζεται στη συνέ εια. Ορισμός Έστ Q ΣΕ, έστ σ αντικατάσταση, και έστ vars ένα σύνο ο από μετα ητές. Η συνάρτηση canbejoined(q, σ, vars) επιστρέφει αληθές εάν ια κά ε z vars υπάρ ει x var(q) τέτοιο ώστε ια τον ράφο G που επά εται από την σ, έ ουμε z G x. Παράδει μα Έστ το ερώτημα Q, τα ΣΣΕ R α2 και R Q, και η αντικατάσταση σ από το Παράδει μα Για τα ερ τήματα Q α2 R α2 και Q R Q έ ουμε ότι canbejoined(q, σ, avar(q α2 )) = αληθές. Συνεπώς, τα άτομα του Q α2 (δη- αδή το B(z)) μπορούν να προστε ούν σε αυτά του Q. Πρέπει στόσο να σημει - εί ότι ό της σ το νέο ερώτημα που πρέπει να δημιουρ η εί είναι το ερώτημα bd(q) {B(z)σ} hd(q), που κατ ακρί εια είναι το Q 1 από το Παράδει μα Όμοια ια το ερώτημα Q 1 R Q έ ουμε canbejoined(q 1, σ, avar(q α2 )) = αληθές, συνεπώς κατασκευάζεται το ερώτημα bd(q 1 ) {B(z)σ} hd(q 1 ) (δη αδή το Q 2). Συνεπώς η επανε ραφή ΣΣΕ R Q ια τα Q, T μπορεί να κατασκευαστεί. Συνοψίζοντας, όταν ένα ερώτημα Q i R α συ νεύεται με κάποιο ερώτημα Q j R Q πρέπει να ν ρίζουμε πρώτα από ό α ποιά ερ τήματα έ ουν παρα εί στο R Q εξαιτίας του Q j, έτσι ώστε να τα προσ έσουμε στο αποτέ εσμα, και κατά δεύτερον, ποιές αντικαταστάσεις μετα ητών ρησιμοποιούνται στη συ ώνευση. Για να μπορέσουμε να συ ά ουμε την π ηροφορία αυτή, σε αντί εση με ά ες προσε ίσεις που ρησιμοποιούν τις επανε ραφές ΣΣΕ R Q και R α, ο α όρι μος μας ειτουρ εί πάν σε ράφους ερ τημάτ ν G και G α οι οποίοι απο ηκεύουν τις συσ ετίσεις μεταξύ τ ν ερ τημάτ ν κα ώς και τις παρα όμενες αντικαταστάσεις. Ορισμός Έστ Q ΣΕ και έστ T DL-Lite R -TBox. Ένας γράφος επανεγγραφής ια τα Q, T είναι ένας κατευ υνόμενος ράφος G = R Q, H, m, με R Q μια επανε ραφή ΣΣΕ ια τα Q, T, H μια δυαδική σ έση πάν στην R Q, και m αντιστοί ιση του κά ε Q i R Q σε ένα σύνο ο μετα ητών. Επιπ έον, ο ράφος G ικανοποιεί τις παρακάτ ιδιότητες: 68 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

93 Κεφάλαιο 4. Βελτιστοιποίηση Επανεγγραφής Ερωτημάτων μέσω της Επέκτασης με Άτομα Εάν Q 1, Q 2 H, τότε το ερώτημα Q 2 παρά εται από το Q 1 με την εφαρμο ή ενός ήματος αναδιατύπ σης ή μεί σης. Για κά ε Q 1, Q 2 H εάν το Q 2 παρά εται από ένα ήμα αναδιατύπ σης, τότε ισ ύει m(q 2 ) = m(q 1 ), ενώ εάν παρά εται από ένα ήμα μεί σης με τον πιο ενικό ενοποιητή σ, τότε m(q 2 ) = m(q 1 ) σ. Ένα πο ύ σημαντικό ερώτημα που ε είρεται στο σημείο αυτό είναι εάν μπορούμε να υπο ο ίσουμε την επανε ραφή ΣΣΕ δεδομένης οποιαδήποτε επανε ραφής αναφοράς. Όπ ς φαίνεται και από το παρακάτ παράδει μα, κάτι τέτοιο δεν είναι πάντα εφικτό. Παράδει μα Θε ρούμε τα παρακάτ TBox και ΣΕ: T = {A(x) y.r(x, y)} Q = A(x) R(x, y) Q A (x). Τότε, G 1 = R 1, H, με R 1 = {Q, Q 1 }, Q 1 = A(x) Q A (x) και H = { Q, Q 1 } είναι ένας ράφος επανε ραφής ια τα Q, T. Όμ ς, το Q είναι περιττό στο R 1. Συνεπώς, το R 2 = {Q 1 } είναι επίσης επανε ραφή ΣΣΕ ια τα Q, T και ο G 2 = R 2,, είναι ράφος επανε ραφής ια τα Q, T. Έστ τώρα ότι έ ουμε να επεκτείνουμε το Q με το άτομο α = B(y) κατασκευάζοντας το ερώτημα Q = bd(q) {B(y)} hd(q). Μια επανε ραφή ΣΣΕ ια τα Q, T υπο ο ισμένη με τη ρήση του α ορί μου PerfectRef αποτε είται από το ΣΣΕ R Q = {Q }. Θε ρούμε τώρα το ερώτημα Q α = B(y) Q A (y). Με ρήση του PerfectRef υπο- ο ίζουμε την επανε ραφή ΣΣΕ R α = {Q α }. Όπ ς είναι εμφανές δεν είναι δυνατό να υπο ο ίσουμε το R Q ρησιμοποιώντας την επανε ραφή ΣΣΕ R 2 που περιέ ει μη-περιττά ερ τήματα. Το R Q μπορεί να κατασκευαστεί με τη ρήση της επανε ραφής ΣΣΕ R 1 που περιέ ει περιττά ερ τήματα. Πιο συ κεκριμένα, η προσ ήκη τ ν ατόμ ν του Q α στο Q έ ει ς αποτέ εσμα τη δημιουρ ία του ΣΕ Q. Το πρό ημα στο προη ούμενο παράδει μα έ κειται στο ότι παρό ο που το ερώτημα Q είναι περιττό στο R 1 τα ερ τήματα που παρά ονται από αυτό δεν είναι περιττά στο τε ικό ΣΣΕ και συνεπώς το ερώτημα αυτό είναι σ ετικό ια τον υπο ο ισμό του ΣΣΕ ια το bd(q) {α} hd(q). Πιο συ κεκριμένα, το Q 1 που ρησιμοποιείται ια να αφαιρέσουμε το Q, δεν παρά ει κανένα ΣΕ που να αποτε εί κομμάτι της τε ικής επανε ραφής ΣΣΕ. Στη συνέ εια παρουσιάζουμε με τυπικό τρόπο μια ιδιότητα ια την επανε ραφή αναφοράς που ρησιμοποιείται σαν είσοδος στον α όρι μο μας. Η ιδιότητα αυτή είναι ικανή ια την παρα ή ενός ράφου επανε ραφής ια ένα επεκτεταμένο ερώτημα. Ορισμός Έστ Q ένα ερώτημα, έστ T ένα DL-Lite R -TBox, και έστ G = R Q, H, m ένας ράφος επανε ραφής ια τα Q, T. Λέμε ότι ο G είναι κλειστός ως προς την αναδιατύπωση (reformulation closed) ια τα Q, T εάν ικανοποιούνται οι παρακάτ ιδιότητες: Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 69

94 Αλγόριθμος Επέκτασης Ερωτημάτων 1. Το Q είναι κόμ ος κορυφής στον G. 2. Για κά ε κόμ ο κορυφής Q i στον G έ ουμε ότι m(q i ) =. 3. Εάν ένα ερώτημα Q 2 μπορεί να παρα εί ρησιμοποιώντας ένα απ ό ήμα αναδιατύπ σης σε κάποιο ερώτημα Q 1 u, τότε Q 1, Q 2 H. 4. Εάν Q 1 R Q και τα άτομα R(z, y) και R(x, y) ή τα άτομα R(y, z) και R(y, x) εμφανίζονται στο Q 1, τότε Q 1, Q 2 H, με Q 2 = Q 1 {z x}. Παρατηρούμε ότι ο ράφος επανε ραφής G 2 από το Παράδει μα δεν είναι κ ειστός ς προς την αναδιατύπ ση ια τα Q, T κα ώς το Q δεν εμφανίζεται ς κόμ ος κορυφής. Ο G 1 όμ ς, είναι κ ειστός ς προς την αναδιατύπ ση ια τα Q, T. 4.2 Α όρι μος Επέκτασης Ερ τημάτ ν Α όρι μος 9 ExtendRewritingForNewAtom(T, G, α) Είσοδος: Ένα TBox T, ένας ράφος επανε ραφής G = R Q, H, m ια κάποιο ΣΕ Q μ..τ. T και ένα νέο άτομο α. 1: G α := ex-perfectref(α Q A (var(α) var(q)), T ) 2: G := joingraphs(g, G α, var(α) var(q), avar(q)) 3: return G Ο α όρι μος μας ια τον υπο ο ισμό ενός ράφου επανε ραφής ια ένα ερώτημα Q που επεκτείνεται με ένα άτομο α φαίνεται στον Α όρι μο 9. Ο α όρι μος δέ εται σαν είσοδο ένα TBox T, ένα ράφο επανε ραφής G ια τα Q, T, και ένα άτομο α και επιστρέφει έναν ράφο επανε ραφής ια τα bd(q) {α} hd(q), T. Ο α όρι μος υπο ο ίζει πρώτα έναν ράφο επανε ραφής G α ια το ερώτημα α Q A (var(α) var(q)), ο οποίος εξά ει τη νώση του T που αφορά το άτομο α. Αυτό πρα ματοποιείται με τη ρήση της υπο-ρουτίνας ex-perfectref, που φαίνεται στον Α - όρι μο 10. Ο α όρι μος αυτός είναι μια ε αφρώς πιο εκτεταμένη έκδοση του α - όρι μου PerfectRef [31], που εκτός από την εφαρμο ή τ ν ημάτ ν αναδιατύπ σης και μεί σης, απο ηκεύει επίσης τις εξαρτήσεις παρα ής ανάμεσα στα ερ τήματα, με τη ρήση ενός ράφου. Στη συνέ εια, ο Α όρι μος 9 συνδυάζει τους G και G α ρησιμοποιώντας τον α όρι μο joingraphs και υπο ο ίζει έναν ράφο επανε ραφής ια το επεκτεταμέντο ερώτημα. Ο α όρι μος joingraphs φαίνεται στον Α όρι μο 11. Διαισ ητικά, ο α όρι μος αυτός υπο ο ίζει το Καρτεσιανό ινόμενο τ ν δύο ράφ ν επανε ραφής που παίρνει ς είσοδο. Η διαίσ ηση είναι ότι εάν Q, Q G (ήτοι, το Q παρά εται από το Q) και το Q α είναι ένας κόμ ος στον ράφο G α, τότε το ίδιο ήμα α είναι επίσης εφαρμόσιμο στο ερώτημα bd(q) bd(q α ) hd(q) δη αδή, το ερώτημα bd(q) bd(q α ) hd(q) α παρά ει το ΣΕ bd(q ) bd(q α ) hd(q ). Το ίδιο α ισ ύει και ια το Q που είναι κόμ ος στον G και τη σ έση Q α, Q α G α. 70 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

95 Κεφάλαιο 4. Βελτιστοιποίηση Επανεγγραφής Ερωτημάτων μέσω της Επέκτασης με Άτομα Α όρι μος 10 ex-perfectref(q, T ) Είσοδος: Ένα ΣΕ Q και ένα DL-Lite R -TBox T 1: Αρ ικοποίησε μια επανε ραφή ΣΣΕ R Q := {Q} 2: Αρ ικοποίησε μια αντιστοί ιση m από ΣΕ σε αντικαταστάσεις 3: G := R Q, H, m 4: m(q) := 5: repeat 6: R Q := R Q 7: for all Q 1 R Q do 8: for all α Q 1 do 9: for all I T do 10: if I είναι εφαρμόσιμο στο α then 11: Πρόσ εσε το Q 2 := Q 1 [α/gr(α, I)] στο R Q 12: Πρόσ εσε το Q 1, Q 2 στο G 13: m(q 2 ) := m(q 1 ) 14: end if 15: end for 16: end for 17: for all α 1, α 2 στο Q 1 do 18: if υπάρ ει mgu σ ια τα α 1 και α 2 then 19: Πρόσ εσε το Q 1, Q 1 σ στο G 20: m(q 1 σ) := m(q 1 ) {σ} 21: end if 22: end for 23: end for 24: until R Q = R Q 25: return G Πιο συ κεκριμένα, ο α όρι μος ρησιμοποιεί τις ουρές Q και Q α έτσι ώστε να προσπε άσει τους ράφους επανε ραφής G και G α, αντίστοι α. Στη ραμμή 5 επι έ- ει ένα στοι είο Q h από τον G και ε έ ει εάν το ερώτημα αυτό μπορεί να επεκτα εί με τα άτομα τ ν ερ τημάτ ν του G α ( ραμμή 6). Εάν μπορεί, τότε επι έ εται επίσης ένα ΣΕ Q α από τον G α ( ραμμή 9), παρά εται ένα νέο ερώτημα Q c από τα Q h και Q α ( ραμμή 11) διακεκριμένες μετα ητές το nv. Επιπ έον, η m(q h ) ορίζεται ς η αντικατάσταση ια το Q c ( ραμμή 12). Στη συνέ εια, ο α όρι μος ε έ ει εάν το Q α μπορεί να συ νευ εί με το Q h. Εάν κάτι τέτοιο μπορεί να ίνει, τότε προσ έτει την Q c, Q h σ (όπου το Q h σ είναι το ερώτημα που προκύπτει από την εφαρμο ή της αντικατάστασης σ στο Q h ) στον νέο ράφο ( ραμμή 15) και στη συνέ εια αντι ράφει στον G το κομμάτι του G που έ ει παρα εί εξαιτίας του Q h ( ραμμές 16 25) εφαρμόζοντας παρά η α την αντικατάσταση µ που υπο ο ίζεται με τη οή εια της συνάρτησης buildsubst. Ορισμός Έστ σ και κ σύνο α από αντιστοι ήσεις. Τότε η συνάρτηση buildsubst(σ, κ) επιστρέφει ένα νέο σύνο ο από αντιστοι ήσεις µ το οποίο κατασκευά- Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 71

96 Αλγόριθμος Επέκτασης Ερωτημάτων Α όρι μος 11 joingraphs(g, G α, jv, av) Είσοδος: Ένας ράφος επανε ραφής G = R Q, H, m ια κάποια Q, T και ένας ράφος επανε ραφής G α, το σύνο ο jv τ ν σημεί ν-έν σης, και ένα σύνο ο μετα ητών av. 1: Αρ ικοποίησε ένα ΣΣΕ R Q := και μια δυαδική σ έση H := και μια αντιστοί ιση m = 2: G := R Q, H, m 3: Αρ ικοποίησε μια ουρά Q με το ΣΕ Q 4: while Q do 5: Αφαίρεσε την κεφα ή Q h της Q και όρισε κ := m(q h ) 6: if canbejoined(q h, κ, jv) then 7: Αρ ικοποίησε μια ουρά Q α με ένα κόμ ο κορυφής του G α 8: while Q α do 9: Αφαίρεσε την κεφα ή Q α της Q α 10: nv := avar(q h ) (var(q α κ) av) 11: Q c := bd(q h ) bd(q α )κ Q A (nv) 12: m (Q c ) := κ 13: Πρόσ εσε το Q c στο R Q 14: for all σ mergecqs(q α κ, Q h ) do 15: Προσέ εσε την Q c, Q h σ to G 16: for all Q s.t. Q h G Q do 17: if dom(σ) var(q ) dom(m(q )) then 18: µ := buildsubst(σ, m(q )) 19: m ([Q Q A (nv)]µ ) := µ 20: for all Q, Q G do 21: µ := buildsubst(σ, m(q )) 22: Προσέ εσε την [Q Q A (nv)]µ, [Q Q A (nv)]µ στον G 23: end for 24: end if 25: end for 26: end for 27: for all Q h, Q G do 28: buildchildren(q c, Q, Q α, G, G, av, jv) 29: Πρόσ εσε το Q στην Q 30: end for 31: for all Q α, Q G α do 32: buildchildren(q c, Q h, Q, G, G, av, jv) 33: Πρόσ εσε το Q στην Q α 34: end for 35: end while 36: end if 37: end while 38: return G 72 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

97 Κεφάλαιο 4. Βελτιστοιποίηση Επανεγγραφής Ερωτημάτων μέσω της Επέκτασης με Άτομα Α όρι μος 12 buildchildren(q c, Q, Q α, G, G, av, jv) Είσοδος: Q c, Q, Q α ΣΕ, G = R Q, H, m και G = R Q, H, m ράφοι και av, jv σύνο α από μετα ητές. 1: κ := m(q) 2: if canbejoined(q, κ, jv) then 3: nv := avar(q) (var(q α κ) av) 4: Q n := bd(q) bd(q α )κ Q A (nv) 5: m (Q n ) := κ 6: Πρόσ εσε την Q c, Q n στον G 7: for σ mergecqs(q α κ, Q) do 8: Πρόσ εσε την Q n, Q σ στον G 9: for all Q s.t. Q G Q do 10: if dom(σ) var(q ) dom(m(q )) then 11: µ := buildsubst(σ, m(q )) 12: m ([Q Q A (nv)]µ ) := µ 13: for all Q, Q G do 14: µ := buildsubst(σ, m(q )) 15: Πρόσ εσε την [Q Q A (nv)]µ, [Q Q A (nv)]µ στον G 16: end for 17: end if 18: end for 19: end for 20: end if ζεται με τα ακό ου α ήματα: 1. Ορίζει µ := κ σ 2. Για κά ε z y σ εάν υπάρ ει η z y στο κ τότε αντικα ιστά την z y στο µ με την y y. Αξίζει να σημει εί π ς η συνάρτηση αυτή είναι ιδιαίτερα σημαντική όταν ια ένα ερώτημα Q που πρόκειται να αντι ραφεί έ ουμε m(q ). Μετά από τον έ ε ο ια το εάν ένα ερώτημα μπορεί να συ νευ εί, ο α - όρι μος προσπε αύνει τα ερ τήματα που παρά ονται από το Q h ( ραμμές 27 30) κα ώς και αυτά που παρά ονται από το Q α στον G α ( ραμμές 31 34) και κατασκευάζει κατά η ους διάδο ους ια το Q c. Αυτό ίνεται με τη ρήση της υπο-ρουτίνας buildchildren, που απεικονίζεται στον Α όρι μο 12 και ακο ου εί μια παρόμοια προσέ ιση με τα προη ούμενα. Υπο ο ίζει, δη αδή την έν ση μεταξύ του Q h (ενός παιδιού του Q h ) και κάποιου παιδιού του Q α (και του Q α ) και στη συνέ εια επιπ έον ε έ ει εάν υπάρ ει κάποιο σημείο-συ ώνευσης. Εάν υπάρ ει κάποιο τέτοιο σημείο τότε αντι ράφει τον σ ετικό υπο ράφο στο αποτέ εσμα. Τέ ος, τα παιδιά του Q h (Q α ) προστί ενται στην Q (Q α ). Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 73

98 Αλγόριθμος Επέκτασης Ερωτημάτων.H.H α.q 1 Q 1 α....q Q 1 α.q.q 3 Q 1 2 Q 1 α.q α 1 Q. 2 α....q 2.Q 3 ((αʹ)).q 2 α (( ʹ)).Q.Q 3 Q 2 2 Q 2 α α (( ʹ)) Σ ήμα 4.1: Γράφοι επανε ραφής ια το Παράδει μα Αξίζει να σημει εί ότι οι G και G α μπορούν να είναι κυκ ικοί. Συνεπώς ο α όρι μος ρειάζεται να σημειώνει ποιούς κόμ ους έ ει επισκεφ εί (αντι ράψει) έτσι ώστε να αποφύ ει να τους επισκεφ εί (αντι ράψει) ξανά. Κάτι τέτοιο μπορεί να επιτευ εί ρησιμοποιώντας ν στές τε νικές διάσ ισης ράφ ν. Παράδει μα Έστ οι ράφοι επανε ραφής: G = {Q 1, Q 2, Q 3 }, H, m και G α = {Q 1 α, Q 2 α}, H α, m α όπου οι H και H α φαίνονται στα Σ ήματα 4.1(αʹ) και 4.1( ʹ), αντίστοι α. Υπο έτουμε επίσης ότι m(q i ) = ια κά ε 1 i 3 και ότι ό α τα ερ τήματα Q i μπορούν να επεκτα ούν. Το Σ ήμα 4.1( ʹ) απεικονίζει τον ράφο που παρά εται από τον Α όρι μο 9 ια τους ράφους G και G α, υπο έτ ντας ότι ια κά ε Q j α u α και ια κά ε Q i u, έ ουμε mergecqs(q j α, Q i ) = ήτοι, δεν προκύπτουν συ νεύσεις. Πιο συ κεκριμένα, έ ουμε τα παρακάτ ήματα: Στην πρώτη επανά ηψη έ ουμε Q = {Q 1 } και Q α = {Q 1 α}, συνεπώς ισ ύει Q h = Q 1 και Q α = Q 1 α. Στη ραμμή 11, παρά εται το ΣΕ Q 1 Q 1 α (αφού m(q 1 ) = ). Στη συνέ εια, στον ρό ο επανά ηψης στις ραμμές 27 30, κατασκευάζονται τα ερ τήματα Q 2 Q 1 α και Q 3 Q 1 α, ορίζονται ς παιδιά του Q 1 Q 1 α και τα ερ τήματα Q 2, Q 3 προστί ενται στην Q. Στη συνέ εια, στον επανα ηπτικό ρό ο στις ραμμές κατασκευάζεται το ερώτημα Q 1 Q 2 α, ορίζεται ς παιδί της Q 1 Q 1 α και το ερώτημα Q 2 α προστί εται στην Q α. Στην επόμενη επανά ηψη έ ουμε Q α = {Q 2 α}, συνεπώς επι έ εται η Q 2 α και τώρα Q h = Q 1 και Q α = Q 2 α. Τότε, στη ραμμή 11, κατασκευάζεται το ΣΕ Q 1 Q 2 α και στη συνέ εια, με παρόμοιο τρόπο όπ ς περι ράφηκε παραπάν, κατασκευάζονται τα ΣΕ Q 2 Q 2 α και Q 3 Q 2 α και τα ζεύ η Q 1 Q 2 α, Q 2 Q 2 α και Q 1 Q 2 α, Q 3 Q 2 α προστί ενται στο αποτέ εσμα. Στην επόμενη επανά ηψη, ο α όρι μος επι έ ει το Q 2 από την Q και η Q α αρ ικοποιείται ξανά στο {Q 1 α}. Ο α όρι μος, τότε α κατασκευάσει πά ι το ερώτημα Q 2 Q 1 α και α το συνδέσει με το ερώτημα Q 2 Q 2 α που έ ει κατασκευαστεί προη ούμενα. Τέ ος, ο α όρι μος επι έ ει το Q 3 από την Q κατασκευάζει πά ι το Q 3 Q 1 α και το συνδέει με το Q 3 Q 2 α. Στη συνέ εια, ο α όρι μος τερματίζει. 74 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

99 Κεφάλαιο 4. Βελτιστοιποίηση Επανεγγραφής Ερωτημάτων μέσω της Επέκτασης με Άτομα Ορ ότητα Στην ενότητα αυτή δεί νουμε την ορ ότητα του Α ορί μου 9. Εξ ορισμού της συνάρτησης mergecqs φαίνεται ότι ο α όρι μος μας δεν ρησιμοποιεί το πρ τότυπο ήμα μεί σης. Για παράδει μα, ια το ΣΕ R(x, y), R(y, z) Q A (x) το πρότυπο ήμα μεί σης α παρά ει το ερώτημα R(x, x) Q A (x) με τον πιο ενικό ενοποιητή {z y, y x}. Παρό α αυτά, ια τα Q 1 := R(x, y) Q A (x) και Q 2 := R(y, z) Q A (x), έ ουμε ότι mergecqs(q 2, Q 1 ) = και συνεπώς το Q 2 δεν συ νεύεται με το Q 1. Η ορ ότητα του περιορισμένου ήματος μεί σης φαίνεται από το παρακάτ Λήμμα. Λήμμα Έστω Q 1, Q 2 ΣΕ τ.ω. το Q 2 να υπάγει το Q 1 και έστω Q 1 το αποτέλεσμα της εφαρμογής ενός αξιώματος I στο Q 1. Εάν το Q 2 δεν υπάγει το Q 1, τότε είτε το I είναι εφαρμόσιμο στο Q 2 και το αποτέλεσμα υπάγει το Q 1 ή για i 1, υπάρχουν στο Q 2 άτομα της μορφής P (u, v), P (z i, v) ή P (v, u), P (v, z i ) τ.ω. για λ := {z i u i 1}, το I είναι εφαρμόσιμο στο Q 2 λ και το αποτέλεσμα υπάγει το Q 1. Απόδειξη: Εφόσον το Q 2 υπά ει το Q 1, υπάρ ει μια αντικατάσταση θ τ.. Q 2 θ Q 1. Συνεπώς, αφού το Q 1 είναι το αποτέ εσμα της εφαρμο ής του I στο Q 1 τα προη ούμενα συνεπά ονται ότι το αξί μα I εφαρμόζεται σε ένα άτομο α Q 1 που υπάρ ει επίσης στο Q 2 θ αντικα ιστώντας το με ένα άτομο β που δεν εμφανίζεται στο Q 2 θ. Συνε ίζοντας, το ε ονός ότι α Q 2 θ συνεπά εται ότι το Q 2 περιέ ει ένα άτομο α 0 τέτοιο ώστε α = α 0 θ, ήτοι, ένα άτομο με το ίδιο όνομα κατη ορήματος με το α, που πι ανότατα περιέ ει διαφορετικές μετα ητές. Με ρήση με έτης περιπτώσε ν στους διαφορετικούς τύπους εφαρμο ής ανάμεσα σε αξιώματα και ατόμ ν ερ τημάτ ν δεί νουμε ότι είτε το I εφαρμόζεται επίσης στο άτομο α 0 και ια Q 2 το αποτέ εσμα της εφαρμο ής του I στο Q 2, η θ μπορεί να επεκτα εί σε μια νέα αντικατάσταση σ τ.. Q 2σ Q 1, ή ότι ια i 1 υπάρ ουν στο Q 2 άτομα της μορφής P (u, v), P (z i, v) ή P (v, u), P (v, z i ) τέτοια ώστε ια λ := {z i u i 1}, το I είναι εφαρμόσιμο στο Q 2 λ και το αποτέ εσμα υπά ει το Q 1. Ας υμη ούμε πρώτα ότι α Q 1, α Q 2 θ, α 0 Q 2, και β Q 1. Διακρίνουμε τις παρακάτ περιπτώσεις: 1. Εάν α = A(x), τότε το αξί μα I είναι της μορφής C(x) A(x), με C μια DL-Lite R -έννοια, το β είναι της μορφής C(x), ενώ το α 0 είναι της μορφής A(u), με u x θ. Τότε, το I είναι επίσης εφαρμόσιμο και στο Q 2 κατασκευάζοντας ένα νέο ερώτημα Q 2 που περιέ ει το C(u). Τότε, διακρίνουμε τις παρακάτ περιπτώσεις: Εάν το αξί μα I είναι της μορφής B(x) A(x), τότε β = B(x). Στην περίπτ ση αυτή, B(u) Q 2, και ια σ := θ έ ουμε B(x) Q 2σ το οποίο συνεπά εται ότι Q 2σ Q 1. Εάν το αξί μα I είναι της μορφής y.p (x, y) A(x), τότε β = P (x, y) ια μια νέα μετα ητή y στο Q 1. Στην περίπτ ση αυτή, ισ ύει P (u, z) Q 2 ια μια νέα μετα ητή z στο Q 2. Εφόσον η z είναι νέα στο Q 2, η θ μπορεί να επεκτα εί στην σ := θ {z y}. Τότε, ισ ύει P (x, y) Q 2σ που συνεπά εται ότι Q 2σ Q 1. Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 75

100 Αλγόριθμος Επέκτασης Ερωτημάτων Η περίπτ ση που το αξί μα I είναι της μοφής y.p (y, x) A(x) είναι συμμετρική με την προη ούμενη. 2. Εάν α = P (x, y) και το I είναι της μορφής S(x, y) P (x, y), τότε β = S(x, y), ενώ το α 0 είναι της μορφής P (u, v) με {u x, v y} θ. Τότε, το I είναι επίσης εφαρμόσιμο στο Q 2 και η εφαρμο ή του έ ει ς αποτέ εσμα τη δημιουρ ία του Q 2 με S(u, v) Q 2, ενώ ια σ := θ έ ουμε S(x, y) Q 2σ που συνεπά εται ότι Q 2σ Q 1. Η περίπτ ση όπου το I είναι της μορφής S(y, x) P (x, y), είναι συμμετρική. 3. Εάν α = P (x, y), η y είναι μη-δεσμευμένη στο Q 1, και το I είναι της μορφής C(x) y.p (x, y) με την C να είναι μια DL-Lite R -έννοια, τότε β = C(x) και α 0 = P (u, v) με {u x, v y} θ. Εάν η v είναι επίσης μη-δεσμευμένη στο Q 2, τότε το I είναι εφαρμόσιμο στο Q 2 και ια το Q 2 το αποτέ εσμα α περιέ ει το A(u) Q 2. Συνεπώς, ια σ := θ α έ ουμε A(x) Q 2σ και επίσης Q 2σ Q 1. Εάν η v είναι δεσμευμένη στο Q 2 αυτό συνεπά εται ότι υπάρ ει κάποιο ά ο άτομο α 2 στο Q 2 στο οποίο αναφέρεται η v. Το α 2 δεν μπορεί να είναι μια έννοια της μορφής A(v) επειδή εξαιτίας του Q 2 θ Q 1 α εί αμε ότι A(v)θ = A(y) Q 1 και συνεπώς η y α ήταν δεσμευμένη στο Q 1 ε ονός που α οδη ούσε σε αντίφαση ( α εμφανιζόταν και στα A(y) και P (x, y)). Άρα, το α 2 πρέπει να είναι άτομο ρό ου. Όμ ς, το α 2 δεν μπορεί να είναι της μοφής P (v, z), ια μια οποιαδήποτε μετα ητή z κα ώς τότε, πά ι η Q 2 θ Q 1 συνεπά εται ότι P (v, z)θ = P (y, zθ) Q 1 και συνεπώς η y α ήταν δεσμευμένη στο Q 1. Η μόνη πι ανή περίπτ ση είναι το α 2 να είναι της μορφής P (z, v) με z x θ (πά ι εάν η z αντιστοι ηστεί σε μια μετα ητή διάφορη της x, αυτό α συνεπα όταν ότι το Q 1 έ ει δύο ρό ους που έ ουν την y σαν δεύτερο όρισμα και η y α ήταν δεσμευμένη στο Q 1 ). Συνεπώς, έ ουμε α 0 θ = P (u, v)θ = P (z, v)θ = a 2 θ, που συνεπά εται ότι τα δύο άτομα ενοποιούνται. Έστ τώρα η αντικατάσταση σ 1 := {z u}. Όπ ς έ ει αναφερ εί προη ουμέν ς, η θ αντίστοι εί τόσο την z όσο και την u στην x, συνεπώς, ια την ορισμένη αντικατάσταση σ 1 έ ουμε Q 2 σ 1 θ = Q 2 θ και άρα το Q 2 σ 1 υπά ει επίσης το Q 1. Συνεπώς, ό ες οι προη ούμενες συν ήκες εφαρμόζονται στο Q 2 σ 1 δη αδή, είτε το Q 2 σ 1 υπά ει το Q 1, είτε το I είναι εφαρμόσιμο στο Q 2 σ 1 και το αποτέ εσμα υπά ει το Q 1. Εάν δεν ισ ύει τίποτα από αυτά τότε πά ι το άτομο P (z, v) με z z πρέπει να υπάρ ει στο Q 2 σ 1, έτσι ώστε να ενοποιείται με το P (u, v) και η σ 2 μπορεί να κατασκευαστεί έτσι ώστε το Q 2 σ 1 σ 2 να υπά ει το Q 1. Εφόσον υπάρ ει πεπερασμένος αρι μός ατόμ ν σε ένα ερώτημα, σε κάποιο σημείο κάποια αντικατάσταση λ := {z i u i 1} α υπάρ ει τέτοια ώστε το I να είναι εφαρμόσιμο στο Q 2 λ και το αποτέ εσμα α υπά ει το Q 1. Αξίζει επίσης να σημει εί ότι κά ε αντικατάσταση σ i είναι ανεξάρτητη και συνεπώς μπορούν να εφαρμοστούν με οποιαδήποτε σειρά στο Q Εάν α = P (y, x), η y είναι μη-δεσμευμένη στο Q 1, και το I είναι της μορφής C(x) yp (y, x), τότε β = C(x) και α 0 = P (v, u) με {v y, u x} θ. Ακο ου ώντας μια αντίστοι η συ ο ιστική με την προη ούμενη περίπτ ση 76 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

101 Κεφάλαιο 4. Βελτιστοιποίηση Επανεγγραφής Ερωτημάτων μέσω της Επέκτασης με Άτομα μπορούμε να συμπεράνουμε ότι, είτε η v είναι επίσης μη-δεσμευμένη στο Q 2 και άρα το I είναι εφαρμόσιμο στο Q 2 και το αποτέ εσμα υπά ει το Q 1, είτε δεν είναι και σε αυτή την περίπτ ση μια ίστα ατόμ ν P (v, z i ) υπάρ ει έτσι ώστε ια λ := {z i u}, το I να είναι εφαρμόσιμο στο Q 2λ και το αποτέ εσμα να υπά ει το Q 1. Όπ ς έ ει εξη η εί ήδη στην Ενότητα 4.1, το ήμα μεί σης εί ε εισα εί επειδή ένα αξί μα I μπορεί να είναι εφαρμόσιμο μόνο σε μια μεί ση Q ενός ΣΕ Q. Παρό α αυτά, είναι ευρέ ς ν στό ότι εάν το Q αποτε εί μεί ση του Q, τότε το Q υπά ει το Q. Συνεπώς, εάν κάποιο αξί μα I είναι εφαρμόσιμο στο Q α ά ό ι στην Q, το Λήμμα υπα ορεύει ότι μόνο ένας περιορισμένος τύπος μεί σης πάν σε άτομα στο Q (το περιορισμένο ήμα μεί σης) είναι ικανός να εξασφα ιστεί ένα ΣΕ στο οποίο να είναι εφαρμόσιμο το I. Οι μειώσεις αυτές είναι εκείνες ακρι ώς οι μειώσεις που ρησιμοποιούνται ια να αποφασίσουμε εάν ένα ερώτημα από το R α μπορεί να συ νευ εί με ένα ερώτημα στην επανε ραφή αναφοράς. Έστ ένα ΣΕ Q, ένα TBox T, ένα άτομο α, ένας ράφος επανε ραφής G ια τα Q, T και ένας ράφος G α που υπο ο ίζεται με ρήση του Α ορί μου 9 στην ραμμή 1. Έστ επίσης ότι R Q είναι η επανε ραφή ΣΣΕ που υπο ο ίζεται με ρήση του προτότυπου α ορί μου PerfectRef ια τα bd(q) {α} hd(q), T. Για να δείξουμε ότι το περιορισμένο μήμα μεί σης είναι σ στό, ε ονός που συνεπά εται και ότι ο Α όρι μος 8 είναι σ στός α ρησιμοποιήσουμε επα ή στον αρι μό τ ν ημάτ ν ια τα οποία έ ει εκτε εστεί ο α όρι μος PerfectRef ια τα bd(q) {α} hd(q), T. Για παράδει μα, έστ ότι R i R Q είναι η επανε ραφή ΣΣΕ που υπο ο ίζεται στο ήμα i and that for every Q i R i υπάρ ουν κάποιο Q h στο G και κάποιο Q α στον G α τέτοια ώστε bd(q h ) bd(q α κ) Q A (nv), όπου κ = m(q h ) και το nv = avar(q h ) (var(q α κ) avar(q)) υπά ει το Q i. Έστ ότι στο ήμα i + 1 κάποιο αξί μα I εφαρμόζεται στο Q i παρά οντας το Q i+1. Από το Λήμμα έ ουμε ότι είτε το I είναι εφαρμόσιμο στο bd(q h ) bd(q α κ) Q A (nv) και το αποτέ εσμα υπά ει το Q i+1 ή ότι μια σειρά από περιορισμένα ήματα μεί σης είναι εφαρμόσιμα. Στην πρώτη περίπτ ση το I είτε είναι εφαρμόσιμο σε κάποιο άτομο στο Q h παρά οντας κάποιο ερώτημα Q h ια το οποίο α έ ουμε Q h, Q h G ή το I είναι εφαρμόσιμο στο Q α κ. Συνεπώς, στην πρώτη περίπτ ση έ ουμε ότι κάποιο Q h στο G τέτοιο ώστε bd(q h ) bd(q ακ) Q A (nv) υπά ει το Q i+1. Στην δεύτερη περίπτ ση η ύπαρξη κάποιου ερ τήματος Q α στον G α έτσι ώστε Q α, Q α G α και το bd(q h ) bd(q ακ) Q A (nv) να υπά ει το Q i+1 προκύπτει από το παρακάτ ήμμα. Λήμμα Έστω Q ΣΕ που περιέχει ακριβώς ένα άτομο στο σώμα του και έστω κ αντικατάσταση έτσι ώστε κάποιο αξίωμα I να είναι εφαρμόσιμο στο Qκ παράγοντας το Q. Τότε το I είναι επίσης εφαρμόσιμο και στο Q και για το αποτέλεσμα Q έχουμε Q κ = Q (μόντουλο τη μετονομασία των νέων μεταβλητών). Απόδειξη: Εάν η κ δεν α άζει κάποια από τις μετα ητές του Q τότε η ιδιότητα αυτή προκύπτει τετριμένα. Εάν α άζει, τότε δεί νουμε την ιδιότητα αυτή παρουσιάζοντας μια ανά υση περιπτώσε ν ια τη μορφή του Q. Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 77

102 Αλγόριθμος Επέκτασης Ερωτημάτων 1. Το Q είναι της μορφής A(x) Q A (x). Τότε, η κ μπορεί να είναι της μορφής {x y}. Διακρίνουμε τις παρακάτ περιπτώσεις ανά ο α με την μορφή του I: (αʹ) Εάν το I είναι της μορφής C(x) A(x), τότε Q = C(y) Q A (y), ενώ το I είναι επίσης εφαρμόσιμο στο Q και το αποτέ εσμα είναι Q = C(x) Q A (x), οπότε προφανώς Q κ = Q. ( ʹ) Εάν το I είναι της μορφής y.r(x, y) A(x), τότε Q = R(y, z 1 ) Q A (y) και Q = R(x, z 2 ) Q A (x), ια z 1, z 2 νέες μετα ητές, και πά ι Q κ = Q. 2. Το Q είναι της μορφής R(x, y) Q A (x). Τότε έ ουμε τις παρακάτ περιπτώσεις ανά ο α με τη μορφή του I: (αʹ) Εάν το I είναι της μορφής C(x) y.r(x, y), τότε η κ δεν μπορεί να αντιστοι ήσει την y στην x (και αντίστροφα), επειδή κάτι τέτοιο α έκανε την x (y) δεσμευμένη στο Qκ. Συνεπώς η κ (πι ανότατα) αντιστοι εί την x και/ή την y σε διαφορετικές μετα ητές. Σε κά ε περίπτ ση Q = C(xκ) Q A (xκ). Προφανώς, το I είναι εφαρμόσιμο στο Q και πά ι όπ ς στην περίπτ ση 1. μπορούμε να εξά ουμε ότι Q κ = Q. ( ʹ) Εάν το I είναι της μορφής P (x, y) R(x, y) και η κ είναι όπ ς στην προη ούμενη περίπτ ση, τότε ο ισ υρισμός προκύπτει με παρόμοια επι- ειρηματο ο ία. Παρό α αυτά, η κ μπορεί να είναι της μορφής {y x} (ή {x y}). Τότε, Q = P (x, x) Q A (x) (ή Q = P (y, y) Q A (y)). Προφανώς, το I είναι επίσης εφαρμόσιμο στο Q και το αποτέ εσμα είναι το Q = P (x, y) Q A (x) ια το οποίο Q κ = P (x, x) Q A (x) (ή Q κ = P (y, y) Q A (y)). Σε κά ε περίπτ ση Q κ = Q. 3. Το Q είναι της μορφής R(x, y) Q A (x, y) και το I είναι της μορφής P (x, y) R(x, y). Η περίπτ ση αυτή είναι παρόμοια με την 2 ʹ. Τέ ος, το εώρημα που ακο ου εί δεί νει την ορ ότητα και την π ηρότητα του α ορί μου. Η απόδειξη που δίνεται στη συνέ εια αποτε εί μια συστηματική με έτη ό ν τ ν περιπτώσε ν που έ ουν αναφερ εί προη ούμενα. Θεώρημα Έστω Q ΣΕ, έστω T DL-Lite R -TBox, έστω α άτομο έτσι ώστε var(α) var(q) και έστω G γράφος επανεγγραφής για τα Q, T που είναι κλειστός ως προς την αναδιατύπωση για τα Q, T. Έστω G ο γράφος που επιστρέφεται από τον Αλγόριθμο 9 όταν σε αυτόν δίνονται ως είσοδος τα G, α και T. Τότε ο G είναι ένας γράφος επανεγγραφής για τα bd(q) {α} hd(q), T που είναι κλειστός ως προς την αναδιατύπωση για τα bd(q) {α} hd(q), T. Απόδειξη: Πρώτα απ ό α πρέπει να τονίσουμε ότι ο Α όρι μος ex-perfectref επεκτείνει τον Α όρι μο PerfectRef, συνεπώς ια ένα δεδομένο ερώτημα Q και ένα DL-Lite R -TBox T υπο ο ίζει ένα ράφο επανε ραφής ια τα Q, T. Επιπρόσ ετα, εφόσον ο PerfectRef εφαρμόζει εξαντ ητικά τα ήματα της αναδιατύπ σης και μεί σης και δεν κ αδεύει τα υπο ο ισμένα ερ τήματα, το αποτέ εσμα του επεκτεταμένου α ορί μου είναι κ ειστό ς προς την αναδιατύπ ση. 78 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

103 Κεφάλαιο 4. Βελτιστοιποίηση Επανεγγραφής Ερωτημάτων μέσω της Επέκτασης με Άτομα Έστ ότι ο ράφος επανε ραφής G = R Q, H, m είσοδος του Α ορί μου 9 και έστ ότι ο ράφος επανε ραφής G = R Q, H, m είναι η έξοδος του. Επιπ έον, ια τη συνέ εια της απόδειξης, έστ ότι jv = var(α) avar(q), έστ ότι ο ράφος G α = R α, H α, m α είναι ο ράφος επανε ραφής που υπο ο ίζεται από τον Α όρι μο 9 στη ραμμή 1, και έστ ότι ο G i είναι ένας ράφος επανε ραφής που υπο ο ίζεται ύστερα από i ήματα του Α ορί μου ex-perfectref όταν αυτός εφαρμόζεται ια τα bd(q) {α} hd(q), T δη αδή, μετά την παρα ή i ερ τημάτ ν από την εφαρμο ή τ ν ημάτ ν αναδιατύπ σης και μεί σης. Η απόδειξη του ε ήματος προκύπτει από την παρακάτ ιδιότητα: ( ): Για κά ε i 0 και ια κά ε Q j στο R i υπάρ ει μια κορυφή Q h στον G και μια κορυφή Q α στον G α τέτοιες ώστε, ια κ = m(q h ) και nv = avar(q h ) (avar(q) var(q α κ)) έ ουμε canbejoined(q h, κ, jv) = αληθές, και ισ ύει μια από τις παρακάτ συν ήκες: 1. Το bd(q h ) bd(q α κ) Q A (nv) υπά ει το Q j, ή 2. ια κάποια αντικατάσταση σ mergecqs(q α κ, Q h ) υπάρ ει κάποιο ΣΕ Q ια το οποίο Q h G Q και το [ bd(q ) Q A (nv)]µ, όπου µ = buildsubst(σ, m(q )), υπά ει το Q j. Έστ τώρα ότι η Ιδιότητα ( ) ισ ύει. Θα δείξουμε ότι ο G = R Q, H, m είναι ένας ράφος επανε ραφής κ ειστός ς προς την αναδιατύπ ση ια τα bd(q) {α} hd(q), T. Πρώτα, δει νουμε ότι η R Q είναι μια επανε ραφή ΣΣΕ ια τα bd(q) {α} hd(q), T. Έστ ότι όταν ο α όρι μος PerfectRef εφαρμόζεται στα bd(q) {α} hd(q) και T τερματίζει ύστερα από n ήματα και έστ ότι η επανε ραφή που υπο ο ίζεται είναι η R n. Τότε όμ ς, από την Ιδιότητα ( ), ν ρίζουμε ότι με τον τερματισμό του Α ορί μου 9, ια κά ε ΣΕ Q n R n είτε ένα ΣΕ της μορφής bd(qh ) bd(q α κ) Q A (nv) ή ένα ΣΕ της μορφής [ bd(q ) Q A (nv)]µ που υπά ει το Q n έ ει προστε εί στο R Q. Επιπ έον, οι συναρτήσεις canbejoined, buildsubst, και η συν ήκη dom(σ) var(q ) dom(m(q )) εξασφα ίζουν ότι κά ε ΣΕ που παρά εται από τον α όρι μο μας μπορεί να παρα εί επίσης και από τον α όρι μο PerfectRef. Συνεπώς, το σύνο ο R Q είναι ορ ό και π ήρες, και άρα είναι επανε ραφή ΣΣΕ ια τα bd(q) {α} hd(q), T. Τώρα δεί νουμε ότι ο G είναι κ ειστός ς προς την αναδιατύπ ση. Αρ ικά, από τον ορισμό τ ν αντιστοι ίσε ν m (Q n) ια κά ε ΣΕ που προστί εται στον G προκύπτει ότι η m ικανοποιεί τις συν ήκες του Ορισμού Επιπ έον, κατά τον τερματισμό του α ορί μου και η σ έση H ικανοποιεί την ιδιότητα του Ορισμού Ακόμα, είναι εύκο ο να δει εί ότι ο α όρι μος α παρά ει και α ορίσει ς κόμ ο κορυφής του G το ΣΕ bd(q) {α} hd(q) με m (Q {α}) =, ενώ ια ό ους τους κόμ ους κορυφής Q i στον G α έ ουμε επίσης m(q i ) = κα ώς κ ηρονομούν την αντιστοί ιση του Q ( α αναφερ ούμε περισσότερο σε αυτό στην απόδειξη της Ιδιότητας ( ) στη συνέ εια). Επιπρόσ ετα, η H είναι κ ειστή ς προς το περιορισμένο ήμα μεί σης. Εάν ια κάποια Q h R Q, κ = m(q h ) και Q α R α έ ουμε κάποια σ mergecqs(q α κ, Q h ), τότε ο α όρι μος προσ έτει πρώτα το Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 79

104 Αλγόριθμος Επέκτασης Ερωτημάτων Q + = bd(q h ) bd(q α κ) Q A (nv) στον G ( ραμμή 13) και στη συνέ εια προσ έτει την π ειάδα Q +, [ bd(q h ) Q A (nv)]σ στον G ( ραμμή 15). Στη συνέ εια, αντι ράφει τον υπο- ράφο της H κάτ από το Q h, α ά η H είναι επίσης κ ειστή ς προς την αναδιατύπ ση. Η μόνη ενδιαφέρουσα περίπτ ση είναι ια κάποιο ερώτημα Q ια το οποίο Q h G Q και έ ουμε z x σ και z x m(q ). Η τε ευταία σ έση συνεπά εται ότι υπάρ ει Q τέτοιο ώστε Q, Q H και R(x, y), R(z, y) είναι άτομα στο Q ενώ Q = Q {z x }, ήτοι, κά ε εμφάνιση της μετα ητής z στο Q έ ει ανιστοι ηστεί στην x. Στη νέα σ έση H, ο α όρι μος α περιέ ει το ερώτημα Q σ, δη αδή, το Q σ α περιέ ει τα άτομα R(x, y), R(x, y) αντί τ ν R(x, y), R(z, y), δη αδή, η z α ε ει αντιστοι ηστεί στην x. Στη συνέ εια, ένα παιδί του Q σ πρέπει να κατασκευαστεί. Για να είναι κ ειστή ς προς την αναδιατύπ ση η H, το παιδί α πρέπει να είναι ένα ερώτημα όπου τώρα η x, και ό ι η z, α αντιστοι εί στην x. Αυτό πρα ματοποιείται με τη συνάρτηση buildsubst. Πιο συ κεκριμένα, εφόσον z x σ και z x m(q ), η συνάρτηση επιστρέφει μια αντιστοί ιση µ που περιέ ει την z x και την x x που εφαρμόζεται στο Q παρά οντας έτσι το κατά η ο ερώτημα. Συνεπώς, ο ράφος G είναι κ ειστός ς προς την αναδιατύπ ση ια τα bd(q) {α} hd(q), T. Τώρα, δίνουμε την απόδειξη ια την Ιδιότητα ( ). Για να δείξουμε αυτή την ιδιότητα ρησιμοποιούμε επα ή πάν στον αρι μό τ ν ημάτ ν i τα οποία ο α όρι μος ex-perfectref έ ει ο οκ ηρώσει όταν εφαρμόζεται ια τα bd(q) {α} hd(q), T. Για ένα ΣΕ Q α ρησιμοποιούμε την έκφραση m Q ια να αναφερ ούμε στην αντιστοί ιση m(q). Βασική Περίπτωση (i = 0): Από τη μια π ευρά, όταν ο α όρι μος ex-perfectref εφαρμόζεται στα bd(q) {α} hd(q), T, στο ήμα 0 αρ ικοποιεί ένα σύνο ο R 0 με την κορυφή bd(q) {α} hd(q). Από την ά η π ευρά, στην ραμμή 1 ο Α όρι μος 9 υπο ο ίζει τον G α ια το Q α = α Q A (var(α) var(q)) και το T με τη ρήση του ex-perfectref και συνεπώς του ά ιστον περιέ ει το Q α ς κορυφή. Επιπ έον, εφόσον ο G είναι κ ειστός ς προς την αναδιατύπ ση ια τα Q, T, τότε το Q εμφανίζεται ς κόμ ος κορυφής στον G με m Q =. Συνεπώς, από την κατασκευή τ ν Q α και jv έ ουμε ότι canbejoined(q, m Q, jv) = αληθές και επίσης το bd(q) bd(q α m q ) Q A (nv) είναι το bd(q) {α} hd(q). Συνεπώς, η συν ήκη 1. ικανοποιείται και άρα ια το ήμα i = 0 η Ιδιότητα ( ) ικανοποιείται. Βήμα Επαγωγής: Υπο έτουμε ότι η Ιδιότητα ( ) ισ ύει στο ήμα i ια κά ε Q j R i. Στη συνέ εια, υπο έτουμε ότι στο ήμα i + 1 ο α όρι μος παρά ει το σύνο ο R i+1 εφαρμόζοντας είτε ένα ήμα αναδιατύπ σης είτε ένα ήμα μεί σης σε κάποιο ερώτημα Q j στο R i παρά οντας το ερώτημα Q i+1. Επιπ έον, από την υπό εση της επα ής, υπάρ ουν κορυφές Q h στον G και Q α στον G α τέτοιες ώστε να ικανοποιείται η Ιδιότητα ( ) δη αδή, ια κ = m Qh, έ ουμε canbejoined(q h, κ, jv) = αληθές και είτε το ερώτημα bd(q h ) bd(q α κ) Q A (nv) (που α κα είται Q + στην συνέ εια) υπά ει το Q j, ή ια κάποια αντικατάσταση σ mergecqs(q α κ, Q h ) και κάποιο Q τέτοιο ώστε Q h G Q, έ ουμε ότι [ bd(q ) Q A (nv)]µ (που α κα είται Q m στη συνέ εια) υπά ει το Q j. Διακρίνουμε τώρα δύο περιπτώσεις ανά ο α με το εάν το Q i+1 έ ει παρα εί από ένα ήμα αναδιατύπ σης ή από ένα ήμα μεί σης. Εάν εφαρμόστηκε στο Q j ένα ήμα μεί σης ια να παρα εί το Q i+1, τότε είναι 80 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

105 Κεφάλαιο 4. Βελτιστοιποίηση Επανεγγραφής Ερωτημάτων μέσω της Επέκτασης με Άτομα ν στό από τις ιδιότητες της μεί σης ότι το ερώτημα Q j υπά ει το Q i+1. Συνεπώς, από την μετα ατικότητα της σ έσης υπα ής και την υπό εση της επα ής το Q i+1 υπά εται είτε από το Q + είτε από το Q m. Συνεπ ς, η Ιδιότητα ( ) ικανοποιείται. Διαφορετικά, έστ ότι στο Q j εφαρμόστηκε ένα ήμα αναδιατύπ σης ια την παρα ή του Q i+1. Αυτό συνεπά εται ότι κάποιο αξι μα I εφαρμόζεται σε κάποιο άτομο του σώματος του Q j παρά οντας το Q i+1. Από την υπό εση της επα ής, είτε το Q + ή το Q m υπά ει το Q j. Εάν οποιοδήποτε από τα δύο αυτά ερ τήματα Q i+1, τότε η Ιδιότητα ( ) ικανοποιείται. Εάν κανένα από τα δύο ερ τήματα δεν υπά ει το Q i+1, τότε από το Λήμμα 4.2.3, είτε (i) το I είναι εφαρμόσιμο σε αυτά και το αποτέ εσμα υπά ει το Q i+1 ή (ii) ια n 1 υπάρ ουν άτομα της μορφής P (u, v), P (z i, v) ή P (v, u), P (v, z i ) στο Q + ή στο Q m έτσι ώστε ια λ = {z i u 1 i n}, το Q + λ ή το Q m λ υπά ει το Q j, το I είναι εφαρμόσιμο στο Q + λ ή στο Q m λ και το αποτέ εσμα υπά ει το Q i+1. Εξετάζουμε τώρα ξε ριστά τις περιπτώσεις που το Q + ή το Q m υπά ουν το Q j. 1. Έστ ότι το Q + υπά ει το Q j και επίσης ότι ισ ύει η περίπτ ση (i) από πάν δη αδή, το I είναι εφαρμόσιμο στο Q + = bd(q h ) bd(q α κ) Q A (nv). Εφόσον η αναδιατύπ ση εφαρμόζει κά ε φορά ένα αξί μα σε ένα μόνο άτομο του σώματος ενός ερ τήματος, αυτό συνεπά εται ότι το I είτε είναι εφαρμόσιμο σε κάποιο άτομο του Q h και από αυτή την εφαρμο ή παρά εται ένα ΣΕ της μορφής bd(q h ) bd(q ακ) Q A (nv), ή είναι εφαρμόσιμο σε κάποιο άτομο του Q α κ και το αποτέ εσμα είναι ένα ΣΕ της μορφής bd(q h ) bd(q α) Q A (nv). (Σημειώνουμε ότι το ήμα αναδιατύπ σης δεν α άζει τις διακεκριμένες μετα ητές του ερ τήματος) Στην πρώτη περίπτ ση, εφόσον το I είναι εφαρμόσιμο στο Q h παρά οντας το Q h, το Q h είναι μια κορυφή στον G και ο G είναι κ ειστός ς προς την αναδιατύπ ση, τότε Q h, Q h H με m Q = κ και avar(q h) = avar(q h h ). Επιπ έον, canbejoined(q h, m Q, jv) = αληθές. Αυτό προκύπτει από το ε ονός ότι το I h είναι εφαρμόσιμο στο bd(q h ) bd(q α κ) Q A (nv), συνεπώς η εφαρμο ή του μπορεί να αφαιρέσει μόνο μετα ητές που δεν εμφανίζονται στο Q α κ. Συνεπώς, η συν ήκη 1. ικανοποιείται και άρα το ίδιο και η Ιδιότητα ( ). Με ετάμε τώρα την περίπτ ση όπου το I είναι εφαρμόσιμο στο Q α κ: Αρ ικά, υπεν υμίζουμε ότι το Q α περιέ ει ακρι ώς ένα άτομο στο σώμα του, κάτι το οποίο προκύπτει ευ έ ς από το ε ονός ότι το ερώτημα ια το οποίο κατασκευάζεται ο G α υπο- ο ίζεται από ένα μόνο άτομο και από το ε ονός ότι ο α όρι μος PerfectRef παρά ει πάντα ερ τήματα που περιέ ουν το πο ύ τον ίδιο αρι μό ατόμ ν με το ερώτημα από το οποίο παρά ονται. Άρα, από το Λήμμα 4.2.4, το I είναι επίσης εφαρμόσιμο και στο Q α και ια το αποτέ εσμα Q α έ ουμε Q ακ = Q α. Επειδή όμ ς Q α R α και ο G α είναι κ ειστός ς προς την αναδιατύπ ση, τότε Q α R α. Συνεπώς, και πά ι η συν ήκη 2. ικανοποιείται άρα και η Ιδιότητα ( ). Έστ τώρα ότι έ ουμε την περίπτ ση (ii) από πάν ήτοι, ια n 1 υπάρ- ουν άτομα της μορφής P (u, v), P (z i, v) ή της μορφής P (u, v), P (z i, v) στο Q + τέτοια ώστε λ = {z i u 1 i n}, το I είναι εφαρμόσιμο στο Q + λ = bd(q h λ) bd(q α κ λ) Q A (nvλ) και το νέο ΣΕ που παρά εται Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 81

106 Αλγόριθμος Επέκτασης Ερωτημάτων από την εφαρμο ή του I στο Q + λ, που ονομάζεται Q f, υπά ει το Q i+1. Θα δείξουμε τώρα π ς ο α όρι μος μας μπορεί να παρά ει τα ερ τήματα Q + λ και Q f. Πρώτα σημειώνουμε ότι η ύπαρξη στο Q + τ ν ατόμ ν στην παραπάν μορφή συνεπά εται ότι μια σειρά από περιορισμένα ήματα μεί σης είναι εφαρμόσιμα ανάμεσα στα άτομα P (z i, v) και το άτομο P (u, v) στο Q j. Επιπ έον, εφόσον το Q α κ περιέ ει μόνο ένα άτομο, οι μειώσεις αυτές είναι εφαρμόσιμες είτε ανάμεσα σε δύο άτομα του Q h ή ανάμεσα σε ένα άτομο του Q h και το άτομο (q α ) κ. Στην πρώτη περίπτ ση, η εφαρμο ή μιας τέτοιας μεί σης α εί ε ς αποτέ εσμα την παρα ή του ΣΕ bd(q h λ i ) bd(q α κ λ i ) Q A (nvλ i ). Εφόσον ο ράφος G είναι κ ειστός ς προς την αναδιατύπ ση και από τη μορφή αυτών τ ν μειώσε ν ισ ύει επίσης Q h, Q h G, με Q h = Q hλ i και m Q h = κ λ i, άρα, canbejoined(q h, m Q, jv) = αληθές. Εάν καμία από αυτές τις h μειώσεις δεν εφαρμόζεται ανάμεσα στα Q α κ και Q h, τότε ια την λ που έ ει οριστεί όπ ς προη ούμενα α έ ουμε Q h G Q h λ με m Qh λ = κ λ και άρα επίσης canbejoined(q h λ, m Qh λ, jv) = αληθές. Τότε, το αξί μα I είναι εφαρμόσιμο στο Q h λ και εφόσον ο G είναι κ ειστός ς προς την αναδιατύπ ση έ ουμε επίσης Q h λ, Q H και m Q = m Qh λ. Τέ ος, το bd(q ) bd(q α m Q ) Q A (nv ) ια nv = avar(q ) (avar(q) var(q α )m Q )) είναι το Q f και υπά ει το Q i+1, συνεπώς η Ιδιότητα ( ) ικανοποιείται. Έστ τώρα ότι ια κάποιο k n, το Q α κ περιέ ει το άτομο P (z k, u) και ένα ήμα μεί σης περι αμ άνει το Q α κ και τα άτομο από το Q h. Στην περίπτ ση αυτή εφόσον το Q α κ περιέ ει ένα άτομο η μεί ση αυτή στην πρα ματικότητα εξα είφει το άτομο αυτό από το Q + και συνεπώς το Q + λ k είναι της μορφής bd(q h λ k ) Q A (avar(q)λ k ). Συνεπώς, εφαρμόζοντας τις υπό οιπες μειώσεις το τε ικό ΣΕ Q + λ α είναι της μορφής bd(q h λ) Q A (avar(q)λ) και το Q f μπορεί να παρα εί εφαρμόζοντας το I σε αυτό το ΣΕ. Εφόσον τώρα, ο G είναι κ ειστός ς προς την αναδιατύπ ση ό ες οι μειώσεις εκτός από αυτή με την λ k έ ουν εφαρμοστεί σε ερ τήματα στον G ξεκινώντας από το Q h, συνεπώς υπάρ ει ένα ΣΕ Q h ν, με ν = λ\λ k στον G τ.. Q h G Q h ν. Επιπ έον, εφόσον το Q h ν δεν περιέ ει το άτομο που υπάρ ει στο Q α κ το I είναι εφαρμόσιμο σε αυτό και συνεπώς Q h ν, Q H. Τότε, από τον ορισμό της συνάρτησης mergecqs, έ ουμε ότι η αντικατάσταση mergecqs(q α ν, Q h ν) περιέ ει την {λ k }. Άρα, το ΣΕ Q λ k είναι στην πρα ματικότητα το Q f που υπά ει το Q i+1 οπότε η Ιδιότητα ( ) ικανοποιείται και πά ι. 2. Έστ ότι το Q m, δη αδή το [ bd(q ) Q A (nv)]µ όπου Q h G Q, με µ = buildsubst(σ, m(q )) και σ mergecqs(q α κ, Q h ) υπά ει το Q j. Και πά ι, από το Λήμμα έ ουμε ότι είτε το I είναι εφαρμόσιμο στο Q m και το αποτέ εσμα (έστ Q f ) υπά ει το Q i+1 ή επιπ έον περιορισμένa ήματα μεί σης είναι εφαρμόσιμα στο Q m παρά οντας ένα ΣΕ στο οποίο το I είναι εφαρμόσιμο και το αποτέ εσμα (έστ και πά ι Q f ) υπά ει το Q i+1. Εφόσον Q m(q ) = Q και εφόσον η µ κατασκευάζεται από την σ και την m(q ), το [ bd(q ) Q A (nv)]µ είναι όπ ς το Q α ά πι ανότατα με κάποια μετα ητή z var(q ) που έ ει μετονομαστεί ό κάποιας αντιστοί ισης z y σ. Επιπ έον, 82 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

107 Κεφάλαιο 4. Βελτιστοιποίηση Επανεγγραφής Ερωτημάτων μέσω της Επέκτασης με Άτομα εφόσον το [ bd(q ) Q A (nv)]µ δεν αναφέρει την z (έ ει μετονομαστεί ό της µ ), τότε κανένα από τα παραπάν ήματα (εφαρμο ή του I ή περιορισμένα ήματα μεί σης) δεν αφορούν την z. Τώρα, ό της µ το Q έ ει ι ότερες δεσμευμένες μετα ητές απο ότι το [ bd(q ) Q A (nv)]µ ή η µ ε ευ ερώνει μια δεσμευμένη μετα ητή που δεν είναι ε εύ ερη στο Q κάνοντας έτσι κάποιο αξί μα εφαρμόσιμο. Στην πρώτη περίπτ ση (το Q έ ει ι ότερες δεσμευμένες), η ίδια ακο ου ία ημάτ ν αναδιατύπ σης ή περιορισμέν ν ημάτ ν μεί σης όπ ς στο Q m είναι του ά ιστον εφαρμόσιμα στο Q. Εφόσον αυτά δεν αφορούν τη μετα ητή z, ύστερα από την εφαρμο ή τους, ένα ΣΕ Q τ.. [ bd(q ) Q A (nv)]µ = Q f, όπου παρά εται η µ = buildsubst(σ, m(q )), κα ώς η µ που παρά εται από την σ α εκτε έσει τις ίδιες μετονομασίες μετα ητών στην z. Επιπ έον, εφόσον ο G είναι κ ειστός ς προς την αναδιατύπ ση το Q ανήκει στον G. Θε ρούμε τώρα την δεύτερη περίπτ ση, ότι δη αδή, η µ ε ευ ερώνει μια δεσμευμένη μετα ητή στο Q. Κάτι τέτοιο συνεπά εται ότι η µ επά ει μια αντιστοί ιση {z x} που ε ευ ερώνει κάποια δεσμευμένη μετα ητή στο Q. Συνεπώς, ένα περιορισμένο ήμα μεί σης με ενοποιητή την σ = {z x} είναι εφαρμόσιμο και εφόσον ο G είναι κ ειστός ς προς την αναδιατύπ ση α έ ουμε ότι Q, Q σ H. Στη συνέ εια, η ίδια ακο ου ία ημάτ όπ ς στο Q m είναι εφαρμόσιμα στο Q σ. Άρα και πά ι, έ ουμε ένα ερώτημα Q τέτοιο ώστε [ bd(q ) Q A (nv)]µ = Q f, όπου η µ = buildsubst(σ, m(q )) παρά εται στον G. Σε κά ε περίπτ ση η Ιδιότητα ( ) ικανοποιείται. Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 83

108 Αλγόριθμος Επέκτασης Ερωτημάτων 84 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

109 Κεφά αιο 5 Επαυξητική Επανε ραφή Ερ τημάτ ν Στο προη ούμενο κεφά αιο δείξαμε πώς μπορούμε, έ οντας μια DL-Lite R οντο- ο ία, ένα ΣΕ, μια επανε ραφή ΣΣΕ ια το ερώτημα αυτό και ένα νέο άτομο, να κατασκευάσουμε μια επανε ραφή ΣΣΕ ια το νέο άτομο και στη συνέ εια να την ενώσουμε με αυτή του αρ ικού ερώτηματος έτσι ώστε να παρά ουμε μια επανε ραφή ΣΣΕ ια το ερώτημα που προκύπτει με την έν ση του αρ ικού ερ τήματος και του ατόμου. Η διαδικασία αυτή υποδη ώνει ότι μπορεί να κατασκευαστεί ένας επαυξητικός α όρι μος επανε ραφής ερ τημάτ ν ια DL-Lite R -TBox εάν ια κά ε άτομο του ερ τήματος κατασκευαστεί μια επανε ραφή και αυτές στη συνέ εια συνδυαστούν με κατά η ο τρόπο. Ένα τέτοιο α όρι μο παρουσιάζουμε στην ενότητα 5.1. Στην συνέ εια, στην ενότητα 5.2 παρουσιάζουμε μια σειρά από ε τιστοποιήσεις που οη- ούν τον α όρι μο μας να παρά ει μια επανε ραφή ΣΣΕ η οποία περιέ ει όσο το δυνατόν ι ότερα περιττά ερ τήματα. Πιο συ κεκριμένα με ετάμε ε τιστοποιήσεις που αφορούν στην προσ ήκη του τε ευταίου ατόμου του ερ τήματος (ενότητα 5.2.1) κα ώς και ε τιστοποιήσεις οι οποίες μας οη άνε να ανα ν ρίσουμε ερ τήματα που α είναι (μη-)περιττά στην τε ική επανε ραφή α ά και ερ τήματα που δεν πρόκειται να υπά ουν κανένα ερώτημα από την τε ική επανε ραφή (ενότητα 5.2.2). Οι ε τιστοποιήσεις αυτές, όπ ς α φανεί και στο επόμενο κεφά αιο, εκτός από το ότι συντε ούν στο να παρα εί μια επανε ραφή ΣΣΕ με ε ά ιστα περιττά ερ τήματα, αυξάνουν σημαντικά την αποδοτικότητα του α ορί μου μας. 5.1 Α όρι μος Ο Α όρι μος 11 μπορεί να αποτε έσει τη άση ια την ανάπτυξη ενός α ορί μου παρα ής μιας επανε ραφής ΣΣΕ ια προκαθορισμένα ερ τήματα. Πιο συ κεκριμένα, δεδομένου ενός ΣΕ Q, κάποιος μπορεί να επι έξει ένα άτομο α Q, να υπο- ο ίσει τον ράφο επανε ραφής ια το ερώτημα Q 1 := α Q A (var(α) avar(q)) και το T ρησιμοποιώντας τον Α όρι μο ex-perfectref, και στη συνέ εια να τον επεκτείνει προσ έτοντας επανα ηπτικά τα υπό οιπα άτομα του ερ τήματος Q ρησιμοποιώντας τον Α όρι μο

110 Αλγόριθμος Α όρι μος 13 IncrementalRew(Q, T ) Είσοδος: Ένα ΣΕ Q και ένα DL-Lite R -TBox T. 1: Έστ S το σύνο ο από τα άτομα του σώματος του Q 2: Αφαίρεσε ένα άτομο α από το S τ.. var(α) avar(q) 3: G := ex-perfectref(α Q A (var(α) avar(q)), T ) 4: cv := var(α) 5: while S do 6: Αφαίρεσε ένα άτομο α από το S τ.. var(α ) cv 7: jv := cv var(α ) 8: G α := ex-perfectref(α Q A (jv), T ) 9: G := joingraphs(g, G α, jv, avar(q)) 10: cv := cv var(α ) 11: end while 12: return removeredundant(g) Η παραπάν ιδέα φαίνεται στον Α όρι μο 13. Ο επαυξητικός αυτός α όρι μος επι έ ει πρώτα κάποιο άτομο α τέτοιο ώστε κάποιες από τις μετα ητές του να εμφανίζονται ς διακεκριμένες μετα ητές στο ερώτημα Q ( ραμμή 2) και υπο ο ίζει έναν ράφο επανε ραφής G ια το ερώτημα α Q A (var(α) avar(q)) και το T ( ραμμή 3). Στο σημείο αυτό έ ει κατασκευαστεί ένας ράφος επανε ραφής ια ένα ερώτημα που περιέ ει μόνο το άτομο α του Q, τις μετα ητές cv := var(α) του Q και τις διακεκριμένες μετα ητές av := var(α) avar(q) του Q. Στη συνέ εια, ο α όρι μος επι έ ει ένα-ένα τα υπό οιπα άτομα και επεκτείνει τον προη ούμενα υπο ο ισμένο ράφο επανε ραφής ( ραμμές 5 11). Πιο συ κεκριμένα, στην i-οστή επανά ηψη ο α όρι μος έ ει υπο ο ίσει έναν ράφο επανε ραφής G ια ένα ερώτημα Q i (και το T ) που περιέ ει i+1 άτομα του Q, έ ει ς διακεκριμένες μετα ητές τις var(q i ) avar(q), ενώ το cv περιέ ει τις μετα ητές του Q που εμφανίζονται στο Q i. Στη συνέ εια, ο α όρι μος επι έ ει ένα άτομο α έτσι ώστε κάποιες από τις μετα ητές του να εμφανίζονται στο cv ( ραμμή 6), υπο ο ίζει έναν ράφο επανε - ραφής G α ια το ερώτημα α Q A (var(α ) cv) και το T ( ραμμή 8) και στη συνέ εια, ενώνει τον G με τον G α ρησιμοποιώντας τον α όρι μο 11 ( ραμμή 9). Τέ ος, ο α όρι μος ρησιμοποιεί τον ευρέ ς ν στό α όρι μο απα οιφής περιττών ερ τημάτ ν removeredundant (Α όρι μος 1) έτσι ώστε να αφαιρέσει ό α τα περιττά ερ τήματα ( ραμμή 12). Αξίζει να σημει εί ότι η απα οιφή τ ν περιττών ερ τημάτ ν ίνεται εφόσον το ερώτημα είναι προκα ορισμένο και ν ρίζουμε ότι δεν πρόκειται να επεκτα εί περισσότερο. Παράδει μα Έστ το TBox T από το Παράδει μα 3.4.1: Καθηγητής(x) y.διδάσκει(x, y), y.διδάσκει(y, x) Φοιτητής(x) και το ΣΕ Q = διδάσκει(x, y) Φοιτητής(y) Q A (x) 86 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

111 Κεφάλαιο 5. Επαυξητική Επανεγγραφή Ερωτημάτων που ανακτά ό α τα άτομα που διδάσκουν κάποιον φοιτητή. Ο Α όρι μος 13 ξεκινά την εκτέ εση του επι έ οντας το άτομο α = διδάσκει(x, y) από το σύνο ο S = {διδάσκει(x, y), Φοιτητής(y)}, αφού είναι το μόνο ια το οποίο ισ ύει var(α) avar(q) ( ραμμή 2). Στη συνέ εια υπο ο ίζει το ράφο επανε ραφής τ ν Q α = διδάσκει(x, y) Q A (x), T που είναι ο G = R Q, H, m ( ραμμή 3) με R Q = {Q α, Q 1α }, όπου Q 1α = Καθηγητής(x) Q A (x), H = { Q α, Q 1α } και m(q α ) = m(q 1α ) =, ενώ έτει και το σύνο ο τ ν μετα ητών cv = {x, y} ( ραμμή 4). Συνε ίζοντας ο α όρι μος εισέρ εται στον ρό ο επανά ηψης ( ραμμές 5 11). Εκεί αφαιρεί το άτομο α = Φοιτητής(y) ια το οποίο ισ ύει var(α ) cv και υπο- ο ίζει το σύνο jv = {y}. Στη συνέ εια υπο ο ίζει το ράφο επανε ραφής τ ν Q α = Φοιτητής(y) Q A (y), T που δίνεται από τον G α = R α, H α, m α ( ραμμή 8) με R α = {Q α, Q 1α }, όπου Q 1α = διδάσκει(z, y) Q A (y) ια μια νέα μετα ητή z, H α = { Q α, Q 1α } και m(q α ) = m(q 1α ) =. Στο σημείο αυτό ο α όρι μος υπο- ο ίζει τον ράφο επανε ραφής που υπο ο ίζεται από τη συνάρτηση joingraphs με ορίσματα τα G, G α, {y} και {x} ( ραμμή 9). Ο ράφος αυτός είναι ο G = R Q, H, m με R Q = {Q, Q 1, Q α, Q 1α }, όπου Q 1 = διδάσκει(x, y) διδάσκει(z, y) Q A (x), H = { Q, Q 1, Q 1, Q α, Q α, Q 1α }, και m(q) = m(q 1) = και m(q α ) = m(q 1α ) = {z x}. Τέ ος, στη ραμμή 12 ίνεται ο έ ε ος απα οιφής περιττών ερ τημάτ ν ια τον ράφο G που έ ει ς αποτέ εσμα την απα οιφή τ ν ερ τημάτ ν Q και Q 1 και την επιστροφή της επανε ραφής ΣΣΕ {Q α, Q 1α } ια τα Q, T. Θεώρημα Έστω Q ΣΕ και έστω T DL-Lite R -TBox. Όταν εφαρμόζεται στα Q και T ο Αλγόριθμος 13 τερματίζει. Έστω G γράφος που παράγεται από τον αλγόριθμο. Τότε, ο G είναι ένας γράφος επανεγγραφής για τα Q, T. Απόδειξη: Για να δείξουμε το εώρημα αυτό ρησιμοποιήσουμε επα ή στα άτομα του Q ({α 1,..., α n }) που επεξερ άζεται ο Α όρι μος 13. Βασική Περίπτωση (α = α 1 ): Όταν ο α όρι μος επεξερ άζεται το πρώτο άτομο α 1 ια το οποίο var(α 1 ) avar(q) παρά ει ένα ράφο επανε ραφής G = R Q, H, m ια το ερώτημα Q α1 = α 1 Q A (var(α 1 ) avar(q))) και το T με ρήση του α ορί μου ex-perfectref ( ραμμή 3). Ο α όρι μος αυτός έ ει αποδει εί ότι τερματίζει και ο ράφος που παρά ει είναι κ ειστός ς προς την αναδιατύπ ση εφόσον ο ex-perfectref εφαρμόζει εξαντ ητικά το ήμα αναδιατύπ σης (το ήμα μεί σης δεν εφαρμόζεται εφόσον το Q α1 έ ει μόνο ένα άτομο στο σώμα του) και δεν κ αδεύει τα υπο ο ισμένα ερ τήματα. Βήμα Επαγωγής: Υπο έτουμε ότι ο ράφος επανε ραφής G = R Q, H, m που παρά εται όταν προστί εται το άτομο α i είναι κ ειστός ς προς την αναδιατύπ ση. Με άση το Θεώρημα όταν προστε εί και το άτομο α i+1 ια το οποίο α παρα εί ο ράφος επανε ραφής G α η συνάρτηση joingraphs η οποία κα είται με ορίσματα τα G, G α, jv και av α παρά ει ένα ράφο επανε ραφής που είναι κ ειστός ς προς την αναδιστύπ ση. Επιπ έον με άση το Θεώρημα η διαδικασία αυτή τερματίζει. Στο σημείο αυτό σ ο ιάζουμε τον μέ ιστο αρι μό ΣΕ που παρά ονται από τον α όρι μο επανε ραφής μας. Εφόσον ο α όρι μος υπο ο ίζει μια επανε ραφή ΣΣΕ ο μέ ιστος αρι μός τ ν ΣΕ παρουσιάζει την ίδια πο υπ οκότητα στη ειρότερη περίπτ ση με ά α συστήματα, όπ ς το QuOnto, το Nyaya, και το Requiem, δη αδή, Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 87

112 Βελτιστοποιήσεις εκ ετική μ..τ. το μέ ε ος του ΣΕ που δίνεται ς είσοδος [85]. Λήμμα Έστω T DL-Lite TBox, έστω Q ΣΕ, και έστω G = R Q, H, m έξοδος του Αλγόριθμου 13. Τότε, το μέγιστο μέγεθος του R Q είναι O(( T Q ) Q ). Απόδειξη: Έστ m ο αρι μός τ ν εννοιών και ρό ν που εμφανίζονται στο T και n ο αρι μός τ ν ατόμ ν στο Q. Έστ επίσης R i το ΣΣΕ που υπο ο ίζεται κατά την i-1-στή επανά ηψη του ρό ου while του Α ορί μου 13. Στην επόμενη επανά ηψη, το R i+1 υπο ο ίζεται κατασκευάζοντας πρώτα ένα ράφο επανε ραφής G αi = R αi, H αi, m αi ια ένα άτομο α i του Q και στη συνέ εια ρησιμοποιώντας τα ερ τήματα του R αi και του R i ια την κατασκευή νέ ν ερ τημάτ ν είτε επεκτείνοντας, είτε συ νεύοντας. Εφόσον το ερώτημα ια το οποίο υπο ο ίζεται το R αi περιέ ει ακρι ώς ένα άτομο, τότε υπάρ ουν το πο ύ m (2 + 1) 2 διαφορετικά ερ τήματα στο R α (ο παρά οντας προκύπτει επειδή το άτομο μπορεί να είναι ρό ος οπότε υπάρ ουν δύο μετα ητές συν 1 ια πι ανές νέες μετα ητές). Στη συνέ εια, ο α όρι μος επεκτείνει τα ερ τήματα στο R i με άτομα από τα ερ τήματα στο R αi. Συνεπώς, μπορεί να παρα ούν R i m 3 2 ΣΕ από επέκταση. Επιπ έον, ο α όρι μος ε έ ει εάν ερ τήματα από το R α μπορούν να συ νευ ούν με ΣΕ υπο ο ίζοντας ό ες τις δυνατές συ νεύσεις. Για κά ε συ ώνευση, ό α τα ΣΕ στο R i που ρίσκονται κάτ από το ερώτημα που συ νεύεται αντι ράφοντα. Από τη στι μή που τα ερ τήματα στο R i έ ουν το πο ύ i άτομα (μέ ρι στι μής έ ουν επεξερ αστεί i άτομα), μπορούν να υπάρ ουν το πο ύ i R i m 3 2 ΣΕ που υπο ο ίζονται ό συ ώνευσης. Συνοψίζοντας, το R i+1 περιέ ει το πο ύ (i + 1) R i m 3 2 ΣΕ. Ανα ύοντας αναδρομικά το R i και εφόσον R 0 = R α0 μπορούμε να συμπεράνουμε ότι το R n περιέ ει το πο ύ n (n 1)... 2 m n 3 2 n ΣΕ. Εφόσον ο m είναι δεσμευμένος από τον T και ο n από τον Q έ ουμε ότι R Q = R n = O( T Q Q! 3 2 Q ) = O( T Q Q!) = O(( T Q ) Q ). 5.2 Βε τιστοποιήσεις Ένας πο ύ σημαντικός παρά οντας ια την επανε ραφή ερ τημάτ ν είναι να μπορεί να υπο ο ιστεί όσο το δυνατόν πιο αποδοτικά μια επανε ραφή και αυτό στις π είστες τ ν περιπτώσε ν σημαίνει ότι το μέ ε ος της επανε ραφής πρέπει να περιέ ει όσο το δυνατόν ι ότερα περιττά ερ τήματα. Στις ενότητες που ακο ου ούν παρουσιάζουμε διάφορες ε τιστοποιήσεις που έ ουν ς στό ο την ε τί ση της απόδοσης του Α όρι μου 13. Οι ε τιστοποιήσεις αυτές ε ουν ς στό ο να ε τιώσουν την επίδοση του, δη αδή τον ρόνο που ρειάζεται ώστε να παρά ει μια επανε ραφή. Θυμίζουμε ότι υπάρ ουν και τε νικές που έ ουν αναπτυ εί πρόσφατα οι οποίες δεί νουν π ς μπορούμε να μειώσουμε επίσης και το μέ ε ος του ΣΣΕ ρησιμοποιώντας τα δεδομένα εισόδου όταν έ ουμε τε ικά να αποτιμήσουμε την επανε ραφή [127, 131]. 88 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

113 Κεφάλαιο 5. Επαυξητική Επανεγγραφή Ερωτημάτων Βε τιστοποιώντας το Τε ευταίο Βήμα Όπ ς έ ει εξη η εί στο Κεφά αιο 4, ο Α όρ μος 11 υπο ο ίζει το καρτεσιανό ινόμενο μεταξύ τ ν ράφ ν που δίνονται ς είσοδος. Ενώ η δομή του ράφου που υπο ο ίζεται είναι σημαντική ια την περαιτέρ προσ ήκη ατόμ ν δεν είναι σημαντική μετά την επεξερ ασία του τε ευταίου ατόμου ενός προκαθορισμένου ερ τήματος ρησιμοποιώντας τον Α όρι μο 13. Συνεπώς, όταν ο Α όρι μος 13 επι έ ει το τε ευταίο άτομο του ερ τήματος εισόδου α ( ραμμή 6) μπορεί να ενερ ήσει ς εξής: Πρώτα, στη ραμμή 8 μπορεί να υπο ο ίσει μια επανε ραφή ΣΣΕ R α ια το ερώτημα α Q A (jv), ρησιμοποιώντας ια παράδει μα τον α όρι μο PerfectRef, αντί ια έναν ράφο επανε ραφής G α. Τότε, όταν ενώνει τον G και το R α μπορεί να κα έσει μια απ οποιημένη έκδοση του Α όρι μου 11 που παρά ει ένα ΣΣΕ αντί ια έναν ράφο επανε ραφής. Ο Α όρι μος 14 απεικονίζει τον απ οποιημένο αυτό α όρι μο. Σε ενικές ραμμές, ο α όρι μος αυτός προκύπτει από τον Α όρι μο 11 αφαιρώντας τον ρό ο επανά ηψης στις ραμμές και προσ έτοντας τα ερ τήματα που παρά ονται σε ένα ΣΣΕ R Q αντί σε έναν ράφο. Ένας ά ος τρόπος να ε τιώσουμε επιπ έον την αποδοτικότητα του Α όρι μου 14 είναι να ανα ν ρίσουμε περιπτώσεις που τα ερ τήματα από τον G δεν ρειάζεται να επεκτα ούν περαιτέρ με άτομα τ ν ερ τημάτ ν του R α. Η επόμενη πρόταση δεί νει ότι όταν ένα ερώτημα Q τ.. Q, Q G αντι ράφεται στο R Q ό της συ ώνευσης του Q με το Q α, τότε το Q δεν ρειάζεται να επεξερ αστεί περαιτέρ από τον α όρι μο. Πρόταση Έστω G = R Q, H, m γράφος επανεγγραφής, έστω R α ΣΣΕ, έστω nv σύνολο από μεταβλητές και έστω Q h G. Εάν υπάρχει ερώτημα Q α στο R α και αντικατάσταση λ τέτοια ώστε για κάθε {z x} mergecqs(q α λ, Q) και z var(q h ) έχουμε z var(q h ), τότε για κάθε ερώτημα Q τέτοιο ώστε Q h G Q, κάθε Q α στο R α και κάθε αντικατάσταση κ, το ΣΕ [ bd(q ) Q A (nv)]µ όπου µ = buildsubst({z x}, m(q )) υπάγει το bd(q ) bd(q ακ) Q A (nv). Απόδειξη: Έστ G = R Q, H, m ράφος επανε ραφής, R α επανε ραφή ΣΣΕ, και jv και av σύνο α από μετα ητές τα οποία δίνονται ς είσοδος στον Α όρι μο 14. Υπο έτουμε ότι ια κάποιο ερώτημα Q h που έ ει επι ε εί στην ραμμή 4, κάποιο ερώτημα Q α που έ ει επι ε εί στην ραμμή 6 και κάποια σ = {z x} mergecqs(q α λ, Q) στην ραμμή 9 ο α όρι μος προσ έτει ό α τα ΣΕ [ bd(q ) Q A (nv)]µ με Q h G Q στο R Q ( ραμμή 14). Εάν z var(q), τότε από τις ιδιότητες της αναδιατύπ σης και της μεί σης ισ ύει επίσης z var(q ) ια κά ε τέτοιο ερώτημα Q και συνεπώς καμία αντιστοί ιση της μορφής z y δεν εμφανίζεται στην m(q ). Επιπ έον, έ ουμε Q m(q ) = Q. Συνεπώς, ια κά ε τέτοιο ερώτημα Q και ια µ = buildsubst({z x}, m(q )) έ ουμε Q µ = Q και συνεπώς το [ bd(q ) Q A (nv)]µ υπά ει το bd(q ) bd(q ακ) Q A (nv) ια κά ε κ και Q α. Β έπουμε οιπόν, π ς ο Α όρι μος 14 προσ έτει στην ουρά τα ερ τήματα που προκύπτουν από ένα επι ε μένο ερώτημα Q h στη ραμμή 19 και τα επεξερ άζεται περαιτέρ μόνο εάν Σ = ή υπάρ ει {z x} Σ με z var(q h ). Διαφορετικά, Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 89

114 Βελτιστοποιήσεις Α όρι μος 14 OptimisedExtensionStep(G, u α, jv, av) Είσοδος: Ένας ράφος επανε ραφής G = R Q, H, m, μια επανε ραφή ΣΣΕ R α, και το σύνο ο τ ν μετα ητών έν σης και τ ν διακεκριμέν ν μετα ητών. 1: Αρ ικοποίησε μια ουρά Q με ένα κόμ ο κορυφής G 2: Αρ ικοποίησε ένα ΣΣΕ R Q := 3: while Q do 4: Αφαίρεσε την κεφα ή Q h της Q και έστ κ := m(q h ) 5: if canbejoined(q h, κ, jv) then 6: for all q α R α do 7: nv := avar(q h ) (var(q α κ av)) 8: Προσ εσε το Q h Q α κ Q A (nv) στο R Q 9: Σ := mergecqs(q α κ, Q h ) 10: for all σ Σ do 11: for all Q τ.. Q h G Q do 12: if dom(σ) var(q ) dom(m(q )) then 13: µ := buildsubst(σ, m(q )) 14: Πρόσ εσε το [Q Q A (nv)]µ στο R Q 15: end if 16: end for 17: end for 18: if (Σ = or {z x} Σ z var(q)) then 19: Πρόσ εσε κά ε Q τ.. Q h, Q G στην Q 20: end if 21: end for 22: end if 23: end while 24: return R Q όπ ς προκύπτει από την Πρόταση οι επεκτάσεις τέτοι ν ερ τημάτ ν οδη ούν στη δημιουρ ία ερ τημάτ ν που είναι περιττά Βε τιστοποιώντας την Απα οιφή Περιττών Ερ τημάτ ν Όπ ς έ ουμε ήδη περι ράψει (ενότητα 5.1), ο Α όρι μος 13 στη ραμμή 12 εφαρμόζει τον ν στό α όρι μο απα οιφής περιττών ερ τημάτ ν removeredundant που φαίνεται στον Α όρι μο 1. Όπ ς έ ει δει εί από διάφορες πειραματικές αξιο- ο ήσεις [116, 40], η μέ οδος αυτή συνή ς δεν αποδίδει κα ά στην πράξη, επειδή αποτε είται από δύο εμφ ευμένους ρό ους επανά ηψης πάν σε μια (πι ανότατα με ά η) υπο ο ισμένη επανε ραφή R Q.1 Πιο συ κεκριμένα, ο α όρι μος πρέπει να ε έ ει εάν κά ε ΣΕ Q 1 R Q υπά εται από κάποιο ά ο ΣΕ Q 2 R Q. Για να 1 Θυμίζουμε ότι σε μια επανε ραφή ΣΣΕ ισ ύει R D =. 90 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

115 Κεφάλαιο 5. Επαυξητική Επανεγγραφή Ερωτημάτων ε τιώσουμε την απόδοση της με όδου αυτής ο α όρι μος μας ρησιμοποιεί τρεις προσε ίσεις, όμοιες με αυτές που παρουσιάσαμε στην ενότητα 3.5 με τις οποίες προσπα εί να μειώσει το μέ ε ος τ ν συνό ν τα οποία α προσπε άσει ο α όρι μος στους ρό ους αυτούς. Έτσι, οιπόν, κατά τη διάρκεια του τρεξίματος του Α ορί μου 14 ο α όρι μος μας προσπα εί να ανα ν ρίσει ερ τήματα που εάν παρα ούν και προστε ούν στο σύνο ο R Q πρόκειται να είναι περιττά, μειώνοντας όσο το δυνατόν περισσότερο το μέ ε ος του συνό ου R Q ια το οποίο α πρέπει να εφαρμοστεί ο α όρι μος removeredundant. Επειδή όμ ς το R Q μπορεί και πά ι να είναι πο ύ με ά ο, ο α όρι μος μας στη συνέ εια προσπα εί να ανα ν ρίσει ερ τήματα που πρόκειται να είναι μη-περιττά στο σύνο ο R Q που υπο ο ίζεται, έτσι ώστε να τα αποκ είσει από τον τε ικό έ ε ο, μειώνοντας το μέ ε ος του πρώτου ρό ου της με όδου removeredundant στο σύνο ο R Q \ NR, όπου NR είναι το σύνο ο τ ν μη-περιττών ερ τημάτ ν. Τέ ος, ο α όρι μος μας προσπα εί να ανα ν ρίσει ερ τήματα που είναι μη-υπά οντα, έτσι ώστε να μπορέσει να μειώσει το μέ ε ος του δεύτερου ρό ου στο σύνο ο R Q \NS, όπου το NS περιέ ει ό α αυτά τα ερ τήματα Έ οντας ανα ν ρίσει, οιπόν, ο α όρι μος μας ερ τήματα που α είναι μη-περιττά και μη-υπά οντα στην τε ική επανε ραφή μπορεί στη συνέ εια αντί ια τον Α όρι μο 1 ια την απα oιφή τ ν περιττών ερ τημάτ ν να ρησιμοποιήσει τον ε τιστοποιημένο Α όρι μο 7. Απα οίφοντας Περιττά Ερ τήματα Η παρακάτ πρόταση παρουσιάζει δύο ιδιότητες με την ρήση τ ν οποί ν μπορούμε να ανα ν ρίσουμε εάν ένα ερώτημα που κατασκευάζεται κατά την εκτέ εση του Α ορί μου 14 α είναι περιττό στο τε ικό ΣΣΕ. Πρόταση Έστω G = R Q, H, m γράφος επανεγγραφής, έστω R α ΣΣΕ, έστω jv, av σύνολα από μεταβλητές, και έστω R Q έξοδος του Αλγόριθμου 14 όταν αυτός εφαρμόζεται στα G, R α, jv, και av. Έστω ΣΕ Q R Q τ.ω. canbejoined(q, m(q), jv) = αληθές, έστω nv σύνολο μεταβλητών που κατασκευάζεται για το Q στην γραμμή 7, και έστω πως το Q υπάγεται από κάποιο ΣΕ Q R Q. Τότε ισχύουν οι ακόλουθες ιδιότητες: (R1) Εάν bd(q ) Q A (nv) R Q, τότε το bd(q ) Q A (nv) είναι περιττό στο R Q. (R2) Εάν canbejoined(q, m(q ), jv) = αληθές, Q Q, και m(q ) = m(q), τότε για κάθε Q α R α το ΣΕ bd(q bd(q α m(q))) Q A (nv) είναι περιττό στο R Q. Απόδειξη: Η Ιδιότητα (R1) προκύπτει ευ έ ς, οπότε δεί νουμε μόνο την Ιδιότητα (R2). Πρώτα δεί νουμε ότι ια κά ε Q α R α το ΣΕ bd(q) bd(q α m(q)) Q A (nv) υπά εται από το ΣΕ bd(q ) bd(q α m(q )) Q A (nv ) όπου το nv είναι το σύνο ο τ ν μετα ητών που κατασκευάζονται ια το Q στη ραμμή 7. Πιο συ κεκριμένα, εφόσον Q Q και m(q ) = m(q) ια κά ε Q α R α έ ουμε bd(q ) Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 91

116 Βελτιστοποιήσεις bd(q α m(q )) Q A (avar(q )) bd(q) bd(q α m(q)) Q A (avar(q)). Επιπ έον, ια τους ίδιους ό ους το nv είναι ίδιο με το nv και άρα το bd(q ) bd(q α m(q )) Q A (nv ) υπά ει το bd(q) bd(q α m(q)) Q A (nv) ια κά ε Q α R α. Τώρα, εφόσον canbejoined(q, m(q ), jv) = αληθές, κατά τον τερματισμό του Α - ορί μου 14, έ ουμε ότι ια κά ε Q α R α είτε το ΣΕ bd(q ) bd(q α m(q )) Q A (nv ) έ ει προστε εί στο R Q στη ραμμή 8 ή ένα ά ο ερώτημα που το υπά ει. Σε κά ε περίπτ ση το bd(q) bd(q α m(q)) Q A (nv) είναι περιττό στο R Q. Η Πρόταση μπορεί να ρησιμοποιη εί ια την αποφυ ή της προσ ήκης περιττών ερ τημάτ ν στο αποτέ εσμα R Q όταν ο Α όρι μος 13 κα εί τον Α όρι μο 14 κατά την τε ευταία επανά ηψη. Παρό α αυτά, ια να μπορέσουμε να ε έ ξουμε εάν ισ ύουν οι Ιδιότητες (R1) και (R2) πρέπει να ν ρίζουμε τις σ έσεις υπα ής που ισ ύουν ανάμεσα στα ΣΕ στον G. Για να ανα ν ρίσουμε τις σ έσεις αυτές, πριν κα έσουμε τον Α όρι μο 14, ο Α όρι μος 13 εκτε εί τον πρ τότυπο α όρι μο υπα ής (Α όρι μος 1) ια τον G και απο ηκεύει ό ες αυτές τις σ έσεις. Αξίζει να σημει εί ότι στο σημείο αυτό δεν αφαιρούνται ερ τήματα κα ώς ο ράφος G πρέπει να είναι κ ειστός ς προς την αναδιατύπ ση έτσι ώστε ο Α όρι μος 14 να κατασκευάσει μια επανε ραφή ΣΣΕ. Επιπρόσ ετα, πρέπει να σημει εί ότι το μέ ε ος του G στο σημείο αυτό αναμένεται να είναι σημαντικά μικρότερο από το τε ικό ΣΣΕ, συνεπώς ο α όρι μος υπα ής αναμένεται να συμπεριφερ εί κα ά στην πράξη. Στη συνέ εια, ο Α όρι μος 14 ρησιμοποιεί τις ιδιότητες (R1) και (R2) ς εξής: Στη ραμμή 14, δεν προσ έτει κανένα ερώτημα [ bd(q ) Q A (nv)]σ στο R Q εάν το Q υπά εται από κάποιο ερώτημα Q στον G και το bd(q ) Q A (nv) έ ει ήδη προστε εί στο R Q. Έστ Q h ερώτημα που επι έ εται στη ραμμή 4. Εάν το Q h υπά εται από κάποιο ερώτημα Q στον G και είτε το bd(q ) Q A (nv ) έ ει ήδη προστε εί στο R Q, ή ισ ύει Q Q h, m(q ) = m(q h ), και canbejoined(q, m(q ), jv) = αληθές, τότε ο α όρι μος προσπερνάει το Q h ήτοι, προσ έτει στην Q κά ε ερώτημα Q τέτοιο ώστε Q h, Q G και συνε ίζει με το επόμενο ΣΕ. Αξίζει να σημει εί ότι παρό ο που οι συν ήκες της Ιδιότητας (R2) Q Q h και m(q ) = m(q h ) φαίνεται να είναι ιδιαίτερα αυστηρές, στην πρα ματικότητα είναι πο ύ συ νό το φαινόμενο ένα ερώτημα Q να υπά ει ένα ερώτημα Q h με άση την ταυτοτική αντικατάσταση και να ισ ύει m(q ) = m(q) =. Επιπ εόν, όσον αφορά στην Ιδιότητα (R1), αξίζει να σημει εί ότι στην π ειονότητα τ ν περιπτώσε ν το σύνο ο μετα ητών nv που κατασκευάζεται ια κά ε ΣΕ στη ραμμή 7 είναι ίδιο ια ό α τα ερ τήματα, ενώ στη ραμμή 10 ια σ := {z x} συνή ς έ ουμε z var(q ), συνεπώς στη ραμμή 14 α έ ουμε ότι [ bd(q ) Q A (nv)]µ = bd(q ) Q A (nv). Παρατηρούμε οιπόν π ς και οι δύο ιδιότητες της Πρότασης μπορεί να είναι πο ύ αποτε εσματικές στην πράξη. Παράδει μα Έστ ότι ια κάποιο ΣΕ και TBox, ο Α όρι μος 13 έ ει υπο ο ίσει σε κάποιο σημείο το ράφο G = R Q, H, m, όπου το R Q περιέ ει τα ερ τήματα Q 1 = A(x) R(x, y) Q A (x) και Q 2 = A(x) Q A (x) και επίσης m(q 1 ) = m(q 2 ) =. Είναι προφανές ότι το Q 1 υπά εται από το Q 2, όμ ς, ο 92 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

117 Κεφάλαιο 5. Επαυξητική Επανεγγραφή Ερωτημάτων α όρι μος δεν μπορεί να αφαιρέσει σε αυτό το σημείο το ερώτημα αυτό από τον G. Στο τε ικό ήμα, έστ ότι κα είται ο Α όρι μος 14 ια τον G και το R α = {Q α }, όπου Q α = B(x) Q A (x). Όταν ο α όρι μος προσπε αύνει τα Q 1 και Q α είναι εύκο ο να δούμε ότι οι συν ήκες της Ιδιότητας (R2) ικανοποιούνται. Πιο συ κεκριμένα, το Q 1 υπά εται από το Q 2, Q 2 Q 1 και m(q 1 ) = m(q 2 ). Άρα, ο Α όρι μος 14 μπορεί να αποφύ ει την κατασκευή του ερ τήματος Q = A(x) R(x, y) B(x) Q A (x) από τα Q 1 και Q α. Όντ ς, σε κάποιο σημείο ο α όρι μος α επι έξει τα Q 2 και Q α και α παρά ει το ερώτημα Q = A(x) B(x) Q A (x) που υπά ει το Q, άρα, το ερώτημα Q όντ ς πρόκειται να είναι περιττό εάν προστε εί στο R Q. Εντοπισμός μη-περιττών Ερ τημάτ ν Ιδιαίτερα συ νό είναι το φαινόμενο κατά το οποίο επεκτείνοντας στο i-οστό ήμα ένα ερώτημα που είναι μη-περιττό παρά εται ένα ερώτημα που είναι επίσης μη-περιττό στο ήμα i + 1. Κα ώς συνή ς το με α ύτερο μέρος του τε ικού ΣΣΕ αποτε είται από ΣΕ που είναι μη-περιττά, α ήταν ευερ ετικό ια τον α όρι μο μας εάν αυτά μπορούσαν να ανα ν ριστούν κατά τη διάρκεια παρα ής της επανε ραφής ΣΣΕ του ερ τήματος στον Α όρι μου 14. Τα ερ τήματα αυτά μπορούν τότε να μην συμπερι ηφ ούν στον τε ικό έ ε ο απα οιφής περιττών ερ τημάτ ν ( ραμμή 12 του Α ορί μου 13), μειώνοντας έτσι σημαντικά το μέ ε ος τ ν ρό ν επανά ηψης που ρησιμοποιεί η μέ οδος αυτή ια να εκτε εστεί. Η παρακάτ πρόταση παρέ ει με όδους ια την ανα νώριση μη-περιττών ερ τημάτ ν κατά τη διάρκεια εκτέ εσης του Α όρι μου 14 υπο έτοντας ότι ν ρίζουμε τις σ έσεις υπα ής στον ράφο επανε ραφής της εισόδου. Πρόταση Έστω G = R Q, H, µ γράφος επανεγγραφής, έστω R α ΣΣΕ, έστω jv, av σύνολα μεταβλητών, και έστω R Q έξοδος του Αλγόριθμου 14 όταν εφαρμόζονται σε αυτόν τα G, R α, jv, και av. Έστω ΣΕ Q R Q τ.ω. canbejoined(q, m(q), jv) = αληθές, έστω nv σύνολο μεταβλητών που κατασκευάζεται για το Q στη γραμμή 7 και έστω ότι το Q είναι μη-περιττό στο R Q. Τότε ισχύουν οι παρακάτω ιδιότητες: (N1) Το bd(q) Q A (nv) είναι επίσης μη-περιττό στο R Q. (N2) Έστω κ = m(q) και έστω ΣΕ Q α R α. Εάν κανένα από τα κατηγορήματα των ατόμων του σώματος του Q α δεν εμφανίζεται σε οποιοδήποτε ΣΕ Q R Q και για κάθε Q α R α έχουμε mergecqs(q α, Q) =, τότε το ερώτημα bd(q) bd(q α m(q)) Q A (nv) είναι επίσης μη-περιττό στο R Q. Απόδειξη: (Ιδιότητα (N1)) Έστ Q ένα αυ αίρετο ΣΕ στο R Q διαφορετικό από το Q. Κατά τον τερματισμό, είτε ένα ΣΕ της μορφής [ bd(q) Q A (nv )]µ ια κάποια µ, είτε κάποιο ΣΕ της μορφής bd(q ) bd(q α κ) Q A (nv ) ια κάποιο Q α R α προστί εται στο R Q από τον Α όρι μο 14. Έστ ότι το [ bd(q ) Q A (nv )]µ υπά ει το bd(q) Q A (nv). Τότε υπάρ ει μια αντικατάσταση θ τ.. Q µ θ Q και συνεπώς, Q θ Q ια θ = µ θ, αντί ετα με την υπό εση μας. Το ίδιο ισ ύει εάν υπο έσουμε ότι το bd(q ) bd(q α κ) Q A (nv ) υπά ει Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 93

118 Βελτιστοποιήσεις το Q. Συνεπώς, μπορούμε να συμπεράνουμε ότι κανένα από τα παραπάν ερ τήματα δεν μπορεί να υπά ει το bd(q) Q A (nv). Εφόσον το Q ήταν ένα αυ αίρετο ΣΕ προκύπτει ότι κανένα ερώτημα στο R Q δεν υπά ει το bd(q) Q A (nv) και συνεπώς αυτό είναι μη-περιττό στο R Q. (Ιδιότητα (N2)) Εφόσον το Q είναι μη-περιττό στο R Q τότε ια ό α τα Q R Q διάφορα του Q και ια ό ες τις αντικαταστάσεις θ, έ ουμε ότι Qθ Q. Έστ ότι το Q είναι ένα τέτοιο αυ αίρετο ΣΕ και έστ ότι η θ είναι μια αυ αίρετη αντικατάσταση. Αυτό συνεπά εται π ς πρέπει να υπάρ ει κάποιο άτομο At στο σώμα του Q τέτοιο ώστε Atθ Q θ και Atθ Q. Θε ρούμε τώρα ένα αυ αίρετο ερώτημα Q α R α τέτοιο ώστε κανένα από τα κατη ορήματα τ ν ατόμ ν του σώματος του να μην εμφανίζονται σε κάποιο άτομο του σώματος του Q. Αυτό συνεπά εται ότι Atθ Q α και Atθ Q α κ ια κά ε αντικατάσταση κ και συνεπώς επίσης Atθ Q Q α m(q). Κατά συνέπεια, ούτε το [ bd(q ) Q A (nv )]µ ια κά ε µ, ούτε το bd(q ) bd(q αm(q )) Q A (nv ) ια κά ε Q α R α υπά ουν το bd(q) bd(q α m(q)) Q A (nv). Επιπ έον, ια κά ε ερώτημα Q α R α έ ουμε mergecqs(q α, Q) = και πά ι επειδή κανένα κατη όρημα από τα άτομα του Q α δεν εμφανίζεται σε κάποιο ά ο ΣΕ, κανένα ερώτημα της μορφής [ bd(q) Q A (nv)]µ ια μια αντικατάσταση µ δεν προστί εται στο R Q από τον Α όρι μο 14. Συνοψίζοντας, το bd(q) bd(q α µ(q)) Q A (nv) είναι μη-περιττό στο R Q. Έστ G = R Q, H, m ράφος και R α ΣΣΕ με τα οποία κα είται ο Α όρι μος 14. Τότε, ια να μπορούν να ρησιμοποιη ούν οι Ιδιότητες (N1) και (N2) ο α όρι μος τροποποιείται ς εξής: Στην αρ ή αρ ικοποιεί ένα άδειο σύνο ο NR που περιέ ει μη-περιττά ερ τήματα. Στη ραμμή 14, εάν [ bd(q ) Q A (nv)]µ = bd(q ) Q A (nv), και επίσης το Q είναι μη-περιττό στο R Q προσ έτει το [ bd(q ) Q A (nv)]µ στο NR. Στη ραμμή 8, προσ έτει το bd(q) bd(q α m(q)) Q A (nv) στο NR εάν το Q h είναι μη-περιττό στο R Q, κανένα από τα κατη ορήματα στο Q α δεν εμφανίζεται σε κάποιο ερώτημα στο R Q και εάν ια κά ε Q α R α έ ουμε mergecqs(q α, Q) =. Τέ ος, επιστρέφει το ΣΣΕ R Q και το σύνο ο NR. Στη συνέ εια, το σύνο ο NR που έ ει επιστραφεί ρησιμοποιείται από τη μέ οδο removeredundant στη ραμμή 12 του Α όρι μου 13 ς εξής: Ό α τα ερ τήματα που ανήκουν στο σύνο ο NR αποκ είονται από τον έ ε ο απα οιφής όπ ς φαίνεται και από τον Α όρι μο 7. Αξίζει να σημει εί και πά ι ότι ο έ ε ος ια το εάν ια κά ε Q α δεν υπάρ ει κανένα κατη όρημα σε κάποιο άτομο του σώματος ερ τήματος στο R Q απαιτεί την επανά ηψη ια κά ε Q α R α από ό α τα ερ τήματα στο R Q. Παρό α αυτά, αυτό μπορεί να πρα ματοποιη εί μόνο μια φορά στην αρ ή του Α όρι μου 14 και επιπ έον, όπ ς έ ει αναφερ εί και προη ουμέν ς, στο σημείο αυτό του α όρι μου το σύνο ο R Q αναμένεται να μην είναι πο ύ με ά ο σε μέ ε ος. Επιπ έον, όπ ς α δείξουμε και 94 Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων

119 Κεφάλαιο 5. Επαυξητική Επανεγγραφή Ερωτημάτων στο Κεφά αιο 6 σε πο ές περιπτώσεις η τε νική αυτή μας επιτρέπει να μειώσουμε αισ ητά το κόστος ε έ ου ια περιττά ερ τήματα στο σύνο ο R Q και σε πο ές περιπτώσεις να το αποφύ ουμε εντε ώς, εάν R Q = NR. Το όφε ος αυτό υπερτερεί σημαντικά του ρόνου που απαιτείται ια ό ους τους επιπ έον ε έ ους που εισά ει η τε νική αυτή. Παράδει μα Έστ και πά ι τα G, R Q, και R α από το Παράδει μα Εάν το R Q δεν περιέ ει ά α ερ τήματα, τότε είναι εύκο ο να δούμε ότι ια το Q 2 R Q και το Q α R α οι συν ήκες της Ιδιότητας (N2) ικανοποιούνται. Πιο συ κεκριμένα, το Q 2 είναι μη-περιττό στο R Q, κανένα από τα κατη ορήματα του Q α δεν εμφανίζονται σε ά α ΣΕ στο R Q και mergecqs(q α, Q 2 ) =. Συνεπώς, το ΣΕ που παρά εται από το Q 2 και το Q α δη αδή, το Q από το Παράδει μα 5.2.3, είναι μη-περιττό στο αποτέ εσμα. Παρό α αυτά, έστ ότι εκτός από τα Q 1 και Q 2 η επανε ραφή ΣΣΕ R Q περιέ ει επίσης το ΣΕ Q 3 = S(x, z) Q A (x) και το R α περιέ ει επίσης το ΣΕ Q α = S(x, z) Q A (x). Η Ιδιότητα (N2) δεν ικανοποιείται τώρα ια τα Q 2 και Q α, εφόσον το κατη όρημα του Q α εμφανίζεται στο Q 3. Άρα, δεν μπορούμε να ε υη ούμε ότι το Q 2 και το Q α α παρά ουν ένα μη-περιττό ερώτημα. Στην πρα ματικότητα, το ερώτημα που κατασκευάζουν (ήτοι, το A(x) S(x, z) Q A (x)) πρόκειται να υπα εί από το ερώτημα που παρά εται από το Q 3 και το Q α (ήτοι, το S(x, z) Q A (x)). Το ερώτημα Q όμ ς που παρά εται από τα Q 2 και Q α παραρμένει μη-περιττό. Εντοπισμός μη-υπα όντ ν Ερ τημάτ ν Τέ ος η επόμενη πρόταση παρουσιάζει μια ιδιότητα με ρήση της οποίας μπορούμε να ανα ν ρίσουμε εάν ένα ερώτημα που παρά εται κατά την εκτέ εση του Α ορί μου 14 δεν α υπά ει κανένα ά ο ΣΕ που παρά εται από τον ίδιο α όρι μο. Πρόταση Έστω G = R Q, H, m γράφος επανεγγραφής, έστω R α ΣΣΕ, έστω jv, av σύνολα μεταβλητών, και έστω R Q έξοδος του Αλγορίθμου 14 όταν εφαρμόζεται στα G, R α, jv, και av. Έστω ΣΕ Q R Q με canbejoined(q, m(q), jv) = αληθές, έστω nv σύνολο μεταβλητών που κατασκευάζεται για το Q στη γραμμή 7, και έστω ότι το Q δεν υπάγει κανένα ΣΕ στο R Q. Τότε ισχύει η παρακάτω ιδιότητα: (S) Έστω ΣΕ Q α R α. Εάν κανένα από τα κατηγορήματα των ατομων του σώματος του Q α δεν εμφανίζεται σε κάποιο ΣΕ R Q (συμπεριλαμβανομένου του Q), τότε το ερώτημα bd(q) bd(q α m(q)) Q A (nv) δεν υπάγει κανένα ΣΕ στο R Q. Απόδειξη: Εφόσον το Q δεν υπά ει κανένα ΣΕ στο R Q, έ ουμε Qθ Q ια ό α τα Q R Q που είναι διαφορετικά από το Q και τις αντικαταστάσεις θ. Συνεπώς, ια κά ε θ υπάρ ει ένα άτομο At στο σώμα του Q τ.. Atθ Qθ και Atθ Q. Για να δείξουμε ότι το bd(q) bd(q α m(q)) Q A (nv), που α κα είται Q n στη συνέ εια, δεν υπά ει κανένα ΣΕ στο R Q ε ρούμε ένα τυ αίο ΣΕ Q R Q. Κατά τον τερματισμό, ο Α όρι μος 14 μπορεί να προσ έσει στο R Q είτε το ΣΕ [ bd(q ) Q A (nv )]µ ια κάποια µ ή το ΣΕ bd(q ) bd(q ακ) Q A (nv ) ια κάποιο (πι ανώς διαφορετικό) Q α R α. Θα δείξουμε ότι το Q n δεν υπά ει κανένα τέτοιο ΣΕ. Αναστάσιος Βενέτης - Αλγόριθμοι Επανεγγραφής Τροποποιημένων Ερωτημάτων 95

120 Βελτιστοποιήσεις Από την υπό εση κανένα από τα κατη ορήματα τ ν ατόμ ν του Q α δεν εμφανίζεται στο Q. Άρα, είναι ξεκά αρο ότι υπάρ ει κάποιο At Q n (κάπο&io