Αναγωγή Προφίλ Μεταδεδομζνων Dublin Core ςε Λογικζσ Περιγραφήσ Δρ. Δθμιτριοσ Α. Κουτςομθτρόπουλοσ (kotsomit@hpclab.ceid.upatras.gr) Εργαςτιριο Πλθροφοριακϊν Συςτθμάτων Υψθλϊν Επιδόςεων Νοζμβριοσ 2008 Στθν αναφορά αυτι εξθγείται πώσ ςχετίηονται τα παραδοςιακά προφίλ μεταδεδομζνων εφαρμογισ (metadata application profiles) με τισ οντολογίεσ Ιςτοφ και τισ Λογικζσ Περιγραφισ. Δείχνεται ότι τα προφίλ μεταδεδομζνων μποροφν να αναχκοφν ςε Λογικζσ Περιγραφισ και αποδεικνφεται παραδόξωσ ότι θ OWL (2) με τθν τρζχουςα εκφραςτικότθτα, δεν επαρκεί για το ςκοπό αυτό. Αρχικά, γίνεται μια ςφντομθ περιγραφι τθσ πρόςφατθσ πρόταςθσ για αναπαράςταςθ προφίλ μεταδεδομζνων μζςω τθσ ζννοιασ των Προφίλ Συνόλων Περιγραφών (DSP) και βάςει του XML Schema, όπου τονίηεται θ ςκοπιμότθτα μιασ αντίςτοιχθσ αναπαράςταςθσ και με χριςθ οντολογικών γλωςςών. Στθ ςυνζχεια ειςάγεται θ αναγωγι των DSP ςε Λογικζσ Περιγραφισ και ςυηθτοφνται τα εκφραςτικά χαρακτθριςτικά που απαιτοφνται, κακώσ και θ επιβάρυνςθ που επιφζρουν ςτθν πολυπλοκότθτα του ςυλλογιςμοφ. 1. Σκοπόσ και αναγκαιότητα Η ανάγκθ τθσ φπαρξθσ ενόσ ςυνεποφσ πλαιςίου για τθν ανάπτυξθ προφίλ εφαρμογισ ζχει επίςθσ αναγνωριςτεί και από το ίδιο το DCMI. Ύςτερα από το ςυνζδριο DC 2007, το επονομαηόμενο «Πλαίςιο τθσ Σιγκαποφρθσ» για τθν ανάπτυξθ προφίλ μεταδεδομζνων εφαρμογισ που βαςίηονται ςτο DC ειςιχκθ ςτο (Nilsson, Baker, & Johnston, 2008). Βαςιςμζνο ςε ζννοιεσ του DCAM, το πλαίςιο τθσ Σιγκαποφρθσ ζχει ωσ κφρια προτεραιότθτα τθν ανάπτυξθ μιασ γλώςςασ περιοριςμών, όπωσ ακριβώσ ζνα XML Schema, που κα κακορίηει και τυπικά τι είδουσ ιδιότθτεσ (πικανώσ προερχόμενεσ από διαφορετικά πρότυπα) ςυμπεριλαμβάνονται ςτο εν λόγω προφίλ και τι είδουσ τιμζσ είναι κατάλλθλεσ για αυτζσ τισ ιδιότθτεσ, που πικανώσ να περιορίηονται από ςυγκεκριμζνα ςυντακτικά και λεξιλογικά ςχιματα κωδικοποίθςθσ. Ο ςτόχοσ ενόσ τζτοιου Προφίλ Συνόλων Περιγραφών (DSP) (Nilsson, 2008) είναι να προςδιορίηει εκείνεσ τισ εγγραφζσ μεταδεδομζνων που ταιριάηουν (ι ςυμμορφώνονται) προσ το ςυγκεκριμζνο DSP. Αυτό ςθμαίνει ότι θ γλώςςα για τθν ζκφραςθ των DSP μπορεί πρωτίςτωσ να χρθςιμοποιθκεί για τθν ζκφραςθ των δομικϊν και ςυντακτικϊν περιοριςμών που επιβάλλει ζνα προφίλ εφαρμογισ, αφινοντασ εκτόσ εμβζλειασ τθ ςθμαςιακι διαλειτουργικότθτα. Εξάλλου, όπωσ αναφζρεται ςτο Πλαίςιο τθσ Σιγκαποφρθσ: «Είναι ςθμαντικό να αντιλθφκεί κανείσ ότι θ ςθμαςιολογία των όρων που χρθςιμοποιοφνται ςτα προφίλ εφαρμογισ φζρεται από τουσ οριςμοφσ τουσ, που είναι ανεξάρτθτοι από το προφίλ εφαρμογισ [ ]. Η ςθμαςιακι διαλειτουργικότθτα παρζχεται από τθν ορκι χριςθ των όρων που ορίηονται ςε ζνα ι περιςςότερα λεξιλόγια και τα
προφίλ εφαρμογισ υπάρχουν για να παρζχουν υψθλοφ επιπζδου ςυντακτικι ι δομικι διαλειτουργικότθτα» Ζχει δειχκεί αλλοφ (Koutsomitropoulos, Paloukis, & Papatheodorou, 2007) ότι ο παραπάνω ιςχυριςμόσ δεν ιςχφει ςτθν περίπτωςθ των ςθμαςιακών προφίλ (semantic profiles) και επίςθσ ότι θ ςθμαςιακι προςαρμογι (semantic profiling) εκλεπτφνει τθ ςθμαςιολογία των όρων και οδθγεί προσ τθ ςθμαςιακι διαλειτουργικότθτα. Περαιτζρω, και παρά τθν υλοποίθςθ τθσ γλώςςασ DSP ςε ζνα XML Schema (Nilsson, 2008), μπορεί να κεωρθκεί ότι θ ζκφραςι τθσ ςε γλώςςα ςυμβατι με το RDF είναι καταλλθλότερθ, δεδομζνων και των πρόςφατων υλοποιιςεων του DC ςε RDF(S), αλλά και τθσ οντολογίασ DC ςε OWL (Koutsomitropoulos, Solomou, & Papatheodorou, 2008). 2. Η διαδικαςία τησ αναγωγήσ Αρχικά παρατθροφμε ότι οι δομικοί περιοριςμοί, όπωσ οι επιτρεπόμενεσ τιμζσ και οι τφποι των πόρων, ζχουν τθν αντιςτοιχία τουσ ςτουσ περιοριςμοφσ πεδίου οριςμοφ και πεδίου τιμών του RDFS. Επίςθσ θ ζννοια των επιτρεπόμενων ιδιοτιτων (allowed properties) μπορεί να αναπαραςτακεί ωσ εξισ: Βαςικό δομικό ςτοιχείο ενόσ DSP είναι το πρότυπο περιγραφισ (description template). Ζνα DSP μπορεί να περιλαμβάνει πολλά τζτοια πρότυπα. Ζνα πρότυπο περιγραφισ αντιςτοιχεί ςτθν περιγραφι πόρων ενόσ ςυγκεκριμζνου τφπου (π.χ. items, persons ) και ορίηει περιοριςμοφσ πάνω ςτο ςφνολο των ιδιοτιτων που αφοροφν το ςυγκεκριμζνο τφπο πόρων (είναι δθλαδι ςτο πεδίο οριςμοφ τουσ). Οι περιοριςμοί ςε μια ιδιότθτα εκφράηονται μζςω του προτφπου διλωςθσ (statement template) και άρα ζνα πρότυπο περιγραφισ μπορεί να ζχει πολλά πρότυπα διλωςθσ. Ζνα πρότυπο περιγραφισ μπορεί επομζνωσ να ειδωκεί ωσ μία μόνο ιδιότθτα, που διαμερίηεται ςτο ςφνολο των επιτρεπόμενων ιδιοτιτων (δθλαδι μια ν-αδικι ιδιότθτα). Ζνασ τρόποσ για τον οριςμό τζτοιων ν-αδικών ιδιοτιτων δίνεται ςτο (Noy & Rector, 2006). Για κάκε πρότυπο περιγραφισ μπορεί να οριςτεί μια κλάςθ Description_ID. Στθ ςυνζχεια, για κάκε επιτρεπόμενθ ιδιότθτα P 1,, P n : Description_ID P 1.range 1 P n.range n (1) Το παραπάνω εκφράηει τον περιοριςμό ότι κάκε ςτιγμιότυπο του Description_ID ζχει τουλάχιςτον μία ςχζςθ, διαμζςου των P 1,, P n με ζνα ςτιγμιότυπο από το κατάλλθλο πεδίο τιμών (range). Για να εκφραςτεί ο περιοριςμόσ ότι οι P 1,, P n μποροφν να ςυςχετίηουν τα ςτιγμιότυπα του Description_ID μόνο με τα κατάλλθλα πεδία τιμών, μπορεί να χρθςιμοποιθκεί κακολικι ποςοτικοποίθςθ: Description_ID P 1.range 1 P n.range n (2) Περιοριςμοί που αφοροφν το πλικοσ των επιτρεπόμενων πλθρωτών για κάκε ιδιότθτα μποροφν να αναπαραςτακοφν με ανάλογο τρόπο, χρθςιμοποιώντασ προςδιοριςμζνουσ περιοριςμοφσ αρικμοφ, αντικακιςτώντασ ζτςι τουσ (πιο γενικοφσ) υπαρξιακοφσ περιοριςμοφσ. Για να φανεί ότι οι παραπάνω εκφράςεισ είναι επίςθσ και ικανζσ (όχι μόνο αναγκαίεσ), ζςτω ότι x Description_ID και P k (x, y), όπου 1 k n και το y δεν ανικει ςτο επιτρεπόμενο
πεδίο τιμών. Τότε, λόγω (2), θ οντολογία κακίςταται αςυνεπισ, αφοφ το y πρζπει να ανικει ςτο κατάλλθλο για τθν P k πεδίο τιμών. Επίςθσ, λόγω (1), το x πρζπει να ζχει (αν και μπορεί να μθν ζχουν δθλωκεί ακόμα) άλλεσ n-1 ςχζςεισ, μζςα από τισ επιτρεπόμενεσ ιδιότθτεσ. Η ζκφραςθ του γεγονότοσ ότι οι P 1,, P n είναι οι μόνεσ ιδιότθτεσ που επιτρζπονται είναι κάπωσ πιο περίτεχνθ. Αυτό που χρειάηεται είναι θ δυνατότθτα ζκφραςθσ του αξιώματοσ τομισ και ςυμπλθρϊματοσ ρόλων. Η OWL 2 επιτρζπει ξζνουσ ρόλουσ, αλλά όχι και τομζσ ρόλων εν γζνει. Ζςτω U o κακολικόσ ρόλοσ, δθλαδι ο γονζασ όλων των ρόλων. Ιςχφει ότι: P 1.range 1 P n.range n U. Θζλουμε να εκφράςουμε ότι οι κλάςεισ P m.range m, για κάκε m διαφορετικό από 1 n, δεν επιτρζπονται μζςα ςτο Descrption_ID. Αν ζχουμε ςτθ διάκεςι μασ τομι και ςυμπλιρωμα ρόλων, το ςφνολο των μθ επιτρεπόμενων ιδιοτιτων μπορεί να ςυμβολιςτεί ωσ: U (P 1 P n ) Το Description_ID κα πρζπει να μθν περιλαμβάνει ςτιγμιότυπα τα οποία να ςχετίηονται με άλλα μζςω των μθ επιτρεπόμενων ιδιοτιτων. Δθλαδι: Descrption_ID (U (P 1 P n )). 3. Εκφραςτικά χαρακτηριςτικά και πολυπλοκότητα Καταλιγουμε λοιπόν ότι για τθν ζκφραςθ των DSP απαιτείται θ διακεςιμότθτα των τριών λογικών τελεςτών (ζνωςθ, τομι, ςυμπλιρωμα) και ςε εκφράςεισ ι τουλάχιςτον μόνο ςε ονόματα ρόλων, κανζνασ από τουσ οποίουσ δεν είναι διακζςιμοσ ςτθν OWL 2. Επίςθσ απαιτείται θ φπαρξθ προςδιοριςμζνων περιοριςμών αρικμοφ (το Q ςτθν ονοματολογία) που δεν υπάρχει ςτθν OWL DL, ενώ ο κακολικόσ ρόλοσ μπορεί και να απαλειφκεί. Οι Lutz και Sattler (Lutz & Sattler, 2000) δείχνουν ότι θ Λογικι Περιγραφισ ALC (,, ) δθλαδι θ βαςικι λογικι ALC με λογικοφσ τελεςτζσ ςτουσ ρόλουσ ανικει ςτθν κλάςθ πολυπλοκότθτασ NEXP. Επίςθσ, ςτο (Tobies, 2001), δείχνεται ότι θ Λογικι Περιγραφισ ALCIQ (,, ), δθλαδι θ προθγοφμενθ λογικι εκτεταμζνθ με προςδιοριςμζνουσ περιοριςμοφσ αρικμοφ και αντίςτροφουσ ρόλουσ, θ οποία επαρκεί για τθν ζκφραςθ DSP, αλλά δεν αντιςτοιχεί ςε κάποια οντολογικι γλώςςα, είναι NEXP-complete. Με τον περιοριςμό ότι οι εκφράςεισ ρόλων, αν μεταςχθματιςτοφν ςε Διαηευγμζνθ Κανονικι Μορφι (Disjunctive Normal Form, DNF, δθλαδι ςε ζνωςθ τομών), κα πρζπει ςε κάκε ςτοιχείο τθσ διάηευξθσ (ζνωςθσ) να ζχουν τουλάχιςτον ζνα μθ αρνθτικό ςκζλοσ, θ λογικι αυτι γίνεται PSPACE-complete. Για παράδειγμα, θ ζκφραςθ (P 1 P n ) ςε DNF γράφεται P 1 P n που αποτελείται από ζνα μόνο ςτοιχείο διάηευξθσ το οποίο δεν ζχει κανζνα μθ αρνθτικό ςκζλοσ, εκτόσ αν χρθςιμοποιθκεί ο κακολικόσ ρόλοσ. Ακόμθ, οι Schmidt και Tishkovsky (Schmidt & Tishkovsky, 2007) δείχνουν ότι θ Λογικι Περιγραφισ ALBO, δθλαδι θ βαςικι λογικι ALC, εκτεταμζνθ με ζνωςθ και ςυμπλιρωμα ρόλων, αντίςτροφουσ ρόλουσ και ονοματικά είναι NEXP-complete (θ τομι δεν αναφζρεται γιατί P R ( P R), όπου P, R ονόματα ρόλων) και υλοποιοφν αντίςτοιχο αλγόρικμο ταμπλό. Αναφζρουν επίςθσ ότι θ εφαρμογι ςυμπλθρώματοσ πάνω ςε αλυςίδεσ ρόλων
οδθγεί ςε μθ αποφαςιςιμότθτα, κάτι που ιςχφει επίςθσ και για τθν εφαρμογι τθσ τομισ (Calvanese & Giacomo, 2007). Συμπεραςματικά, θ ςθμαςιολογία του RDF(S) και τθσ OWL δεν επαρκεί για τθν ζκφραςθ των δομικών και ςυντακτικών περιοριςμών των προφίλ εφαρμογισ. Επιπρόςκετα, αν και ρθτόσ ςτόχοσ των DSP είναι θ εναςχόλθςθ με ςυντακτικοφσ μόνο περιοριςμοφσ, αποδεικνφεται ότι ζχουν ςοβαρζσ ςθμαςιακζσ προεκτάςεισ. 4. Συμπεράςματα Παραδόξωσ, θ ζκφραςθ κλαςικών προφίλ εφαρμογισ μεταδεδομζνων, όπωσ αυτά επιχειρείται πρόςφατα να τυποποιθκοφν, γφρω από το DC, με το πλαίςιο τθσ Σιγκαποφρθσ, δεν μπορεί να γίνει με τθν τρζχουςα εκφραςτικότθτα τθσ OWL. Δείξαμε ακριβώσ ποια εκφραςτικά χαρακτθριςτικά απουςιάηουν από τθν τελευταία προδιαγραφι τθσ γλώςςασ και απαιτοφνται για τον προςδιοριςμό τζτοιων προφίλ. Αποδείξαμε παρ όλα αυτά ότι οι ςυντακτικοί περιοριςμοί που επιβάλλει ζνα κλαςςικό προφίλ μποροφν να αναχκοφν ςε ςθμαςιακοφσ περιοριςμοφσ μζςα ςε μία οντολογία. Η δυςκολία -ζωσ και μθ αποφαςιςιμότθτα- που κα ζχει ο ςυλλογιςμόσ με τθν προςκικθ και αυτών των χαρακτθριςτικών δεν κα πρζπει όμωσ να ειδωκεί ωσ αδυναμία: Αφενόσ, το XML Schema μπορεί πολφ εφκολα να χρθςιμοποιθκεί για τθν επιβολι και επαλικευςθ τζτοιων ςυντακτικών περιοριςμών και, αφετζρου, το ιςοδφναμό τουσ ςε Λογικζσ Περιγραφισ δεν υπάρχει ανάγκθ να ςυνοδεφεται από τθν ταυτόχρονθ φπαρξθ και των υπολοίπων εκφραςτικών χαρακτθριςτικών τθσ OWL 2, εκτόσ μόνο από λίγων. 5. Βιβλιογραφία Calvanese, D., & Giacomo, G. d. (2007). Expressive Description Logics. In F. Baader, D. Calvanese, D. McGuinness, D. Nardi, & P. F. Patel-Schneider (Eds.), The Description Logic Handbook (2nd ed.). Cambridge. Koutsomitropoulos, D. A., Paloukis, G. E., & Papatheodorou, T. S. (2007). From Metadata Application Profiles to Semantic Profiling: Ontology Refinement and Profiling to Strengthen Inference-based Queries on the Semantic Web. Int. J. on Metadata, Semantics and Ontologies, 2 (4), pp. 268-280. Koutsomitropoulos, D. A., Solomou, G. D., & Papatheodorou, T. S. (2008). Semantic Interoperability of Dublin Core Metadata in Digital Repositories. 5th Int. Conference on Innovations in Information Technology. IEEE. Lutz, C., & Sattler, U. (2000). Mary likes all Cats. Proc. of the 2000 Int. Workshop in Description Logics (DL 2000), Vol 33 in CEUR-WS, pp. 213-226. Nilsson, M. (2008). Description Set Profiles: A constraint language for Dublin Core Application Profiles. DCMI Working Draft. Retrieved from http://dublincore.org/documents/dc-dsp/ Nilsson, M., Baker, T., & Johnston, P. (2008). The Singapore Framework for Dublin Core Application Profiles. Retrieved from http://www.dublincore.org/documents/singaporeframework/ Noy, N., & Rector, A. (Eds.). (2006). Defining N-ary Relations on the Semantic Web. Semantic Web Best Practices and Deployment Working Group Note. Retrieved from http://www.w3.org/tr/swbp-n-aryrelations/
Schmidt, R. A., & Tishkovsky, D. (2007). Using Tableau to Decide Expressive Description Logics with Role Negation. Proc. of the 6th Int. Semantic Web Conference (ISWC 2007) (pp. 438-451). Springer. Tobies, S. (2001). Complexity results and practical algorithms for logics in Knowledge Representation. PhD Thesis, LuFG Theoretical Computer Science,RWTH-Aachen.