ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Σχετικά έγγραφα
Οντολογία για την περιγραφή των προσωπικοτήτων της Σάμου, την κατηγοριοποίηση και τις σχέσεις τους

Μάθημα: Δ3. Δίκτυα Γνώσης και Σημασιολογικός Ιστός. Διάλεξη 02 & 03. Δρ. Γεώργιος Χρ. Μακρής

Μάθημα: Δ3. Δίκτυα Γνώσης και Σημασιολογικός Ιστός. Διάλεξη 01 & 02. Δρ. Γεώργιος Χρ. Μακρής

Field Service Management ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ

Συγχώνευση αλληλογραφίας και συγχώνευση μιας πηγής δεδομένων με ένα κύριο έγγραφο όπως ένα γράμμα ή ένα έγγραφο ετικετών

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Εργαστήριο Σημασιολογικού Ιστού

«Ανάπτυξη μηχανής παραγωγής φυσικής γλώσσας για οντολογίες OWL»

Εγκατάσταση αρχείων βιβλιοθήκης VHOPE και VHOPE

Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών

Use Cases: μια σύντομη εισαγωγή. Heavily based on UML & the UP by Arlow and Neustadt, Addison Wesley, 2002

ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: ΣΥΓΓΡΑΦΕΑΣ:

Λίγα λόγια από το συγγραφέα Κεφάλαιο 1: Βάσεις δεδομένων και Microsoft Access Κεφάλαιο 2: Microsoft Access

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος.

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Μάθημα: Εργαστήριο «Πληροφορική Υγείας» ΕΙΣΑΓΩΓΗ ΣΤΗΝ ACCESS

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Πεδί α

Σενάριο Χρήσης myschool

4.1 Άνοιγμα υπάρχοντος βιβλίου εργασίας

Pylon Entry. Πόροι. Στη διαδικασία αυτή περιγράφεται η Δημιουργία- Μεταβολή-Διαγραφή Αναζήτηση Πόρων

Kεφάλαιο 11 Λίστες και Ανάλυση Δεδομένων Kεφάλαιο 12 Εργαλεία ανάλυσης πιθανοτήτων Kεφάλαιο 13 Ανάλυση δεδομένων...

Πρότυπα και Τεχνολογίες Semantic Web και Web 2.0 και η εφαρμογή τους στην Ηλεκτρονική Διακυβέρνηση

Σενάριο Χρήσης Moodle

ΚΕΦΑΛΑΙΟ 8 Η ΓΛΩΣΣΑ PASCAL

Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού

Εννοιολογικός Χάρτης Cmap Tools

SITEBUILDER ΠΛΑΤΦΟΡΜΑ ΑΥΤΟΝΟΜΗΣ ΚΑΤΑΣΚΕΥΗΣ & ΔΙΑΧΕΙΡΙΣΗΣ ΔΙΚΤΥΑΚΩΝ ΤΟΠΩΝ (WEBSITE) ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ. Version 2.0

Τμήμα Επιστημών της Θάλασσας Σύντομες οδηγίες συγγραφής της Πτυχιακής Εργασίας

Εργαστήριο Σημασιολογικού Ιστού

Λίγα λόγια από το συγγραφέα Κεφάλαιο 1: Microsoft Excel Κεφάλαιο 2: Η δομή ενός φύλλου εργασίας... 26

(1) Επιλέξτε την εντολή QUERIES για να μπείτε στο περιβάλλον δημιουργίας

Ασκήσεις μελέτης της 8 ης διάλεξης

ΗΥ Λογική. Διδάσκων: Δημήτρης Πλεξουσάκης Καθηγητής

Εργαστήριο Σημασιολογικού Ιστού

Περιεχόμενα. Κεφάλαιο 1 Εισαγωγή στην Access...9. Κεφάλαιο 2 Χειρισμός πινάκων... 25

App Inventor 3ο Μάθημα (Ζάρια - επέκταση)

Σχεδίαση Βάσεων Δεδομένων

ΟΔΗΓΟΣ ΔΗΜΙΟΥΡΓΙΑΣ ΛΟΓΑΡΙΑΣΜΟΥ ΣΤΟ GOOGLE SCHOLAR ΓΙΑ ΤΑ ΜΕΛΗ ΔΙΔΑΚΤΙΚΟΥ - ΕΡΕΥΝΗΤΙΚΟΥ ΠΡΟΣΩΠΙΚΟΥ

Περιεχόμενα. Μέρος 1: Βασικές έννοιες Πληροφορικής και επικοινωνιών Μέρος 2: Χρήση υπολογιστή και διαχείριση αρχείων Πρόλογος...

Οντολογία Ψηφιακής Βιβλιοθήκης

Λίγα λόγια από το συγγραφέα...7

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Λογική. Ενότητα 1: Εισαγωγή. Δημήτρης Πλεξουσάκης Τμήμα Επιστήμης Υπολογιστών

Γενικά Στοιχεία Ηλεκτρονικού Υπολογιστή

«Οδηγίες χρήσης εφαρμογής Ενιαίου Συστήματος Πληρωμών»

2 ΟΥ και 8 ΟΥ ΚΕΦΑΛΑΙΟΥ

Είσοδος. Καλωσορίσατε στο Ενιαίο Σύστημα Πληρωμών Δαπανών Ηλεκτρονικών Υπηρεσιών.

Κατάλογος Βιβλιοθήκης ΤΕΙ Ηπείρου Ιδρυματικό αποθετήριο ΤΕΙ Ηπείρου Ερευνητικό αποθετήριο ΤΕΙ Ηπείρου:

ΕΡΩΤΗΣΕΙΣ ΚΛΕΙΣΤΟΥ Ή ΑΝΤΙΚΕΙΜΕΝΙΚΟΥ ΤΥΠΟΥ

Σχεδιασμός Βάσεων Δεδομένων

Αναπαράσταση Γνώσης και Αναζήτηση στον Σηµασιολογικό Ιστό

Η διαδικτυακή εφαρμογή ESOG: Εγχειρίδιο χρήσης *

Description Logics. Γεώργιος Χρ. Μακρής MSc, MEd

SilverPlatter WebSPIRS 4.1.

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

Εργαστήριο «Βάσεις Οικολογικών Δεδομένων και Εφαρμογές»

ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι

ΜΑΘΗΜΑ / ΤΑΞΗ : ΑΕΠΠ / Γ ΛΥΚΕΙΟΥ-ΘΕΡΙΝΑ ΣΕΙΡΑ: 1 η ΗΜΕΡΟΜΗΝΙΑ: 09/09/2012

A ΕΠΑ.Λ ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 5 η ΕΝΟΤΗΤΑ: ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ. Εκπαιδευτικοί: ΓΑΛΑΝΟΣ ΓΕΩΡΓΙΟΣ ΜΠΟΥΣΟΥΝΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ

ΕΞΕΤΑΣΤΕΑ ΥΛΗ (SYLLABUS) Ενότητα Advanced Βάσεις Δεδομένων, Προχωρημένο Επίπεδο. Copyright 2013 ECDL Foundation Ref: SL_AM3_Syl2.

Συνοπτικό εγχειρίδιο χρήσης του Microsoft Visual Studio 2010

Σχεδιασµός Ανάπτυξη Οντολογίας

ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΟΛΟΚΛΗΡΩΜΕΝΟΥ ΠΛΗΡΟΦΟΡΙΑΚΟΥ ΣΥΣΤΗΜΑΤΟΣ (ΟΠΣ) ΓΙΑ ΤΗΝ ΠΡΟΓΡΑΜΜΑΤΙΚΗ ΠΕΡΙΟΔΟ ΣΕΣ

Τεχνητή Νοημοσύνη. 23η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Εννοιολογική χαρτογράφηση. Τ. Α. Μικρόπουλος

ΚΟΗΑ ΠΑΡΑΓΓΕΛΙΕΣ ΔΗΜΙΟΥΡΓΙΑ ΚΑΛΑΘΙΟΥ / ΠΡΟΣΘΗΚΗ ΤΕΚΜΗΡΙΩΝ / ΚΛΕΙΣΙΜΟ ΚΑΛΑΘΙΟΥ/ ΠΑΡΑΛΑΒΗ ΠΑΡΑΓΓΕΛΙΩΝ

Περιεχόμενα. Βήμα 4 ο Βήμα 5 ο... 6 Τι πρέπει να προσέξουμε Page 1 ΤΕΧΝΙΚΟ ΕΓΧΕΙΡΙΔΙΟ ΜΑΖΙΚΗΣ ΠΡΟΣΘΗΚΗΣ ΠΡΟΪΟΝΤΩΝ

Οδηγίες Χρήσης της MySQL

Β ΕΙΔΙΚΗ ΦΑΣΗ ΣΠΟΥΔΩΝ

Έστω ένας πίνακας με όνομα Α δέκα θέσεων : 1 η 2 η 3 η 4 η 5 η 6 η 7 η 8 η 9 η 10 η

ΑΝΑΠΤΥΞΗ ΛΟΓΙΣΜΙΚΟΥ ΓΙΑ ΤΗ ΔΙΕΝΕΡΓΕΙΑ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΜΕΛΕΤΩΝ

Καταχώρηση ονομάτων χώρου

Εργαστήριο «Τεχνολογία Πολιτισμικού Λογισμικού» Ενότητα. Επεξεργασία πινάκων

Κεφάλαιο 5. Δημιουργία φορμών για τη βάση δεδομένων DVDclub

Αλγόριθμος. Αλγόριθμο ονομάζουμε τη σαφή και ακριβή περιγραφή μιας σειράς ξεχωριστών οδηγιών βημάτων με σκοπό την επίλυση ενός προβλήματος.

ΓΕΝΙΚΗ ΓΡΑΜΜΑΤΕΙΑ ΔΗΜΟΣΙΩΝ ΕΠΕΝΔΥΣΕΩΝ & ΕΣΠΑ

Βασικές Οδηγίες Χρήσης της Εφαρμογής

Κάθε ένα κελί θα πρέπει να περιέχει ένα μόνο στοιχείο δεδομένων, για παράδειγμα το όνομα σε ένα κελί, το επίθετο σε άλλο κελί.

Βασικοί τύποι δεδομένων (Pascal) ΕΠΑ.Λ Αλίμου Γ Πληροφορική Δομημένος Προγραμματισμός (Ε) Σχολ. Ετος Κων/νος Φλώρος

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Λογική. Δημήτρης Πλεξουσάκης

Τεχνητή Νοημοσύνη. 21η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

HY118-Διακριτά Μαθηματικά. Προτασιακός Λογισμός. Προηγούμενη φορά. Βάσεις της Μαθηματικής Λογικής. 02 Προτασιακός Λογισμός

9 ο Μαθητικό Συνέδριο Πληροφορικής Κεντρικής Μακεδονίας. "My Binary Logic" Ένας προσομοιωτής λογικών πυλών στο Scratch

Σύστημα Κεντρικής Υποστήριξης της Πρακτικής Άσκησης Φοιτητών ΑΕΙ

Πρόβλημα 29 / σελίδα 28

ΕΙΔΗ ΕΡΕΥΝΑΣ I: ΠΕΙΡΑΜΑΤΙΚΗ ΕΡΕΥΝΑ & ΠΕΙΡΑΜΑΤΙΚΟΙ ΣΧΕΔΙΑΣΜΟΙ

Περιεχόμενα. Κεφάλαιο 1 Γνωριμία με το Excel...9

Web-TMS Web Thesaurus Management System

HY118-Διακριτά Μαθηματικά

Εθνικό Κέντρο Τεκμηρίωσης ΕΙΕ. Copyright 2014 Εθνικό Κέντρο Τεκμηρίωσης Ι EIE

Τεχνητή Νοημοσύνη. 8η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Λογισμική Εφαρμογή Διαχείρισης Ερωτηματολογίων ΟΔΗΓΟΣ ΧΡΗΣΗΣ System Συμβουλευτική Α.Ε

3.1 Αριθμητικοί και Λογικοί Τελεστές, Μετατροπές Τύπου (Casting)

Πρόβλημα είναι μια κατάσταση η οποία χρήζει αντιμετώπισης, απαιτεί λύση, η δε λύση της δεν είναι γνωστή, ούτε προφανής.

Εγχειρίδιο Χρήσης Φορέα Πιστοποίησης

Σύστημα Κεντρικής Υποστήριξης της Πρακτικής Άσκησης Φοιτητών ΑΕΙ

Blog στο Wordpress. Επιμέλεια: Δέγγλερη Σοφία

"My Binary Logic" Ένας προσομοιωτής λογικών πυλών στο Scratch

Περιεχόμενα. Κεφάλαιο 1 Γνωριμία με το Excel... 9

Εργαστήριο 6 ο 7 ο / Ερωτήματα Ι

Ο Οδηγός γρήγορης εκκίνησης

Transcript:

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΚΟΥΚΙΟ ΑΡΝΤΙΤ Ερωταποκρίσεις Ελεγχόμενης Φυσικής Γλώσσας για Οντολογίες OWL Επιβλέπων Καθηγητής: Ίων Ανδρουτσόπουλος Βοηθός Επίβλεψης: Γεράσιμος Λάμπουρας [0]

[1]

Κεφάλαιο 1 Εισαγωγή... 3 1.1 Αντικείμενο της εργασίας... 3 1.2 Διάρθρωση της εργασίας... 3 1.3 Ευχαριστίες... 3 Κεφάλαιο 2 - Υπόβαθρο... 5 2.1 Ο Σημασιολογικός Ιστός... 5 2.2 Συστήματα ερωταποκρίσεων... 6 2.3 Παραγωγή Φυσικής Γλώσσας... 7 2.4 Εννοιολογική Συγγραφή... 10 Κεφάλαιο 3 - Περιγραφή των Συστημάτων της Εργασίας... 12 3.1 Το σύστημα Natural Language Question Answering (NLQA)... 12 3.1.1 Αρχιτεκτονική του συστήματος NLQA... 14 3.2 Το σύστημα NaturalOWL Question Answering (NOWLQA)... 20 3.2.1 Αρχιτεκτονική του συστήματος NOWLQA... 25 Κεφάλαιο 4 Δοκιμές και Εκφραστικότητα των Συστημάτων... 30 4.1 Δοκιμές συστημάτων... 30 4.1.1 Δοκιμή του συστήματος NLQA... 30 4.1.2 Δοκιμή του συστήματος NOWLQA... 33 4.2 Εκφραστικότητα της Ελεγχόμενης Φυσικής Γλώσσας... 36 Κεφάλαιο 5 - Συμπεράσματα και Μελλοντική Δουλειά... 39 Βιβλιογραφία... 40 [2]

1 - Εισαγωγή 1-1 Αντικείμενο της εργασίας Σκοπός της εργασίας ήταν η ανάπτυξη ενός συστήματος ερωταποκρίσεων ελεγχόμενης φυσικής γλώσσας για το NaturalOWL [Gal06, Gal07], μια μηχανή παραγωγής κειμένων φυσικής γλώσσας για οντολογίες OWL του Σημασιολογικού Ιστού [Ant08], που αναπτύχθηκε από την Ομάδα Επεξεργασίας Φυσικής Γλώσσας του Οικονομικού Πανεπιστημίου Αθηνών. Έμφαση δόθηκε ώστε η διαδικασία σύνθεσης της ερώτησης να είναι απλή, για να μπορεί να την εκτελέσει ένας χρήστης χωρίς να χρειάζεται να έχει ιδιαιτέρες γνώσεις στον τομέα της πληροφορικής. 1-2 Διάρθρωση της εργασίας Στο κεφάλαιο 2 εισάγονται και εξηγούνται συνοπτικά η θεωρία και οι έννοιες πάνω στις οποίες είναι βασισμένη η παρούσα εργασία. Στο κεφάλαιο 3 παρουσιάζονται αναλυτικά τα δύο συστήματα που αναπτύχθηκαν κατά τη διάρκεια της εργασίας. Στο κεφάλαιο 4, ερευνάται η εκφραστικότητα των δύο συστημάτων. Τέλος, στο κεφάλαιο 5 γίνεται μια ανασκόπηση της εργασίας και προτείνονται μελλοντικές βελτιώσεις. 1-3 Ευχαριστίες Καταρχάς θα ήθελα να ευχαριστήσω τον επιβλέποντα καθηγητή μου κ. Ίωνα Ανδρουτσόπουλο, για την συνεχή καθοδήγηση και βοήθεια που μου πρόσφερε καθ όλη την διάρκεια αυτής της εργασίας. Επιπλέον ευχαριστώ το Γεράσιμο Λάμπουρα για τις συμβουλές, την τεχνική βοήθεια που μου πρόσφερε, καθώς και για το χρόνο που αφιέρωσε για την ανάγνωση και [3]

διόρθωση του κειμένου της εργασίας. Τέλος, ευχαριστώ την ομάδα Επεξεργασίας Φυσικής Γλώσσας του Τμήματος Πληροφορικής του Οικονομικού Πανεπιστημίου Αθηνών, για το ενδιαφέρον τους και τις συμβουλές που μου έδωσαν. [4]

2 - Υπόβαθρο 2.1 Ο Σημασιολογικός Ιστός Ο Σημασιολογικός Ιστός (Semantic Web) [Ber01, Shad06, Ant08] αποτελεί μια προσπάθεια ανάπτυξης μηχανισμών που θα επιτρέπουν στους υπολογιστές να «κατανοούν» ευκολότερα πληροφορίες που δημοσιεύονται στον Παγκόσμιο Ιστό. Για παράδειγμα, η παρακάτω πρόταση, που θα μπορούσε να αποτελεί τμήμα μιας ιστοσελίδας, δύσκολα γίνεται κατανοητή από έναν υπολογιστή. Ο Ναός του Άρη ακολουθούσε το Δωρικό ρυθμό. Αντίθετα, η παρακάτω τύποι, που είναι διατυπωμένοι σε συναρτησιακό συντακτικό (functional-style syntax) της γλώσσας οντολογιών OWL του Σημασιολογικού Ιστού, είναι πιο εύκολα κατανοητοί από ένα υπολογιστή περιέχουν την πληροφορία ότι οι οντότητες «temple-of-ares» και «doric-style» ανήκουν στις τάξεις «Temple» και «Style» αντίστοιχα, και ότι συνδέονται με την σχέση «was-built-in-style». 1 Οι τύποι αυτοί παριστάνουν το νόημα της προηγούμενης πρότασης. ClassAssertion(:Temple :temple-of-ares) ClassAssertion(:Style :doric-style) ObjectPropertyAssertion(:was-built-in-style :temple-of-ares :doric-style) Η γλώσσα οντολογιών OWL (Web Ontology Language), που βασίζεται στο μοντέλο RDF [Ant08], είναι ένα από τα πιο σημαντικά πρότυπα παράστασης γνώσεων του Σημασιολογικού Ιστού. Οι οντολογίες ορίζουν εννοιολογικές τάξεις και υποτάξεις, τις οντότητες που ανήκουν σε αυτές, τις σχέσεις μεταξύ τους, αξιώματα των τάξεων, υποτάξεων και σχέσεων κλπ., με σκοπό να περιγράψουν ένα γνωστικό πεδίο (π.χ. προϊόντα υπολογιστών, ένα αρχαιολογικό χώρο κτλ.). Η OWL2 [Gra08] αποτελεί τη νεότερη έκδοση του προτύπου OWL, αλλά σε αυτή την εργασία χρησιμοποιούμε την έκδοση 1 της OWL. 1 Βλ. http://www.w3.org/tr/owl2-primer/ για μια εισαγωγή στην OWL, καθώς και http://www.w3.org/tr/owl2-overview/ για περισσότερες πληροφορίες. Για πληροφορίες σχετικές με το μοντέλο RDF, βλ. http://www.w3.org/rdf/. [5]

2.2 Συστήματα Ερωταποκρίσεων Τα Συστήματα Ερωταποκρίσεων (Question Answering Systems), γνωστά και ως Διεπαφές Φυσικής Γλώσσας (Natural Language Interfaces) επιτρέπουν στο χρήστη να θέτει ερωτήματα σε φυσική γλώσσα, προκειμένου να αναζητήσει ευκολότερα πληροφορίες π.χ. σε μια βάση δεδομένων [And95] ή μια συλλογή κειμένων [Lam09]. Στην περίπτωση του Σημασιολογικού Ιστού, τα συστήματα ερωταποκρίσεων είναι εξίσου σημαντικά, γιατί ενώ η τυπική (formal) και αυστηρά λογική παράσταση των γνώσεων διευκολύνει την αναζήτηση από έναν υπολογιστή, δυσκολεύει οποιονδήποτε χρήστη δεν διαθέτει γνώσεις περί οντολογιών και δεν γνωρίζει τα πρότυπα (π.χ. τη γλώσσα OWL) του Σημασιολογικού Ιστού. Ο μέσος χρήστης δυσκολεύεται να διατυπώσει το ερώτημά του, καθώς και να κατανοήσει τους λογικούς τύπους που αποτελούν την απάντηση. Έστω, για παράδειγμα, ότι ο χρήστης θέλει να θέσει σε μια οντολογία το παρακάτω ερώτημα. Τι ρυθμό ακολουθούσε ο Ναός του Άρη; Πρέπει να διατυπώσει ένα ερώτημα σε SPARQL, μια τυποποιημένη γλώσσα για τη διατύπωση ερωτημάτων του μοντέλου RDF. 2 Ακολουθεί το παραπάνω ερώτημα διατυπωμένο σε SPARQL-DL [Sir09, Kre08], ένα υποσύνολο της SPARQL για οντολογίες OWL. PropertyValue(temple-of-Ares, was-built-in-style,?x), Type(?x, Style) Το παραπάνω ερώτημα ζητά τη τιμή x της σχέσης «was-built-in-style» για την οντότητα «temple-of-ares», όπου x είναι μια οντότητα της τάξης «Style». Είναι προφανές πως η διατύπωση ενός ερωτήματος στην περίπτωση των οντολογιών OWL δεν είναι εύκολη για ένα χρήστη που δεν έχει τις απαραίτητες γνώσεις των σχετικών προτύπων ή των περιεχομένων της οντολογίας. Δυσνόητη είναι επίσης η επιστρεφόμενη απάντηση, που φαίνεται παρακάτω. 2 Βλ. http://www.w3.org/tr /rdf-sparql-query/ [6]

?x: doric-style Η παραπάνω απάντηση δηλώνει ότι οι δυνατές τιμές που μπορεί να πάρει η μεταβλητή x του ερωτήματος είναι μόνο «doric-style». Η απάντηση θα μπορούσε να γίνει πιο κατανοητή στο χρήστη μέσω Παραγωγής Φυσικής Γλώσσας (Natural Language Generation - NLG), μετατρέποντάς την στην πρόταση «Ο Ναός του Άρη ακολουθούσε το Δωρικό ρυθμό» (βλ. και ενότητα 1.4 παρακάτω). Ένα βασικό πρόβλημα σε πολλά συστήματα ερωταποκρίσεων είναι ότι ο χρήστης δεν είναι εύκολο να καταλάβει ποιες ακριβώς εκφράσεις φυσικής γλώσσας είναι σε θέση το σύστημα να κατανοήσει [Kau10]. Αυτό οδηγεί συχνά τους χρήστες στη διατύπωση ερωτημάτων που το σύστημα δεν μπορεί να απαντήσει. Προκειμένου να γίνουν πιο κατανοητές οι δυνατότητες του συστήματος στους χρήστες, είναι δυνατόν να οριστεί ρητώς ένα υποσύνολο φυσικής γλώσσας, μια ελεγχόμενη φυσική γλώσσα (controlled natural language), της οποίας όλες οι εκφράσεις θα είναι κατανοητές από το σύστημα και της οποίας τα όρια θα είναι κατανοητά στο χρήστη. Τα όρια (οι επιτρεπόμενες εκφράσεις) μιας ελεγχόμενης γλώσσας μπορούν π.χ. να γίνουν ευκολότερα κατανοητά στους χρήστες αν οι χρήστες συνθέτουν τα ερωτήματά τους επιλέγοντας λέξεις ή μεγαλύτερες εκφράσεις από καταλόγους επιλογών, οι οποίοι να εξασφαλίζουν ότι είναι δυνατόν να διατυπωθούν μόνο ερωτήματα που ανήκουν στην ελεγχόμενη γλώσσα. 2.3 Παραγωγή Φυσικής Γλώσσας Η αυτόματη μετατροπή μια λογικής παράστασης γνώσεων σε φυσική γλώσσα είναι το αντικείμενο της Παραγωγής Φυσικής Γλώσσας (Natural Language Generation - NLG) [Rei00]. Για τον σκοπό της συγκεκριμένης εργασίας, χρησιμοποιήθηκε η μηχανή NaturalOWL [Gal06, Gal07], που παράγει κείμενα στα Ελληνικά και Αγγλικά από οντολογίες OWL. Συνοπτικά, το NaturalOWL μετατρέπει τους τύπους της OWL σε τριάδες της μορφής <S, P, O>, όπου S είναι μια οντότητα ή τάξη, P μια ιδιότητα της οντολογίας και O η οντότητα, τάξη ή τιμή με την οποία το S [7]

συσχετίζεται μέσω της P. (Οι τριάδες αυτές είναι παρόμοιες, αλλά όχι πάντα ίδιες, με τις αντίστοιχες τριάδες του μοντέλου RDF.) Για παράδειγμα, ο παρακάτω τύπος: ObjectPropertyAssertion(:was-built-in-style :temple-of-ares :doric-style) μετατρέπεται στην ακόλουθη τριάδα: <:temple-of-ares :was-built-in-style :doric-style> Στη συνέχεια, χρησιμοποιούνται προκατασκευασμένοι γλωσσικοί πόροι για να μετατραπεί η τριάδα σε μια πρόταση φυσικής γλώσσας. Κάθε τάξη ή οντότητα αντιστοιχεί σε μια εγγραφή λεξικού, που περιέχει το όνομα της τάξης ή οντότητας σε φυσική γλώσσα. Πιο συγκεκριμένα, η εγγραφή του λεξικού περιέχει πληροφορίες για τις διαφορετικές μορφές του ονόματος, σε όλους τους αριθμούς και πτώσεις. :temple-of-ares «Ναός του Άρη» :doric-style «Δωρικός Ρυθμός» Κάθε ιδιότητα αντιστοιχεί σε ένα σχέδιο πρότασης (sentence plan), μια σειρά από πεδία που περιγράφουν πώς μπορεί να σχηματιστεί μια πρόταση που να εκφράζει μια τριάδα που εμπλέκει την ιδιότητα. :was-built-in-style [ πεδίο1 S] [ πεδίο2 ακολουθούσε] [ πεδίο3 O] Στο τελικό στάδιο τα σχέδια προτάσεων συμπληρώνονται με όσες πληροφορίες λείπουν. Για παράδειγμα, τα πεδία S και O γεμίζουν με τα αντίστοιχα ονόματα φυσικής γλώσσας ή άλλες αναφορικές εκφράσεις (π.χ. αντωνυμίες), προστίθενται άρθρα και σημεία στίξης κτλ. Ο Ναός του Άρη ακολουθούσε το Δωρικό ρυθμό. Η συνολική λειτουργία του NaturalOWL είναι πολύ πιο πολύπλοκη. Το σύστημα μπορεί να παραγάγει περιγραφές οντοτήτων ή τάξεων, επιλέγοντας τις πιο [8]

ενδιαφέρουσες και σχετικές πληροφορίες της οντολογίας, διατάσσοντας και συνενώνοντας προτάσεις, ώστε να φτιάξει μεγαλύτερες, παράγοντας αυτόματα αναφορικές εκφράσεις κλπ. Για περισσότερες πληροφορίες δείτε τη βιβλιογραφία [Gal06, Gal07]. Τα συστήματα που αναπτύχθηκαν κατά τη διάρκεια αυτής της εργασίας βασίζονται στους μηχανισμούς παραγωγής φυσικής γλώσσας του NaturalOWL και τους γλωσσικούς πόρους που εκείνο χρησιμοποιεί. Η μηχανή NaturalOWL μπορεί επίσης να παράγει ερωτήματα φυσικής γλώσσας. Για κάθε τριάδα <S, P, O>, μπορεί να κατασκευάσει αυτόματα την ερωτηματική μορφή πρότασης που αντιστοιχεί στην τριάδα <S?, P, O> ή <S, P, O?>, όπου με «?» σημειώνεται το μέλος της τριάδας που ζητείται ως απάντηση. Για παράδειγμα, έστω το παρακάτω σχέδιο πρότασης: [ πεδίο1 S] [ πεδίο2 έχτισε] [ πεδίο3 O] από το οποίο προκύπτουν τα παρακάτω ημιτελή ερωτηματικά σχέδια προτάσεων, στη δεύτερη περίπτωση με αυτόματη αναδιάταξη των πεδίων των S και O: [ πεδίο1 S?] [ πεδίο2 έχτισε] [ πεδίο3 O] (Ποιος έχτισε το O;) [ πεδίο1 Ο?] [ πεδίο2 έχτισε] [ πεδίο3 S] (Τι έχτισε ο Ο;) Για κάθε ιδιότητα της οντολογίας (P), διαθέτουμε την πληροφορία αν το S και το Ο είναι πρόσωπα, τοποθεσίες ή χρονικές περίοδοι. Με βάση αυτές τις πληροφορίες αντικαθιστούμε το πεδίο του S ή του O στην αρχή του ερωτηματικού σχεδίου πρότασης με την ερωτηματική λέξη «who»/«ποιος», «where»/«πού» ή «when»/«πότε» αντίστοιχα. Στο πρώτο από τα παραπάνω δύο σχέδια, για παράδειγμα, γνωρίζουμε ότι το S είναι πρόσωπο, οπότε προκύπτει το παρακάτω ερωτηματικό σχέδιο πρότασης: [ πεδίο1 ποιος] [ πεδίο2 έχτισε] [ πεδίο3 Ο] Αν ακολουθήσουμε και το τελευταίο βήμα της παραγωγής και συμπληρώσουμε τα πεδία θα παραχθεί η παρακάτω ερώτηση φυσικής γλώσσας. Ποιος έχτισε την Ακρόπολη; [9]

Στην περίπτωση που το S ή το O για το οποίο ρωτά η ερώτηση δεν είναι πρόσωπο, τοποθεσία, χρονική περίοδος ή άλλο είδος που απαιτεί συγκεκριμένη ερωτηματική λέξη, αντικαθιστούμε το πεδίο του με ένα πεδίο που περιέχει την τάξη στην οποία ανήκει αν είναι οντότητα, την υπερ-τάξη του αν είναι τάξη ή το διαγράφουμε αν είναι τιμή δεδομένων επίσης προσθέτουμε στην αρχή του ερωτηματικού σχεδίου πρότασης ένα πεδίο με την ερωτηματική λέξη what /«τι». Έτσι προκύπτουν ερωτήσεις όπως οι παρακάτω. 2.4 Εννοιολογική Συγγραφή Τι ρυθμό ακολουθεί ο Ναός του Άρη; Τι ήταν ο Αιακός; Στην Εννοιολογική Συγγραφή (Conceptual Authoring) [Hal07, Pow09] ο χρήστης συμπληρώνει και εξειδικεύει λογικές παραστάσεις αλληλεπιδρώντας, όμως, με προτάσεις φυσικής γλώσσας που παράγονται διαρκώς από τις τροποποιούμενες λογικές παραστάσεις μέσω Παραγωγής Φυσικής Γλώσσας. Με παρόμοιο τρόπο μπορούν να σχηματιστούν ερωτήσεις. Για παράδειγμα, έστω πως ο χρήστης θέλει να σχηματίσει την πρόταση «Pericles built the Acropolis». Αρχικά το σύστημα Εννοιολογικής Συγγραφής θα του εμφανίσει την κενή πρόταση. <statement> Επιλέγοντας τον υπερσύνδεσμο «statement» θα εμφανιστεί στο χρήστη μια λίστα με επιλογές, για παράδειγμα μια λίστα με τα κύρια ρήματα των σχεδίων προτάσεων του συστήματος Παραγωγής Φυσικής Γλώσσας. <statement> built destroyed fought were [10]

Ο χρήστης θα επιλέξει από την παραπάνω λίστα την λέξη «built», επιλέγοντας ουσιαστικά έτσι ένα σχέδιο πρότασης, το οποίο πλέον εμφανίζεται. Στο παρακάτω σχέδιο πρότασης οι υπογραμμισμένες λέξεις μπορούν να αντικατασταθούν από άλλες επιλέγοντας πάλι από λίστες. <somebody> built <something> Ομοίως όταν ο χρήστης επιλέξει το «<something>» θα του εμφανιστεί μία λίστα με τις δυνατές αντικαταστάσεις. Στο παράδειγμα μας, το σύστημα θα αγνοήσει όλες τις αντικαταστάσεις που δεν σχετίζονται με το ρήμα «built» και θα εμφανίσει μια λίστα που περιέχει μόνο κτίρια. <somebody> built <something> Επιλέγοντας την λέξη «Acropolis» σχηματίζεται το επόμενο σχέδιο πρότασης, όπου το άρθρο προστίθεται (στην ιδανική περίπτωση) από το σύστημα Παραγωγής Φυσικής Γλώσσας. Acropolis Altar of Aphrodite Ourania Altar of Zeus Agoraios Temple of Ares <somebody> built the Acropolis Αντίστοιχα ο χρήστης μπορεί να αντικαταστήσει το «<somebody>» με το όνομα ενός προσώπου. Ανά πάσα στιγμή ο χρήστης μπορεί να επιλέξει να αλλάξει οποιαδήποτε από τις επιλογές που έχει ήδη κάνει. Για παράδειγμα πατώντας στην λέξη «Acropolis» μπορεί να επιλέξει κάποιο άλλο κτίριο. [11]

3 - Περιγραφή των Συστημάτων της Εργασίας Στο κεφάλαιο αυτό παρουσιάζονται δύο συστήματα ερωταποκρίσεων για οντολογίες OWL που αναπτύχθηκαν στη διάρκεια της εργασίας. 3.1 Το σύστημα Natural Language Question Answering (NLQA) Το σύστημα Natural Language Question Answering (NLQA) είναι το πρώτο από τα δύο συστήματα που αναπτύχθηκαν κατά τη διάρκεια της εργασίας. Χρησιμοποιεί τεχνικές Εννοιολογικής Συγγραφής εκμεταλλευόμενο την μηχανή Παραγωγής Φυσικής Γλώσσας NaturalOWL, τις ερωτήσεις που παράγει και τους γλωσσικούς πόρους που αυτή χρησιμοποιεί. Δεδομένης μιας οντολογίας OWL, ο χρήστης συντάσσει μια ερώτηση προς αυτή μέσω Εννοιολογικής Συγγραφής, το σύστημα ανασύρει την πληροφορία που αποτελεί την απάντηση από την οντολογία και, με την βοήθεια του NaturalOWL, παράγει την απάντηση σε φυσική γλώσσα. Το σύστημα NLQA υποστηρίζει μόνο ερωτήματα δύο κατηγοριών: Ερωτήσεις ορισμού, δηλαδή ερωτήσεις που ζητούν την περιγραφή μιας οντότητας ή τάξης. Παράδειγμα μιας τέτοιας ερώτησης είναι η παρακάτω: What do you know about Aeacus? Ο χρήστης ζητάει από το σύστημα να του δώσει όλες τις διαθέσιμες πληροφορίες για την οντότητα με όνομα Aeacus (Αιακός). Στις ερωτήσεις ορισμού, το σύστημα ζητάει από το NaturalOWL να δημιουργήσει μια περιγραφή σε φυσική γλώσσα της συγκεκριμένης οντότητας και στη συνέχεια παρουσιάζει την περιγραφή στο χρήστη. Στην εικόνα 1 φαίνεται η γραφική διεπαφή του συστήματος με το ερώτημα του παραδείγματος. [12]

Εικόνα 1. Παράδειγμα ερώτησης ορισμού στο σύστημα NLQA. Ερωτήσεις τιμής ιδιότητας, δηλαδή ερωτήματα που ζητούν την τιμή που έχει μια συγκεκριμένη ιδιότητα για μια συγκεκριμένη οντότητα ή τάξη. Παράδειγμα μιας τέτοιας ερώτησης είναι η παρακάτω: When was the Temple of Ares excavated? Ο χρήστης ζητάει από το σύστημα να του δώσει την τιμή που έχει η ιδιότητα excavation-time για την οντότητα temple-of-ares. To σύστημα θα δώσει απάντηση ζητώντας από το NaturalOWL να δημιουργήσει μεμονωμένες προτάσεις, όχι την πλήρη περιγραφή της οντότητας ή τάξης. Συγκεκριμένα, θα ζητήσει από το NaturalOWL να δημιουργήσει τις προτάσεις που αντιστοιχούν στις τριάδες της μορφής <S, P, O>, όπου S η οντότητα που αναφέρεται στην ερώτηση, P η ιδιότητα που αναφέρεται και O όλες οι οντότητες, τάξεις ή τιμές δεδομένων που συνδέονται με το S μέσω του P. Στην εικόνα 2 φαίνεται η γραφική διεπαφή του συστήματος με το ερώτημα του παραδείγματος. [13]

Εικόνα 2. Παράδειγμα ερώτησης τιμής ιδιότητας στο σύστημα NLQA. Και οι δύο παραπάνω κατηγορίες ερωτήσεων μπορούν να παρασταθούν με ερωτηματικές τριάδες <S, P, O>. Για να θεωρείται μια ερωτηματική τριάδα έγκυρη ερώτηση πρέπει να είναι άγνωστο τουλάχιστον ένα από τα μέλη της. Αν στην τριάδα είναι άγνωστα η ιδιότητα P και το O, τότε έχουμε ερώτηση ορισμού. Αν είναι άγνωστο μόνο το Ο, τότε έχουμε ερώτηση τιμής ιδιότητας μιας οντότητας. Δεν επιτρέπουμε σε αυτό το σύστημα να είναι άγνωστο το S. 3.1.1 Αρχιτεκτονική του συστήματος NLQA Τα στάδια επεξεργασίας του συστήματος NLQA είναι τρία (βλ. εικόνα 3): 1. Παραγωγή και ανάλυση των δυνατών ερωτήσεων 2. Σύνταξη ερώτησης 3. Παραγωγή απάντησης Θα περιγράψουμε τα στάδια αυτά στις παρακάτω ενότητες. [14]

Παραγωγή Ελεγχόμενης Φυσικής Γλώσσας Οντολογία OWL Γλωσσικοί Πόροι Παραγωγή Φυσικής Γλώσσας (NaturalOWL) Ερωτήσεις Φυσικής Γλώσσας Παραγωγή Ελεγχόμενης Φυσικής Γλώσσας Ερώτημα Απάντηση XML Ελεγχόμενης Φυσικής Γλώσσας Ερώτημα Φυσικής Γλώσσας Διεπαφή Φυσικής Γλώσσας Χρήστης Σύνταξη ερώτησης Παραγωγή απάντησης Εικόνα 3. Αρχιτεκτονική του συστήματος NLQA. Παραγωγή Ελεγχόμενης Φυσικής Γλώσσας Στο στάδιο αυτό θεωρούμε ως είσοδο του συστήματος την οντολογία στην οποία θέλουμε να θέσουμε τα ερωτήματα και τους απαραίτητους γλωσσικούς πόρους για την παραγωγή φυσικής γλώσσας από αυτή. Αρχικά το NLQA ζητάει από το NaturalOWL να κατασκευάσει όλες τις δυνατές ερωτήσεις που μπορεί από την οντολογία. Για κάθε τριάδα της μορφής <S, P, O> παράγονται ερωτηματικά σχέδια προτάσεων πού αντιστοιχούν στις δυνατές [15]

ερωτήσεις τιμής ιδιότητας, όπως η παρακάτω: When was the Temple of Ares excavated? Στη συνέχεια, για όλες τις οντότητες και τάξεις που υπάρχουν στην οντολογία παράγονται ερωτήσεις ορισμού σύμφωνα με το παρακάτω ερωτηματικό σχέδιο: [ πεδίο1 what] [ πεδίο2 do you know about] [ πεδίο3 Ο] όπου Ο είναι μια οντότητα ή τάξη της οντολογίας. Για όσα Ο δείχνει η οντολογία ότι είναι πρόσωπα, παράγονται και ερωτήσεις ορισμού σύμφωνα με το επόμενο ερωτηματικό σχέδιο: [ πεδίο1 who] [ πεδίο2 was] [ πεδίο3 O] Έπειτα το σύστημα επεξεργάζεται τις παραχθείσες ερωτήσεις και τις αποθηκεύει σε μια ενδιάμεση μορφή, εκφρασμένη σε XML. Η XML μορφή ουσιαστικά αποτελεί την Ελεγχόμενη Φυσική Γλώσσα του συστήματος και βοηθάει στον καθορισμό της δομής των ερωτήσεων, καθώς και στη σύνδεσή τους με τις οντότητες, τάξεις και ιδιότητες στις οποίες αναφέρονται. Παρακάτω δίδεται ένα παράδειγμα: <data id="ontology.owl"> <individual id="1" name="athenion" url=" #Athenion"> <question entity_url= #Athenion id="1027" property_url="" question_str="who is Athenion"> <slot id="1" importance="2" list="1" name="who" text="who " type="type"/> <slot id="2" importance="0" list="0" name="is" text="is " type="verb"/> <slot id="3" importance="2" list="0" name="athenion" text="athenion " type="individual"/> [16]

</data> </individual> </question> <slot id="4" importance="0" list="0" name="?" text="? " type="punctuation"/> <question entity_url= #Athenion id="646" property_url="" question_str="what do you know about Athenion"> </question> <slot id="1" importance="2" list="1" name="what" text="what " type="type"/> <slot id="2" importance="2" list="2" name="do you know" text="do you know about " type="verb"/> <slot id="3" importance="2" list="0" name="athenion" text="athenion " type="individual"/> <slot id="4" importance="0" list="0" name="?" text="? " type="punctuation"/> <individual id="2" name="karystos" url=" #Karystos"> </individual>... Στην παραπάνω μορφή αποθηκεύονται όλες οι ερωτήσεις που μπορούν να γίνουν προς τη συγκεκριμένη οντολογία. Κάθε οντότητα ή τάξη συνδέεται με ένα ή περισσότερα σχέδια ερωτημάτων, τα οποία περιέχουν πληροφορίες για την σύνταξη της ερώτησης μέσω Εννοιολογικής Συγγραφής. Σύνταξη ερώτησης Το σύστημα δείχνει αρχικά μια τυχαία ερώτηση και ο χρήστης μπορεί να επεξεργαστεί τα τμήματα της, ώστε να σχηματίσει όποια ερώτηση θέλει. Ας [17]

θεωρήσουμε ότι το σύστημα έχει παραγάγει την παρακάτω ερώτηση. What do you know about the Temple of Ares? Η ερώτηση αποτελείται από τρία τμήματα (slots) τα οποία μπορεί να αλλάξει ο χρήστης: την ερωτηματική λέξη, την οντότητα και την ιδιότητα στις οποίες αναφέρεται η ερώτηση. Οι επιλογές που κάνει ο χρήστης στα αριστερότερα τμήματα επηρεάζουν και περιορίζουν τις επιλογές στα δεξιότερα τμήματα. Το πρώτο τμήμα είναι η ερωτηματική λέξη, που καθορίζει τον τύπο της ερώτησης. What do you know about the Temple of Ares? What When Where Who Αν ο χρήστης επιλέξει την ερωτηματική λέξη «When», σχηματίζει αναγκαστικά μια ερώτηση που αφορά κάποια χρονική περίοδο και τα δεξιότερα τμήματα περιορίζονται στις ιδιότητες και οντότητες που σχετίζονται με χρονικές περιόδους. Αντίστοιχα οι ερωτηματικές λέξεις «Where» και «Who» οδηγούν σε ερωτήματα για τοποθεσίες και πρόσωπα ή οργανισμούς. Επίσης οι επιλογές «When» και «Where» οδηγούν αναγκαστικά σε ερωτήσεις τιμής ιδιότητας, ενώ οι «Who» και «What» σχηματίζουν και ερωτήσεις ορισμού. Αν στο ίδιο παράδειγμα ο χρήστης επιλέξει την ερωτηματική λέξη «When», το δεξιότερα τμήματα θα αλλάξουν, αν είναι απαραίτητο, ώστε να περιέχουν μια οντότητα και ιδιότητα της οντολογίας που συσχετίζεται με μια χρονική περίοδο. When was the Temple of Ares destroyed? [18]

Αλλάζοντας το δεύτερο τμήμα, ο χρήστης μπορεί να ορίσει κάποια άλλη οντότητα ή τάξη. When was the Temple of Ares destroyed? Temple of Zeus Ares Acropolis Αν η ιδιότητα που εμφανίζεται στην ερώτηση δεν συνδέεται με την οντότητα που επέλεξε ο χρήστης, επιλέγεται μία άλλη ιδιότητα τυχαία, που να συνδέεται και να συμφωνεί με τον τύπο της ερώτησης. Αν μια οντότητα δεν έχει κάποια ιδιότητα που να συμφωνεί με τον τύπο της ερώτησης, δεν εμφανίζεται στη λίστα. Το τρίτο τμήμα καθορίζει την ιδιότητα στην οποία αναφέρεται η ερώτηση. Στη λίστα εμφανίζονται μόνο ιδιότητες που συνδέονται με την ήδη επιλεγμένη οντότητα ή τάξη και σχετίζονται με τον τύπο της ερώτησης. When was the Temple of Ares destroyed? excavated built Η επιλογή για ερώτηση ορισμού εμφανίζεται μόνο αν η επιλεγμένη ερωτηματική λέξη είναι «What» ή «Who». Η επιλογή αυτή εμφανίζεται ως η ψευδο-ιδιότητα «do you know about» ή «was» αντίστοιχα. What was the Temple of Ares made of? do you know about used as [19]

Παραγωγή απάντησης Στο τελευταίο στάδιο του συστήματος NLQA γίνεται σημασιολογική ανάλυση του ερωτήματος του χρήστη και παράγεται η απάντηση. Η σημασιολογική ανάλυση είναι εξαιρετικά απλή στην περίπτωσή μας, αφού γνωρίζουμε ακριβώς σε ποια οντότητα και/ή ιδιότητα αντιστοιχεί η ερώτηση χάρη στη φύση της Ελεγχόμενης Φυσικής Γλώσσας που χρησιμοποιούμε. Την παραγωγή της απάντησης αναλαμβάνει η μηχανή NaturalOWL παράγοντας μια περιγραφή της αναφερόμενης οντότητας/τάξης, εάν πρόκειται για ερώτηση ορισμού ή ένα σύνολο προτάσεων, εάν πρόκειται για ερώτηση τιμής ιδιότητας. Στα παραγόμενα κείμενα είναι σημειωμένες ως σύνδεσμοι (hyperlinks) όσες οντότητες και τάξεις αναφέρονται. Επιλέγοντας κάποια από αυτές, παράγεται αυτόματα μια τυχαία ερώτηση που να την αναφέρει, την οποία μπορεί στη συνέχεια ο χρήστης να τροποποιήσει. 3.2 Το σύστημα NaturalOWL Question Answering (NOWLQA) Το σύστημα NLQA, το οποίο περιγράψαμε στις προηγούμενες παραγράφους, μπορεί να απαντήσει ερωτήσεις που προκύπτουν από τριάδες <S, P, O>, όπου είναι άγνωστο είτε μόνο το O, είτε η ιδιότητα P και το O μαζί. Αυτό είναι αρκετό για απλές ερωτήσεις της μορφής π.χ. «Ποιος δημιούργησε τη Μόνα Λίζα;», αλλά δεν καλύπτει σύνθετες ερωτήσεις, όπως π.χ. «Ποιος δημιούργησε την Μόνα Λίζα και ποια άλλα έργα δημιούργησε;». Ο χρήστης θα έπρεπε να χωρίσει την σύνθετη ερώτηση σε δύο, εισάγοντας αρχικά την ερώτηση «Ποιος δημιούργησε τη Μόνα Λίζα;» και έπειτα να χρησιμοποιήσει την απάντηση του συστήματος (Λεονάρντο Ντα Βίντσι) για να συνθέσει την ερώτηση «Ποια είναι τα έργα του Λεονάρντο Ντα Βίντσι;». Επίσης, το σύστημα NLQA δεν επιτρέπει ερωτήματα αναζήτησης συσχετισμού μεταξύ δύο οντοτήτων ή τάξεων. Για παράδειγμα, δεν επιτρέπει την ερώτηση «Ποια σχέση συνδέει τον Λεονάρντο Ντα Βίντσι με τη Μόνα Λίζα;». Το σύστημα NaturalOWL Question Answering (NOWLQA) (βλ. εικόνα 4) αποτελεί [20]

επέκταση του NLQA και αναπτύχθηκε για να υποστηρίξει πιο σύνθετες ερωτήσεις. Με το σύστημα αυτό ο χρήστης μπορεί να συνθέσει τρεις κατηγορίες προτάσεων. Εικόνα 4. Η κεντρική οθόνη του συστήματος NOWLQA. Ερωτήσεις ορισμού, δηλαδή ερωτήσεις που ζητούν την περιγραφή μιας οντότητας ή τάξης, όπως και στο σύστημα NLQA. Η μόνη διαφορά βρίσκεται στη σύνταξη της ερώτησης. Aντί να συνθέσει μια ερώτηση (π.χ. «Who is Attalus II?») ο χρήστης επιλέγει (από κατάλογο επιλογών) απλώς την οντότητα ή τάξη που τον ενδιαφέρει (π.χ. «Describe Attalus II»). Στην εικόνα 5 φαίνεται η γραφική διεπαφή του συστήματος για ερωτήσεις ορισμού με το ερώτημα του παραδείγματος. [21]

Εικόνα 5. Παράδειγμα ερώτησης ορισμού στο σύστημα NOWLQA. Σύνθετες ερωτήσεις, δηλαδή ερωτήματα διερεύνησης των οντοτήτων, τάξεων ή ιδιοτήτων που ικανοποιούν κάποιους περιορισμούς. Αρχικά ο χρήστης εισάγει έναν αριθμό μεταβλητών, των οποίων τις δυνατές τιμές θέλει να μάθει. Στη συνέχεια περιορίζει τις μεταβλητές συνθέτοντας δηλώσεις που τις περιγράφουν. Γενικά τα ερωτήματα είναι της μορφής: Find X1 ΧΝ such that (AND/OR) <S1, P1, O1> <SN, PN, ON> Οποιοδήποτε μέλος (S, P ή Ο) των τριάδων <S, P, O> που αντιστοιχούν στους περιορισμούς μπορεί να αντικατασταθεί από κάποια μεταβλητή. Για παράδειγμα, έστω πως ο χρήστης θέλει να σχηματίσει την παρακάτω ερώτηση. [22]

What material were the Temple of Ares and Acropolis created from? Στο σύστημα NLQA ο χρήστης θα έπρεπε να κάνει ξεχωριστά τις παρακάτω ερωτήσεις και να συγκρίνει τα αποτέλεσμα τους για ομοιότητες. What material was the Temple of Ares created from? What material was Acropolis created from? Με το NOWLQA ο χρήστης εισάγει αρχικά την μεταβλητή που αναζητεί, έστω Χ1 (material). Στη συνέχεια σχηματίζει δηλώσεις, που περιορίζουν τη Χ1, διαμορφώνοντας το παρακάτω ερώτημα. Find X1 such that The Temple of Ares was created from X1 AND Acropolis was created from X1 Οι δύο περιορισμοί συνδέονται με λογική σύζευξη, καθώς θέλουμε να ισχύουν και οι δύο ταυτόχρονα. Η μορφή αυτή είναι ισοδύναμη με την αρχική ερώτηση και κατανοητή από το χρήστη. Συνδυάζει την εκφραστικότητα της φυσικής γλώσσας με τη γενική μορφή των ερωτημάτων SPARQL-DL. Μεταβλητές μπορούν επίσης να χρησιμοποιηθούν για να συνδυάσουν τους περιορισμούς, κάτι που χρειάζεται στην παρακάτω ερώτηση. Who was the creator of the Mona Lisa and what other paintings has he/she created? Η ερώτηση αυτή ουσιαστικά αποτελείται από δύο απλές ερωτήσεις τιμής ιδιότητας. Who was the creator of the Mona Lisa? What other paintings has he/she created? [23]

Θέτοντας τον δημιουργό (creator) ως μεταβλητή, έστω Χ2, μπορούμε να σχηματίσουμε το παρακάτω ερώτημα με το NOWLQA. Find X1, Χ2 such that Mona Lisa was created by X1 AND X1 created X2 Υπάρχει ακόμα η δυνατότητα σύνδεσης των περιορισμών με λογική διάζευξη, καθώς και η δημιουργία φωλιασμένων διαζεύξεων σε συζεύξεις κτλ. για σχηματισμό ακόμα πιο πολύπλοκων ερωτημάτων. Εικόνα 6. Παράδειγμα σύνθετης ερώτησης στο σύστημα NOWLQA. Ορθές δηλώσεις, όπου ο χρήστης σχηματίζει προτάσεις που αντιστοιχούν σε πλήρεις τριάδες <S, O, P>, χωρίς δηλαδή κάποιο άγνωστο στοιχείο. Το σύστημα δεν επιτρέπει στον χρήστη να εισαγάγει κάποια ιδιότητα ή οντότητα που να μην συνδέεται ήδη στην οντολογία με τα υπόλοιπα στοιχεία της τριάδας και έτσι δεν [24]

μπορεί να σχηματίσει ψευδείς δηλώσεις. Ο μηχανισμός αυτός βοηθά το χρήστη να ερευνήσει ποιες δηλώσεις είναι ορθές σε μια συγκεκριμένη οντολογία. Στην εικόνα 7 φαίνεται η γραφική διεπαφή του συστήματος για δηλώσεις ο χρήστης συνθέτει τη δήλωσή του κάτω από την προτροπή «it is true that». Εικόνα 3. Παράδειγμα δήλωσης στο σύστημα NOWLQA. 2.1.1 Αρχιτεκτονική του συστήματος NOWLQA Η αρχιτεκτονική του συστήματος NOWLQA είναι παρόμοια με την αρχιτεκτονική του συστήματος NLQA οι διαφορές των σταδίων περιγράφονται στις παρακάτω ενότητες. [25]

Παραγωγή Ελεγχόμενης Φυσικής Γλώσσας Το στάδιο της παραγωγής Ελεγχόμενης Φυσικής Γλώσσας από τις παραχθείσες ερωτήσεις του NaturalOWL είναι ίδιο με το αντίστοιχο στάδιο του συστήματος NLQA. Ωστόσο, λόγω των διαφορών στη σύνταξη των ερωτήσεων, καθώς και της πρόσθετης λειτουργικότητας που έχει το σύστημα, η δομή του παραγόμενου XML αρχείου είναι αρκετά διαφορετική. Παρατίθεται ένα τμήμα του στη συνέχεια. <data id="ontology.owl"> </data> <individual id="1" text="the South Stoa I" uri=" #south-stoa-i"> </individual> <property id="1.1" text="was in use during" uri=" #using-period"> <answer id="1.1.1" text="the Classical period" uri=" #Classical"/> </property> <property id="1.2" text="is located in" uri=" #location-agora"> </property> <answer id="1.2.1" text="southern part of the Agora " uri=" #South"/> <individual id="2" text="the New Bouleuterion" uri=" #new-bouleuterion"> </individual> Σύνταξη ερώτησης Η σύνταξη ερώτησης είναι παρόμοια με το αντίστοιχο στάδιο στο σύστημα NLQA, ειδικά σε ό,τι αφορά τις ερωτήσεις ορισμού και τη σύνθεση ορθών δηλώσεων. Πρόσθετη λειτουργικότητα παρέχεται για τις σύνθετες ερωτήσεις. [26]

Ο χρήστης μπορεί για οποιοδήποτε τμήμα ενός περιορισμού να επιλέξει, πέρα από κάποια άλλη οντότητα, τάξη ή ιδιότητα, κάποια υπάρχουσα μεταβλητή ή να εισαγάγει μια καινούργια. Find X1 such that The Temple of Ares was created from X1 [+] X1 New Variable ----------------------------- was built in is located in Επιλέγοντας το σύμβολο [+] στο τέλος ενός περιορισμού, ο χρήστης έχει την επιλογή να προσθέσει ένα νέο περιορισμό συνδεδεμένο με τον αρχικό με λογική σύζευξη ή να αφαιρέσει τον αρχικό περιορισμό. Find X1 such that The Temple of Ares was created from X1 [+] AND [+] The Temple of Ares was created from X1 [+] Πατώντας πάνω στην λέξη AND μπορεί να μετατρέψει τη λογική σύζευξη σε διάζευξη και το ανάποδο. Εάν επιλέξει το σύμβολο [+] δίπλα στη σύζευξη/διάζευξη, αντίστοιχα) μπορεί να προσθέσει ένα νέο περιορισμό στη σύζευξη/διάζευξη ή να την αφαιρέσει τελείως. Το σύμβολο [+] δίπλα στον περιορισμό θα δημιουργήσει μια φωλιασμένη σύζευξη/διάζευξη. Find X1 such that The Temple of Ares was created from X1 [+] OR [+] The Temple of Ares was created from X1 [+] [27]

AND [+] The Temple of Ares was created from X1 [+] Παραγωγή απάντησης Στο στάδιο αυτό, όπως και στο αντίστοιχο του συστήματος NLQA, γίνεται η σημασιολογική ανάλυση της ερώτησης και παράγεται η απάντηση. Η λειτουργία αυτού του σταδίου διαφοροποιείται ανάλογα με τον τύπο της ερώτησης. Αν η ερώτηση είναι ερώτηση ορισμού, τότε η διαδικασία είναι πανομοιότυπη με την αντίστοιχη του συστήματος NLQA. Στην περίπτωση σύνθετης ερώτησης, τότε η εφαρμογή πρέπει πρώτα να συνθέσει μια ισοδύναμη ερώτηση σε γλώσσα SPARQL-DL. Έστω το παρακάτω ερώτημα: Find X1 such that The Temple of Ares was created from X1 AND Acropolis was created from X1 Το ισοδύναμο ερώτημα σε SPARQL-DL ακολουθεί: PropertyValue(temple-of-Ares, was-created-from,?x) PropertyValue(Acropolis, was-created-from,?x) Εκτελώντας το ερώτημα στην οντολογία εξάγουμε τα στοιχεία που το απαντούν και μέσω της NaturalOWL παράγουμε μια κατάλληλη απάντηση σε φυσική γλώσσα. Αν έχουν χρησιμοποιηθεί λογικές διαζεύξεις στο ερώτημα, μπορεί να υπάρχουν πολλές δυνατές απαντήσεις. Τέλος, στην περίπτωση ορθής δήλωσης, απλώς εμφανίζεται στο χρήστη ένα μήνυμα που επιβεβαιώνει την αλήθεια της δήλωσης που συνέθεσε, καθώς, όπως προαναφέρθηκε, το σύστημα επιτρέπει την δημιουργία μόνο αληθών δηλώσεων. [28]

[29]

4 Δοκιμές και Εκφραστικότητα των Συστημάτων 4.1 Δοκιμές συστημάτων Για τις δοκιμές των δύο συστημάτων της εργασίας χρησιμοποιήθηκε μια οντολογία που περιγράφει τα κτίρια της Αρχαίας Αγοράς της Αθήνας και τα πρόσωπα και γεγονότα που συνδέονται με την ιστορία τους. Η οντολογία αναπτύχθηκε στη διάρκεια του ευρωπαϊκού ερευνητικού έργου INDIGO [Kons08]. 3 Η οντολογία του INDIGO, οι γλωσσικοί πόροι τους οποίους χρησιμοποιεί το σύστημα παραγωγής φυσικής γλώσσας NaturalOWL για να παράγει κείμενα από την οντολογία αυτή, καθώς και το ίδιο το NaturalOWL είναι δημόσια διαθέσιμα. 4 4.1.1 Δοκιμή του συστήματος NLQA Παρακάτω δίνεται ένα παράδειγμα χρήσης του πρώτου συστήματος (NLQA). Παρουσιάζονται αναλυτικά τα βήματα σύνθεσης της ερώτησης μέσω του γραφικού περιβάλλοντος του συστήματος. Έστω ότι θέλουμε να σχηματίσουμε την παρακάτω ερώτηση. When was the Altar of Zeus Agoraios excavated? Σύνθεση της ερώτησης: 1. Αρχική οθόνη του συστήματος. 2. Στην εκκίνηση σύνθεσης της ερώτηση το σύστημα ζητά να επιλέξουμε το 3 Βλ. http://www.ics.forth.gr/indigo/. 4 Βλ. http://nlp.cs.aueb.gr/software.html. [30]

υποκείμενο της ερώτησης («Altar of Zeus Agoraios»). 3. Αποτέλεσμα από την επιλογή του υποκειμένου της ερώτησης. Το σύστημα παράγει αυτόματα μια τυχαία ερώτηση για αυτό το υποκείμενο. Θεωρούμε ότι είναι πιο εύκολο για τον χρήστη να επεξεργαστεί τα στοιχεία μιας ήδη υπάρχουσας ερώτησης από το να σχηματίσει μία από την αρχή. 4. Επιλογή της ερωτηματικής λέξης «When» για να ορίσουμε ότι θέλουμε να συνθέσουμε ερώτηση χρόνου. 5. Αποτέλεσμα από την επιλογή της ερωτηματικής λέξης «When». Και πάλι το σύστημα παράγει μια τυχαία ερώτηση, αυτή τη φορά που να συμφωνεί με το υποκείμενο και την ερωτηματική λέξη. [31]

6. Επιλογή του ρήματος «excavated». Ουσιαστικά επιλέγεται έτσι η αντίστοιχη ιδιότητα. 7. Αποτέλεσμα από την επιλογή του «excavated». Η ερώτηση έχει πλέον συντεθεί. Πατώντας το κουμπί «Generate Answer» το σύστημα παράγει μια απάντηση σε φυσική γλώσσα. [32]

4.1.2 Δοκιμή του συστήματος NOWLQA Παρακάτω δίνεται ένα παράδειγμα χρήσης του δεύτερου συστήματος (NLQA). Έστω ότι θέλουμε να σχηματίσουμε την παρακάτω σύνθετη ερώτηση. Which island was Aeacus the Mythological king of and where is that island located? Σύνθεση της ερώτησης: 1. Αρχική οθόνη του συστήματος με επιλογές σύνθεσης ερώτησης ορισμού («Describe something»), σύνθετης ερώτησης («Find X such that») ή ορθής δήλωσης («It is true that»). 2. Αποτέλεσμα από την επιλογή δημιουργίας σύνθετης ερώτησης από την αρχική οθόνη. Το σύστημα παράγει αυτόματα μια τυχαία ερώτηση για να καθοδηγήσει καλύτερα το χρήστη. 3. Επιλογή του υποκειμένου «Aeacus» αντί της οντότητας «South Stoa I». Ο χρήστης θα μπορούσε επίσης να αντικαταστήσει το «Aeacus» με μια υπάρχουσα ή [33]

νέα μεταβλητή. 4. Επιλογή δημιουργίας νέου περιορισμού για την σύνθετη ερώτηση. Ο χρήστης μπορεί να επιλέξει ο νέος περιορισμός να χρησιμοποιεί μια υπάρχουσα ή νέα μεταβλητή. Στο παράδειγμά μας επιλέγει την προσθήκη νέας μεταβλητής. Οι μεταβλητές ονομάζονται αυτόματα. 5. Αποτέλεσμα της επιλογής του δεύτερου περιορισμού. [34]

6. Επιλογή της ιδιότητας is located in στον δεύτερο περιορισμό. 7. Αποτέλεσμα από την επιλογή της ιδιότητας is located in. Πατώντας το κουμπί Generate Answer, όπως και στο προηγούμενο σύστημα, παράγεται η απάντηση. Στις σύνθετες ερωτήσεις παράγεται μια λίστα με τις δυνατές τιμές των μεταβλητών. [35]

4.2 Εκφραστικότητα της Ελεγχόμενης Φυσικής Γλώσσας Τα συστήματα που παρουσιάσαμε στα προηγούμενα κεφάλαια χρησιμοποιούν μια αυτόματα παραγόμενη Ελεγχόμενη Φυσική Γλώσσα βασισμένη πάνω σε μια συγκεκριμένη οντολογία και γλωσσικούς πόρους αυτής. Η εκφραστικότητα της παραγόμενης Ελεγχόμενης Φυσικής Γλώσσας σίγουρα δεν είναι πλήρης, με την έννοια πως η παραγόμενη γλώσσα δεν μπορεί να εκφράσει όλες τις ερωτήσεις που θα μπορούσε να διατυπώσει κάποιος χρήστης σε φυσική γλώσσα ή σε κάποια τυπική γλώσσα όπως η SPARQL-DL. Για να εξετάσουμε την εκφραστικότητα της Ελεγχόμενης Φυσικής Γλώσσας που παράγουμε, θα ελέγξουμε το κατά πόσο τα συστήματα μας καλύπτουν ένα σύνολο ερωτήσεων. Σε πρόσφατη έρευνα [Dritsou11] μελετήθηκαν συλλογές κειμένων και εκθεσιακοί κατάλογοι μουσειακών συλλογών, με σκοπό την εξαγωγή πρότυπων ερωτήσεων. Τα κείμενα που μελετήθηκαν περιγράφουν μουσειακά εκθέματα, έχουν συγγραφεί από αρχαιολόγους και ιστορικούς και είναι δημόσια διαθέσιμα από το Ελληνικό Υπουργείο Τουρισμού. Από τα κείμενα που μελετήθηκαν δημιουργήθηκαν ερωτήσεις (τις οποίες απαντούν τα κείμενα), καθώς και πρότυπα ερωτήσεων που γενικεύουν τις ερωτήσεις που δημιουργήθηκαν. Ακολουθούν μερικά παραδείγματα ερωτήσεων που καλύπτονται από τα πρότυπα: Find all individuals of class Temple. Find all individuals, except the Stoa of Attalus, which are located in the Ancient Agora of Athens. Find all individuals of class building that were in use during the Classical Period. Συνολικά εξήχθησαν 23 πρότυπα ερωτήσεων από τα κείμενα των εκθεμάτων. Εξετάσαμε κατά πόσον τα 23 πρότυπα ερωτήσεων υποστηρίζονται από τις Ελεγχόμενες Φυσικές Γλώσσες των συστημάτων NLQA και NOWLQA, στην περίπτωση της οντολογίας του INDIGO. Στον πίνακα 1 παρουσιάζονται τα αποτελέσματα. Στην πρώτη στήλη εμφανίζεται ο αριθμός του προτύπου ερώτησης, όπως στην παραπάνω μελέτη [Dritsou11]. Στις επόμενες στήλες φαίνεται η κάλυψη [36]

των ερωτήσεων που προκύπτουν από το πρότυπο από τα συστήματα NLQA και NOWLQA αντίστοιχα. Κωδικός Προτύπου Ερώτησης NLQA NOWLQA 1 ΝΑΙ ΝΑΙ 2 ΟΧΙ ΝΑΙ 3 ΝΑΙ ΝΑΙ 4 ΟΧΙ ΝΑΙ 5 ΟΧΙ ΝΑΙ 6 ΟΧΙ ΟΧΙ 7 ΟΧΙ ΟΧΙ 8 ΟΧΙ ΝΑΙ 9 ΟΧΙ ΝΑΙ 10 ΟΧΙ ΟΧΙ 11 ΟΧΙ ΟΧΙ 12 ΟΧΙ ΝΑΙ 13 ΟΧΙ ΝΑΙ 14 ΟΧΙ ΝΑΙ 15 ΟΧΙ ΝΑΙ 16 ΟΧΙ ΝΑΙ 17 ΟΧΙ ΝΑΙ 18 ΟΧΙ ΟΧΙ 19 ΟΧΙ ΟΧΙ 20 ΟΧΙ ΝΑΙ 21 ΟΧΙ ΝΑΙ 22 ΟΧΙ ΟΧΙ 23 ΟΧΙ ΝΑΙ Πίνακας 1. Κάλυψη προτύπων ερωτήσεων από τα συστήματα NLQA και NLOWLQA. Το σύστημα NLQA καλύπτει μόνο τα 2 από τα 23 πρότυπα ερωτήσεων (8,6%). Το ποσοστό αυτό είναι αναμενόμενο, αφού, όπως προαναφέρθηκε, το σύστημα αυτό υποστηρίζει μόνο ερωτήσεις ορισμού και αναζήτησης τιμής ιδιότητας. Η [37]

εκφραστικότητα του NOWLQA είναι πολύ πιο εκτεταμένη. Tο NOWLQA καλύπτει 16 από τα 23 πρότυπα (69.56%). Tα πρότυπα ερωτήσεων που αδυνατεί να καλύψει το σύστημα περιέχουν κάποια μορφή άρνησης. Προς το παρόν το NOWLQA δεν υποστηρίζει αρνήσεις. Με την προσθήκη υποστήριξης για αρνήσεις, το NOWLQA θα μπορούσε να καλύψει και τα 23 πρότυπα ερωτήσεων. [38]

5 - Συμπεράσματα και Μελλοντική Δουλειά Κατά τη διάρκεια της εργασίας αναπτύχθηκαν δύο συστήματα ερωταποκρίσεων ελεγχόμενης φυσικής γλώσσας βασισμένα σε ένα υπάρχον σύστημα παραγωγής κειμένων φυσικής γλώσσας για οντολογίες OWL. Τα δύο συστήματα ερωταποκρίσεων παράγουν αυτόματα μια ελεγχόμενη φυσική γλώσσα για μια συγκεκριμένη κάθε φορά οντολογία OWL, εκμεταλλευόμενα τους γλωσσικούς πόρους που χρησιμοποιεί το σύστημα παραγωγής κειμένων για να συνθέτει κείμενα από τη συγκεκριμένη οντολογία. Η παραγόμενη ελεγχόμενη φυσική γλώσσα υποστηρίζεται και στα δύο συστήματα από γραφική διεπαφή, μέσω της οποίας ο χρήστης εισάγει ερωτήματα. Η ελεγχόμενη γλώσσα του δεύτερου συστήματος επιτρέπει την εισαγωγή πιο περίπλοκων ερωτημάτων, αλλά η χρήση του πρώτου συστήματος είναι απλούστερη. Τα δύο συστήματα δοκιμάστηκαν με μια υπάρχουσα οντολογία για την Αρχαία Αγορά της Αθήνας. Μελετήθηκε επίσης κατά πόσον οι ελεγχόμενες γλώσσες των δύο συστημάτων καλύπτουν μια συλλογή προτύπων ερωτήσεων που είχε δημιουργηθεί σε προηγούμενη μελέτη. Υπάρχουν αρκετά περιθώρια βελτίωσης των συστημάτων της εργασίας. Η υποστήριξη λογικής άρνησης θα βελτίωνε περαιτέρω την εκφραστικότητα της ελεγχόμενης φυσικής γλώσσας του δεύτερου συστήματος. Μια άλλη βελτίωση θα ήταν η υποστήριξη ερωτήσεων αριθμητικής φύσεως, σύγκρισης αριθμητικών τιμών δεδομένων ή σύγκρισης χρονικών περιόδων. Τέλος, θα είχε ενδιαφέρον η δοκιμή των συστημάτων με μεγαλύτερη ποικιλία οντολογιών, καθώς και η υποστήριξη της Ελληνικής γλώσσας, που προς το παρόν δεν υποστηρίζεται. [39]

Βιβλιογραφία [And95] I. Androutsopoulos, G.D. Ritchie, P. Thanisch, Natural Language Interfaces to Databases An Introduction, Natural Language Engineering, 1(1):29 81, 1995. [Ant08] G. Antoniou and F. van Harmelen, A Semantic Web Primer, 2nd ed., MIT Press, 2008. [Ber01] T. Berners-Lee, J. Hendler and O. Lassila, The Semantic Web, Scientific American, May 2001, pp. 34 43. [Dritsou11] V. Dritsou, Formulation and Efficient Execution of Frequent Queries in RDF Databases, PhD thesis, Department of Informatics, Athens University of Economics and Business, 2011. [Gal06] D. Galanis, Development of a Natural Language Generation Engine for OWL Ontologies, MSc thesis, Department of Informatics, Athens University of Economics and Business, 2006. [Gal07] D. Galanis and I. Androutsopoulos, Generating Multilingual Descriptions from Linguistically Annotated OWL Ontologies: the NaturalOWL System, Proceedings of the 11th European Workshop on Natural Language Generation, Schloss Dagstuhl, Germany, pp. 143 146, 2007. [Gra08] B. Grau, I. Horrocks, B. Motik, B. Parsia, P. Patel-Schneider, U. Sattler, OWL 2: The Next Step for OWL, Web Semantics, vol. 6, 309 322, 2008. [Hal07] C. Hallett, D. Scott, and R. Power, Composing Questions through Conceptual Authoring, Computational Linguistics, 33(1):105 133, 2007. [Kau10] E. Kaufmann and A. Bernstein, Evaluating the Usability of Natural Language Query Languages and Interfaces to Semantic Web Knowledge Bases, Web Semantics, 8(4):377 293, 2010. [Kons08] S. Konstantopoulos, I. Androutsopoulos, H. Baltzakis, V. Karkaletsis, C. Matheson, A. Tegos, P. Trahanias, INDIGO: Interaction with Personality and Dialogue Enabled Robots, Proceedings of the 18th European Conference on Artificial Intelligence (demos), Patras, Greece, 2008. [Kre08] Kremen, P. & Sirin, E., SPARQL-DL Implementation Experience, in Kendall Clark & Peter F. Patel-Schneider, ed., Proceedings of the 4 th Workshop on OWL Experiences and Directions, Washington, D.C., 2008. [Lam09] G. Lampouras and I. Androutsopoulos, Finding Short Definitions of Terms on Web Pages, Proceedings of the 2009 Conference on Empirical Methods on Natural Language Processing, Suntec, Singapore, pp. 1270 1279, 2009. [40]

[Pow09] R. Power, R. Stevens, D. Scott, and A. Rector, Editing OWL through Generated CNL. Workshop on Controlled Natural Language, Marettimo Island, Italy, 2009. [Rei00] E. Reiter and R. Dale, Building Natural Language Generation Systems, Cambridge University Press, 2000. [Shad06] N. Shadbolt, T. Berners-Lee, W. Hall, The Semantic Web revisited, IEEE Intelligent Systems, vol. 21, pp. 96 101, 2001. [Sir09] E. Sirin, B. Parsia, SPARQL-DL: SPARQL Query for OWL-DL, Proceedings of the 3rd OWL Experiences and Directions Workshop, Innsbruck, Austria 2009. [41]