Κεφάλαιο 8 Διάθεση-Οργάνωση-Εξόρυξη Γεωχωρικών Δεδομένων στο Διαδίκτυο

Σχετικά έγγραφα
Ανάκτηση Πληροφορίας

ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: ΣΥΓΓΡΑΦΕΑΣ:

Γεωγραφικά Πληροφοριακά Συστήµατα (Geographical Information Systems GIS)

Οντολογία για την περιγραφή των προσωπικοτήτων της Σάμου, την κατηγοριοποίηση και τις σχέσεις τους

ΜΑΘΗΜΑ 6. Σχήµατα ιαλειτουργικότητας Μεταδεδοµένων. Το RDF Το Warwick Framework. Ιόνιο Πανεπιστήµιο - Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας

Απεικόνιση Οντολογιών Σε Σχήµατα Σχεσιακών Βάσεων εδοµένων Με Σκοπό Την Ανάκτηση εδοµένων Σηµασιολογικού Περιεχοµένου ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Διαχείριση οντολογιών: μελέτη και εμβάθυνση στα βασικά προβλήματα που την αφορούν και παρουσίαση υπαρχουσών βιβλιοθηκών οντολογιών

Σχεδιασµός Ανάπτυξη Οντολογίας

Αναπαράσταση Γνώσης και Αναζήτηση στον Σηµασιολογικό Ιστό

Παραδοτέο Π.2.1. Υπερχώρος και διαχείριση μοντέλων

Τι είναι τα Συστήµατα Γεωγραφικών Πληροφοριών. (Geographical Information Systems GIS)

Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών

ΟΝΤΟΛΟΓΙΕΣ, ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΙΣΤΟΣ ΚΑΙ ΕΦΑΡΜΟΓΕΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΔΙΑΚΥΒΕΡΝΗΣΗΣ

Γιάννης Θεοδωρίδης. Εργαστήριο Πληροφοριακών Συστηµάτων.

Εννοιολογική Ομοιογένεια

"Αθηνά" - Ερευνητικό Κέντρο Καινοτομίας στις Τεχνολογίες της Πληροφορίας, των Επικοινωνιών και της Γνώσης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΜΗΧ/ΚΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΝΑΠΑΡΑΣΤΑΣΗ ΓΝΩΣΗΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ ΕΚΠΟΝΗΣΗ ΕΡΓΑΣΙΑΣ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Βάσεις Δεδομένων. Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα

Θεωρητική προσέγγιση του Σημασιολογικού Ιστού στο χώρο της πολιτισμικής πληροφορίας: μία πρότυπη εφαρμογή στη βιβλιοθηκονομία

ΑΝΑΠΑΡΑΣΤΑΣΗ ΓΝΩΣΗΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ

Οντολογία Ψηφιακής Βιβλιοθήκης

Διασύνδεση και Άνοιγμα Δεδομένων του Α.Π.Θ. Καραογλάνογλου Κωνσταντίνος Μονάδα Σημασιολογικού Ιστού Α.Π.Θ 18/3/2014

Εργαστήριο Σημασιολογικού Ιστού

Πρότυπα και Τεχνολογίες Semantic Web και Web 2.0 και η εφαρμογή τους στην Ηλεκτρονική Διακυβέρνηση

ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ. και ΣΥΣΤΗΜΑΤΑ ΓΕΩΓΡΑΦΙΚΩΝ ΠΛΗΡΟΦΟΡΙΩΝ

ΜΑΘΗΜΑ: Εισαγωγή στις Αρχές της Επιστήμης των Η/Υ. 1 η ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ

τεχνολογιών χαρτοσύνθεσης σε περιβάλλον διαδικτύου

Εργαστήριο Σημασιολογικού Ιστού

Μεταδεδομένα στο Ψηφιακό περιβάλλον

Μάθημα: Δ3. Δίκτυα Γνώσης και Σημασιολογικός Ιστός. Διάλεξη 02 & 03. Δρ. Γεώργιος Χρ. Μακρής

ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ-ΕΙΣΑΓΩΓΗ

ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ ΓΕΩΓΡΑΦΙΚΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΩΝ - ΕΝΟΤΗΤΑ 1 7/4/2013 ΕΝΟΤΗΤΕΣ ΜΑΘΗΜΑΤΟΣ. Ορισμός

Μάθημα: Δ3. Δίκτυα Γνώσης και Σημασιολογικός Ιστός. Διάλεξη 01 & 02. Δρ. Γεώργιος Χρ. Μακρής

Linked Data for the Masses: Η προσέγγιση και το λογισμικό

ΜΟΝΑΔΕΣ ΑΡΙΣΤΕΙΑΣ ΑΝΟΙΧΤΟΥ ΛΟΓΙΣΜΙΚΟΥ

Δομές δεδομένων και ψηφιακή αναπαράσταση χωρικών φαινομένων

Ολοκληρωμένη Πλατφόρμα Δικτύωσης της Δημόσιας Διοίκησης για την παροχή ενιαίων και εξατομικευμένων ηλεκτρονικών υπηρεσιών σε πολίτες και επιχειρήσεις»

Νεογεωγραφία και Χαρτογραφική Διαδικτυακή Απεικόνιση. Η χρήση Ελεύθερων Γεωγραφικών Δεδομένων και Λογισμικού Ανοιχτού Κώδικα σε Φορητές Συσκευές.

ΧΩΡΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ

Οντολογία σύμφωνα με τη Φιλοσοφία

ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01

Εργαστήριο Σημασιολογικού Ιστού

ΑΝΑΚΤΗΣΗ ΠΟΛΥΜΕΣΙΚΟΥ ΠΕΡΙΕΧΟΜΕΝΟΥ ΚΑΙ ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΙΣΤΟΣ Γ.Τ.Π

Η Πληροφορική ως γνώση και εργαλείο για τον σύγχρονο μηχανικό. Νικόλαος Μήτρου Καθηγητής, ΕΜΠ

Μοντέλα Κυβερνητικής Πληροφορίας

Ανάπτυξη Ανοιχτής Διαδικτυακής Πλατφόρμας για την Ενίσχυση της Γεωχωρικής Σκέψης

DECO DECoration Ontology

Aναπαράσταση Γνώσης στο Σημασιολογικό Ιστό

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος Κεφάλαιο 1 ο Αρχές Διαχείρισης πληροφορίας στον Παγκόσμιο Ιστό... 15

Οντολογίες γενικά. Ορισμοί Εφαρμογές Πρότυπα/Γλώσσες Διαχείριση οντολογιών Semantic Web

Θέματα Ατομικής Διπλωματικής Εργασίας - DRAFT Ακαδημαϊκό Έτος 2015/2016. Γεωργία Καπιτσάκη (Λέκτορας)

Γεωχωρική πληροφορία και υποστήριξη αποφάσεων σε επίπεδο ΟΤΑ

Ανάπτυξη οντολογίας για τη δομή και τις διαδικασίες του Τμήματος Σπουδών ΑΠΘ

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

ΚΩΔΙΚΟΠΟΙΗΣΗ ONEGEOLOGY - EUROPE ΔΕΔΟΜΕΝΩΝ ΓΙΑ ΤΗΝ ΠΑΡΟΧΗ WMS WFS ΥΠΗΡΕΣΙΩΝ KATA INSPIRE ΜΕ ΒΑΣΗ ΤΟ ΠΡΟΤΥΠΟ GeoSciML 4.0

Σημασιολογικός Ιστός RDF(S) OWL Οντολογίες. Pervasive Computing Research Group

ΜΑΘΑΙΝΟΝΤΑΣ ΤΑ GIS ΣΤΗ ΠΡΑΞΗ ΤΟ ARCGIS 9.3. Α. Τσουχλαράκη, Γ. Αχιλλέως ΚΕΦΑΛΑΙΟ 4 ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΓΡΑΦΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ΠΙΝΑΚΕΣ

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3

Εφαρμογές Συστημάτων Γεωγραφικών Πληροφοριών

Μιχάλης Βαΐτης Πανεπιστήµιο Αιγαίου Τµήµα Γεωγραφίας Έργα ΕΛ/ΛΑΚ για τον ηµόσιο Τοµέα Αθήνα, 29 Σεπτεµβρίου 2010

Μεταφορές - Ναυτιλία

Γεωγραφικά Συστήματα Πληροφοριών. Λογισμικά WEBGIS. Διδάσκοντες: Ανδρουλακάκης Ν., Βαλαδάκη Κ., Ζήσου Α., Κάτσιος Ι., Τσάτσαρης Α.

Οδηγία INSPIRE, μεταδεδομένα και GIS

Ιστορικοί χάρτες στον Παγκόσμιο Ιστό

Ψηφιακός Χάρτης Πολυεπίπεδης Πληροφορίας σε Μορφότυπο PDF

ΨΗΦΙΑΚΉ ΠΛΑΤΦΌΡΜΑ ΧΩΡΙΚΏΝ ΔΕΔΟΜΈΝΩΝ ΓΙΑ ΤΗΝ ΤΟΠΙΚΉ ΑΥΤΟΔΙΟΊΚΗΣΗ

Διαδικτυακή υπηρεσία περιβαλλοντικών κινδύνων Πλημμύρες ERMIS-Floods: Environmental Risk Management & Information Service

Διαχείριση, Δημοσίευση και Διάθεση Ανοικτών Εκπαιδευτικών Πόρων

Ανάπτυξη Δυνατοτήτων στην Εκπαίδευση μέσω της Πρωτοβουλίας GEO

Προγράμματα για τη δημιουργία και διαχείριση θησαυρού

Παραδοτέο Π.1.3. Μηχανισμοί δεικτοδότησης μη-παραδοσιακών δεδομένων

Ο ρόλος των ελεγχόμενων λεξιλογίων και θησαυρών στην οργάνωση της γνώσης

Μοντελοποίηση Πεδίου

κεφάλαιο Βασικές Έννοιες Επιστήμη των Υπολογιστών

Πίνακας Προτεινόμενων Πτυχιακών Εργασιών

Ψηφιοποίηση και ψηφιακή επεξεργασία εικόνας

Υποστήριξη στη ιαχείριση Γνώσης

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

Τεχνολογία ανάπτυξης νέων ιστοσελίδων στο Semantic Web.

πληροφορίες ΠΛΗΡΟΦΟΡΙΑ

Toward a SPARQL Query Execution Mechanism using Dynamic Mapping Adaptation -A Preliminary Report- Takuya Adachi 1 Naoki Fukuta 2.

Ανοιχτά Κυβερνητικά Δεδομένα Η οπτική του χρήστη

Εργαστήριο Σημασιολογικού Ιστού

ΜΑΘΑΙΝΟΝΤΑΣ ΤΑ GIS ΣΤΗ ΠΡΑΞΗ ΤΟ ARCGIS 9.3. Α. Τσουχλαράκη, Γ. Αχιλλέως ΚΕΦΑΛΑΙΟ 6 ΧΑΡΤΟΓΡΑΦΩΝΤΑΣ ΔΕΔΟΜΕΝΑ ΚΑΙ ΑΠΟΤΕΛΕΣΜΑΤΑ

Η ΧΡΗΣΗ ΤΗΣ ΥΠΟΔΟΜΗΣ ΧΩΡΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ΓΙΑ ΤΗΝ ΑΝΑΖΗΤΗΣΗ ΚΑΙ ΑΠΕΙΚΟΝΙΣΗ ΓΕΩΓΡΑΦΙΚΩΝ ΠΛΗΡΟΦΟΡΙΩΝ

ΕΝΙΑΙΟ ΠΛΑΙΣΙΟ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ

ΜΑΘΑΙΝΟΝΤΑΣ ΤΑ GIS ΣΤΗ ΠΡΑΞΗ ΤΟ ARCGIS 9.3. Α. Τσουχλαράκη, Γ. Αχιλλέως ΚΕΦΑΛΑΙΟ 1 ΞΕΚΙΝΩΝΤΑΣ ΜΕ ΤΟ ARCGIS - ΤΟ ARCMAP

5o Πανελλήνιο Συνέδριο / Οκτωβρίου Αθήνα

Θέματα Ατομικής Διπλωματικής Εργασίας Ακαδημαϊκό Έτος 2017/2018. Γεωργία Καπιτσάκη (Επίκουρη Καθηγήτρια)

Ανάπτυξη Μοντέλου Εκτίμησης της Ποιότητας του Χάρτη

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Λογική. Ενότητα 1: Εισαγωγή. Δημήτρης Πλεξουσάκης Τμήμα Επιστήμης Υπολογιστών

Νέες Εφαρμογές 3D Χαρτογραφίας:

ΜΑΘΑΙΝΟΝΤΑΣ ΤΑ GIS ΣΤΗ ΠΡΑΞΗ ΤΟ ARCGIS 9.3. Α. Τσουχλαράκη, Γ. Αχιλλέως ΚΕΦΑΛΑΙΟ 10 ΔΗΜΙΟΥΡΓΙΑ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ ΓΕΩΒΑΣΕΩΝ

ΔΙΠΛΩΜΑΤΙΚΕΣ ΕΡΓΑΣΙΕΣ

Το στοιχείο που διαφοροποιεί τις γεωγραφικές πληροφορίες από τους υπόλοιπους τύπους πληροφοριών

Transcript:

Κεφάλαιο 8 Διάθεση-Οργάνωση-Εξόρυξη Γεωχωρικών Δεδομένων στο Διαδίκτυο Σύνοψη Σκοπός του Κεφαλαίου αυτού είναι η παρουσίαση μεθόδων και διαδικασιών για την οργάνωση και εύρεση γεωχωρικών δεδομένων, την ταξινόμηση και το διαμοιρασμό τους. Αρχικά, γίνεται αναφορά σε τρόπους διάθεσης των γεωχωρικών δεδομένων στο διαδίκτυο όπως ανοιχτά γεωχωρικά δεδομένα. Ιδιαίτερη έμφαση δίνεται στην εννοιολογική διάσταση και τους τρόπους διάθεσης και εύρεσης γεωχωρικών δεδομένων με σύγχρονες τεχνολογίες όπως τα ανοιχτά διασυνδεδεμένα γεωχωρικά δεδομένα. Επιπροσθέτως, στο Κεφάλαιο αναφέρονται προηγμένα θέματα εξόρυξης γεωχωρικής πληροφορίας από διαδικτυακές πηγές με τη βοήθεια τεχνολογιών επεξεργασίας φυσικής γλώσσας και τεχνολογιών γεω-σημασιολογικού ιστού (geo semantic web). Προαπαιτούμενη γνώση Συνίσταται η εξοικείωση του αναγνώστη με το περιεχόμενο του Κεφαλαίου 2 «Επιστημονικά πεδία και θεωρήσεις στην επιστήμη της γεωγραφικής πληροφορίας», του Κεφαλαίου 9 «Υποδομές Χωρικών Δεδομένων» του Κεφαλαίου 10 «Διαλειτουργικότητα» και του Κεφαλαίου 12 «Περιεχόμενο με Χωρική Αναφορά Παραγόμενο από το Πλήθος» του παρόντος καθώς και του Κεφαλαίου 4 «Πηγές και Τεχνικές Συλλογής Γεωγραφικών Δεδομένων» του βιβλίου Επιστήμη Γεωγραφικής Πληροφορίας Αρχές και Τεχνολογίες του ιδίου συγγραφέα. 8.1. Εισαγωγή Μεγάλος όγκος γεωχωρικών δεδομένων είναι πλέον ελεύθερα διαθέσιμα στο διαδίκτυο. Τα δεδομένα αυτά δεν είναι μόνο στην παραδοσιακή τους μορφή όπως διανυσματικά δεδομένα, χάρτες και δορυφορικές εικόνες αλλά εκτείνονται σε πληροφορίες με χωρική αναφορά που δημοσιεύονται στο διαδίκτυο από εθελοντές χρήστες σε μορφή εικόνων, κειμένου, σύντομων μηνυμάτων. Παρατηρείται δηλαδή σταδιακά μια διεύρυνση του όρου «γεωχωρικά δεδομένα» και συνεπώς ο τρόπος εμφάνισης και κωδικοποίησης του. Στο σημείο αυτό, μπορούμε να διαχωρίσουμε δύο μεγάλες κατηγορίες γεωχωρικών δεδομένων που είναι άμεσα διαθέσιμες αυτή τη στιγμή: Γεωχωρικά δεδομένα στην κλασική τους μορφή όπως διανυσματικά αρχεία οδικού δικτύου, ψηφιακά μοντέλα εδάφους, χάρτες χρήσης/κάλυψης γης, ορθοφωτογραφίες και δορυφορικές εικόνες. Τα δεδομένα αυτά συλλέγονται συνήθως από συγκεκριμένους φορείς και διατίθεται στο κοινό με τη βοήθεια απλών διαδικτυακών διεπαφών χρήστη. Δεδομένα μεγαλύτερης πολυπλοκότητας με χωρική αναφορά που βρίσκονται και δημοσιεύονται σε κειμενική μορφή κυρίως μέσω μέσων κοινωνικής δικτύωσης (Twitter, Facebook, travelblogs κτλ.). Τα δεδομένα αυτά περιέχουν κάποια χωρική αναφορά καθώς και θεματική πληροφορία που αφορά σε συγκεκριμένες τοποθεσίες. Ένα παράδειγμα πλούσιο σε χωρικές εκφράσεις και γεωγραφική πληροφορία είναι οι περιγραφές των ταξιδιωτών σε travelblogs. Δεδομένου ότι σε αντίθεση με τα κλασικά γεωχωρικά δεδομένα η γεωμετρία και η τοποθέτηση πάνω σε έναν χάρτη δεν ορίζονται άμεσα, η ανάκτηση και επεξεργασία τέτοιου είδους πληροφορίας είναι ιδιαίτερα περίπλοκη. Από την άλλη όμως, τέτοιου είδους πηγές δεδομένων είναι ιδιαίτερα χρήσιμες και ανοίγουν νέες προοπτικές στον τομέα της γεωπληροφορικής γιατί περιλαμβάνουν μεγάλο πλούτο της γνώσης του ανθρώπου και του τρόπου με την οποίο αντιλαμβάνεται και επικοινωνεί το περιβάλλον του. Η γνώση αυτή είναι απαραίτητα για την ανάπτυξη ευφυών υπολογιστικών συστημάτων που υποστηρίζουν την ανθρώπινη καθημερινότητα (παραπέμπουμε τον αναγνώστη στο Κεφάλαιο 11 του παρόντος για περαιτέρω πληροφορίες).

Η ύπαρξη τόσο μεγάλου πλούτου γεωχωρικών δεδομένων στο διαδίκτυο φέρνει στο επίκεντρο του επιστημονικού ενδιαφέροντος, θέματα διαλειτουργικότητας που εμφανίζονται κυρίως κατά το διαμοιρασμό των δεδομένων. Πλήθος προσεγγίσεων έχουν προταθεί για την αντιμετώπιση των δυσκολιών που εμφανίζονται όταν δεδομένα από διαφορετικούς φορείς και σε διαφορετική μορφή συνδυάζονται και αξιοποιούνται από τρίτους. Οι δυσχέρειες αυτές ξεκινούν από τεχνικές ασυμβατότητες (διαφορετικές γλώσσες κωδικοποίησης και διαφορετικοί τρόποι οργάνωσης μιας βάσης δεδομένων) και εκτείνονται σε ζητήματα σημασιολογικής διαλειτουργικότητας όπου πλέον εξετάζεται σε βάθος: το νόημα των γεωχωρικών ευνοιών, οι διαφορετικοί τρόποι με τους οποίους οι έννοιες γίνονται αντιληπτές και επικοινωνούνται, το πως όλα αυτά θα κωδικοποιηθούν σε υπολογιστικά συστήματα. Στο Κεφάλαιο αυτό γίνεται αρχικά μια αναφορά στην πρώτη κατηγορία γεωχωρικών δεδομένων και αναφέρονται κάποιες βασικές πηγές. Στη συνέχεια θίγεται το θέμα της ανάγκης οργάνωσης της γεωχωρικής πληροφορίας ειδικά με την προοπτική διαμοιρασμού και ενοποίησής της με πληροφορία από περισσότερες πηγές. Αναφέρονται έτσι θέματα σημασιολογικής διαλειτουργικότητας και αναλύονται οι μέθοδοι της μηχανικής των οντολογιών και των διασυνδεδεμένων ανοιχτών δεδομένων για την οργάνωση της γεωχωρικής πληροφορίας. Τέλος, γίνεται αναφορά στη δεύτερη κατηγορία πηγών δεδομένων σε κείμενα με χωρική αναφορά, και παρουσιάζονται προκλήσεις και μεθοδολογίες για την ανάκτησή γεωχωρικής πληροφορίας από αυτά. 8.2. Ελεύθερα Διαθέσιμα Γεωχωρικά Δεδομένα στο Διαδίκτυο Με μια γρήγορη αναζήτηση στο διαδίκτυο διαπιστώνει κανείς ότι μεγάλο πλήθος γεωχωρικών δεδομένων είναι πλέον ελεύθερα διαθέσιμος. Μεγάλοι φορείς και εταιρίες παρέχουν δεδομένα, όπως δορυφορικές εικόνες, μέσα από εύκολες διαδικτυακές διεπαφές στο ευρύ κοινό. Τα δεδομένα είναι συνήθως σε κάποια μορφή εύκολα προσπελάσιμη και επεξεργάσιμη από συστήματα γεωγραφικών πληροφοριών και συνοδεύονται από τα απαραίτητα δεδομένα με στοιχεία του συστήματος αναφοράς, της ακρίβειας των δεδομένων και στοιχεία των φορέων συλλογής και διάθεσης. Στην Ευρώπη η κοινοτική οδηγία 2007/2/EC INSPIRE που ψηφίστηκε στις 14 Μαρτίου 2007, τέθηκε σε ισχύ στις 15 Μαΐου 2007 και προβλέπεται να εφαρμοστεί πλήρως μέχρι το 2019 καθορίζει το πλαίσιο για τη συλλογή, οργάνωση και διάθεση γεωχωρικών δεδομένων (για περισσότερες λεπτομέρειες παραπέμπουμε τον αναγνώστη στο Κεφάλαιο 9 του παρόντος). Μεγάλο μέρος γεωχωρικών δεδομένων παρέχεται ελεύθερα από φορείς της δημόσιας διοίκησης. Στην Ελλάδα δημιουργήθηκε η υπηρεσία http://geodata.gov.gr/geodata/ ως πλατφόρμα επικοινωνίας μεταξύ φορέων της δημόσιας διοίκησης που παρέχουν γεωχωρικά δεδομένα και ενδιαφερόμενων χρηστών. Τα είδη δεδομένων που μπορεί να ανατρέξει κανείς είναι πολλά και οι κατηγορίες αυξάνονται συνεχώς. Ανά θεαματική κατηγορία, τα δεδομένα που παρέχονται μέχρις στιγμής (Οκτώβριος 2015) είναι: βασικά υπόβαθρα, δημόσιες υπηρεσίες, περιβάλλον, υποδομές και επικοινωνίες, ενέργεια, πολιτισμός, ασφάλεια, ορθοφωτογραφίες, εκπαίδευση, τοπωνύμια, υψομετρία, σημεία ενδιαφέροντος. Αναφορικά στις άδειες χρήσης, τα χαρτογραφικά υπόβαθρα Google Maps και ΟpenStreetMap καθώς και οι αεροφωτογραφίες της Κτηματολόγιο Α.Ε. συνοδεύονται από τις άδειες χρήσης των αρχικών

προϊόντων. Τα υπόλοιπα δεδομένα παρέχονται με διάφορες ελληνικές εκδόσεις της Άδειας Creative Commons Αναφορά Δημιουργού (CC BY v.3.0). H πλατφόρμα έχει δημιουργηθεί στο σύνολό της με λογισμικό ανοιχτού κώδικα (open source software) (Lakhani & Von Hippel 2003). Τα δεδομένα παρέχονται στη μορφή shp, gml, kml. Αναφορικά στα συστήματα αναφοράς αξιοποιούνται το ΕΓΣΑ'87 και WGS84. Για την οργάνωση και δημοσίευση των δεδομένων έχουν χρησιμοποιηθεί τεχνικές Διασυνδεδεμένων Ανοιχτών Δεδομένων ΔΑΔ (linked open data) (βλέπε Ενότητα 4 του παρόντος). Σε μικρότερη κλίμακα οι περιφέρειες προσφέρουν αντίστοιχες πλατφόρμες όπως για παράδειγμα η Περιφέρεια Κρήτης 1. Η αντίστοιχη υπηρεσία στη Μεγάλη Βρετανία, data.gov.uk παρέχει μέχρι σήμερα (Οκτώβριος 2015), 20.776 συλλογές γεωχωρικών δεδομένων (σε μορφή csv, wms, xls, pdf, html, xml, rdf, shp.) στις εξής θεματικές κατηγορίες. περιβάλλον, χαρτογραφία, πόλεις, δημόσια διοίκηση, κοινωνία, υγεία. H Γεωλογική Υπηρεσία των Ηνωμένων Πολιτειών (U.S. Geological Survey USGS) παρέχει γεωχωρικά δεδομένα που καλύπτουν τον παγκόσμιο γεωγραφικό χώρο όπως για παράδειγμα δορυφορικές εικόνες. Μέσω μιας διαδικτυακής εφαρμογής μπορεί ο χρήστης να κατεβάσει δορυφορικές εικόνες του δέκτη Landsat. Αν και οι δορυφορικές εικόνες δεν είναι ιδιαίτερα πρόσφατες, είναι χρήσιμες για πλήθος εφαρμογών ειδικά για την ανίχνευση αλλαγών στην επιφάνεια της γης. Ομοίως μέσα από την υπηρεσία, παρέχονται δορυφορικές εικόνες του δέκτη Moderate Resolution Imaging Spectroradiometer (ΜODIS). Πέρα από δορυφορικές εικόνες, παρέχονται και προϊόντα ατμοσφαιρικών, επίγειων, θαλάσσιων υπηρεσιών 2. Αναφορικά σε υψομετρικά δεδομένα και ψηφιακά μοντέλα εδάφους, της USGS παρέχει δεδομένα για την Αμερική μέσα από μια διαδικτυακή εφαρμογή σε μορφή ArcGrid, GridFloat και img. Παγκόσμια υψομετρικά δεδομένα παρέχονται από το Shuttle Radar Topography Mission (SRTM), το Advanced Spaceborne Thermal Emission and Reflection Radiometer (ASTER) και το GTOPO30. Παγκόσμια δεδομένα χρήσης/κάλυψης γης παρέχονται από το Ινστιτούτο Κάλυψης Γης (USGS) (USGS Land Cover Institute). Για τον ευρωπαϊκό χώρο, δεδομένα χρήσης/κάλυψης γης παρέχονται από την Ευρωπαϊκή Υπηρεσία Περιβάλλοντος (European Environment Agency) 3. Πέρα από τις χρήσεις γης, η Ευρωπαϊκή Υπηρεσία Περιβάλλοντος παρέχει πλήθος γεωχωρικών δεδομένων από τους τομείς: γεωργία, ατμοσφαιρική ρύπανση, βιοποικιλότητα, κλιματική αλλαγή, ακτογραμμή και θάλασσα, ενέργεια, αλιεία, πράσινη οικονομία, εδαφολογία, βιότοποι, τουρισμός, μεταφορές, αστικό περιβάλλον, διαχείριση υδάτων. Ιστορικά κλιματολογικά δεδομένα παρέχονται από το Κέντρο Αρχείων Περιβαλλοντικών Δεδομένων (ΗΒ) (Centre for Environmental Data Archival (UK)). H εταιρία Geofabric ιδρύθηκε το 2007 στη Γερμανία και παρέχει πρωτογενή δεδομένα του OpenStreetMap. Από πολύ νωρίς ο ιδρυτής της Frederik Ramm, είχε εμπλακεί στο OpenStreetMap και ιδιαίτερα στη διεπαφή χρήστη Java OpenStreetMap (JOSM) για την επεξεργασία δεδομένων. Τα δεδομένα παρέχονται σε μορφή.shp και εκτείνονται σε όλες τις κατηγορίες του ΟpenStreetMap όπως οδικό δίκτυο, σημεία ενδιαφέροντος, κτήρια, χρήσεις γης κτλ. 8.3. Οργάνωση Γεωχωρικών Δεδομένων στο Διαδίκτυο Η ανάγκη οργάνωσης των γεωχωρικών δεδομένων έγινε αισθητή από πολύ νωρίς και ενισχύθηκε με το διαμοιρασμό, την επαναχρησιμοποίηση και ενοποίηση γεωχωρικών δεδομένων από διαφορετικές πηγές. 1 http://www.opencrete.gov.gr/ (τελευταία προσπέλαση στις 25/10/2015). 2 Μια πλήρης λίστα των διαθέσιμων προϊόντων μπορεί να ανατρέξει κανείς στο http://modis.gsfc.nasa.gov/data/dataprod/ (τελευταία προσπέλαση στις 25/10/2015). 3 Τα διαθέσιμα δεδομένα μπορεί να ανατρέξει κανείς στο http://www.eea.europa.eu/data-andmaps/find#c1=data&c1=graph&c1=indicator&c1=interactive+data&c1=interactive+map&c1=map&c6=landuse&c0=1 2&b_start=0 (τελευταία προσπέλαση στις 25/10/2015).

Αποτέλεσμα αυτού ήταν η εμφάνιση ζητημάτων διαλειτουργικότητας τόσο σε τεχνικό όσο και σημασιολογικό επίπεδο. Ο Bishr (1998) χαρακτηριστικά διακρίνει έξι επίπεδα στα οποία εμφανίζονται προβλήματα διαλειτουργικότητας κατά τον συνδυασμό γεωχωρικής πληροφορίας από διαφορετικές πηγές και συνεπώς έξι επίπεδα στα οποία απαιτείται οργάνωση των γεωχωρικών δεδομένων: πρωτόκολλα δικτύου (network protocols), υλικό (hardware), αρχεία χωρικών δεδομένων (spatial data files), σύστημα διαχείρισης βάσεων δεδομένων, μοντέλο δεδομένων (data model), σημασιολογία. Στην ενότητα αυτή θα επικεντρωθούμε στο έκτο επίπεδο της παραπάνω κατηγοριοποίησης, αυτό της σημασιολογικής διάστασης και σημασιολογικής διαλειτουργικότητας γεωχωρικών δεδομένων στο διαδίκτυο. Η βασική δυσκολία που καλούμαστε ως άνθρωποι και ως υπολογιστικά συστήματα να αντιμετωπίσουμε είναι η διαφορετική εννοιολόγηση του κόσμου. Ακόμα και για την ίδια έννοια π.χ. δάσος, συναντώνται πλήθος ορισμοί οι οποίοι διαφέρουν ανάλογα τη χώρα και τον επιστημονικό τομέα. Οι δυσκολίες στη σημασιολογική διαλειτουργικότητα αμβλύνονται ακόμα περισσότερο μεταξύ υπολογιστικών συστημάτων όπου η γνώση και η κωδικοποίηση αυτής είναι συγκεκριμένη και περιορισμένη (βλέπε επίσης Κεφάλαιο 10). Στη βιβλιογραφία συναντάει κανείς πλήθος προσεγγίσεων όπως γεωχωρικές βάσεις δεδομένων (Oracle Spatial, Sql, PostGIS με PostgrSql ), εννοιολογικούς γράφους (conceptual graphs) (Karalopoulos κ.ά. 2004), μηχανική των οντολογιών (Mizoguchi & Ikeda 1998), διασυνδεδεμένα ανοιχτά δεδομένα (Yu 2011). Στο κεφάλαιο αυτό θα επικεντρωθούμε στη σημασιολογική οργάνωση των δεδομένων και συγκεκριμένα στην μηχανική των οντολογιών και τα ανοιχτά διασυνδεδεμένα δεδομένα στην γεωγραφική τους έκφραση μιας και αποτελούν τις πιο πρόσφατες προσεγγίσεις που προορίζονται για το σημασιολογικό ιστό (semantic web). 8.3.1. Οντολογίες Η έννοια της οντολογίας προέρχεται από την επιστήμη της αρχαίας ελληνικής φιλοσοφίας όπου στόχευε στον ορισμό των αρχών του κόσμου. Εισήχθη στον τομέα των πληροφοριακών συστημάτων ως ένας τρόπος οργάνωσης και τεκμηρίωση της γνώσης. Στη σημερινή εποχή ο όρος αυτός έχει αξιοποιηθεί από πολλές επιστήμες όπως γεωγραφία, γλωσσολογία, επιστήμη των υπολογιστών ως εργαλείο για την τυποποίηση της γνώσης και την επίτευξη της διαλειτουργικότητας σε διάφορα επίπεδα. Η ενέργεια αυτή πραγματοποιείται είτε με τη σύνταξη ειδικών οντολογιών στις οποίες περιγράφεται η γνώση ενός συγκεκριμένου πεδίου, είτε με τη σύνταξη γενικότερων οντολογιών που αναφέρονται σε κοινές έννοιες διαφορετικών πεδίων και στοχεύουν στην οργάνωση της γνώσης σε ένα μετα-επίπεδο. Ο Guarino (1998) κατηγοριοποίησε τις οντολογίες με το βαθμό συσχέτισής τους με κάποια οπτική και τις χώρισε σε: οντολογίες υψηλού επιπέδου (Top-Level Ontology), οντολογίες πεδίου (Domain Ontology), οντολογίες έργου (Task Ontology), οντολογίες εφαρμογής (Application Ontology). Οι οντολογίες υψηλού επιπέδου, αποτελούν οντολογίες που περιγράφουν πολύ γενικές έννοιες όπως χρόνος, χώρος, σχέση, ενέργεια. Οι έννοιες αυτές είναι ανεξάρτητες από επιστημονικό πεδίο, δεν αντιπροσωπεύουν δηλαδή συγκεκριμένη ορολογία ενός επιστημονικού πεδίου για παράδειγμα υδρολογία, ωκεανογραφία, δασολογία. Σκοπός μιας τέτοια οντολογίας είναι η δημιουργία μιας θεωρητικής βάσης (σε υψηλό επίπεδο εννοιών) κοινώς αποδεκτής από το σύνολο της επιστημονικής κοινότητας πάνω στην οποία δομείται οποιαδήποτε πιο ειδική γνώση. Με την ύπαρξη μιας οντολογίας υψηλού επιπέδου, είναι δυνατή η σύνδεση οντολογιών πεδίου που περιέχουν ειδικότερες έννοιες, με ένα σταθερό υπόβαθρο. Το βασικό πλεονέκτημα που προκύπτει από μια τέτοια σύνδεση είναι το γεγονός ότι η σημασιολογία των ειδικότερων εννοιών είναι καλώς τεκμηριωμένη και

η μορφή είναι τέτοια ώστε να επιτυγχάνεται διαλειτουργικότητα σε επίπεδο επικοινωνίας μεταξύ των ατόμων και των συστημάτων. Στις οντολογίες πεδίου συγκεντρώνεται όλη η γνώση που αφορά ένα συγκεκριμένο κλάδο π.χ. υδρολογία, φυσικές καταστροφές, κάλυψη γης κλπ. Με τις οντολογίες πεδίου περιγράφονται όλες οι βασικές έννοιες που συναντώνται σε κάποιον τομέα με τις απαραίτητες σχέσεις και τα στιγμιότυπά τους. Η επιλογή των εννοιών εναπόκειται στο σχεδιαστή της οντολογίας ο οποίος έχει κάθε ελευθερία επιλογής υπό τον όρο ότι πληρεί τις συνθήκες σαφήνειας και πληρότητας που τεκμηριώνουν τη γνώση του πεδίου που θέλει να περιγράψει. Τόσο το πλήθος των εννοιών και σχέσεων όσο και το επίπεδο λεπτομέρειας των εννοιών εξαρτάται από την εφαρμογή για την οποία προορίζεται και τις προδιαγραφές που έχουν τεθεί από την αρχιτεκτονική του συστήματος. Μια βασική αρχή είναι πως όσο πλουσιότερη είναι μια οντολογία και όσο περισσότερες έννοιες και σχέσεις συμπεριλαμβάνει τόσο μεγαλύτερο τμήμα της γνώσης ενός πεδίου περιγράφει, αλλά ταυτόχρονα αυξάνει την μαθηματική και υπολογιστική πολυπλοκότητα κατά τη δημιουργία νέας γνώσης και την εξαγωγή συμπερασμάτων (reasoning). Οι οντολογίες έργου αξιοποιούνται για την μοντελοποίηση της γνώσης που αφορά σε κάποια δραστηριότητα ή εφαρμογή. Για παράδειγμα οι μέθοδοι και τεχνικές υλοποίησης ενός κτηματολογίου μπορούν να περιγραφούν με τη βοήθεια οντολογιών έργου. Με τις οντολογίες αυτές μοντελοποιούνται οι διαδικασίες και συνήθως απαρτίζονται από κατηγοριοποιήσεις και σχέσεις αυτών. Στις οντολογίες εφαρμογής αξιοποιείται η γνώση από τις οντολογίες πεδίου και τις οντολογίες έργου προκειμένου να μοντελοποιηθούν συγκεκριμένες εφαρμογές π.χ. η ολοκληρωμένη περιγραφή των εννοιών και διαδικασιών για τη σύνταξη ενός κτηματολογίου. Οι οντολογίες αυτές είναι ιδιαίτερα χρήσιμες σε περιπτώσεις όπου κάποια δραστηριότητα ή κάποια πειραματική διάταξη σε ένα πεδίο, πραγματοποιείται με διαφορετικές διαδικασίες. Με τη βοήθεια των οντολογιών εφαρμογής διευκολύνεται η σύγκριση των αποτελεσμάτων και η εξαγωγή συμπερασμάτων. 8.3.2. Μηχανική των Οντολογιών (Ontology Engineering) Η έννοια της μηχανικής των οντολογιών μεταφέρει τη θεωρητική και φιλοσοφική προσέγγιση των οντολογιών στην πρακτική τους μορφή, στην εύρεση δηλαδή τεχνικών και φορμαλισμών για την περιγραφή της γνώσης σε υπολογιστικά συστήματα. Όπως έχει αναφερθεί, με τις οντολογίες συγκεντρώνεται όλη η γνώση ενός πεδίου και αποδίδεται σε αυτή συγκεκριμένη δομή και τεκμηρίωση. Για να μπορεί να αξιοποιηθεί όλη αυτή η γνώση απαιτείται μια γλώσσα με καθορισμένο αλφάβητο, καθορισμένη σύνταξη και συγκεκριμένη σημασιολογία ώστε να διευκολύνεται η ανταλλαγή πληροφορίας μεταξύ των επιστημόνων και των συστημάτων. Για την ικανοποίηση αυτής της απαίτησης, πλήθος γλωσσών έχουν σχεδιαστεί. Οι γλώσσες αναπαράστασης οντολογιών διαχωρίζονται σε: Παραδοσιακές γλώσσες στις οποίες ανήκουν: (α) η λογική πρώτης τάξης (πχ. Prolog language), (β) η λογική πλαισίων (frame-based language), (γ) η περιγραφική λογική (description logic). Τα πιο χαρακτηριστικά παραδείγματα των παραδοσιακών γλωσσών αναπαράστασης οντολογιών είναι οι: Carin, Flogic, Loom, OCMI, Ontolingua. Γλώσσες οντολογιών που προορίζονται για το διαδίκτυο όπως: (α) Simple HTML Ontology Extension (SHOE), (β) Ontology Exchange Language (XOL), (γ) Ontology Markup Language (OML) και ΚΜL, (δ) Resource Description Framework Schema Language (RDFs), (ε) DARPA Agent Markup Language (DAML), (στ) Ontology Interchange Language (OIL) και (ζ) Web Ontology Language (OWL). Γλώσσες που αναπτύχθηκαν για την αναπαράσταση συγκεκριμένων οντολογιών σε συγκεκριμένες εφαρμογές. όπως οι CycL, GRAIL, NKRL, KIF, Loom. Όπως διαφαίνεται το πλήθος των γλωσσών με τις οποίες μπορεί να αναπαρασταθεί μια οντολογία είναι μεγάλο. Η διαφοροποίηση μεταξύ των γλωσσών βασίζεται: στη σύνταξη, στην ορολογία (Κλάση ή Έννοια, Περίπτωση ή Αντικείμενο),

στην εκφραστικότητα (κάτι που μπορεί να εκφραστεί σε μια γλώσσα δεν μπορεί να εκφραστεί σε μια άλλη), στην σημασιολογία (η ίδια δήλωση μπορεί να έχει διαφορετική σημασία σε διαφορετικές γλώσσες). Έτσι, ανάλογα με τις ανάγκες κάθε εφαρμογής επιλέγεται και η αντίστοιχη γλώσσα. Στην επόμενη ενότητα γίνεται μια λεπτομερής παρουσίαση της γλώσσας OWL. Η γλώσσα αυτή χρησιμοποιείται στο μεγαλύτερο πλήθος των οντολογιών που σχεδιάζονται για το διαδίκτυο. 8.3.3. Η Γλώσσα Οντολογιών OWL Η OWL είναι μια γλώσσα αναπαράστασης γνώσης για το Σημασιολογικό Ιστό που έχει αναπτυχθεί και προτυποποιηθεί από την World Wide Web Concortium (W3C) (οργανισμό που ασχολείται με την ανάπτυξη και προτυποποίηση τεχνολογιών για τον Παγκόσμιο Ιστό) το 2004. Βασίζεται στον φορμαλισμό των Περιγραφικών Λογικών επιτρέποντας την ανάπτυξη συλλογισμών και την εξαγωγή συμπερασμάτων (inference). Με τις δυο αυτές λειτουργίες ένας μηχανισμός εξαγωγής συμπερασμάτων (reasoner), ελέγχει τη συνέπεια μιας οντολογίας και διατηρεί σωστή την ιεραρχία των οντοτήτων-εννοιών. Η γλώσσα OWL παρέχεται σε τρεις εκδοχές αυξανόμενης εκφραστικότητας, την OWL Lite, OWL DL και OWL Full. Η OWL Lite ενδείκνυται για εφαρμογές με μειωμένες απαιτήσεις εκφραστικότητας. Το βασικό της πλεονέκτημα είναι η εύκολη κατανόησή της από τους χρήστες και υλοποίησή της από τα συστήματα. Απόρροια του δεύτερου είναι η δυνατότητα ανάπτυξης μηχανισμών εξαγωγής συμπερασμάτων που αναμένεται να λειτουργούν ταχύτερα από αυτούς που υλοποιούν γλώσσες με μεγαλύτερη εκφραστικότητα. Η OWL DL παρέχει τη μεγαλύτερη δυνατή εκφραστικότητα που προσφέρεται από τη γλώσσα OWL, ενώ ταυτόχρονα διατηρεί την αποφανσιμότητά της επιτρέποντας την αποδοτική υποστήριξη συλλογισμών. Βασικό μειονέκτημα της γλώσσας αυτής είναι η ελλιπής συμβατότητα της με την γλώσσα RDF. Η OWL Full είναι η πιο πλούσια εκδοχή της OWL, παρέχοντας όλο το λεξιλόγιο της OWL, ενώ ταυτόχρονα επιτρέπει τον συνδυασμό με τις γλώσσες RDF και RDF(s). Με τον τρόπο αυτό η γλώσσα αυτή είναι πλήρως συμβατή -συντακτικά και σημασιολογικά- με την RDF. Βασικότερο μειονέκτημά της είναι ότι είναι μη αποφάνσιμη μιας και η γλώσσα αυτή είναι τόσο ισχυρή ώστε να δημιουργούνται διλήμματα στις αποφάσεις και να μη δύναται να επιτευχθεί η αποδοτική υποστήριξη συλλογισμών. Σύνταξη και Σημασιολογία της OWL Όμοια με κάθε γλώσσα - φυσική, γλώσσα προγραμματισμού κτλ. - η ΟWL διαθέτει δικό της συντακτικό και αλφάβητο. Αναφορικά με το συντακτικό, η γλώσσα ΟWL ως γλώσσα που προορίζεται για το σημασιολογικό ιστό διαθέτει μια μορφή σύνταξης συμβατή με τη γλώσσα XML (γλώσσα του σημασιολογικού ιστού) τη σύνταξη XML/RDF ενώ ταυτόχρονα διαθέτει και μια δεύτερη μορφή σύνταξης την αφηρημένη σύνταξη (abstract syntax) λιγότερο περίπλοκη και περισσότερο κατάλληλη για διδακτικούς σκοπούς. Το αλφάβητό της αποτελείται από κλάσεις (classes) -σύνολο από αντικείμενα τα οποία έχουν κοινά χαρακτηριστικά-, ιδιότητες (properties) -δυαδικές σχέσεις- και ξεχωριστές οντότητες (individuals) -στιγμιότυπα των κλάσεων. Ένας από τους επεξεργαστές οντολογιών που χρησιμοποιείται για την σύνταξη σε OWL είναι ο Protégé (Σχήμα 8.1). Δομικό στοιχείο κάθε δέντρου ταξινομίας και κάθε οντολογίας αποτελούν οι κλάσεις. Στη γλώσσα OWL αναπαρίστανται ως owl:class. Δυο βασικές κλάσεις της γλώσσας είναι οι owl:thing και owl:nothing. Η πρώτη είναι η πιο γενική κλάση (περιέχει τα πάντα) και η δεύτερη είναι η κενή κλάση. Συνεπώς κάθε επιπλέον κλάση είναι υποκλάση της κλάσης Thing και υπερκλάση της κλάσης Nothing. Με την ιδιότητα rdfs:subclassof δηλώνονται οι σχέσεις υπαγωγής μεταξύ των κλάσεων (μια κλάση είναι υποκλάση μιας άλλης). Επιπλέον δυο κλάσεις μπορεί να είναι ξένες μεταξύ τους owl:disjointwith ή ισοδύναμες owl:equivalentclass. Επί των κλάσεων μπορούν να εφαρμοστούν τρεις λογικοί συνδυασμοί: η ένωση των κλάσεων owl:unionof, η τομή owl:intersectionof και το συμπλήρωμα owl:complementof. Μια επιπλέον

δυνατότητα που παρέχεται είναι η απαρίθμηση (enumeration) owl:oneof με την οποία ορίζεται μια κλάση με απαρίθμηση όλων των στοιχείων της (Πίνακας 8.1). Σχήμα 8.1 Στιγμιότυπο κλάσεων στο Protégé. Σύνταξη owl:class owl:subclassof owl:disjointwith owl:equivalentclass owl:thing owl:nothing Σημασιολογία κλάση υποκλάση κλάσεις ξένες μεταξύ τους ισοδύναμες κλάσεις γενική κλάση κενή κλάση Πίνακας 8.1 Στοιχεία των Κλάσεων της γλώσσας OWL. Οι ιδιότητες στην OWL αναπαριστούν δυαδικές σχέσεις δηλαδή ζευγάρια αντικειμένων και διακρίνονται σε ιδιότητες αντικειμένων (object properties) και ιδιότητες τύπου δεδομένων (data type properties). Η πρώτη κατηγορία χρησιμοποιείται για να συνδέσει άτομα μεταξύ τους π.χ. Λίμνη έχεισχήμα Κύκλο. Η δεύτερη κατηγορία χρησιμοποιείται για να συνδέσει κάποιο άτομο με κάποια συγκεκριμένη τιμή π.χ. Έρημος έχειηλικία xyz χρόνια. Όπως και στις κλάσεις έτσι και στις ιδιότητες ισχύουν οι σχέσεις υπαγωγής (ιδιότητα - υποϊδιότητα) rdfs:subpropertyof. Επίσης μπορεί μια ιδιότητα να είναι αντίστροφη μιας άλλης owl:inverseof ή ισοδύναμη owl:equivalentproperty. Επιπλέον η OWL παρέχει τη δυνατότητα καθορισμού του πεδίου ορισμού και το σύνολο τιμών μιας ιδιότητας αντικειμένων ή τύπων δεδομένων με τις εκφράσεις rdfs:domain και rdfs:range αντίστοιχα (Πίνακας 8.2). Σύνταξη rdfs:subpropertyofowl:inverseof owl:subclassofo owl:equivalentproperty owl:equivalentclass rdfs:domain rdfs:range Σημασιολογία υποϊδιότητα αντίστροφη ιδιότητα ισοδύναμη ιδιότητα ισοδύναμες κλάσεις πεδίο ορισμού σύνολο τιμών Πίνακας 8.2 Στοιχεία των Κλάσεων της γλώσσας OWL.

Ακόμα, η OWL παρέχει και μια σειρά χαρακτηριστικών των ίδιων των ιδιοτήτων. Μια ιδιότητα μπορεί να είναι συναρτησιακή (functional) owl:functionalproperty, αντίστροφη συναρτησιακή (inverse functional) owl:inversefunctionalproperty, συμμετρική οwl:symmetricproperty και μεταβατική (transitive) owl:transitiveproperty (Πίνακας 8.3). Σύνταξη owl:functionalproperty owl:inversefunctionalproperty owl:symmetricproperty owl:equivalentproperty οwl:transitiveproperty Σημασιολογία συναρτησιακή ιδιότητα αντίστροφη συναρτησιακή ιδιότητα συμμετρική ιδιότητα ισοδύναμη ιδιότητα μεταβατική ιδιότητα Πίνακας 8.3 Μετα-ιδιότητες των ιδιοτήτων της OWL. Για κάθε ιδιότητα μπορούν να οριστούν μια σειρά περιορισμών (restrictions). Με το στοιχείο\xena owl:allvaluesfrom (καθολικός περιορισμός πληθικότητας), ορίζεται ότι όλες οι τιμές που μπορεί να πάρει μια ιδιότητα προέρχονται αυστηρά από μια κλάση (καθολική ποσοτικοποίηση - universal quantification) ενώ αντίθετα με το στοιχείο owl:somevalues From (υπαρξιακός περιορισμός πληθικότητας) σε μια ιδιότητα μπορεί να αποδοθούν ορισμένες τιμές μιας κλάσης ή να αποδοθούν τιμές από περισσότερες της μιας κλάσης (υπαρξιακή ποσοτικοποίηση - existential quantification). Το στοιχείο owl:hasvalue, δηλώνει μια συγκεκριμένη τιμή που πρέπει να έχει μια ιδιότητα. Τέλος υπάρχει και μια σειρά αριθμητικών περιορισμών πληθικότητας όπως owl:mincardinality, owl:max Cardinality, owl:cardinality (Πίνακας 8.4). Σύνταξη owl:allvaluesfrom owl:somevaluesfrom owl:hasvalue owl:equivalentclass owl:mincardinality owl:maxcardinality owl:cardinality Σημασιολογία καθολικός περιορισμός πληθικότητας υπαρξιακός περιορισμός πληθικότητας περιορισμός με συγκεκριμένη τιμή ισοδύναμες κλάσεις ελάχιστος περιορισμός πληθικότητας μέγιστος περιορισμός πληθικότητας περιορισμός πληθικότητας συγκεκριμένης τιμής Πίνακας 8.4 Συνθήκες της γλώσσας OWL. Στην επιστήμη της Γεωχωρικής Πληροφορίας η χρησιμότητα των οντολογιών έχει ήδη αναγνωριστεί από τη βιβλιογραφία (Visser κ.ά. 2002, Fonseca κ.ά. 2002). Μεγάλο πλήθος γεωγραφικών οντολογιών πεδίου έχουν σχεδιαστεί για την οργάνωση και τεκμηρίωση της γνώσης πεδίων όπως επιστήμη των θαλασσών (MarineTLO), υδρολογία (Pundt & Bishr 2002), επιστήμη δασών (Leader & Paques 2013) φυσικά φαινόμενα και ανθρώπινες δραστηριότητες (Raskin & Pan 2005). 8.4. Διασυνδεδεμένα Ανοιχτά Δεδομένα Στις μέρες μας υπάρχει μεγάλος όγκος πληροφορίας στο διαδίκτυο η οποία αν και πλούσια είναι συνήθως σε κειμενική μορφή και ασύνδετη μεταξύ της. Ο προσανατολισμός της HTML (γλώσσα που χρησιμοποιείται ευρέως στο διαδίκτυο) στρέφεται κυρίως στην κωδικοποίηση κειμένων που περιέχουν πληροφορία και δεδομένα. Με τον τρόπο αυτό η προσπέλαση και εύρεση εκείνων των τμημάτων της πληροφορίας που είναι χρήσιμα για κάποιον χρήστη είναι δύσκολη. Επίσης με τον τρόπο αυτό δυσχεραίνεται η διασύνδεση της πληροφορίας. Παραδείγματος χάρη, η γνώση για τον Παρθενώνα που αφορά στην αρχιτεκτονική του πλευρά

δεν συσχετίζεται με τη γνώση που αφορά στην θρησκευτική ή ιστορική του πλευρά πόσο μάλλον να συσχετιστεί με την κοινωνικοπολιτική κατάσταση της αρχαίας Ελλάδας την περίοδο της δημιουργίας του. Τους περιορισμούς αυτούς στην αναπαράσταση και ανάκτηση πληροφορίας στο διαδίκτυο έρχεται να αντιμετωπίσει η λογική των ΔΑΔ με τους μηχανισμούς που υποστηρίζονται από την RDF (Klyne & Carroll 2006). H βασική καινοτόμα λογική που εισήχθη προτείνει τον «απεγκλωβισμό» των δεδομένων από την κειμενική τους μορφή και την αναπαράστασή τους στην μορφή τριπλέτας «Υποκείμενο - Χαρακτηριστικό Αντικείμενο» (Heath & Bizer 2011) πολύ κοντινή στη δόμηση της φυσικής γλώσσας με «Υποκείμενο - Ρήμα Αντικείμενο». Η έννοια των δεδομένων ξεφεύγει από τη στείρα παραδοσιακή λογική π.χ. γεωτεμάχια ενός νομού, πρωτεύουσες χωρών, οικοδομικά τετράγωνα, πληθυσμιακά στοιχεία κτλ. και περιλαμβάνει πλέον οτιδήποτε π.χ. το ωράριο λειτουργίας ενός καταστήματος, η πόλη που γεννήθηκε ένας συγγραφέας, η αθλητική δραστηριότητα που γίνεται σε μια περιοχή. Όπως βλέπουμε τα ΔΑΔ δεν εισάγουν μόνο μια νέα τεχνολογία ή μια νέα μορφή με την οποία κωδικοποιείται πληροφορία στο διαδίκτυο, αλλά προτείνουν μια ολοκληρωμένη εννοιολογική προσέγγιση στην οργάνωση και διασύνδεση της πληροφορίας. 8.4.1. Αρχές Σχεδιασμού και Χρήσεις Διασυνδεδεμένων Ανοιχτών Δεδομένων Βασικά στοιχεία που πρέπει να πληρούνται ώστε τα ΔΑΔ να είναι εύκολα στη χρήση τους είναι: να είναι σε μορφή εύκολα προσπελάσιμη στο διαδίκτυο, να είναι σε μορφή εύκολα επεξεργάσιμη από τις μηχανές αναζήτησης. Σύμφωνα με τον Tim Berners 4 που ήταν από τους πρώτους που εισήγαγαν την ανάγκη των ΔΑΔ προκειμένου να επιτύχει η διαδικασία απαιτούνται πέντε συστατικά: ο διαμοιρασμός της πληροφορίας να γίνεται με ανοιχτές άδειες, τα δεδομένα να είναι δομημένα, να χρησιμοποιούνται ανοιχτά πρότυπα για τη δόμηση των δεδομένων, να χρησιμοποιούνται URIs για την ταυτοποίηση της πληροφορίας, να γίνεται διασύνδεση των δεδομένων ενός παρόχου με τον άλλο ώστε να παρέχεται το ευρύτερο πλαίσιο. Ο Berners-Lee (2011) πρότεινε ως βασικές αρχές των ΔΑΔ (linked data principles) τις εξής: αξιοποίηση URIs για την αναγνώριση οντοτήτων, αξιοποίηση HTTP URIs για την προσπέλαση δεδομένων από τρίτους, χρήση του προτύπου RDF για την παροχή περαιτέρω πληροφορίας όταν κάποιος χρήστης προσπελαύνει κάποιο URI, διασύνδεση των URIs με άλλα ώστε να μπορεί να βρει κανείς συμπληρωματικές πηγές πληροφοριών. Σε πρακτικό επίπεδο, το σύνολο της πληροφορίας οργανώνεται σε τριπλέτες στη μορφή «Υποκείμενο-Ρήμα- Αντικείμενο» και κωδικοποιείται σε μορφή RDF. Και τα τρία δομικά της στοιχεία είναι URIs ενώ ιδιαίτερη έμφαση δίνεται στη σύνδεση (το μεσαίο τμήμα της τριπλέτας) πχ. το δεδομένο Σπερχειός συνδέεται με το δεδομένο Λαμία μέσω της σχέσης κοντάσε (Σχήμα 8.2). Στο Σχήμα 8.3 παρατίθεται ένα παράδειγμα σε RDF δεδομένων για τον Σπερχειό από το ΥΠΕΚΑ. Σχήμα 8.2 Παράδειγμα τριπλέτας ΔΑΔ. 4 http://5stardata.info/en/ (τελευταία προσπέλαση στις 25/10/2015).

Σχήμα 8.3 ΔΑΔ κωδικοποιημένα σε RDF. Τα υποκείμενα και αντικείμενα (Σπερχειός και Λαμία αντίστοιχα) έχουν μοναδικά URIs που τα καθιστούν «πολίτες του διαδικτύου» και επιτρέπουν την ταυτοποίηση και σύνδεσή τους με άλλη πληροφορία. Έτσι ο χρήστης όταν αναζητάει πληροφορία για το Σπερχειό, ταυτόχρονα έρχεται σε επαφή και με την πληροφορία για τη Λαμία πράγμα που ήταν αδύνατο να πραγματοποιηθεί στην προηγούμενη μορφή του διαδικτύου. Συνδυάζοντας τις τριπλέτες προκύπτει ένα δίκτυο/γράφος της πληροφορίας (Σχήμα 8.4). Σχήμα 8.4 Απλός γράφος ΔΑΔ. Ο γράφος αυτός μπορεί να διευρυνθεί περαιτέρω με την σύνδεση της πληροφορίας με εξωτερικές πηγές. (Σχήμα 8.5).Έτσι σταδιακά δημιουργείται ένα πολύ μεγάλο δίκτυο πληροφορίας.

Σχήμα 8.5 Διασύνδεση γράφου με εξωτερικά δίκτυα δεδομένων. Το πιο βασικό στοιχείο κάθε τριπλέτας είναι η σύνδεση μεταξύ υποκειμένου και αντικειμένου. Στο παρελθόν με τις κλασικές μεθόδους ανάρτησης κειμενικού υλικού και τη δημιουργία εφαρμογών ο δημιουργός ήταν γνώστης της σημασιολογίας των δεδομένων και των μοντέλων του οπότε και δεν υπήρχε ανάγκη περιγραφής και διαμοιρασμού του. Στη σημερινή μορφή όμως που στόχος είναι ο διαμοιρασμός και η επαναχρησιμοποίηση των δεδομένων, είναι απαραίτητη η σημασιολογική περιγραφή τους ώστε να μπορούν να αξιοποιηθούν από τρίτους καθώς και για να μπορούν να αξιοποιηθούν από εφαρμογές για τις οποίες αρχικά δεν προορίζονταν. Στην τριπλέτα των ΔΑΔ, το μεγαλύτερο ποσοστό σημασιολογικής πληροφορίας συγκεντρώνεται στις συνδέσεις μεταξύ υποκειμένου και αντικειμένου. Οι συνδέσεις αυτές συγκεντρώνονται σε απλές ταξονομίες, τα λεξιλόγια (vocabularies). O κάθε χρήστης είναι ελεύθερος είτε να δημιουργήσει κάποιο δικό του λεξιλόγιο, είτε να επαναχρησιμοποιήσει κάποιο δημοσιευμένο. Συνίσταται, εφόσον υπάρχει κάποιο κατάλληλο, να επαναχρησιμοποιείται κάποιο υφιστάμενο λεξιλόγιο ώστε να μειώνονται τα προβλήματα σημασιολογικής διαλειτουργικότητας. 8.4.2. Λεξιλόγια Μερικά παραδείγματα λεξιλογίων που χρησιμοποιούνται στα ΔΑΔ αναφέρονται παρακάτω: το λεξιλόγιο της DBpedia, το Open Time and Space Core Vocabulary, τo Frappe Frame, Pixel, Place, Event τιμary, το Ontomedia Space Representation, το linkedgeodata onotology, το ISO 3266 - Country codes, το Ontology of administrative unions in France, το The geonames ontology, το Juso vocabulary, το Core location vocabulary, το Place on Schema.

8.5. Προηγμένες Τεχνικές Εξόρυξης Γεωχωρικών Δεδομένων Πέρα από το πλήθος γεωχωρικής πληροφορίας που αναρτάται με κάποιο οργανωμένο τρόπο στο διαδίκτυο από φορείς συλλογής και διάθεσης δεδομένων (βλέπε Υποενότητα 8.2. του παρόντος), υπάρχει ακόμα μεγαλύτερος όγκος πληροφοριών που έχουν χωρική αναφορά και δεν διατίθεται σε συγκεκριμένη μορφή και με κάποιον οργανωμένο τρόπο. Τέτοια παραδείγματα είναι κείμενα που έχουν χωρική πληροφορία, εικόνες που αναφέρουν τοποθεσίες στα μεταδεδομένα ή τις περιγραφές τους και ευρύτερο πολυμεσικό υλικό. Ενώ τις προηγούμενες δεκαετίες η επιστήμη της γεωγραφικής πληροφορίας επικεντρωνόταν κυρίως στον τομέα των χωρικών βάσεων δεδομένων και την χαρτογραφική τους αναπαράσταση σε ΣΓΠ, με την δυνατότητα χωρικών αναλύσεων στα πλαίσια που τα συστήματα αυτά το επέτρεπαν, στη σημερινή εποχή το αντικείμενο έχει διευρυνθεί πάρα πολύ. Αποτέλεσμα αυτού είναι η ενασχόληση με την εύρεση μεθόδων και την ανάπτυξη συστημάτων που κατανοούν όλο αυτό το πλήθος αδόμητης γεωχωρικής πληροφορίας που διατίθεται ελεύθερα στο διαδίκτυο, και μπορούν να αξιοποιούν και να επιστρέφουν στον τελικό χρήστη τα καλύτερα δυνατά αποτελέσματα. Το ενδιαφέρον είναι ιδιαίτερα μεγάλο αν αναλογιστεί κανείς ότι 13-15% των ερωτήσεων που υποβάλλονται σε μηχανές αναζήτησης έχουν κάποια χωρική αναφορά. Μια από τις βασικές διαφορές μεταξύ νέων και παλαιότερων προσεγγίσεων είναι ότι η γεωχωρική πληροφορία στην κλασική της μορφή είναι γεωκωδικοποιημένη δηλαδή προσδιορίζεται άμεσα σε κάποιο σύστημα αναφοράς. Σε αντίθεση η αξιοποίηση πληροφορίας με γεωγραφική αναφορά που βρίσκεται ελεύθερη σε κείμενα και περιγραφές, δεν είναι άμεσα γεωκωδικοποιημένη και απαιτεί την καταβολή μεγάλης προσπάθειας για την γεωκωδικοποίησή της. Η έρευνα προς αυτή την κατεύθυνση εντάσσεται στο γενικότερο πεδίο της ανάκτησης πληροφορίας (information retrieval) και αφορά σε μεθόδους και αλγορίθμους εύρεσης της καταλληλότερης πληροφορίας που απαντά σε κάποιο ερώτημα του χρήστη (Baeza-Yates κ.ά. 1999, Manning κ.ά. 2008). Η πληροφορία αυτή συνήθως προέρχεται από ένα μεγάλο σύνολο αδόμητων και ετερογενών δεδομένων. Για το λόγο αυτό, στις προσεγγίσεις λαμβάνονται στοιχεία και πρακτικές από διάφορες επιστήμες όπως την επιστήμη των υπολογιστών, τη γνωσιακή επιστήμη, τα μαθηματικά, τη βιβλιοθηκονομία και τη γλωσσολογία. Η ανάκτηση γεωγραφικής πληροφορίας αφορά στην εύρεση πληροφορίας που έχει χωρική αναφορά. Η έννοια της τοποθεσία είναι είτε άμεσα είτε έμμεσα διαθέσιμη. Η χρήση έξυπνων συσκευών με ενσωματωμένο δέκτη GPS ή wifi και οι κατάλληλες εφαρμογές επιτρέπουν στο χρήστη την άμεση προσθήκη πληροφοριών θέσης στα μεταδεδομένα όπως για παράδειγμα κατά τη λήψη και ανάρτηση φωτογραφιών στο Flickr. Μέσα από αυτή τη διαδικασία προστίθεται άμεση χωρική πληροφορία ιδιαίτερα χρήσιμη για την ανάκτηση δεδομένων με χωρική αναφορά από υπηρεσίες με επίγνωση θέσης (location aware services). Αναφορικά στην έμμεση αναφορά στην τοποθεσία, αυτή βρίσκεται συνήθως σε κειμενική μορφή πχ. μέσα από την αναφορά τοποθεσιών και χαρακτηριστικών σημείων και αποτελεί επίκεντρο των μελετών στο πεδίο της ανάκτησης της γεωγραφικής πληροφορίας. Ο λόγος είναι: Tο γεγονός ότι υπάρχει πολύ μεγάλο πλήθος τέτοιων δεδομένων (αν αναλογιστεί κανείς τον όγκο περιεχομένου που δημιουργεί καθημερινά το πλήθος όπως ταξιδιωτικές περιγραφές, μηνύματα Twitter, wikis, blogs, forums κλπ.). Tο γεγονός ότι η φυσική γλώσσα του ανθρώπου είναι πολύ πλούσια αλλά ιδιαίτερα πολύπλοκη και αμφίσημη κατά την επεξεργασία της από τους υπολογιστές. Ο προσδιορισμός της γεωχωρικής πληροφορίας γίνεται μέσα από τη λεκτική, συντακτική και σημασιολογική ανάλυση του κειμένου. Η διαδικασία αυτή εντάσσεται στην ευρύτερη κατηγορία της αναγνώρισης ονομάτων (Named Entity Recognition - NER) στην επιστήμη της επεξεργασίας φυσικής γλώσσας (natural language processing). Στόχος του ΝΕR είναι η αναγνώριση και επισημείωση σε κείμενα κατηγοριών όπως άτομα, οργανισμοί, τοποθεσίες, εκφράσεις χρόνου, γεγονότα κτλ. (Nadeau και Sekine 2007). Επόμενο στάδιο μετά την εύρεση της γεωχωρικής πληροφορίας είναι η γεωκωδικοποίηση της (geocoding) δηλαδή η αντιστοίχισή της με γεωγραφικές συντεταγμένες σε κάποιο γεωγραφικό σύστημα αναφοράς. Παραδείγματα σε κειμενική μορφή μπορεί να είναι ταχυδρομικές διευθύνσεις (συνήθως απαρτιζόμενων από ταχυδρομικό κώδικα και οδό) και ονόματα τοποθεσιών. Μια επισκόπηση των τεχνικών και μεθόδων γεωκωδικοποίησης από διεπιστημονικής πλευράς και κυρίως με τεχνικό προσανατολισμό μπορεί να ανατρέξει κανείς στο (Goldberg κ.ά. 2007).

Η πλούσια δομή και σημασιολογία της φυσικής γλώσσας καθιστά την διαδικασία της εύρεσης και γεωκωδικοποίησης πληροφορίας ιδιαίτερα πολύπλοκη. Το γεγονός αυτό ενισχύεται ακόμα περισσότερο αν αναλογιστεί κανείς τις διαφορές που προκύπτουν στην εννοιολόγηση και την έκφραση γεωχωρικών εννοιών από χρήστες με διαφορετικό πολιτισμικό, μορφωτικό και κοινωνικοπολιτικό υπόβαθρο. Μια πρώτη πρόκληση που συναντάται κατά την ανάκτηση γεωχωρικής είναι η αναγνώριση οντοτήτων που αναφέρονται σε τοποθεσίες και όχι σε κάτι άλλο όπως πρόσωπα. Για παράδειγμα, πολλές φορές οι ταχυδρομικές διευθύνσεις περιέχουν ονόματα όπως Οδός Β. Σοφίας, Λεωφόρος Παπανικολή κλπ. Ο αλγόριθμος θα πρέπει με κατάλληλους τρόπους να μπορεί να διαχωρίσει πότε οι λεκτικές αυτές περιγραφές αναφέρονται σε ονόματα και πότε σε τοποθεσίες. Το ζήτημα αυτό είναι ένα από τα κλασικά προβλήματα συνωνυμίας που αντιμετωπίζονται στην επιστήμη της ανάκτησης πληροφορίας (Leveling κ.ά. 2006). Στο επόμενο στάδιο πρέπει να αντιμετωπιστεί το ζήτημα της αποσαφήνισης της όρων με την ίδια ονομασία π.χ. Αθήνα στην Ελλάδα και Αθήνα στη Γεωργία της Αμερικής, πάνω από 30 πόλεις στη Γερμανία αναφέρονται ως Zell, πολλά νησιά της Ελλάδος έχουν τοποθεσίες με το ίδιο όνομα όπως Κόρφος, Ακρωτήρι, Σαρακήνικο, Βάλα κλπ. Τα ζητήματα αυτά πολυσημίας είναι εύκολο να αποσαφηνιστούν από τον ανθρώπινο εγκέφαλο όταν λαμβάνεται υπόψη το πλαίσιο μέσα στο οποίο αναφέρεται μια τοποθεσία. Εύκολα μπορεί να συμπεράνει κανείς ότι όταν διαβάζει ένα κείμενο που αναφέρει τοποθεσίας όπως Παρθενώνας, πλατεία Συντάγματος, σταθμός μετρό Μοναστηράκι η πιθανότητα της λέξης Αθήνα που αναφέρεται στο ίδιο κείμενο να αναφέρεται στην Αθήνα της Ελλάδας είναι πολύ μεγαλύτερη από την πιθανότητα να αναφέρεται στην Αθήνα της Γεωργίας, Αμερικής. Το ίδιο δεν ισχύει όμως για τα υπολογιστικά συστήματα. Για το λόγο αυτό πλήθος τεχνικών έχουν εφαρμοστεί για την αποσαφήνιση τοποθεσιών όπως οντολογίες (Volz κ.ά. 2007), μοντέλα συνύπαρξης (co-occurence models) (Overell κ.ά. 2007), εννοιολογική συνάφεια (conceptual density) (Buscaldi & Rosso 2008), συστήματα βασισμένα σε κανόνες (rule-based systems) (Garbin & Mani 2005), μέτρα σημασιολογικής ομοιότητας (semantic similarity measure) (Batista κ.ά. 2010). Μεγάλη πρόκληση για τα υπολογιστικά συστήματα είναι η ασάφεια των χωρικών περιγραφών τοποθεσιών. Για παράδειγμα, εκφράσεις όπως Βόρεια Ελλάδα, Ανατολικές Ακτές, Κεντρική Ευρώπη είναι πολύ δύσκολο να γεωκωδικοποιηθούν. Το γεγονός αυτό οφείλεται κυρίως στο ότι οι περιγραφές αυτές αναφέρονται σε περιοχές που δεν έχουν σαφή όρια. Το στοιχείο αυτό δυσχεραίνει ακόμα περισσότερο τη διαδικασία αν αναλογιστεί κανείς ότι στην κλασική διαδικασία γεωκωδικοποίησης ένα όνομα αντιστοιχίζεται σε ένα ζεύγος συντεταγμένων δηλαδή ένα σημείο (Hill 2009). Έντονα θέματα ασάφειας εμφανίζονται και στην κατανόηση χωρικών εκφράσεων όπως κοντά, μακριά, αριστερά, δεξιά, πάνω κάτω, την έκφραση απόστασης μέσω χρονικού διαστήματος όπως «απέχει 5 λεπτά από το σπίτι μου», σύνθετες χωρικές εκφράσεις όπως 15 χιλιόμετρα νότια της Αθήνας ή την πολυσημία προθέσεων. Η πρόκληση στην περίπτωση αυτή είναι η εύρεση του σωστού συστήματος αναφοράς και η ποσοτικοποίηση των λεκτικών περιγραφών σε μονάδες απόστασης (Hall & Jones 2008). Αναφορικά στα συστήματα αναφοράς, η πληροφορία μπορεί να αναφέρεται σε απόλυτα συστήματα όπως το γεγονός Α λαμβάνει χώρα στην Αθήνα, ή να αναφέρονται σε σχετικά συστήματα αναφοράς όπως το γεγονός Α λαμβάνει χώρο 10 χιλιόμετρα βορειοανατολικά της Αθήνας (Levinson 1991) Οι Hutchinson και Veenendal (2013) σημειώνουν ότι η μέθοδος μοντελοποίησης μεσώ πρακτόρων (agent-based modeling) (Getschell κ.ά. 2008) και η θεωρία πίστης-επιθυμίας-πρόθεσης (Geogreff κ.ά. 1999) μπορεί να εισάγει πιο ευφυείς λύσεις στο θέμα της γεωκωδικοποίησης. Τα αποτελέσματα της συγκεκριμένη έρευνας δείχνουν ότι η επιτυχία μιας μεθόδου γεωκωδικοποίησης βασίζεται ιδιαίτερα στη σημασιολογία και το πλαίσιο. Οι Weihong κ.ά. (2014) χρησιμοποιούν στην προσέγγισή τους Μπαϋεσιανές μεθόδους (Bayesian methods) για την κατάτμηση ονομασιών τοποθεσιών (place name segmentation) και τη γεωκωδικοποίησή τους. Οι Qin κ.ά. (2013) παρουσιάζουν ένα ιδιαίτερα απαιτητικό πεδίο εφαρμογής, αυτό της άμεσης γεωκωδικοποίησης σημείων ατυχημάτων στο οποίο αξιοποιούνται ευφυείς τεχνικές για την εξαγωγή πληροφορίας της θέσης από αστυνομικές εκθέσεις.

Βιβλιογραφία Batista, D., Silva, M., Couto, F., & Behera, B. (2010). Geographical signatures for semantic retrieval. Proceedings of the 6th Workshop on Geographic Information Retrieval (p. 19). Zurich, Switzerland: ACM. Beaza - Yates, R., & Ribeiro - Neto, B. (1999). Modern infromation retrieval. New York: ACM press. Berners - Lee, T. (2006). Linked data - design issues. Retrieved 10 25, 2015, from http://www.w3org/designissues/linkeddata Bishr, Y. (1998). Overcoming the semantic and other barriers to gis interoperability. International Journal of Geographical Information Science, 12(4), pp. 299-314. Buscaldi, D., & Rosso, P. (2008). A conceptual density-based approach for the disambiguation of toponyms. International Journal of Geographical Information Science, 22(3), pp. 301-313. Garbin, E., & Mani, I. (2005). Disambiguating toponyms in news. Proceedings of the conference on Human Language Technology and Empirical Methods in Natural Language Processing (pp. 363-370). Vancouver: Association for Computational Linguistics. Georgeff, M., Pell, B., Pollack, M., Tambe, M., & M., W. (1999). The belief-desire-intention model of agency. In J. Müller, M. Singh, & A. Rao (Eds.), Intelligent Agents V: Agents Theories, Architectures, and Languages (Vol. 1555, pp. 1-10). Berlin, Heidelberg: Springer Verlag. Goldberg, D., Wilson, J., & Knoblock, C. (2007). From text to geographic coordinates: the current state of geocoding. Journal of Urban and Regional Information Systems Association, 19(1), pp. 33-46. Gómez-Pérez, A., Fernández-López, M., & Corcho, O. (2004). Ontological Engineering: with examples from the areas of Knowledge Management, e-commerce and the Semantic Web. London: Springer-Verlag. Hall, M., & Jones, C. (2008). Quantifying spatial prepositions: an experimental study. Proceedings of the 16th International Conference on Advances in Geographic Information Systems (p. 62). Chicago, IL, USA: ACM. Heath, T., & Bizer, C. (2011). Linked data: Evolving the web into a global data space. San Rafael, CA: Morgan & Claypool Publishing. Hill, L. (2009). Georeferencing: The geographic associations of information. Cambridge, MA: MIT Press. Hutchinson, M., & Veenendaal, B. (2013). An agent-based framework for intelligent geocoding. Applied Geomatics, 5(1), pp. 33-44. Karalopoulos, A., Kokla, M., & Kavouras, M. (2004). Geographic knowledge representation using conceptual graphs. 7th AGILE Conference on Geographic Information Science, 28. Creete, Greece. Klyne, G., & Carroll, J. (2006). Resource description framework (rdf): Concepts and abstract syntax. Retrieved 10 25, 2015, from W3C Reccomendation, World Wide Wed Consortium (W3C): https://www.w3.org/tr/rdf-concepts/ Lakhani, K., & Von Hippel, E. (2003). How open source software works: free user-to-user assistance. Research Policy, 32(6), pp. 923-943. Leveling, J., Hartrumpf, S., & Veiel, D. (2006). Using semantic networks for geographic information retrieval. Στο Accessing Multilingual Information Repositories (pp. 977-986). Berlin Heidelberg: Springer-Verlag. Levinson, S. (1991). Relativity in spatial conception and description. Nijmegen: Cognitive Anthropology Research Group at the Max Planck Institute fur Psycholinguistics. Manning, C., Raghavan, P., & Schütze, H. (2008). Introduction to information retrieval. Cambridge: Cambridge University Press.

Mizoguchi, M., & Ikeda, M. (1998). Towards ontology engineering. Journal - Japanese Society for Artificial Inteligence, 13, pp. 9-10. Nadeau, D., & Sekine, S. (2007). A survey of named entity recognition and classification. Lingvisticae Investigationes, 30(1), pp. 3-26. Overell, S., Magalhaes, j., Rüger, S., & al., e. (2006). Place disambiguation with co-occurrence models. Working Notes. CLEF 2006 Workshop. Pundt, H., & Bishr, Y. (2002). Domain ontologies for data sharing--an example from environmental monitoring using field gis. Computers & Geosciences, 28(1), pp. 95-102. Qin, X., Parker, S., Liu, Y., Graettinger, A., & Forde, S. (2013). Intelligent geocoding system to locate traffic crashes. Accident Analysis & Prevention, 50, pp. 1034-1041. Raskin, R., & Pan, M. (2005). Knowledge representation in the semantic web for earth and environmental terminology (sweet). Computers & geosciences, 31(9), pp. 1119-1125. Sanderson, M., & Kohler, J. (2004). Analyzing geographic queries. proceedings of Workshop on Geographic Information Retrieval SIGIR, 2. Visser, U., Stuckenschmidt, H., Schuster, G., & Vögele, T. (2002). Ontologies for geographic information processing. Computers & Geosciences, 28(1), pp. 103-117. Volz, R., Kleb, J., & Mueller, W. (2007). Towards ontology-based disambiguation of geographical identifiers. I3. Weihong, L., Ao, Z., & Kan, D. (2014). An efficient bayesian framework based place name segmentation algorithm for geocoding system. Fifith International Conference on Intelligent Systems Design and Engineering Applications (pp. 141-144). Hunan: IEEE. WP Leader and Berthold Heinze BFW. (n.d.). Trees4Future. Retrieved 25 10, 2015, from Designing trees for the future: http://www.trees4future.eu/uploads/brochures/efi_trees4future_brochure_reprint.pdf Yu, L. (2011). Linked open data, A Developer s Guide to the Semantic Web. Berlin Heidelberg: Springer- Verlag.