Γραμματειακή Yποστήριξη Σχολών Πανεπιστημίων: Ανάπτυξη Ιστοσελίδας με Xρήση Τεχνολογιών Σημασιολογικού Ιστού (Semantic Web)

Σχετικά έγγραφα

Διασύνδεση και Άνοιγμα Δεδομένων του Α.Π.Θ. Καραογλάνογλου Κωνσταντίνος Μονάδα Σημασιολογικού Ιστού Α.Π.Θ 18/3/2014

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος Κεφάλαιο 1 ο Αρχές Διαχείρισης πληροφορίας στον Παγκόσμιο Ιστό... 15

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού

Εργαστήριο Σημασιολογικού Ιστού

Σημασιολογικοί Ιστοχώροι: Γιατί Drupal. 18/3/2014 Μυρτώ Αμοργιανού Μονάδα Σημασιολογικού Ιστού

Ανάκτηση Πληροφορίας

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: ΣΥΓΓΡΑΦΕΑΣ:

Διαδίκτυο: δίκτυο διασυνδεμένων δικτύων Ξεκίνησε ως ένα μικρό κλειστό στρατιωτικό δίκτυο, απόρροια του Ψυχρού Πολέμου μεταξύ ΗΠΑ και ΕΣΣΔ.

Πρότυπα και Τεχνολογίες Semantic Web και Web 2.0 και η εφαρμογή τους στην Ηλεκτρονική Διακυβέρνηση

ΕΠΛ 012 Εισαγωγή στο Παγκόσμιο Πλέγμα Πληροφοριών

ΕΦΑΡΜΟΓΗ ΔΙΑΧΕΙΡΙΣΗΣ ΙΣΤΟΣΕΛΙΔΩΝ ΜΕΛΩΝ ΔΕΠ, ΤΜΗΜΑΤΟΣ ΜΑΘΗΜΑΤΙΚΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΠΑΤΡΩΝ ΕΓΧΕΙΡΙΔΙΟ ΟΔΗΓΙΩΝ ΠΛΟΗΓΗΣΗΣ ΚΑΙ ΧΡΗΣΗΣ

Η Oracle ανακοίνωσε την πιο ολοκληρωμένη λύση στον τομέα της Ανάλυσης δεδομένων στο Cloud

Ανάπτυξη Οντολογικής Γνώσης για Τεκμηρίωση Οπτικοακουστικού Περιεχομένου ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Επιμορφωτικές Τηλεκπαιδεύσεις

Διαχείριση, Δημοσίευση και Διάθεση Ανοικτών Εκπαιδευτικών Πόρων

Η βασική εργαλειοθήκη του διαδικτύου (2 ο μέρος)

Εισαγωγή στις ΤΠΕ ΙΙ Γιάννης Βρέλλης ΠΤΔΕ-Πανεπιστήμιο Ιωαννίνων. World Wide Web. Παγκόσμιος Ιστός

Εργαστήριο Σημασιολογικού Ιστού

Μεταπτυχιακή Διατριβή

Εργαστήριο Σημασιολογικού Ιστού

ΜΕΤΑΦΟΡΑ ΤΩΝ ΔΕΔΟΜΕΝΩΝ ΠΟΥ ΑΦΟΡΟΥΝ ΤΟ ΑΤΟΜΟ ΣΑΣ ΣΕ ΤΡΙΤΑ ΜΕΡΗ

ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΑ ΕΡΓΑΛΕΙΑ ΓΙΑ ΤΟ ΔΙΑΔΙΚΤΥΟ

Κεφάλαιο 9: Διαδίκτυο, Web 2.0 και Web X.0. Εφαρμογές Πληροφορικής Κεφ. 9 Καραμαούνας Πολύκαρπος 1

O7: Πρόγραμμα Κατάρτισης Εκπαιδευτικών O7-A1: Αναπτύσσοντας εργαλεία για το Πρόγραμμα Κατάρτισης Εκπαιδευτικών

Συνοπτικός Οδηγός Χρήσης του Moodle για τον Καθηγητή

ΤΕΙ ΚΑΒΑΛΑΣ. Πτυχιακή εργασία ΕΙΣΑΓΩΓΗ. Μιλτιάδης Κακλαμάνης

Εφαρμογές που χρησιμοποιούν το πρότυπο DCAT. Γιάννης Ξυδιάς

Γλώσσες Σήµανσης (Markup Languages) Τεχνολογία ιαδικτύου και Ηλεκτρονικό Εµπόριο

ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ Π.Σ. ΦΟΙΤΗΤΟΛΟΓΙΟΥ- ΓΙΑ ΤΟ ΔΙΔΑΣΚΟΝΤΑ (ClassWeb)

Ολοκληρωμένο σύστημα διαχείρισης παρουσιών στο Τ.Ε.Ι. Σερρών

Θεωρητική προσέγγιση του Σημασιολογικού Ιστού στο χώρο της πολιτισμικής πληροφορίας: μία πρότυπη εφαρμογή στη βιβλιοθηκονομία

ΕΥΦΥΕΙΣ ΠΡΑΚΤΟΡΕΣ ΓΙΑ ΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ: Μια σύντομη αναφορά στο παρόν και στο μέλλον

Διαχείριση Πολιτισμικών Δεδομένων

Linked Data for the Masses: Η προσέγγιση και το λογισμικό

Τεχνολογίες RDF για τον Ιστό Δεδοµένων

Παραδοτέο Π5.3: Έντυπο και ψηφιακό υλικό (Web site) προβολής των δράσεων έργου

Σε παγκόσμιο επίπεδο, οιμηχανέςαναζήτησηςτουinternet αναπτύχθηκαν για να κάνουν αναζήτηση πληροφοριών σε πολλαπλές τοποθεσίες ιστού.

ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΤΕΧΝΟΛΟΓΙΩΝ ΔΙΑΔΙΚΤΥΑΚΩΝ ΥΠΗΡΕΣΙΩΝ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗ ΤΗΣ ΤΕΧΝΟΛΟΓΙΑΣ REST ΠΛΑΣΤΑΡΑΣ ΕΥΡΙΠΙΔΗΣ

Μαθηματικά Λογισμικά και Γλώσσες Αναπαράστασης Γνώσης

Υπηρεσίες Ιστού (Web Services) ΜΙΧΑΛΗΣ ΜΑΛΙΑΠΠΗΣ

Γιώργος Χρ. Μακρής. Σύγχρονες Γλώσσες Σήμανσης του Διαδικτύου. Αναπαράσταση Μαθηματικών κειμένων στο διαδίκτυο. Η Γλώσσα MathML

"Αθηνά" - Ερευνητικό Κέντρο Καινοτομίας στις Τεχνολογίες της Πληροφορίας, των Επικοινωνιών και της Γνώσης

ΕΓΧΕΙΡΙΔΙΟ ΜΑΘΗΤΗ. της Πλατφόρμας Τηλεκατάρτισης

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΔΙΔΑΣΚΑΛΙΑ ΓΝΩΣΤΙΚΗΣ ΣΤΡΑΤΗΓΙΚΗΣ ΓΙΑ ΤΗΝ ΚΑΤΑΝΟΗΣΗ Δρ. Ζαφειριάδης Κυριάκος Οι ικανοί αναγνώστες χρησιμοποιούν πολλές στρατηγικές (συνδυάζουν την

Σχεδίαση και Ανάπτυξη Ιστότοπων

ΔΕΛΤΙΟ ΤΥΠΟΥ Open Data Day 2013

Το Μέλλον για τα Συστήματα Διαχείρισης Ακτινολογικής Εικόνας (PACS)

Ανάπτυξη πλήρους διαδικτυακής e-commerce εφαρμογής με χρήση του CMS WordPress

Έκδοσης 2005 Π. Κεντερλής

Κεφάλαιο 13: : Εφαρμογές νέφους. Καραμαούνας Π. 1

Όλες οι υπηρεσίες είναι διαθέσιμες μέσω διαδικτύου.

ΑΝΑΚΟΙΝΩΣΗ ΔΙΑΔΙΚΑΣΙΑΣ ΑΠΕΥΘΕΙΑΣ ΑΝΑΘΕΣΗΣ. Αριθμ. Πρωτ.: /2017 Ο ΕΙΔΙΚΟΣ ΛΟΓΑΡΙΑΣΜΟΣ ΚΟΝΔΥΛΙΩΝ ΕΡΕΥΝΑΣ

ΜΑΘΗΜΑ: Εργαλεία Ανάπτυξης εφαρμογών internet.

ΑΝΑΠΤΥΞΗ ΥΠΟΔΟΜΩΝ ΑΝΟΙΚΤΗΣ ΠΡΟΣΒΑΣΗΣ ΙΔΡΥΜΑΤΙΚΟ ΑΠΟΘΕΤΗΡΙΟ «ΟΛΥΜΠΙΑΣ» Διαλειτουργικότητα Ιδρυματικών Αποθετηρίων

Δυναμικές Ιστοσελίδες στο Πανελλήνιο Σχολικό Δίκτυο

Μεταδεδομένα στο Ψηφιακό περιβάλλον

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ

ΤΕΧΝΟΛΟΓΙΕΣ ΣΧΕΔΙΑΣΗΣ ΔΙΑΔΙΚΤΥΑΚΟΥ ΤΟΠΟΥ (Web Site Design Technologies)

Διαχείριση Πολιτισμικών Δεδομένων

Τεχνολογίες Παγκόσμιου Ιστού. 1η διάλεξη

Don t hire us if you want average. We only do exceptional.

Περιεχόμενα. Λίγα λόγια από το συγγραφέα... 7

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές

Αναφορά εργασιών για το τρίμηνο Σεπτέμβριος Νοέμβριος 2012

MathDebate Οδηγός για διαχειριστές

Διαχείριση Ειδοποιήσεων με Κινητές Συσκευές

Αναζήτηση στον Ιστό. Πληκτρολόγηση του URL: στο πλαίσιο αναζήτησης του Mozilla Firefox. Enter ή κλικ στο Αναζήτηση

Μετασχηματισμός Υπηρεσιών Ηλεκτρονικής Διακυβέρνησης (T-Gov): Υιοθέτηση ενός web 2.0 πολιτοκεντρικού μοντέλου επικοινωνίας

Πλοήγηση και Αναζήτηση

ΑΞΙΟΠΟΙΗΣΗ ΑΝΟΙΧΤΩΝ ΔΕΔΟΜΕΝΩΝ ΣΤΗΝ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΓΙΑ ΕΥΦΥΕΙΣ ΔΗΜΟΥΣ

Αναφορά εργασιών για το τρίμηνο Δεκέμβριος 2012 Φεβρουάριος 2013 Όνομα : Μπελούλη Αγάθη

Η βασική εργαλειοθήκη του διαδικτύου

ΕΓΧΕΙΡΙΔΙΟ ΧΡΗΣΗΣ ΓΙΑ ΤΟΥΣ ΧΡΗΣΤΕΣ ΚΑΙ ΤΟΥΣ ΥΠΕΥΘΥΝΟΥΣ ΠΕΡΙΕΧΟΜΕΝΟΥ ΤΗΣ ΙΣΤΟΣΕΛΙΔΑΣ ΤΟΥ ΤΜΗΜΑΤΟΣ ΙΑΤΡΙΚΗΣ

Ηλεκτρονικό εμπόριο. HE 8 Εξατομίκευση

Διαδίκτυο είναι ένα σύστημα διασυνδεδεμένων δικτύων και υπολογιστών που απλώνεται σε όλο τον κόσμο και έχουν πρόσβαση σε αυτό εκατομμύρια χρήστες.

Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Ενσωματωμένα controls τα οποία προσαρμόζονται και χρησιμοποιούνται σε οποιαδήποτε ιστοσελίδα επιλέγει ο φορέας.

ΠΕΡΙΛΗΨΗ ΤΩΝ ΚΥΡΙΟΤΕΡΩΝ ΣΗΜΕΙΩΝ

Ενότητες Γ3.1 - Γ3.2 - Γ3.3

ΠΛΑΤΦΟΡΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΒΙΝΤΕΟΔΙΑΛΕΞΕΩΝ ΔΗΛΟΣ delos.uoa.gr. Εγχειρίδιο Χρήσης Μελών ΔΕΠ

Περιεχόμενα. Δημιουργία σύνδεσης ΤΙ ΕΙΝΑΙ ΙΣΤΟΣΕΛΙΔΕΣ ΚΑΙ ΤΙ ΤΟΠΟΘΕΣΙΕΣ ΙΣΤΟΥ Γνωριμία με μια ιστοσελίδα:... 38

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS

Μέρος 3 ο : Βασικές Έννοιες για δυναμικές ιστοσελίδες

Αναζητήσεις στο Διαδίκτυο

ΟΔΗΓΟΣ ΧΡΗΣΗΣ(ΜΑΝUΑL) ΔΙΑΧΕΙΡΙΣΤΗ-ΧΡΗΣΤΗ.

30 Μαρτίου 2011 Ημέρα Ελευθερίας Εγγράφων

ΑΝΑΠΤΥΞΗ ΛΟΓΙΣΜΙΚΟΥ ΓΙΑ ΤΗ ΔΙΕΝΕΡΓΕΙΑ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΜΕΛΕΤΩΝ

ΟΛΟΚΛΗΡΩΜΕΝΟ ΣΥΣΤΗΜΑ ΤΗΛΕΚΑΤΑΡΤΙΣΗΣ E-AGIOGRAFIA

ΟΔΗΓΙΕΣ ΧΡΗΣΤΗ ΓΙΑ ΤΟ ΠΡΟΓΡΑΜΜΑ ΗΛΕΚΤΡΟΝΙΚΗΣ ΤΑΞΗΣ

Η εφαρµογή ClassWeb δίνει στους διδάσκοντες χρήστες του συστήµατος τη δυνατότητα πρόσβασης µέσω του ιαδικτύου σε ποικίλες υπηρεσίες, όπως:

. Εργαστήριο Βάσεων Δεδομένων. Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Βάσεις Δεδομένων και Ευφυή Πληροφοριακά Συστήματα Επιχειρηματικότητας. 2 ο Μάθημα: Βασικά Θέματα Βάσεων Δεδομένων. Δρ. Κωνσταντίνος Χ.

Cloud Computing with Google and Microsoft. Despoina Trikomitou Andreas Diavastos Class: EPL425

GoDigital.CMS Content Management System. Πλήρης διαχείριση περιεχομένου ιστοσελίδας

Ενιαία Αναζήτηση σε ψηφιακό πολιτιστικό περιεχόμενο

Περιγραφή Εργαλείου. Παρουσίαση Πλατφόρμας

Transcript:

Ε Λ Λ Η Ν Ι Κ Η Η Μ Ο Κ Ρ Α Τ Ι Α ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ Μεταπτυχιακή Διπλωματική Εργασία: Γραμματειακή Yποστήριξη Σχολών Πανεπιστημίων: Ανάπτυξη Ιστοσελίδας με Xρήση Τεχνολογιών Σημασιολογικού Ιστού (Semantic Web) Γιώργος Φωτεινός Α.Μ.: 468 Επιβλέπων Καθηγητής: κ. Μητακίδης Γεώργιος Πάτρα, Νοέμβριος 2013

ΠΕΡΙΛΗΨΗ Ένα υποσύνολο του τεράστιου όγκου πληροφοριών του Ιστού αφορά τα Ανοικτά Δεδομένα (Open Data), τα οποία αποτελούν πληροφορίες, δημόσιες ή άλλες, στις οποίες ο καθένας μπορεί να έχει πρόσβαση και να τις χρησιμοποιεί περαιτέρω για οποιονδήποτε σκοπό με στόχο να προσθέσει αξία σε αυτές. Η δυναμική των ανοιχτών δεδομένων γίνεται αντιληπτή όταν σύνολα δεδομένων των δημόσιων οργανισμών μετατρέπονται σε πραγματικά ανοιχτά δεδομένα, δηλαδή χωρίς νομικούς, οικονομικούς ή τεχνολογικούς περιορισμούς για την περαιτέρω χρήση τους από τρίτους. Τα ανοικτά δεδομένα ενός Τμήματος ή Σχολής Πανεπιστημίου μπορούν να δημιουργήσουν προστιθέμενη αξία και να έχουν θετικό αντίκτυπο σε πολλές διαφορετικές περιοχές, στη συμμετοχή, την καινοτομία, τη βελτίωση της αποδοτικότητας και αποτελεσματικότητας των Πανεπιστημιακών υπηρεσιών, την παραγωγή νέων γνώσεων από συνδυασμό στοιχείων κ.α. Ο τελικός στόχος είναι τα ανοικτά δεδομένα να καταστούν Ανοικτά Διασυνδεδεμένα Δεδομένα. Τα Διασυνδεδεμένα Δεδομένα, αποκτούν νόημα αντιληπτό και επεξεργάσιμο από μηχανές, επειδή περιγράφονται σημασιολογικά με την χρήση οντολογιών. Έτσι τα δεδομένα γίνονται πιο «έξυπνα» και πιο χρήσιμα μέσα από την διάρθρωση που αποκτούν. Στην παρούσα διπλωματική εργασία, υλοποιείται μια πρότυπη δικτυακή πύλη με την χρήση του Συστήματος Διαχείρισης Περιεχομένου CMS Drupal, το οποίο ενσωματώνει τεχνολογίες Σημασιολογικού Ιστού στον πυρήνα του, με σκοπό την μετατροπή των δεδομένων ενός Τμήματος ή Σχολής Πανεπιστημίου σε Ανοικτά Διασυνδεδεμένα Δεδομένα διαθέσιμα στην τρίτη γενιά του Ιστού τον Σημασιολογικό Ιστό. Keywords: Σημασιολογικός Ιστός, Σύστημα Διαχείρισης Περιεχομένου, CMS, Drupal, Διασυνδεδεμένα Δεδομένα, Οντολογία, RDF, RDFa, SPARQL [2]

ABSTRACT A subset of the vast amount of information of the web is concerned with open data, which is information, whether public or other, in which everyone can have access and use it for any purpose with a view to add value. The dynamics of open data becomes noticeable when datasets of public bodies are transformed into truly open data, i.e. without legal, financial or technological limitations for further use by third parties. The open data of a university department or faculty can add value and have a positive impact on many different areas such as participation, innovation, improvisation of the efficiency and effectiveness of university services, generating new knowledge from a combination of elements, etc. The ultimate goal is to transform open data into open linked data. The linked data, become meaningful and processable by machines, given that they are semantically described, using ontologies. Thus, the data become more " intelligent " and more useful through the structure they acquire. In this thesis, a prototype web portal is implemented using the content management system CMS Drupal, which incorporates semantic web technologies in the core, in order to convert the data of a University Department or School in open linked data available in the third generation web semantic web. [3]

ΕΥΧΑΡΙΣΤΙΕΣ Η εργασία αυτή αποτελεί το επιστέγασμα των προσπαθειών μου για την ολοκλήρωση των μεταπτυχιακών μου σπουδών στο Τμήμα Μαθηματικών του Πανεπιστημίου Πατρών. Στο σημείο αυτό θα ήθελα να ευχαριστήσω τους ανθρώπους που βοήθησαν τα μέγιστα στην ολοκλήρωσή της. Τις θερμότερες ευχαριστίες εκφράζω στον καθηγητή κ. Γεώργιο Μητακίδη για την εμπιστοσύνη που μου έδειξε κατά την ανάθεση του συγκεκριμένου θέματος και για την συμβολή του σε κάθε βήμα αυτής της εργασίας. Αμέριστες ευχαριστίες εκφράζω επίσης στον καθηγητή Παναγιώτη Πιντέλα και στον Λέκτορα Σωτήριο Κωτσιαντή για την θερμή συμπαράστασή τους και τις εύστοχες παρατηρήσεις τους. Τέλος, ευχαριστώ την οικογένειά μου για την υπομονή, τη στήριξη και την εμπιστοσύνη της καθ όλη τη διάρκεια των μεταπτυχιακών μου σπουδών, δίνοντας μου την δύναμη να τις ολοκληρώσω με αυτήν την εργασία. [4]

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ ΚΕΦΑΛΑΙΟ 1... 9 ΕΙΣΑΓΩΓΗ... 9 1.1 Η ΕΞΕΛΙΞΗ ΤΟΥ ΙΣΤΟΥ... 9 1.2 ΣΤΟΧΟΣ ΤΗΣ ΔΙΠΛΩΜΑΤΙΚΗΣ... 12 1.3 ΔΟΜΗ ΤΗΣ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ... 12 ΚΕΦΑΛΑΙΟ 2... 15 ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΙΣΤΟΣ... 15 2.1. ΤΙ ΕΙΝΑΙ Ο ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΙΣΤΟΣ... 15 2.2 ΔΙΑΣΥΝΔΕΔΕΜΕΝΑ ΔΕΔΟΜΕΝΑ LINKED DATA... 17 2.3 ΤΕΧΝΟΛΟΓΙΕΣ ΣΗΜΑΣΙΟΛΟΓΙΚΟΥ ΙΣΤΟΥ... 19 2.3.1 XML... 19 2.3.2 RDF... 20 2.3.3 Uniform Resource Identifiers (URIs)... 21 2.3.4 VOCABULARIES... 23 2.3.5 RDFa (ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΕΜΠΛΟΥΤΙΣΜΟΣ ΤΗΣ HTML)... 24 2.3.6 RDFa, MICROFORMATS ΚΑΙ MICRODATA... 27 ΚΕΦΑΛΑΙΟ 3... 29 ΕΙΣΑΓΩΓΗ ΣΤΟ ΠΡΟΒΛΗΜΑ... 29 3.1 ΥΠΕΡΦΟΡΤΩΣΗ ΠΛΗΡΟΦΟΡΙΩΝ... 29 3.2 ΑΝΟΙΚΤΑ ΔΕΔΟΜΕΝΑ (OPEN DATA)... 30 3.2.1 ΣΕ ΤΙ ΔΕΔΟΜΕΝΑ ΑΝΑΦΕΡΟΜΑΣΤΕ;... 32 3.2.2 ΓΙΑΤΙ ΑΝΟΙΧΤΑ ΔΕΔΟΜΕΝΑ;... 32 3.3 ΣΗΜΕΡΙΝΗ ΚΑΤΑΣΤΑΣΗ (ΤΟ ΠΡΟΒΛΗΜΑ)... 36 3.4 ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΠΡΟΒΛΗΜΑΤΑ ΣΤΗΝ ΠΑΡΟΧΗ ΠΛΗΡΟΦΟΡΙΩΝ... 39 3.5 ΣΕΝΑΡΙΟ ΑΝΑΖΗΤΗΣΗΣ ΜΙΑΣ ΠΛΗΡΟΦΟΡΙΑΣ... 40 3.6 Η ΠΡΟΤΑΣΗ ΛΥΣΗΣ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ... 44 ΚΕΦΑΛΑΙΟ 4... 47 ΣΥΣΤΗΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΕΡΙΕΧΟΜΕΝΟΥ (CMS) ΚΑΙ DRUPAL... 47 4.1 ΤΑ CONTENT MANAGEMENT SYSTEMS (CMSs) ΣΥΣΤΗΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΙΝΑΙ Η ΚΑΛΥΤΕΡΗ ΕΠΙΛΟΓΗ... 47 4.2 ΓΙΑΤΙ DRUPAL... 51 4.2.2 ΤΟ DRUPAL ΩΣ ΠΛΑΙΣΙΟ ΕΦΑΡΜΟΓΩΝ (APPLICATION FRAMEWORK)... 53 4.2.3 ΤΟ DRUPAL ΩΣ ΚΟΙΝΩΝΙΚΗ ΚΑΙ ΣΗΜΑΣΙΟΛΟΓΙΚΗ ΠΛΑΤΦΟΡΜΑ... 53 4.2.4 ΟΙ ΟΡΟΙ ΠΟΥ ΠΡΕΠΕΙ ΝΑ ΓΝΩΡΙΖΕΙ ΚΑΝΕΙΣ ΣΤΟ DRUPAL... 54 4.2.5 ΠΩΣ ΛΕΙΤΟΥΡΓΕΙ ΤΟ DRUPAL... 56 ΚΕΦΑΛΑΙΟ 5... 57 Η ΙΣΤΟΣΕΛΙΔΑ... 57 5.1 RDF MAPPING... 57 5.1.1 ΑΝΑΖΗΤΗΣΗ ΤΩΝ ΚΑΤΑΛΛΗΛΩΝ ΛΕΞΙΛΟΓΙΩΝ (VOCABULARIES)... 57 5.2 ΥΛΟΠΟΙΗΣΗ ΣΤΟ DRUPAL... 62 5.2.1 ΤΥΠΟΙ ΠΕΡΙΕΧΟΜΕΝΟΥ (CONTENT TYPES)... 62 5.2.2 5.2.3 ΔΗΜΙΟΥΡΓΙΑ ΕΝΟΣ CONTENT TYPE... 64 ΔΗΜΙΟΥΡΓΙΑ ΕΝΟΣ ΠΕΔΙΟΥ-FIELD... 68 5.2.4 DRUPAL CORE RDF... 69 5.2.5 RDF EXTENSIONS PROJECT... 71 5.2.6 RDF MAPPING ΣΤΟ DRUPAL... 74 5.2.7 ΑΝΑΛΥΤΙΚΟΣ ΠΙΝΑΚΑΣ ΤΥΠΩΝ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΕΔΙΩΝ RDF MAPPING... 79 5.3 ΠΑΡΟΥΣΙΑΣΗ ΙΣΤΟΣΕΛΙΔΑΣ... 83 [5]

5.4 ΤΑ ΠΛΕΟΝΕΚΤΗΜΑΤΑ ΠΟΥ ΠΑΡΕΧΕΙ Η ΙΣΤΟΣΕΛΙΔΑ... 97 5.5 ΕΠΙΠΛΕΟΝ ΔΥΝΑΤΟΤΗΤΕΣ... 99 5.5.1 5.5.2 ΔΙΑΛΕΞΕΙΣ... 99 ΔΙΑΛΕΙΤΟΥΡΓΙΚΟΤΗΤΑ... 104 5.5.3 ΔΗΜΟΣΙΕΥΣΕΙΣ ΤΩΝ ΔΙΔΑΣΚΟΝΤΩΝ ΜΕΣΩ ΤΗΣ DBLP (COMPUTER SCIENCE BIBLIOGRAPHY)107 5.5.4 ΝΟΜΟΘΕΣΙΑ ΜΕΣΩ ΤΗΣ ΔΙΑΥΓΕΙΑΣ... 117 ΚΕΦΑΛΑΙΟ 6... 122 ΟΙ ΠΡΟΟΠΤΙΚΕΣ ΤΗΣ ΙΣΤΟΣΕΛΙΔΑΣ ΚΑΤΑ ΤΗΝ ΠΟΡΕΙΑ ΜΕΤΑΤΡΟΠΗΣ ΤΟΥ ΣΗΜΕΡΙΝΟΥ ΙΣΤΟΥ ΣΕ ΣΗΜΑΣΙΟΛΟΓΙΚΟ... 122 6.1 ΟΙ ΑΛΛΑΓΕΣ ΣΤΟ ΔΙΑΔΙΚΤΥΟ... 122 6.2 ΟΙ ΠΡΟΟΠΤΙΚΕΣ ΤΗΣ ΙΣΤΟΣΕΛΙΔΑΣ... 125 ΒΙΒΛΙΟΓΡΑΦΙΑ... 128 [6]

ΚΑΤΑΛΟΓΟΣ ΕΙΚΟΝΩΝ ΕΙΚΟΝΑ 1: ΤΑ ΣΤΑΔΙΑ Η ΦΑΣΕΙΣ ΤΟΥ ΔΙΑΔΙΚΤΥΟΥ... 9 ΕΙΚΟΝΑ 2: ΠΡΟΤΑΣΗ ΣΕ ΜΟΡΦΗ (SUBJECT-PROPERTY-OBJECT)... 21 ΕΙΚΟΝΑ 3: ΔΙΑΓΡΑΜΜΑ EULER ΓΙΑ ΤΗΝ ΠΕΡΙΓΡΑΦΗ ΤΟΥ UNIFORM RESOURCE IDENTIFIER (URI)... 22 ΕΙΚΟΝΑ 4: ΠΡΟΤΑΣΗ ΣΕ ΜΟΡΦΗ (SUBJECT-PROPERTY-OBJECT) ΜΕ ΤΑ URIS... 22 ΕΙΚΟΝΑ 5: ΠΡΟΤΑΣΗ ΣΕ ΜΟΡΦΗ (SUBJECT-PROPERTY-OBJECT) ΜΕ ΤΟ URIS ΤΗΣ ΙΔΙΟΤΗΤΑΣ ΑΠΟ ΤΗΝ DBPEDIA... 24 ΕΙΚΟΝΑ 6: ΔΙΚΤΥΑΚΟΣ ΤΟΠΟΣ ΑΝΑΚΟΙΝΩΣΕΩΝ ΤΜΗΜΑΤΟΣ ΜΑΘΗΜΑΤΙΚΩΝ... 41 ΕΙΚΟΝΑ 7: ΣΕΛΙΔΑ ΑΝΑΖΗΤΗΣΗΣ ΘΕΜΑΤΩΝ... 41 ΕΙΚΟΝΑ 8: ΑΠΟΤΕΛΕΣΜΑΤΑ ΑΝΑΖΗΤΗΣΗΣ ΓΙΑ ΤΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ... 42 ΕΙΚΟΝΑ 9: ΑΠΟΤΕΛΕΣΜΑΤΑ ΕΠΙΤΥΧΟΥΣ ΑΝΑΖΗΤΗΣΗΣ ΟΔΗΓΟΥ ΣΠΟΥΔΩΝ... 43 ΕΙΚΟΝΑ 10: ΑΝΑΚΟΙΝΩΣΗ ΟΔΗΓΟΥ ΣΠΟΥΔΩΝ... 44 ΕΙΚΟΝΑ 11: ΤΟ DRUPAL ΩΣ ΤΟΜΗ ΜΕΤΑΞΥ ΤΩΝ CMS, FRAMEWORK, COMMUNITY ΚΑΙ SOCIAL AND SEMANTIC WEB PLATFORM... 51 ΕΙΚΟΝΑ 12: ΓΡΑΦΙΚΗ ΑΝΑΠΑΡΑΣΤΑΣΗ ΤΟΥ ΤΡΟΠΟΥ ΜΕ ΤΟ ΟΠΟΙΟ ΤΟ DRUPAL ΔΙΑΝΕΜΕΙ ΤΟ ΠΕΡΙΕΧΟΜΕΝΟ... 56 ΕΙΚΟΝΑ 13: ΤΟ RDF ΜΟΝΤΕΛΟ ΤΟΥ ΤΜΗΜΑΤΟΣ ΜΑΘΗΜΑΤΙΚΩΝ... 61 ΕΙΚΟΝΑ 14: ΦΟΡΜΑ ΔΗΜΙΟΥΡΓΙΑΣ ΤΟΥ ΤΥΠΟΥ ΠΕΡΙΕΧΟΜΕΝΟΥ «ΔΙΔΑΣΚΩΝ»... 64 ΕΙΚΟΝΑ 15: ΦΟΡΜΑ ΔΗΜΙΟΥΡΓΙΑΣ ΤΟΥ ΤΥΠΟΥ ΠΕΡΙΕΧΟΜΕΝΟΥ «ΔΙΔΑΣΚΩΝ» - SUBMISSION FORM SETTINGS... 65 ΕΙΚΟΝΑ 16: ΦΟΡΜΑ ΔΗΜΙΟΥΡΓΙΑΣ ΤΟΥ ΤΥΠΟΥ ΠΕΡΙΕΧΟΜΕΝΟΥ «ΔΙΔΑΣΚΩΝ» - PUBLISHING OPTIONS... 66 ΕΙΚΟΝΑ 17: ΦΟΡΜΑ ΔΗΜΙΟΥΡΓΙΑΣ ΤΟΥ ΤΥΠΟΥ ΠΕΡΙΕΧΟΜΕΝΟΥ «ΔΙΔΑΣΚΩΝ» - DISPLAY SETTINGS... 66 ΕΙΚΟΝΑ 18: ΦΟΡΜΑ ΔΗΜΙΟΥΡΓΙΑΣ ΤΟΥ ΤΥΠΟΥ ΠΕΡΙΕΧΟΜΕΝΟΥ «ΔΙΔΑΣΚΩΝ» - COMMENT SETTINGS... 67 ΕΙΚΟΝΑ 19: ΦΟΡΜΑ ΔΗΜΙΟΥΡΓΙΑΣ ΤΟΥ ΤΥΠΟΥ ΠΕΡΙΕΧΟΜΕΝΟΥ «ΔΙΔΑΣΚΩΝ» - MENU SETTINGS... 67 ΕΙΚΟΝΑ 20: ΔΗΜΙΟΥΡΓΙΑ ΤΟΥ ΠΕΔΙΟΥ-FILED SITE ΣΤΟΝ ΤΥΠΟ ΠΕΡΙΕΧΟΜΕΝΟΥ «ΔΙΔΑΣΚΩΝ»... 68 ΕΙΚΟΝΑ 21: ΚΑΘΟΡΙΣΜΟΣ ΤΩΝ ΕΠΙΠΛΕΟΝ ΡΥΘΜΙΣΕΩΝ ΤΟΥ ΠΕΔΙΟΥ-FILED SITE... 69 ΕΙΚΟΝΑ 22: TO RDF MODULE ΟΠΩΣ ΦΑΙΝΕΤΑΙ ΑΠΟ ΤΗΝ ΚΑΡΤΕΛΑ MODULE ΤΟΥ DRUPAL... 70 ΕΙΚΟΝΑ 23: ΕΠΙΛΟΓΗ ΤΩΝ ΑΡΧΕΙΩΝ MODULE ΠΡΟΣ ΚΑΤΕΒΑΣΜΑ ΣΤΟΝ ΦΑΚΕΛΟ ΤΗΣ ΙΣΤΟΣΕΛΙΔΑΣ... 72 ΕΙΚΟΝΑ 24: ΕΝΕΡΓΟΠΟΙΗΣΗ ΤΩΝ RDFX, RDF UI ΚΑΙ EVOC MODULES... 73 ΕΙΚΟΝΑ 25: ΠΡΟΣΘΗΚΗ ΛΕΞΙΛΟΓΙΟΥ-VOCABULARY ΜΕΣΩ ΤΟΥ EVOC MODULE... 74 ΕΙΚΟΝΑ 26: ΚΑΡΤΕΛΑ MANAGE FIELDS ΤΟΥ ΤΥΠΟΥ ΠΕΡΙΕΧΟΜΕΝΟΥ «ΔΙΔΑΣΚΩΝ»... 75 ΕΙΚΟΝΑ 27: ΚΑΡΤΕΛΑ RDF MAPPING ΤΟΥ ΤΥΠΟΥ ΠΕΡΙΕΧΟΜΕΝΟΥ «ΔΙΔΑΣΚΩΝ»-ΟΡΙΣΜΟΣ ΤΟΥ RDF ΤΥΠΟΥ FOAF:PERSON... 76 ΕΙΚΟΝΑ 28: ΚΑΡΤΕΛΑ RDF MAPPING ΤΟΥ ΤΥΠΟΥ ΠΕΡΙΕΧΟΜΕΝΟΥ «ΔΙΔΑΣΚΩΝ»-ΟΡΙΣΜΟΣ ΤΟΥ RDF PREDICATE FOAF:NAME... 76 ΕΙΚΟΝΑ 29: ΕΜΦΑΝΙΣΗ ΤΩΝ ΚΑΤΑΛΛΗΛΩΝ ΙΔΙΟΤΗΤΩΝ ΚΑΤΑ ΤΗΝ ΠΛΗΚΤΡΟΛΟΓΗΣΗ ΜΙΑΣ ΤΙΜΗΣ... 78 ΕΙΚΟΝΑ 30: ΑΡΧΙΚΗ ΣΕΛΙΔΑ ΜΕ ΤΙΣ ΑΝΑΚΟΙΝΩΣΕΙΣ ΤΗΣ ΓΡΑΜΜΑΤΕΙΑΣ... 85 ΕΙΚΟΝΑ 31: ΚΑΡΤΕΛΑ «ΔΙΔΑΣΚΩΝ» ΜΕ ΤΟΝ ΠΙΝΑΚΑ ΤΩΝ ΔΙΔΑΣΚΟΝΤΩΝ ΤΟΥ ΤΜΗΜΑΤΟΣ... 87 ΕΙΚΟΝΑ 32: ΣΕΛΙΔΑ ΜΕ ΤΙΣ ΠΛΗΡΟΦΟΡΙΕΣ ΕΝΟΣ ΔΙΔΑΣΚΟΝΤΑ... 88 ΕΙΚΟΝΑ 33: ΚΑΡΤΕΛΑ «ΜΑΘΗΜΑΤΑ» ΜΕ ΤΟΝ ΠΙΝΑΚΑ ΤΩΝ ΜΑΘΗΜΑΤΩΝ ΤΟΥ ΤΜΗΜΑΤΟΣ... 89 ΕΙΚΟΝΑ 34: ΣΕΛΙΔΑ ΜΕ ΤΙΣ ΠΛΗΡΟΦΟΡΙΕΣ ΕΝΟΣ ΜΑΘΗΜΑΤΟΣ... 90 ΕΙΚΟΝΑ 35: ΚΑΡΤΕΛΑ ΤΟΥ ΩΡΟΛΟΓΙΟΥ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ-ΕΠΙΛΟΓΗ ΕΜΦΑΝΙΣΗΣ ΑΝΑ ΕΒΔΟΜΑΔΑ... 91 ΕΙΚΟΝΑ 36: ΛΕΠΤΟΜΕΡΕΙΕΣ ΔΙΔΑΣΚΑΛΙΑΣ ΕΝΟΣ ΜΑΘΗΜΑΤΟΣ ΑΠΟ ΤΟΝ ΠΙΝΑΚΑ ΩΡΟΛΟΓΙΟΥ ΠΡΟΓΡΑΜΜΑΤΟΣ... 92 ΕΙΚΟΝΑ 37: ΚΑΡΤΕΛΑ ΤΟΥ ΩΡΟΛΟΓΙΟΥ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ-ΕΠΙΛΟΓΗ ΕΜΦΑΝΙΣΗΣ ΑΝΑ ΜΗΝΑ... 93 ΕΙΚΟΝΑ 38: ΣΕΛΙΔΑ ΤΟΥ ΠΡΟΓΡΑΜΜΑΤΟΣ ΤΗΣ ΕΞΕΤΑΣΤΙΚΗΣ ΠΕΡΙΟΔΟΥ... 94 ΕΙΚΟΝΑ 39: ΚΑΡΤΕΛΑ ΣΧΕΤΙΚΑ- ΠΑΡΕΧΟΝΤΑΙ ΠΛΗΡΟΦΟΡΙΕΣ ΣΧΕΤΙΚΑ ΜΕ ΤΗΝ ΙΣΤΟΣΕΛΙΔΑ... 95 ΕΙΚΟΝΑ 40: ΚΑΡΤΕΛΑ ΕΠΙΚΟΙΝΩΝΙΑΣ ΦΟΡΜΑ ΕΠΙΚΟΙΝΩΝΙΑΣ ΜΕ ΤΗΝ ΓΡΑΜΜΑΤΕΙΑ ΤΟΥ ΤΜΗΜΑΤΟΣ... 96 ΕΙΚΟΝΑ 41: ΠΛΗΡΟΦΟΡΙΕΣ ΤΟΠΟΘΕΣΙΑΣ ΜΙΑΣ ΑΙΘΟΥΣΑΣ ΔΙΔΑΣΚΑΛΙΑΣ... 97 ΕΙΚΟΝΑ 42: ΚΑΡΤΕΛΑ ΜΕ ΤΙΣ ΓΕΝΙΚΕΣ ΠΛΗΡΟΦΟΡΙΕΣ ΤΗΣ ΔΙΑΛΕΞΗΣ... 101 ΕΙΚΟΝΑ 43: ΚΑΡΤΕΛΑ ΜΕ ΤΙΣ ΥΛΙΚΟ ΤΗΣ ΔΙΑΛΕΞΗΣ... 102 ΕΙΚΟΝΑ 44: ΣΕΛΙΔΑ ΜΕ ΤΙΣ ΠΛΗΡΟΦΟΡΙΕΣ ΤΟΥ ΔΙΔΑΣΚΟΝΤΑ ΚΑΙ ΤΙΣ ΔΙΑΛΕΞΕΙΣ ΤΟΥ... 102 ΕΙΚΟΝΑ 45: Η ΣΕΛΙΔΑ ΜΙΑΣ ΔΙΑΛΕΞΗΣ... 103 ΕΙΚΟΝΑ 46: ΕΝΕΡΓΟΠΟΙΗΣΗ ΤΩΝ SPARQL API, SPARQL ENDPOINT, SPARQL ENDPOINT REGISTRY ΚΑΙ SPARQL VIEWS MODULES... 105 ΕΙΚΟΝΑ 47: ΠΡΟΣΘΗΚΗ ΕΝΟΣ SPARQL ENDPOINT ΣΤΟ DRUPAL-ADD SPARQL ENDPOINT... 107 ΕΙΚΟΝΑ 48: ΤΟ ΣΗΜΕΙΟ ΔΗΜΟΣΙΕΥΣΗΣ ΤΗΣ ΒΑΣΗΣ ΔΕΔΟΜΕΝΩΝ ΤΗΣ DBLP... 108 ΕΙΚΟΝΑ 49: ΠΛΗΡΟΦΟΡΙΕΣ ΔΗΜΟΣΙΕΥΣΗΣ ΟΠΩΣ ΠΑΡΟΥΣΙΑΖΟΝΤΑΙ ΑΠΟ ΤΗΝ DBLP... 109 ΕΙΚΟΝΑ 50: ADD SPARQL VIEWS RESOURCE TYPE... 110 [7]

ΕΙΚΟΝΑ 51: ADD SPARQL VIEWS RESOURCE TYPE-MANAGE FIELDS... 111 ΕΙΚΟΝΑ 52: ADD NEW VIEW WIZARD... 112 ΕΙΚΟΝΑ 53: ADD NEW VIEW - DISPLAYS... 113 ΕΙΚΟΝΑ 54: BLOCKS... 115 ΕΙΚΟΝΑ 55: CONFIGURE BLOCK-VISIBILITY SETTINGS... 115 ΕΙΚΟΝΑ 56: ΣΕΛΙΔΑ ΠΛΗΡΟΦΟΡΙΩΝ ΔΙΔΑΣΚΟΝΤΑ Π. ΠΙΝΤΕΛΑ... 116 ΕΙΚΟΝΑ 57: DISPLAYS VIEW ΝΟΜΟΘΕΣΙΑ ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ... 119 ΕΙΚΟΝΑ 58: ΚΑΡΤΕΛΑ ΕΠΙΛΟΓΗΣ ΚΡΙΤΗΡΙΩΝ ΑΝΑΖΗΤΗΣΗΣ ΑΠΟ ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ... 120 ΕΙΚΟΝΑ 59: ΚΑΡΤΕΛΑ ΕΠΙΛΟΓΗΣ ΚΡΙΤΗΡΙΩΝ ΑΝΑΖΗΤΗΣΗΣ ΑΠΟ ΝΟΜΙΚΟ ΣΥΜΒΟΥΛΙΟ ΤΟΥ ΚΡΑΤΟΥΣ... 120 ΕΙΚΟΝΑ 60: ΠΙΝΑΚΑΣ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΝΑΖΗΤΗΣΗΣ ΑΠΟΦΑΣΕΩΝ ΑΠΟ ΤΟ ΝΟΜΙΚΟ ΣΥΜΒΟΥΛΙΟ ΤΟΥ ΚΡΑΤΟΥΣ... 121 ΚΑΤΑΛΟΓΟΣ ΠΙΝΑΚΩΝ ΠΙΝΑΚΑΣ 1: ΟΙ ΤΥΠΟΙ ΠΕΡΙΕΧΟΜΕΝΟΥ (CONTENT TYPES) ΠΟΥ ΧΡΗΣΙΜΟΠΟΙΟΥΝΤΑΙ ΣΤΗΝ ΙΣΤΟΣΕΛΙΔΑ... 63 ΠΙΝΑΚΑΣ 2: TA CORE VOCABULARIES ΠΟΥ ΕΙΣΑΓΟΝΤΑΙ ΜΕΣΩ ΤΟΥ EVOC MODULE... 73 ΠΙΝΑΚΑΣ 3: ΟΙ ΤΥΠΟΙ ΠΕΡΙΕΧΟΜΕΝΟΥ ΜΕ ΤΑ ΠΕΔΙΑ ΤΟΥΣ ΚΑΙ ΤΟ RDF MAPPING ΠΟΥ ΕΧΕΙ ΕΦΑΡΜΟΣΤΕΙ... 83 ΠΙΝΑΚΑΣ 4: TA PREFIXES ΠΟΥ ΘΑ ΧΡΗΣΙΜΟΠΟΙΗΘΟΥΝ ΑΠΟ ΤΟΝ ΠΙΝΑΚΑ ΤΗΣ ΕΙΚΟΝΑΣ 49... 110 [8]

ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 1.1 Η ΕΞΕΛΙΞΗ ΤΟΥ ΙΣΤΟΥ Σήμερα η επικοινωνία μέσω του Διαδικτύου είναι πλέον άμεση και αμφίδρομη. Δίνεται η δυνατότητα σε κάθε χρήστη ηλεκτρονικού υπολογιστή συνδεδεμένου στο Διαδίκτυο, να πληροφορηθεί αλλά και να πληροφορήσει ανταλλάσσοντας απόψεις μέσω πολλών διαφορετικών και συμμετοχικών διαύλων επικοινωνίας. Μπορεί κανείς να ενημερωθεί, να ψυχαγωγηθεί, να εκπαιδευτεί αλλά και να εκπαιδεύσει, να συναλλάσσεται με διάφορες υπηρεσίες όπως Δημόσιο, Τράπεζες κ.λ.π. Το Διαδίκτυο είναι ένα αναπτυσσόμενο σύμπαν από διασυνδεδεμένες ιστοσελίδες και δικτυακές εφαρμογές, γεμάτο από βίντεο, εικόνες και διαδραστικό περιεχόμενο. Αυτό που ο μέσος χρήστης δεν χρειάζεται να βλέπει, είναι η αλληλεπίδραση των τεχνολογιών του Διαδικτύου, που κάνει δυνατά όλα τα παραπάνω. [1] Εικόνα 1: Τα στάδια ή φάσεις του Διαδικτύου [9]

Για να μπορέσει κανείς να κατανοήσει καλύτερα την σημερινή μορφή του Διαδικτύου καθώς και τις διαφαινόμενες προοπτικές του, θα πρέπει να εξετάσει την μέχρι τώρα εξέλιξή του. Μία διαίρεση του Διαδικτύου σε τέσσερα στάδια ή φάσεις από την ίδρυσή του, παρατίθεται στην παραπάνω εικόνα 1. Στο πρώτο στάδιο του Ιστού το επίκεντρο ήταν κυρίως η κατασκευή του, καθιστώντας το προσιτό και εμπορεύσιμο για πρώτη φορά. Το ενδιαφέρον επικεντρώνεται στα πρωτόκολλα όπως το HTTP, στα ανοικτά πρότυπα γλωσσών σήμανσης όπως η HTML και η XML, στην πρόσβαση στο Διαδίκτυο μέσω των παρόχων υπηρεσιών (ISPs), στους πρώτους φυλλομετρητές, στις πλατφόρμες ανάπτυξης ιστοσελίδων και εφαρμογών, στις ιστοκεντρικές γλώσσες λογισμικού όπως η Java και η JavaScript, στη δημιουργία ιστοσελίδων, στα επιχειρηματικά μοντέλα του Διαδικτύου και στην ανάπτυξη των βασικών πυλών του. Αυτή η έκδοση του Διαδικτύου, σύμφωνα με τον ιδρυτή του, Tim Berners-Lee, θα μπορούσε να θεωρηθεί ως Διαδίκτυο «μόνο ανάγνωσης». Οι χρήστες μπορούσαν να αναζητήσουν μια πληροφορία και απλά να τη διαβάσουν. Μπορούσαν να δουν το περιεχόμενο των ιστοσελίδων όχι όμως να συμβάλλουν στην δημιουργία του. Τεχνολογικά το Web 1.0 επικεντρώθηκε στην παρουσίαση και την σύνδεση όχι όμως στην δημιουργία των πληροφοριών, έτσι δεν είναι ακόμα διαθέσιμο το παραγόμενο από τους χρήστες περιεχόμενο (User-generated content). [2] Η δεύτερη φάση παρόλο που προτείνει μια νέα έκδοση του Διαδικτύου, δεν αναφέρεται σε αναβάθμιση τεχνικών προδιαγραφών, αλλά στις συγκεντρωτικές αλλαγές στον τρόπο με τον οποίο δημιουργούνται και χρησιμοποιούνται οι ιστοσελίδες. Για αυτό το λόγο δεν είναι εύκολο για πολλούς να κατανοήσουν τις διαφορές των δύο εκδόσεων Web 1.0 και Web 2.0. παρά μόνο μέσω του τρόπου με τον οποίο οι χρήστες αλληλεπιδρούν με τον Ιστό. Για παράδειγμα μια, ιστοσελίδα στο Web 1.0 είναι στατική, περιλαμβάνει πληροφορία που μπορεί να είναι χρήσιμη, αλλά δεν υπάρχει κανένας λόγος για το επισκέπτη της, να επιστρέψει σ αυτήν. Η ιστοσελίδα αυτή θα μπορούσε να είναι μια προσωπική σελίδα που παρέχει πληροφορίες για τον ιδιοκτήτη της, αλλά δεν αλλάζει ποτέ περιεχόμενο ή αλλάζει πολύ σπάνια και αυτό μόνο από τον διαχειριστή της. Στην Web 2.0 έκδοση η σελίδα [10]

αυτή θα μπορούσε να είναι ένα blog ή ένας λογαριασμός στο MySpace ή στο Facebook. Οι Web 2.0 εφαρμογές είναι ανοικτού κώδικα, που σημαίνει ότι ο πηγαίος κώδικας των εφαρμογών αυτών είναι ελεύθερα διαθέσιμος στον οποιονδήποτε. Οι χρήστες μπορούν να δουν πώς λειτουργούν οι εφαρμογές, να κάνουν τροποποιήσεις ή ακόμα να δημιουργήσουν καινούργιες εφαρμογές βασιζόμενοι στις αρχικές. Χαρακτηριστικό παράδειγμα αποτελεί ο Web 2.0 φυλλομετρητής Firefox που παρέχει στους προγραμματιστές όλα τα απαραίτητα εργαλεία για την ανάπτυξη νέων Firefox εφαρμογών (Firefox Αdd-ons). [3][4][6] Μία ακόμα τάση που αποτελεί σημαντικό παράγοντα στο Web 2.0 είναι η εμφάνιση του κινητού Διαδικτύου και των κινητών συσκευών, ως μια σημαντική νέα πλατφόρμα που οδηγεί στην υιοθέτηση και την ανάπτυξη του Διαδικτύου. Συμπερασματικά, μπορούμε να πούμε ότι το Web 2.0 επιτρέπει στους χρήστες να αλληλεπιδρούν και να συνεργάζονται μεταξύ τους ως δημιουργοί περιεχομένου. Ενώ οι καινοτομίες και οι πρακτικές του Web 2.0 συνεχίζουν να αναπτύσσονται σήμερα, αυτό δεν αποτελεί το τελικό στάδιο στην εξέλιξη του Ιστού. Από το 2006 επινοήθηκε ο όρος Web 3 από τον John Markoff των New York Times. Ο όρος αναφέρεται σε μια Τρίτη γενιά του Διαδικτύου που βασίζεται σε υπηρεσίες οι οποίες συλλογικά αποτελούν αυτό που ονομάζεται ευφυές Διαδίκτυο, όπως αυτές που χρησιμοποιούν τον Σημασιολογικό Ιστό, αναζήτηση σε φυσική γλώσσα, εξόρυξη γνώσης, μηχανική μάθηση, τεχνολογίες τεχνητής νοημοσύνης, οι οποίες τονίζουν την κατανόηση των πληροφοριών από τις μηχανές προκειμένου να παρέχουν μια περισσότερο παραγωγική και διαισθητική εμπειρία στους χρήστες του Διαδικτύου. Μέσα σε αυτό το περιβάλλον βλέπουμε να αναπτύσσονται νέες τάσεις διαχείρισης των πληροφοριών όπως η διάθεση δημόσιων δεδομένων και άλλων ως σύνολα δεδομένων (Ανοικτά Δεδομένα) με σκοπό την περεταίρω επεξεργασία τους προς εξόρυξη χρήσιμων πληροφοριών γνώσης. Η αξιοποίηση της παραπάνω διαδικασίας θα ολοκληρωθεί με την διασύνδεση των δεδομένων αυτών δηλαδή την εκμετάλλευση δεδομένων από διαφορετικές πηγές (Διασυνδεδεμένα Δεδομένα). Τα Διασυνδεδεμένα Δεδομένα, αποκτούν νόημα και για τις μηχανές, επειδή περιγράφονται σημασιολογικά με την χρήση οντολογιών. [11]

Τελικά το Web 3.0 θα είναι περισσότερο συνδεδεμένο, ανοικτό και ευφυές. Αν κοιτάξουμε ξανά το παραπάνω σχήμα για τα στάδια εξέλιξης του Ιστού, αυτό που μένει ως συμπέρασμα είναι ότι το Web 1.0 συνδέει τις πληροφορίες, το Web 2.0 τους ανθρώπους ενώ το Web 3.0 την γνώση, με απώτερο στόχο το Web 4.0 που θα συνδέει την ευφυΐα. [6] 1.2 ΣΤΟΧΟΣ ΤΗΣ ΔΙΠΛΩΜΑΤΙΚΗΣ Η παρούσα διπλωματική εργασία έχει ως στόχο τα δεδομένα που διαθέτει μια Γραμματεία ενός Τμήματος Πανεπιστημίου, να καταστούν Διασυνδεδεμένα Δεδομένα με σκοπό την βελτίωση της αποδοτικότητας και αποτελεσματικότητας των Πανεπιστημιακών υπηρεσιών, την παραγωγή νέων γνώσεων από συνδυασμό στοιχείων κ.λ.π. Για την ανάδειξη μια τέτοιας λύσης είναι απαραίτητη η χρήση εργαλείων που είναι διαθέσιμα, με κριτήρια την ευχρηστία, τεχνολογική εξέλιξη και πρακτικότητα. Έτσι, θεωρήθηκε απαραίτητο να χρησιμοποιηθεί ένα Σύστημα Διαχείρισης Περιεχομένου (CMS), που υποστηρίζει τεχνολογίες Σημασιολογικού Ιστού. Μέσω αυτού του εργαλείου επιχειρείται από την μια η υλοποίηση μιας πρότυπης ιστοσελίδας που θα κληρονομεί τα πλεονεκτήματα ενός CMS, τα κυριότερα από τα οποία είναι η ευκολία στον τρόπο παραγόμενου περιεχομένου από τους χρήστες, η ευκολία συντήρησης και επέκτασης από τους διαχειριστές της, η ασφάλεια κ.α. και από την άλλη μέσω της υποστήριξης τεχνολογιών Σημασιολογικού Ιστού όλο το περιεχόμενο της ιστοσελίδας καθίσταται μέρος του Σημασιολογικού Ιστού και τα δεδομένα της Διασυνδεδεμένα Δεδομένα. 1.3 ΔΟΜΗ ΤΗΣ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ Η παρούσα διπλωματική εργασία έχει οργανωθεί ως εξής: Στο κεφάλαιο 2 της εργασίας περιγράφεται τι είναι ο Σημασιολογικός Ιστός και πως μπορεί αυτή η τεχνολογία να ωφελήσει τον σημερινό Ιστό. Τι είναι τα Διασυνδεδεμένα Δεδομένα και πώς τα δεδομένα του Ιστού μπορούν να συνδέονται [12]

από διαφορετικές πηγές και να ερωτούνται χρησιμοποιώντας κοινά namespaces και URIs. Στην συνέχεια, το κεφάλαιο επικεντρώνεται στη περιγραφή των τεχνολογιών που χρησιμοποιούνται στον Σημασιολογικό Ιστό δίδοντας μια αναλυτική περιγραφή των XML, RDF, RDFa, Microformats και Microdata. Στο κεφάλαιο 3 γίνεται μια εκτενής παρουσίαση των Ανοικτών Δεδομένων (Open Data). Δίδονται παραδείγματα τομέων που τα ανοικτά δεδομένα έχουν αξιοποιηθεί και παρουσιάζονται τα πλεονεκτήματα που προσφέρουν. Στην συνέχεια, δίδεται έμφαση στην δομή και λειτουργία μιας Γραμματείας ενός Τμήματος και παρουσιάζονται μια σειρά από χαρακτηριστικά προβλήματα που ανακύπτουν από τον τρόπο παροχής πληροφοριών με τις σημερινές υποδομές. Στο τέλος του κεφαλαίου προτείνεται η λύση της παρούσας διπλωματικής στα προβλήματα που αναφέρθηκαν, με την μετατροπή των δεδομένων της Γραμματείας σε Ανοικτά Διασυνδεδεμένα Δεδομένα μέσω της χρήσης τεχνολογιών Σημασιολογικού Ιστού. Το κεφάλαιο 4 χωρίζεται σε δύο μέρη. Στο πρώτο μέρος περιγράφεται το σύστημα Διαχείρισης Περιεχομένου (CMS), τα πλεονεκτήματά του και εξηγείται γιατί αποτελεί την καλύτερη επιλογή για την παρούσα διπλωματική εργασία. Στο δεύτερο μέρος εξηγείται γιατί επιλέχθηκε το σύστημα διαχείρισης περιεχομένου «Drupal» σε σχέση με άλλα συστήματα και γίνεται μια εκτενής παρουσίαση του τελευταίου. Στο κεφάλαιο 5 δίνεται καταρχήν μια απεικόνιση του RDF μοντέλου για την περιγραφή της δομής ενός Πανεπιστημίου, των διδασκόντων και των δημοσιεύσεών τους, των μαθημάτων και των αιθουσών διδασκαλίας. Στην συνέχεια παρουσιάζεται λεπτομερώς ο τρόπος υλοποίησης της ιστοσελίδας με το CMS Drupal. Συγκεκριμένα, παρουσιάζεται ο τρόπος κατασκευής των content types και των fields που αυτά περιλαμβάνουν και στην συνέχεια δίδεται έμφαση στα RDF modules που παρέχει το Drupal για την υλοποίηση του RDF μοντέλου. Παρουσιάζεται ο τρόπος με τον οποίο προστίθενται λεξιλόγια και δίδεται μια αναλυτική περιγραφή του τρόπου με τον οποίο μπορεί ο διαχειριστής της ιστοσελίδας να διαχειριστεί το RDF mapping μέσω του user interface που παρέχει το RDF UI module. Μετά την περιγραφή του τρόπου υλοποίησης το περιεχόμενο του κεφαλαίου συνεχίζεται με την παρουσίαση της [13]

ιστοσελίδας ως προς το περιεχόμενο, τα μενού και γενικότερα την όψη που παρουσιάζει στους επισκέπτες. Στην συνέχεια δίδεται μια περιγραφή των πλεονεκτημάτων της ιστοσελίδας, που παρέχονται από τις τεχνολογίες Σημασιολογικού Ιστού, συγκριτικά με μια συμβατική. Παρουσιάζονται με λεπτομέρεια τα SPARQL και SPARQL Views modules, και ο τρόπος με τον οποίο τα χρησιμοποιούμε ώστε να ενεργοποιηθούν δυνατότητες που μια συμβατική ιστοσελίδα δεν θα μπορούσε να υποστηρίξει. Τέλος, το κεφάλαιο ολοκληρώνεται με την περιγραφή των παραπάνω δυνατοτήτων, όπως είναι η αυτόματη συλλογή και ανάρτηση των δημοσιεύσεων των διδασκόντων από ένα αποθετήριο δημοσιεύσεων σαν αυτό της DBLP και η συλλογή νομοθετικών πληροφοριών από το σύστημα Δι@υγεια με βάση πολύπλοκα κριτήρια προσαρμοσμένα στις ανάγκες της Γραμματείας. Στο κεφάλαιο 6 γίνεται μια αναφορά στο τρόπο με τον οποίο θα φτάσουμε στο Σημασιολογικό Ιστό μέσω μια πορείας όπου τα δεδομένα θα καταστούν Ανοικτά και στην συνέχεια Διασυνδεδεμένα. Εν συνεχεία, περιγράφεται μέσω ενός παραδείγματος πως περίπου θα είναι το Διαδίκτυο στο μέλλον με το Σημασιολογικό Ιστό. Τέλος, γίνεται μια σύντομη ανασκόπηση της διπλωματικής εργασίας και παρουσιάζεται η μελλοντική εξέλιξη της ιστοσελίδας, δίδοντας ορισμένες πιθανές περιπτώσεις χρήσης που θα μπορούσαν να επιτευχθούν καθώς θα υιοθετείται όλο και περισσότερο η σημασιολογική τεχνολογία στο Ιστό. [14]

ΚΕΦΑΛΑΙΟ 2 ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΙΣΤΟΣ Στο κεφάλαιο αυτό θα εξετάσουμε τι είναι ο Σημασιολογικός Ιστός και τις καινοτομίες που αυτός επιφέρει. Τι είναι τα Διασυνδεδεμένα Δεδομένα και πως μπορεί ο Ιστός να γίνει μια παγκόσμια βάση δεδομένων δηλαδή η ολοκλήρωση της μετατροπής από τον σημερινό στον Σημασιολογικό Ιστό. Τέλος, θα δοθεί μια εκτενής αναφορά στις τεχνολογίες του Σημασιολογικού Ιστού. 2.1. ΤΙ ΕΙΝΑΙ Ο ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΙΣΤΟΣ Το Διαδίκτυο είναι κατασκευασμένο από υπολογιστές, αλλά για τους ανθρώπους. Οι ιστοσελίδες που επισκεπτόμαστε καθημερινά χρησιμοποιούν τη φυσική γλώσσα, εικόνες και διατάξεις σελίδας με σκοπό την παρουσίαση των πληροφοριών, με τρόπο που να είναι εύκολο να τις καταλάβουμε. Οι υπολογιστές δεν βγάζουν νόημα από αυτές τις πληροφορίες. Δεν μπορούν να διαβάσουν, να βγάλουν νόημα από συμφραζόμενες έννοιες ή να πάρουν αποφάσεις όπως ένας άνθρωπος. Η πρόταση του Σημασιολογικού Ιστού είναι να βοηθήσει του υπολογιστές να διαβάζουν και να χρησιμοποιούν τον Ιστό. Η μεγάλη ιδέα είναι πολύ απλή: τα μεταδεδομένα που προστίθενται στις ιστοσελίδες μπορούν να κάνουν τον Ιστό αναγνώσιμο από της μηχανές. Παρ όλα αυτά ο Σημασιολογικός Ιστός δεν αποτελεί έναν διαφορετικό αλλά επέκταση του ήδη υπάρχοντος Παγκόσμιου Ιστού. Σε τι μας χρησιμεύει όμως ο Σημασιολογικός Ιστός; Ας πάρουμε το παρακάτω παράδειγμα. Έστω ότι θέλαμε να αγοράσουμε ένα DVD αλλά σε ευρεία οθόνη (widescreen) όχι Full, γιατί η οθόνη μας υποστηρίζει καλύτερα αυτό το μέγεθος και έστω ότι θέλουμε [15]

το σετ μιας συγκεκριμένης ταινίας με τους extra δίσκους όχι την απλή έκδοση. Επίσης, θέλουμε να αγοράσουμε στην καλύτερη δυνατή τιμή όχι όμως μεταχειρισμένο και έστω ότι δεν θέλουμε να περιμένουμε πολύ μέχρι την παραλαβή. Στον Ιστό με τη σημερινή του μορφή θα πρέπει να ψάξουμε σε διάφορες σελίδες, να συγκρίνουμε τιμές και τον χρόνο που απαιτείται μέχρι την παραλαβή. Θα μπορούσαμε, επίσης, να κοιτάξουμε μια ιστοσελίδα που συγκρίνει τιμές και επιλογές παραλαβής από διάφορα καταστήματα. Με οποιονδήποτε τρόπο, η περισσότερη δουλειά θα πρέπει να γίνει από εμάς, μέχρι να αποφασίσουμε και να πραγματοποιήσουμε την παραγγελία. Με τον Σημασιολογικό Ιστό θα έχουμε άλλη επιλογή. Θα μπορούσαμε να εισάγουμε τις προτιμήσεις μας σε έναν πράκτορα (agent) που θα έψαχνε το Διαδίκτυο ώστε να κάνει αυτός την δουλειά για εμάς και να πραγματοποιήσει την παραγγελία. Ο πράκτορας θα μπορούσε να ανοίξει την εφαρμογή των οικονομικών μας εσόδωνεξόδων και να καταγράψει το όριο τον εξόδων που μπορούμε να δαπανήσουμε και στην συνέχεια θα μπορούσε να καταγράψει στο ημερολόγιό μας την ημέρα που θα παραλαμβάναμε το DVD. Θα μπορούσε, ακόμα, να μάθει τις προτιμήσεις και τις συνήθειες μας, ώστε αν είχαμε κάποια άσχημη εμπειρία σε σχέση με την αγορά DVD από κάποια ιστοσελίδα να μην την ξαναχρησιμοποιήσει άλλη φορά. Ο πράκτορας θα πραγματοποιούσε τις παραπάνω ενέργειες όχι μέσω των εικόνων και τις περιγραφών όπως θα έκανε ένας άνθρωπος, αλλά από την αναζήτηση μέσω μεταδεδομένων τα οποία προσδιορίζουν με σαφήνεια τι χρειάζεται ο πράκτορας να γνωρίζει. Τα μεταδεδομένα είναι απλά δεδομένα αναγνώσιμα από μηχανές που περιγράφουν άλλα δεδομένα. Στον Σημασιολογικό Ιστό τα μεταδεδομένα είναι αόρατα από τους ανθρώπους καθώς διαβάζουν μια σελίδα, αλλά είναι σαφώς ορατά από τις μηχανές. Τα μεταδεδομένα επιτρέπουν περισσότερο σύνθετες και εστιασμένες αναζητήσεις στον Ιστό με πιο ακριβή αποτελέσματα. [7] Ο Σημασιολογικός Ιστός διαδίδεται από την κοινοπραξία World Wide Web (W3C), ένα διεθνές σώμα τυποποίησης και προτυποποίησης του Ιστού. Υπάρχει μια ειδική ομάδα ανθρώπων, με ηγετική μορφή των Tim Berners-Lee, ιδρυτή του Ιστού και του Σημασιολογικού Ιστού, στην διεθνή κοινοπραξία του (W3C), που εργάζεται για την βελτίωση, επέκταση και τυποποίηση του συστήματος. Εκτός από τον κλασσικό Ιστό [16]

εγγράφων η κοινοπραξία W3C βοηθά στο να οικοδομηθεί ένα πλαίσιο τεχνολογιών για την υποστήριξη του «Ιστού δεδομένων» (Web of data). Οι τεχνολογίες Σημασιολογικού Ιστού επιτρέπουν στους ανθρώπους να δημιουργήσουν δεδομένα αποθηκευμένα στον Ιστό, να κατασκευάσουν λεξιλόγια (vocabularies) και να γράψουν κανόνες διαχείρισης των δεδομένων αυτών. Τα Διασυνδεδεμένα Δεδομένα είναι εμπλουτισμένα με τεχνολογίες όπως RDF, SPARQL, OWL, και SKOS. 2.2 ΔΙΑΣΥΝΔΕΔΕΜΕΝΑ ΔΕΔΟΜΕΝΑ LINKED DATA Οι περισσότερες εφαρμογές αποθηκεύουν τα δεδομένα χρησιμοποιώντας την έννοια των ξένων κλειδιών, που τους επιτρέπει να διευθυνσιοδοτούν κάθε στοιχείο και να βρίσκουν τα σχετιζόμενα με αυτό δεδομένα, εύκολα μέσω πινάκων. Αυτή η λογική δουλεύει πολύ καλά στα κλειστά συστήματα, που είναι εύκολη η επιβολή περιορισμών στα κλειδιά αυτά, όπως η δημιουργία μοναδικών αναγνωριστικών. Δεν λειτουργεί όμως σε παγκόσμια κλίμακα, διότι κάθε σελίδα στον Ιστό δεν στηρίζεται σε μια κεντρική αρχή για την απόδοση των αναγνωριστικών. Ενώ το όνομα χρήστη, ενός ατόμου στην προσωπική του ιστοσελίδα μπορεί να είναι το theodor, δεν σημαίνει ότι έχει το ίδιο σε όλες τις ιστοσελίδες που χρησιμοποιεί. Π.χ. στο Gmail μπορεί να είναι το theodor_kolokotronis αλλά στο Facebook επειδή έχει ήδη δοθεί το συγκεκριμένο όνομα να είναι το th_kolok ενώ στο Skype το kolokotronis_th. Το συμπέρασμα είναι ότι, το να μιλάμε για έννοιες όπως κωδικός και όνομα χρήστη δεν σημαίνει τίποτα για ένα κατανεμημένο σύστημα όπως ο Παγκόσμιος Ιστός, είναι από μόνο του ασαφές. Τη λύση στο παραπάνω πρόβλημα την φέρνει η RDF με τα URIs. Με τα URIs γίνεται εφικτή η ονομασία και η διευθυνσιοδότηση των πόρων του Διαδικτύου. Έτσι, αντί να αναφέρεται σε έναν χρήστη με κάποιον αριθμό, η RDF χρησιμοποιεί κείμενο της μορφής http://example.com/user/524569. Με αυτόν τον τρόπο μπορούμε να ισχυριστούμε ότι αντικείμενα όπως http://example.com/user/524569 και http://groups.example.com/user/58569 αποτελούν δύο σελίδες προφίλ του ίδιου ατόμου. Με τα URIs οι ιστοσελίδες μπορούν να εγκαταστήσουν το δικό τους [17]

namespace και να δημιουργήσουν όσους περισσότερους πόρους χρειάζεται χωρίς να απαιτείτε οποιαδήποτε διαβούλευση με άλλες ιστοσελίδες. Πέρα από τα παραπάνω, ας σκεφτούμε το πρόβλημα της ασάφειας όταν μιλάμε για έννοιες όπως tagging ή block post με την λέξη «apple». Μπορούμε να ταυτοποιήσουμε μια ενδεχομένως ασαφή έννοια, πάλι χρησιμοποιώντας κείμενο, με την βοήθεια της RDF. Θα μπορούσαμε να εισάγουμε έννοιες στο δικό μας namespace, αλλά για πιο γενικές έννοιες όπως «όνομα» ή «όλες οι χώρες του κόσμου», είναι πιο λογικό να χρησιμοποιήσουμε κάτι που συμφωνεί με ένα κεντρικό αποθετήριο. Η Βικιπαίδεια περιλαμβάνει έναν μεγάλο όγκο πληροφοριών σχετικά με αντικείμενα, έννοιες, διάσημους ανθρώπους, πόλεις, χώρες, οργανισμούς κ.λ.π. Κάθε καταχώρηση έχει ένα URI στην Βικιπαίδεια που εμφανίζει πληροφορίες σχετικές με κάποιο θέμα. Μιλώντας για την έννοια «apple» θα μπορούσε να εννοείτε το μήλο ή η εταιρεία. Χρησιμοποιώντας URIs θα μπορούσαμε εύκολα να απαλλαγούμε από κάθε ασάφεια αφού το URI http://en.wikipedia.org/wiki/apple μιλάει για το φρούτο ενώ το http://en.wikipedia.org/wiki/apple_inc περιγράφει την εταιρεία. Αυτή η διάκριση δεν σημαίνει τίποτα για τους ανθρώπους, όμως για τις μηχανές είναι ζωτικής σημασίας. Όσες περισσότερες ιστοσελίδες χρησιμοποιούν κοινά αναγνωριστικά, τόσο πιο εύκολο είναι για τις μηχανές να κάνουν διασταυρώσεις και να βγάζουν συμπεράσματα, όπως ποιό είναι το σύνολο των δημοσιεύσεων (posts) που μιλούν για το ίδιο θέμα. Τα παραπάνω επιτρέπουν στα δεδομένα από διαφορετικές πηγές να συνδέονται και να μπορούν να ερωτηθούν. Έτσι, ο Ιστός γίνεται μια παγκόσμια βάση δεδομένων όπου όλα τα δεδομένα είναι συνδεδεμένα και εύκολα ανακτήσιμα. Αυτή η συλλογή των αλληλένδετων δεδομένων του Ιστού μπορεί να αναφερθεί ως Διασυνδεδεμένα Δεδομένα. [9] Ο Tim Berners-Lee περιγράφει τέσσερις βασικές αρχές των Διασυνδεδεμένων Δεδομένων, με την προοπτική να κάνουν τον Ιστό να λειτουργήσει αποδοτικότερα: 1. Χρησιμοποίησε URIs ως ονόματα για να προσδιορίσεις αντικείμενα και έννοιες. [18]

2. Χρησιμοποίησε HTTP URIs ώστε αυτά τα αντικείμενα να μπορούν να αναφερθούν και να αναζητηθούν από ανθρώπους και πράκτορες χρηστών (Agents). 3. Όταν κάποιος ψάχνει ένα URI, να παρέχονται χρήσιμες πληροφορίες αξιοποιώντας πρότυπα όπως η (RDF*, SPARQL). 4. Να περιλαμβάνει συνδέσμους προς άλλα URIs, έτσι ώστε να ανακαλύπτονται περισσότερα αντικείμενα. [10] 2.3 ΤΕΧΝΟΛΟΓΙΕΣ ΣΗΜΑΣΙΟΛΟΓΙΚΟΥ ΙΣΤΟΥ Για την δημιουργία των Διασυνδεδεμένων δεδομένων, η τεχνολογίες που χρησιμοποιούνται θα πρέπει να είναι διαθέσιμες σε μια συγκεκριμένη μορφή, ώστε να επιτευχθεί είτε η μετατροπή είτε η απευθείας πρόσβαση στις υπάρχουσες βάσεις δεδομένων. Επιπλέον σημαντικό είναι η εγκατάσταση ερωτούμενων τελικών σημείων (Endpoints) ώστε η πρόσβαση στα δεδομένα να γίνεται πιο λειτουργική. Αυτή η μορφή προέρχεται από τις γλώσσες σήμανσης markup languagies οι οποίες προσφέρουν μια μέθοδο εισαγωγής μεταδεδομένων στις ιστοσελίδες. Η κυρίως τεχνολογία που χρησιμοποιείται για το σκοπό αυτό είναι η XML και η RDF. 2.3.1 XML Η Extensible Markup Language (XML) είναι μια γλώσσα σήμανσης (markup language) όπως η hypertext markup language (HTML). Προήλθε από μια προγενέστερη τυποποιημένη μορφή, την SGML (ISO 8879), προκειμένου να είναι πιο κατάλληλη για το Διαδίκτυο. Ενώ η HTML είναι υπεύθυνη για την εμφάνιση των πληροφοριών που βλέπουμε στον Ιστό, η XML, που την συμπληρώνει, προσθέτει ετικέτες που περιγράφουν τα δεδομένα. Αυτές οι ετικέτες είναι αόρατες από τους ανθρώπους καθώς διαβάζουν τις ιστοσελίδες, αλλά ορατές από τις μηχανές. Οι ετικέτες χρησιμοποιούνται ήδη στον Ιστό, όπως στα bots (Web Robots) τα οποία μπορούν να τις διαβάσουν και να συλλέγουν πληροφορίες για τις μηχανές αναζήτησης. Η XML είναι επεκτάσιμη διότι επιτρέπει τι δημιουργία ετικετών από τους προγραμματιστές με βάσει ορισμένους συντακτικούς κανόνες. Τα δεδομένα [19]

που κωδικοποιούνται σε XML μετατρέπονται σε έναν standard τύπο εγγράφου τον οποίο μπορεί να διαβάσει και να επεξεργαστεί οποιαδήποτε εφαρμογή που υποστηρίζει XML τεχνολογία. Από το 2009 έχουν αναπτυχθεί εκατοντάδες μορφές εγγράφων που χρησιμοποιούν XML σύνταξη, συμπεριλαμβανομένου τα RSS, Atom, SOAP, και XHTML. Οι βασισμένες σε XML μορφές έχουν γίνει προεπιλογή για πολλά office-productivity εργαλεία, όπως Microsoft Office (Office Open XML), OpenOffice.org και LibreOffice (OpenDocument), και το iwork της Apple. Η XML χρησιμοποιείται ευρέως στις μέρες μας. Αποτελεί την βάση για πολλά πρότυπα όπως το Universal Business Language (UBL), το Universal Plug and Play (UPnP) που χρησιμοποιείται στην οικιακή ηλεκτρονική, σε μορφές επεξεργασίας κειμένου όπως το ODF και το OOXML, σε μορφές γραφικών όπως η SVG, υποστηρίζεται άμεσα από γλώσσες προγραμματισμού και βάσεις δεδομένων μέχρι κινητά τηλέφωνα. Ακόμα και όταν πάει κανείς το αυτοκίνητό του για service, ο υπολογιστής της μηχανής αποστέλλει XML μηνύματα στο σύστημα διάγνωσης. Η XML είναι παντού. [11] [12] [13] 2.3.2 RDF Το πλαίσιο περιγραφής πόρων Resource Description Framework (RDF) είναι ένα σύνολο προδιαγραφών του W3C για την μοντελοποίηση πληροφοριών. Στην RDF κάθε κομμάτι πληροφορίας περιέχει ένα υποκείμενο ρήμα αντικείμενο (subjectverb-object) όπως σε μια πρόταση στην φυσική γλώσσα. Όταν συνδυαστούν μαζί, αυτά τα κομμάτια μπορούν να μοντελοποιήσουν γνώση για πολλά πράγματα. Ας υποθέσουμε ότι θέλουμε να κάνουμε κατανοητή σε έναν υπολογιστή την παρακάτω πρόταση. «Ο Φίλλιπος ο Β είναι πατέρας του Μέγα Αλέξανδρου». Στην RDF κάθε πρόταση ακολουθεί την ίδια δομή (subject-verb-object), επομένως η παραπάνω πρόταση μπορεί να γραφτεί ως εξής: [20]

Εικόνα 2: Πρόταση σε μορφή (Subject-Property-Object) Αυτό το πρότυπο (subject-verb-object) χρησιμοποιείται για να διασφαλιστούν τα βασικά στοιχεία των πληροφοριών που στην διάλεκτο της RDF συχνά ονομάζεται τριπλότυπο-τριπλέτα. Το ρήμα (verb) αναφέρεται συχνά και ως κατηγορούμενο (predicate) ή ιδιότητα (property), όπως στο παραπάνω σχήμα. Για να διασφαλιστεί η διαλειτουργικότητα στον Ιστό, είναι ζωτικής σημασίας να χρησιμοποιούνται τα ίδια ρήματα-ιδιότητες (properties), έτσι ώστε όταν κάποιος άλλος διαβάσει την παραπάνω πρόταση να καταλάβει τι αναπαριστά ο Φίλλιπος ο Β ή ο Μέγας Αλέξανδρος και την μεταξύ τους σχέση. Στην φυσική γλώσσα αυτό μπορεί να επιτευχθεί από το νόημα των λέξεων που χρησιμοποιούμε. Για τις μηχανές και την RDF αυτό επιτυγχάνεται με την χρήση των URIs. Οι βέλτιστες πρακτικές των Διασυνδεδεμένων δεδομένων ενθαρρύνουν την χρήση των HTTP URIs διότι παρέχουν για τις μηχανές και τον άνθρωπο ένα μέσο αναζήτησης της έννοιας του πόρου. Τι είναι όμως τα URIs; 2.3.3 Uniform Resource Identifiers (URIs) Ακόμη και με το πλαίσιο που η XML και η RDF προσφέρουν, οι υπολογιστές εξακολουθούν να χρειάζονται έναν άμεσο και ξεκάθαρο τρόπο κατανόησης για το ποιοί και τί είναι οι πόροι. Για να επιτευχθεί αυτό η RDF χρησιμοποιεί τα Uniform Resource Identifiers URIs (ενιαίους αναγνωριστικούς πόρους) ώστε να κατευθύνει τους υπολογιστές σε ένα έγγραφο ή αντικείμενο που αναπαριστά τον πόρο. Τα URIs μπορούν να χαρακτηριστούν ως ανιχνευτές τοποθεσιών (URLs) ή ονομάτων (URNs) ή και τα δυο. Ενώ ένα ενιαίο όνομα πόρου URN λειτουργεί όπως το όνομα ενός προσώπου, αντίστοιχα ένας ενιαίος εντοπιστής πόρου URL λειτουργεί όπως η διεύθυνσή του. Με άλλα λόγια το URN ορίζει την ταυτότητα του προσώπου ενώ το URL παρέχει μια μέθοδο εντοπισμού του. Χαρακτηριστικό παράδειγμα χρήσης του [21]

URN είναι το σύστημα μοναδικού εντοπισμού βιβλίων (ISBN). Για παράδειγμα, το ISBN 0596153813 αναφέρεται σαφώς σε μια συγκεκριμένη έκδοση του βιβλίου «Programming the Semantic Web». Για να αποκτηθεί η πρόσβαση σε αυτό το βιβλίο και να διαβαστεί, θα πρέπει να είναι διαθέσιμη η τοποθεσία του στον Ιστό, μια URL διεύθυνση. Μια τυπική URL διεύθυνση του συγκεκριμένου βιβλίου θα ήταν κάπως έτσι file:///home/username/books/programming the Semantic Web.pdf που προσδιορίζει το ηλεκτρονικό βιβλίο που είναι αποθηκευμένο σε ένα τοπικό δίσκο. [7][8] Το παρακάτω Euler διάγραμμα δείχνει ότι to URI μπορεί να είναι είτε URL είτε URN. Εικόνα 3: Διάγραμμα Euler για την περιγραφή του Uniform Resource Identifier (URI) Το πλεονέκτημα της χρησιμοποίησης URI αντί κειμένου είναι ότι αποφεύγεται η οποιαδήποτε ασάφεια μπορεί να έχει ένα απλό κείμενο. Επιπλέον στο παράδειγμά μας, το URI παρέχει τις ημερομηνίες γέννησης και θανάτου των προσώπων, τις κατακτήσεις τους, πού πολέμησαν και πολύ περισσότερες πληροφορίες από ότι μπορεί να εκφράσει ένα απλό κείμενο. Έτσι η παραπάνω πρόταση θα μπορούσε να γίνει: Εικόνα 4: Πρόταση σε μορφή (Subject-Property-Object) με τα URIs [22]

2.3.4 VOCABULARIES Αν δεν είμαστε σίγουροι για την έννοια μιας ιδιότητας μπορούμε απλά να την αναζητήσουμε μέσω του φυλλομετρητή μας ώστε να μάθουμε περισσότερα γι αυτήν. Αυτή η τακτική μπορεί να ακολουθηθεί και από τις μηχανές ώστε να ανακαλύψουν το νόημα πίσω από ένα URI. Είναι το ίδιο με τo να ψάχνει κανείς σε ένα λεξικό. Αυτά τα λεξικά στην RDF αποκαλούνται οντολογίες (ontologies), λεξικά (vocabularies) ή σχήματα (schemas). Περιέχουν ένα σύνολο ορισμών για τα URIs που είναι στοχευμένοι σε ένα συγκεκριμένο θέμα. Ένα συχνό παράδειγμα αποτελεί το Friend of a Friend (FOAF) λεξικό το οποίο περιλαμβάνει όρους που περιγράφουν άτομα και τις μεταξύ τους σχέσεις. Τα λεξικά προσδίδουν συναρπαστικές δυνατότητες στις μηχανές για να μάθουν και να εξάγουν γνώση, όπως αν δυο πόροι από διαφορετικά λεξικά είναι στην ουσία συνώνυμοι ή αν ένας συγκεκριμένος πόρος φέρει ένα σύνολο από επιπλέον καταστάσεις. Αξίζει να σημειωθεί η σημειογραφία π.χ. foaf:img που αναφέρεται σε μια img (image-εικόνα) ιδιότητα του λεξικού FOAF. Αυτή η ιδιότητα αποτελεί την CURIE (Compact URI) σύνταξη και είναι χρήσιμη ώστε να αποφεύγονται τα πλήρη URIs, που τείνουν να είναι μεγάλα και ως εκ τούτου επιρρεπή σε τυπογραφικά λάθη. Τα CURIEs χρησιμοποιούνται πάντα μέσα σε ένα πλαίσιο, όπου το πρόθεμα που χρησιμοποιείται πριν την άνω-κάτω τελεία, αντιστοιχεί στο namespace του λεξικού. Στην περίπτωση του foaf:img, το πρόθεμα foaf αντιστοιχεί στο namespace http://xmlns.com/foaf/0.1/ όπως ορίζεται στις προδιαγραφές του λεξιλογίου FOAF. Το πλήρες URI για το foaf:img (αυτό που αναφέρεται στον όρο img) είναι η συνένωση του namespace και του όρου img, όπως παρακάτω http://xmlns.com/foaf/0.1/img Στην πρόταση του παραπάνω παραδείγματος χρησιμοποιήσαμε URIs από την Βικιπαίδεια επομένως η ιδιότητα που εκφράζει την σχέση που συνδέει τα δύο παραπάνω πρόσωπα πρέπει να αναχθεί από το λεξικό που χρησιμοποιεί αυτά τα URIs και δεν είναι άλλο από αυτό της DBpedia η οποία καθιστά στην ουσία το [23]

περιεχόμενο της Βικιπαίδειας διαθέσιμο σε RDF μορφή. Έτσι η παραπάνω πρόταση θα γίνει: Εικόνα 5: Πρόταση σε μορφή (Subject-Property-Object) με το URIs της ιδιότητας από την DBPedia Στο dbpedia-owl:parent, το πρόθεμα dbpedia-owl αντιστοιχεί στο namespace http://dbpedia.org/ontology/ όπως ορίζεται στις προδιαγραφές του λεξιλογίου της DBpedia. Το πλήρες URI για το dbpedia-owl:parent (αυτό που αναφέρεται στον όρο parent) είναι η συνένωση του namespace και του όρου parent, όπως παρακάτω http://dbpedia.org/ontology/parent 2.3.5 RDFa (ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΕΜΠΛΟΥΤΙΣΜΟΣ ΤΗΣ HTML) Το μοντέλο RDF, περιγράφει αντικείμενα-πόρους, τις σχέσεις τους και τις τιμές τους. Τοποθετώντας τα όλα μαζί, σχηματίζουν ένα γράφημα που αντιπροσωπεύει το RDF μοντέλο δεδομένων. Αυτό το RDF μοντέλο στην συνέχεια πρέπει να σειριοποιηθεί (serialization), ώστε να μπορεί να διαβαστεί και να κατανοηθεί από τις μηχανές, με τον ίδιο τρόπο που ένα PHP αντικείμενο μπορεί να σειριοποιηθεί ώστε να μπορεί να αποθηκευτεί /μεταφερθεί σε κάποιο άλλο script. Η Resource Description Framework in attributes (RDFa) είναι ένας τρόπος μεταφοράς του RDF μοντέλου σε οποιαδήποτε γλώσσα σήμανσης όπως η HTML ή XHTML, εμπλουτίζοντας τα υφιστάμενα, αναγνώσιμα από τον άνθρωπο δεδομένα με RDF ιδιότητες (RDF attributes). Έτσι με την RDFa δίνεται η δυνατότητα γεφύρωσης του χάσματος ανάμεσα σε αυτό που βλέπουν οι άνθρωποι κατά την περιήγησή τους σε μια ιστοσελίδα και σε αυτό που βλέπουν οι μηχανές όταν [24]

επεξεργάζονται την ίδια σελίδα. Η RDFa δεν αλλάζει τον τρόπο με τον οποίο μια ιστοσελίδα εμφανίζεται σε έναν φυλλομετρητή. Για τον χρήστη φαίνεται ακριβώς ίδια με πριν. Ωστόσο, η διαφορά είναι εμφανής σε οποιοδήποτε λογισμικό που υποστηρίζει την RDFa, διότι κατανοεί την σημασιολογική σήμανση. Οι φυλλομετρητές μπορούν με αυτό τον τρόπο να βελτιώσουν την εμπειρία του χρήστη ανάλογα με τα δεδομένα που περιέχει η σελίδα. Για παράδειγμα, κάποιες επεκτάσεις φυλλομετρητών παρέχουν πρόσθετες λειτουργίες βασιζόμενες στην RDFa σήμανση που περιέχει μια ιστοσελίδα. Οι μηχανές αναζήτησης χρησιμοποιούν αποδοτικά αυτά τα δεδομένα, αφού τους επιτρέπουν να κατανοούν καλύτερα τις πληροφορίες και να τις εμφανίζουν αναλόγως στα αποτελέσματά τους. Γίνεται εύκολη η εξαγωγή του τίτλου, της ημερομηνίας ή μιας εικόνας από την σελίδα, η οποία μπορεί να βελτιώσει δραστικά την εμφάνιση στα αποτελέσματα αναζήτησης και να βοηθήσει στην βελτιστοποίηση της αναζήτησης Search Engine Optimization (SEO) μιας σελίδας. Στοιχεία όπως το ποσοστό αξιολόγησης (price ratings) και ο αριθμός των κριτικών (reviews) μπορούν να οδηγήσουν σε αύξηση της κίνησης σε μια ιστοσελίδα ηλεκτρονικού εμπορίου (e-commerce site). Η Yahoo έχει αναφέρει περισσότερο από 15% αύξηση στα ποσοστά των clicks μέσω της RDFa. Όπως είπαμε, η RDFa προσθέτει ιδιότητες στην XHTML. Πρώτα απ όλα πρέπει να γίνουν μερικές προσαρμογές, στην αρχή κάθε προτύπου XHTML, ώστε αυτές οι ιδιότητες να είναι συμβατές με τις προδιαγραφές της RDFa, όπως π.χ. παρακάτω <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/markup/dtd/xhtml-rdfa-1.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" version="xhtml+rdfa 1.0" dir="ltr"> <head profile="http://www.w3.org/1999/xhtml/vocab"> Δεύτερον, προστίθενται κάποια προθέματα χρησιμοποιώντας την CURIE σύνταξη που αναφέρθηκε παραπάνω στην περιγραφή της RDF. Αυτό γίνεται στις HTML ετικέτες χρησιμοποιώντας την παρακάτω σύνταξη: για την FOAF θα μπορούσε να είναι: xmlns:prefix="http://somenamespace.org/" xmlns:foaf=http://xmlns.com/foaf/0.1/ [25]

RDF attributes Για να δηλωθούν οι RDFa ιδιότητες στην HTML, θα πρέπει να προστεθεί το σύμβολο @ ως πρόθεμα. Οι RDFa ιδιότητες είναι οι παρακάτω: @about: Ένα URI ή Safe CURIE, που χρησιμοποιείται για να δηλώσει τι είναι τα δεδομένα (το Υποκείμενο-Subject στην RDF ορολογία) @content: Ένα κείμενο, που παρέχει περιεχόμενο, για ένα literal, αναγνώσιμο από τις μηχανές (ένα plain literal object-στην ορολογία RDF). @datatype: Ένα CURIE που αντιπροσωπεύει ένα τύπο δεδομένων και χρησιμοποιείται για την περιγραφή του τύπου δεδομένων ενός literal. @href: Ένα URI για την περιγραφή του πόρου μια σχέσης (ένα resource object στην ορολογία της RDF). @property: Μία ξεχωριστή λίστα από CURIEs, που χρησιμοποιείται για την περιγραφή των σχέσεων μεταξύ του Subject και ενός literal κειμένου. @rel: Μία ξεχωριστή κενή λίστα από CURIEs, που χρησιμοποιείται για την περιγραφή των σχέσεων μεταξύ δυο πόρων. @rev: Μία ξεχωριστή λίστα από CURIEs, που χρησιμοποιείται για την περιγραφή της αντίστροφης σχέσης μεταξύ δυο πόρων. @src: Ένα URI που περιγράφει το πόρο μιας σχέσης όταν ο αυτός είναι ένθετος @typeof: Μία ξεχωριστή λίστα από CURIEs, που χρησιμοποιείται για την δήλωση των RDF τύπων που σχετίζονται με το subject. [26]

Οι ιδιότητες @property, @rel, και @rev προσδιορίζουν το ρήμα μιας RDF πρότασης. Για να κατανοηθεί καλύτερα ας κοιτάξουμε το παρακάτω παράδειγμα: <h1 property="dc:title">joe's homepage</h1> <div rel="sioc:has_creator"><a href="/user/9">john Smith</a></div> dc:title and sioc:has_creator είναι δυο διαφορετικά RDF predicates τα οποία καθορίζουν τον τίτλο και τον συγγραφέα της ιστοσελίδας. Η ιδιότητα @property αναγκάζει το αντικείμενο της RDF πρότασης να είναι κείμενο. Η ιδιότητα @rel χρησιμοποιείται σε αντίθεση με την @property έτσι ώστε να αναγκάσει το αντικείμενο της πρότασης να είναι URI που δείχνει στην ιστοσελίδα του συγγραφέα. Με άλλα λόγια πρόκειται για πόρο και όχι κείμενο. Με αυτόν τον τρόπο επιτρέπεται στην γλώσσα σήμανσης να περιλαμβάνει περισσότερες πληροφορίες για τον συγγραφέα από ότι ένα κείμενο. Ο πόρος του συγγραφέα περιλαμβάνει πέραν του ονόματός του, το βιογραφικό του και δεσμούς σε άλλα άρθρα του, επιτρέποντας με αυτόν τον τρόπο, την ανακάλυψη περιεχομένου. 2.3.6 RDFa, MICROFORMATS ΚΑΙ MICRODATA Η RDFa δεν αποτελεί την μοναδική σύνταξη για την προσθήκη σημασιολογίας στην HTML. Τα Microformats αποτέλεσαν την πρώτη σύνταξη για την προσθήκη σημασιολογικής πληροφορίας που υιοθετήθηκε από τους προγραμματιστές του Ιστού. Ωστόσο τα Microformats ποτέ δεν τυποποιήθηκαν και εξαιτίας του σχεδιασμού τους, η ανάπτυξη λεξιλογίων όπως (hcard, vcard, κ.λ.π.) ήταν συγκεντρωτική και περιορισμένη σε έναν και μόνο οργανισμό. Η RDFa από την άλλη μεριά, λόγω της φύσης της είναι ελεύθερα επεκτάσιμη, μπορούν να συνδυαστούν εξωτερικά λεξιλόγια ή ακόμα όταν χρειάζεται, μπορούν να χτιστούν προσαρμόσιμα λεξιλόγια ειδικευμένα σε κάποιον τομέα. Επίσης, η RDFa επωφελείται από όλη την έρευνα που έχει γίνει στον Σημασιολογικό Ιστό την τελευταία δεκαετία. Πολλά εργαλεία είναι διαθέσιμα για ανάπτυξη, αποθήκευση και ερώτηση των RDFa δεδομένων. Συγκεκριμένα η SPARQL είναι η RDF γλώσσα ερωτήσεων, παρόμοια με την SQL για τις σχεσιακές βάσεις δεδομένων, που επιτρέπει την εκτέλεση [27]

ερωτήσεων πάνω στα συνδεδεμένα δεδομένα από οποιονδήποτε RDF πόρο. Η RDFa έγινε πρότυπο του W3C από το 2008 και έχει υιοθετηθεί από πολλές εξέχουσες εταιρείες του Ιστού όπως οι Google, Facebook, BBC, και Best Buy. Πρόσφατες έρευνες από την Yahoo! έδειξαν ότι η RDFa είχε μια εκρηκτική ανάπτυξη το 2010 και είναι η ταχύτερα αναπτυσσόμενη μορφή σήμανσης δεδομένων. [14] Τα Microdata είναι ένα νέο τμήμα σύνταξης με βάση τις προδιαγραφές της HTML5, το οποίο βρίσκεται ακόμα στο στάδιο της ανάπτυξης. Τα Microdata έχουν περισσότερα κοινά με την RDFa από ότι τα Microformats, όπως η χρήση URIs για επεκτασιμότητα. Παρ όλα το πρότυπο της RDFa είναι πολύ περισσότερο υποσχόμενο. Ενώ η έκδοση 1.0 της RDFa ισχύει μόνο για την XHTML, η έκδοση 1.1 επιτρέπει στην RDFa να λειτουργεί τόσο στην XHTML όσο και στην HTML5 [15]. Επίσης, η τελευταία έκδοση περιλαμβάνει ανατροφοδότηση από τις κοινότητες των microformats και microdata επιτρέποντας έτσι απλούστερη σύνταξη και περισσότερες περιπτώσεις χρήσης. [28]

ΚΕΦΑΛΑΙΟ 3 ΕΙΣΑΓΩΓΗ ΣΤΟ ΠΡΟΒΛΗΜΑ Στο κεφάλαιο αυτό θα εξετάσουμε τι είναι ανοικτά δεδομένα, γιατί χρειάζονται, ποια είναι η κατάσταση με τα κυβερνητικά δεδομένα και ποιο είναι το πρόβλημα με την διαδικασία παροχής πληροφοριών από τις Γραμματείες των Τμημάτων Σχολών των Πανεπιστημίων. Στο τέλος θα παρουσιαστεί η πρόταση λύσης του παραπάνω προβλήματος, δηλαδή, του προβλήματος που καλείτε να λύσει η παρούσα Διπλωματική. 3.1 ΥΠΕΡΦΟΡΤΩΣΗ ΠΛΗΡΟΦΟΡΙΩΝ Ο Ιστός περιλαμβάνει περισσότερες από 20 δισεκατομμύρια δημοσιευμένες ιστοσελίδες στις οποίες προστίθενται 900 δισεκατομμύρια σκοτεινές σελίδες (deep pages), δηλαδή σελίδες που είναι προστατευμένες με κωδικούς ή δυναμικές σελίδες οι οποίες δημιουργούνται μετά από αναζήτηση. Αν συνδυαστούν όλοι οι προσωπικοί υπολογιστές, εξυπηρετητές του Ιστού και άλλες συσκευές συνδεδεμένες στον Ιστό, ο δικτυακός αποθηκευτικός χώρος εκτιμάτε περίπου στα 600 exabytes, δηλαδή 600 δισεκατομμύρια gigabytes. Αν σε όλα τα παραπάνω συνυπολογίσουμε τον συνεχόμενα αυξανόμενο ρυθμό των χρηστών που προστίθενται καθημερινά στον Ιστό, το ποσό των πληροφοριών που καλούμαστε να επεξεργαστούμε σε καθημερινή βάση είναι τρομακτικό. Είναι σημαντικό να κατανοήσουμε ότι χωρίς την βοήθεια των μηχανών, δεν μπορούμε να διαχειριστούμε αυτή την υπερφόρτωση πληροφοριών. [29]

3.2 ΑΝΟΙΚΤΑ ΔΕΔΟΜΕΝΑ (OPEN DATA) Ένα υποσύνολο του τεράστιου όγκου πληροφοριών του Ιστού που αναφέρθηκε στην προηγούμενη παράγραφο οι οποίες είναι ανεκμετάλλευτες και καλούμαστε να διαχειριστούμε, αφορά τα «Ανοικτά Δεδομένα» (Open Data). Τι είναι τα Ανοικτά Δεδομένα; Ανοιχτά είναι τα δεδομένα που μπορούν ελεύθερα να χρησιμοποιηθούν, να επαναχρησιμοποιηθούν και να αναδιανεμηθούν από οποιονδήποτε, υπό τον όρο, το πολύ, να γίνεται αναφορά στους δημιουργούς και να διατίθενται, με τη σειρά τους, υπό τους ίδιους όρους. Τα σημαντικότερα σημεία που κάνουν τα δεδομένα ανοικτά, θα λέγαμε ότι είναι τα παρακάτω: Διαθεσιμότητα και Προσβασιμότητα: Τα δεδομένα πρέπει να είναι διαθέσιμα αυτούσια, να έχουν ένα λογικό κόστος αναπαραγωγής, και κατά προτίμηση να είναι διαθέσιμα για λήψη από το Διαδίκτυο. Επίσης, πρέπει να είναι διαθέσιμα σε κάποια μορφή πρακτικά αναγνώσιμη. Επαναχρησιμοποίηση και Αναδιανομή: Τα δεδομένα θα πρέπει να είναι διαθέσιμα υπό όρους που επιτρέπουν την επαναχρησιμοποίηση και την αναδιανομή τους, συμπεριλαμβανομένης και της ανάμειξης με άλλα σύνολα δεδομένων. Καθολική Συμμετοχή: Καθένας πρέπει να μπορεί να χρησιμοποιήσει, να επαναχρησιμοποιήσει και να αναδιανείμει τα δεδομένα. Δεν πρέπει αυτά να υπόκεινται σε διακρίσεις με βάση τον τομέα δραστηριότητας ή τα πρόσωπα και τις ομάδες. Για παράδειγμα, περιορισμοί για «μη-εμπορική χρήση» ή περιορισμοί για χρήση μόνο για συγκεκριμένους σκοπούς (π.χ. μόνο στην εκπαίδευση) δεν είναι επιτρεπτοί. Αν κάποιος αναρωτιέται γιατί είναι τόσο σημαντικό να είναι σαφές τι σημαίνει Ανοιχτά Δεδομένα και σε τι είναι χρήσιμος αυτός ο ορισμός, υπάρχει μια απλή απάντηση: η διαλειτουργικότητα. [30]

«Όταν κάποιος θα έχει δύο ανοιχτά σύνολα δεδομένων από δύο διαφορετικές πηγές, θα είναι σε θέση να τα συνδυάσει» Η διαλειτουργικότητα δηλώνει τη δυνατότητα διαφορετικών συστημάτων να λειτουργούν μαζί (διαλειτουργούν). Σε αυτή τη συγκεκριμένη περίπτωση, γίνεται αναφορά στη δυνατότητα να διαλειτουργούν ή να αναμειγνύουν διαφορετικά σύνολα δεδομένων. Η διαλειτουργικότητα είναι σημαντική επειδή επιτρέπει στις διαφορετικές συνιστώσες να λειτουργούν μαζί. Αυτή η δυνατότητα διαμοίρασης και σύνδεσης συνιστωσών έχει θεμελιώδη σημασία για τη δόμηση μεγαλύτερων και πιο πολύπλοκων συστημάτων. Χωρίς τη δυνατότητα διαλειτουργικότητας αυτό γίνεται σχεδόν αδύνατο, απόδειξη αποτελεί η διάσημη ιστορία του Πύργου της Βαβέλ, όπου η αδυναμία επικοινωνίας (διαλειτουργίας) οδήγησε στην ολοκληρωτική κατάρρευση της προσπάθειας οικοδόμησής του. Παρόμοιες προκλήσεις αντιμετωπίζονται και σε σχέση με τα δεδομένα. Ο πυρήνας της «κοινής ωφέλειας» που βρίσκεται σε δεδομένα (ή κώδικα) έγκειται στο γεγονός ότι ένα τμήμα ανοικτού υλικού που περιέχουν μπορεί να αναμειχθεί με άλλο ανοικτό υλικό. Αυτή η διαλειτουργικότητα είναι το απαραίτητο κλειδί για τη πραγματοποίηση των κύριων πρακτικών πλεονεκτημάτων της έννοιας «Ανοιχτά», δηλαδή τη δραματικά εμπλουτισμένη δυνατότητα να συνδυάζεις διαφορετικά σύνολα δεδομένων και ως εκ τούτου να αναπτύσσεις περισσότερα και καλύτερα προϊόντα και υπηρεσίες. Ένας σαφής ορισμός για την έννοια «Ανοικτά» εγγυάται ότι, όταν κάποιος θα έχει δύο ανοικτά σύνολα δεδομένων από δύο διαφορετικές πηγές, θα είναι σε θέση να τα συνδυάσει και, επίσης, εγγυάται ότι αποφεύγουμε το δικό μας Πύργο της Βαβέλ: πολλά δεδομένα αλλά περιορισμένη ή καθόλου δυνατότητα για το συνδυασμό τους σε μεγαλύτερα συστήματα, όπου αναδεικνύεται η πραγματική τους αξία. [31]