Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων"

Transcript

1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΠΛΗΡΟΦΟΡΙΚΗ ΚΑΙ ΔΙΟΙΚΗΣΗ» ΤΜΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων Διπλωματική Εργασία της Αναστασίας Σταμπουλή Α.Ε.Μ. 220 υπό την επίβλεψη της καθηγήτριας κ. Αθηνάς Βακάλη Θεσσαλονίκη 2009

2 Σύνοψη Διπλωματικής Το ενδιαφέρον μεγάλης μερίδας των χρηστών του διαδικτύου έχουν προσελκύσει τα Συστήματα Κοινωνικής Σήμανσης (π.χ. Flickr, del.icio.us). Τα συστήματα αυτά παρέχουν στο χρήστη τη δυνατότητα να ανεβάζει και να περιγράφει πόρους στο διαδίκτυο, χρησιμοποιώντας ετικέτες που επιλέγει ο ίδιος. Με την ανάπτυξη των συστημάτων κοινωνικής σήμανσης δημιουργήθηκε σε ένα σχετικά σύντομο χρονικό διάστημα ένας πολύ μεγάλος όγκος πληροφορίας. Όμως τα μειονεκτήματα των συστημάτων κοινωνικής σήμανσης μπορεί να οδηγήσουν σε λάθος πληροφόρηση των χρηστών και σε δυσκολίες εκμετάλλευσης των δεδομένων αυτών. Αυτό συμβαίνει κυρίως λόγω της έλλειψης κάποιας μορφής ελέγχου για την ορθότητα των πληροφοριών που εισάγει ο κάθε χρήστης. Λόγω της μεγάλης ανάπτυξης των Συστημάτων Κοινωνικής Σήμανσης το Flickr πλέον περιλαμβάνει δισεκατομμύρια φωτογραφιών. Η επιστροφή αποτελεσμάτων με μόνο κριτήριο την αντιστοίχηση των ετικετών δεν επιστρέφει καθόλου ικανοποιητικά αποτελέσματα για σύνθετες αναζητήσεις. Λόγω του ασαφή χαρακτήρα των πληροφοριών δημιουργήθηκε η ανάγκη συνδυασμού πληροφοριών από πολλές πηγές γνώσης προκειμένου οι πληροφορίες που παρέχονται στους χρήστες να έχουν ένα πιο έγκυρο χαρακτήρα και να παράγονται καλύτερης ποιότητας αποτελέσματα στις διάφορες αναζητήσεις των χρηστών. Οι παραπάνω λόγοι οδήγησαν στη δημιουργία του φαινομένου των mashups. Στη συγκεκριμένη εργασία αποφασίσαμε να υλοποιήσουμε μία σύγκλιση (mashup) που θα συνδέει την DBpedia με το Flickr δηλαδή οδηγεί στο συνδυασμό των πληροφοριών που παρέχει η DBpedia με τις πληροφορίες που παρέχουν οι ετικέτες που χαρακτηρίζουν τις δημοσιευμένες φωτογραφίες του Flickr. Η σύγκλιση αυτή έχει ως στόχο την επιστροφή αποτελεσμάτων καλύτερης ποιότητας σε διάφορες αναζητήσεις χρηστών στον ιστότοπο Flickr.Τα σενάρια τα οποία αναπτύχθηκαν προκειμένου να μπορέσουμε να διαπιστώσουμε την λειτουργικότητα της συγκεκριμένης εφαρμογής και το κατά πόσο επιτυχημένο είναι το mashup το οποίο αναπτύξαμε ανάμεσα στη DBpedia και στο Flickr χωρίζονται σε δύο κατηγορίες. Η πρώτη κατηγορία περιλαμβάνει τις αμφίσημες έννοιες μιας λέξης ενώ η δεύτερη σχετίζεται άμεσα με τον χαρακτηρισμό φωτογραφιών με γεωγραφικές συντεταγμένες. Η διάρθρωση της εργασίας είναι η ακόλουθη: Στο πρώτο κεφάλαιο γίνεται μια σύντομη αναφορά σε βασικές έννοιες του προβλήματος και στους λόγους που μας οδήγησαν στη συγκεκριμένη υλοποίηση. Στο δεύτερο κεφάλαιο γίνεται μια αναφορά στα συστήματα που μπορούν να συνεργαστούν με τα συστήματα κοινωνικής σήμανσης προκειμένου να παραχθούν πληροφορίες καλύτερης ποιότητας καθώς και κάποια παραδείγματα συνδυασμού γνώσης από διαφορετικές πηγές. Στο τρίτο κεφάλαιο, αρχικά, γίνεται μια αναλυτική περιγραφή των εργαλείων που χρησιμοποιήθηκαν για την υλοποίηση της σύγκλισης και ακολουθεί μια αναφορά θεωρητικών Στο τέταρτο κεφάλαιο παρουσιάζεται αναλυτικά το σύστημα που υλοποιήθηκε στη συγκεκριμένη εργασία, η αρχιτεκτονική του καθώς και τα πειραματικά αποτελέσματα που προέκυψαν. Τέλος, στο πέμπτο κεφάλαιο παρατίθενται τελικά συμπεράσματα και οι μελλοντικές τάσεις που υπάρχουν στον τομέα που μελετήσαμε. Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

3 Περιεχόμενα Σύνοψη Διπλωματικής...1 Περιεχόμενα...2 Κεφάλαιο 1. Εισαγωγή Εισαγωγή-Βασικές έννοιες Οντολογίες και folksonomies Semantic Web και Web Πλεονεκτήματα και μειονεκτήματα STS...10 Κεφάλαιο 2. Σύγκλιση STS με άλλες εφαρμογές Wikis και Wikipedia DBpedia Mashups Wikipedia Mashups Flickr Mashups DBpedia mashups...29 Κεφάλαιο 3. Τεχνολογίες και υλοποίηση σύγκλισης Εργαλεία SPARQL RDF Flickr API Python SPARQL Wrapper Θεωρητικό υπόβαθρο υλοποίησης Γενικά Αμφίσημες έννοιες(disambiguation) Γεωγραφικές συντεταγμένες...43 Κεφάλαιο 4. Υλοποίηση και σενάρια χρήσης Αμφίσημες έννοιες (Disambiguations) Υλοποίηση Σενάρια χρήσης Geotags (specific locations) Υλοποίηση Σενάρια χρήσης Geotags (Near Places) Υλοποίηση Σενάρια χρήσης...73 Κεφάλαιο 5. Συμπεράσματα-Μελλοντικές τάσεις Αποτελέσματα έρευνας και συμπεράσματα Μελλοντικές τάσεις...94 References...98 Διπλωματική εργασία-αναστασία Σταμπουλή 2

4 Κεφάλαιο 1. Εισαγωγή 1.1 Εισαγωγή-Βασικές έννοιες Πολλοί ιστότοποι έχουν αρχίσει να επιτρέπουν στους χρήστες να υποβάλλουν αντικείμενα σε μια συλλογή και να τα χαρακτηρίζουν με λέξεις-κλειδιά(tags). Οι δομές που δημιουργούνται από αυτά τα tags, που είναι γνωστές και ως folksonomies είναι ένα ενδιαφέρον θέμα το οποίο δεν έχει διερευνηθεί επαρκώς σε πρακτικό επίπεδο. Σχετικά πρόσφατα κάποιοι ιστότοποι έχουν αρχίσει να χρησιμοποιούν νέες μεθόδους για να μετατρέψουν την περιήγηση στο διαδίκτυο σε κοινωνική εμπειρία. Οι χρήστες των ιστοτόπων κοινωνικού bookmarking όπως το Del.icio.us 1 μπορούν να προσθέσουν Web έγγραφα σε μία συλλογή και να τα χαρακτηρίσουν με λέξειςκλειδιά [Morrison2008]. Ο όρος folksonomy που προέρχεται από τις λέξεις folk και taxonomy αποτελεί ένα νεολογισμό για συνεργατική κατηγοριοποίηση αντικειμένων με τη χρήση επιλεγμένων λέξεων-κλειδιών. Οι folksonomies που είναι γνωστές και ως συστήματα κοινωνικής σήμανσης (social tagging systems) έχουν εφαρμοστεί σε έναν αριθμό online περιβαλλόντων γνώσης κοινής χρήσης από τη στιγμή που υιοθετήθηκε για πρώτη φορά από τον ιστότοπο del.icio.us to 2004[Mika2006]. Η βασική ιδέα ενός folksonomy είναι να επιτρέπει στους χρήστες να περιγράφουν ένα σύνολο αντικειμένων κοινής χρήσης με ένα σύνολο που αποτελείται από λέξεις κλειδιά δικής τους επιλογής. Τα κοινωνικά συστήματα διαμοιρασμού πόρων (Social resource sharing systems) είναι βασισμένα σε web συστήματα τα οποία επιτρέπουν στους χρήστες να ανεβάσουν (upload) τους πόρους τους και να τους χαρακτηρίζουν 1 Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

5 χρησιμοποιώντας αυθαίρετες λέξεις αποκαλούμενες με τον όρο ετικέτες(tags). Κάθε σύστημα υποστηρίζει ένα συγκεκριμένο τύπο πόρων. Για παράδειγμα το αντικείμενο της κατηγοριοποίησης στο del.icio.us είναι οι ηλεκτρονικές διαφημίσεις, οι φωτογραφίες στο Flickr 2, επιστημονικές δημοσιεύσεις στο CiteULike 3, βιβλιογραφικές αναφορές στο Connotea 4 ενώ ο ιστότοπος 43 Things 5 δίνει τη δυνατότητα στους χρήστες του να μοιράζονται μεταξύ τους στόχους και τις επιδιώξεις που έχουν στην ιδιωτική τους ζωή (π.χ. να ταξιδέψουν ή να αδυνατίσουν). Σε αυτούς τους ιστοτόπους δίνεται η δυνατότητα στους χρήστες να σχολιάσουν με διάφορες λέξεις κλειδιά και να φέρουν σε επαφή μεταξύ τους χρήστες οι οποίοι έχουν κοινές επιδιώξεις και ενδιαφέροντα. Είναι σημαντικό να σημειωθεί ότι στα πλαίσια της παρουσίασης των δεδομένων το σύνολο των λέξεων κλειδιών δεν μπορεί να θεωρηθεί ότι αποτελεί ένα περιορισμένο λεξιλόγιο [Jaschke2008]. Αρχικά το σύνολο των λέξεων δεν είναι καθορισμένο. Στην πραγματικότητα οι χρήστες δεν διαμορφώνουν κάποια ρητή συμφωνία για τη χρήση της κάθε λέξης, αλλά η σημασιολογία αυτής καθώς και οι σχέσεις μεταξύ των λέξεων προκύπτουν από τον τρόπο που τις χρησιμοποιούν οι χρήστες (emergent semantics). Κατά δεύτερον παρ όλο που χρησιμοποιούμε την έννοια του όρου δεν υπάρχει ένα προς ένα σχέση ανάμεσα σε κάποιους όρους και τις λέξεις κλειδιά. Επίσης δεν είναι πάντα εφικτό για τους χρήστες να εκφράσουν ένα σύνθετο νόημα με μία μόνο λέξη κλειδί και γι αυτό το λόγο μπορεί να χρησιμοποιήσουν περισσότερες από μία ετικέτες (tags) για να εκφράσουν το συσχετισμό που υπάρχει μεταξύ της έννοιας και του αντικειμένου. Τα Κοινωνικά συστήματα διαμοιρασμού πόρων(social resource sharing systems) στον Ιστό, όπως η κοινή έκθεση φωτογραφιών Flickr ή το bookmarking σύστημα del.icio.us, έχουν αποκτήσει μεγάλο αριθμό χρηστών μέσα σε χρονικό διάστημα λίγων ετών. Το Flickr είναι γνωστό ότι έχει περισσότερους από 1.5 εκατομμύριο χρήστες, ενώ το del.icio.us κατάφερε να ξεπεράσει το όριο του ενός εκατομμυρίου χρηστών το έτος Ο λόγος για την άμεση επιτυχία τους είναι το γεγονός ότι δεν απαιτείται καμία συγκεκριμένη δεξιότητα για τη συμμετοχή σε τέτοιου είδους sites, και ότι αυτά τα εργαλεία έχουν ως αποτέλεσμα άμεσο όφελος για κάθε χρήστη χωρίς καμία ιδιαίτερη επιβάρυνση[jaschke2008] Διπλωματική εργασία-αναστασία Σταμπουλή 4

6 1.2 Οντολογίες και folksonomies Η βασική δομή δεδομένων ενός κοινωνικού συστήματος κοινής εκμετάλλευσης πόρων αναφέρεται με τον όρο folksonomy και αποτελείται από αφηρημένες λέξεις κλειδιά τα οποία ορίζονται ως ετικέτες (tags) οι οποίες ανατίθενται από τους χρήστες σε διάφορα είδη πόρων. Οπότε συμπεραίνουμε ότι οι folksonomies είναι ουσιαστικά μία αναπαράσταση γνώσης για την διαμοίραση γνώσης στον ιστό (web). Ο όρος folksonomy αναφέρεται στους χρήστες, στους πόρους και στις ετικέτες και στην βασισμένη στους χρήστες ανάθεση ετικετών στους πόρους. Από τη στιγμή που ένας χρήστης θα συνδεθεί έχει την δυνατότητα να προσθέσει έναν πόρο στο σύστημα και να χαρακτηρίσει τον συγκεκριμένο πόρο με μία οποιαδήποτε ετικέτα το περιεχόμενο της οποίας δεν τίθεται συνήθως σε κάποιο περιορισμό. Η συλλογή των ετικετών που έχει αναθέσει ο κάθε χρήστης του συστήματος αποκαλείται personomy. Ο κάθε χρήστης μπορεί να εξερευνήσει την δικιά του personomy καθώς και αυτές άλλων χρηστών. Για παράδειγμα ένας συγκεκριμένος χρήστης μπορεί να δει το σύνολο των πόρων που έχει κάνει upload καθώς και τις ετικέτες που έχει αναθέσει στους πόρους. Επίσης υπάρχει η δυνατότητα κάνοντας κλικ πάνω σε έναν πόρο να εντοπίσεις τους υπόλοιπους χρήστες που τον έχουν κάνει επίσης upload και με ποιες ετικέτες τον έχουν χαρακτηρίσει. Άλλη μια δυνατότητα η οποία υπάρχει είναι όταν ένας χρήστης κάνει κλικ σε μία ετικέτα (tag) να εντοπίσει ποιος χρήστης το έχει χρησιμοποιήσει και για ποιους πόρους. Σε αντίθεση με τις οντολογίες οι folksonomies δεν πάσχουν από δυσχέρεια απόκτησης γνώσεων λόγω της σημαντικής παροχής πληροφοριών και περιεχομένου από ένα σημαντικό αριθμό χρηστών. Από την άλλη μεριά στις folksonomies σε αντίθεση με τις οντολογίες δεν δηλώνουν με σαφήνεια τις κοινές συλλήψεις και ούτε υποχρεώνουν τους χρήστες να χρησιμοποιούν τις ίδιες ετικέτες (tags). Εντούτοις η χρήση των ετικετών από χρήστες με παρόμοια ενδιαφέροντα τείνει στη δημιουργία σύγκλισης προς ένα κοινό λεξιλόγιο. Η βασική διαφορά που υπάρχει ανάμεσα σε ένα folksonomy και σε μία κλασική οντολογία είναι ο στόχος που έχουν να δείχνουν στο μεγαλύτερο δυνατό βαθμό σεβασμό στα αιτήματα των απλών χρηστών που δεν ασχολούνται με την επίσημη διαμόρφωση της δομής των δεδομένων. Έξυπνες τεχνικές για αυτό το σκοπό μπορεί να υπάρχουν αλλά είναι ενσωματωμένες στο σύστημα και κρυφές για τους απλούς χρήστες [Jaschke2008]. Το γενικότερο πλεονέκτημα το οποίο προκύπτει από την ενσωμάτωση του κοινωνικού περιεχομένου στον τρόπο με τον οποίο παρουσιάζονται οι οντολογίες είναι η δυνατότητα μελέτης σημασιολογιών που προκύπτουν από ενέργειες χρηστών. Οι προκύπτουσες σημασιολογίες είναι πιθανόν να συμπληρώνουν πολύ καλά Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

7 δομημένες αλλά αργά εξελισσόμενες οντολογίες όπως η WordNet οι οποίες έχουν έλλειψη από συσχετιστικά στοιχεία[mika2006]. Ο όρος εκμάθηση οντολογίας εισήχθη για πρώτη φορά από τους Maedche και Staab [Maedche2001]. Αναφέρεται στη διαδικασία κατά την οποία μία οντολογία δημιουργείται με ημι-αυτόματο τρόπο. Συνήθως οι αλγόριθμοι εκμάθησης μηχανών ή εξόρυξης δεδομένων εφαρμόζονται σε δεδομένα κειμένου προκειμένου να εξαχθεί το κρυμμένο νόημα των συγκεκριμένων δεδομένων και να το καταστήσουν πιο σαφές. [Jaschke2008]. Υπάρχει μια σημαντική συζήτηση στην κοινότητα του Web σχετικά με την θέση την οποία κατέχουν οι folksonomies στο όραμα του σημασιολογικού ιστού. Συνήθως βέβαια τα επιχειρήματα εξαντλούνται σε συγκρίσεις μεταξύ του Web 2.0 και του σημασιολογικού ιστού (Semantic Web). Αυτές οι συζητήσεις δίνουν την εντύπωση ότι υπάρχει μία μόνο επιλογή για τον τρόπο που θα εισαχθούν οι σημασιολογικές έννοιες στο Web. Η αλήθεια είναι ότι δεν υπάρχει ανάγκη να γίνει μια τέτοια επιλογή καθώς στην πραγματικότητα οι folksonomies είναι οντολογίες. Για να στηριχθεί αυτή η άποψη μπορούμε να ανατρέξουμε στην σχετική βιβλιογραφία. Για παράδειγμα οι Smith και Welty [Smith2001] χαρακτηρίζουν τις οντολογίες ως ένα σύνολο μηχανισμών παρουσίασης οι οποίες μπορούν να κατηγοριοποιηθούν σύμφωνα με την εκφραστικότητα (expressivity) τους [Mika2006]. Από έρευνες έχει αποδειχθεί ότι υπάρχει ένα σημείο όπου η οντολογία έχει τουλάχιστον μία σταθερή ιεραρχία και επιτρέπεται η αιτιολόγηση με βάση συσχετισμούς κατώτερης στάθμης. Οι Elst και Abecker [Elst2002] σημειώνουν ότι είναι δύσκολο αν όχι αδύνατο να αποκτήσεις γνώση η οποία να έχει επίσημη μορφή αλλά ταυτόχρονα να μεταβάλλεται δυναμικά και να είναι ευρέως διαμοιρασμένη. Εάν μεταφράσουμε τον όρο οντολογία είναι εύκολο να δείξουμε ότι οι folksonomies απλώς αναπαριστούν διαφορετικές θέσεις στην κλίμακα από ότι τα πιο επίσημα ελεγχόμενα λεξιλόγια που χρησιμοποιούνται από την κοινότητα του σημασιολογικού ιστού. Οι folksonomies τείνουν να θεωρηθούν από εκπροσώπους του σημασιολογικού ιστού ως όχι ιδιαιτέρως χρήσιμες με την έννοια ότι δεν μπορούν να εφαρμοστούν αυτόματες αιτιολογήσεις χρησιμοποιώντας λογικές προσεγγίσεις. Εντούτοις υπάρχει ένα μεγάλος αριθμός σημασιολογιών που μπορεί να προκύψει από τις folksonomies. Οι μέθοδοι οι οποίες χρησιμοποιούνται για να προκύψουν δεν είναι βασισμένες σε λογικά κριτήρια αλλά προέρχονται από την ανάλυση δικτύων. Οι folksonomies έχουν επίσης δυναμικό χαρακτήρα αλλάζοντας με την πάροδο του χρόνου με κάθε ενέργεια ανάθεσης ετικέτας(tagging) γεγονός το οποίο έρχεται σε αντίθεση με πιο σταθερές δομές πάνω στις οποίες είναι βασισμένες οι εφαρμογές του Διπλωματική εργασία-αναστασία Σταμπουλή 6

8 σημασιολογικού ιστού. Για ακόμη μια φορά κάποιοι θα υποστηρίξουν ότι αυτό καθιστά τις folksonomies άχρηστες για οποιοδήποτε άλλο λόγο εκτός της ανακάλυψης γνώσης. Για παράδειγμα ένας χρήστης μπορεί να μην θέλει να περιγράψει τις παραμέτρους κάποια υπηρεσία του ιστού χρησιμοποιώντας μια folksonomy διότι μια τέτοιους είδους υπηρεσία δεν γίνεται να βασιστεί σε εξαρτώμενες υπηρεσίες. Παρ όλο που οι σημασιολογίες είναι πολύ περισσότερο οι συλλογικές πράξεις ενός μεγάλου αριθμού ατόμων μπορούν επίσης να οδηγήσουν σε κάποια προκύπτουσα σημασιολογία. Επιπλέον τα δεδομένα στα συστήματα κοινωνικής σήμανσης συνοδεύονται και από ένα καινούργιο χαρακτηριστικό το οποίο είναι η ταυτότητα του χρήστη ο οποίος έχει συσχετίσει την συγκεκριμένη ετικέτα με ένα συγκεκριμένο αντικείμενο [Mika2006]. Στα πλαίσια του διαμοιρασμού(sharing) οι folksonomies έχουν μια πολύ περιορισμένη οπτική γωνία σε σχέση με τις οντολογίες. Λόγω του δυναμικού τους χαρακτήρα η αντιστοίχηση των folksonomies είναι μια δύσκολη αν όχι αδύνατη πρόκληση. Τη συγκεκριμένη χρονική στιγμή τα συστήματα σήμανσης αναπαριστούν μια τεράστια πηγή σημασιολογιών που δεν ξεπερνούν τα στενά όρια μιας ενός ιστοτόπου Web 2.0. Ακόμη και αν για παράδειγμα υπήρχε η δυνατότητα να προσδιοριστεί η σχέση μεταξύ της ετικέτας ruby στο del.icio.us και της ίδιας ετικέτας στο Flickr η αντιστοίχηση δεν θα ήταν μονοσήμαντη εξαιτίας της αμφισημίας των εννοιών. Επίσης σε μία folksonomy δεν υπάρχει διάκριση μεταξύ των ομωνύμων όρων. Αναφερόμαστε στην περίπτωση που προκύπτει όταν διάφοροι όροι εκφράζονται με την ίδια μορφή αλλά έχουν διαφορετική σημασία. Για παράδειγμα η Java είναι γλώσσα προγραμματισμού αλλά είναι και είδος καφέ καθώς και το όνομα ενός νησιού στο νοτιοανατολικό Ασιατικό αρχιπέλαγος της Ινδονησίας. Επίσης μπορεί να υπάρχουν λέξεις οι οποίες είναι συνώνυμες δηλαδή έχουν την ίδια σημασία αλλά γράφονται με διαφορετικό τρόπο όπως οι λέξεις beach και seaside. [Barnes2007]. Οπότε καταλήγουμε ότι οι folksonomies είναι ένα διαφορετικό είδος οντολογίας σε σχέση με το πιο επίσημο και σταθερά ελεγχόμενο λεξιλόγιο το οποίο χρησιμοποιείται από την κοινότητα του σημασιολογικού ιστού για το Web. Οι εφαρμογές τους είναι διαφορετικές οπότε θεωρείται σχετικά απίθανο να αντικαταστήσουν ή έστω να ανταγωνιστούν τις προσεγγίσεις που βασίζονται σε λογικές μεθοδολογίες. Παρ όλ αυτά οι folksonomies θα έχουν μελλοντικά μια σημαντική επίδραση στη συνειδητοποίηση του πραγματικού οράματος του σημασιολογικού ιστού ως επέκταση της τωρινής κατάστασης που επικρατεί στο Web. Ένας κύριος λόγος γι αυτό είναι ότι είναι η πρώτη φορά που η ενέργεια της παροχής γνώσης έχει πάρει ένα τέτοιο Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

9 χαρακτήρα που ο κάθε χρήστης είναι πρόθυμος να παρέχει πληροφορίες σε διάφορες εφαρμογές του ιστού σε μεγάλη κλίμακα [Vrandecic2006]. 1.3 Semantic Web και Web 2.0 Ο σημασιολογικός ιστός είναι ο ιστός για τις μηχανές αλλά η διαδικασία για τη δημιουργία και τη συντήρηση του αποτελεί κοινωνικό γεγονός. Σε αντίθεση με το γεγονός ότι οι μηχανές βοηθούν σε σημαντικό βαθμό στη διαχείριση συμβόλων σύμφωνα με προκαθορισμένους κανόνες μόνο οι χρήστες του σημασιολογικού ιστού έχουν την απαραίτητη ικανότητα ερμηνείας και συσχέτισης που οδηγεί στη δημιουργία και συντήρηση οντολογιών. Η δημιουργία οντολογιών έχει ως αναγκαία προϋπόθεση την κοινωνική παρουσία καθώς απαιτεί την ύπαρξη ενός ατόμου που θα προβλέπει με εγκυρότητα τον τρόπο με τον οποίο τα άλλα μέλη της κοινότητας θα ερμηνεύσουν τα σύμβολα μια οντολογίας βασιζόμενα σε περιορισμένη περιγραφή. Με την ενσωμάτωση της σημασιολογίας των όρων στην αρχιτεκτονική του ιστού έχουν καταστεί οι χρήστες του συστήματος σημαντικό κομμάτι του σχεδιασμού. Υπάρχει μία άποψη ότι ο σημασιολογικός ιστός αποτελείται από τρία επίπεδα τα οποία είναι το επίπεδο των κοινοτήτων και των συσχετισμών που υπάρχουν μεταξύ τους, το επίπεδο των σημασιολογιών που αφορά τις οντολογίες και τους συσχετισμούς που υπάρχουν μεταξύ τους και το επίπεδο των αντικειμένων όσον αφορά το περιεχόμενο τους (hypertext Web) [Mika2006]. Το σύνολο των τεχνολογιών και των σχεδιαστικών προτύπων που είναι γνωστά ως Web 2.0 έχουν μετατραπεί πλέον στον κύριο υποψήφιο που θα δρομολογήσει της μελλοντικές εξελίξεις του Ιστού. Οι ερευνητές συγκλίνουν προς αυτή την άποψη λόγω των προσδοκιών που έχουν για την μαζικά αυξανόμενη συμμετοχή και διαμοίρασης πόρων μεταξύ των χρηστών του ιστού. Συγχρόνως οι τεχνολογίες του σημασιολογικού ιστού εξελίσσονται και διαδίδονται και πλέον παρέχουν έναν σαφή τρόπο να εφαρμοστεί ένα βασικό επίπεδο επίσημης σημασιολογίας στην υποδομή και τις σελίδες του Ιστού. Χρησιμοποιώντας διαφορετικούς τρόπους τα πρότυπα του Web 2.0 και οι τεχνολογίες του σημασιολογικού ιστού εισάγουν την έννοια της κοινωνικής διαμοίρασης στον ιστό [Greaves2008]. Web 2.0 είναι ένας όρος που δημιουργήθηκε το 2004 από την O Reilly Media και αναφέρεται σε μια νέα γενιά υπηρεσιών που βασίζονται στο διαδίκτυο όπως για παράδειγμα είναι οι ιστότοποι κοινωνικής δικτύωσης (social networking sites), τα wikis, τα εργαλεία επικοινωνίας, και οι folksonomies (στις οποίες αναφερθήκαμε Διπλωματική εργασία-αναστασία Σταμπουλή 8

10 εκτενώς σε προηγούμενο κεφάλαιο). Αυτές οι υπηρεσίες βασίζονται κυρίως για την λειτουργία, την ανάπτυξη αλλά και την συντήρηση τους στην ηλεκτρονική συνέργεια και στην ανταλλαγή μεταξύ των χρηστών. Η O'Reilly Media, σε συνεργασία με την MediaLive International, χρησιμοποίησαν αυτή την φράση σαν τίτλο για μια σειρά από συνέδρια, και από το 2004 και μετά τεχνικοί και διαφημιστές έχουν υιοθετήσει αυτή την φράση κλειδί. Το ακριβές νόημά της παραμένει ανοιχτό προς αντιπαράθεση, και μερικοί ειδικοί, συμπεριλαμβανομένου και του Tim Berners Lee, έχουν αμφισβητήσει εάν ο όρος έχει κάποιο πραγματικό νόημα. Ο τελευταίος, συμπυκνωμένος ορισμός του Web 2.0, σύμφωνα με τον Tim O'Reilly είναι ο εξής: Το Web 2.0 είναι η εταιρική επανάσταση στην βιομηχανία των υπολογιστών που προκαλείται από την μετακίνηση στο διαδίκτυο σαν πλατφόρμα, και στην απόπειρα να καταλάβουμε τους κανόνες της επιτυχίας σε αυτή τη νέα πλατφόρμα. Βασικός κανόνας ανάμεσα σε αυτούς είναι ο εξής: Χτίσιμο εφαρμογών που καρπώνονται τις επιδράσεις των δικτύων και καλυτερεύουν όσο περισσότερο τις χρησιμοποιούν οι άνθρωποι.('εκμετάλλευση της συλλογικής νοημοσύνης') [O'Reilly2006]. Οι εφαρμογές του Web 2.0 συμβάλλουν στη δημιουργία κάποιου τύπου κοινώς χρησιμοποιούμενων σημασιολογιών όπως για παράδειγμα συμβαίνει στην περίπτωση της κοινότητας χρηστών που συνεισφέρουν σε κάποιο σύστημα σήμανσης (tagging system). Ωστόσο τα διαφορετικά συστήματα Web 2.0 είναι εντελώς ανεξάρτητα και δεν υπάρχει τρόπος ανταλλαγής πληροφοριών μεταξύ τους. Σε αυτή την περίπτωση το σημαντικό ερώτημα που προκύπτει είναι αν είναι δυνατόν οι τεχνικές του σημασιολογικού ιστού να χρησιμοποιηθούν για να βελτιώσουν ουσιωδώς την αξία που έχει ο απλός χρήστης στα κοινωνικά δίκτυα του Web 2.0 για παράδειγμα βοηθώντας να υπάρξει κάποια ένωση μεταξύ των διαφόρων κοινοτήτων αυτού του είδους. Επίσης πρέπει να διαπιστωθεί αν οι τεχνολογίες γέφυρας του σημασιολογικού ιστού (RDFa 6, GRDDL 7 και SPARQL 8 ) είναι επαρκείς για να μπορέσουν να ικανοποιήσουν τις σημασιολογικές ανάγκες των εφαρμογών του Web 2.0[Greaves2008]. Οι τεχνολογίες που αφορούν τον σημασιολογικό ιστό αρχικά σχεδιάστηκαν (πριν την ανάπτυξη των μεθόδων του Web 2.0) για την διαχείριση μεγάλης κλίμακας περιεχομένου προερχόμενο από χρήστες. Το ερώτημα είναι το πώς μπορούν να επηρεαστούν οι μέθοδοι του σημασιολογικού ιστού από το γεγονός ότι τα συστήματα σήμανσης, τα κοινωνικά δίκτυα, τα mashups και άλλες τεχνικές του Web 2.0 γίνονται 6 Resource Description Framework - in attributes, 7 Gleaning Resource Descriptions from Dialects of Languages, 8 SPARQL Protocol and RDF Query Language, Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

11 όλο και πιο δημοφιλείς σε όλο και περισσότερες ομάδες χρηστών του διαδικτύου. Δηλαδή αν είναι δυνατόν η επιτυχία των κοινωνικών, προσανατολισμένων σε συνεισφορές από των χρήστη μοντέλων του Web 2.0 να επηρεάσουν τον τρόπο με τον οποίο πρέπει να δημιουργούνται, να διαχειρίζονται και να διακινούνται τα δεδομένα του σημασιολογικού ιστού. Τα τελευταία χρόνια έχει καταστεί σαφές ότι αυτές οι δύο τεχνικές είναι φυσικά συμπληρώματα η μία της άλλης. Επιπλέον ο συνδυασμός των τεχνολογιών του σημασιολογικού ιστού με τις εφαρμογές του Web 2.0 θα οδηγήσουν στη γέννηση του Web 3.0 γνωστού και με τον όρο κοινωνικός σημασιολογικός ιστός (socialsemantic web) [Greaves2008]. 1.4 Πλεονεκτήματα και μειονεκτήματα STS Με τη χρήση ενός συγκεκριμένου λεξιλογίου ή έστω με την ύπαρξη κάποιου ελέγχου κατά τη διαδικασία επιλογής των λέξεων οδηγούμαστε στη χρήση συγκεκριμένων όρων και παρόμοιοι ή έστω συσχετιζόμενοι πόροι παρατίθενται έτσι ώστε να διευκολύνουν το χρήστη στην ανακάλυψη τους[macgregor2006]. Για να διασφαλιστεί και να συντηρηθεί η συνολική αποτελεσματικότητα του συστήματος ανάκτησης είναι απαραίτητο να εφαρμοστεί σε κάποιο βαθμό έλεγχος στην διαδικασία της δημιουργίας ευρετηρίου. Ελέγχοντας την συγκεκριμένη διαδικασία με τη χρήση ενός ελεγχόμενου λεξιλογίου οι όροι γίνονται πιο συγκεκριμένοι και όμοιοι ή συσχετιζόμενοι πόροι παρατίθενται με σκοπό την ευκολία ανακάλυψης τους από το χρήστη[lancaster1979]. Ένα ελεγχόμενο λεξιλόγιο διαφέρει στο γεγονός ότι γενικότερα ενσωματώνει μία μορφή σημασιολογικής και ιεραρχικής δομής. Αυτού του είδους η δομή και ο έλεγχος που ασκείται στο λεξιλόγιο συμβάλλει στον έλεγχο των συνώνυμων εννοιών εγκαθιδρύοντας τη χρήση ενός συγκεκριμένου όρου. Αυτό διασφαλίζει ότι θα χρησιμοποιηθούν οι ίδιοι όροι για την περιγραφή ίδιων ή παρόμοιων θεμάτων μειώνοντας με αυτό τον τρόπο την πιθανότητα σχετικές έννοιες να παραλειφθούν κατά τη διάρκεια μια αναζήτησης[macgregor2006]. Αν και αυτή η μέθοδος παρέχει πολλά οφέλη η υπεροχή των ελεγχόμενων λεξιλογίων έχει πρόσφατα απειληθεί από την εμφάνιση του φαινόμενου του χαρακτηρισμού με ετικέτες από χρήστες (collaborative tagging) το οποίο παρατηρείται σε ιστοτόπους όπως το del.icio.us: το CiteULike: το Flickr: κ.τ.λ. Αυτό το είδους χαρακτηρισμού αντικειμένων με ετικέτες από χρήστες των συγκεκριμένων ιστοτόπων προέκυψε ως Διπλωματική εργασία-αναστασία Σταμπουλή 10

12 ένα μέσο για την οργάνωση των πηγών πληροφορίας στο Web και είναι τελείως αντίθετο με τη φιλοσοφία της χρήσης ελεγχόμενου λεξιλογίου σε τέτοιου είδους διαδικασίες. Η χρήση του ελεγχόμενου λεξιλογίου από κοινού με την ευρύτερη δραστηριότητα δημιουργίας δεδομένων παραμένει μια εξειδικευμένη διαδικασία η οποία διεξάγεται σε κανονικές συνθήκες από άριστα εκπαιδευμένους επαγγελματίες. Τα συστήματα σήμανσης έχουν πολλά πλεονεκτήματα σε σχέση με τα παραδοσιακά προϊόντα λογισμικού αυτόματης τοποθέτησης και ταξινόμησης πόρων όπως είναι οι Web spiders των μηχανών αναζήτησης. Η ταξινόμηση με βάση τις ετικέτες στα συστήματα σήμανσης γίνεται από ανθρώπους οι οποίοι κατανοούν το θέμα σε αντίθεση με το οποιουδήποτε είδους λογισμικό το οποίο προσπαθεί αλγοριθμικά να καθορίσει την σημασία του πόρου. Αυτή η μέθοδος παρέχει σημασιολογικά ταξινομημένες ετικέτες [UBC2008]. Παρακάτω θα αναφερθούμε στα χαρακτηριστικά των folksonomies τα οποία μπορεί να θεωρηθούν ως πλεονεκτήματα. Ένα από τα πιο σημαντικά πλεονεκτήματα των folksonomies μπορεί να θεωρηθεί ο πολυδιάστατος χαρακτήρας τους. Οι χρήστες έχουν τη δυνατότητα να χρησιμοποιήσουν ένα μεγάλο αριθμό ετικετών για να εκφράσουν μία συγκεκριμένη έννοια και υπάρχει επίσης η δυνατότητα συνδυασμού αυτών. Οι χρήστες επίσης μπορούν να χρησιμοποιήσουν τη μητρική τους γλώσσα και οι λέξεις που θα χρησιμοποιήσουν μπορεί να έχουν καθαρά τοπικό χαρακτήρα. Οι χρήστες επιλέγουν έννοιες που έχουν νόημα για αυτούς και αναλύουν αντικείμενα προκειμένου να τονίσουν τι θεωρούν σημαντικό. Οι ετικέτες μπορούν να μοιραστούν ως γνώση μεταξύ των χρηστών και να δημιουργήσουν έναν μεγάλο όγκο πληροφοριών [Hayman2007]. Όπως δήλωσε και ο David Weinberger υπάρχουν εκατομμύρια ανθρώπων πλέον που δηλώνουν δημόσια της γνώμη τους σχετικά με τη σημασία σελίδων και εικόνων που υποπίπτουν στην αντίληψη τους. Οι πληροφορίες τέτοιου είδους θεωρούνται πλέον κρίσιμες γιατί μπορούν να χρησιμοποιηθούν για να δομηθούν νέες ιδέες και πληροφορίες. Τα πλεονεκτήματα της χρήσης ετικετών και γενικότερα της συμμετοχής σε κάποιο folksonomy επικαλύπτουν τα μειονεκτήματα που προκύπτουν. Εντούτοις είναι σημαντικό να είμαστε ενήμεροι σχετικά με κάποια συνηθισμένα προβλήματα που προκύπτουν από τη χρήση των εργαλείων του Web 2.0. Ένα από τα πιο κοινά προβλήματα που δημιουργούνται είναι η ύπαρξη ορθογραφικών λαθών σε κάποιες από τις ετικέτες. Το αποτέλεσμα είναι ένα μεγάλο μέρος πληροφορίας να μην μπορεί να δεχτεί την κατάλληλη επεξεργασία οπότε παραμένει ανεκμετάλλευτο[bell2007]. Ένα άλλο θέμα το οποίο προκύπτει είναι η απόφαση σχετικά με το που αναφέρεται το αντικείμενο στο οποίο τοποθετείται μια ετικέτα. Ο κάθε χρήστης έχει διαφορετική αντίληψη και την δική του οπτική γωνία για τα διάφορα θέματα που Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

13 διαβάζει. Οι ετικέτες που μπορεί να χαρακτηρίζουν ένα αντικείμενο είναι τις περισσότερες φορές άσχετες μεταξύ τους. Στερούνται ακρίβειας και δεν υπάρχει η ικανότητα να ελεγχθούν οι συνώνυμοι ή οι με κάποιο τρόπο συσχετιζόμενοι όροι. Τα σύνολα των ετικετών και οι folksonomies περιέχουν πολλές παραλλαγές ενικό ή πληθυντικό αριθμός, ορθογραφικά λάθη και σημειολογικά λάθη. Επίσης ένα φαινόμενο που παρατηρείται είναι ότι διάφορα εργαλεία λογισμικού τα οποία ασχολούνται με κοινωνικά δίκτυα χρησιμοποιούν διαφορετικές προσεγγίσεις σχετικά με τις ετικέτες που αποτελούνται από περισσότερες από μια λέξεις, καταλήγοντας με αυτό τον τρόπο σε ακόμα περισσότερες παραλλαγές Οι folksonomies στερούνται ιεραρχικών δομών. Το σύστημα το οποίο χρησιμοποιούν οι folksonomies στερείται ιεραρχικών σχέσεων και παρατηρείται έλλειψη κατηγοριών και υποκατηγοριών. Αυτή η έλλειψη ιεραρχικών δομών μπορεί να επηρεάσει με άμεσο τρόπο τα αποτελέσματα που προκύπτουν από τις διάφορες αναζητήσεις. Χωρίς ιεραρχικές δομές ή έλεγχο των συνώνυμων εννοιών θα παράγει αποτελέσματα μόνο για τον συγκεκριμένο όρο και δεν θα δώσει αποτελέσματα όσον αφορά τους συσχετιζόμενους όρους που είναι πιθανό να είναι σχετικές με τις ανάγκες και τους στόχους του χρήστη. Οι folksonomies δεν παρέχουν προτάσεις για σχετικά θέματα με τον όρο αναζήτησης όπως κάνουν τα κλασικά συστήματα που χρησιμοποιούνταν μέχρι τώρα[bell2007]. Συγκεντρώνοντας λοιπόν όλα όσα προαναφέραμε και προσθέτοντας και κάποια άλλα μειονεκτήματα των συστημάτων που βασίζονται σε ετικέτες καταλήγουμε στα εξής: Δεν υπάρχουν συγκεκριμένοι περιορισμοί για τη δομή των ετικετών π.χ. ενικόςπληθυντικός, κεφαλαία κ.τ.λ. Περιπτώσεις ορθογραφικών λαθών στις ετικέτες Ετικέτες με περισσότερες από μία σημασίες Ετικέτες που δεν έχουν σαφή σημασία εξαιτίας της ύπαρξη συνώνυμων λέξεων Ετικέτες ανορθόδοξου τύπου με εξαιρετικά προσωπικό χαρακτήρα και χωρίς ιεραρχικές σχέσεις μεταξύ των ετικετών. Για παράδειγμα οι ετικέτες cheese και cheddar δεν υπάρχει τρόπο να συνδεθούν σημασιολογικά μεταξύ τους καθώς το cheddar είναι μια πιο ειδική κατηγορία τυριού [UBC2008]. Τέλος το πιο σημαντικό μειονέκτημα των folksonomies είναι ότι ετικέτες που έχουν παραπάνω από μία σημασίες μπορεί να οδηγήσουν την αναζήτηση του χρήστη σε αποτελέσματα που καθόλου δεν συμβαδίζουν με τον αρχικό στόχο του. Οι ετικέτες οι οποίες έχουν έντονο προσωπικό χαρακτήρα είναι κατανοητές από μία μικρή μερίδα των χρηστών και όχι από το σύνολο[bell2007]. Διπλωματική εργασία-αναστασία Σταμπουλή 12

14 Συνολικά ο δημόσιος χαρακτηρισμός με ετικέτες αντικειμένων δεν υπόκειται σε κάποιον έλεγχο και οι διάφορες ετικέτες δεν συνδέονται μεταξύ τους με βάση κάποια δομή αναφοράς. Σε αντίθεση με τα παλιότερα συστήματα που χρησιμοποιούνταν για να συνδέουν συσχετιζόμενους όρους. Η δημιουργία ετικετών και ακολούθως ο χαρακτηρισμός κάποιου αντικειμένου με ετικέτες από χρήστες οι οποίοι δεν είναι ειδικοί στην διαχείριση πληροφοριών οδηγεί στα προβλήματα που περιγράψαμε παραπάνω. Εντούτοις υπάρχουν σαφώς μεγάλα οφέλη που προκύπτουν από τον χαρακτηρισμό αντικειμένων με ετικέτες από χρήστες. Αυτά τα οφέλη αναφέρονται ειδικότερα στη σχετικότητα και την ποικιλομορφία των όρων που χρησιμοποιούνται. Είναι σημαντικό να διατηρηθούν αυτά τα ποιοτικά χαρακτηριστικά σε σχέση με οποιαδήποτε προσπάθεια γίνει για τον έλεγχο των folksonomies[hayman2007]. Στον Πινακα εμφανίζονται συγκεντρωμένα τα πλεονεκτήματα και τα μειονεκτήματα των συστημάτων κοινωνικής σήμανσης τα οποία αναφέραμε πιο αναλυτικά στο παρόν κεφάλαιο: Πλεονεκτήματα Μέσο για την οργάνωση των πηγών πληροφορίας στο Web Η ταξινόμηση με βάση τις ετικέτες γίνεται από ανθρώπους,οι οποίοι κατανοούν το θέμα, και όχι από αλγορίθμους Χρήση μητρικής γλώσσας και λέξεων με τοπικό χαρακτήρα Δυνατότητα χρήσης μεγάλου αριθμού ετικετών για έκφραση μιας έννοιας Δυνατότητα συνδυασμού ετικετών Διαμοιρασμός γνώσης μεταξύ των χρηστών Δημιουργία μεγάλου όγκου πληροφοριών Ποικιλομορφία όρων που χρησιμοποιούνται λόγω της συμμετοχικής διαδικασίας χαρακτηρισμού αντικειμένων με ετικέτες Social Tagging Systems Μειονεκτήματα Περιπτώσεις ορθογραφικών λαθών στις ετικέτες με αποτέλεσμα μεγάλο μέρος της πληροφορίας να μην μπορεί να επεξεργαστεί Ο κάθε χρήστης έχει διαφορετική αντίληψη για διάφορα θέματα που διαβάζει οπότε μπορεί να προκύψουν παρερμηνείες στο νόημα των ετικετών Δεν υπάρχει η δυνατότητα ελέγχου συνώνυμων ή με κάποιο τρόπο συσχετιζόμενων όρων Δεν υπάρχουν συγκεκριμένοι περιορισμοί για τη δομή των ετικετών π.χ. ενικός-πληθυντικός, κεφαλαία κ.τ.λ έτσι όμοιοι όροι μεταξύ τους εμφανίζονται ως άσχετοι Ετικέτες που δεν έχουν σαφή σημασία εξαιτίας της ύπαρξη συνώνυμων λέξεων Ετικέτες με περισσότερες από μία σημασίες που μπορεί να προκαλέσουν σύγχυση στους απλούς χρήστες και λάθη στην επεξεργασία δεδομένων Ετικέτες οι οποίες έχουν έντονο προσωπικό χαρακτήρα είναι κατανοητές από μία μικρή μερίδα των χρηστών και όχι από το σύνολο Ετικέτες που αποτελούνται από περισσότερες από μια λέξεις υπόκεινται διαφορετική επεξεργασία από διάφορα εργαλεία λογισμικού οπότε και διαφορετικά αποτελέσματα Πίνακας 1 Πλεονεκτήματα και μειονεκτήματα συστημάτων κοινωνικής σήμανσης (social tagging systems) Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

15 Κεφάλαιο 2. Σύγκλιση STS με άλλες εφαρμογές Όπως διαπιστώσαμε στο προηγούμενο κεφάλαιο τα μειονεκτήματα των συστημάτων κοινωνικής σήμανσης μπορεί να οδηγήσουν σε λάθος πληροφόρηση των χρηστών και σε έναν τεράστιο όγκο πληροφοριών που είναι πολύ δύσκολο να το εκμεταλλευθεί ένας χρήστης για να αποκομίσει χρήσιμες πληροφορίες πάσης φύσεως. Αυτό συμβαίνει κυρίως λόγω της έλλειψης κάποιας μορφή ελέγχου για την ορθότητα των πληροφοριών που εισάγει ο κάθε χρήστης. Μια λύση σε αυτό το πρόβλημα είναι η χρησιμοποίηση πληροφοριών από διάφορες πηγές γνώσης του ιστού έτσι ώστε να προκύψουν καλύτερης ποιότητας αποτελέσματα σε οποιαδήποτε αναζήτηση διενεργεί ο χρήστης Wikis και Wikipedia Παρακάτω θα δοθεί ένας ορισμός της έννοιας του wiki που θα μας βοηθήσει να προχωρήσουμε στη μελέτη μας. Πρόκειται για ιστοσελίδες για τις οποίες υπάρχει η δυνατότητα προβολής και τροποποίησης από τον κάθε χρήστη ο οποίος διαθέτει ένα πλοηγό (browser) και διαθέτει πρόσβαση στο διαδίκτυο. Αυτό σημαίνει ότι ο οποιοσδήποτε επισκέπτης ενός wiki έχει τη δυνατότητα να αλλάξει το περιεχόμενο του αν το επιθυμεί. Διπλωματική εργασία-αναστασία Σταμπουλή 14

16 Τα wikis επιτρέπουν την ασύγχρονη επικοινωνία και την συνεργασία στα πλαίσια μιας ομάδας μέσω του διαδικτύου. Έχουν περιγραφεί με ποικίλους τρόπους στους οποίους συμπεριλαμβάνονται οι εξής: ένα σύστημα σύνθεσης, ένα μέσο συζήτησης, ένα σύστημα ηλεκτρονικής αλληλογραφίας και ένα εργαλείο το οποίο διευκολύνει τη συνεργασία. Τα Wikis παρέχουν στους χρήστες τη δυνατότητα συγγραφής αλλά και επεξεργασίας του κειμένου που ήδη υπάρχει. Η συνολική οργάνωση των συνεισφορών γνώσης πρέπει να υποστεί την κατάλληλη επεξεργασία όπως πρέπει να συμβεί και για το ίδιο το περιεχόμενο ενός wiki. Τα wikis έχουν τη δυνατότητα να ενσωματώνουν ήχους, ταινίες καθώς και εικόνες. Μπορεί να χρησιμοποιηθούν ως απλά εργαλεία για τη δημιουργία παρουσιάσεων που περιλαμβάνουν πολυμέσα καθώς και απλές ψηφιακές ιστορίες. Σύμφωνα με το TheWikiWay 9 η ελεύθερη επεξεργασία έχει κάποιες προφανείς συνέπειες στη χρήση των wikis. Το γεγονός ότι επιτρέπεται στον κοινό χρήστη να δημιουργήσουν ή να επεξεργαστούν οποιαδήποτε σελίδα στον ιστότοπο ενθαρρύνει τη δημοκρατική χρήση του ιστού και προωθεί το γεγονός της σύνθεσης περιεχομένου από μη ειδικούς χρήστες. Επειδή το περιβάλλον διεπαφής του χρήστης θεωρείται οικείο τα όρια που υπάρχουν για την τροποποίηση ενός wiki είναι ελάχιστα. Επιπλέον τα αποτελέσματα των ενεργειών των χρηστών στο περιεχόμενο της ιστοσελίδας είναι άμεσα ορατά στους υπόλοιπους χρήστες[eli2005]. Τα πρώτα wikis εμφανίστηκαν στα μέσα της δεκαετίας του 90. Οι επιστήμονες και οι μηχανικοί τα χρησιμοποιούσαν για να δημιουργήσουν δυναμικές γνωσιακές βάσεις. Το περιεχόμενο ενός wiki μπορούσε άμεσα και ευρέως να προβληθεί και να σχολιαστεί. Τα τελευταία χρόνια έχει προσαρμοστεί και μετατραπεί σε μία λειτουργική τεχνολογία και τα wikis χρησιμοποιούνται για μία μεγάλη ποικιλία δραστηριοτήτων στις οποίες απαιτείται συνεργασία [ELI2005]. Τα wikis προσφέρουν ένα εργαλείο επικοινωνίας το οποίο διευκολύνει τη συνεργασία μεταξύ των χρηστών για την ανάπτυξη ιστοτόπων συγκεκριμένου περιεχομένου. Επειδή τα wikis εξελίσσονται ως άμεσο αποτέλεσμα της προσθήκης υλικού από τους χρήστες στον ιστότοπο μπορούν να εξυπηρετήσουν ένα μεγάλο αριθμό παιδαγωγικών αναγκών. Τα άτομα τα οποία απασχολούνται στην εκπαιδευτική διαδικασία, οι μαθητές καθώς και ερασιτέχνες και επαγγελματίες(καλλιτέχνες, συγγραφείς και συλλέκτες) εντόπισαν μια τεράστια χρησιμότητα στα wikis στο να ενθαρρύνουν την ανάμιξη και το ενδιαφέρον στα θέματα που τους απασχολούν και τις δραστηριότητες τους. Από τη στιγμή που τα wikis βρίσκονται στο διαδίκτυο οι μαθητές μπορούν να έχουν πρόσβαση και να 9 Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

17 συμμετέχουν από όπου και αν βρίσκονται αρκεί να έχουν πρόσβαση στο διαδίκτυο.. [ELI2005]. Τα wikis έχουν γίνει δημοφιλή εργαλεία για συνεργασία χρηστών στον ιστό(web) και πολλές online κοινότητες ενσωματώνουν wikis με σκοπό την ανταλλαγή γνώσης. Για την πλειοψηφία των Wikis διαθέσιμες στο ευρύ κοινό ή όχι οι πρωταρχικοί στόχοι είναι η οργάνωση της γνώσης και η διαμοίραση αυτών των πληροφοριών. Η Wikipedia 10 είναι το πιο γνωστό παράδειγμα ενός wiki. Η Wikipedia είναι μία online εγκυκλοπαίδεια που δίνει τη δυνατότητα επεξεργασίας και προσθήκης περιεχομένου από τον κάθε χρήστη και είναι ιδιαιτέρως δημοφιλής ανάμεσα σε σπουδαστές. Η Wikipedia είναι η παγκοσμίως μεγαλύτερη πηγή εγκυκλοπαιδικής γνώσης η οποία βασίζεται σε συνεργατική επεξεργασία του περιεχομένου της. Σε αντίθεση με τη χρησιμότητα της το περιεχόμενο της είναι ελάχιστα δομημένο. Έχει ως σκοπό την δημιουργία μιας δωρεάν εγκυκλοπαίδειας σε πολλές γλώσσες στην δημιουργία της οποίας θα μπορεί να συμβάλλει ο κάθε χρήστης. Οι πληροφορίες όμως που περιέχονται στην Wikipedia είναι πολύ δύσκολο να χρησιμοποιηθούν από εξωτερικά εργαλεία[leuf2001]. Η χρήση της Wikipedia προς το παρόν περιορίζεται στο διάβασμα άρθρων διότι δεν υπάρχει κανένας τρόπος για να μπορέσει κάποιος να συλλέξει πληροφορίες οι οποίες είναι διάσπαρτες σε διάφορα άρθρα. Για παράδειγμα δεν υπάρχει κάποιος τρόπος έτσι ώστε αν θέλει κάποιος να ζητήσει μία λίστα από όλες τις ταινίες της δεκαετίας του 1960 που να είχανε Ιταλό σκηνοθέτη. Παρ όλ αυτά τα δεδομένα είναι δομημένα κατά μία έννοια (κάθε ταινία έχει το δικό της άρθρο και υπάρχουν links για ηθοποιούς και σκηνοθέτες ) αλλά το νόημα τους δεν είναι σαφές στον υπολογιστή καθώς δεν παρουσιάζονται με έναν πιο επίσημο τρόπο ο οποίος θα είναι επεξεργάσιμος από κάποια μηχανή [Völkel2006]. Η πρόσβαση για ανάγνωση του περιεχομένου της Wikipedia ελέγχεται μόνο σε σπάνιες περιπτώσεις. Αυτό που ενδιαφέρει κυρίως είναι η διαδικασία προσθήκης πληροφοριών στην Wikipedia. Οι συνολικές διεργασίες επεξεργασίας του περιεχομένου της δεν έχουν γίνει ακόμα πλήρως κατανοητές. Μία πρώτη ανάλυση διενεργήθηκε βρέθηκε ότι οι άνθρωποι που επιμελούνται το περιεχόμενο της Wikipedia χωρίζονται σε δύο γενικότερες κατηγορίες: το μεγαλύτερο μέρος της επεξεργασίας γίνεται από μία μικρή ομάδα που συνεισφέρουν συστηματικά στον εμπλουτισμό του περιεχομένου αν και το μεγαλύτερο μέρος του περιεχομένου προστίθεται από μία πολύ μεγαλύτερη ομάδα συγγραφέων[swartz2006] Διπλωματική εργασία-αναστασία Σταμπουλή 16

18 Η πρώτη ομάδα που αναφέραμε παρουσιάζει μεγαλύτερη εξειδίκευση και ενδιαφέρον για την Wikipedia και την λειτουργία της σαν σύνολο σε αντίθεση με την δεύτερη ομάδα που ενδιαφέρεται για ένα μικρό μέρος των άρθρων τα οποία συνήθως είναι σχετικά με την ειδικότητα τους. Όπως αναφέρεται και ο Swartz [Swartz2006] ένας εξωτερικός παράγοντας επεξεργάζεται ένα κομμάτι προσθέτοντας κάποιες πληροφορίες και μετά κάποιοι υπεύθυνοι επεξεργάζονται τα προστιθέμενα κομμάτια αναδιαμορφώνοντας τα. Επιπρόσθετα οι υπεύθυνοι ταξινομούν χιλιάδες από τα επεξεργασμένα κομμάτια κάνοντας πράγματα όπως το να αλλάξουν το όνομα μιας κατηγορίας σε ολόκληρο τον ιστότοπο (site). Πιο εκτεταμένες μελέτες απαιτούνται για να ξεκαθαριστεί η εικόνα σχετικά με την επεξεργασία των άρθρων στην Wikipedia αλλά αυτές οι πρώτες παρατηρήσεις υποδεικνύουν ότι βελτιώσεις στην δομή πραγματοποιούνται κυρίως από μία μικρή μερίδα αυτών που συνεισφέρουν στο χτίσιμο της ηλεκτρονικής αυτής εγκυκλοπαίδειας [Völkel2006]. Άλλη μια σημαντική άποψη κατηγοριοποίησης στην Wikipedia είναι οι συσχετισμένες με την εγκυκλοπαίδεια ροές εργασίας, οι οδηγίες και οι κανόνες. Τέτοιου είδους πολιτικές παίζουν ένα σημαντικό ρόλο στην δόμηση της Wikipedia όπως αναφέρουν και οι Viégas et al.[viégas2007]. Πιο συγκεκριμένα για τις κατηγορίες υπάρχουν λεπτομερείς οδηγίες σχετικά με τα κριτήρια που θα οδηγήσουν στην απόφαση για το αν μια κατηγορία είναι κατάλληλη και για το αν θα πρέπει να χρησιμοποιηθεί σε ένα συγκεκριμένο άρθρο. Οι πολιτικές που ακολουθούνται σχετικά με την κατηγοριοποίηση και η εφαρμογή τους είναι ένα θέμα υπό συζήτηση από μέλη της κοινότητας τα οποία ενδιαφέρονται για το σχετικό θέμα. Σημειώνεται επίσης ότι σύμφωνα με τις οδηγίες οι κατηγορίες πρέπει να θεωρούνται σαν ένας επιπλέον σχολιασμός με την έννοια ότι ο λόγος χρήσης τους πρέπει να είναι προφανής από το κείμενο του άρθρου [Völkel2006] DBpedia Η DBpedia 11 είναι μία προσπάθεια μιας ομάδας ανθρώπων να εξάγουν δομημένη πληροφορία από τη Wikipedia. Η προσπάθεια αυτή ξεκίνησε έτσι ώστε να μπορέσει αυτός ο τεράστιος όγκος πληροφοριών που περιλαμβάνονται στη Wikipedia να γίνει διαθέσιμος στο ευρύ κοινό και να μπορεί να επεξεργαστεί από υπολογιστικά συστήματα. Η Wikipedia δεν περιλαμβάνει δομημένες πληροφορίες εντούτοις υπάρχει μια υποτυπώδης δομή σε όλα τα άρθρα της. Αναφερόμαστε στα: 11 Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

19 Infobox Περιλήψεις άρθρων(abstract) Κατηγοριοποίηση των πληροφοριών Εικόνες Γεωγραφικές συντεταγμένες Σύνδεσμοι που υπάρχουν και οδηγούν σε εξωτερικές ιστοσελίδες -Σύνδεσμοι στα αντίστοιχα άρθρα άλλων γλωσσών Αυτό ο τεράστιος όγκος πληροφοριών( άτομα, τοποθεσίες, ταινίες κ.α.) αν εξαχθεί με κάποιο τρόπο και παρουσιαστεί σε δομημένη μορφή τότε θα μας δοθεί η δυνατότητα να πάρουμε απαντήσει σε σύνθετα ερωτήματα [Fadeel2008]. Στην Εικόνα 1 φαίνεται ο τρόπος με τον οποίο η DBpedia εξάγει δομημένες πληροφορίες από την Wikipedia καθώς και ο τρόπος με τον οποίο ο χρήστης μπορεί να ανακτήσει αυτές τις πληροφορίες και να τις χρησιμοποιήσει σε διάφορες εφαρμογές. Εικόνα 1 Διαδικασία εξαγωγής δομημένων πληροφοριών από τη Wikipedia μέσω του project της DBpedia [Lee2008] Στην Εικόνα 2 φαίνεται η μορφή που έχει ο σύνδεσμος για ένα άρθρο στην Wikipedia και η μορφή που έχει ο αντίστοιχος σύνδεσμος στην DBpedia. Διπλωματική εργασία-αναστασία Σταμπουλή 18

20 Εικόνα 2 Σύνδεση εννοιών της Wikipedia με τη DBpedia [Auer2008]. Όπως διαπιστώνουμε και από το παραπάνω σχήμα τα δεδομένα της DBpedia μπορούν να χαρακτηριστούν ως συνδεδεμένα δεδομένα καθώς οι βασικές αρχές των συνδεδεμένων δεδομένων(linked Data) είναι οι εξής: Χρησιμοποιούνται URIs ως ονόματα πραγμάτων. Χρησιμοποιούνται http URIs έτσι ώστε οι χρήστες να μπορούν να έχουν πρόσβαση σε αυτά τα δεδομένα. Όταν κάποιος χρήστης ψάχνει και βρίσκει τελικά ένα URI παρέχει σημαντικές πληροφορίες σε μορφή RDF 12. Περιλαμβάνονται δηλώσεις σε μορφή RDF οι οποίες συνδέονται με άλλα URIs έτσι ώστε ο χρήστης να μπορέσει να ανακαλύψει συσχετιζόμενες έννοιες [Bizer2008] Το όραμα του σημασιολογικού ιστού(semantic Web) είναι να φέρει τα πλεονεκτήματα των τεχνολογιών που σχετίζονται με τις σημασιολογίες σε ένα ευρύ κοινό. Μεγάλες γνωσιακές βάσεις όπως είναι η DBpedia, η YAGO 13 και άλλες δημιουργήθηκαν και είναι δωρεάν διαθέσιμες ως Linked Data and SPARQL endpoints. Αυτές οι γνωσιακές βάσεις βασίζονται σε πρότυπα που αφορούν την σημασιολογική αναπαράσταση γνώσης όπως είναι το RDF και η OWL. Σε αυτές τις 12 Resource Description Framework, Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

21 βάσεις περιγράφονται εκατομμύρια αντικείμενα και περιέχονται εκατοντάδες χιλιάδες ιδιότητες καθώς και κλάσεις. Εξαιτίας του μεγάλου μεγέθους αυτών των βάσεων οι χρήστες τους αντιμετωπίζουν το πρόβλημα ότι μπορούν με δυσκολία να γνωρίζουν ποια προσδιοριστικά στοιχεία χρησιμοποιούνται και είναι διαθέσιμα. Στις περισσότερες περιπτώσεις οι χρήστες δεν μπορούν να εκφράσουν τα ερωτήματα τους σε μία δομημένη μορφή όμως συχνά έχουν και περιορισμένη φαντασία σχετικά με το τι είδους αποτελέσματα μπορεί να προκύψουν. Ένας ιστορικός για παράδειγμα ο οποίος ψάχνει για αρχαίους Έλληνες φιλοσόφους οι οποίοι ήταν επηρεασμένοι από τον Πλάτωνα μπορεί με μεγάλη ευκολία να ονομάσει μερικά παραδείγματα και αν του παρουσιαστεί μία επιλογή με πιθανά αποτελέσματα είναι δυνατόν πολύ γρήγορα να εντοπίσει τα λανθασμένα αποτελέσματα. Όμως είναι πιθανόν να μην είναι ικανός να συντάξει με σωστό τρόπο ένα ερώτημα που θέλει να υποβάλει στην μεγάλη γνωσιακή βάση DBpedia. Το DBpedia Navigator [Lehmann2008] είναι μια εφαρμογή η οποία προσπαθεί να ξεπεράσει το συγκεκριμένο πρόβλημα και να διευκολύνει την εξερεύνηση και τα ερωτήματα που τίθενται σε μεγάλες γνωσιακές βάσεις δεδομένων. Δημιουργήθηκε ως διεπαφή για την DBpedia και τα σύνολα των δεδομένων τα οποία διασυνδέονται με αυτή αλλά μπορεί να χρησιμοποιηθεί επίσης σε συνδυασμό με αυθαίρετες μεγάλες γνωσιακές βάσεις δεδομένων οι οποίες είναι διαθέσιμες ως SPARQL endpoints. Τo DBpedia Navigator 14 χειρίζεται το θέμα το οποίο αναφέρεται παραπάνω χρησιμοποιώντας τεχνικές εκμάθησης μηχανών οι οποίες ακολουθούν τις υποδείξεις πλοήγησης του κάθε χρήστη. Επιπλέον παρέχει πολλά άλλα μέσα για να μπορέσει ο χρήστης να διερευνήσει τη γνωσιακή βάση δεδομένων DBpedia λαμβάνοντας υπόψη την ελλοχεύουσα σημασιολογία. Διάφορα projects του σημασιολογικού ιστού εκτός από την DBpedia είναι τα FOAF 15, Social Google Graph API s 16, Linked Data [Bizer2008], RDF Book Mashup [Bizer2007], flickr wrappr 17, GeoNames 18 κ.α. Στην παρακάτω εικόνα βλέπουμε ότι η DBpedia συνδέεται με πολλά από αυτά τα projects. Υπάρχουν και κάποια projects του σημασιολογικού ιστού τα οποία δεν συνδέονται άμεσα με τη DBpedia αλλά με έμμεσο τρόπο μέσω άλλων projects Διπλωματική εργασία-αναστασία Σταμπουλή 20

22 Εικόνα 3 Σύνδεση DBpedia με άλλα projects του σημασιολογικού ιστού [Auer2008]. Στην Εικόνα 4 η DBpedia απεικονίζεται ως σημείου εισόδου γεωγραφικών δεδομένων στις γενικότερες πηγές δεδομένων που υπάρχουν στον παγκόσμιο ιστό[becker2009]: Εικόνα 4 Η DBpedia ως σημείου εισόδου γεωγραφικών δεδομένων στις πηγές δεδομένων του παγκόσμιο ιστό[becker2009]. Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

23 Το project της DBpedia επικεντρώνεται στο θέμα της μετατροπής του περιεχομένου της Wikipedia σε πληροφορίες δομημένης μορφής έτσι ώστε οι τεχνικές του σημασιολογικού ιστού να μπορούν να εφαρμοστούν σε αυτές θέτοντας πολύπλοκα ερωτήματα προς την Wikipedia, συνδέοντας τα με άλλα σύνολα δεδομένων στο Web ή δημιουργώντας νέες εφαρμογές ή mashups. Το έργο το οποίο ουσιαστικά επιτελεί η DBpedia είναι το εξής: μετατρέπει το περιεχόμενο της Wikipedia σε μορφή RDF παρέχει το περιεχόμενο της Wikipedia ως ένα σύνολο δεδομένων σε μορφή RDF το οποίο μπορεί να χρησιμοποιηθεί σε μια μεγάλη ποικιλία εφαρμογών του σημασιολογικού ιστού συνδέει το σύνολο των δεδομένων της DBpedia με άλλα σύνολα δεδομένων ανάπτυξη ενός συνόλου διεπαφών έτσι ώστε να υπάρχει πρόσβαση στο σύνολο των δεδομένων μέσω υπηρεσιών του ιστού και να επιτυγχάνεται η διασύνδεση τους και με άλλους ιστοτόπους. Τα σύνολα δεδομένων της DBpedia μπορούν να ενσωματωθούν σε τρίτες εφαρμογές. Υπάρχει η δυνατότητα να έχει κάποιος πρόσβαση σε αυτά χρησιμοποιώντας μια ποικιλία διεπαφών χρήστη της DBpedia. Στην Εικόνα 5 παρουσιάζονται τα βασικά στοιχεία που συνθέτουν την DBpedia. Δίνεται ουσιαστικά μια εικονική περιγραφή της διαδικασίας εξαγωγής πληροφοριών και τον τρόπο δημοσίευσης των δεδομένων αυτών στον ιστό. Οι κύριες διεπαφές της DBpedia χρησιμοποιούν το Virtuoso DBMS και την MySQL [Auer2008]. Εικόνα 5 Γενική επισκόπηση των συστατικών μερών της DBpedia [Auer2008]. Διπλωματική εργασία-αναστασία Σταμπουλή 22

24 2.3. Mashups Αποτελούν βασικό συστατικό του Web 2.0. Είναι η ικανότητα συνδυασμού δεδομένων διαφορετικών ιστοτόπων, με στόχο τη δημιουργία μιας καινούργιας πηγής γνώσης που να έχει ένα συγκεκριμένο νόημα. Το εξαγόμενο προϊόν μπορεί να απευθύνεται στον καθένα ατομικά και σε άλλους ανθρώπους που θα έχουν την ίδια αντίληψη και αισθητική σε κάποιον συγκεκριμένο τομέα. Αναφέρονται ως σύνθετοι ιστότοποι από κάποιους, ενώ από άλλους αναφέρονται με τον όρο Mashup. Ουσιαστικά πρόκειται για συνδυασμό δεδομένων που βρίσκονται στον παγκόσμιο ιστό μέσω κάποιας διαδικασίας αποκωδικοποίησης. Τα Mashups έχουν πρόσφατα κερδίσει ιδιαίτερη προσοχή εξαιτίας της δημιουργικότητας που εμπεριέχει η ανάπτυξη τους και η λειτουργικότητα όσον αφορά τους χρήστες. Αν θεωρήσουμε ότι το διαδίκτυο αποτελείται από κάποιο επίπεδα (το φυσικό το οποίο αναφέρεται στον φυσικό εξοπλισμό, το λογικό το οποίο αφορά ότι έχει να κάνει με τα πρωτόκολλα επικοινωνίας, αυτό που αφορά το περιεχόμενο και το κοινωνικό) τα mashups κατατάσσονται ανάμεσα στα επίπεδα που αφορούν το περιεχόμενο και τα κοινωνικά επίπεδα[palfrey2007]. Με αυτό τον τρόπο τα mashups επιτυγχάνουν να αλλάξουν τον τρόπο που τα άτομα σχετίζονται με το περιεχόμενο. Στο παρακάτω σχήμα απεικονίζονται γραφικά τα επίπεδα που υπάρχουν καθώς και το που ακριβώς μπορεί να τοποθετηθούν τα mashups ως προς τα συγκεκριμένα επίπεδα. Εικόνα 6 Επίπεδα διαδικτύου και τοποθέτηση mashups[palfrey2007]. Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

25 Τα mashups βασίζονται στο λογικό επίπεδο για να μπορέσουν να υποστηρίξουν την ανταλλαγή μηνυμάτων. Τα δεδομένα προέρχονται από το επίπεδο που αφορά το περιεχόμενο πράγμα το οποίο υποβοηθείται από το API και το τελικό προϊόν επηρεάζει τις κοινωνικές αλληλεπιδράσεις στον ιστό. Οι πηγές των δεδομένων προέρχονται από μία ευρεία γκάμα περιεχομένου που υπάρχει στον ιστό στις οποίες συμπεριλαμβάνονται APIS, στατιστικά, χάρτες, RSS feeds και διαφημίσεις. Το περιεχόμενο το οποίο υπάρχει σε ένα mashup μπορεί να προέλθει από την εφαρμογή μιας διαδικασίας που ονομάζεται screen scraping στην οποία δεν υπάρχει κάποιο API απλά ένα πρόγραμμα υπολογιστή εξερευνεί έναν ιστότοπο χρησιμοποιώντας κώδικα και συλλέγει πληροφορίες σε μία μορφή στην οποία ο προγραμματιστής μπορεί να τα χρησιμοποιήσει για την ανάπτυξη του mashup. Πολλά άτομα πειραματίζονται με mashups χρησιμοποιώντας τη Microsoft, το Google, το ebay,το Amazon, το Flickr, το Facebook και τα APIs του Yahoo[Palfrey2007]. Ο απλός χρήστης μόλις τα τελευταία χρόνια έχει ξεκινήσει να εκμεταλλεύεται τις υπηρεσίες του ιστού με έναν τρόπο που προσεγγίζει περισσότερο τις καθημερινές του δραστηριότητες. Ενώ η σύνθεση επιχειρησιακής διαδικασίας δεν αποτελεί απαραίτητη δράση για τον απλό χρήστη η ένταξη των αποτελεσμάτων που προκύπτουν σε ένα κοινό πλαίσιο μπορεί να είναι γεγονός βαρύνουσας σημασίας. Με τον όρο service mashup εννοούμε την παράλληλη εκτέλεση δύο ή περισσότερων υπηρεσιών για τη δημιουργία ενός ολοκληρωμένου εργαλείου το οποίο θα παρέχει μία πιο πλήρη περιγραφή σχετικά με ένα αντικείμενο ή ένα χαρακτηριστικό[blake2008]. Στον τομέα του web development με τον όρο mashup ορίζουμε μια εφαρμογή του ιστού η οποία συνδυάζει δεδομένα που προέρχονται από περισσότερες από μία πηγές σε ένα μόνο ολοκληρωμένο εργαλείο. Ο όρος mashup υπονοεί εύκολη και γρήγορη ενσωμάτωση η οποία πραγματοποιείται σε μεγάλη συχνότητα με πρόσβαση σε APIs και πηγές δεδομένων με σκοπό την παραγωγή αποτελεσμάτων τα οποία οι ιδιοκτήτες των δεδομένων δεν θα μπορούσαν να φανταστούν ότι θα παραχθούν. Οι δημιουργοί των mashups παίρνουν με δυναμικό τρόπο δεδομένα από τη μία πηγή και τα ενσωματώνουν σε μια άλλη εφαρμογή. Ως ένα απλό παράδειγμα αναφέρουμε τους Fast Food Maps οι οποίοι συνδυάζουν πληροφορίες για τοποθεσίες στις οποίες βρίσκονται βασικά εστιατόρια με fast food στις Ηνωμένες Πολιτείες με τους Google Maps. Με αυτό τον τρόπο οι κάτοικοι μιας συγκεκριμένης πόλης μπορούν να ξέρουν που έχουν τη δυνατότητα να βρούνε ένα τέτοιου είδους εστιατόριο. Ένα άλλο παράδειγμα είναι η χρήση χαρτογραφικών δεδομένων με πηγή τους Google Maps για την προσθήκη πληροφοριών σχετικά με την τοποθεσία σε κτηματομεσιτικά δεδομένα. Με αυτό τον τρόπο δημιουργήθηκε μία καινούργια και διακριτή Διπλωματική εργασία-αναστασία Σταμπουλή 24

26 διαδικτυακή υπηρεσία η οποία δεν μπορούσε αρχικά να παρασχεθεί από καμία πηγή. Οι υπηρεσίες που παρέχει ο ιστός υπάρχουν εδώ και αρκετό καιρό πλέον. Οι υπηρεσίες του ιστού και πιο συγκεκριμένα τα mashups είναι μια περιοχή εξαιρετικής καινοτομίας. Αυτή η καινοτομία καθιερώνεται μέσω νέων επιχειρηματικών μοντέλων, νέες τεχνολογίες και νέους έξυπνους τρόπους για να χρησιμοποιείς και να μοιράζεσαι δεδομένα στον ιστό. Είναι επίσης μια περιοχή στην οποία η διαλειτουργικότητα είναι το βασικό θέμα. Πιο συγκεκριμένα είναι η γενικότερη ιδέα ότι οι άνθρωποι, τα δεδομένα και ο κώδικας μπορούν να αλληλεπιδράσουν με άλλους ανθρώπους, δεδομένα και κώδικα και αυτό αποτελεί την αφετηρία για αυτό το είδος των υπηρεσιών ή αλλιώς την βασική φιλοσοφία. Η διαλειτουργικότητα στο πλαίσιο του mashup μπορεί να οριστεί με ευρεία έννοια έτσι ώστε να είναι εύκολο να συζητηθούν όλες οι σχετικές εφαρμογές που αφορούν τον όρο αλλά βάζοντας κάποια όρια προκειμένου να μη χαθεί το νόημα και η αξία του όρου. Επιλέγουμε την έννοια του όρου στην οποία η διαλειτουργικότητα του mashup είναι ουσιαστικά ο συνδυασμός των συμβατών τεχνολογιών, των υπηρεσιών του ιστού και των δεδομένων που παρέχονται από τους διάφορους ιστοτόπους που επιτρέπουν στους υπεύθυνους για την ανάπτυξη να οδηγηθούν στη δημιουργία mashups [Palfrey2007]. Παρακάτω θα αναφέρουμε κάποια από τα βασικά mashups που έχουν δημιουργηθεί τα τελευταία χρόνια έτσι ώστε να μπορέσουμε να έχουμε μια καλύτερη εικόνα σχετικά με το φαινόμενο αυτό το οποίο θεωρείται ότι θα αποτελέσει το μέλλον του παγκόσμιου ιστού. Κυρίως επικεντρωθήκαμε σε Mashups τα οποία χρησιμοποιούν την Wikipedia, την DBpedia και το Flickr καθώς σχετίζονται άμεσα και με τη δική μας δουλειά Wikipedia Mashups Wikipedia Vision 19 Εμφάνιση σε πραγματικό χρόνο ανώνυμων εισόδων στη Wikipedia σε σχέση με τοποθεσίες και τη θέση τους στο Google Maps. Είναι διαθέσιμο στα Αγγλικά, Γερμανικά, Γαλλικά και Ισπανικά Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

27 Εικόνα 7 Διεπαφή Wikipedia Vision Flickr Mashups Παρατηρήσαμε ότι υπάρχουν αρκετά mashups τα οποία έχουν δομηθεί πάνω στο API του Flickr. Αυτό δεν συμβαίνει διότι το Flickr API είναι το μόνο API που υπάρχει για διαχείριση φωτογραφιών αλλά διότι παρέχει ένα συνδυασμό υπηρεσιών που μπορεί να χρησιμοποιηθούν σε πολλές εφαρμογές και έναν μεγάλο όγκο δεδομένων [Musser2007]. Flickr Wrappr 20 Χρησιμοποιεί το API της DBpedia και για κάθε μία από τις θεματικές ενότητες της DBpedia(υπολογίζονται γύρω στις 1.95 εκατομμύρια) παράγει μία συλλογή φωτογραφιών που προέρχονται από το Flickr και απεικονίζουν τη συγκεκριμένη θεματική ενότητα χρησιμοποιώντας ετικέτες σε διάφορες γλώσσες και γεωγραφικές συντεταγμένες οι οποίες παρέχονται από την Wikipedia. Δηλαδή συνδυάζει γεωγραφικές τοποθεσίες με ετικέτες από το Flickr και την Wikipedia προκειμένου να αντλήσει φωτογραφίες που σχετίζονται άμεσα με το αντικείμενο της αναζήτησης. Εικόνα 8 Παράδειγμα αποτελεσμάτων αναζήτησης μέσω Flickr Wrappr[Becker2007] 20 Διπλωματική εργασία-αναστασία Σταμπουλή 26

28 Flickr Mania 21 Μία μηχανή αναζήτησης του Flickr που επιτρέπει επίσης τον χαρακτηρισμό των φωτογραφιών του Flickr με ετικέτες που περιλαμβάνουν γεωγραφικές συντεταγμένες μέσω ενός GPS track file. To GPS track file αποτελεί μία λίστα με διαδοχικές γεωγραφικές συντεταγμένες που δημιουργείται καθώς μία μονάδα GPS βρίσκεται ενσωματωμένη σε ένα ποδήλατο. Κάθε στοιχείο της λίστας αντιστοιχεί σε ένα σημείο στον τρισδιάστατο χώρο και περιλαμβάνει γεωγραφικό πλάτος, μήκος και την ανύψωση. Εικόνα 9 Διεπαφή Flick Mania Flickr Fight 22 Συγκρίνει τα αποτελέσματα που προκύπτουν για μια εικόνα του Flickr για δύο λέξεις κλειδιά που συναγωνίζονται μεταξύ τους. Εικόνα 10 Διεπαφή Flickr Fight Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

29 Feelimage 23 Αποτελέσματα εικόνων που προέρχονται από το Flickr, το Zorg 24 και το PhotoCorpus και προκύπτουν μετά τη χρήση λέξεων συναισθημάτων ως λέξεις κλειδιά για την αναζήτηση. Εικόνα 11 Διεπαφή Feelimage Semapedia 25 Ο στόχος της Semapedia είναι να συνδέσει τον εικονικό και φυσικό κόσμο συνδέοντας πληροφορίες που βρίσκονται στο διαδίκτυο με φυσικές τοποθεσίες. Οι τεχνολογίες που χρησιμοποιούνται είναι η Wikipedia, τα Google Maps και το Flickr. Εικόνα 12 Διεπαφή Semapedia InSuggest 26 Το συγκεκριμένο mashup επιτρέπει στους χρήστες να αναζητήσουν με συγκεκριμένο σκοπό ή τυχαία εικόνες που βρίσκονται στο Flickr. Ο χρήστης επιλέγει ένα ζεύγος εικόνων που του αρέσει και λαμβάνει άμεσα συστάσεις για εικόνες από ανθρώπους που έχουν παρόμοια αισθητική. Η διεπαφή του mashup είναι εξαιρετικά φιλική προς το χρήστη Διπλωματική εργασία-αναστασία Σταμπουλή 28

30 Εικόνα 13 Διεπαφή InSuggest Flicktionary 27 Πρόκειται για ένα mashup που συνδυάζει το Flickr με κάποιο είδος παιχνιδιών. Ο χρήστης προσπαθεί να μαντέψει πως οι φωτογραφίες που του παρουσιάζονται σχετίζονται μεταξύ τους έχοντας και κάποιον συγκεκριμένο χρονικό περιορισμό. Εικόνα 14 Διεπαφή Flicktionary DBpedia mashups DBpedia Mobile Το DBpedia Mobile[Becker2008] εντοπίζει στο χάρτη τοποθεσίες που υπάρχουν στη DBpedia και δίνει στον χρήστη τη δυνατότητα να εξερευνήσει σχετικές πληροφορίες που υπάρχουν για αυτά τα μέρη στην DBpedia καθώς και σε άλλα συνδεδεμένα με την DBpedia σύνολα δεδομένων π.χ. GeoNames, Revyu 28, EuroStat 29 και Flickr. Υποστηρίζει 14 γλώσσες και διάφορα φίλτρα για την επιστροφή των αποτελεσμάτων με τη μεγαλύτερη σχετικότητα. Οι τεχνολογίες που χρησιμοποιούνται είναι η DBpedia και τα Google Maps Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

31 Εικόνα 15 DBpedia Mobile Gwannon 30 Καθορισμός της τοποθεσίας των πελάγων. Πρόκειται για ένα Mashup το οποίο συνδυάζει πληροφορίες από το Flickr, το WeatherBug 31, την DBpedia, το Twitter 32, Google Chart 33 και τα Google Maps 34. Εικόνα 16 Διεπαφή Gwannon Από όλα τα mashups τα οποία αναφέραμε θα κάνουμε μια ιδιαίτερη αναφορά στο Flickr Wrappr καθώς είναι ένα mashup το οποίο συνδυάζει γνώση από την DBpedia και το Flickr δηλαδή τις δύο πηγές πληροφοριών τις οποίες χρησιμοποιήσαμε και εμείς για να υλοποιήσουμε το δικό μας mashup. Ο Christian Becker δήλωσε τον Οκτώβριο του 2007 στο beckr.org ότι έκανε μια σημαντική προσθήκη στο project της DBpedia η οποία να υποστηρίζει γεωγραφικές συντεταγμένες. Την συγκεκριμένη προσθήκη την ονόμασε Flickr Wrappr της οποίας η χρησιμότητα είναι να παρέχει φωτογραφίες για ένα συγκεκριμένο άρθρο της Wikipedia με τη βοήθεια γεωγραφικών συντεταγμένων και ετικετών που είναι διαθέσιμες σε πολλές γλώσσες. Το πλεονέκτημα της συγκεκριμένης δουλειάς είναι ότι αποτελεί ένα αποδοτικό και ακριβή τρόπο για την εύρεση μιας εικόνας που αναφέρεται σε μια έννοια. Το Flickr Wrappr είναι πλέον μέρος του W3C SWEO Linking Open Data community project code.google.com/apis/chart/ 34 Διπλωματική εργασία-αναστασία Σταμπουλή 30

32 Το Flickr Wrappr συνδυάζει γεωγραφικές τοποθεσίες και τις αντιστοιχίζει σε ετικέτες από το Flickr και τη Wikipedia με σκοπό την ανάκτηση εικόνων από το Flickr οι οποίες να έχουν υψηλό συσχετισμό με την έννοια για την οποία διενεργεί συγκεκριμένη αναζήτηση ο χρήστης. Η DBpedia εξάγει δομημένες πληροφορίες από την Wikipedia και τις κάνει διαθέσιμες στο ευρύ κοινό σε μορφή RDF. Αυτό το γεγονός δίνει τη δυνατότητα να τεθούν πολύ σημαντικά και πολύπλοκα ερωτήματα (queries) στα δεδομένα της Wikipedia π.χ. ένας παίχτης ποδοσφαίρου με αριθμό φανέλα 11 ο οποίος παίζει σε μία ομάδα η οποία έχει στάδιο χωρητικότητας άνω των θέσεων και έχει γεννηθεί σε χώρα η οποία έχει πάνω από 10 εκατομμύρια κατοίκους. Το flickr wrappr υλοποιείται σαν ένα μικρό PHP script (250 γραμμές κώδικα περίπου). Όποτε το script καλείται για κάποια είσοδο στην Wikipedia θέτει ένα ερώτημα στο SPARQL endpoint της Wikipedia σχετικά με ετικέτες σε διάφορες γλώσσες και γεωγραφικές συντεταγμένες. Αυτές οι πληροφορίες παρέχονται στο API του Flickr Search και τα αποτελέσματα παράγονται σε μορφή RDF χρησιμοποιώντας foaf:depiction συσχετισμούς. Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

33 Κεφάλαιο 3. Τεχνολογίες και υλοποίηση σύγκλισης Σε αυτή την εργασία θα περιγραφεί η σύγκλιση δύο πηγών γνώσης της DBpedia και του ιστοτόπου Flickr με σκοπό την παραγωγή αποτελεσμάτων που θα παρέχουν καλύτερης ποιότητας πληροφορίες στο χρήστη. Όπως αναφέραμε και σε προηγούμενο κεφάλαιο η DBpedia είναι ένα project που ως στόχο του έχει την εξόρυξη δομημένων πληροφοριών από τη Wikipedia με σκοπό την επεξεργασία των δεδομένων. Το Flickr είναι ένας ιστότοπος στον οποίο οι χρήστες-μέλη του έχουν τη δυνατότητα να μοιράζονται με τους υπόλοιπους χρήστες φωτογραφίες καθώς και να τις χαρακτηρίζουν με ετικέτες. Σε αυτό το κεφάλαιο θα αναφερθούμε στα εργαλεία που χρησιμοποιήθηκαν για την υλοποίηση της σύγκλισης καθώς και σε κάποιες θεωρητικές λεπτομέρειες που θα βοηθήσουν τον αναγνώστη να κατανοήσει την υλοποίηση μας Εργαλεία Παρακάτω περιγράφονται τα βασικά εργαλεία τα οποία χρησιμοποιήθηκαν για να υλοποιηθεί το mashup μεταξύ της DBpedia και του Flickr προκειμένου ο χρήστης αναλόγως με την αναζήτηση που θέλει να κάνει να του επιστρέφονται αποτελέσματα με υψηλή σχετικότητα. Διπλωματική εργασία-αναστασία Σταμπουλή 32

34 SPARQL Η SPARQL είναι μία γλώσσα με την οποία ο χρήστης θέτει ερωτήματα και αποτελεί επίσης ένα πρωτόκολλο πρόσβασης δεδομένων για τον σημασιολογικό ιστό(semantic Web). Η SPARQL ορίζεται στα πλαίσια του μοντέλου δεδομένων W3C RDF και λειτουργεί για κάθε πηγή δεδομένων που μπορεί να διαμορφωθεί σε RDF. Το specification είναι υπό ανάπτυξη από το RDF Data Access Working Group (DAWG) ( [Dodds2005]. Σε αυτό το σημείο ανάπτυξης του specification οι υπεύθυνοι για την ανάπτυξή του έχουν τη δυνατότητα να ξεκινήσουν να εξερευνούν τις δυνατότητες του. Το γεγονός το οποίο δείχνει ότι η διερεύνηση μπορεί να γίνει σε πρακτικό επίπεδο και όχι μόνο σε θεωρητικό είναι η διαθεσιμότητα διάφορων μηχανών στις οποίες ο κάθε χρήστης μπορεί να θέσει ερωτήματα διατυπωμένα σε SPARQL. Η δομή δεδομένων RDF είχε για αρκετό χρονικό διάστημα την ανάγκη μίας γλώσσας υποβολής ερωτημάτων έτσι ώστε να μπορεί να γίνεται εξόρυξη δεδομένων τα οποία βρίσκονται στην συγκεκριμένη μορφή. Ως εκ τούτου η ανάπτυξη της SPARQL θα έχει ως αποτέλεσμα να διευκολυνθούν πολλές εργασίες ανάπτυξης. Η SPARQL η οποία αποτελεί ταυτόχρονα μία γλώσσα με την οποία ο χρήστης θέτει ερωτήματα σε πηγές δεδομένων που βρίσκονται σε μορφή RDF καθώς και ένα πρωτόκολλο πρόσβασης δεδομένων έχει τη δυνατότητα να αποτελεί βασικό στοιχείο των εφαρμογών του Web 2.0. Αυτό συμβαίνει διότι αποτελεί ένα πρότυπο το οποίο ενισχύεται από μία αρκετά ευέλικτη μορφή δεδομένων και ως εκ τούτου μπορεί να παρέχει ένα μηχανισμό υποβολής ερωτημάτων για όλες τις εφαρμογές του Web 2.0. Η SPARQL επίσης μπορεί να αποτελέσει αντικείμενο ενδιαφέροντος για τα άτομα τα οποία είναι υπεύθυνα για τη διερεύνηση των πιθανών επιλογών για τη δημοσίευση δεδομένων στον ιστό [Clark2005]. Εντούτοις η SPARQL απευθύνεται σε πολύ πιο ευρύ κοινό από αυτό το οποίο έχει υπονοηθεί μέχρι τώρα. Μία πολύ σημαντική οπτική γωνία της ιδέας του Web 2.0 είναι η δυνατότητα να εξάγονται και να ζητούνται πληροφορίες από πολλές διαφορετικές εφαρμογές, υπηρεσίες ή αποθήκες δεδομένων. Αυτή η δυνατότητα που υπάρχει να διακινούνται πληροφορίες μεταξύ πολλών διαφορετικών πηγών δεδομένων είναι το κλειδί στην έννοια του mashup που παρουσιάστηκε ως ιδέα στο Web 2.0. Μερικά παραδείγματα τέτοιων εφαρμογών είναι τα Google Maps, το ebay, το Flickr και πολλά άλλα[dodds2005]. Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

35 RDF Πολλά έχουν γραφτεί για το Σημασιολογικό Ιστό, σαν να είναι τεχνολογία που θα αντικαταστήσει τον Παγκόσμιο Ιστό που γνωρίζουμε σήμερα. Στην πραγματικότητα, αναφέρει ο Eric Miller, Επικεφαλής της Δραστηριότητας του Σημασιολογικού Ιστού του W3C, είναι περισσότερο εξέλιξη του Παγκόσμιου Ιστού παρά επανάσταση. Ο Σημασιολογικός Ιστός προκύπτει από μικρές αλλαγές, φέρνοντας περιγραφές που μπορούν να διαβάσουν μηχανές, στα δεδομένα και έγγραφα που ήδη υπάρχουν στον Παγκόσμιο Ιστό. Τα XML, RDF και OWL επιτρέπουν να γίνει ο Παγκόσμιος Ιστός μια παγκόσμια υποδομή για την κοινή χρήση εγγράφων και δεδομένων, που κάνει την αναζήτηση και επαναχρησιμοποίηση της πληροφορίας ευκολότερη αλλά και πιο αξιόπιστη [Miller1998]. Το RDF το Πλαίσιο Περιγραφής Πόρων(Resource Description Framework) αποτελεί πρότυπο τρόπο για να γίνουν απλές περιγραφές. Αυτό που είναι η XML για το συντακτικό, το RDF είναι για τη σημασιολογία ένα ξεκάθαρο σύνολο κανόνων για την παροχή απλής περιγραφικής πληροφορίας. Το RDF Schema τότε, παρέχει ένα τρόπο ώστε αυτές οι περιγραφές να μπορούν να συνδυαστούν σε ένα μοναδικό λεξιλόγιο. Το RDF ενσωματώνεται σε ποικιλία εφαρμογών συμπεριλαμβανομένων των: κατάλογοι βιβλιοθηκών παγκόσμιοι κατάλογοι δημοσίευση και συλλογή νέων, λογισμικού και περιεχομένου προσωπικές συλλογές μουσικής, φωτογραφιών και εκδηλώσεων Το RDF είναι μέρος μιας μεγάλης προόδου στη δύναμη του Παγκοσμίου Ιστού. Ουσιαστικά, θα δούμε τους χρήστες και τις εφαρμογές να συνδυάζουν τις Διπλωματική εργασία-αναστασία Σταμπουλή 34

36 πληροφορίες που αναπαρίστανται με RDF από διάφορες πηγές στον Παγκόσμιο Ιστό, με τρόπους που μέχρι τώρα δεν είχαν καν συλληφθεί, εξηγεί ο Brian McBride, Πρόεδρος της Ομάδας Εργασίας RDF Core 35, Η Ομάδα Εργασίας RDF Core έχει μετατρέψει τις προδιαγραφές του RDF σε πρακτικό αλλά και μαθηματικά ακριβές υπόβαθρο, πάνω στο οποίο η OWL και ο υπόλοιπος Σημασιολογικός Ιστός μπορούν να χτιστούν. Στον παρακάτω πίνακα αναφέρονται κάποιες από τις βάσεις δεδομένων που έχουν αποθηκευμένα τα δεδομένα τους σε μορφή RDF. Δίνονται πληροφορίες σχετικά με το μέγεθος των βάσεων, τους συνδέσμους που περιέχουν καθώς και αν υπάρχει η δυνατότητα χρήσης SPARQL για να αντλήσει ο χρήστης δεδομένα από αυτές. Πίνακας 2 Βάσεις δεδομένων με δεδομένα σε μορφή RDF [Hausenblas08] 35 Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

37 Flickr API Όπως έχουμε προαναφέρει τα τελευταία χρόνια έχει παρατηρηθεί μια αξιοσημείωτη ανάπτυξη σε ιστοτόπους κοινωνικών δικτύων καθώς και σε online εφαρμογές τους όπου χρήστες διαμοιράζονται πόρους, δημιουργούν, αναθέτουν ετικέτες σε περιεχόμενο και το αξιολογούν με κάποιο τρόπο [Matthews2006], οι ονομαζόμενες εφαρμογές του Web 2.0 [O Reilly 2005]. Τέτοιου είδους εφαρμογές ποικίλλουν σε μεγάλο βαθμό καθώς κυμαινόμαστε από ιστοτόπους όπου ο χρήστης μπορεί να προσθέσει, να οργανώσει και να μοιραστεί bookmarks (π.χ. del.icio.us), ακαδημαϊκές αναφορές (π.χ. CiteULike.org) και φωτογραφίες (π.χ. Flickr.com). Ένα πράγμα το οποίο έχουν ως κοινό αυτοί οι ιστότοποι είναι η έμφαση που δίνουν στην online συνεργασία και στο διαμοιρασμό των πόρων μεταξύ των χρηστών. Πιο συγκεκριμένα θα αναφερθούμε σε έναν από αυτούς τους ιστοτόπους ένα δημοφιλή ιστότοπο κοινωνικού χαρακτήρα στον οποίο επιτελείται online διαχείριση εικόνων και εφαρμογών διαμοιρασμού τους. Το Flickr επιτρέπουν στους χρήστες να κάνουν upload, να αποθηκεύσουν και να μοιραστούν ψηφιακές εικόνες οι οποίες υπάρχει η δυνατότητα να έχουν χαρακτηριστεί από ετικέτες (ελεύθερα επιλεγμένες λέξεις-κλειδιά) προκειμένου να βοηθήσουν την οργάνωση και την ανάκτηση τους. Τέτοιου είδους εικόνες υπάρχει η δυνατότητα να χαρακτηριστούν ως ιδιωτικές, να είναι ορατές σε επιλεγμένους φίλους και στην οικογένεια μόνο ή μπορούν να είναι ορατές από τη συνολική κοινότητα χρηστών του συστήματος [Angus2008]. Για να μπορέσει κάποιος να χρησιμοποιήσει το Flickr API χρειάζεται να διαθέτει ένα κλειδί της εφαρμογής. Αυτό χρησιμοποιείται από τους διαχειριστές του Flickr για να εντοπίζουν τη χρήση του API. Για να κάνουμε αναζήτηση των φωτογραφιών που πληρούν τα κριτήρια των διαφόρων σεναρίων που εφαρμόσαμε χρησιμοποιήσαμε τη συνάρτηση flickr.photos.search του Flickr API. Η συγκεκριμένη συνάρτηση επιστρέφει μια λίστα φωτογραφιών οι οποίες πληρούν κάποια κριτήρια. Θα επιστραφούν μόνο φωτογραφίες στις οποίες ο συγκεκριμένος χρήστης που κάνει την αναζήτηση έχει δικαιώματα πρόσβασης. Παρακάτω θα περιγράψουμε κάποια από τα ορίσματα που μπορεί να δεχτεί η συνάρτηση. Ο αριθμός και το είδος των ορισμάτων ποικίλλει αναλόγως με το πόσο εξειδικευμένη αναζήτηση θέλει να κάνει ο συγκεκριμένος χρήστης. Τα ορίσματα που περιγράφουμε παρακάτω είναι αυτά τα οποία χρησιμοποιήθηκαν και στα διάφορα σενάρια που υλοποιήσαμε και των οποίων τα αποτελέσματα θα παρουσιάσουμε σε επόμενο κεφάλαιο. -api_key: Το κλειδί της API εφαρμογής Διπλωματική εργασία-αναστασία Σταμπουλή 36

38 - tags: Η λίστα των ετικετών. Ο διαχωρισμός μεταξύ τους γίνεται με κόμματα. Θα επιστραφούν φωτογραφίες που έχουν χαρακτηριστεί με τουλάχιστον μία από τις ετικέτες που ανήκουν στη συγκεκριμένη λίστα. - tag_mode: Το συγκεκριμένο όρισμα μπορεί να πάρει δύο τιμές. Η τιμή any σημαίνει ότι θα επιστραφούν φωτογραφίες που θα περιέχουν τουλάχιστον μία από τις ετικέτες που περιλαμβάνονται στη λίστα. Αν το όρισμα πάρει την τιμή all σημαίνει ότι θα επιστραφούν φωτογραφίες που θα έχουν χαρακτηριστεί με το σύνολο των ετικετών που ανήκουν στη λίστα. - page: Η σελίδα των αποτελεσμάτων που επιστρέφονται. Εάν το όρισμα αυτό παραλειφθεί τότε η προεπιλεγμένη τιμή είναι 1. - per_page: Ο αριθμός των φωτογραφιών που επιστρέφονται ανά σελίδα. Εάν αυτό το όρισμα παραλειφθεί έχει ως προεπιλεγμένη το 100. Η μέγιστη επιτρεπόμενη τιμή είναι το lat: Μία έγκυρη τιμή για το γεωγραφικό πλάτος σε δεκαδική μορφή για να υπάρχει η δυνατότητα να τεθούν ερωτήματα στη βάση δεδομένων με επιπλέον κριτήριο την ακτίνα από ένα συγκεκριμένο γεωγραφικό σημείο. -long: Μία έγκυρη τιμή για το γεωγραφικό μήκος σε δεκαδική μορφή. - radius: Μία έγκυρη τιμή για την ακτίνα μεγαλύτερο από το μηδέν και μικρότερο από 20 μίλια ή 32 χιλιόμετρα. Χρησιμοποιείται ως παράμετρος για ερωτήματα με κριτήριο τις γεωγραφικές συντεταγμένες ενός συγκεκριμένου σημείου. Η προεπιλεγμένη τιμή είναι 5 km Python Η γλώσσα προγραμματισμού η οποία χρησιμοποιήσαμε για να μπορέσουμε να κάνουμε τη διασύνδεση μεταξύ της DBpedia και του Flickr είναι η Python. Η Python είναι μια σχετικά νέα γλώσσα. Ο Guido van Rossum συνέλαβε την ιδέα της δημιουργίας της γλώσσας μόλις το Δεκέμβριο του Το όνομα της γλώσσας προγραμματισμού προέκυψε από την σειρά του BBC που προβαλλόταν τη δεκαετία του 70 Monty Python s Flying Circus. Είναι γλώσσα προγραμματισμού υψηλού επιπέδου με πολύ μεγάλη ευκολία στην ανάπτυξη κώδικα καθώς και στην ανάγνωση του. Περιλαμβάνει έναν διαδραστικό μεταγλωττιστή με πολύ μεγάλες δυνατότητες. Επίσης υπάρχει πολύ γρήγορος ρυθμός ανάπτυξης εφαρμογών. Η Python είναι μία μεταγλωττίσιμη, διαδραστική και αντικειμενοστραφής γλώσσα προγραμματισμού. Συνδυάζει το μεγάλο εύρος δυνατοτήτων με σύνταξη η οποία Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

39 χαρακτηρίζεται από μεγάλο βαθμό σαφήνειας. Διαθέτει διεπαφές για πολλες βιβλιοθήκες καθώς και για διάφορα συστήματα βασισμένα στο λειτουργικό σύστημα των windows. Υπάρχει επίσης η δυνατότητα επέκτασης σε C ή C++. Τέλος έχει φορητότητα σε όλες τις σημαντικές πλατφόρμες υλικού και λογισμικού [Krishnakant2007]. Η Python θεωρείται ιδανική για τη γρήγορη διαμόρφωση πρωτοτύπου όσον αφορά σύνθετες εφαρμογές. Χρησιμοποιείται επίσης ως συνδετικός κρίκος για τα διάφορα κομμάτια μιας σύνθετης λύσης όπως ιστοσελίδες, βάσεις δεδομένων κ.τ.λ. Αυτό ακριβώς συνέβη και στη περίπτωση της δικιάς μας εφαρμογής στην οποία χρησιμοποιήσαμε την Python ως συνδετικό κρίκο ανάμεσα στην DBpedia που ανακτά δεδομένα από την Wikipedia σε δομημένη μορφή και την ιστοσελίδα δημοσίευσης φωτογραφιών Flickr. Έχει χρησιμοποιηθεί από τη NASA κατά τη διάρκεια του σχεδίου αποστολής διαστημικού λεωφορείου. Η AstraZeneca χρησιμοποιεί την Python για την συνεργατική ανακάλυψη νέων φαρμάκων. Η ForecastWatch.com προτιμά την Python για να μπορέσει να βοηθήσει το έργο των μετεωρολόγων. Άλλες εταιρίες που χρησιμοποιούν τη συγκεκριμένη γλώσσα προγραμματισμού είναι η Zope, η RedHat καθώς και πολλές άλλες [Ramachandran2005] SPARQL Wrapper Πρόκειται ουσιαστικά για μία εφαρμογή η οποία συμβάλλει στο να μπορέσει να γίνει η διαχείριση των δεδομένων που προέρχονται από ερωτήματα σε SPARQL προς μία βάση δεδομένων που τα δεδομένα είναι σε μορφή RDF με κάποια γλώσσα προγραμματισμού. Στην προκειμένη περίπτωση επειδή η γλώσσα προγραμματισμού που θέλαμε να χρησιμοποιήσουμε ήταν η Python έγινε χρήση της εφαρμογής SPARQL Endpoint interface to Python. Με τη βοήθεια αυτής της εφαρμογής καταφέραμε να μετατρέψουμε τα αποτελέσματα που επιστρέφονταν από τα ερωτήματα σε SPARQL σε μία μορφή που να μπορούμε να τα διαχειριστούμε και να τα επεξεργαστούμε. Συμβάλλει επίσης στη δημιουργία του URI του ερωτήματος που επιθυμεί να θέσει ο χρήστης στη βάση δεδομένων που στην προκειμένη περίπτωση είναι η DBpedia.org. Το SPARQL Endpoint Interface σε Python αποτελεί ένα σύνολο κλάσεων. Ο στόχος δημιουργίας του πακέτου ήταν η βοήθεια για τη μετατροπή ενός ερωτήματος εκφρασμένο σε SPARQL στο αντίστοιχο HTTP GET Protocol, η αποστολή του σε κάποιο SPARQL endpoint και ακολούθως η χρησιμοποίηση των αποτελεσμάτων που Διπλωματική εργασία-αναστασία Σταμπουλή 38

40 προκύπτουν από το ερώτημα. Ένα πολύ απλό παράδειγμα χρήσης του SPARQL Wrappr είναι το παρακάτω: from SPARQL import SPARQLWrapper querystring = "SELECT * WHERE {?s?p?o. }" sparql = SPARQLWrapper(" # add a default graph, though that can also be done in the query string sparql.adddefaultgraph(" sparql.setquery(querystring) try: ret = sparql.query() # ret is a stream with the results in XML, it is a file like object except: deal_with_the_exception() # eg, syntax error Για να γίνει ακόμη πιο εύκολη η χρήση του πακέτου μπορεί να γίνει μετατροπή των αποτελεσμάτων σε μορφές πιο συμβατές με τη γλώσσα προγραμματισμού που χρησιμοποιούμε. Για παράδειγμα μπορεί να γίνει μετατροπή σε δενδρική δομή DOM αν το αποτέλεσμα είναι σε XML. Επίσης μπορεί να χρησιμοποιηθεί το simplejson 36 για να γίνει μετατροπή από μία μορφή αποτελεσμάτων σε JSON σε λεξικό(dictionary) της Python [Herman2007]. Στο παρακάτω κομμάτι κώδικα φαίνεται η τελευταία περίπτωση που αναφέραμε: try : sparql.setreturnformat(sparql.json) ret = sparql.query() dict = ret.convert() except: deal_with_the_exception() Το simplejson είναι ένας απλός και πλήρης κωδικοποιητής και αποκωδικοποιητής σε μορφή JSON για γλώσσα προγραμματισμού Python. Είναι κώδικας γραμμένος σε Python χωρίς κανενός είδους εξάρτηση αλλά περιλαμβάνει μία επέκταση σε C για την επίλυση συγκεκριμένων προβλημάτων Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

41 3.2. Θεωρητικό υπόβαθρο υλοποίησης Στη συνέχεια θα αναφερθούμε σε κάποιες θεωρητικές έννοιες οι οποίες είναι σημαντικό να γίνουν κατανοητές από τον αναγνώστη καθώς θα χρησιμοποιηθούν στη σύγκλιση που θα περιγραφεί στο επόμενο κεφάλαιο Γενικά Το Flickr αποτελεί μία από τις μεγαλύτερες παγκόσμιες πηγές δημοσιευμένων φωτογραφιών. Δίνει τη δυνατότητα στο χρήστη να χαρακτηρίσει με ετικέτες τις φωτογραφίες του. Παρατηρείται μεγάλη ποικιλία στα είδη των ετικετών που μπορεί να χρησιμοποιήσει ένας χρήστης συμπεριλαμβανομένου ετικετών γεωγραφικών συντεταγμένων (geotags). Με στόχο την διευκόλυνση του χρήστη δεν υπάρχουν σαφώς καθορισμένοι κανόνες για τις ετικέτες(tags) που μπορούν να χρησιμοποιηθούν. Δηλαδή δεν υπάρχουν περιορισμοί όσον αφορά την ονομασία, το επίπεδο λεπτομέρειας καθώς και την σχετικότητα των ετικετών. Αυτό έχει ως αποτέλεσμα οι ετικέτες να υπάρχουν σε διάφορες γλώσσες και η ακρίβεια καθώς και σχετικότητα τους με το αντικείμενο να ποικίλλει σε μεγάλο βαθμό. Επιπρόσθετα αμφισημίες μπορεί να προκύψουν όταν κάποιες φωτογραφίες χαρακτηρίζονται με ετικέτες που αναφέρονται μόνο σε γενικούς όρους. Με αυτό τον τρόπο δημιουργούνται εμπόδια σε αλγορίθμους σημασιολογικής αντιστοίχησης έτσι ώστε να μπορέσουν να παράγουν δηλώσεις ακριβείας για τις φωτογραφίες λόγω απουσίας επιπλέον στοιχείων. Από την άλλη πλευρά οι ετικέτες με τις γεωγραφικές συντεταγμένες συχνά χρησιμοποιούνται μαζικά δηλαδή υπάρχει περίπτωση κάποιος χρήστης να χαρακτηρίσει όλες τις φωτογραφίες των διακοπών του με γεωγραφικές συντεταγμένες ενός σημείου. Για να αποφευχθούν τέτοιου είδους καταστάσεις το Flickr αποθηκεύει το επίπεδο ζουμ στο οποίο μια εικόνα έχει χαρακτηριστεί με γεωγραφικές συντεταγμένες ως μέτρο ακριβείας και αυτό το εξετάζει κατά τη διάρκεια της διαδικασίας αναζήτησης. Για παράδειγμα όταν γίνεται αναζήτηση φωτογραφιών με βάση γεωγραφικές συντεταγμένες χρησιμοποιώντας το Flickr API επιστρέφονται εξ ορισμού μόνο οι εικόνες οι οποίες έχουν χαρακτηριστεί με γεωγραφικές συντεταγμένες σε επίπεδο οδών. Εντούτοις αυτή η λύση δεν αποτρέπει τις καταστάσεις στις οποίες χρήστες συσχετίζουν όλες τις φωτογραφίες των διακοπών τους με ένα συγκεκριμένο σημείο σε επίπεδο οδών. Η λύση βρίσκεται στο συνδυασμό της αναζήτησης με βάση το θέμα και της αναζήτησης με βάση τη γεωγραφική θέση. Η Wikipedia παρέχει μια τεράστια Διπλωματική εργασία-αναστασία Σταμπουλή 40

42 συλλογή ημι-δομημένου περιεχομένου από την οποία το πρόγραμμα της DBpedia.org εξάγει δομημένες πληροφορίες. Αυτό έχει ως αποτέλεσμα η DBpedia.org να παρέχει ετικέτες σε πολλές διαφορετικές γλώσσες και γεωγραφικές τοποθεσίες για διάφορα θέματα. Με την αντιστοίχηση ετικετών και γεωγραφικών τοποθεσιών μπορούμε να αποκτήσουμε φωτογραφίες εξαιρετικά σχετικές με κάποια θέματα που μας ενδιαφέρουν. Αυτό βέβαια μπορεί να συμβεί μόνο αν υπάρχει κάποιο άρθρο σχετικό με την έννοια αυτή στη Wikipedia διότι η DBpedia εξάγει δομημένες πληροφορίες μόνο από τη Wikipedia. Είναι γνωστό άλλωστε ότι για κάθε τοποθεσία στη σελίδα που έχει στη Wikipedia υπάρχει μέσα στο Infobox το ακριβές γεωγραφικό πλάτος και μήκος της. Οι φωτογραφικές συλλογές συνδέονται με την DBpedia με τη χρήση dbpedia:hasphotocollection RDF συνδέσμων. Στη συνέχεια του κεφαλαίου θα αναφέρουμε πιο αναλυτικές πληροφορίες για τους δύο τομείς στους οποίους επικεντρωθήκαμε στην υλοποίηση μας Αμφίσημες έννοιες(disambiguation) Με την έννοια του disambiguation στη Wikipedia αναφερόμαστε στη διεργασία της επίλυσης συγκρούσεων που προκύπτουν στους τίτλους των άρθρων της Wikipedia. Αυτές οι συγκρούσεις συμβαίνουν όταν ένας όρος μπορεί να συσχετιστεί με περισσότερα από ένα θέματα οπότε αυτός ο όρος είναι πιθανό να αποτελεί τον τίτλο σε περισσότερα από ένα άρθρα. Με πιο απλά λόγια τα disambiguations είναι σύνδεσμοι οι οποίοι οδηγούν σε διαφορετικά άρθρα τα οποία θα μπορούσαν να έχουν τον ίδιο τίτλο. Για παράδειγμα η λέξη Mercury είναι πιθανό να αναφέρεται σε πολλά διαφορετικά πράγματα όπως ένα χημικό στοιχείο, τον πλανήτη, μία μάρκα αυτοκινήτου, μία δισκογραφική εταιρία, ένα διαστημικό σχέδιο της NASA, ένα εργοστάσιο και έναν αρχαίο θεό των Ρωμαίων. Όμως επειδή μόνο μια σελίδα στη Wikipedia μπορεί να έχει το γενικό όνομα Mercury για τις υπόλοιπες έννοιες χρησιμοποιούνται τίτλοι στα άρθρα που εμποδίζουν τις αμφισημίες. Όπως αντιλαμβανόμαστε θα πρέπει να υπάρχει ένας τρόπος να ανακατευθύνεται ο χρήστης στη σελίδα του συγκεκριμένου άρθρου που αναφέρεται στη σωστή έννοια όταν προκύπτουν τέτοιες αμφισημίες. Αυτό που αναφέραμε παραπάνω είναι γνωστό ως disambiguation. Σε αυτή την περίπτωση αυτό επιτυγχάνεται χρησιμοποιώντας το Mercury ως σελίδα για disambiguation. Όπως παρατηρήσαμε από τη Wikipedia συνήθως υπάρχει στην αρχή κάθε άρθρου ένας σύνδεσμος που οδηγεί τον Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

43 αναγνώστη σε μια σελίδα και εκεί τον ενημερώνει για άρθρα με παρόμοιους τίτλους ή θεματικές ενότητες. Η ικανότητα προσδιορισμού των διαφόρων οντοτήτων όπως άνθρωποι και τοποθεσίες έχει πλέον μετατραπεί σε ένα πολύ σημαντικό θέμα σε διάφορους τομείς όπως εύρεση του θέματος στο οποίο αναφέρεται ένα κείμενο, ανάκτηση πληροφοριών κ.α. Για παράδειγμα μία οντότητα όπως ο George W. Bush ο πρώην πρόεδρος των Ηνωμένων Πολιτειών μπορεί να αναφερθεί ως George Bush ή Bush. Όπως επίσης και με την ονομασία Bush μπορεί να αναφέρεται σε πολλαπλές οντότητες π.χ. δύο πρόεδροι των Ηνωμένων Πολιτειών, ο παίχτης του ποδοσφαίρου Reggie Bush και το ροκ συγκρότημα Bush [Cucerzan2007]. Κατά την διαδικασία ανάλυσης ενός κειμένου το οποίο μπορεί να ανήκει σε μια μεγάλη συλλογή εγγράφων ή μπορεί να είναι αναρτημένο σε κάποιον ιστότοπο το να επιλυθεί το ζήτημα κάποιων διφορούμενων εννοιών γίνεται θέμα κεντρικής σημασίας. Για παράδειγμα ο όρος Texas αναφέρεται σε περισσότερες από 20 διαφορετικές οντότητες στην Wikipedia. Στο πλαίσιο του former Texas quarterback James Street αναφέρεται στο πανεπιστήμιο του Texas στο Austin, στο πλαίσιο του in 2000, Texas released a greatest hits album αναφέρεται στο βρετανικό ποπ συγκρότημα, στο πλαίσιο του Texas borders Oklahoma on the north αναφέρεται στην πολιτεία των Ηνωμένων Πολιτειών ενώ στο πλαίσιο του the characters in Texas include both real and fictional explorers αναφέρεται στο μυθιστόρημα του James A. Michener. Το πρόβλημα της εύρεσης της σωστής σημασίας ονομάτων με διάφορες έννοιες εμφανίζεται και στον παγκόσμιο ιστό. Αν χρησιμοποιηθούν ως λέξεις κλειδιά σε μια αναζήτηση ονόματα όπως Jim Clark ή Michael Jordan οι μηχανές αναζήτησης επιστρέφουν διάφορα αποτελέσματα που αναφέρονται σε πολλά διαφορετικά πρόσωπα. Η παγκόσμια γνώση κατηγοριοποιείται με βάση οντότητες. Τα περισσότερα άρθρα στη Wikipedia σχετίζονται με κάποια οντότητα. Υπάρχει επίσης σαν πληροφορία εκτός από το όνομα της οντότητας το είδος της οντότητας(άνθρωπος, τοποθεσία, οργανισμός και διάφορα), κάποιοι πιθανοί όροι οι οποίοι χρησιμοποιούνται για να γίνεται αναφορά στις συγκεκριμένες οντότητες μέσα στο κείμενο και ετικέτες οι οποίες περιγράφουν θέματα στα οποία ανήκει η συγκεκριμένη οντότητα. Στην Εικόνα 17 φαίνονται 9 από τις πάνω από 70 διαφορετικές οντότητες που αναφέρονται με το όνομα Columbia στη Wikipedia καθώς και μερικές από τις κατηγορίες και τις πληροφορίες που πλαισιώνουν και σχετίζονται με μία από αυτές τις οντότητες το διαστημικό λεωφορείο Columbia[Cucerzan2007]. Διπλωματική εργασία-αναστασία Σταμπουλή 42

44 Εικόνα 17 Μοντέλο αποθήκευσης της πληροφορίας που εξάγεται από τη Wikipedia σε δύο βάσεις δεδομένων[cucerzan2007] Γεωγραφικές συντεταγμένες Τα άρθρα που υπάρχουν στη Wikipedia είναι γραμμένα σε μία σχετικά ελεύθερη μορφή χωρίς να υπάρχουν ιδιαίτεροι περιορισμοί. Κατά συνέπεια οι βασικές πληροφορίες συμπεριλαμβανομένου και του γεωγραφικού πλάτους και μήκους πρέπει με κάποιο τρόπο να εξαχθούν από το κείμενο. Η DBpedia ( είναι μια κοινοτική προσπάθεια εξαγωγής δομημένης πληροφορίας από την Wikipedia. Οι εξαγόμενες πληροφορίες αποθηκεύονται σε μορφή Resource Description Framework (RDF), μορφή η οποία είναι συμβατή με XML. Οι πληροφορίες σε μορφή RDF μπορούν να εξαχθούν με ερωτήματα σε SPARQL. Παρακάτω δίνεται ενδεικτικά ο κώδικας σε SPARQL για την εύρεση όλων των τοποθεσιών που βρίσκονται στην Wikipedia και απέχουν από το Πανεπιστήμιο του Houston απόσταση μεγαλύτερή ή μικρότερη από 0,05 στο γεωγραφικό πλάτος αλλά και στο μήκος[becker2008]. PREFIX geo: < SELECT?subject?label?lat?long WHERE { < geo:lat?uhlat. < geo:long?uhlong.?subject geo:lat?lat.?subject geo:long?long. Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

45 ?subject rdfs:label?label. FILTER(xsd:float(?lat) - xsd:float(?uhlat) <= 0.05 && xsd:float(?uhlat) -xsd:float(?lat) <= 0.05 && xsd:float(?long) - xsd:float(?uhlong) <= 0.05 && xsd:float(?uhlong) - xsd:float(?long) <= 0.05 && lang(?label) = "en" ). } LIMIT 20 Το geotagging είναι μια μορφή χαρακτηρισμού των εικόνων με ετικέτες που περιλαμβάνουν γεωγραφικές συντεταγμένες. Θεωρείται εξαιρετικά χρήσιμο καθώς πολλές φορές οι χρήστες δημοσιεύουν διάφορες φωτογραφίες και ενώ τις χαρακτηρίζουν με κάθε είδους ετικέτες δεν καθορίζουν το γεωγραφικό μέρος στο οποίο τις απέκτησαν. Δηλαδή δεν υπάρχει σαφής γεωγραφική τοποθέτηση των φωτογραφιών γεγονός που θα ήταν εξαιρετικά χρήσιμο για τους υπόλοιπους χρήστες. Πριν προσθέσουμε ένα geotag σε μια εικόνα είναι απαραίτητο να το προσδιορίσουμε. Αυτό γίνεται με τον ορισμό γεωγραφικού πλάτους και μήκους για την τοποθεσία. Υπάρχουν ιστότοποι οι οποίοι υποστηρίζουν τη μέθοδο του geotagging. Όπως γνωρίζουμε το Flickr ανήκει σε αυτή την κατηγορία των ιστοτόπων καθώς υποστηρίζει κάποιας μορφής geotagging. Όχι όμως με τη μορφή αριθμητικής ετικέτας αλλά με τη μορφή της τοποθέτησης των φωτογραφιών στο χάρτη με drag and drop. Αυτός ίσως είναι ένας πιο εύκολος τρόπος σε σχέση με τον αριθμητικό (στον οποίο μπορεί να χρειαστούν να γίνουν και κάποιες μετατροπές στις μονάδες) γεγονός που μπορεί να ενθαρρύνει μεγαλύτερο αριθμό χρηστών να χαρακτηρίσουν με γεωγραφικές συντεταγμένες τις φωτογραφίες τους. Το αποτέλεσμα αυτής της μεθόδου φαίνεται από τον πολύ μεγάλο αριθμό φωτογραφιών στο Flickr που έχουν γεωγραφικό πλάτος και μήκος. Αυτή τη χρονική στιγμή είναι διαθέσιμα γεωγραφικά σύνολα δεδομένων ως μέρος του Linking Open Data. Η DBpedia συγκεκριμένα περιλαμβάνει δεδομένα σχετικά με γεωγραφικές συντεταγμένες για μέρη. Άλλες πηγές συνδεδεμένων δεδομένων είναι τα GeoNames, US Census ( η Eurostat η οποία παρέχει σύνολα δεδομένων γενικής και οικονομικής φύσεως, το World Factbook( και πολλά άλλα [Becker2009]. Διπλωματική εργασία-αναστασία Σταμπουλή 44

46 Κεφάλαιο 4. Υλοποίηση και σενάρια χρήσης Η υλοποίηση που επιχειρήσαμε είχε ως στόχο την ένωση της DBpedia με το Flickr δηλαδή το συνδυασμό των πληροφοριών που παρέχει η DBpedia με τις πληροφορίες που παρέχουν οι ετικέτες που χαρακτηρίζουν τις δημοσιευμένες φωτογραφίες του Flickr. Η σύγκλιση αυτή έχει ως στόχο την επιστροφή αποτελεσμάτων καλύτερης ποιότητας σε διάφορες αναζητήσεις χρηστών στον ιστότοπο Flickr. Στην Εικόνα 18 παρατηρούμε τις διαδοχικές ενέργειες που εκτελέστηκαν προκειμένου να υλοποιηθεί η σύγκλιση. Εικόνα 18 Διαδοχικές ενέργειες υλοποίησης σύγκλισης Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

47 Στην παρακάτω εικόνα απεικονίζεται γραφικά το σύστημα που υλοποιήσαμε το οποίο ουσιαστικά οδηγεί στη διασύνδεση της DBpedia με το Flickr με τη βοήθεια εργαλείων και συστημάτων που περιγράφονται στο σχήμα. Wikipedia Extraction DBpedia Infobox Abstract RDF triplets Flickr Loaded Into Images Tags+Info Virtuoso Virtuoso keyword User System keyword Published via keyword Info SPARQL endpoint Reessuul lttss Prreesseennttaatti ioonn (html format) Εικόνα 19 Δομή συστήματος Τα σενάρια τα οποία αναπτύχθηκαν προκειμένου να μπορέσουμε να διαπιστώσουμε την λειτουργικότητα της συγκεκριμένης εφαρμογής και το κατά πόσο επιτυχημένο είναι το mashup το οποίο αναπτύξαμε ανάμεσα στη DBpedia και στο Flickr χωρίζονται σε δύο κατηγορίες. Η πρώτη κατηγορία περιλαμβάνει τις αμφίσημες Διπλωματική εργασία-αναστασία Σταμπουλή 46

48 έννοιες μιας λέξης ενώ η δεύτερη σχετίζεται άμεσα με τον χαρακτηρισμό φωτογραφιών με γεωγραφικές συντεταγμένες Αμφίσημες έννοιες (Disambiguations) Υλοποίηση Όπως αναφέραμε στη Wikipedia στη σελίδα κάθε βασικής έννοιας υπάρχει ένας σύνδεσμος ο οποίος οδηγεί σε μια άλλη σελίδα και στην οποία περιλαμβάνονται τα disambiguations της συγκεκριμένης έννοιας. Η DBpedia έχει δημιουργήσει ένα συγκεκριμένο πεδίο(property) dbpprop:disambiguates. Σε αυτό περιλαμβάνεται μια λίστα disambiguations που είναι ουσιαστικά σύνδεσμοι που οδηγούν στις συγκεκριμένες οντότητες. Οι σύνδεσμοι αυτοί απεικονίζονται στο παρακάτω σχήμα: Εικόνα 20 Σύνδεσμοι αμφίσημων εννοιών στη DBpediaγια τη λέξη Paris Η κάθε οντότητα στη DBpedia βρίσκεται σε έναν σύνδεσμο(link) της μορφής όπου Resource το όνομα της αντίστοιχης οντότητας. Για παράδειγμα η οντότητα για την γαλλική πρωτεύουσα υπάρχει στο σύνδεσμο Στην αρχή της σελίδας υπάρχει μια βασική Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

49 περιγραφή της έννοιας. Για παράδειγμα για το Παρίσι(γαλλική πρωτεύουσα) υπάρχει το συγκεκριμένο κείμενο: Paris (in in French) is the capital of France and the country's largest city. It is situated on the river Seine, in northern France, at the heart of the Île-de-France region. The city of Paris within its administrative limits has an estimated population of 2,167,994. Στη συγκεκριμένη σελίδα περιλαμβάνονται με δομημένο τρόπο κάποιες βασικές πληροφορίες οι οποίες αφορούν τη συγκεκριμένη έννοια. Υπάρχει μια στήλη property στην οποία καταγράφονται όλα τα predicates δηλαδή η σχέση που υπάρχει ανάμεσα στην βασική έννοια και στις τιμές(values) που βρίσκονται στη δεξιά στήλη της σελίδας. Όπως αναφέραμε και σε προηγούμενο κεφάλαιο τα δεδομένα είναι οργανωμένα σε μορφή RDF. Οπότε οι πληροφορίες που αντλεί η DBpedia από τη Wikipedia για κάθε έννοια υπάρχουν σε δομημένη μορφή οπότε μας δίνεται η δυνατότητα να έχουμε πρόσβαση σε αυτά μέσω ερωτημάτων(queries) εκφρασμένων σε SPARQL. Στο παρακάτω ερώτημα σε SPARQL επιστρέφονται τα ονόματα των disambiguates για το Paris. Υπάρχει όμως το κριτήριο να επιστραφούν μόνο τα ονόματα τα οποία είναι εκφρασμένα στην αγγλική γλώσσα. Έχουμε ορίσει να γίνεται εκτύπωση των αποτελεσμάτων. Οπότε παρατηρούμε ότι κάποια από τα disambiguations που επιστρέφονται περιλαμβάνουν και ειδικούς χαρακτήρες όπως παρενθέσεις και κόμματα. Οι χαρακτήρες αυτοί υπάρχουν καθώς υπάρχουν κάποιες λέξεις επεξήγησης που διαχωρίζουν τις υπόλοιπες έννοιες από την βασική έννοια της λέξης. PREFIX rdfs: < SELECT DISTINCT?label?disambiguates WHERE { dbpedia:paris dbpprop:disambiguates?disambiguates.?disambiguates rdfs:label?label. FILTER(lang(?label) = "en"). Για παράδειγμα στην περίπτωση της λέξης Paris η βασική έννοια είναι η γαλλική πρωτεύουσα. Μία από τις άλλες έννοιες που επιστρέφονται είναι το Paris,Illinois. Ο χαρακτήρας κόμμα υπάρχει για ευνόητους λόγους καθώς θέλει να προσδιορίσει ότι ναι μεν πρόκειται για μία πόλη με όνομα Paris αλλά όχι την γαλλική πρωτεύουσα αλλά την πόλη με όνομα Paris η οποία βρίσκεται στην πολιτεία Illinois των Ηνωμένων Πολιτειών. Ένα άλλο παράδειγμα disambiguation που χρειάζεται επεξεργασία είναι το Paris(2008 film). Με τη βοήθεια των βοηθητικών λέξεων που βρίσκονται μέσα στις παρενθέσεις αντιλαμβανόμαστε ότι πρόκειται για μια ταινία του 2008 με όνομα Paris. Αυτές οι βοηθητικές λέξεις οι οποίες χωρίζονται από τις βασικές Διπλωματική εργασία-αναστασία Σταμπουλή 48

50 με κόμματα, παρενθέσεις ή άλλους ειδικούς χαρακτήρες θα συμβάλλουν έτσι ώστε τα αποτελέσματα που θα επιστραφούν από το Flickr να είναι απολύτως σχετικά με τη συγκεκριμένη έννοια της βασικής λέξης. Αυτό θα συμβεί διότι με την αφαίρεση των ειδικών χαρακτήρων και οι βοηθητικές λέξεις θα χρησιμεύσουν ως ετικέτες(tags) μαζί με την βασική λέξη στην έρευνα που θα γίνει στο Flickr. Οι φωτογραφίες που θα επιστραφούν θα έχουν χαρακτηριστεί με το σύνολο των tags που θα έχουμε ορίσει για την κάθε έννοια και όχι με τουλάχιστον ένα από αυτά. Με αυτό τον τρόπο θα μπορέσουμε να πάρουμε σχετικές εικόνες με το θέμα μας από το Flickr. Μετά την επιστροφή όλων των αποτελεσμάτων από το SPARQL query όλες οι αμφίσημες έννοιες προστίθενται ως στοιχεία σε μια λίστα. Ακολούθως για την κάθε έννοια θα κληθεί μία συνάρτηση την οποία έχουμε αναπτύξει(crawlhtml.py). Η συγκεκριμένη συνάρτηση περιλαμβάνει δύο ορίσματα. Το ένα όρισμα είναι ένα συγκεκριμένο στοιχείο της λίστας δηλαδή μία από τις αμφίσημες έννοιες και το δεύτερο όρισμα είναι ένα αριθμός ο οποίος υποδεικνύει την αύξουσα σειρά στην οποία επιστρέφεται το συγκεκριμένο αποτέλεσμα από το ερώτημα σε SPARQL. Αυτό το όρισμα μας βοηθάει ακολούθως στη συνάρτηση crawlhtml έτσι ώστε να μπορέσουμε κατά τη δημιουργία ενός αρχείου hmtl να καθορίσουμε πότε θα γίνει η δημιουργία του αρχείου htrml και πότε απλά θα πρέπει να συνεχιστεί το συγκεκριμένο αρχείο. Δηλαδή τα στοιχεία τα οποία θα έχουμε ορίσει να καταγράφονται για κάθε έννοια στο html αρχείο απλά να προστεθούν στο ήδη υπάρχον. Στη συνάρτηση crawlhtml για την κάθε έννοια για την οποία καλείται γίνεται η κατάλληλη επεξεργασία έτσι ώστε να σχηματιστεί μία λίστα για τις ετικέτες για τις οποίες θα πρέπει να χαρακτηρίζουν μια φωτογραφία έτσι ώστε να θεωρηθεί ότι είναι σχετικές με την συγκεκριμένη έννοια της αρχικής λέξης. Η λίστα αυτή των λέξεων μετατρέπεται σε μια ακολουθία λέξεων χωρισμένες μεταξύ τους με κόμματα έτσι ώστε να μπορέσουν να αποτελέσουν τιμή της μεταβλητής tags που υπάρχει στη συνάρτηση flick.photos.search του Flickr API. Ο χρήστης ορίζει ένα συγκεκριμένο αριθμό φωτογραφιών που επιθυμεί από την κάθε έννοια. Για την κάθε φωτογραφία από αυτές που βρέθηκαν μετά την έρευνα στο Flickr και εξυπηρετούν τα συγκεκριμένα κριτήρια που προαναφέραμε καταγράφεται το url της σε ένα αρχείο xml καθώς και οι υπόλοιπες ετικέτες που την χαρακτηρίζουν. Το συγκεκριμένο αρχείο xml θα έχει το όνομα της συγκεκριμένης έννοιας όπως αυτή παρουσιάζεται στην DBpedia χωρίς βέβαια τους ειδικούς χαρακτήρες και έναν αύξοντα αριθμό στο τέλος της ονομασίας για να γίνεται διαχωρισμός μεταξύ των φωτογραφιών της ίδιας έννοιας. Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

51 Επίσης οι φωτογραφίες αυτές αποθηκεύονται σε μορφή jpeg σε μια συγκεκριμένη διαδρομή που έχει οριστεί από τον χρήστη στην αρχή της συνάρτησης. Στο αρχείο html στο οποίο θα δημιουργηθεί για το σύνολο των εννοιών θα εμφανίζεται σαν επικεφαλίδα το όνομα της κάθε έννοιας και στην κάτω γραμμή ακριβώς θα εμφανίζονται σε διαδοχική σειρά και σε καθορισμένο μέγεθος από το χρήστη οι σχετικές φωτογραφίες. Με αυτό τον τρόπο ο χρήστης έχει την πλήρη εποπτεία των αποτελεσμάτων που προκύπτουν Σενάρια χρήσης Paris Παρακάτω θα μελετήσουμε το σενάριο κατά το οποίο ο χρήστης θέλει να δει τα πιθανά disambiguations της λέξης Paris. Από την αντίστοιχη σελίδα της DBpedia παρατηρούμε ότι οι τιμές για την ιδιότητα disambiguates είναι πάρα πολλές για την συγκεκριμένη λέξη. Αυτό ήταν αναμενόμενο καθώς η συγκεκριμένη λέξη αποτελεί ονομασία πολλών τοποθεσιών, ονόματα ανθρώπων, κινηματογραφικών ταινιών κ.τ.λ. Το σύνολο των αμφίσημων εννοιών της DBpedia τα οποία έχουν το property label στην οντότητα τους και μπορούν να επιστραφούν ως αποτελέσματα του SPARQL query είναι 47. Ο αριθμός είναι πολύ μεγάλος για να μπορέσουμε να τα απεικονίσουμε με σωστό τρόπο σε ένα html αρχείο στο οποίο όπως είπαμε είναι συγκεντρωμένα όλα τα αποτελέσματα. Οπότε κάνουμε επιλογή κάποιων χαρακτηριστικών εννοιών που περιλαμβάνουν μέρη, ταινίες καθώς και διάσημα πρόσωπα σε διάφορους τομείς. Ο αριθμός των εννοιών είναι ίσος με 10, οι φωτογραφίες που θα επιστραφούν από το Flickr έχουν οριστεί να είναι ίσες με 10 και θα πρέπει επίσης να χαρακτηρίζονται οπωσδήποτε από το σύνολο των tags που έχουν οριστεί για την κάθε έννοια(συνθήκη AND και όχι OR). Για να πληρείται η τελευταία προϋπόθεση έχουμε ορίσει την παράμετρο tag_mode ίση με την τιμή all. Οι έννοιες που επιλέξαμε να εμφανίζονται είναι οι εξής: -Paris, Illinois -Paris, Ohio -Paris, Ontario -Paris, Virginia -Paris, je t'aime -Paris (2008 film) -Paris (Supertramp album) -Paris (The Flowers of Romance album) Διπλωματική εργασία-αναστασία Σταμπουλή 50

52 -Paris (rapper) -Paris Hilton Παρακάτω φαίνονται τα αποτελέσματα των διαφόρων εννοιών για τη λέξη Paris που επιλέξαμε να εμφανίζονται στο αρχείο html. Εμφανίζονται 10 φωτογραφίες για την κάθε έννοια όπως το ορίσαμε στον κώδικα. Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

53 Παρατηρούμε ότι για κάποιες έννοιες τα αποτελέσματα που εμφανίζονται μπορεί να μην είναι απολύτως σχετικά ή σε κάποιες από τις έννοιες να μην υπάρχουν καθόλου φωτογραφίες στο Flickr που να ανταποκρίνονται στα κριτήρια που θέσαμε. Όπως αναφέραμε και παραπάνω έχουμε ορίσει να επιστρέφονται φωτογραφίες που έχουν χαρακτηριστεί με το σύνολο των ετικετών που αντιστοιχούν σε κάθε μία από τις έννοιες. Για παράδειγμα για την έννοια Paris(2008 film) οι φωτογραφίες που επιστρέφονται έχουν χαρακτηριστεί με τις ετικέτες Paris,2008 και film. Για να επιστρέφονται πιο σχετικά αποτελέσματα από το Flickr μπορούμε να τροποποιήσουμε τον κώδικα ως εξής: - Για τις έννοιες που δίνονται για παράδειγμα με δυο λέξεις που χωρίζονται με ένα κενό μεταξύ τους χωρίς κόμματα, παρενθέσεις κ.τ.λ ίσως είναι καλύτερα για την επιστροφή πιο σχετικών αποτελεσμάτων να γίνεται αναζήτηση φωτογραφιών με τις δύο λέξεις σαν ένα tag - Για την περίπτωση που δεν υπάρχει καμία φωτογραφία που να έχει χαρακτηριστεί με το σύνολο των ετικετών της λίστας τότε εναλλακτικά να γίνεται αναζήτηση με μία ετικέτα που θα περιλαμβάνει όλες τις λέξεις που απαρτίζουν την έννοια μαζί π.χ. Paris (Supertramp Album). Διπλωματική εργασία-αναστασία Σταμπουλή 52

54 Με βάση την πρώτη πρόταση τροποποιήσαμε τον κώδικα και προέκυψαν τα παρακάτω αποτελέσματα στο νέο αρχείο html που δημιουργήθηκε: Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

55 Παρατηρούμε ότι δεν υπάρχουν διαφορές στα αποτελέσματα εκτός από την έννοια Paris Hilton. Αυτό είναι λογικό καθώς η τροποποίηση που έγινε στον κώδικα αφορά τις έννοιες που οι λέξεις που τις αποτελούν δεν χωρίζονται μεταξύ τους με κάποιον ειδικό χαρακτήρα. Όπως παρατηρούμε όλες οι υπόλοιπες έννοιες περιέχουν χαρακτήρες όπως κόμματα ή παρενθέσεις. Οπότε η αναζήτηση για αυτές τις έννοιες θα γίνει πάλι με αριθμό ετικετών όσες είναι και οι λέξεις που τις αποτελούν. Η έννοια Paris Hilton είναι η μόνη που δεν περιλαμβάνει ειδικούς χαρακτήρες και οι δύο λέξεις που την αποτελούν χωρίζονται μεταξύ τους με ένα κενό. Οπότε σε αυτή την περίπτωση η αναζήτηση έγινε με μία ετικέτα Paris Hilton. Παρατηρούμε ότι τα αποτελέσματα μετά την τροποποίηση είναι απολύτως σχετικά με την έννοια σε αντίθεση με την προηγούμενη περίπτωση που αρκετές από τις φωτογραφίες που επιστράφηκαν σαν αποτέλεσμα απεικόνιζαν πράγματα ή πρόσωπα καθόλου σχετικά με την Paris Hilton. Apple Θα μελετήσουμε το σενάριο κατά το οποίο ο χρήστης θέλει να δει τα πιθανά disambiguation της λέξης Apple. Η σελίδα της DBpedia για την συγκεκριμένη λέξη είναι Στο παρακάτω σχήμα φαίνονται όλες οι πιθανές έννοιες της λέξης Apple που έχουν καταγραφεί στην DBpedia. Κάποιες από αυτές είναι πιθανό να μην έχουν το property rdfs:label οπότε και δεν θα παρουσιαστούν στα αποτελέσματα που θα προκύψουν συγκεντρωμένα στην html σελίδα. Διπλωματική εργασία-αναστασία Σταμπουλή 54

56 Εικόνα 21 Σύνδεσμοι αμφίσημων εννοιών στη DBpedia για τη λέξη Apple Παρατηρούμε τελικά ότι οι έννοιες που επιστρέφονται για τη λέξη Apple μετά το SPARQL query που θέτουμε στο SPARQL endpoint της DBpedia είναι οι εξής: -Apple (automobile) -Apple Corps - Apple River -Apple (band) -Apple Inc. -Apples, Vaud -Apple (album) -Apple Cup -Apple Daily -Apple Records -Apple Store (online) -Apple Valley Παρακάτω δίνονται τα αποτελέσματα που προέκυψαν δηλαδή οι φωτογραφίες που επιστράφηκαν ως σχετικές για την κάθε μία έννοια: Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

57 Διπλωματική εργασία-αναστασία Σταμπουλή 56

58 Τα αποτελέσματα αυτά προέκυψαν όταν η αναζήτηση εικόνων για μία έννοια γίνεται με κριτήριο να έχει χαρακτηριστεί με το σύνολο των ετικετών που αντιστοιχούν στην κάθε έννοια. Παρατηρούμε ότι για κάποιες έννοιες επιστρέφονται φωτογραφίες από το Flickr που είναι απολύτως σχετικές με το θέμα όπως για παράδειγμα οι Apple (automobile), Apple (band), Apples,Vaud κ.τ.λ. Όμως παρατηρούμε ότι για κάποιες έννοιες οι εικόνες που επιστρέφονται δεν ανταποκρίνονται στην πραγματική σημασία τους. Για παράδειγμα για τις έννοιες Apple Daily, Apple Cup και Apple Inc. Οι φωτογραφίες που επιστρέφει το Flickr δεν είναι ούτε στο ελάχιστο σχετικές με την πραγματική σημασία των λέξεων. Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

59 Η Apple Daily στην συγκεκριμένη περίπτωση είναι μία εφημερίδα που εκδίδεται στο Hong-Kong αλλά η αναζήτηση που έγινε για φωτογραφίες που να έχουν χαρακτηριστεί και με τις δύο ετικέτες(apple και Daily) δεν επέστρεψε κανένα σχετικό αποτέλεσμα. Αυτό συνέβη όχι επειδή έγινε λάθος χρήση των συγκεκριμένων ετικετών στις φωτογραφίες που επιστράφηκαν από το Flickr αλλά επειδή αυτές οι δύο ετικέτες υπάρχει περίπτωση να χαρακτηρίζουν και εικόνες που απεικονίζουν και άλλα πράγματα. Στην προκειμένη περίπτωση μπορεί να είναι μια φωτογραφία που να απεικονίζει το φρούτο apple και να έχει χαρακτηριστεί και με την ετικέτα daily καθώς μπορεί να απεικονίζει κάποια καθημερινή στιγμή από τη ζωή ενός ανθρώπου. Μετά την τροποποίηση στον κώδικα η οποία αφορά τις έννοιες που δεν περιλαμβάνουν κάποιους ειδικούς χαρακτήρες προκύπτουν τα παρακάτω αποτελέσματα: Διπλωματική εργασία-αναστασία Σταμπουλή 58

60 Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

61 Μεταξύ των δύο περιπτώσεων παρατηρούνται διαφορές μόνο στις έννοιες που οι λέξεις που τις αποτελούν χωρίζονται μεταξύ τους με ένα κενό. Σε κάποιες από αυτές όπως Apple River, Apple Records και Apple Valley οι εικόνες που επιστρέφονται από το Flickr σαν αποτέλεσμα της αναζήτησης ήταν σχετικές με τη συγκεκριμένη έννοια και στις δύο περιπτώσεις. Ενώ σε κάποιες άλλες έννοιες όπως η Apple Cup στην πρώτη περίπτωση που η αναζήτηση έγινε με δύο ετικέτες ( Apple και Cup ) τα αποτελέσματα δεν προσεγγίζουν ούτε στο ελάχιστο την πραγματική σημασία της έννοιας. Το Apple Cup στην DBpedia είναι το ετήσιο ποδοσφαιρικό παιχνίδι μεταξύ των δύο μεγαλύτερων πανεπιστημίων στις Ηνωμένες Πολιτείες. Όπως παρατηρούμε στην δεύτερη περίπτωση μετά την τροποποίηση του κώδικα και την αναζήτηση μόνο με μία ετικέτα( Apple Cup ) τα αποτελέσματα ανταποκρίνονται πλήρως στην πραγματική σημασία της έννοιας. Στην πρώτη περίπτωση την οποία αναφέραμε που τα αποτελέσματα είναι σχετικά και πριν αλλά και μετά την τροποποίηση αυτό πιθανόν συμβαίνει διότι η δεύτερη λέξη (εκτός από τη λέξη Apple) που υπάρχει στην έννοια είναι χαρακτηριστική λέξη. Οπότε είναι πολύ πιθανό η χαρακτηριστική αυτή λέξη να υπάρχει σαν ετικέτα μόνη της σε σχετικές φωτογραφίες χωρίς να είναι απαραίτητο να αποτελεί μέρος της ετικέτας που χαρακτηρίζει την φωτογραφία. Ως εκ τούτου τα αποτελέσματα που επιστρέφονται είναι σχετικά. Ενώ σε κάποιες άλλες έννοιες όπως Apple Inc. η δεύτερη λέξη δεν θεωρείται ιδιαιτέρως αντιπροσωπευτική της σημασίας της έννοιας που υπάρχει στην DBpedia οπότε και τα αποτελέσματα που επιστρέφονται δεν ικανοποιούν το χρήστη. Στην προκειμένη περίπτωση είναι απαραίτητη η αναζήτηση με μία ετικέτα. Διπλωματική εργασία-αναστασία Σταμπουλή 60

62 Athena Τέλος θα μελετήσουμε το σενάριο κατά το οποίο ο χρήστης θέλει να δει τα πιθανά disambiguation της λέξης Athena. Η σελίδα της DBpedia για την συγκεκριμένη λέξη είναι Στην Εικόνα 21 φαίνονται όλες οι πιθανές έννοιες της λέξης που έχουν καταγραφεί στην DBpedia. Κάποιες από αυτές είναι πιθανό να μην έχουν το property rdfs:label οπότε και δεν θα παρουσιαστούν στα αποτελέσματα που θα προκύψουν συγκεντρωμένα στην html σελίδα. Εικόνα 22 Σύνδεσμοι αμφίσημων εννοιών στη DBpedia για τη λέξη Athena Παρατηρούμε τελικά ότι οι έννοιες που επιστρέφονται για τη λέξη Athena μετά το SPARQL query που θέτουμε στο SPARQL endpoint της DBpedia είναι οι εξής: -Athena (Battlestar Galactica) - Athena (company) - Athena (rocket) - Athena (video game) - Athena (yacht) - Athena, Oregon - Athena (band) - Athena (film) - Athena (song) - Athena Asamiya -Apple Wissenschaftsmarketing Παρακάτω δίνονται τα αποτελέσματα που προέκυψαν δηλαδή οι φωτογραφίες που επιστράφηκαν ως σχετικές για την κάθε μία έννοια: Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

63 Διπλωματική εργασία-αναστασία Σταμπουλή 62

64 Αυτά τα αποτελέσματα προκύπτουν πριν από την τροποποίηση του κώδικα. Καθώς η μόνη έννοια που δεν περιέχει ειδικούς χαρακτήρες είναι η Athena Asamiya παραθέτουμε τις φωτογραφίες που επιστρέφονται μόνο για την συγκεκριμένη έννοια μετά την τροποποίηση που κάναμε στον τρόπο αναζήτησης. Τα αποτελέσματα είναι παρόμοια μιας και όπως εξηγήσαμε και στο προηγούμενο σενάριο αν όταν οι λέξεις που ακολουθούν την βασική λέξη,που στην προκειμένη περίπτωση είναι Athena, είναι χαρακτηριστικές τότε τα αποτελέσματα δεν διαφέρουν ως προς τη σχετικότητα τους σε μεγάλο βαθμός στις δύο περιπτώσεις(πριν και μετά την τροποποίηση). Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

65 Μια γενική παρατήρηση σχετικά με τα αποτελέσματα των σεναρίων είναι ότι υπάρχει περίπτωση να εμφανιστούν φωτογραφίες που μπορεί να πληρούν τις προϋποθέσεις δηλαδή να έχουν χαρακτηριστεί με όλες τις ετικέτες που υπάρχουν στη λίστα που έχει δημιουργηθεί για τη συγκεκριμένη έννοια παρ όλ αυτά όμως οι φωτογραφίες να μην είναι σχετικές με τη συγκεκριμένη έννοια. Αυτό μπορεί να συμβαίνει για διάφορους λόγους. Οι δύο πιο σημαντικοί λόγοι που μπορούμε να ξεχωρίσουμε είναι ότι οι χρήστες μπορεί να έχουν χρησιμοποιήσει ετικέτες για την συγκεκριμένη εικόνα που δεν την χαρακτηρίζουν πλήρως ή την χαρακτηρίζουν με λάθος τρόπο. Αυτό είναι λογικό και επόμενο καθώς όπως έχουμε αναλύσει και σε προηγούμενο κεφάλαιο ο χαρακτηρισμός εικόνων με ετικέτες έχει αρκετά υποκειμενικό χαρακτήρα. Επίσης υπάρχει περίπτωση να έχει γίνει σωστός χαρακτηρισμός με τις συγκεκριμένες ετικέτες που έχουν χρησιμοποιηθεί για μια εικόνα αλλά οι ετικέτες να υπάρχει περίπτωση να αναφέρονται σε παραπάνω από μία έννοιες. Τα μη σχετικά αποτελέσματα που προκύπτουν μετά από μία αναζήτηση έχουν να κάνουν με τα μειονεκτήματα που παρουσιάζουν τα social tagging systems στα οποία αναφερθήκαμε εκτενώς σε προηγούμενο κεφάλαιο. Μερικά από τα μειονεκτήματα αυτά αναφέρθηκαν και παραπάνω Geotags (specific locations) Υλοποίηση Στο συγκεκριμένο σενάριο το οποίο αφορά τις γεωγραφικές συντεταγμένες ο χρήστης μπορεί να ορίσει μια συγκεκριμένη γεωγραφική τοποθεσία η οποία τον ενδιαφέρει. Με τον ορισμό του συγκεκριμένου μέρους είτε πρόκειται για πόλη, είτε για χώρα είτε ακόμα και για ένα συγκεκριμένο μνημείο τότε μέσω ενός ερωτήματος που τίθεται στην DBpedia στο endpoint στο οποίο παρέχεται (OpenLink Virtuoso SPARQL Query) επιστρέφονται οι γεωγραφικές συντεταγμένες του συγκεκριμένου μέρους. Το SPARQL query είναι το εξής: PREFIX rdfs: < SELECT DISTINCT?label?lat?long WHERE { dbpedia:eiffel_tower geo:lat?lat. dbpedia:eiffel_tower geo:long?long.?subject geo:lat?lat. Διπλωματική εργασία-αναστασία Σταμπουλή 64

66 ?subject geo:long?long.?subject rdfs:label?label. FILTER(lang(?label) = "en"). } LIMIT 1 Το όνομα του μέρους που έχει ορίσει ο χρήστης θα πρέπει να είναι σύμφωνα με τον τρόπο που είναι ορισμένο το όνομα της συγκεκριμένης τοποθεσίας στην DBpedia για να μπορέσουν να επιστραφούν σωστά αποτελέσματα. Όμως τα συγκεκριμένα ονόματα μπορεί να περιλαμβάνουν χαρακτήρες οι οποίοι υπάρχει περίπτωση να δημιουργήσουν πρόβλημα στην διαδικασία που ακολουθεί μετά το ερώτημα στη DBpedia. Αναφερόμαστε σε χαρακτήρες όπως παρενθέσεις, κόμματα, άνω και κάτω παύλες οι οποίες υπάρχει περίπτωση να διαχωρίζουν κάποιες λέξεις μεταξύ τους ή να προσδίδουν ένα συγκεκριμένο νόημα σε κάποια λέξη. Όμως αν αφαιρεθούν δεν θα αλλοιωθεί το νόημα. Επιπρόσθετα θα διευκολυνθεί η επεξεργασία τους και θα επιστραφούν πιο σχετικά αποτελέσματα από το Flickr. Μετά τη συγκεκριμένη επεξεργασία όλες αυτές οι πληροφορίες προστίθενται σε μια λίστα. Η συγκεκριμένη λίστα περιλαμβάνει το όνομα του συγκεκριμένου μέρους(με τη μορφή που έχει μετά την αφαίρεση των χαρακτήρων που προαναφέραμε), το γεωγραφικό πλάτος και μήκος της τοποθεσίας. Η τριάδα αυτή των στοιχείων χαρακτηρίζει μοναδικά το συγκεκριμένο μέρος και θα συμβάλλει έτσι ώστε να επιστραφούν σχετικά αποτελέσματα από το Flickr. Έχει δημιουργηθεί μια συγκεκριμένη συνάρτηση η οποία καλείται για την τριάδα των στοιχείων που έχει δημιουργηθεί για το μέρος που επέλεξε ο χρήστης. Η συνάρτηση αυτή δημιουργήθηκε προκειμένου να επεξεργαστεί το όνομα της τοποθεσίας καθώς μπορεί να υπάρχουν λέξεις στην ονομασία οι οποίες δεν θα είχε κανένα νόημα να χαρακτηριστούν ως ετικέτες π.χ of, the κ.τ.λ. Μετά την επεξεργασία δημιουργείται μία λίστα από ετικέτες που χαρακτηρίζουν το συγκεκριμένο μέρος καθώς έχει γίνει διαχωρισμός των σημαντικών λέξεων που αποτελούν την ονομασία του. Η συνάρτηση χρησιμοποιείται και για τη δημιουργία ενός αρχείου xml το οποίο θα έχει το όνομα της συγκεκριμένης τοποθεσίας και στο εσωτερικό του αποθηκεύονται τα urls των φωτογραφιών που προέρχονται από το Flickr και πληρούν συγκεκριμένα κριτήρια. Στο συγκεκριμένο αρχείο καταγράφονται στοιχεία για την κάθε φωτογραφία που έχει χαρακτηριστεί με τις ετικέτες που ανήκουν στη λίστα που δημιουργήθηκε και πληρούν τα γεωγραφικά κριτήρια που έχουμε θέσει με βάση τις γεωγραφικές συντεταγμένες από τη DBpedia. Τα στοιχεία που καταγράφονται είναι τα εξής: url, τοποθεσία στην οποία αποθηκεύονται οι φωτογραφίες και έχει οριστεί από το χρήστη Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

67 στη συνάρτηση, οι υπόλοιπες ετικέτες που χαρακτηρίζουν τη φωτογραφία και έχουν καταχωρηθεί από χρήστες του Flickr ή από τον ίδιο το χρήστη ο οποίος ανέβασε τη συγκεκριμένη φωτογραφία. Μέσα στη συνάρτηση ορίζεται επίσης ο αριθμός των φωτογραφιών που θέλει ο χρήστης να επιστραφούν ως αποτέλεσμα της αναζήτησης του. Βασιζόμενοι στη συνάρτηση flickr.photos.search η οποία ανήκει στο API του Flickr ορίζουμε τον αριθμό των φωτογραφιών ανά σελίδα που θέλουμε να επιστραφούν, τη λίστα των ετικετών που ορίσαμε παραπάνω και αφορούν τη συγκεκριμένη τοποθεσία, το γεωγραφικό πλάτος και μήκος της συγκεκριμένης τοποθεσίας καθώς και την ακτίνα μέσα στην οποία ο χρήστης επιθυμεί να του επιστραφούν φωτογραφίες. Η λίστα των ετικετών θα πρέπει να είναι ορισμένη ως ένα string στο οποίο οι λέξεις χωρίζονται μεταξύ τους με κόμματα. Το γεωγραφικό πλάτος και μήκος της τοποθεσία έχει προκύψει από το ερώτημα που θέσαμε στo SPARQL endpoint. Η ακτίνα επίσης ορίζεται από το χρήστη αναλόγως με τα αποτελέσματα που θέλει να του επιστραφούν. Η μονάδα στην οποία ορίζεται η ακτίνα είναι τα km. Όσο πιο μεγάλο νούμερο ορίσουμε στην ακτίνα τόσο πιο πιθανό είναι να επιστραφούν αποτελέσματα τα οποία δεν θα είναι σχετικά με την τοποθεσία την οποία έχουμε επιλέξει. Στην αντίθετη περίπτωση βέβαια δηλαδή αν σαν ακτίνα οριστεί μια πολύ μικρή τιμή τότε ίσως ο αριθμός των φωτογραφιών που θα επιστραφεί να είναι πολύ περιορισμένος. Για την κάθε μία φωτογραφία που έχει επιστρέψει η συνάρτηση flickr.photos.search του Flickr API δημιουργείται ένα συγκεκριμένο όνομα το οποίο αποτελείται από το όνομα της τοποθεσίας και έναν αύξοντα αριθμό. Αυτή η διαδικασία γίνεται για να οριστεί το όνομα αποθήκευσης της φωτογραφίας σε μορφή jpeg στην τοποθεσία που έχει ορίσει ο χρήστης. Με αυτό τον τρόπο μπορεί ανά πάσα στιγμή να καταλάβει η κάθε φωτογραφία τι απεικονίζει. Οι φωτογραφίες αποθηκεύονται στη συγκεκριμένη διαδρομή με τη βοήθεια της εφαρμογής wget. Για την καλύτερη απεικόνιση των αποτελεσμάτων μας στη συνάρτηση δημιουργείται ένα html αρχείο. Το html αρχείο θα περιλαμβάνει το όνομα της τοποθεσίας καθώς και την σειρά φωτογραφιών που έχουν επιστραφεί από το Flickr οι οποίες είναι διαδοχικά τοποθετημένες για να έχει ο χρήστης μια καλύτερη εποπτεία των αποτελεσμάτων. Υπάρχει η δυνατότητα ορισμού του αριθμού των φωτογραφιών που θα εμφανίζονται σε κάθε γραμμή καθώς και του μεγέθους στο οποίο θα εμφανίζονται. Διπλωματική εργασία-αναστασία Σταμπουλή 66

68 Σενάρια χρήσης Eiffel Tower (Paris) Ο πύργος του Eiffel (Eiffel Tower) στο Παρίσι αποτελεί ένα από τα πιο γνωστά αξιοθέατα παγκοσμίως. Οι γεωγραφικές του συντεταγμένες οι οποίες προέκυψαν μετά από το SPARQL query που θέσαμε προς το SPARQL endpoint της DBpedia είναι οι εξής: Latitude: και Longitude: Ο σύνδεσμος του συγκεκριμένου μνημείου στην DBpedia είναι Αρχικά γίνεται το query μέσω του οποίου επιστρέφονται οι γεωγραφικές συντεταγμένες της συγκεκριμένης τοποθεσίας. Ακολούθως γίνεται λεκτική επεξεργασία καθώς η μορφή με την οποία παρουσιάζεται στην DBpedia ο πύργος του Eiffel είναι Eiffel_Tower. Γίνεται αφαίρεση της κάτω παύλας που διαχωρίζει τις δύο λέξεις της ονομασίας και ακολούθως καλείται η συνάρτηση μέσω της οποίας θα γίνει η αναζήτηση για σχετικές φωτογραφίες. Γίνεται διαχωρισμός των λέξεων οπότε η αναζήτηση θα γίνει με τις ετικέτες Eiffel και Tower, με τις γεωγραφικές συντεταγμένες που επιστράφηκαν από το query και μία συγκεκριμένη τιμή για την ακτίνα (radius). Ως τιμή για το όρισμα radius της συνάρτησης flickr.photo.search ορίσαμε το 0.1 καθώς θέλουμε οι φωτογραφίες που θα επιστραφούν να απεικονίζουν τον πύργο του Eiffel. Αν η ακτίνα είχε μεγαλύτερη τιμή μπορεί κάποιες από τις φωτογραφίες να απεικόνιζαν κάποια άλλα μέρη που βρίσκονται κοντά στον πύργο του Eiffel ή να ήτανε σχετικά μακρινές σε απόσταση. Ο αριθμός των φωτογραφιών που θα επιστραφούν από το Flickr είναι 50 γιατί μπορεί να θέσαμε ως τιμή του ορίσματος per_page την τιμή 10 αλλά ο αριθμός των σελίδων ορίστηκε ίσος με 5. Οπότε συνολικά θα επιστραφούν ως αποτέλεσμα της συγκεκριμένης αναζήτησης 50 φωτογραφίες που θα απεικονίζουν τον πύργο του Eiffel. Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

69 Όπως παρατηρούμε οι φωτογραφίες που επιστράφηκαν από το Flickr είναι απολύτως σχετικές με το θέμα μας. Όποτε συμπεραίνουμε ότι έχει γίνει σωστός χαρακτηρισμός των εικόνων με γεωγραφικές συντεταγμένες καθώς και ότι έγινε σωστή επιλογή ακτίνας για τη συγκεκριμένη αναζήτηση. Η επιλογή σωστής τιμής για την ακτίνα αποτελεί καθοριστικό παράγοντα για την επιτυχία της αναζήτησης σε περιπτώσεις που εμπλέκονται γεωγραφικές συντεταγμένες. Colosseum (Rome) Το Κολοσσαίο (Colosseum ή Roman Coliseum) είναι ένα ελλειπτικό αμφιθέατρο στο κέντρο της Ρώμης της πρωτεύουσας της Ιταλίας. Αποτελεί το μεγαλύτερο στάδιο το οποίο χτίστηκε ποτέ κατά τη διάρκεια της Ρωμαϊκής Αυτοκρατορίας. Είναι ένα από τα σπουδαιότερα δείγματα της Ρωμαϊκής αρχιτεκτονικής. Οι γεωγραφικές του συντεταγμένες οι οποίες προέκυψαν μετά από το SPARQL query που θέσαμε προς το SPARQL endpoint της DBpedia είναι οι εξής: Latitude: και Longitude: Ο σύνδεσμος του συγκεκριμένου μνημείου στην DBpedia είναι Όπως αντιλαμβανόμαστε δεν χρειάζεται να γίνει κάποια λεκτική επεξεργασία καθώς το όνομα του μνημείου αποτελείται από μία Διπλωματική εργασία-αναστασία Σταμπουλή 68

70 λέξη. Η αναζήτηση θα γίνει με την ετικέτα Colosseum, με τις γεωγραφικές συντεταγμένες που επιστράφηκαν από το query και μία συγκεκριμένη τιμή για την ακτίνα (radius). Ως τιμή για το όρισμα radius της συνάρτησης flickr.photo.search ορίσαμε πάλι το 0.1. Ο αριθμός των φωτογραφιών που θα επιστραφούν από το Flickr θα είναι ίσος με 50. Παρατηρούμε ότι το σύνολο των φωτογραφιών απεικονίζουν το Κολοσσαίο από διάφορες οπτικές γωνίες και από διαφορετικές αποστάσεις. Εντούτοις δεν υπάρχει καμία φωτογραφία η οποία να μην ανταποκρίνεται στα κριτήρια της αναζήτησης. Acropolis of Athens Το συγκεκριμένο σενάριο έχει ως κεντρική του έννοια της δική μας Ακρόπολη. Οι γεωγραφικές του συντεταγμένες οι οποίες προέκυψαν μετά από το SPARQL query που θέσαμε προς το SPARQL endpoint της DBpedia είναι οι εξής: Latitude: και Longitude: Ο σύνδεσμος του συγκεκριμένου μνημείου στην DBpedia είναι Acropolis_of_Athens. Όπως παρατηρούμε στη συγκεκριμένη περίπτωση εκτός από την αρχική επεξεργασία κατά την οποία θα αφαιρεθούν οι κάτω παύλες που αποτελούν τα διαχωριστικά μεταξύ των τριών Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

71 λέξεων της ονομασίας θα πρέπει να αφαιρεθεί και η λέξη of. Η λέξη of όπως έχουμε προαναφέρει είναι μία από τις λέξεις που δεν συμβάλλουν καθόλου στην επιτυχία της αναζήτησης και πρέπει να αφαιρεθούν. Μετά την αφαίρεση της λέξης γίνεται διαχωρισμός των άλλων δύο και η αναζήτηση διενεργείται με κριτήριο τις ετικέτες Acropolis και Athens. Οι φωτογραφίες που θα επιστραφούν θα πρέπει να χαρακτηρίζονται και με τις δύο ετικέτες(σχέση AND) Geotags (Near Places) Υλοποίηση Βασιζόμενοι πάλι στις γεωγραφικές συντεταγμένες οι οποίες επιστρέφονται ως αποτελέσματα queries προς τη DBpedia και τα οποία αναφέρονται σε συγκεκριμένες τοποθεσίες δημιουργήσαμε ένα ακόμα σενάριο. Στο συγκεκριμένο σενάριο το ερώτημα το οποίο τίθεται προς την DBpedia δεν επιστρέφει ως αποτέλεσμα τις γεωγραφικές συντεταγμένες της τοποθεσία που έχει επιλέξει ο χρήστης (τουλάχιστον όχι μόνο αυτές). Αλλά με τη βοήθεια του γεωγραφικού μήκους και πλάτους του συγκεκριμένου μέρους επιστρέφονται σαν αποτέλεσμα του ερωτήματος όλες οι τοποθεσίες οι οποίες απέχουν μέχρι μια συγκεκριμένη απόσταση από την αρχική Διπλωματική εργασία-αναστασία Σταμπουλή 70

72 τοποθεσία. Αυτό επιτυγχάνεται με τη χρήση φίλτρου στο SPARQL query που αποκλείει όλες εκείνες τις τοποθεσίες που το γεωγραφικό πλάτος και μήκος τους έχει τέτοια τιμή ώστε να ξεπερνάει μια συγκεκριμένη οριακή απόσταση(η οποία καθορίζεται από το χρήστη) σε σχέση πάντα με την γεωγραφική τοποθεσία του αρχικού μέρους. Ένα ακόμα κριτήριο για να επιστραφεί μια τοποθεσία ως αποτέλεσμα του ερωτήματος είναι το όνομα της στην DBpedia να είναι στην αγγλική γλώσσα. Το ερώτημα που θέσαμε προς το SPARQL endpoint δίνεται παρακάτω: PREFIX rdfs: < SELECT?subject?myLat?myLong?label?lat?long?mylabel WHERE { dbpedia:eiffel_tower geo:lat?mylat. dbpedia:eiffel_tower geo:long?mylong.?subject geo:lat?lat.?subject geo:long?long. dbpedia:eiffel_tower dbpprop:buildingname?mylabel.?subject rdfs:label?label. FILTER(xsd:float(?lat) - xsd:float(?mylat) <= 0.05 && xsd:float(?mylat) - xsd:float(?lat) <= 0.05 && xsd:float(?long) - xsd:float(?mylong) <= 0.05 && xsd:float(?mylong) - xsd:float(?long) <= 0.05 && lang(?label) = "en"). } LIMIT 20 Στη συνέχεια ορίζουμε μια list comprehension που είναι μια λίστα η οποία περιλαμβάνει εμφωλευμένες λίστες ίσες στον αριθμό με το όριο που έχουμε ορίσει στο query για τον αριθμό των τοποθεσιών που θέλουμε να μας επιστρέψει σαν αποτελέσματα. Ακολούθως για κάθε μία από τις τοποθεσίες θα δημιουργήσουμε μια λίστα η οποία θα περιλαμβάνει το όνομα της τοποθεσίας, το γεωγραφικό πλάτος και μήκος της. Αυτή η διαδικασία θα γίνει για όλες τις τοποθεσίες-αποτελέσματα του query και οι λίστες που θα δημιουργηθούν θα προστεθούν ως στοιχεία του list comprehension. Με αυτό τον τρόπο ακολούθως θα μπορεί να κληθεί η συνάρτηση για όλες τις πιθανές τριάδες και να επιστρέψει τα αποτελέσματα που επέστρεψε η geocrawlhtml.py όμως σαν σύνολο αυτή τη φορά. Στον φάκελο που έχει οριστεί από τη συγκεκριμένη διαδρομή θα βρίσκονται οι φωτογραφίες από το κάθε γειτονικό μέρος με όνομα το όνομα τη κάθε τοποθεσίας και έναν αύξοντα αριθμό. Βέβαια ο αριθμός των φωτογραφιών που θα υπάρχει για το κάθε μέρος μπορεί να ποικίλλει. Δηλαδή να επιστραφεί αριθμός φωτογραφιών μικρότερος του μέγιστου αριθμού που Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

73 έχουμε ορίσει μέσα στη συνάρτηση. Αυτό μπορεί να συμβεί για δύο λόγους: είτε γιατί για τη συγκεκριμένη τοποθεσία δεν υπάρχουν φωτογραφίες οι οποίες να χαρακτηρίζονται από τη λίστα των tags που έχουμε δημιουργήσει είτε γιατί υπάρχουν αλλά δεν ικανοποιούν το γεωγραφικό κριτήριο της ακτίνας που έχουμε ορίσει. Αν δεν υπάρχει αρκετές φωτογραφίες που να χαρακτηρίζονται με όλα τα tags της λίστας αυτό ίσως σημαίνει ότι η συγκεκριμένη τοποθεσία δεν είναι ιδιαίτερα γνωστή. Γεγονός αρκετά πιθανό καθώς η γνωστή τοποθεσία είναι η αρχική που έχουμε ορίσει ενώ οι γειτονικές τοποθεσίες που επιστρέφονται από το query μπορεί να πληρούν το κριτήριο της απόστασης από την κεντρική τοποθεσία αλλά να μην είναι ιδιαιτέρως γνωστές για κάποιο λόγο. Το συγκεκριμένο σενάριο εξυπηρετεί ένα συγκεκριμένο σκοπό. Αν κάποιος χρήστης ενδιαφέρεται για ένα συγκεκριμένο μέρος ή μνημείο μπορεί με αυτό τον τρόπο να ενημερωθεί για τα κοντινά μέρη που υπάρχουν σε αυτό. Το θετικό σε αυτό είναι ότι ο χρήστης δεν ενημερώνεται μόνο ονομαστικά για τα μέρη αλλά και οπτικά καθώς βλέπει φωτογραφίες που υπάρχουν στο Flick και αφορούν το συγκεκριμένο μέρος. Αυτό θα μπορούσε να εφαρμοστεί κάλλιστα σε μια τουριστική εφαρμογή καθώς ο χρήστης θα μπορούσε με κριτήριο τις φωτογραφίες που επιστρέφονται να αποφασίσει ποια από τα κοντινά μέρη ενός πολύ γνωστού αξιοθέατου αξίζει να επισκεφτεί ή πιο γενικά να μπορέσει να δει τις επιλογές του όταν βρίσκεται σε ένα συγκεκριμένο μέρος. Και σε αυτό το σενάριο αποθηκεύονται οι εικόνες των τοποθεσιών και δημιουργείται ένα αρχείο html το οποίο περιλαμβάνει συγκεντρωμένα τις φωτογραφίες όλων των τοποθεσιών με την εξής δομή. Στην αρχή δίνεται το όνομα της κεντρικής τοποθεσίας, οι γεωγραφικές της συντεταγμένες και στην επόμενη σειρά φωτογραφίες του συγκεκριμένου μέρους. Στην επόμενη σειρά δηλώνεται ότι στις παρακάτω φωτογραφίες απεικονίζονται μέρη γειτονικά στο κεντρικό και δίνεται και το συγκεκριμένο όριο απόστασης από το κεντρικό μέρος. Ακολούθως δίνεται το όνομα του μέρους και στην κάτω γραμμή η σειρά των φωτογραφιών του που προέρχονται από το Flickr και πληρούν τα συγκεκριμένα κριτήρια(tags και απόσταση από το κεντρικό μέρος). Οι φωτογραφίες των διαφόρων τοποθεσιών χωρίζονται μεταξύ τους μέσω μιας γραμμής. Διπλωματική εργασία-αναστασία Σταμπουλή 72

74 Σενάρια χρήσης Eiffel Tower Με τη χρήση φίλτρου στο SPARQL query που αποκλείει όλες εκείνες τις τοποθεσίες που το γεωγραφικό πλάτος και μήκος τους έχει τέτοια τιμή ώστε να ξεπερνάει μια συγκεκριμένη οριακή απόσταση(η οποία καθορίζεται από το χρήστη) σε σχέση πάντα με την γεωγραφική τοποθεσία του αρχικού μέρους. Η οριακή απόσταση στην δική μα ς περίπτωση ορίστηκε ως Θέσαμε ως περιορισμό ο αριθμός των μερών που θα πληρούν το συγκεκριμένο κριτήριο της απόστασης και θα επιστραφούν ως τοποθεσίες από το SPARQL query να είναι 10. Τα γειτονικά μέρη του πύργου του Eiffel που προκύπτουν με βάση τα συγκεκριμένα κριτήρια είναι τα εξής: - Montrouge - Vanves - Parc Montsouris -Paris School of Economics - Issy-les-Moulineaux - Malakoff - Petit-Montrouge - Val de Seine - Paris International Agricultural Show - Gare de Denfert-Rochereau Μετά την εύρεση των γειτονικών τοποθεσιών στον πύργο του Eiffel ακολουθούμε την ίδια διαδικασία που ακολουθήσαμε και στην προηγούμενη κατηγορία σεναρίων. Μόνο που σε αυτή την περίπτωση η συνάρτηση που έχουμε δημιουργήσει θα κληθεί τόσες φορές όσες και ο αριθμός των γειτονικών τοποθεσιών. Για την κάθε τοποθεσία γίνεται η κατάλληλη λεκτική επεξεργασία με αφαίρεση χαρακτήρων καθώς και περιττών λέξεων σε οποία περίπτωση αυτό απαιτείται. Με το SPARQL query που παραθέσαμε στο κεφάλαιο της υλοποίησης έχουμε διαθέσιμες τις γεωγραφικές συντεταγμένες όλων των γειτονικών μερών. Οπότε όπως αντιλαμβανόμαστε υπάρχει η δυνατότητα να γίνει αναζήτηση για το κάθε μέρος ξεχωριστά και να επιστραφούν σχετικές φωτογραφίες. Η ακτίνα σε αυτή την περίπτωση ορίζεται στο 0.5 καθώς μετά από πειραματισμούς διαπιστώσαμε ότι είναι μια λογική τιμή η οποία δίνει σχετικά αποτελέσματα. Αν τεθεί μικρότερη τιμή για την ακτίνα ο αριθμός των φωτογραφιών που προκύπτουν από την αναζήτηση μειώνεται. Το να θέσουμε τιμή 0.1 για την ακτίνα όπως κάναμε στην προηγούμενη κατηγορία σεναρίων θα ήταν άτοπο καθώς σε εκείνες τις περιπτώσεις μιλούσαμε για Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

75 κάποια μνημεία ενώ στο συγκεκριμένο σενάριο τα γειτονικά μέρη μπορεί να είναι μέχρι και κοντινές συνοικίες. Διπλωματική εργασία-αναστασία Σταμπουλή 74

76 Παρατηρούμε ότι σε αρκετές από τις τοποθεσίες δεν υπάρχουν διαθέσιμες φωτογραφίες που να πληρούν τα συγκεκριμένα κριτήρια που θέσαμε. Η αναζήτηση έγινε με πολλαπλές ετικέτες και όχι με την ονομασία των κοντινών τοποθεσιών ως μία ετικέτα. Colosseum Με τη χρήση φίλτρου στο SPARQL query που αποκλείει όλες εκείνες τις τοποθεσίες που το γεωγραφικό πλάτος και μήκος τους έχει τέτοια τιμή ώστε να ξεπερνάει μια συγκεκριμένη οριακή απόσταση(η οποία καθορίζεται από το χρήστη) σε σχέση πάντα με την γεωγραφική τοποθεσία του αρχικού μέρους. Η οριακή απόσταση στην δική μας περίπτωση ορίστηκε ως Θέσαμε ως περιορισμό ο αριθμός των μερών που θα πληρούν το συγκεκριμένο κριτήριο της απόστασης και θα επιστραφούν ως τοποθεσίες από το SPARQL query να είναι 20. Τα γειτονικά μέρη του πύργου του Κολοσσαίου που προκύπτουν με βάση τα συγκεκριμένα κριτήρια είναι τα εξής: - Circus of Maxentius - San Sebastiano fuori le mura - Ardeatine massacre - Basilica of Saint Paul Outside the Walls - Church of Domine Quo Vadis - Aurelian Walls - Porta San Sebastiano - Monte Testaccio - Pyramid of Cestius - Protestant Cemetery, Rome - San Giovanni in Oleo - San Giovanni a Porta Latina - San Saba, Rome - Baths of Caracalla - Santi Nereo e Achilleo Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

77 - Chiesa di Sant'Anselmo all'aventino - Fontana delle Anfore - Aventine Hill - Santi Bonifacio e Alessio - Porta Capena Μετά την εύρεση των γειτονικών τοποθεσιών στο Colosseum ακολουθούμε την ίδια διαδικασία που ακολουθήσαμε και στο προηγούμενο σενάριο. Για την κάθε τοποθεσία γίνεται η κατάλληλη λεκτική επεξεργασία με αφαίρεση χαρακτήρων καθώς και περιττών λέξεων σε οποία περίπτωση αυτό απαιτείται. Με το SPARQL query που παραθέσαμε στο κεφάλαιο της υλοποίησης έχουμε διαθέσιμες τις γεωγραφικές συντεταγμένες όλων των γειτονικών μερών. Οπότε όπως αντιλαμβανόμαστε υπάρχει η δυνατότητα να γίνει αναζήτηση για το κάθε μέρος ξεχωριστά και να επιστραφούν σχετικές φωτογραφίες. Η ακτίνα και σε αυτή την περίπτωση ορίζεται στο 0.5. Έχει οριστεί να επιστρέφονται το μέγιστο 10 εικόνες ανά έννοια. Για την ονομασία κάθε τοποθεσίας έγινε η αντίστοιχη λεκτική επεξεργασία όπως αναφέρθηκε και στο προηγούμενο παράδειγμα με αφαίρεση ειδικών χαρακτήρων και λέξεων. Η αναζήτηση θα γίνει με πολλαπλές ετικέτες δηλαδή για να επιστραφεί μια εικόνα θα πρέπει να έχει χαρακτηριστεί με το σύνολο των λέξεων που συνθέτουν την ονομασία της συγκεκριμένης τοποθεσία. Παρακάτω δίνονται τα αποτελέσματα που προέκυψαν σε μορφή αρχείου html. Διπλωματική εργασία-αναστασία Σταμπουλή 76

78 Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

79 Παρατηρούμε ότι για τις περισσότερες τοποθεσίες είτε δεν υπάρχουν καθόλου διαθέσιμες εικόνες είτε υπάρχουν πολύ λίγες γεγονός που μας οδηγεί στο συμπέρασμα ότι η αναζήτηση θα μπορούσε να βελτιωθεί. Το φαινόμενο αυτό μπορεί να συμβαίνει για δύο λόγους. Είναι πιθανό κάποια από αυτά μέρη τα οποία είναι γειτονικά στο Κολοσσαίο να μην είναι ιδιαιτέρως γνωστά στο ευρύ κοινό οπότε είναι λογικό να μην υπάρχουν πολλές φωτογραφίες τους αποθηκευμένες στο Flickr. Όμως αυτό που επίσης μπορεί να συμβαίνει στην προκειμένη περίπτωση είναι ότι επειδή πρόκειται για ονόματα τοποθεσιών ο χαρακτηρισμός τους να έχει γίνει με μία ετικέτα(ίδια με την ονομασία της τοποθεσίας). Τα περισσότερα κιόλας από τα παραπάνω ονόματα των τοποθεσιών αποτελούνται από 3 ή 4 λέξεις οπότε μειώνεται σημαντικά η πιθανότητα ένας χρήστης να έχει χαρακτηρίσει μία φωτογραφία που απεικονίζει τη συγκεκριμένη έννοια με τις 3 ή 4 συγκεκριμένες λέξεις. Να υπενθυμίσουμε ότι ισχύει η συνθήκη AND δηλαδή μια φωτογραφία θα πρέπει να έχει χαρακτηριστεί με το σύνολο των λέξεων για να επιστραφεί ως αποτέλεσμα. Μετά από την μικρή τροποποίηση του κώδικα (την ίδια που κάναμε και για το σενάριο με τα disambiguations σε προηγούμενο κεφάλαιο) προκύπτουν τα παρακάτω αποτελέσματα: Διπλωματική εργασία-αναστασία Σταμπουλή 78

80 Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

81 Διπλωματική εργασία-αναστασία Σταμπουλή 80

82 Παρατηρούμε ότι για τις περισσότερες τοποθεσίες ο αριθμός των φωτογραφιών που επιστρέφονται με τη δεύτερη μέθοδο είναι μεγαλύτερος. Εντούτοις υπάρχουν ακόμα κάποιες τοποθεσίες για τις οποίες δεν υπάρχουν διαθέσιμες εικόνες στο Flickr. Από μία μικρή έρευνα που έγινε στον συγκεκριμένο ιστότοπο διαπιστώθηκε ότι υπάρχουν σχετικές φωτογραφίες για τις συγκεκριμένες τοποθεσίες απλά δεν έχουν χαρακτηριστεί με γεωγραφικές συντεταγμένες και γι αυτό το λόγο δεν επιστρέφεται κάποιο αποτέλεσμα. Όπως αναφέραμε και προηγουμένως το συγκεκριμένο σενάριο που υλοποιήθηκε μπορεί να έχει άμεση εφαρμογή στον τουρισμό καθώς μπορεί να βοηθήσει τον χρήστη να εντοπίσει όλα τα κοντινά μέρη σε ένα αξιοθέατο και με τη βοήθεια οπτικού περιεχομένου(φωτογραφίες Flickr) να αποφασίσει ποια από αυτά τα μέρη αξίζει να επισκεφθεί. Όμως όπως καταλαβαίνουμε για μια τέτοια εφαρμογή θα είναι καλύτερο να επιστρέφονται αποτελέσματα για όλες τις κοντινές τοποθεσίες. Μπορούμε να ξεπεράσουμε το συγκεκριμένο εμπόδιο αν τροποποιήσουμε τον κώδικα έτσι ώστε να επιστρέφονται αποτελέσματα για μία τοποθεσία ακόμα και αν δεν πληρεί τα κριτήρια των γεωγραφικών συντεταγμένων είτε γιατί δεν έχει χαρακτηριστεί με γεωγραφικές συντεταγμένες είτε γιατί οι γεωγραφικές της συντεταγμένες δεν είναι μέσα στα καθορισμένα από το χρήστη όρια. Οπότε σε μια τέτοια περίπτωση ορίζουμε να επιστρέφονται ως αποτέλεσμα της αναζήτησης φωτογραφίες που έχουν χαρακτηριστεί με την ετικέτα που αντιστοιχεί στο όνομα της τοποθεσίας. Παρακάτω βλέπουμε τα αποτελέσματα για τις κοντινές τοποθεσίες στο Κολοσσαίο μετά την αλλαγή που προτείναμε. Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

83 Διπλωματική εργασία-αναστασία Σταμπουλή 82

84 Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

85 Παρατηρούμε ότι με το συνδυασμό των δύο μεθόδων τα αποτελέσματα που επιστρέφονται είναι εμφανώς βελτιωμένα. Παρατηρώντας τα αποτελέσματα για τις τοποθεσίες που δεν είχαν διαθέσιμες εικόνες με το προηγούμενο σενάριο προκύπτει ότι τα αποτελέσματα που προέκυψαν από την τροποποίηση είναι σε πολύ μεγάλο βαθμό σχετικά με την τοποθεσία. Αυτό συμβαίνει παρ όλο που οι συγκεκριμένες εικόνες δεν έχουν χαρακτηριστεί με γεωγραφικές συντεταγμένες. Η τροποποίηση που προτείναμε είναι μία βελτιωμένη πρόταση λόγω του γεγονότος ότι αρκετοί χρήστες δεν έχουν ακόμα εξοικειωθεί με το φαινόμενο του χαρακτηρισμού των εικόνων τους με γεωγραφικές συντεταγμένες. Tower of London Με τη χρήση φίλτρου στο SPARQL query που αποκλείει όλες εκείνες τις τοποθεσίες που το γεωγραφικό πλάτος και μήκος τους έχει τέτοια τιμή ώστε να ξεπερνάει μια συγκεκριμένη οριακή απόσταση(η οποία καθορίζεται από το χρήστη) σε σχέση πάντα με την γεωγραφική τοποθεσία του αρχικού μέρους. Η οριακή απόσταση στην δική μα ς περίπτωση ορίστηκε ως Θέσαμε ως περιορισμό ο αριθμός των μερών που θα πληρούν το συγκεκριμένο κριτήριο της απόστασης και θα επιστραφούν ως τοποθεσίες από το SPARQL query να είναι 20. Τα γειτονικά μέρη του πύργου του Λονδίνου (Tower of London) που προκύπτουν με βάση τα συγκεκριμένα κριτήρια είναι τα εξής: - River Peck - Champion Hill Διπλωματική εργασία-αναστασία Σταμπουλή 84

86 - A2217 Road - East Dulwich Railway Station - East Dulwich - Nunhead - Brixton tube station - Brixton railway station - Brixton - Stockwell - Nunhead Cemetery - East Brixton railway station - Brockley railway station - Brixton Academy - Telegraph Hill Lewisham - Loughborough junction railway station - Nunhead railway station - Demark Hill - Demark Hill railway station - Peckham Rye railway station Μετά την εύρεση των γειτονικών τοποθεσιών στο Tower of London ακολουθούμε την ίδια διαδικασία που ακολουθήσαμε και στο προηγούμενο σενάριο. Για την κάθε τοποθεσία γίνεται η κατάλληλη λεκτική επεξεργασία με αφαίρεση χαρακτήρων καθώς και περιττών λέξεων(π.χ. of) σε οποία περίπτωση αυτό απαιτείται. Με το SPARQL query που παραθέσαμε στο κεφάλαιο της υλοποίησης έχουμε διαθέσιμες τις γεωγραφικές συντεταγμένες όλων των γειτονικών μερών. Οπότε όπως αντιλαμβανόμαστε υπάρχει η δυνατότητα να γίνει αναζήτηση για το κάθε μέρος ξεχωριστά και να επιστραφούν σχετικές φωτογραφίες. Η ακτίνα και σε αυτή την περίπτωση ορίζεται στο 0.5. Έχει οριστεί να επιστρέφονται το μέγιστο 10 εικόνες ανά έννοια. Για την ονομασία κάθε τοποθεσίας έγινε η αντίστοιχη λεκτική επεξεργασία όπως αναφέρθηκε και στο προηγούμενο παράδειγμα με αφαίρεση ειδικών χαρακτήρων και λέξεων. Η αναζήτηση θα γίνει με πολλαπλές ετικέτες δηλαδή για να επιστραφεί μια εικόνα θα πρέπει να έχει χαρακτηριστεί με το σύνολο των λέξεων που συνθέτουν την ονομασία της συγκεκριμένης τοποθεσία. Παρακάτω δίνονται τα αποτελέσματα που προέκυψαν σε μορφή αρχείου html. Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

87 Διπλωματική εργασία-αναστασία Σταμπουλή 86

88 Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

89 Παρακάτω δίνονται τα αποτελέσματα που προέκυψαν όταν η αναζήτηση για τις συγκεκριμένες τοποθεσίες έγινε με το όνομα της τοποθεσίας σαν μία ετικέτα. Και σε αυτή την περίπτωση τα αποτελέσματα που προκύπτουν είναι σαφώς βελτιωμένα σε σχέση με την προηγούμενη περίπτωση. Διπλωματική εργασία-αναστασία Σταμπουλή 88

90 Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

91 Κεφάλαιο 5. Συμπεράσματα-Μελλοντικές τάσεις 5.1. Αποτελέσματα έρευνας και συμπεράσματα Ο χαρακτηρισμός με ετικέτες των εικόνων που έχουν δημοσιευτεί στο διαδίκτυο μπορεί να περιγραφεί σαν μια αλτρουιστική πράξη καθώς οι χρήστες συνεισφέρουν σε μία κοινή γνωσιακή βάση. Η κοινωνική σήμανση αντικειμένων ευνοεί την ανάπτυξη κοινοτήτων που οι οποίες αποτελούνται από άτομα που μοιράζονται κοινά ενδιαφέροντα και απόψεις. Με αυτό τον τρόπο παρέχονται πληροφορίες σχετικά με διάφορες περιοχές ενδιαφέροντος και τον τρόπο με τον οποίο αυτές περιγράφονται. Είναι μια νέα διέξοδος στον τρόπο με τον οποίο σκέφτονται οι χρήστες και επιπρόσθετα δίνει μία νέα οπτική γωνία στον τρόπο με τον οποίο διαμορφώνονται οι ανάγκες πληροφόρησης που έχουν οι χρήστες [Hayman2007] Γενικότερα έχουν προκύψει κάποιες συζητήσεις σχετικά με τη χρησιμότητα των συστημάτων κοινωνικής σήμανσης. Οι συζητήσεις αυτές επικεντρώνονται στη χρήση αυτών των συστημάτων για την ανακάλυψη πόρων καθώς και για την οργάνωση γνώσης που είναι γενικότερα ένας σχετικά αφηρημένος όρος εκ φύσεως. Η άποψη που υποστηρίζεται από πολλούς ερευνητές που ασχολούνται με το συγκεκριμένο ζήτημα είναι ότι η εμφάνιση τέτοιου είδους συστημάτων που επιτρέπουν το χαρακτηρισμό με ετικέτες από κάθε χρήστη θα εκτοπίσει τη χρήση ελεγχόμενων λεξιλογίων με σκοπό την ανακάλυψη πόρων και την οργάνωση γνώσης. Αυτό θα Διπλωματική εργασία-αναστασία Σταμπουλή 90

92 συμβεί διότι τα συστήματα που χρησιμοποιούν ελεγχόμενο λεξιλόγιο δεν μπορούν να συμβαδίσουν με τις σύγχρονες πληροφοριακές ανάγκες του χρήστη [Macgregor2006]. Με την ανάπτυξη των συστημάτων κοινωνικής σήμανσης δημιουργήθηκε σε ένα σχετικά σύντομο χρονικό διάστημα ένας πολύ μεγάλος όγκος πληροφορίας. Αυτό οδήγησε πολλούς ερευνητές σε σκέψη για τον τρόπο με τον οποίο θα μπορούσαν να εκμεταλλευθούν αυτές τις πληροφορίες για διάφορους σκοπούς. Όπως όμως έχουμε αναφέρει σε προηγούμενα κεφάλαια οι πληροφορίες οι οποίες προέρχονται από τους χρήστες υπάρχει περίπτωση να μπορούν να ερμηνευθούν με πολλούς διαφορετικούς τρόπος καθώς έχουν ένα καθαρά υποκειμενικό χαρακτήρα. Ο υποκειμενικός τους χαρακτήρας βασίζεται στο γεγονός ότι στα περισσότερα συστήματα τέτοιου είδους δίνεται στους χρήστες η δυνατότητα να επιλέξουν ελεύθερα τις ετικέτες που θα χρησιμοποιήσουν για να χαρακτηρίσουν τα αντικείμενα χωρίς να υπάρχει κάποιου είδους έλεγχος ή επιλογή ετικετών μέσα από κάποιο συγκεκριμένο λεξιλόγιο. Ένα σημαντικό ζήτημα σε τέτοιου είδους συστήματα που οι χρήστες μπορούν να επιλέξουν ελεύθερα τις ετικέτες που θα χρησιμοποιήσουν είναι η αμφισημία των εννοιών που αντιπροσωπεύουν οι ετικέτες. Το πραγματικό νόημα μιας ετικέτας είναι προφανές για το δημιουργό της αλλά όχι και για όλους τους υπόλοιπους χρήστες. Υπάρχουν κάποια παραδείγματα ετικετών που χρησιμοποιούνται σαν βάση για τη δημιουργία mashups τα οποία υποστηρίζουν με αποδοτικό τρόπο τη διασύνδεση μεταξύ των πηγών πληροφόρησης και λειτουργίες σε σχέση με τη διαχείριση του περιεχομένου τους [Hagemann2009]. Ένα άλλο ζήτημα που προκύπτει σε τέτοιου είδους συστήματα είναι η γεωγραφική τοποθέτηση των αντικειμένων που χαρακτηρίζονται με ετικέτες. Λόγω της αυξημένης χρήσης των ψηφιακών φωτογραφιών τα τελευταία χρόνια υπάρχουν πολλοί χρήστες οι οποίοι είναι διατεθειμένοι να μοιραστούν τις φωτογραφίες τους και γενικότερα τις εμπειρίες του σε ιστοτόπους όπως είναι το Flickr. Το Flickr πλέον περιλαμβάνει δισεκατομμύρια φωτογραφιών και γι αυτό το λόγο η αναζήτηση των χρηστών με βάση κάποια αντικείμενα ενδιαφέροντος τους δυσχεραίνει. Εντούτοις έχει διαπιστωθεί ότι η επιστροφή αποτελεσμάτων με μόνο κριτήριο την αντιστοίχηση των ετικετών δεν επιστρέφει καθόλου ικανοποιητικά αποτελέσματα για σύνθετες αναζητήσεις. Ένα από τα σημαντικά ζητήματα που αφορούν αυτό το θέμα είναι η δημιουργία φωτογραφικής συλλογής όλων των χαρακτηριστικών τοποθεσιών μιας πόλης το οποίο αναφέρεται στη βιβλιογραφία ως πρόβλημα εύρεσης χαρακτηριστικών τοποθεσιών (landmark finding problem) [Abbasi2009]. Η εφαρμογή παρόμοιων τεχνικών σε άλλους τομείς εκτός των τοποθεσιών και γενικότερα των χαρακτηριστικών που καθορίζονται από γεωγραφικές συντεταγμένες μπορούν να Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

93 συμβάλλουν στη βελτίωση της γνώσης που έχουμε για τον κόσμο που μας περιβάλλει[kennedy2008] Λόγω του ασαφή χαρακτήρα των πληροφοριών δημιουργήθηκε η ανάγκη συνδυασμού πληροφοριών από πολλές πηγές γνώσης προκειμένου οι πληροφορίες που παρέχονται στους χρήστες να έχουν ένα πιο έγκυρο χαρακτήρα και να παράγονται καλύτερης ποιότητας αποτελέσματα στις διάφορες αναζητήσεις των χρηστών. Οι παραπάνω λόγοι οδήγησαν στη δημιουργία του φαινομένου των mashups. Οι εφαρμογές που βασίζονται σε mashups δεν λαμβάνουν στατικές πληροφορίες αλλά υψηλής ποιότητας προεπεξεργασμένα στοιχεία που καθιστούν τις πληροφορίες πολυτιμότερες. Στη συγκεκριμένη εργασία αποφασίσαμε να υλοποιήσουμε μία σύγκλιση(mashup) που θα συνδέει την DBpedia με το Flickr δηλαδή οδηγεί στο συνδυασμό των πληροφοριών που παρέχει η DBpedia με τις πληροφορίες που παρέχουν οι ετικέτες που χαρακτηρίζουν τις δημοσιευμένες φωτογραφίες του Flickr. Η σύγκλιση αυτή έχει ως στόχο την επιστροφή αποτελεσμάτων καλύτερης ποιότητας σε διάφορες αναζητήσεις χρηστών στον ιστότοπο Flickr.Τα σενάρια τα οποία αναπτύχθηκαν προκειμένου να μπορέσουμε να διαπιστώσουμε την λειτουργικότητα της συγκεκριμένης εφαρμογής και το κατά πόσο επιτυχημένο είναι το mashup το οποίο αναπτύξαμε ανάμεσα στη DBpedia και στο Flickr χωρίζονται σε δύο κατηγορίες. Η πρώτη κατηγορία περιλαμβάνει τις αμφίσημες έννοιες μιας λέξης ενώ η δεύτερη σχετίζεται άμεσα με τον χαρακτηρισμό φωτογραφιών με γεωγραφικές συντεταγμένες. Παρακάτω θα καταδείξουμε τη χρησιμότητα των σεναρίων που επιλέξαμε να υλοποιήσουμε και θα αναφερθούμε σε πρακτικές εφαρμογές που θα μπορούσαν να έχουν. Το σενάριο με τις διαφορετικές ερμηνείες (disambiguation) που μπορεί να επιδεχτεί μια λέξη μπορεί να συμβάλλει στην ενημέρωση του χρήστη για όλες τις πιθανές έννοιες της συγκεκριμένης λέξης. Σε αυτό συμβάλλει βέβαια και η παρουσίαση με οπτικά μέσα που γίνεται μέσω των σχετικών φωτογραφιών που παρουσιάζονται από το Flickr. Αυτό το σύστημα θα μπορούσε να χρησιμοποιηθεί για να βοηθήσει το χρήστη στην περίπτωση που θέλει να ενημερωθεί για κάποια συγκεκριμένη έννοια. Επίσης θα μπορούσε να χρησιμοποιηθεί και σε κάποιο σύστημα το οποίο θα είναι ενσωματωμένο σε έναν ιστότοπο όπως είναι το Flickr και θα βοηθούσε τους χρήστες στην επιλογή σχετικών ετικετών μέσω προτεινόμενων ετικετών σχετικών με τη βασική έννοια. Ένα τέτοιο σύστημα θα συνέβαλλε σε πολύ μεγάλο βαθμό προκειμένου οι ετικέτες που χαρακτηρίζουν ένα αντικείμενο να έχουν μεγαλύτερη συνάφεια με αυτό και να αποτρέπονται οι αμφισημίες και οι ετικέτες οι οποίες έχουν πολύ προσωπικό χαρακτήρα. Με αυτό τον τρόπο η ποιότητα των Διπλωματική εργασία-αναστασία Σταμπουλή 92

94 πληροφοριών που παρέχεται από αυτού του είδους τους ιστοτόπους θα είναι ιδιαίτερα υψηλή. Το σενάριο το οποίο συνδυάζει τις γεωγραφικές συντεταγμένες μιας τοποθεσίας με χαρακτηριστικές ετικέτες που την αντιπροσωπεύουν μπορεί να φανεί ιδιαιτέρως χρήσιμο για τουριστικούς σκοπούς. Μπορεί να συμβάλλει έτσι ώστε κάποιος τουρίστας ή γενικότερα κάποιος χρήστη ο οποίος δεν είναι εξοικειωμένος με τη συγκεκριμένη τοποθεσία να ενημερωθεί μέσω φωτογραφιών για το συγκεκριμένο μέρος. Το σενάριο αυτό κυρίως βρίσκει χρήση σε σημαντικά μνημεία τα οποία κάποιος θεωρεί ως απαραίτητο προορισμό κατά τη διάρκεια ενός ταξιδιού σε κάποια χώρα του εξωτερικού ή της χώρας του. Το σύστημα επιστρέφει απόλυτα σχετικές φωτογραφίες καθώς χρησιμοποιεί και τις γεωγραφικές συντεταγμένες εκτός από τις ετικέτες που χαρακτηρίζουν τις αποθηκευμένες φωτογραφίες. Μια ακόμα χρήση του συγκεκριμένου σεναρίου μπορεί να είναι μια εφαρμογή αυτόματου εντοπισμού τοπογραφικών μνημείων. Αυτό βέβαια μπορεί να υλοποιηθεί σε συνδυασμό και με άλλες τεχνολογίες του παγκόσμιου ιστού. Μία πιθανή επέκταση της συγκεκριμένης εφαρμογής μπορεί να είναι όχι μόνο ο προσδιορισμός χαρακτηριστικών τοποθεσιών αλλά και άλλων επίκαιρων φωτογραφιών όπως αυτοκίνητα, κινητά τηλέφωνα κ.τ.λ Στο τρίτο και τελευταίο σενάριο το ερώτημα το οποίο τίθεται προς την DBpedia δεν επιστρέφει ως αποτέλεσμα τις γεωγραφικές συντεταγμένες της τοποθεσία που έχει επιλέξει ο χρήστης (τουλάχιστον όχι μόνο αυτές). Αλλά με τη βοήθεια του γεωγραφικού μήκους και πλάτους του συγκεκριμένου μέρους επιστρέφονται σαν αποτέλεσμα του ερωτήματος όλες οι τοποθεσίες οι οποίες απέχουν μέχρι μια συγκεκριμένη απόσταση από την αρχική τοποθεσία. Το συγκεκριμένο σενάριο εξυπηρετεί ένα συγκεκριμένο σκοπό. Αν κάποιος χρήστης ενδιαφέρεται για ένα συγκεκριμένο μέρος ή μνημείο μπορεί με αυτό τον τρόπο να ενημερωθεί για τα κοντινά μέρη που υπάρχουν σε αυτό. Το θετικό σε αυτό είναι ότι ο χρήστης δεν ενημερώνεται μόνο ονομαστικά για τα μέρη αλλά και οπτικά καθώς βλέπει φωτογραφίες που υπάρχουν στο Flick και αφορούν το συγκεκριμένο μέρος. Αυτό θα μπορούσε να εφαρμοστεί κάλλιστα σε μια τουριστική εφαρμογή καθώς ο χρήστης θα μπορούσε με κριτήριο τις φωτογραφίες που επιστρέφονται να αποφασίσει ποια από τα κοντινά μέρη ενός πολύ γνωστού αξιοθέατου αξίζει να επισκεφτεί ή πιο γενικά να μπορέσει να δει τις επιλογές του όταν βρίσκεται σε ένα συγκεκριμένο μέρος. Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

95 5.2. Μελλοντικές τάσεις Η ανάπτυξη του σημασιολογικού ιστού προχωράει με σταθερά βήματα. Το κάθε βήμα που γίνεται προς αυτή την κατεύθυνση χτίζει ένα ακόμα επίπεδο πάνω στα προηγούμενα. Αυτού του είδους η τακτική σχετίζεται με το γεγονός ότι είναι καλύτερα να επιτευχθεί η συναίνεση όλων επιχειρώντας κάτι τέτοιο με μικρά βήματα ενώ είναι πολύ πιο δύσκολο να επιτευχθεί αυτός ο στόχος αν γίνουν βιαστικές κινήσεις που θα απαιτούν πολύ μεγάλη προσπάθεια από όλους τους χρήστες του ιστού. Συνήθως υπάρχουν πολλές ερευνητικές ομάδες που προχωρούν προς διαφορετικές κατευθύνσεις. Αυτό ο ανταγωνισμός ιδεών που προκύπτει από το συγκεκριμένο γεγονός αποτελεί την κινητήρια δύναμη για επιστημονική πρόοδο. Παραδείγματος χάριν εάν καθιερωθεί ένα πρότυπο πολύ περισσότερες ομάδες και επιχειρήσεις θα το υιοθετήσουν αντί να περιμένουν να δούνε τα αποτελέσματα των εναλλακτικών ερευνητικών γραμμών δηλαδή το κατά πόσο αυτές θα θεωρηθούν επιτυχημένες στο τέλος[el-fadeel2008]. Ο διευθύνων σύμβουλος της Google, Eric Schmidt, έδωσε έναν από τους πιο σαφείς ορισμούς του Web 3.0 όταν ρωτήθηκε από μέλος του κοινού στο Digital Forum της Σεούλ. Το στέλεχος της Google, αφού δήλωσε αστειευόμενος ότι και το Web 2.0 είναι «όρος του μάρκετινγκ», έδωσε έναν από τους πιο σαφείς ορισμούς μέχρι σήμερα του Web 3.0.Ο κ. Schmidt δήλωσε ότι ενώ το Web 2.0 βασίστηκε περισσότερο σε Ajax, το Web 3.0 θα απαρτίζεται από «εφαρμογές που θα λειτουργούν όλες μαζί».οι εφαρμογές θα είναι σχετικά μικρές, εξαιρετικά γρήγορες, θα μπορούν να «τρέξουν» σε οποιονδήποτε υπολογιστή και να τροποποιηθούν από τον οποιονδήποτε ενώ θα διατίθενται μέσα από κοινωνικά δίκτυα, κλπ. Το Web στη σημερινή εποχή αποτελεί μία τεράστια πηγή πληροφοριών διαθέσιμες σε όλους τους χρήστες αλλά χωρίς να υπάρχει πάντα η δυνατότητα επεξεργασίας τους από τους υπολογιστές. Το παράδοξο είναι ότι αυτές οι πληροφορίες βρίσκονται «παγιδευμένες» μέσα σε σελίδες HTML έχοντας μία συγκεκριμένη μορφή την οποία είναι δύσκολο να επεξεργαστούν οι υπολογιστικές μηχανές. Το επονομαζόμενο Web 3.0 το οποίο πιθανότατα θα αποτελέσει τον προάγγελο του πραγματικού σημασιολογικού ιστού έχει την φιλοδοξία να αλλάξει τη συγκεκριμένη κατάσταση. Αυτό που εννοούμε με τον όρο Web 3.0 είναι ότι βασικοί ιστότοποι θα μετατραπούν σε υπηρεσίες του ιστού και θα εξάγουν με αποτελεσματικό τρόπο τις πληροφορίες που περιέχουν στο ευρύ κοινό. Διπλωματική εργασία-αναστασία Σταμπουλή 94

96 Αυτή η μετατροπή θα συμβεί με έναν από δύο πιθανούς τρόπους. Κάποιοι ιστότοποι θα ακολουθήσουν το παράδειγμα του Amazon, του del.icio.us και του Flickr και θα παρέχουν πληροφορίες μέσω ενός API. Ο δεύτερος τρόπος ο οποίος μπορεί να ακολουθηθεί είναι ότι κάποιοι ιστότοποι θα προσπαθήσουν να κρατήσουν σε ιδιωτικό επίπεδο τις πληροφορίες που κατέχουν αλλά θα διαθέσουν ένα μέρος των πληροφοριών αυτών μέσω mashups τα οποία θα δημιουργηθούν χρησιμοποιώντας υπηρεσίες όπως τα Dapper 37, Teqlo 38 και Yahoo! Pipes 39. Το αποτέλεσμα από τέτοιου είδους κινήσεις θα είναι οι πληροφορίες χωρίς μία συγκεκριμένη δομή να δομηθούν με ένα συγκεκριμένο τρόπο γεγονός το οποίο θα επιτρέπει την εκμετάλλευση τους με τον καλύτερο δυνατό τρόπο. Αυτή η ουσιώδης μετατροπή έχει αρχίσει ήδη να επιτελείται και θα διαπιστώσουμε σε κάποια χρόνια με ποιο τρόπο μπορεί να εξελιχθεί[iskold2007]. Στο παρακάτω σχήμα απεικονίζεται η γενική μορφή της διαδικασίας με την οποία θα προκύψουν δομημένες πληροφορίες από τις διάφορες πηγές πληροφοριών του παγκόσμιου ιστού που δεν έχουν κάποια συγκεκριμένη δομή και ως εκ τούτου δεν μπορούν να χρησιμοποιηθούν με κανέναν τρόπο. Εικόνα 23 Διαδικασία εξαγωγής δομημένων πληροφοριών από τις πηγές πληροφοριών του παγκόσμιου ιστού Συνεργατικότητα/Ενοποίηση Web 2.0 δεδομένων- Ιούνιος

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

1 Συστήματα Αυτοματισμού Βιβλιοθηκών 1 Συστήματα Αυτοματισμού Βιβλιοθηκών Τα Συστήματα Αυτοματισμού Βιβλιοθηκών χρησιμοποιούνται για τη διαχείριση καταχωρήσεων βιβλιοθηκών. Τα περιεχόμενα των βιβλιοθηκών αυτών είναι έντυπα έγγραφα, όπως βιβλία

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Εξαγωγή γεωγραφικής πληροφορίας από δεδομένα παρεχόμενα από χρήστες του

Διαβάστε περισσότερα

Διασύνδεση και Άνοιγμα Δεδομένων του Α.Π.Θ. Καραογλάνογλου Κωνσταντίνος Μονάδα Σημασιολογικού Ιστού Α.Π.Θ 18/3/2014

Διασύνδεση και Άνοιγμα Δεδομένων του Α.Π.Θ. Καραογλάνογλου Κωνσταντίνος Μονάδα Σημασιολογικού Ιστού Α.Π.Θ 18/3/2014 Διασύνδεση και Άνοιγμα Δεδομένων του Α.Π.Θ. Καραογλάνογλου Κωνσταντίνος Μονάδα Σημασιολογικού Ιστού Α.Π.Θ 18/3/2014 Ανοικτά και Συνδεδεμένα Δεδομένα Ανοικτά Δεδομένα Πληροφορίες, δημόσιες ή άλλες, στις

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13. Κεφάλαιο 1 ο Αρχές Διαχείρισης πληροφορίας στον Παγκόσμιο Ιστό... 15

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13. Κεφάλαιο 1 ο Αρχές Διαχείρισης πληροφορίας στον Παγκόσμιο Ιστό... 15 ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος... 13 Κεφάλαιο 1 ο Αρχές Διαχείρισης πληροφορίας στον Παγκόσμιο Ιστό... 15 1.1 Εισαγωγή... 16 1.2 Διαδίκτυο και Παγκόσμιος Ιστός Ιστορική αναδρομή... 17 1.3 Αρχές πληροφοριακών συστημάτων

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΠΑΙΔΑΓΩΓΙΚΟ ΙΝΣΤΙΤΟΥΤΟ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ Κ Υ Κ Λ Ο Υ Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ Κ Α Ι Υ Π Η Ρ Ε Σ Ι Ω Ν Τ Ε Χ Ν Ο Λ Ο Γ Ι Κ Η

Διαβάστε περισσότερα

Κοινωνικές επισημάνσεις (social bookmarking)

Κοινωνικές επισημάνσεις (social bookmarking) Κοινωνικές επισημάνσεις (social bookmarking) Παλαιγεωργίου Γιώργος Τμήμα Πληροφορικής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Ιανουάριος 2009 Social Bookmarking Ιστορικά στοιχεία - Τι είναι; 13/1 1 Κοινωνικές

Διαβάστε περισσότερα

Δικτυακοί τόποι. Η σχεδίαση ενός δικτυακού τόπου. Δρ. Ματθαίος Α. Πατρινόπουλος

Δικτυακοί τόποι. Η σχεδίαση ενός δικτυακού τόπου. Δρ. Ματθαίος Α. Πατρινόπουλος Δικτυακοί τόποι Η σχεδίαση ενός δικτυακού τόπου Δρ. Ματθαίος Α. Πατρινόπουλος Πώς χρησιμοποιούμε το διαδίκτυο; ΔΙΑΦΑΝΕΙΕΣ ΤΟΥ ΜΑΘΗΜΑΤΟΣ ΣΧΕΔΙΑΣΜΟΣ ΚΑΙ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΔΙΑΔΙΚΤΥΟΥ. 2 Από το www.smartinsights.

Διαβάστε περισσότερα

ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: ΣΥΓΓΡΑΦΕΑΣ:

ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: ΣΥΓΓΡΑΦΕΑΣ: ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: Υπολογιστικά Συστήµατα & Τεχνολογίες Πληροφορικής ΣΥΓΓΡΑΦΕΑΣ: Γιώργος Γιαννόπουλος, διδακτορικός φοιτητής

Διαβάστε περισσότερα

Αναζητήσεις στο Διαδίκτυο

Αναζητήσεις στο Διαδίκτυο Αναζητήσεις στο Διαδίκτυο Πλεονεκτήματα από τη χρήση του Διαδικτύου για την αναζήτηση πληροφοριών Υπάρχει πληθώρα πληροφοριών (που περιλαμβάνουν μεγάλο εύρος από media). Οι μαθητές καθίστανται «ερευνητές

Διαβάστε περισσότερα

Eρευνητική εργασία Β Λυκείου με θέμα: Κοινωνικά δίκτυα στην εκπαίδευση, νέα εργαλεία, νέες προοπτικές, νέες προκλήσεις

Eρευνητική εργασία Β Λυκείου με θέμα: Κοινωνικά δίκτυα στην εκπαίδευση, νέα εργαλεία, νέες προοπτικές, νέες προκλήσεις Ομάδα Ο.Π.Α.Π.Σ. Eρευνητική εργασία Β Λυκείου με θέμα: Κοινωνικά δίκτυα στην εκπαίδευση, νέα εργαλεία, νέες προοπτικές, νέες προκλήσεις Βαρσάμης Παναγιώτης, Μπέρμπεης Γιάννης, Πλατής Σωτήρης, Τσαγγαίος

Διαβάστε περισσότερα

Σχεδίαση και Ανάπτυξη Ιστότοπων

Σχεδίαση και Ανάπτυξη Ιστότοπων Σχεδίαση και Ανάπτυξη Ιστότοπων Ιστορική Εξέλιξη του Παγκόσμιου Ιστού Παρουσίαση 1 η 1 Βελώνης Γεώργιος Καθηγητής Περιεχόμενα Τι είναι το Διαδίκτυο Βασικές Υπηρεσίες Διαδικτύου Προηγμένες Υπηρεσίες Διαδικτύου

Διαβάστε περισσότερα

Το FUTURE Time Traveller έκλεισε ένα χρόνο!

Το FUTURE Time Traveller έκλεισε ένα χρόνο! Το FUTURE Time Traveller έκλεισε ένα χρόνο! Πριν από 12 μήνες, η πολυεθνική μας ομάδα ξεκίνησε μια μελλοντική πρωτοβουλία με στόχο να μετασχηματίσει τον προσανατολισμό της σταδιοδρομίας για την Γενιά Z

Διαβάστε περισσότερα

Ενσωματωμένα controls τα οποία προσαρμόζονται και χρησιμοποιούνται σε οποιαδήποτε ιστοσελίδα επιλέγει ο φορέας.

Ενσωματωμένα controls τα οποία προσαρμόζονται και χρησιμοποιούνται σε οποιαδήποτε ιστοσελίδα επιλέγει ο φορέας. Η Πυξίδα Απασχόλησης είναι ένα πλήρως παραμετροποιήσιμο portal που απευθύνεται σε Κέντρα Επαγγελματικής Κατάρτισης, Δήμους, Εκπαιδευτικούς Οργανισμούς και Εταιρίες Εύρεσης Εργασίας, με στόχο τόσο την μηχανογράφηση

Διαβάστε περισσότερα

Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού

Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΤΑ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Διπλωματική Εργασία με θέμα: Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού Καραγιάννης Ιωάννης Α.Μ.

Διαβάστε περισσότερα

Ένα WEB2 διαδικτυακό εργαλείο μάθησης. Κων/νος Κεραμάρης Βιολόγος

Ένα WEB2 διαδικτυακό εργαλείο μάθησης. Κων/νος Κεραμάρης Βιολόγος Ένα WEB2 διαδικτυακό εργαλείο μάθησης Κων/νος Κεραμάρης Βιολόγος To Wikispaces είναι μια πλατφόρμα με την οποία ο χρήστης μπορεί να δημιουργήσει το δικό του Wiki. Τα Wiki είναι διαδικτυακοί

Διαβάστε περισσότερα

Εννοιολογική Ομοιογένεια

Εννοιολογική Ομοιογένεια Ιόνιο Πανεπιστήμιο Τμήμα Αρχειονομίας Βιβλιοθηκονομίας Εργαστήριο Ψηφιακών Βιβλιοθηκών και Ηλεκτρονικής Δημοσίευσης Εννοιολογική Ομοιογένεια Αξιοποίηση Ταξινομικών Συστημάτων Γεωργία Προκοπιάδου, Διονύσης

Διαβάστε περισσότερα

ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι

ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι Συστήματα Υποστήριξης Αποφάσεων Τα Συστήματα Υποστήριξης Αποφάσεων (Σ.Υ.Α. - Decision Support Systems, D.S.S.) ορίζονται ως συστήματα

Διαβάστε περισσότερα

Η χρήση των wikis στις βιβλιοθήκες: δημιουργία "διαδραστικών" συλλογώναποθετηρίων. Το wiki της Βιβλιοθήκης του Μουσείου Μπενάκη.

Η χρήση των wikis στις βιβλιοθήκες: δημιουργία διαδραστικών συλλογώναποθετηρίων. Το wiki της Βιβλιοθήκης του Μουσείου Μπενάκη. Η χρήση των wikis στις βιβλιοθήκες: δημιουργία "διαδραστικών" συλλογώναποθετηρίων γνώσης Το wiki της Βιβλιοθήκης του Μουσείου Μπενάκη Πανωραία Γαϊτάνου Βιβλιοθηκονόμος MSc Βιβλιοθήκη Μουσείου Μπενάκη gaitanou@benaki.gr,

Διαβάστε περισσότερα

Μέρος 3 ο : Βασικές Έννοιες για δυναμικές ιστοσελίδες

Μέρος 3 ο : Βασικές Έννοιες για δυναμικές ιστοσελίδες Μέρος 3 ο : Βασικές Έννοιες για δυναμικές ιστοσελίδες Εισαγωγή-Σκοπός. Τρόποι δημιουργίας δυναμικών ιστοσελίδων. Dynamic Web Pages. Dynamic Web Page Development Using Dreamweaver. Τρόποι δημιουργίας δυναμικών

Διαβάστε περισσότερα

Σχεδιαστικά Προγράμματα Επίπλου

Σχεδιαστικά Προγράμματα Επίπλου Σχεδιαστικά Προγράμματα Επίπλου Καθηγήτρια ΦΕΡΦΥΡΗ ΣΩΤΗΡΙΑ Τμήμα ΣΧΕΔΙΑΣΜΟΥ & ΤΕΧΝΟΛΟΓΙΑΣ ΞΥΛΟΥ - ΕΠΙΠΛΟΥ Σχεδιαστικά Προγράμματα Επίπλου Η σχεδίαση με τον παραδοσιακό τρόπο απαιτεί αυξημένο χρόνο, ενώ

Διαβάστε περισσότερα

Οδηγίες Χρήσης Πλατφόρμας Ασύγχρονης Τηλεκπαίδευσης (Moodle) του Τμήματος ΔΕΤ

Οδηγίες Χρήσης Πλατφόρμας Ασύγχρονης Τηλεκπαίδευσης (Moodle) του Τμήματος ΔΕΤ Οδηγίες Χρήσης Πλατφόρμας Ασύγχρονης Τηλεκπαίδευσης (Moodle) του Τμήματος ΔΕΤ -Για τους Φοιτητές- Έκδοση 1.2 Οκτώβριος 2015 Υπεύθυνος Σύνταξης: Χρήστος Λάζαρης (lazaris@aueb.gr) Πίνακας Περιεχομένων Εισαγωγή...

Διαβάστε περισσότερα

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Τεχνολογίες Κοινωνικής Δικτύωσης στην Εκπαίδευση

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Τεχνολογίες Κοινωνικής Δικτύωσης στην Εκπαίδευση ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Τεχνολογίες Κοινωνικής Δικτύωσης στην Εκπαίδευση Ομάδα: Αριστερίδου Δανάη Ελένη (08) Ευαγγελόπουλος Νίκος (670)

Διαβάστε περισσότερα

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3 Ανάπτυξη Οντολογίας Βιοϊατρικών Όρων Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3 www.iatrolexi.cti.gr 1 Ερευνητικό Ακαδημαϊκό Ινστιτούτο Τεχνολογίας Υπολογιστών (ΕΑΙΤΥ) Σελίδα 1 Ημερομηνία:

Διαβάστε περισσότερα

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ

GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΣΠΟΥ ΑΣΤΗΣ: Γιαννόπουλος Γεώργιος ΕΠΙΒΛΕΠΩΝ: Καθ. Ι. Βασιλείου ΒΟΗΘΟΙ: Α. ηµητρίου, Θ. αλαµάγκας Γενικά Οι µηχανές αναζήτησης

Διαβάστε περισσότερα

Εννοιολογική χαρτογράφηση: Διδακτική αξιοποίηση- Αποτελέσματα για το μαθητή

Εννοιολογική χαρτογράφηση: Διδακτική αξιοποίηση- Αποτελέσματα για το μαθητή Το λογισμικό της εννοιολογικής χαρτογράυησης Inspiration Η τεχνική της εννοιολογικής χαρτογράφησης αναπτύχθηκε από τον καθηγητή Joseph D. Novak, στο πανεπιστήμιο του Cornell. Βασίστηκε στις θεωρίες του

Διαβάστε περισσότερα

Σύγχρονες Προσεγγίσεις στη Διδακτική

Σύγχρονες Προσεγγίσεις στη Διδακτική Σύγχρονες Προσεγγίσεις στη Διδακτική Ορολογία Ορισμοί Μέθοδος διδασκαλίας θεωρείται ένα πρότυπο (pattern) οργάνωσης του μαθήματος και συμπεριφοράς του εκπαιδευτικού. Στρατηγική διδασκαλίας. Περιλαμβάνει

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΣΥΣΤΗΜΑΤΟΣ ΠΛΗΡΟΦΟΡΙΩΝ ΓΗΣ ΜΕ ΧΡΗΣΗ ΠΟΛΥΜΕΣΩΝ ΕΦΑΡΜΟΓΗ: ΤΟΥΡΙΣΤΙΚΟΣ ΟΔΗΓΟΣ ΤΗΣ ΑΘΗΝΑΣ

ΑΝΑΠΤΥΞΗ ΣΥΣΤΗΜΑΤΟΣ ΠΛΗΡΟΦΟΡΙΩΝ ΓΗΣ ΜΕ ΧΡΗΣΗ ΠΟΛΥΜΕΣΩΝ ΕΦΑΡΜΟΓΗ: ΤΟΥΡΙΣΤΙΚΟΣ ΟΔΗΓΟΣ ΤΗΣ ΑΘΗΝΑΣ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΤΜΗΜΑ ΑΓΡΟΝΟΜΩΝ ΚΑΙ ΤΟΠΟΓΡΑΦΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΤΟΠΟΓΡΑΦΙΑΣ-ΕΡΓΑΣΤΗΡΙΟ ΦΩΤΟΓΡΑΜΜΕΤΡΙΑΣ ΑΝΑΠΤΥΞΗ ΣΥΣΤΗΜΑΤΟΣ ΠΛΗΡΟΦΟΡΙΩΝ ΓΗΣ ΜΕ ΧΡΗΣΗ ΠΟΛΥΜΕΣΩΝ ΕΦΑΡΜΟΓΗ: ΤΟΥΡΙΣΤΙΚΟΣ ΟΔΗΓΟΣ ΤΗΣ

Διαβάστε περισσότερα

Αναλυτικό Πρόγραμμα Μαθηματικών

Αναλυτικό Πρόγραμμα Μαθηματικών Αναλυτικό Πρόγραμμα Μαθηματικών Σχεδιασμός... αντιμετωπίζει ενιαία το πλαίσιο σπουδών (Προδημοτική, Δημοτικό, Γυμνάσιο και Λύκειο), είναι συνέχεια υπό διαμόρφωση και αλλαγή, για να αντιμετωπίζει την εξέλιξη,

Διαβάστε περισσότερα

Αξιοποίηση κοινωνικών δικτύων στην εκπαίδευση Αλέξης Χαραλαμπίδης Γραφικές Τέχνες / Πολυμέσα Ενότητα Ιανουαρίου 2015

Αξιοποίηση κοινωνικών δικτύων στην εκπαίδευση Αλέξης Χαραλαμπίδης Γραφικές Τέχνες / Πολυμέσα Ενότητα Ιανουαρίου 2015 Αξιοποίηση κοινωνικών δικτύων στην εκπαίδευση Αλέξης Χαραλαμπίδης 90279 Γραφικές Τέχνες / Πολυμέσα Ενότητα 61 18 Ιανουαρίου 2015 Web 2.0 Ενσωμάτωση στις εφαρμογές του παγκόσμιου ιστού (www) στοιχείων:

Διαβάστε περισσότερα

Αναζητήσεις στο Διαδίκτυο

Αναζητήσεις στο Διαδίκτυο Αναζητήσεις στο Διαδίκτυο Διαδίκτυο ως πηγή πληροφοριών Το Διαδίκτυο στις μέρες μας αποτελεί την μεγαλύτερη πηγή πληροφοριών. Οι Δάσκαλοι πρέπει να εκπαιδεύσουν τους μαθητές να αναζητούν σωστά και να αξιοποιούν

Διαβάστε περισσότερα

ΧΩΡΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ

ΧΩΡΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΧΩΡΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ ΜΕΛΕΤΗ ΓΙΑ ΤΗΝ ΕΚΤΙΜΗΣΗ ΤΗΣ ΑΛΗΘΟΦΑΝΕΙΑΣ ΤΩΝ ΧΩΡΙΚΩΝ ΣΧΕΣΕΩΝ (COGNITIVE PLAUSIBILITY ASSESSMENT)... 2 ΣΥΝΔΥΑΣΜΟΣ ΤΟΠΟΛΟΓΙΚΩΝ ΚΑΙ ΚΑΤΕΥΘΥΝΤΗΡΙΩΝ ΣΧΕΣΕΩΝ ΣΕ ΧΩΡΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ...

Διαβάστε περισσότερα

Μελέτη Συνεργατικής Δραστηριότητας Μαθητών Αξιοποιώντας την Τεχνολογία Wiki

Μελέτη Συνεργατικής Δραστηριότητας Μαθητών Αξιοποιώντας την Τεχνολογία Wiki Μελέτη Συνεργατικής Δραστηριότητας Μαθητών Αξιοποιώντας την Τεχνολογία Wiki Δ. Κράββαρης Δευτεροβάθμια Εκπαίδευση, jkravv@gmail.com Περίληψη Η παρούσα έρευνα μελετά τη συνεργατική δραστηριότητα μαθητών

Διαβάστε περισσότερα

Κοινωνικά Δίκτυα & Καλές Περιβαλλοντικές Πρακτικές

Κοινωνικά Δίκτυα & Καλές Περιβαλλοντικές Πρακτικές Κοινωνικά Δίκτυα & Καλές Περιβαλλοντικές Πρακτικές Αγγελική Καραματσούκη karamaag@gmail.com Πράσινες Ιδέες 22/10/2014 Γνωριμία 2 Αγγελική Καραματσούκη Πτυχίο Νοσηλευτικής, Πτυχίο Πληροφορικής Διδακτορικό

Διαβάστε περισσότερα

Σχολιάστε αν τα εκπαιδευτικά αντικείμενα (όπως: φύλλα διδασκαλίας, εργασίας. και αξιολόγησης μαθητών και υποστηρικτικό υλικό) καλύπτουν τους

Σχολιάστε αν τα εκπαιδευτικά αντικείμενα (όπως: φύλλα διδασκαλίας, εργασίας. και αξιολόγησης μαθητών και υποστηρικτικό υλικό) καλύπτουν τους 1 Αξιολόγηση Web2 για Επικοινωνία Άννα Χουντάλα ΑΜ 11Μ13 1ο Κριτήριο Αξιολόγησης Σχολιάστε αν τα εκπαιδευτικά αντικείμενα (όπως: φύλλα διδασκαλίας, εργασίας και αξιολόγησης μαθητών και υποστηρικτικό υλικό)

Διαβάστε περισσότερα

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές Μεταπτυχιακό Δίπλωμα Ειδίκευσης Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές Δρ. Κακαρόντζας Γεώργιος Επίκουρος Καθηγητής Τμ. Μηχανικών Πληροφορικής Τ.Ε. Μηχανική Λογισμικού για Διαδικτυακές

Διαβάστε περισσότερα

ΟΔΗΓΟΣ ΧΡΗΣΗΣ ΥΠΗΡΕΣΙΑΣ [ΥΠΗΡΕΣΊΑ 4 - ΑΝΆΠΤΥΞΗ

ΟΔΗΓΟΣ ΧΡΗΣΗΣ ΥΠΗΡΕΣΙΑΣ [ΥΠΗΡΕΣΊΑ 4 - ΑΝΆΠΤΥΞΗ ΟΔΗΓΟΣ ΧΡΗΣΗΣ ΥΠΗΡΕΣΙΑΣ [ΥΠΗΡΕΣΊΑ 4 - ΑΝΆΠΤΥΞΗ ΗΛΕΚΤΡΟΝΙΚΉΣ ΥΠΗΡΕΣΊΑΣ ΑΝΑΖΉΤΗΣΗΣ ΕΘΕΛΟΝΤΏΝ ΚΑΙ ΕΠΑΓΓΕΛΜΑΤΙΏΝ] ΓΙΑ ΤΟN ΧΡΗΣΤΗ [13/01/2014] έκδοση: 1.0 1 Περιεχόμενα 1. Έλεγχος εγγράφου...3 2. Εισαγωγή...4

Διαβάστε περισσότερα

Τεχνολογία Πολυμέσων. Ενότητα 6: Υπερκείμενο - Υπερμέσα. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Τεχνολογία Πολυμέσων. Ενότητα 6: Υπερκείμενο - Υπερμέσα. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ Τεχνολογία Πολυμέσων Ενότητα 6: Υπερκείμενο - Υπερμέσα Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό

Διαβάστε περισσότερα

Fake News ΕΛΛΗΝΙΚΟ ΚΕΝΤΡΟ ΑΣΦΑΛΟΥΣ ΔΙΑΔΙΚΤΥΟΥ. Γραμμή βοηθείας Ενημέρωση-Επαγρύπνηση Γραμμή παράνομου περιεχομένου

Fake News ΕΛΛΗΝΙΚΟ ΚΕΝΤΡΟ ΑΣΦΑΛΟΥΣ ΔΙΑΔΙΚΤΥΟΥ. Γραμμή βοηθείας Ενημέρωση-Επαγρύπνηση Γραμμή παράνομου περιεχομένου Fake News ΕΛΛΗΝΙΚΟ ΚΕΝΤΡΟ ΑΣΦΑΛΟΥΣ ΔΙΑΔΙΚΤΥΟΥ 210 6007686 www.safeline.gr Γραμμή βοηθείας Ενημέρωση-Επαγρύπνηση Γραμμή παράνομου περιεχομένου Η διασπορά ψευδών ειδήσεων ήταν και συνεχίζει να είναι ένα

Διαβάστε περισσότερα

Ανοιχτά Λογισμικά Βιβλιοθηκών & Web 2.0 Το παράδειγμα του Koha

Ανοιχτά Λογισμικά Βιβλιοθηκών & Web 2.0 Το παράδειγμα του Koha Ανοιχτά Λογισμικά Βιβλιοθηκών & Web 2.0 Το παράδειγμα του Koha Κολοβός Φίλιππος Βιβλιοθήκη & Κέντρο Πληροφόρησης Πανεπιστήμιο Μακεδονίας, Οικονομικών και Κοινωνικών Επιστημών Web 1.0 Η παλαιότερη «έκδοση»

Διαβάστε περισσότερα

Ενότητα 1η. Εισαγωγή στην Πληροφορική

Ενότητα 1η. Εισαγωγή στην Πληροφορική Ενότητα 1η Εισαγωγή στην Πληροφορική 1.1 Τι είναι Πληροφορική Ένας σύντομος ορισμός για το τι είναι πληροφορική είναι ο παρακάτω: όλα εκείνα που χρειάζεται κανείς για να παράγει, να οργανώνει και να διαχειρίζεται

Διαβάστε περισσότερα

ΕΙ ΙΚΑ ΚΕΦΑΛΑΙΑ ΧΑΡΤΟΓΡΑΦΙΑΣ ΧΑΡΤΟΓΡΑΦΙΑ ΧΑΡΤΗΣ ΧΡΗΣΗ ΗΜΙΟΥΡΓΙΑ. β. φιλιππακοπουλου 1

ΕΙ ΙΚΑ ΚΕΦΑΛΑΙΑ ΧΑΡΤΟΓΡΑΦΙΑΣ ΧΑΡΤΟΓΡΑΦΙΑ ΧΑΡΤΗΣ ΧΡΗΣΗ ΗΜΙΟΥΡΓΙΑ. β. φιλιππακοπουλου 1 ΧΑΡΤΟΓΡΑΦΙΑ ΑΝΑΠΑΡΑΣΤΑΣΗ ΧΑΡΤΗΣ ΓΕΩΓΡΑΦΙΚΟΣ ΧΩΡΟΣ ΗΜΙΟΥΡΓΙΑ ΧΡΗΣΗ β. φιλιππακοπουλου 1 Αναλυτικό Πρόγραµµα 1. Εισαγωγή: Μια επιστηµονική προσέγγιση στη χαρτογραφική απεικόνιση και το χαρτογραφικό σχέδιο

Διαβάστε περισσότερα

Βιογραφικό Σημείωμα. Published on career.uop.gr ( Τι είναι το Βιογραφικό Σημείωμα. Η μορφή του Βιογραφικού Σημειώματος

Βιογραφικό Σημείωμα. Published on career.uop.gr (  Τι είναι το Βιογραφικό Σημείωμα. Η μορφή του Βιογραφικού Σημειώματος Published on career.uop.gr (https://career.uop.gr) Αρχική > Συμβουλευτική > Βιογραφικό Σημείωμα Βιογραφικό Σημείωμα Τι είναι το Βιογραφικό Σημείωμα Η μορφή του Βιογραφικού Σημειώματος Τα είδη του Βιογραφικού

Διαβάστε περισσότερα

Πίνακας Προτεινόμενων Πτυχιακών Εργασιών

Πίνακας Προτεινόμενων Πτυχιακών Εργασιών ΕΝ4.0-Α Έκδοση η / 7..06 ΣΧΟΛΗ: ΣΔΟ ΤΜΗΜΑ: Βιβλιοθηκονομίας και Συστημάτων Πληροφόρησης ΤΟΜΕΑΣ: Τομέας Μαθημάτων Γενικής Παιδείας και Τεχνολογιών Πληροφόρησης Α/Α Τίτλος Θέματος Μέλος Ε.Π. Σύντομη Περιγραφή

Διαβάστε περισσότερα

Τα Διδακτικά Σενάρια και οι Προδιαγραφές τους. του Σταύρου Κοκκαλίδη. Μαθηματικού

Τα Διδακτικά Σενάρια και οι Προδιαγραφές τους. του Σταύρου Κοκκαλίδη. Μαθηματικού Τα Διδακτικά Σενάρια και οι Προδιαγραφές τους του Σταύρου Κοκκαλίδη Μαθηματικού Διευθυντή του Γυμνασίου Αρχαγγέλου Ρόδου-Εκπαιδευτή Στα προγράμματα Β Επιπέδου στις ΤΠΕ Ορισμός της έννοιας του σεναρίου.

Διαβάστε περισσότερα

Διαδικασίες παραγωγής λογισμικού. Βασικές αρχές Τεχνολογίας Λογισμικού, 8η αγγ. έκδοση

Διαδικασίες παραγωγής λογισμικού. Βασικές αρχές Τεχνολογίας Λογισμικού, 8η αγγ. έκδοση Διαδικασίες παραγωγής λογισμικού Περιεχόμενα Παρουσίαση μοντέλων διεργασίας ανάπτυξης λογισμικού Περιγραφή τριών γενικών μοντέλων διεργασίας ανάπτυξης λογισμικού Γενική περιγραφή των διαδικασιών που περιλαμβάνονται

Διαβάστε περισσότερα

ΕΠΛ 003: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Μηχανές αναζήτησης

ΕΠΛ 003: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Μηχανές αναζήτησης ΕΠΛ 003: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Μηχανές αναζήτησης Στόχοι 1 Να εξηγήσουμε για ποιον λόγο μας είναι απαραίτητες οι μηχανές αναζήτησης στον Παγκόσμιο Ιστό. Να περιγράψουμε κάποιους από τους

Διαβάστε περισσότερα

2 ο ΠΕ.Κ.Ε.Σ. Ιονίων Νήσων Μπαρμπόπουλος Γεώργιος Συντονιστής Εκπαιδευτικού Έργου κλ. ΠΕ86

2 ο ΠΕ.Κ.Ε.Σ. Ιονίων Νήσων Μπαρμπόπουλος Γεώργιος Συντονιστής Εκπαιδευτικού Έργου κλ. ΠΕ86 2 ο ΠΕ.Κ.Ε.Σ. Ιονίων Νήσων Μπαρμπόπουλος Γεώργιος Συντονιστής Εκπαιδευτικού Έργου κλ. ΠΕ86 Η παιδαγωγική-διδακτική αξιοποίηση του διαδικτύου, των υπηρεσιών Web 2.0 και της δυνατότητας οι χρήστες να είναι

Διαβάστε περισσότερα

Παραδοτέο Π.2.1. Υπερχώρος και διαχείριση μοντέλων

Παραδοτέο Π.2.1. Υπερχώρος και διαχείριση μοντέλων Έργο: Τίτλος Υποέργου: «ΘΑΛΗΣ: Ενίσχυση της Διεπιστημονικής ή και Διιδρυματικής έρευνας και καινοτομίας με δυνατότητα προσέλκυσης ερευνητών υψηλού επιπέδου από το εξωτερικό μέσω της διενέργειας βασικής

Διαβάστε περισσότερα

ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΤΕΧΝΟΛΟΓΙΩΝ ΔΙΑΔΙΚΤΥΑΚΩΝ ΥΠΗΡΕΣΙΩΝ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗ ΤΗΣ ΤΕΧΝΟΛΟΓΙΑΣ REST ΠΛΑΣΤΑΡΑΣ ΕΥΡΙΠΙΔΗΣ

ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΤΕΧΝΟΛΟΓΙΩΝ ΔΙΑΔΙΚΤΥΑΚΩΝ ΥΠΗΡΕΣΙΩΝ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗ ΤΗΣ ΤΕΧΝΟΛΟΓΙΑΣ REST ΠΛΑΣΤΑΡΑΣ ΕΥΡΙΠΙΔΗΣ ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΤΕΧΝΟΛΟΓΙΩΝ ΔΙΑΔΙΚΤΥΑΚΩΝ ΥΠΗΡΕΣΙΩΝ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗ ΤΗΣ ΤΕΧΝΟΛΟΓΙΑΣ REST ΠΛΑΣΤΑΡΑΣ ΕΥΡΙΠΙΔΗΣ ΘΕΣΣΑΛΟΝΙΚΗ, 2016 ΕΙΣΑΓΩΓΗ Μια διαδικτυακή υπηρεσία μπορεί να περιγραφεί απλά σαν μια οποιαδήποτε

Διαβάστε περισσότερα

Ηλεκτρονικό εμπόριο. HE 8 Εξατομίκευση

Ηλεκτρονικό εμπόριο. HE 8 Εξατομίκευση Ηλεκτρονικό εμπόριο HE 8 Εξατομίκευση Πληροφοριακός υπερφόρτος (information overload) Αδυναμία διαχείρισης μεγάλου όγκου πληροφοριών και εντοπισμού της χρήσιμης πληροφορίας Η εξατομίκευση στοχεύει στην

Διαβάστε περισσότερα

Δρ. Μιχάλης Παρασκευάς. Δ/ντης Διεύθυνσης Πανελλήνιου Σχολικού Δικτύου και Δικτυακών Τεχνολογιών

Δρ. Μιχάλης Παρασκευάς. Δ/ντης Διεύθυνσης Πανελλήνιου Σχολικού Δικτύου και Δικτυακών Τεχνολογιών Πανελλήνιο Σχολικό Δίκτυο Το Δίκτυο στην υπηρεσία της Εκπαίδευσης Οι υπηρεσίες και ο ρόλος του Πανελλήνιου Σχολικού Δικτύου στη δομούμενη Κοινωνία της Γνώσης Δρ. Μιχάλης Παρασκευάς Δ/ντης Διεύθυνσης Πανελλήνιου

Διαβάστε περισσότερα

ΕΠΛ 002: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Μηχανές αναζήτησης

ΕΠΛ 002: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Μηχανές αναζήτησης ΕΠΛ 002: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Μηχανές αναζήτησης Στόχοι 1 Να εξηγήσουμε για ποιον λόγο μας είναι απαραίτητες οι μηχανές αναζήτησης στον Παγκόσμιο Ιστό. Να περιγράψουμε κάποιους από τους

Διαβάστε περισσότερα

CRM για Εκπαιδευτικούς Φορείς

CRM για Εκπαιδευτικούς Φορείς Cosmos Business Systems S.A. Group CRM για Εκπαιδευτικούς Φορείς CRM Εκπαιδευτικών Φορέων Το CRM Εκπαιδευτικών Φορέων έχει αναπτυχθεί για να ικανοποιήσει τις ανάγκες διαχείρισης του υποψήφιου πελατολογίου

Διαβάστε περισσότερα

Εισαγωγή στις Αρχές της Επιστήμης των ΗΥ

Εισαγωγή στις Αρχές της Επιστήμης των ΗΥ Εισαγωγή στις Αρχές της Επιστήμης των ΗΥ 2.3.1.1. Παπαγιάννη Νάσια Ηλεκτρολόγος Μηχανικός και Μηχανικός Υπολογιστών ΕΜΠ 1 περιλαμβάνει: Η έννοια του προγράμματος Επίλυση προβλήματος 1. Ακριβή προσδιορισμό

Διαβάστε περισσότερα

ΠΛΑΤΩΝΑΣ Έργο ΓΓΕΤ 1SME2009

ΠΛΑΤΩΝΑΣ Έργο ΓΓΕΤ 1SME2009 ΠΛΑΤΩΝΑΣ Έργο ΓΓΕΤ 1SME2009 4o Συνέδριο InfoCom Green ICT 2012 ΕΥΡΩΠΑΪΚΗ ΕΝΩΣΗ ΠΛΑΤΩΝΑΣ ΠΛΑΤφόρμα έξυπνου διαλογισμικού για συλλογή, ανάλυση, επεξεργασία δεδομένων από συστήματα πολλαπλών ετερογενών ΑισθητήρΩΝ

Διαβάστε περισσότερα

Ενότητες Γ3.1 - Γ3.2 - Γ3.3

Ενότητες Γ3.1 - Γ3.2 - Γ3.3 Ενότητες Γ3.1 - Γ3.2 - Γ3.3 3.1 Τo διαδίκτυο ως πηγή πληροφοριών 3.2 Αξιοποίηση- αξιολόγηση ιστοσελίδων, ιστοχώρων και πυλών 3.3 Σχεδίαση μαθημάτων με τη χρήση του διαδικτύου To Διαδίκτυο ως πηγή πληροφοριών

Διαβάστε περισσότερα

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΑ ΣΥΣΤΗΜΑΤΑ

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΑ ΣΥΣΤΗΜΑΤΑ ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΑ ΣΥΣΤΗΜΑΤΑ Δρ. Κουζαπάς Δημήτριος Πανεπιστήμιο Κύπρου - Τμήμα Πληροφορικής Μηχανές Αναζήτησης Στόχοι 1 Να εξηγήσουμε για ποιον λόγο μας είναι απαραίτητες

Διαβάστε περισσότερα

Social Web: lesson #3

Social Web: lesson #3 Social Web: lesson #3 tagging social organisation of information ratings democratic editorial control shared opinions collaborative filtering recommendations case studies del.icio.us digg last.fm το Tag...

Διαβάστε περισσότερα

Media Monitoring. Ενότητα 2: Η ανάλυση περιεχομένου. Σταμάτης Πουλακιδάκος Σχολή ΟΠΕ Τμήμα ΕΜΜΕ

Media Monitoring. Ενότητα 2: Η ανάλυση περιεχομένου. Σταμάτης Πουλακιδάκος Σχολή ΟΠΕ Τμήμα ΕΜΜΕ Media Monitoring Ενότητα 2: Η ανάλυση περιεχομένου Σταμάτης Πουλακιδάκος Σχολή ΟΠΕ Τμήμα ΕΜΜΕ Ορισμός Μετατρέπει υλικό ποιοτικής κυρίως φύσης σε μορφή ποσοτικών/ποιοτικών δεδομένων Μπορεί να οριστεί ως

Διαβάστε περισσότερα

Ρετσινάς Σωτήριος ΠΕ 1703 Ηλεκτρολόγων ΑΣΕΤΕΜ

Ρετσινάς Σωτήριος ΠΕ 1703 Ηλεκτρολόγων ΑΣΕΤΕΜ Ρετσινάς Σωτήριος ΠΕ 1703 Ηλεκτρολόγων ΑΣΕΤΕΜ Τι είναι η ερευνητική εργασία Η ερευνητική εργασία στο σχολείο είναι μια δυναμική διαδικασία, ανοιχτή στην αναζήτηση για την κατανόηση του πραγματικού κόσμου.

Διαβάστε περισσότερα

Κεφάλαιο 15 Κοινωνικά Δίκτυα

Κεφάλαιο 15 Κοινωνικά Δίκτυα Κεφάλαιο 15 Κοινωνικά Δίκτυα 1 15.1 Γενικά για τα Κοινωνικά Δίκτυα Κοινωνικό Δίκτυο: ηλεκτρονική πλατφόρμα που παρέχει στα μέλη της δυνατότητες διασύνδεσης και αλληλεπίδρασης. Πρόκειται για εικονικές κοινότητες,

Διαβάστε περισσότερα

Διαδίκτυο: δίκτυο διασυνδεμένων δικτύων Ξεκίνησε ως ένα μικρό κλειστό στρατιωτικό δίκτυο, απόρροια του Ψυχρού Πολέμου μεταξύ ΗΠΑ και ΕΣΣΔ.

Διαδίκτυο: δίκτυο διασυνδεμένων δικτύων Ξεκίνησε ως ένα μικρό κλειστό στρατιωτικό δίκτυο, απόρροια του Ψυχρού Πολέμου μεταξύ ΗΠΑ και ΕΣΣΔ. ΚΕΦΑΛΑΙΟ 9 Διαδίκτυο: δίκτυο διασυνδεμένων δικτύων Ξεκίνησε ως ένα μικρό κλειστό στρατιωτικό δίκτυο, απόρροια του Ψυχρού Πολέμου μεταξύ ΗΠΑ και ΕΣΣΔ. Το 1966 αρχίζει ο σχεδιασμός του ARPANET, του πρώτου

Διαβάστε περισσότερα

Τα είδη των ιστοσελίδων. Web Sites E-commerce Sites CMS & Blog Sites CMS Flash Facebook Layouts Tumblr Themes

Τα είδη των ιστοσελίδων. Web Sites E-commerce Sites CMS & Blog Sites CMS Flash Facebook Layouts Tumblr Themes Ορισμός ιστοσελίδας Ιστοσελίδα (αγγλικά: web page) είναι ένα είδος εγγράφου του παγκόσμιου ιστού (WWW) που περιλαμβάνει πληροφορίες με την μορφή κειμένου, υπερκειμένου, εικόνας, βίντεο και ήχου. Τα είδη

Διαβάστε περισσότερα

Οπτική αντίληψη. Μετά?..

Οπτική αντίληψη. Μετά?.. Οπτική αντίληψη Πρωτογενής ερεθισµός (φυσικό φαινόµενο) Μεταφορά µηνύµατος στον εγκέφαλο (ψυχολογική αντίδραση) Μετατροπή ερεθίσµατος σε έννοια Μετά?.. ΓΙΑ ΝΑ ΚΑΤΑΝΟΗΣΟΥΜΕ ΤΗΝ ΟΡΑΣΗ ΠΡΕΠΕΙ ΝΑ ΑΝΑΛΟΓΙΣΤΟΥΜΕ

Διαβάστε περισσότερα

Μια κορυφαία πλατφόρμα κοινωνικής δικτύωσης Ο έξυπνος τρόπος για να Συνδεθείτε, να Μοιραστείτε και να Συνεργαστείτε

Μια κορυφαία πλατφόρμα κοινωνικής δικτύωσης Ο έξυπνος τρόπος για να Συνδεθείτε, να Μοιραστείτε και να Συνεργαστείτε Elgg.com (http://elgg.com/index.php) Μια κορυφαία πλατφόρμα κοινωνικής δικτύωσης Ο έξυπνος τρόπος για να Συνδεθείτε, να Μοιραστείτε και να Συνεργαστείτε Χαρακτηριστικά (http://elgg.com/features.php) Επισκόπηση

Διαβάστε περισσότερα

Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων ..?????? Εργαστήριο ΒΑΣΕΙΣ????????? ΔΕΔΟΜΕΝΩΝ Βάσεων Δεδομένων?? ΙΙ Εισαγωγικό Μάθημα Βασικές Έννοιες - . Γενικά Τρόπος Διεξαγωγής Ορισμός: Βάση Δεδομένων (ΒΔ) είναι μια συλλογή από σχετιζόμενα αντικείμενα

Διαβάστε περισσότερα

Τεχνολογίες Πληροφορικής και Επικοινωνιών (ΤΠΕ) στις Μικρομεσαίες Επιχειρήσεις (ΜΜΕ)

Τεχνολογίες Πληροφορικής και Επικοινωνιών (ΤΠΕ) στις Μικρομεσαίες Επιχειρήσεις (ΜΜΕ) Τεχνολογίες Πληροφορικής και Επικοινωνιών (ΤΠΕ) στις Μικρομεσαίες Επιχειρήσεις (ΜΜΕ) Γιώργος Μανής Επίκουρος Καθηγητής Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων Τι είναι οι Τεχνολογίες

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών 44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.

Διαβάστε περισσότερα

Ηλεκτρονικό Επιχειρείν & Νέες Τεχνολογίες για Επιχειρηματικότητα ΔΕΟ45

Ηλεκτρονικό Επιχειρείν & Νέες Τεχνολογίες για Επιχειρηματικότητα ΔΕΟ45 Ηλεκτρονικό Επιχειρείν & Νέες Τεχνολογίες για Επιχειρηματικότητα ΔΕΟ45 ΤΟΜΟΣ Α «Ηλεκτρονικό Επιχειρείν» πηγή: ibm.com Ηλεκτρονικό Επιχειρείν Η εφαρμογή τεχνολογιών πληροφορίας και επικοινωνίας (ΤΠΕ) για

Διαβάστε περισσότερα

ΟΔΗΓΟΣ ΧΡΗΣΗΣ ΥΠΗΡΕΣΙΑΣ [ΥΠΗΡΕΣΙΑ 2 ΑNAΠΤΥΞΗ

ΟΔΗΓΟΣ ΧΡΗΣΗΣ ΥΠΗΡΕΣΙΑΣ [ΥΠΗΡΕΣΙΑ 2 ΑNAΠΤΥΞΗ ΟΔΗΓΟΣ ΧΡΗΣΗΣ ΥΠΗΡΕΣΙΑΣ [ΥΠΗΡΕΣΙΑ 2 ΑNAΠΤΥΞΗ ΗΛΕΚΤΡΟΝΙΚΗΣ ΥΠΗΡΕΣΙΑΣ ΑΝΑΖΗΤΗΣΗΣ ΕΦΑΡΜΟΓΩΝ ΕΛ/ΛΑΚ ] ΓΙΑ ΤΟN ΧΡΗΣΤΗ [13/01/2014] έκδοση: 1.0 1 Περιεχόμενα 1. Έλεγχος εγγράφου...3 2. Εισαγωγή...4 3. Εισαγωγή

Διαβάστε περισσότερα

ΤΕΧΝΟΛΟΓΙΕΣ ΚΟΙΝΩΝΙΚΗΣ ΔΙΚΤΥΩΣΗΣ ΣΤΗΝ ΕΚΠΑΙΔΕΥΣΗ

ΤΕΧΝΟΛΟΓΙΕΣ ΚΟΙΝΩΝΙΚΗΣ ΔΙΚΤΥΩΣΗΣ ΣΤΗΝ ΕΚΠΑΙΔΕΥΣΗ ΤΕΧΝΟΛΟΓΙΕΣ ΚΟΙΝΩΝΙΚΗΣ ΔΙΚΤΥΩΣΗΣ ΣΤΗΝ ΕΚΠΑΙΔΕΥΣΗ Κιουτσιούκη Δήμητρα, 485 Τελική δραστηριότητα Φάση 1 :Ατομική μελέτη 1. Πώς θα περιγράφατε το ρόλο της τεχνολογίας στην εκπαιδευτική καινοτομία; Οι Web

Διαβάστε περισσότερα

Αναφορά εργασιών για το τρίμηνο Μάρτιος 2013 Μάιος 2013 Όνομα : Παπαχριστόπουλος Λεωνίδας

Αναφορά εργασιών για το τρίμηνο Μάρτιος 2013 Μάιος 2013 Όνομα : Παπαχριστόπουλος Λεωνίδας Στο πλαίσιο της πράξης «Αναβάθμιση και Εμπλουτισμός των Ψηφιακών Υπηρεσιών της Βιβλιοθήκης του Παντείου Πανεπιστημίου». Η Πράξη συγχρηματοδοτείται από το Ευρωπαϊκό Ταμείο Περιφερειακής Ανάπτυξης (ΕΤΠΑ).

Διαβάστε περισσότερα

Βάσεις Δεδομένων. Εισαγωγή Ανάλυση Απαιτήσεων. Φροντιστήριο 1 ο

Βάσεις Δεδομένων. Εισαγωγή Ανάλυση Απαιτήσεων. Φροντιστήριο 1 ο Βάσεις Δεδομένων Εισαγωγή Ανάλυση Απαιτήσεων Φροντιστήριο 1 ο 16-10-2008 Εισαγωγή - Ορισμοί Βάση Δεδομένων είναι μία συλλογή από σχετιζόμενα αντικείμενα Ένα σύστημα διαχείρισης βάσεων δεδομένων (ΣΔΒΔ)

Διαβάστε περισσότερα

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Μηχανές αναζήτησης

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ. Μηχανές αναζήτησης ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Μηχανές αναζήτησης Στόχοι 1 Να εξηγήσουμε για ποιο λόγο μας είναι απαραίτητες οι μηχανές αναζήτησης στον Παγκόσμιο Ιστό. Να περιγράψουμε κάποιους

Διαβάστε περισσότερα

3 ο ΓΕΛ Τρικάλων ΟΔΥΣΣΕΑΣ ΕΛΥΤΗΣ. Ιστολόγια και κοινότητες

3 ο ΓΕΛ Τρικάλων ΟΔΥΣΣΕΑΣ ΕΛΥΤΗΣ. Ιστολόγια και κοινότητες 3 ο ΓΕΛ Τρικάλων ΟΔΥΣΣΕΑΣ ΕΛΥΤΗΣ Ιστολόγια και κοινότητες Ιστολόγια (blogs) και εκπαιδευτικές κοινότητες Εισαγωγή Ορισμοί Στόχοι και Όροι χρήσης Στατιστικά Στοιχεία Ιστολόγια Ηλεκτρονικές εκπαιδευτικές

Διαβάστε περισσότερα

Τι είναι το web 2.0; Γιατί είναι τόσο σημαντικό για την εκπαίδευση;

Τι είναι το web 2.0; Γιατί είναι τόσο σημαντικό για την εκπαίδευση; Τι είναι το web 2.0; Γιατί είναι τόσο σημαντικό για την εκπαίδευση; 1 Με τον όρο «web 2.0» εννοούνται μια σειρά από εφαρμογές και περιβάλλοντα στο Διαδίκτυο, που χαρακτηρίζονται από το γεγονός ότι είναι

Διαβάστε περισσότερα

Τακοινωνικάδίκτυαστηνπροώθηση τηςεπιστημονικήςέρευνας.

Τακοινωνικάδίκτυαστηνπροώθηση τηςεπιστημονικήςέρευνας. Τακοινωνικάδίκτυαστηνπροώθηση τηςεπιστημονικήςέρευνας. Πανεπιστήμιο Μακεδονίας MIS 2012 Ζαχαρίδης Γεώργιος Επιβλέπων καθηγητής: Dr Πρωτόγερος Νικόλαος Σκοπόςτηςέρευνας Σύγκριση δικτύων γενικής χρήσης με

Διαβάστε περισσότερα

"Αθηνά" - Ερευνητικό Κέντρο Καινοτομίας στις Τεχνολογίες της Πληροφορίας, των Επικοινωνιών και της Γνώσης

Αθηνά - Ερευνητικό Κέντρο Καινοτομίας στις Τεχνολογίες της Πληροφορίας, των Επικοινωνιών και της Γνώσης "Αθηνά" - Ερευνητικό Κέντρο Καινοτομίας στις Τεχνολογίες της Πληροφορίας, των Επικοινωνιών και της Γνώσης ΙΝΣΤΙΤΟΥΤΟ ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Προκήρυξη Υποτροφιών To Ινστιτούτο Πληροφοριακών Συστημάτων

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΙΜΕΛΕΙΑ: ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ 6 ΟΥ ΚΕΦΑΛΑΙΟΥ ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ 6.1 Τι ονοµάζουµε πρόγραµµα υπολογιστή; Ένα πρόγραµµα

Διαβάστε περισσότερα

Δημιουργία. Ιστολογίου (blog) 7/5/2015. Χρυσάνθη Γιομέλου ΚΔΒΜ ΝΙΚΑΙΑΣ

Δημιουργία. Ιστολογίου (blog)  7/5/2015. Χρυσάνθη Γιομέλου ΚΔΒΜ ΝΙΚΑΙΑΣ Δημιουργία 7/5/2015 Ιστολογίου (blog) www.blogger.com Χρυσάνθη Γιομέλου ΚΔΒΜ ΝΙΚΑΙΑΣ ΠΕΡΙΕΧΟΜΕΝΑ TI EINAI TO ΙΣΤΟΛΟΓΙΟ... 2 ΓΙΑΤΙ ΙΣΤΟΛΟΓΙΟ;... 2 ΠΛΕΟΝΕΚΤΗΜΑΤΑ ΤΗΣ ΧΡΗΣΗΣ ΙΣΤΟΛΟΓΙΟΥ... 2 ΔΗΜΙΟΥΡΓΙΑ ΛΟΓΑΡΙΑΣΜΟΥ

Διαβάστε περισσότερα

ΜΑΘΗΜΑ 6. Σχήµατα ιαλειτουργικότητας Μεταδεδοµένων. Το RDF Το Warwick Framework. Ιόνιο Πανεπιστήµιο - Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας

ΜΑΘΗΜΑ 6. Σχήµατα ιαλειτουργικότητας Μεταδεδοµένων. Το RDF Το Warwick Framework. Ιόνιο Πανεπιστήµιο - Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας ΜΑΘΗΜΑ 6 195 Σχήµατα ιαλειτουργικότητας Μεταδεδοµένων Το RDF Το Warwick Framework 196 1 Resource Data Framework RDF Τα πολλαπλά και πολλαπλής προέλευσης σχήµατα παραγωγής δηµιουργούν την ανάγκη δηµιουργίας

Διαβάστε περισσότερα

ΤΙ ΕΙΝΑΙ Η ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΣΥΜΒΟΥΛΕΥΤΙΚΗ ΚΑΙ Ο ΕΠΑΓΓΕΛΜΑΤΙΚΟΣ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΣ ΚΑΙ ΠΟΙΟΣ ΕΙΝΑΙ Ο ΣΚΟΠΟΣ ΤΟΥΣ;

ΤΙ ΕΙΝΑΙ Η ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΣΥΜΒΟΥΛΕΥΤΙΚΗ ΚΑΙ Ο ΕΠΑΓΓΕΛΜΑΤΙΚΟΣ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΣ ΚΑΙ ΠΟΙΟΣ ΕΙΝΑΙ Ο ΣΚΟΠΟΣ ΤΟΥΣ; Η επαγγελματική ανάπτυξη και η ανθρώπινη ανάπτυξη συνδέονται. Η εξελικτική πορεία του ατόμου δεν κλείνει με την είσοδό του στο επάγγελμα ή σε έναν οργανισμό αλλά αντίθετα, την στιγμή εκείνη αρχίζει μία

Διαβάστε περισσότερα

Λειτουργικά. Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Σιώζιος Κων/νος - Πληροφορική Ι

Λειτουργικά. Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Σιώζιος Κων/νος - Πληροφορική Ι Λειτουργικά Συστήματα 1 Λογισμικό του Υπολογιστή Για να λειτουργήσει ένας Η/Υ εκτός από το υλικό του, είναι απαραίτητο και το λογισμικό Το σύνολο των προγραμμάτων που συντονίζουν τις λειτουργίες του υλικού

Διαβάστε περισσότερα

Εισαγωγή στα Μέσα Κοινωνικής Δικτύωσης

Εισαγωγή στα Μέσα Κοινωνικής Δικτύωσης Εισαγωγή στα Μέσα Κοινωνικής Δικτύωσης LinkedIn Κουστουμπάρδη Ερατώ Ιόνιο Πανεπιστήμιο Τμήμα Ψηφιακών Μέσων και Επικοινωνίας Τι είναι το LinkedIn Το LinkedIn είναι ένα Κοινωνικό Μέσω Δικτύωσης εστιασμένο

Διαβάστε περισσότερα

Φόρμα Επικοινωνίας ΠΡΟΟΙΜΙΟ

Φόρμα Επικοινωνίας ΠΡΟΟΙΜΙΟ ΠΡΟΟΙΜΙΟ Η Πολιτική Προστασίας των Δεδομένων Προσωπικού Χαρακτήρα καλύπτει και αφορά τις προϋποθέσεις συλλογής και διαχείρισης των προσωπικών στοιχείων των αναγνωστών / επισκεπτών / χρηστών / μελών από

Διαβάστε περισσότερα

Διαδίκτυο είναι ένα σύστημα διασυνδεδεμένων δικτύων και υπολογιστών που απλώνεται σε όλο τον κόσμο και έχουν πρόσβαση σε αυτό εκατομμύρια χρήστες.

Διαδίκτυο είναι ένα σύστημα διασυνδεδεμένων δικτύων και υπολογιστών που απλώνεται σε όλο τον κόσμο και έχουν πρόσβαση σε αυτό εκατομμύρια χρήστες. Διαδίκτυο είναι ένα σύστημα διασυνδεδεμένων δικτύων και υπολογιστών που απλώνεται σε όλο τον κόσμο και έχουν πρόσβαση σε αυτό εκατομμύρια χρήστες. Για να επιτευχθεί αυτό όλοι οι υπολογιστές και τα επιμέρους

Διαβάστε περισσότερα

Νεογεωγραφία και Χαρτογραφική Διαδικτυακή Απεικόνιση. Η χρήση Ελεύθερων Γεωγραφικών Δεδομένων και Λογισμικού Ανοιχτού Κώδικα σε Φορητές Συσκευές.

Νεογεωγραφία και Χαρτογραφική Διαδικτυακή Απεικόνιση. Η χρήση Ελεύθερων Γεωγραφικών Δεδομένων και Λογισμικού Ανοιχτού Κώδικα σε Φορητές Συσκευές. Νεογεωγραφία και Χαρτογραφική Διαδικτυακή Απεικόνιση. Η χρήση Ελεύθερων Γεωγραφικών Δεδομένων και Λογισμικού Ανοιχτού Κώδικα σε Φορητές Συσκευές. 13ο ΕΘΝΙΚΟ ΣΥΝΕΔΡΙΟ ΧΑΡΤΟΓΡΑΦΙΑΣ Η ΧΑΡΤΟΓΡΑΦΙΑ ΣΤΟ ΔΙΑΔΙΚΤΥΟ

Διαβάστε περισσότερα

Συνοπτικός Οδηγός Χρήσης του Moodle για τον Καθηγητή

Συνοπτικός Οδηγός Χρήσης του Moodle για τον Καθηγητή Συνοπτικός Οδηγός Χρήσης του Moodle για τον Καθηγητή 1 Πίνακας Περιεχομένων 1. Εισαγωγή... 4 1.1 Περιβάλλον Moodle...4 1.2 Χρήση ονόματος χρήστη και κωδικού...4 1.3 Δημιουργία νέου μαθήματος...4 1.3.1

Διαβάστε περισσότερα

Πρόγραμμα Μεταπτυχιακών Σπουδών MA in Education (Education Sciences) ΑΣΠΑΙΤΕ-Roehampton ΠΜΣ MA in Education (Education Sciences) Το Μεταπτυχιακό Πρόγραμμα Σπουδών στην Εκπαίδευση (Επιστήμες της Αγωγής),

Διαβάστε περισσότερα

Σεμινάριο Wordpress CMS (Δημιουργία Δυναμικών Ιστοσελίδων)

Σεμινάριο Wordpress CMS (Δημιουργία Δυναμικών Ιστοσελίδων) Σεμινάριο Wordpress CMS (Δημιουργία Δυναμικών Ιστοσελίδων) Τι είναι το Wordpress: To Wordpress είναι ένα δωρεάν ανοικτού κώδικα (open source) λογισμικό (εφαρμογή), με το οποίο μπορεί κάποιος να δημιουργεί

Διαβάστε περισσότερα

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΜΑΡΚΕΤΙΝΓΚ

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΜΑΡΚΕΤΙΝΓΚ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΜΑΡΚΕΤΙΝΓΚ Ενότητα 10: Κοινωνικά Μέσα Μάρκετινγκ (1) Βλαχοπούλου Μάρω Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό,

Διαβάστε περισσότερα

Περί της Ταξινόμησης των Ειδών

Περί της Ταξινόμησης των Ειδών Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Tel.: +30 2310998051, Ιστοσελίδα: http://users.auth.gr/theodoru Περί της Ταξινόμησης

Διαβάστε περισσότερα

Ηλεκτρονική Διαφήμιση. Αντωνιάδου Όλγα

Ηλεκτρονική Διαφήμιση. Αντωνιάδου Όλγα Ηλεκτρονική Διαφήμιση Αντωνιάδου Όλγα Διαφήμιση στο διαδίκτυο Το διαδίκτυο είναι αναμφισβήτητα ένα τεράστιο πεδίο προώθησης και διαφήμισης υπηρεσιών και προϊόντων. Η ποσότητα της πληροφορίας που διακινείται

Διαβάστε περισσότερα

Εθνικό Κέντρο Επαγγελματικού Προσανατολισμού

Εθνικό Κέντρο Επαγγελματικού Προσανατολισμού ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΔΙΑ ΒΙΟΥ ΜΑΘΗΣΗΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ Εθνικό Κέντρο Επαγγελματικού Προσανατολισμού Εθνική βάση Δεδομένων Εκπαιδευτικών Ευκαιριών «Πλοηγός» - Ploteus II Αναζητήστε εκπαιδευτικές ευκαιρίες

Διαβάστε περισσότερα

ΘΕΜΑ: Πρόσκληση εκδήλωσης ενδιαφέροντος για την παροχή υπηρεσιών με τίτλο «Σχεδιασμός λογοτύπου και σχεδιασμός και κατασκευή δυναμικής ιστοσελίδας»

ΘΕΜΑ: Πρόσκληση εκδήλωσης ενδιαφέροντος για την παροχή υπηρεσιών με τίτλο «Σχεδιασμός λογοτύπου και σχεδιασμός και κατασκευή δυναμικής ιστοσελίδας» ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ, ΕΡΕΥΝΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΔΗΜΟΣΙΑ ΚΕΝΤΡΙΚΗ ΒΙΒΛΙΟΘΗΚΗ ΚΟΝΙΤΣΑΣ Ταχ. Δ/νση : Κόνιτσα, 44100 Πληροφορίες: Περσεφόνη Ντούλια Τηλ: 26550-22298, 29311 FAX: 26550-22298

Διαβάστε περισσότερα

Αξιολόγηση Ιστοσελίδων. Εργασία. Χαράλαμπος Κουτσουρελάκης

Αξιολόγηση Ιστοσελίδων. Εργασία. Χαράλαμπος Κουτσουρελάκης ΕΠΙΜΟΡΦΩΣΗ ΤΩΝ ΕΚΠΑΙ ΕΥΤΙΚΩΝ ΓΙΑ ΤΗΝ ΑΞΙΟΠΟΙΗΣΗ ΚΑΙ ΕΦΑΡΜΟΓΗ ΤΩΝ ΤΠΕ ΣΤΗ Ι ΑΚΤΙΚΗ ΠΡΑΞΗ- ΠΑΚΕ ΚΡΗΤΗΣ Αξιολόγηση Ιστοσελίδων Εργασία Περιεχόμενα Εισαγωγή... 2 Τρόποι αξιολόγησης μιας ιστοσελίδας... 2 Αξιολόγηση

Διαβάστε περισσότερα

ΕΠΙΜΟΡΦΩΣΗ ΤΩΝ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΓΙΑ ΤΗΝ ΑΞΙΟΠΟΙΗΣΗ ΚΑΙ ΕΦΑΡΜΟΓΗ ΤΩΝ ΤΠΕ ΣΤΗ ΔΙΔΑΚΤΙΚΗ ΠΡΑΞΗ

ΕΠΙΜΟΡΦΩΣΗ ΤΩΝ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΓΙΑ ΤΗΝ ΑΞΙΟΠΟΙΗΣΗ ΚΑΙ ΕΦΑΡΜΟΓΗ ΤΩΝ ΤΠΕ ΣΤΗ ΔΙΔΑΚΤΙΚΗ ΠΡΑΞΗ ΞΑΝΘΗ 2013, 2 ο ΣΕΚ ΞΑΝΘΗΣ ΕΠΙΜΟΡΦΩΣΗ ΤΩΝ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΓΙΑ ΤΗΝ ΑΞΙΟΠΟΙΗΣΗ ΚΑΙ ΕΦΑΡΜΟΓΗ ΤΩΝ ΤΠΕ ΣΤΗ ΔΙΔΑΚΤΙΚΗ ΠΡΑΞΗ ΕΠΙΜΟΡΦΩΤΗΣ : ΓΙΑΝΝΗΣ ΚΟΥΤΙΔΗΣ Μαθηματικός www.kutidis.gr ΑΠΡΙΛΙΟΣ ΝΟΕΜΒΡΙΟΣ 2013 Η ΔΥΝΑΜΙΚΗ

Διαβάστε περισσότερα

ΟΛΟΚΛΗΡΩΜΕΝΟ ΣΥΣΤΗΜΑ ΤΗΛΕΚΑΤΑΡΤΙΣΗΣ E-AGIOGRAFIA

ΟΛΟΚΛΗΡΩΜΕΝΟ ΣΥΣΤΗΜΑ ΤΗΛΕΚΑΤΑΡΤΙΣΗΣ E-AGIOGRAFIA ΟΛΟΚΛΗΡΩΜΕΝΟ ΣΥΣΤΗΜΑ ΤΗΛΕΚΑΤΑΡΤΙΣΗΣ E-AGIOGRAFIA Καλωσορίσατε στην πλατφόρμα ηλεκτρονικής μάθησης E-Agiografia, Η Media Suite έχει αναπτύξει το Ολοκληρωμένο Σύστημα Τηλεκατάρτισης (e-learning) με την επωνυμία

Διαβάστε περισσότερα

Αρχές Δημιουργίας Εκπαιδευτικού ΙΣΤΟΤΟΠΟΥ βάσει του σχετικού εργαλείου αξιολόγησης του «διαγωνισμού ελληνόφωνων εκπαιδευτικών ιστοτόπων»

Αρχές Δημιουργίας Εκπαιδευτικού ΙΣΤΟΤΟΠΟΥ βάσει του σχετικού εργαλείου αξιολόγησης του «διαγωνισμού ελληνόφωνων εκπαιδευτικών ιστοτόπων» Αρχές Δημιουργίας Εκπαιδευτικού ΙΣΤΟΤΟΠΟΥ βάσει του σχετικού εργαλείου αξιολόγησης του «διαγωνισμού ελληνόφωνων εκπαιδευτικών ιστοτόπων» Φίλιππος Δεληγιάννης Αναστάσιος Χατζηπαπαδόπουλος 1o ΕΚ ΑΘΗΝΩΝ Σεμινάριο

Διαβάστε περισσότερα

Τύπος Εκφώνηση Απαντήσεις

Τύπος Εκφώνηση Απαντήσεις Α/ Α Τύπος Εκφώνηση Απαντήσεις Απλή Αν κάνετε αναζήτηση µιας λέξης σε ένα αρχαιοελληνικό σώµα κειµένων, αυτό που θα λάβετε ως αποτέλεσµα θα είναι: Μια καταγραφή όλων των εµφανίσεων της λέξης στο συγκεκριµένο

Διαβάστε περισσότερα