Ελένη Μπουρδάκη Ελληνικό Ανοικτό Πανεπιστήμιο Μεταπτυχιακό Πρόγραμμα Σπουδών Γραφικές Τέχνες και Πολυμέσα ΑΘΗ1 Επιβλέπων καθηγητής Στυλιαράς Γεώργιος Ακαδημαϊκό έτος 2012-13
Πολυμεσική πληροφορία Το πολυμεσικό περιεχόμενο καταλαμβάνει περισσότερο από 60% του διακινούμενου υλικού που κυκλοφορεί στο σημερινό διαδίκτυο. Στις ανάγκες συλλογής, επεξεργασίας, διαχείρισης, και διανομής πληροφοριών πολυμεσικής μορφής έρχονται να δώσουν λύσεις σύγχρονα περιβάλλοντα και εργαλεία που μπορούν να ανταποκριθούν στις ιδιαίτερες απαιτήσεις της αναζήτησης και ανάκτησης δεδομένων με σκοπό την άμεση ανάκτηση των επιθυμητών πληροφοριών.
Αναζήτηση πολυμεσικής πληροφορίας Η αναζήτηση πολυμεσικής πληροφορίας βασίζεται στο περιεχόμενο της(content based image retrieval) Αναζήτηση χρήστη Πολυμεσική πληροφορία στις Ιστοσελίδες Σημασιολογική αναζήτηση Η σημασιολογική αναζήτηση επιχειρεί να εξάγει νόημα από ερωτήματα αναζήτησης και από τις ιστοσελίδες απ ότι απλώς να ταιριάξει με σχετικούς υπερσυνδέσμους με βάση λέξεις κλειδιά προηγούμενες ή σχετικές αναζητήσεις. Διαφορές στην διατύπωση και στα συμφραζόμενα
Παράδειγμα χρήσης σημασιολογικής αναζήτησης Η Amazon είναι ένα καλό παράδειγμα από τις καινοτόμες εταιρίες που χρησιμοποιούν σημασιολογικές τεχνικές αναζήτησης Όταν ο χρήστης αναζητεί ένα βιβλίο, εμφανίζεται στο τέλος της σελίδας βιβλία που άλλοι χρήστες έχουν αγοράσει με σκοπό την καλύτερη επιλογή
Διαδικασία αναζήτησης Σημαντικό μέρος η αποσαφήνιση τόσο των ερωτημάτων όσο και αντίστοιχα του περιεχομένου στο διαδίκτυο με : Χρήση οντολογιών (ontologies) προκειμένου ο υπολογιστής να κατανοήσει τι σημαίνουν οι λέξεις και ποια είναι η σχέση μεταξύ των λέξεων ο υπολογιστής πρέπει να έχει έγγραφα που περιγράφουν όλες τις λέξεις καθώς και την λογική προκειμένου να κάνει τις απαραίτητες συνδέσεις. Χρήση μηχανών αναζήτησης πχ Google, Alltheweb Χρήση συνδυαστικής ή υβριδικής αναζήτησης πχ. Excite, Lycos Χρήση θεματικών ευρετηρίων πχ Yahoo, Britanccia Χρήση εργαλειών νέας γενιάς (μεταμηχανές) πχ Dogpile, Metacrawler
Οντολογίες(ontologies) Είναι ένα από τα δύο εργαλεία για την βοήθεια παροχής κατανόησης του ανθρώπινου λεξιλογίου στον ηλεκτρονικό υπολογιστή με απλούς όρους το λεξιλόγιο που περιγράφει αντικείμενα και πως σχετίζονται μεταξύ τους. Ontology Web Language (OWL) OWL, είναι μια γλώσσα σήμανσης ιστού επισημοποιεί οντότητες περιγράφει την σχέση μεταξύ των κλάσεων και χρησιμοποιεί την λογική ώστε να κάνει αφαιρέσεις. uses logic to make deductions. Μπορεί επίσης να κατασκευάσει νέες κατηγορίες με βάση τις υπάρχουσες πληροφορίες. OWL είναι διαθέσιμο σε τρία επίπεδα Lite, Περιγραφή Γλώσσας (DL) και Full.(Wilson,2013) OWL είναι αναθεώρηση της DAML OIL και σκοπός της είναι να διευκολύνει περισσότερο την αναγνωσιμότητα της μηχανής στο περιεχόμενο του παγκόσμιου ιστού απ οτι η XML, RDF, RDFS παρέχοντας ένα επιπλέον λεξιλόγιο για την περιγραφή των όρων (Alonso et al 2004)
Μηχανές αναζήτησης Ορίζεται ως μια πλούσια βάση δεδομένων η οποία δημιουργείται αυτόματα από ειδικά προγράμματα(agents) Σε μια σύγχρονη μηχανή αναζήτησης διακρίνουμε: ειδικό πρόγραμμα intelligent agents ευρετήριο(index) τελική εφαρμογή Ησύγχρονητάσηστηνεξέλιξητωνμηχανώνείναιοιέξυπνοι πράκτορες (intelligent agents) και οι θεματικές πύλες(portals) πχ τεχνολογία RSS εξέλιξη των θεματικών ευρετηρίων και είναι εργαλεία του σημασιολογικού ιστού. Υπολογίζεται ότι και οι καλύτερες μηχανές αναζήτησης δεν περιέχουν περισσότερες από το 16% των διαθέσιμων ιστοσελίδων στον παγκόσμιο ιστό.
Συστήματα ανάκτησης εικόνων Τα συστήματα ανάκτησης εικόνων επιτρέπουν την αναζήτηση και ανάκτηση δισδιάστατων, τρισδιάστατων, σταθερών (still) και κινούμενων (moving) εικόνων από μεγάλες βάσεις δεδομένων. Καταλογογράφηση εικόνων αυτών με την προσθήκη μεταδεδομένων (metadata)η οποία εκφράζεται συνήθως με την λεκτική περιγραφή του περιεχομένου της με: λέξεις κλειδιά, λεζάντες ή συνοδευτικό κείμενο (Kosch Timmerer2009)
Σημασιολογικός Ιστός(Semantic Web) Εξελίχθηκε σταδιακά από τον υφιστάμενο Παγκόσμιο Ιστό Ο εμπνευστής της πρωτοβουλίας για τον Σημασιολογικό Ιστό Tim Berners Lee Προωθείται από την Κοινοπραξία Παγκόσμιου Ιστού(World Wide Web Consortium, W3C) Οι υπηρεσίες του ορίζονται από πρότυπα RDF, RDF Schema DAML+ OIL DAML S
Πρότυπο RDF O W3C πρότεινε το πρότυπο RDF (Resource Description Framework) για την περιγραφή ψηφιοποιημένων φωτογραφιών ώστε να είναι αναζητήσιμες και ανακτήσιμες μέσω HTTP πρωτοκόλλου. Την σάρωση της φωτογραφίας και την διάσωσή της ως αρχείου JPEG. Την δημιουργία RDF μεταδεδομένων και την αποθηκευσή τους μέσα στο ίδιο το αρχείο. Την χρήση εξυπηρετητών που υποστηρίζουν HTTP για την μεταφορά της φωτογραφίας ή των μεταδεδομένων της σε ένα πελάτη.
Μηχανές συλλογιστικής Συναφή ανάλυση Οντολογική έρευναεπεκτάσεις Σήμανση(semantics) Κατανόηση φυσικής γλώσσας Σήμανση πληροφορίας(markup) είναι η ανάμειξη περιεχομένου με πληροφορίες για το περιεχόμενο μέσα στην ίδια την πολυμεσική πληροφορία. Με την εισαγωγή τους οι σημαντήρες: Αναπαριστούν την λογική δομή της πολυμεσικής πληροφορίας Επιτρέπουν τον διαχωρισμό του περιεχομένου(content) από την παρουσίαση (formatting) της πληροφορίας. Οι σημαντήρες(tags) βοηθούν στην ανάγνωση της δομής του εγγράφου
Παράδειγμα Το ίδιο το Facebook μέσω της πλατφόρμας με ονομασία Open Graph, η NASA, το BBC, η Microsoft, η Dell, η CIA και πολλές ακόμα εταιρίες και οργανισμοί κάνουν χρήση της τεχνολογίας αυτής. Οι ΗΠΑ υλοποίησαν το έργο με τίτλο DARPA Agents Markup Language (Γλώσσα Σήμανσης Πρακτόρων)
Γλώσσες σήμανσης Οι γλώσσες σήμανσης καθορίζουν σημαντήρες(tags) και κανόνες για εισαγωγή τους σε έγγραφα SGML (Standard Generalized Markup Language)Προδιαγραφή Γενικών Γλωσσών Σήμανσης Παράλληλα με την SGML, η χρήση της Document Style Semantics και Specification Language μπορούν να καθορίσουν την παρουσίαση του περιεχομένου ενός εγγράφου
XML Διευθετεί το πρόβλημα της αναπαράστασης της πληροφορίας εστιάζοντας στην σύνταξη απ ότι στα semantics Παρέχει τον πρότυπο τρόπο ορισμού των εγγράφων ώστε να είναι κατάλληλα για αυτόματη επεξεργασία(alonso et al 2004) semantic (x)html
Οφέλη από την χρήση σήμανσης(semantics) προώθηση προϊόντων, προβολή ενημερωτικών μηνυμάτων, μείωση του αντιληπτού χρόνου αναμονής τηλε εκπαίδευση κ.α.
Η μεγάλη δυνατότητα.. People Το κοινωνικό γράφημα συνδέει απλώς ανθρώπους Το σημασιολογικό γράφημα συνδέει τα πάντα Companies Emails Καλύτερη έρευνα Places Products Περισσότερο στοχευόμενες διαφημίσεις Interests Activities Projects Services Web Pages Documents Ευφυέστερη συνεργασία Βαθύτερη ολοκλήρωση Πλουσιότερο περιεχόμενο Καλύτερη εξατομίκευση Events Multimedia Groups
Συστήματα Ψηφιακής Σήμανσης Η AMCO Α.Β.Ε.Ε. εγκαθιστά και παραμετροποιεί συστήματα ψηφιακής σήμανσης (digital signage). Ένα σύστημα ψηφιακής σήμανσης είναι μια διάταξη λογισμικού και εξοπλισμού η οποία επιτρέπει την προβολή πολυμεσικού διαφημιστικού περιεχομένου σε συσκευές προβολής, όπως οθόνες TV & Projectors. Μια χρονικά προγραμματισμένη ζωντανή ροή περιεχομένου (videos, φωτογραφίες, κείμενα, δυναμικό περιεχόμενο) μαζί με διαφημίσεις προϊόντων και υπηρεσιών μεταδίδονται σε πραγματικό χρόνο στις οθόνες προβολής. Η χρήση συστημάτων ψηφιακής σήμανσης για διαφήμιση και προώθηση προϊόντων παράγει απτά αποτελέσματα με συγκριτικά χαμηλότερο μάρκετινγκ και διαφημιστικές δαπάνες από την παραδοσιακή διαφήμιση και τις υπηρεσίες επικοινωνίας. Εξασφαλίζει την προσέγγιση δυνητικών πελατών η οποία στο παρελθόν δεν ήταν προσιτή με την παραδοσιακή διαφήμιση.(spacevision nd)
Εφαρμογές συστημάτων αναζήτησης πολυμεσικής πληροφορίας Infokiosks Εικόνα 1. Infokiosks(Amco 2011)
Πλατφόρμες λογισμικού σήμανσης(semantics) Scala InfoCaster C nario SuperSign
Google Μετατροπή του αλγόριθμου της σε πιο semantic(σημασιολογικό) στα αποτελέσματα αναζητήσεων (SERPs) Τεχνική rich snippets ΣΚΟΠΟΣ Το νέο σύστημα να αντιλαμβάνεται τον κόσμο όπως κάνουν καθημερινά οι ίδιοι οι άνθρωποι ΣΤΟΧΟΣ Η ερμηνεία των αναζητήσεων των χρηστών με βάση τα συμφραζόμενα της αναζήτησης και όχι με τον αριθμό των λέξεων του κειμένου που ταιριάζουν με το keyword του ερωτήματος. η μετάδοση ποιοτικότερων αποτελεσμάτων προς το χρήστη χωρίς αυτός να αναγκάζεται να ανατρέχει στα ειδικά μπλε links στο τέλος κάθε σελίδας ώστε να μεταβεί σε σημασιολογικά όμοια αποτελέσματα
Google(2) Tα keywords διαδραματίζουν πρωτεύον ρόλο στον αλγόριθμο κατάταξης της Google, οπως επίσης και τα ποιοτικά links, αλλά και οι προτιμήσεις των χρήστων (personalization). Προσθέτοντας τη σημασιολογική τεχνολογία (semantic)στο σύστημα της, γίνεται εφικτό ώστε να καταλαβαίνει τις πραγματικές σημασίες των λέξεων. Για παράδειγμα η διαφοροποίηση αναζητήσεων για περισσότερες από μια σημασίες πχ. Jaguar και ως αυτοκίνητο και ως ζώο
Σύστημα Knowledge graph Είναι ένα εμφωλευμένο πάνελ στα δεξιά των αποτελεσμάτων, το οποίο εμφανίζει πληροφορίες σχετικά με το ερώτημα που έθεσε ο χρήστης. Η νέα αυτή τεχνολογία είναι διαθέσιμη μόνο σε χρήστες των Ηνωμένων Πολιτειών με επιλεγμένη γλώσσα την αγγλική, παρέχει επιπλέον πληροφορίες σχετικά με δημοφιλή γεγονότα τα όποια εμφανίζουν υψηλή συχνότητα αναζήτησης. Η Google χρησιμοποιεί το knowledge graph με απώτερο σκοπό τη συλλογή πληροφοριών από τον πραγματικό κόσμο συνδέοντας σημασιολογικά τις ιστοσελίδες μεταξύ τους και αναδεικνύοντας σχέσεις μεταξύ των αντικειμένων που βρίσκονται στο περιεχόμενο αυτών των ιστοσελίδων. ( Roiblat 2009 )
Σύστημα True Knowledge εστιάζει στην λογική αιτιολογία συνάγοντας πρόσθετα στοιχεία από μια σειρά γεγονότων που ξαναπαρουσιάζονται στο σύστημα
Σύστημα Powerset Αυτό το σύστημα επεξεργάζεται το περιεχόμενο που το ίδιο διαθέτει και τις αναζητήσεις που υποβάλλει ο χρήστης ώστε να αναγνωρίσει την πρόθεση των πληροφοριών. Χρησιμοποιούν την σύνταξη της πρότασης και κανόνες για την αναγνώριση ανθρώπων και τοποθεσιών με εκτεταμένη χρήση στην κατανόηση της φυσικής γλώσσας.
Προκλήσεις Χρειάζεται η έξυπνη συνάθροιση και η συνεπής παρουσίαση αποτελεσμάτων στους χρήστες ενώ θα πρέπει να τους παρέχεται ασφάλεια και σχετικά με τεχνικές πρόσβασης ελέγχου κατάλληλα για το πολυμεσικό περιεχόμενο. Άλλη πρόκληση αφορά τον συγχρονισμό πληροφοριών μεταδεδομένων με τα μέσα και αντίστροφα καθώς και την διαχείριση της σχέση σε όλο τον κύκλο ζωής μεταδεδομένων.
Ζητήματα προς συζήτηση Η έλλειψη αποτελεσματικών δεικτών στην περιγραφή του περιεχομένου της πολυμεσικής πληροφορίας είναι το κυρίως εμπόδιο στην πολυμεσική αναζήτηση. Στόχος: Καλύτερες γέφυρες στα σημασιολογικά κενά Ο ρυθμός αύξησης της πολυμεσικής πληροφορίας στον παγκόσμιο ιστό υπερβαίνει τον ρυθμό ανάπτυξης της τεχνολογικής προόδου Τα αποτελέσματα των διαδικτυακών αναζητήσεων δεν είναι άμεσα προσπελάσιμα από άλλα εργαλεία λογισμικού Προτεινόμενη Λύση Επιδιόρθωση του προβλήματος πως κατασκευάζεται μια ιστοσελίδα ώστε να εξυπηρετεί τις τεχνολογίες σημασιολογικού ιστού.
ΒΙΒΛΙΟΓΡΑΦΙΑ Wilson T 2013, How Semantic Web Works [online]http://computer.howstuffworks.com/semanticweb4.htm Roiblat H 2009, Semantic Search[online] http://truevert.blogspot.gr/2009/04/semantic search.html Alonso et al 2004, Web services, concepts, architectures and applications p118,306 Springer Spacevision nd,[online]http://www.spacevision.gr/files/download/spa cevisiondigitalsignage.pdf KoschH,TimmererC2009, Multimedia Metadata and Semantic Management[online] http://www.computer.org/portal/web/computingnow/arch ive/december2009