Τζίτζικας Αγαπητός
Τζίτζικας Αγαπητός
Σε παγκόσμιο επίπεδο, οιμηχανέςαναζήτησηςτουinternet αναπτύχθηκαν για να κάνουν αναζήτηση πληροφοριών σε πολλαπλές τοποθεσίες ιστού. Δυστυχώς, αυτές οι μηχανές αναζήτησης δεν αποτέλεσαν την πανάκεια για την οποία είχαν ελπίσει κάποιοι. Κάθε μηχανή αναζήτησης δίνει κάποιες φορές καλά αποτελέσματα, και κάποιες άλλες (τις περισσότερες) όχι καλά. Είναι το φαινόμενο που οι επιστήμονες των πληροφοριών αποκαλούν «υψηλή ανάκληση» και «χαμηλή ακρίβεια».
Η υψηλή ανάκληση αναφέρεται στην πολύ γνωστή (και δυσάρεστη) εμπειρία της χρήσης μιας μηχανής αναζήτησης στο Internet και της λήψης χιλιάδων αποτελεσμάτων. Είναι γνωστό στο ευρύ κοινό ως φαινόμενο της «πληροφοριακής υπερφόρτωσης». Η χαμηλή ακρίβεια αναφέρεται στην αδυναμία εντοπισμού των χρήσιμων εγγράφων εντός των χιλιάδων αποτελεσμάτων που παράγει η αναζήτηση. Οι εταιρείες των μηχανών αναζήτησης δεν θεωρούν το μεγάλο αριθμό αποτελεσμάτων ως πρόβλημα.
Πώς επιλύουν τα μεταδεδομένα αυτό το πρόβλημα; Οι παρακάτω ορισμοί των μεταδεδομένων μας δίνει μια ιδέα: «Τα μεταδεδομένα είναι δεδομένα που σχετίζονται με αντικείμενα και απαλλάσσουν τους πιθανούς χρήστες αυτών των αντικειμένων από την ανάγκη να έχουν πλήρη προηγούμενη γνώση της ύπαρξής τους ή των χαρακτηριστικών τους». Μεταδεδομένα σημαίνει «δεδομένα που αναφέρονται σε δεδομένα», δομημένα δεδομένα που περιγράφουν τα χαρακτηριστικά ενός πόρου. Ο όρος μεταδεδομένα χρησιμοποιήθηκε πολύ πριν το Internet αλλάξει το θεμελιώδη ορισμό μας για τους πληροφοριακούς πόρους, αλλά ποτέ πριν δεν είχε χρησιμοποιηθεί τόσο ενεργά όσο στις μέρες μας.
Ο Tim Berners-Lee, έναςαπότουςιδρυτέςτου Παγκόσμιου Ιστού έδωσε τον ορισμό: «Μεταδεδομένα είναι κατανοητές από τη μηχανή πληροφορίες σχετικά με πόρους του ιστού ή άλλα πράγματα».
Οι πληροφοριακοί πόροι πρέπει να γίνονται ορατοί με έναν τρόπο που θα επιτρέπει στους ανθρώπους να ξεχωρίσουν αν οι πόροι αυτοί είναι πιθανόν να τους είναι χρήσιμοι. Τα μεταδεδομένα είναι μια συστηματική μέθοδος περιγραφής πόρων, επομένως και βελτιωμένης πρόσβασης σ αυτούς. Αν ένας πόρος αξίζει να γίνει προσβάσιμος, τότε αξίζει να περιγραφεί με μεταδεδομένα, έτσι ώστε να μεγιστοποιηθεί η πιθανότητα ανεύρεσης και εντοπισμού του. Τα μεταδεδομένα παρέχουν τον ουσιαστικό σύνδεσμο ανάμεσα στο δημιουργό της πληροφορίας και στο χρήστη της
Τα μεταδεδομένα αποτελούν τη βάση του Σημασιολογικού Ιστού. Το βασικό πρόβλημα του τρέχοντος Παγκόσμιου Ιστού είναι ότι οι ιστοσελίδες χτίζονται με συντακτικές γλώσσες σήμανσης, όπως η HTML. Γι αυτό, ο Παγκόσμιος Ιστός καλείται και «Συντακτικός Ιστός». Στο συντακτικό περιβάλλον του Ιστού, οι μηχανές δεν μπορούν να κατανοήσουν και να επεξεργαστούν το νόημα των διακινούμενων πληροφοριών. Οι σελίδες HTML είναι για έναν υπολογιστή, απλά, κώδικες ASCII ή εικόνες. Αυτού του είδους οι δυσκολίες εμποδίζουν την αυτοματοποίηση της επεξεργασίας των πληροφοριών από τις μηχανές και ελαττώνουν την αποδοτικότητα και ακρίβεια της συλλογής των πληροφοριών. Επιπλέον, το ραγδαίως αυξανόμενο περιεχόμενο του Παγκόσμιου Ιστού και η συντακτική δομή του δημιουργούν το πρόβλημα της πληροφοριακής του υπερφόρτωσης. Αυτή η κατάσταση δεν είχε προβλεφθεί στα αρχικά βήματα σύλληψης και δημιουργίας του.
Για την επίλυση αυτών των προβλημάτων, ο Tim Berners-Lee εμπνεύστηκε το Σημασιολογικό Ιστό. Ο Σημασιολογικός Ιστός είναι μια επέκταση του τρέχοντος Ιστού, κατά την οποία οι πληροφορίες αποκτούν ένα σαφώς καθορισμένο νόημα που επιτρέπει στους υπολογιστές και στους ανθρώπους να συνεργάζονται αρμονικά. Βασίζεται στην ιδέα ότι τα δεδομένα του Ιστού πρέπει να είναι ορισμένα και συνδεδεμένα με τέτοιο τρόπο, ώστε να μπορούν να χρησιμοποιούνται για πιο αποτελεσματική ανακάλυψη, αυτοματοποίηση, ολοκλήρωση και επαναχρησιμοποίηση σε ποικίλες εφαρμογές
Πολύ σημαντική παράμετρος για την δημιουργία μιας ολοκληρωμένης πολυμεσικής εφαρμογής είναι η επαρκής αναπαράσταση του πολυμεσικού υλικού με τη χρήση μεταδεδομένων. Ένας έξυπνος και αρκετά απλός ορισμός του όρου μεταδεδομένα (metadata) είναι «δομημένα δεδομένα για τα δεδομένα». Η ανάπτυξη του Παγκόσμιου Ιστού και των δικτυακών συστημάτων ψηφιακών πληροφοριών παρέχει στους ειδικούς πληροφοριών πολλές ευκαιρίες, ενώ την ίδια στιγμή απαιτεί από αυτούς να αντιμετωπίσουν θέματα που δεν είχαν ερευνήσει προηγουμένως. Τα χειροκίνητα κατασκευασμένα σύνολα στοιχείων μεταδεδομένων, τα οποία συμμορφώνονται (όσο είναι δυνατόν) με εθνικά και διεθνή πρότυπα, αποτελούν τα εργαλεία που χρησιμοποιούν οι ειδικοί πληροφοριών προκειμένου να προωθήσουν:
Μεταδεδομένα και πολυμέσα 2 την αυξημένη δυνατότητα πρόσβασης στα γνωστικά αντικείμενα, τη συνοχή / διατήρηση περιεχομένου τους, τις πολλαπλές εκδόσεις του ίδιου γνωστικού αντικειμένου, νομικά ζητήματα που αφορούν τα δικαιώματα και τους περιορισμούς χρήσης του, τη συντήρηση της τεκμηρίωσης του ιστορικού του γνωστικού αντικειμένου και της δυνατότητας πρόσβασής του και βελτιώσεις του συστήματος
Η ύπαρξη των μεταδεδομένων είναι απαραίτητη, ιδιαίτερα για τη λειτουργία συστημάτων που διαχειρίζονται οπτικοακουστική πληροφορία. Σήμερα, μεγάλος όγκος οπτικοακουστικού υλικού αποθηκεύεται σε ψηφιακή μορφή και διατίθεται σε χρήστες, μέσω συστημάτων ψηφιακών βιβλιοθηκών ή και του Παγκόσμιου Ιστού. Το οπτικοακουστικό υλικό, είναι πλούσιο τόσο σε δομή όσο και σε περιεχόμενο, ωστόσο η ιδιαίτερη φύση του και η διαφοροποίηση του σε σχέση με το γραπτό λόγο καθιστά αναγκαία τη χρήση νέων τεχνικών για τη δεικτοδότηση και την ανάκτηση του, αφού οι κλασικές τεχνικές που έχουν αναπτυχθεί για κείμενα δεν επαρκούν.
Μεταδεδομένα και οπτικοακουστικη πληροφορία Στην περίπτωση αυτή, συσχετίζονται με την οπτικοακουστική πληροφορία μεταδεδομένα, τα οποία έχουν τέτοια δομή και περιεχόμενο, ώστε να καθίσταται αποτελεσματική η πρόσβαση στην πληροφορία αυτή και η διαχείρισή της. Τα μεταδεδομένα περιέχουν τόσο χαρακτηριστικά (attributes) για την καταλογογράφηση του υλικού με τρόπο παρόμοιο με τις συμβατικές βιβλιοθήκες, όπως τίτλο, δημιουργό και χώρα προέλευσης, όσο και κάποιαςμορφήςαναπαράστασητουπεριεχομένου του οπτικοακουστικού αντικειμένου, που μπορεί να περιέχει είτε πληροφορία χαμηλού επιπέδου, όπως ιστογράμματα, είτε υψηλότερου επιπέδου σημασιολογικές περιγραφές.
Ιδιαίτερο ερευνητικό ενδιαφέρον υπάρχει, στα πλαίσια της ανάπτυξης συστημάτων διαχείρισης οπτικοακουστικής πληροφορίας, στον ορισμό προτύπων μοντέλων μεταδεδομένων, τα οποία θα αντικαταστήσουν τους αυθαίρετα ορισμένους τρόπους περιγραφής που χρησιμοποιούνται στα υπάρχοντα συστήματα. Η χρήση τέτοιων προτύπων, θα καταστήσει δυνατή την διαφανή πρόσβαση στα περιεχόμενα διαφορετικών συστημάτων, ανεξάρτητα από την εσωτερική οργάνωση των δεδομένων τους βελτιώνοντας έτσι τη διαλειτουργικότητα των εφαρμογών ανάζήτησης και ανάκτησης. Εκτός αυτού, η ανάπτυξη προτύπων μοντέλων μεταδεδομένων θα συντελέσει στηνανάδειξηκαιτηνπροώθηση, απότοπλήθοςτωνδυνατών προσεγγίσεων στην περιγραφή και ανάκτηση οπτικοακουστικής πληροφορίας, των πιο σύγχρονων και των περισσότερα υποσχόμενων
Τα πρότυπα μοντέλα μεταδεδομένων ορίζουν ουσιαστικά σύνολα από χαρακτηριστικά τα οποία περιγράφουν την οπτικοακουστική πληροφορία με τέτοιο τρόπο ώστε να καλύπτουν συγκεκριμένες ανάγκες διαχείρισης και ανάκτησής της. Τα πρότυπα αυτά σύνολα χαρακτηριστικών, αποτελούν ένα κοινό λεξιλόγιο αναφοράς, προς χρήση από κάθε ενδιαφερόμενη πλευρά. Παράδειγμα τέτοιων προτύπων μεταδεδομένων είναι το Dublin Core, το οποίο αν και σχεδιάστηκε ώστε να παρέχει «βιβλιογραφική» πληροφορία για έγγραφα με όχι κατ ανάγκη οπτικοακουστικό περιεχόμενο, υποστηρίζεται ότι μπορεί να βρει εφαρμογή και στα μεταδεδομένα πολυμέσων
Τα στοιχεία μεταδεδομένων του προτύπου, πλήθους δεκαπέντε (15), παρουσιάζονται στον παρακάτω πίνακα και κατηγοριοποιούνται αμέσως μετά σε τρεις (3) περιοχές όνομα Μεταδεδομένου title creator Subject Description Publisher Contributor Date Type Format Identifier Source Language Relation Coverage Rights περιγραφικός ορισμος των στοιχείων μεταδεδομένων του Dublin Core Standard Το όνομα που δίνεται στην πηγή πληροφοριών ( ο τίτλος είναι το όνομα με το οποίο ηπηγήείναιεπίσημαγνωστή) Η οντότητα η οποία ευθύνεται αρχικά για τη δημιουργία του περιεχομένου της πηγής. Τοθέματουπεριεχομένουτηςπηγής. (Εκφράζεται κυρίως με λέξεις κλειδιά ή κώδικες ταξινόμησης κλάσεων.) Μια έκθεση του περιεχομένου της πηγής. (Μπορεί να εκφραστεί με μια σύντομη επισκόπηση, με έναν πίνακα περιεχομένων, κ.λπ...) Η οντότητα η οποία είναι υπεύθυνη για τη διαθεσιμότητα της πηγής Η οντότητα που είναι υπεύθυνη να συνεισφέρει στο περιεχόμενο της πηγής. Η ημερομηνία ενός γεγονότος στον κύκλο ζωής της πηγής. Η φύση ή το είδος του περιεχομένου της πηγής. Η φυσική ή ψηφιακή υλοποίηση / τυποποίηση της πηγής. Μια σαφής αναφορά στην πηγή μέσα ένα συγκεκριμένο πλαίσιο. (URL, URI, DOI, κ.λπ...) Μια αναφορά στην πηγή από την οποία προέρχεται / απορρέει η παρούσα πηγή. Η γλώσσα του πνευματικού περιεχομένου της πηγής. Μιααναφοράσεμιαάλλησχετικήπηγή. Η επέκταση ή ο σκοπός του περιεχομένου της πηγής. Πληροφορίες για τα δικαιώματα που σχετίζονται με οποιαδήποτε χρήση της πηγής. (Δικαιώματα Πνευματικής Ιδιοκτησίας)
Οι 3 περιοχές κατηγοριοποίησης του συνόλου μεταδεδομένων του Dublin Core φαίνονται στον παρακάτω πίνακα:
Η πιο έγκυρη και πλήρης προσέγγιση στην μοντελοποίηση μεταδεδομένων πολυμέσων είναι το (υπό ανάπτυξη) διεθνές πρότυπο MPEG 7. Το πρότυπο MPEG 7 θα ορίσει ένα επεκτάσιμο σύνολο από απλά και σύνθετα χαρακτηριστικά, τα οποία θα καλύπτουν με γενικό και ενιαίο τρόπο όλες τις απαιτήσεις για τα μεταδεδομένα πολυμέσων, παρέχοντας τη δυνατότητα κατασκευής περιγραφών που κυμαίνονται από το πολύ χαμηλό επίπεδο των μαθηματικών ιδιοτήτων του οπτικού και ηχητικού σήματος, στο πολύ υψηλό της σημασιολογικής ανάλυσης της δομής και του περιεχομένου της οπτικοακουστικής οντότητας. Το πρότυπο MPEG 7 ορίζεται και τυπικά χρησιμοποιώντας την γλώσσα ορισμού σχημάτων XML Schema.
Έτσι, οποιαδήποτε MPEG 7 περιγραφή έχει μια πρότυπη XML αναπαράσταση, μπορεί δηλαδή να γραφτεί σαν ένα XML έγγραφο με σύνταξη που να τηρεί τους κανόνες που τίθενται απότοπρότυποσχήμα, με όλα τα πλεονεκτήματα που συνεπάγεται η ύπαρξη μιας τυπικής, ανεξάρτητης από πλατφόρμα υλοποίησης (platform independent) και κατανοητής από το λογισμικό (machine understandable) σύνταξης για της περιγραφές. Εκτός αυτού, η επεκτασιμότητα της XML Schema επιτρέπει τον ορισμό επεκτάσεων του προτύπου και τη δημιουργία επιπλέων περιγραφών, οι οποίες θα καλύπτουν τις ανάγκες νέων και εξειδικευμένων εφαρμογών.
Tο σχήμα μεταδεδομένων που προέρχεται από το TV Anytime forum. Το TV Anytime forum (TVA) δραστηριοποιείται στις εφαρμογέςψηφιακήςτηλεόρασηςκαιέχειωςστόχοόχιμόνο την τυποποίηση των μεταδεδομένων για τέτοιου είδους εφαρμογές, αλλα τη σχεδίαση και υλοποίηση ολοκληρωμένων συστημάτων αναφοράς, τα οποία παρέχουν υπηρεσίες σχετικές με οπτικοακουστικό υλικό ευρείας ζώνης «εκμεταλλευόμενα την ύπαρξη αποθηκευτικών μέσων μεγάλης χωρητικότητας, που βρίσκονται εγκατεστημένα σε μαζικής παραγωγής ηλεκτρονικές καταναλωτικές συσκευές». Το μοντέλο μεταδεδομένων του TVA είναι διακριτό από το MPEG 7, διότι οι βασικές οντότητες που το απαρτίζουν είναι διαφορετικές. Χρησιμοποιεί όμως και αυτό την XML Schema για τον ορισμό του και σε πολλά σημεία ενσωματώνει ολόκληρες MPEG 7 περιγραφές
[1] Παπαδομανωλάκης Ευστράτιος, ΣΥΣΤΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΜΕΤΑΔΕΔΟΜΕΝΩΝ ΓΙΑ ΨΗΦΙΑΚΗ ΤΗΛΕΟΡΑΣΗ, Πολυτεχνείο Κρήτης, 2001 [2] Ελένη Κ.Βάθη, Ανάπτυξη Οντολογικής Γνώσης για Τεκμηρίωση Οπτικοακουστικού Περιεχομένου Εθνικό Μετσόβειο Πολυτεχνείο, 2011 [3] Understanding Metadata, NISO Press National Information Standards Organization,2004 [4] Παναγιώτης Ν. Τσουγκριάνης, Τυποποίηση Διαδικασίας Ανάπτυξης Πολυμεσικών Εφαρμογών, Εθνικό Μετσόβειο Πολυτεχνείο,2006 [5] Alex Berson and Larry Dubov, Mastering Data Management and Customer Intergration for a global Enterprise, McGraw-Hill, 2007