Διαχείριση Πολιτισμικών Δεδομένων Μάθημα 9 Μεταδεδομένα Τζανέτος Πομόνης ΤΕΙ Ιονίων Νήσων Τμήμα Τεχνολόγων Περιβάλλοντος Κατεύθυνση Συντήρησης Πολιτισμικής Κληρονομιάς
Τι είναι τα Μεταδεδομένα; Ο όρος Μεταδεδομένα αποτελεί μετάφραση του όρου metadata, ο οποίος σχηματίζεται από την ελληνική λέξη μετά και τη λατινική λέξη data (=δεδομένα). Ο συνηθέστερος ορισμός που δίδεται είναι: Τα μεταδεδομένα είναι δεδομένα που αφορούν δεδομένα. Στο βιβλιοθηκονομικό περιβάλλον, ένας πιο ακριβής και τεχνικός ορισμός είναι ο ακόλουθος: Τα μεταδεδομένα είναι δομημένα και κωδικοποιημένα δεδομένα τα οποία περιγράφουν χαρακτηριστικά πληροφοριακών οντοτήτων, αποσκοπώντας στην ταύτιση, αναγνώριση, ανακάλυψη, αξιολόγηση και διαχείρισή τους.
Αρχεία Μεταδεδομένων Ένα αρχείο μεταδεδομένων αποτελείται από ένα σύνολο ιδιοτήτων ή στοιχείων απαραίτητων για να περιγράψουν έναν πόρο. Για παράδειγμα, ένα σύστημα μεταδεδομένων κοινό σε βιβλιοθήκες - ο κατάλογος της βιβλιοθήκης - περιέχει ένα σύνολο αρχείων μεταδεδομένων με στοιχεία που περιγράφουν ένα βιβλίο ή κάποιο άλλο αντικείμενο σε μια βιβλιοθήκη: συγγραφέας, τίτλος, ημερομηνία δημιουργίας ή δημοσίευσης, κάλυψη θέματος και ο αριθμός εισαγωγής που προσδιορίζει τη θέση του αντικειμένου στο ράφι.
Παράδειγμα Μεταδεδομένων
Σύγχυση Δεδομένων και Μεταδεδομένων Συνήθως δε μπορεί κάποιος να διαχωρίσει εύκολα τα απλά δεδομένα από τα μεταδεδομένα διότι: Κάποια δεδομένα μπορούν να είναι ταυτόχρονα και απλά δεδομένα και μεταδεδομένα. Η επικεφαλίδα σε κάποιο κείμενο είναι τόσο μέρος του κειμένου, δηλ. δεδομένο, όσο και τίτλος του κειμένου, δηλ. μεταδεδομένο. Τα δεδομένα και τα μεταδεδομένα μπορούν να αλλάξουν ρόλους. Ένα ποίημα, αυτό καθ' αυτό, είναι δεδομένα, αλλά αν το ποίημα αποτελεί τους στίχους σε ένα τραγούδι, ολόκληρο το ποίημα θα μπορούσε να επισυναφθεί σε ένα ηχητικό αρχείο ως μεταδεδομένα. Έτσι, η ερμηνεία εξαρτάται από ποια άποψη το βλέπει κανείς. Είναι δυνατό να δημιουργηθούν μετα-μετα-...-μεταδεδομένα...
Χρήση Μεταδεδομένων Η βασική χρησιμότητα των μεταδεδομένων είναι να επιταχύνουν και να εμπλουτίζουν την αναζήτηση πηγών. Η αναζήτηση με τη χρήση μεταδεδομένων γλιτώνει το χρήστη από περίπλοκες και χρονοβόρες χειροκίνητες διαδικασίες φιλτραρίσματος πληροφοριών.
Είδη Μεταδεδομένων Τα μεταδεδομένα διακρίνονται σε κατηγορίες ανάλογα με: το περιεχόμενό τους. Μπορούν να περιγράφουν είτε την ίδια την πηγή, π.χ. όνομα και μέγεθος του αρχείου, ή το περιεχόμενο της πηγής, π.χ. "Το βίντεο δείχνει ένα αγόρι να παίζει ποδόσφαιρο." τη μεταβλητότητά τους. Σε σχέση με την πηγή, τα μεταδεδομένα μπορούν να είναι είτε αμετάβλητα, π.χ. ο τίτλος ενός αρχείου δεν αλλάζει, ανεξάρτητα από το ποιο μέρος του αρχείου λαμβάνεται υπ' όψη, είτε μεταβλητά, π.χ. οι περιγραφές των σκηνών σε ένα βίντεο ποικίλλουν.
Είδη Μεταδεδομένων τη λογική συνάρτησή τους. Υπάρχουν τρία επίπεδα λογικής συνάρτησης, το ένα πάνω από το άλλο: κάτω βρίσκεται το υπο-συμβολικό επίπεδο που περιέχει τα ίδια τα απλά δεδομένα, στη μέση υπάρχει το συμβολικό επίπεδο όπου υπάρχουν μεταδεδομένα τα οποία περιγράφουν το περιεχόμενο των απλών δεδομένων, και πάνω το λογικό επίπεδο που περιέχει μεταδεδομένα τα οποία επιτρέπουν λογικούς συλλογισμούς βάσει του συμβολικού επιπέδου.
Μεταδεδομένα σε Ψηφιακές Βιβλιοθήκες Για την περιγραφή αρχείων σε μια ψηφιακή βιβλιοθήκη χρησιμοποιούνται συχνά τρεις κατηγορίες μεταδεδομένων: Περιγραφικά: περιγραφή και προσδιορισμός πληροφοριών Πληροφορίες που περιγράφουν το περιεχόμενο του αρχείου. Χρησιμοποιούνται για βιβλιογραφικούς σκοπούς και για αναζήτηση-ανάκτηση. Δομικά: πλοήγηση και παρουσίαση Πληροφορίες που συνδέουν ένα αρχείο με άλλα αρχεία ώστε να αποτελούν λογικές μονάδες Π.χ. πληροφορίες που συνδέουν την κάθε εικόνα που υπάρχει σε ένα βιβλίο με τις υπόλοιπες εικόνες του. Διαχειριστικά: διαχείριση και επεξεργασία
Περιγραφικά Μεταδεδομένα Περιγραφή και προσδιορισμός του πρωτοτύπου: Στο τοπικό σύστημα επιτρέπει την αναζήτηση και ανάκτηση (π.χ. αναζήτηση φωτογραφιών με συγκεκριμένο θέμα). Σε επίπεδο δικτύου επιτρέπει την ανακάλυψη ψηφιακών αντικειμένων (π.χ. ψηφιοποιημένων ποιητικών συλλογών). Ενδεικτικά πεδία: Μοναδικά αναγνωριστικά. Φυσικές ιδιότητες του πρωτοτύπου (διαστάσεις κλπ). Βιβλιογραφικές πληροφορίες (τίτλος, δημιουργός, γλώσσα, λέξεις-κλειδιά κλπ).
Δομικά Μεταδεδομένα Απεικόνιση της δομής (λογικών και φυσικών σχέσεων) και βελτιωμένη παρουσίαση των ψηφιακών αντικειμένων: Πληροφορίες σχετικά με την εσωτερική δομή του αντικειμένου π.χ. σελίδα, ενότητα, αριθμός κεφαλαίου. Σχέσεις ανάμεσα σε διαφορετικά ψηφιακά αντικείμενα (για παράδειγμα η φωτογραφία Β περιέχεται στο κείμενο Α). Σχέσεις ανάμεσα σε διαφορετικά αρχεία του ίδιου αντικειμένου (π.χ. το αρχείο εικόνας Β τύπου JPEG έχει δημιουργηθεί από το αρχείο εικόνας Α τύπου TIFF). Ενδεικτικά Πεδία: Σελίδα, Κεφάλαιο κτλ. Πίνακας περιεχομένων. Σχέσεις ανάμεσα σε ψηφιακά αντικείμενα κλπ.
Διαχειριστικά Μεταδεδομένα Επιτρέπουν τη βραχυπρόθεσμη αλλά και μακροπρόθεσμη διαχείριση και επεξεργασία ψηφιακών συλλογών: Τεχνικά χαρακτηριστικά από την ψηφιακή αποτύπωση και τον έλεγχο ποιότητας (τεχνικά μεταδεδομένα). Πληροφορίες σχετικές με τη διαχείριση των πνευματικών δικαιωμάτων και τον έλεγχο πρόσβασης. Πληροφορίες σχετικά με τη διατήρηση. Πληροφορίες σχετικά με το ιστορικό αλλαγών στο ψηφιακό αντικείμενο από τη στιγμή της δημιουργίας του. Ενδεικτικά Πεδία: Τεχνικά χαρακτηριστικά, όπως τύπος και μοντέλο σαρωτή, ανάλυση, χρωματικό βάθος, τύπος αρχείου, φωτισμός, συμπίεση, κάτοχος πνευματικών δικαιωμάτων, περιορισμοί στην αναπαραγωγή και τη διανομή, ενέργειες διατήρησης κλπ.
Πρότυπα Μεταδεδομένων Χρειάζονται για να έχουμε κοινή αντίληψη των δεδομένων που περιγράφονται με αυτά. Μας προσφέρουν μεγαλύτερη δομή Μας περιορίζουν στην ευελιξία Επεξεργάζονται ευκολότερα μηχανικά Είναι αναγκαιότερα σε ψηφιακά αντικείμενα Αφού στα συμβατικά συνήθως έχουμε καλύτερη αισθητήρια αντίληψη για αναγνώριση, θέση, θέμα...
Πρότυπα Μεταδεδομένων Δεν υπάρχει ένα μοναδικό διεθνές πρότυπο μεταδεδομένων, γιατί: Χρειαζόμαστε διαφορετικά επίπεδα πολυπλοκότητας, από πλούσιες μέχρι απλές περιγραφές. Υπάρχουν πολλά σχήματα μεταδεδομένων, για διαφορετικά επίπεδα και απαιτήσεις. Επεκτείνουμε συνεχώς τα υπάρχοντα πρότυπα.
Πρότυπα Μεταδεδομένων Text Encoding and Interchange (TEI) Machine Readable Cataloging (MARC) Encoded Archive Description (EAD) Metadata Encoding and Transmission Standard (METS) Open Archives Initiative - OAI Dublin Core - DC Europeana Semantic Elements Europeana Data Model CIDOC CRM...
Το Πρότυπο Dublin Core Πρωτοβουλία για να βελτιώσει την ανακάλυψη πόρων στο Διαδίκτυο. Κοινός παρονομαστής για επικοινωνία και διαλειτουργικότητα Έναυσμα για σύγκλιση των προτύπων Επεκτάσιμο για να καλύψει τις επιπρόσθετες ανάγκες ανακάλυψης πόρων των διαφορετικών εφαρμογών / περιοχών Προτυποποίηση: ISO 15836-2003 US: NISO Z39.85-2001 Ευρώπη: αναγνώριση από το CEN/ISSS Workshop Agreement 13874-2000
Στόχοι του Dublin Core Απλότητα δημιουργίας και διατήρησης: Μη ειδικοί να δημιουργούν περιγραφικές εγγραφές για αποτελεσματική ανάκτηση σε δικτυωμένο περιβάλλον Κοινά κατανοητή (διαθεματική) σηµασιολογία: Σύγκλιση κοινών, περισσότερο γενικών στοιχείων Αυξημένη ορατότητα και προσβασιμότητα Κατάλληλο και για το μη ειδικό της αναζητητής Τον «ψηφιακό τουρίστα» Διεθνές πεδίο εφαρμογής.
Χρήση του Dublin Core Είναι βασικός πυρήνας στοιχείων Γενικού σκοπού εν είναι υποκατάστατο σε πλουσιότερα περιγραφικά πρότυπα Περιλαμβάνει δύο επίπεδα: Απλό (Simple). Περιλαμβάνει 15 στοιχεία. Εξειδικευτικό (Qualified). Επεκτείνεται με εξειδικεύσεις στοιχείων.
Dublin Core Simple Τίτλος / Title Θέμα / Subject Περιγραφή / Description Πηγή / Source Γλώσσα / Language Σχέση / Relation Κάλυψη / Coverage Δημιουργός / Creator Εκδότης / Publisher Συντελεστής / Contributor Δικαιώματα / Rights Ημερομηνία / Date Τύπος / Type Μορφότυπο / Format Αναγνωριστικό / Identifier
Dublin Core Qualified Δομημένο αλλά μη περιορισμένο σύνολο! Κάθε στοιχείο μπορεί να έχει άτυπες εξειδικεύσεις Έσχατη λύση: νέοι προσδιορισμοί / επίπεδα π.χ. Degree = τύπος πτυχίου Κανόνας «ακρωτηριασμού» (γενίκευσης), π.χ: TITLE TITLE.ALTERNATIVE TITLE.TRANSLATED TITLE.ALTERNATIVE.TRANSLATED TITLE.FULL
Dublin Core Qualified
Καλές Πρακτικές Χρήση προτύπων και καθιερωμένων κανόνων Η χρήση των κατάλληλων μεταδεδομένων είναι πολύ σημαντική ως προς τη διευκόλυνση των υπηρεσιών αναζήτησης και ανάκτησης αντικειμένων από μια ψηφιακή συλλογή. Αυτό είναι εμφανές, ιδιαίτερα όταν γίνεται αναζήτηση σε πολλές συλλογές, οι οποίες φιλοξενούνται σε διαφορετικές τοποθεσίες (π.χ. εικονική διασύνδεση μουσείων κλπ) Όχι αυτοσχεδιασμοί στην περιγραφή των δεδομένων Έστω και αν φαινομενικά επαρκούν για την εφαρμογή Δε φτάνει να δουλεύει μια εφαρμογή Πρέπει να μπορεί να δια-λειτουργεί στο μέλλον