ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. ΜΕΤΑΠΤΥΧΙΑΚΟ ΔΙΠΛΩΜΑ ΕΙΔΙΚΕΥΣΗΣ (MSc) στα ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΠΛΩΜΑΤΙKH ΕΡΓΑΣΙΑ

Σχετικά έγγραφα
Μεταδεδομένα στο Ψηφιακό περιβάλλον

Διαχείριση Πολιτισμικών Δεδομένων

Ιόνιο Πανεπιστήμιο - Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας

Μάθηµα 6. Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας

Διαλειτουργικότητα μεταξύ αρχείων (1/2)

της πληροφορίας Λίνα Μπουντούρη Εθνικό Κέντρο Τεκμηρίωσης 13ο ΠανελλήνιοΣυνέδριοΑκαδημαϊκών Βιβλιοθηκών - Κέρκυρα 2004

ΜΑΘΗΜΑ 6. Σχήµατα ιαλειτουργικότητας Μεταδεδοµένων. Το RDF Το Warwick Framework. Ιόνιο Πανεπιστήµιο - Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας

ΜΑΘΗΜΑ 5. Ιόνιο Πανεπιστήµιο - Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας. Tεχνολογίες των Πληροφοριών σε ψηφιακό περιβάλλον: Τα εργαλεία

ΑΝΑΠΤΥΞΗ ΥΠΟΔΟΜΩΝ ΑΝΟΙΚΤΗΣ ΠΡΟΣΒΑΣΗΣ ΙΔΡΥΜΑΤΙΚΟ ΑΠΟΘΕΤΗΡΙΟ «ΟΛΥΜΠΙΑΣ» Διαλειτουργικότητα Ιδρυματικών Αποθετηρίων

Σε παγκόσμιο επίπεδο, οιμηχανέςαναζήτησηςτουinternet αναπτύχθηκαν για να κάνουν αναζήτηση πληροφοριών σε πολλαπλές τοποθεσίες ιστού.

Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών

Ιστορικοί χάρτες στον Παγκόσμιο Ιστό

Σχεδιασμός του Ολοκληρωμένου Συστήματος Ψηφιακής Βιβλιοθήκης του Πανεπιστημίου Αθηνών

Πολιτισμική Τεχνολογία. Πολυμέσα & Διαδίκτυο Παράμετροι Δικαίου Μέρος Α

Πίνακας Προτεινόμενων Πτυχιακών Εργασιών

Ψηφιοποιημένο Αρχείο Ελληνικής Μουσικής Από την απομόνωση στην εποχή των δικτύων και της διάδοσης της πληροφορίας

Έφη Πατσατζή, Αρχαιολόγος-Μουσειολόγος Διεύθυνση Εθνικού Αρχείου Μνημείων ΥΠ.ΠΟ.Τ. Ψηφιακός πολιτισμός και επιμέλεια

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ:

Ήλιος: Το ψηφιακό Αποθετήριο Ανοικτής Πρόσβασης του Εθνικού Ιδρύματος Ερευνών

Συμπόσιο για την Ανοικτή Επιστήμη Αθήνα, Νοεμβρίου Πάνος Κωνσταντόπουλος Οικονομικό Πανεπιστήμιο Αθηνών και Ερευνητικό Κέντρο «Αθηνά»

Ψηφιοποίηση και ψηφιακή επεξεργασία εικόνας

Αναφορά εργασιών για το τρίμηνο Σεπτέμβριος Νοέμβριος 2012

Αποθετήρια. Κλειώ Σγουροπούλου. Αριστεία ΕΛ/ΛΑΚ ΤΕΙ Αθήνας

Ψηφιακά Αποθετήρια: Η Ελληνική Πραγματικότητα

Πίνακας Προτεινόμενων Πτυχιακών Εργασιών

Πίνακας Προτεινόμενων Πτυχιακών Εργασιών

Εννοιολογική Ομοιογένεια

Διακιρυξθ Διαγωνιςμοφ για το Ζργο ΨΘΦΙΑΚΘ ΠΕΡΙΘΓΘΘ ΣΟ ΠΟΛΙΣΙΣΙΚΟ ΚΑΙ ΙΣΟΡΙΚΟ ΑΡΧΕΙΟ ΣΟΤ ΧΑΪΔΑΡΙΟΤ

Συλλογικοί Κατάλογοι & Διαδίκτυο

Αναφορά εργασιών για το τρίμηνο Σεπτέμβριος Νοέμβριος 2012 Όνομα : Μπελούλη Αγάθη

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

Οντολογία για την περιγραφή των προσωπικοτήτων της Σάμου, την κατηγοριοποίηση και τις σχέσεις τους

Διαχείριση, Δημοσίευση και Διάθεση Ανοικτών Εκπαιδευτικών Πόρων

Αναφορά εργασιών για το τρίμηνο Δεκέμβριος 2012 Φεβρουάριος 2013 Όνομα : Μπελούλη Αγάθη

Μοντέλα Κυβερνητικής Πληροφορίας

«DARIAH-ΑΤΤΙΚΗ Ανάπτυξη της ελληνικής ερευνητικής υποδομής για τις ανθρωπιστικές επιστήμες ΔΥΑΣ» Αθήνα, 26 Φεβρουαρίου 2015

6 ο Πακέτο Εργασίας «Ψηφιακή Βάση ιαχείρισης Γεωγνώσης (e-repository of Geoscience Content)»

Θεωρητική προσέγγιση του Σημασιολογικού Ιστού στο χώρο της πολιτισμικής πληροφορίας: μία πρότυπη εφαρμογή στη βιβλιοθηκονομία

Λογισμικό Open Source στις Υπηρεσίες των Βιβλιοθηκών του Πανεπιστημίου Αθηνών

Ψηφιοποίηση και Ψηφιακή Επεξεργασία Εικόνας

Αναπαράσταση Γνώσης και Αναζήτηση στον Σηµασιολογικό Ιστό

e-publishing Υπηρεσίες Ηλεκτρονικών εκδόσεων- Τίτλος παρουσίασης epublishing Open Book Press

Unified search of digital cultural content: Searching culture

Ιδρυματικά Καταθετήρια

Ανοικτή Πρόσβαση και αρχαιολογικά Δεδομένα.

Εισαγωγή στην Πληροφορική

Ενιαίο Σύστημα Ψηφιακής Βιβλιοθήκης του Πανεπιστημίου Αθηνών

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ. Σαράντος Καπιδάκης

Διαχείριση οντολογιών: μελέτη και εμβάθυνση στα βασικά προβλήματα που την αφορούν και παρουσίαση υπαρχουσών βιβλιοθηκών οντολογιών

Παρουσίαση Παρεχόμενων Υπηρεσιών Πληροφορικής της DBS AE

Επιχειρησιακό Πρόγραμμα «Ψηφιακή Σύγκλιση»

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3

Δρ. Εμμανουήλ Γαρουφάλλου. Δρ. Αλέξανδρος Κουλούρης

Η Τεχνολογική Διαλειτουργική Πλατφόρµα του έργου ATHENA

Οι Δρόμοι της Ψηφιακής Διατήρησης και της Ψηφιακής Αρχαιολογίας

Αξιοποίηση και διάθεση ελληνικού ψηφιακού έγκριτου περιεχομένου

Τεχνολογία Πολιτισμικού Λογισμικού

ΙΔΡΥΜΑΤΙΚΑ ΑΠΟΘΕΤΗΡΙΑ (ΙΑ): ΡΟΕΣ ΚΑΤΑΘΕΣΗΣ ΤΕΚΜΗΡΙΩΝ, ΔΙΕΠΑΦΕΣ ΧΡΗΣΤΗ, ΥΠΟΔΟΜΗ

Εκλογή Καθηγητή στο Τμήμα Αρχειονομίας, Βιβλιοθηκονομίας και Μουσειολογίας, στο γνωστικό αντικείμενο «Πληροφοριακά Συστήματα Βιβλιοθηκών και Αρχείων».

Συστήματα πανταχού παρόντος υπολογιστή σε περιβάλλοντα υβριδικών βιβλιοθηκών

Αναφορά εργασιών για το τρίμηνο Μάρτιος 2013 Μάιος 2013 Όνομα : Παπαχριστόπουλος Λεωνίδας

Ο συσσωρευτής SearchCulture.gr: μια προσέγγιση για την ανάδειξη του ελληνικού ψηφιακού πολιτιστικού περιεχομένου

ΚΩΔΙΚΟΠΟΙΗΣΗ ONEGEOLOGY - EUROPE ΔΕΔΟΜΕΝΩΝ ΓΙΑ ΤΗΝ ΠΑΡΟΧΗ WMS WFS ΥΠΗΡΕΣΙΩΝ KATA INSPIRE ΜΕ ΒΑΣΗ ΤΟ ΠΡΟΤΥΠΟ GeoSciML 4.0

Μαθησιακά Αντικείμενα

Υπηρεσιοστρεφής Αρχιτεκτονική SOA (Service Oriented Architecture)

Η χρήση µεταδεδοµένων στα πολυµέσα: τρόποι εισαγωγής και πεδία εφαρµογής

Όμως πώς θα ορίζαμε την έννοια πληροφορία; Πώς την αντιλαμβανόμαστε;

Μάθηµα 3. Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας

Οδηγός υποβολής σε αποθετήριο SaaS

ΤΙΤΛΟΣ ΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: GoNToggle: ΕΞΥΠΝΗ ΜΗΧΑΝΗ ΑΝΑΖΗΤΗΣΗΣ ΜΕ ΧΡΗΣΗ ΟΝΤΟΛΟΓΙΩΝ ΠΕΡΙΟΧΗ ΕΡΕΥΝΑΣ: ΣΥΓΓΡΑΦΕΑΣ:

ΑΝΑΠΤΥΞΗ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ ΨΗΦΙΑΚΩΝ ΣΥΛΛΟΓΩΝ ΕΦΗΜΕΡΙΔΩΝ

Διαχείριση Πολιτισμικών Δεδομένων

Υποδομές δεδομένων & υπηρεσιών: ωφέλη και προκλήσεις

Οδηγός. Σχολιασμού. Διπλωματικής Εργασίας

econtentplus Έφη Πατσατζή, Αρχαιολόγος-Μουσειολόγος Υπουργείο Πολιτισμού και Τουρισμού Διεύθυνση Εθνικού Αρχείου Μνημείων

Ο ΗΓΟΣ ΠΟΛΙΤΙΣΜΙΚΗΣ ΤΕΚΜΗΡΙΩΣΗΣ ΚΑΙ ΙΑΛΕΙΤΟΥΡΓΙΚΟΤΗΤΑΣ

Μεταδεδομένα ψηφιακού περιεχομένου

Η υπηρεσία αποθετηρίων SaaS του ΕΚΤ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ Δ.Π.Μ.Σ. ΣΤΑ ΣΤΑΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ

Θέλετε να διαθέσετε ένα αρχείο στο διαδίκτυο;

ΕΚΤ και καινοτομία με ανοιχτά δεδομένα και APIs

Παραδοτέο Π.2.1. Υπερχώρος και διαχείριση μοντέλων

Η συμβολή στην επιτυχία ενός οργανισμού, παρουσιάζοντας σχετικά δεδομένα με τη χρήση τεχνικών 2Δ ή 3Δ τεχνολογίας. Αρμοδιότητα

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές

Η τεχνική υποδομή του Εθνικού Συσσωρευτή. Βαγγέλης Μπάνος, ελληνική ομάδα EDLocal

ΑΚΑΔΗΜΙΑ ΠΛΑΤΩΝΟΣ ΑΝΑΠΤΥΞΗ ΤΗΣ ΓΝΩΣΗΣ ΚΑΙ ΚΑΙΝΟΤΟΜΩΝ ΙΔΕΩΝ

Υπηρεσίες Υποστήριξης, Δικτύωσης, Προδιαγραφών & Πιστοποίησης Ιδρυματικών Αποθετηρίων

Ψηφιοποίηση και Ψηφιακή Επεξεργασία Εικόνας

γνωστικό περιβάλλον της Κοινωνίας της Πληροφορίας, Προπτυχιακών και Μεταπτυχιακών Σπουδών με σύγχρονες μεθόδους,

Επιτυχημένα παραδείγματα. σε ελληνικά αποθετήρια και σχετικά τεχνολογικά εργαλεία

4/2014 ΣΥΝΟΠΤΙΚΗ ΠΑΡΟΥΣΙΑΣΗ ΥΔΡΟΛΗΨΙΕΣ ΑΤΤΙΚΗΣ ΑΠΟΚΕΝΤΡΩΜΕΝΗ ΔΙΟΙΚΗΣΗ ΑΤΤΙΚΗΣ ΔΙΕΥΘΥΝΣΗ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ

Πατήστε στην ερώτηση που επιθυμείτε, για να διαβάσετε την αντίστοιχη απάντηση.

λειτουργιών βιβλιοθήκης

Ορισμός. Τι είναι το ψηφιακό αποθετήριο; Βασικά Υποσυστήματα Ψηφιακής Βιβλιοθήκης 12/4/2015

Η Βιβλιοθήκη του Α.Τ.Ε.Ι.Θ

Τεχνικές Προδιαγραφές ιαλειτουργικότητας

Θεματική Ενότητα: Εκπαιδευτικό Λογισμικό. Αποθετήρια & Ανοικτοί Εκπαιδευτικοί Πόροι Ανάλυση εφαρμογής

Πίνακας Προτεινόμενων Πτυχιακών Εργασιών

Υπόθεση A8-0245/14 /225

ΙΔΡΥΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΕΡΕΥΝΑΣ (ITE)

Transcript:

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΔΙΠΛΩΜΑ ΕΙΔΙΚΕΥΣΗΣ (MSc) στα ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΠΛΩΜΑΤΙKH ΕΡΓΑΣΙΑ «Ανάπτυξη μητρώων δεδομένων» Μακρή Δήμητρα-Νεφέλη Μ3110002 ΑΘΗΝΑ, ΦΕΒΡΟΥΑΡΙΟΣ 2013

ΜΕΤΑΠΤΥΧΙΑΚΟ ΔΙΠΛΩΜΑ ΕΙΔΙΚΕΥΣΗΣ (MSc) στα ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΠΛΩΜΑΤΙKH ΕΡΓΑΣΙΑ «Ανάπτυξη μητρώων δεδομένων» Μακρή Δήμητρα-Νεφέλη Μ3110002 Επιβλέπων Καθηγητής: Πάνος Κωνσταντόπουλος Εξωτερικός Κριτής: Χρήστος Παπαθεοδώρου ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΘΗΝΑ, ΦΕΒΡΟΥΑΡΙΟΣ 2013

ΠΕΡΙΛΗΨΗ Η ψηφιοποίηση των αντικειμένων και η ψηφιακή τους επιμέλεια έχει απασχολήσει τα τελευταία χρόνια πολλούς ερευνητές σε διαφορετικές επιστημονικές κοινότητες. Σκοπός της παρούσας εργασίας είναι η διερεύνηση των μητρώων δεδομένων, με εξειδίκευση στο χώρο των ανθρωπιστικών επιστημών, εστιάζοντας στις τεχνικές υποδομές τους. Αρχικά γίνεται μία ανασκόπηση αναφορικά με τον ορισμό των μητρώων και τα πρότυπα διαχείρισης μητρών μεταδεδομένων και γίνεται μία ενδεικτική αναφορά κάποιων μητρώων δεδομένων. Στη συνέχεια, παρουσιάζεται η δομή των πληροφοριών, αναφέροντας γνωστά σχήματα μεταδεδομένων που έχουν αναπτυχθεί για τη διαχείριση τους καθώς επίσης και οι υπηρεσίες που προσφέρουν τα μητρώα. Σε επόμενο στάδιο, αντικείμενο προς εξέταση αποτελούν όλες οι τεχνολογίες και τεχνικές υποδομές που χρησιμοποιούνται για την ανάπτυξη των μητρώων. Τέλος, παρουσιάζεται μία πρόταση για την ανάπτυξη ενός μητρώου δεδομένων που μπορεί να εφαρμοστεί τόσο στο χώρο των ανθρωπιστικών επιστημών όσο και σε άλλους τομείς.

Πίνακας περιεχομένων 1. ΕΙΣΑΓΩΓΗ... 6 2. ΜΗΤΡΩΑ ΔΕΔΟΜΕΝΩΝ... 10 2.1 Χρησιμότητα και απαιτήσεις μητρώων δεδομένων... 10 2.2 Τύποι και πρότυπα μητρώων... 11 2.3 Ευρέως διαδεδομένα μητρώα... 15 2.4 Μητρώα δεδομένων στις ανθρωπιστικές επιστήμες... 17 3. ΔΟΜΗ ΠΛΗΡΟΦΟΡΙΩΝ ΚΑΙ ΥΠΗΡΕΣΙΕΣ ΜΗΤΡΩΩΝ... 20 3.1 Σχήματα μεταδεδομένων... 20 3.2 Πρότυπα μητρώα μορφοτύπων... 25 3.3 Υπηρεσίες μητρώων δεδομένων στις ανθρωπιστικές επιστήμες... 27 4. ΤΕΧΝΟΛΟΓΙΕΣ ΑΝΑΠΤΥΞΗΣ ΜΗΤΡΩΩΝ ΔΕΔΟΜΕΝΩΝ... 30 4.1 Επεξεργαστές κειμένου XML... 31 4.2 Εργαλεία μετατροπής ενός αρχείου σε άλλη μορφή... 32 4.3 Συστήματα Βάσεων Δεδομένων... 33 4.4 Περιβάλλοντα που συμβάλλουν στην ανάπτυξη των μητρώων... 34 5. ΕΝΑ ΠΕΡΙΒΑΛΛΟΝ ΑΝΑΠΤΥΞΗΣ ΜΗΤΡΩΩΝ ΠΗΓΩΝ... 36 5.1 Ανάπτυξη μητρώου δεδομένων... 36 5.2 Ανάλυση και περιγραφή τεχνολογιών και εργαλείων... 44 5.2.1 FEDORA Commons... 44 5.2.2 Apache Tomcat... 45 5.2.3 SAXON... 46 5.2.4 Apache Cocoon... 46 5.2.5 MODS Editor... 49 6. ΣΥΜΠΕΡΑΣΜΑΤΑ ΜΕΛΛΟΝΤΙΚΗ ΕΡΕΥΝΑ... 50 ΒΙΒΛΙΟΓΡΑΦΙΑ... 52 Παράρτημα... 56

1. ΕΙΣΑΓΩΓΗ Ο όγκος εγγράφων που χρησιμοποιούνται σε καθημερινή βάση για τις συναλλαγές μας είναι πολύ μεγάλος και συνεχώς αυξάνεται, πράγμα που οφείλεται τόσο στις συνεχώς μεταβαλλόμενες συνθήκες όσο και στην καλπάζουσα ανάπτυξη του Διαδικτύου. Η πλειοψηφία των εγγράφων αυτών είναι σε έντυπη μορφή πράγμα που δυσχεραίνει τη διαχείρισή τους, προκαλώντας συνεπώς την ανάγκη ψηφιοποίησης τους. Λέγοντας ψηφιοποίηση εννοούμε τη μετατροπή των έντυπων εγγράφων σε ψηφιακών. Ένα βασικό ερώτημα όμως είναι με ποιο τρόπο και για πόσο χρονικό διάστημα μπορεί να διατηρηθεί ένα ψηφιακό αντικείμενο. Σύμφωνα με το Συνασπισμό Ψηφιακής Διατήρησης (Digital Preservation Coalition) [14], η ψηφιακή διατήρηση αναφέρεται σε όλες εκείνες τις ενέργειες που απαιτούνται να γίνουν έτσι ώστε να διασφαλιστεί η συνεχής πρόσβαση στα ψηφιακά αντικείμενα, ανεξαρτήτως των τεχνολογικών αλλαγών ή του προκαθορισμένου χρόνου ζωής του αντικειμένου. Τα ψηφιακά αντικείμενα περιλαμβάνουν τόσο εκείνα που προέκυψαν από την μετατροπή της αναλογικής σε ψηφιακή μορφή (π.χ. αρχείο εγγράφου) όσο και εκείνα που δημιουργήθηκαν απευθείας σε ψηφιακή μορφή (π.χ. βίντεο). Απαραίτητα στοιχεία στην ψηφιακή διατήρηση αποτελούν τα μητρώα δεδομένων και τα μεταδεδομένα. Αντικείμενο της παρούσας διπλωματικής εργασίας αποτελεί η ανάπτυξη ενός μητρώου δεδομένων στο χώρο των ανθρωπιστικών επιστημών. Ο επιστημονικός κλάδος των ψηφιακών ανθρωπιστικών επιστημών (digital humanities) έχει διαμορφωθεί, κατά κοινή αντίληψη, μόλις εντός της δεκαετίας 2000-2010, αποτελώντας τη συνέχεια του πεδίου που ήταν γνωστό παλαιότερα ως ανθρωπιστική πληροφορική (humanities computing). Πρόκειται για ένα κλάδο ο οποίος περιλαμβάνει μία ποικιλία ζητημάτων που κυμαίνονται από την επιμέλεια ψηφιακών συλλογών μέχρι την εξόρυξη σε μεγάλα σύνολα πολιτισμικών δεδομένων [12]. Στη συνέχεια παρατίθεται ένα διάγραμμα, το οποίο απεικονίζει μία σύγκριση μεταξύ των όρων «ψηφιακές ανθρωπιστικές επιστήμες» και «ανθρωπιστική πληροφορική» κάνοντας χρήση της μηχανής αναζήτησης Google. Το διάγραμμα σχεδιάστηκε με το εργαλείο Google Trends, το οποίο είναι προσβάσιμο δικτυακά και δείχνει τη συχνότητα μιας συγκεκριμένης αναζήτησης ενός όρου σε σχέση με το συνολικό όγκο

αναζήτησης σε διάφορες περιοχές του κόσμου. Ο οριζόντιος άξονας απεικονίζει το χρόνο, ξεκινώντας από το 2004 και ο κατακόρυφος τη συχνότητα του όρου [23]. Χρόνος: 2004 - σήμερα Διάγραμμα1: Google Trends (digital humanities humanities computing) Από το παραπάνω διάγραμμα παρατηρούμε ότι ό όρος «ψηφιακές ανθρωπιστικές επιστήμες» είναι μεταγενέστερος του όρου «ανθρωπιστική πληροφορική». Είναι άμεσα ορατό ότι αν και τα δύο πρώτα χρόνια (2004-2006) ο όρος «ανθρωπιστική πληροφορική» χρησιμοποιείται ευρέως στια αναζητήσεις στον ιστό, από το 2006 υπάρχει μία συνεχώς αυξανόμενη χρήση του όρου «ψηφιακές ανθρωπιστικές επιστήμες». Αυτό είναι λογικό, αφού λαμβάνοντας υπόψη και τον ορισμό των ψηφιακών ανθρωπιστικών επιστημών που αναφέρθηκε παραπάνω, ο όρος «ανθρωπιστική πληροφορική» αντικαταστάθηκε και συνεπώς πλέον δεν χρησιμοποιείται αρκετά συχνά. Οι ψηφιακές ανθρωπιστικές επιστήμες καλύπτουν μία ποικιλία επιστημονικών προσεγγίσεων, αξιοποιώντας όλες τις υπηρεσίες και τα εργαλεία που προσφέρονται μέσω της τεχνολογίας. Όσον αφορά το χώρο της αρχαιολογικής έρευνας, η χρήση των τεχνολογιών συντελεί σημαντικά στη συλλογή και καταχώρηση των πρωτογενών δεδομένων και εν συνεχεία στη διαχείριση τους, στην ανάλυση πληροφοριών για τα αρχαιολογικά αντικείμενα και για τη γεωγραφική τους προέλευση, στην ταξινόμηση των αρχαιολογικών ευρημάτων ανάλογα με την μορφή τους, στην χρήση μεθόδων προσομοίωσης, στην οπτικοποίηση των τεκμηρίων και των δεδομένων, στη τρισδιάστατη αναπαράσταση του χώρου και των μνημείων [40]. Στην ιστορία της τέχνης, η τεχνολογία συμβάλλει στην οπτική εξέταση των έργων καθώς επίσης και

στη χρήση οπτικών τεκμηρίων για την διδασκαλία και την αναπαραγωγή της γνώσης. Στο πεδίο της ιστορίας, βάσει των υπολογιστικών μεθόδων, είναι δυνατή η εξαγωγή συμπερασμάτων ανάλυσης και συλλογής δεδομένων διαφορετικών χρονικών περιόδων. Στη φιλοσοφία και σε επιστήμες που σχετίζονται με αυτή, η ανάπτυξη μεθόδων και εργαλείων που αφορούν τη σημασιολογική επισημείωση διευκολύνουν την κατανόηση και την ερμηνεία των κειμένων. Η ανάγκη διαμόρφωσης ενός συνόλου κανόνων για τη ψηφιοποίηση των πολιτισμικών τεκμηρίων επηρεάζει σημαντικά το πεδίο της αρχειονομίας, ενώ η χρήση της ψηφιακής τεχνολογίας στο χώρο αυτό έχει δημιουργήσει νέους διαύλους επικοινωνίας. Σε τομείς όπως η μουσική, οι εικαστικές τέχνες ή η λογοτεχνία, η εφαρμογή των νέων ψηφιακών τεχνολογιών έχει συνδράμει στην συνένωση των ανθρωπιστικών επιστημόνων με τους μελετητές της θεωρίας των μέσων [31]. Ο συνδυασμός της γνώσης, των θεωριών και των μεθόδων που χρησιμοποιούνται στις ανθρωπιστικές επιστήμες με την εξέλιξη της τεχνολογίας και την αξιοποίηση των ψηφιακών υποδομών και εργαλείων έχει ως αποτέλεσμα να έχει δημιουργηθεί ο κλάδος των ψηφιακών ανθρωπιστικών επιστημών. Οι ψηφιακές ανθρωπιστικές επιστήμες λαμβάνουν ακόμη ιδιαίτερα υπόψη τη σχέση μεταξύ των απόψεων του ερευνητή, των αναφορών εντός των κειμένων και της αξιοποίησης των «πρωτογενών» δεδομένων της έρευνας. Όπως έχει προκύψει από μελέτες (π.χ., στο πλαίσιο του έργου DARIAH [10] ), η πληροφοριακή συμπεριφορά και οι απαιτήσεις στις ανθρωπιστικές επιστήμες εστιάζονται σε πέντε βασικούς άξονες: στο πεδίο εφαρμογής των πληροφοριακών αντικειμένων. Λόγω της διαφορετικότητας των ειδών των πληροφοριακών αντικειμένων (πρωτογενή δεδομένα, επιστημονικά αντικείμενα, αντικείμενα ερευνητικών αποτελεσμάτων), κρίνεται αναγκαία η παροχή αποτελεσματικών μέσων για τον εντοπισμό, την αναφορά, την πρόσβαση, την παράσταση και τη διαχείριση των αντικειμένων αυτών. στους όρους πρόσβασης. Τα διαφορετικά καθεστώτα πρόσβασης (δικαιώματα πνευματικής ιδιοκτησίας, νομοθεσία προστασίας πολιτιστικής κληρονομιάς) καθιστούν απαραίτητη την ύπαρξη ενός αξιόπιστου συστήματος για την ανταλλαγή, κατανομή και αναχρησιμοποίηση των πληροφοριακών αντικειμένων.

στη διαλειτουργικότητα. Συγκεκριμένα, η σημασιολογική διαλειτουργικότητα κρίνεται αναγκαία για την επιστημονική έρευνα κυρίως όταν πρόκειται για διεπιστημονική, πολυγλωσσική ή βασίζεται σε κατανεμημένους πόρους. στη συλλογική εργασία. Κάθε πληροφοριακό αντικείμενο προκύπτει από την αλληλεπίδραση και επικοινωνία μεταξύ των μελετητών καθώς επίσης και από την συμμετοχή των ερευνητών σε δομημένες και ενεργές κοινότητες πρακτικής. στη χρήση της πληροφορίας με τη βοήθεια των εργαλείων ανάκτησης. Η κατανόηση των πληροφοριακών αντικειμένων επηρεάζεται άμεσα από τον καθορισμό των υποδομών, των υπηρεσιών και των εργαλείων που θα χρησιμοποιηθούν στην ερευνητική κοινότητα. Στο πλαίσιο της παρούσας διπλωματικής εργασίας και στην προσπάθεια προσέγγισης του κλάδου των ψηφιακών ανθρωπιστικών επιστημών έγινε μία εκτενής βιβλιογραφική ανασκόπηση στον ευρύτερο χώρο της ψηφιακής διατήρησης εστιάζοντας στις ενέργειες που έχουν γίνει όσον αφορά τις ανθρωπιστικές επιστήμες. Η εργασία αναπτύσσεται σε δύο βασικούς άξονες: 1. Βιβλιογραφική ανασκόπηση ως προς: τα μητρώα δεδομένων, πως χρησιμοποιούνται και σε ποιους τομείς, τη δομή των πληροφοριών και των υπηρεσιών μητρώων, τα υπάρχοντα περιβάλλοντα ανάπτυξης μητρών δεδομένων. 2. Ανάπτυξη ενός μητρώου δεδομένων που μπορεί να βρει απήχηση στο χώρο των ανθρωπιστικών επιστημών.

2. ΜΗΤΡΩΑ ΔΕΔΟΜΕΝΩΝ Τα μητρώα δεδομένων συναντώνται σήμερα σε ένα ευρύ περιβάλλον, όπως για παράδειγμα στον κλάδο της πληροφορικής (μητρώο των Windows, μητρώα ονομάτων χώρου (domain), μητρώα μεταδεδομένων), στον κλάδο της ιατρικής (μητρώα καρκίνου, μητρώα νοσηλευτών) και στον κλάδο της πολιτικής, εστιάζοντας στους νόμους και στη διακυβέρνηση του κράτους (μητρώα πολιτών, μητρώα παραβατών, μητρώα οχημάτων) [54]. Λέγοντας μητρώο εννοούμε έναν χώρο αποθήκευσης και διαχείρισης των δεδομένων, δεδομένα που είναι ανιχνεύσιμα και προσβάσιμα στον χρήστη που χρησιμοποιεί το μητρώο. Στην παρούσα διπλωματική εργασία εστιάζουμε στα μητρώα δεδομένων που σχετίζονται με την ψηφιακή διατήρηση στο χώρο των ανθρωπιστικών επιστημών. 2.1 Χρησιμότητα και απαιτήσεις μητρώων δεδομένων Τα μητρώα δεδομένων αναπτύχθηκαν έχοντας ως βασικό σκοπό την διαχείριση και οργάνωση των δεδομένων διευκολύνοντας οποιονδήποτε επιθυμεί να τα χρησιμοποιήσει. Τα μητρώα αποθηκεύουν και καθιστούν ικανή την αναζήτηση και ανάκτηση των μεταδεδομένων τα οποία περιγράφουν δεδομένα ως προς τη θέση που αποθηκεύονται, την δυνατότητα πρόσβασης και τις ενέργειες που μπορούν να υποστούν. Ένα πολύ σημαντικό στοιχείο των μητρώων είναι ότι αποτελούν έναν εύκολο τρόπο εύρεσης δεδομένων από την πλευρά του χρήστη ενώ από την πλευρά του εκδότη διευκολύνουν τη διαχείριση και δημοσίευση των δεδομένων. Εκτός από την παροχή πληροφοριών, τα μητρώα προωθούν την επαναχρησιμοποίηση των δεδομένων και την διαλειτουργικότητα μεταξύ διαφορετικών κοινοτήτων, αξιοποιώντας τα μεταδεδομένα τους. Ορίζοντας την διαλειτουργικότητα, θα λέγαμε ότι είναι η ικανότητα πολλαπλών συστημάτων με διαφορετικές λειτουργικές και τεχνικές πλατφόρμες, δομές δεδομένων και διεπαφές να ανταλλάσσουν δεδομένα με ελάχιστη απώλεια του περιεχομένου και της λειτουργικότητάς τους [9]. Τα στοιχεία της επαναχρησιμοποίησης και διαλειτουργικότητας μεταδεδομένων είναι πολύ σημαντικά καθώς με τον τρόπο αυτό οι πληροφορίες γίνονται ανιχνεύσιμες και κοινόχρηστες. Για να επιτευχθεί όμως η διαλειτουργικότητα των μεταδεδομένων, είναι απαραίτητο να ικανοποιούνται οι παρακάτω προϋποθέσεις[43] :

η διαλειτουργικότητα να υφίσταται ανάμεσα σε διαφορετικά πρότυπα μεταδεδομένων. Κάθε κοινότητα αναπτύσσει και εφαρμόζει το δικό της σχήμα μεταδεδομένων, αναλόγως των αναγκών της. Συνεπώς πολλά σχήματα και πρότυπα δημιουργούνται με αποτέλεσμα να μην είναι δυνατή η χρήση ενός βασικού προτύπου. Για το λόγο αυτό, κρίνεται απαραίτητο να αναπτυχθούν σημεία που να διασταυρώνουν τις σχέσεις μεταξύ των όρων που συναντώνται σε διαφορετικά σχήματα, επιτρέποντας έτσι τη διαλειτουργικότητα. να γίνεται τήρηση ιστορικού εκδόσεων. Το ιστορικό των σχημάτων μεταδεδομένων είναι σημαντικό για την ενίσχυση της μακροζωίας των μεταδεδομένων και τη διαχείριση ιδιοτήτων που έχουν υποστεί κάποια αλλαγή, διατηρώντας τόσο ολόκληρα σχήματα όσο και μεμονωμένους όρους μεταδεδομένων. να υπάρχει υποστήριξη πολλαπλών γλωσσών. Η περιγραφή των σχημάτων μεταδεδομένων σε πολλαπλές γλώσσες ενισχύει την χρήση μεταδεδομένων και την επικοινωνία μεταξύ διαφορετικών κοινοτήτων κάνοντας έτσι την πληροφορία κατανοητή, ανιχνεύσιμη και κοινόχρηστη από πολλούς. Η διαλειτουργικότητα στα μεταδεδομένα μπορεί να επιτευχθεί, αναλόγως των αναγκών, είτε σε επίπεδο σχήματος (schema level) είτε σε επίπεδο εγγραφών (record level) είτε σε επίπεδο αποθετηρίου (repository level) [9]. Σε επίπεδο σχήματος, η διαλειτουργικότητα επιδιώκεται στα στοιχεία του σχήματος και τα αποτελέσματα που προκύπτουν εμφανίζονται ως σύνολα στοιχείων (νέα ή ενημερωμένα), κωδικοποιημένα σχήματα, διασταυρώσεις όρων, εφαρμογές και μητρώα στοιχείων. Σε επίπεδο εγγραφών, η διαλειτουργικότητα επιχειρείται στην ενοποίηση των εγγραφών μεταδεδομένων μέσω της αντιστοίχισης της εννοιολογικής σημασίας των στοιχείων. Τα αποτελέσματα της διαλειτουργικότητας εμφανίζονται ως επικαιροποιημένες και νέες εγγραφές που προκύπτουν από το συνδυασμό των τιμών των υπαρχουσών εγγραφών. Τέλος, σε επίπεδο αποθετηρίου, η διαλειτουργικότητα εστιάζεται στην αντιστοίχιση τιμών των εγγραφών που σχετίζονται με συγκεκριμένα στοιχεία και τα αποτελέσματά της εμφανίζονται σαν διασταυρώσεις όρων που επιτρέπουν την αναζήτηση συλλογών. 2.2 Τύποι και πρότυπα μητρώων Ένας βασικός τύπος μητρώων αποτελεί το μητρώο μορφότυπου (format registries). Στην ουσία τα μητρώα αυτά περιλαμβάνουν όλους εκείνους τους

μορφότυπους που γίνονται αποδεκτοί στα αποθετήρια. Ο μορφότυπος του ψηφιακού αρχείου μπορεί να επηρεάσει τόσο την διατήρηση του όσο επίσης και την διανομή του στο πέρασμα του χρόνου. Για το λόγο αυτό, τα μητρώα μορφοτύπων προβάλλονται σαν μία κεντρικοποιημένη υπηρεσία που παρέχει πληροφορίες για μία ποικιλία μορφότυπων αρχείων διευκολύνοντας έτσι τη διαχείριση των διαφορετικών τύπων δεδομένων από την πλευρά των υπευθύνων του εκάστοτε αποθετηρίου [44]. Συνοπτικά οι λειτουργίες των μητρώων μορφοτύπων [32] είναι οι εξής: αναγνωρίζουν το μορφότυπο του ψηφιακού αντικειμένου, πιστοποιούν ότι ο μορφότυπος ενός αντικειμένου είναι πραγματικός και σύμφωνος με τις προδιαγραφές, προτείνουν τρόπους για τον μετασχηματισμό του ψηφιακού αντικειμένου σε αποδεκτό μορφότυπο, αναγνωρίζουν σημαντικές ιδιότητες του ψηφιακού αντικειμένου δημιουργώντας την πληροφορία αναπαράστασης, η οποία χρησιμοποιείται μεταγενέστερα για την αναγνώριση του εντός του αποθετηρίου ή μεταξύ άλλων αποθετηρίων, αξιολογούν τον κίνδυνο απαρχαίωσης του ψηφιακού αντικειμένου, προσδιορίζουν τη μέθοδο αντικατάστασης του αντικειμένου. Εκτός από τα μητρώα μορφοτύπων, εξίσου σημαντικά είναι τα μητρώα μεταδεδομένων (metadata registries). Πρόκειται για καταλόγους που εμπεριέχουν πληροφορίες για τη δομή και τη σημασιολογία των δεδομένων ενός σχήματος μεταδεδομένων[11]. Τα μητρώα μεταδεδομένων παρέχουν πληροφορίες για τον ορισμό, την προέλευση, την πηγή και τη θέση των δεδομένων ενώ χρησιμοποιούνται από διάφορους οργανισμούς για να διασφαλίσουν τη διαλειτουργικότητα, τη διανομή και την επαναχρησιμοποίηση των δεδομένων. Βασικές λειτουργίες των μητρώων αυτών αποτελούν τα ακόλουθα [11, 43]: παρέχουν ένα ενοποιημένο πόρο πληροφόρησης για τα δεδομένα, ως προς τους όρους μεταδεδομένων και το λεξιλόγιο που χρησιμοποιείται μέσα στο αποθετήριο, χρησιμοποιούνται για να υποστηρίζουν τόσο την διαδικασία εισαγωγής όσο και εξαγωγής δεδομένων, αντιστοιχίζοντας τα με τα ήδη υπάρχοντα μεταδεδομένα του αποθετηρίου, λειτουργούν σαν εργαλείο αναζήτησης για το σχεδιασμό βάσεων δεδομένων τεκμηριώνουν κάθε στοιχείο των δεδομένων

Για την καλύτερη διαχείριση, καταλογογράφηση και οργάνωση των μητρώων μεταδεδομένων έχουν αναπτυχθεί δύο πρότυπα ISO (International Organization for Standardization), το ISO/IEC 11179 Metadata registries (MDR) και το ISO 15000-3. Το πρότυπο ISO/IEC 11179 ασχολείται με τη σημασιολογία των δεδομένων (τόσο εννοιολογικά όσο και υπολογιστικά), την αναπαράσταση τους καθώς επίσης και την καταγραφή των περιγραφών των εν λόγω δεδομένων. Το πρότυπο αυτό συμβάλλει στην προώθηση της προκαθορισμένης περιγραφής των δεδομένων, την επαναχρησιμοποίηση και προτυποποίηση τους με το πέρασμα του χρόνου και τη καλύτερη διαχείριση των στοιχείων δεδομένων. Όλα αυτά έχουν ως αποτέλεσμα την εναρμόνιση και πλήρης κατανόηση των δεδομένων τόσο εντός ενός οργανισμού όσο και μεταξύ διαφόρων οργανισμών [24]. Το πρότυπο αυτό αποτελείται από 6 επιμέρους τμήματα, τα οποία στο σύνολό τους περιγράφουν τα μεταδεδομένα και τις δραστηριότητες που χρειάζονται για τη διαχείριση των στοιχείων στο μητρώο. Τα τμήματα του προτύπου αυτού περιγράφονται ως εξής: 1. Τμήμα 1: Πλαίσιο (Framework). Το τμήμα αυτό περιγράφει συνοπτικά το πρότυπο καθώς επίσης και τις βασικές έννοιες του. Διατυπώνονται οι αναπαραστάσεις και έννοιες των στοιχείων δεδομένων έτσι ώστε να γίνονται αντιληπτές τόσο από τους ανθρώπους όσο και από τις μηχανές [24]. 2. Τμήμα 2: Κατηγοριοποίηση (Classification). Το τμήμα αυτό καταγράφει διάφορους τύπους κατάταξης των δεδομένων, μέσω ενός συνόλου γνωρισμάτων. Τα σχήματα κατάταξης που συναντώνται και χρησιμοποιούνται είναι λέξεις κλειδιά, θησαυροί, ταξονομίες και οντολογίες. Η κατάταξη των στοιχείων διευκολύνει την αναζήτηση, τη διαχείριση και την ανάλυση τους καθώς επίσης βοηθάει στον εντοπισμό οποιαδήποτε εξάρτησης μεταξύ των εννοιών [25]. 3. Τμήμα 3: Βασικά χαρακτηριστικά και μεταμοντέλο μητρώου (Registry metamodel and basic attributes). Το τμήμα αυτό θέτει το βασικό εννοιολογικό μοντέλο των στοιχείων. Αυτό σημαίνει ότι συμπεριλαμβάνεται ο ορισμός, οι προδιαγραφές και το περιεχόμενο των στοιχείων, το σχέδιο και οι προδιαγραφές των μοντέλων δεδομένων, των βάσεων δεδομένων και των τύπων μηνυμάτων για την ανταλλαγή δεδομένων καθώς επίσης και η πραγματική χρήση των δεδομένων εντός των πληροφοριακών συστημάτων [26].

4. Τμήμα 4: Διατύπωση των ορισμών δεδομένων (Formulation of data definitions). Το τμήμα αυτό ορίζει κανόνες και οδηγίες για την διατύπωση ορισμών όσον αφορά τα δεδομένα και τα συστατικά τους μέρη. Συμπεριλαμβάνονται μόνο σημασιολογικά οι ορισμοί δεδομένων και όχι οι προδιαγραφές για το σχηματισμό των ορισμών [27]. 5. Τμήμα 5: Αρχές ονοματοδοσίας και αναγνώρισης (Naming and identification principles). Το τμήμα αυτό περιγράφει με ποιο τρόπο θα γίνει η ονομασία και η αναγνώριση των στοιχείων δεδομένων. Επιπλέον ορίζει τα γνωρίσματα ταυτοποίησης, περιλαμβάνει αρχές μέσω των οποίων δημιουργούνται συμβάσεις ονοματοδοσίας, περιγράφει τη σχέση μεταξύ των γνωρισμάτων καθώς επίσης παραθέτει ένα παράδειγμα σύμβασης ονοματοδοσίας [28]. 6. Τμήμα 6: Καταγραφή (Registration). Το τμήμα αυτό καθορίζει τους ρόλους και τις απαιτήσεις για τη διαδικασία καταγραφής των δεδομένων σε ένα μητρώο μεταδεδομένων. Συνεπώς, ορίζεται ο τύπος της πληροφορίας που πρέπει να καθοριστεί, οι συνθήκες που πρέπει να πληρούνται καθώς επίσης και οι διαδικασίες που πρέπει να ακολουθηθούν [29]. Το δεύτερο πρότυπο που χρησιμοποιείται για τα μητρώα μεταδεδομένων είναι το ISO 15000-3, το οποίο στην πραγματικότητα αποτελεί το πρότυπο ebxml (electronic business using extensible Markup Language) Registry Information Model. Ουσιαστικά αποτελεί ένα τμήμα του προτύπου ISO 15000 (συγκεκριμένα το τρίτο τμήμα), το οποίο στο σύνολό του αποτελείται από 5 τμήματα. Συνοπτικά το πρότυπο ebxml χρησιμοποιείται για τη χρήση και ανταλλαγή ηλεκτρονικών επιχειρηματικών πληροφοριών με ένα ασφαλή και συνεπή τρόπο εξασφαλίζοντας τη διαλειτουργικότητα μεταξύ των συμβαλλομένων. Εστιάζουμε στο συγκεκριμένο τμήμα του προτύπου (ISO 15000-3), καθώς είναι το μόνο που ασχολείται με την έννοια των πληροφοριών σε ένα μητρώο μεταδεδομένων. Το πρότυπο αυτό ασχολείται με ζητήματα που αφορούν τον ορισμό των τύπων μεταδεδομένων και των εννοιών που μπορούν να αποθηκευτούν σε ένα μητρώο ebxml, δηλαδή ένα πληροφοριακό σύστημα που διαχειρίζεται κάθε τύπο περιεχομένου και τα προτυποποιημένα μεταδεδομένα που αυτό περιγράφει. Η απήχηση του προτύπου ISO 15000-3 δεν ήταν τόσο μεγάλη όπως του ISO/IEC 11179 καθώς η γενική αρχιτεκτονική του ebxml εστιάζει σε έννοιες και μεθοδολογίες που μπορούν να εφαρμοστούν για την εφαρμογή ηλεκτρονικών επιχειρηματικών λύσεων [17].

2.3 Ευρέως διαδεδομένα μητρώα Η ανάπτυξη των μητρώων δεδομένων συνεχώς αυξάνεται και αυτό οφείλεται στην ανάγκη για καλύτερη οργάνωση και διαχείριση καλά δομημένων πληροφοριών. Τα μητρώα δεδομένων διαφέρουν ανάλογα με το σκοπό που εξυπηρετούν, το πεδίο εφαρμογής τους, τις υποδομές τεχνολογίας και την προσβασιμότητα τους. Αυτή η ποικιλία και διαφοροποίηση των μητρώων είναι ουσιώδης καθώς αντανακλά τα ερευνητικά ενδιαφέροντα και τις λειτουργικές ανάγκες κάθε τομέα. Ένα από τα μητρώα που μπορεί να το χρησιμοποιήσει οποιοσδήποτε, χωρίς να εξειδικεύεται σε κάποιο τομέα, είναι το μητρώο Open Metadata Registry [47]. Το μητρώο αυτό αποτελεί ένα βασικό κομμάτι της τεχνικής υποδομής του Σημασιολογικού Ιστού καθώς εφαρμόζει κάποιες από τις βασικές τεχνολογίες του ιστού όπως RDF (Resource Description Framework), SKOS (Simple Knowledge Organization System), OWL (Web Ontology Language). Το RDF είναι ένα πρότυπο μοντέλο για την ανταλλαγή δεδομένων στον Ιστό το οποίο χρησιμοποιείται για τον τρόπο δόμησης της πληροφορίας με ένα προκαθορισμένο τρόπο[53], η OWL πρόκειται για μία γλώσσα αναπαράστασης γνώσης για τον Σημασιολογικό Ιστό, γνώση που αφορά αντικείμενα, ομάδες αντικειμένων και σχέσεις μεταξύ αυτών [49] ενώ τέλος το SKOS πρόκειται για ένα σύστημα προδιαγραφών και προτύπων που υποστηρίζει τη χρήση συστημάτων οργάνωσης γνώσης, όπως θησαυροί, σχήματα ταξινόμησης και ταξινομίες που ορίζονται εντός του Σημασιολογικού Ιστού [56]. Το μητρώο Open Metadata Registry παρέχει σε οποιονδήποτε χρήστη τη δυνατότητα να εντοπίσει, να δηλώσει και να δημοσιεύσει (αφού πρώτα κάνει εγγραφή στο μητρώο) τα δικά του σχήματα μεταδεδομένων (στοιχεία, ιδιότητες), εφαρμογές (application profiles) (σχήματα δεδομένων στοιχείων συνδυασμένα με κανόνες εφαρμογής) και άλλο υλικό (λεξιλόγια). Επιπλέον, το μητρώο υποστηρίζει την αντιστοίχιση σχέσεων μεταξύ όρων και εννοιών στα διάφορα σχήματα χρησιμοποιώντας τεχνικές μηχανικής μάθησης. Από όλα τα παραπάνω, γίνεται αντιληπτό ότι το μητρώο Open Metadata Registry υποστηρίζει την διερεύνηση, επαναχρησιμοποίηση και διαλειτουργικότητα των μεταδεδομένων ακολουθώντας κάποια πρότυπα τόσο τοπικά όσο και συνολικά, στοιχεία που αποτελούν τους βασικούς στόχους των μεταδεδομένων [47]. Το μητρώο Open Metadata Registry στην πραγματικότητα είναι το μητρώο NSDL Metadata Registry. Το παραδοσιακό NSDL Registry σχεδιάστηκε για να διευκολύνει ανθρώπους και μηχανές στην αναζήτηση, δημιουργία, πρόσβαση και διαχείριση των σχημάτων μεταδεδομένων, των εφαρμογών και των αντιστοιχίσεων

εννοιών. Στόχοι του μητρώου είναι η σαφής αναγνώριση, κωδικοποίηση και δικτυακή μεταφορά των σχημάτων μεταδεδομένων καθώς επίσης και η δημοσίευση των εν λόγω σχημάτων μεταδεδομένων στις ανάλογες κοινότητες και εφαρμογές. Το μητρώο παρέχει αυτοματοποιημένες διασταυρώσεις και αντιστοιχίες στους όρους μεταξύ σχημάτων και συστημάτων μεταδεδομένων. Εφόσον στην πραγματικότητα το μητρώο αυτό είναι ο προκάτοχος του Open Metadata Registry, όλοι οι βασικοί στόχοι των μεταδεδομένων (αναζήτηση, επαναχρησιμοποίηση, διαλειτουργικότητα) επιτυγχάνονται [46]. Μέσω της κοινότητας του DCMI (Dublin Core Metadata Initiative) και του προτύπου Dublin Core (DC) σχεδιάστηκε το μητρώο μεταδεδομένων Dublin Core (Dublin Core Metadata Registry). Πρόκειται για ένα πολυγλωσσικό μητρώο όρων μεταδεδομένων που έχει ως στόχο την προώθηση επαναχρησιμοποίησης ιδιοτήτων και κλάσεων των μεταδεδομένων, έχοντας ως περιορισμό ότι τα μεταδεδομένα που εισάγονται σε αυτό πρέπει να αναπαριστώνται σε RDF. Το DCMI Registry βοηθά στην αναζήτηση όρων και ορισμών, δείχνει τις σχέσεις μεταξύ των όρων και μεταφράζει ορισμούς και σχόλια σε άλλες γλώσσες. Αν και η εφαρμογή του μητρώου μπορεί να διαφέρει ανάλογα με την κοινότητα που το χρησιμοποιεί ή τη γλώσσα που το υποστηρίζει, έχει δομηθεί μία κοινή αρχιτεκτονική [60]. Έτσι, κάθε μητρώο DCMI χαρακτηρίζεται από τα ακόλουθα: κοινό λογισμικό βάσης και κοινές διασυνδέσεις με το περιεχόμενο του, προσβασιμότητα από τους χρήστες (άνθρωποι και μηχανές) μόνο για ανάγνωση του περιεχομένου, ύπαρξη ενός υπευθύνου ελέγχου και καταχώρησης του περιεχομένου των μεταδεδομένων, ύπαρξη ενός υπεύθυνου για την υποστήριξη και συντήρηση της εφαρμογής. Έχοντας ως βάση το πρότυπο ISO/IEC 11179, που αναφέρθηκε προηγουμένως, δημιουργήθηκε το μητρώο METeOR (METadata Online Registry). Πρόκειται για ένα αποθετήριο, που εντοπίζεται στην Αυστραλία και αφορά εθνικά πρότυπα μεταδεδομένων σχετικά με την υγεία, κοινοτικές υπηρεσίες και τομείς στεγαστικής βοήθειας. Το μητρώο αυτό παρέχει διαδικτυακή πρόσβαση σε μία ποικιλία από ορισμούς δεδομένων καθώς επίσης και εργαλεία για τη δημιουργία νέων ορισμών ήδη υπαρχόντων στοιχείων. Ουσιαστικά το μητρώο αυτό αποθηκεύει,

διαχειρίζεται και μοιράζεται μεταδεδομένα τα οποία μπορούν να χρησιμοποιηθούν για να διευκολύνουν οποιονδήποτε Αυστραλό [41]. Το ROADS Metadata Registry είναι ένα μητρώο μεταδεδομένων που έχει προκύψει από το έργο ROADS(Resource Organization and Discovery in Subjectbased services). Το έργο στο σύνολο του έχει ως στόχο την παραγωγή ενός πακέτου λογισμικού για τη δημιουργία συγκεκριμένων θεματικών περιοχών, την διερεύνηση μεθόδων για αναζήτηση και διαλειτουργικότητα μεταξύ τους και τη συμμετοχή στην ανάπτυξη προτύπων για ευρετηρίαση, καταλογογράφηση και αναζήτηση συγκεκριμένων πόρων. Συγκεκριμένα το μητρώο ROADS χρησιμοποιείται για την παραγωγή υπηρεσιών που αναγνωρίζουν, αξιολογούν, περιγράφουν και επιτρέπουν την πρόσβαση σε πόρους συγκεκριμένων πεδίων ή γεωγραφικών περιοχών. Το μητρώο χρησιμοποιεί κάποια πρότυπα (ROADS Templates) τα οποία αναπαριστούν τα γνωρίσματα που χρησιμοποιούνται στις υπηρεσίες του ROADS. Τα πρότυπα αυτά είναι ένας μορφότυπος μεταδεδομένων και ορίζονται για διάφορους τύπους πόρων (π.χ. COLLECTION, DOCUMENT, IMAGE, SOUND, κ.ά.). Συνεπώς, σύμφωνα με τα πρότυπα και τους κανόνες καταλογογράφησης, ορίζονται τα μεταδεδομένα ανά πεδίο εφαρμογής. Βασικός στόχος του μητρώου ROADS είναι να κάνει πιο άμεση, εύκολη και πλήρως στοχευόμενη την αναζήτηση πόρων (μεταδεδομένων) ανάλογα με τις επιθυμίες του χρήστη [52]. Όπως αναφέρθηκε και στην προηγούμενη ενότητα, βασικό στόχο των μητρώων αποτελεί η διαλειτουργικότητα. Με γνώμονα το στοιχείο αυτό δημιουργήθηκε το μητρώο μεταδεδομένων Scientific Database Metadata Registry (SDBMR). Βασικές λειτουργίες του μητρώου αποτελούν η καταχώρηση, δημοσίευση και διαχείριση σχημάτων μεταδεδομένων, εφαρμογών και χρήσεων στοιχείων δεδομένων. Με βάση αυτές τι λειτουργίες, κάποιος μπορεί να αναζητήσει κάποιο πόρο καθώς επίσης και να διασταυρώσει έννοιες μεταξύ σχημάτων και εφαρμογών. Το μητρώο SDBMR εστιάζει στα στοιχεία των σχημάτων για να επιτευχθεί η διαλειτουργικότητα ενώ η διασταύρωση των εννοιών γίνεται μέσω μίας βάσης δεδομένων που υποστηρίζεται από το σύστημα [37]. 2.4 Μητρώα δεδομένων στις ανθρωπιστικές επιστήμες Με το πέρασμα του χρόνου όλο και περισσότερα μητρώα δεδομένων αναπτύσσονται σε διάφορους τομείς. Στην παρούσα εργασία θα επικεντρώσουμε το

ενδιαφέρον μας στον κλάδο των ανθρωπιστικών επιστημών, δηλαδή γλωσσολογία, φιλολογία, ιστορία, αρχαιολογία, φιλοσοφία, μουσικολογία, θεατρολογία κ.ά. Η χρήση των νέων τεχνολογιών και των ψηφιακών εργαλείων έχουν συνδράμει στην εξέλιξη και στην επέκταση των μεθόδων και πρακτικών στο χώρο των ανθρωπιστικών επιστημών. Οι ψηφιακές ανθρωπιστικές επιστήμες αξιοποιούν τις τεχνολογικές υποδομές, επικεντρώνοντας σε ζητήματα που αφορούν ευρετηρίαση, ψηφιοποίηση, οργάνωση και διάθεση ψηφιακών δεδομένων, πηγών και τεκμηρίων, ενώ στοχεύουν στην ενίσχυση νέων πρακτικών επιστημονικής δημοσίευσης που αξιοποιούν τα ψηφιακά μέσα. Στην πραγματικότητα, αυτό που συμβαίνει είναι ότι εφαρμόζονται όλες οι πρακτικές και μέθοδοι των ανθρωπιστικών επιστημών με τις τεχνολογικές υποδομές και τα ψηφιακά εργαλεία[7]. Επιπλέον, οι ψηφιακές ανθρωπιστικές επιστήμες επιδιώκουν την ανάπτυξη μεθόδων και πρακτικών με σκοπό την διερεύνηση του ρόλου των ανθρωπιστικών επιστημών, τη βελτίωση της ποιότητας καθώς επίσης και της ενίσχυσης της προβολής έρευνας στο ερευνητικό χώρο των ανθρωπιστικών επιστημών. Στη συνέχεια παρουσιάζονται κάποια από τα υπάρχοντα μητρώα δεδομένων. Αξίζει να σημειωθεί ότι η επιλογή αυτή έγινε βάσει των τεχνικών γνωρισμάτων κάθε μητρώου, στοιχείο προς διερεύνηση στην παρούσα εργασία. Λέγοντας τεχνικά γνωρίσματα, αναφέρονται όλες εκείνες οι τεχνολογίες που χρησιμοποιούνται για την ανάπτυξη ενός μητρώου, την διαχείρισή του και οποιαδήποτε άλλη ενέργεια γίνεται σε αυτό. Σε επόμενο κεφάλαιο γίνεται εκτενής ανάλυση των τεχνολογιών, λαμβάνοντας ως βασικό γνώμονα τη ροή εργασίας εντός ενός μητρώου δεδομέωνων. Στο σημείο αυτό αναφέρονται ενδεικτικά κάποιες από τις τεχνολογίες που χρησιμοποιούνται όπως είναι NoteTab Pro, Oxygen XML Editor, XML Spy,, MARCXML Toolkit, MARC4J, FEDORA Commons, Apache Lucene, Apache Jena, Apache Cocoon, MODS Editor, Apache Tomcat. Κάποια από τα μητρώα είναι: Language Description Heritage (LDH) Open Access Digital Library. Πρόκειται για ένα ψηφιακό αποθετήριο που παρέχει πρόσβαση σε περιγραφές σχετικά με τις γλώσσες του κόσμου. Υπεύθυνος φορέας για την ανάπτυξη του αποθετηρίου είναι ο οργανισμός Max Planck Society, που εδρεύει στη Γερμανία. Σκοπός του μητρώου είναι να κάνει διαθέσιμο προς την επιστημονική κοινότητα όλο εκείνο το υλικό που αφορά υπάρχουσα περιγραφική και αναλυτική πληροφορία σχετικά με τις διάφορες γλώσσες που συναντώνται ανά τον κόσμο [34].

DLF(Digital Library Federation) Digital Collections Registry Πρόκειται για ένα μητρώο που αφορά ψηφιακές συλλογές, προσβάσιμες από τα μέλη της κοινότητας ψηφιακών βιβλιοθηκών (DLF). Η ανάπτυξη του στηρίχτηκε στο μητρώο IMLS Digital Collections Registry, το οποίο αναπτύχθηκε για τις υπηρεσίες του Ινστιτούτου Μουσείων και Βιβλιοθηκών (Institute of Museum and Library Services). Το μητρώο περιλαμβάνει ψηφιακές συλλογές που δημιουργήθηκαν ή αναπτύχθηκαν από τα μέλη της κοινότητας, καθώς επίσης και νέες συλλογές που προστίθενται με το πέρασμα του χρόνου. Κάθε συλλογή μπορεί να περιέχει υποσυλλογές, κάθε μία από τις οποίες περιλαμβάνουν μία πλήρη περιγραφή τους. Σκοπός του μητρώου είναι να διευκολύνει την αναζήτηση και πρόσβαση σε ενδιαφέρουσες και καινοτόμες ψηφιακές συλλογές καθώς επίσης και η δημιουργία διαύλων επικοινωνίας μεταξύ των ερευνητών που ασχολούνται με ζητήματα που εμπεριέχονται στις συλλογές [15]. Archeology Data Service (ADS) Πρόκειται για ένα αποθετήριο που διατηρεί ψηφιακά δεδομένα μακροπρόθεσμα και προωθεί τη διανομή δεδομένων σχετικών με την αρχαιολογία. Βασικός στόχος της υπηρεσίας είναι η υποστήριξη στην έρευνα και στη μάθηση μέσω υψηλών ποιότητας και αξιόπιστων ψηφιακών πόρων. Το μητρώο της υπηρεσίες περιλαμβάνει μία μεγάλη συλλογή που σχετίζεται με την αρχαιολογία ενώ είναι προσβάσιμο από όλους [6]. The Digital Archaeological Record (tdar) Πρόκειται για ένα ψηφιακό αποθετήριο που περιλαμβάνει ψηφιακές εγγραφές αρχαιολογικών ερευνών. Η ανάπτυξη, χρήση και διατήρηση του μητρώου γίνεται από τον οργανισμό Digital Antiquity, ο οποίος ασχολείται με την μακροπρόθεσμη διατήρηση ψηφιακών δεδομένων. Το μητρώο αναπτύχθηκε έχοντας ως γνώμονα την εύρεση ενός τρόπου για τη σύνθεση δεδομένων, τα οποία έχουν συλλεχθεί με συστηματικό τόπο, χρησιμοποιώντας διαφορετικές κωδικοποιήσεις πάνω σε πολλαπλά σύνολα δεδομένων [58].

3. ΔΟΜΗ ΠΛΗΡΟΦΟΡΙΩΝ ΚΑΙ ΥΠΗΡΕΣΙΕΣ ΜΗΤΡΩΩΝ Η δομή των πληροφοριών σε ένα μητρώο δεδομένων αποτελεί βασικό παράγοντα για τη ψηφιακή διατήρηση τους. Όπως αναφέρθηκε και στο προηγούμενο κεφάλαιο, υπάρχουν εξειδικευμένα μητρώα μορφοτύπων τα οποία έχουν ως στόχο να προκαθορίζουν όλους τους αποδεκτούς τύπους για ένα αρχείο ανάλογα με τις προδιαγραφές του μητρώου δεδομένων. Τα μητρώα δεδομένων μεταχειρίζονται μεταδεδομένα, δηλαδή δεδομένα για τα δεδομένα ή πληροφορία για την πληροφορία. Πρόκειται δηλαδή για δομημένη πληροφορία που περιγράφει, εξηγεί, εντοπίζει και διευκολύνει την ανάκτηση, τη χρήση και τη διαχείριση ενός πληροφοριακού πόρου [43]. Υπάρχουν τέσσερα είδη μεταδεδομένων [22]: τα περιγραφικά (descriptive), τα οποία χρησιμοποιούνται για να προσδιορίσουν και να περιγράψουν τις συλλογές και τις συσχετιζόμενες πληροφορίες (π.χ. εγγραφές καταλογογράφησης ή υπερσυνδέσεις μεταξύ πληροφοριών ή παραπομπές από τους δημιουργούς και τους χρήστες), τα δομικά (structural), τα οποία αφορούν τις φυσικές και λογικές δομικές σχέσεις μεταξύ των οντοτήτων. τα διαχειριστικά (administrative), τα οποία χρησιμοποιούνται για τη διαχείριση των συλλογών και των ψηφιακών αντικειμένων (π.χ. πληροφορίες απόκτησης συλλογής ή κριτήρια για την ψηφιοποίηση). τα τεχνικά (technical), τα οποία σχετίζονται με τον τρόπο που λειτουργεί ένα σύστημα και πως συμπεριφέρονται τα μεταδεδομένα σε αυτό (π.χ. τεχνικές πληροφορίες ψηφιοποίησης ή δεδομένα αυθεντικοποίησης και ασφάλειας). 3.1 Σχήματα μεταδεδομένων Ένα σχήμα μεταδεδομένων ορίζει ένα πλαίσιο αναπαράστασης μεταδεδομένων, περιλαμβάνοντας σημασιολογικούς ορισμούς των όρων που χρησιμοποιούνται, περιορισμούς στη δομή, ορισμούς για τα βασικά δεδομένα και συνδέσεις με την σύνταξη της φυσικής περιγραφής των δεδομένων [11]. Ένα σχήμα μεταδεδομένων αποτελείται από τα ακόλουθα στοιχεία: ένα σύνολο όρων που περιγράφουν τις ιδιότητες ενός πόρου ένα σύνολο όρων που εκφράζουν τις τιμές των ιδιοτήτων ένα σύνολο κανόνων που ορίζουν τους περιορισμούς στη δομή και τα συντακτικά χαρακτηριστικά

ένα σύνολο κανόνων διασυνδέσεων (binding) για μία συγκεκριμένη γλώσσα περιγραφής. Η γλώσσα που αποτελεί τη βάση αναπαράστασης των μεταδεδομένων είναι η XML (extensible Markup Language). Πρόκειται για μία γλώσσα σήμανσης (markup language) η οποία ορίζει κανόνες για την κωδικοποίηση εγγράφων με τρόπο που να είναι κατανοητό τόσο από τον άνθρωπο όσο και από την μηχανή. Η γλώσσα XML σχεδιάστηκε για την μεταφορά και όχι για την έκθεση δεδομένων ενώ χρησιμοποιεί ετικέτες (tags) για να εκφραστούν τα δεδομένα. Οι ετικέτες αυτές δεν είναι προκαθορισμένες αλλά κάθε φορά ο χρήστης δημιουργεί τις δικές του ετικέτες, ανάλογα με το περιεχόμενο της πληροφορίας. Η XML είναι κατάλληλη για τη δόμηση, αποθήκευση και μεταφορά της πληροφορίας [61]. Με βάση τη γλώσσα XML, δημιουργήθηκε το μοντέλο δεδομένων RDF (Resource Description Framework). Πρόκειται για ένα μοντέλο εννοιολογικής περιγραφής ή πληροφοριακών πόρων. Η βασική ιδέα είναι η δημιουργία δηλώσεων σχετικά με τους πόρους (πληροφορίες) στη μορφή εκφράσεων του τύπου υποκείμενο κατηγόρημα - αντικείμενο. Το υποκείμενο δηλώνει τον πόρο ενώ το κατηγόρημα χαρακτηρίζει τον πόρο και εκφράζει τη σχέση μεταξύ υποκειμένου και αντικειμένου. Το μοντέλο RDF ορίζει ένα σύνολο από κλάσεις και ιδιότητες, βάσει των οποίων δημιουργούνται οι δηλώσεις που προαναφέρθηκαν [53]. Ένα αρχείο XML μπορεί να μετατραπεί σε άλλο XML αρχείο ή σε κάποια άλλη μορφή (κείμενο, html σελίδα) μέσω της γλώσσας XSLT (extensible Stylesheet Language Transformation). Πρόκειται για μία γλώσσα που λαμβάνει ένα XML πόρο και μία δήλωση μορφότυπου XSL, επεξεργάζεται τους πόρους και παράγει το επιθυμητό αποτέλεσμα, σε όποια μορφή απαιτείται. Το XSLT περιλαμβάνει μία συλλογή από κανόνες και άλλες οδηγίες που κατευθύνουν τον επεξεργαστή να παράγει το επιθυμητό έγγραφό [63]. Κατά την βιβλιογραφική ανασκόπηση που έγινε στα μητρώα δεδομένων στο χώρο των ανθρωπιστικών επιστημών, τα πιο ευρέως χρησιμοποιούμενα σχήματα μεταδεδομένων είναι τα: Dublin Core (DC), Metadata Encoding and Transmission Standard (METS), Metadata Object Description Schema (MODS), Encoded Archival Description (EAD), τα οποία αναλύονται στη συνέχεια. Το σχήμα μεταδεδομένων Dublin Core (DC) δημιουργήθηκε το 1995 από τους οργανισμούς OCLC (Online Computer Library Center) και NCSA (National Center for Supercomputing Applications) ενώ στη συνέχεια αναπτύχθηκε από την Πρωτοβουλία μεταδεδομένων Dublin Core Dublin Core Metadata Initiative

(DCMI). Ο βασικός σκοπός ανάπτυξης του συγκεκριμένου σχήματος ήταν ο ορισμός ενός συνόλου στοιχείων και κάποιων απλών κανόνων που θα μπορούσαν να εφαρμοστούν στον δικτυακό πόρο για να διευκολύνουν την περιγραφή του από τους συγγραφείς του. Το σύνολο στοιχείων του Dublin Core αποτελείται από 15 στοιχεία, τα οποία είναι: Τίτλος (Title), Δημιουργός (Creator), Θέμα (Subject), Εκδότης (Publisher), Συντελεστής (Contributor), Ημερομηνία (Date), Τύπος (Type), Μορφότυπος (Format), Αναγνωριστικό (Identifier), Πηγή (Source), Γλώσσα (Language), Σχέση (Relation), Κάλυψη (Coverage) και Δικαιώματα (Rights) [44]. Όλα τα στοιχεία του Dublin Core είναι προαιρετικά και επαναλαμβανόμενα ενώ δεν ορίζεται ένας αυστηρός τρόπος σύνταξης για τα στοιχεία κάνοντας έτσι το σχήμα πολύ απλό και εύχρηστο. Το σχήμα μεταδεδομένων Metadata Encoding Transmission Standard (METS) δημιουργήθηκε το 2001 από την Ομοσπονδία Ψηφιακών Βιβλιοθηκών (Digital Library Federation DFL), υπό την υποστήριξη της Βιβλιοθήκης του Κογκρέσου. Πρόκειται για ένα σχήμα κωδικοποίησης των δεδομένων και των προδιαγραφών μετάδοσης, εκφρασμένων σε XML,προσδιορίζοντας μεταδεδομένα τα οποία είναι απαραίτητα τόσο για τη διαχείριση των ψηφιακών αντικειμένων μέσα στο αποθετήριο όσο και στην ανταλλαγή των αντικειμένων μεταξύ των αποθετηρίων [20]. Το σχήμα μεταδεδομένων METS είναι ευέλικτο, αρκετά δομημένο και ικανό για να περιγράφει και να διαχειρίζεται όλα τα είδη των ψηφιακών αντικειμένων. Ένα σχήμα METS αποτελείται από 5 βασικά τμήματα [13]: ο δομικός πίνακας (structural map). Πρόκειται για την περιγραφή της συνολικής δομής του αντικειμένου, που είναι το πιο βασικό και το μόνο υποχρεωτικό τμήμα. Αυτό το τμήμα περιγράφει τα κύρια συστατικά στοιχεία του αντικειμένου και πως αυτά σχετίζονται μεταξύ τους. οι ομάδες αρχείων (file groups). Πρόκειται για τα μεμονωμένα αρχεία που αποτελούν το ψηφιακό αντικείμενο στο σύνολό του, προσδιορίζοντας κάθε αχρείο με ένα μοναδικό αναγνωριστικό. τα περιγραφικά μεταδεδομένα (descriptive metadata). Πρόκειται για μεταδεδομένα που αφορούν το περιεχόμενο του ψηφιακού αντικειμένου ορισμένα σε τμήματα με ένα μοναδικό αναγνωριστικό. τα διαχειριστικά μεταδεδομένα (administrative metadata). Πρόκειται για μεταδεδομένα που προσδιορίζουν δικαιώματα, άδειες πρόσβασης και τεχνικές

πληροφορίες των ψηφιακών αρχείων που αποτελούν ένα αντικείμενο. Όπως και τα προηγούμενα, έτσι και τα διαχειριστικά μεταδεδομένα ορίζονται σε τμήματα κάθε ένα από τα οποία έχει ένα μοναδικό αναγνωριστικό. η συμπεριφορά (behavior). Πρόκειται για ένα τμήμα που επιτρέπει την καταγραφή της πληροφορίας ως προς τον τρόπο που τα στοιχεία του ψηφιακού αντικειμένου θα παρέχονται για τον χρήστη. Το σχήμα μεταδεδομένων Metadata Object Description Schema (MODS), δημιουργήθηκε το 2002 από τον οργανισμό συντήρησης του MARC21 στη Βιβλιοθήκη του Κογκρέσου. Πρόκειται για ένα σχήμα μεταδεδομένων που προέρχεται από το πρότυπο MARC (Machine Readable - Cataloging) και αρχικά σχεδιάστηκε για να εξυπηρετήσει την κοινότητα των βιβλιοθηκών [8]. Τα στοιχεία που αποτελούν το λεξιλόγιο του MODS είναι τα εξής: Πληροφορίες Τίτλου (titleinfo), Όνομα (name), Τύπος Πηγής (typeofresource), Είδος (genre), Πληροφορίες προελεύσεως (origininfo), Γλώσσα (language), Φυσική περιγραφή (physicaldescription), Περίληψη (abstract), Πίνακας περιεχομένων (tableofcontents), Στόχος κοινού (targetaudience), Σημείωση (note), Θέμα υποκείμενο (subject), Κατηγοριοποίηση (classification), Συσχετιζόμενο αντικειμένο (relateditem), Αναγνωριστικό (identifier), Τοποθεσία (location), Συνθήκες πρόσβασης (accesscondition), Μέρος (part), Επέκταση (extension), Πληροφορίες εγγραφής (recordinfo). Από όλα αυτά τα στοιχεία, κατά τον ορισμό μίας πληροφορίας, υποχρεωτικά είναι τα πεδία Πληροφορίες Τίτλου, Τύπος Πηγής, Είδος, Πληροφορίες προελεύσεως, Γλώσσα, Φυσική περιγραφή και Συσχετιζόμενο αντικείμενο. Επίσης, όλα τα στοιχεία είναι επαναλαμβανόμενα εκτός από τις Πληροφορίες τίτλου και τη Φυσική περιγραφή ενώ κατά τον ορισμό τους εμπεριέχουν άλλα υποστοιχεία ανά στοιχείο [39]. Το σχήμα μεταδεδομένων Encoded Archival Description (EAD) δημιουργήθηκε το 1993 από το Πανεπιστήμιο του Berkeley, στην Καλιφόρνια. Πρόκειται για ένα πρότυπο που στηρίζεται στη γλώσσα XML και στην ουσία αποτελεί ένα σύνολο από κανόνες που ορίζουν τα αρχειακά εργαλεία εφαρμογών έτσι ώστε να είναι εφικτή η αναζήτηση, ανάκτηση, εμφάνιση ή ανταλλαγή της πληροφορίας που εμπεριέχεται στο αρχείο με ένα προβλεπόμενο τρόπο. Μέσω του προτύπου EAD, αρχεία, αντικείμενα μουσείων και βιβλιοθήκες είναι δυνατό να καταγράφουν και στη συνέχεια να περιγράφουν τα αρχεία τους με τρόπο κατανοητό από μία μηχανή. Το DTD (document type definition) του EAD, δηλαδή το έγγραφο

που ορίζεται η δομή του προτύπου, καθορίζει τα στοιχεία που χρησιμοποιούνται για να περιγράψουν μία συλλογή καθώς επίσης και την διάταξη αυτών των στοιχείων. Στη βασική τους μορφή, τα κωδικοποιημένα αρχειακά εργαλεία αναζήτησης αποτελούνται από δύο τμήματα: 1) εκείνο που παρέχει πληροφορία για το εργαλείο (π.χ. όνομα, ημερομηνία σύνταξης κ.ά.) και 2) εκείνο που παρέχει πληροφορία για το κύριο μέρος των αρχειακών υλικών (μία συλλογή, μία ομάδα εγγραφών ή μία σειρά). Στο EAD DTD ορίζονται αρχικά δύο βασικά στοιχεία, το <eadheader> και το <frontmatter>, τα οποία αντιστοιχούν στην πληροφορία για το εργαλείο ενώ στη συνέχεια ορίζεται το <archdesc>, το οποίο αντιστοιχεί στην πληροφορία για το αρχειακό υλικό. Και τα τρία αυτά στοιχεία, εμπεριέχονται στο θεμελιώδες στοιχείο <ead> [16].Έτσι η δομή ενός EAD DTD στη βασική του μορφή, μοιάζει ως εξής: <ead> <eadheader> <frontmatter> <archdesc>. Αξίζει να σημειωθεί ότι κάθε ένα από τα τρία βασικά στοιχεία μπορεί να συμπεριλαμβάνει άλλα υποστοιχεία, ανάλογα με την εκάστοτε περιγραφή της πληροφορίας. Εκτός από τα σχήματα μεταδεδομένων που προαναφέρθηκαν, δύο σημαντικά σχήματα είναι το Europeana Semantic Elements (ESE) και το Europeana Data Model (EDM). Πρόκειται για δύο σχήματα (το δεύτερο είναι μεταγενέστερο του πρώτου), τα οποία δημιουργήθηκαν για να διευκολύνουν την οργάνωση της πληροφορίας στο περιβάλλον της Europeana. Η Europeana ή Ευρωπαϊκή Ψηφιακή Βιβλιοθήκη δίνει πρόσβαση σε βιβλία, χάρτες, ηχογραφήσεις, φωτογραφίες, αρχειακά έγγραφα, πίνακες και ταινίες, υλικά που προέρχονται από εθνικές βιβλιοθήκες και πολιτιστικά ιδρύματα των 27 κρατών μελών της Ευρωπαϊκής Ένωσης. Το πρότυπο ESE δημιουργήθηκε από την ομάδα της Europeana το 2008. Πρόκειται ουσιαστικά για ένα πρότυπο που υιοθετεί όλα τα στοιχεία του προτύπου Dublin Core (15 στοιχεία) καθώς επίσης και ένα υποσύνολο των όρων του DC, ενώ επιπρόσθετα περιλαμβάνονται κάποια στοιχεία που εξυπηρετούν τις ανάγκες της Ευρωπαϊκής Ψηφιακής Βιβλιοθήκης. Τα στοιχεία αυτά είναι 12 και είναι τα εξής: προέλευση (provenance), μη αποθηκευμένο υλικό (unstored), αντικείμενο (object), πάροχος (provider), τύπος (type), είναι ορατή από (isshownby), είναι ορατή σε (isshownat), χώρα (country), έχει αντικείμενο (hasobject), γλώσσα (language),

ετικέτα χρήστη (usertag), διεύθυνση πόρου (uri), χρόνος (year). Το σχήμα XML του προτύπου ESE επεκτείνει το σχήμα XML του προτύπου DC προσθέτοντας στοιχεία από το χώρο ονομάτων της Europeana [19]. Το σχήμα EDM αποτελεί βελτίωση του ESE, στοχεύοντας στην ενοποίηση των δεδομένων από τους παρόχους κατά τη συλλογή, τη σύνδεση και τον εμπλουτισμό των περιγραφών των περιεχομένων. Ο χώρος ονομάτων (namespace) του σχήματος περιλαμβάνει τόσο στοιχεία που χρησιμοποιούνται σε άλλα σχήματα (π.χ. DC) όσο και στοιχεία που αναπτύχθηκαν με σκοπό την ικανοποίηση αναγκών της Ευρωπαϊκής Ψηφιακής Βιβλιοθήκης. Τα στοιχεία από χώρους ονομάτων άλλων σχημάτων μεταδεδομένων προέρχονται από το μοντέλο RDF (Resource Description Framework) και το RDFS (RDF Schema), το πρότυπο OAI Object Reuse and Exchange (ORE), το μοντέλο SKOS (Simple Knowledge Organization System) και το πρότυπο DC (Dubin Core), τόσο από το χώρο ονομάτων για τα στοιχεία όσο για τους όρους και τους τύπους (DCTERMS, DCMITYPE). Τα στοιχεία που δημιουργήθηκαν προς εξυπηρέτηση της Ευρωπαϊκής Ψηφιακής Βιβλιοθήκης ο χώρος ονομάτων είναι η Europeana είναι τα εξής: αντιπρόσωπος (agent), συσσωμάτωση Ευρωπαϊκής ψηφιακής βιβλιοθήκης (europeanaaggregation), γεγονός (event), πόρος πληροφορίας (informationresource), μη πληροφοριακός πόρος (non-informationresource), φυσικό αντικείμενο (physicalthing), τοποθεσία (place), αντικείμνο που παρέχεται από πολιτσμική κληρονομιά (providedculturalheritageobject), χρονικό διάστημα (timespan), διαδικτυακός πόρος (webresource) [18]. 3.2 Πρότυπα μητρώα μορφοτύπων Στην προσπάθεια ενοποίησης των ψηφιακών αντικειμένων εντός των αποθετηρίων, εκτός από τα πρότυπα σχήματα μεταδεδομένων που προαναφέρθηκαν, αναπτύχθηκαν και κάποια πρότυπα μητρώα μορφοτύπων, τα οποία ορίζουν ένα σύνολο συντακτικών και σημασιολογικών κανόνων ώστε να διευκολύνουν την αντιστοίχιση μεταξύ της πληροφορίας και των δυαδικών ψηφίων (bits) που την αναπαριστούν. Τα πιο ευρέως διαδεδομένα μητρώα είναι τα PRONOM και GDFR (Global Digital Format Registry), ενώ το UDFR (Unified Digital Format Registry) αποτελεί την ενοποίηση των δύο παραπάνω μητρώων. Το PRONOM είναι ένα μητρώο βασισμένο στον ιστό που δίνει πληροφορίες για μορφότυπους αρχείων και τις τεχνικές τους εξαρτήσεις. Αναπτύχθηκε από τον

φορέα των Εθνικών αρχείων του Ηνωμένου Βασιλείου (National Archives of the United of Kingdom) με σκοπό να οριστεί ένα κοινό μητρώο μορφότυπου. Το μητρώο αυτό είναι ο συνδυασμός ενός προκαθορισμένου μητρώου και μιας εκτενής συλλογής που περιέχει μία μεγάλη γκάμα από ευρέως χρησιμοποιούμενους μορφότυπους [57]. Το Παγκόσμιο Ψηφιακό Μητρώο Μορφοτύπων (Global Digital Format Registry - GDFR) αποτελεί ένα δίκτυο αποθετηρίων αναπαράστασης του μορφότυπου της πληροφορίας, έχοντας ως βασικό στόχο να διατηρεί ένα συνεχές και ακριβές δέσιμο μεταξύ των αναγνωριστικών των ψηφιακών μορφοτύπων και των αναπαραστάσεων τους. Ως ένα κατανεμημένο δίκτυο συνεργαζόμενων αποθετηρίων, το πρότυπο αυτό προσπαθεί να ορίσει ένα αφηρημένο μοντέλο δεδομένων για την αναπαράσταση του μορφότυπου της πληροφορίας [1]. Για να οριστεί το μοντέλο δεδομένων (data model), το GDFR χρησιμοποιεί το μοντέλο αναφοράς OAIS (Open Archival Information System). Το OAIS (Ανοικτό Σύστημα Πληροφοριών Αρχείων) είναι ένα σύστημα το οποίο ασχολείται με τη διαχείριση και τη διαθεσιμότητα πληροφοριών που αφορούν μία καθορισμένη επιστημονική κοινότητα. Το μοντέλο OAIS αποτελείται από τρία βασικά τμήματα [35]: 1. το περιβάλλον (εμπλεκόμενοι στο σύστημα) 2. το λειτουργικό μοντέλο 3. το πληροφοριακό μοντέλο. Το παρακάτω διάγραμμα αναπαριστά το μοντέλο OAIS στο σύνολό του: 2 P Preservation Planning C 1 R O O Descriptive 2 Descriptive N Data 1 D Info Info S SIP Management 2 U 2 U Ingest Access DIP 3 C 3 2 M E AIP Archival AIP E 3 3 R R 2 Administration Εικόνα 1: Μοντέλο OAIS 1 MANAGEMENT

Τέλος, στην προσπάθεια ενοποίησης των δύο παραπάνω γενικών μητρώων μορφοτύπων, αναπτύχθηκε το UDFR (Unified Digital Format Registry), το οποίο αναπτύχθηκε στη Ψηφιακή Βιβλιοθήκη της Καλιφόρνιας του τμήματος Ψηφιακής Επιμέλειας (University of California Curation Center, California Digital Library) με την συγχρηματοδότηση της Βιβλιοθήκης του Κογκρέσου και είναι πλατφόρμα ανοικτού κώδικα [59]. Το μητρώο αυτό αποτελεί μία αξιόπιστη, δημοσίως προσπελάσιμη και βιώσιμη βάση για την αναπαράσταση του μορφότυπου της πληροφορίας προς χρήση από την κοινότητα ψηφιακής διατήρησης. Για να γίνει αυτό, χρησιμοποιεί μία σημασιολογική βάση δεδομένων όπου οι πληροφορίες παριστάνονται σε μορφή RDF και διατίθενται ως συνδεδεμένα δεδομένα (Linked Data). 3.3 Υπηρεσίες μητρώων δεδομένων στις ανθρωπιστικές επιστήμες Όπως και σε άλλες επιστήμες, έτσι και στις ανθρωπιστικές επιστήμες, τα μητρώα δεδομένων αναπτύχθηκαν για να καλύψουν κάποιες ανάγκες. Μεταξύ των αναγκών αυτών είναι η μακροπρόθεσμη διατήρηση των ψηφιακών αντικειμένων, η εύκολη αναζήτησή τους και η άμεση πρόσβαση από την επιστημονική κοινότητα. Οι βασικές υπηρεσίες των μητρών δεδομένων αφορούν την αναζήτηση και αναδίφηση πληροφοριών, την ταξινόμηση τους, την αντιστοίχιση σχημάτων μεταδεδομένων, την μακροχρόνια διαχείριση τους, την υποστήριξη πολυγλωσσικών διπεαφών και την δυνατότητα χρήσης τους από διαφορετικά εργαλεία λογισμικού (π.χ. SOAP, REST ) [9]. Όσον αφορά την αναζήτηση πληροφοριών, αυτή μπορεί να γίνει με έναν από τους ακόλουθους τρόπους: βάσει του τύπου του πόρου (π.χ. έγγραφο, κείμενο, οντολογία, σύνολο δεδομένων), βάσει του γεωγραφικού περιορισμού στα αποτελέσματα της αναζήτησης, βάσει λέξεων-κλειδιών που ο χρήστης επιθυμεί να εμπεριέχονται στα αποτελέσματα, βάσει της συλλογής ή του φορέα που έχει εκχωρήσει τα ψηφιακά αντικείμενα βάσει της χρονικής περιόδου και της τοποθεσίας προέλευσης των ψηφιακών αντικειμένων βάσει σύνθετης αναζήτησης, δηλαδή επιλέγοντας περισσότερα από ένα από τα παραπάνω ή και άλλα κριτήρια.

Κατά την αναζήτηση των ψηφιακών αντικειμένων, δίνεται η δυνατότητα στο χρήστη να επιλέξει κάποιο κριτήριο ταξινόμησης στα αποτελέσματα του. Συνεπώς τα αποτελέσματα μπορεί να είναι ταξινομημένα ως προς τον τίτλο ή το φορέα ή την ημερομηνία δημιουργίας των αντικειμένων ή την ημερομηνία εκχώρησης των αντικειμένων στο μητρώο. Αξίζει τέλος να σημειωθεί, ότι δίνεται η δυνατότητα αποθήκευσης των ερωτημάτων αναζήτησης στη βάση του μητρώου. Συνεπώς αν ένας χρήστης επιθυμεί να κάνει μία αναζήτηση με ίδια κριτήρια με αυτή του παρελθόντος, αρκεί να ανατρέξει στις επερωτήσεις που έχει κάνει ο ίδιος και άμεσα να κάνει την αναζήτηση στον όγκο των συλλογών. Η αναδίφηση σε ένα μητρώο μπορεί να γίνεται βάσει του τύπου του πόρου (π.χ. έγγραφο, οντολογία, σύνολο δεδομένων), ή βάσει του τύπου του εγγράφου (π.χ. αναφορά, βιβλίο, άρθρο) ή βάσει των δικαιωμάτων πρόσβασης του αρχείου (π.χ. δημοσίως προσβάσιμα αρχεία, περιορισμένης πρόσβασης αρχεία). Επιπλέον, η αναδίφηση μπορεί να γίνει με κριτήριο τη χρονική περίοδο δημιουργίας των ψηφιακών αντικειμένων ή τη γεωγραφική τοποθεσία που εντοπίστηκαν. Ένα άλλο κριτήριο μπορεί να είναι το έργο στο οποίο ανήκει ένα ψηφιακό αντικείμενο ή ο οργανισμός από τον οποίο δημιουργήθηκε. Εξίσου σημαντικό κριτήριο κατά την αναδίφηση αποτελεί το θέμα για το οποίο ενδιαφέρεται ο χρήστης (π.χ. αρχαιολογία, λογοτεχνία, θεατρολογία). Μέσω της αναδίφησης ή της αναζήτησης, τα αποτελέσματα που προκύπτουν παρέχουν πληροφορίες στο χρήστη ανάλογα με τα κριτήρια προσδιορισμού του. Μέσω της άμεσης και συνοπτικής πληροφόρησης για τις συλλογές στο σύνολο τους, αποτυπώνεται μία γρήγορη εικόνα στο χρήστη σχετικά με το περιεχόμενο τους. Οι πληροφορίες μπορεί να περιλαμβάνουν μία περίληψη του ψηφιακού αντικειμένου, λέξεις-κλειδιά που περιέχονται σε αυτό, χρονολογικά και τοπογραφικά χαρακτηριστικά του αντικειμένου, επιπλέον σημειώσεις που προσδιορίζουν σημαντικά το ψηφιακό αντικείμενο, φορείς και οργανισμοί που είχαν την εποπτεία του, βιβλιογραφικές αναφορές και παραπομπές, πληροφορίες για συσχετιζόμενες συλλογές ή και άλλα έργα που ασχολούνται με συναφή αντικείμενα. Στο σύνολό τους οι πληροφορίες αυτές αποτελούν τα στοιχεία γνωρίσματα του εκάστοτε σχήματος μεταδεδομένων που χρησιμοποιεί το κάθε μητρώο (π.χ. DC, MOD, METS). Επιπλέον, δίνεται η δυνατότητα στο χρήστη να επιλέγει κάθε φορά την μορφή που επιθυμεί να εμφανίζονται οι παραπάνω πληροφορίες. Ως εκ τούτου, μπορεί να επιλέξει την απλή μορφή κειμένου ή την εμφάνιση του σχήματος μεταδεδομένων του