Ψηφιακή Συλλογή Ημερήσιου και Περιοδικού Τύπου της Εθνικής Βιβλιοθήκης: Τρία από τα κλειδιά της επιτυχίας της

Σχετικά έγγραφα
ΑΝΑΠΤΥΞΗ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ ΨΗΦΙΑΚΩΝ ΣΥΛΛΟΓΩΝ ΕΦΗΜΕΡΙΔΩΝ

ΠΛΗΡΟΦΟΡΙΑΚΗ ΠΑΙΔΕΙΑ: ΤΟ ΚΛΕΙΔΙ ΓΙΑ ΤΗ ΔΙΑ ΒΙΟΥ ΜΑΘΗΣΗ ΑΘΗΝΑ

Εθνικό Κέντρο Τεκμηρίωσης. Δραστηριότητες και Εργαλεία για τις Βιβλιοθήκες

ΙΔΡΥΜΑΤΙΚΟ ΑΠΟΘΕΤΗΡΙΟ Dspace

Συμβούλιο της Ευρωπαϊκής Ένωσης Βρυξέλλες, 14 Σεπτεμβρίου 2017 (OR. en)

«Εμπειρία ανάπτυξης συστημάτων βιβλιοθηκών Συνεργασίες με βιβλιοθήκες ββ Εξέλιξη ξη ΑΒΕΚΤ»

The governance of culture in today's globalized world

Αναφορά εργασιών για το τρίμηνο Μάρτιος 2013 Μάιος 2013 Όνομα : Παπαχριστόπουλος Λεωνίδας

από αναπτυξιακά προγράμματα στους οργανισμούς πληροφόρησης»

«DARIAH-ΑΤΤΙΚΗ Ανάπτυξη της ελληνικής ερευνητικής υποδομής για τις ανθρωπιστικές επιστήμες ΔΥΑΣ» Αθήνα, 26 Φεβρουαρίου 2015

Αναφορά εργασιών για το τρίµηνο Μάρτιος - Μάϊος 2013

ΜΕ ΕΠΕΑΕΚ: ΑΝΑΜΟΡΦΩΣΗ ΤΟΥ ΠΡΟΓΡΑΜΜΑΤΟΣ ΣΠΟΥΔΩΝ ΤΟΥ ΤΕΦΑΑ ΠΘ ΑΥΤΕΠΙΣΤΑΣΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΦΥΣΙΚΗΣ ΑΓΩΓΗΣ & ΑΘΛΗΤΙΣΜΟΥ

1. Εισαγωγή. 2. Η φιλοσοφία της ΒΚΠ

ΟΔΗΓΙΕΣ ΥΠΟΒΟΛΗΣ ΕΡΕΥΝΗΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΣΤΟ ΙΔΡΥΜΑΤΙΚΟ ΑΠΟΘΕΤΗΡΙΟ ΤΟΥ ΟΠΑ "ΠΥΞΙΔΑ"

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ:

Δημιουργία Ιστορικής Ψηφιακής Βάσης για την Περίοδο : πρακτικές, προβλήματα, προκλήσεις

Ψηφιοποίηση και διαχείριση ΠΔ:τα ορφανά έργα και η ιστορία τους/ Βασιλικής Στρακαντούνα, ΕΚΠΑ

Ψηφιοποίηση Σπάνιων Βιβλίων και Ελληνικών Περιοδικών (προ 1920) και Υπηρεσία Διάθεσής τους

1. Σκοπός της έρευνας

Οδηγός υποβολής σε αποθετήριο SaaS

Σεμινάριο Τελειοφοίτων. 2 - Επιλογή Επεξεργασία Ερευνητικού Θέματος

Αναβάθμιση και εμπλουτισμός ΙδρυματικούΑποθετηρίουΕΜΠ

Εγγραφή της etwinning συνεργασίας σας: αναλυτικός οδηγός

Η πληροφορία έχει τα. Εμείς είμαστε δίπλα σας σε κάθε βήμα

Επικεντρώνεται στην περιγραφή της χρήσης της Ανέμη και στην αξιολόγησή της.

SUPPORT SERVICES EPALE CY

Ερευνητικό Αποθετήριο ΤΕΙ Ηπείρου. Οδηγίες κατάθεσης δημοσίευσης στο σύστημα Ερευνητικού Αποθετηρίου CRIS

Τα σχέδια μαθήματος 1 Εισαγωγή

e-publishing Υπηρεσίες Ηλεκτρονικών εκδόσεων- Τίτλος παρουσίασης epublishing Open Book Press

Γ ΚΟΙΝΟΤΙΚΟ ΠΛΑΙΣΙΟ ΣΤΗΡΙΞΗΣ

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

Αναζητήσεις στο Διαδίκτυο

Αναζητήσεις στο Διαδίκτυο

ΜΕΘΟΔΟΛΟΓΙΑ ΙMP3ROVE

Υπηρεσία δανεισμού μεταξύ Βιβλιοθηκών και απόκτηση εντύπων

ΣΧΕΔΙΟ ΓΝΩΜΟΔΟΤΗΣΗΣ. EL Eνωμένη στην πολυμορφία EL 2011/0430(COD) της Επιτροπής Νομικών Θεμάτων

Η Τεχνολογική Διαλειτουργική Πλατφόρµα του έργου ATHENA

Έντυπο Υποβολής Αιτήματος Υποκειμένου των Δεδομένων

Ερευνητικό Αποθετήριο Πανεπιστημίου Πειραία

Βιβλιογραφία κοινωνικής έρευνας

ΕΥΡΩΠΑΪΚΟ ΚΟΙΝΟΒΟΥΛΙΟ

Unified search of digital cultural content: Searching culture

Ψηφιοποίηση του Αρχειακού Υλικού του ΣΙΜΑΕ από τη Βιβλιοθήκη του Πανεπιστημίου Κύπρου

ΕΙΣΑΓΩΓΗ σ. 2 Α. ΕΡΕΥΝΑ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ Ε ΟΜΕΝΩΝ 2

An expert is a person who has made all the mistakes that can be made in a very narrow field. Niels Bohr Βραβείο Νόμπελ στη Φυσική, 1922

Χρήση εναλλακτικών μετρικών για την αποτίμηση της διάδοσης της έρευνας σε επιστημονικά συνέδρια

Τα πάντα για την επιχειρηματική δραστηριότητα των κυπριακών επιχειρήσεων με ένα κλικ!

Ευρήματα στον τομέα του τουρισμού. Ανάλυση αναγκών

ΟΔΗΓΙΕΣ ΧΡΗΣΗΣ ΤΟΥ ΠΛΗΡΟΦΟΡΙΑΚΟΥ ΣΥΣΤΗΜΑΤΟΣ ΔΙΑΧΕΙΡΙΣΗΣ ΜΗΤΡΩΩΝ ΤΟΥ Ι.Ε.Π.

Αναφορά εργασιών για το δίμηνο Μάϊος Ιούνιος Ανάδοχος. Καμάτσος Παρασκευάς

ΣΥΜΒΟΥΛΕΣ ΔΡΑΣΗΣ ΓΙΑ ΤΗ ΠΡΟΣΕΓΓΙΣΗ ΕΦΑΡΜΟΓΗΣ ΤΟΥ EILEEN. ΕΛΛΗΝΙΚΗ ΕΚΔΟΣΗ Greek Language Version

Ημερομηνία Παράδοσης: 4/7/2013

ΚΡΙΤΗΡΙΑ ΑΞΙΟΛΟΓΗΣΗΣ ΑΙΤΗΣΗΣ

Οδηγίες Καταχώρησης Τεκμηρίου

ΣΧΕΔΙΟ ΥΠΟΒΟΛΗΣ ΕΡΕΥΝΗΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΤΜΗΜΑ ΒΘΔ ΒΝ Ο ΤΙΤΛΟΣ ΤΗΣ ΕΡΕΥΝΗΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: ΣΤΟΙΧΕΙΑ ΥΠΕΥΘΥΝΩΝ ΕΚΠΑΙΔΕΥΤΙΚΩΝ

Ησυµβολή των Έργων ΕΠΕΑΕΚ ΙΙ των Ακαδηµαϊκών Βιβλιοθηκών. Τίτλος Εργασίας: Πληροφοριακή Παιδεία και Ελληνική Ανώτατη Εκπαίδευση:

Μεθοδολογία ερευνητικής εργασίας

ΑΠΟΓΡΑΦΙΚΟ ΔΕΛΤΙΟ του Εθνικού Αρχείου Διδακτορικών Διατρίβων

Εγχειρίδιο λειτουργιών χρήστη (επιχείρησης) στο Mathiteia4u

ΕΠΙΤΡΟΠΗ ΤΩΝ ΕΥΡΩΠΑΪΚΩΝ ΚΟΙΝΟΤΗΤΩΝ ΕΓΓΡΑΦΟ ΕΡΓΑΣΙΑΣ ΤΩΝ ΥΠΗΡΕΣΙΩΝ ΤΗΣ ΕΠΙΤΡΟΠΗΣ ΠΕΡΙΛΗΨΗ ΤΗΣ ΕΚΤΙΜΗΣΗΣ ΑΝΤΙΚΤΥΠΟΥ

Αξιοποίηση και διάθεση ελληνικού ψηφιακού έγκριτου περιεχομένου

Οδηγός καταχώρισης σχεδίου δράσης σχολείου στην Ηλεκτρονική Πύλη Επαγγελματικής Μάθησης

Συγγραφή Τεχνικών Κειμένων

Αναφορά εργασιών για το τρίμηνο Δεκέμβριος 2013 Φεβρουάριος 2014

γνωστικό περιβάλλον της Κοινωνίας της Πληροφορίας, Προπτυχιακών και Μεταπτυχιακών Σπουδών με σύγχρονες μεθόδους,

Ο ΑΝΤΙΚΤΥΠΟΣ ΤΟΥ ΔΙΑΔΙΚΤΥΑΚΟΥ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΤΟΝ ΕΛΛΗΝΙΚΟ ΤΟΥΡΙΣΜΟ

ΟΔΗΓΟΣ ΧΡΗΣΗΣ ΥΠΗΡΕΣΙΑΣ [ΥΠΗΡΕΣΊΑ 9 ΣΎΣΤΗΜΑ

Políticas bibliotecarias y profesionales de la información en España. Πολιτικές των Βιβλιοθηκών και των επαγγελµατιών της Πληροφορίας στην Ισπανία

ΕΚΤ και καινοτομία με ανοιχτά δεδομένα και APIs

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ. Πτυχιακή Εργασία. Κόπωση και ποιότητα ζωής ασθενών με καρκίνο.

Προκειμένου η συμπλήρωση του Καταλόγου να καταστεί εύκολη για όλες τις δημόσιες αρχές, πρέπει να:

Ψηφιοποίηση υλικού σε Βιβλιοθήκες και Αρχεία : προκλήσεις και περιορισμοί

ΚΟΗΑ ΠΑΡΑΓΓΕΛΙΕΣ ΔΗΜΙΟΥΡΓΙΑ ΚΑΛΑΘΙΟΥ / ΠΡΟΣΘΗΚΗ ΤΕΚΜΗΡΙΩΝ / ΚΛΕΙΣΙΜΟ ΚΑΛΑΘΙΟΥ/ ΠΑΡΑΛΑΒΗ ΠΑΡΑΓΓΕΛΙΩΝ

ΕΝΑΣ ΔΟΡΥΦΟΡΙΚΟΣ ΛΟΓΑΡΙΑΣΜΟΣ ΓΙΑ ΤΟΥΣ ΔΗΜΙΟΥΡΓΙΚΟΥΣ ΚΛΑΔΟΥΣ ΤΗΣ ΕΥΡΩΠΑΪΚΗΣ ΕΝΩΣΗΣ

ΑΞΙΟΠΟΙΗΣΗ ΣΥΓΧΡΟΝΩΝ ΜΕΘΟΔΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΩΝ ΚΑΤΑΡΤΙΣΗΣ ΣΤΗΝ ΚΥΠΡΟ ΣΤΟ ΚΑΤΩΦΛΙ ΤΟΥ 21ου ΑΙΩΝΑ. Συμβολή στην ανάπτυξη του ανθρώπινου δυναμικού

κοινοποιούνται επιτεύγματα ώστε να προάγεται η κοινωνική πρόοδος και η ολόπλευρη και καθολική ανάπτυξη της ανθρωπότητας.

ΔΙΔΑΣΚΑΛΙΑ ΓΝΩΣΤΙΚΗΣ ΣΤΡΑΤΗΓΙΚΗΣ ΓΙΑ ΤΗΝ ΚΑΤΑΝΟΗΣΗ Δρ. Ζαφειριάδης Κυριάκος Οι ικανοί αναγνώστες χρησιμοποιούν πολλές στρατηγικές (συνδυάζουν την

ΠΡΑΚΤΙΚΗ ΑΣΚΗΣΗ ΦΟΙΤΗΤΩΝ ΒΕΡΓΟΣ Σ. ΓΕΩΡΓΙΟΣ ΕΤΗΣΙΟ ΣΧΕΔΙΟ ΔΡΑΣΗΣ ΚΑΙ ΕΚΘΕΣΗ ΑΞΙΟΛΟΓΗΣΗΣ ΠΡΟΓΡΑΜΜΑΤΟΣ ΠΑ

Εφαρμογή Ηλεκτρονικής Διαχείρισης Μετεγγραφών

Θέλετε να διαθέσετε ένα αρχείο στο διαδίκτυο;

Gary Hall, Open Humanity Press

Εγχειρίδιο χρήσης Ai4B σελ. 2 από 21

ΠΡΑΚΤΙΚΗ ΑΣΚΗΣΗ ΦΟΙΤΗΤΩΝ ΒΕΡΓΟΣ Σ. ΓΕΩΡΓΙΟΣ ΕΤΗΣΙΟ ΣΧΕΔΙΟ ΔΡΑΣΗΣ ΚΑΙ ΕΚΘΕΣΗ ΑΞΙΟΛΟΓΗΣΗΣ ΠΡΟΓΡΑΜΜΑΤΟΣ ΠΑ

Στην πράξη ουσιαστικά αντικαθιστά τον παραδοσιακό κατάλογο μιάς Βιβλιοθήκης με όλα τα παραπάνω πλεονεκτήματα.

ΕΥΡΩΠΑΪΚΟ ΚΟΙΝΟΒΟΥΛΙΟ

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ & ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Μ.Π.Σ. ΣΤΗ ΔΙΟΙΚΗΣΗ ΥΠΗΡΕΣΙΩΝ

Εγχειρίδιο Εισαγωγής Στοιχείων στο Πληροφοριακό Σύστημα του προγράμματος Εξοικονόμηση Κατ Οίκον ΙΙ - Διαχείριση αίτησης μετά την Έκδοση της Απόφασης

Μαθηματικά και Πληροφορική. Διδακτική Αξιοποίηση του Διαδικτύου για τη Μελέτη και την Αυτο-αξιολόγηση των Μαθητών.

Παρουσίαση Παρεχόμενων Υπηρεσιών Πληροφορικής της DBS AE

XΑΡΟΚΟΠΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΚΟΙΝΩΝΙΚΗ ΕΝΤΑΞΗ ΣΤΟΝ ΤΟΜΕΑ ΤΩΝ ΔΗΜΟΣΙΩΝ ΜΕΤΑΦΟΡΩΝ ΤΗΣ ΕΕ

Φύλλο εργασίας. Ερωτήσεις ανασκόπησης του μαθήματος

ΚΑΝΟΝΙΣΜΟΣ ΙΠΛΩΜΑΤΙΚΩΝ ΕΡΓΑΣΙΩΝ

ΘΕΜΑ ΕΡΓΑΣΙΑΣ: «ΈΚΘΕΣΗ ΈΚΦΡΑΣΗ ΜΟΥΣΙΚΑ ΘΕΜΑΤΑ»

ΚΑΝΟΝΙΣΜΟΣ ΙΠΛΩΜΑΤΙΚΩΝ ΕΡΓΑΣΙΩΝ

Dynamic Business Systems. Παρουσίαση Εφαρμογής

Ιδρυματικό Αποθετήριο ΑΕΙ ΠΕΙΡΑΙΑ Τ.Τ.

Δρ. Εμμανουήλ Γαρουφάλλου. Δρ. Αλέξανδρος Κουλούρης

Εθνικό Κέντρο Τεκμηρίωσης ΕΙΕ. Copyright 2014 Εθνικό Κέντρο Τεκμηρίωσης Ι EIE

3 βήματα για την ένταξη των ΤΠΕ: 1. Εμπλουτισμός 2. Δραστηριότητα 3. Σενάριο Πέτρος Κλιάπης-Όλγα Κασσώτη Επιμόρφωση εκπαιδευτικών

Transcript:

MEI, II, Τ. 2, αρ. 2, σελ. 21 ΜΕΙ ΙΙ, τ.2 αρ.2 Ελήφθη στις 02-05-2011 Έγινε δεκτό στις 25-07-2011 Σύνοψη Ψηφιακή Συλλογή Ημερήσιου και Περιοδικού Τύπου της Εθνικής Βιβλιοθήκης: Τρία από τα κλειδιά της επιτυχίας της Lola Rodríguez Fuentes Εθνική Βιβλιοθήκη Τέσσερα χρόνια μετά την έναρξη λειτουργίας της Ψηφιακής Συλλογής Ημερήσιου και Περιοδικού Τύπου (Hemeroteca digital) στην Εθνική Βιβλιοθήκη Ισπανίας και αφού ολοκληρώθηκε η πρώτη φάση του προγράμματος ψηφιοποίησης (2008-2010), μπορούμε να επιβεβαιώσουμε την επιτυχία της στους κύκλους των χρηστών μας και των διεθνών ερευνητών. Τον Απρίλιο του 2011 η Ψηφιακή Συλλογή Ημερήσιου και Περιοδικού Τύπου περιλαμβάνει 840 τίτλους και περισσότερες από 4.000.000 σελίδες. Στο παρόν άρθρο, παραθέτουμε τα συμπεράσματα της αξιολόγησης που πραγματοποιήσαμε και στην οποία ξεχωρίζουν τρία σημεία-κλειδιά: περιεχόμενο, εργαλεία αναζήτησης και υπηρεσίες προστιθέμενης αξίας. Λέξεις-κλειδιά OCR (Οπτική Αναγνώριση Χαρακτήρων), ψηφιοποίηση Τύπου, υπηρεσίες μέσω Διαδικτύου, συλλογές ημερήσιου και περιοδικού Τύπου. Abstract Four years after the launching of the Hemeroteca Digital, we can confirm its success among our users and international researchers. We have carried out an evaluation to the first stage of the digitization (2008-2010) project. As of April 2011, the Hemeroteca Digital amounts to 840 titles, comprising more than 4.000.000 pages. Three are the main points that resulted in the success of the application: contents, searching tools and added value services. These aspects will be described shortly below. Keywords OCR; Press digitization; online services; Press archives. 1. Εισαγωγή Τέσσερα χρόνια μετά την έναρξη λειτουργίας της Ψηφιακής Συλλογής Ημερήσιου και Περιοδικού Τύπου (Μάρτιος 2007) και πριν από την ενσωμάτωσή της στην Ψηφιακή Βιβλιοθήκη Ισπανόφωνου Πολιτισμού (Biblioteca Digital Hispánica), εξέλιξη που θα επιφέρει ορισμένες αλλαγές στο αρχικό σχέδιο, προβήκαμε σε αξιολόγηση αυτής της πρώτης φάσης (2008-2010), τα αποτελέσματα της οποίας μας ενθαρρύνουν να συνεχίσουμε το έργο μας. Σήμερα η Ψηφιακή Συλλογή Ημερήσιου και Περιοδικού Τύπου περιλαμβάνει 840 τίτλους, με περισσότερες από 4.000.000 σελίδες και, όπως μπορέσαμε να διαπιστώσουμε, σημειώνει επιτυχία στους κύκλους των χρηστών μας και της διεθνούς ερευνητικής κοινότητας (όπως εμφαίνεται στο γράφημα αναζητήσεων). Από το αποτέλεσμα της αξιολόγησης, μπορούμε να επισημάνουμε τρία δυνατά σημεία ως κλειδιά της επιτυχίας: περιεχόμενο, εργαλεία αναζήτησης και υπηρεσίες προστιθέμενης αξίας. Ακολουθεί συνοπτική περιγραφή τους. RODRÍGUEZ FUENTES, LOLA. Hemeroteca digital de la Biblioteca Nacional: tres claves de su éxito. Στο: Métodos de información (MEI), II Época, Τ. 2, αρ. 2, 2011, σελ. 21-27. DOI: http://dx.doi.org/10.5557/iimei2-n2-021027

MEI, II, Τ. 2, αρ. 2, σελ. 22 Σχ. 1. Συγκριτικό γράφημα της χρήσης της Ψηφιακής Συλλογής Ημερήσιου και Περιοδικού Τύπου (2008-2010) 2. Περιεχόμενο 2.1. Επιλογή Όταν μια μεγάλη βιβλιοθήκη έργων πολιτιστικής κληρονομιάς έρχεται αντιμέτωπη με την πρόκληση της ψηφιοποίησης των συλλογών της, το πρώτο βήμα που πρέπει να κάνει είναι να καθορίσει ποιο μέρος της συλλογής θα μπορέσει να ψηφιοποιηθεί με τους διαθέσιμους πόρους, εφόσον δεν είναι δυνατόν να ψηφιοποιηθεί ολόκληρη η συλλογή. Η Εθνική Βιβλιοθήκη διαθέτει περίπου 8.000 τίτλους ιστορικού Τύπου που θα μπορούσαν να ψηφιοποιηθούν και έναν προϋπολογισμό που μας επιτρέπει να ψηφιοποιήσουμε περίπου 800 τίτλους, δηλαδή το 10% περίπου της συνολικής συλλογής. Απαιτείται, επομένως, μια διαδικασία επιλογής και ο τρόπος με τον οποίο θα πραγματοποιηθεί αυτή η διαδικασία θα καθορίσει σε μεγάλο βαθμό την επιτυχία ή την αποτυχία του έργου ψηφιοποίησης. Στην περίπτωση μας η επιλογή έγινε βάσει των παρακάτω παραγόντων: - ΔΙΑΤΗΡΗΣΗ: έγινε αρκετός λόγος σε διάφορα φόρουμ σχετικά με την καταλληλότητα ή μη της ψηφιοποίησης ως μεθόδου διατήρησης σε σχέση με την πιο διαδεδομένη άποψη ότι το σύστημα που εξασφαλίζει την επιβίωση του πρωτότυπου περιεχομένου είναι η αποτύπωση σε μικροφίλμ, καθώς διαθέτει καθιερωμένα πρότυπα και δεν απαιτεί χρήση ιδιαίτερα πολύπλοκου εξοπλισμού. Ταυτοχρόνως, αρχίζει να κερδίζει έδαφος η ιδέα ότι η ψηφιοποίηση μπορεί να λειτουργήσει τουλάχιστον υποστηρικτικά των προγραμμάτων διατήρησης, καθώς, εφόσον τα πρωτότυπα δεν χρησιμοποιούνται για τη διάδοση της πληροφορίας, δεν υφίστανται τη φθορά που πάντα προκαλεί η χρήση. Με βάση αυτό το σκεπτικό, επιλέξαμε βασικές συλλογές Τύπου που βρίσκονται σε πολύ άσχημη κατάσταση και τις οποίες δεν θα μπορούσε να συμβουλευτεί κανείς διαφορετικά, μοναδικά αντίτυπα υψηλού ενδιαφέροντος και δημοσιεύσεις με μεγάλη ζήτηση οι οποίες υπόκεινται σε συνεχή χρήση και τμηματική αναπαραγωγή, γεγονός που επηρεάζει πολύ αρνητικά την επιβίωσή τους. Σε αυτήν την περίπτωση ο κυρίαρχος παράγοντας για την επιλογή ήταν η φυσική κατάσταση των δημοσιεύσεων.

MEI, II, Τ. 2, αρ. 2, σελ. 23 Σχ. 2. Παράδειγμα εφημερίδας με αποκομμένα τμήματα - ΧΡΗΣΗ: θέλαμε, εξάλλου, να ανταποκριθούμε στα αιτήματα των χρηστών μας, τόσο των πραγματικών όσο και των εν δυνάμει, γι αυτό και επιλέξαμε τους πιο αντιπροσωπευτικούς τίτλους της συλλογής μας, καθώς ένας από τους στόχους μας είναι η μεγαλύτερη διάδοση της χρήσης της Βιβλιοθήκης, μέσω της βελτίωσης της πρόσβασης στις δημοσιεύσεις μας που έχουν τη μεγαλύτερη ζήτηση και της απόκτησης πιστών χρηστών. Ο παράγοντας που λάβαμε υπ όψιν ήταν τα στατιστικά στοιχεία χρήσης μαζί με τα επαναλαμβανόμενα αιτήματα των χρηστών μας. - ΕΙΔΟΣ ΥΛΙΚΟΥ: πέρα από τους τίτλους των πιο σημαντικών ιστορικών ισπανικών εφημερίδων, επιλέχτηκαν επίσης πολλά από τα βασικότερα περιοδικά κάθε τομέα και από τα εικονογραφημένα ειδησεογραφικά περιοδικά που παρουσιάζουν με πολύ ολοκληρωμένο τρόπο τα πολιτικά, κοινωνικά και πολιτιστικά γεγονότα της εποχής τους. Κατ αυτόν τον τρόπο, προσφέρουμε ένα ευρύ και αντιπροσωπευτικό φάσμα της συλλογής της Εθνικής Βιβλιοθήκης. - ΑΛΛΟΙ ΠΑΡΑΓΟΝΤΕΣ: κατά τη διαδικασία επιλογής ελήφθησαν υπ όψιν και άλλοι παράγοντες που συμπληρώνουν τον σκοπό του έργου αυτού, όπως είναι η συνεργασία μεταξύ κέντρων με παρόμοιες λειτουργίες, η στήριξη σημαντικών εκθέσεων ή γεγονότων, χάρη στα οποία εμπλουτίστηκε η επιλογή με τίτλους που αρχικά δεν είχαν ληφθεί υπ όψιν, προτάσεις διαφόρων ιδρυμάτων ή φορέων καθώς και προτάσεις ερευνητών ή εκπαιδευτικών.

MEI, II, Τ. 2, αρ. 2, σελ. 24 2.2. Μεθοδολογία Αφού καθορίστηκαν οι επιδιωκόμενοι με την επιλογή σκοποί, ξεκίνησε η εξέταση και η ανάλυση της προς αναπαραγωγής συλλογής, διαδικασία που αποτέλεσε την πιο επίπονη εργασία στο πλαίσιο του όλου έργου και απαίτησε πολύ χρόνο και μεγάλο μέρος των ανθρώπινων πόρων του Τμήματος Περιοδικών Εκδόσεων. Η μεθοδολογία ήταν η εξής: - Δημιουργήθηκε μια βάση δεδομένων με όλες τις πληροφορίες της επιλογής, την ανάλυση και τις διάφορες φάσεις του workflow του κάθε τίτλου. - Μέσω αναζήτησης στον κατάλογο ελέγχθηκε η ύπαρξη ή όχι διπλοτύπων και εντοπίστηκαν οι τοποθεσίες τους. - Εξετάστηκαν σελίδα προς σελίδα όλα τα πιθανά αντίτυπα και επελέγησαν τα καταλληλότερα. - Εντοπίστηκαν τα προβλήματα που υπήρχαν στα πρωτότυπα, όπως λάθη, κενά, αποκομμένα τμήματα, λεκέδες, ρωγμές με ή χωρίς απώλεια κειμένου, διαπότιση του μελανιού της γραμμής και διάφορες φθορές που έγινε προσπάθεια να καλυφθούν με άλλες συλλογές. - Στις περιπτώσεις όπου δεν ήταν δυνατόν να συμπληρωθούν τα αντίτυπα ή οι τίτλοι, προστέθηκε σχετική επισήμανση στις εικόνες και όλες οι πληροφορίες αποθηκεύτηκαν με σκοπό τη σταδιακή συμπλήρωση των συλλογών μέσω της συνεργασίας με άλλα κέντρα. - Σε ορισμένες περιπτώσεις, πραγματοποιήθηκαν μικρές επεμβάσεις αποκατάστασης για τη σταθεροποίηση του μέσου πριν από την ψηφιοποίηση, αλλά υπήρξαν και περιπτώσεις όπου η απώλεια κειμένου ήταν ανεπανόρθωτη. 2.3. Συντονισμός μεταξύ κέντρων Πραγματοποιήθηκε μια σειρά δράσεων συνεργασίας με άλλους φορείς με στόχο την κοινή αξιοποίηση πόρων και τη συμπλήρωση, όσο ήταν δυνατόν, των συλλογών της Εθνικής Βιβλιοθήκης. Στο πλαίσιο αυτό, αποκλείστηκαν, αρχικά, όλοι εκείνοι οι τίτλοι που υπάρχουν ψηφιοποιημένοι σε άλλα κέντρα. Για τον εντοπισμό τους, γίνεται εκτεταμένη έρευνα σε όλες τις ισπανικές ψηφιακές βιβλιοθήκες. Σε δεύτερη φάση, θα καταβληθούν προσπάθειες για να εντοπιστούν σε άλλες βιβλιοθήκες τα αντίτυπα που λείπουν από την Ψηφιακή Συλλογή Ημερήσιου και Περιοδικού Τύπου, με στόχο να συμπληρωθούν οι τίτλοι. 3. Εργαλείο αναζήτησης 3.1. OCR: Αναζήτηση βάσει κειμένου Όσον αφορά στα εργαλεία για αναζήτηση στον Τύπο στην Ισπανία, ουδέποτε είχαμε στη διάθεσή μας ευρετήρια ή περιλήψεις που θα διευκόλυναν τον εντοπισμό των αναζητούμενων άρθρων ή θεμάτων. Οι ερευνητές άρχισαν να ζητούν κάποιο εργαλείο που θα διευκόλυνε την εργασία τους, κυρίως από τότε που η έρευνα στον Τύπο γενικεύθηκε και έγινε απαραίτητη για τη μελέτη ιστορικών περιόδων ή πρόσφατων ζητημάτων. Η δυνατότητα εφαρμογής τεχνικών OCR στις ψηφιακές εικόνες ήρθε να καλύψει, σε μεγάλο βαθμό, την έλλειψη πιο προηγμένων εργαλείων αναζήτησης, όπως θησαυρών ή ευρετηρίων, και άλλων εργαλείων πολύ πιο ακριβών και πρακτικά ανεφάρμοστων σε χώρες με μεγάλη παραγωγή τίτλων Τύπου.

MEI, II, Τ. 2, αρ. 2, σελ. 25 Σε όλες τις βιβλιοθήκες που υλοποιούν σήμερα σημαντικά έργα ψηφιοποίησης (βλ. TELplus project) εξετάζεται η σκοπιμότητα της εφαρμογής τεχνικών OCR σε παλιές εφημερίδες αλλά και η ακρίβεια των αποτελεσμάτων που προκύπτουν. Δεν πρέπει να ξεχνάμε ότι το OCR θα αποτελεί πάντα μια μέθοδο μη ελεγχόμενης αναζήτησης βάσει κειμένου και, ως εκ τούτου, ακόμη και εάν η μεταγραφή ήταν ακριβής, θα συνέχιζε να μας δίνει λανθασμένα αποτελέσματα (και πολύ «θόρυβο» όσον αφορά στα κοινά ουσιαστικά και τις ημερομηνίες). Συγκεκριμένα, στη δική μας περίπτωση, είχαμε αρχίσει να πειραματιζόμαστε με το OCR εφαρμόζοντάς το σε κάποιους τίτλους σύγχρονου Τύπου και, παρότι τα αποτελέσματα δεν ήταν απολύτως ικανοποιητικά, είχαμε παρατηρήσει τον αντίκτυπό του στην έρευνα και την αναζήτηση δημοσιευμάτων του Τύπου. Οι τίτλοι που χρησιμοποιήθηκαν περισσότερο ήταν εκείνοι που διέθεταν αυτό το εργαλείο και μάλιστα η αναζήτηση με OCR χρησιμοποιούταν για να επαληθευτούν οι ημερομηνίες των αναζητούμενων γεγονότων, ώστε να αναζητηθούν αργότερα οι ημερομηνίες αυτές σε άλλους τίτλους πιο ενδιαφέροντες για τον ερευνητή. Επιπλέον, όταν οι χρήστες εξοικειώθηκαν με τη χρήση του εργαλείου, ήταν σε θέση να σχεδιάσουν προφίλ αναζήτησης που ανταποκρίνονταν επαρκώς στις αναζητήσεις τους ελαχιστοποιώντας τα λάθη αναγνώρισης χαρακτήρων. Στη συνέχεια, άρχισαν να ζητούν την ψηφιοποίηση όλου του ιστορικού Τύπου που υπήρχε αποτυπωμένος σε μικροφίλμ και την εφαρμογή OCR για να διευκολυνθεί η αναζήτησή του. Προς ποια κατεύθυνση έπρεπε, λοιπόν, να κινηθούμε, ξεκινώντας το έργο ψηφιοποίησης του ιστορικού Τύπου; Προφανώς επιλέξαμε να εξοπλίσουμε την Ψηφιακή Συλλογή Ημερήσιου και Περιοδικού Τύπου με το μοναδικό εργαλείο αναζήτησης περιεχομένου που μπορούμε να προσφέρουμε στους ερευνητές μας σήμερα. Και παρότι τα αποτελέσματα δεν είναι πάντα ακριβή, εκείνοι μας έδειξαν την ευγνωμοσύνη τους αυξάνοντας τον αριθμό των αναζητήσεών τους και συγχαίροντάς μας για τη δουλειά μας. Το λογισμικό που χρησιμοποιούμε είναι το ABBYY Finereader, το οποίο, όπως διαπιστώσαμε, βελτιώνεται με κάθε νέα έκδοση. Αν και δεν προβήκαμε σε λεπτομερή μελέτη των αποτελεσμάτων από την αναζήτηση μέσω του ΟCR, πραγματοποιήσαμε αυτόματη ανάλυση δείγματος 268.696 σελίδων, από 23 διαφορετικούς τίτλους, στο οποίο οι μηχανές του OCR ανέφεραν ότι αναγνώρισαν 4.000.867.107 χαρακτήρες και θεώρησαν σωστούς ή με πολύ χαμηλό ποσοστό αμφιβολίας 3.459.095.760 χαρακτήρες, δηλαδή ο μέσος όρος σωστών χαρακτήρων είναι 86,46 % επί του συνόλου. Υπολογιζόμενος βάσει της μέσης επιτυχημένης αναγνώρισης ανά σελίδα, ο μέσος όρος ανέρχεται σε 87 %. Από τις τιμές αυτές προκύπτει ότι η ποιότητα της ανάγνωσης είναι σχετικά καλή και λίγο πολύ ομοιογενής σε όλες τις σελίδες. Τα ποσοστά ανά τίτλο κυμαίνονται μεταξύ του 98% για το καλύτερο αποτέλεσμα ανάγνωσης και 82% για το χειρότερο.

MEI, II, Τ. 2, αρ. 2, σελ. 26 Σχ. 3. Αυτόματη ανάλυση του δείγματος OCR (% ανάγνωσης) Παράδειγμα: αποτέλεσμα του OCR σε ιστορική εφημερίδα: Siglo futuro, El (Madrid. 1875). 04/02/1932, αρ. 7544, σελίδα 1. (PDF, 6 σελίδες, ~2 MB.), por- que soy feliz en mi hogar". COMO él señor Unamuno, que de- cía en los pasillos: "Se ha [...] la ley de divorcio no existe; o como si no existiera. Como al isieñor Unamuno, no les importa Σχ. 4. Παράδειγμα: αποτέλεσμα του OCR σε μια ιστορική εφημερίδα 3.2. Πιθανές λύσεις - Διόρθωση με το χέρι με τη βοήθεια επεξεργαστή κειμένου. Αυτή η λύση θα έδινε τα πιο ακριβή αποτελέσματα, αλλά είναι παντελώς ανεφάρμοστη σε μια ψηφιακή συλλογή του μεγέθους της Ψηφιακής Συλλογής Ημερήσιου και Περιοδικού Τύπου. Μπορεί να χρησιμοποιηθεί μόνο για κάποιον σημαντικό τίτλο με σοβαρά προβλήματα ανάγνωσης εξαιτίας της κακής κατάστασης του πρωτοτύπου. - Εκ νέου επεξεργασία των εικόνων με τις μελλοντικές βελτιωμένες εκδόσεις του λογισμικού, εφόσον αποδειχθεί βάσει αντιπροσωπευτικού δείγματος ότι αποδίδουν καλύτερα αποτελέσματα όσον αφορά στην ανάκτηση του περιεχομένου.

MEI, II, Τ. 2, αρ. 2, σελ. 27 - Άλλες εναλλακτικές λύσεις όπως η συνεργατική διόρθωση, με τη συμμετοχή των ερευνητών που χρησιμοποιούν την εφαρμογή, μοιάζουν ιδιαίτερα πολύπλοκες σήμερα, αλλά θα μπορούσαν να αποτελέσουν επιλογή στο μέλλον. 4. Υπηρεσία προστιθέμενης αξίας Πέρα από το περιεχόμενο και τις λύσεις αναζήτησης, η Ψηφιακή Συλλογή Ημερήσιου και Περιοδικού Τύπου στηρίζεται σε μια σειρά εργαλείων και υπηρεσιών που προσφέρουν προστιθέμενη αξία στην αναζήτηση δημοσιευμάτων του ισπανικού ιστορικού Τύπου και την μετατρέπουν σε πύλη αναφοράς για τους ερευνητές, όπως: - Βιβλιογραφικός κατάλογος: Οι ψηφιοποιημένες εικόνες συνοδεύονται από σύνδεσμο με τον κατάλογο της Βιβλιοθήκης, όπου μπορεί κανείς να βρει την τυποποιημένη βιβλιογραφική τους καταχώριση και όλες τις συλλογές, τόσο πρωτότυπες όσο και αντίγραφα, του εν λόγω τίτλου που υπάρχουν στη Βιβλιοθήκη. Επίσης είναι δυνατή η πρόσβαση στις ψηφιοποιημένες εικόνες μέσω του βιβλιογραφικού μητρώου του καταλόγου. - Περιγραφή δημοσιεύσεων: Οι ψηφιοποιημένες δημοσιεύσεις συνοδεύονται από σύντομη παρουσίαση, όπου εξηγείται η σημασία της δημοσίευσης, η ιστορία της και ο ρόλος που διαδραμάτισε στην εποχή της, στοιχεία που μπορούν να φανούν πολύ χρήσιμα για την πραγματοποίηση συγκρίσεων με τις πληροφορίες που περιέχονται σε άλλους τίτλους διαφορετικής ιδεολογίας. - Άλλες ψηφιακές συλλογές ημερήσιου και περιοδικού Τύπου: Η Ψηφιακή Συλλογή Ημερήσιου και Περιοδικού Τύπου διαθέτει κατάλογο συνδέσμων προς τις κύριες ισπανικές ψηφιακές συλλογές ημερήσιου και περιοδικού Τύπου με μια σύντομη παρουσίασή τους και πληροφορίες για τους πόρους τους. - Κατάλογος σημερινών ηλεκτρονικών εφημερίδων: Στην ιστοσελίδα της Βιβλιοθήκης υπάρχει κατάλογος με τους συνδέσμους προς όλους τους τίτλους ισπανικού Τύπου που διατίθενται σήμερα στο Διαδίκτυο. - SFX και ηλεκτρονικοί πόροι: Μέσω του διαχειριστή ηλεκτρονικών πόρων SFX μπορούμε να εντοπίσουμε τις σημερινές ηλεκτρονικές εφημερίδες και περιοδικά που είναι διαθέσιμα στις πολυάριθμες βάσεις δεδομένων στις οποίες μπορεί κανείς να έχει πρόσβαση μέσω της ιστοσελίδας της Βιβλιοθήκης. - Ευρωπαϊκά προγράμματα: Η Ψηφιακή Συλλογή Ημερήσιου και Περιοδικού Τύπου ως τμήμα της Ψηφιακής Βιβλιοθήκης Ισπανόφωνου Πολιτισμού (Biblioteca Digital Hispánica) συμμετέχει στο πρόγραμμα Europeana και σε σειρά άλλων έργων που υλοποιούνται στο πλαίσιο του The European Library, γεγονός που θα της επιτρέψει στο μέλλον να μοιράζεται τους πόρους της με τις κυριότερες ευρωπαϊκές ψηφιακές βιβλιοθήκες και θα καταστήσει δυνατή την πραγματοποίηση ταυτόχρονων αναζητήσεων στις ψηφιακές συλλογές τους.