Text. Encoding ncoding Initiativenitiative. επισκόπηση, προβλήματα και εφαρμογές. Λίνα Μπουντούρη

Σχετικά έγγραφα
Text Encoding Initiative: επισκόπηση, προβλήµατα και εφαρµογές. Text Encoding Initiative: review, problems and real world implementations

της πληροφορίας Λίνα Μπουντούρη Εθνικό Κέντρο Τεκμηρίωσης 13ο ΠανελλήνιοΣυνέδριοΑκαδημαϊκών Βιβλιοθηκών - Κέρκυρα 2004

Διαχείριση Πολιτισμικών Δεδομένων

Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών

Ιόνιο Πανεπιστήμιο - Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας

Μάθηµα 6. Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας

ΕΠΛ 012 Εισαγωγή στο Παγκόσμιο Πλέγμα Πληροφοριών

Γλώσσες Σήµανσης (Markup Languages) Τεχνολογία ιαδικτύου και Ηλεκτρονικό Εµπόριο

Μετανάστευση τεκμηρίων από το πρότυπο ΤΕΙΡ3 (SGML) σε Ρ4 (XML) Migration of ΤΕΙ documents from ΤΕΙ Ρ3 (SGML) to P4 (XML) standard

ΑΝΑΠΑΡΑΣΤΑΣΗ ΓΝΩΣΗΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ

Περιεχόμενα. Γαβαλάς Δαμιανός Τρέχον status της HTML

Κείμενο ASCII Unicode - HTML. Κωδικοποίηση ASCII / Unicode HTML

Διαλειτουργικότητα μεταξύ αρχείων (1/2)

Ενιαίο Σύστημα Ψηφιακής Βιβλιοθήκης του Πανεπιστημίου Αθηνών

Ιδρυματικά Καταθετήρια

Σημασιολογικός Ιστός (Semantic Web) - XML

ΜΑΘΗΜΑ 5. Ιόνιο Πανεπιστήµιο - Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας. Tεχνολογίες των Πληροφοριών σε ψηφιακό περιβάλλον: Τα εργαλεία

BibConvert μετατροπές LOM

E-LIS: E-prints για τη Βιβλιοθηκονομία και την Επιστήμη της Πληροφόρησης (ΒΕΠ)

Θεωρητική προσέγγιση του Σημασιολογικού Ιστού στο χώρο της πολιτισμικής πληροφορίας: μία πρότυπη εφαρμογή στη βιβλιοθηκονομία

Ψηφιοποιημένο Αρχείο Ελληνικής Μουσικής Από την απομόνωση στην εποχή των δικτύων και της διάδοσης της πληροφορίας

Η χρήση µεταδεδοµένων στα πολυµέσα: τρόποι εισαγωγής και πεδία εφαρµογής

Έρευνα για την Εξοικείωση των Βιβλιοθηκονόμων των Ελληνικών Ακαδημαϊκών Βιβλιοθηκών με τα Metadata

ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

Βάσεις Δεδομένων ΙΙ. Διάλεξη 5 η XML και ΒΔ στο Διαδίκτυο

ΥΠΗΡΕΣΙΑ «TAXISNET» - ΗΛΕΚΤΡΟΝΙΚΗ ΥΠΟΒΟΛΗ ΤΩΝ ΦΟΡΟΛΟΓΙΚΩΝ ΔΗΛΩΣΕΩΝ ΓΙΑ ΤΟ ΤΜΗΜΑ ΕΣΩΤΕΡΙΚΩΝ ΠΡΟΣΟΔΩΝ ΚΑΙ ΤΗΝ ΥΠΗΡΕΣΙΑ ΦΟΡΟΥ ΠΡΟΣΤΙΘΕΜΕΝΗΣ ΑΞΙΑΣ ΤΟΥ

Σχεδιασμός του Ολοκληρωμένου Συστήματος Ψηφιακής Βιβλιοθήκης του Πανεπιστημίου Αθηνών

Σήμανση και Μορφοποίηση: HTML και CSS

«Μεσολαβητές διασύνδεσης ηλεκτρονικών πηγών πληροφόρησης»

Σχεδίαση και Ανάπτυξη Ιστότοπων

Μεταδεδομένα στο Ψηφιακό περιβάλλον

Σε παγκόσμιο επίπεδο, οιμηχανέςαναζήτησηςτουinternet αναπτύχθηκαν για να κάνουν αναζήτηση πληροφοριών σε πολλαπλές τοποθεσίες ιστού.

example: Αξιοποιώντας την τεχνολογία XML στη διαχείρισης της πληροφορίας example: Exploiting XML technology in information management

Αναφορά εργασιών για το τρίμηνο Ιούνιος Αύγουστος 2013

«Μητρώο Ανοικτών Δεδομένων του Δημοσίου» Οδηγός Διαχειριστή Φορέα για το

Παρουσίαση Παρεχόμενων Υπηρεσιών Πληροφορικής της DBS AE

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

SGML (Standard Generalized Markup Language) HTML (HyperText Markup Language) XML (extensible Markup Language)

Ψηφιακά Αποθετήρια: Η Ελληνική Πραγματικότητα

<address>αδριανείου 2, Νέο Ψυχικό, 11525, Αθήνα</adderss> <address>

«ΑΠΟΛΛΩΝΙΣ» Γλωσσικοί πόροι στο ΕΚΠΑ: Υποδομή, χρήση και εργαλεία. Κλεοπάτρα Φέρλα ΕΚΠΑ, 01/03/2019

Περιεχόμενα. Λίγα λόγια από το συγγραφέα... 7

ΜΑΘΗΜΑ: ΤΕΧΝΟΛΟΓΙΕΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

Ο ΗΓΟΣ ΠΟΛΙΤΙΣΜΙΚΗΣ ΤΕΚΜΗΡΙΩΣΗΣ ΚΑΙ ΙΑΛΕΙΤΟΥΡΓΙΚΟΤΗΤΑΣ

Μαθηματικά Λογισμικά και Γλώσσες Αναπαράστασης Γνώσης

ανθρωπιστικών επιστημών Ηρώ Φραντζή

e-publishing Υπηρεσίες Ηλεκτρονικών εκδόσεων- Τίτλος παρουσίασης epublishing Open Book Press

Γιώργος Χρ. Μακρής. Σύγχρονες Γλώσσες Σήμανσης του Διαδικτύου. Αναπαράσταση Μαθηματικών κειμένων στο διαδίκτυο. Η Γλώσσα MathML

Διαχειριστείτε τις καταθέσεις (Manage deposits)

Σχεδιασμός και Ανάπτυξη Ιστοτόπων. ΕΠΑ.Λ. ΑΛΙΜΟΥ Τομέας Πληροφορικής Κ. Φλώρος

Αναφορά εργασιών για το τρίμηνο Μάρτιος 2013 Μάιος 2013 Όνομα : Παπαχριστόπουλος Λεωνίδας

Εννοιολογική Διεύρυνση Ερωτημάτων με τη Χρήση Θησαυρού: μια εμπειρική μελέτη

Η Βιβλιοθήκη του Α.Τ.Ε.Ι.Θ

ΑΝΑΠΑΡΑΣΤΑΣΗ ΚΕΙΜΕΝΟΥ

Εφαρμογή οnline υπηρεσιών πληροφόρησης στο Σύστημα Βιβλιοθηκών του ΑΠΘ

Αναφορά εργασιών για το τρίμηνο Σεπτέμβριος Νοέμβριος 2012 Όνομα : Μπελούλη Αγάθη

Επιτυχημένα παραδείγματα. σε ελληνικά αποθετήρια και σχετικά τεχνολογικά εργαλεία

ΑΝΑΠΑΡΑΣΤΑΣΗ ΓΝΩΣΗΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος Κεφάλαιο 1 ο Αρχές Διαχείρισης πληροφορίας στον Παγκόσμιο Ιστό... 15

ΕΙΣΑΓΩΓΗ ΣΤΗΝ HTML. Decode, ISSEL. Θεοδόσης Σουργκούνης Αντώνης Χρυσόπουλος Στέλιος Μόσχογλου

Βάσεις ιαδικτύου. Θέματα. Εισαγωγή στην XML. Ευρετήρια για την Ανάκτηση Κειμένων. Ο αλγόριθμος HITS. είναι η XML. Παράδειγμα XML

Προγραμματισμός και Συστήματα στον Παγκόσμιο Ιστό Ενότητα 5: XML. Καθ. Ιωάννης Γαροφαλάκης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

Ανάπτυξη Οντολογικής Γνώσης για Τεκμηρίωση Οπτικοακουστικού Περιεχομένου ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Έρευνα για την προσβασιμότητα των τυφλών και των ατόμων με περιορισμένη όραση στους Δικτυακούς Τόπους των Ελληνικών Ακαδημαϊκών Βιβλιοθηκών

Πολιτισμική Τεχνολογία. Πολυμέσα & Διαδίκτυο Παράμετροι Δικαίου Μέρος Α

Εισαγωγή στην Πληροφορική

Ανίχνευση απαιτήσεων χρηστών για υπηρεσίες ψηφιακών βιβλιοθηκών μέσα από ποιοτικές μεθοδολογικές προσεγγίσεις

Εισαγωγή στον Παγκόσμιο ιστό και στη γλώσσα Html. Χρ. Ηλιούδης

ΚΩΝΣΤΑΝΤΙΝΟΣ ΚΑΒΑΦΗΣ

ΔΙΑΣΥΝΔΕΣΗ ΚΑΙ ΔΗΜΟΣΙΕΥΣΗ ΔΕΔΟΜΕΝΩΝ ΔΗΜΟΣΙΩΝ ΚΑΙ ΙΔΙΩΤΙΚΩΝ ΦΟΡΕΩΝ ΜΕ ΧΡΗΣΗ ΤΗΣ XML

Ανάπτυξη Υπηρεσίας Καταλόγου LDAP με τα στοιχεία του προσωπικού του TEI Πειραιά. Νίκος Πασσαράς. Εισηγητής: Πρεζεράκος Γεώργιος

Επιτυχίες, προβλήματα και ο δρόμος προς τον ψηφιακό μετασχηματισμό. Διομήδης Σπινέλλης, Νίκος Βασιλάκης, Νάνσυ Πουλούδη, Νίκη Τσούμα

Η γλώσσα XHTML: διαφορές με HTML, μετατροπή

ΔΙΑΚΗΡΥΞΗ ΤΗΣ ΑΛΑΜΠΡΑ ΓΙΑ ΤΗΝ ΑΝΟΙΚΤΗ ΠΡΟΣΒΑΣΗ

Η ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΣΤΟ ΣΥΓΧΡΟΝΟ ΠΕΡΙΒΑΛΛΟΝ

ΕΡΓΑΣΤΗΡΙΟ «ΟΙ ΨΗΦΙΑΚΕΣ ΠΗΓΕΣ ΓΝΩΣΗΣ ΚΑΙ Η ΣΥΜΒΟΛΗ ΤΟΥΣ ΣΤΟ ΕΡΓΟ ΤΟΥ ΦΙΛΟΛΟΓΟΥ»

Ι ΡΥΜΑΤΙΚΑ ΑΠΟΘΕΤΗΡΙΑ (ΙΑ): ΡΟΕΣ ΚΑΤΑΘΕΣΗΣ ΤΕΚΜΗΡΙΩΝ, ΙΕΠΑΦΕΣ ΧΡΗΣΤΗ, ΥΠΟ ΟΜΗ. ηµήτριος Σπανός Άγγελος Αναγνωστόπουλος

Ανάπτυξηλογισμικού υλοποίησης του ανοικτού πρότυπου EPCALEv1.1 για εφαρμογές RFID

Αλεξιάδης Γεώργιος (ΠΕ86) -

Σημασιολογικός Ιστός (Semantic Web) - XML

Φύλλο εργασίας για την κωδικοποίηση

ΕΛΛΗΝΙΚΆ ΑΚΑΔΗΜΑΪΚΆ ΗΛΕΚΤΡΟΝΙΚΆ ΣΥΓΓΡΆΜΜΑΤΑ ΚΑΙ ΒΟΗΘΉΜΑΤΑ


7-22 Οκτωβρίου Μία γιορτή δημιουργίας με κώδικα. Europe Code Week

ΙΔΡΥΜΑΤΙΚΑ ΑΠΟΘΕΤΗΡΙΑ (ΙΑ): ΡΟΕΣ ΚΑΤΑΘΕΣΗΣ ΤΕΚΜΗΡΙΩΝ, ΔΙΕΠΑΦΕΣ ΧΡΗΣΤΗ, ΥΠΟΔΟΜΗ

Δρόμοι και τρόποι για τη συνάντηση της βιβλιοθήκης με την ερευνητική/εκπαιδευτική πράξη στις Ψηφιακές Ανθρωπιστικές Σπουδές

ΝΤUA. Τεχνολογία Πολυμέσων

Κέρκυρα, 11 Νοεµβρίου Πρόσκληση συµµετοχής σε οµαδική έκθεση φωτογραφίας µε θέµα "Η δική µου Ιθάκη", στα πλαίσια του project Ιθάκη 2013.

Διατηρώντας Ψηφιακά Τεκμήρια. Κατερίνα Τζάλη Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Βιβλιοθήκη

Ηλεκτρονική διακυβέρνηση στην Ελλάδα Επιτυχίες, προβλήματα και ο δρόμος προς τον ψηφιακό μετασχηματισμό

Βιβλιοθηκονόμος γεωγραφικών συλλογών (GIS Librarian) : υπερβολή ή αναγκαιότητα;

Ανάπτυξη ψηφιακής βιβλιοθήκης και ιδρυματικού αποθετηρίου στην Κεντρική Βιβλιοθήκη ΕΜΠ

ΨΗΦΙΑΚΉ ΠΛΑΤΦΌΡΜΑ ΧΩΡΙΚΏΝ ΔΕΔΟΜΈΝΩΝ ΓΙΑ ΤΗΝ ΤΟΠΙΚΉ ΑΥΤΟΔΙΟΊΚΗΣΗ

ΚΩΔΙΚΟΠΟΙΗΣΗ ONEGEOLOGY - EUROPE ΔΕΔΟΜΕΝΩΝ ΓΙΑ ΤΗΝ ΠΑΡΟΧΗ WMS WFS ΥΠΗΡΕΣΙΩΝ KATA INSPIRE ΜΕ ΒΑΣΗ ΤΟ ΠΡΟΤΥΠΟ GeoSciML 4.0

Πληροφορική Τμήμα Σχεδιασμού & Τεχνολογίας Ξύλου & Επίπλου Αντώνιος Καραγεώργος Ευανθία Τσιλιχρήστου. Μάθημα 5 ο Τεχνολογίες Διαδικτύου: HTML I

Σταύρος Καουκάκης Ευτύχιος Βαβουράκης

ΑΝΑΠΤΥΞΗ ΥΠΟΔΟΜΩΝ ΑΝΟΙΚΤΗΣ ΠΡΟΣΒΑΣΗΣ ΙΔΡΥΜΑΤΙΚΟ ΑΠΟΘΕΤΗΡΙΟ «ΟΛΥΜΠΙΑΣ» Διαλειτουργικότητα Ιδρυματικών Αποθετηρίων

ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΙΣΤΟΣ - XML

Αποθετήρια. Κλειώ Σγουροπούλου. Αριστεία ΕΛ/ΛΑΚ ΤΕΙ Αθήνας

Ιατρική Πληροφορική. Δρ. Π. ΑΣΒΕΣΤΑΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΒΙΟΪΑΤΡΙΚΗΣ ΤΕΧΝΟΛΟΓΙΑΣ Τ.Ε. DICOM Επικοινωνία Γενικά

Transcript:

Text Encoding ncoding Initiativenitiative επισκόπηση, προβλήματα και εφαρμογές Λίνα Μπουντούρη 13ο Πανελλήνιο Συνέδριο Ακαδημαϊκών Βιβλιοθηκών - Κέρκυρα 2004

Πληροφορική για τις Ανθρωπιστικές Σπουδές Προσπάθειες για πρότυπα και εργαλεία Χρήστες με αυξημένες και εξειδικευμένες ανάγκες Ηλεκτρονικό κείμενο Γλώσσες Σήμανσης SGML HTML XML 2

Text Encoding Initiative Πηγές σε μορφή κειμένου TEI: κωδικοποίηση και ανταλλαγή κειμένων TEI Consortium Έκδοση TEI P4 Περιγραφικό Διαχειριστικό Δομικό πρότυπο 3

TEI DTD (P4) 4 Ποικιλία κόμβων Core tag sets: υποχρεωτική χρήση TEI.core.dtd (π.χ. παράγραφος) TEI.header.dtd (μεταδεδομένα TEI εγγράφου) Base tag sets: για συγκεκριμένους τύπους κειμένων TEI.prose, (πεζός λόγος) TEI.verse, (ποίηση) TEI.drama, (θεατρικά έργα) TEI.spoken, (προφορικά κείμενα) TEI.dictionaries, (έντυπα λεξικά) TEI.terminology, (ορολογία)

TEI DTD (P4) 5 Συνδυασμός Base tag sets ετικετών μέσα από: TEI.general TEI.mixed Additional tag sets (π.χ. TEI.linking, TEI.names,dates) User defined tags: δημιουργία, μετατροπή και επέκταση ετικετών TEI Lite DTD

TEI header Βιβλιογραφικές και περιγραφικές πληροφορίες του TEI εγγράφου Ηλεκτρονική σελίδα τίτλου Περιλαμβάνει File Description Encoding Description Profile Description Revision Description 6

TEI header Χρήσιμες πληροφορίες Κοινή βάση με βιβλιοθηκονομικά πρότυπα Διαλειτουργικότητα Δημιουργία βιβλιογραφικής εγγραφής Π.χ. Oxford Text Archive Διαχείριση συλλογών Αναζήτηση, επιλογή και πρόσβαση 7

TEI header Αναλυτικότερα File Description: <title>, <author> <sourcedesc>, <editionstmt> <notesstmt> Πληροφορίες πρόσκτησης και πρόσβασης στο περιγραφόμενο υλικό Εξειδικευμένα σημεία πρόσβασης 8

Εργαλεία 9 Δημιουργία TEI DTD και TEI XML Schema Pizza Chef: TEI P4 (DTD) Roma: TEI P4 και P5 (DTD, Relax NG, W3C Schema) Δημιουργία TEI εγγράφων SGML και XML επεξεργαστές XMetal, Emacs, <oxygen/> Επεξεργαστές κειμένου (π.χ. UltraEdit) SGML και XML βάσεις δεδομένων teipublisher

TEI Πλεονεκτήματα Ανεξάρτητο από πλατφόρμες, συστήματα και εφαρμογές Αξιοποίηση υπαρχόντων τεχνολογιών και εργαλείων extensible Stylesheet Language Δυνατότητα παραμετροποίησης Αυξημένες δυνατότητες αποτύπωσης πληροφοριών 10

Επικαλυπτόμενες ιεραρχίες TEI: κωδικοποίηση κειμένου ως ένα σύνολο ιεραρχιών που δεν επικαλύπτονται Συνύπαρξη πολλαπλών ιεραρχικών δομών Παράδειγμα <l n= 1 >Είπες<quotation>«Θα πάγω σ' άλλη γη, θα πάγω σ' άλλη θάλασσα</l> <l n= 2 >...</l>... <l n= 8 >που τόσα χρόνια πέρασα και ρήμαξα και χάλασα.»</quotation></l> 11

Επικαλυπτόμενες ιεραρχίες Δυσκολίες αποθήκευσης, αναζήτησης ανάκτησης και μορφοποίησης Λανθασμένη απόδοση κόμβων Λύσεις Κενά στοιχεία (Milestones) Τεμαχισμός (Fragmentation) Εικονικά στοιχεία (Virtual elements) TEI Overlapping Markup SIG discussion list 12

Κανόνες περιγραφής TEI Header Έλλειψη καταγραφής δεδομένων Δημιουργία ελλιπών ή λανθασμένων μεταδεδομένων Έλλειψη κανόνων περιγραφής TEI Consortium: δενέχειορίσειπολιτική TEI P5 13

Πληροφορική για τις Ανθρωπιστικές Σπουδές Ελλάδα Ακαδημαϊκή παράδοση και σχετικό υλικό στο χώρο των Ανθρωπιστικών Σπουδών Ελληνικά κείμενα κωδικοποιημένα σε TEI Perseus Digital Library (http://www.perseus.tufts.edu/) EpiDoc (http://www.unc.edu/awmc/epidoc/ ) 14

Παράδειγμα 15 <TEI.2> <teiheader> <filedesc> <titlestmt> <title>τα ποιήματα του Κ.Π. Καβάφη: ηλεκτρονική έκδοση</title> <author> Κ.Π. Καβάφης</author> </titlestmt> <publicationstmt> <publisher>εκδόσεις Ίκαρος</publisher> <date>1966</date> </publicationstmt> </filedesc> </teiheader>

Παράδειγμα 16 <text> <body> <lg type="free"> <l>σα βγεις στον πηγαιμό για την Ιθάκη,</l> <l> να εύχεσαι νάναι μακρύς ο δρόμος,</l> <l> Τους Λαιστρυγόνας και τους Κύκλωπας,</l> <l>τον θυμωμένο Ποσειδώνα μη φοβάσαι,</l> <l>τέτοια στον δρόμο σου ποτέ σου δεν βρεις,</l> <l>αν μέν η σκέψις σου υψηλή, αν εκλεκτή</l>... </lg> </body> </text> </TEI.2>

17 Παράδειγμα

Συμπεράσματα TEI: πρόσβαση και αναζήτηση Ξεπέρασε αρχικό στόχο (ανταλλαγή κειμένων) Μέσο για μόνιμη αποθήκευση κειμένων Ανοικτά ερευνητικά προβλήματα 18