BibConvert μετατροπές LOM

Σχετικά έγγραφα
Δικησοκενηρικά Πληροθοριακά Σσζηήμαηα

Μια εισαγωγή στην XSL

της πληροφορίας Λίνα Μπουντούρη Εθνικό Κέντρο Τεκμηρίωσης 13ο ΠανελλήνιοΣυνέδριοΑκαδημαϊκών Βιβλιοθηκών - Κέρκυρα 2004

Γλώσσες Σήµανσης (Markup Languages) Τεχνολογία ιαδικτύου και Ηλεκτρονικό Εµπόριο

ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΙΣΤΟΣ - XML

Σημασιολογικός Ιστός (Semantic Web) - XML

κεφάλαιο 3 Η ΓΛΩΣΣΑ XML Εισαγωγή

Προγραμματισμός και Συστήματα στον Παγκόσμιο Ιστό Ενότητα 6: XSL. Καθ. Ιωάννης Γαροφαλάκης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

Σχεδίαση Εφαρμογών και Υπηρεσιών Διαδικτύου 12η Διάλεξη: Επανάληψη / Ανακεφαλαίωση

ΑΝΑΠΑΡΑΣΤΑΣΗ ΓΝΩΣΗΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ

ΕΠΛ 012 Εισαγωγή στο Παγκόσμιο Πλέγμα Πληροφοριών

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Πτυχιακή Εργασία. Σχεδιασμός & ανάπτυξη δικτυακής εφαρμογής οργάνωσης και διαχείρισης αεροδρομίου με χρήση λογισμικού ανοιχτού κώδικα

Διαδίκτυο και Εφαρμογές 2η Άσκηση Μετασχηματισμοί XML και XSL. Γιαννέλος Γιάννης ΑΜ: Μαρινέλλης Γιώργος ΑΜ:

Σημασιολογικός Ιστός (Semantic Web) - XML

Σημασιολογικός Ιστός (Semantic Web) - XML

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Κρήτης

Πώς τροποποιούμε το Invenio;

Άσκηση 1. Απάντηση Άσκησης 1

Γιώργος Χρ. Μακρής. Σύγχρονες Γλώσσες Σήμανσης του Διαδικτύου. Αναπαράσταση Μαθηματικών κειμένων στο διαδίκτυο. Η Γλώσσα MathML

ΚΕΦΑΛΑΙΟ Web Services

ΝΤUA. Τεχνολογία Πολυμέσων

Θεματική Ενότητα: Εκπαιδευτικό Λογισμικό. Αποθετήρια & Ανοικτοί Εκπαιδευτικοί Πόροι Ανάλυση εφαρμογής

Θερινό Σχολείο, Ιουλίου slim. Δημοσθένης Νικούδης. Μονάδα Αριστείας ΕΛ/ΛΑΚ ΤΕΙ Αθήνας

Εισαγωγή XML: Extensible Markup Language Ορίστηκε από το WWW Consortium (W3C) ως συµπλήρωµα της HTML. εν σχεδιάστηκε για βάσεις δεδοµένων αλλά για δια

ΝΤUA. Τεχνολογία Πολυμέσων

H εντολή που συσχετίζει ένα αρχείο XML με το αρχείο μορφοποίησης έστω "filename.xsl" είναι :

Ημερομηνία Παράδοσης: 4/4/2013

example: Αξιοποιώντας την τεχνολογία XML στη διαχείρισης της πληροφορίας example: Exploiting XML technology in information management

Μαθηματικά Λογισμικά και Γλώσσες Αναπαράστασης Γνώσης

Εισαγωγή στον Παγκόσμιο ιστό και στη γλώσσα Html. Χρ. Ηλιούδης

Ανάπτυξη Υπηρεσίας Καταλόγου LDAP με τα στοιχεία του προσωπικού του TEI Πειραιά. Νίκος Πασσαράς. Εισηγητής: Πρεζεράκος Γεώργιος

Text. Encoding ncoding Initiativenitiative. επισκόπηση, προβλήματα και εφαρμογές. Λίνα Μπουντούρη

ΥΠΗΡΕΣΙΑ «TAXISNET» - ΗΛΕΚΤΡΟΝΙΚΗ ΥΠΟΒΟΛΗ ΤΩΝ ΦΟΡΟΛΟΓΙΚΩΝ ΔΗΛΩΣΕΩΝ ΓΙΑ ΤΟ ΤΜΗΜΑ ΕΣΩΤΕΡΙΚΩΝ ΠΡΟΣΟΔΩΝ ΚΑΙ ΤΗΝ ΥΠΗΡΕΣΙΑ ΦΟΡΟΥ ΠΡΟΣΤΙΘΕΜΕΝΗΣ ΑΞΙΑΣ ΤΟΥ

Διάλεξη 3η HTML intermediate

Γλωσσική Τεχνολογία. HTML/XML Processing HTTP Services

Παραδοτέο Π2.2 Υπηρεσία σημασιολογικής αντιστοίχισης

Μεταδεδομένα στο Ψηφιακό περιβάλλον

Workshop 5ης εβδομάδας Ο πρώτος μας κριτής

ΚΕΡΑΜΟΠΟΥΛΟΣ ΕΥΚΛΕΙΔΗΣ

Επιστηµονική ραστηριότητα ΠΘ1: Τεχνική Υποστήριξη.

ΜΑΘΗΜΑ 5. Ιόνιο Πανεπιστήµιο - Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας. Tεχνολογίες των Πληροφοριών σε ψηφιακό περιβάλλον: Τα εργαλεία

ΕΙΣΑΓΩΓΗ ΣΤΗΝ HTML. Decode, ISSEL. Θεοδόσης Σουργκούνης Αντώνης Χρυσόπουλος Στέλιος Μόσχογλου

ΕΞΕΤΑΣΤΕΑ ΥΛΗ (SYLLABUS) ADVANCED σχεδιασμός ιστοσελίδας ΕΚΔΟΣΗ 1.0. Σόλωνος 108,Τηλ Φαξ

Παρουσίαση Θερινού Σχολείου. Αριστεία ΕΛ/ΛΑΚ ΤΕΙ Αθήνας

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

3. Επερώτηση XML Εγγράφων: Η Γλώσσα XPath

Περιεχόμενα. Γαβαλάς Δαμιανός Τρέχον status της HTML

ΔΕ10: Πληροφοριακά Συστήματα Διοίκησης IΙ Εργαστήριο # 2

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ & ΤΕΧΝΟΛΟΓΙΑΣ Θ.Ε. ΠΛΗ23 «Τηλεματική, Διαδίκτυα και Κοινωνία»

Παράρτημα Α. Πρότυπα Διάθεσης Ψηφιακών Δεδομένων

JOOMLA CMS ΒΑΣΙΚΗ ΠΑΡΑΜΕΤΡΟΠΟΙΗΣΗ (PART I)

ΣΗΜΑΣΙΟΛΟΓΙΚΟΣ ΙΣΤΟΣ - XML

TCExam Ερευνητικό και Ακαδημαϊκό Ινστιτούτο Τεχνολογίας Υπολογιστών, 2

Προγραμματισμός και Συστήματα στον Παγκόσμιο Ιστό Ενότητα 5: XML. Καθ. Ιωάννης Γαροφαλάκης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

ΤΕΧΝΙΚΕΣ ΠΡΟΔΙΑΓΡΑΦΕΣ WEB SERVICES ΓΙΑ ΔΙΑΣΥΝΔΕΣΗ ΜΕ ΤΟ ΥΦΙΣΤΑΜΕΝΟ ΠΛΗΡΟΦΟΡΙΑΚΟ ΣΥΣΤΗΜΑ

Τα tags μπορούν να εφωλιασθούν δομικά σε οποιοδήποτε βάθος <book> <author> XX </author> </book>

NetBeans και σχετικά προγράμματα. Κακαρόντζας Γεώργιος Κέντρο Αριστείας Ανοιχτού Λογισμικού ΑΠΘ 1ο Θερινό Σχολείο Κώδικα

2. ΕΙΣΑΓΩΓΗ ΣΤΗΝ HTML ΓΙΩΡΓΟΣ ΓΙΑΝΝΑΚΑΚΗΣ, ΜΑΝΩΛΗΣ ΤΣΙΚΝΑΚΗΣ

Αναπαράσταση Γνώσης και Αναζήτηση στον Σηµασιολογικό Ιστό

Μαθησιακά Αντικείμενα

ΔΝΓΔΙΚΣΙΚΔ ΑΠΑΝΣΗΔΙ 3 εο ΓΡΑΠΣΗ ΔΡΓΑΙΑ

Δυναμικές Ιστοσελίδες Εισαγωγή στην Javascript για προγραμματισμό στην πλευρά του client

Ενότητα 3: Τα δεδομένα στο Web. (και η σημασιολογία τους semantics )

Χειμερινό εξάμηνο Διδάσκοντες: Ν. Παπασπύρου, Β. Βεσκούκης, Κ. Σαΐδης

Ιόνιο Πανεπιστήμιο - Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας

Εισαγωγή στην HTML (1)

Θέματα Προγραμματισμού Διαδικτύου ~ MySQL & PHP ~

Αποθετήρια. Κλειώ Σγουροπούλου. Αριστεία ΕΛ/ΛΑΚ ΤΕΙ Αθήνας

Α ΛΥΚΕΙΟΥ - ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΑΪΟΣ 2019 ΕΝΔΕΙΚΤΙΚΕΣ ΕΡΩΤΗΣΕΙΣ ΚΑΤΑΝΟΗΣΗΣ

Ψηφιοποιημένο Αρχείο Ελληνικής Μουσικής Από την απομόνωση στην εποχή των δικτύων και της διάδοσης της πληροφορίας

ΑΣΚΗΣΗ. Δημιουργία Ευρετηρίων Συλλογής Κειμένων

<address>αδριανείου 2, Νέο Ψυχικό, 11525, Αθήνα</adderss> <address>

7-22 Οκτωβρίου Μία γιορτή δημιουργίας με κώδικα. Europe Code Week

ΑΣΚΗΣΗ. Συγκομιδή και δεικτοδότηση ιστοσελίδων

Μπορείτε τα δείτε βιντεάκι με τη διαδικασία εδώ:

«Μητρώο Ανοικτών Δεδομένων του Δημοσίου» Οδηγός Διαχειριστή Φορέα για το

SGML (Standard Generalized Markup Language) HTML (HyperText Markup Language) XML (extensible Markup Language)

Περιεχόμενα. Λίγα λόγια από το συγγραφέα... 7

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος Κεφάλαιο 1 ο Αρχές Διαχείρισης πληροφορίας στον Παγκόσμιο Ιστό... 15

ΤΕΙ ΚΑΒΑΛΑΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΑΣ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΒΙΟΜΗΧΑΝΙΚΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ

Διπλωματική Εργασία Διάθεση πολυμέσων σε ετερογενή δίκτυα κατά

Επιχειρησιακό Πρόγραμμα «Ανταγωνιστικότητα και Επιχειρηματικότητα» Δράση Εθνικής Εμβέλειας «Συνεργασία» «Γεώκλιμα»

ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

ΕΠΛ 003: ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ HTML

(Πρωτόγνωρα) Δεδοµένα για την Οικονοµία

ΤΕΙ ΚΡΗΤΗΣ ΚΕΝΤΡΙΚΗ ΒΙΒΛΙΟΘΗΚΗ. Η χρήση του. Βήμα προς Βήμα

Τεχνικός Εφαρμογών Πληροφορικής

ΠΟΙΟΤΙΚΟΣ ΕΛΕΓΧΟΣ ΤΩΝ ΕΛΛΗΝΙΚΩΝ ΑΠΟΔΟΣΕΩΝ ΣΤΗΝ ΟΡΟΛΟΓΙΚΗ ΒΑΣΗ ΙΑΤΕ ΑΠΘ. 5η ΣΥΝΑΝΤΗΣΗ ΕΛΛΗΝΟΦΩΝΩΝ ΜΕΤΑΦΡΑΣΕΟΛΟΓΩΝ

Χρήσιμες οδηγίες για την πορεία δημιουργίας ιστοσελίδων

ΑΝΑΠΑΡΑΣΤΑΣΗ ΓΝΩΣΗΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ

Μαθηματικά Λογισμικά και Γλώσσες Αναπαράστασης Γνώσης

ΕΙΣΑΓΩΓΗ ΔΕΔΟΜΕΝΩΝ ΑΠΟ EXCEL ΣΤΟ GRETL

Θερινό Σχολείο, Ιουλίου Εισαγωγή στο. Αχιλλέας Πιπινέλης. Μονάδα Αριστείας ΕΛ/ΛΑΚ ΤΕΙ Αθήνας

Με την αλλαγή των μεταβλητών σελιδοποίησης αυτόματα ρυθμίζετε το νέο όριο για τα άρθρα και τα αποτελέσματα αναζήτησης.

Διαλειτουργικότητα μεταξύ αρχείων (1/2)

ΤΕΙ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Ψηφιακή τυπογραφία με δυναμική διαχείριση δεδομένων και χρήση CSS

Βάσεις ιαδικτύου. Θέματα. Εισαγωγή στην XML. Ευρετήρια για την Ανάκτηση Κειμένων. Ο αλγόριθμος HITS. είναι η XML. Παράδειγμα XML

ΑΝΑΠΑΡΑΣΤΑΣΗ ΓΝΩΣΗΣ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ

1. <body> 2. <header> 3. <h1> My Page </h1> 4. </header> 5. <section>

Transcript:

BibConvert μετατροπές LOM Δημοσθένης Νικούδης Μονάδα Αριστείας ΕΛ/ΛΑΚ ΤΕΙ Αθήνας

BibConvert 2 Μετατρέπει μεταδεδομένα από άλλες μορφές σε MARC21 (ή πιο σωστά MARCXML) Command-line tool Δεν έχει web interface Υποστηρίζει 2 modes για τα εισαγόμενα δεδομένα Plain text-oriented mode XML oriented mode

Plain text-oriented mode 3 Το αρχείο με τα εισαγόμενα δεδομένα χωρίζεται με line-breaks σε γραμμές και με κάποιον ειδικό χαρακτήρα (πχ.,) σε στήλες Γνωστότερο format αυτού του τύπου το CSV Comma/Character separated values Μικρό μέγεθος, ελάχιστο περιττό περιεχόμενο Δεν μπορούν εύκολα να μπουν nested data

XML 4 XML σημαίνει Extensible Markup Language Διαδεδομένο πρότυπο Γίνεται parse εύκολα από πολλές βιβλιοθήκες Ως markup language έχει ομοιότητες με την HTML αλλά είναι αυστηρότερη Δε γίνονται parse όλες οι HTML σαν XML Υπάρχουν όμως μορφές (XHTML) που γίνονται

Παράδειγμα XML 5 <?xml version="1.0" encoding="utf-8"?> <lom> <general> <title> <string language="el">η θάλασσα στο έργο του Στράτη Μυριβήλη</string> <string language="en">the sea in his work</string> </title> </general> </lom>

Τι θα κάνουμε 6 Θέλουμε να βρούμε έναν τρόπο να μετατρέπουμε υπάρχοντα δεδομένα με μορφή LOM σε MARCXML ώστε να μπαίνουν στο Invenio Τα δεδομένα LOM που έχουμε είναι σε μορφή XML Από τη στιγμή που θα γίνουν convert με ποιο module θα εισαχθούν στο Invenio;

XSL 7 XSL σημαίνει EXtensible Stylesheet Language Τα tags στην XML δεν είναι predefined μπορούμε να χρησιμοποιήσουμε ότι tag name θέλουμε Αντίθετα, στην HTML πχ. το <table> tag έχει συγκεκριμένη σημασία Αυτό σημαίνει ότι η σημασία του κάθε tag δεν είναι καλά κατανοητή Το XSL αναπτύχθηκε για να μπορούμε να δίνουμε σημασίες σε XML tags είτε βρίσκοντας πληροφορίες σε ένα document είτε μετατρέποντας το σε άλλες μορφές Το XSL περιλαμβάνει τρείς τεχνολογίες: XSLT, Xpath, XSL-FO

XPath 8 Είναι ένα query language που μας βοηθάει να βρίσκουμε πληροφορίες μέσα σε ένα έγγραφο XML. Μια από τις πιο απλές μορφές του είναι: <A> <B> <C>Test</C> </B> </A> Για να βρούμε το περιεχόμενο του C μπορούμε να χρησιμοποιήσουμε αυτό το expression: /A/B/C

XSLT 9 Είναι μια γλώσσα για μετατροπή XML εγγράφων σε άλλες μορφές Στην περίπτωση μας θα κάνουμε μετατροπή από ένα είδος XML σε ένα άλλο Το XSLT ορίζει τους κανόνες με τους οποίους θα γίνει η μετατροπή Η γλώσσα XSLT είναι υποσύνολο της XML Οι κανόνες περιγράφονται με συγκεκριμένα XML tags

Παράδειγμα XLST 10 Έστω ότι έχουμε το παρακάτω XML και θέλουμε να το κάνουμε ένα όμορφο HTML: <?xml version="1.0" encoding="utf-8"?> <catalog> <cd> <title>empire Burlesque</title> <artist>bob Dylan</artist> <country>usa</country> <company>columbia</company> <price>10.90</price> <year>1985</year> </cd> </catalog>

Το περνάμε από το εξής XLST <?xml version="1.0" encoding="utf-8"?> <xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/xsl/transform"> Παράδειγμα XSLT <xsl:template match="/"> <html> <body> <h2>my CD Collection</h2> <table border="1"> <tr bgcolor="#9acd32"> <th>title</th> <th>artist</th> </tr> <xsl:for-each select="catalog/cd"> <tr> <td><xsl:value-of select="title"/></td> <td><xsl:value-of select="artist"/></td> </tr> </xsl:for-each> </table> </body> </html> </xsl:template> 11 </xsl:stylesheet>

12 Ποιο θα είναι το αποτέλεσμα;

Ποιο θα είναι το αποτέλεσμα; 13 <html> <body> <h2>my CD Collection</h2> <table border="1"> <tr bgcolor="#9acd32"> <th>title</th> <th>artist</th> </tr> <tr> <td>empire Burlesque</td> <td>bob Dylan</td> </tr> </table> </body> </html>

Άσκηση 14 Θα φτιάξουμε ένα XSL με όνομα lom2marcxml.xsl που να μετατρέπει τα πεδία title και description από το lom_example.xml σε MARCXML Θα δοκιμάσουμε το XSL που δημιουργήσαμε με την εντολή: bibconvert -clom2marcxml.xsl < lom_example.xml > marcxml_example.xml

Template 15 <?xml version="1.0" encoding="utf-8"?> <xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/xs L/Transform"> <xsl:output method="xml" indent="yes" encoding="utf-8"/> <xsl:template match="/"> Περιεχόμενο εδώ </xsl:template> </xsl:stylesheet>

Αναμενόμενο αποτέλεσμα 16 <?xml version="1.0" encoding="utf-8"?> <record> <datafield tag="245" ind1=" " ind2=" "> <subfield code="a">η θάλασσα στο έργο του Στράτη Μυριβήλη</subfield> </datafield> <datafield tag="500" ind1=" " ind2=" "> <subfield code="a">αυτό το κλιπ εστιάζει στην αγάπη του Μυριβήλη για τη θάλασσα και την κυριαρχική παρουσία της στο έργο του.</subfield> </datafield> </record>

Επιβεβαίωση και ανέβασμα 17 Μπορούμε να ελέγξουμε την ορθότητα του παραγόμενου xml ως MARCXML με το εργαλείο xmlmarclint xmlmarclint --verbose=9 marcxml_example.xml Αν είναι έγκυρο μπορούμε να το ανεβάσουμε στο Invenio με το BibUpload bibupload -i marcxml_example.xml Το BibUpload βάζει το αρχείο σε μια ουρά η οποία καταναλώνεται από ένα άλλο module το BibSched

Επιβεβαίωση και ανέβασμα 18 Σε περίπτωση που δεν τρέχει ο worker του bibsched τον ξεκινάμε με την εντολή: bibsched start Για να βρούμε το id του εγγράφου που ανεβάσαμε μπορούμε να δούμε τα log του BibSched στον φάκελο: /opt/invenio/var/log/bibsched/0 Γιατί δεν εμφανίζεται το νέο έγγραφο στην αναζήτηση; Δεν έχει μπει ακόμα στο index

Χρήσιμα links 19 Xpath tutorial: http://www.w3schools.com/xpath/ Xpath tester: http://www.xpathtester.com/xpath MARC21 tag reference: http://www.loc.gov/marc/bibliographic/ecbdhome.html Έτοιμο xsl από Invenio: https://github.com/inveniosoftware/invenio/blob/ master/modules/bibconvert/etc/crossref2marcxml.xsl

Σας ευχαριστώ πολύ Ερωτήσεις; Μονάδα Αριστείας ΕΛ/ΛΑΚ ΤΕΙ Αθήνας