Πανεπιστήμιο Πειραιώς Τμήμα Πληροφορικής Πρόγραμμα Μεταπτυχιακών Σπουδών «Πληροφορική» Μεταπτυχιακή Διατριβή Τίτλος Διατριβής Υπηρεσία Αυτόματης Ανάκτησης Συνδεδεμένης Δομής Θεματικών Επικεφαλίδων μέσω της Βιβλιοθήκης του Κογκρέσου Service Autorecover Structure Linked Subject Headings through the Library of Congress Ονοματεπώνυμο Φοιτητή Καλλιόπη Καναβού Πατρώνυμο Μιλτιάδης Αριθμός Μητρώου ΜΠΠΛ/ 10048 Επιβλέπων Ιωάννης Παπαδάκης, Επ. Καθηγητής
Πίνακας Περιεχομένων 3. Εισαγωγή - Υπηρεσία Ανάκτησης Συνδεδεμένης Δομής Καταλόγου 4. Υπηρεσία Ανάκτησης Συνδεδεμένης Δομής Καταλόγου Στόχος 5. Υπηρεσία Ανάκτησης Συνδεδεμένης Δομής Καταλόγου Τεχνολογίες 6. Ανοικτά Συνδεδεμένα Δεδομένα 4 Αρχές 7. Η βιβλιοθήκη του Κογκρέσου 8. Το πρότυπο Skos 9. Ο πυρήνας του Skos 10. Αρχιτεκτονική 3-Tier 11. 3o Επίπεδο Αποθήκευση Δεδομένων (Back-End) 12. Γράφος 13. Sparql Γλώσσα Επερωτήσεων 14. 2 ο Επίπεδο Εξυπηρετητής (Server) 15. 16. Γλώσσα Προγραμματισμού Python 17. 18. 1o Επίπεδο Εμφάνιση στον πελάτη (Client) 19. Εξυπηρετητής Twisted 20. Λειτουργίες Εξυπηρετητή Twisted 21. Συμπεράσματα 22. Ευχαριστίες
Υπηρεσία Ανάκτησης Συνδεδεμένης Δομής Καταλόγου Αναφέρεται σε μια υπηρεσία διαχείρισης των θεματικών επικεφαλίδων του on-line καταλόγου (Online Public Access Catalog OPAC) μιας βιβλιοθήκης Δίνει τη δυνατότητα στον χρήστη να διαχειρίζεται τις θεματικές επικεφαλίδες της βιβλιοθήκης του Ιονίου Πανεπιστημίου σε πραγματικό χρόνο (on-line) 3
Υπηρεσία Ανάκτησης Συνδεδεμένης Δομής Καταλόγου - Στόχος Στόχος για κάθε μία θεματική επικεφαλίδα της βιβλιοθήκης, ο εντοπισμός των μη καταγεγραμμένων σχέσεων της επικεφαλίδας αυτής με τις υπόλοιπες Χρησιμοποιήθηκε το αποθετήριο των θεματικών επικεφαλίδων της βιβλιοθήκης του Κογκρέσου
Υπηρεσία Ανάκτησης Συνδεδεμένης Δομής Καταλόγου - Τεχνολογίες Γενικά Βασίζεται σε τεχνολογίες του Σημασιολογικού Ιστού Ειδικά Στο κίνημα των Ανοικτών Συνδεδεμένων Δεδομένων
Ανοικτά Συνδεδεμένα Δεδομένα 4 Αρχές Ο όρος συνδεδεμένα δεδομένα αναφέρεται σε ένα σύνολο βέλτιστων πρακτικών για τη δημοσίευση και τη διασύνδεση δομημένων δεδομένων στον παγκόσμιο ιστό. Βασίζονται σε τέσσερις αρχές: Χρησιμοποιήστε μόνιμους προσδιοριστές πόρων (URI) ως ονόματα για τα πράγματα Χρησιμοποιήστε το πρωτόκολλο μεταφοράς υπερκειμένου (HTTP Hypertext Transfer Protocol) μόνιμων προσδιοριστών πόρου, έτσι ώστε να μπορούν να προσπελαστούν αυτά τα ονόματα Όταν κάποιος προσπελαύνει ένα μόνιμο προσδιοριστή πόρου, να παρέχονται χρήσιμες πληροφορίες, χρησιμοποιώντας πρότυπα όπως Sparql (SPARql Query Language for RDF) Να περιλαμβάνονται σύνδεσμοι προς άλλους μόνιμους προσδιοριστές πόρων, έτσι ώστε να μπορούν να ανακαλυφθούν περισσότερα πράγματα
Η βιβλιοθήκη του Κογκρέσου Παρέχει μια μοντέρνα υπηρεσία που βασίζεται στις παραπάνω τέσσερις αρχές Λειτουργεί σε μορφή on- line υπηρεσίας http://id.loc.gov/authorities/ Κάθε μία θεματική επικεφαλίδα προσδιορίζεται από έναν μόνιμο προσδιοριστή ως αναγνωριστικό πόρου Ο μόνιμος προσδιοριστής πόρου αναφέρεται στο απλό σύστημα οργάνωσης γνώσης των θεματικών επικεφαλίδων Skos Το πρότυπο Skos συνδέει τους ευρύτερους (Broader - BT), στενότερους (Narrower - NT) και συναφείς (Related - RT) θεματικούς όρους
Το πρότυπο Skos Χρησιμοποιείται ως ένα σύστημα οργάνωσης γνώσης το οποίο εκφράζει τα αντίστοιχα δεδομένα σε μηχαναγνώσιμη μορφή Τα δεδομένα αυτά μπορούν και ανταλλάσσονται μεταξύ των εφαρμογών και να δημοσιεύονται στο διαδίκτυο Οι έννοιες ταυτίζονται με ενιαία αναγνωριστικά πόρων, επισημαίνονται με λεξιλογικές συμβολοσειρές σε μία ή περισσότερες φυσικές γλώσσες Σημασιολογικά σχετίζονται μεταξύ τους σε άτυπες ιεραρχίες και τα δίκτυα σύνδεσης συγκεντρώνονται σε εννοιολογικά συστήματα
Ο πυρήνας του Skos Τα στοιχεία του μοντέλου δεδομένων Skos αποτελούνται: Κλάσεις Skos:Concept Skos:Collection Skos:CollectableProperty Skos:ConceptScheme Skos:OrderedCollection τύπου rdf:type Ιδιότητες λεξιλογικών ετικετών Skos:prefLabel-preferred label Skos:altLabel alternate label(s) Σημασιολογικές Σχέσεις Ιεραρχικές Μη Ιεραρχικές o Skos:broader Skos:related o Skos:narrower
Αρχιτεκτονική 3- Tier 1 ο Επίπεδο (First Tier) - Εμφάνιση στον πελάτη (Client) 2 ο Επίπεδο (Second Tier) Εξυπηρετητής (Server) 3 ο Επίπεδο (Third Tier) Αποθήκευση Δεδομένων (Back-end)
3 ο Επίπεδο (Third Tier) Αποθήκευση Δεδομένων (Back-end) Απεικόνιση τρίτου επιπέδου Πρωτεύον Αρχείο Excel Back-End Kb Demo Δευτερεύον Αρχείο Excel Turtle <http://id.loc.gov/authorities/sh85136516#concept> <http://www.w3.org/2004/02/skos/core#altlabel> "ΣΥΝΤΕΧΝΙΕΣ"@GR.
Απεικόνιση σε ένα γράφο τις σχέσεις που προκύπτουν από τη θεματική επικεφαλίδα "ΣΥΝΤΕΧΝΙΕΣ"@GR ΣΥΝΤΕΧΝΙΕΣ has:related ΚΕΝΤΡΙΚΑ ΣΥΜΒΟΥΛΙΑ ΕΡΓΑΣΙΑΣ has:broader has:broader has:broader ΚΟΙΝΩΝΙΕΣ has:related ΕΡΓΑΤΙΚΟ ΚΙΝΗΜΑ ΕΝΩΣΕΙΣ ΣΥΛΟΓΟΙ
Sparql Γλώσσα Επερωτήσεων Sparql Query -Kb Demo Sparql Query Kb LCSH ASK WHERE { <http://id.loc.gov/authorities/subjects/sh85006210>?p?o.} Απάντηση από το HTTP4STORE http://localhost:8000/test SELECT?o where { <http://id.loc.gov/authorities/subjects/sh85006210> Skos:broader?o.} Απάντηση από το HTTP4STORE http://83.212.99.113:8089/test/ <?xml version="1.0"?> <sparql xmlns="http://www.w3.org/2005/sparql-results#"> <head> <variable name="o"/> </head> <results> <result> <binding name="o"><uri>http://id.loc.gov/authorities/subjects/sh99002423</uri></binding> </result> <result> <binding name="o"><uri>http://id.loc.gov/authorities/subjects/sh85002415</uri></binding> </result> </results> </sparql>
2 ο Επίπεδο (Second Tier) Εξυπηρετητής (Server) preflabels PC User αρχίζουν από χορ sparql results Twisted Server 4Store
Γλώσσα Προγραμματισμού Python Γλώσσα Υψηλού Επιπέδου Απλή στην εκμάθησή της Αντικειμενοστραφής Διερευνητική Ανοικτού Κώδικα Αφαιρετική Περιγραφή του Αλγόριθμου o Βρες την συνδετική δομή (getsyndeticstructure.py) o Δημιούργησε ένα Sparql ερώτημα για κάθε ένα μόνιμο προσδιοριστή στην εξειδικευμένη βάση localhost:8000/test o Για κάθε ένα από τα παραπάνω αποτελέσματα δημιούργησε ένα sparql ερώτημα για τους ευρύτερους στενότερους και συναφείς θεματικούς όρους από την βιβλιοθήκη του Κογκρέσου http://83.212.99.113:8089 o Για κάθε μία από τις τρεις λίστες (ευρύτερος, πλατύτερος ή συναφής θεματικός όρος) των αποτελεσμάτων που αντιστοιχούν σε ένα μόνιμο προσδιοριστή, βρες αν υπάρχουν τα αποτελέσματα στην εξειδικευμένη τοπική βάση δεδομένων localhost:8000 o Εκτύπωσε τα αποτελέσματα στην οθόνη
1 ο Επίπεδο (First Tier) - Εμφάνιση στον πελάτη (Client) Υπηρεσία Διαχείρισης Θεμάτων
Εξυπηρετητής Twisted Ανοικτού κώδικα Υλοποιημένος σε γλώσσα python Επιτρέπει την ανάπτυξη εφαρμογών μεγάλης κλίμακας Αποτελείται από πάρα πολλές βιβλιοθήκες Στη θύρα (TCP port: 8888) δέχεται κλήσεις HTTP από τον Web Browser: o Σύστημα ελέγχου πληκτρολόγησης (autocomplete control) o Στην συγκέντρωση της συνδετικής δομής της θεματικής επικεφαλίδας
Λειτουργίες Twisted Εξυπηρετητή Αιτήσεις Get twisted-xhr.py Συγκέντρωση της Συνδετικής Δομής
Συμπεράσματα Εργαλεία του Σημασιολογικού Ιστού Αυτοματοποίηση των υπηρεσιών Εξοικονόμηση χρόνου Εξοικονόμηση χώρου Κατάργηση μεγάλων βάσεων δεδομένων Ευελπιστούμε στη μελλοντική επέκταση της υπηρεσίας
Ευχαριστώ!!!! Καλό Καλοκαίρι..