Εφαρµογές Τεχνολογιών Γλωσσικής Επεξεργασίας στα Συστήµατα Αναζήτησης των Ελληνικών Ακαδηµαϊκών Βιβλιοθηκών



Σχετικά έγγραφα
Εφαρµογές Τεχνολογιών Γλωσσικής Επεξεργασίας στα Συστήµατα Αναζήτησης των Ελληνικών Ακαδηµαϊκών Βιβλιοθηκών

clarin:el δημιουργώ, επεξεργάζομαι, μοιράζομαι Στέλιος Πιπερίδης, Πένυ Λαμπροπούλου, Μαρία Γαβριηλίδου Ε.Κ. Αθηνά / ΙΕΛ

ανοιχτά γλωσσικά δεδομένα: η υποδομή γλωσσικών πόρων και υπηρεσιών clarin:el

Εννοιολογική Διεύρυνση Ερωτημάτων με τη Χρήση Θησαυρού: μια εμπειρική μελέτη

Το µάθηµα Ηλεκτρονική ηµοσίευση

Το µάθηµα Ψηφιακές Βιβλιοθήκες

Εθνική Πολιτική Ανοικτής Πρόσβασης στην Επιστημονική Πληροφόρηση. Ειρήνη Κυριάκου Λειτουργός Προγραμματισμού

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ:

Οριζόντια και Κάθετες ράσεις Ψηφιακών Βιβλιοθηκών

Ψηφιακά Αποθετήρια: Η Ελληνική Πραγματικότητα

από αναπτυξιακά προγράμματα στους οργανισμούς πληροφόρησης»

Γλωσσικη τεχνολογια. Προεπεξεργασία Κειμένου

Ευρετήριο Ελληνικών Ψηφιακών Πηγών: Εργαλείο καταγραφής, ενημέρωσης, συντονισμού και αξιολόγησης των ψηφιακών πρωτοβουλιών

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Υλοποίηση συστημάτων ανοικτής πρόσβασης στο Εθνικό Κέντρο Τεκμηρίωσης

Σημασιολογική Ολοκλήρωση Δεδομένων με τη χρήση Οντολογιών

Tεχνολογίες της Πληροφορίας. Ιόνιο Πανεπιστήµιο Τµήµα Αρχειονοµίας Βιβλιοθηκονοµίας ΜΑΘΗΜΑ 1

Τμήμα Βιβλιοθηκονομίας & Συστημάτων Πληροφόρησης από το 1984

Γεωγραφικά Πληροφοριακά Συστήµατα (Geographical Information Systems GIS)

«Παρατηρήσεις και προβλήµατα. Παντελής Α. Μπράττης Βιβλιοθηκονόµος Τεχνική Υποστήριξη ΣΚΕΑΒ

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Προεπεξεργασία Κειμένου

ΕΚΠΑΙΔΕΥΤΗΡΙΑ «ΝΕΑ ΠΑΙΔΕΙΑ» Τοµέας Νέων Ελληνικών. ΠΑΝΕΛΛΗΝΙΕΣ ΕΞΕΤΑΣΕΙΣ 2018 Εξεταστέα Ύλη Νεοελληνικής Γλώσσας

ΑΠΟΦΑΣΕΙΣ ΣΥΜΠΕΡΑΣΜΑΤΑ

XΑΡΟΚΟΠΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Η βιβλιοθήκη της Ι.Μ. Ευαγγελισμού της Θεοτόκου

1. Αναθέσεις έργου σε επιστηµονικό προσωπικό στο πλαίσιο εκτέλεσης της πράξης µε τίτλο «Ψηφιακές Υπηρεσίες του ιεθνούς Πανεπιστηµίου της Ελλάδος»

Πίνακας Προτεινόμενων Πτυχιακών Εργασιών

ΕΘΝΙΚΟ ΚΕΝΤΡΟ ΚΟΙΝΩΝΙΚΩΝ ΕΡΕΥΝΩΝ

Αναφορά εργασιών για το δίμηνο Μάϊος Ιούνιος Ανάδοχος. Καμάτσος Παρασκευάς

Γεωµετρία Γ' Γυµνασίου: Παραλληλία πλευρών, αναλογίες γεωµετρικών µεγεθών, οµοιότητα

Γλώσσα και Γλωσσική Τεχνολογία στην Ελλάδα

Η Τεχνολογία στις Συνεργασίες των Βιβλιοθηκών

Περιεχόµενα. Πληροφοριακά Συστήµατα: Κατηγορίες και Κύκλος Ζωής. Π.Σ. ιαχείρισης Πράξεων. Π.Σ. ιοίκησης. Κατηγορίες Π.Σ. Ο κύκλος ζωής Π.Σ.

Τρίτη 5 Μάρτιου Οι Ανθρωπιστικές και Κοινωνικές Επιστήμες στην Ψηφιακή Εποχή

ΤΕΤΡΑ ΙΑ ΑΝΑΛΥΣΗΣ Ε ΟΜΕΝΩΝ, ΤΕΥΧΟΣ 15 (σσ ) DATA ANALYSIS BULLETIN, ISSUE 15 (pp ) Ιεραρχική Ανάλυση

Δρ. Εμμανουήλ Γαρουφάλλου. Δρ. Αλέξανδρος Κουλούρης

Εννοιολογική Ομοιογένεια

Επιτυχημένα παραδείγματα. σε ελληνικά αποθετήρια και σχετικά τεχνολογικά εργαλεία

Σύστηµα ιαχείρισης και Ελέγχου των ΕΠ του ΕΣΠΑ

Τι είναι τα Συστήµατα Γεωγραφικών Πληροφοριών. (Geographical Information Systems GIS)

ΙΔΡΥΜΑΤΙΚΑ ΑΠΟΘΕΤΗΡΙΑ (ΙΑ): ΡΟΕΣ ΚΑΤΑΘΕΣΗΣ ΤΕΚΜΗΡΙΩΝ, ΔΙΕΠΑΦΕΣ ΧΡΗΣΤΗ, ΥΠΟΔΟΜΗ

Μάθηµα 3. Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας

Το Εθνικό Κέντρο Τεκμηρίωσης και οι υπηρεσίες του προς την επιστημονική κοινότητα:

ΑΝΑΛΥΣΗ ΠΟΙΟΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Αλλαγή του τρόπου επιστημονικής πληροφόρησης με τη χρήση δημοσιευμάτων ανοιχτής πρόσβασης και ιδρυματικών αποθετηριών

Α/Α Τύπος Εκφώνηση Απαντήσεις Το λογισµικό Άτλαντας CENTENNIA µπορεί να χρησιµοποιηθεί 1. Α) Στην ιστορία. Σωστό το ) Σωστό το Γ)

Ι ΡΥΜΑΤΙΚΑ ΑΠΟΘΕΤΗΡΙΑ (ΙΑ): ΡΟΕΣ ΚΑΤΑΘΕΣΗΣ ΤΕΚΜΗΡΙΩΝ, ΙΕΠΑΦΕΣ ΧΡΗΣΤΗ, ΥΠΟ ΟΜΗ. ηµήτριος Σπανός Άγγελος Αναγνωστόπουλος

ΤΟΥΡΚΙΚΑ ΟΜΗ ΕΞΕΤΑΣΤΙΚΩΝ ΟΚΙΜΙΩΝ Α - ΣΤ ΕΠΙΠΕ Ο

Πίνακας Προτεινόμενων Πτυχιακών Εργασιών

3 Ο ΠΑΝΕΛΛΗΝΙΟ ΦΟΙΤΗΤΙΚΟ ΣΥΝΕ ΡΙΟ ΕΛΛΗΝΙΚΗΣ ΕΤΑΙΡΕΙΑΣ ΕΠΙΧΕΙΡΗΣΙΑΚΩΝ ΕΡΕΥΝΩΝ (Ε.Ε.Ε.Ε.) ΤΙΤΛΟΣ ΣΥΝΕ ΡΙΟΥ:

2, µε τίτλο: «Υλοποίηση Εργαλείων Ανάπτυξης ιαχείρισης Σώµατος Κειµένων και Αυτόµατης Εξαγωγής Ορολογίας».

ΓΕΩΓΡΑΦΟΙ ΣΤΗΝ ΕΛΛΗΝΙΚΗ ΑΓΟΡΑ ΕΡΓΑΣΙΑΣ: ΠΡΟΒΛΗΜΑΤΑ ΚΑΙ ΠΡΟΟΠΤΙΚΕΣ

Από την Διακίνηση της Πληροφορίας ως τα Creative Commons


ΨηφιακόΕλληνικόΠεριεχόμενοκαι Ανοικτή Πρόσβαση

«Περιεχόµενα. 03 Εισαγωγή Ένα ολοκληρωµένο πληροφοριακό σύστηµα. 04 Περιγραφή Εργαλείο εφαρµογής διαδικασιών

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

Ανάπτυξη ψηφιακής βιβλιοθήκης και ιδρυματικού αποθετηρίου στην Κεντρική Βιβλιοθήκη ΕΜΠ

«Η Αξιοποίηση του ΑΒΕΚΤ για τις Βιβλιοθήκες Κυβερνητικών Υπηρεσιών»

Αναφορά εργασιών για το τρίμηνο Σεπτέμβριος Νοέμβριος 2012

Επίδραση Υδατοδιαλυτών Επιφανειοδραστικών στη Ροή Υγρού Υµένα

Αξιολόγηση πληροφοριακών συστηµάτων και υπηρεσιών

Πίνακας Προτεινόμενων Πτυχιακών Εργασιών

Ευρωπαϊκό Κοινωνικό Ταµείο

ΙΑΤΡΟΛΕΞΗ. Neurosoft A.E. --- ΕΑΙΤΥ. ΓΓΕΤ, ΚτΠ, Πρόγραµµα «ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΩΝ, ΗΧΟΥ ΚΑΙ ΓΛΩΣΣΑΣ»

Περιεχόµενα. 1 Tο βιβλίο "µε µια µατιά" Εισαγωγή στη Microsoft Access Γνωριµία µε τις βάσεις δεδοµένων της Access...

ヤ Διδασκαλία της Γλώσσας στις τάξεις Γ & Δ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα. 4o Εργαστήριο Σ.Α.Ε

Η Βιβλιοθήκη του Α.Τ.Ε.Ι.Θ

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ. Σαράντος Καπιδάκης

Αναφορά εργασιών για το τρίμηνο Μάρτιος 2013 Μάιος 2013 Όνομα : Παπαχριστόπουλος Λεωνίδας

Η ΟΡΙΖΟΝΤΙΑ ΠΡΟΤΑΣΗ ΤΩΝ ΕΑΒ στα πλαίσια της ΨΗΦΙΑΚΗΣ ΣΥΓΚΛΙΣΗΣ. Νικόλαος Μήτρου Καθ. ΕΜΠ πρόεδρος ΣΕΑΒ

Ευρωπαϊκό Κοινωνικό Ταµείο

ΧΑΡΟΚΟΠΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΤΕΙ ΘΕΣΣΑΛΟΝΙΚΗΣ

Τύποι πόρων προς συγκέντρωση Σενάρια χρήσης

ΔΙΑΚΗΡΥΞΗ ΤΗΣ ΑΛΑΜΠΡΑ ΓΙΑ ΤΗΝ ΑΝΟΙΚΤΗ ΠΡΟΣΒΑΣΗ

Βιβλιογραφία κοινωνικής έρευνας

ΠΑΝΔΗΜΟΣ Ψηφιακή Βιβλιοθήκη. Οδηγός χρήσης

Α ΤΑΞΗ. 1 η ΕΝΟΤΗΤΑ: Γνωρίζω τον υπολογιστή. Θα παρουσιαστεί µε τρόπο απλό και κατανοητό,

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ & ΕΠΙΧΕΙΡΗΣΕΩΝ

Προγράµµατα σπουδών πληροφορικής στην ανωτάτη εκπαίδευση και χρήση των τεχνολογιών ΤΠΕ ραστηριότητες του τµήµατος Πληροφορικής του ΤΕΙ Αθήνας.

ΠΡΟΣΚΛΗΣΗ ΕΚ ΗΛΩΣΗΣ ΕΝ ΙΑΦΕΡΟΝΤΟΣ ΓΙΑ ΥΠΟΒΟΛΗ ΠΡΟΤΑΣΗΣ ΠΡΟΣ ΣΥΝΑΨΗ ΣΥΜΒΑΣΕΩΝ ΜΙΣΘΩΣΗΣ ΕΡΓΟΥ Ι ΙΩΤΙΚΟΥ ΙΚΑΙΟΥ

ΑΝΑΛΥΣΗ ΠΟΙΟΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ. Γεράσιμος Παπαναστασάτος, Ph.D. Αθήνα, Σεπτέμβριος 2016

ΑΝΑΛΥΣΗ ΠΟΙΟΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01

Software Production Company

Υπηρεσίες Ανοικτής Πρόσβασης. Ηράκλειτος Σουγιουλτζόγλου ΕΚΤ

ΠΡΟΣΩΠΙΚΟ Μόνιμο προσωπικό 8 EE και Λογοθεραπεία 2 Επισκέπτες εκπαιδευτικοί 3

ΠΡΟΓΡΑΜΜΑ ΚΟΙΝΟΤΙΚΗΣ ΡΑΣΗΣ ΓΙΑ ΤΗΝ ΠΑΡΑΚΟΛΟΥΘΗΣΗ ΤΗΣ ΥΓΕΙΑΣ ΠΡΟΓΡΑΜΜΑ ΕΡΓΑΣΙΑΣ ΓΙΑ ΤΟ (Άρθρο 5.2.β) της απόφασης 1400/97/EΚ)

ΠΡΟΓΡΑΜΜΑ ΓΑΛΛΙΚΩΝ ΣΠΟΥΔΩΝ ΓΑΛ 102 Προφορικός λόγος 6 ΓΑΛ 103 Γραπτός λόγος I 6 ΓΑΛ 170 e-french 6 ΓΑΛ Μάθημα περιορισμένης επιλογής 6

ΕΥΡΩΠΑΪΚΗ ΕΝΩΣΗ Ευρωπαϊκό Κοινωνικό Ταµείο ΕΛΛΗΝΙΚΗ ΗΜΟΚΡΑΤΙΑ ΥΠΟΥΡΓΕΙΟ ΠΑΙ ΕΙΑΣ ΙΑ ΒΙΟΥ ΜΑΘΗΣΗΣ & ΘΡΗΣΚΕΥΜΑΤΩΝ

ΚΕΝΤΡΟ ΕΚΠΑΙ ΕΥΣΗΣ ΕΝΗΛΙΚΩΝ ΣΑΜΟΥ. ΙΕΥΘΥΝΣΗ ΚΑΡΜΑΝΙΟΛΩΝ. ΠΟΛΗ ΚΑΡΛΟΒΑΣΙ. Τ.Κ83200 ΤΗΛ , FAX ,

Υπηρεσίες Υποστήριξης, Δικτύωσης, Προδιαγραφών & Πιστοποίησης Ιδρυματικών Αποθετηρίων

Ψηφιακές πηγές για την έρευνα στις Ανθρωπιστικές Επιστήμες

ΜΕΤΑΒΑΤΙΚΕΣ ΠΡΟΫΠΟΘΕΣΕΙΣ ΑΠΟΚΤΗΣΗΣ ΠΤΥΧΙΟΥ

Οι Τεχνολογίες Πληροφορικής Και Επικοινωνιών στον Κλάδο Της Εκπαίδευσης

Μαθηµατική. Μοντελοποίηση

Αυτοαξιολόγηση: (Boud & Donovan, 1982; MacBeath, 1999) εκ των έσω αξιολόγηση της µονάδας Βασικός Στόχος: βελτίωση της µονάδας µέσω µιας συνεχόµενης δι

«ΑΠΟΛΛΩΝΙΣ» Γλωσσικοί πόροι στο ΕΚΠΑ: Υποδομή, χρήση και εργαλεία. Κλεοπάτρα Φέρλα ΕΚΠΑ, 01/03/2019

Transcript:

Εφαρµογές Τεχνολογιών Γλωσσικής Επεξεργασίας στα Συστήµατα Αναζήτησης των Ελληνικών Ακαδηµαϊκών Βιβλιοθηκών Άννα Μάστορα 1, Μανόλης Πεπονάκης 2, Σαράντος Καπιδάκης 1 1 Εργαστήριο Ψηφιακών Βιβλιοθηκών και Ηλεκτρονικής ηµοσίευσης, Τµήµα Αρχειονοµίας - Βιβλιοθηκονοµίας, Ιόνιο Πανεπιστήµιο {mastora, sarantos}@ionio.gr 2 Εθνικό Κέντρο Τεκµηρίωσης, Εθνικό Ίδρυµα Ερευνών epepo@ekt.gr 21 ο Πανελλήνιο Συνέδριο Ακαδηµαϊκών Βιβλιοθηκών 18-19 Οκτωβρίου 2012, Πειραιάς

2 Κίνητρο της έρευνας Έντονη µορφολογία ελληνικής γλώσσας Αυξηµένη χρήση της φυσικής γλώσσας στη διατύπωση ερωτηµάτων Περιορισµένη χρήση ελεγχόµενου λεξιλογίου Ποικιλοµορφία στη διατύπωση του ερωτήµατος από τους χρήστες Ερώτηµα χρήστη ΕΘΝΙΚΟΙ ΡΥΜΟΙ ΕΘΝΙΚΟΣ ΡΥΜΜΟΣ ΕΘΝΙΚΟΣ ΡΥΜΟΣ εθνικος δρυµος Εθνικός ρυµός εθνικός δρυµός Εθνικούς ρυµούς Εθνικούς δρυµούς Εθνικοί δρυµοί Ευρετήριο Εθνικοί δρυµοί Εθνικών δρυµών

3 Γλωσσικές τεχνολογίες Στοχεύουν Αυτόµατη ανάλυση (και ίσως κατανόηση;) & παραγωγή γραπτών ή προφορικών εκφράσεων της φυσικής γλώσσας Πεδία εφαρµογής ιόρθωση ορθογραφικών λαθών, Εκµάθηση γλώσσας υποβοηθούµενη από Η/Υ, Εξαγωγή πληροφορίας, Αυτόµατη περίληψη κειµένου, Ανάκτηση πληροφορίας κτλ.

4 Γλωσσικές τεχνολογίες: Ανάκτηση πληροφορίας Αποκατάληξη (stemming) Ληµµατοποίηση (lemmatisation) ιαχωρισµός λέξεων (tokenisation) ιαχείριση σηµείων στίξης & ανεπιθύµητων λέξεων Ορθογραφικός έλεγχος Εντοπισµός συνωνύµων Μορφολογική & συντακτική ανάλυση Αναγνώριση ονοµατικών οντοτήτων (Named Entity Recognition) ιαχείριση χαρακτήρων: κεφαλαίων πεζών, τονούµενων άτονων

5 Στόχος έρευνας Ανάδειξη πλεονεκτηµάτων εφαρµογής γλωσσικών τεχνολογιών Με έµφαση στην ελληνική γλώσσα Καταγραφή της υφιστάµενης κατάστασης αλλά και των προβληµάτων που προκύπτουν από την έλλειψη διαλειτουργικότητας στις εφαρµογές Με έµφαση στα συστήµατα αναζήτησης των Ελληνικών Ακαδηµαϊκών Βιβλιοθηκών

6 Αντικειµενικοί σκοποί Ανάδειξη αποτελεσµάτων από πειραµατικά δεδοµένα µε εφαρµογή γλωσσικών τεχνολογιών Έρευνα σε Ελληνικές Ακαδηµαϊκές Βιβλιοθήκες και Ιδρυµατικά Αποθετήρια Συγκριτική προσέγγιση ώστε να διαπιστωθεί η διαλειτουργικότητα

7 εδοµένα & εργαλεία πειράµατος ιαπιστώθηκε η χρήση διαφορετικών µορφολογικών τύπων της ελληνικής γλώσσας στην υποβολή των ερωτηµάτων ιαπιστώθηκε αναντιστοιχία µεταξύ όρων ερωτήµατος και όρων ευρετηρίου Αναπτύχθηκε σουίτα εργαλείων Εφαρµογή ad-hoc τεχνολογιών γλωσσικής επεξεργασίας ιαχείριση τονούµενων-άτονων, διαχείριση σηµείων στίξης, µετατροπή χαρακτήρων σε πεζούς ή κεφαλαίους, κτλ υνατότητα χρήσης εξωτερικών εργαλείων Ορθογραφικός έλεγχος (ASpell) -> Βελτίωση* 9,75% Ληµµατοποίηση (ilsp_nlp, από το ΙΕΛ) -> Βελτίωση* 16,7% * Βελτίωση θεωρήθηκε η δυνατότητα ανάκτησης αποτελεσµάτων σε ερωτήµατα που αρχικά είχαν µηδενικά αποτελέσµατα

Ερώτημα Ερώτημα Εθνικός Εθνικός δρυμός δρυμός Εθνικος Εθνικος δρυμος δρυμος ΕΘΝΙΚΟΣ ΕΘΝΙΚΟΣ ΔΡΥΜΟΣ ΔΡΥΜΟΣ ΕΘΝΙΚΟΣ ΕΘΝΙΚΟΣ ΔΡΥΜΜΟΣ ΔΡΥΜΜΟΣ Εθνικοί Εθνικοί δρυμοί δρυμοί Εθνικούς Εθνικούς δρυμούς δρυμούς Μη εφαρμογή ΤΓΕ Αντιστοιχία ερωτήματος με όρους ευρετηρίου Όροι Όροι ευρετηρίου ευρετηρίου Εθνικοί Εθνικοί δρυμοί δρυμοί Εθνικών Εθνικών δρυμών δρυμών 8 Ορθογραφικός Ορθογραφικός έλεγχος έλεγχος Εθνικός Εθνικός δρυμός δρυμός ΕΘΝΙΚΌΣ ΕΘΝΙΚΌΣ ΔΡΥΜΌΣ ΔΡΥΜΌΣ Εθνικοί Εθνικοί δρυμοί δρυμοί Εθνικούς Εθνικούς δρυμούς δρυμούς Λημματοποίηση Λημματοποίηση ΕΘΝΙΚΌΣ ΕΘΝΙΚΌΣ ΔΡΥΜΌΣ ΔΡΥΜΌΣ Εθνικός Εθνικός δρυμός δρυμός Ληµµατοποίηση είναι η αναγωγή ενός όρου στον πρώτο κλιτικό του τύπο. Πρόκειται, επί της ουσίας, για τη µορφή του όρου όπως συναντάται στα ερµηνευτικά λεξικά. Λημματοποίηση Λημματοποίηση Εθνικός Εθνικός δρυμός δρυμός Κεφαλαία Κεφαλαία Άτονα Άτονα ΕΘΝΙΚΟΣ ΕΘΝΙΚΟΣ ΔΡΥΜΟΣ ΔΡΥΜΟΣ Αντιστοιχία ερωτήματος με όρους ευρετηρίου Κεφαλαία Κεφαλαία Άτονα Άτονα ΕΘΝΙΚΟΣ ΕΘΝΙΚΟΣ ΔΡΥΜΟΣ ΔΡΥΜΟΣ

9 Συµπεράσµατα εφαρµογής ΤΓΕ Οι διαφορετικοί κλιτικοί τύποι ενός όρου µπορεί να επηρεάσουν σηµαντικά την απόδοση της ανάκτησης πληροφορίας Εκ πρώτης όψης οι ΕΤΓΕ φαίνεται να είναι κάτι που µπορεί να βοηθήσει πολύ, ωστόσο, δεν υπάρχει ουσιαστική χρήση τους από τα συστήµατα αναζήτησης ελληνικού περιεχοµένου εδοµένης της ύπαρξης εργαλείων και τεχνικών που θα µπορούσαν να συµβάλουν αποφασιστικά στην ανάπτυξη των υπηρεσιών αναζήτησης είναι σηµαντικό να διερευνηθούν οι δυνατότητες συνέργιας στο πλαίσιο διεπιστηµονικής προσέγγισης του θέµατος

10 Οι γλωσσικές τεχνολογίες στα συστήµατα αναζήτησης των Ακαδηµαϊκών Βιβλιοθηκών Επιλέξαµε: εκείνα τα ιδρύµατα που είχαν δηµόσιο κατάλογο (OPAC) και διέθεταν επίσης Ιδρυµατικό Αποθετήριο Εξετάσαµε: τα συστήµατα αναζήτησης των παραπάνω ιδρυµάτων ώστε να καταγραφεί η κατάσταση σχετικά µε την εφαρµογή Τεχνολογιών Γλωσσικής Επεξεργασίας

Κατανοµή συστηµάτων που εξετάστηκαν 6 5 4 3 2 1 0 11 Horizon Aleph Advance Opacial Dspace CDS-WARE Fedora Keystone OPACs Αποθετήρια

OPACs και Εφαρµογές Τεχνολογιών Γλωσσικής Επεξεργασίας 12

Ιδρυµατικά Αποθετήρια και Εφαρµογές Τεχνολογιών Γλωσσικής Επεξεργασίας 13

Συµπεράσµατα ΕΤΓΕ σε συστήµατα Ελληνικών Ακαδηµαϊκών Βιβλιοθηκών Τα συστήµατα αναζήτησης των Ελληνικών Ακαδηµαϊκών Βιβλιοθηκών εφαρµόζουν σε περιορισµένη έκταση γλωσσικές τεχνολογίες τονούµενα-άτονα διαφορετικές πολιτικές τόσο µεταξύ των συστηµάτων κάθε ιδρύµατος όσο και των ιδρυµάτων µεταξύ τους κεφαλαία-πεζά όλα τα συστήµατα αναζήτησης (OPACs & Αποθετήρια) εξισώνουν κεφαλαία-πεζά Εξαίρεση: το τελικό σίγµα «ς»: µη εξίσωση τού «ς» µε το «Σ» ή το «σ» για τους OPACs των βιβλιοθηκών Α,, ΣΤ, Η και στο Αποθετήριο Ε 14

15 Επισήµανση! Η εξίσωση κεφαλαίων-πεζών ή τονούµενωνάτονων χαρακτήρων δεν αποτελεί (πάντοτε) ζητούµενο (τονικά παρώνυµα κτλ.) Αθήνα Αθηνά τσίπουρα τσιπούρα γέρος γερός νόµος - νοµός Μαργαρίτα µαργαρίτα

16 Συµπεράσµατα: σύνοψη Οι γλωσσικές τεχνολογίες µπορούν να έχουν θετικά αποτελέσµατα για την ανάκτηση πληροφοριών από τα συστήµατα αναζήτησης Ώστε να διευκολύνουν το χρήστη στην αναζήτηση Όπως έδειξαν τα αποτελέσµατα της έρευνάς µας, η ληµµατοποίηση µπορεί να παίξει καθοριστικό ρόλο στην ανάκτηση ελληνικού περιεχοµένου Είναι πολύ σηµαντική η χρήση κοινών πολιτικών ώστε να επιτυγχάνεται διαλειτουργικότητα ιαφορετικά, ο χρήστης βρίσκεται στην ίδια (δύσκολη) θέση όπως και χωρίς την εφαρµογή ΤΓΕ

17 Μελλοντική έρευνα Είναι αναγκαία η χρήση (δοκιµή) των εργαλείων και τεχνικών ΕΤΓΕ σε µεγάλο όγκο δεδοµένων ελληνικού περιεχοµένου Ανάγκη απόκτησης δεδοµένωνκαι από ελληνικούς φορείς για επιβεβαίωση των πειραµατικών δεδοµένων οκιµή περισσότερων εργαλείων και πιο εκλεπτυσµένων τεχνικών για πιο στοχευµένη ερµηνεία της πρόθεσης του χρήστη (query intent) Μορφοσυντακτική ανάλυση Αναγνώριση ονοµατικών οντοτήτων Εντοπισµός συνωνύµων, κτλ. Μελέτες συµπεριφοράς χρηστών για εξαγωγήεπιβεβαίωση µοντέλων αναζήτησης πληροφορίας

H παρούσα έρευνα έχει συγχρηµατοδοτηθεί από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταµείο - ΕΚΤ) και από εθνικούς πόρους µέσω του Επιχειρησιακού Προγράµµατος Εκπαίδευση και ια Βίου Μάθηση» του Εθνικού Στρατηγικού Πλαισίου Αναφοράς (ΕΣΠΑ) Ερευνητικό Χρηµατοδοτούµενο Έργο: Ηράκλειτος ΙΙ. Επένδυση στην κοινωνία της γνώσης µέσω του Ευρωπαϊκού Κοινωνικού Ταµείου. 18