Τύποι πόρων προς συγκέντρωση Σενάρια χρήσης

Σχετικά έγγραφα
Τύποι πόρων προς συγκέντρωση Σενάρια χρήσης

«ΑΠΟΛΛΩΝΙΣ» Γλωσσικοί πόροι στο ΕΚΠΑ: Υποδομή, χρήση και εργαλεία. Κλεοπάτρα Φέρλα ΕΚΠΑ, 01/03/2019

clarin:el δημιουργώ, επεξεργάζομαι, μοιράζομαι Στέλιος Πιπερίδης, Πένυ Λαμπροπούλου, Μαρία Γαβριηλίδου Ε.Κ. Αθηνά / ΙΕΛ

ανοιχτά γλωσσικά δεδομένα: η υποδομή γλωσσικών πόρων και υπηρεσιών clarin:el

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ:

25 CLARIN EL: Δημιουργώ, επεξεργάζομαι, μοιράζομαι. CLARIN EL: Creating, processing, sharing. 0 Εισαγωγή

ΓΛΩΣΣΑ & ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΣΤΗΝ ΚΥΠΡΟ

Συχνέ ς Ερωτή σέις Πνέυματικα Δικαιωματα

Οδηγίες για τη Ανάπτυξη Ανοικτών Ψηφιακών Μαθημάτων

Ήλιος: Το ψηφιακό Αποθετήριο Ανοικτής Πρόσβασης του Εθνικού Ιδρύματος Ερευνών

Παρουσίαση Παρεχόμενων Υπηρεσιών Πληροφορικής της DBS AE

Media Monitoring. Ενότητα 2: Η ανάλυση περιεχομένου. Σταμάτης Πουλακιδάκος Σχολή ΟΠΕ Τμήμα ΕΜΜΕ

Οδηγίες για τη Ανάπτυξη Ανοικτών Ψηφιακών Μαθημάτων

7 0 0 /2 /7 0 : 2 1 ( 2 ( Google Yahoo

Οι Ανοικτοί Εκπαιδευτικοί Πόροι του Αποθετηρίου «Κάλλιπος» του ΣEAB: Οφέλη χρήσης και προοπτικές βιώσιμης ανάπτυξης

Παράρτημα Α. Πρότυπα Διάθεσης Ψηφιακών Δεδομένων

Ανοιχτή Διακυβέρνηση. Πρόσβαση και Περαιτέρω Χρήση Δημόσιας Πληροφορίας Η πλευρά του Χρήστη

Διαμοιρασμός δεδομένων & γλωσσικών πόρων: τεχνικά ζητήματα. Πένυ Λαμπροπούλου ΙΕΛ/ΕΚ "ΑΘΗΝΑ"

«ΑΠΟΛΛΩΝΙΣ» Γλωσσικοί πόροι στο ΕΚΠΑ: Υποδομή, χρήση και εργαλεία. Διονύσης Γούτσος ΕΚΠΑ, 01/03/2019

Γλώσσα και Γλωσσική Τεχνολογία στην Ελλάδα

Software Production Company

Γενικές πληροφορίες συλλογής

Τη γλώσσα μου έδωσαν ellhnikh. Μαρία Γαβριηλίδου, ΙΕΛ/ΕΚ Αθηνά Παγκόσμια Ημέρα Μετάφρασης 29 Σεπτεμβρίου 2018, ΕΙΕ

Π1.3.3 Διαδικτυακή Πύλη και εργαλεία υποστήριξης χρηστών. Τεκμηρίωση - Εγχειρίδιο χρήσης.

Θέλετε να διαθέσετε ένα αρχείο στο διαδίκτυο;

DARIAH: Η ψηφιακή τεχνολογία στην υπηρεσία της έρευνας στις ανθρωπιστικές σπουδές και τις τέχνες Ανωτάτη Σχολή Καλών Τεχνών, 26 Ιουνίου 2015

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΨΗΦΙΑΚΕΣ ΒΙΒΛΙΟΘΗΚΕΣ. Σαράντος Καπιδάκης

Η εξέλιξη στα συστήματα Μηχανικής Μετάφρασης

ανθρωπιστικών επιστημών για

ΠΟΛΙΤΙΚΗ ΔΙΑΧΕΙΡΙΣΗΣ ΤΟΥ ΙΔΡΥΜΑΤΙΚΟΥ ΑΠΟΘΕΤΗΡΙΟΥ ΤΟΥ ΤΕΙ ΗΠΕΙΡΟΥ

Τύποι Τεκμηρίων. ΕΚΤ Τύποι Τεκμηρίων

Δημιουργία Ιστορικής Ψηφιακής Βάσης για την Περίοδο : πρακτικές, προβλήματα, προκλήσεις

ΑΝΑΠΤΥΞΗ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ ΨΗΦΙΑΚΩΝ ΣΥΛΛΟΓΩΝ ΕΦΗΜΕΡΙΔΩΝ

ΠΟΛΙΤΙΚΗ ΔΙΑΧΕΙΡΙΣΗΣ ΤΟΥ ΕΡΕΥΝΗΤΙΚΟΥ ΑΠΟΘΕΤΗΡΙΟΥ CRIS (CURRENT RESEARCH INFORMATION SYSTEMS) ΤΟΥ ΤΕΙ ΗΠΕΙΡΟΥ

Εθνική Πολιτική Ανοικτής Πρόσβασης στην Επιστημονική Πληροφόρηση. Ειρήνη Κυριάκου Λειτουργός Προγραμματισμού

ΙΑΤΡΟΛΕΞΗ. Neurosoft A.E. --- ΕΑΙΤΥ. ΓΓΕΤ, ΚτΠ, Πρόγραµµα «ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΩΝ, ΗΧΟΥ ΚΑΙ ΓΛΩΣΣΑΣ»

1 Συστήματα Αυτοματισμού Βιβλιοθηκών

Α. Βαγγελάτος 2, Γ. Ορφανός 2, Χ. Τσαλίδης 2, Χ. Καλαμαρά 3

Διαλειτουργικότητα μεταξύ αρχείων (1/2)

Συμφωνητικό Κατάθεσης Πόρων. 1. Του <Οργανισμού, π.χ. Αστικής Μη Κερδοσκοπικής Εταιρείας> με την επωνυμία., με έδρα την, οδός, με ΑΦΜ και ΔΟΥ

1. Εκπαιδευτικό υλικό... Error! Bookmark not defined. Διάκριση εκπαιδευτικού υλικού... Error! Bookmark not defined.

Ψηφιοποίηση και Ψηφιακή Επεξεργασία Εικόνας

Εφαρµογές Τεχνολογιών Γλωσσικής Επεξεργασίας στα Συστήµατα Αναζήτησης των Ελληνικών Ακαδηµαϊκών Βιβλιοθηκών

Παιδαγωγοί και παιδαγωγική σκέψη στον ελληνόφωνο χώρο (18ος αιώνας Μεσοπόλεμος)

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Οι Ακαδημαϊκές Βιβλιοθήκες στο ψηφιακό περιβάλλον. Από την θεωρία στην πράξη: Η περίπτωση της Βιβλιοθήκης του Πανεπιστημίου Κύπρου

Νομικό πλαίσιο για τη συνεισφορά γλωσσικών δεδομένων ΤΑΤΙΆΝΑ-ΕΛΈΝΗ ΣΥΝΟΔΙΝΟΎ, ΑΝΑΠΛΗΡΏΤΡΙΑ ΚΑΘΗΓΉΤΡΙΑ, ΤΜΉΜΑ ΝΟΜΙΚΉΣ, ΠΑΝΕΠΙΣΤΉΜΙΟ ΚΎΠΡΟΥ

ΠΟΛΙΤΙΚΗ ΔΙΑΧΕΙΡΙΣΗΣ ΤΟΥ ΙΔΡΥΜΑΤΙΚΟΥ ΑΠΟΘΕΤΗΡΙΟΥ ΤΟΥ ΤΕΙ ΗΠΕΙΡΟΥ

Ανοικτά Ακαδημαϊκά Μαθήματα στο Πανεπιστήμιο Αθηνών. Α Κύκλος Εκπαίδευσης Προσωπικού Υποστήριξης (ΠΥ) & 20-22/5/2014

ΠΟΛΙΤΙΚΗ ΓΙΑ ΤΑ ΠΝΕΥΜΑΤΙΚΑ ΔΙΚΑΙΩΜΑΤΑ ΚΑΙ ΤΗΝ ΕΠΑΝΑΧΡΗΣΙΜΟΠΟΙΗΣΗ ΣΤΟΙΧΕΙΩΝ

Ίσως/ Παρατηρήσεις/σχόλια Ακαδημαϊκού λόγου. Υπάρ χουν αμφιβολί ες

Παρουσίαση της απαλλακτικής εργασίας στο μάθημα Νέες Τεχνολογίες στην Επιστημονική Έρευνα: Διαδίκτυο και Εκπαίδευση (Εαρινό 2015)

Εγχειρίδιο Χρήσης Λογισμικού ΙΑ

Περιβάλλον Διαχείρισης Συνεδρίων και άλλων Επιστημονικών Εκδηλώσεων. Πολιτική Χρήσης

ΕΘΝΙΚΟ ΚΕΝΤΡΟ ΚΟΙΝΩΝΙΚΩΝ ΕΡΕΥΝΩΝ

Η Ευρωπαϊκή Υποδομή CLARIN και η Εθνική Υποδομή CLARIN EL

«DARIAH-ΑΤΤΙΚΗ Ανάπτυξη της ελληνικής ερευνητικής υποδομής για τις ανθρωπιστικές επιστήμες ΔΥΑΣ» Αθήνα, 26 Φεβρουαρίου 2015

Αναβάθμιση και εμπλουτισμός ΙδρυματικούΑποθετηρίουΕΜΠ

e-publishing Υπηρεσίες Ηλεκτρονικών εκδόσεων- Τίτλος παρουσίασης epublishing Open Book Press

Τι είδους δεδομένα χρειάζονται; Προκόπης Προκοπίδης ΙΕΛ/ΕΚ «Αθηνά»

Κεφάλαιο 16 Εφαρμογές Αυτοματισμού Γραφείου

01 SOLUTIONS HELLAS Ε.Π.Ε. Χελμού 20, Μαρούσι Αττικής Τηλ FAX Ηλεκτρονικό Πρωτόκολλο & Διακίνηση Εγγράφων

Εθνική Πολιτική Ανοικτής Πρόσβασης στην Κυπριακή Δημοκρατία

Η υπηρεσία αποθετηρίων SaaS του ΕΚΤ

Διαχείριση Επιστημονικών Εκδόσεων. Πολιτική Χρήσης

Κατάλογος Βιβλιοθήκης ΤΕΙ Ηπείρου Ιδρυματικό αποθετήριο ΤΕΙ Ηπείρου Ερευνητικό αποθετήριο ΤΕΙ Ηπείρου:

Ψηφίδες για τη Νεοελληνική Γλώσσα

Αποθετήρια. Κλειώ Σγουροπούλου. Αριστεία ΕΛ/ΛΑΚ ΤΕΙ Αθήνας

Τι είναι το αρχείο Γεωργακά;

Αναζήτηση στον Ιστό. Πληκτρολόγηση του URL: στο πλαίσιο αναζήτησης του Mozilla Firefox. Enter ή κλικ στο Αναζήτηση

Δημιουργία HTML5 Podcasts ΜΑΡΚΟΠΟΥΛΟΣ ΠΑΝΑΓΙΩΤΗΣ

«ΑΠΟΛΛΩΝΙΣ» Γλωσσικοί πόροι στο ΕΚΠΑ: Υποδομή, χρήση και εργαλεία. Ειρήνη Φλώρου ΕΚΠΑ, 01/03/2019

Εθνικό Ίδρυμα Ερευνών

Σύμφωνο Διάθεσης Ανοικτών Ψηφιακών Μαθημάτων (ΑΨΜ)

Αναφορά εργασιών για το τρίμηνο Σεπτέμβριος Νοέμβριος 2012 Όνομα : Μπελούλη Αγάθη

Είδος σήματος Ορισμός Τρόπος απεικόνισης Λεκτικό σήμα Σήμα που συνίσταται αποκλειστικά Για την αναπαράσταση του σήματος

ΙΔΡΥΜΑΤΙΚΟ ΑΠΟΘΕΤΗΡΙΟ Dspace

η εμπειρία του ΤΕΙ Δυτικής Μακεδονίας».

ΑΠΟΓΡΑΦΙΚΟ ΔΕΛΤΙΟ του Εθνικού Αρχείου Διδακτορικών Διατρίβων

Όροι χρήσης Πολιτική Προστασίας Προσωπικών Δεδομένων

ΠΡΟΚΗΡΥΞΗ. 1) Ηλεκτρονική τεκμηρίωση του φωτογραφικού αρχείου του γλύπτη Γ. Παππά (άτομο 1)

ΑΔΑ: 4ΑΡΟ46941Δ-Ε. Συνολικός Προϋπολογισμός Έργου : ΑΝΑΡΤΗΤΕΑ ΣΤΟ ΙΑ ΙΚΤΥΟ 137/

Ημερομηνία Παράδοσης: 4/7/2013

2, µε τίτλο: «Υλοποίηση Εργαλείων Ανάπτυξης ιαχείρισης Σώµατος Κειµένων και Αυτόµατης Εξαγωγής Ορολογίας».

Αυτόματο Σύστημα Εύρεσης και Κατηγοριοποίησης Ευκαιριών Εργασίας Μηχανικών (ΕΥΡΗΚΑ)

Εργαστηριακό Μέρος του Μαθήματος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ. Κ. Δεμέστιχας, Κ. Κωστοπούλου Εργαστήριο Πληροφορικής Γεωπονικό Πανεπιστήμιο Αθηνών

Δημιουργία ανοικτών μαθημάτων- ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ- ΕΚΚΛΗΣΙΑΣΤΙΚΗ ΑΚΑΔΗΜΙΑ ΘΕΣΣΑΛΟΝΙΚΗΣ ΕΝΗΜΕΡΩΣΗ ΕΞΩΤΕΡΙΚΩΝ ΣΥΝΕΡΓΑΤΩΝ- ΠΝΕΥΜΑΤΙΚΑ ΔΙΚΑΙΩΜΑΤΑ

ΑΝΑΠΤΥΞΗ ΥΠΟΔΟΜΩΝ ΑΝΟΙΚΤΗΣ ΠΡΟΣΒΑΣΗΣ ΙΔΡΥΜΑΤΙΚΟ ΑΠΟΘΕΤΗΡΙΟ «ΟΛΥΜΠΙΑΣ» Διαλειτουργικότητα Ιδρυματικών Αποθετηρίων

ΠΡΟΓΡΑΜΜΑ ΓΑΛΛΙΚΩΝ ΣΠΟΥΔΩΝ ΓΑΛ 102 Προφορικός λόγος 6 ΓΑΛ 103 Γραπτός λόγος I 6 ΓΑΛ 170 e-french 6 ΓΑΛ Μάθημα περιορισμένης επιλογής 6

ΟΜΑΔΑ 4. Ονόματα συμμετεχόντων. Τζουβελέκης Ορέστης Παλιογιάννης Θέμης Κάλλης Θοδωρής Χρυσικός Λάμπρος

Πολιτισμική Τεχνολογία. Πολυμέσα & Διαδίκτυο Παράμετροι Δικαίου Μέρος Α

Κεντρικό Μητρώο Ελληνικών Ανοικτών Μαθημάτων Προδιαγραφές Ανοικτών Μαθημάτων v1.0

Εθνικό Κέντρο Τεκμηρίωσης ΕΙΕ. Copyright 2014 Εθνικό Κέντρο Τεκμηρίωσης Ι EIE

ΜΕΤΑΦΡΑΣΗ ΓΕΝΙΚΩΝ ΚΕΙΜΕΝΩΝ Ι

Προχωρημένα Θέματα Διδακτικής της Φυσικής

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Ιόνιο Πανεπιστήμιο - Τμήμα Αρχειονομίας - Βιβλιοθηκονομίας

Μονάδα Διασφάλισης Ποιότητας Εθνικού & Καποδιστριακού Πανεπιστημίου Αθηνών

Επιχειρησιακές Επικοινωνίες

2.5.1 Χρήση δεξιοτήτων αρχειοθέτησης για τη διατήρηση ενός καθιερωμένου συστήματος

Transcript:

Τύποι πόρων προς συγκέντρωση Σενάρια χρήσης Στέλιος Πιπερίδης Μαρία Γαβριηλίδου Πένυ Λαμπροπούλου Γιούλη Μπακαγιάννη Κανέλλα Πουλή ΙΕΛ /ΕΚ «Αθηνά» 9 Μαρτίου 2015

Τι τύπους πόρων συγκεντρώνουμε; ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 2

Δεδομένα και μεταδεδομένα Δεδομένα: το πρωτογενές γλωσσικό υλικό Μεταδεδομένα: η τεκμηρίωση των δεδομένων με βάση ένα συγκεκριμένο σχήμα περιγραφής Το CLARIN EL συγκεντρώνει τόσο δεδομένα όσο και μεταδεδομένα. ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 3

Οργάνωση του υλικού σε τρεις κατηγορίες Μεταδεδομένα και πόροι στο CLARIN EL Μεταδομένα στο CLARIN EL και οι πόροι διαθέσιμοι από αλλού Μεταδεδομένα στο CLARIN EL, ενώ οι πόροι δεν είναι ψηφιοποιημένοι ή διαθέσιμοι ηλεκτρονικά ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 4

Μεταδεδομένα & πόροι στο CLARIN EL: η βασική κατηγορία το CLARIN EL παρέχει τον πόρο και την τεκμηρίωσή του ο χρήστης μπορεί να ψάξει στον κατάλογο με βάση την τεκμηρίωση του πόρου, να εντοπίσει και να καταφορτώσει τον πόρο ή να χρησιμοποιήσει κάποια υπηρεσία γλωσσικής επεξεργασίας και να πάρει τα αποτελέσματα στον υπολογιστή του. Το CLARIΝ EL φέρει την ευθύνη για τη διάθεση του πόρου, σύμφωνα με τους όρους διάθεσής του όπως καθορίζονται από τον πάροχο. ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 5

Μεταδομένα στο CLARIN EL, αλλά όχι οι πόροι το CLARIN EL παρέχει την τεκμηρίωση του πόρου αλλά όχι τον ίδιο τον πόρο (τον οποίο δεν έχει στα αποθετήριά του) παρέχει απλώς σύνδεσμο για το σημείο όπου βρίσκεται ο πόρος, ο οποίος παρέχεται από άλλη υποδομή ή φορέα το CLARIN EL δεν φέρει καμία ευθύνη για την διαθεσιμότητα του πόρου ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 6

Χωριστός κατάλογος μόνο με μεταδεδομένα ο πόρος δεν είναι διαθέσιμος διαδικτυακά ή δεν είναι καν σε ψηφιακή μορφή, όμως είναι χρήσιμος το CLARIN EL παρέχει την τεκμηρίωση και παραπέμπει στον δημιουργό/διαθέτη του πόρου ΔΕΝ είναι προτεραιότητα του CLARIN EL η συλλογή τέτοιου τύπου υλικού αν κριθεί χρήσιμο να καταγραφεί η ύπαρξή του πόρου, γίνεται τεκμηρίωσή του σε χωριστό κατάλογο "συμπληρωματικού υλικού", ώστε να μην υπάρξει σύγχυση με τους πραγματικούς πόρους ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 7

Προδιαγραφές συγκέντρωσης πόρων ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 8

Το υλικό που συγκεντρώνει το CLARIN EL ψηφιοποιημένα κείμενα γραπτού ή προφορικού (μεταγραμμένου) λόγου ηχητικά αρχεία καταγεγραμμένου προφορικού λόγου βίντεο λεξικά/γλωσσάρια συλλογές κειμένων ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 9

Γλώσσα μονόγλωσσοι (Ελληνικά) δίγλωσσοι ή πολύγλωσσοι (που περιλαμβάνουν Ελληνικά) προτεραιότητα στα Νέα Ελληνικά δεν αποκλείονται παλαιότερες μορφές και διάλεκτοι, απλώς είναι σε χαμηλότερη προτεραιότητα [οι διαθέσιμες ΓΤ είναι για τα ΝΕ!] ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 10

Μέσο Κείμενο Ήχος Βίντεο Εικόνα ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 11

Κειμενικό είδος / επίπεδο λόγου σε οποιοδήποτε τομέα, επίπεδο λόγου ή κειμενικό είδος λογοτεχνία /επιστήμες / τύπος οικείο/επίσημο ύφος άρθρα / μυθιστορήματα /δημόσια έγγραφα / συγγράμματα / επιστολές / αναρτήσεις σε κοινωνικά μέσα δικτύωσης ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 12

Μορφότυποι κειμενικού υλικού txt xml html doc/rtf pdf ppt τελευταία προτεραιότητα: κείμενο σε μορφή εικόνας (tiff, jpg) δακτυλόγραφο & χειρόγραφο ΟΧΙ ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 13

Μορφότυποι ηχητικού υλικού & πολυμεσικού υλικού (βίντεο) Ηχητικό υλικό ηχητικό/ακουστικό αρχείο wav file Mp3 απλή ορθογραφική μεταγραφή από απομαγνητοφώνηση φωνητική μεταγραφή σε IPA Πολυμεσικό υλικό Mp4 avi ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 14

Κωδικοποίηση UTF-8 ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 15

Εικόνα jpg tiff pdf (όχι σκαναρισμένα) φωτογραφίες σκέτες ΟΧΙ φωτογραφίες με λεζάντες ΝΑΙ ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 16

Λεξικά/θησαυροί βέλτιστη επιλογή: το περιεχόμενό τους (=τα λήμματα), ώστε να είναι δυνατόν να αποθηκεύονται και να καταφορτώνονται από το CLARIN σε αυτή την περίπτωση LMF, tbx txt, csv xml, SKOS / RDF λιγότερο επιθυμητή επιλογή: διαθέσιμα μέσω διεπαφής, οπότε τα τεκμηριώνουμε και κάνουμε απλή παραπομπή στο url τους έντυπα: ΟΧΙ, εκτός αν είναι εύκολα μετατρέψιμα σε ηλεκτρονικά επεξεργάσιμη μορφή ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 17

Βάσεις δεδομένων Οι βάσεις δεδομένων αυτές καθαυτές δεν μπορούν να ενταχθούν στο CLARIN EL ως γλωσσικοί πόροι. Ωστόσο, το περιεχόμενό τους μπορεί (κατά περίπτωση). Αν είναι βάσεις δεδομένων με κειμενικό υλικό (π.χ. βιβλιοκριτικές / βιβλιοπαρουσιάσεις) ΝΑΙ, εφόσον μπορούμε να εξαγάγουμε τα κείμενα και να δημιουργήσουμε ένα ενιαίο dataset π.χ. το corpus των βιβλιοπαρουσιάσεων στην περίπτωση αυτή, ισχύουν οι προδιαγραφές για το κειμενικό υλικό. ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 18

Ευαίσθητα δεδομένα Πόροι με προσωπικά δεδομένα: δεκτά αν έχει γίνει ή αν μπορεί να γίνει ανωνυμοποίηση ή αν υπάρχει η γραπτή συγκατάθεση των συμμετεχόντων ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 19

Υπάρχουσες συλλογές κειμένων Προτιμητέα λύση: να τεκμηριωθεί και αποθηκευτεί στο CLARIN EL το περιεχόμενό τους ως ενιαίος (και επεξεργάσιμος από την υποδομή) πόρος, π.χ. Οι δημοσιεύσεις του Χ Τμήματος ή Οι δημοσιεύσεις πάνω στο Χ θέμα Ο αρχικός πόρος εξακολουθεί να διατίθεται όπως και πριν Λιγότερο προτιμητέα λύση: τεκμηρίωση και παραπομπή στο url τους ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 20

Άλλου τύπου υλικό υλικό που δεν εμπίπτει σε αυτές τις κατηγορίες αλλά αξιολογείται ως χρήσιμο μπορεί να εντάσσεται στην κατηγορία των πόρων που έχουν μόνο μεταδεδομένα στο CLARIN με παραπομπή στο url τους ή στην κατηγορία του απλού καταλόγου πληροφοριακού υλικού ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 21

Νομικά ζητήματα Τύποι πόρων και σενάρια χρήσης ΕΚΠΑ, 9.3.2015 22

Ροή νομικών διαδικασιών Καταστατικό Δικτύου Ένταξη Μέλους Δομή Δικτύου και Υποδομής Υποχρεώσεις Μελών και Υποδομής Συμφωνητικό Κατάθεσης Πόρων Υποχρεώσεις Παρόχων και Αποθετηρίων Άδειες Όροι χρήσης πόρων και υπηρεσιών ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 23

Καταστατικό Δικτύου Υπογράφεται μεταξύ των Μελών του Δικτύου Ορίζει τον σκοπό, τις αρχές και τη δομή του Δικτύου Ρυθμίζει τους τύπους, τα δικαιώματα και τις υποχρεώσεις των Μελών Προβλέπει το σχήμα διοίκησης και τα όργανα του Δικτύου ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 24

Συμφωνητικό Κατάθεσης Πόρων νομικό κείμενο το οποίο υπογράφεται μεταξύ Παρόχου και Υποδομής CLARIN EL με το οποίο ο Πάροχος δηλώνει ότι έχει (ή ότι έχει ξεκαθαρίσει) τα δικαιώματα διανοητικής ιδιοκτησίας και διάθεσης του πόρου εξουσιοδοτεί την Υποδομή να συμπεριλάβει τον πόρο στα Αποθετήριά της και να τον διαθέτει σύμφωνα με το σχήμα αδειοδότησης που ο ίδιος έχει επιλέξει και η Υποδομή δεσμεύεται για την απρόσκοπτη διάθεση του πόρου με τους ενδεδειγμένους και συμφωνημένους τρόπους. ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 25

Ζητήματα διάθεσης κάθε πόρος που διατίθεται μέσω CLARIN EL πρέπει να έχει σαφές και ρητό καθεστώς διανοητικής ιδιοκτησίας o πάροχος του πόρου πρέπει να κατέχει τα δικαιώματα διάθεσης (τα οποία βεβαίως διατηρεί) και ορίζει τους όρους με τους οποίους ο πόρος θα διατίθεται μέσω CLARIN EL ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 26

Αρχές διάθεσης στόχος είναι οι πόροι να είναι ελεύθερα διαθέσιμοι για κάθε πόρο παρέχεται μία άδεια χρήσης με ξεκάθαρους όρους ωστόσο, υπάρχει μέριμνα για τον σεβασμό των υφισταμένων πνευματικών δικαιωμάτων των πόρων των διαφορετικών απαιτήσεων των παρόχων ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 27

Κατηγοριοποίηση πόρων CLARIN ανάλογα με τη χρήση ελεύθερα διαθέσιμοι (Publicly Available) Creative Commons 0 ή Open Database License (ODbL) για ακαδημαϊκή / ερευνητική χρήση χρήση υπό περιορισμούς πρόσθετοι περιορισμοί ηθικού χαρακτήρα ή σχετικοί με προστασία δεδομένων ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 28

Ζητήματα διανοητικής ιδιοκτησίας και αδειοδότησης Οι πρότυπες άδειες χρήσης του CLARIN EL περιλαμβάνουν άδειες Creative Commons (ξεκινώντας από τις Creative Commons Zero) άδειες META-SHARE No Redistribution, που επιτρέπουν την χρήση και αξιοποίηση πόρων, δίνοντας στον κάτοχο του πόρου πλήρη έλεγχο μέσω της απαγόρευσης της αναδιανομής άδειες CLARIN ERIC άδειες ανοικτού λογισμικού για εργαλεία και υπηρεσίες Θα λαμβάνονται υπόψη οι υπάρχουσες άδειες διάθεσης ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 29

Σενάρια χρήσης γλωσσικών πόρων, τεχνολογιών και υπηρεσιών γλωσσικής επεξεργασίας ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 30

Σενάρια γλωσσικής έρευνας Εντοπισμός φωνημάτων και των συνδυασμών τους σε corpus προφορικού λόγου, είτε στην αρχική του μορφή (ηχητικό υλικό) είτε στην ορθογραφική ή φωνητική του μεταγραφή. Σύγκριση της στατιστικής συχνότητας εμφάνισης κυρίων ονομάτων (τοπωνυμίων, ανθρωπωνυμίων, κτλ.) σε διαφορετικούς πόρους. Εντοπισμός συντακτικών σχημάτων / δομών σε κείμενα. ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 31

Όμως Οι γλωσσικοί πόροι και η γλωσσική τεχνολογία δεν είναι πολύτιμα μόνο για τους γλωσσολόγους ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 32

Σενάριο 1 Θέμα: η μελέτη της άποψης διαφόρων πολιτικών για την κρίση Υλικό: επιλογή πόρου κειμένων που προέρχεται από τον Τύπο Αναζήτηση: δηλώσεων / συνεντεύξεων / άρθρων των συγκεκριμένων πολιτικών με θέμα την κρίση Εντοπισμός του υλικού: με τη βοήθεια γλωσσικών εργαλείων που αναγνωρίζουν λέξεις σχετικές με το θέμα Ανάλυση του υλικού: ποσοτική ανάλυση με στατιστικά εργαλεία ποιοτική ανάλυση με γλωσσικά εργαλεία ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 33

Σενάριο 2 ανάλυση πολιτικού λόγου: συγκέντρωση πολιτικών κειμένων, ηχογραφήσεων & βίντεο από διάφορες πηγές (π.χ. αρχεία πολιτικών ιδρυμάτων, Αρχείο ΕΡΤ, ΕΟΑ, κτλ.) προπαρασκευή για ηχητικά αρχεία: μεταγραφή σε γραπτό λόγο για βίντεο: επισημείωση κινήσεων/χειρονομιών/εκφράσεων λόγου & σχέσεων μεταξύ τροπικοτήτων για κείμενα: λημματοποίηση, μορφοσυντακτική επισημείωση, συντακτική ανάλυση, σημασιολογική επισημείωση (π.χ. λέξεις με συναισθηματικό φόρτο κτλ.) ανάλυση/μελέτη στατιστική επεξεργασία (π.χ. συχνότητα λημμάτων, γραμματικών φαινομένων) μελέτη τροπικοτήτων (π.χ. σύνδεση συγκεκριμένων χειρονομιών με ορισμένη στάση του ομιλητή) δυνατότητα μελέτης διαχρονικά, ανά ομιλητή, σε άλλες γλώσσες ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 34

Σενάριο 3 Θέμα: μελέτη της θέση της γυναίκας στη μεσαιωνική εποχή με βάση τα ιπποτικά έπη και τα ακριτικά τραγούδια. Με τη βοήθεια του εργαλείου εξαγωγής κυρίων ονομάτων ο ερευνητής επιλέγει όλα τα κύρια ονόματα θηλυκού γένους του μορφοσυντακτικού αναλυτή επιλέγει τα επίθετα και τις μετοχές που τα συνοδεύουν του εργαλείου εξαγωγής συμφραστικών πινάκων αντλεί όλες τις προτάσεις που περιλαμβάνουν αυτά τα πρόσωπα. στατιστικών εργαλείων αναλύει ποσοτικά αυτό το σώμα υλικού Αξιολόγηση και ερμηνεία των αποτελεσμάτων των εργαλείων γλωσσικής τεχνολογίας από τον ειδικό ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 35

Σενάριο 4 Θέμα: Μελέτη των κινημάτων του 20 ού αιώνα από υλικό εφημερίδων. Ο μελετητής αναζητά τις οντότητες που εμφανίζονται στα κείμενα (άτομα, κόμματα, οργανώσεις κ.λπ.) με το εργαλείο αναζήτησης ονοματικών οντοτήτων ζητά από την εφαρμογή να του φέρει όλα τα σημεία που εμφανίζονται αυτές οι οντότητες ζητά από την εφαρμογή να κάνει ποσοτική ανάλυση (στατιστική συχνότητα) της εμφάνισης των οντοτήτων αυτών ζητά από την εφαρμογή να κάνει συντακτική ανάλυση των προτάσεων αυτών για να δει τα γεγονότα με τα οποία συνδέεται η κάθε οντότητα (parsing & event extraction) ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 36

Σενάριο 5 Λεξικογραφία: κατάρτιση λημματολογίου & κωδικοποίηση λήμματος επιλογή γλωσσικού υλικού επιλογή από υφιστάμενους πόρους συγκέντρωση νέων κειμένων από διαδίκτυο, για δημιουργία νέου πόρου επεξεργασία με εργαλεία υποδομής λημματοποιητές και μορφοσυντακτικοί επισημειωτές στατιστικά εργαλεία μέτρησης συχνοτήτων εργαλεία δημιουργίας συμφραστικών πινάκων εργαλεία συντακτικής ανάλυσης εργαλεία εξαγωγής ορολογίας από κείμενα ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 37

Σενάριο 6 Αυτόματη εξαγωγή πληροφορίας από επιστημονικές δημοσιεύσεις στην ιατρική ή τη νομική επιστήμη γονίδιο Χ σχετίζεται με ασθένεια Υ νόμος Χ τροποποιεί νόμο Υ Αναζήτηση και ανάκτηση σχετικών δημοσιεύσεων με βάση οντολογίες, θησαυρούς ή λέξεις κλειδιά Αναγνώριση οντοτήτων και σχέσεων μεταξύ τους με χρήση εξειδικευμένων εργαλείων Αναγνώρισης και εξαγωγής ορολογίας Αναγνώρισης και εξαγωγής ονομάτων Αναγνώρισης και εξαγωγής γεγονότων Υπολογισμού των συντακτικών σχέσεων μεταξύ τους ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 38

Σενάριο 7 Εξαγωγή ορολογίας από κείμενα Επιλογή πόρου στον συγκεκριμένο τομέα Λημματοποίηση και μορφοσυντακτική επισημείωση Χρήση εργαλείου εξαγωγής ορολογίας Επεξεργασία καταλόγου όρων από ειδικούς του τομέα για επαλήθευση ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 39

Άλλα σενάρια; Παρουσιάσαμε κάποια από τα σενάρια που έχουν ήδη διατυπωθεί από ερευνητές χρήστες γλωσσικών πόρων και τεχνολογιών Να τα εμπλουτίσουμε σύμφωνα με τις δικές σας ανάγκες; Ποιος είναι ο πόρος που χρειάζομαι; Ποια είναι η υπηρεσία που χρειάζομαι; κίτρινο ροζ Ποιο είναι το σενάριό μου; πράσινο ΕΚΠΑ, 9.3.2015 Τύποι πόρων και σενάρια χρήσης 40