Διαμοιρασμός δεδομένων & γλωσσικών πόρων: τεχνικά ζητήματα. Πένυ Λαμπροπούλου ΙΕΛ/ΕΚ "ΑΘΗΝΑ"



Σχετικά έγγραφα
Getting Data and Language Resources: Technical & Practical Issues

Sharing Data and Language Resources: Technical Aspects and Best Practices. Stelios Piperidis ELRC, ILSP/Athena RC

Sharing Data and Language Resources: Technical Aspects and Best Practices. Stelios Piperidis ELRC, ILSP/Athena RC

Sharing Data and Language Resources: Technical Aspects and Best Practices. Stelios Piperidis ELRC, ILSP/Athena RC

Sharing Data and Language Resources: Technical Aspects and Best Practices. Stelios Piperidis ELRC, ILSP/Athena RC

Τι είδους δεδομένα χρειάζονται; Προκόπης Προκοπίδης ΙΕΛ/ΕΚ «Αθηνά»

Σκοπός και στόχοι της Ημερίδας Εργασίας. Στέλιος Πιπερίδης ELRC, ΙΕΛ/ΕΚ «Αθηνά»

ανοιχτά γλωσσικά δεδομένα: η υποδομή γλωσσικών πόρων και υπηρεσιών clarin:el

Σκοπός και στόχοι της Ημερίδας Εργασίας. Στέλιος Πιπερίδης ELRC, ΙΕΛ/ΕΚ «Αθηνά»

«ΑΠΟΛΛΩΝΙΣ» Γλωσσικοί πόροι στο ΕΚΠΑ: Υποδομή, χρήση και εργαλεία. Κλεοπάτρα Φέρλα ΕΚΠΑ, 01/03/2019

«Μητρώο Ανοικτών Δεδομένων του Δημοσίου» Οδηγός Διαχειριστή Φορέα για το

Εισαγωγή Στόχοι και Όροι χρήσης Προηγούμενη έκδοση υπηρεσίας Ζωντανές μεταδόσεις Εξελιγμένες Υπηρεσίες Βίντεο Βίντεο κατ Απαίτηση Προσωποποιημένες

Τύποι πόρων προς συγκέντρωση Σενάρια χρήσης

Ανοιχτά Κυβερνητικά Δεδομένα Η οπτική του χρήστη

Νομικό πλαίσιο για τη συνεισφορά γλωσσικών δεδομένων ΤΑΤΙΆΝΑ-ΕΛΈΝΗ ΣΥΝΟΔΙΝΟΎ, ΑΝΑΠΛΗΡΏΤΡΙΑ ΚΑΘΗΓΉΤΡΙΑ, ΤΜΉΜΑ ΝΟΜΙΚΉΣ, ΠΑΝΕΠΙΣΤΉΜΙΟ ΚΎΠΡΟΥ

clarin:el δημιουργώ, επεξεργάζομαι, μοιράζομαι Στέλιος Πιπερίδης, Πένυ Λαμπροπούλου, Μαρία Γαβριηλίδου Ε.Κ. Αθηνά / ΙΕΛ

Οδηγίες για τη Ανάπτυξη Ανοικτών Ψηφιακών Μαθημάτων

Αναφορά εργασιών για το τρίμηνο Μάρτιος 2013 Μάιος 2013 Όνομα : Παπαχριστόπουλος Λεωνίδας

Ήλιος: Το ψηφιακό Αποθετήριο Ανοικτής Πρόσβασης του Εθνικού Ιδρύματος Ερευνών

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ:

Υλοποίηση συστημάτων ανοικτής πρόσβασης στο Εθνικό Κέντρο Τεκμηρίωσης

Οδηγίες για τη Ανάπτυξη Ανοικτών Ψηφιακών Μαθημάτων

Τύποι πόρων προς συγκέντρωση Σενάρια χρήσης

Εθνικό Κέντρο Τεκμηρίωσης

Ερευνητικό Αποθετήριο Πανεπιστημίου Πειραία

Υπηρεσίες Ανοικτής Πρόσβασης. Ηράκλειτος Σουγιουλτζόγλου ΕΚΤ

Χτίζοντας την ΕΚΕ από..μέσα προς τα έξω! 2013 Grant Thornton International Ltd. All rights reserved.

Ερευνητικό Αποθετήριο ΤΕΙ Ηπείρου. Οδηγίες κατάθεσης δημοσίευσης στο σύστημα Ερευνητικού Αποθετηρίου CRIS

Ανοιχτή Διακυβέρνηση. Πρόσβαση και Περαιτέρω Χρήση Δημόσιας Πληροφορίας Η πλευρά του Χρήστη

COMMUNICATING CULTURE WITH AN INTEROPERABLE PLATFORM FOR CREATIVE REUSE OF DIGITAL CULTURAL HERITAGE

Εθνική Πολιτική Ανοικτής Πρόσβασης στην Κυπριακή Δημοκρατία

25 CLARIN EL: Δημιουργώ, επεξεργάζομαι, μοιράζομαι. CLARIN EL: Creating, processing, sharing. 0 Εισαγωγή

Υπηρεσίες Ψηφιακής Βιβλιοθήκης Ανοικτής Πρόσβασης Ε.Μ.Π.

Content Provider Dashboard Διαλειτουργικότητα αποθετηρίων και εμπλουτισμός περιεχομένου

Οργάνωση επιστηµονικού, ηλεκτρονικού περιοδικού µε τη χρήση του Λογισµικού Open Journal System

Εθνική Πολιτική Ανοικτής Πρόσβασης στην Επιστημονική Πληροφόρηση. Ειρήνη Κυριάκου Λειτουργός Προγραμματισμού

Αποθετήριο ΕΛ/ΛΑΚ

Η χρήση των wikis στις βιβλιοθήκες: δημιουργία "διαδραστικών" συλλογώναποθετηρίων. Το wiki της Βιβλιοθήκης του Μουσείου Μπενάκη.

Μεταφορές - Ναυτιλία

Παρουσίαση Παρεχόμενων Υπηρεσιών Πληροφορικής της DBS AE

7 0 0 /2 /7 0 : 2 1 ( 2 ( Google Yahoo

Υπέρτιτλος. Ονομα. ιδιότητα Αθήνα, Ημ/νια

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΝΑΥΤΙΛΙΑΚΩΝ ΣΠΟΥΔΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗ ΝΑΥΤΙΛΙΑ

Ανοικτή Πρόσβαση στο Πρόγραμμα «Ορίζοντας 2020»

ΕΠΙΜΕΛΕΙΑ ΕΚΘΕΣΕΩΝ. Τι είναι μία έκθεση;

Τι είναι η Ψηφιακή Υποδοµή DARIAH-GR. Ελένη Κατσιαδάκη Ακαδηµία Αθηνών, 8 Απριλίου 2014

μοντέλα για βιώσιμη ανάπτυξη και ενίσχυση της επιχειρηματικότητας

Ψηφιοποίηση και Ψηφιακή Επεξεργασία Εικόνας

HI CARE Ltd, is a company of European standards that begun its operation in 1992 and since then successfully

Ανοιχτά Οικονοµικά εδοµένα

Νομικό Πλαίσιο για την παροχή και συνεισφορά Δεδομένων

Ανάπτυξη Οντολογικής Γνώσης για Τεκμηρίωση Οπτικοακουστικού Περιεχομένου ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

TEC610 Δυναμικές Εφαρμογές Διαδικτύου (ΣΤ εξάμηνο)

Δίνοντας προστιθέμενη αξία στα δεδομένα ενός αποθετηρίου δεδομένων μέσω του Moodle. Άννα Μοσχά / Ε.ΔΙ.Π στο Κέντρο Η/Υ του Ε.Μ.Π

Θεματική Ενότητα: Εκπαιδευτικό Λογισμικό. Αποθετήρια & Ανοικτοί Εκπαιδευτικοί Πόροι Ανάλυση εφαρμογής

Π1.3.3 Διαδικτυακή Πύλη και εργαλεία υποστήριξης χρηστών. Τεκμηρίωση - Εγχειρίδιο χρήσης.

Πρόεδρος, GS1 Association - Greece GS1 Association - Greece

Πρόσβαση στην πληροφορία και ανοιχτά κυβερνητικά δεδομένα Αικατερίνη Γιαννουκάκου Βιβλιοθηκονόμος MSc, ΥΔ Πανεπιστήμιο Μακεδονίας Ομάδα Δικαίου

Υποδομή και Υπηρεσίες για την Συνεργατική Ανάπτυξη & Ανάδειξη του Ελληνικού Ψηφιακού Πολιτιστικού Αποθέματος

Σχεδιασμός και Υλοποίηση ενός πληροφοριακού συστήματος για τους τεχνικούς του φυσικού αερίου

H Περαιτέρω Χρήση Πληροφοριών του Δημόσιου Τομέα

Ευρωπαϊκά έργα για την ανάδειξη και τις e υποδομές πολιτιστικού περιεχομένου: η συμβολή της ΔΙΠΤ. Διεύθυνση Πληροφορικής & Τηλεπικοινωνιών

...στις µέρες µας, όσο ποτέ άλλοτε, οι χώρες καταναλώνουν χρόνο και χρήµα στη µέτρηση της απόδοσης του δηµόσιου τοµέα...(oecd)

Σύνθεση ενός Fire-fighting robot. Ζαχιώτης Γεώργιος. Λέσχη Ρομποτικής

Εθνικό Κέντρο Τεκμηρίωσης ΕΙΕ. Copyright 2014 Εθνικό Κέντρο Τεκμηρίωσης Ι EIE

ΕΛΛΗΝΙΚΆ ΑΚΑΔΗΜΑΪΚΆ ΗΛΕΚΤΡΟΝΙΚΆ ΣΥΓΓΡΆΜΜΑΤΑ ΚΑΙ ΒΟΗΘΉΜΑΤΑ

ΔΙΑΔΙΚΑΣΙA ΜΕΤΑΦΟΡΑΣ ΥΛΙΚΟΥ ΜΑΘΗΜΑΤΟΣ ΑΠΟ BLACKBOARD VISTA ΣΕ MOODLE

Π3.11 Εκπαιδευτικό Υλικό. (Υπηρεσία Ενημέρωσης για Εκπαιδευτικές και Πολιτισμικές Δράσεις)

Χρήση, προώθηση και συνεισφορά ΕΛ/ΛΑΚ από το ΕΚΤ

ΑΔΑ: ΒΕ54Φ-ΩΔΨ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ

Διαχειριστείτε τις καταθέσεις (Manage deposits)

Πρακτική Εφαρμογή του Προγράμματος Σπουδών Επιπέδου Α' στην Διδασκαλία της Ελληνικής Γλώσσας. Στέφανος Παπαζαχαρίας

XΑΡΟΚΟΠΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ. Επιμέλεια Εκθέσεων

G. Kokkinankis, E. Dermatas, E. Coutsogeorgopoulos

ΠΡΟΓΡΑΜΜΑΤΙΚΗ ΣΥΜΦΩΝΙΑ ΠΛΑΙΣΙΟ ΣΥΝΕΡΓΑΣΙΑΣ

Ενισχύοντας το οικοσύστημα της ανοικτής γνώσης στη χώρα

Δεδομένα στην πράξη. Μιχάλης Βαφόπουλος, vafopoulos.org. ΕΚΕΦΕ Δημόκριτος και ODI ΕΕΛΛΑΚ

Πανεπιστήμιο Πειραιώς Τμήμα Πληροφορικής Πρόγραμμα Μεταπτυχιακών Σπουδών «Πληροφορική»

Επιτυχημένα παραδείγματα. σε ελληνικά αποθετήρια και σχετικά τεχνολογικά εργαλεία

Microsoft EXCEL ΛΟΓΙΣΤΙΚΑ ΦΥΛΛΑ ECDL. Περιεχόμενα. Απόκτησε τώρα το δίπλωμα. για να θεωρείσαι Επαγγελματίας! 1 Χρήση της Εφαρμογής.

Title. Συνέργειες για την εξωστρέφεια και την καινοτομία των επιχειρήσεων. Sub-title. 5 Μαρτίου 2015 Ημερίδα εξωστρέφειας

Χρήση html editor. Περιεχόμενα. 1. Εισαγωγή/διαμόρφωση κειμένου.

Εφαρµογές Τεχνολογιών Γλωσσικής Επεξεργασίας στα Συστήµατα Αναζήτησης των Ελληνικών Ακαδηµαϊκών Βιβλιοθηκών

1η Ηµερίδα Ενηµέρωσης για τη δράση Ελληνικά Ακαδηµαϊκά Ηλεκτρονικά Συγγράµµατα και Βοηθήµατα

ΕΙΣΑΓΩΓΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ ΠΛΗΡΟΦΟΡΙΚΗΣ

Η Ιταλία όπως μας την αφηγείται η θάλασσα.

Ref.: SLWS 1 5Copyright 2005 The European Computer Driving Licence Foundation Ltd Σελίδα 1 από 7

ΟΔΗΓΟΣ ΧΡΗΣΗΣ ΥΠΗΡΕΣΙΑΣ [ΥΠΗΡΕΣΊΑ 7 - ΥΠΗΡΕΣΊΑ

Εργαστήριο Σημασιολογικού Ιστού

Ευκαιρίες και προϋποθέσεις για τον κλάδο ΤΠΕ στο Ανοικτό Λογισμικό. Δρ. Βασίλης Χρηστίδης Διευθύνων Σύμβουλος Knowledge Broadband Services AE

ΕΠΕΞΕΡΓΑΣΙΑ ΚΕΙΜΕΝΟΥ

Π2.2.1 Έγγραφο σχεδίασης των εφαρμογών του υποσυστήματος για την υποβολή, προβολή και παραμετροποίηση του ψηφιακού περιεχομένου

Διαλειτουργικότητα μεταξύ αρχείων (1/2)

Χρήση, προώθηση και συνεισφορά ΕΛ/ΛΑΚ από το ΕΚΤ

ΕΓΧΕΙΡΙΔΙΟ ΜΑΘΗΤΗ. της Πλατφόρμας Τηλεκατάρτισης

Τη γλώσσα μου έδωσαν ellhnikh. Μαρία Γαβριηλίδου, ΙΕΛ/ΕΚ Αθηνά Παγκόσμια Ημέρα Μετάφρασης 29 Σεπτεμβρίου 2018, ΕΙΕ

Ανοικτή Πρόσβαση στο Πρόγραμμα «Ορίζοντας 2020»

Linked Heritage Kick-off meeting Rome, 29/4/2011

Επεξεργασία Κειμένου (Word Processing)

Transcript:

Διαμοιρασμός δεδομένων & γλωσσικών πόρων: τεχνικά ζητήματα Πένυ Λαμπροπούλου ΙΕΛ/ΕΚ "ΑΘΗΝΑ"

Επισκόπηση Γνωρίζετε ήδη Τι είδους δεδομένα χρειάζονται από προηγούμενη συνεδρία Μοντέλο που βασίζεται στα Δεδομένα (Data Driven Paradigm) Χρειαζόμαστε δεδομένα στην ελληνική αλλά και σε όλες τις γλώσσες Πού μπορούμε να εντοπίσουμε δεδομένα: σε Φορείς του Δημοσίου Ορατά Δεδομένα, π.χ. διαδίκτυο (σελίδες HTML, αναφορές, κτλ.) Κρυμμένα/Αόρατα Δεδομένα: αρχεία/συλλογές, κρυμμένο διαδίκτυο (deep web), εσωτερικά αποθετήρια φορέων Μέσω των Παρόχων Γλωσσικών Υπηρεσιών με τους οποίους συνεργάζεστε 2

Ροή εργασίας για τη συλλογή & επεξεργασία των δεδομένων Δεδομένα Γλωσσικοί Πόροι (ΓΠ) Αλυσίδα αξίας Εντοπισμός & επιλογή δεδομένων Βασική τεκμηρίωση Καθαρισμός & μετατροπές (περιεχόμενο, αρχείο) Έλεγχος & αξιολόγηση Επεξεργασία των ΓΠ (π.χ. στοίχιση) Περιγραφή & Αποθήκευση των ΓΠ Έλεγχος νομικών ζητημάτων Market knowledge ΠΔΤ (PSI) ή Αδειοδότηση Επεξεργασία προσωπικών δεδομένων (ανωνυμοποίηση) Μεταφόρτωση δεδομένων στο Αποθετήριο & Διαμοιρασμός Industry network Συνεργασία Συνεργασία Συνεργασία ELRC / ΕΕ 3

Θέματα προς εξέταση (1) Εντοπισμός & επιλογή δεδομένων Έλεγχος νομικών ζητημάτων Βασική τεκμηρίωση ΠΔΤ (PSI) ή Αδειοδότηση Εντοπισμός πηγών Εντοπισμός και επιλογή συνόλων δεδομένων (μη επεξεργασμένων) Έλεγχος νομικών θεμάτων Άδεια χρήσης Διαχείριση προσωπικών & ευαίσθητων δεδομένων Έλεγχος τεχνικών θεμάτων Επιλογή μορφοτύπων των "μη επεξεργασμένων" δεδομένων Τεκμηρίωση των δεδομένων με την ελάχιστη βασική πληροφορία (Τίτλος, Γλώσσες, Θεματικά πεδία, ) Συνεργασία Market knowledge Industry network 4

Νομικά θέματα Θέματα που επηρεάζουν τη διαδικασία συλλογής δεδομένων εξ ορισμού ανοιχτά δεδομένα, π.χ. ΠΔΤ δεδομένα για τη χρήση των οποίων απαιτείται αίτηση Θέματα αδειοδότησης μπορούμε να σας βοηθήσουμε στις διαδικασίες πρότυπες άδειες χρήσης Κυβερνητικές Ανοιχτές Άδειες (Government Open Licenses) Πρότυπες Άδειες Επαναχρησιμοποίησης Διαλειτουργικότητα αδειών 5

Δεδομένα σε ψηφιακή μορφή και σε κάθε είδους μορφότυπο!! Προτιμητέα μορφότυπα: αυτά που μπορούν να χρησιμοποιηθούν από τα εργαλεία επεξεργασίας και την πλατφόρμα CEF.AT) 6

Θέματα προς εξέταση (2) Καθαρισμός & Μετατροπές (περιεχόμενο, αρχείο) Τεχνικά θέματα "Καθαρισμός" των αρχείων μετατροπή χαρακτήρων σε κωδικοποίηση UTF8 αφαίρεση μορφοποίησης (π.χ. εντολών για έντονα γράμματα / πλαγιογράμματα, γραφικών, πινάκων, διαφημίσεων, ετικετών html Επεξεργασία προσωπικών δεδομένων (ανωνυμοποίηση) κτλ.) Μετατροπή των αρχείων στο απαιτούμενο / κατάλληλο μορφότυπο (π.χ. μετατροπή σε XML, XLIFF κτλ.) Ανωνυμοποίηση δεδομένων (αν και όπου χρειάζεται και, βεβαίως, αν Market knowledge Συνεργασία είναι εφικτό) Industry network 7

Παράδειγμα μορφοποίησης Greece is a place of culture, the arts and sciences. Its tradition of contribution to global cultural and scientific communities, combined with its outstanding natural beauty and excellent infrastructure, has made it an ideal place in which to hold conferences. Over the last few years, Greece has more and more Greece is a place of culture, the arts and frequently welcomed people of letters, sciences and the arts, who sciences. Its tradition of contribution to have participated in symposia, conferences and exhibitions. Athens global cultural and scientific communities, International Airport Eleftherios Venizelos, one of the most modern combined with its outstanding natural airports in the world in operation since 2001, greatly boosted the beauty and excellent infrastructure, has organization of international conferences. made it an ideal place in which to hold conferences. Over the last few years, Greece has more and more frequently welcomed people of letters, sciences and the arts, who have participated in symposia, conferences and exhibitions. Athens International Airport Eleftherios Venizelos, one of the most modern airports in the world in operation since 2001, greatly boosted the organization of international conferences. Η Ελλάδα αποτελεί έναν χώρο πολιτισμού, τέχνης και επιστημών. Η μακραίωνη συμβολή της στο παγκόσμιο γίγνεσθαι, σε συνδυασμό με το μοναδικό φυσικό κάλλος και τις άρτιες υποδομές, την καθιστούν ιδανικό τόπο διεξαγωγής συνεδρίων. Τα τελευταία χρόνια, η ελληνική Η Ελλάδα αποτελεί έναν χώρο πολιτισμού, επικράτεια υποδέχεται όλο και συχνότερα ανθρώπους των τέχνης και επιστημών. Η μακραίωνη γραμμάτων, των επιστημών και των τεχνών, οι οποίοι συμβολή της στο παγκόσμιο γίγνεσθαι, σε συμμετέχουν σε συμπόσια, συνέδρια και εκθέσεις. Ο Διεθνής συνδυασμό με το μοναδικό φυσικό κάλλος Αερολιμένας Αθηνών «Ελευθέριος Βενιζέλος», ένα από τα και τις άρτιες υποδομές, την καθιστούν πλέον σύγχρονα αεροδρόμια παγκοσμίως, ο οποίος ιδανικό τόπο διεξαγωγής συνεδρίων. Τα λειτουργεί από το 2001, έδωσε μεγάλη ώθηση στη τελευταία χρόνια, η ελληνική επικράτεια διοργάνωση διεθνών συνεδρίων. υποδέχεται όλο και συχνότερα ανθρώπους των γραμμάτων, των επιστημών και των τεχνών, οι οποίοι συμμετέχουν σε συμπόσια, συνέδρια και εκθέσεις. Ο Διεθνής Αερολιμένας Αθηνών «Ελευθέριος Βενιζέλος», ένα από τα πλέον σύγχρονα αεροδρόμια παγκοσμίως, ο οποίος λειτουργεί από το 2001, έδωσε μεγάλη ώθηση στη διοργάνωση διεθνών συνεδρίων. 8

Ανωνυμοποίηση δεδομένων Εντοπίζουμε μια μεγάλη πηγή δεδομένων με στοιχεία για άτομα, φορείς κτλ. Μπορούμε πάντοτε να χρησιμοποιήσουμε εργαλεία Αναγνώρισης Ονομάτων (Named Entity Recognizer) για να βρούμε τα (προσωπικά) στοιχεία (ονόματα, τοποθεσίες, ημερομηνίες, πληροφορίες γέννησης, κτλ.), να τα αφαιρέσουμε και να τα αντικαταστήσουμε με σύμβολα Επιβεβαιώνουμε ότι τα αποτελέσματα της επεξεργασίας καλύπτουν τις απαιτήσεις του παρόχου εάν η ανωνυμοποίηση δεν έχει τα απαιτούμενα ποσοστά επιτυχίας, απορρίπτουμε το συγκεκριμένο σύνολο δεδομένων 9

Θέματα προς εξέταση (3) Έλεγχος & Αξιολόγηση Έλεγχος αποτελεσμάτων ανωνυμοποίησης Αξιολόγηση & Έλεγχος ποιότητας των δεδομένων μετά την επεξεργασία (μορφότυπο & περιεχόμενο ΓΠ) αποδοχή / απόρριψη ΓΠ Συνεργασία 10

Θέματα προς εξέταση (4) Επεξεργασία των ΓΠ (π.χ. στοίχιση) Περιγραφή & Αποθήκευση των ΓΠ Προετοιμασία και επεξεργασία των ΓΠ για τα εργαλεία Αυτόματης Μετάφρασης (π.χ. στοίχιση) Τεκμηρίωση ΓΠ (προσθήκη μεταδεδομένων για την περιγραφή του ΓΠ) Μεταφόρτωση του ΓΠ σε ειδικό Αποθετήριο Δεδομένων που υποστηρίζει τον διαμοιρασμό τους Μεταφόρτωση Δεδομένων στο Αποθετήριο & Διαμοιρασμός Market knowledge ELRC / ΕΕ Industry network 11

Θέλουμε τη συμμετοχή σας Γνωρίζετε τα δεδομένα σας και τα ορατά και τα αόρατα Η πρόσβαση στα αρχεία, στο "κρυμμένο" διαδίκτυο δεν είναι δυνατή για τους εκτός του φορέα Δεν ισχύει για όλα τα δεδομένα η οδηγία ΠΔΤ ή κάποια επιτρεπτική άδεια χρήσης Η πρόσβαση σε παράγωγες μορφές (π.χ. PDF) είναι λιγότερο αποδοτική από την πρόσβαση στο περιεχόμενο στην αρχική του μορφή (το οποίο μπορεί να βρίσκεται αποθηκευμένο στα αποθετήρια του φορέα και να έχουν πρόσβαση σε αυτό μόνο οι εργαζόμενοι του φορέα) 12

Δράσεις σε συνεργασία με τους φορείς Εντοπισμός & επιλογή πηγών Εντοπισμός & επιλογή συνόλων δεδομένων (μη επεξεργασμένων) Τα δεδομένα μπορούν να αντληθούν από ορατές πηγές (π.χ. να συλλεχθούν από το διαδίκτυο με αυτόματες μεθόδους) Τα δεδομένα μπορούν να τα προσφέρουν οι ίδιοι οι φορείς του δημοσίου Οι φορείς του δημοσίου μπορούν να ενισχύσουν τον εντοπισμό των ορατών πηγών Οι δράσεις επεξεργασίας που παρουσιάστηκαν μπορούν να γίνουν από κοινού από την κοινοπραξία ELRC και τον πάροχο δεδομένων 13

Ρόλος της κοινοπραξίας ELRC Υποστήριξη σε όλες τις διαδικασίες και σε πρακτικά θέματα με τις ακόλουθες υπηρεσίες ιστότοπος ELRC γραφεία τεχνικής & νομικής υποστήριξης αποθετήριο διαμοιρασμού γλωσσικών πόρων φόρουμ χρηστών 14

Ιστότοπος ELRC Screen shot goes here 15

Ιστότοπος ELRC: Γραφείο υποστήριξης Screen shot goes here 16

Ιστότοπος ELRC: Αποθετήριο Screen shot goes here 17

Ιστότοπος ELRC: Αποθετήριο Screen shot goes here 18

Ιστότοπος ELRC: Φόρουμ χρηστών Screen shot goes here 19

Συμπεράσματα Η αξιοποίηση με τις κατάλληλες προσαρμογές υπαρχόντων δεδομένων (π.χ. μεταφράσεων που έχουν γίνει από ανθρώπους) είναι ο καλύτερος τρόπος βελτίωσης της ποιότητας της Αυτόματης Μετάφρασης Τα μοντέλα που βασίζονται σε Δεδομένα προσφέρουν τον βέλτιστο τρόπο για να αποκτήσουν αξία οι υπάρχοντες πόροι Το ELRC μπορεί να σας βοηθήσει να ελέγξετε την καταλληλότητα των δεδομένων σας (σε οποιαδήποτε φάση) Ας αναγνωρίσουμε και ας δώσουμε στους γλωσσικούς σας πόρους την αξία που πραγματικά έχουν - σχεδιάστε από τώρα ένα Σχέδιο Διαχείρισης Δεδομένων 20