Europe's Languages in the Digital Age:

Σχετικά έγγραφα
Language Technology for Multilingual Europe

Πανεπιστήμιο Πειραιώς Τμήμα Πληροφορικής Πρόγραμμα Μεταπτυχιακών Σπουδών «Πληροφορική»

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS

Μιχάλης Βαφόπουλος, vafopoulos.org

1 ΚΩΝΣΤΑΝΤΙΝΟΣ Δ. ΤΡΙΤΑΡΗΣ

Προσωπική Aνάπτυξη. Ενότητα 4: Συνεργασία. Juan Carlos Martínez Director of Projects Development Department

The Nottingham eprints service makes this work by researchers of the University of Nottingham available open access under the following conditions.

«ΨΥΧΙΚΗ ΥΓΕΙΑ ΚΑΙ ΣΕΞΟΥΑΛΙΚΗ» ΠΑΝΕΥΡΩΠΑΪΚΗ ΕΡΕΥΝΑ ΤΗΣ GAMIAN- EUROPE

4000 specialists, 600 local points, more than 50 countries in Europe and beyond

GREECE BULGARIA 6 th JOINT MONITORING

Thesis presentation. Turo Brunou

Τι είναι η Ψηφιακή Υποδοµή DARIAH-GR. Ελένη Κατσιαδάκη Ακαδηµία Αθηνών, 8 Απριλίου 2014

Scrum framework: Ρόλοι

Προσωπική Aνάπτυξη. Ενότητα 2: Διαπραγμάτευση. Juan Carlos Martínez Director of Projects Development Department

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS

ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. ΘΕΜΑ: «ιερεύνηση της σχέσης µεταξύ φωνηµικής επίγνωσης και ορθογραφικής δεξιότητας σε παιδιά προσχολικής ηλικίας»

AΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ

ΣΟΡΟΠΤΙΜΙΣΤΡΙΕΣ ΕΛΛΗΝΙΔΕΣ

Ενημερωτική εκδήλωση για τις ερευνητικές υποδομές Δημήτρης Δενιόζος Γενική Γραμματεία Δημοσίων Επενδύσεων και ΕΣΠΑ

(Α.Σ.ΠΑΙ.Τ.Ε.) ΠΑΡΑΔΟΤΕΟ Δ3-5_3 1 ΕΠΙΣΤΗΜΟΝΙΚΗ ΕΡΓΑΣΙΑ ΣΕ ΔΙΕΘΝΕΣ ΕΠΙΣΤΗΜΟΝΙΚΟ ΣΥΝΕΔΡΙΟ. Vocational Technology Enhanced Learning (VocTEL) 2015

Από την ιδέα στο έργο

ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ Α. Διαβάστε τις ειδήσεις και εν συνεχεία σημειώστε. Οπτική γωνία είδησης 1:.

Development and operation of University-Industry Liaison Offices in the Republic of Cyprus: Creating the future Dr Gregory Makrides, Director of

2015 Όλη η Ευρώπη ένας πύργος της Βαβέλ!

Η ΠΡΟΣΩΠΙΚΗ ΟΡΙΟΘΕΤΗΣΗ ΤΟΥ ΧΩΡΟΥ Η ΠΕΡΙΠΤΩΣΗ ΤΩΝ CHAT ROOMS

Phys460.nb Solution for the t-dependent Schrodinger s equation How did we find the solution? (not required)

Προσωπική Aνάπτυξη. Ενότητα 1: Ηγεσία και ενδυνάμωση. Juan Carlos Martínez Director of Projects Development Department

ΠΡΟΓΡΑΜΜΑ IKYDA 2012 PROGRAMME IKYDA 2012

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΓΕΩΤΕΧΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ. Πτυχιακή εργασία

Πώς μπορεί κανείς να έχει έναν διερμηνέα κατά την επίσκεψή του στον Οικογενειακό του Γιατρό στο Ίσλινγκτον Getting an interpreter when you visit your

ΟΙΚΟΝΟΜΟΤΕΧΝΙΚΗ ΑΝΑΛΥΣΗ ΕΝΟΣ ΕΝΕΡΓΕΙΑΚΑ ΑΥΤΟΝΟΜΟΥ ΝΗΣΙΟΥ ΜΕ Α.Π.Ε

UNIVERSITY OF CAMBRIDGE INTERNATIONAL EXAMINATIONS International General Certificate of Secondary Education

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ. Πτυχιακή Εργασία

Σπουδάστρια Δακανάλη Νικολέτα Α.Μ "Πώς η εξέλιξη της τεχνολογίας επηρεάζει την απόδοση των επιχειρήσεων" ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΑΓΩΓΗΣ

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007

Κάθε γνήσιο αντίγραφο φέρει υπογραφή του συγγραφέα. / Each genuine copy is signed by the author.

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ. Πτυχιακή εργασία

1) Abstract (To be organized as: background, aim, workpackages, expected results) (300 words max) Το όριο λέξεων θα είναι ελαστικό.

Ευρωπαϊκός Αριθμός 112.

CSR and Sustainability. Katerina Katsouli CSR & Sustainability Director Grant Thornton Greece

«Έντυπο και ψηφιακό βιβλίο στη σύγχρονη εποχή: τάσεις στην παγκόσμια βιομηχανία».

Μικρομεσαίες Επιχειρήσεις Πληροφορικής Ευκαιρίες Χρηματοδότησης σε Ευρωπαϊκό Επίπεδο

GREECE BULGARIA 6 th JOINT MONITORING

Μεταπτυχιακή διατριβή. Ανδρέας Παπαευσταθίου

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ. Πτυχιακή εργασία

Η Επιτροπή κρίνει ότι ο 112, o ενιαίος ευρωπαϊκός αριθµός έκτακτης ανάγκης πρέπει να γίνει πολύγλωσσος

Policy Coherence. JEL Classification : J12, J13, J21 Key words :

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Ηλεκτρονική Υγεία

ICTR 2017 Congress evaluation A. General assessment

Τ.Ε.Ι. ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΠΑΡΑΡΤΗΜΑ ΚΑΣΤΟΡΙΑΣ ΤΜΗΜΑ ΔΗΜΟΣΙΩΝ ΣΧΕΣΕΩΝ & ΕΠΙΚΟΙΝΩΝΙΑΣ

Ινστιτούτο Βιώσιμης Κινητικότητας & Δικτύων Μεταφορών (Ι.ΜΕΤ):

Advanced Subsidiary Unit 1: Understanding and Written Response

AKAΔΗΜΙΑ ΕΜΠΟΡΙΚΟΥ ΝΑΥΤΙΚΟΥ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΜΗΧΑΝΙΚΩΝ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΘΕΜΑ: Η ΧΡΗΣΗ ΒΙΟΚΑΥΣΙΜΩΝ ΣΤΗΝ ΝΑΥΤΙΛΙΑ ΠΛΕΟΝΕΚΤΗΜΑΤΑ-ΜΕΙΟΝΕΚΤΗΜΑΤΑ ΠΡΟΟΠΤΙΚΕΣ

Η θέση ύπνου του βρέφους και η σχέση της με το Σύνδρομο του αιφνίδιου βρεφικού θανάτου. ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ. Πτυχιακή εργασία ΔΙΕΡΕΥΝΗΣΗ ΤΟΥ ΚΛΙΜΑΤΟΣ ΑΣΦΑΛΕΙΑΣ ΤΩΝ ΑΣΘΕΝΩΝ ΣΤΟ ΝΟΣΟΚΟΜΕΙΟ

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΚΡΗΤΗΣ ΣΧΟΛΗ ΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ

Αναφοράς ως Μοχλός Ανάπτυξης στην Περιφέρεια της Κρήτης»

ΔΘΝΗΚΖ ΥΟΛΖ ΓΖΜΟΗΑ ΓΗΟΗΚΖΖ

IMES DISCUSSION PAPER SERIES

Terabyte Technology Ltd

Προσωπική Ανάπτυξη. Ενότητα 3: Δικτύωση. Juan Carlos Martínez Director of Projects Development Department

Study of urban housing development projects: The general planning of Alexandria City

ΠΑΝΔΠΙΣΗΜΙΟ ΜΑΚΔΓΟΝΙΑ ΠΡΟΓΡΑΜΜΑ ΜΔΣΑΠΣΤΥΙΑΚΧΝ ΠΟΤΓΧΝ ΣΜΗΜΑΣΟ ΔΦΑΡΜΟΜΔΝΗ ΠΛΗΡΟΦΟΡΙΚΗ

ΣΥΓΧΡΟΝΕΣ ΤΑΣΕΙΣ ΣΤΗΝ ΕΚΤΙΜΗΣΗ ΚΑΙ ΧΑΡΤΟΓΡΑΦΗΣΗ ΤΩΝ ΚΙΝΔΥΝΩΝ

ΤΟ ΣΤΑΥΡΟΔΡΟΜΙ ΤΟΥ ΝΟΤΟΥ ΤΟ ΛΙΜΑΝΙ ΤΗΣ ΚΑΛΑΜΑΤΑΣ

ΤΕΧΝΟΛΟ ΓΙ ΚΟ ΕΚΠΑ ΙΔ ΕΥ Τ ΙΚΟ Ι ΔΡΥ Μ Α 'ΠΕ Ι ΡΑ ΙΑ ΤΜΗΜΑ ΚΛΩΣΤΟΥΦΑΝΤΟΥΡΓΙΑΣ ΕΙΔΙΚΟΤΗΤΑ ΒΑΦΙΚΗΣ ΠΤΥΧΙΑΚΉ ΕΡΓ ΑΣΙΑ ΤΙΤΛΟΣ ΕΥΧΡΗΣΤΙΑ ΕΞΕΙΔΙΚΕΥΜΕΝΟΥ

Πτυχιακή Εργασία Η ΠΟΙΟΤΗΤΑ ΖΩΗΣ ΤΩΝ ΑΣΘΕΝΩΝ ΜΕ ΣΤΗΘΑΓΧΗ

Project IQ-Freshlabel

Brussels, 2 July 2004 OJ CONS AGRI PECHE

Πτυχιακή Εργασία Η ΑΝΤΙΛΑΜΒΑΝΟΜΕΝΗ ΚΟΙΝΩΝΙΚΗ ΣΤΗΡΙΞΗ ΣΤΙΣ ΘΗΛΑΖΟΥΣΕΣ ΜΗΤΕΡΕΣ

Πέτρος Γ. Οικονομίδης Πρόεδρος και Εκτελεστικός Διευθυντής

(2011/431/EE) (8) Για να είναι επιλέξιμες για χρηματοδοτική συμμετοχή, οι

Enterprise Europe Network Πανευρωπαϊκό ίκτυο Υποστήριξης Επιχειρηματικότητας. Κ.Καραμάνης Εθνικό Κέντρο Τεκμηρίωσης

ΙΟΥΝΙΟΣ 2017 ΠΡΟΓΡΑΜΜΑ ΕΚΔΗΛΩΣΕΩΝ

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΗΡΑΚΛΕΙΟ ΚΡΗΤΗΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ

EE512: Error Control Coding

Πρός: Όλα τα μέλη του ΚΕΒΕ 08/11/18. Θέμα: Συνέδριο «Reshaping the hospitality industry challenges & opportunities for Cypriot SME s»

Section 1: Listening and responding. Presenter: Niki Farfara MGTAV VCE Seminar 7 August 2016

PROJECT: CONSULTING SERVICES FOR THE IMPLEMENTATION OF OPERATIONAL EFFICIENCY IMPROVEMENTS IN MINES BU

ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΤΩΝ ΕΚΘΕΣΕΩΝ ΕΤΑΙΡΙΚΗΣ ΚΟΙΝΩΝΙΚΗΣ ΕΥΘΥΝΗΣ COSMOTE ΚΑΙ VODAFONE ΣΤΟΝ ΕΛΛΗΝΙΚΟ ΚΛΑΔΟ ΤΩΝ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

Νέες ρωγµές στην γερµανική ηγεµονία. (New rifts in the German hegemony) Μαυροζαχαράκης Εµµανουήλ Πολιτικός Επιστήµονας

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Τα γνωστικά επίπεδα των επαγγελματιών υγείας Στην ανοσοποίηση κατά του ιού της γρίπης Σε δομές του νομού Λάρισας

JEREMIE Joint European Resources for Micro to medium Enterprises

Το μέλλον των μεταφορών στην Ευρώπη: Οι προκλήσεις και η αντιμετώπιση τους

Πανεπιστήµιο Μακεδονίας Τµήµα ιεθνών Ευρωπαϊκών Σπουδών Πρόγραµµα Μεταπτυχιακών Σπουδών στις Ευρωπαϊκές Πολιτικές της Νεολαίας

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ. «Θεσμικό Πλαίσιο Φωτοβολταïκών Συστημάτων- Βέλτιστη Απόδοση Μέσω Τρόπων Στήριξης»

ΕΠΑΝΑΛΗΨΗ ΨΕΥΔΟΛΕΞΕΩΝ ΑΠΟ ΠΑΙΔΙΑ ΜΕ ΕΙΔΙΚΗ ΓΛΩΣΣΙΚΗ ΔΙΑΤΑΡΑΧΗ ΚΑΙ ΠΑΙΔΙΑ ΤΥΠΙΚΗΣ ΑΝΑΠΤΥΞΗΣ

derivation of the Laplacian from rectangular to spherical coordinates

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ. Πτυχιακή εργασία ΔΙΕΡΕΥΝΗΣΗ ΤΗΣ ΠΟΙΟΤΗΤΑΣ ΖΩΗΣ ΣΕ ΕΦΗΒΟΥΣ ΜΕ ΣΑΚΧΑΡΩΔΗ ΔΙΑΒΗΤΗ.

Assalamu `alaikum wr. wb.

ΑΛΕΞΑΝΔΡΟΣ ΠΑΛΛΗΣ SCHOOLTIME E-BOOKS

THE GREEK LANGUAGE IN THE DIGITAL AGE Η ΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ ΣΤΗΝ ΨΗΦΙΑΚΗ ΕΠΟΧΗ

Στεγαστική δήλωση: Σχετικά με τις στεγαστικές υπηρεσίες που λαμβάνετε (Residential statement: About the residential services you get)

EUROPEAN COMMISSION Employment, Social Affairs and Equal Opportunities DG

Εκτεταμένη περίληψη Περίληψη

Test Data Management in Practice

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ

Matrices and Determinants

Transcript:

Europe's Languages in the Digital Age: Multilingual Technologies for overcoming Language Barriers and Preventing Digital Language Extinction Georg Rehm DFKI, Berlin, Germany Network Manager META-NET georg.rehm@dfki.de Workshop State of the Art of Machine Translation Current Challenges and Future Opportunities, STOA, European Parliament, Brussels, Belgium December 03, 2013 Co-funded by the 7th Framework Programme and the ICT Policy Support Programme of the European Commission through the contracts T4ME, CESAR, METANET4U, META-NORD (grant agreements no. 249119, 271022, 270893, 270899).

Outline Introduction Language White Paper Series: Europe s Languages in the Digital Age The META-NET Strategic Research Agenda for Multilingual Europe Conclusions http://www.meta-net.eu 2

Network of excellence dedicated to fostering the technological foundations of the European multilingual information society. Initial project: T4ME (FP7). Three ICT-PSP consortia since Feb. 2011: CESAR, METANET4U, META-NORD First funded phase (i.e., the four projects) ended on Jan. 31, 2013. All EU member states and several non-member states covered. META-NET: 60 research centres in 34 European countries. http://www.meta-net.eu/members

Europe s Languages in the Digital Age Language White Paper Series http://www.meta-net.eu 4

Language White Paper Series Europe s Languages in the Digital Age Series covers 31 languages in 31 volumes. Reports on the state of our languages in the digital age and the level of support through language technology. >2 years in the making. >215 experts as contributors. >8.000 copies distributed to politicians and journalists. http://www.meta-net.eu 5

Basque Bulgarian* Catalan Croatian* Czech* Danish* Dutch* English* Estonian* Finnish* French* Galician German* Greek* Hungarian* Icelandic Irish* Italian* Latvian* Lithuanian* Maltese* Norwegian Polish* Portuguese* Romanian* Serbian Slovak* Slovene* Spanish* Swedish* Welsh * Official EU language

Cross-Lingual Comparison In four areas 1. Machine Translation, 2. Text Analytics, 3. Speech Processing, 4. Language Resources each language is ranked: from excellent LT support to weak/no support. Cross-lingual comparison discussed and finalised at a network meeting with representatives of all languages (Oct., 2011). http://www.meta-net.eu 7

excellent good moderate fragmentary weak or no support through LT MT English French, Spanish Catalan, Dutch, German, Hungarian, Italian, Polish, Romanian Basque, Bulgarian, Croatian, Czech, Danish, Estonian, Finnish, Galician, Greek, Icelandic, Irish, Latvian, Lithuanian, Maltese, Norwegian, Portuguese, Serbian, Slovak, Slovene, Swedish, Welsh Resources Speech Text Analytics excellent excellent excellent good English good English good English moderate Dutch, French, German, Italian, Spanish moderate Czech, Dutch, Finnish, French, German, Italian, Portuguese, Spanish moderate Czech, Dutch, French, German, Hungarian, Italian, Polish, Spanish, Swedish fragmentary Basque, Bulgarian, Catalan, Czech, Danish, Finnish, Galician, Greek, Hungarian, Norwegian, Polish, Portuguese, Romanian, Slovak, Slovene, Swedish fragmentary Basque, Bulgarian, Catalan, Danish, Estonian, Galician, Greek, Hungarian, Irish, Norwegian, Polish, Serbian, Slovak, Slovene, Swedish fragmentary Basque, Bulgarian, Catalan, Croatian, Danish, Estonian, Finnish, Galician, Greek, Norwegian, Portuguese, Romanian, Serbian, Slovak, Slovene weak or no support through LT Croatian, Estonian, Icelandic, Irish, Latvian, Lithuanian, Maltese, Serbian, Welsh weak or no support through LT Croatian, Icelandic, Latvian, Lithuanian, Maltese, Romanian, Welsh weak or no support through LT Icelandic, Irish, Latvian, Lithuanian, Maltese, Welsh

Key Observations and Results When it comes to technology support, there are massive differences between Europe s languages and technology areas. Support for English is ahead of any other language. But: even support for English is far from being perfect. Several languages get the weakest score in all four areas (e.g., Icelandic, Latvian, Lithuanian, Maltese)! http://www.meta-net.eu 9

Ord. Forskere arbejder på at forbedre danske oversættelser på internettet. Date 30 September 2012 Page 16 Dårlig sprogteknologi truer dansk på nettet / " 2 / 0 Digital Language Extinction! Af Jens Ejsing // ejs@berlingske.dk Det danske sprog har det svært i den digitale verden. Det konstaterer danske sprogforskere- og eksperter i forbindelse med den nye internationale undersøgelse META-NET, der ser nærmere på, hvordan en lang række mindre, europæiske sprog som dansk klarer sig i den digitale verden. Forskerne fra bl.a. Københavns Universitet og Dansk Sprognævn når frem til, at dansk i fremtiden kan få det endnu sværere i den digitale verden, fordi Google Translate, GPSer, applikationer til smartphones og andre sprogteknologiske programmer ikke i tilstrækkelig grad formår at behandle de mange nuancer i det danske sprog. Professor i sprogteknologi på Københavns Universitet, Bolette Sandford Pedersen, mener, at der er brug for en slags digital dansk sprogbank fyldt med data, så bl.a. oversættelser bliver så præcise og gode som muligt. Med hjælp fra sprogbanken kan forskere ifølge professoren hjælpe virksomheder med at forbedre programmer, der skal håndtere sproglig viden om bl.a. maskinoversættelse, talegenkendelse og informationssøgning. Dermed vil der blive længere mellem fejlagtige oversættelser, som når»hæld olie på panden«med Google Translate bliver til»pour oil on the forehead«på engelsk. Oversættelser, der er i værste fald er så upræcise, at danskere ender med at fravælge deres eget sprog i den digitale verden. Sproghjælp til virksomheder Hun anerkender dog, at»teknologien til automatiske oversættelser på mange måder er fantastisk«.»den er bare ikke god nok, når det gælder dansk,«siger hun:»det er som om, at vi i et vist omfang lægger det i hænderne på Google eller andre virksomheder at afgøre, om dansk skal behandles godt nok eller ej. Men det danske marked er ikke stort for dem. Spørgsmålet er derfor, fakta H Sprog i Europa H Der er omkring 80 sprog i EU. For 21 af dem også dansk gælder det, at der er store sprogteknologiske mangler, når det gælder bl.a. maskinoversættelse, talegenkendelse og informationssøgning. H Ifølge en EU-undersøgelse køber et stigende antal europæiske internetbrugere varer eller tjenester på nettet, hvor det sprog, der bliver anvendt, ikke er deres eget. Det gælder over halvdelen af brugerne.! ÔÞ } Ð î ÐgÔ 4 p Ð Ô C çc p Ô p } g ôp Ô } çð pc Þ çpô gc pð } p p]þð ] pïþ ]Þ gçp Þ C] } g Þ Ôpg ] Þp Þ¾ î ]C Cp p ç Þ p g ÞC g í gpd CÔ Ô çð Ô om vi ikke i højere grad selv skal gøre noget for at sikre, at det fornødne datamateriale er til rådighed, så vi får gode oversættelser og anden god sprogteknologi. Det kunne f.eks. være ved, at vi gjorde en indsats for at få oprettet en sprogbank med en masse beriget materiale om dansk.hvis vi hele tiden oplever, at oversættelser er behæftede med fejl, tør vi ikke stole på dem,«siger hun og understreger, at»fejlagtige oversættelser kan føre til store misforståelser«. Ifølge Dansk Sprognævns direktør, Sabine Kirchmeier-Andersen, kan dårlig sprogteknologi have konsekvenser for mange danskere, der ikke er så gode til engelsk.»hvis vi har ambitioner om at bruge det danske sprog i fremtidens teknologiske univers, skal der gøres en indsats nu for at fastholde ekspertise og udbygge den viden, vi har,«mener hun:»ellers risikerer vi, at kun folk, der taler flydende engelsk, vil få glæde af de nye generationer af web-, tele- og robotteknologi, der er på vej.«b /$4" 0 n åî na A åa nò A H Over hver tredje anvender et fremmedsprog til at skrive mail eller indlæg på nettet. Î Ò A åa n åònîò e Aìn e ÜA Ü Ò Press release sent out to journalists, politicians and other stakeholder groups on the European Day of Languages (Sept. 26, 2012). 2$" 4 2: 02 / Î Ò AÒ å Ãån Ãå Î Ò 4Î n Ü í Î nnene Ü n Î Ò 2 n Î Ò A åa n AÒ e ÒÜ [Ü ìn {naüåînò í [ A n Ò nn[ A e ÜnîÜ QAÒne Ün[ nò ÜÎ [ ï¼ 4 n ÒÜ åî na A åa nòb Ü AÒ A ìnîq ÒåQ n[ü Q n[ü ÒÜÎå[ÜåÎnb A e Ae n[ü ìnò { í å Ò¼ Î Ò AÒ í ÎeÒ { Î ÈïnÒÉ Î È É¼ 2 ìn A ïnò Î ÎnÒ Ònb ï å åòü În naü Ü n ìnîq¼ 2 nîn AÎn Üí { Î Ò { ÈÜ Qnɼ ÒÜnAe { A ÒÜA eaîe Ò n { Î b Ü nîn AÎn Ü Înn e ÒÜ [Ü e A n[üò u n A b n AÎA A e!å ÒÜnμ Ò Ü n ÒÜA eaîe Ò n { Î AÒ AÜ ìn Ò na nîò u Qn A [ Î Òn { Ü n Ü Înn e A n[üò u Ü Èe nò Ü Òå Ü Ü n Qå e { A Ò nn[ Òï Ü nò Ò ÒïÒÜn b í [ AÒ Ü Qn QAÒne A Ò n[ { [ Ò na nîé¼ 2 nîn Ò A Ò A AQÒn [n { ÎnÒ åî[nò í [ ÜnîÜ QAÒne Ün[ nò nneb Òå[ AÒ Î å [ AÜ e [Ü AÎ nò¼ Î Ò Ò AÎ n ï åü { Ü n {å e Qn[AåÒn Ü e nò Ü În ÎnÒn Ü A AÎ nü Ü AÜ ìnòü ÎÒ AÎn ÜnÎnÒÜne b Ü n În ÎÜ ÜÒ åü¼! [Î Ò {Üb n A e! A Aìn [n ÜÎnÒ { Î å ÒÜ [Òb A e AÎn QAÒne În A eb ÈQåÜ e ìnîï ÜÜ n í Î Î Ò A åa n eaüaé¼ n A {{ [ A 4 A åa n A{{ ÎeÒ Î Ò Ò n Î Ün[Ü b A[[ Îe Ü åe n¼ È åü ín enò nîaün ï nne Ü ÒÜAÎÜ Î eå[ În [ În [ n Ü Ü Ò n AÎÒnÎÒb [ å nîòb Ò nn[ În[ ÒnÎÒ A e Òï Ü nò ÒnÎÒbÉ n ÒA e¼ È ÎenÎ Ü e Ü Ò ín nne Ü n ÊÎAí AÜnÎ A ÒËb n å ÒÜ [ eaüa A A[ n åòaq n { Î ¼ 2 nîn Ò A A[ { [ Ü å Üï Ü n A Ün A [n { í AÜ ÜÜ n ín Aìnb í [ na Ò nî ÒÜ ÎnÒ åî[nò Îå Ü n Î Ò { Qn[ QÒ nün¼é Overwhelmed by the huge interest in the topic and our key findings! Πέµπτη 27 Σεπτεµβρίου 2012 ΕΛΕΥΘΕΡΟΣ ΤΥΠΟΣ Life 2 [ ìnîò nìnîïü {Î ÜÎA Ò AÜ ínq A nò Ü nîaü A Q n n í Ü Ò n [ A eò¼ 2 nîn Ò Ò {ÜíAÎn Òå ÎÜ { Î Ü n Î Ò A åa nb { Î nîa n nb! [Î Ò {Ü : e í A e! ó A În{ î A Aìn [A Òne ÜnÎ{A[nÒ¼!0 ${{ [n AÒ A Ò n [ n[ nîb A Ü å Ü AÒ ËÜ Qnn å eaüne În[n Ü ïb A e Ü nîn AÎn n Ü Ò { Î Ò n A e ÎA AÎ Òå[ AÒ An 0 n ¼ È2 nîn AÎn [A Òne ìnîò Ò { í Îe Î [nòò ÎÒb ÜnÎ nü QÎ íònîò A e Ü nî enò Ü Ü Ò AÒ ín AÒ nîaü ÒïÒÜn ÒbÉ ÒA e åe n¼ È2 nòn Ün[ nò AÎn Qn åòne Ü n Î Ò Ò na [ å Üï¼É ínìnî Ü nîn Ò AåÜ AÜ [ Ò nn[ În[ Ü Î Ò b A e ÈÜ nîn Ò A íaï Ü É Qn{ În Òå[ ÒïÒÜn Ò [A Qn åü A[nb ÒAïÒ Ü n ÒÜåeï¼ At Least 21 European Languages in Danger of Digital Extinction! "2 / 2 $" 0-4- 38 /nònaî[ AÒ Qnn [AÎÎ ne åü Ü í Þõ { åî nëò nòü AÜne sõ A åa nò AÎn [ Ü n e ÜA A nb A e Ü n [ [ åò Ò ÒÜ AÎn å n ï Ü ÒåÎì ìn ܼ A åa n Ün[ ï 2¹ ÎnÒnAÎ[ nîò nòü AÜn Ü AÜ e ÜA Òå ÎÜ { Î ã { Ü n Ü ånò Ò È nî ÒÜn ÜÉ Î ÈínA ɼ 2 n ÒÜåeï Qï!nÜA "nüb A åî na nüí Î { õ ÎnÒnAÎ[ [n ÜÎnÒ Þ [ å ÜÎ nòb [ [ åene Ü AÜ ÒÜ { Ü n A åa nò Òå[ AÒ AÒÃån A e AÜA A ¹ AÎn å enî ÎnÒ åî[neb í n Ò n AÎn [ nün ï n n[üne¼ Î Ò Ò A Ü Òn AÜ Î Ò { Qn n{ü Qn eb QåÜ Èí Ü A ÒÜÎ ne Înn ÜÎA Ò AÜ b [A ÒAÜ A e 2 ÎnÒnAÎ[ b În A e Ò A ÒÜÎ Ò Ü Ü enìn Òå[ Ün[ nòéb A[[ Îe Ü Ü n AåÜ ÎÒb [ åe Î åe n { åq Üï 4 ìnîò Üï¼ 049-ΚΟΣΜΟΣ 29/09/2012 1:41? Μ Page 49 600+ mentions in the press. Copyright material. This may only be copied under the terms of a Newspaper Licensing Agency agreement (www.nla.co.uk) or with written publisher permission. For external republishing rights see www.nla-republishing.com 49 KYPIAKH 30 ΣΕΠΤΕΜΒΡΙΟΥ 2012 Οι περισσότερες ευρωπαϊκές γλώσσες κινδυνεύουν µε ψηφιακή εξαφάνιση Τη γλώσσα 20+ television reports and 30+ broadcast interviews µού... (radio, έχασανtv) with META-NET representatives. Η Γιώργος Μπαµπινιώτης. XX GREEKLISH Η γλώσσα της αποξένωσης ΜΕ GREEKLISH επικοινωνούν πλέον µέσω µηνυµάτων ή email οι περισσότεροι νέοι της χώρας µας. Παρά το γεγονός ότι τα τελευταία χρόνια υπάρχουν τα γλωσσικά εργαλεία, τα οποία επιτρέπουν τη χρήση της ελληνικής γραµµατοσειράς, έφηβοι και νέοι ενήλικες φαίνεται ότι δεν έχουν «αγκαλιάσει» αυτές τις τεχνολογίες. Ο καθηγητής Γλωσσολογίας, κ. Γιώργος Μπαµπινιώτης, λέει στον «Ε.Τ.»: «Τα greeklish είναι πρόβληµα για την ελληνική γλώσσα, ιδίως για ανθρώπους νέας ηλικίας για έναν καθαρά γλωσσικό λόγο. Με τη χρήση των greeklish αποξενώνονται από τη µορφή της λέξης ή όπως λέµε το ετυµολογικό ίνδαλµα που δηλώνεται µε την ορθογραφία της λέξης και συνδέεται και µε τη σηµασία της λέξης και µε την προέλευσή της». Ο κίνδυνος, µε τον οποίο έρχονται αντιµέτωποι οι νέοι άνθρωποι, είναι η αποξένωση από τη γραπτή µορφή της γλώσσας. Αυτή η «οικειότητα», όµως, βοηθάει και στην κατανόηση της σηµασίας αλλά και την προέλευση της λέξης. «Αυτή η αποξένωση δεν είναι άνευ σηµασίας», αναφέρει ο ειδικός, ο οποίος εξηγεί ότι η διαδικασία της γραφής βοηθάει να εντυπωθεί η λέξη και να συνδεθεί µε άλλες οµόρριζες λέξεις. «Οταν χρησιµοποιείται αυτή η µορφή επικοινωνίας, καταστρέφονται, ατονούν. εν είναι προς θάνατο, αλλά θα κάνει ζηµιά», αναφέρει ο κ. Μπαµπινιώτης, ο οποίος συµβουλεύει τους χρήστες να επιλέγουν την ελληνική γραµµατοσειρά. Πρέπει να εξασφαλιστεί ο εφοδιασµός των µικρότερων και λιγότερο πλούσιων -σε ψηφιακούς πόρους- γλωσσών µε τις απαραίτητες βασικές τεχνολογίες 26η Σεπτεµβρίου έχει καθιερωθεί από το Συµβούλιο της Ευρώπης ως η Ευρωπαϊκή Ηµέρα των Γλωσσών, αλλά, σύµφωνα µε µια νέα ευρωπαϊκή επιστηµονική έκθεση, οι 21 από τις 30 γλώσσες της Ευρώπης -µεταξύ των οποίων και η Ελληνική- αντιµετωπίζουν κίνδυνο ψηφιακής εξαφάνισης. Η έρευνα κρούει τον κώδωνα κινδύνου, καθώς διαπίστωσε ότι η ψηφιακή βοήθεια για τις περισσότερες ευρωπαϊκές γλώσσες είναι ελλιπής ή απολύτως ανύπαρκτη για τους χρήστες. Ακολουθούν µε ικανοποιητική ή µέτρια τεχνολογική/ψηφιακή υποστήριξη η Ολλανδική, η Γαλλική, η Γερµανική, η Ιταλική και η Ισπανική. Η Ελληνική, όπως επίσης η Βασκική, η Καταλανική, η Πολωνική, η Ουγγρική κ.ά. κατατάσσονται στις γλώσσες µε «αποσπασµατική» µόνο υποστήριξη, γι αυτό ακριβώς θεωρούνται γλώσσες υψηλού κινδύνου προς εξαφάνιση. News εξαφάνιση came in from 40+ countries in 35+ different languages. Με ψηφιακή ΠΟΛΛΕΣ ΕΥΡΩΠΑΪΚΕΣ ΓΛΩΣΣΕΣ ΘΕΩΡΟΥΝΤΑΙ ΤΕΧΝΟΛΟΓΙΚΑ ΞΕΠΕΡΑΣΜΕΝΕΣ Τις έφαγαν οι κοινές Η έκθεση, µε τη µορφή µιας σειράς Λευκών Βίβλων (µε τίτλο «Γλώσσες στην Ευρωπαϊκή Κοινωνία της Πληροφορίας»), από το επιστηµονικό δίκτυο ΜΕΤΑΝΕΤ, το οποίο συνενώνει 60 ερευνητικά κέντρα σε 34 χώρες, επισηµαίνει ότι οι γλώσσες που µιλιούνται από σχετικά µικρό αριθµό ανθρώπων κινδυνεύουν, επειδή δεν έχουν τεχνολογική υποστήριξη όπως έχουν οι ευρέως χρησιµοποιούµενες γλώσσες. Λευκές Βίβλοι έχουν καταρτιστεί για τις εξής ευρωπαϊκές γλώσσες: αγγλικά, βασκικά, βουλγαρικά, γαλικιανά, γαλλικά, γερµανικά, δανικά, ελληνικά, εσθονικά, ιρλανδικά, ισλανδικά, ισπανικά, ιταλικά, καταλανικά, κροατικά, λετονικά, λιθουανικά, µαλτέζικα, νορβηγικά (µπουκµόλ και νινόρσκ), ολλανδικά, ουγγρικά, πολωνικά, πορτογαλικά, ρουµανικά, σερβικά, σλοβακικά, σλοβενικά, σουηδικά, τσεχικά και φινλανδικά. Κάθε Λευκή Βίβλος είναι γραµµένη στη γλώσσα στην οποία αναφέρεται και είναι µεταφρασµένη στα αγγλικά. Δραµατικές διαφορές Σύµφωνα µε τους επιµελητές της µελέτης Χανς Ουζκοράιτ και Γκέοργκ Ρεµ, «υπάρχουν δραµατικές διαφορές στην υποστήριξη της γλωσσικής τεχνολογίας ανάµεσα στις διάφορες ευρωπαϊκές γλώσσες και τεχνολογικές περιοχές. Το χάσµα µεταξύ µικρών και µεγάλων γλωσσών ολοένα και διευρύνεται. Πρέπει να εξασφαλίσουµε τον εφοδιασµό των µικρότερων και λιγότερο πλούσιων -σε ψηφιακούς πόρους- γλωσσών µε τις απαραίτητες βασικές τεχνολογίες, αλλιώς οι γλώσσες αυτές είναι καταδικασµένες σε ψηφιακή εξαφάνιση». Ως ελπίδα αυτών των γλωσσών θεωρείται η βελτίωση και η ευρύτερη αξιοποίηση του λογισµικού γλωσσικής τεχνολογίας, το οποίο επιτρέπει τη φωνητική και τη γραπτή επεξεργασία των διαφόρων γλωσσών. Παραδείγµατα αυτών των δυνατοτήτων είναι οι ηλεκτρονικοί ορθογραφικοί και συντακτικοί διορθωτές κειµένων, οι διαδραστικοί προσωπικοί «βοηθοί» των έξυπνων κινητών τηλεφώνων (π.χ. η Siri στο iphone), τα συστήµατα αυτόµατης µετάφρασης, τα ηλεκτρονικά συστήµατα διαλόγου των τηλεφωνικών κέντρων, οι µηχανές αναζήτησης, η συνθετική φωνή στα συστήµατα πλοήγησης των αυτοκινήτων. κ.ά. κινδυνεύουν τα ελληνικά Σ Two Parliamentary Questions in the EP on the digital extinction of την ψηφιακή εποχή δεν µιλούν ελληνικά, όπως και αρκετές άλλες ευρωπαϊκές γλώσσες, σύµφωνα µε πανευρωπαϊκή έκθεση µε την υπογραφή 200 και πλέον ειδικών. Η συγκεκριµένη µελέτη δηµοσιεύτηκε από το επιστηµονικό δίκτυο ΜΕΤΑ-ΝΕΤ µε αφορµή τη χτεσινή Ευρωπαϊκή Ηµέρα Γλωσσών. Για τις ανάγκες της έρευνάς τους, γλωσσολόγοι από 34 χώρες της Γηραιάς Ηπείρου βαθµολόγησαν τις διαθέσιµες γλωσσικές υπηρεσίες και δηµιούργησαν ένα «Λευκό Βιβλίο» για κάθε ευρωπαϊκή γλώσσα. Στη µελέτη τους, οι ειδικοί αναζήτησαν µεταξύ άλλων τέσσερα βασικά ηλεκτρονικά εργαλεία, δηλαδή την ύπαρξη αυτόµατης µετάφρασης, τη δυνατότητα φωνητικής αλληλεπίδρασης και ψηφιακής ανάλυσης κειµένου, ενώ ταυτόχρονα διερευνήθηκε και η διαθεσιµότητα γλωσσικών πόρων ή πηγών. Σε πρώτη φάση εξέτασαν τις ιστοσελίδες που επιτρέπουν στους χρήστες να κάνουν µεταφράσεις online, όπως, για παράδειγµα, η υπηρεσία του κολοσσού πληροφορικής Google Translate. Την ίδια ώρα, εξετάστηκε και η «επικοινωνία» των ελληνόφωνων χρηστών µε τις συσκευές τους, όπως για παράδειγµα η δυνατότητα ΕΛΕΝΗ ΒΕΡΓΟΥ evergou@e-typos.com τεχνολογίας ανάµεσα στις διάφορες ευρωπαϊκές γλώσσες. Το χάσµα µεταξύ µικρών και µεγάλων γλωσσών ολοένα και διευρύνεται. Πρέπει να εξασφαλίσουµε τον εφοδιασµό των µικρότερων και λιγότερο πλούσιων σε ψηφιακούς πόρους γλωσσών µε τις απαραίτητες βασικές τεχνολογίες. ιαφορετικά, οι γλώσσες αυτές είναι καταδικασµένες σε ψηφιακή εξαφάνιση». Μάλιστα, οι ειδικοί τονίζουν ότι χωρίς αποφασιστική δράση οι γλώσσες αυτές δύσκολα θα επιβιώσουν στον ψηφιακό κόσµου του 21ου αιώνα. Η κ. Μαρία Γαβριηλίδου, µέλος της επιστηµονικής οµάδας από το Ινστιτούτο Επεξεργασίας του Λόγου Ερευνητικό Κέντρο Αθηνά, λέει στον «Ε.Τ.»: «Η έρευνα αυτή δεν λέει ότι δεν θα ζήσει η ελληνική γλώσσα ή ότι κινδυνεύει µε εξαφάνιση». Η ειδικός εξηγεί ότι όσο υπάρχουν άνθρωποι που µιλάνε, γράφουν και επικοινωνούν µε µια γλώσσα, τότε αυτή θα συνεχίσει να υπάρχει. Είναι σηµαντικό, όµως, να έχουν όλοι οι χρήστες τη δυνατότητα να «µιλήσουν» στις µηχανές, όπως τα GPS τους, στα ελληνικά και να έχουν στη διάθεσή τους γλωσσικά εργαλεία ηλεκτρονικών υπολογιστών. Μεταξύ αυτών των «εργαλείων» είναι οι διορθωτές ορθογραφικών και συντακτικών λαθών, που χρησιµοποιούνται καθηµερινά από εκατοντάδες Ελληνες χρήστες και βασίζονται στη γλωσσική τεχνολογία. Παρ όλα αυτά, τονίζει ότι η ψηφιακή εξάπλωση µιας γλώσσας είναι σηµαντική «εν είναι στα χέρια του µέσου χρήστη. Οι εκάστοτε κυβερνήσεις, η Ευρωπαϊκή Ενωση και ο ιδιωτικός τοµέας πρέπει να χρηµατοδοτήσουν την ανάπτυξη αυτής της τεχνολογίας για όλες τις γλώσσες», αναφέρει και συνεχίζει: «Οι χρήστες, όµως, πρέπει να απαιτούν να υπάρχουν και στη γλώσσα τους τα µέσα αυτά και να µην ικανοποιούνται µε τα αγγλικά». languages topic. να «µιλήσει» κάποιος στο GPS στη µητρική του γλώσσα. Οι ερευνητές κατέληξαν στο συµπέρασµα ότι υπάρχουν τέτοιες συσκευές, αλλά δεν είναι τόσο διαδεδοµένες όσο οι αγγλόφωνες. Το «χρυσό» µετάλλιο κατακτά, όπως είναι άλλωστε και λογικό, η αγγλική γλώσσα. Οι αγγλόφωνοι χρήστες έχουν την καλύτερη δυνατή τεχνολογική υποστήριξη, κάτι το οποίο ευνοεί την περαιτέρω εξάπλωση της γλώσσας. Από «τεχνολογικό αποκλεισµό» κινδυνεύουν περισσότερο η ισλανδική, η λετονική, η λιθουανική και η µαλτέζικη γλώσσα, ενώ σε λίγο καλύτερη µοίρα βρίσκονται η ελληνική, η βουλγαρική, η ουγγρική και η πολωνική, που όπως αναφέρει η έρευνα έχουν «αποσπασµατική» τεχνολογική υποστήριξη. «Μέτρια» χαρακτηρίζεται η υποστήριξη χρηστών σε ολλανδική, γαλλική, γερµανική, ιταλική και ισπανική γλώσσα. Οι επικεφαλής της επιστηµονικής οµάδας, Χανς Ουζκοράιτ και Γκεόργκ Ρεµ, αναφέρουν χαρακτηριστικά: «Υπάρχουν δραµατικές διαφορές στην υποστήριξη της γλωσσικής Οι αγγλόφωνοι χρήστες έχουν την καλύτερη δυνατή τεχνολογική υποστήριξη, γεγονός που ευνοεί την περαιτέρω εξάπλωση της γλώσσας http://www.meta-net.eu Τέσσερις µεγάλοι κίνδυνοι Σύµφωνα µε τη νέα µελέτη, η Ισλανδική, η Λετονική, η Λιθουανική και η Μαλτέζικη αντιµετωπίζουν τον µεγαλύτερο κίνδυνο εξαφάνισης σε µια ευρωπαϊκή τεχνολογική κοινωνία, που ολοένα περισσότερο προωθεί τη χρήση συγκεκριµένων γλωσσών και ιδίως της Αγγλικής. Όµως και άλλες γλώσσες, όπως η Ελληνική, η Βουλγαρική, η Ουγγρική και η Πολωνική, επίσης κινδυνεύουν στον σύγχρονο ψηφιακό κόσµο. Η έρευνα του ΜΕΤΑ-ΝΕΤ, στην οποία συνέβαλαν περισσότεροι από 200 ειδικοί, αξιολογεί τον κίνδυνο για κάθε γλώσσα µε βάση τέσσερα βασικά κριτήρια σε τεχνολογικό/ψηφιακό επίπεδο: την ύπαρξη αυτόµατης µετάφρασης στη συγκεκριµένη γλώσσα, τη δυνατότητα φωνητικής αλληλεπίδρασης, τη δυνατότητα ψηφιακής ανάλυσης κειµένου και τη διαθεσιµότητα των σχετικών ψηφιακών γλωσσικών πόρων/πηγών. Οι δυνατές Η γλώσσα µε την καλύτερη βαθµολογία στα κριτήρια είναι ασφαλώς η Αγγλική, που απολαµβάνει τη συγκριτικά καλύτερη τεχνολογική υποστήριξη (αν και όχι την καλύτερη δυνατή), γεγονός που διευκολύνει την περαιτέρω εξάπλωσή της. Το βασικό πρόβληµα Το σηµαντικό, σύµφωνα µε την έκθεση, είναι όλες αυτές οι δυνατότητες να προσφέρονται στους χρήστες και στη µητρική τους γλώσσα που κινδυνεύει µε εξαφάνιση. Χωρίς αποφασιστική δράση, γίνεται η δυσοίωνη πρόβλεψη ότι οι γλώσσες αυτές δύσκολα θα επιβιώσουν στον ψηφιακό κόσµο του 21ου αιώνα. Ένα πρόβληµα είναι ότι το λογισµικό αυτών των συστηµάτων γλωσσικής τεχνολογίας στηρίζεται σε στατιστικές µεθόδους που απαιτούν τεράστιες ποσότητες γραπτών ή φωνητικών δεδοµένων, όµως τόσα πολλά δεδοµένα είναι δύσκολο να αποκτηθούν για γλώσσες που οµιλούνται από σχετικά λίγους ανθρώπους. Εξάλλου, ακόµα και για ευρέως χρησιµοποιούµενες γλώσσες όπως τα αγγλικά, η σχετική γλωσσική τεχνολογία έχει ακόµα αδυναµίες, που είναι π.χ. φανερές στις άκρως ανεπαρκείς και γεµάτες λάθη αυτόµατες µεταφράσεις. Η έκθεση προτείνει ότι πρέπει να αναληφθεί µια συντονισµένη µεγάλης κλίµακας προσπάθεια στην Ευρώπη, προκειµένου σταδιακά να δηµιουργηθούν ή να βελτιωθούν οι αναγκαίες τεχνολογίες και να βοηθηθούν οι γλώσσες που είναι ψηφιακά παραγκωνισµένες. 10

Update of the Study (2013/2014) Study comprised 31 volumes/languages. Many languages missing! Need for extension at least of the comparison. We invited three language community bodies to participate in the update: European Federation of National Institutions for Language (EFNIL) Network to Promote Linguistic Diversity (NPLD) Experts Committee of the European Language Charter (Council of Europe) Submitted to LREC 2014 http://www.meta-net.eu 11

excellent good moderate fragmentary weak or no support MT English French, Spanish Catalan, Dutch, German, Hungarian, Italian, Polish, Romanian Albanian, Asturian, Basque, Bosnian, Breton, Bulgarian, Croatian, Czech, Danish, Estonian, Finnish, Frisian, Friulian, Galician, Greek, Hebrew, Icelandic, Irish, Latvian, Limburgish, Lithuanian, Luxembourgish, Macedonian, Maltese, Norwegian, Occitan, Portuguese, Romany, Scots, Serbian, Slovak, Slovene, Swedish, Turkish, Vlax Romani, Welsh, Yiddish Resources Speech Text Analytics excellent excellent excellent good English good English good English moderate Dutch, French, German, Hebrew, Italian, Spanish moderate Czech, Dutch, Finnish, French, German, Italian, Portuguese, Spanish moderate Czech, Dutch, French, German, Hungarian, Italian, Polish, Spanish, Swedish fragmentary Basque, Bulgarian, Catalan, Czech, Danish, Finnish, Galician, Greek, Hungarian, Norwegian, Polish, Portuguese, Romanian, Slovak, Slovene, Swedish fragmentary Basque, Bulgarian, Catalan, Danish, Estonian, Galician, Greek, Hungarian, Irish, Norwegian, Polish, Serbian, Slovak, Slovene, Swedish, Turkish fragmentary Basque, Bulgarian, Catalan, Croatian, Danish, Estonian, Finnish, Galician, Greek, Hebrew, Norwegian, Portuguese, Romanian, Serbian, Slovak, Slovene weak or no support Albanian, Asturian, Bosnian, Breton, Croatian, Estonian, Frisian, Friulian, Icelandic, Irish, Latvian, Limburgish, Lithuanian, Luxembourgish, Macedonian, Maltese, Occitan, Romany, Scots, Serbian, Turkish, Vlax Romani, Welsh, Yiddish weak or no support Albanian, Asturian, Bosnian, Breton, Croatian, Frisian, Friulian, Hebrew, Icelandic, Latvian, Limburgish, Lithuanian, Luxembourgish, Macedonian, Maltese, Occitan, Romanian, Romany, Scots, Vlax Romani, Welsh, Yiddish weak/no support Albanian, Asturian, Bosnian, Breton, Frisian, Friulian, Icelandic, Irish, Latvian, Limburgish, Lithuanian, Luxembourgish, Macedonian, Maltese, Occitan, Romany, Scots, Turkish, Vlax Romani, Welsh, Yiddish

If [LT] doesn t exist, it s death. Recorded at META-FORUM 2013 September 19/20, Berlin (Video length: 1:26 ) Sigve Gramstad Vice Chair of the Experts Committee of the European Language Charter (Council of Europe) Meirion Prys Jones CEO of the Network to Promote Linguistic Diversity (NPLD) http://www.meta-net.eu 13

The META-NET Strategic Research Agenda for Multilingual Europe Strategic Research Agenda http://www.meta-net.eu 14

Strategic Research Agenda Addresses the problems we identified when preparing the white papers. Can put Europe ahead of its competitors in this technology area. 200 contributors; >2 years. 54% from industry; 46% from research; 4% from national and international institutions. Presented and discussed at 80+ conferences and major workshops. Published & presented in early 2013. http://www.meta-net.eu/sra http://www.meta-net.eu 15

Priority Research Themes Our priority themes (a) support technology progress, (b) lead to solutions that European society needs and (c) solutions from which European industry will benefit as users or as providers. Translingual Cloud Social Intelligence and e-participation Socially-Aware Interactive Assistants Two additional themes: European Service Platform for Language Technologies Core Technologies for Language Analysis and Production http://www.meta-net.eu 16

Translingual Cloud Europe has a big need for translations of publishable quality. Machine Translation for many European and important other languages. Focus on High-Quality Translation New research paradigms Stronger emphasis on the properties of individual languages Central role for semantics Methods for specific genres & domains See presentation by Hans Uszkoreit http://www.meta-net.eu 17

Research Centres Providers of operational and research technologies and services National Language Institutions Language Service Providers Universities Language Technology Providers European Institutions Other companies (SMEs, startups etc.) Towards the Translingual Cloud Priority Research Theme 1: Translingual Cloud Priority Research Theme 2: Social Intelligence & e-participation Priority Research Theme 3: Socially Aware Interactive Assistants Language Processing Language Understanding Knowledge Emotion/ Sentiment Language checking European Service Platform for Language Technologies (Cloud or Sky Computing Platform) Text analytics Sentiment analysis Multilingual technologies Named entity recognition Text generation Summarisation Information and relation extraction Knowledge access and management Data protection Tools Data Sets Resources Components Metadata Standards Interfaces APIs Catalogues Quality Assurance Data Import/Export Input/Output Storage Performance Availability Scalability Features Interfaces (web, speech, mobile etc.) Beneficiaries/users of the platform European Institutions Research Centres Public Administrations European Citizens Enterprises LT User Industries Universities

META-NET Conclusions http://www.meta-net.eu 19

Conclusions Many European languages have insufficient technological support! These languages are threatened by digital extinction. Multilingual technologies are a key enabler to overcoming language barriers and to preserving our precious languages. META-NET suggests setting up a focused, major, interdisciplinary research effort so that Europe can overcome language barriers, benefit from language diversity and play a leading role in the next IT revolution. META-NET suggests to develop a Translingual Cloud Services Platform. The whole continent needs to team up for this to become reality! The proposed measures have the power to bring about a technological quantum leap, put Europe in a leading position in a core area of economic growth and to allow our languages to thrive in the digital age. http://www.meta-net.eu 20

excellent support good support moderate support fragmentary support weak or no support Machine Translation English French Spanish Catalan Dutch German Hungarian Italian Polish Romanian Basque Bulgarian Croatian Czech Danish Estonian Finnish Galician Greek Icelandic Irish Latvian Lithuanian Maltese Norwegian Portuguese Serbian Slovak Slovene Swedish Welsh http://www.meta-net.eu 21

excellent support good support moderate support fragmentary support weak or no support Machine Translation Basque Bulgarian Catalan Croatian Czech Danish Dutch English Estonian Finnish French Galician German Greek Hungarian Icelandic Irish Italian Latvian Lithuanian Maltese Norwegian Polish Portuguese Romanian Serbian Slovak Slovene Spanish Swedish Welsh http://www.meta-net.eu 22

excellent support good support moderate support fragmentary support weak or no support Machine Translation Basque Bulgarian Catalan Croatian Czech Danish Dutch English Estonian Finnish French Galician German Greek Hungarian Icelandic Irish Italian Latvian Lithuanian Maltese Norwegian Polish Portuguese Romanian Serbian Slovak Slovene Spanish Swedish Welsh? only if we manage to achieve several scientific breakthroughs. http://www.meta-net.eu 23

Thank you! http://www.meta-net.eu/whitepapers http://www.meta-net.eu/sra Acknowledgements: This work would not have been possible without the dedication and commitment of our colleagues Aljoscha Burchardt, Kathrin Eichler, Tina Klüwer, Arle Lommel, Felix Sasaki and Hans Uszkoreit (all DFKI), the 60 member organisations of the META-NET network of excellence, the ca. 70 members of the Vision Groups, the ca. 30 members of the META Technology Council, the more than 200 authors of and contributors to the META-NET Language White Paper Series and the ca. 200 representatives from industry and research who contributed to the SRA. 24