Αυτόματη Μετάφραση: Τι είναι σήμερα και πως λειτουργεί. Στέλιος Πιπερίδης ELRC, ΙΕΛ/ΕΚ «Αθηνά»



Σχετικά έγγραφα
Σκοπός και στόχοι της Ημερίδας Εργασίας. Στέλιος Πιπερίδης ELRC, ΙΕΛ/ΕΚ «Αθηνά»

Η εξέλιξη στα συστήματα Μηχανικής Μετάφρασης

Σκοπός και στόχοι της Ημερίδας Εργασίας. Στέλιος Πιπερίδης ELRC, ΙΕΛ/ΕΚ «Αθηνά»

Γλώσσα και Γλωσσική Τεχνολογία στην Ελλάδα

ΟΡΓΑΝΙΣΜΟΣ ΒΙΟΜΗΧΑΝΙΚΗΣ ΙΔΙΟΚΤΗΣΙΑΣ

Τι είδους δεδομένα χρειάζονται; Προκόπης Προκοπίδης ΙΕΛ/ΕΚ «Αθηνά»

SDL Trados Studio 2014 Starter Πώς να γίνετε πιο Παραγωγικοί (κωδ. Β036)

Προσαρμογή Γνωστικού Αντικειμένου σε. Στατιστικής Μηχανικής Μετάφρασης

Πώς μπορεί κανείς να έχει έναν διερμηνέα κατά την επίσκεψή του στον Οικογενειακό του Γιατρό στο Ίσλινγκτον Getting an interpreter when you visit your

Εθνικές Γλώσσες και Πολυγλωσσία

Πέτρος Γ. Οικονομίδης Πρόεδρος και Εκτελεστικός Διευθυντής

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΑΛΛΗΛΟΓΡΑΦΙΑ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑ ΣΤΗΝ ΑΓΓΛΙΚΗ ΓΛΩΣΣΑ

3/6/2015. Τιτίκα Δημητρούλια Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης

Πρακτική Εφαρμογή του Προγράμματος Σπουδών Επιπέδου Α' στην Διδασκαλία της Ελληνικής Γλώσσας. Στέφανος Παπαζαχαρίας

ΕΘΝΙΚΗ ΣΧΟΛΗ ΗΜΟΣΙΑΣ ΙΟΙΚΗΣΗΣ

ΟΙ ΑΞΙΕΣ ΤΗΣ ΖΩΗΣ THE VALUES OF LIFE Η ΥΠΕΥΘΥΝΟΤΗΤΑ..THE RESPONSIBILITY ΔΗΜΗΤΡΑ ΚΩΝΣΤΑΝΤΙΝΟΥ

Φθινοπώριασε και μύρισε σχολείο! Τα μικρά νηπιαγωγάκια ζωγραφίζουν το σχολείο που τους φαίνεται τόσο μεγάλο... Ρωτήθηκαν για το τι τους έκανε πιο

AΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ. Πτυχιακή εργασία Η ΚΑΤΑΘΛΙΨΗ ΣΕ ΕΦΗΒΟΥΣ ΜΕ ΣΑΚΧΑΡΩΔΗ ΔΙΑΒΗΤΗ ΤΥΠΟΥ 1

«ΨΥΧΙΚΗ ΥΓΕΙΑ ΚΑΙ ΣΕΞΟΥΑΛΙΚΗ» ΠΑΝΕΥΡΩΠΑΪΚΗ ΕΡΕΥΝΑ ΤΗΣ GAMIAN- EUROPE

Διαμοιρασμός δεδομένων & γλωσσικών πόρων: τεχνικά ζητήματα. Πένυ Λαμπροπούλου ΙΕΛ/ΕΚ "ΑΘΗΝΑ"

ΧΡΗΣΗ ΣΩΜΑΤΩΝ ΚΕΜΕΝΩΝ ΩΣ ΛΕΞΙΚΟΓΡΑΦΙΚΗ ΕΛΛΗΝΟ ΑΓΓΛΙΚΟ ΣΩΜΑ ΚΕΙΜΕΝΩΝ ΣΟΦΙΑ ΤΡΥΠΑΝΑΓΝΩΣΤΟΠΟΥΛΟΥ

LESSON 26 (ΜΑΘΗΜΑ ΕΙΚΟΣΙ ΕΞΙ) REF : 102/030/ November 2014

15 Ο ΕΠΑΛ ΘΕΣΣΑΛΟΝΙΚΗΣ 30/3/2016

Τη γλώσσα μου έδωσαν ellhnikh. Μαρία Γαβριηλίδου, ΙΕΛ/ΕΚ Αθηνά Παγκόσμια Ημέρα Μετάφρασης 29 Σεπτεμβρίου 2018, ΕΙΕ

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΓΕΩΤΕΧΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ. Πτυχιακή εργασία

Scientix, η κοινότητα για την Εκπαίδευση STEM στην Ευρώπη

Ενότητα 2 Εργαλεία για την αναζήτηση εργασίας: Το Βιογραφικό Σημείωμα

τι σημαίνει ΚΑΡΙΕΡΑ ΣΤΙΣ ΔΗΜΟΣΙΕΣ ΣΧΕΣΕΙΣ; Έλια Λιατάκη Διευθύνουσα Σύμβουλος

e-satisfaction: Η ψηφιακη πλατφόρμα μέτρησης της γνώμης & ικανοποίησης των online καταναλωτών

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΠΗΡΕΑΖΕΙ ΤΗΝ ΠΡΟΛΗΨΗ ΚΑΡΚΙΝΟΥ ΤΟΥ ΜΑΣΤΟΥ

S. Gaudenzi,. π υ, «aggregation problem»

ΕΘΝΙΚΗ ΣΧΟΛΗ ΔΗΜΟΣΙΑΣ ΔΙΟΙΚΗΣΗΣ ΙΓ' ΕΚΠΑΙΔΕΥΤΙΚΗ ΣΕΙΡΑ

Πληροφορίες για το νέο HSK

Μηχανική μετάφραση η πλατφόρμα CEF.AT και τα οφέλη για τους δημόσιους φορείς

ΓΛΩΣΣΑ & ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΣΤΗΝ ΚΥΠΡΟ

ΕΥΡΩΠΑΪΚΗ ΕΠΙΤΡΟΠΗ ΓΕΝΙΚΗ ΔΙΕΥΘΥΝΣΗ ΜΕΤΑΦΡΑΣΗΣ

Πολυγλωσσία και Ευρωπαϊκή Ένωση

ΣΧΕΔΙΑΣΜΟΣ ΚΑΙ ΕΝΙΣΧΥΣΗ ΤΩΝ ΚΟΜΒΩΝ ΟΠΛΙΣΜΕΝΟΥ ΣΚΥΡΟΔΕΜΑΤΟΣ ΜΕ ΒΑΣΗ ΤΟΥΣ ΕΥΡΩΚΩΔΙΚΕΣ

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΑΛΛΗΛΟΓΡΑΦΙΑ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑ ΣΤΗΝ ΑΓΓΛΙΚΗ ΓΛΩΣΣΑ

Προδιαγράφοντας τα προκαθορισμένα: Η σημασία των προαπαιτούμενων προεπιλογών στις προμήθειες

Επικοινωνία, Μάθηση και Προσεγγίσεις Αποτελεσματικής Διδασκαλίας Λευκωσία 26 Φεβρουαρίου 2014

LESSON 16 (ΜΑΘΗΜΑ ΔΕΚΑΕΞΙ) REF : 102/018/16-BEG. 4 March 2014

Κατανοώντας και στηρίζοντας τα παιδιά που πενθούν στο σχολικό πλαίσιο

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ

7 Present PERFECT Simple. 8 Present PERFECT Continuous. 9 Past PERFECT Simple. 10 Past PERFECT Continuous. 11 Future PERFECT Simple

36 ο Δημοτικό Σχολείο Αθηνών ΣΧΕΔΙΟ ΔΡΑΣΗΣ. ΤΙΤΛΟΣ: ΠΑΙΔΙ και ΕΥΡΩΠΑΙΚΗ ΕΝΩΣΗ-Μάθε τα Δικαιώματά σου

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

ΜΕΤΑΦΡΑΣΗ ΓΕΝΙΚΩΝ ΚΕΙΜΕΝΩΝ Ι

Constantinou, Andreas

Πληροφορική & Νέο Λύκειο (Εισαγωγή)

JUNIOR FORENSICS Dear Parents,

Τεχνολογία Ψυχαγωγικού Λογισμικού και Εικονικοί Κόσμοι Ενότητα 8η - Εικονικοί Κόσμοι και Πολιτιστικό Περιεχόμενο

-ΔΕΛΤΙΟ ΤΥΠΟΥ- Εκδήλωση Ενημέρωσης για τη λίμνη Ορόκλινης και το έργο LIFE Oroklini

New Technologies in Security and Citizens Rights. Λίλιαν Μήτρου Αναπληρώτρια Καθηγήτρια Πανεπιστήμιο Αιγαίου

ΕΥΡΩΠΑΙΚΟ ΠΡΟΓΡΑΜΜΑ ΔΙΑ ΒΙΟΥ ΜΑΘΗΣΗ EUROPEAN LANGUAGE LABEL ΕΘΝΙΚΗ ΠΡΟΣΚΛΗΣΗ ΥΠΟΒΟΛΗΣ ΠΡΟΤΑΣΕΩΝ 2013

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ

Τεχνητή Νοημοσύνη. 21η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

John Mavrikakis ENGLISH MULTIBOOK

going digital to the future SHADING SYSTEMS

ΣΥΝΕΔΡΙΟ ΚΡΑΤΙΚΕΣ ΕΝΙΣΧΥΣΕΙΣ ΠΡΟΣΦΑΤΕΣ ΕΞΕΛΙΞΕΙΣ. Κέντρο Διεθνούς & Ευρωπαϊκού Οικονομικού Δικαίου (ΚΔΕΟΔ) Μονάδα Κρατικών Ενισχύσεων (ΜοΚΕ)

ΟΡΟΙ ΚΑΙ ΠΡΟΥΠΟΘΕΣΕΙΣ ΣΧΕΔΙΟΥ

Table of Contents. Περιεχόμενα Γραμματικής - Grammar Contents

3 Ο Συνέδριο Ταμείων Προνοίας & Ταμείων Συντάξεων

Μετάφραση. Οδηγός Αγοράς. metaphrasis

Animals Ζώα Come and listen to them all. Ελάτε να τ ακούσετε όλα. pages 54 and 55 Lesson 1

SDL Trados Studio 2014 Intermediate + Advanced (κωδ. Β070)

Πτυχιακή Εργασία. Παραδοσιακά Προϊόντα Διατροφική Αξία και η Πιστοποίηση τους

clarin:el δημιουργώ, επεξεργάζομαι, μοιράζομαι Στέλιος Πιπερίδης, Πένυ Λαμπροπούλου, Μαρία Γαβριηλίδου Ε.Κ. Αθηνά / ΙΕΛ

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ. Πτυχιακή εργασία ΑΓΧΟΣ ΚΑΙ ΚΑΤΑΘΛΙΨΗ ΣΕ ΓΥΝΑΙΚΕΣ ΜΕ ΚΑΡΚΙΝΟΥ ΤΟΥ ΜΑΣΤΟΥ ΜΕΤΑ ΑΠΟ ΜΑΣΤΕΚΤΟΜΗ

Προγραμματισμός Η/Υ. Προτεινόμενα θέματα εξετάσεων Εργαστήριο. Μέρος 1 ό. ΤΕΙ Λάρισας- Σχολή Τεχνολογικών Εφαρμογών Τμήμα Πολιτικών Έργων Υποδομής

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ. Πτυχιακή εργασία

Objectives-Στόχοι: -Helping your Child become a fantastic language learner «Βοηθώντας το παιδί σας να γίνει εξαιρετικό στην εκμάθηση γλωσσών» 6/2/2014

ΤΡΟΠΟΛΟΓΙΕΣ EL Eνωμένη στην πολυμορφία EL 2008/0227(COD) Σχέδιο έκθεσης Anja Weisgerber (PE v01-00)

ΟΙΚΟΝΟΜΟΤΕΧΝΙΚΗ ΑΝΑΛΥΣΗ ΕΝΟΣ ΕΝΕΡΓΕΙΑΚΑ ΑΥΤΟΝΟΜΟΥ ΝΗΣΙΟΥ ΜΕ Α.Π.Ε

Αναζήτηση Πληροφοριών στο Διαδίκτυο

GREECE BULGARIA 6 th JOINT MONITORING

Διαβίβαση προσωπικών δεδομένων στο πλαίσιο του νέου προτεινόμενου Κανονισμού

Verklarte Nacht, Op.4 (Εξαϋλωμένη Νύχτα, Έργο 4) Arnold Schoenberg ( )

Παράγοντες επιτυχίας. ΗΜΥ 100 Εισαγωγή στην Τεχνολογία ιάλεξη 2β ΤΑ ΘΕΜΑΤΑ ΜΑΣ ΣΗΜΕΡΑ

ΤΟ ΣΤΑΥΡΟΔΡΟΜΙ ΤΟΥ ΝΟΤΟΥ ΤΟ ΛΙΜΑΝΙ ΤΗΣ ΚΑΛΑΜΑΤΑΣ

Δυσλεξία και Ξένη Γλώσσα

ΟΝΟΜΑΤΟΔΟΣΙΑ ΚΑΙ IP ΔΙΕΥΘΥΝΣΕΙΣ. ΜΕΡΟΣ 2 ο

Εισαγωγή στην Επιστήμη του Μηχανικού Περιβάλλοντος

Οδηγός αναζήτησης στο Google και στο Google Scholar

Από την Κριτική Εθνογραφία στην Κριτική Έρευνα Δράσης: Ένα συνεχές στο σχεδιασμό της εκπαιδευτικής καινοτομίας 1

Αξιολόγηση μεταφράσεων ιταλικής ελληνικής γλώσσας

Writing for A class. Describe yourself Topic 1: Write your name, your nationality, your hobby, your pet. Write where you live.

«ΑΓΡΟΤΟΥΡΙΣΜΟΣ ΚΑΙ ΤΟΠΙΚΗ ΑΝΑΠΤΥΞΗ: Ο ΡΟΛΟΣ ΤΩΝ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ ΣΤΗΝ ΠΡΟΩΘΗΣΗ ΤΩΝ ΓΥΝΑΙΚΕΙΩΝ ΣΥΝΕΤΑΙΡΙΣΜΩΝ»

Παρουσίαση της απαλλακτικής εργασίας στο μάθημα Νέες Τεχνολογίες στην Επιστημονική Έρευνα: Διαδίκτυο και Εκπαίδευση (Εαρινό 2015)

ΠΕΡΙ ΑΠΕΙΛΟΥΜΕΝΩΝ ΖΩΩΝ...ΑΝΘΡΩΠΩΝ ΕΡΓΑ.

ΑΘΗΝΑ 2013 ΑΝΑΛΥΣΗ ΕΠΕΞΕΡΓΑΣΜΕΝΟΥ ΥΔΑΤΟΣ (ΛYΜΑΤΩΝ) FRAMME - LIFE08 NAT/GR/ ΡΟΔΟΣ

ΣΗΣΛΟ: Ζ ΥΡΖΖ ΒΗΟΛΟΓΗΚΧΝ ΠΡΟΗΟΝΣΧΝ ΣΟΝ ΑΓΡΟΣΟΤΡΗΜΟ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΜΣ «ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ» ΚΑΤΕΥΘΥΝΣΗ «ΕΥΦΥΕΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΕΠΙΚΟΙΝΩΝΙΑΣ ΑΝΘΡΩΠΟΥ - ΥΠΟΛΟΓΙΣΤΗ»

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία ιάλεξη 6

Business Opening. Very formal, recipient has a special title that must be used in place of their name

ΙΕΡΕΥΝΗΣΗ ΤΗΣ ΠΟΙΟΤΗΤΑΣ ΤΟΥ ΝΕΡΟΥ ΑΝΘΡΩΠΙΝΗΣ ΚΑΤΑΝΑΛΩΣΗΣ ΚΑΙ ΤΩΝ ΠΑΡΑΜΕΤΡΩΝ ΠΟΥ ΤΗΝ ΕΠΗΡΕΑΖΟΥΝ

ΤΕΙ ΚΑΒΑΛΑΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΙΑΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ

Μάθηση σε κίνηση (Mobile learning) Χαρίκλεια Τσαλαπάτα 16/11/2016

Transcript:

Αυτόματη Μετάφραση: Τι είναι σήμερα και πως λειτουργεί Στέλιος Πιπερίδης ELRC, ΙΕΛ/ΕΚ «Αθηνά»

Μηχανική Μετάφραση Περιεχόμενα: Μηχανική Μετάφραση (ΜΜ), ποιότητα και κόστος; Γιατί είναι δύσκολη η ΜΜ; ΜΜ + άνθρωποι-μεταφραστές = ποιότητα Πως δουλεύει η σύγχρονη στατιστική μηχανική μεταφραστική τεχνολογία; Το παν είναι τα δεδομένα! Και μάλιστα τα σωστά και κατάλληλα δεδομένα! Image: http://www.freeimages.com/photo/keyboard-1243553 License: Freeimages.com Content License Modified: Arle Lommel 2

Μηχανική μετάφραση, ποιότητα και κόστος; Ευρώπη = Πολυγλωσσία 24 επίσημες γλώσσες, 24+2 CEF γλώσσες Μεγάλοι όγκοι περιεχομένου προς μετάφραση Κόστος μετάφρασης!; Μπορεί η ΜΜ να βοηθήσει; Και η ποιότητα του αποτελέσματος; Image: https://en.wikipedia.org/wiki/eniac#/media/file:eniac.jpg License: public domain 3

Γιατί είναι δύσκολη η ΜΜ; Η (φυσική) γλώσσα είναι εξαιρετικά : κομψή αποτελεσματική ευέλικτη σύνθετη Μία λέξη/πρόταση μπορεί να έχει πολλές διαφορετικές σημασίες (αμφισημία) Πολλοί διαφορετικοί τρόποι για να εκφραστεί το ίδιο νόημα (ποικιλία) Η σημασία εξαρτάται από το περικείμενο (context) Κυριολεκτική και μεταφορική χρήση (μεταφορά) Γλώσσα και πολιτισμός (διαφορετικοί τρόποι νοητικής σύλληψης του ίδιου πράγματος) Σειρά λέξεων / όρων μιας πρότασης Μορφολογία Image: http://workingtropes.lmc.gatech.edu/wiki/index.php/file:man-vs-machine.jpg License: CC BY-NC-SA 3.0 4

Η πολυπλοκότητα γλώσσας και μετάφρασης Ανάλυση/κατανόηση γλώσσας και μετάφραση: δύο απαιτητικά εγχειρήματα Δεν είναι δυνατός ο ακριβής «υπολογισμός» Προσπάθειες για νομοθετικές προσεγγίσεις, τόσο για τη μετάφραση όσο και την ανάλυση/κατανόηση Τι κάνουμε? Μηχανική μάθηση (machine learning) Μαθαίνουμε από δεδομένα τα δεδομένα είναι το παν Προσεγγιστική λύση ατελής, χρειάζεται επεξεργασία Επαγγελματίες μεταφραστές Μετεπεξεργασία (post-editing) Μηχανική μετάφραση Αυτόματη μετάφραση 5

Γιατί είναι η ΜΜ δύσκολη: Παραδείγματα Από εφημερίδες των τελευταίων ημερών/μηνών: 1. Θα γίνει κούρεμα στις συντάξεις κάτω των 1.000 2. Το Grexit φεύγει από το τραπέζι μετά τη νίκη Τσίπρα εκτιμούν Γερμανοί οικονομολόγοι 3. Ποιοι θίγονται από τα πρώτα σκληρά μέτρα εφαρμογής του μνημονίου 4. Νέα Δημοκρατία: Ποιοι ενδιαφέρονται για την προεδρία 5. Ασπίδα κατά της κατάθλιψης η πολλή κατανάλωση ψαριών 6

Γιατί είναι η ΜΜ δύσκολη: Παραδείγματα Take your time / It s raining cats and dogs Με την ησυχία σου / Βρέχει καρεκλοπόδαρα Η Γερμανίδα καγκελάριος Άνγκελα Μέρκελ θα κάνει μία ανακοίνωση την Πέμπτη. Angela Merkel wird am Donnerstag eine Ankündigung machen 7

Πώς λειτουργεί η σύγχρονη ΜΜ? Δεν θα σας κουράσουμε με μαθηματικούς τύπους αντίθετα Θα μιλήσουμε για τη στατιστική ΜΜ μέσα από εικόνες 9

Πως λειτουργεί η σύγχρονη ΜΜ; Η στατιστική ΜΜ μαθαίνει από δεδομένα Δύο είδη δεδομένων: Πρωτότυπα κείμενα και μεταφράσεις τους Κείμενα στη γλώσσα στόχο Οσο περισσότερα δεδομένα, τόσο το καλύτερο! Και βέβαια: τα κατάλληλα δεδομένα! 10

Πως λειτουργεί η σύγχρονη ΜΜ; Αγγλικό Κείμενο προς μετάφραση Μετάφραση στα Ελληνικά 11

Τι μαθαίνουμε από αυτά τα δεδομένα; Ποιες προτάσεις μεταφράζονται ως ποιες: Στοίχιση προτάσεων Ποιες λέξεις μεταφράζονται ως ποιες: Στοίχιση λέξεων + πιθανότητες μεταφράσεων λέξεων Πως μοιάζει μια καλή πρόταση στη γλώσσα στόχο: Γλωσσικό Μοντέλο (language model) 12

Στοίχιση προτάσεων (με τον LF aligner) 13

Πως μαθαίνει ο υπολογιστής να στοιχίζει λέξεις; 14

Πως μαθαίνει ο υπολογιστής να στοιχίζει λέξεις; 15

Μαθαίνοντας πώς να μεταφράζουμε κάθε λέξη: Η διαδικασία στοίχισης λέξεων δεν γνωρίζει πολλά για τις Κινέζικες σούπες του προηγούμενου παραδείγματος Ο αλγόριθμος από μόνος του δεν γνωρίζει τίποτα Αυτό που γνωρίζει είναι αυτό που βλέπει στα δεδομένα εκπαίδευσης Όπως και ο άνθρωπος Αν έχουμε πολλά δεδομένα με λέξεις στοιχισμένες με τις μεταφράσεις τους, μπορούμε να κατασκευάσουμε ένα μεταφραστικό λεξικό? Φυσικά, πολύ εύκολα 16

Στατιστική Μηχανική Μετάφραση Στοιχισμένα δεδομένα Ελληνικά Εγώ αγαπώ το σκύλο. Εγώ αγαπώ το παιδί. Αυτοί αγαπούν το σκύλο. Αυτοί μιλούν στη γυναίκα. Αυτοί μιλούν στο σκύλο. Εγώ μιλώ στο παιδί.. Αγγλικά I love the dog. I love the child. They love the dog. They talk to the woman. They talk to the dog. I talk to the child.. 17

Στατιστική Μηχανική Μετάφραση talk μιλούν 2 μιλώ 1 I love the dog. Εγώ αγαπώ το σκύλο. I love the child. Εγώ αγαπώ το παιδί. They love the dog. Αυτοί αγαπούν το σκύλο. They talk to the woman. Αυτοί μιλούν στη γυναίκα. They talk to the dog. Αυτοί μιλούν στο σκύλο. I talk to the child. Εγώ μιλώ στο παιδί. I εγώ 3 child παιδί 2 love αγαπώ 2 they αυτοί 3 αγαπούν 1 woman γυναίκα 1 the το 3 to στο/_the 2 dog σκύλο 3 στη/_the 1 talk μιλούν 2 μιλώ 1 Συγκεντρωτικά στατιστικά Στοιχισμένα δεδομένα 18

Στατιστική Μηχανική Μετάφραση talk μιλούν 2 μιλώ 1 I love the dog. Εγώ αγαπώ το σκύλο. I love the child. Εγώ αγαπώ το παιδί. They love the dog. Αυτοί αγαπούν το σκύλο. They talk to the woman. Αυτοί μιλούν στη γυναίκα. They talk to the dog. Αυτοί μιλούν στο σκύλο. I talk to the child. Εγώ μιλώ στο παιδί. Δεδομένα εισόδου I εγώ 3 child παιδί 2 love αγαπώ 2 they αυτοί 3 αγαπούν 1 woman γυναίκα 1 the το 3 to στο/_the 2 dog σκύλο 3 στη/_the 1 talk μιλούν 2 μιλώ 1 I talk to the woman Συγκεντρωτικά στατιστικά Στοιχισμένα δεδομένα 19

Στατιστική Μηχανική Μετάφραση I love the dog. Εγώ αγαπώ το σκύλο. I love the child. Εγώ αγαπώ το παιδί. They love the dog. Αυτοί αγαπούν το σκύλο. They talk to the woman. Αυτοί μιλούν στη γυναίκα. They talk to the dog. Αυτοί μιλούν στο σκύλο. I talk to the child. Εγώ μιλώ στο παιδί. Δεδομένα εισόδου I εγώ 3 child παιδί 2 love αγαπώ 2 they αυτοί 3 αγαπούν 1 woman γυναίκα 1 the το 3 to στο/_the 2 dog σκύλο 3 στη/_the 1 talk μιλούν 2 I talk to the woman μιλώ 1 Συγκεντρωτικά στατιστικά Στοιχισμένα δεδομένα Έξοδος Εγώ μιλούν στο γυναίκα 20

Στατιστική Μηχανική Μετάφραση I love the dog. Εγώ αγαπώ το σκύλο. I love the child. Εγώ αγαπώ το παιδί. They love the dog. Αυτοί αγαπούν το σκύλο. They talk to the woman. Αυτοί μιλούν στη γυναίκα. They talk to the dog. Αυτοί μιλούν στο σκύλο. I talk to the woman Εγώ μιλούν στο γυναίκα 3/3 2/3 2/3 1/1 Εγώ μιλώ στη γυναίκα 3/3 1/3 1/3 1/1 I talk to the child. Εγώ μιλώ στο παιδί. Στοιχισμένα δεδομένα 21

Στατιστική Μηχανική Μετάφραση I love the dog. Εγώ αγαπώ το σκύλο. I love the child. Εγώ αγαπώ το παιδί. They love the dog. Αυτοί αγαπούν το σκύλο. They talk to the woman. Αυτοί μιλούν στη γυναίκα. They talk to the dog. Αυτοί μιλούν στο σκύλο. I talk to the child. Εγώ μιλώ στο παιδί. Στοιχισμένα δεδομένα I talk to the woman Εγώ μιλούν στο γυναίκα 3/3 2/3 2/3 1/1 Εγώ μιλώ στη γυναίκα 3/3 1/3 1/3 1/1 Πως θα επιλέξουμε; 22

Στατιστική Μηχανική Μετάφραση I love the dog. Εγώ αγαπώ το σκύλο. I love the child. Εγώ αγαπώ το παιδί. They love the dog. Αυτοί αγαπούν το σκύλο. They talk to the woman. Αυτοί μιλούν στη γυναίκα. They talk to the dog. Αυτοί μιλούν στο σκύλο. I talk to the child. Εγώ μιλώ στο παιδί. Στοιχισμένα δεδομένα Το γλωσσικό μοντέλο: Μας λέει τι είναι καλά σχηματισμένος λόγος στη γλώσσα στόχο Πως; Ποιες λέξεις ακολουθούν άλλες λέξεις και ποιες όχι Και μαθαίνει από μονογλωσσικά δεδομένα εγώ μιλώ είναι σωστό εγώ μιλούν είναι λάθος στη γυναίκα σωστό στο γυναίκα λάθος 23

Στατιστική Μηχανική Μετάφραση I love the dog. Εγώ αγαπώ το σκύλο. I love the child. Εγώ αγαπώ το παιδί. They love the dog. Αυτοί αγαπούν το σκύλο. They talk to the woman. Αυτοί μιλούν στη γυναίκα. They talk to the dog. Αυτοί μιλούν στο σκύλο. I talk to the child. Εγώ μιλώ στο παιδί. Στοιχισμένα δεδομένα I talk to the woman Εγώ μιλούν στο γυναίκα 3/3 2/3 2/3 1/1 Εγώ μιλώ στη γυναίκα 3/3 1/3 1/3 1/1 Το γλωσσικό μοντέλο 24

Πώς λειτουργεί η σύγχρονη ΜΜ; Καθόλου μαθηματικά σήμερα αντίθετα: Η ιστορία της Στατιστικής ΜΜ με εικόνες 25

Στατιστική Μηχανική Μετάφραση βάσει φράσεων Μέχρι στιγμής: Μεταφράζουμε μεμονωμένες λέξεις Χάνουμε τα συμφραζόμενα: όπως τη συμφωνία (η γυναίκα ) κλπ. Ως ένα βαθμό αυτά διορθώνονται από το γλωσσικό μοντέλο (language model) Ένα καλύτερο μοντέλο: Όχι απλά μεμονωμένες λέξεις Αλλά και μεταφράσεις φράσεων: the woman : η γυναίκα to the woman : στη γυναίκα I talk : Εγώ μιλώ 26

Στατιστική Μηχανική Μετάφραση I love the dog. Εγώ αγαπώ το σκύλο. I love the child. Εγώ αγαπώ το παιδί. They love the dog. Αυτοί αγαπούν το σκύλο. They talk to the woman. Αυτοί μιλούν στη γυναίκα. They talk to the dog. Αυτοί μιλούν στο σκύλο. I talk to the child. Εγώ μιλώ στο παιδί. Δεδομένα εισόδου I εγώ 3 child παιδί 2 love αγαπώ 2 they αυτοί 3 αγαπούν 1 woman γυναίκα 1 the το 3 to στο/_the 2 dog σκύλο 3 στη/_the 1 talk μιλούν 2 μιλώ 1 I talk to the woman Συγκεντρωτικά στατιστικά Στοιχισμένα δεδομένα Εξοδος Εγώ μιλούν στο γυναίκα 27

Στατιστική Μηχανική Μετάφραση talk μιλούν 2 μιλώ 1 I love the dog. Εγώ αγαπώ το σκύλο. I love the child. Εγώ αγαπώ το παιδί. They love the dog. Αυτοί αγαπούν το σκύλο. They talk to the woman. Αυτοί μιλούν στη γυναίκα. They talk to the dog. Αυτοί μιλούν στο σκύλο. I talk to the child. Εγώ μιλώ στο παιδί. Δεδομένα εισόδου I talk to the woman I love εγώ αγαπώ 2 I talk εγώ μιλώ 1 they love αυτοί αγαπούν 1 they talk αυτοί μιλούν 2 the dog το σκύλο 2 the child το παιδί 1 to the woman στη γυναίκα 1 to the dog στο σκύλο 1 to the child στο παιδί 1 Στοιχισμένα δεδομένα 28

Στατιστική Μηχανική Μετάφραση talk μιλούν 2 μιλώ 1 I love the dog. Εγώ αγαπώ το σκύλο. I love the child. Εγώ αγαπώ το παιδί. They love the dog. Αυτοί αγαπούν το σκύλο. They talk to the woman. Αυτοί μιλούν στη γυναίκα. They talk to the dog. Αυτοί μιλούν στο σκύλο. I talk to the child. Εγώ μιλώ στο παιδί. Δεδομένα εισόδου I talk to the woman I love εγώ αγαπώ 2 I talk εγώ μιλώ 1 they love αυτοί αγαπούν 1 they talk αυτοί μιλούν 2 the dog το σκύλο 2 the child το παιδί 1 to the woman στη γυναίκα 1 to the dog στο σκύλο 1 to the child στο παιδί 1 Στοιχισμένα δεδομένα Έξοδος Εγώ μιλώ στη γυναίκα 29

Στατιστική Μηχανική Μετάφραση βάσει φράσεων Πολύ καλύτερη από τη ΣΜΜ με λέξεις! Πρότυπη τεχνολογία: Google, Microsoft, Baidu, DGT, Μεταφραστικές εταιρίες Ελεύθερο λογισμικό Moses PB-SMT Το πιο ευρέως χρησιμοποιούμενο SMT σύστημα τόσο για εμπορική όσο και για ερευνητική χρήση Χρηματοδοτείται από την Ευρωπαϊκή Ένωση Χρησιμοποιείται από το DGT της Ευρωπαϊκής Ένωσης 30

ΣMM και δεδομένα Η Στατιστική Μηχανική Μετάφραση (ΣΜΜ) βασίζεται στα δεδομένα Η ΣΜΜ μαθαίνει πώς να μεταφράζει από δεδομένα Δεδομένα Μεταφράσεις (Δίγλωσσα δεδομένα) Μονόγλωσσα δεδομένα (Κείμενα στη γλώσσα-στόχο) Λεξικά, ορολογίες, οντολογίες, ονοματολογίες, Όπως και ο άνθρωπος έτσι και η ΣΜΜ είναι καλή σε αυτά που έχει μάθει 32

Παραδείγματα μεταφράσεων ΣΜΜ (1) «As set out in Article 1 of Directive 2001/42, the objective of that directive is to provide for a high level of protection of the environment and to contribute to the integration of environmental considerations into the preparation and adoption of plans and programmes with a view to promoting sustainable development, by ensuring that, in accordance with that directive, an environmental assessment is carried out of certain plans and programmes which are likely to have significant effects on the environment.» «Όπως ορίζεται στο άρθρο 1 της οδηγίας 2001/42, σκοπός της εν λόγω οδηγίας είναι η υψηλού επιπέδου προστασία του περιβάλλοντος και η ενσωμάτωση περιβαλλοντικών ζητημάτων στην προετοιμασία και θέσπιση σχεδίων και προγραμμάτων με σκοπό την προώθηση βιώσιμης ανάπτυξης, εξασφαλίζοντας ότι, σύμφωνα με την παρούσα οδηγία, θα γίνεται εκτίμηση των περιβαλλοντικών επιπτώσεων για ορισμένα σχέδια και προγράμματα που ενδέχεται να έχουν σημαντικές επιπτώσεις στο περιβάλλον.» Πηγή:http://old.eurlex.europa.eu/Notice.do?val=817755:cs&lang=en&list=817755:cs,817749:cs,817758:cs,817150:cs, 816557:cs,815613:cs,815165:cs,815152:cs,814361:cs,814353:cs,&pos=1&page=1&nbl=6414&pgs=10&hwords=susta inable%20development~&checktexte=checkbox&visu=#texte (ημ/νία εγγράφου : 10/09/2015) 33

Παραδείγματα μεταφράσεων ΣΜΜ (2) «To those of us who live here, the European Union is something that we argue about who s in, who s out, who s in charge [ ].» «Με εκείνες των ΗΠΑ που ζουν εδώ, η Ευρωπαϊκή Ένωση είναι κάτι που υποστηρίζουμε Who s, του οποίου, ποιος κάνει κουμάντο [ ].» «Pour ceux d entre nous qui vivent ici, l Union européenne est quelque chose que nous avançons sur qui, de l OMS, qui gouvernera [ ].» Πηγή:http://blog.europeana.eu/2015/05/a-big-idea-how-the-european-union-was-set-in-motion-65-years-ago/ 34

Παραδείγματα μεταφράσεων ΣΜΜ (3) Θα γίνει κούρεμα στις συντάξεις κάτω των 1.000 Will be 13-15-treated pensions below EUR 1,000 Τα 12 μέλη του σώματος των ενόρκων The 12 members the Aldermen Ασπίδα κατά της κατάθλιψης η πολλή κατανάλωση ψαριών Shield against depression too much fish consumption 35

ELRC: Δεδομένα 36

ΣΜΜ και δεδομένα 37

ELRC: Δεδομένα Χρειαζόμαστε τα κατάλληλα δεδομένα Εθνικές κυβερνήσεις, δημόσια διοίκηση, δημόσιες υπηρεσίες, μη-κυβερνητικές οργανώσεις Το CEF παρέχει πολυγλωσσικές υπηρεσίες στους Ευρωπαίους πολίτες και κάθε άλλο πελάτη της δημόσιας διοίκησης 38

ELRC: Δεδομένα Μορφή δεδομένων? Αρχεία Word και άλλων προγραμμάτων επεξεργασίας κειμένου Τύπου PPT και άλλων προγραμμάτων παρουσίασης Αρχεία προγραμμάτων υπολογιστικών φύλλων Αρχεία PDF Βάσεις δεδομένων Συστήματα διαχείρισης περιεχομένου Ιστοσελίδες Μεταφραστικές μνήμες 39

ELRC: Δεδομένα Που μπορούμε να βρούμε αυτά τα δεδομένα? Εθνικά ιδρύματα Υπουργεία / Βουλή των Ελλήνων Δημόσια διοίκηση Δημόσιες υπηρεσίες Μη κυβερνητικές οργανώσεις πιλοτικά έργα μεγάλης κλίμακας 40

ELRC: Δεδομένα Παραδοχές Πολλές δημόσιες υπηρεσίες έχουν στην κατοχή τους σχετικά δεδομένα Χωρίς να το γνωρίζουν Αν το γνωρίζουν, πολλές φορές δεν συνειδητοποιούν την αξία των δεδομένων Αν γνωρίζουν την αξία τους, διστάζουν να παραδώσουν τα δεδομένα αυτά 41

ELRC Βοηθήστε μας να πετύχει το CEF.AT Υπηρεσίες για τους πολίτες της Ευρώπης Υποστήριξη της πολυγλωσσίας Προώθηση των γλωσσικών τεχνολογιών Υποστηρίζοντας τη γλώσσα μας υποστηρίζουμε την Ευρώπη, και υποστηρίζοντας την Ευρώπη υποστηρίζουμε τη γλώσσα μας! 43