Προσαρμογή Γνωστικού Αντικειμένου σε. Στατιστικής Μηχανικής Μετάφρασης

Σχετικά έγγραφα
Η εξέλιξη στα συστήματα Μηχανικής Μετάφρασης

Πώς μπορεί κανείς να έχει έναν διερμηνέα κατά την επίσκεψή του στον Οικογενειακό του Γιατρό στο Ίσλινγκτον Getting an interpreter when you visit your

Σεμινάριο Βιβλιογραφίας στους προπτυχιακούς φοιτητές

Λέξεις κλειδιά: Αρωματικά και Φαρμακευτικά Φυτά, Κατευθυντήριες Γραμμές Γεωργικής Πρακτικής και Συγκομιδής, Α.Φ.Φ.

CHAPTER 25 SOLVING EQUATIONS BY ITERATIVE METHODS

Bayesian statistics. DS GA 1002 Probability and Statistics for Data Science.

Other Test Constructions: Likelihood Ratio & Bayes Tests

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΑΡΣΗ ΑΜΦΙΣΗΜΙΑΣ ΛΕΞΕΩΝ (ΑΠΟΣΑΦΗΝΙΣΗ ΕΝΝΟΙΑΣ ΛΕΞΕΩΝ) WORD SENSE DISAMBIGUATION

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ. Διπλωματική Εργασία Μεταπτυχιακού Διπλώματος Ειδίκευσης

ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ «ΘΕΜΑ»

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

CONTENTS. 1. Το Εκπαιδευτικό Πρόγραμμα του NG Europe Erasmus+ 2. Το Πρόγραμμα Πρακτικής Άσκησης του NG Europe. 3. Πως να συμμετάσχετε στο NG Europe

Σεμινάριο Βιβλιογραφίας στους προπτυχιακούς φοιτητές

Σεμινάριο Βιβλιογραφίας στους προπτυχιακούς φοιτητές

Αυτόματη Μετάφραση: Τι είναι σήμερα και πως λειτουργεί. Στέλιος Πιπερίδης ELRC, ΙΕΛ/ΕΚ «Αθηνά»

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΓΕΩΤΕΧΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ. Πτυχιακή εργασία

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

How to register an account with the Hellenic Community of Sheffield.

Εκπαίδευση και Πολιτισμός: έρευνα προκαταρκτικής αξιολόγησης μίας εικονικής έκθεσης

Τεχνητή Νοημοσύνη. 15η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ΟΙΚΟΝΟΜΟΤΕΧΝΙΚΗ ΑΝΑΛΥΣΗ ΕΝΟΣ ΕΝΕΡΓΕΙΑΚΑ ΑΥΤΟΝΟΜΟΥ ΝΗΣΙΟΥ ΜΕ Α.Π.Ε

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

Ευρωπαϊκός Αριθμός 112.

(Α.Σ.ΠΑΙ.Τ.Ε.) ΠΑΡΑΔΟΤΕΟ Δ3-5_3 1 ΕΠΙΣΤΗΜΟΝΙΚΗ ΕΡΓΑΣΙΑ ΣΕ ΔΙΕΘΝΕΣ ΕΠΙΣΤΗΜΟΝΙΚΟ ΣΥΝΕΔΡΙΟ. Vocational Technology Enhanced Learning (VocTEL) 2015

«Αξιολόγηση ατόμων με αφασία για Επαυξητική και Εναλλακτική Επικοινωνία, σύμφωνα με το μοντέλο συμμετοχής»

Η Αυτοματοποιημένη και μη-αυτοματοποιημένη αξιολόγηση συστήματος Στατιστικής Μηχανικής Μετάφρασης για το γλωσσικό ζεύγος Ελληνικά - Ιταλικά

Paper Reference. Paper Reference(s) 1776/04 Edexcel GCSE Modern Greek Paper 4 Writing. Thursday 21 May 2009 Afternoon Time: 1 hour 15 minutes

Derivation of Optical-Bloch Equations

C.S. 430 Assignment 6, Sample Solutions

Ψηφιακές Τεχνολογίες βασικά θεωρητικά ζητήματα με αναφορά στη διαδικασία σχεδιασμού

Μηχανική Μάθηση Hypothesis Testing

: Monte Carlo EM 313, Louis (1982) EM, EM Newton-Raphson, /. EM, 2 Monte Carlo EM Newton-Raphson, Monte Carlo EM, Monte Carlo EM, /. 3, Monte Carlo EM

European Business Law: The Direct Effect of Directives And The Free Movement of Goods

Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά δεδομένα

ΒΙΟΛΟΓΙΚΗ ΚΑΛΛΙΕΡΓΕΙΑ ΤΗΣ ΕΛΙΑΣ

Section 1: Listening and responding. Presenter: Niki Farfara MGTAV VCE Seminar 7 August 2016

Κάθε γνήσιο αντίγραφο φέρει υπογραφή του συγγραφέα. / Each genuine copy is signed by the author.

Παλεπηζηήκην Πεηξαηώο Τκήκα Πιεξνθνξηθήο Πξόγξακκα Μεηαπηπρηαθώλ Σπνπδώλ «Πξνεγκέλα Σπζηήκαηα Πιεξνθνξηθήο»

Areas and Lengths in Polar Coordinates

Ανάκτηση Πληροφορίας

Every set of first-order formulas is equivalent to an independent set

[4] 1.2 [5] Bayesian Approach min-max min-max [6] UCB(Upper Confidence Bound ) UCT [7] [1] ( ) Amazons[8] Lines of Action(LOA)[4] Winands [4] 1

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS

ΕΙΣΑΓΩΓΗ ΣΤOΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ

ΠΕΡΙΕΧΟΜΕΝΑ. Μάρκετινγκ Αθλητικών Τουριστικών Προορισμών 1

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΗΛΕΚΤΡΙΚΗΣ ΙΣΧΥΟΣ

Ζητήματα Τυποποίησης στην Ορολογία - ο ρόλος και οι δράσεις της Επιτροπής Ορολογίας ΤΕ21 του ΕΛΟΤ

Statistical Inference I Locally most powerful tests

Fractional Colorings and Zykov Products of graphs

A global biofuels outlook: U.S. RIN markets and EU proposals. Gerard Wynn Energy and climate columnist Thomson Reuters

Προετοιμάζοντας τον μελλοντικό δάσκαλο για το ψηφιακό σχολείο

Galatia SIL Keyboard Information

Οδηγός αναφοράς e-artined για τη Διδασκαλία Σχολικών Γνωστικών Αντικειμένων μέσω του Χορού

Strain gauge and rosettes

Αύξηση της αναγνωρισιµότητας µίας πράσινης επιχείρησης Υποενότητα 1

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΜΣ «ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΠΛΗΡΟΦΟΡΙΚΗΣ» ΚΑΤΕΥΘΥΝΣΗ «ΕΥΦΥΕΙΣ ΤΕΧΝΟΛΟΓΙΕΣ ΕΠΙΚΟΙΝΩΝΙΑΣ ΑΝΘΡΩΠΟΥ - ΥΠΟΛΟΓΙΣΤΗ»

ANSWERSHEET (TOPIC = DIFFERENTIAL CALCULUS) COLLECTION #2. h 0 h h 0 h h 0 ( ) g k = g 0 + g 1 + g g 2009 =?

Right Rear Door. Let's now finish the door hinge saga with the right rear door

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

«ΑΓΡΟΤΟΥΡΙΣΜΟΣ ΚΑΙ ΤΟΠΙΚΗ ΑΝΑΠΤΥΞΗ: Ο ΡΟΛΟΣ ΤΩΝ ΝΕΩΝ ΤΕΧΝΟΛΟΓΙΩΝ ΣΤΗΝ ΠΡΟΩΘΗΣΗ ΤΩΝ ΓΥΝΑΙΚΕΙΩΝ ΣΥΝΕΤΑΙΡΙΣΜΩΝ»

Προστασία των Υπόγειων Υδάτων στην Ευρώπη Η ΝΕΑ ΕΥΡΩΠΑΪΚΗ ΟΔΗΓΙΑ ΓΙΑ ΤΑ ΥΠΟΓΕΙΑ ΥΔΑΤΑ ΕΝΟΠΟΙΗΣΗ ΤΟΥ ΚΟΙΝΟΤΙΚΟΥ ΡΥΘΜΙΣΤΙΚΟΥ ΠΛΑΙΣΙΟΥ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΤΜΗΜΑΤΟΣ ΕΚΠΑΙΔΕΥΤΙΚΗΣ ΚΑΙ ΚΟΙΝΩΝΙΚΗΣ ΠΟΛΙΤΙΚΗΣ ΕΙΔΙΚΕΥΣΗ ΣΥΝΕΧΙΖΟΜΕΝΗΣ ΕΚΠΑΙΔΕΥΣΗΣ

Areas and Lengths in Polar Coordinates

Instruction Execution Times

Πέτρος Γ. Οικονομίδης Πρόεδρος και Εκτελεστικός Διευθυντής

February 2012 Source: Cyprus Statistical Service

Εγκατάσταση λογισμικού και αναβάθμιση συσκευής Device software installation and software upgrade

Καλώς ήλθατε στο δικό σας Τμήμα!!

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΑΛΛΗΛΟΓΡΑΦΙΑ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑ ΣΤΗΝ ΑΓΓΛΙΚΗ ΓΛΩΣΣΑ

Παναγιώτης Ραφαήλ Μπαλαξής ειδικευόμενος ιατρός Ουρολογική κλινική Γ.Ν.Θ. ΙΠΠΟΚΡΑΤΕΙΟ

Πρόγραμμα Συνάντησης

Ms. Mesimeri. 4 th Grade Greek Language HW 10/14-10/21 Week 9 NOTES

Dynamic types, Lambda calculus machines Section and Practice Problems Apr 21 22, 2016

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

( )( ) ( ) ( )( ) ( )( ) β = Chapter 5 Exercise Problems EX α So 49 β 199 EX EX EX5.4 EX5.5. (a)

ΣΟΡΟΠΤΙΜΙΣΤΡΙΕΣ ΕΛΛΗΝΙΔΕΣ

Ψηφιακό Μουσείο Ελληνικής Προφορικής Ιστορίας: πώς ένας βιωματικός θησαυρός γίνεται ερευνητικό και εκπαιδευτικό εργαλείο στα χέρια μαθητών

Εντατικοποίηση ινσουλινοθεραπείας2στον2σδ τύπου22. Δρ.2Χρίστος2Παστελλάς ΠΑΘΟΛΟΓΟΣ2 2ΔΙΑΒΗΤΟΛΟΓΟΣ ΛΕΜΕΣΟΣ,2ΚΥΠΡΟΣ 2013

Cite as: Pol Antras, course materials for International Economics I, Spring MIT OpenCourseWare ( Massachusetts

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ. Πτυχιακή Εργασία

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΜΗΧΑΝΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ. Πτυχιακή εργασία ΕΤΟΙΜΑΣΙΑ ΔΕΛΤΙΟΥ ΠΟΣΟΤΗΤΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΛΟΓΙΣΜΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΟΣ

PARTIAL NOTES for 6.1 Trigonometric Identities

6.3 Forecasting ARMA processes

ΕΘΝΙΚΗ ΣΧΟΛΗ ΗΜΟΣΙΑΣ ΙΟΙΚΗΣΗΣ

Exercises to Statistics of Material Fatigue No. 5

ΕΛΟΤ ΕΝ Σκυρόδεμα με Πιστοποίηση ελέγχου παραγωγής. Κ. Γεωργίου Πολ.Μηχανικός Ε.Μ.Π. Ειδικευμένος στην τεχνολογία σκυροδέματος

Αγαπητοί συνεργάτες,

ΣΗΣΛΟ: Ζ ΥΡΖΖ ΒΗΟΛΟΓΗΚΧΝ ΠΡΟΗΟΝΣΧΝ ΣΟΝ ΑΓΡΟΣΟΤΡΗΜΟ

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα

Approximation of distance between locations on earth given by latitude and longitude

The Simply Typed Lambda Calculus

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΜΗΧΑΝΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ. Πτυχιακή εργασία ΟΛΙΣΘΗΡΟΤΗΤΑ ΚΑΙ ΜΑΚΡΟΥΦΗ ΤΩΝ ΟΔΟΔΤΡΩΜΑΤΩΝ ΚΥΚΛΟΦΟΡΙΑΣ

Δημιουργία Λογαριασμού Διαχείρισης Business Telephony Create a Management Account for Business Telephony

UDZ Swirl diffuser. Product facts. Quick-selection. Swirl diffuser UDZ. Product code example:

Ενότητα 8 : Διαχείριση και καθοδήγηση άλλων

ΙΑΤΡΟΦΙΚΗ ΦΡΟΝΤΙ Α ΓΙΑ ΤΑΞΙ ΙΩΤΕΣ ΣΥΝΤΟΜΗΣ ΚΑΙ ΜΑΚΡΑΣ ΙΑΡΚΕΙΑΣ

Διαδικτυακά Εργαλεία για την Εκπαίδευση Ενηλίκων:

TAMIL NADU PUBLIC SERVICE COMMISSION REVISED SCHEMES

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΠΕΛΟΠΟΝΝΗΣΟΥ

Transcript:

Προσαρμογή Γνωστικού Αντικειμένου σε Συστήματα Στατιστικής Μηχανικής Μετάφρασης (MSc in AI UoE 2007) Δημήτρης Μαυροειδής 7/11/2007 1

Μηχανική Μετάφραση (Ιστορικά ά στοιχεία 1) 1668, Bishop John Wilkins Μεγάλη Οντολογία 1933, Petr Smirnov Troyanskii Μοντέλο Μηχανικής Μετάφρασης με 3 βήματα. 1949, Warren Weaver s memorandum «Ένα βιβλίο γραμμένο στα κινέζικα είναι απλά ένα βιβλίο γραμμένο στα αγγλικά κωδικοποιημένο στον Κινεζικό κώδικα. Έχοντας τη δυνατότητα να λύσουμε τα περισσότερα προβλήματα κρυπτογραφίας, δεν έχουμε ήδη χρήσιμες μεθόδους για μετάφραση; [ ] 7/11/2007 2

Μηχανική Μετάφραση (Ιστορικά ά στοιχεία 2) 1954, Το πρώτο σύστημα ΜΜ από την IBM Ρωσικά σε αγγλικά Λεξιλόγιο 250 λέξεων 1966, ALPAC «Δεν υπάρχει άμεση ή προβλέψιμη προοπτική χρήσιμης Μηχανικής Μετάφρασης» 1976, Σύστημα METEO (Καναδάς) 1976, SYSTRAN (Ευρωπαϊκή Επιτροπή) 7/11/2007 3

Προσεγγίσεις στη ΜΜ Βασισμένη σε Λεξικά (Dictionary based) Βασισμένη σε Κανόνες (Rule based) Βασισμένη σε Παραδείγματα (Example based) Στατιστική (Statistical) Υβριδική (Hybrid) 7/11/2007 4

Στατιστική Μηχανική Μετάφραση (1) Μηχανική Μάθηση (Machine Learning) Κανόνας του Bayes: P ( T S) = P( T ) P( S P ( S ) T ) arg maxt P( T S) = arg max T P( T ) P( S T ) S = Γλώσσα πηγή T = Γλώσσα στόχος 7/11/2007 5

Στατιστική Μηχανική Μετάφραση (2) Δίγλωσσο σώμα εκπαίδευσης IBM (5 διαδοχικά μοντέλα) Μοντέλα στηριγμένα σε λέξεις (word based) d) Μοντέλα στηριγμένα σε φράσεις (phrasebased): arg max T P ( T S ) = arg max T P ( T ) P ( S T )ω length(t) 7/11/2007 6

Ευθυγράμμιση 7/11/2007 7

Λειτουργία ενός συστήματος ΣΜΜ Προεπεξεργασία δεδομένων (Pre processing) Εκπαίδευση μοντέλων (Models training) Μοντέλο Μετάφρασης (ΜΜ) Μοντέλο Γλώσσας (ΜΓ) Υπολογισμός βέλτιστων βαρών (Tuning) Αποκωδικοποίηση (Decoding) Αξιολόγηση (Evaluation) Επαγγελματίες μεταφραστές, BLEU, NIST, METEOR, WER 7/11/2007 8

7/11/2007 9

Προεπεξεργασία δεδομένων Αριθμός Γραμμής 1 Αγγλικό αρχείο Ελληνικό αρχείο COMMISSION REGULATION (EEC) No ΚΑΝΟΝΙΣΜΟΣ (ΕΟΚ) αριθ. 3812/85 3812/85 ΤΗΣ ΕΠΙΤΡΟΠΗΣ 2 of 20 December 1985 της 20ής Δεκεμβρίου 1985 3 adjusting certain Regulations on milk and milk products by reason of the accession of Spain για την αναπροσαρμογή ορισμένων κανονισμών στον τομέα του γάλακτος και των γαλακτοκομικών προϊόντων, λόγω της προσχώρησης της Ισπανίας THE COMMISSION OF THE Η ΕΠΙΤΡΟΠΗ ΤΩΝ ΕΥΡΩΠΑΪΚΩΝ 4 EUROPEAN COMMUNITIES, ΚΟΙΝΟΤΗΤΩΝ, Having regard to the Treaty Έχοντας υπόψη: τη συνθήκη για 5 establishing the European την ίδρυση της Ευρωπαϊκής Economic Community, Οικονομικής Κοινότητας, 6 Having regard to the Act of την πράξη προσχώρησης της Ισπανίας Accession of Spain and Portugal και της Πορτογαλίας 7/11/2007 10

Εκπαίδευση Μοντέλου Γλώσσας 7/11/2007 11

Εκπαίδευση Μοντέλου Μετάφρασης 7/11/2007 12

Υπολογισμός Βέλτιστων Βαρών (Tuning) 7/11/2007 13

Αποκωδικοποίηση (Decoding) 7/11/2007 14

Αξιολόγηση 7/11/2007 15

MOSES Υλοποίηση μοντέλου στηριγμένου σε φράσεις Δυνατότητα προσθήκης επιπλέον πληροφορίας (κυρίως γλωσσολογικής) Αλγόριθμος αποκωδικοποίησης: Beam search Λογισμικό ανοιχτού κώδικα (sourceforge.net) 7/11/2007 16

Προσαρμογή Γνωστικού Αντικειμένου (1) Αμφισημία 1. Note («νότα» ή «σημείωση»;) 2. Log («κορμός δένδρου» ή «ημερολόγιο»;) Τα συμφραζόμενα βοηθούν: 1. Play that note on the piano v. Can I borrow your organic chemistry notes? 2. The Admiral needs the ship s log book v. These logs will be sent to the paper mill 7/11/2007 17

Προσαρμογή Γνωστικού Αντικειμένου (2) Τρέχοντα : Λαμβάνουν υπόψη λίγες περιρρέουσες λέξεις Γνωρίζοντας το γνωστικό αντικείμενο του κειμένου προς μετάφραση, η άρση της αμφισημίας γίνεται ευκολότερη. Στόχος: Προσαρμογή του συστήματος ΣΜΜ σε διαφορετικά γνωστικά αντικείμενα. Αναμένεται βελτίωση και του ύφους. 7/11/2007 18

Σώματα εκπαίδευσης 3 διαφορετικά σώματα εκπαίδευσης Europarl JRC Acquis Greek Paediatrics Journal 7/11/2007 19

Europarl 7/11/2007 20

JRC Acquis 7/11/2007 21

Greek Paediatrics Journal 7/11/2007 22

Προσεγγίσεις Επιβλεπόμενη μάθηση (Μέθοδος 1) Προϋπάρχοντα σώματα εκπαίδευσης Ιατρικό Europarl Μη επιβλεπόμενη μάθηση (Μέθοδος 2) Δημιουργία συστάδων (clusters) από το JRC Acquis Cluto (tree clusterer) 21 συστάδες (EUROVOC) 7/11/2007 23

Αποτελέσματα Μεθόδου 1 7/11/2007 24

Αποτελέσματα Μεθόδου 2 7/11/2007 25

Παράδειγμα μεθόδου 1 Baseline: «given all spontaneous the existing data, appears that the microvascular complications may προληφθούν with επίτευξη ευγλυκαιμίας. this the κύριος and αυστηρός θεραπευτικός both the be επιτεύξιμος only ρυθμίζονται also when and the μεταγευματικές γλυκαιμικές excursions.» Μέθοδος 1: «taking all existing data, microvascular complications can prevent achieving ευγλυκαιμίας. the main and strict therapeutic goal may be επιτεύξιμος only when adjusted also the μεταγευματικές γλυκαιμικές falls.» Μετάφραση αναφοράς: «Taken together, the existing evidence suggests that microvascular complications can be prevented by sustained normoglycaemia. This main and stringent target of therapy may be achievable only when postprandial glycaemic excursions are also addressed.» 7/11/2007 26

Συμπεράσματα Η εκπαίδευση ενός ΣΜΜ με ένα μικρό εξειδικευμένο σώμα σε συνδυασμό με ένα μεγάλο γενικό βελτιώνει σημαντικά την ποιότητα της μετάφρασης σε κείμενα του εξειδικευμένου σώματος. Ο υπολογισμός βέλτιστων βαρών (tuning) είναι ο πιο σημαντικός παράγοντας στη διαδικασία εκπαίδευσης Πρώτη χρήση του JRC Acquis στο σύστημα ΣΜΜ «MOSES» 7/11/2007 27

Βελτιώσεις Καλύτερος αλγόριθμος και διαδικασία συσταδοποίησης (clustering) Χρήση μηχανικής μάθησης για την αναγνώριση των προς μετάφραση κειμένων Χρήση λεξικού σε εξειδικευμένα κείμενα Καλύτερη ευθυγράμμιση των σωμάτων εκπαίδευσης 7/11/2007 28

Ερωτήσεις 7/11/2007 29