Η Αυτοματοποιημένη και μη-αυτοματοποιημένη αξιολόγηση συστήματος Στατιστικής Μηχανικής Μετάφρασης για το γλωσσικό ζεύγος Ελληνικά - Ιταλικά

Σχετικά έγγραφα
ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ. Διπλωματική Εργασία Μεταπτυχιακού Διπλώματος Ειδίκευσης

Προσαρμογή Γνωστικού Αντικειμένου σε. Στατιστικής Μηχανικής Μετάφρασης

(Statistical Machine Translation: SMT[1]) [2]

Η εξέλιξη στα συστήματα Μηχανικής Μετάφρασης

1530 ( ) 2014,54(12),, E (, 1, X ) [4],,, α, T α, β,, T β, c, P(T β 1 T α,α, β,c) 1 1,,X X F, X E F X E X F X F E X E 1 [1-2] , 2 : X X 1 X 2 ;

1 n-gram n-gram n-gram [11], [15] n-best [16] n-gram. n-gram. 1,a) Graham Neubig 1,b) Sakriani Sakti 1,c) 1,d) 1,e)

Π Ρ Ο Σ Κ Λ Η Σ Η. Τελετή μεταβίβασης εξουσίας των Πρυτανικών Aρχών

Εκπαίδευση Ενηλίκων και Μηχανική Μετάφραση στη διδασκαλία της ξένης γλώσσας

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος.

Ανασκόπηση Βιβλιογραφίας. Δρ. Ιωάννης Γκιόσος

Μεταπτυχιακή Διπλωματική Εργασία. Κ. Αλεξανδρής Αν. Καθηγητής, ΤΕΦΑΑ, ΑΠΘ

2. Μοντέλα Ερευνας Γενικά Μοντέλα έρευνας

Α.Σ.ΠΑΙ.Τ.Ε. Π.Μ.Σ. ΕΠΙΣΤΗΜΕΣ ΤΗΣ ΑΓΩΓΗΣ

ΕΙΔΙΚΟ ΕΝΤΥΠΟ ΠΕΡΙΓΡΑΦΗΣ ΜΑΘΗΜΑΤΩΝ. Υποχρεωτικής επιλογής (Κατεύθυνσης)

Buried Markov Model Pairwise

Κεφάλαιο 6ο: Παρόν και μέλλον της Υπολογιστικής Γλωσσολογίας

Η χρήση του MOODLE από την οπτική γωνία του ιαχειριστή

Παρουσίαση της εργασίας στο μάθημα Νέες Τεχνολογίες στην Επιστημονική Έρευνα: Διαδίκτυο και Εκπαίδευση (Εαρινό 2016) Β Μέρος. Γιώργος Μικρός ΕΚΠΑ

(Statistical Machine Translation: SMT [1])

Τίτλος Εργασίας Καινοτόμου Προγράμματος και Δράσης

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΠΑΙΔΑΓΩΓΙΚΟ ΤΜΗΜΑ ΠΡΟΣΧΟΛΙΚΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΔΙΔΑΣΚΟΥΣΑ: ΕΛΕΥΘΕΡΙΑ ΤΣΕΛΙΟΥ

Η ελληνική γλώσσα μέσα από αριθμούς: Μετρήσεις και στατιστική στην υπηρεσία της γλωσσολογίας

μ μ μ μ ( ) / μ μ

<5,0 5,0 6,9 7 7,9 8 8,9 9-10

Η ΜΕΣΩ ΜΕΤΑΦΡΑΣΗΣ ΕΠΙΚΟΙΝΩΝΙΑ Φρειδερίκη ΜΠΑΤΣΑΛΙΑ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Ελένη ΣΕΛΛΑ Ιόνιο Πανεπιστήμιο, Κέρκυρα

Α.Π.Θ. ΤΜΗΜΑ ΙΤΑΛΙΚΗΣ ΓΛΩΣΣΑΣ - ΥΠΟΒΟΛΗ ΑΙΤΗΣΕΩΝ ΓΙΑ ΕΚΠΟΝΗΣΗ ΔΙΔΑΚΤΟΡΙΚΗΣ ΔΙΑΤΡΙΒΗ

ΚΑΝΟΝΙΣΜΟΣ ΕΚΠΟΝΗΣΗΣ ΕΡΓΑΣΙΩΝ ΓΙΑ ΤΟ ΜΑΘΗΜΑ «ΕΠΕΞΕΡΓΑΣΙΑ ΨΗΦΙΑΚΟΥ ΣΗΜΑΤΟΣ ΚΑΙ ΣΧΕΔΙΑΣΜΟΣ ΥΛΙΚΟΥ»

1. ΓΕΝΙΚΟΙ ΚΑΝΟΝΕΣ ΚΑΙ ΠΡΟΥΠΟΘΕΣΕΙΣ ΛΗΨΗΣ ΠΤΥΧΙΟΥ

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

ΕΠΙΧΕΙΡΗΣΙΑΚΗ EΡΕΥΝΑ & ΔΙΟΙΚΗΤΙΚΗ ΕΠΙΣΤΗΜΗ OPERATIONS RESEARCH & MANAGEMENT SCIENCE

Εισαγωγή στη Γνωστική Ψυχολογία. επ. Κωνσταντίνος Π. Χρήστου

Η Επίδραση των Events στην Απόδοση των Μετοχών

Εκτίμηση Αξιολόγηση της Μάθησης

ΜΙΑ ΜΕΛΕΤΗ ΠΕΡΙΠΤΩΣΗΣ: ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΤΩΝ ΒΑΘΜΟΛΟΓΙΩΝ ΤΩΝ ΜΑΘΗΤΩΝ ΕΝΟΣ ΛΥΚΕΙΟΥ ΑΠΟ ΤΟ 2000 ΩΣ ΤΟ 2013.

Η αβεβαιότητα στη μέτρηση.

Αντώνης Βεντούρης. Επίκουρος Καθηγητής Διδακτικής των Γλωσσών Τμήμα Ιταλικής Γλώσσας και Φιλολογίας Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης

Αξιολόγηση μεταφράσεων ιταλικής ελληνικής γλώσσας

Αξιολόγηση μεταφράσεων ιταλικής ελληνικής γλώσσας

ΕΕΟ 11. Η χρήση στατιστικών εργαλείων στην εκτιμητική

"The Project ARXIMIDIS ΙΙ is co-funded by the European Social Fund and National Resources EPEAEK ΙΙ "

Τίτλος Εργασίας. Επώνυμο και Όνομα Πρώτου Εισηγητή (ΠΡΟΣΟΧΗ: πρώτα το Επώνυμο) Ιδιότητα, Εργασιακός Φορέας, Διεύθυνση

ΣΥΓΓΡΑΦΗ ΕΠΙΣΤΗΜΟΝΙΚΗΣ ΕΡΕΥΝΑΣ

Τίτλος Εργασίας Εκπαιδευτικού Σεναρίου

ΔΥΝΑΤΟΤΗΤΕΣ ΠΑΡΑΓΩΓΗΣ ΑΛΛΑΝΤΙΚΩΝ ΑΕΡΟΣ ΧΑΜΗΛΗΣ ΛΙΠΟΠΕΡΙΕΚΤΙΚΟΤΗΤΑΣ ΜΕ ΠΡΟΣΘΗΚΗ ΕΛΑΙΟΛΑΔΟΥ

ΒΑΣΙΚΕΣ ΑΡΧΕΣ ΔΙΑΣΦΑΛΙΣΗΣ ΤΗΣ ΠΟΙΟΤΗΤΑΣ ΤΩΝ ΑΚΑΔΗΜΑΙΚΩΝ ΤΜΗΜΑΤΩΝ ΤΟΥ ΤΕΙ ΣΤΕΡΕΑΣ ΕΛΛΑΔΑΣ (πρώην ΤΕΙ ΛΑΜΙΑΣ)

ΟΜΑΔΑ Λ. Αναστασίου Κωνσταντίνος Δεληγιάννη Ισαβέλλα Ζωγοπούλου Άννα Κουκάκης Γιώργος Σταθάκη Αρετιάννα

ΤΟ ΜΟΝΤΕΛΟ Οι Υποθέσεις Η Απλή Περίπτωση για λi = μi 25 = Η Γενική Περίπτωση για λi μi..35

Μ. Κορφιατη - Π. Γεωργίου ΒΙΒΛΙΟΘΗΚΗ & ΥΠΗΡΕΣΙΑ ΠΛΗΡΟΦΟΡΗΣΗΣ ΠΑΝ. ΠΑΤΡΩΝ

BSc (Hons) in Psychology (University of Greenwich)

Older Children Preparing for GCSE

Μεθοδολογία Έρευνας Διάλεξη 10 η ( ) Παρουσίαση Πτυχιακής Εργασίας

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ. Μεταπτυχιακό πρόγραμμα ΑΣΚΗΣΗ ΚΑΙ ΠΟΙΟΤΗΤΑ ΖΩΗΣ ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

Δρ. Σπύρος Παπαδάκης. Σχολή Θετικών Επιστημών & Τεχνολογίας Ελληνικό Ανοικτό Πανεπιστήμιο. Δρ. Σ. Παπαδάκης

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

Οδηγός. Σχολιασμού. Διπλωματικής Εργασίας

ΔΥΝΑΤΟΤΗΤΑ ΣΥΓΚΡΙΤΙΚΗΣ ΑΞΙΟΛΟΓΗΣΗΣ ΤΩΝ ΕΛΛΗΝΙΚΩΝ ΠΑΝΕΠΙΣΤΗΜΙΩΝ ΜΕ

Πολιτισμός και ψυχοπαθολογία:

Μελέτη κατώτατης απαιτούμενης βαθμολογίας στις εξετάσεις πιστοποίησης για την απόκτηση του τίτλου Διεθνώς Πιστοποιημένου Συμβούλου Γαλουχίας (IBCLC )

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Ποσοτικές ερευνητικές προσεγγίσεις

Πληροφορίες για το νέο HSK

Development of the Nursing Program for Rehabilitation of Woman Diagnosed with Breast Cancer

Μέθοδοι Κοινωνικής Έρευνας ΙI

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ. Μεταπτυχιακό πρόγραμμα ΑΣΚΗΣΗ ΚΑΙ ΠΟΙΟΤΗΤΑ ΖΩΗΣ ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

Πτυχιακή διατριβή. Η επίδραση της τασιενεργής ουσίας Ακεταλδεΰδης στη δημιουργία πυρήνων συμπύκνωσης νεφών (CCN) στην ατμόσφαιρα

Η μετεπιμέλεια της αυτόματης μετάφρασης ως μεταφραστική πράξη

Αναγνώριση Προτύπων Ι

Η ψηφιακή τεχνολογία στην ερευνητική δραστηριότητα Θέματα κουίζ. Υψηλάντης Γεώργιος, Βαβούρας Θεόδωρος Τμήμα Ιταλικής Γλώσσας & Φιλολογίας

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΤΗΣ ΕΠΙ ΟΣΗΣ ΤΩΝ ΦΟΙΤΗΤΩΝ ΥΟ ΑΚΑ ΗΜΑΪΚΩΝ ΤΜΗΜΑΤΩΝ ΕΝΟΣ ΑΕΙ ΩΣ ΠΡΟΣ ΤΟ ΣΥΣΤΗΜΑ ΕΙΣΑΓΩΓΗΣ ΤΟΥΣ ΣΤΗ ΤΡΙΤΟΒΑΘΜΙΑ ΕΚΠΑΙ ΕΥΣΗ

Ιδιότητες και Τεχνικές Σύνταξης Επιστημονικού Κειμένου

Στρατηγική έρευνας. Στρατηγική έρευνας. Η ερευνητική διαδικασία στη βιβλιοθήκη αρχίζει από τη στιγμή που χρειάζεται

Τίτλος Εργασίας Εργαστηριακής Παρουσίασης

Ιδιότητες και Τεχνικές Σύνταξης Επιστημονικού Κειμένου Σχολιασμός ερευνητικής πρότασης

Αναζητώντας θέμα έρευνας: ορισμένες μεθοδολογικές παρατηρήσεις. Δρ. Ηλίας Μαυροειδής

Αξιολόγηση μεταφράσεων ιταλικής ελληνικής γλώσσας

Μεθοδολογία Έρευνας Διάλεξη 1 η : Εισαγωγή στη Μεθοδολογία Έρευνας

ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ. Επιμέλεια Εκθέσεων

Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP)

Απόσπασμα από: «Οδηγός Συγγραφής Πτυχιακής Εργασίας. Αλεξάνδρα Οικονόμου, Βασίλης Παυλόπουλος & Πέτρος Ρούσσος

Αλγόριθμος Ομαδοποίησης

(econtent Localisation Resources for Translator Training)

ΟΡΓΑΝΙΣΜΟΣ ΒΙΟΜΗΧΑΝΙΚΗΣ ΙΔΙΟΚΤΗΣΙΑΣ

[Type text] ΓΕΝΙΚΕΣ ΟΔΗΓΙΕΣ ΓΙΑ ΤΗΝ ΕΚΠΟΝΗΣΗ, ΣΥΝΤΑΞΗ, ΣΥΓΓΡΑΦΗ ΚΑΙ ΥΠΟΒΟΛΗ ΤΗΣ ΔΙΔΑΚΤΟΡΙΚΗΣ ΔΙΑΤΡΙΒΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΑΜΕΣΕΣ ΞΕΝΕΣ ΕΠΕΝΔΥΣΕΙΣ ΣΕ ΕΥΡΩΠΑΙΚΕΣ ΧΩΡΕΣ

Καλημέρα. Καλημέρα. Καλημέρα

Σκοπός του μαθήματος

Ενότητα 4 η : Ανάλυση ερευνητικών δεδομένων. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Μοντέρνα Θεωρία Ελέγχου

ΑΠΟΓΡΑΦΙΚΟ ΔΕΛΤΙΟ ΜΕΤΑΠΤΥΧΙΑΚΗΣ ΕΡΓΑΣΙΑΣ ΤΙΤΛΟΣ

Ερευνητικό Κέντρο Ευφυών Συστημάτων και Δικτύων Κοίος

Κεφάλαιο 9. Έλεγχοι υποθέσεων

ΕΠΙΣΤΗΜΟΝΙΚΟΙ ΥΠΟΛΟΓΙΣΜΟΙ: Μια ενδιαφέρουσα σταδιοδρομία

Για την εξέταση των Αρχαίων Ελληνικών ως μαθήματος Προσανατολισμού, ισχύουν τα εξής:

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης

Λήψη αποφάσεων κατά Bayes

An Analysis of Problems in Grammatical Error Correction of ESL Writings Using a Large Learner Corpus of English

Transcript:

111 Η Αυτοματοποιημένη και μη-αυτοματοποιημένη αξιολόγηση συστήματος Στατιστικής Μηχανικής Μετάφρασης για το γλωσσικό ζεύγος Ελληνικά - Ιταλικά Πολυξένη Κανελλιάδου* Κωνσταντίνος Χατζηθεοδώρου** Machine Translation (MT) evaluation is a hard task considering the difficulties that raise from the translation process itself. In this paper we present the results of the evaluation of a Statistical Machine Translation (SMT) system in which the Moses decoder was trained for the language pair Greek-Italian. The evaluation task was both automatic and non automatic (human). For the automatic evaluation, the metrics BLEU, NIST were used, while for the human evaluation, the adequacy and the fluency of the translated texts was evaluated. A corpus of 120 individual sentences were evaluated, (e.g. EU texts, scientific & technical texts, subtitles, proverbs etc.), by postgraduate students of the direction of Translation, Interpretation and Communication of the Department of Italian Language and Literature of the Aristotle University of Thessaloniki. The first results show that SMT performs well when translating text of this type 1. Εισαγωγή ΗΑυτόματη ή Μηχανική Μετάφραση (ΜΜ) (Machine Translation - MΤ) είναι ένα πεδίο της υπολογιστικής γλωσσολογίας (Computational Linguistics - CL) που ερευνά την μεταφορά ενός κειμένου από μία φυσική γλώσσα σε μία άλλη με τη χρήση κατάλληλου λογισμικού ηλεκτρονικών υπολογιστών (Hutchins 1992). Η μετάφραση που προάγεται από υπολογιστή απασχολεί τους ερευνητές εδώ και πολλά χρόνια, παρουσιάζοντας πολλές διακυμάνσεις (Σταύρου 2000). Ένα από τα πρώτα συστήματα ΜΜ παρουσιάστηκε το 1954 από την International Business Machines (IBM). Το σύστημα αυτό χρησιμοποιώντας ένα δείγμα 49 επιλεγμένων προτάσεων μεταφρασμένες από τα ρωσικά στα ** Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης. ** Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης.

112 Π. Κανελλιάδου Κ. Χατζηθεοδώρου αγγλικά, ένα περιορισμένο λεξιλόγιο 250 λέξεων και 6 απλούς κανόνες γραμματικής, μετέφραζε με μεγάλη επάρκεια (Hutchins, Lovtsky 2000). Από τότε μέχρι σήμερα προτάθηκαν πολλά συστήματα ΜΜ, τα οποία χρησιμοποιούν διάφορες προσεγγίσεις για μετάφραση φυσικών γλωσσών (Allen 1987, Nirenburg κ.ά. 1994). Οι τελευταίες εξελίξεις στον τομέα αυτό θέλουν την παραγωγή των μεταφράσεων με στατιστικές μεθόδους. Η ΣΜΜ αξιοποιεί παράλληλα σώματα κειμένων από τα οποία εκπαιδεύεται χρησιμοποιώντας διάφορες τεχνικές μηχανικής μάθησης (επιβλεπόμενης ή μη-επιβλεπόμενης). Παρόλα αυτά, ούτε και με αυτή την προσέγγιση οι ερευνητές κατάφεραν να λύσουν αυτό το μείζον πρόβλημα. Το σημαντικότερο πρόβλημα αποτελεί η αµφισηµία (λεξιλογική ή συντακτική ή υφολογική-πραγματολογική) των λέξεων. Ένα ακόμη πρόβλημα αφορά στη διαφορετική σύνταξη που υπάρχει ανάμεσα σε δύο γλώσσες. Τέλος, δεν υπάρχει πάντα αντιστοιχία 1:1 στις λέξεις διαφορετικών γλωσσών (Manning, Schutze 1999). Η αξιολόγηση της ΜΜ είναι ιδιαίτερα σημαντική, όσο σημαντική είναι και η δημιουργία ενός συστήματος ΜΜ. Ωστόσο, τις περισσότερες φορές τα αποτελέσματα εξάγονται αυτόματα από αλγόριθμους, καθώς η μη-αυτοματοποιημένη αξιολόγηση πρώτον είναι ακριβή και δεύτερον απαιτεί πολύ χρόνο (Papineni κ.ά. 2002). Στην παρούσα εργασία παρουσιάζονται τα αποτελέσματα αξιολόγησης ενός συστήματος ΣΜΜ που εκπαιδεύτηκε για το γλωσσικό ζεύγος Ελληνικά- Ιταλικά. Η αξιολόγηση έγινε τόσο με αυτοματοποιημένο όσο και με μη-αυτοματοποιημένο τρόπο. Για τον αυτοματοποιημένο τρόπο χρησιμοποιούνται οι γνωστές μετρικές αξιολόγησης BLEU/NIST, ενώ για τον μη αυτοματοποιημένο τρόπο αξιολογήθηκε η επάρκεια και η ευφράδεια λόγου. Συνολικά αξιολογήθηκαν 120 διαφορετικών ειδών προτάσεις από μεταπτυχιακούς φοιτητές της κατεύθυνσης Μετάφρασης, Διερμηνείας και Επικοινωνίας του Τμήματος Ιταλικής Γλώσσας και Φιλολογίας του Αριστοτέλειου Πανεπιστημίου Θεσσαλονίκης, στο πλαίσιο του μεταπτυχιακού μαθήματος με τίτλο «Μεταφραστικές μνήμες και προγράμματα αυτόματης μετάφρασης». 2. Στατιστική ΜΜ Η ΣΜΜ βασίζεται σε ιδέες δάνειες από το πεδίο της θεωρίας των Πληροφοριών (Shannon, Weaver 1963). Η ιδέα για στατιστικές προσεγγίσεις στη ΜΜ εκφράστηκε στο υπόμνημα του Weaver το 1949, αλλά πέρασαν πολλά χρόνια έως ότου αυξηθεί η υπολογιστική ισχύς και γίνουν πραγματικότητα τέτοιου είδους συστήματα. Το πρώτο σύστημα ΣΜΜ δημιουργήθηκε το 1988 από την IBM, στο ερευνητικό κέντρο Thomas J. Watson (Brown κ.ά. 1988). Το σύστημα αυτό που ονομάστηκε Candide, εκπαιδεύτηκε με το παράλληλο σώμα κειμένων του καναδικού κοινοβουλίου για το γλωσσικό ζεύγος Γαλλικά-Αγγλικά (Berger κ.ά. 1994). Ένα σύστημα ΜΜ που μεταφράζει βάσει στατιστικών κανόνων μπορεί να παρομοιαστεί με ένα θορυβώδες κανάλι (noisy channel), όπως αυτό του Σχήματος 1, το οποίο βασίζεται στο θεώρημα του Bayes (Bayes 1763).

Αξιολόγηση συστήματος Στατιστικής Μηχανικής Μετάφρασης για Ελληνικά - Ιταλικά 113 Σχήμα 1: θορυβώδες κανάλι του Bayes. Η εκπαίδευση ενός συστήματος στατιστικής ΜΜ είναι μια πολύπλοκη διαδικασία η οποία διαρκεί πολλές ημέρες ή εβδομάδες, ανάλογα με τον όγκο του σώματος κειμένων που θα χρησιμοποιηθεί. Κατά τη διαδικασία της εκπαίδευσης ενός συστήματος που μεταφράζει από τα ιταλικά it στα ελληνικά el, ο αλγόριθμος θεωρεί πως μία μεταφραστική μονάδα του ιταλικού κειμένου it αποτελεί μία πιθανή μετάφραση μίας μεταφραστικής μονάδας του ελληνικού κειμένου el, και αναθέτει σε κάθε τέτοιο ζεύγος μεταφραστικών μονάδων (it, el) την πιθανότητα P(it, el). Δηλαδή, την πιθανότητα σύμφωνα με την οποία ένας επαγγελματίας μεταφραστής θα παρήγαγε τη μεταφραστική μονάδα it ως πιθανή μετάφραση της μονάδας el. Η βέλτιστη επιλογή της μεταφραστικής μονάδας στη γλώσσα-πηγή ê, είναι αυτή για την οποία η πιθανότητα Pr(it, el) είναι υψηλότερη, χωρίς ωστόσο, να αποτελεί την ιδανικότερη μετάφραση (Brown κ.ά. 1990). Η παραπάνω διαδικασία μοντελοποιήθηκε χρησιμοποιώντας στατιστικές μεθόδους όπως φαίνεται στην Εξίσωση 1. ê = argmax it P (el it) P (it) (1)0 Στην παραπάνω εξίσωση παρατηρούμε πως για την επιλογή της σωστής ακολουθίας λέξεων ê ορίζονται δυο πιθανοτικά μοντέλα, το μεταφραστικό P (el, it) και το γλωσσικό P(it). Το μεταφραστικό μοντέλο προκύπτει από σώμα παράλληλων σωμάτων κειμένων, ενώ το γλωσσικό από επεξεργασία σώματος κειμένων στη γλώσσα-στόχο και βασίζεται σε ν-γράμματα (3-γράμματα). 3. Αξιολόγηση ΜΜ Η αξιολόγηση της ΜΜ αποτελεί μείζον πρόβλημα στην παγκόσμια κοινότητα της ΜΜ. Ένα σύστημα μπορεί να αξιολογηθεί με αυτοματοποιημένο ή με μη-αυτοματοποιημένο τρόπο. Ως μονάδα αξιολόγησης συνήθως χρησιμοποιείται η πρόταση. Η βαθμολογία κατά τον αυτοματοποιημένο τρόπο διαμορφώνεται με σύγκριση της προς αξιολόγηση πρότασης με ένα σώμα έγκυρων μεταφράσεων που έχει παράξει επαγγελματίας μεταφραστής (συνήθως 2-3 προτάσεις). Η βαθμολογία της μη-αυτοματοποιημένης διαδικασίας προκύπτει έπειτα από αξιολόγηση στην οποία συμμετέχουν γλωσσολόγοι ή επαγγελματίες μεταφραστές. Η αξιολόγηση της ΜΜ βοηθάει στη σύγκριση και αντιπαραβολή των μεταφραστικών συστημάτων και έχει ως αποτέλεσμα την εξέλιξη τους καθώς και τη δημιουργία νέων μετρικών σύγκρισης. Κάθε ερευνητής μπορεί να διαλέξει ανάμεσα σε πολλές μετρικές αυτόματης αξιολόγησης, χωρίς ωστόσο να υπάρχει καμία που να μπορεί να αντικαταστήσει την ανθρώπινη, καθώς οι άνθρωποι, λόγω της ευφυΐας που διαθέτουν, μπορούν να αναγνωρίσουν τις σχέσεις παράφρασης μεταξύ δύο εξίσου «καλών μεταφράσεων» και δεν περιορίζονται σε απλές συγκρίσεις συμβολοσειρών μίας ή περισσότερων έ- γκυρων μεταφράσεων. Στις παρακάτω ενότητες γίνεται αναφορά στις μετρικές αξιολόγησης BLEU και NIST και στην ανθρώπινη αξιολόγηση ARPA.

114 Π. Κανελλιάδου Κ. Χατζηθεοδώρου 3.1 Αυτοματοποιημένη αξιολόγηση BLEU και NIST Η μετρική αξιολόγησης BLEU (BiLingual Evaluation Understudy) προτάθηκε το 2002 από την IBM. Από τότε αποτελεί το επίσημο μετρικό των συστημάτων ΜΜ και κυρίως εκείνων που μεταφράζουν χρησιμοποιώντας στατιστικές μεθόδους. Αυτό συμβαίνει διότι από έρευνες προκύπτει πως τα αποτελέσματά του συσχετίζονται κατά πολύ με τα αποτελέσματα της ανθρώπινης αξιολόγησης. Ο αλγόριθμος λειτουργεί ανεξάρτητου γλώσσας, αλλά δε λαμβάνει υπόψη τη γραμματική ορθότητα των προτάσεων. Για την εκτίμηση της βαθμολογίας, η μεταφρασμένη πρόταση συγκρίνεται με 1-3 διαφορετικές μεταφράσεις από επαγγελματία μεταφραστή. Για τον λόγο αυτόν, είναι πολύ δύσκολο μια πρόταση να βαθμολογηθεί με άριστα, πράγμα που συμβαίνει πολύ συχνά κατά την ανθρώπινη αξιολόγηση. Για την εξαγωγή του τελικού αποτελέσματος ο αλγόριθμος λαμβάνει υπόψη του το μήκος της μεταφρασμένης πρότασης καθώς οι αυτόματα μεταφρασμένες προτάσεις συνήθως έχουν μικρότερο μήκος. Ένας άλλος αλγόριθμος που μοιάζει πολύ με τον BLEU, είναι ο NIST. Η ονομασία του προέρχεται από τα αρχικά του Εθνικού Ιδρύματος Προτύπων και Τεχνολογίας (National Institute of Standards and Technology) των ΗΠΑ. Ο αλγόριθμος αυτός βασίζεται στην ίδια λογική με τον BLEU και διαφέρει σε τρία σημεία όσον αφορά την εκτίμηση της βαθμολογίας. Η σημαντικότερη διαφορά των δύο αλγορίθμων είναι πως ο NIST χρησιμοποιεί τον αριθμητικό μέσο και όχι τον γεωμετρικό μέσο για τον υπολογισμό της ακρίβειας των n- grams (Doddington 2002). Επίσης, αυτή η μετρική αξιολόγησης εστιάζει κυρίως στην επάρκεια των μεταφράσεων, αφού ενδιαφέρεται περισσότερο για τα unigrams. Παρόλα ταύτα, οι δύο μετρικές χρησιμοποιούνται συμπληρωματικά καθώς η μία συμπληρώνει την άλλη. Η εκτίμηση του τελικού αποτελέσματος για το σύστημα που αξιολογείται, προκύπτει από τον μέσο όρο της βαθμολογίας όλων των προτάσεων του κειμένου, αναγόμενο σε κλίμακα από 0-1. 3.2 Μη-αυτοματοποιημένη αξιολόγηση ARPA Για την αξιολόγηση από ανθρώπους έχουν προταθεί κατά διαστήματα διάφορες μεθοδολογίες. Συνήθως ως αξιολογητές χρησιμοποιούνται ειδικοίγλωσσολόγοι της γλώσσας-στόχου, ενώ η αξιολόγηση γίνεται σε επίπεδο μεμονωμένων προτάσεων και όχι σε επίπεδο κειμένου. Μια από τις πιο γνωστές μεθοδολογίες είναι η Advanced Research Projects Agency (ARPA), η οποία ξεκίνησε το 1991 και συνεχίζεται μέχρι και σήμερα. Σε αυτή την αξιολόγηση οι αξιολογητές βαθμολογούν προτάσεις λαμβάνοντας υπόψη δύο παράγοντες: την επάρκεια (adequacy) και την ευφράδεια (fluency) της γλώσσας-στόχου. Στόχος της επάρκειας είναι να αξιολογηθεί η ποσότητα της πληροφορίας δηλαδή πόσο επαρκής είναι η μετάφραση από τη γλώσσα-πηγή στη γλώσσα-στόχο ανεξάρτητα από τη γραμματική, δηλαδή αν το νόημα της πρότασης μεταφέρεται σωστά. Στόχος της ευφράδειας είναι να αξιολογηθεί η ποιότητα της γλώσσας από πλευρά γραμματικής και συντακτικού και όχι νοήματος.

Αξιολόγηση συστήματος Στατιστικής Μηχανικής Μετάφρασης για Ελληνικά - Ιταλικά 115 Για τις μετρήσεις αυτές οι αξιολογητές χρησιμοποιούν διαβαθμισμένες κλίμακες Likert 5 σημείων. Στον Πίνακα 1 εμφανίζονται οι ενδείξεις για την κάθε βαθμίδα. Πίνακας 1: Διαβαθμισμένη κλίμακα για την αξιολόγηση της επάρκειας και της ευφράδειας. Κατά τη διάρκεια της αξιολόγησης της επάρκειας οι βαθμολογητές έχουν πρόσβαση μόνο στην πρόταση που αξιολογούν, ενώ κατά την αξιολόγηση της ευφράδειας οι βαθμολογητές συγκρίνουν την προς αξιολόγηση πρόταση με μία ή περισσότερες έγκυρες μεταφράσεις από μεταφραστή ή με την πρόταση του πρωτογενούς κειμένου. Η εκτίμηση του τελικού αποτελέσματος για το σύστημα που αξιολογείται, προκύπτει από τον μέσο όρο της βαθμολογίας όλων των προτάσεων του κειμένου, αναγόμενο σε κλίμακα από 0-1 (White 1995). 4. Πειραματική διαδικασία 4.1 Το σύστημα της πειραματικής διαδικασίας Για τις ανάγκες της παρούσας έρευνας χρειάστηκε να εκπαιδευτεί ένα σύστημα που παράγει τις μεταφράσεις βάσει στατιστικής. Έπειτα από πολλές και μικρής κλίμακας αξιολογήσεις, καταλήξαμε στον αποκωδικοποιητή Moses (Koehn κ.ά. 2007), διότι: πρώτον, θεωρείται state-of-the-art σύστημα ΣΜΜ δεύτερον, είναι ανοιχτού κώδικα λογισμικό και τρίτον, υλοποιήθηκε χρηματοδοτούμενο από ευρωπαϊκά κονδύλια. Ο συγκεκριμένος αποκωδικοποιητής δημιουργήθηκε καθαρά για ακαδημαϊκούς σκοπούς από την ερευνητική ομάδα ΣΜΜ του Πανεπιστημίου του Εδιμβούργου, με επικεφαλής τον καθηγητή Δρ. Philipp Koehn. Το μόνο που χρειάζεται για να μπορεί να παραγάγει μεταφράσεις είναι ένα παράλληλο σώμα κειμένων και ένα μονoγλωσσικό σώμα στη γλώσσα-στόχο. Το Moses παράγει τις μεταφράσεις βάσει φράσεων (phrase-based translation), δηλαδή ο αποκωδικοποιητής πριν προβεί στη διαδικασία της μετάφρασης χωρίζει το κείμενο σε επιμέρους φράσεις, τις μεταφράζει και έπειτα τις ανασυνθέτει. Φυσικά δεν πρόκειται για γλωσσολογικά ορθές φράσεις, αλλά για μικρά κομμάτια κειμένου, τα οποία προκύπτουν με τη χρήση στατιστικών τεχνικών από το σώμα κειμένων με τα οποία εκπαιδεύτηκε το σύστημα. Αυτό γίνεται διότι οι μέχρι τώρα έρευνες έδειξαν πως αν η μετάφραση γίνεται σύμφωνα με ορθές γλωσσολογικά προτάσεις, η ποιότητα της μετάφρασης είναι χαμηλότερης ποιότητας (Koehn κ.ά. 2003). Για την εκπαίδευση του συστήματός μας, χρησιμοποιήθηκε παράλληλο

116 Π. Κανελλιάδου Κ. Χατζηθεοδώρου σώμα κειμένων αποτελούμενο από 1.140.486 προτάσεις. Στον Πίνακα 2 εμφανίζονται τα επιμέρους στατιστικά στοιχεία της συλλογής για κάθε μία από τις γλώσσες. Πίνακας 2: Στατιστικά στοιχεία των παράλληλων σωμάτων κειμένων Πιο συγκεκριμένα το 50% προέρχεται από το Europarl corpus (Koehn 2005), σώματα πρακτικών των συνεδριάσεων του Ευρωκοινοβουλίου δηλαδή, και το υπόλοιπο 50% από το Opus corpus (OpenSubtitles, EMEA και KDE4) (Tiedemann και Nygaard 2004) και από το νέο σώμα 900 προτάσεων που δημιουργήθηκε ειδικά για τον σκοπό αυτόν. Το γλωσσικό μοντέλο που δημιουργήθηκε για την παρούσα εργασία, αποτελείται από 54.339 προτάσεις με μέσο όρο 15,76 λέξεις σε κάθε πρόταση. Συνολικά υπήρχαν 1.427.818 λέξεις και 28.360 μοναδικές λέξεις. Θέλοντας να πρωτοτυπήσουμε και σε αυτό το κομμάτι της έρευνας, επιλέξαμε το σύνολό του να μην αποτελείται από ένα είδος κείμενου, αλλά από περισσότερα. Επιγραμματικά, μπορούμε να αναφέρουμε ότι οι προτάσεις αυτές προέρχονται από το ιταλικό σύνταγμα, από μέρος της συλλογής BADIP (BAnca Dati dell Italiano Parlato) (Bellini και Schneider 2006), από μέρος του Europarl corpus και του JRC-Acquis (Steinberger κ.ά. 2006) καθώς επίσης από κείμενα Ιταλών συγγραφέων. Επίσης, χρησιμοποιήθηκαν κείμενα από την ιταλική έκδοση της Wikipedia και διάφορους ειδησεογραφικούς δικτυακούς τόπους. Με αυτόν τον τρόπο εξασφαλίζουμε τη μοναδικότητα του συστήματός μας. 4.2 Μεθοδολογία Συνολικά αξιολογήθηκαν 120 προτάσεις από διάφορα είδη κειμένων (π.χ. κοινοτικά, τεχνικά, λογοτεχνικά, υπότιτλοι ταινιών, παροιμίες κ.ά.). Κατά μέσο όρο η κάθε πρόταση είχε 12,52 λέξεις. Αυτές οι προτάσεις μεταφράστηκαν τόσο από το σύστημα που αναπτύχθηκε, όσο και από επαγγελματία μεταφραστή με μία μόνο εκδοχή μετάφρασης για κάθε πρόταση, ακολουθώντας προηγούμενες παρόμοιες αξιολογήσεις (Papineni κ.ά. 2002, Doddington 2002). Για τη διαδικασία της αυτοματοποιημένης αξιολόγησης χρησιμοποιήθηκε το script mteval-v11b.pl, 1 ενώ για τη διαδικασία της μη-αυτοματοποιημένης αξιολόγησης οι 6 βαθμολογητές αξιολόγησαν την ευφράδεια και την επάρκεια όπως περιγράφεται στη μεθοδολογία ARPA. Οι αξιολογητές 01. <http://www.itl.nist.gov/iad/mig/tests/mt/2009/> [ημερομηνία τελευταίας προσπέλασης: 14/12/2010].1

Αξιολόγηση συστήματος Στατιστικής Μηχανικής Μετάφρασης για Ελληνικά - Ιταλικά 117 ήταν μεταπτυχιακοί φοιτητές της κατεύθυνσης Μετάφρασης, Διερμηνείας και Επικοινωνίας του Τμήματος Ιταλικής Γλώσσας και Φιλολογίας του Αριστοτέλειου Πανεπιστημίου Θεσσαλονίκης και η αξιολόγηση διεξήχθη στο πλαίσιο του μεταπτυχιακού μαθήματος με τίτλο «Μεταφραστικές μνήμες και προγράμματα αυτόματης μετάφρασης». 5. Αποτελέσματα 5.1. Ποσοτικά αποτελέσματα Η βαθμολογία της ανθρώπινης αξιολόγησης είναι 0,44 για την ευφράδεια και 0,50 για την επάρκεια, ενώ της αυτοματοποιημένης είναι 0,43 για τον BLEU και 0,58 για το NIST. Τα αποτελέσματα αυτά, κρίνονται ικανοποιητικά, αν λάβουμε υπόψη μας ότι οι προς αξιολόγηση προτάσεις δεν αποτελούνταν αποκλειστικά και μόνο από νομικά κείμενα, όπως γίνεται σε παρόμοιες έρευνες, αλλά από διάφορα είδη κειμένων. Πρέπει να σημειωθεί πως οι αξιολογητές δεν είχαν προηγούμενη εμπειρία σε παρόμοιες αξιολογήσεις και για τον λόγο αυτό ήταν αρκετά αυστηροί στην απόδοση των βαθμών. Για τον καθορισμό της αξιοπιστίας της έρευνας κατά τη διαδικασία αξιολόγησης από ανθρώπους, εκτιμήθηκε ο συντελεστής Cohen kappa, ο οποίος είναι το πιο διαδεδομένο μέτρο συμφωνίας και χρησιμοποιείται στη βιβλιογραφία για να μετράει την ασυμφωνία μεταξύ δύο (μόνο) διαφορετικών αξιολογητών, άρα κατά κάποιο τρόπο και την αξιοπιστία της βαθμολόγησης (Carletta 1996). Αναλυτικότερα, η συμφωνία των αξιολογητών για την επάρκεια είναι 0,618, ενώ για την ευφράδεια είναι 0,635 και περιλαμβάνει τους μέσους όρους και των 6 αξιολογητών. Ακόμη, επιβεβαιώθηκε η υπόθεση ότι οι αυτοματοποιημένες μέθοδοι αξιολόγησης BLEU και NIST ταυτίζονται την ανθρώπινη αξιολόγηση. Πιο συγκεκριμένα, με εξάρτηση 0,917 για τον BLEU και 0,722 για τον NIST (p<0,001) προτείνονται ως αξιόπιστες λύσεις αξιολόγησης της ΜΜ. 5.2. Ποιοτικά αποτελέσματα - Γλωσσολογικές αδυναμίες Τα αριθμητικά αποτελέσματα επιβεβαιώνονται και από τη γλωσσολογική ανάλυση των δευτερογενών κειμένων. Τα αποτελέσματα αυτής της ανάλυσης έδειξαν πως οι μεταφράσεις του συστήματός μας είναι επαρκείς ακόμη και σε δύσκολα γλωσσολογικά προβλήματα, όπως είναι οι προθέσεις. Ωστόσο, δεν έλειπαν και μεταφράσεις που παρουσίαζαν κενά κατανόησης, και κατά συνέπεια κενά ερμηνείας των πρωτογενών κειμένων. Εκτός από τις πολλές μη-μεταφρασμένες λέξεις και τη συχνή παράλειψη ολόκληρων τμημάτων στις μεταφρασμένες προτάσεις, παρατηρείται λανθασμένη αντιστοιχία όρων. Για παράδειγμα, η μεταφραστική μονάδα Κρήτη μεταφράστηκε ως Cipro (Κύπρος) ή η μεταφραστική μονάδα Β. Ελλάδα (Βόρεια Ελλάδα) αποδόθηκε ως b. Grecia. Επιπροσθέτως, σε πολλές προστάσεις παρατηρούμε πως υπάρχει λάθος ή δεν υπάρχει καθόλου άρθρο, ή υπάρχει ενώ δεν θα έπρεπε. Για παράδειγμα, υπάρχουν μεταφραστικές μονάδες αρσενικού γένους στις οποίες αποδόθηκε άρθρο γένους θηλυκού ( la ricevimento αντί για il ricevimento ),

118 Π. Κανελλιάδου Κ. Χατζηθεοδώρου ή το αντίθετο. Υπήρχαν περιπτώσεις που δε θα έπρεπε να αποδοθεί άρθρο, ωστόσο αποδόθηκε ( la Corfù αντί για Corfù ) και περιπτώσεις στις οποίες, παρόλο που έγινε σωστή αναγνώριση του γένους, έγινε λάθος απόδοση του άρθρου ( il spirito αντί για lo spirito, il giorno αντί για un giorno ). 6. Συζήτηση Σκοπός της παρούσας εργασίας ήταν η εκπαίδευση και η αξιολόγηση ενός συστήματος ΜΜ για το γλωσσικό ζεύγος ελληνικά-ιταλικά. Το παραπάνω σύστημα αξιολογήθηκε με αυτοματοποιημένο και μη-αυτοματοποιημένο τρόπο. Η ευφράδεια και η επάρκεια αξιολογήθηκε από ειδικούς γλωσσολόγους, απόφοιτους Τμημάτων Ιταλικής Γλώσσας και Φιλολογίας, ενώ για την αυτοματοποιημένη χρησιμοποιήσαμε δύο αλγόριθμους που θεωρούνται de facto μετρικά από τη διεθνή κοινότητα της ΜΜ. Με τον τρόπο αυτό μπορούμε να είμαστε σίγουροι ότι τα εξαγόμενα αποτελέσματα είναι ασφαλή ως προς την πιστότητά τους. Οι λόγοι που μας οδήγησαν στην παρούσα μελέτη εντοπίζονται στο γεγονός ότι πρώτον, η αξιολόγηση της ΜΜ είναι ένα ανοιχτό και σημαντικό κεφάλαιο στον τομέα της ΥΓ και δεύτερον, για το συγκεκριμένο γλωσσικό ζεύγος δεν έχει διεξαχθεί παρόμοια έρευνα σε παγκόσμιο επίπεδο. Τα αποτελέσματα κρίνονται ικανοποιητικά, ακόμη και σε σύγκριση με παρόμοιες αξιολογήσεις συστημάτων π.χ. Αγγλικά-Ιταλικά ή Γαλλικά-Ιταλικά. Βέβαια, δεν μπορεί να γίνει απόλυτη σύγκριση, καθώς αυτά εκπαιδεύτηκαν με διαφορετικά σώματα κειμένων και αξιολογήθηκαν με διαφορετικά σώματα ελέγχου. Ωστόσο, μια έστω και αδρομερής σύγκριση πάντα είναι επωφελής. Συγκεκριμένα, προκύπτει πως σε παρόμοιες αξιολογήσεις, οι βαθμολογίες κυμαίνονται από 0,57 έως 0,65 για την ευφράδεια και από 0,62 έως 0,74 για την επάρκεια, με συμφωνία αξιολογητών μεταξύ 0,590 έως 0,830 (Koehn, Monz 2006). Σε ό,τι αφορά την αυτοματοποιημένη αξιολόγηση, οι βαθμολογίες κυμαίνονται από 0,324 έως 0,650 για τη μετρική BLEU και από 0,437έως 0,590 για τη μετρική NIST. Η μοντελοποίηση των αδυναμιών που προέκυψαν βοηθάει να λυθούν σε καίρια προβλήματα του συγκεκριμένου γλωσσικού ζεύγους. Κλείνοντας, πρέπει να επισημάνουμε πως, παρόλο που οι αλγόριθμοι BLEU και NIST ταυτίζονται με την ανθρώπινη αξιολόγηση, δεν θα πρέπει να την αντικαθηστούν, καθώς οι άνθρωποι λόγω της ευφυΐας που διαθέτουν μπορούν να αναγνωρίσουν τις σχέσεις παράφρασης μεταξύ δύο εξίσου καλών μεταφράσεων και δεν περιορίζονται σε απλές συγκρίσεις συμβολοσειρών μίας ή περισσότερων έγκυρων μεταφράσεων. Eυχαριστίες Οι συγγραφείς ευχαριστούν θερμά τους μεταπτυχιακούς φοιτητές της κατεύθυνσης Μετάφρασης, Διερμηνείας και Επικοινωνίας του Τμήματος Ιταλικής Γλώσσας και Φιλολογίας του Αριστοτέλειου Πανεπιστημίου Θεσσαλονίκης, που παρακολουθούσαν το μάθημα με τίτλο «Μεταφραστικές μνήμες και προγράμματα αυτόματης μετάφρασης» και συμμετείχαν στη διαδικασία της αξιολόγησης.

Αξιολόγηση συστήματος Στατιστικής Μηχανικής Μετάφρασης για Ελληνικά - Ιταλικά 119 Βιβλιογραφικές αναφορές Allen J. (1987). Natural Language Understanding. Benjamin Cummings. Bayes T. (1763). An Essay Towards Solving a Problem in the Doctrine of Chances. In Philos. Trans. Royal Society London 53, 370-418. Bellini B. και Schneider S. (2006). Spoken Italian Online: The Banca dati dell italiano parlato (BADIP). In Bernhard Kettemann, Georg Marko (eds.). Planing, Gluing and Painting Corpora. Inside the Applied Corpus Linguist s Workshop. Frankfurt am Main: Peter Lang, 13-26. Berger A. et al. (1994). The Candide system for machine translation. In Proceedings of the workshop on Human Language Technology (HLT 94). Association for Computational Linguistics, USA: Stroudsburg, PA, 157-162. Brown P., J. Cocke, S.A. Della Pietra, V.J. Jelinek, F. Mercer, R.L. και P.S. Roossin, (August 1988). A statistical approach to language translation. In Proceedings, 12th International Conference on Computational Linguistics (COLING-88). Budapest, Hungary: 71-76. Carletta J. (1996). Assessing agreement on classification tasks: the Kappa statistic. In Computational Linguistics 22, 2, 249-254. Doddington G. (2002). Automatic Evaluation of Machine Translation Quality Using N-Gram Co-Occurrence Statistics. In Proceeding of the Second International Conference on Human Language Technology. San Diego: CA, 138-145. Hutchins W.J. και L.S. Harold (1992). An Introduction to Machine Translation. London: Academic Press. Hutchins W.J. και E. Lovtsky (2000). Petr Petrovich Troyanskii (1894-1950): a forgotten pioneer of machine translation. In Machine Translation 15, 3, 187-221. Koehn Ph. (2005). Europarl: A Parallel Corpus for Statistical Machine Translation. MT Summit. Koehn Ph. Och & F. J., Marcu (2003). Statistical Phrase-Based Translation. In Proceedings of the 2003 Conference of the North American Chapter of the Association for Computational Linguistics on Human Language Technology, Edmonton, Canada, May 27-June 01 2003, 48-54. Koehn Ph. & C. Monz (2006). Manual and automatic evaluation of machine translation between European languages. In Proceedings on the Workshop on Statistical Machine Translation, New York: Association for Computational Linguistics, 102-121. Koehn Ph.et al. (2007). Moses: Open Source Toolkit for Statistical Machine Translation. In Annual Meeting of the Association for Computational Linguistics (ACL), demonstration session, Prague. Manning Ch. & H. Schutze (1999). Foundations of Statistical Natural Language Processing. Cambridge, MA: MIT Press. Nirenburg S. & R. Frederking (1994). Toward Multi-Engine Machine Translation. In Proceedings of the Human Language Technology Conference, Princeton, NJ. Papineni K., S. Roukos, T. Ward & W.J. Zhu (2002). BLEU: a method for automatic evaluation of Machine Translation. In Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics (ACL). Association for Computational Linguistics. Philadelphia, USA, 311-318

120 Π. Κανελλιάδου Κ. Χατζηθεοδώρου Σταύρου Μ. & Μ. Τζεβελέκου (επιμέλεια) (2000). Η Μηχανική Μετάφραση και η Ελληνική Γλώσσα. Αθήνα: Εκδόσεις Καστανιώτη. Shannon, E.Cl. & W. Weaver (1963). A Mathematical Theory of Communication. Champaign, IL, USA: University of Illinois Press. Steinberger R.et al. (2006). The JRC-Acquis: A multilingual aligned parallel corpus with 20+ languages. In Proceedings of the 5th International Conference on Language Resources and Evaluation (LREC 2006). Tiedemann J. & Nygaard L. (2004). The OPUS corpus - parallel & free. In Proceedings of the Fourth International Conference on Language Resources and Evaluation (LREC 04). Lisbon, Portugal, May 26-28. White J.S. (1995). Approaches to Black Box MT Evaluation. In Proceedings of Machine Translation Summit V, 10.