Η συμβολή των παράλληλων και συγκρίσιμων σωμάτων κειμένων στη μετάφραση: ηλεκτρονικά εργαλεία επεξεργασίας και ανάλυσής τους Ελένη Τζιάφα*

Σχετικά έγγραφα
Ηλεκτρονικά σώματα κειμένων και γλωσσική διδασκαλία: Διεθνείς αναζητήσεις και διαφαινόμενες προοπτικές για την ελληνική γλώσσα

Η ΜΕΣΩ ΜΕΤΑΦΡΑΣΗΣ ΕΠΙΚΟΙΝΩΝΙΑ Φρειδερίκη ΜΠΑΤΣΑΛΙΑ Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Ελένη ΣΕΛΛΑ Ιόνιο Πανεπιστήμιο, Κέρκυρα

Μοντέλο οικιστικής ανάπτυξης πρόγνωση της ζήτησης σε επίπεδο πόλης. Ε. Ρόζος και Χ. Μακρόπουλος

Μαρίνα Ματθαιουδάκη. Περίληψη

Η εξέλιξη στα συστήματα Μηχανικής Μετάφρασης

«Αξιολόγηση ατόμων με αφασία για Επαυξητική και Εναλλακτική Επικοινωνία, σύμφωνα με το μοντέλο συμμετοχής»

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ:

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ. Πτυχιακή εργασία ΔΙΕΡΕΥΝΗΣΗ ΤΟΥ ΚΛΙΜΑΤΟΣ ΑΣΦΑΛΕΙΑΣ ΤΩΝ ΑΣΘΕΝΩΝ ΣΤΟ ΝΟΣΟΚΟΜΕΙΟ

(Α.Σ.ΠΑΙ.Τ.Ε.) ΠΑΡΑΔΟΤΕΟ Δ3-5_3 1 ΕΠΙΣΤΗΜΟΝΙΚΗ ΕΡΓΑΣΙΑ ΣΕ ΔΙΕΘΝΕΣ ΕΠΙΣΤΗΜΟΝΙΚΟ ΣΥΝΕΔΡΙΟ. Vocational Technology Enhanced Learning (VocTEL) 2015

G. Kokkinankis, E. Dermatas, E. Coutsogeorgopoulos

Πανεπιστήµιο Μακεδονίας Τµήµα ιεθνών Ευρωπαϊκών Σπουδών Πρόγραµµα Μεταπτυχιακών Σπουδών στις Ευρωπαϊκές Πολιτικές της Νεολαίας

Συνεργασία για την Ευρωπαϊκή Ορολογία. Κέρκυρα, Πέμπτη , Ροδόλφος Μασλίας, Στέλλα Τσομπάνου, Όλγα Βαμβακά, Γιάννης Μπέρσος

3/6/2015. Τιτίκα Δημητρούλια Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης

Α.Σ.ΠΑΙ.Τ.Ε. Π.Μ.Σ. ΕΠΙΣΤΗΜΕΣ ΤΗΣ ΑΓΩΓΗΣ

Διδασκαλία Μετάφρασης Ιατρικής Ορολογίας με χρήση Παράλληλου Σώματος Κειμένων. Μαργαρίτη Ελπινίκη Χατζηκουμή Ειρήνη

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ ΕΚΠΑΙΔΕΥΣΗ

2016 IEEE/ACM International Conference on Mobile Software Engineering and Systems

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΑΛΛΗΛΟΓΡΑΦΙΑ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑ ΣΤΗΝ ΑΓΓΛΙΚΗ ΓΛΩΣΣΑ

Προσωπική Aνάπτυξη. Ενότητα 4: Συνεργασία. Juan Carlos Martínez Director of Projects Development Department

Ζητήματα Τυποποίησης στην Ορολογία - ο ρόλος και οι δράσεις της Επιτροπής Ορολογίας ΤΕ21 του ΕΛΟΤ

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ. Πτυχιακή διατριβή. Ονοματεπώνυμο: Αργυρώ Ιωάννου. Επιβλέπων καθηγητής: Δρ. Αντρέας Χαραλάμπους

Τ.Ε.Ι. ΗΠΕΙΡΟΥ ΣΧΟΛΗ: ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ: ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗΣ ΚΑΙ ΕΛΕΓΚΤΙΚΗΣ

ΣΥΓΧΡΟΝΕΣ ΤΑΣΕΙΣ ΣΤΗΝ ΕΚΤΙΜΗΣΗ ΚΑΙ ΧΑΡΤΟΓΡΑΦΗΣΗ ΤΩΝ ΚΙΝΔΥΝΩΝ

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΜΕΤΑΦΡΑΣΗ ΓΕΝΙΚΩΝ ΚΕΙΜΕΝΩΝ Ι

ΣΧΕΔΙΑΣΜΟΣ ΚΑΙ ΕΝΙΣΧΥΣΗ ΤΩΝ ΚΟΜΒΩΝ ΟΠΛΙΣΜΕΝΟΥ ΣΚΥΡΟΔΕΜΑΤΟΣ ΜΕ ΒΑΣΗ ΤΟΥΣ ΕΥΡΩΚΩΔΙΚΕΣ

Πτυχιακή Εργασία Η ΑΝΤΙΛΑΜΒΑΝΟΜΕΝΗ ΚΟΙΝΩΝΙΚΗ ΣΤΗΡΙΞΗ ΣΤΙΣ ΘΗΛΑΖΟΥΣΕΣ ΜΗΤΕΡΕΣ

ΠΕΡΙΛΗΨΗ. Είναι γνωστό άτι καθημερινά διακινούνται δεκάδες μηνύματα (E~mail) μέσω του διαδικτύου

Scrum framework: Ρόλοι

IEEE Xplore, Institute of Electrical and Electronics Engineers Inc.

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (Δ.Π.Μ.Σ.)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΤΜΗΜΑΤΟΣ ΕΚΠΑΙΔΕΥΤΙΚΗΣ ΚΑΙ ΚΟΙΝΩΝΙΚΗΣ ΠΟΛΙΤΙΚΗΣ ΕΙΔΙΚΕΥΣΗ ΣΥΝΕΧΙΖΟΜΕΝΗΣ ΕΚΠΑΙΔΕΥΣΗΣ

Κατασκευή σώματος κειμένων οικονομικού περιεχομένου και συμφραστικών πινάκων. Construction of an electronic corpus of financial texts and concordances

ΠΕΡΙΓΡΑΜΜΑ ΕΙΣΗΓΗΣΕΩΝ ΜΑΘΗΜΑ 943 ΑΞΙΟΛΟΓΗΣΗ ΣΤΗ ΦΥΣΙΚΗ ΑΓΩΓΗ

ΑΝΑΠΤΥΞΗ ΛΟΓΙΣΜΙΚΟΥ ΓΙΑ ΤΗ ΔΙΕΝΕΡΓΕΙΑ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΜΕΛΕΤΩΝ

Η ΔΙΑΣΤΡΕΥΛΩΣΗ ΤΗΣ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ ΜΕΣΩ ΤΩΝ SOCIAL MEDIA ΤΗΝ ΤΕΛΕΥΤΑΙΑ ΠΕΝΤΑΕΤΙΑ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΤΗΣ ΑΝΑΣΤΑΣΙΑΣ-ΜΑΡΙΝΑΣ ΔΑΦΝΗ

Παρουσίαση της εργασίας στο μάθημα Νέες Τεχνολογίες στην Επιστημονική Έρευνα: Διαδίκτυο και Εκπαίδευση (Εαρινό 2016) Β Μέρος. Γιώργος Μικρός ΕΚΠΑ

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ ΤΜΗΜΑ ΝΟΣΗΛΕΥΤΙΚΗΣ

ΕΥΘΑΛΙΑ ΚΑΜΠΟΥΡΟΠΟΥΛΟΥ

Η ΠΡΟΣΩΠΙΚΗ ΟΡΙΟΘΕΤΗΣΗ ΤΟΥ ΧΩΡΟΥ Η ΠΕΡΙΠΤΩΣΗ ΤΩΝ CHAT ROOMS

ΠΡΟΓΡΑΜΜΑ ΚΑΡΑΘΕΟΔΩΡΗΣ 2008

Χρειάζεται να φέρω μαζί μου τα πρωτότυπα έγγραφα ή τα αντίγραφα; Asking if you need to provide the original documents or copies Ποια είναι τα κριτήρια

Η ΕΡΕΥΝΑ ΤΗΣ ΓΛΩΣΣΙΚΗΣ ΑΛΛΑΓΗΣ ΣΤΑ ΚΕΙΜΕΝΑ ΤΗΣ ΜΕΣΑΙΩΝΙΚΗΣ ΕΛΛΗΝΙΚΗΣ: ΜΕΘΟΔΟΛΟΓΙΚΗ ΔΙΕΡΕΥΝΗΣΗ ΤΩΝ

Τι είδους δεδομένα χρειάζονται; Προκόπης Προκοπίδης ΙΕΛ/ΕΚ «Αθηνά»

Τίτλος παρουσίασης: Χρηματοοικονομική Μοντελοποίηση της Εξοικονόμησης Νερού σε Επίπεδο Οικίας. Όνομα ομιλητή: Γιώργος Καπαρός

Νέες τεχνολογίες. στην εκπαίδευση. ΜΑΡΙΑ Γ. ΧΑΤΖΟΠΟΥΛΟΥ ΕΚΠΑΙΔΕΥΤΙΚΟΣ ΠΕ02 M.Ed. ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ

Διγλωσσία και Εκπαίδευση

ΣΤΥΛΙΑΝΟΥ ΣΟΦΙΑ

ΠΟΙΟΤΙΚΟΣ ΕΛΕΓΧΟΣ ΤΩΝ ΕΛΛΗΝΙΚΩΝ ΑΠΟΔΟΣΕΩΝ ΣΤΗΝ ΟΡΟΛΟΓΙΚΗ ΒΑΣΗ ΙΑΤΕ ΑΠΘ. 5η ΣΥΝΑΝΤΗΣΗ ΕΛΛΗΝΟΦΩΝΩΝ ΜΕΤΑΦΡΑΣΕΟΛΟΓΩΝ

Θεόδωρος Βυζάς Ελευθερία Δογορίτη ΤΕΙ ΗΠΕΙΡΟΥ

Προγράμματα για τη δημιουργία και διαχείριση θησαυρού

Ροδόλφος Mασλίας. Παγκόσμια Ημέρα Μετάφρασης meta/φραση, Αθήνα, 27 Σεπτεμβρίου Powerpoint Templates

Modern Greek Extension

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ ΠΤΥΧΙΑΚΗ ΔΙΑΤΡΙΒΗ

ΤΑ ΣΧΕΔΙΑ ΤΩΝ ΜΑΘΗΤΩΝ Γ ΛΥΚΕΙΟΥ ΤΗΣ ΡΟΔΟΥ ΜΕΤΑ ΤΗΝ ΑΠΟΦΟΙΤΗΣΗ ΤΟΥΣ. ΤΑ ΑΠΟΤΕΛΕΣΜΑΤΑ ΜΙΑΣ ΕΜΠΕΙΡΙΚΗΣ ΕΡΕΥΝΑΣ

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ

Υπηρεσίες ανάδειξης της πνευματικής παραγωγής του ΑΠΘ

þÿ ½ Á Å, ˆ»µ½± Neapolis University þÿ Á̳Á±¼¼± ¼Ìù±Â ¹ º à Â, Ç» Ÿ¹º ½ ¼¹ºÎ½ À¹ÃÄ ¼Î½ º±¹ ¹ º à  þÿ ±½µÀ¹ÃÄ ¼¹ µ À»¹Â Æ Å

ΓΕΩΠΟΝΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΤΡΟΦΙΜΩΝ ΚΑΙ ΔΙΑΤΡΟΦΗΣ ΤΟΥ ΑΝΘΡΩΠΟΥ

Ροδόλφος Mασλίας 4 η Συνάντηση Mεταφρασεολόγων Aριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης. Powerpoint Templates

Ψηφιακή ανάπτυξη. Course Unit #1 : Κατανοώντας τις βασικές σύγχρονες ψηφιακές αρχές Thematic Unit #1 : Τεχνολογίες Web και CMS

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ. Πτυχιακή εργασία ΑΓΧΟΣ ΚΑΙ ΚΑΤΑΘΛΙΨΗ ΣΕ ΓΥΝΑΙΚΕΣ ΜΕ ΚΑΡΚΙΝΟΥ ΤΟΥ ΜΑΣΤΟΥ ΜΕΤΑ ΑΠΟ ΜΑΣΤΕΚΤΟΜΗ

2, µε τίτλο: «Υλοποίηση Εργαλείων Ανάπτυξης ιαχείρισης Σώµατος Κειµένων και Αυτόµατης Εξαγωγής Ορολογίας».

ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ «ΘΕΜΑ»

Πτυχιακή Εργασία ΓΝΩΣΕΙΣ KAI ΣΤΑΣΕΙΣ ΤΩΝ ΕΠΑΓΓΕΛΜΑΤΙΩΝ ΥΓΕΙΑΣ ΓΙΑ ΤΗΝ ΕΠΑΓΓΕΛΜΑΤΙΚΗ ΕΚΘΕΣΗ ΣΤΟΝ HIV. Στυλιανού Στυλιανή

Δυσκολίες που συναντούν οι μαθητές της Στ Δημοτικού στην κατανόηση της λειτουργίας του Συγκεντρωτικού Φακού

Software Production Company

ΟΔΗΓΙΕΣ ΓΙΑ ΤΗΝ ΕΚΠΟΝΗΣΗ ΤΗΣ ΥΠΟΧΡΕΩΤΙΚΗΣ ΕΡΓΑΣΙΑΣ ΣΤΟ ΠΛΑΙΣΙΟ ΤΟΥ ΜΑΘΗΜΑΤΟΣ

Development of the Nursing Program for Rehabilitation of Woman Diagnosed with Breast Cancer

JEREMIE Joint European Resources for Micro to medium Enterprises

ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ Α. Διαβάστε τις ειδήσεις και εν συνεχεία σημειώστε. Οπτική γωνία είδησης 1:.

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ. Πτυχιακή Εργασία

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ. Πτυχιακή διατριβή Η ΚΑΤΑΘΛΙΨΗ ΩΣ ΠΑΡΑΓΟΝΤΑΣ ΚΙΝΔΥΝΟΥ ΓΙΑ ΑΠΟΠΕΙΡΑ ΑΥΤΟΚΤΟΝΙΑΣ

ΔΘΝΙΚΗ ΥΟΛΗ ΓΗΜΟΙΑ ΓΙΟΙΚΗΗ ΚΑ ΔΚΠΑΙΓΔΤΣΙΚΗ ΔΙΡΑ ΣΔΛΙΚΗ ΔΡΓΑΙΑ

Τη γλώσσα μου έδωσαν ellhnikh. Μαρία Γαβριηλίδου, ΙΕΛ/ΕΚ Αθηνά Παγκόσμια Ημέρα Μετάφρασης 29 Σεπτεμβρίου 2018, ΕΙΕ

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ

Δήµου Δράµας Παιδαγωγικό Τµήµα Νηπιαγωγών Τµήµα Επιστηµών Προσχολικής Αγωγής και Εκπαίδευσης Τµήµα Δηµοτικής Εκπαίδευσης του Πανεπιστηµίου Frederick

Η Επίδραση των Events στην Απόδοση των Μετοχών

Προσωπική Aνάπτυξη. Ενότητα 2: Διαπραγμάτευση. Juan Carlos Martínez Director of Projects Development Department

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ

Μεταπτυχιακή διατριβή. Ανδρέας Παπαευσταθίου

þÿ ¼ ¼± Ä Â ÆÅùº  ÃÄ ½

ΔΘΝΗΚΖ ΥΟΛΖ ΓΖΜΟΗΑ ΓΗΟΗΚΖΖ ΚΑ ΔΚΠΑΙΓΔΤΣΙΚΗ ΔΙΡΑ ΣΔΛΗΚΖ ΔΡΓΑΗΑ

Μηχανική Μετάφραση και Ελεγχόµενες Γλώσσες. Ελευθερία Φλώρου. Imperial College London

(econtent Localisation Resources for Translator Training)

ΤΟ ΜΟΝΤΕΛΟ Οι Υποθέσεις Η Απλή Περίπτωση για λi = μi 25 = Η Γενική Περίπτωση για λi μi..35

Web 論 文. Performance Evaluation and Renewal of Department s Official Web Site. Akira TAKAHASHI and Kenji KAMIMURA

ΟΡΓΑΝΙΣΜΟΣ ΒΙΟΜΗΧΑΝΙΚΗΣ ΙΔΙΟΚΤΗΣΙΑΣ

Η ΝΟΜΟΘΕΣΙΑ ΤΗΣ Ε.Ε. ΣΧΕΤΙΚΑ ΜΕ ΤΗΝ ΑΤΜΟΣΦΑΙΡΙΚΗ ΡΥΠΑΝΣΗ ΑΠΟ ΠΛΟΙΑ ΚΑΙ ΟΙ ΠΡΟΚΛΗΣΕΙΣ ΣΤΗΝ ΕΦΑΡΜΟΓΗ ΤΗΣ

υγεία των νοσηλευτών που συστηματικά εμπλέκονται στην παρασκευή και χορήγηση τους.

Αζεκίλα Α. Μπνπράγηεξ (Α.Μ. 261)

Advanced Subsidiary Unit 1: Understanding and Written Response

ΠΩΣ ΕΠΗΡΕΑΖΕΙ Η ΜΕΡΑ ΤΗΣ ΕΒΔΟΜΑΔΑΣ ΤΙΣ ΑΠΟΔΟΣΕΙΣ ΤΩΝ ΜΕΤΟΧΩΝ ΠΡΙΝ ΚΑΙ ΜΕΤΑ ΤΗΝ ΟΙΚΟΝΟΜΙΚΗ ΚΡΙΣΗ

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Κ Υ Ρ Ι Α Κ Η Ι Ω Α Ν Ν Ι Δ Ο Υ

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ. Πτυχιακή Εργασία

ΝΗΠΙΑΓΩΓΕΙΟ ΚΟΙΝΩΝΙΚΗΣ ΜΕΡΙΜΝΑΣ ΑΓΙΩΝ ΟΜΟΛΟΓΗΤΩΝ

ΚΡΑΤΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΡΙΟΥΠΟΛΗΣ (ΟΥΚΡΑΝΙΑ) Διεθνής Ημερίδα ΟΡΟΛΟΓΙΑ ΚΑΙ ΜΕΤΑΦΡΑΣΗ 22 Απριλίου 2016 ΡΟΔΟΛΦΟΣ ΜΑΣΛΙΑΣ

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΒΑΛΕΝΤΙΝΑ ΠΑΠΑΔΟΠΟΥΛΟΥ Α.Μ.: 09/061. Υπεύθυνος Καθηγητής: Σάββας Μακρίδης

Κεφάλαιο 6 ο Εισαγωγή στον Προγραμματισμό 1

Transcript:

83 Η συμβολή των παράλληλων και συγκρίσιμων σωμάτων κειμένων στη μετάφραση: ηλεκτρονικά εργαλεία επεξεργασίας και ανάλυσής τους Ελένη Τζιάφα* This research has been co-financed by the European Union (European Social Fund ESF) and Greek national funds through the Operational Program "Education and Lifelong Learning" of the National Strategic Reference Framework (NSRF) - Research Funding Program: Heraclitus II: Investing in knowledge society through the European Social Fund. In this paper we aim to outline the contribution of parallel and comparable corpora to translation. Nevertheless, corpora are not a new or unknown method to translators. Besides translated texts, there is a long tradition of using parallel texts, meaning similar texts, in the same domain or register as the text-source. In this paper though, in accordance with modern bibliography, we consider as a parallel corpus a collection of texts in language A and their translation in language B, while comparable corpora are collections of texts of two languages or more, constructed on the basis of certain criteria (text size, subject, time period, etc.). Moreover, we focus on the creation of parallel and comparable corpora in the domain of the Stock Market and we describe the electronic tools used for their construction. The creation of a glossary of 1,908 Stock Market terms and frequency lists of simple and multi-word terms, which could be used by translators in order to deal with terminology. 1. Εισαγωγή Ηπαρούσα έρευνα έχει συγχρηματοδοτηθεί από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο - ΕΚΤ) και από εθνικούς πόρους μέσω του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Διά Βίου Μάθηση» του Εθνικού Στρατηγικού Πλαισίου Αναφοράς (ΕΣΠΑ) Ερευνη- * Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης.

84 Ελένη Τζιάφα τικό Χρηματοδοτούμενο Έργο: Ηράκλειτος ΙΙ. Επένδυση στην κοινωνία της γνώσης μέσω του Ευρωπαϊκού Κοινωνικού Ταμείου. 1 Η μελέτη των σωμάτων κειμένων κατά τις τελευταίες δεκαετίες, χάρη στις νέες τεχνικές δυνατότητες των Η/Υ, υλικού και λογισμικού, αποτελεί πλέον μία εκ των ων ουκ άνευ μεθοδολογία για την αυτόματη ανάλυση και επεξεργασία της γλώσσας, σε τέτοιο βαθμό ώστε να συζητείται αν πρόκειται απλώς για μεθοδολογία ή για ανεξάρτητο κλάδο της γλωσσολογίας (Tognini- Bonelli 2001). Επιπλέον, η χρήση των σωμάτων κειμένων στη μετάφραση και τις μεταφραστικές σπουδές έχει αυξηθεί σημαντικά, κυρίως κατά την τελευταία δεκαετία, όπως υποδεικνύει ο όγκος της σχετικής βιβλιογραφίας (Laviosa 2002, Bowker, Pearson 2002, Zanettin, Bernardini, Stewart 2003). Ωστόσο, τα σώματα κειμένων κάθε άλλο παρά άγνωστη ή νέα πρακτική αποτελούν για τους μεταφραστές. Υπάρχει μια μακρά παράδοση χρήσης παράλληλων κειμένων, με την έννοια των παρόμοιων κειμένων του ίδιου τομέα ή κειμενικού είδους με το κείμενο πηγή. Όσον αφορά τους όρους όμως παράλληλα και συγκρίσιμα, υπάρχει μια σύγχυση στη βιβλιογραφία. Έως πρόσφατα στη βιβλιογραφία χρησιμοποιούνταν ο όρος παράλληλα γι αυτά που σήμερα ονομάζονται συγκρίσιμα, ενώ τα παράλληλα καλούνταν στοιχισμένα. Εν κατακλείδι, στη σύγχρονη βιβλιογραφία έχει πλέον καθιερωθεί να ονομάζουμε παράλληλο σώμα κειμένων ένα σύνολο κειμένων στη γλώσσα Α και τη μετάφρασή τους στη γλώσσα Β, ενώ συγκρίσιμα σώματα κειμένων ονομάζονται οι συλλογές κειμένων δύο ή περισσότερων γλωσσών που κατασκευάζονται βάσει ορισμένων κριτηρίων (κείμενα ενός ορισμένου μεγέθους, ενός συγκεκριμένου θέματος, μίας δεδομένης περιόδου κτλ.). Καθώς μέσω του διαδικτύου η διαδικασία εύρεσης είτε παράλληλων είτε συγκρίσιμων σωμάτων κειμένων έχει διευκολυνθεί σε μεγάλο βαθμό, έχει δημιουργηθεί πλέον μια νέα περιοχή έρευνας στην επεξεργασία φυσικών γλωσσών μέσω του ηλεκτρονικού υπολογιστή. Στόχος της εργασίας αυτής, στο πλαίσιο της έρευνας για την ανάλυση της ελληνικής γλώσσας μέσω ηλεκτρονικού υπολογιστή (Kyriacopoulou 2005), είναι να συνοψίσουμε τη συμβολή των παράλληλων και συγκρίσιμων κειμένων στη μετάφραση, αλλά και να καταγράψουμε μια σειρά από ηλεκτρονικά εργαλεία τα οποία χρησιμοποιήθηκαν για τη δημιουργία συγκεκριμένων παράλληλων και συγκρίσιμων κειμένων που βρίσκονται πλέον στη διάθεση των μεταφραστών. 1.

Συμβολή παράλληλων και συγκρίσιμων σωμάτων κειμένων στη μετάφραση 85 2. Παράλληλα και συγκρίσιμα σώματα κειμένων Σύμφωνα με τους Sinclair και Ball (1996) στην τυπολογία της EA- GLES, 2 ένα παράλληλο σώμα κειμένων είναι μια συλλογή κειμένων, καθένα από τα οποία έχει μεταφραστεί σε μία ή περισσότερες γλώσσες από ένα πρωτότυπο κείμενο. Στην απλούστερη περίπτωση εμπλέκονται δύο μόνο γλώσσες: ένα από τα σώματα κειμένων αποτελεί τη μετάφραση του άλλου. Ωστόσο, ορισμένα παράλληλα σώματα κειμένων περιλαμβάνουν περισσότερες από μία γλώσσες. Παράλληλα σώματα κειμένων παράγονται σε πολύγλωσσους οργανισμούς όπως τα Ηνωμένα Έθνη, το ΝΑΤΟ, η Ευρωπαϊκή Ένωση και χώρες με περισσότερες από μία επίσημες γλώσσες, όπως ο Καναδάς. Όσον αφορά τα συγκρίσιμα σώματα κειμένων, αυτά περιλαμβάνουν «μια συλλογή πρωτότυπων κειμένων στις εμπλεκόμενες γλώσσες, τα οποία έχουν σχεδιαστεί βάσει κριτηρίων ομοιότητας ως προς το περιεχόμενο, το θεματικό πεδίο και την επικοινωνιακή λειτουργία» (Zanettin 1998). Κοινό στοιχείο ανάμεσα στα δύο αυτά είδη σωμάτων κειμένων παραμένει η δυνατότητα της σύγκρισης μεταξύ των δομών δύο ή περισσότερων γλωσσών, καθώς και η δυνατότητα εφαρμογής ηλεκτρονικών εργαλείων επεξεργασίας και ανάλυσής τους. Ως επί το πλείστον γίνεται χρήση των παράλληλων και συγκρίσιμων σωμάτων κειμένων στους τομείς της μετάφρασης, αλλά και της εκπαίδευσης μεταφραστών, της δίγλωσσης λεξικογραφίας και της μηχανικής μετάφρασης. Όπως αναφέρει η Frérot (2009), η έρευνα και ανάλυση συγκρίσιμων και παράλληλων σωμάτων κειμένων μέσω προγραμμάτων δημιουργίας συμφραστικών πινάκων (concordancers) μπορούν να αποτελέσουν πολύτιμο βοήθημα κατά τη διαδικασία της μετάφρασης (Zanettin 2001, Pearson 2003, Wilkinson 2005), ενώ εμπειρικές μέθοδοι κατέδειξαν την αποτελεσματικότητα της χρήσης σωμάτων κειμένων κατά τη διδασκαλία της μετάφρασης (Williams 1996, Bowker 1998, Zanettin 1998). Συγκεκριμένα, η Bowker (1998) συνέκρινε την αποτελεσματικότητα ενός ειδικού μονόγλωσσου σώματος κειμένων σε φυσική γλώσσα με αυτή συμβατικών πηγών, π.χ. λεξικών, και κατέδειξε ότι τα σώματα κειμένων παρείχαν πληροφορίες που έλειπαν από τα λεξικά, ιδίως όσον αφορά την επιλογή των κατάλληλων όρων και τις ιδιωματικές εκφράσεις. Επιπλέον, ο Williams (1996) απέδειξε ότι τα παράλληλα σώματα κειμένων συμβάλλουν στην επιλογή των κατάλληλων μεταφραστικών αντιστοιχιών κατά 40%, σε σύγκριση με τη συμβολή δίγλωσσων λεξικών. 02. Eagles (Expert Advisory Group on Language Engineering Standards): Ομάδα Εμπειρογνωμόνων για την Τυποποίηση της Γλωσσικής Τεχνολογίας που αποτελεί πρωτοβουλία της Ευρωπαϊκής Ένωσης και συντονίζεται από την Consorzio Pisa Ricerche στην Πίζα της Ιταλίας.

86 Ελένη Τζιάφα 2.1. Παράλληλα σώματα κειμένων Η χρησιμότητα των παράλληλων κειμένων είναι προφανής: ο μεταφραστής μπορεί να δει πώς αντιμετωπίστηκαν ορισμένα μεταφραστικά ζητήματα από άλλους και να εμπνευστεί από αυτά. Υπάρχουν ορισμένοι τύποι μεταφραστικών προβλημάτων, για την επίλυση των οποίων χρειάζεται ο μεταφραστής να καταφύγει σε παράλληλα σώματα κειμένων, κι αυτό γιατί καταδεικνύουν τις στρατηγικές επίλυσης προβλημάτων που χρησιμοποιήθηκαν από επαγγελματίες μεταφραστές (Olohan 2004: 168-170). Τα παράλληλα σώματα κειμένων μπορούν να χρησιμοποιηθούν για συγκρίσεις σε διαφορετικά επίπεδα της γλώσσας, από τη λέξη ως τη σύνταξη και ως το είδος του λόγου. Διευκολύνοντας τον εντοπισμό και την καταγραφή των αντιστοιχιών μεταξύ των γλωσσών, τα παράλληλα σώματα κειμένων μπορούν να διασαφηνίσουν τα κοινά στοιχεία και τις διαφορές μεταξύ ζευγών γλωσσών και να βελτιώσουν την ακρίβεια της περιγραφής της κάθε γλώσσας ξεχωριστά. Η σύγκριση με την άλλη γλώσσα καθιστά βαθύτερη τη μελέτη της γλώσσας-πηγής (Kenning 1999). Επίσης, συμβάλλουν στην εξαγωγή πληροφοριών και όρων, χρησιμοποιούνται δηλ. για ορολογική αναζήτηση σε μια τράπεζα δεδομένων, η οποία περιέχει ευθυγραμμισμένες δίγλωσσες προτάσεις. Η χρήση των παράλληλων σωμάτων κειμένων στη σύγχρονη υπολογιστική γλωσσολογία επιτρέπει σε ελάχιστο χρόνο την εξαγωγή ορολογίας και τη δημιουργία δίγλωσσων ή και πολύγλωσσων ορολογικών βάσεων και λεξικών. Ακόμη, καθίσταται δυνατή η ανάπτυξη, η εκπαίδευση και αξιολόγηση συστημάτων αυτόματης μετάφρασης. Επιπλέον, μπορούν να συμβάλουν στη μελέτη του φαινομένου της υπερμετάφρασης (translationese,) (Kenny 1998: 51), δηλ. της μη φυσικής χρήσης της γλώσσας-στόχου που προκύπτει ως απόρροια της προσκόλλησης σε χαρακτηριστικά της γλώσσας-πηγής (Shuttleworth, Cowie 1997: 120). 2.2. Συγκρίσιμα σώματα κειμένων Η επίδραση, ωστόσο, της μεταφραστικής διαδικασίας, συνιστά ένα σημαντικό μειονέκτημα: «Η εργασία με μεταφράσεις σημαίνει εργασία με διαστρεβλωμένες κατοπτρικές εικόνες της γλώσσας-πηγής μέσω της γλώσσαςστόχου, ενώ ο στόχος είναι η ανάλυση και περιγραφή της γλώσσας αυθύπαρκτης και όχι ως γλώσσας-στόχου» (Teubert 1996). Γι αυτό το λόγο, ενώ τα παράλληλα σώματα μπορούν να αποτελέσουν σημεία εκκίνησης, πρέπει ωστόσο να συμπληρωθούν. Η ανάλυση και περιγραφή της γλώσσας ολοκληρώνεται λοιπόν με τη μελέτη των συγκρίσιμων σωμάτων, τα οποία περιέχουν πρωτότυπα και αυθεντικά κείμενα και μπορούν να συντελέσουν στην πληρέστερη κατανόηση του κειμένου πηγής και της ορολογίας του, καθώς και στον εντοπισμό και την αξιολόγηση πιθανών αντιστοιχιών (Aston, Kübler 2010). Παρά τη διαθεσιμότητα μεταφρασμένων κειμένων μετά την έλευση του διαδικτύου, τα υπάρχοντα παράλληλα σώματα κειμένων είναι περιορισμένα ως προς τον αριθμό τους, αλλά και τον αριθμό των γλωσσών που αφορούν, καθώς και τα θέματα

Συμβολή παράλληλων και συγκρίσιμων σωμάτων κειμένων στη μετάφραση 87 που καλύπτουν. Έτσι, είναι ευκολότερη η συλλογή και κατασκευή συγκρίσιμων σωμάτων κειμένων λόγω της μεγάλης διαθεσιμότητας των πηγών, ενώ έτσι μπορούν να είναι και μεγαλύτερα, πράγμα που ενισχύει την αξιοπιστία των αποτελεσμάτων. Τα συγκρίσιμα σώματα μπορούν επίσης να αποτελέσουν χρήσιμο εργαλείο για τον μεταφραστή, δεδομένου ότι μπορούν να οδηγήσουν σε βαθύτερη κατανόηση του κειμένου πηγής και της ορολογίας του, στον εντοπισμό και την αξιολόγηση πιθανών ισοδυνάμων στη γλώσσα-στόχο, καθώς επίσης και να συμβάλουν στην ανάπτυξη της κατάλληλης φρασεολογίας στη γλώσσαστόχο. Οι τεχνικές εξαγωγής δεδομένων (data mining) έχουν επεκταθεί και στα συγκρίσιμα σώματα, χρησιμοποιώντας μεθόδους προερχόμενες από τη συσχέτιση των συχνοτήτων των λέξεων μεταξύ διαφορετικών γλωσσών, ώστε να ανιχνευθούν οι αντιστοιχίες (Tao, Zhai, 2005). Η μελέτη των αντίστοιχων πλεονεκτημάτων και μειονεκτημάτων των διαφορετικών ειδών σωμάτων κειμένων οδήγησε στο συμπέρασμα ότι τα παράλληλα και τα συγκρίσιμα σώματα κειμένων πρέπει να θεωρούνται συμπληρωματικά και ότι έχουμε πολλά να κερδίσουμε από τη συνδυαστική χρήση τους. Σύμφωνα με τους Bernardini και Zanettin (2004), είναι αναγκαίο να έχουμε πρόσβαση τόσο σε σώματα κειμένων που αποτελούν μεταφράσεις όσο και σώματα αυθεντικών κειμένων στη γλώσσα-στόχο. 3. Ηλεκτρονικά εργαλεία επεξεργασίας σωμάτων κειμένων Παρά την ευρύτατη διάδοση της χρήσης σωμάτων κειμένων και την προφανή χρησιμότητά τους, κατά την Frérot (2009), σύμφωνα με έρευνα που διενεργήθηκε κατά τη διάρκεια του προγράμματος MeLLANGE 3, με αντικείμενο τη χρήση σωμάτων κειμένων από επαγγελματίες μεταφραστές από πέντε χώρες, βρέθηκε ότι μόνο το 43,9% συγκεντρώνει ειδικά κείμενα του τομέα προς μετάφραση, εκ των οποίων μεταφραστών το 69% συγκεντρώνει κείμενα σε ηλεκτρονική μορφή, ωστόσο το 53,4% στην πραγματικότητα «διαβάζει» τα κείμενα αντί να πραγματοποιεί αναζητήσεις μέσω ειδικού λογισμικού. Μεταξύ του 46,6% που χρησιμοποιεί ηλεκτρονικά εργαλεία, το 20,2% χρησιμοποιεί προγράμματα δημιουργίας συμφραστικών πινάκων, ενώ το 65,1% χρησιμοποιεί την αναζήτηση σε επεξεργαστές κειμένου. Τα δεδομένα αυτά καταδεικνύουν το γεγονός ότι τα ηλεκτρονικά εργαλεία επεξεργασίας σωμάτων κειμένων και οι συμφραστικοί πίνακες δεν αποτελούν κοινή πρακτική για την πλειονότητα των επαγγελματιών μεταφραστών. Ωστόσο, οι απαντήσεις τους σε ερωτηματολόγια έδειξαν αυξημένο ενδιαφέρον όσον αφορά λογισμικό που μπορεί να παρέχει ειδικά σώματα κειμένων, ανάλογα με τις μεταφραστικές ανάγκες (84%) και επίσης όσον αφορά την αυτόματη εξαγωγή όρων από ειδικά σώματα κειμένων (83,4%). Δεδομένης λοιπόν της πολλαπλότητας των εφαρμογών των παράλληλων και συγκρίσιμων σωμάτων κειμένων, θα παρουσιάσουμε στη συνέχεια ορι- 03. Multilingual elearning in LANGuage Engineering. Πληροφορίες διαθέσιμες στην ιστοσελίδα http://mellange.eila.univ-paris-diderot.fr (10.1.2012).

88 Ελένη Τζιάφα σμένα ηλεκτρονικά εργαλεία που μπορούν να εφαρμοστούν για την επεξεργασία και την ανάλυσή τους, ακολουθώντας τη διαδικασία κατασκευής και επεξεργασίας των παράλληλων και συγκρίσιμων σωμάτων κειμένων που κατασκευάστηκαν στο πλαίσιο της έρευνας πάνω στο αντικείμενο της διδακτορικής διατριβής μας για τα συντακτικά και σημασιολογικά χαρακτηριστικά των όρων του ελληνικού χρηματιστηρίου. Η διαδικασία ακολουθεί καταρχήν τα τρία βασικά βήματα της κατασκευής σωμάτων κειμένων: τον σχεδιασμό, τη συλλογή των κειμένων και την προεπεξεργασία. Συνακόλουθα, χρησιμοποιούνται, σε κάθε στάδιο, τα αντίστοιχα εργαλεία που είναι απαραίτητα για την κατασκευή γενικότερα σωμάτων κειμένων σε ηλεκτρονική μορφή. Η συλλογή των συγκεκριμένων σωμάτων κειμένων, παράλληλων και συγκρίσιμων, προέκυψε κατά τη διάρκεια του ευρύτερου σχεδιασμού των ηλεκτρονικών σωμάτων κειμένων που χρησιμοποιήθηκαν ως βάση για τη μελέτη των συντακτικών και σημασιολογικών χαρακτηριστικών των όρων του χρηματιστηρίου. Τα συγκεκριμένα σώματα που χρησιμοποιήθηκαν στην παρούσα εργασία (περίπου 1.000.000 λέξεις για την ελληνική και 1.000.000 λέξεις για την αγγλική γλώσσα) αποτελούν μέρος ενός μεγαλύτερου μονόγλωσσου σώματος κειμένων από το χώρο του χρηματιστηρίου, το οποίο με τη σειρά του θα μπορούσε να χρησιμεύσει στο μέλλον ως ένα συγκρίσιμο σώμα κειμένων. Τα εργαλεία που χρησιμοποιήθηκαν κατά τη διάρκεια της εργασίας αυτής είναι είτε λογισμικά ανοιχτού κώδικα είτε κατά το δυνατόν ελεύθερα λογισμικά όσο το δυνατόν, ενώ για ορισμένα από τα εμπορικά προϊόντα υπάρχουν διαθέσιμες λειτουργικές δοκιμαστικές εκδόσεις. Επιλέχθηκαν επίσης, ανάμεσα σε πολλά συναφή προγράμματα, αυτά που παρείχαν έδιναν; τη δυνατότητα υποστήριξης της ελληνικής γλώσσας. Για τη σωστή χρήση των εργαλείων, συχνά ήταν απαραίτητη η κωδικοποίηση σε μορφή UTF8, ώστε να υπάρχει ελάχιστη απώλεια χαρακτήρων. Αρχικά, λοιπόν, χρησιμοποιήθηκε το πρόγραμμα Httrack Website Copier, ένα εργαλείο αποθήκευσης ιστοτόπων ώστε να είναι διαθέσιμοι και χωρίς σύνδεση. Τα αρχεία που περιέχονται στις ιστοσελίδες είναι απαραίτητο να μετατραπούν σε αρχεία απλού κειμένου (.txt) προκειμένου να ενσωματωθούν σε σώματα κειμένων. Έτσι, χρησιμοποιήθηκαν προγράμματα που επιτρέπουν τη μαζική μετατροπή χιλιάδων αρχείων (.html,.doc,.pdf,.xls κ.ά.) σε αρχεία απλού κειμένου (.txt) 4. Στη συνέχεια πραγματοποιήθηκε η συνένωση όλων των αρχείων απλού κειμένου σε ένα κείμενο, ώστε οι διορθώσεις τυπογραφικών και άλλων στοιχείων να πραγματοποιηθούν με αυτόματο, κατά το δυνατόν, τρόπο, επί του συνόλου των κειμένων. Τέλος, αναγκαία υπήρξε η ανίχνευση των διπλών αρχείων, με κοινό περιεχόμενο, ακόμη και εφόσον είχαν διαφορετικό όνομα. Στον ακόλουθο πίνακα παρατίθενται τα κυριότερα εργαλεία που χρησιμοποιήθηκαν και οι διευθύνσεις όπου αυτά μπορούν να ανακτηθούν. 04. Για τα αρχεία που περιείχαν πίνακες ή προέρχονταν από αρχεία παρουσιάσεων (Power Point) χρησιμοποιήθηκε το πρόγραμμα OCR Adobe Fine Reader, το οποίο ενδείκνυται επίσης όταν τα κείμενα είναι στοιχειοθετημένα σε στήλες.

Συμβολή παράλληλων και συγκρίσιμων σωμάτων κειμένων στη μετάφραση 89 Πίνακας 1: Εργαλεία που χρησιμοποιήθηκαν κατά τη διαδικασία επεξεργασίας των κειμένων Τα κείμενα τα οποία επεξεργαστήκαμε στο πλαίσιο της παρούσας εργασίας είναι τα κείμενα των ετήσιων απολογισμών του ΧΑΑ της περιόδου 2000-2010 και της μετάφρασής τους στην αγγλική. Οι εταιρείες από τις οποίες προέρχονται οι εν λόγω ετήσιοι απολογισμοί είναι θυγατρικές του Ομίλου Ελληνικά Χρηματιστήρια Α.Ε. Οι εταιρείες αυτές εκδίδουν και διαθέτουν σε ηλεκτρονική μορφή από τις ιστοσελίδες τους ετήσιους απολογισμούς τους από το 1999 και το Χ.Α.Α. από το 2000. Μεταφρασμένοι στην αγγλική γλώσσα υπάρχουν για τα έτη που σημειώνονται εντός των παρενθέσεων. Χ.Α.Α. - Χρηματιστήριο Αθηνών Α.Ε. (2003-2006) Χ.Π.Α. - Χρηματιστήριο Παραγώγων Αθηνών Α.Ε. (1999-2001) ΕΤ.Ε.Σ.Ε.Π. - Εταιρεία Εκκαθάρισης Συναλλαγών Επί Παραγώγων (2003) Ε.Χ.Α.Ε. - Ελληνικά Χρηματιστήρια Α.Ε. (2000-2010)

90 Ελένη Τζιάφα Μέσω της προεπεξεργασίας των κειμένων από το πρόγραμμα Unitex (Paumier 2008), προέκυψαν ορισμένα στοιχεία που παρουσιάζονται στον ακόλουθο πίνακα: Πίνακας 2: Στατιστικά στοιχεία των παράλληλων σωμάτων κειμένων Με βάση τα στατιστικά αυτά στοιχεία, ήδη γίνεται προφανής, για παράδειγμα, η διαφορά της έκτασης της περιόδου στην ελληνική και την αγγλική γλώσσα, εφόσον τα ίδια κείμενα τεμαχίζονται σε 37.005 περιόδους στην ελληνική γλώσσα, έναντι 77.331 περιόδων στην αγγλική γλώσσα. Αυτό οφείλεται στη διαφορά των δομών της περιόδου μεταξύ της ελληνικής (μακροπερίοδης) γλώσσας και της αγγλικής, αλλά πιθανόν και στο γεγονός ότι η αγγλική γλώσσα αποτελεί τη γλώσσα-στόχο, επομένως υπάρχει η τάση απλοποίησης της γλώσσας-πηγής μέσω του τεμαχισμού των μακρών περιόδων (Baker, 1996). 4. Διαδικασία Παραλληλοποίησης Η διαδικασία της παραλληλοποίησης πραγματοποιήθηκε μέσω της λειτουργίας Xalign του προγράμματος Unitex. Μέσω της διαδικασίας αυτής καθίσταται δυνατή η ανίχνευση της αντιστοιχίας μίας περιόδου της γλώσσαςπηγής σε δύο περιόδους της γλώσσας-στόχου ή το αντίθετο. Εικόνα 1: Παραλληλοποίηση κειμένων

Συμβολή παράλληλων και συγκρίσιμων σωμάτων κειμένων στη μετάφραση 91 Η κατασκευή συμφραστικών πινάκων, αποτελεί επίσης ένα βασικό και πολύ συχνά χρησιμοποιούμενο εργαλείο για την αναζήτηση των σωστών συνάψεων των όρων, την κατανόηση μέσω των συμφραζομένων, αλλά και τον εντοπισμό, για παράδειγμα, του κατάλληλου ρήματος, ή, τέλος, για την επιβεβαίωση των μεταφραστικών υποθέσεων. Ωστόσο, ένα από τα μεγαλύτερα πλεονεκτήματα της χρήσης παράλληλων κειμένων μέσω της διαδικασίας παραλληλοποίησης αποτελεί η παραγωγή δίγλωσσων ή παράλληλων συμφραστικών πινάκων. Ο χρήστης πληκτρολογεί μια λέξη ή φράση σε μία από τις δύο γλώσσες και το πρόγραμμα εμφανίζει όλες τις προτάσεις όπου αυτή η λέξη ή φράση εμφανίζεται στοιχίζοντάς τες με τις προτάσεις στην άλλη γλώσσα. Οι δύο ομάδες εμφανίζονται σε δύο στήλες. Έτσι μπορούμε να δούμε πώς η λέξη μεταφράζεται αλλά και πώς χρησιμοποιείται στην άλλη γλώσσα. Εικόνα 2: Εύρεση αντιστοιχιών μέσω παραλληλοποίησης Μετά το στάδιο της παραλληλοποίησης των κειμένων μπορούμε πλέον να περάσουμε στην εφαρμογή εργαλείων εξαγωγής δίγλωσσης ορολογίας όπως τα ακόλουθα: Giza++, http://code.google.com/p/giza-pp/ Berkeley aligner, http://code.google.com/p/berkeleyaligner/downloads/detail?name=berkeleyaligner_unsupervised-2.1.tar.gz Cairo, http://www.clsp.jhu.edu/ws99/projects/mt/toolkit/ I*Link, http://www.ida.liu.se/~nlplab/ilink/ NATools-0.5.5, http://linguateca.di.uminho.pt/natools/ SDL Multiterm Extract, http://www.translationzone.com/en/translatorproducts/sdlmultitermextract/ Το δημοφιλέστερο πρόγραμμα είναι το Giza++, ένα λογισμικό ανοιχτού κώδικα, ενώ τα περισσότερα λειτουργούν σε περιβάλλον Linux, εκτός από τα τρία τελευταία που λειτουργούν σε Linux και Windows ή μόνο Windows.

92 Ελένη Τζιάφα 5. Εργαλεία Εξαγωγής Δίγλωσσης Ορολογίας Για την παρούσα εργασία χρησιμοποιήθηκε ένα εργαλείο το οποίο αποτελεί μέρος ομάδας προγραμμάτων με την οποία είναι εξοικειωμένοι οι περισσότεροι μεταφραστές (SDL Trados). Εικόνα 3: Εξαγωγή ορολογίας μέσω SDL Multiterm Τα αποτελέσματα της εφαρμογής των εργαλείων στα συγκεκριμένα σώματα κειμένων ήταν ιδιαιτέρως ενθαρρυντικά, καθώς προέκυψαν σε πρώτο στάδιο 21.198 όροι με τις μεταφράσεις τους στην αγγλική γλώσσα, από τους οποίους με τη βοήθεια του προγράμματος Unitex αναγνωρίστηκαν 13.856 απλές λέξεις και 1.677 σύνθετες. Από αυτές, μετά την εφαρμογή μέσω Unitex των λεξικών του χρηματιστηρίου που κατασκευάστηκε ως μέρος του λεξικού της νέας ελληνικής γλώσσας, το οποίο δημιουργήθηκε στο Εργαστήριο Μετάφρασης και Επεξεργασίας του Λλόγου, ταυτοποιήθηκαν ως όροι του χρηματιστηρίου 1.177 απλές λέξεις και 731 σύνθετες. Προέκυψε έτσι από το αρχικό σώμα κειμένων ένα γλωσσάρι ελληνικής χρηματιστηριακής ορολογίας με τη μετάφρασή τους στην αγγλική γλώσσα 1.908 όρων, μέσα σε ελάχιστο χρονικό διάστημα μετά την εγκατάσταση των προγραμμάτων και την επεξεργασία του κειμένου. 5.1. Συγκρίσιμο σώμα κειμένων Επιπρόσθετα, έγινε η συλλογή και επεξεργασία ενός συγκρίσιμου σώματος κειμένων από τους ετήσιους απολογισμούς της αντίστοιχης περιόδου του χρηματιστηρίου του Λονδίνου και της NYSE Euronext. Ο όμιλος NYSE εξαγόρασε το Euronext το 2007, και διαχειρίζεται αγορές μετοχών και παραγώγων στο Άμστερνταμ, τις Βρυξέλλες, τη Λισαβόνα και το Παρίσι, όπως επίσης και

Συμβολή παράλληλων και συγκρίσιμων σωμάτων κειμένων στη μετάφραση 93 την αγορά παραγώγων NYSE Liffe στο Λονδίνο. Με την επιλογή αυτών των ετήσιων απολογισμών συμπεριελήφθησαν στο συγκρίσιμο σώμα κειμένων οι διαθέσιμοι απολογισμοί στην αγγλική γλώσσα (ως γλώσσα-πηγή) στο μεγαλύτερο μέρος των χρηματιστηρίων της Ευρώπης. Ανήκουν στην ίδια χρονική περίοδο με τα παράλληλα σώματα κειμένων, έχουν δημιουργηθεί για τις ίδιες συνθήκες επικοινωνίας και ανήκουν στο ίδιο επίπεδο λόγου (επίσημη γλώσσα). Εφαρμόζουμε ένα πρόγραμμα εξαγωγής όρων από το συγκρίσιμο σώμα κειμένων, και προκύπτουν σε πρώτο στάδιο 25.716 όροι, στους οποίους περιλαμβάνονται 125.755 εμφανίσεις όρων που αντιστοιχούν σε 7.487 διαφορετικές απλές λέξεις και 1.403 εμφανίσεις σύνθετων όρων που αντιστοιχούν σε 1.150 διαφορετικές σύνθετες λέξεις. Τα αποτελέσματα των όρων μπορούν να συγκριθούν με τα αποτελέσματα που προέκυψαν από την επεξεργασία των παράλληλων σωμάτων κειμένων χωρίς κάποιο πολύπλοκο εργαλείο, αλλά με τη χρήση μικρών προγραμμάτων σε γλώσσα Perl. Εικόνα 4: Εξαγωγή όρων από το συγκρίσιμο σώμα κειμένων στην αγγλική γλώσσα 5.2. Λίστες συχνοτήτων Τα περισσότερα από τα ηλεκτρονικά εργαλεία αξιοποιούν τις λίστες συχνοτήτων των λέξεων που μπορούν να παραχθούν από πολλά προγράμματα. Στη συγκεκριμένη περίπτωση πρόκειται για τις λίστες στοιχείων (tokens) που παράγει το πρόγραμμα Unitex ταυτόχρονα με το άνοιγμα ενός κειμένου. Παραθέτουμε στον Πίνακα 3 τις 20 πρώτες λέξεις με λεξική σημασία. Εύκολα μπορούν να εντοπιστούν οι ομοιότητες ανάμεσα στη γλώσσα πηγή και τη γλώσσα-στόχο. Σε ορισμένα κελιά παρατηρούμε απόλυτα στοιχισμένες κάποιες λέξεις, π.χ. τη λέξη financial και στα δύο σώματα κειμένων στην αγγλική γλώσσα. Ακόμη και όταν δεν είναι απόλυτα στοιχισμένες, ο εντοπισμός τους είναι σχετικά εύκολος.

94 Ελένη Τζιάφα Πίνακας 3: Λίστες συχνοτήτων μονολεκτικών όρων Παρατηρούμε ότι οι λέξεις που βρίσκονται στις υψηλότερες θέσεις στις λίστες συχνοτήτων είναι κοινές ανάμεσα στα τρία σώματα κειμένων, διευκολύνοντας έτσι τον μεταφραστή να επιλέξει την καταλληλότερη για τη μετάφραση, ελέγχοντας παράλληλα το συγκρίσιμο σώμα κειμένων. Ωστόσο σε πολλές περιπτώσεις οι λέξεις που εμφανίζονται εδώ αποτελούν μέρος πολυλεκτικών όρων, π.χ. η λέξη οικονομικές συμπληρώνεται με τη λέξη καταστάσεις, κάτι που το διαπιστώνουμε όταν δημιουργούμε ένα συμφραστικό πίνακα για τη λέξη οικονομικές. Επομένως, καθίσταται απαραίτητη η μελέτη των σύνθετων όρων. Για τη μελέτη των συνάψεων (collocations) χρησιμοποιήσαμε το πρόγραμμα Antconc (Anthony 2011), ένα ελεύθερο λογισμικό, καθώς και το Wordsmith Tools (Scott 2011). Τα εξαγόμενα αποτελέσματα μπορούν σε συνδυασμό με την αναγνώριση των μερών του λόγου με το πρόγραμμα Unitex να οδηγήσουν σε λίστες πολυλεκτικών μονάδων. Με αυτά τα προγράμματα μπορούμε να εντοπίσουμε ακόμη και πολυλεκτικές μονάδες που αποτελούνται από περισσότερες από πέντε λέξεις.

Συμβολή παράλληλων και συγκρίσιμων σωμάτων κειμένων στη μετάφραση 95 Πίνακας 4: Λίστες συχνοτήτων διλεκτικών όρων Παρατηρούμε ότι δίνεται η δυνατότητα στο μεταφραστή να επιβεβαιώσει όρους που εμφανίζονται τόσο στο μεταφρασμένο κείμενο όσο και στο συγκρίσιμο, όπως π.χ. financial statements, general meeting, balance sheet, fair value, ή να διερευνήσει όρους που παρουσιάζουν διαφορές όπως Market

96 Ελένη Τζιάφα Commission, Audit Committee, Supervisory Board, ή απουσιάζουν από το συγκρίσιμο σώμα κειμένων, όπως οι όροι fiscal year, Auxiliary Fund, executive member κ.ά. 6. Κατακλείδα Κατά την παρούσα εργασία, πέρα από τη θεωρητική διερεύνηση της συμβολής των παράλληλων και συγκρίσιμων σωμάτων κειμένων στη μεταφραστική διαδικασία, αλλά και τον εντοπισμό και την καταγραφή ηλεκτρονικών εργαλείων κατάλληλων για την επεξεργασία σωμάτων κειμένων στην ελληνική γλώσσα, προέκυψαν ορισμένα πρακτικά αποτελέσματα. Συγκεκριμένα, προέκυψαν ορισμένοι γλωσσικοί πόροι προς χρήση από τους μεταφραστές: Δύο παράλληλα σώματα κειμένων (EN-GR) Ένα συγκρίσιμο σώμα κειμένων (ENC) Ένα ελληνο-αγγλικό γλωσσάρι 1908 όρων Λίστες συχνοτήτων απλών και πολυλεκτικών μονάδων Τα σώματα κειμένων θα μπορούσαν να χρησιμοποιηθούν, πέρα από τη μετάφραση ειδικών χρηματιστηριακών κειμένων, κατά την εκπαίδευση μεταφραστών όσον αφορά ειδικά κείμενα, ώστε να εξασκηθούν στη χρήση τους στη μετάφραση, παράλληλα με το ειδικό λογισμικό, προκειμένου να επιλύσουν προβλήματα ορολογίας και φρασεολογίας. Βιβλιογραφικές αναφορές Anthony L. (2011). AntConc (Version 3.2.2) [Computer Software]. Tokyo, Japan: Waseda University. http://www.antlab.sci.waseda.ac.jp/ (10.1.2012). Aston G.& N. Kübler (2010) Using Corpora in Translation. In M. Mc Carthy & A. O Keefe (eds) The Routledge Handbook of Corpus Linguistics, London: Routledge, 501-515. Baker M. (1996). Corpus-based Translation Studies: The Challenges that Lie Ahead. In H. Somers (ed.) Terminology, LSP and Translation: Studies in Language Engineering in Honour of Juan C. Sager. Amsterdam: John Behnjamins, 175-186. Bernandini S.& F. Zanettin (2004). When is a Universal not a Universal? Some Limits of Current Corpus-based Methodologies for the Investigation of Translation Universals. In A. Mauranen, P. Kujamäki (eds.) Translation Universals: Do They Exist? Amsterdam: John Benjamins, 51-62. Bowker L. 1998. Using specialized monolingual native-language corpora as a translation resource: A pilot study. In Meta 43,4, 631-651. Bowker L. & J. Pearson (2002). Working with specialized language: A practical guide to using corpora. London, New York: Routledge. EAGLES (1996a). Recommendations for the morphosyntactic annotation of corpora, Pisa. http://www.ilc.cnr.it/eagles/home.html (10.1.2012). EAGLES (1996b). Synopsis and comparison of morphosyntactic phenomena encoded in lexicons and corpora, Pisa. http://www.ilc.cnr.it/eagles96/ corpustyp/corpustyp.html (10.1.2012).

Συμβολή παράλληλων και συγκρίσιμων σωμάτων κειμένων στη μετάφραση 97 Frérot C. (2009). Designing a corpus-based translation course for translation teaching and translator training. In International Journal of Translation, 2, 1-2, 133-147. Kenning M.-M. (1999). Parallel Concordancing and French Personal Pronouns. In Languages in Contact 1, 1, 1-21. Kenny D. (2005). Parallel Corpora and Translation Studies: Old Questions, New Perspectives?. In G. Barnbrook, P. Danielson & M. Mahlberg (eds.) Meaningful Texts: The Extraction of Semantic Information from Monolingual and Multilingual Corpora. London Continuum, 154-165. Kyriacopoulou T. (2005). L analyse automatique des textes écrits : le cas du grec moderne. Thessalonique: University Studio Press. Laviosa S. (2002). Corpus-Based Translation Studies: Theory, Findings, Applications. Amsterdam, New York: Rodopi. Olohan M. (2004). Introducing Corpora in Translation Studies: An Introduction. London: Routledge. Paumier S. (2008). Unitex manual. University of Marne-la-Vallée. http://www-igm. univ-mlv.fr/~unitex/unitexmanual2.0.pdf. (10.1.2012). Pearson J. (2003). Using parallel texts in translation training environment. In F. Zanettin, S. Bernardini & D. Stewart (eds.), Corpora in Translator Education. Manchester: St Jerome, 15-24. Scott M. (2011). WordSmith Tools Help. Liverpool: Lexical Analysis Software. http://www.lexically.net/downloads/version5/html/proc_tag_handling.htm (10.1.2012). Shuttleworth M., M. Cowie (1997). Dictionary of Translation Studies. Manchester: St Jerome. Tao T. και C.X. Zhai (2005). Mining Comparable Bilingual Text Corpora for Crosslanguage Information Integration. In Proceedings of the Eleventh ACM SGKDD International Conference on Knowledge Discovery in Data Mining. Chicago: SGKDD, 691-696. Teubert W. (1996). Comparable or Parallel Corpora?. In International Journal of Lexicography 9, 3, 238-264. Tognini-Bonelli E. (2001). Corpus Linguistics at Work. Amsterdam: John Benjamins. Wilkinson M. (2005). Using a specialized corpus to improve translation quality. In Translation Journal 9, 3. http://www.bokorlang.com/journal/33corpus.htm (10.1.2012). Williams I. A. (1996). A translator s reference needs: Dictionaries or parallel texts. In Target 8, 277-299. Zanettin F. (1998). Bilingual comparable corpora and the training of translators. In S. Laviosa (ed.) Meta 43, 4, Special Issue. The corpus-based approach: a new paradigm in translation studies, 616-630. Zanettin F. (2001). Swimming in words: Corpora, translation and language training. In G. Aston (ed.), Learning with Corpora. Houstox, TX: Athelstan, 177-197. Zanettin F., S. Bernardini & D. Stewart (eds.) (2003). Corpora in Translator Education. Manchester: St. Jerome.

98 Ελένη Τζιάφα