ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (Δ.Π.Μ.Σ.)

Σχετικά έγγραφα
ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΕΡΓΑΣΤΗΡΙΟ ΜΕΤΑΦΡΑΣΗΣ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ ΜΟΝΑ Α ΑΥΤΟΜΑΤΗΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΦΥΣΙΚΩΝ ΓΛΩΣΣΩΝ

Απλές ασκήσεις για αρχάριους μαθητές 3

ΓΡΑΜΜΑΤΙΚΗ ΣΥΝΤΑΞΗ ΕΙΣΑΓΩΓΗ


Θέµατα Μορφολογίας της Νέας Ελληνικής Ι. Κώστας Δ. Ντίνας Πανεπιστήµιο Δυτικής Μακεδονίας

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΜΑΥΡΟΠΟΥΛΟΣ ΑΘΑΝΑΣΙΟΣ (ΠΑΡΑΡΤΗΜΑΤΑ) ΔΙΔΑΚΤΟΡΙΚΗ ΔΙΑΤΡΙΒΗ

ΟΜΟΙΟΙ ΚΑΙ OMOHXΟΙ ΤΥΠΟΙ

ΦΩΝΗΤΙΚΗ-ΦΩΝΟΛΟΓΙΑ (Ι)

Τα ουσιαστικά. Ενικός αριθµός Πληθυντικός αριθµός

ΟΜΟΙΟΙ ΚΑΙ OMOHXΟΙ ΤΥΠΟΙ

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (Δ.Π.Μ.Σ.)

ΑΡΘΡΑ. Μικρές λέξεις που μπαίνουν μπροστά από ουσιαστικά, επίθετα, τις κλιτές μετοχές και ορισμένες αντωνυμίες. ΟΥΣΙΑΣΤΙΚΑ

Ρήματα λέγονται οι λέξεις που φανερώνουν ότι ένα πρόσωπο, ζώο ή πράγμα ενεργεί ή παθαίνει κάτι ή βρίσκεται σε μία κατάσταση.

ΚΟΛΛΕΓΙΟ ΑΘΗΝΩΝ Σχολικό έτος: ΤΜΗΜΑ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ ΓΥΜΝΑΣΙΟ

ΚΟΛΛΕΓΙΟ ΑΘΗΝΩΝ Σχολικό έτος: ΤΜΗΜΑ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ ΓΥΜΝΑΣΙΟ

Η πρόταση. Πρόταση λέγεται ένα σύντομο κομμάτι του λόγου, που περιλαμβάνει μια σειρά από λέξεις με ένα τουλάχιστον ρήμα και έχει ολοκληρωμένο νόημα.

ΤΑ ΜΕΡΗ ΤΟΥ Βασίλης Αναστασίου

ΚΟΛΛΕΓΙΟ ΑΘΗΝΩΝ Σχολικό έτος: ΤΜΗΜΑ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ ΓΥΜΝΑΣΙΟ

Ουσιαστικά. Ενικός αριθµός Πληθυντικός αριθµός

Η ύλη για τις εξετάσεις υποτροφιών: (για οποιαδήποτε διευκρίνιση μπορείτε να απευθύνεστε στις γραμματείες των φροντιστηρίων).

«Η τροπικότητα στην Νέα Ελληνική» Ανάλυση βάσει του Επικοινωνιακού Δοµολειτουργικού Προτύπου

ΟΜΟΙΟΙ ΚΑΙ OMOHXΟΙ ΤΥΠΟΙ

Νέα ελληνικά Πανεπιστήμιο Stendhal Grenoble 3 Επίπεδο A2 Α εξάμηνο-επιλογή / επιμέλεια Μ. Ζουμπουλίδου Γραμματικό Κοινωνικοπολιτιστικά.

Νέα ελληνικά- Πανεπιστήμιο Stendhal Grenoble 3 επίπεδο A1 εξάμηνο Β - επιλογή /επιμέλεια Μ. Ζουμπουλίδου Γραμματικό Κοινωνικοπολιτιστικά.

Πρόσεξε τα παρακάτω παραδείγματα:

Λογισμικό: Αρχαία με Νόημα Κατηγορία αναπηρίας: Κώφωση Βαρηκοΐα Μάθημα: Αρχαία Ελληνικά Τάξη/εις: Α, Β Γυμνασίου

ΧΡΗΣΙΜΕΣ ΠΑΡΑΤΗΡΗΣΕΙΣ ΣΤΑ ΛΑΤΙΝΙΚΑ ΚΕΙΜΕΝΑ

ΕΝΗΜΕΡΩΤΙΚΟ ΣΗΜΕΙΩΜΑ ΕΚΠΑΙΔΕΥΤΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΟΣ

ΡΗΜΑΤΑ. Στην πρώτη περίπτωση κάποιος ενεργεί (ρήμα) και η ενέργειά του αυτή ασκείται σε ένα άλλο πρόσωπο ή πράγμα έξω από αυτόν.

Νέα ελληνικά-πανεπιστήμιο Stendhal Grenoble 3 Επίπεδο A2 Β εξάμηνο-επιλογή /επιμέλεια Μ. Ζουμπουλίδου Γραμματικό. Πηγές Πηγές περιεχόμενο

ΓΝΩΣΤΙΚΟ ΑΝΤΙΚΕΙΜΕΝΟ: ΑΡΧΑΙΑ ΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ

Νέα ελληνικά Επίπεδο A1-Εξάμηνο Α Κοινωνικοπολιτιστικά Βιβλία. Πηγές

Προτεινόμενος Προγραμματισμός κατά ενότητα

ΕΚ ΟΣΕΙΣ ΠΑΠΑ ΟΠΟΥΛΟΣ

ΥΛΗ ΕΞΕΤΑΣΕΩΝ 2007 ΥΠΟΨΗΦΙΩΝ ΥΠΟΤΡΟΦΩΝ ΚΑΘΙΔΡΥΜΑΤΟΣ ΑΘΑΝΑΣΙΟΥ ΜΑΤΑΛΑ Α ΝΕΟΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ

Εισαγωγικές εξετάσεις 2019

Μέθοδοι εξάλειψης μορφολογικών αμφισημιών κατά την αυτόματη ανάλυση κειμένων της Νέας Ελληνικής

ΧΡΗΣΙΜΕΣ ΠΑΡΑΤΗΡΗΣΕΙΣ ΣΤΑ ΛΑΤΙΝΙΚΑ ΚΕΙΜΕΝΑ

ΕΜΠΛΟΥτΙΣΜΟΣ ΜΟΡΦΟΛΟΓΙΚΩΝ ΛΕΞΙΚΩΝ ΜΕ ΟΡΟΥΣ ΚΑΙ ΥΠΟΣτΗΡΙΞΗ

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ ΕΚΠΑΙΔΕΥΣΗ

ΚΟΛΛΕΓΙΟ ΑΘΗΝΩΝ Σχολικό έτος: ΤΜΗΜΑ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ ΓΥΜΝΑΣΙΟ ΝΕΟΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ Α ΓΥΜΝΑΣΙΟΥ. Προτεινόμενος Προγραμματισμός κατά ενότητα

ΑΝΣΩΝΤΜΙΕ Είναι κλιτές λέξεις που αντικαθιστούν ονοματικές φράσεις και κάνουν την ίδια «δουλειά» με αυτές.

PROF. GEORGE Th. PAVLIDIS

ΣΧ.ΕΤΟΥΣ Τάξη Β Τμήμα: Β θεωρητική 1 Μάθημα: Λατινικά Α ΤΕΤΡΑΜΗΝΟ. ρωμαϊκής λογοτεχνίας, γενικά χαρακτηριστικά της ρωμαϊκής λογοτεχνίας

για ξένους υ ISBN: ΒΟΗΘ. ΚΩΔ. ΜΗΧ/ΣΗΣ 5463

Στάδια Ανάπτυξης Λόγου και Οµιλίας

Φύλλα εργασίας για τη Γλώσσα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ. Εισαγωγή στη Γλωσσολογία Ι. Μορφολογία

Η εξέλιξη στα συστήματα Μηχανικής Μετάφρασης

ΛΑΤΙΝΙΚΑ Β Λ ΠΡΟΕΤΟΙΜΑΣΙΑ Γ Λ. ΠΑΡΑΤΗΡΗΣΕΙΣ Β1. Να γράψετε τους τύπους που ζητούνται για καθεμία από τις παρακάτω λέξεις:

Προτεινόμενος Προγραμματισμός κατά ενότητα

Ι, Α. Ερωτήσεις ανοικτού τύπου ή ελεύθερης ανάπτυξης

Gramática de referencia del español para griegos

Εισαγωγή στη Γλωσσολογία Ι

Δεκτές είναι μόνο οι λέξεις της νέας Eλληνικής γλώσσας που υπάρχουν στα ισχύοντα βοηθήματα-λεξικά τα οποία είναι τα εξής (1) :

ΣΤΑΔΙΑ ΕΠΕΞΕΡΓΑΣΙΑΣ ΑΓΝΩΣΤΟΥ ΚΕΙΜΕΝΟΥ

ΠΡΟΛΟΓΟΣ ΠΡΩΤΗΣ ΕΚΔΟΣΗΣ

ΧΡΗΣΙΜΕΣ ΠΑΡΑΤΗΡΗΣΕΙΣ ΣΤΑ ΛΑΤΙΝΙΚΑ ΚΕΙΜΕΝΑ

ΑΔΙΔΑΚΤΟ ΚΕΙΜΕΝΟ. Ἀκούω δ αὐτόν, ὦ ἄνδρες δικασταί, ἐπὶ τοῦτον τὸν λόγον τρέψεσθαι, ὡς

Δείγμα εξέτασης. Ο νέος σχεδιασμός

Νέα ελληνικά Πανεπιστήμιο Stendhal Grenoble 3 Επίπεδο Β1.1 Α εξάμηνο Επιλογή /επιμέλεια Μ.Ζουμπουλίδου. στοιχεία

Τα ταξίδια του παππού. Ρήματα σε -άβω. Τα ρήματα που τελειώνουν σε -άβω γράφονται με β. πχ: ράβω, ανάβω, σκάβω, θάβω, κ.ά.

Οι μαθητές και οι μαθήτριες να είναι σε θέση να: Να κατανοούν την ανθρωποκεντρική διάσταση του αρχαίου κόσμου.

Εργαστήριο Αρχαιομάθειας. Κείμενο. Κατάλογος φαινομένων. Περιεχόμενα. [Διδασκαλία - Εκπαίδευση] Ηλεκτρονικές Ασκήσεις

Αναδιάρθρωση και εξορθολογισμός διδακτέας ύλης

Πρόγραμμα θερινής περιόδου Γ Λυκείου Από 22 Ιουνίου έως 24 Ιουλίου Διάρκεια προγράμματος: 5 εβδομάδες

Εφαρµογές Τεχνολογιών Γλωσσικής Επεξεργασίας στα Συστήµατα Αναζήτησης των Ελληνικών Ακαδηµαϊκών Βιβλιοθηκών

Κεφάλαιο 2. Συντακτικές κατηγορίες

21. Ορολογία και ηλεκτρονικός ορθογραφικός έλεγχος. Terminology and automatic spelling correction

Όταν µπροστά από τα κύρια ονόµατα υπάρχει τίτλος, τότε το οριστικό άρθρο προηγείται του τίτλου: ο κύριος Μικέογλου ο πρίγκιπας Κάρολος

Studying at the School of English. Οι σπουδές στο Τμήμα Αγγλικής Γλώσσας και Φιλολογίας Α.Π.Θ.

Δείγμα εξέτασης. Ο νέος σχεδιασμός

Νέα ελληνικά-πανεπιστήμιο Stendhal Grenoble 3 Επίπεδο Β1.2 Α εξάμηνο-επιλογή / επιμέλεια Μ.Ζουμπουλίδου Γραμματικό Κοινωνικοπολιτιστικά.

ΑΓΓΛΙΚΗ ΣΧΟΛΗ ΛΕΥΚΩΣΙΑΣ ΕΙΣΑΓΩΓΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Χρόνος: 1 ώρα. Οδηγίες

Ηλεκτρονικό Λεξικό Ρηµάτων Αρχαίας Ελληνικής Γλώσσας. Περίληψη

Σχηματισμός Ευκτικής Παρακειμένου Ενεργητικής Φωνής. Στις σημειώσεις μας θα εστιάσουμε στον περιφραστικό τύπο, καθώς αυτός είναι ο πιο εύχρηστος.

1. ΣΤΟΙΧΕΙΑ ΤΙΤΛΟΥ ΔΙΑΤΡΙΒΗΣ

Στόχος του βιβλίου αυτού είναι να κατακτήσουν οι μικροί μαθητές

ΥΠΟΥΡΓΕΙΟ ΠΑΙ ΕΙΑΣ ΚΑΙ ΠΟΛΙΤΙΣΜΟΥ

Λογισμικό: Γλωσσικές Περιπλανήσεις Κατηγορία αναπηρίας: Κώφωση Βαρηκοΐα Μάθημα: Γλώσσα Τάξη/εις: Δ, Ε και Στ Δημοτικού

Περιεχόμενα. I. Εισαγωγή και γενικές οδηγίες II. Προετοιμασία: θεματικές ενότητες, λεξιλόγιο και Γραμματική 1. Δομή της γραπτής εξέτασης

ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΑΣΚΗΣΕΙΣ ΑΡΧΑΙΩΝ ΕΛΛΗΝΙΚΩΝ (ΧΡΙΣΤΟΥΓΕΝΝΙΑΤΙΚΟ ΔΩΡΑΚΙ!!!!)

ΝΕΑ ΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ - ΔΗΜΟΤΙΚΗ ΕΚΠΑΙΔΕΥΣΗ - ΔΕΙΚΤΕΣ ΕΠΙΤΥΧΙΑΣ ΚΑΙ ΕΠΑΡΚΕΙΑΣ -

Αρχές Σύνταξης της Αρχαιοελληνικής Γλώσσας

ΤΑ ΠΑΡΕΠΟΜΕΝΑ ΤΟΥ ΡΗΜΑΤΟΣ ΦΩΝΗ ΣΥΖΥΓΙΑ ΔΙΑΘΕΣΗ ΧΡΟΝΙΚΗ ΒΑΘΜΙΔΑ ΠΟΙΟΝ ΕΝΕΡΓΕΙΑΣ

Συντακτικό. χρόνου. Απρόσωπα ρήματα και εκφράσεις Προσοχή ουσιαστ.(σε ονομαστ.)+ἐστί ουδέτερο επιθέτου+ἐστί(π.χ. ἄξιον ἐστί) ουδέτερο μτχ.

Επισημάνσεις στη γραμματική διδασκαλία. των εγχειριδίων του Δημοτικού. Φώτης Α. Καβουκόπουλος

accedo spolio, vaco utor, potior

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΙΟΥ ΑΘ. ΚΡΟΝΤΣΟΥ ΘΕΜΑ: ΓΡΑΜΜΑΤΙΚΗ-ΣΥΝΤΑΚΤΙΚΗ ΑΝΑΛΥΣΗ ΤΗΣ ΝΕΑΣ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ ΕΙΣΗΓΗΤΗΣ: ΙΩΑΝΝΗΣ ΡΕΦΑΝΙΔΗΣ

Αναπτυξιακά ορόσημα λόγου

Page 1

ΓΡΑΜΜΑΤΙΚΗ Για την Γ τάξη του Δημοτικού

Ελληνικά με την παρέα μου

ΟΜΟΣΠΟΝΔΙΑ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΦΡΟΝΤΙΣΤΩΝ ΕΛΛΑΔΟΣ (Ο.Ε.Φ.Ε.) ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ 2018 Β ΦΑΣΗ

Διδακτικοί στόχοι εγχειριδίων Γλώσσας Δηµοτικού (2006)

Ξενοφώντος Κύρου Παιδεία 3, 2, 12

Κεφάλαιο Ένα Επίπεδο 1 Στόχοι και Περιεχόμενο

ΛΑΤΙΝΙΚΑ ΠΡΟΕΤΟΙΜΑΣΙΑ Γ ΛΥΚΕΙΟΥ

ΕΚ ΟΣΕΙΣ ΠΑΠΑ ΟΠΟΥΛΟΣ

Table of Contents. Περιεχόμενα Γραμματικής - Grammar Contents

Transcript:

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (Δ.Π.Μ.Σ.) «Διερμηνεία και Μετάφραση» Tων Τμημάτων: Φιλολογίας, Αγγλικής Γλώσσας και Φιλολογίας, Γαλλικής Γλώσσας και Φιλολογίας, Γερμανικής Γλώσσας και Φιλολογίας, και Ιταλικής Γλώσσας και Φιλολογίας Δ ι δ α κ τ ο ρ ι κ ή δ ι α τ ρ ι β ή γ ι α τ η ν α π ό κ τ η σ η Διδακτορικού Διπλώματος στη Μετάφραση-Μεταφρασεολογία μ ε θ έ μ α «Ονοματικά σύνολα της Νέας Ελληνικής: Αυτόματη αναγνώριση και εξάλειψη μορφολογικών αμφισημιών κατά την αυτόματη επεξεργασία κειμένων. Προτάσεις εφαρμογής στη μετάφραση» Noun phrases in Modern Greek: Automatic recognition and morphological disambiguation in automatic text processing. Some suggestions for possible applications in translation ΠΑΡΑΡΤΗΜΑΤΑ Κυριακή Ιωαννίδου Επταμελής επιτροπή: Παναγιώτα Κυριακοπούλου (επιβλέπουσα) Άννα Αναστασιάδη-Συμεωνίδη (μέλος της τριμελούς συμβουλευτικής επιτροπής) Συμεών Γραμμενίδης (μέλος της τριμελούς συμβουλευτικής επιτροπής) Ξανθίππη Δημητρούλια Γεώργιος Μικρός Ανδρομάχη-Βιργινία Πανταζάρα Αικατερίνη Φραντζή ΘΕΣΣΑΛΟΝΙΚΗ 2013

Η παρούσα διδακτορική διατριβή έχει συγχρηματοδοτηθεί από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο ΕΚΤ) και από εθνικούς πόρους μέσω του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» - «Επένδυση στην κοινωνία της γνώσης» του Εθνικού Στρατηγικού Πλαισίου Αναφοράς (ΕΣΠΑ) 2007-2013. Ερευνητικό Χρηματοδοτούμενο Έργο: Ηράκλειτος ΙΙ. Ενίσχυση του ανθρώπινου ερευνητικού δυναμικού μέσω της υλοποίησης διδακτορικής έρευνας 1

ΠΕΡΙΕΧΟΜΕΝΑ ΠΑΡΑΡΤΗΜΑΤΩΝ Διάγραμμα ροής της έρευνας 4 ΠΑΡΑΡΤΗΜΑ Ι Επεξεργασία σωμάτων κειμένων 1. Απόσπασμα σώματος κειμένου πριν από οποιαδήποτε επεξεργασία..5 2. Γραμματική τεμαχισμού κειμένου σε περιόδους..8 3. Απόσπασμα σώματος κειμένων κατόπιν προεπεξεργασίας.9 4. Δομή μορφολογικού λεξικού και μορφολογικής ανάλυσης κειμένων...12 5. Δείγμα αποτελέσματος λεξικής ανάλυσης κειμένου: απλές λεκτικές μονάδες 13 6. Δείγμα αποτελέσματος λεξικής ανάλυσης κειμένου: σύνθετες πολυλεκτικές μονάδες...14 7. Απόσπασμα πεπερασμένου αυτομάτου κειμένου κατόπιν μορφολογικής ανάλυσης 15 8. Δείγμα γραμματικών ELAG για την κατάρτιση επισημειωμένου σώματος κειμένων.18 9. Απόσπασμα πεπερασμένου αυτομάτου κειμένου κατόπιν εφαρμογής γραμματικών ELAG 19 10. Απόσπασμα πεπερασμένου αυτομάτου επισημειωμένου κειμένου κατόπιν χειρωνακτικής διόρθωσης...22 11. Απόσπασμα επισημειωμένου σώματος κειμένων...25 ΠΑΡΑΡΤΗΜΑ ΙΙ: Αυτόματη αναγνώριση ονοματικών συνόλων 1. Δείγμα γραμματικών αναγνώρισης ονοματικών συνόλων..28 2. Απόσπασμα συμφραστικών πινάκων κατόπιν εφαρμογής γραμματικών αναγνώρισης ονοματικών συνόλων..39 2

ΠΑΡΑΡΤΗΜΑ ΙΙΙ: Εξάλειψη μορφολογικών αμφισημιών 1. Δείγμα γραμματικών αναγνώρισης ονοματικών συνόλων, χρησιμοποιημένων ως μεταβιβαστών, κατόπιν προσθήκης αντίστοιχης μορφολογικής επισήμανσης..44 2. Απόσπασμα συμφραστικών πινάκων κατόπιν εξάλειψης μορφολογικών αμφισημιών...46 3. Απόσπασμα προγράμματος σε γλώσσα PERL για τη σύγκριση σωμάτων κειμένων και την εξαγωγή ποσοστών ανάκλησης και ακρίβειας...50 ΠΑΡΑΡΤΗΜΑ ΙV: Εφαρμογή στη μηχανική μετάφραση 1. Απόσπασμα γαλλικού μεταφρασμένου κειμένου από το λογισμικό BABEL FISH 51 2. Απόσπασμα γαλλικού μεταφρασμένου κειμένου από το λογισμικό BING.. 52 3. Απόσπασμα γαλλικού μεταφρασμένου κειμένου από το λογισμικό GOOGLE.53 4. Απόσπασμα γαλλικού μεταφρασμένου κειμένου από το λογισμικό SYSTRAN.54 5. Απόσπασμα γαλλικού μεταφρασμένου κειμένου από το λογισμικό WORDLINGO.55 3

Διάγραμμα ροής της έρευνας Α. Προεπεξεργασία σωμάτων κειμένων Α & Β ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ που κατασκευάσαμε 1. Επεξεργασία σωμάτων κειμένων Β. Μορφολογική ανάλυση σωμάτων κειμένων Α & Β Γ. Ημι-αυτόματη εξάλειψη αμφισημιών σώματος κειμένων Β Δ. Χειρωνακτική διόρθωση σώματος κειμένων Β/Επισημείωση Επισημειωμένο σώμα κειμένων Α. Συλλογή πιθανών δομών ονοματικών συνόλων 2. Μελέτη ονοματικών συνόλων Β. Παρατήρηση, ομαδοποίηση περιπτώσεων & κατασκευή τυπολογίας Γ. Κατασκευή γραμματικών κανόνων/γράφων περιγραφής ονοματικών συνόλων Δ. Εφαρμογή κανόνων στο σώμα κειμένων Α και διόρθωση γραμματικών κανόνων γραμματικοί κανόνες/γράφοι αναγνώρισης ονοματικών συνόλων 3. Εξάλειψη αμφισημιών Εξάλειψη αμφισημιών στο σώμα κειμένων Α και αντιπαραβολή με το σώμα κειμένων Β 4

ΠΑΡΑΡΤΗΜΑ Ι Επεξεργασία σωμάτων κειμένων Απόσπασμα σώματος κειμένου πριν από οποιαδήποτε επεξεργασία 5

6

7

Γραμματική τεμαχισμού κειμένου σε περιόδους 8

Απόσπασμα σώματος κειμένων κατόπιν προεπεξεργασίας 9

10

11

Δομή μορφολογικού λεξικού και μορφολογικής ανάλυσης λέξεων Δομή καταχώρισης στο μορφολογικό ηλεκτρονικό λεξικό: τύπος,λήμμα.γραμμ. κατηγορία+χαρακτηριστικό (ένα ή περισσότερα):πληροφ. κλίσης (μία ή περισσότερες) Π.χ. ανθρώπου,άνθρωπος.n+hum:gms Αναλυτικότερα: τύπος: ο κλιτός τύπος μιας λέξης (πχ. ανθρώπου) λήμμα: ο λημματικός τύπος της (πχ. άνθρωπος). γραμμ. κατηγορία: Μία από τις επόμενες γραμματικές κατηγορίες: A (επίθετο) ABREV (συντομογραφία) ACRON (ακρωνύμιο) ADV (επίρρημα) CONJ (σύνδεσμος) DET (προσδιοριστής) INTJ (επιφώνημα) N (ουσιαστικό) PART (μόριο) PREP (πρόθεση) PREPdet (εμπρόθετος προσδιοριστής) PRO (αντωνυμία) SIGL (αρκτικόλεξο) V (ρήμα) χαρακτηριστικό: σημασιολογικό χαρακτηριστικό ή υποκατηγορία γραμματικής κατηγορίας (π.χ. +Conc= δηλώνει το συγκεκριμένο, +Def= οριστικό (άρθρο)) πληροφ. κλίσης: Για λέξεις που έχουν πτώσεις: Το 1 ο γράμμα εκφράζει την πτώση, το 2 ο το γένος και το 3 ο τον αριθμό. Πτώσεις: N (ονομαστική),, G (γενική), A (αιτιατική), V (κλιτική). Γένος: m (αρσενικό), f (θηλυκό), n (ουδέτερο). Αριθμός: s (ενικός), p (πληθυντικός) Π.χ. ανθρώπου Gms Για ρήματα: Το 1 ο γράμμα εκφράζει το χρόνο, το 2 ο το πρόσωπο και το 3 ο τον αριθμό. Χρόνοι: C (υποθετική μέλλοντα (π.χ. θα αγόραζα), D (εξακολουθητικός μέλλοντας), F (στιγμιαίος μέλλοντας), I (παρατατικός), J (αόριστος), OJ (ευκτική αορίστου), OP (ευκτική ενεστώτα), P (ενεστώτας), R (παρακείμενος) S (υποτακτική αορίστου), T (υποτακτική ενεστώτα), Y (προστακτική ενεστώτα), YR (προστακτική παρακειμένου), Z (προστακτική αορίστου). Πρόσωπα: 1 (πρώτο πρόσωπο), 2 (δεύτερο πρόσωπο), 3 (τρίτο πρόσωπο). Αριθμός: s (ενικός), p (πληθυντικός). Μετοχή ενεργητικής φωνής: G 12

Δείγμα αποτελέσματος λεξικής ανάλυσης κειμένου: απλές λεκτικές μονάδες 13

Δείγμα αποτελέσματος λεξικής ανάλυσης κειμένου: σύνθετες πολυλεκτικές μονάδες 14

Απόσπασμα πεπερασμένου αυτομάτου κειμένου κατόπιν μορφολογικής ανάλυσης 15

16

17

Δείγμα γραμματικών ELAG για την κατάρτιση επισημειωμένου σώματος κειμένων 18

Απόσπασμα πεπερασμένου αυτομάτου κειμένου κατόπιν εφαρμογής γραμματικών ELAG 19

20

21

Απόσπασμα πεπερασμένου αυτομάτου επισημειωμένου κειμένου κατόπιν χειρωνακτικής διόρθωσης 22

23

24

Απόσπασμα επισημειωμένου σώματος κειμένων 25

26

27

ΠΑΡΑΡΤΗΜΑ ΙΙ: Αυτόματη αναγνώριση ονοματικών συνόλων Δείγμα γραμματικών αναγνώρισης ονοματικών συνόλων Γράφος προσδιοριστών που τοποθετούνται πριν το οριστικό άρθρο για ΟΣ ενικού αριθμού Γράφος προσδιοριστών που τοποθετούνται πριν το οριστικό άρθρο για ΟΣ πληθυντικού αριθμού 28

Γράφος αόριστων προσδιοριστών και συνδυασμών με αυτούς Γράφος προσδιοριστών που τοποθετούνται μεταξύ του επιθετικού προσδιορισμού και του ουσιαστικού Γράφος που συνοψίζει τους συνδυασμούς των προσδιοριστών 29

Γράφος αριθμητικών σε ΟΣ ενικού αριθμού Γράφος αριθμητικών με ψηφία ή χρήση μεταβλητών (χ, ψ κτλ) Γράφος κλασμάτων 30

Γράφος αριθμητικών με χρήση προθέσεων Γράφος δομών αριθμητικών 31

Γράφος ΟΣ στο αρσενικό ενικού με κεφαλή ουσιαστικό και παρουσία προσδιοριστών Γράφος ΟΣ στο θηλυκό ενικού με κεφαλή ουσιαστικό και παρουσία προσδιοριστών 32

Γράφος επιθετικού προσδιορισμού Απόσπασμα γράφου όπου ο επιθετικός προσδιορισμός προηγείται ή έπεται του ουσιαστικού 33

Γράφος επανάληψης οριστικού άρθρου με επιθετικό προσδιορισμό Γράφος παρατακτικής σύνδεσης μεταξύ επιθετικών προσδιορισμών. Γίνεται ταυτόχρονη εξαγωγή από το ΟΣ συνδέσμων που τροποποιούν τη φράση 34

Γράφος επιρρήματος όταν βρίσκεται στο εσωτερικό ενός ΟΣ Γράφος επιθετικού προσδιορισμού που δεν προηγείται από προσδιοριστή 35

Γράφος ΟΣ αρσενικού ενικού με κεφαλή εννοούμενο ουσιαστικό και παρουσία προσδιοριστών Κεντρικός γράφος ΟΣ με κεφαλή ουσιαστικό Γράφος ετερόπτωτου προσδιορισμού 36

Γράφος ουσιαστικοποιημένων επιθέτων χωρίς την παρουσία προσδιοριστών Γράφος ουσιαστικοποιημένων επιρρημάτων 37

Γράφος αντωνυμιοποίησης προσδιοριστών Γράφος που επικαλείται το σύνολο των γράφων 38

Απόσπασμα συμφραστικών πινάκων κατόπιν εφαρμογής γραμματικών αναγνώρισης ονοματικών συνόλων 39

40

41

42

43

ΠΑΡΑΡΤΗΜΑ ΙΙΙ: Εξάλειψη μορφολογικών αμφισημιών Δείγμα γραμματικών αναγνώρισης ονοματικών συνόλων, χρησιμοποιημένων ως μεταβιβαστών, κατόπιν προσθήκης αντίστοιχης μορφολογικής επισήμανσης Μεταβιβαστής ΟΣ στο αρσενικό ενικού με κεφαλή ουσιαστικό και παρουσία προσδιοριστών 44

Μεταβιβαστής προσδιοριστών που τοποθετούνται μεταξύ του επιθετικού προσδιορισμού και του ουσιαστικού Μεταβιβαστής επιθέτων όταν βρίσκεται στο εσωτερικό ενός ΟΣ Μεταβιβαστής επιρρήματος όταν βρίσκεται στο εσωτερικό ενός ΟΣ 45

Απόσπασμα συμφραστικών πινάκων κατόπιν εξάλειψης μορφολογικών αμφισημιών 46

47

48

49

Απόσπασμα προγράμματος σε γλώσσα PERL για τη σύγκριση σωμάτων κειμένων και την εξαγωγή ποσοστών ανάκλησης και ακρίβειας 50

ΠΑΡΑΡΤΗΜΑ ΙV: Εφαρμογή στη μηχανική μετάφραση Απόσπασμα γαλλικού μεταφρασμένου κειμένου από το λογισμικό BABEL FISH 51

Απόσπασμα γαλλικού μεταφρασμένου κειμένου από το λογισμικό BING 52

Απόσπασμα γαλλικού μεταφρασμένου κειμένου από το λογισμικό GOOGLE 53

Απόσπασμα γαλλικού μεταφρασμένου κειμένου από το λογισμικό SYSTRAN 54

Απόσπασμα γαλλικού μεταφρασμένου κειμένου από το λογισμικό WORDLINGO 55