Συνδετιστικό μοντέλο ορθογραφίας διπλής διαδρομής για την ελληνική γλώσσα



Σχετικά έγγραφα
Γνωστική Ψυχολογία ΙΙ (ΨΧ 05) Γλώσσα (2)

Σπουδάστρια: Ευθυμίου Μαρία Υπεύθυνη καθηγήτρια: Ζακοπούλου Βικτωρία

Πώς μαθαίνουν οι μαθητές;

ΕΙΣΑΓΩΓΗ... 1 ΥΠΟΛΟΓΙΣΤΙΚΑ ΜΟΝΤΕΛΑ ΑΝΑΓΝΩΣΗΣ... 2 DUAL ROUTE CASCADED... 2 TRIANGLE MODEL... 4 CDP MULTIPLE TRACE MEMORY MODEL...


Διδάσκων : Αργύρης Καραπέτσας Καθηγητής Νευροψυχολογίας Νευρογλωσσολογίας Πανεπιστήμιο Θεσσαλίας

ΤΟ ΤΕΣΤ ΑΝΙΧΝΕΥΣΗΣ ΤΗΣ ΔΥΣΛΕΞΙΑΣ ΣΤΟΥΣ ΕΝΗΛΙΚΕΣ(DAST) Δριδάκη Αργυρώ Α.Μ.: Κόλλια Δήμητρα Α.Μ.: 11283

29. Βοηθητικό ρόλο στους μαθητές με δυσγραφία κατέχει η χρήση: Α) ηλεκτρονικών υπολογιστών Β) αριθμομηχανών Γ) λογογράφων Δ) κανένα από τα παραπάνω

ΔΙΑΦΟΡΟΠΟΙΗΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΠΡΟΓΡΑΜΜΑΤΩΝ

Διδάσκων : Αργύρης Καραπέτσας Καθηγητής Νευροψυχολογίας Νευρογλωσσολογίας Πανεπιστήμιο Θεσσαλίας

Η φωνολογική επίγνωση. Ευφημία Τάφα

13 ο ΠΑΓΚΥΠΡΙΟ ΣΥΝΕΔΡΙΟ ΔΥΣΛΕΞΙΑΣ Σάββατο 6 Οκτωβρίου 2010 Εργαστήριο

Η ΓΛΩΣΣΙΚΗ ΑΝΑΠΤΥΞΗ ΤΩΝ ΠΑΙΔΙΩΝ ΓΕΝΝΗΣΗ 6 ΕΤΩΝ ΓΛΩΣΣΙΚΗ ΣΥΜΠΕΡΙΦΟΡΑ

ΔΙΔΑΚΤΙΚΕΣ ΠΑΡΕΜΒΑΣΕΙΣ ΣΤΙΣ ΜΑΘΗΣΙΑΚΕΣ ΔΥΣΚΟΛΙΕΣ ΜΑΘΗΜΑ ΕΠΙΛΟΓΗΣ 6 ΟΥ ΕΞΑΜΗΝΟΥ (2 Ο ΜΑΘΗΜΑ)

Πότε πρέπει να αρχίζει η λογοθεραπεία στα παιδιά - λόγος και μαθησιακές δυσκολίες

Δυσλεξία και Ξένη Γλώσσα

Χαρακτηριστικά άτυπης αξιολόγησης

Η ενίσχυση της φωνολογικής επίγνωσης στα παιδιά της προσχολικής ηλικίας Ευφημία Τάφα

Ορθογραφική απόδοση θεματικών μορφημάτων και παραγωγικών επιθημάτων από παιδιά του Δημοτικού Σχολείου

Ανάγνωση. Ικανότητα γρήγορης και αυτόματης αναγνώρισης λέξεων. Γνώση γραμμάτων και αντιστοιχίας γραμμάτων φθόγγων. Κατανόηση κειμένου

ΠΡΑΚΤΙΚΗ ΑΣΚΗΣΗ 2013/14. Μιχαηλίδου Αγγελική Λάλας Γεώργιος

- Καθυστέρηση λόγου (LLI)

Γνωστική Ψυχολογία ΙΙ (ΨΧ 05) Γλώσσα (1)

Στόχος 5 ος ιαβάζει και γράφει λέξεις που περιέχουν δίψηφα φωνήεντα και συνδυασµούς ει, ευ, ου, ια, αυ) π.χ. ευτυχία, ουρανός, αυτός κλπ.

Η έννοια του συνόλου. Εισαγωγικό κεφάλαιο 27

ΠΑΙΔΑΓΩΓΙΚΟ ΤΜΗΜΑ ΔΗΜΟΤΙΚΗΣ ΕΚΠΑΙΔΕΥΣΗΣ

Αξιολόγηση. Ευφημία Τάφα

Παιδαγωγική ή Εκπαίδευση ΙΙ

Διαδικτυακό Περιβάλλον Διαχείρισης Ασκήσεων Προγραμματισμού

ΤΕΤΑΡΤΟ 4 ο δίωρο: ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ. Γιώτη Ιφιγένεια (Α.Μ. 6222) Λίβα Παρασκευή (Α.Μ. 5885)

ΔΙΑΛΕΞΗ ΤΡΙΤΗ ΤΟ ΑΛΦΑΒΗΤΟ ΚΑΙ Η ΔΙΑΜΟΡΦΩΣΗ ΤΩΝ ΑΡΧΑΙΩΝ ΕΛΛΗΝΙΚΩΝ ΔΙΑΛΕΚΤΩΝ

Σχεδιασμός Ψηφιακών Εκπαιδευτικών Εφαρμογών ΙI

ΕΙΔΗ ΕΡΕΥΝΑΣ I: ΠΕΙΡΑΜΑΤΙΚΗ ΕΡΕΥΝΑ & ΠΕΙΡΑΜΑΤΙΚΟΙ ΣΧΕΔΙΑΣΜΟΙ

Προσβάσιμο υλικό για μαθητές με αυτισμό

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΕΡΙΦΕΡΕΙΑΚΗ Δ/ΝΣΗ Π. ΕΚΠ/ΣΗΣ Δ/ΝΣΗ ΠΕ ΔΗΜΟΤΙΚΟ.

ΦΟΡΜΑ ΑΞΙΟΛΟΓΗΣΗΣ. 1) Στάση του μαθητή/τριας κατά τη διάρκεια του μαθήματος: Δεν την κατέχει. Την κατέχει μερικώς. επαρκώς

Μάθηση και Γενίκευση. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων


Εκπαιδευτική Τεχνολογία - Πολυμέσα. Ελένη Περιστέρη, Msc, PhD

Τσάπελη Φανή ΑΜ: Ενισχυτική Μάθηση για το παιχνίδι dots. Τελική Αναφορά

Το Πολυεπίπεδο Perceptron. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

ΑΝΑΔΥΟΜΕΝΟΣ ΓΡΑΜΜΑΤΙΣΜΟΣ

ΑΣΤΠΗ ΑΞΙΟΛΟΓΗΗ. Informal Assessment. Φριστίνα Κοτρώνη. Eιδική Παιδαγωγός ΜΕd, Τποψήφια Διδάκτωρ Σομέας Χυχολογίας ΕΚΠΑ

Δυσλεξία και διδασκαλία αγγλικής γλώσσας. Γουλέτη Κατερίνα, Κοκκώνη Ανθή, Περικλεους Κατερίνα ΠΡΟΓΡΑΜΜΑ

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΑΓΩΓΗΣ ΠΑΙΔΑΓΩΓΙΚΟ ΤΜΗΜΑ ΔΗΜΟΤΙΚΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΔΥΣΟΡΘΟΓΡΑΦΙΑ. Ονοματεπώνυμα: Ηλιάνα Στάμογλου, 4635

Ανάλυση των δραστηριοτήτων κατά γνωστική απαίτηση

Μελέτη περίπτωσης εργαλεία κοινωνικής δικτύωσης - MultiBlog. Ισπανική γλώσσα. 33 φοιτητές (ενήλικες > 25 ετών) και 2 εκπαιδευτικοί

Διδασκαλία γραμμάτων-συλλαβών

Μαθησιακές Δυσκολίες Εκπαιδευτική αξιολόγηση. Πηνελόπη Κονιστή ΠΕ 70 Med Ειδικής Αγωγής

Διδάσκων : Αργύρης Καραπέτσας Καθηγητής Νευροψυχολογίας Νευρογλωσσολογίας Πανεπιστήμιο Θεσσαλίας

ΔΙΔΑΚΤΙΚΟ ΣΕΝΑΡΙΟ. Νικόλαος Μπαλκίζας Τίτλος Η αξιοποίηση των εικόνων PECS στην πρώτη ανάγνωση και γραφή.

ΓΥΜΝΑΣΙΟ ΑΓΙΟΥ ΣΤΥΛΙΑΝΟΥ Μ 7 ΣΧΟΛΙΚΗ ΧΡΟΝΙΑ: ΤΡΟΠΟΙ ΜΕΛΕΤΗΣ

Μαθηματικά και Πληροφορική. Διδακτική Αξιοποίηση του Διαδικτύου για τη Μελέτη και την Αυτο-αξιολόγηση των Μαθητών.

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΑΡΡΗΤΗ ΟΡΘΟΓΡΑΦΙΚΗ ΜΑΘΗΣΗ. Κουστουμπάρδης Μιλτιάδης (12Μ06) Αθήνα

Η ΔΙΔΑΣΚΑΛΙΑ ΤΟΥ ΛΕΞΙΛΟΓΙΟΥ ΣΤΟ ΔΗΜΟΤΙΚΟ ΣΧΟΛΕΙΟ

Αξιολογήστε την ικανότητα του μαθητή στην κατανόηση των προφορικών κειμένων και συγκεκριμένα να:

Α.Τ.ΕΙ ΚΡΗΤΗΣ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΠΟΛΥΜΕΣΩΝ. ΕΡΓΑΣΤΗΡΙΟ ΤΕΧΝΗΤΩΝ ΝΕΥΡΩΝΙΚΩΝ ΔΙΚΤΥΩΝ

Για να βεβαιωθείτε ότι είναι ενεργοποιημένος ο έλεγχος ορθογραφίας κάντε τα εξής:

Η οργάνωση της γνώσης ΠΕΤΡΟΣ ΡΟΥΣΣΟΣ

ΣΧΕΔΙΟ ΜΑΘΗΜΑΤΟΣ ΓΙΑ ΔΙΔΑΣΚΑΛΙΑ ΚΟΙΝΩΝΙΚΩΝ ΔΕΞΙΟΤΗΤΩΝ 1

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 4 o Φροντιστήριο

Ο Οδηγός γρήγορης εκκίνησης

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΛΟΓΟΥ ΚΑΙ ΑΚΟΗΣ

Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP)

Φωνολογική Ανάπτυξη και Διαταραχές

Αναπτυξιακά ορόσημα λόγου

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 5 o Φροντιστήριο

Εργαστήριο Αθλητικής Ψυχολογίας

Microsoft Excel Κεφάλαιο 1. Εισαγωγή. Βιβλίο εργασίας

Υπολογιστική Νοημοσύνη. Μάθημα 12: Παραδείγματα Ασκήσεων 2

ΟΡΙΣΜΟΣ ΜΑΘΗΣΙΑΚΩΝ ΔΥΣΚΟΛΙΩΝ:

Ασκήσεις φυσικής και Δυσλεξία

Η ανάδυση της ανάγνωσης και της γραφής: έννοια και σύγχρονες απόψεις. Ευφημία Τάφα Καθηγήτρια ΠΤΠΕ Πανεπιστήμιο Κρήτης

ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΜΑΘΗΣΙΑΚΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΜΕ ΤΗ ΧΡΗΣΗ Η ΧΩΡΙΣ ΤΗ ΧΡΗΣΗ Η/Υ ΓΙΑ ΤΗ ΔΙΔΑΣΚΑΛΙΑ ΚΛΑΣΜΑΤΩΝ

ΘΕΜΑ ΕΡΓΑΣΙΑΣ: «ΈΚΘΕΣΗ ΈΚΦΡΑΣΗ ΜΟΥΣΙΚΑ ΘΕΜΑΤΑ»

Αιτία παραποµπής Ε Ω ΣΥΜΠΛΗΡΩΝΕΤΕ ΣΤΟΙΧΕΙΑ ΤΟΥ ΙΣΤΟΡΙΚΟΥ ΤΟΥ ΠΑΙ ΙΟΥ ΚΑΙ ΤΟ ΛΟΓΟ ΤΗΣ ΠΑΡΑΠΟΜΠΗΣ.

1 φωτοτυπία ανά μαθητή με τα διαγράμματα παραγωγή προφορικού λόγου, παραγωγή γραπτού λόγου, κατανόηση γραπτού λόγου

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Μαθησιακές Δυσκολίες. Τίτλος: Δυσορθογραφία. Αγγελική Μουζάκη. Παιδαγωγικό Τμήμα Δημοτικής Εκπαίδευσης

Λογισμικό Καθοδήγησης ή Διδασκαλίας

POWERPOINT Είναι το δημοφιλέστερο πρόγραμμα παρουσιάσεων.

Ελέγξτε την ταινία σας

Μορφολογικές κατηγορίες νοητικού λεξικού του SLDT στα ελληνικά και η σχέση τους με την προνοσηρή νοημοσύνη

Κατηγοριοποίηση των στρατηγικών σε πολυψήφιους πολλαπλασιασμούς και διαιρέσεις

Μαθησιακές Δυσκολίες: δυγλωσσία και πολυγλωσσικό περιβάλλον

Διαχρονικές δομές δεδομένων

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

Εργασία-3: Παρουσίαση Εργασίας. Ομάδα Α. Προετοιμασία Αναφοράς

ΕΠΙΣΗΜΟΙ ΚΑΝΟΝΕΣ ΤΟΥ ΟΙ ΚΑΡΤΕΣ

Πώς να διαβάζεις στο σπίτι γρήγορα και αποτελεσματικά για μαθητές τάξης Teens 2 & 3 (B & C Senior)

PowerPoint Ένα εργαλείο παρουσίασης

Ο ηλεκτρονικός υπολογιστής στην εκπαίδευση παιδιών με διάχυτη αναπτυξιακή διαταραχή

Φοιτήτρια: Τσαρκοβίστα Βικτώρια (Α.Μ ) Επιβλέπων καθηγητής: Χριστοδουλίδης Παύλος

ΔΙΔΑΣΚΑΛΙΑ ΓΝΩΣΤΙΚΗΣ ΣΤΡΑΤΗΓΙΚΗΣ ΓΙΑ ΤΗΝ ΚΑΤΑΝΟΗΣΗ Δρ. Ζαφειριάδης Κυριάκος Οι ικανοί αναγνώστες χρησιμοποιούν πολλές στρατηγικές (συνδυάζουν την

Εργαστήριο «Τεχνολογία Πολιτισμικού Λογισμικού» Ενότητα. Σχεδίαση Βάσεων Δεδομένων

Οι διαταραχές του λόγου και τις οµιλίας στην παιδική ηλικία. Αναστασία Λαµπρινού Δεκέµβριος 2001

Γνωστική Ψυχολογία ΙΙ (ΨΧ 05) Γλώσσα (3)

Στόχος του βιβλίου αυτού είναι να κατακτήσουν οι μικροί μαθητές

MICROSOFT OFFICE 2003 MICROSOFT WORD 2003

Η ΕΚΜΑΘΗΣΗ ΞΕΝΗΣ ΓΛΩΣΣΑΣ ΣΕ ΠΑΙΔΙΑ ΜΕ ΔΥΣΛΕΞΙΑ. Ράπτη Ειρήνη ΑΜ 10420

Interactive Power Point

Transcript:

ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΜΕΘΟΔΟΛΟΓΙΑΣ, ΙΣΤΟΡΙΑΣ ΚΑΙ ΘΕΩΡΙΑΣ ΤΗΣ ΕΠΙΣΤΗΜΗΣ ΔΙΑΠΑΝΕΠΙΣΤΗΜΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗ ΒΑΣΙΚΗ ΚΑΙ ΕΦΑΡΜΟΣΜΕΝΗ ΓΝΩΣΙΑΚΗ ΕΠΙΣΤΗΜΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Συνδετιστικό μοντέλο ορθογραφίας διπλής διαδρομής για την ελληνική γλώσσα ΙΩΑΝΝΑ Ν. ΚΑΤΙΔΙΩΤΗ Επιβλέποντες: Αθανάσιος Πρωτόπαπας, Αναπληρωτής Καθηγητής ΕΚΠΑ Ελπίδα Τζαφέστα, Αναπληρώτρια Καθηγήτρια ΕΚΠΑ ΑΘΗΝΑ ΦΕΒΡΟΥΑΡΙΟΣ 2012

Οι επιβλέποντες καθηγητές Αθανάσιος Πρωτόπαπας Ελπίδα Τζαφέστα Ημερομηνία 2

Περιεχόμενα ΕΙΣΑΓΩΓΗ 4 Ορθογραφία της ελληνικής γλώσσας 4 Κατηγοριοποίηση λέξεων σύμφωνα με αντιστοίχιση ήχου σε ορθογραφία 6 Πλαίσιο διττής διαδρομής για την ορθογραφία 9 Επιφανειακή δυσγραφία 12 Συνδετιστικά μοντέλα ορθογραφίας μονής διαδρομής 14 Συνδετιστικό μοντέλο ορθογραφίας διττής διαδρομής των Houghton & Zorzi (2003) 17 ΣΥΝΔΕΤΙΣΤΙΚΟ ΜΟΝΤΕΛΟ ΟΡΘΟΓΡΑΦΙΑΣ ΔΙΠΛΗΣ ΔΙΑΔΡΟΜΗΣ ΓΙΑ ΤΗΝ ΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ 26 Προκαταρκτικές εκδοχές 26 Εισροή Εκροή 30 Διαδικασίες και παράμετροι μάθησης 32 Διαδικασία και παράμετροι φωνολογικής διαδρομής 35 Διαδικασία και παράμετροι λεξικής διαδρομής 37 Διττή διαδρομή 40 Εκπαίδευση με διάφορες τιμές παραμέτρων 41 Παραδείγματα ενεργοποίησης εκροής 46 Προβλήματα μοντέλου 50 Έλεγχος μοντέλου σε δεδομένα παιδιών Δημοτικού 53 Αμφίσημα φωνήματα και τρόπος γραφής τους από το μοντέλο 58 ΕΡΕΥΝΑ 60 Τρόπος δημιουργίας λέξεων 60 Υλικό Συμμετέχοντες - Διαδικασία 62 Αποτελέσματα 62 Συμπεράσματα 65 ΒΙΒΛΙΟΓΡΑΦΙΑ 68 ΠΑΡΑΡΤΗΜΑΤΑ 71 3

ΕΙΣΑΓΩΓΗ Ορθογραφία της ελληνικής γλώσσας Όπως αναφέρουν οι Μουζάκη & Πρωτόπαπας (2010), ορθογραφία είναι η συμβατικά ορθή γραπτή αποτύπωση του προφορικού λόγου. Θεωρείται ως το αποτέλεσμα ενός σύνθετου πλέγματος γνωσιακών λειτουργιών που αφορούν την παγίωση και την εφαρμογή της γνώσης των συμβάσεων και των κανόνων γραφής στο πλαίσιο ενός συγκεκριμένου γλωσσικού συστήματος. Οι κανόνες μπορεί να είναι φωνολογικοί, μορφολογικοί και σημασιολογικοί. Η ελληνική γλώσσα, όπως και κάθε άλλη γλώσσα, έχει τις δικές της ιδιαιτερότητες, που έχουν διαμορφωθεί κατά την ιστορική πορεία της ανά τους αιώνες. Ένα χαρακτηριστικό της ορθογραφίας που σχετίζεται με τους φωνολογικούς κανόνες είναι η διαφάνεια. Διαφάνεια είναι η συστηματικότητα της αντιστοίχισης ανάμεσα στις ακολουθίες γραμμάτων και στις φωνολογικές ακολουθίες (Protopapas & Vlahou, 2009). Συγκεκριμένα όσον αφορά την ορθογραφία, διαφάνεια είναι η κανονικότητα με την οποία το ορθογραφικό σύστημα μιας γλώσσας αναπαριστά τον τρόπο με τον οποίο προφέρονται οι λέξεις. Ένα διαφανές ορθογραφικό σύστημα απεικονίζει με συνεπή και συστηματικό τρόπο τα φωνήματα της γλώσσας με γράμματα ή συνδυασμούς γραμμάτων, ενώ σε ένα αδιαφανές ορθογραφικό σύστημα οι λέξεις γράφονται με τρόπο που δεν μπορεί να αποδοθεί άμεσα και με συστηματικό τρόπο σε αντιστοιχία φωνημάτων-γραφημάτων (Πρωτόπαπας, 2010). Η πιο γνωστή αδιαφανής γλώσσα είναι τα κινέζικα, όπου κάποιος δεν μπορεί να διαβάσει μια λέξη αν δεν την γνωρίζει ήδη. Η γραφή της λέξης, αν και κάποιες φορές περιέχει κάποια φωνολογικά στοιχεία, δεν προσδιορίζει την προφορά της λέξης (Πρωτόπαπας, 2010). Οι αλφαβητικές γλώσσες έχουν διαφορετικούς βαθμούς διαφάνειας η καθεμία. Η αγγλική γλώσσα, η οποία είναι και η περισσότερο μελετημένη, είναι πολύ αδιαφανής και ασυνεπής, με πάρα πολλές εξαιρέσεις. Αντιθέτως η ελληνική γλώσσα είναι πολύ διαφανής ως προς την αντιστοίχιση μεμονωμένων φωνημάτων σε γραφήματα. Επίσης οι ασυνέπειες που υπάρχουν στην ελληνική γλώσσα μπορούν να αναχθούν σε επιμέρους συστηματικότητες (Μουζάκη & Πρωτόπαπας, 2010). 4

Το συνδετιστικό μοντέλο ορθογραφίας για την ελληνική γλώσσα που περιγράφεται σε αυτή τη διπλωματική εργασία, όπως και τα περισσότερα συνδετιστικά μοντέλα, χρησιμοποιεί μόνο τους φωνολογικούς κανόνες της γλώσσας. Οι φωνολογικοί κανόνες αφορούν την αντιστοίχιση φωνημάτων σε γραφήματα. Φώνημα είναι η ελάχιστη μονάδα στο σύστημα φθόγγων μιας γλώσσας, μια δεσμίδα αφηρημένων διαφοροποιητικών χαρακτηριστικών ή αντιθέσεων (Κρύσταλ, 2003). Γράφημα είναι κάθε γράμμα ή συνδυασμός γραμμάτων που αντιστοιχεί σε ένα φώνημα (Πρωτόπαπας, 2010). Για παράδειγμα η λέξη «ντύνεις» έχει 5 φωνήματα, /d/, / i/, /n/, /i/ και /s/, και αντίστοιχα 5 γραφήματα, «ντ», «ύ», «ν», «ει» και «ς». 5

Κατηγοριοποίηση λέξεων σύμφωνα με τη αντιστοίχιση ήχου σε ορθογραφία Υπάρχουν διάφοροι τρόποι κατηγοριοποίησης των λέξεων μιας γλώσσας, π.χ. σύμφωνα με τους φωνολογικούς κανόνες, σύμφωνα με τους γραμματικούς κανόνες, σύμφωνα με την προέλευση των λέξεων, σύμφωνα με τη μορφολογία, κλπ. Για το μοντέλο ορθογραφίας διττής διαδρομής για την ελληνική γλώσσα (αλλά και για τα περισσότερα μοντέλα ορθογραφίας) η κατηγοριοποίηση πρέπει να γίνει σύμφωνα με την αντιστοίχιση ήχου σε ορθογραφία, δηλαδή με σύμφωνα με τις σχέσεις φωνημάτων-γραφημάτων. Οι Protopapas & Vlahou (2009) αναφέρουν τα κριτήρια κατηγοριοποίησης των λέξεων όσον αφορά την αντιστοίχιση ήχου-ορθογραφίας: 1. Κανονικότητα: Οι λέξεις χωρίζονται σύμφωνα με την κανονικότητα της χαρτογράφησής τους σε κανονικές, μη-κανονικές και εξαιρέσεις. Κανονική αντιστοίχιση θεωρείται η πιο συχνή αντιστοιχία φωνήματος-γραφήματος, για παράδειγμα κανονική είναι η αντιστοιχία /ο/ = ο και όχι /ο/ = ω, που είναι πιο σπάνιο. 2. Συνέπεια: Είναι η σταθερότητα στις αντιστοιχίες ανάμεσα στις φωνολογικές και τις ορθογραφικές μονάδες μιας γλώσσας. Οι Houghton & Zorzi (2003) χωρίζουν τις λέξεις όσον αφορά την αντιστοίχιση ήχου σε ορθογραφία, σε τρεις κατηγορίες: κανονικές-συνεπείς, κανονικές-ασυνεπείς και εξαιρέσεις. Συνδυάζοντας την κατηγοριοποίηση τους με αυτή του Πρωτόπαπα (2010) (χωρίς όμως να λαμβάνουμε υπ όψιν τη βοήθεια που προσφέρει η γνώση της γραμματικής και η γνώση της προέλευσης της λέξης, εφ όσον κοιτάμε το θέμα από τη σκοπιά των υπολογιστικών μοντέλων που δεν έχουν τις κατάλληλες γνώσεις) στην ελληνική γλώσσα διακρίνονται οι εξής κατηγορίες: 1. Κανονικές-συνεπείς: είναι οι λέξεις οι οποίες μπορούν να γραφούν σωστά με βάση την προφορά τους. Υπάρχουν δύο υποκατηγορίες: i. Οι λέξεις στις οποίες υπάρχει μόνο ένας πιθανός τρόπος ορθογραφίας, π.χ. «χαθούν», «μπάντα», «ψάθα». Το /a/ = α και το /u/ = ου (και οι τονισμένες εκδοχές τους) είναι τα μόνα μη 6

ii. αμφίσημα φωνήεντα. Όσον αφορά τα σύμφωνα, σύμφωνα με την αντιστοίχιση των Protopapas & Vlahou (2009) τα μόνα που γράφονται 100% των περιπτώσεων με ένα μόνο γράφημα είναι τα: /b/ = μπ, /d/ = ντ. /D/ = δ, /θ/ = θ, /x/ = χ και ο συνδυασμός /ps/ = ψ. Οι λέξεις στις οποίες υπάρχει ένας μόνο πιθανός τρόπος ορθογραφίας, αλλά μόνο εξαιτίας της συγκεκριμένης θέσης που έχει ένα φώνημα. Για παράδειγμα το /s/ είναι είτε «σ», είτε «σσ», είτε «ς». Αλλά αν βρίσκεται στο τέλος της λέξης (π.χ. «τους») γράφεται πάντα με «ς» και αν βρίσκεται στην αρχή πάντα με «σ». Πολλά σύμφωνα γράφονται είτε με τη μονή εκδοχή τους, είτε με τη διπλή (π.χ. /m/ = «μ» ή «μμ», /n/ = «ν» ή «νν», /p/ = «π» ή «ππ» κλπ.), αλλά αν βρίσκονται στην αρχή της λέξης δεν είναι πιθανό να γραφούν με τη διπλή εκδοχή. Υπάρχουν και άλλου είδους κανόνες, για παράδειγμα η λέξη / xazma/ γράφεται με «σ» και όχι με «ζ» γιατί ακολουθεί φωνούμενο σύμφωνο. 2. Κανονικές-ασυνεπείς: είναι το μεγαλύτερο ποσοστό των ελληνικών λέξεων, λέξεις που περιέχουν αμφίσημα φωνήματα όπως το /i/ = ι, η, ει, οι και υι, /e/ = ε και αι, /o/ = ο και ω, /g/ = γκ και γγ κλπ. Παραδείγματα: «είναι» (πιθανοί τρόποι γραφής: ίνε, οίννε, ήναι κλπ), «μυρμήγκι» (πιθανοί τρόποι γραφής: μοιρμύγκει, μιρμίγκι κλπ.) «ογκώδης» (πιθανοί τρόποι γραφής: ωγγώδοις, ογγόδυς κλπ) 3. Εξαιρέσεις: οι Houghton & Zorzi (2003) αναφέρουν ως εξαιρέσεις τις λέξεις που περιέχουν τουλάχιστον μια χαμηλής συχνότητας σχέση φωνήματος-γραφήματος. Σύμφωνα με την αντιστοίχιση των Protopapas & Vlahou (2009), κάποιες χαμηλής συχνότητας σχέσεις είναι: i. /c/ = κκ με συχνότητα 0,17% (π.χ. «κόκκινος») ii. /ɟ/ = γγι με συχνότητα 0,09% (π.χ. «αστροφεγγιά») iii. /ɣ/ = γγ με συχνότητα 0,07% (π.χ. «συγγνώμη») iv. /n/ = νν με συχνότητα 0,19% (π.χ. «γέννηση) v. /ɲ/ = νει με συχνότητα 0,11% (π.χ. «γενειάδα») 7

vi. /p/ = ππ με συχνότητα 0,05% (π.χ. «παππούς) vii. /v/ = ββ με συχνότητα 0,03% (π.χ. «σάββατο») viii. /t/ = ττ με συχνότητα 0,14% (π.χ. «κύτταρο») ix. /ç/ = χυ με συχνότητα 0,001% (π.χ. «στάχυα») x. /i/ = υι με συχνότητα 0,02% (π.χ. «υιός») Στο διαχωρισμό του Πρωτόπαπα (2010) δεν υπάρχει αναφορά στις εξαιρέσεις (ο διαχωρισμός του βασίζεται στη γραμματική και στη γνώση της προέλευσης της λέξης, τα οποία δεν μπορούμε να ενσωματώσουμε στο μοντέλο), γιατί δεν υπάρχει κάποιος κανόνας στο διαχωρισμό του. Είναι μια κατανομή επιλογών με συχνότερες και σπανιότερες εναλλακτικές. Οι Houghton & Zorzi (2003) όμως αναφέρονται σε εξαιρέσεις και σύμφωνα με το διαχωρισμό τους εξαιρέσεις (όσον αφορά την αντιστοίχιση φωνημάτων γραφημάτων) στην ελληνική γλώσσα είναι λέξεις που περιέχουν μια από τις παραπάνω σχέσεις ή κάποιες άλλες σχέσεις χαμηλής συχνότητας. 8

Πλαίσιο διττής διαδρομής για την ορθογραφία Υπάρχουν αρκετές θεωρίες για τον τρόπο με τον οποίο πραγματοποιείται η ανάγνωση ή η ορθογραφία. Όσοι φτιάχνουν συνδετιστικά μοντέλα ανάγνωσης ή ορθογραφίας επιλέγουν μία θεωρία, την οποία προσπαθούν να ακολουθήσουν όσο καλύτερα μπορούν. Το συνδετιστικό μοντέλο που περιγράφεται σε αυτή τη διπλωματική εργασία ακολουθεί τη θεωρία της διττής διαδρομής. Το πλαίσιο διττής διαδρομής για την ανάγνωση και την ορθογραφία (Εικόνα 1) υπάρχει εδώ και αρκετό καιρό (π.χ. Baron & Strawson, 1976, Forster & Chambers, 1973). Όπως αναφέρουν οι Houghton & Zorzi (2003), η βασική ιδέα πίσω από το πλαίσιο διττής διαδρομής για την ορθογραφία είναι ότι οι κανονικότητες ήχου-ορθογραφίας μπορεί να αναπαριστώνται διαφορετικά από τη γνώση ορθογραφίας ολόκληρων λέξεων. Εικόνα 1 (Houghton & Zorzi, 2003): Ένα τυπικό μοντέλο ορθογραφίας διττής διαδρομής. Η διακεκομμένη γραμμή δείχνει τη λεξική διαδρομή και η συνεχόμενη τη φωνολογική διαδρομή. Στην εικόνα απεικονίζεται επίσης η εισροή από τη σημασιολογία. Όπως φαίνεται και στην Εικόνα 1, το πλαίσιο διττής διαδρομής για την ορθογραφία έχει τις εξής διαδρομές: 9

1. Φωνολογική Διαδρομή: η διαδρομή αυτή ασχολείται με τη διαδικασία της υπολεξικής μετατροπής ήχου σε ορθογραφία, δηλαδή τη μετατροπή των φωνημάτων σε γραφήματα. Δεν είναι ξεκάθαρο πώς ακριβώς λειτουργεί η διαδρομή αυτή και τα μοντέλα χρησιμοποιούν το καθένα το δικό του τρόπο υλοποίησής της. Για παράδειγμα το μοντέλο ανάγνωσης διττής διαδρομής των Coltheart & Rastle (1994) υλοποιεί τη φωνολογική διαδρομή ως ένα σύστημα συμβολικής παραγωγής σειριακής επεξεργασίας, ενώ αυτό των Zorzi et al. (1998) ως ένα συνειρμικό δίκτυο παράλληλης επεξεργασίας. 2. Λεξική Διαδρομή: είναι βασισμένη στη μνήμη. Η βασική ιδέα είναι ότι έχουμε ένα ορθογραφικό λεξικό εκροής στο οποίο βρίσκονται όλες οι λέξεις των οποίων την ορθογραφία έχουμε απομνημονεύσει. Το πλαίσιο δεν εξηγεί πώς ακριβώς γίνεται η αποθήκευση και πως σχηματίζονται οι λεξικές αναπαραστάσεις. Τα μοντέλα διττής διαδρομής έχουν το καθένα τον δικό του τρόπο με τον οποίο διαχειρίζεται τα θέματα αυτά (Shallice, Glasspool, & Houghton, 1995). Σύμφωνα με το πλαίσιο διττή διαδρομής (όπως αναφέρουν οι Houghton & Zorzi, 2003), υπάρχουν δύο τρόποι με τους οποίους μπορεί να γραφεί μια λέξη. Για παράδειγμα η λέξη «γάτα» μπορεί να γραφεί ακολουθώντας μία από τις παρακάτω μεθόδους: 1. Μετατρέποντας την ακολουθία φωνημάτων / ɣata/ στα αντίστοιχα γραφήματα /ɣ/ = γ, / a/ = ά, /t/ = τ και /a/ = α. Αν μια γλώσσα έχει λέξεις χωρίς αμφίσημα φωνήματα, ο τρόπος αυτός θα ήταν αρκετός για τη σωστή γραφή όλων των λέξεων. Αν όμως ένα φώνημα είναι αμφίσημο (πχ το /i/ μπορεί να είναι ι, η, υ, ει, οι και υι), τότε η μετατροπή του σε γράφημα δεν είναι ξεκάθαρη και πρέπει να γίνει χρήση άλλων κανόνων (μορφολογικών, γραμματικών κλπ) για να γραφεί σωστά η λέξη. Αυτός ο τρόπος ορθογραφίας συμβαίνει από τη φωνολογική διαδρομή. 2. Έχουμε ξαναδεί ή και ξαναγράψει τη λέξη «γάτα». Η ακολουθία αυτών των φωνημάτων είναι ήδη γνωστή και στο ορθογραφικό λεξικό εκροής μας βρίσκεται αποθηκευμένη η αντίστοιχη ορθογραφία. Επομένως η φωνολογική μορφή της λέξης, / ɣata/, υπάρχει καταχωρισμένη στο 10

λεξικό μας και μπορούμε να ανασύρουμε την ορθογραφική της μορφή, χωρίς να σπάσουμε τη λέξη σε επιμέρους φωνήματα. Αυτός ο τρόπος ορθογραφίας συμβαίνει από τη λεξική διαδρομή. Κανένας από αυτούς τους δύο τρόπους δεν αρκεί από μόνος του για να εξηγήσει την ορθογραφία (ή αντίστοιχα την ανάγνωση). Επομένως μάλλον χρησιμοποιούμε και τους δύο. Υπάρχει ένας «αγώνας» ανάμεσα στις δύο διαδρομές. Και οι δύο ενεργοποιούνται όταν ακούμε μια λέξη και αρχίζουν να την επεξεργάζονται. (Harley, 2008, για την ανάγνωση διπλής διαδρομής). Στο τέλος, για να παραχθεί η ορθογραφική μορφή της λέξης, θα υπάρξει συνεργασία ή ανταγωνισμός των δύο διαδρομών (Houghton & Zorzi, 2003). 11

Επιφανειακή δυσγραφία Όσοι φτιάχνουν μοντέλα ανάγνωσης πολλές φορές χρησιμοποιούν δεδομένα από άτομα με δυσλεξία για να ελέγξουν κατά πόσο τα μοντέλα τους προσομοιάζουν τον τρόπο με τον οποίο διαβάζουν οι άνθρωποι. Τα κανονικά δεδομένα δεν αρκούν, ένα καλό μοντέλο πρέπει με διάφορες παραλλαγές (αλλαγές στα βάρη, πρόσθεση θορύβου κλπ.) να μπορεί να προσομοιώνει και δεδομένα ατόμων με προβλήματα στην ανάγνωση, όπως είναι όσοι έχουν δυσλεξία. Αντίστοιχα, τα μοντέλα ορθογραφίας προσπαθούν να προσομοιάσουν δεδομένα ατόμων με επιφανειακή δυσγραφία. Οι Houghton & Zorzi (2003) εξηγούν ότι η επιφανειακή δυσγραφία μπορεί να προκύψει από εγκεφαλικό, τραύμα στον εγκέφαλο ή διαταραχές όπως το Alzheimer s και η άνοια. Υπάρχουν ακόμα και περιπτώσεις αναπτυξιακής δυσγραφίας, η οποία παρατηρείται συνήθως μαζί με επιφανειακή δυσλεξία (π.χ. Castles & Coltheart, 1996). Αυτοί που την περιέγραψαν πρώτοι ήταν οι Beauvois & Derousnè (1981). Οι Houghton & Zorzi (2003) αναφέρουν ότι το βασικό χαρακτηριστικό της επιφανειακής δυσγραφίας είναι η κακή ορθογραφία των μη κανονικώνσυνεπών λέξεων. Δηλαδή όσοι έχουν επιφανειακή δυσγραφία δυσκολεύονται με την ορθογραφία λέξεων των οποίων η ορθογραφία δεν προκύπτει αποκλειστικά από τη μετατροπή των φωνημάτων σε γραφήματα. Οι ασθενείς με επιφανειακή δυσγραφία δεν έχουν πρόβλημα στη ορθογραφία των ψευδολέξεων, καθώς μπορούν να μετατρέψουν τα φωνήματα σε γραφήματα. Το πρόβλημά τους είναι τα αμφίσημα φωνήματα, δηλαδή οι κανονικές-μη συνεπείς λέξεις και οι εξαιρέσεις. Έχουν γίνει πολλές μελέτες ασθενών με επιφανειακή δυσγραφία και αυτό που δείχνουν είναι ότι τα λάθη που κάνουν είναι φωνολογικά πιθανά. Δείχνουν όμως αλληλεπίδραση συχνότητας και κανονικότητας, δηλαδή όσο περισσότερο εξαίρεση είναι μια λέξη, τόσο χειρότερη η επίδοσή τους (Beauvois & Derousnè, 1981, Behrmann & Bub, 1992). Γενικά, οι ασθενείς με επιφανειακή δυσγραφία τείνουν να κάνουν «κανονικοποίηση» της ορθογραφίας, δηλαδή όταν ένα φώνημα ή και ολόκληρη η λέξη (εφόσον οι 12

περισσότερες μελέτες έχουν γίνει για την αγγλική γλώσσα) είναι αμφίσημα συνήθως επιλέγουν να τα γράψουν με τον πιο συχνό τρόπο γραφής τους. Υπάρχουν και άλλα είδη δυσγραφίας εκτός από την επιφανειακή. Ο Harley (2008) αναφέρει έναν ασθενή που περιέγραψε ο Shallice (1981), τον PR, με φωνολογική δυσγραφία. Τα συμπτώματα είναι ακριβώς τα αντίθετα από αυτά της επιφανειακής δυσγραφίας. Ο PR μπορούσε να γράψει πολλές γνωστές του λέξεις, αλλά δεν μπορούσε να γράψει νέες λέξεις και ψευδολέξεις, δηλαδή δεν μπορούσε να παράγει γραφή από τον ήχο. Οι δύο μορφές δυσγραφίας συμφωνούν με το πλαίσιο διττής διαδρομής για την ορθογραφία. Οι ασθενείς με επιφανειακή δυσγραφία δεν μπορούν να χρησιμοποιήσουν τη λεξική διαδρομή και οι ασθενείς με φωνολογική δυσγραφία δεν μπορούν να χρησιμοποιήσουν τη φωνολογική διαδρομή. 13

Συνδετιστικά μοντέλα ορθογραφίας μονής-διαδρομής Γενικότερα δεν υπάρχουν πολλά συνδετιστικά μοντέλα ορθογραφίας. Αυτά που υπάρχουν στηρίζονται συνήθως σε μοντέλα ανάγνωσης, των Sejnowski & Rosenberg (1987) και κυρίως στων Seidenberg & McClelland (1989). Το μοντέλο των Seidenberg & McClelland (1989) είναι ένα μοντέλο ανάγνωσης μονής διαδρομής τριών επιπέδων, δηλαδή το επίπεδο εισόδου συνδέεται με το κρυφό επίπεδο, το οποίο συνδέεται με το επίπεδο εξόδου (Εικόνα 2). Το δίκτυο είναι προσθιοδρομικό (feedforward) και είναι εκπαιδευμένο με αντίστροφη διάδοση (backpropagation). Ένα μοντέλο αυτής της μορφής παράγει κατανεμημένες αναπαραστάσεις στο κρυφό επίπεδο, οι οποίες του επιτρέπουν να γενικεύσει αυτά που έχει μάθει και σε νέες λέξεις ή ψευδολέξεις. Κάποια μοντέλα ορθογραφίας που αναφέρουν και συγκρίνουν οι Houghton & Zorzi (2003) είναι τα εξής: Brown & Loosemore (1994): είναι ένα συνδετιστικό μοντέλο ορθογραφίας όμοιο με το μοντέλο ανάγνωσης των Seidenberg & McClelland (1989). Το μοντέλο είχε εκπαιδευτεί σε λίγες (227) λέξεις, γιατί ο βασικός σκοπός της μελέτης ήταν ο ρυθμός μάθησης λέξεων σε σχέση με την κανονικότητα ήχου-ορθογραφίας. Το αποτέλεσμα ήταν οι κανονικές-συνεπείς λέξεις να μαθαίνονται πιο γρήγορα από τις κανονικές-ασυνεπείς και τις εξαιρέσεις. Τα αποτελέσματα ήταν σε συμφωνία με δεδομένα παιδιών τεσσάρων διαφορετικών ηλικιών. Το μοντέλο όμως δεν είχε καλά αποτελέσματα με τις ψευδολέξεις, γεγονός που δείχνει ότι δεν έκανε την απαραίτητη γενίκευση αυτών που είχε μάθει. Olson & Caramazza (1994) (NETspell): είναι βασισμένο στο μοντέλο NETalk, δηλαδή το μοντέλο ανάγνωσης των Sejnowski & Rosenberg (1987). Και αυτό επίσης είναι ένα συνδετιστικό μοντέλο μονής διαδρομής τριών επιπέδων, προσθιοδρομικό και εκπαιδευμένο με αντίστροφη διάδοση. Το μοντέλο αυτό είχε την εξής διαφορά από τα υπόλοιπα: το μοντέλο μπορούσε να «δει» (μέσω ενός κινούμενου 14

«παραθύρου) όλα τα φωνήματα της λέξης, καθώς και τις λέξεις πριν και μετά. Η «προσοχή» του μοντέλου βρίσκεται σε ένα φώνημα τη φορά και ταυτόχρονα το αντίστοιχο γράφημα (για εκείνη τη λέξη) παρουσιάζεται απομονωμένο. Επομένως το μοντέλο αυτό παρέχει ρητή εκπαίδευση των σχέσεων φωνημάτων-γραφημάτων. Το μοντέλο εκπαιδεύτηκε σε 1000 και 1628 λέξεις (για διαφορετικές προσομοιώσεις). Τα καλύτερα αποτελέσματα είχε η εκδοχή των 1628 λέξεων, η οποία μετά από εκπαίδευση 100 εποχών είχε 83% ποσοστό σωστών αποτελεσμάτων. Δεν κατάφεραν να βελτιώσουν αυτή την επίδοση. Τα λάθη που έκανε ήταν κυρίως παραλείψεις γραμμάτων, τα οποία δεν είναι φωνολογικά αποδεκτά λάθη. Τα υπόλοιπα λάθη ήταν όλα φωνολογικά αποδεκτά. Το μοντέλο έκανε καλή γενίκευση σε νέες λέξεις, με ποσοστό 87% σωστών φωνολογικά απαντήσεων. Επίσης πρόσθεσαν θόρυβο για να προσομοιώσουν δεδομένα από άτομα με τραύματα στον εγκέφαλο (που προκαλούν επιφανειακή δυσγραφία), μειώνοντας τις φωνολογικά αποδεκτές απαντήσεις νέων λέξεων στο 70% (ελαφρύ τραύμα) και στο 50% (πιο ισχυρό τραύμα). Τα αποτελέσματα αυτά όμως δεν ταίριαζαν αρκετά με τα δεδομένα ασθενών με επιφανειακή δυσγραφία. Και οι δύο εκδοχές του μοντέλου (κανονικό και δυσγραφικό) έκαναν πολλά μη φωνολογικά πιθανά λάθη, καθιστώντας το μοντέλο ακατάλληλο να προσομοιώνει δεδομένα ανθρώπων. Bullinaria (1994): το μοντέλο αυτό είναι παρόμοιο με των Olson & Caramazza (1994) σε ότι αφορά το σχεδιασμό (τρόπος λειτουργίας, είσοδος, έξοδος κλπ.). Το μοντέλο εκπαιδεύτηκε σε 2837 λέξεις για 700 εποχές, παράγοντας 100% σωστά αποτελέσματα. Οι κανονικέςσυνεπείς λέξεις ήταν πιο εύκολες για το μοντέλο από τις κανονικέςασυνεπείς και τις εξαιρέσεις. Όσον αφορά τη γενίκευση, στην ορθογραφία των ψευδολέξεων είχε 88,6% φωνολογικά αποδεκτά λάθη. Το μοντέλο έδειξε επίδραση της κανονικότητας των λέξεων, αλλά όχι της συχνότητας ή της αλληλεπίδρασης της συχνότητας με την κανονικότητα. Όταν προκάλεσαν βλάβη στο μοντέλο, επηρεάστηκε πολύ η ορθογραφία των εξαιρέσεων, το οποίο είναι ένα βασικό 15

χαρακτηριστικό της επιφανειακής δυσγραφίας. Αυτό όμως ήταν και το μόνο χαρακτηριστικό το οποίο μπόρεσαν να επιτύχουν. Ο Bullinaria αναφέρει ότι το μοντέλο έχει έλλειψη λεξικής διαδρομής και ότι μπορεί να χρησιμοποιηθεί ως μοντέλο της φωνολογικής διαδρομής μόνο. Παρόλα αυτά, το γεγονός ότι μπορούσε να δημιουργήσει σωστή ορθογραφία εξαιρέσεων δείχνει ότι δεν ήταν απλά μοντέλο μετατροπής ήχου σε ορθογραφία. Το πρόβλημα που έχουν όλα τα παραπάνω μοντέλα είναι ότι χρησιμοποιούν μία διαδρομή (Εικόνα 2). Παρόλο που τα περισσότερα είχαν πολύ καλά αποτελέσματα, κανένα δεν μπόρεσε να προσομοιώνει τόσο καλά τα δεδομένα ανθρώπων (ειδικά τα δεδομένα δυσγραφικών ασθενών) όσο το μοντέλο διττής διαδρομής των Houghton & Zorzi (2003). Επίπεδο Εκροής Κρυφό Επίπεδο Επίπεδο Εισροής. Εικόνα 2: Ένα δίκτυο μονής διαδρομής τριών επιπέδων 16

Συνδετιστικό μοντέλο ορθογραφίας διττής διαδρομής των Houghton & Zorzi (2003) Το συνδετιστικό μοντέλο ορθογραφίας διττής διαδρομής για την ελληνική γλώσσα είναι βασισμένο σε πολύ μεγάλο βαθμό στο αντίστοιχο μοντέλο για την αγγλική γλώσσα των Houghton & Zorzi (2003) (του οποίου η αρχιτεκτονική είναι βασισμένη στο μοντέλο ανάγνωσης διττής διαδρομής των Zorzi et al., 1998). Ένα δίκτυο διττής διαδρομής πολλαπλών επιπέδων έχει τη μορφή που φαίνεται στην Εικόνα 3. Επίπεδο Εκροής Φωνολογική Διαδρομή Κρυφό Επίπεδο Λεξική Διαδρομή Επίπεδο Εισροής Εικόνα 3: Το δίκτυο διττής διαδρομής πολλαπλών επιπέδων που χρησιμοποίησαν οι Houghton & Zorzi (2003). Εισροή είναι η φωνολογική μορφή της λέξης και εκροή η ορθογραφική. Υπάρχουν δύο διαδρομές τις οποίες μπορεί να ακολουθήσει η εισροή για να φτάσει στην εκροή: τη φωνολογική διαδρομή, η οποία ενώνει απευθείας την εισροή με την εκροή και τη λεξική διαδρομή, όπου υπάρχει ένα κρυφό επίπεδο ανάμεσα στην εισροή και στην εκροή. Κατά την εκπαίδευση του μοντέλου και οι δύο διαδρομές εκπαιδεύονται ταυτόχρονα στην ίδια λέξη κάθε φορά. Μια διαφορά που έχουν τα μοντέλα διττής διαδρομής έναντι αυτών της μονής διαδρομής είναι ότι παρόλο που η 17

μάθηση συμβαίνει ταυτόχρονα και στις δύο διαδρομές, το μοντέλο κάνει τον εξής διαχωρισμό: από την απευθείας διαδρομή (φωνολογική) μαθαίνονται οι απλές κανονικότητες, δηλαδή οι φωνολογικοί κανόνες (π.χ. /a/ = α). Από τη διαδρομή με το κρυφό επίπεδο (λεξική) μαθαίνονται τα ζευγάρια εισροήςεκροής που αποτελούν εξαιρέσεις με το να αναγνωρίζει τις εξαιρέσεις στην εισροή και να διορθώνει την κανονικοποιημένη εκροή της απευθείας διαδρομής. Με αυτό τον τρόπο, υπεύθυνη για τη γενίκευση του μοντέλου είναι η φωνολογική διαδρομή, ενώ η λεξική διαδρομή δεν χρειάζεται να γενικεύσει. Όταν το μοντέλο των Houghton & Zorzi (2003) γράφει ορθογραφία, ενεργοποιούνται και οι δύο διαδρομές παράλληλα. Η κάθε διαδρομή δημιουργεί τη δική της ορθογραφική μορφή για τη φωνολογική μορφή της λέξης που έχει δοθεί στην είσοδο. Οι ορθογραφικές μορφές μπορεί να είναι απολύτως ίδιες ή να διαφέρουν σε ένα ή περισσότερα γραφήματα. Οι δύο ορθογραφικές μορφές φτάνουν στην έξοδο, όπου για κάθε γράφημα ξεχωριστά γίνεται έλεγχος των δύο απαντήσεων. Για κάθε γράφημα υπάρχει είτε συνεργασία είτε ανταγωνισμός ανάμεσα στις δύο διαδρομές. Συνεργασία υπάρχει όταν και οι δύο διαδρομές συμφωνούν στο ίδιο γράφημα και ανταγωνισμός όταν διαφωνούν, οπού το γράφημα με την υψηλότερη ενεργοποίηση συνήθως κερδίζει. Επομένως μία λέξη μπορεί να είναι συνδυασμός των δύο διαδρομών, δηλαδή να περιέχει κάποια γραφήματα από τη φωνολογική και κάποια από τη λεξική διαδρομή. Εικόνα 4: Ο τρόπος αναπαράστασης των λέξεων που χρησιμοποίησαν οι Houghton & Zorzi (2003) 18

Οι Houghton & Zorzi (2003) χρησιμοποίησαν 3165 άκλιτες μονοσύλλαβες λέξεις της αγγλικής γλώσσας. Όπως φαίνεται από την Εικόνα 4, υπάρχουν 7 θέσεις φωνημάτων σε κάθε λέξη, 3 θέσεις για σύμφωνα, μία θέση για φωνήεν και άλλοι 3 θέσεις για σύμφωνα. Η αναπαράσταση ήταν βασισμένη στην φωνολογία, όπως φαίνεται και στη Εικόνα 5. Δηλαδή η φωνολογική μορφή της λέξης χωρίζεται στις θέσεις έτσι ώστε μία θέση να μην περιέχει περισσότερα από ένα φωνήματα. Η ορθογραφική μορφή της λέξης δημιουργείται μετατρέποντας το φώνημα κάθε θέσης στο αντίστοιχο γράφημα. Επομένως αν ένα φώνημα αντιστοιχούσε σε δίψηφο γράφημα (π.χ. /Τ/ = «ΤΗ»), τα δύο γράμματα θα τοποθετηθούν στην ίδια θέση. Όπως φαίνεται στην Εικόνα 5, το δίψηφο γράφημα ΤΗ καταλαμβάνει μία θέση στην έξοδο κι ας έχουν δύο γράμματα, γιατί αντιστοιχεί σε ένα φώνημα, το /Τ/ = ΤΗ. Εικόνα 5: Ένα παράδειγμα αναπαράστασης εισροής και εκροής του μοντέλου των Houghton & Zorzi (2003) Ο τρόπος λειτουργίας του μοντέλου των Houghton & Zorzi (2003) είναι ίδιο με του ελληνικού μοντέλου, που περιγράφεται παρακάτω (σελίδες 33-40). Οι συναρτήσεις που χρησιμοποιούνται στην εκπαίδευση και στη λειτουργία της κάθε διαδρομή, καθώς και οι παράμετροι, είναι ίδιες με του ελληνικού μοντέλου, αν και οι τιμές που χρησιμοποιήθηκαν είναι διαφορετικές. 19

Η εκπαίδευση έγινε σε εποχές (epoch), όπου γίνεται κάθε φορά τυχαία παρουσίαση των λέξεων μέχρι να παρουσιαστούν στο μοντέλο όλες οι λέξεις από μία φορά, πριν αλλάξει η εποχή. Στο τέλος κάθε εποχής, τα αδύναμα βάρη κλαδεύονταν. Τα καλύτερα αποτελέσματα για το μοντέλο των Houghton & Zorzi (2003) προέκυψαν μετά από 20 εποχές, με ρυθμό μάθησης 0,03 και κατώφλι ποσοστού κλαδέματος αδύναμων βαρών 5% (οι παράμετροι αυτοί εξηγούνται αναλυτικά στις σελίδες 33-40). Μετά την εκπαίδευση, οι Houghton & Zorzi (2003) έδωσαν στο μοντέλο όλη τη λίστα λέξεων στις οποίες είχε εκπαιδευτεί για να ελέγξουν την ορθογραφία του σε γνωστές λέξεις. Το μοντέλο παρήγαγε σωστή ορθογραφία μόνο για το 68% των λέξεων (το αντίστοιχο μοντέλο ανάγνωσης των Zorzi et al., 1998 είχε ποσοστό σωστών απαντήσεων 81%), αλλά με 96% των λαθών να είναι φωνολογικά πιθανά. Οι Houghton & Zorzi (2003) υποστηρίζουν ότι το χαμηλό ποσοστό, αλλά και η διαφορά με το μοντέλο ανάγνωσης, οφείλονται στο ότι υπάρχει μεγαλύτερη ασυνέπεια στην αγγλική γλώσσα από τον ήχο στην ορθογραφία, παρά το αντίθετο. Στη συνέχεια οι Houghton & Zorzi (2003) έκαναν 11 προσομοιώσεις με το μοντέλο τους. Στις πρώτες 6 χρησιμοποίησαν μόνο τη φωνολογική διαδρομή του μοντέλου, γιατί ήθελαν να προσομοιώσουν δεδομένα από ασθενείς με επιφανειακή δυσγραφία, οι οποίοι δεν χρησιμοποιούν τη λεξική διαδρομή. Η φωνολογική διαδρομή απλά μετατρέπει τον ήχο σε γραφήματα, χωρίς να κάνει χρήση κάποιου λεξικού. Αυτά που έχει μάθει η φωνολογική διαδρομή είναι μόνο οι φωνολογικοί κανόνες, δηλαδή την αντιστοιχία φωνημάτων γραφημάτων. Οι 6 πρώτες προσομοιώσεις των Houghton & Zorzi (2003) βασίστηκαν σε δεδομένα από μία ασθενή, την ΜΡ, που έχει μελετηθεί από πολλούς ερευνητές (π.χ. Behrmann & Bub, 1992): Προσομοίωση 1: Ορθογραφία ψευδολέξεων σε επιφανειακή δυσγραφία: Οι Houghton & Zorzi (2003) χρησιμοποίησαν τις 58 ψευδολέξεις που είχαν δώσει οι Behrmann & Bub (1992) στην ΜΡ. Η ορθογραφία του 20

μοντέλου ήταν σε πολύ μεγάλο βαθμό όμοια με της ΜΡ (39 λέξεις ίδιες και μικρές διαφορές στις περισσότερες από τις υπόλοιπες). Τόσο η ΜΡ όσο και το μοντέλο έκαναν μόνο φωνολογικά πιθανά λάθη στις ψευδολέξεις. Προσομοίωση 2: Επιρροή της συνέπειας της λέξης στην ορθογραφία: Το μοντέλο όταν χρησιμοποιεί μόνο τη φωνολογική διαδρομή τείνει να κανονικοποιεί τις εξαιρέσεις και τις κανονικές-μη συνεπείς λέξεις. Κανονική αντιστοιχία φωνήματος-γραφήματος θεωρείται η πιο συχνή. Δηλαδή μπορεί να γράψει τη λέξη «chef», η οποία είναι εξαίρεση εξαιτίας της χαμηλής συχνότητας αντιστοιχίας /S/ = «ch», ως «shef» Οι Houghton & Zorzi (2003) χρησιμοποίησαν τις λίστες λέξεων των Stone et al. (1997), βασιζόμενοι συγκεκριμένα στη συνέπεια ήχουορθογραφίας. Έδωσαν στο μοντέλο μια λίστα συνεπών και μια λίστα μη συνεπών λέξεων. Το μοντέλο παρήγαγε σωστή ορθογραφία για το 92% της λίστας των συνεπών λέξεων (2 λάθη) και για το 24% της λίστας των μη συνεπών λέξεων (με όλα τα λάθη να είναι φωνολογικά αποδεκτά). Επομένως το μοντέλο δείχνει μια ξεκάθαρη ευαισθησία προς τις κανονικότητες ήχου-ορθογραφίας της αγγλικής γλώσσας. Προσομοίωση 3: Χρόνοι απόκρισης και συνέπεια: Εξέτασαν τους χρόνους απόκρισης του μοντέλου για 4 λίστες λέξεων των Stone et al. (1997), που αποτελούνταν από συνεπείς και μη συνεπείς λέξεις και ψευδολέξεις. Τα αποτελέσματα έδειξαν ότι υπήρχε επίδραση της συνέπειας, γιατί το μοντέλο αργούσε περισσότερο να αποφασίσει πως θα γράψει μια μη συνεπή λέξη απ ότι μια συνεπή. Δεν υπήρχε όμως επιρροή της «λεξικότητας», δηλαδή το μοντέλο δεν ήταν πιο γρήγορο όταν έπρεπε να γράψει μια πραγματική λέξη απ ότι όταν έπρεπε να γράψει μια ψευδολέξη. Τέλος, δεν υπήρχε επιρροή της αλληλεπίδρασης της συνέπειας με τη λεξικότητα. Το συμπέρασμα είναι ότι η φωνολογική διαδρομή αντιμετωπίζει όλες τις λέξεις με τον ίδιο τρόπο, είτε είναι οι λέξεις στις οποίες είχε εκπαιδευτεί είτε είναι νέες 21

λέξεις και ψευδολέξεις. Αυτό ήταν και το αναμενόμενο αποτέλεσμα, εφόσον δεν υπάρχει λεξικό που να αποθηκεύει τα ζεύγη εισροήςεκροής και γίνεται απλή μετατροπή των φωνημάτων σε γραφήματα. Προσομοίωση 4: Επιρροή της συνέπειας σε γνωστές λέξεις: Για να κατανοήσουν καλύτερα την αλληλεπίδραση που υπάρχει ανάμεσα στη φωνολογική και τη λεξική διαδρομή, οι Houghton & Zorzi (2003) έκαναν αυτή την προσομοίωση για να επιβεβαιώσουν την επίδραση της συνέπειας που είχε βρεθεί στην Προσομοίωση 3, αλλά για γνωστές λέξεις. Αυτή τη φορά έδωσαν στο μοντέλο μόνο λέξεις από τη λίστα των 3165 λέξεων στις οποίες είχε εκπαιδευτεί. Ήταν 48 συνεπείς λέξεις και 48 εξαιρέσεις και το αποτέλεσμα ήταν το μοντέλο να κάνει μόνο 3 λάθη στις συνεπείς (με μέσο όρο 4,33 κύκλους για να γράψει την κάθε λέξη) και να κανονικοποιήσει το 77% των εξαιρέσεων (με μέσο όρο 6,9 κύκλους). Τα αποτελέσματα επιβεβαίωσαν αυτά της Προσομοίωσης 3. Προσομοίωση 5: Μεταβλητότητα στην ορθογραφία: Στην έρευνα των Barry & Seymour (1988) κάποια αμφίσημα φωνήεντα είχαν εξεταστεί σε δύο ψευδολέξεις και είχαν ιεραρχηθεί οι επιλογές ανάλογα με τη συχνότητα χρήσης τους, για παράδειγμα το /i/ γραφόταν πιο συχνά με ΕΕ και λιγότερο συχνά με ΕΑ, το /u/ πιο συχνά με ΟΟ και λιγότερο συχνά με UE κλπ. Οι Houghton & Zorzi (2003) έδωσαν στο μοντέλο τις ψευδολέξεις των Barry & Seymour (1988). Το μοντέλο έδειξε την ίδια προτίμηση με τους συμμετέχοντες στους τρόπους γραφής των περισσότερων αμφίσημων φωνηέντων (δηλαδή έγραφε π.χ. το /i/ πιο συχνά με ΕΕ παρά με ΕΑ). Προσομοίωση 6: Επιρροή από το περιβάλλον του φωνήεντος: Οι περισσότερες ασυνέπειες της αγγλικής γλώσσας βρίσκονται στα φωνήεντα. Οι Kessler & Treiman (2001) έδειξαν ότι κάποια μη-συνεπή φωνήεντα έχουν πιο αναμενόμενη ορθογραφία όταν ληφθεί υπόψη το προηγούμενο ή το επόμενο σύμφωνο. Οι Treiman et al. (2002) σε ένα από τα πειράματά τους με ψευδολέξεις βρήκαν ότι οι ενήλικες επηρεάζονται από το περιβάλλον του φωνήεντος, για παράδειγμα 22

έγραφαν το /e/ ως ΕΑ όταν ακολουθούσε /_d/ (HEAD, SPREAD, DREAD κλπ.), παρόλο που συνήθως το /e/ συνήθως γράφεται ως Ε. Οι Houghton & Zorzi (2003) έδωσαν στο μοντέλο την ίδια λίστα λέξεων και τα αποτελέσματα ήταν πολύ κοντά σε αυτά των ανθρώπων, εκτός από το /U/, το οποίο το μοντέλο έγραφε ως ΟΟ και όχι U. Μετά από τις 6 προσομοιώσεις που έκαναν στη φωνολογική διαδρομή, οι Houghton & Zorzi (2003) έκαναν άλλες 5 προσομοιώσεις χρησιμοποιώντας αυτή τη φορά ολόκληρο το μοντέλο, δηλαδή και τη φωνολογική και τη λεξική διαδρομή: Προσομοίωση 7: Αλληλεπίδραση συχνότητας και κανονικότητας: Έδωσαν στο μοντέλο λέξεις κανονικές, εξαιρέσεις, λέξεις υψηλής και λέξεις χαμηλής συχνότητας. Το μοντέλο είχε σωστή ορθογραφία για όλες τις κατηγορίες, αλλά υπήρχε επιρροή της συχνότητας και επιρροή της κανονικότητας (οι κανονικές γράφονταν πιο γρήγορα από τις εξαιρέσεις), το οποίο δείχνει ότι η φωνολογική διαδρομή επηρέασε το αποτέλεσμα και ότι δεν γράφεται όλη η ορθογραφία μόνο από τη λεξική διαδρομή. Μετά από αυτή την προσομοίωση, οι Houghton & Zorzi (2003) προσπάθησαν να προσομοιώσουν καλύτερα την επιφανειακή δυσγραφία. Στην προσομοίωση 1 χρησιμοποίησαν μόνο τη φωνολογική διαδρομή για να προσομοιώσουν έναν δυσγραφικό ασθενή. Όμως το να μην κάνει κάποιος καθόλου χρήση του λεξικού είναι μια πάρα πολύ σοβαρή μορφή δυσγραφίας. Οι περισσότεροι ασθενείς με επιφανειακή δυσγραφία έχουν μια διατηρημένη ικανότητα να γράφουν σωστά πολλές εξαιρέσεις (όπως έκανε και η ασθενής ΜΡ σύμφωνα με την έρευνα των Behrmann & Bub, 1992), το οποίο δείχνει μια γενική εξασθένιση (σε διαφορετικούς βαθμούς για τον κάθε ασθενή) του λεξικού και όχι την μη χρήση του εντελώς. Επομένως, οι Houghton & Zorzi (2003) μείωσαν την επίδραση του λεξικού για τις επόμενες προσομοιώσεις, έτσι ώστε να συμφωνούν περισσότερο τα αποτελέσματα του μοντέλου με αυτά των ασθενών με επιφανειακή δυσγραφία. 23

Προσομοίωση 8: Λέξεις της ΜΡ σε κανονικό μοντέλο: Έδωσαν τις μονοσύλλαβες λέξεις που είχαν μαζέψει οι Behrmann & Bub (1992) από την ΜΡ στην κανονική μορφή του μοντέλου (χωρίς να μειώσουν την επίδραση του λεξικού. Με αυτό τον τρόπο βρήκαν επίδραση της κανονικότητας, της συχνότητας και της αλληλεπίδρασής τους. Προσομοίωση 9: Αδυνατίζοντας τη λεξική διαδρομή: Τα αποτελέσματα της ΜΡ έδειξαν ότι επηρεαζόταν από τη συχνότητα στις μη κανονικές λέξεις, αλλά σχεδόν καθόλου στις κανονικές. Οι Houghton & Zorzi 92003) έδωσαν τις ίδιες λέξεις στο μοντέλο και τα αποτελέσματα του ταίριαζαν αρκετά και ποιοτικά και ποσοτικά με αυτά της ΜΡ. Προσομοίωση 10: Τα λάθη της ΜΡ: Έδωσαν στο μοντέλο μια λίστα λέξεων με μη κανονικές, χαμηλής συχνότητας λέξεις που είχε δοθεί και στην ΜΡ. Τα λάθη του μοντέλου έμοιαζαν σε πολύ μεγάλο βαθμό με αυτά της ΜΡ. Δηλαδή έτεινε να γράφει λάθος τις ίδιες λέξεις που με την ΜΡ και τα λάθη και των δύο ήταν φωνολογικά πιθανά και σε πολλές περιπτώσεις ίδια. Προσομοίωση 11: Λάθη και αλληλεπιδράσεις της διττής διαδρομής δεδομένα από τον ασθενή LAT: Μια πιθανή κριτική που θα μπορούσε να γίνει στο μοντέλο των Houghton & Zorzi (2003) είναι ότι τα λάθη που κάνει θα μπορούσαν να συμβαίνουν ακόμα και αν οι δύο διαδρομές δεν λειτουργούσαν παράλληλα, αλλά η λεξική συνέβαινε πρώτη και η φωνολογική λειτουργούσε μόνο όταν η λεξική δεν είχε κάποιο υποψήφιο γράφημα. Η κριτική αυτή δεν είναι μόνο για το μοντέλο αλλά και για τον τρόπο λειτουργίας που πολλοί ερευνητές λένε ότι έχει η επιφανειακή δυσγραφία. Για να αποκλείσουν αυτή την περίπτωση, οι Houghton & Zorzi (2003) επισημαίνουν ότι τα λάθη (του μοντέλου και των ασθενών με επιφανειακή δυσγραφία) θα ήταν είτε λεξικά είτε φωνολογικά και όχι μίξεις. Για να το ελέγξουν χρησιμοποίησαν τα λάθη του δυσγραφικού ασθενή LAT (Rapp et al., 2002), που περιείχαν μίξεις λεξικών και 24

φωνολογικών λαθών. Το μοντέλο μπορούσε να γράψει τις λέξεις με τον ίδιο τρόπο όπως ο LAT, υπό την προϋπόθεση ότι η φωνολογική διαδρομή θα προσπαθούσε να σε κάθε λέξη κανονικοποιήσει δύο φωνήματα και θα πετύχαινε μόνο το ένα. Το «φαινόμενο LAT» υπήρχε σε αρκετές λέξεις που είχε γράψει το μοντέλο, υποδεικνύοντας ότι οι δύο διαδρομές λειτουργούν παράλληλα. Το μοντέλο των Houghton & Zorzi (2003) κατάφερε να προσομοιώσει περισσότερα και διαφορετικών ειδών (κανονικά και δυσγραφικά) δεδομένα από τα ήδη υπάρχοντα μοντέλα ορθογραφίας. Επίσης σχεδόν κανένα άρθρο των προηγούμενων μοντέλων ορθογραφίας δεν ανέλυε το χρόνο απόκρισης του μοντέλου, μελετούσαν μόνο τα λάθη. Επομένως η έρευνα των Houghton & Zorzi (2003) είναι περισσότερο πλήρης όσον αφορά τα δεδομένα που προσπάθησαν να προσομοιώσουν, αλλά και την ανάλυση των αποτελεσμάτων του μοντέλου. Το μοντέλο έχει βέβαια κάποιες αδυναμίες. Δεν μπορεί να χρησιμοποιήσει πολυσύλλαβες λέξεις και η φωνολογική διαδρομή μαθαίνει χωρίς βοήθεια από τη λεξική, το οποίο δεν ταιριάζει με τον τρόπο μάθησης της ορθογραφίας των ανθρώπων. Επίσης, η χρήση μόνο μονοσύλλαβων λέξεων καθιστά αδύνατον το μοντέλο να προσομοιώσει αναπτυξιακά δεδομένα, καθώς τα παιδιά εκτίθενται σε πολλές και διαφορετικές λέξεις. Ακόμα περισσότερη δυσκολία σε αυτό το θέμα προσφέρει η ορθογραφική αναπαράσταση του μοντέλου, καθώς δεν ταιριάζει με τον τρόπο με τον οποίο τα παιδιά μαθαίνουν γραφή, κυρίως λόγω τον πολύπλοκων γραφημάτων (TH SH, CH, κλπ.), αλλά και μάθηση κανόνων που δεν τους έχουν διδαχθεί ρητά (π.χ. δεν βάζουν CK στην αρχή της λέξης, Treiman, 1993). 25

ΣΥΝΔΕΤΙΣΤΙΚΟ ΜΟΝΤΕΛΟ ΟΡΘΟΓΡΑΦΙΑΣ ΔΙΤΤΗΣ ΔΙΑΔΡΟΜΗΣ ΓΙΑ ΤΗΝ ΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ Το μοντέλο ορθογραφίας διττής διαδρομής για την ελληνική γλώσσα είναι σε μεγάλο βαθμό όμοιο με το μοντέλο των Houghton & Zorzi (2003) για την αγγλική γλώσσα. Η τελική έκδοση περιλαμβάνει 30.391 λέξεις από τη λίστα παιδικών λέξεων, η οποία περιλαμβάνει όλες τις λέξεις των βιβλίων «Η Γλώσσα μου» όλων των τάξεων του δημοτικού σχολείου και των τριών ανθολογίων. Βρίσκεται στην ιστοσελίδα του Παιδαγωγικού Ινστιτούτου για τυφλούς μαθητές (ηλεκτρονική διεύθυνση http:///www.pi-schools.gr/special_ education_new/html/8emata/orasi/braille/gr_braille.htm). Το μοντέλο έχει υλοποιηθεί από τον Ian Simpson του University of Granada με Visual Basic ενσωματωμένη σε Excel. Ο αρχικός κώδικας ήταν για το αντίστοιχο μοντέλο της ισπανικής γλώσσας (περίπου 7000 παιδικές λέξεις), το οποίο δεν έχει δημοσιευτεί ακόμα. Ο Ian Simpson προσάρμοσε κατάλληλα τον κώδικά του έτσι ώστε να ταιριάζει στη ελληνική γλώσσα. Προκαταρκτικές εκδοχές Η τελική εκδοχή του μοντέλου διττής διαδρομής για την ελληνική γλώσσα είναι η 4.15, η οποία αποτελείται από λέξεις που θεωρούμε ότι γνωρίζουν τα παιδιά του δημοτικού. Μέχρι να καταλήξουμε σε αυτήν, υπήρξαν οι εξής εκδοχές: 1. Εκδοχή 1: Αρχικά το μοντέλο ξεκίνησε με διαφορετική λίστα λέξεων, τις 217.664 λέξεις από το σώμα κειμένων C των ψυχογλωσσολογικών πόρων του Ινστιτούτου Επεξεργασίας του Λόγου (speech.ilsp.gr/iplr), η οποία θεωρούμε πως αποτελεί αντιπροσωπευτικό υποσύνολο των λέξεων που γνωρίζει ένας ενήλικας. Οι λέξεις ήταν μέχρι 11 συλλαβές. Το μοντέλο δεν είχε πλήρη συνδεσιμότητα ανάμεσα στις συλλαβές. Κάθε κανόνα που μάθαινε το μοντέλο, τον μάθαινε μόνο εσωτερικά στη συλλαβή. Δεν ήξερε με ποιους κανόνες επηρέαζαν οι διπλανές συλλαβές, ούτε γνώριζε σε ποια θέση βρισκόταν η συλλαβή. 26

Αντιμετώπιζε δηλαδή την κάθε λέξη ως μια ομάδα μονοσύλλαβων λέξεων. Οι Houghton & Zorzi (2003) είχαν χρησιμοποιήσει μόνο μονοσύλλαβες λέξεις, αλλά αυτό έχει νόημα μόνο στην αγγλική γλώσσα, οι περισσότερες ευρωπαϊκές γλώσσες δεν έχουν πολλές μονοσύλλαβες λέξεις. Όμως οι 11 συλλαβές δημιουργούσαν μεγάλο αριθμό κόμβων, το οποίο δημιουργούσε προβλήματα μνήμης στο μοντέλο. Για να λυθεί το πρόβλημα αυτό, οι λέξεις μειώθηκαν σε αυτές που είχαν μέγεθος μέχρι 5 συλλαβές το οποίο μείωσε τον αριθμό των λέξεων στις 179.604. Μετά από εκπαίδευση σε 10 εποχές (οι οποίες ήταν αρκετές εξαιτίας των πολλών λέξεων) η φωνολογική διαδρομή είχε ποσοστό σωστών απαντήσεων 33,37%. Το κυρίως πρόβλημα ήταν ότι υπήρχαν πολλά λάθη που δεν ήταν φωνολογικά αποδεκτά και τα πιο κύρια ήταν τα εξής: i. Έβαζε «ς» μέσα στη λέξη λέξης (π.χ. έγραφε «διακομιςθεί» αντί για «διακομισθεί») ii. Χρησιμοποιούσε δύο τόνους σε κάποιες λέξεις (π.χ. έγραφε «δεσμέύονται» αντί για «δεσμεύονται) iii. Προσέθετε ή αφαιρούσε γράμματα Όταν έγινε έλεγχος της ορθογραφία των λέξεων χρησιμοποιώντας και τις δύο διαδρομές, τα λάθη ήταν μόνο 88 για τις 179.604. Όμως και τα λάθη αυτά δεν ήταν φωνολογικά αποδεκτά, γιατί το μοντέλο και πάλι προσέθετε επιπλέον γράμματα στις λέξεις αυτές. Η πιο πιθανή εξήγηση για αυτά τα περισσότερα λάθη, κυρίως για το «ς» και τους δύο τόνους, είναι η έλλειψη πλήρους συνδεσιμότητας. Το μοντέλο δεν ήξερε πως μια συλλαβή επηρεάζει την άλλη, δεν ήξερε ότι υπάρχει ήδη τονισμένη συλλαβή στη λέξη, ούτε γνώριζε ότι η συλλαβή δεν είναι τελευταία (ώστε να μη χρησιμοποιεί «ς»). Τα υπόλοιπα λάθη μπορεί να οφείλονταν στο γεγονός ότι το κατώφλι κλαδέματος αδύναμων βαρών ήταν υψηλό (5%), το οποίο δεν άφηνε τους πιο αδύναμους κανόνες να μαθευτούν ή μπορεί οι 10 εποχές να ήταν λίγες. 27

2. Εκδοχή 2: Το μοντέλο εκπαιδεύτηκε ξανά, αυτή τη φορά σε 20 εποχές με το κατώφλι ποσοστού κλαδέματος αδύναμων βαρών στο 1%. Η φωνολογική διαδρομή είχε αυτή τη φορά ποσοστό σωστών απαντήσεων 37%, αλλά και πάλι υπήρχαν πολλά φωνολογικά μη αποδεκτά λάθη και στην ουσία δεν εξαλείφθηκε καμία από τις παραπάνω κατηγορίες λαθών. 3. Εκδοχή 3: Στην εκδοχή 3 το μοντέλο είχε πλέον πλήρη συνδεσιμότητα ανάμεσα στις συλλαβές. Αυτό σημαίνει ότι κάθε φώνημα στην είσοδο μπορεί, τουλάχιστον στη θεωρία, να επηρεάσει οποιοδήποτε γράφημα στην έξοδο, άσχετα με τη συλλαβή στην οποία βρίσκεται. Το πρόβλημα με τους δύο τόνους λύθηκε με το να αφαιρεθούν οι λέξεις που είχαν δύο τόνους. Στα ελληνικά μια λέξη έχει δύο τόνους σε συγκεκριμένο περιβάλλον μέσα σε μια πρόταση, για παράδειγμα «παρακάλεσέ τον», αλλά αρκετές από αυτές τις μορφές βρίσκονταν μέσα στη λίστα. Αφού δεν προσέφεραν κάτι με το να βρίσκονται στη λίστα (δεν είναι μορφές λέξεων που μπορεί να υπάρξουν αυτόνομες), αφαιρέθηκαν. Μετά από εκπαίδευση 10 εποχών, το μοντέλο έκανε μόνο 3 φωνολογικά αποδεκτά λάθη όταν χρησιμοποιούσε και τις δύο διαδρομές. Όταν όμως χρησιμοποιούσε μόνο τη φωνολογική διαδρομή, τα λάθη (αν και διαφορετικά από αυτά των προηγούμενων εκδοχών) ήταν και πάλι φωνολογικά μη αποδεκτά. Ουσιαστικά το μοντέλο προσέθετε πολλά επιπλέον γράμματα μόνο στο τέλος της λέξης ή στην αρχή αν άρχιζε με φωνήεν. Για παράδειγμα έγραφε «μπριγιάννν» αντί για «μπριγιάν» και «γυάβαθοςρρ» αντί για «άβαθο». Γενικά το μοντέλο έγραφε πολλές λέξεις με υπερβολικά πολλά λάθη που δεν υπήρχε καμία περίπτωση να κάνει κανένας άνθρωπος (ούτε καν ένας ασθενής με σοβαρή δυσγραφία), αλλά ανήκαν όλα στην ίδια κατηγορία, την προσθήκη επιπλέον γραμμάτων. 4. Εκδοχή 4.0: Πέρα από τη διόρθωση των λαθών, άλλο ένα πρόβλημα άρχισε να εμφανίζεται, το οποίο είχε να κάνει με τον έλεγχο του 28

μοντέλου. Δεν υπήρχαν δυσγραφικά δεδομένα για την ελληνική γλώσσα, ούτε είχαμε κάποιους υποψήφιους ασθενείς με επιφανειακή δυσγραφία από τους οποίους θα μπορούσαμε να μαζέψουμε δεδομένα. Επίσης μέχρι εκείνη την εκδοχή, το μοντέλο δεν μπορούσε ακόμα να γράψει ψευδολέξεις. Επομένως δεν μπορούσαμε να ελέγξουμε κατά πόσο ήταν καλό μοντέλο, εφ όσον οι ενήλικες θα έκαναν ελάχιστα ή καθόλου λάθη, όπως ακριβώς και το μοντέλο όταν χρησιμοποιούσε τη διπλή διαδρομή. Γι αυτό αποφασίσαμε να αλλάξουμε εντελώς τη λίστα των λέξεων και να χρησιμοποιήσουμε τις λέξεις από τα βιβλία της Γλώσσας του Δημοτικού για να προσομοιώσουμε δεδομένα παιδιών. Οι λέξεις ήταν αρχικά 33.790, αλλά υπήρχαν πάρα πολλά λάθη, γιατί οι λίστα είχε δημιουργηθεί με αυτόματη καταμέτρηση από την ηλεκτρονική μορφή των βιβλίων. Επίσης υπήρχαν λέξεις με περισσότερες από 5 συλλαβές. Για αρχή, στο μοντέλο δόθηκαν μόνο όσες λέξεις ήταν κοινές με την προηγούμενη λίστα λέξεων (του IPLR), αφήνοντας συνολικά 24.631 λέξεις. Τα υπόλοιπα λάθη διορθώθηκαν και πλέον όλα τα λάθη που έκανε η φωνολογική διαδρομή ήταν φωνολογικά αποδεκτά, με εξαίρεση κάποιες λέξεις στις οποίες παρέλειπε ένα γράμμα (π.χ. «ς» αντί για «ως» και «ο» αντί για «ωχ»). Επίσης υπήρχαν ακόμα κάποιες λέξεις με «ς» μέσα στη λέξη, αλλά ήταν μόνο 19. 5. Εκδοχή 4.1: Μετά από έλεγχο, προστέθηκαν άλλες 5.760 από τις υπόλοιπες λέξεις της λίστας, ανεβάζοντας το συνολικό αριθμό των λέξεων στις 30.391. 6. Εκδοχή 4.15: Το μοντέλο έχει πλέον τη δυνατότητα να γράφει ψευδολέξεις χρησιμοποιώντας τη φωνολογική διαδρομή. 29

Είσοδος - Έξοδος Η είσοδος και η έξοδος του μοντέλου έχουν βασιστεί σε αυτή των Houghton & Zorzi (2003) (βλ. σελίδα 19). Η βασική διαφορά είναι ότι οι Houghton & Zorzi χρησιμοποίησαν μόνο μονοσύλλαβες λέξεις. Κάθε λέξη αντιπροσωπευόταν από 7 θέσεις: 3 θέσεις για σύμφωνα (onset), μία θέση για φωνήεν και τέλος άλλες 3 θέσεις για σύμφωνα (coda). Δεν ήταν απαραίτητο για μια λέξη να γεμίσει όλες τις θέσεις. Η εισροή του μοντέλου είναι η φωνολογική μορφή της λέξης. Το μέγεθος της κάθε λέξης μπορεί να φτάσει τις 45 θέσεις (πέντε συλλαβές με εννιά θέσεις η κάθε μία). Κάθε συλλαβή ξεκινά με τέσσερις θέσεις για σύμφωνα (Onset 1 ως Onset 4), ακολουθεί μία θέση για φωνήεν (Nucleus) και τελειώνει με τέσσερις θέσεις για σύμφωνα (Coda 1 ως Coda 4). Επομένως μια συλλαβή εισροής έχει τη μορφή: Onset1 Onset2 Onset3 Onset4 Nucleus Coda1 Coda2 Coda3 Coda4 Σ Σ Σ Σ Φ Σ Σ Σ Σ Η εκροή του μοντέλου είναι η ορθογραφική μορφή της λέξης. Έχει το ίδιο μέγεθος (45 κόμβους) και μορφή με την εισροή. Κάθε συλλαβή ξεκινά με τέσσερις θέσεις για σύμφωνα (Head 1 ως Head 4), ακολουθεί μία θέση για φωνήεν (Nucleus) και τελειώνει με τέσσερις θέσεις για σύμφωνα (Tail 1 ως Tail 4). Επομένως μια συλλαβή εκροής έχει τη μορφή: Head 1 Head2 Head3 Head4 Nucleus Tail1 Tail2 Tail3 Tail4 Σ Σ Σ Σ Φ Σ Σ Σ Σ Ο μόνος περιορισμός που έχουν η εισροή και η εκροή είναι ότι κάθε συλλαβή (και προφανώς κάθε λέξη) πρέπει να περιέχει ένα φωνήεν. Η στοίχιση των φωνημάτων και των γραφημάτων είναι στα αριστερά, δηλαδή αν 30

υπάρχει μόνο ένα σύμφωνο πριν το φωνήεν, θα καταλάβει την πρώτη θέση, αφήνοντας δύο κενές θέσεις πριν το φωνήεν. Παραδείγματα εισροής: 1 η συλλαβή 2 η συλλαβή 3 η συλλαβή s i b e k t e s a f t ç a ɣ r a p s i m o Τα αντίστοιχα παραδείγματα εκροής: 1 η συλλαβή 2 η συλλαβή 3 η συλλαβή σ υ μπ αί κ τ ε ς α υ τ ι ά γ ρ ά ψ ι μ o Όπως φαίνεται και από τα παραδείγματα, ο χωρισμός της κάθε λέξης σε θέσεις γίνεται σύμφωνα με τη φωνολογική της μορφή, δηλαδή την εισροή. Για παράδειγμα, το φώνημα /b/ αντιστοιχεί σε δύο γραφήματα, τα οποία όμως καταλαμβάνουν μία θέση στην έξοδο (*μπ*). Αντιθέτως, τα γραφήματα «ξ» και «ψ» αντιστοιχούν σε συνδυασμό δύο φωνημάτων το καθένα, /ks/ και /ps/ αντίστοιχα, οι οποίοι καταλαμβάνουν δύο θέσεις στην είσοδο. 31

Διαδικασία και παράμετροι μάθησης Οι εξισώσεις που αναφέρονται παρακάτω για την εκπαίδευση, τη φωνολογική, τη λεξική και τη διπλή διαδρομή είναι ίδιες με τις εξισώσεις των Houghton & Zorzi (2002). Το μοντέλο έχει διάφορες παραμέτρους οι οποίες επηρεάζουν το πώς συμπεριφέρεται κατά τη διάρκεια της εκπαίδευσης: 1. Αριθμός εποχών: είναι ο αριθμός των φορών που η κάθε λέξη παρουσιάζεται στο μοντέλο κατά τη διάρκεια της εκπαίδευσης. Σε κάθε εποχή όλες οι λέξεις της λίστας «ανακατεύονται» και παρουσιάζεται από μία φορά η κάθε λέξη. 2. Ρυθμός μάθησης (λ στη συνάρτηση (1)): αυτή η παράμετρος ελέγχει το πόσο γρήγορα μαθαίνει το μοντέλο. Αν έχει υψηλή τιμή, το μοντέλο θα μαθαίνει γρήγορα, αλλά θα έχει επίδραση των πρόσφατων λέξεων στις οποίες εκπαιδεύτηκε. Αν έχει χαμηλή τιμή, τότε το μοντέλο θα χρειάζεται περισσότερο χρόνο να μάθει. Οι Houghton & Zorzi (2003) χρησιμοποίησαν ρυθμό μάθησης 0,03, ενώ στο ελληνικό μοντέλο χρησιμοποιήσαμε 0,02. Η ελληνική γλώσσα έχει σχετικά ομαλή ορθογραφία, επομένως ο ρυθμός μάθησης δεν δημιουργεί μεγάλη διαφορά. 3. Κατώφλι ποσοστού κλαδέματος: υπάρχει η δυνατότητα να κλαδεύεται ένα ποσοστό αδύναμων βαρών μετά από κάθε εποχή. Τα βάρη των οποίων η δύναμη είναι κάτω από αυτό το ποσοστό (συνήθως ως 5%) κλαδεύονται. Καθώς η εκπαίδευση προχωρά, η δύναμη των ισχυρότερων βαρών αυξάνεται και αντίστοιχα η απόλυτη τιμή του κατωφλιού κλαδέματος επίσης αυξάνεται. 4. Θερμοκρασία μάθησης: το τ είναι μια σιγμοειδής δεσμευτική (binding) συνάρτηση που επηρεάζει την κλίση της καμπύλης που χρησιμοποιείται για να περιορίσει την ενεργοποίηση του γραφήματος ανάμεσα στο 0 και το 1. Όσο υψηλότερο είναι το τ, τόσο περισσότερο μοιάζει η καμπύλη με S. Περισσότερη ανάλυση για την παράμετρο αυτή γίνεται στην εξίσωση 2 των Zorzi et al. (1998). 5. Έλεγχος συχνότητας κατά τη μάθηση: αν ενεργοποιηθεί αυτή η παράμετρος, ο ρυθμός μάθησης επηρεάζεται από τη συχνότητα της 32

κάθε λέξης, όπως στους Perry et al. (2010). Αν δεν ενεργοποιηθεί, όλες οι λέξεις αντιμετωπίζονται με τον ίδιο τρόπο κατά την εκπαίδευση. Στο ελληνικό μοντέλο η παράμετρος αυτή είναι ενεργοποιημένη. Κατά την εκπαίδευση, για κάθε ζεύγος φωνήματος-γραφήματος, η απαιτούμενη φωνολογική εισροή δημιουργείται με την ενεργοποίηση των κατάλληλων φωνολογικών κόμβων στην τιμή 1. Η ενεργοποίηση διαδίδεται στους κόμβους γραφημάτων εκροής με τον εξής τρόπο: η προσθιοδρομική (feedforward) είσοδος σε κάθε μονάδα εξόδου είναι το εσωτερικό γινόμενο του διανύσματος της ενεργοποίησης των φωνημάτων και του διανύσματος των βαρών εισόδου σε κάθε μονάδα γραφήματος. Έπειτα, οι ενεργοποιήσεις των κόμβων γραφημάτων υπολογίζονται ως μια σιγμοειδής συνάρτηση f της εισροής, περιορισμένη στο εύρος [0,1] και με f(0) = 0, δηλαδή αν δεν υπάρχει εισροή δεν υπάρχει ούτε εκροή. Αυτό το πρότυπο ενεργοποίησης γραφήματος συγκρίνεται με το στόχο. Οι κόμβοι που πρέπει να είναι ενεργοί, έχουν στόχο ενεργοποίησης 1 και αυτοί που δεν θα έπρεπε να είναι ενεργοί έχουν στόχο ενεργοποίησης 0. Το λάθος κάθε κόμβου εκροής είναι η διαφορά ανάμεσα στο στόχο ενεργοποίησης και την πραγματική τιμή της ενεργοποίησης. Η συνάρτηση (1) (Delta rule error correcting algorithms, Widrow & Hoff, 1960) δείχνει τον τρόπο με τον οποίο χρησιμοποιείται το σφάλμα για να διορθωθούν τα βάρη. Οι παράμετροι της συνάρτησης (1) είναι οι εξής: (1) i. ω ij : είναι το βάρος από το φώνημα u i σο γράφημα u j ii. α i και α j : οι ενεργοποιήσεις ου φωνήματος και του γραφήματος αντίστοιχα iii. λ: ο ρυθμός μάθησης (συνήθως έχει τιμές από 0,03 ως 0,05) Στο τέλος κάθε εποχής υπάρχει η δυνατότητα κλαδέματος των μικρών βαρών. Αυτό συμβαίνει γιατί η συνάρτηση (1) μοιράζει το «φταίξιμο» για τα λάθη σε όλες τις ενεργοποιημένες διαδρομές εισόδου. Στην αρχή της εκπαίδευσης, 33

όπου υπάρχουν συνήθως λάθη, αυτή η διαδικασία δημιουργεί πολλά μημηδενικά βάρη, τα οποία μετά επηρεάζουν ελάχιστα την απόδοση. Το κλάδεμα καθαρίζει αυτά τα βάρη, απλοποιώντας με αυτό τον τρόπο την ανάλυση του δικτύου. Οι Houghton & Zorzi (2003) χρησιμοποίησαν 3%-5% ποσοστό κάτω από το οποίο τα βάρη κλαδεύονταν. Στο ελληνικό μοντέλο βρέθηκε ότι αν δεν γινόταν κλάδεμα τα αποτελέσματα ήταν καλύτερα. 34

Διαδικασία και παράμετροι φωνολογικής διαδρομής Κατά τη διάρκεια του ελέγχου της ορθογραφίας παρουσιάζεται στην είσοδο η φωνολογική μορφή της λέξης, δημιουργώντας ενεργοποίηση στις μονάδες εκροής με τον τρόπο που περιγράφηκε στην προηγούμενη ενότητα. Στη συνέχεια επιλέγονται τα πιο ενεργά γραφήματα για κάθε θέση. Η επιλογή αυτή γίνεται μέσω ανταγωνισμού των υποψήφιων απαντήσεων και πραγματοποιείται μέσω της αναστολής ανάμεσα στα υποψήφια γραφήματα κάθε θέσης. Κάθε υποψήφιο γράφημα έχει συνδέσεις αναστολής στα υπόλοιπα υποψήφια γραφήματα και σύνδεση θετικής ανατροφοδότησης προς τον εαυτό του. Αφού πετύχει το αρχικό επίπεδο ενεργοποίησης εξαιτίας της φωνολογικής εισόδου, το επίπεδο ενεργοποίησης των γραφημάτων αναπτύσσεται σύμφωνα με τον κανόνα της εξίσωσης (2): i. α j : η ενεργοποίηση της μονάδας j (2) ii. iii. iv. t: ο χρόνος (σε διακεκριμένες μονάδες t=1,2 ) F j + : η θετική ανατροφοδότηση του γραφήματος στον εαυτό του F j - : η πλάγια αναστολή που δέχεται το γράφημα από τα αντίπαλα γραφήματα Η θετική ανατροφοδότηση F j + προκύπτει από τη συνάρτηση (3) και η πλάγια αναστολή από την εξίσωση (4): 35

i. ω+: είναι το βάρος της θετικής ανατροφοδότησης ενός γραφήματος στον εαυτό του ii. ω-: είναι το βάρος της πλάγιας αναστολής που δέχεται το γράφημα από τα αντίπαλα γραφήματα iii. : είναι ο ρυθμός με τον οποίο ένα γράφημα εξασθενεί αν δεν περάσει το κατώφλι της θετικής ανατροφοδότησης. iv. θ: το κατώφλι που πρέπει να υπερβεί η ενεργοποίηση του γραφήματος για να δεχθεί τη θετική ανατροφοδότηση. Αν δεν περάσει αυτό το κατώφλι, θα εξασθενίσει με ρυθμό 36

Διαδικασία και παράμετροι λεξικής διαδρομής Το ορθογραφικό λεξικό εκροής της λεξικής διαδρομής είναι ένα ανταγωνιστικό τοπικό δίκτυο, του οποίου ο κάθε κόμβος αντιπροσωπεύει την ορθογραφία μιας μορφής γραφής μιας λέξης. Ανταγωνιστικές αλληλεπιδράσεις επιτρέπουν την ενεργοποίηση ενός κόμβου κάθε φορά, όταν η εισροή είναι ένας γνωστός φωνολογικός κόμβος. Η ενεργοποίηση γίνεται με τον εξής τρόπο: το διάνυσμα της φωνολογικής ενεργοποίησης αντιπαρατίθεται έναντι του αποθηκευμένου βάρους εισόδου για κάθε ορθογραφικό λεξικό στοιχείο και η λέξη που παράγει το καλύτερο ταίριασμα ανάμεσα σε αυτά τα δύο είναι αυτή που επιλέγεται. Η ενεργοποίηση του επιλεγμένου λεξικού κόμβου είναι σταδιακή και ο ρυθμός ενεργοποίησής του εξαρτάται από τη συχνότητα της κάθε λέξης. Ο κάθε κόμβος δίνει θετική ανατροφοδότηση στον εαυτό του. Η ανατροφοδότηση αυτή εξαρτάται από τη συχνότητα της λέξης, όπως φαίνεται στην εξίσωση (5). i. ω i + : το βάρος ανατροφοδότησης σε μια λεξική μονάδα ui (5) ii. W max : το μέγιστο πιθανό βάρος iii. freq i : η συχνότητα της λέξης (από τα αρχεία του Ινστιτούτου Επεξεργασίας του Λόγου) iv. f( ): μια σιγμοειδής συνάρτηση στο διάστημα [0,1], με f(0) = 0 Στο παρόν μοντέλο, για κανονική χρήση της λεξικής διαδρομής, το W max είναι 0,9. Η είσοδος σε ένα λεξικό κόμβο θεωρητικά αναπτύσσεται σταδιακά, φτάνοντας ένα ασυμπτωτικό επίπεδο μετά από κάποια βήματα. Η διαδικασία αυτή έχει ονομαστεί από τους Houghton & Zorzi (2003) ως «διάκλιση» (ramping). Η φωνολογική είσοδος σε ένα λεξιλογικό κόμβο u i σε χρόνο t γίνεται σύμφωνα με τη συνάρτηση (6): 37