ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΙΟΥ ΑΘ. ΚΡΟΝΤΣΟΥ ΘΕΜΑ: ΓΡΑΜΜΑΤΙΚΗ-ΣΥΝΤΑΚΤΙΚΗ ΑΝΑΛΥΣΗ ΤΗΣ ΝΕΑΣ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ ΕΙΣΗΓΗΤΗΣ: ΙΩΑΝΝΗΣ ΡΕΦΑΝΙΔΗΣ



Σχετικά έγγραφα
ΣΥΝΤΑΚΤΙΚΟ ΠΡΟΤΑΣΗ. Η οργανωμένη ομάδα λέξεων που εκφράζει μόνο ένα νόημα, με σύντομη συνήθως διατύπωση, λέγεται πρόταση.

Με την προσδοκία ότι το βιβλίο αυτό θα αποβεί χρήσιμο σε μαθητές και συναδέλφους φιλολόγους, εύχομαι καλή επιτυχία στο έργο τους.

ΣΥΝΤΑΚΤΙΚΟΙ ΟΡΟΙ. Η σύνταξη μιας πρότασης

ΚΟΛΛΕΓΙΟ ΑΘΗΝΩΝ Σχολικό έτος: ΤΜΗΜΑ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ ΓΥΜΝΑΣΙΟ

ΤΑ ΜΕΡΗ ΤΟΥ Βασίλης Αναστασίου

Μοντέλα γλωσσικής επεξεργασίας: σύνταξη

Βασικοί κανόνες κατά τη σύνταξη της Αρχαίας Ελληνικής Γλώσσας ΒΑΣΙΚΟΙ ΟΡΟΙ

ΤΕΧΝΟΓΛΩΣΣΙΑ VIII ΛΟΓΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΔΙΔΑΣΚΟΝΤΕΣ: ΜΑΪΣΤΡΟΣ ΓΙΑΝΗΣ, ΠΑΠΑΚΙΤΣΟΣ ΕΥΑΓΓΕΛΟΣ ΑΣΚΗΣΗ: ΔΙΟΡΘΩΣΗ ΕΚΦΡΑΣΕΩΝ (Β )

ΣΤΑΔΙΑ ΕΠΕΞΕΡΓΑΣΙΑΣ ΑΓΝΩΣΤΟΥ ΚΕΙΜΕΝΟΥ

ΦΩΝΗΤΙΚΗ-ΦΩΝΟΛΟΓΙΑ (Ι)


Αντικείμενο Μονόπτωτα και δίπτωτα ρήματα

Ενότητες Α και Β (Α' Μέρος). Από τη γραμμικότητα στη συστατικότητα. Δομή και συστατικότητα. Δομικοί κανόνες.

ΥΛΗ ΕΞΕΤΑΣΕΩΝ 2007 ΥΠΟΨΗΦΙΩΝ ΥΠΟΤΡΟΦΩΝ ΚΑΘΙΔΡΥΜΑΤΟΣ ΑΘΑΝΑΣΙΟΥ ΜΑΤΑΛΑ Α ΝΕΟΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ

ΓΛΩΣΣΙΚΗ ΔΙΔΑΣΚΑΛΙΑ Α ΓΥΜΝΑΣΙΟΥ. 1 η ΕΝΟΤΗΤΑ Οι πρώτες μέρες σε ένα νέο σχολείο

3ο Νηπ/γείο Κορδελιού Τμήμα Ένταξης

ΝΕΟΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ. A. Κυκλώστε τη σωστή απάντηση στις παρακάτω προτάσεις (μία μόνο απάντηση είναι σωστή σε κάθε περίπτωση)

ΜΕΡΟΣ Α. ΕΡΩΤΗΣΕΙΣ ΠΟΛΛΑΠΛΗΣ ΕΠΙΛΟΓΗΣ (Κυκλώστε τη μοναδική σωστή απάντηση.)

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΕΡΓΑΣΤΗΡΙΟ ΜΕΤΑΦΡΑΣΗΣ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑΣ ΤΟΥ ΛΟΓΟΥ ΜΟΝΑ Α ΑΥΤΟΜΑΤΗΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΦΥΣΙΚΩΝ ΓΛΩΣΣΩΝ

ΚΟΛΛΕΓΙΟ ΑΘΗΝΩΝ Σχολικό έτος: ΤΜΗΜΑ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ ΓΥΜΝΑΣΙΟ ΝΕΟΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ Α ΓΥΜΝΑΣΙΟΥ. Προτεινόμενος Προγραμματισμός κατά ενότητα

ΓΡΑΜΜΑΤΙΚΗ ΣΥΝΤΑΞΗ ΕΙΣΑΓΩΓΗ

«Η τροπικότητα στην Νέα Ελληνική» Ανάλυση βάσει του Επικοινωνιακού Δοµολειτουργικού Προτύπου

ΕΚ ΟΣΕΙΣ ΠΑΠΑ ΟΠΟΥΛΟΣ

Η ΘΕΩΡΙΑ ΤΟΥ Χ --Η ΔΟΜΗ ΤΗΣ ΡΦ, ΠΡΦ, ΕΦ, ΟΦ

Εισαγωγή στη Γλωσσολογία Ι

ΓΛΩ 386 Ζητηματα Νεοελληνικής Σύνταξης

Εργαστήριο Αρχαιομάθειας. Κείμενο. Κατάλογος φαινομένων. Περιεχόμενα. [Διδασκαλία - Εκπαίδευση] Ηλεκτρονικές Ασκήσεις

Αρχές Σύνταξης της Αρχαιοελληνικής Γλώσσας

Η ύλη για τις εξετάσεις υποτροφιών: (για οποιαδήποτε διευκρίνιση μπορείτε να απευθύνεστε στις γραμματείες των φροντιστηρίων).

ΣΥΝΤΑΚΤΙΚΟ Ο. ΠΑΛΑΙΟΧΩΡΙΝΟΥ

accedo spolio, vaco utor, potior

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΣΥΝΤΑΞΗ: ΟΡΘΟΛΟΓΙΚΗ ΠΡΟΣΕΓΓΙΣΗ (FORMAL SYNTAX)

ΦΥΛΛΑΔΙΟ ΓΛΩΣΣΑΣ ΣΥΝΤΑΚΤΙΚΟ (Υποκείμενο, Αντικείμενο, Κατηγορούμενο)

Λογισμικό: Γλωσσικές Περιπλανήσεις Κατηγορία αναπηρίας: Κώφωση Βαρηκοΐα Μάθημα: Γλώσσα Τάξη/εις: Δ, Ε και Στ Δημοτικού

Προτεινόμενος Προγραμματισμός κατά ενότητα

ΑΡΘΡΑ. Μικρές λέξεις που μπαίνουν μπροστά από ουσιαστικά, επίθετα, τις κλιτές μετοχές και ορισμένες αντωνυμίες. ΟΥΣΙΑΣΤΙΚΑ

Προτεινόμενος Προγραμματισμός κατά ενότητα

Οι σύνθετες προτάσεις αποτελούνται από δύο ή περισσότερες απλές προτάσεις που συνδέονται μεταξύ τους με συνδετικά στοιχεία.

ΕΝΟΤΗΤΑ Γ. Κατηγορίες (Μέρη του Λόγου)

ΠΑΛΙΑΤΣΟΥ ΟΥΡΑΝΙΑ 1 ο Γυμνάσιο Φιλιππιάδας. Nea/parathesi-epexigisi.

ΕΙΔΗ ΔΕΥΤΕΡΕΥOΥΣΩΝ ΠΡOΤΑΣΕΩΝ Τη θεωρία της ύλης θα τη βρείτε: Βιβλίο μαθητή σελ και Βιβλίο Γραμματικής σελ

ΑΣΚΗΣΗ 11: ΕΠΕΞΕΡΓΑΣΙΑ ΦΥΣΙΚΗΣ ΓΛΩΣΣΑΣ - ΣΥΝΤΑΚΤΙΚΗ ΑΝΑΛΥΣΗ (PARSING)

ΚΟΛΛΕΓΙΟ ΑΘΗΝΩΝ Σχολικό έτος: ΤΜΗΜΑ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ ΓΥΜΝΑΣΙΟ

[Ένας φίλος που...τρώγεται]

Συντακτικό. χρόνου. Απρόσωπα ρήματα και εκφράσεις Προσοχή ουσιαστ.(σε ονομαστ.)+ἐστί ουδέτερο επιθέτου+ἐστί(π.χ. ἄξιον ἐστί) ουδέτερο μτχ.

ΝΕΑ ΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ ΕΝΔΕΙΚΤΙΚΟΣ ΕΤΗΣΙΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Α ΤΑΞΗ ΓΥΜΝΑΣΙΟΥ

Η πρόταση. Πρόταση λέγεται ένα σύντομο κομμάτι του λόγου, που περιλαμβάνει μια σειρά από λέξεις με ένα τουλάχιστον ρήμα και έχει ολοκληρωμένο νόημα.

ΝΕΑ ΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ - ΔΗΜΟΤΙΚΗ ΕΚΠΑΙΔΕΥΣΗ - ΔΕΙΚΤΕΣ ΕΠΙΤΥΧΙΑΣ ΚΑΙ ΕΠΑΡΚΕΙΑΣ -

Κεφάλαιο 3. Από τη λέξη στη φράση: φραστική δομή

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 4 ο : Συντακτική ανάλυση. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΝΕΑ ΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ ΕΝΔΕΙΚΤΙΚΟΣ ΕΤΗΣΙΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Γ ΤΑΞΗ ΓΥΜΝΑΣΙΟΥ

Εισαγωγή στη Γλωσσολογία Ι

Κεφάλαιο 2. Συντακτικές κατηγορίες

Εισαγωγή στη Γλωσσολογία Ι

ΚΟΛΛΕΓΙΟ ΑΘΗΝΩΝ Σχολικό έτος: ΤΜΗΜΑ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ ΓΥΜΝΑΣΙΟ

Α ΓΥΜΝΑΣΙΟΥ-ΓΛΩΣΣΑ *ΘΕΩΡΙΑ ΕΙΔΗ ΠΡΟΤΑΣΕΩΝ ΜΕ ΒΑΣΗ ΤΑ ΣΥΣΤΑΤΙΚΑ ΤΟΥΣ

ΑΓΓΛΙΚΗ ΣΧΟΛΗ ΛΕΥΚΩΣΙΑΣ ΕΙΣΑΓΩΓΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Χρόνος: 1 ώρα. Οδηγίες

ΕΝΗΜΕΡΩΤΙΚΟ ΣΗΜΕΙΩΜΑ ΕΚΠΑΙΔΕΥΤΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΟΣ

ΝΕΑ ΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ ΕΝΔΕΙΚΤΙΚΟΣ ΕΤΗΣΙΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Β ΤΑΞΗ ΓΥΜΝΑΣΙΟΥ

ΚΟΙΝΗ ΥΛΗ ΚΑΙ ΤΟ ΚΑΙ ΤΟ ΥΠΑΡΧΕΙ ΣΤΗΝ ΥΛΗ ΤΟΥ ΚΑΙ ΔΕΝ ΣΥΜΠΕΡΙΕΛΗΦΘΗ ΣΤΗΝ ΥΛΗ ΤΟΥ ΝΕΑ ΥΛΗ ΤΟ

ΘΕΜΑΤΑ ΝΕΩΝ ΕΛΛΗΝΙΚΩΝ. Κυκλώστε τη μοναδική σωστή απάντηση στις ακόλουθες προτάσεις.

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (Δ.Π.Μ.Σ.)

Η παθητική σύνταξη και το ποιητικό αίτιο

Ο ΚΑΤΑΛΟΓΟΣ. Οι [-Ρ] κατηγορίες (ο, Προθ) εμφανίζονται στη δομή «είναι [-Ρ] που...»: Είναι ο Γιάννης που λείπει Στη βιβλιοθήκη ήταν που κλειδώθηκε

4. ΚΑΤΑΛΟΓΟΣ ΕΛΕΓΧΟΥ ΕΠΙΠΕΔΟΥ ΓΝΩΣΗΣ ΤΗΣ ΕΛΛΗΝΙΚΗΣ ΝΟΗΜΑΤΙΚΗΣ ΓΛΩΣΣΑΣ

2. ΣΥΝΟΠΤΙΚΗ ΠΕΡΙΓΡΑΦΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΡΟΓΡΑΜΜΑΤΩΝ ΣΠΟΥΔΩΝ ΕΝΓ

Γραµµατικοί κανόνες Κανόνες µεταγραφής συµβόλων

Β. Συστατικότητα και εξαρτήσεις (συνέχεια). Το σθένος, επιλογή (το Λεξικό)

Λογισμικό: Αρχαία με Νόημα Κατηγορία αναπηρίας: Κώφωση Βαρηκοΐα Μάθημα: Αρχαία Ελληνικά Τάξη/εις: Α, Β Γυμνασίου

Το Ελληνικό Βλέμμα Revista de Estudos Helênicos da UERJ no.4 ISSN Separata Athanásios Michális Universidade de Atenas

Οδηγίες χορήγησης και διόρθωσης κατατακτήριων τεστ. «Ας μιλήσουμε Ελληνικά Ι, ΙΙ, ΙΙΙ»

[Ένας φίλος που...τρώγεται]

Πέτρος Κλιάπης 3η Περ. Ημαθίας

Η ΠΟΡΕΙΑ ΣΥΝΤΑΞΗΣ ΚΑΙ ΜΕΤΑΦΡΑΣΗΣ ΕΝΟΣ ΑΡΧΑΙΟΥ ΚΕΙΜΕΝΟΥ

C Y M B ȦIJȠıIJȠȚȤİȚȠșİıȓĮ Ȇ =+7+ ȈȚĮ 2( (țijȫʌȧıș ǺȚȞȜȚȠįİıȓĮ %ȚȕȜȚȠʌȦȜİȓȠ (.ǻ2ȉ(,ȉ =+7+ ĭȧijƞıijƞțȥițƞșiıȓį Ȇ =+7+ ȈȚĮ 2( (țijȫʌȧıș ǺȚȞȜȚȠįİıȓĮ

Εξεταστέα ύλη - Α Λυκείου

Συντάκτης : Πηγουνάκη Βαρβάρα, Φιλόλογος ΠΡΟΤΑΣΗ ΠΑΡΟΥΣΙΑΣΗΣ ΤΩΝ ΜΕΤΟΧΩΝ (Γ ΓΥΜΝΑΣΙΟΥ ) ΘΕΑΤΡΙΚΟ

ΝΕΑ ΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ - ΔΗΜΟΤΙΚΗ ΕΚΠΑΙΔΕΥΣΗ - ΔΕΙΚΤΕΣ ΕΠΙΤΥΧΙΑΣ ΚΑΙ ΕΠΑΡΚΕΙΑΣ -

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

ΝΕΑ ΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ - ΔΗΜΟΤΙΚΗ ΕΚΠΑΙΔΕΥΣΗ - ΔΕΙΚΤΕΣ ΕΠΙΤΥΧΙΑΣ ΚΑΙ ΕΠΑΡΚΕΙΑΣ -

ΑΝΣΩΝΤΜΙΕ Είναι κλιτές λέξεις που αντικαθιστούν ονοματικές φράσεις και κάνουν την ίδια «δουλειά» με αυτές.

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΣΗΜΑΣΙΟΛΟΓΙΑ - SEMANTICS

ΦΟΡΜΑ ΑΞΙΟΛΟΓΗΣΗΣ. 1) Στάση του μαθητή/τριας κατά τη διάρκεια του μαθήματος: Δεν την κατέχει. Την κατέχει μερικώς. επαρκώς

ΕΚ ΟΣΕΙΣ ΠΑΠΑ ΟΠΟΥΛΟΣ

Λογισμικό για την εκμάθηση της Ελληνικής ως δεύτερης γλώσσας στα μειονοτικά σχολεία της Θράκης

5Σύνδεση προτάσεων EΝΟΤΗΤΑ

Στοιχεία συντακτικού. (βασικές γνώσεις)

Γραµµατικοί κανόνες Κανόνες µεταγραφής συµβόλων

Ερωτηματικές προτάσεις. Ερωτηματικές λέγονται οι προτάσεις που στον προφορικό λόγο συνοδεύονται από ανέβασμα της φωνής και στο γραπτό με ερωτηματικό.

ΘΕΜΑΤΑ ΝΕΩΝ ΕΛΛΗΝΙΚΩΝ ΜΕΡΟΣ Ι. ΕΡΩΤΗΣΕΙΣ ΠΟΛΛΑΠΛΗΣ ΕΠΙΛΟΓΗΣ

Ενότητα 7. πίνακας του Γιώργου Ιακωβίδη

Τεχνογλωσσία 8 Β' Εξάμηνο. Λογικός Προγραμματισμός Prolog. Άσκηση: Διορθωτής Εκφράσεων

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Εκπαιδευτική παρέμβαση στον αφηγηματικό λόγο νηπίου με γλωσσική διαταραχή

Επικοινωνία Ανθρώπου Υπολογιστή. Β3. Κατανόηση φυσικής γλώσσας

Τεχνητή Νοημοσύνη. 21η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ΕΙΔΙΚΕΣ ΒΟΥΛΗΤΙΚΕΣ ΕΝΔΟΙΑΣΤΙΚΕΣ ΠΡΟΤΑΣΕΙΣ ΕΙΔΙΚΕΣ ΠΡΟΤΑΣΕΙΣ. Εισάγονται με τους συνδέσμους: ότι, πως, που

λατινικά γ λυκείου, γερούνδιο - γερουνδιακό ΓΕΡΟΥΝΔΙΟ ΓΕΡΟΥΝΔΙΑΚΟ

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

Transcript:

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΘΕΜΑ: ΓΡΑΜΜΑΤΙΚΗ-ΣΥΝΤΑΚΤΙΚΗ ΑΝΑΛΥΣΗ ΤΗΣ ΝΕΑΣ ΕΛΛΗΝΙΚΗΣ ΓΛΩΣΣΑΣ ΔΗΜΗΤΡΙΟΥ ΑΘ. ΚΡΟΝΤΣΟΥ ΕΙΣΗΓΗΤΗΣ: ΙΩΑΝΝΗΣ ΡΕΦΑΝΙΔΗΣ

Στόχοι της εργασίας Εντρύφηση στις βασικές αρχές της Επεξεργασίας Φυσικής Γλώσσας Μελέτη του προβλήματος της γραμματικής και συντακτικής ανάλυσης της Νέας Ελληνικής Γλώσσας, μέσα από την διαδικασία συγκριτικής αντιστοίχησης των κύριων τεχνικών που προτάθηκαν στην ξένη βιβλιογραφία. Συγκριτική εισαγωγή ορισμένων τεχνικών ανάλυσης και κατάλληληπροσαρμογήγιατηνεισαγωγήτουςστην ελληνική. Ανάπτυξη λογισμικού σε αντικειμενοστρεφή γλώσσα προγραμματισμού το οποίο θα παρέχει και διαδραστικό περιβάλλον γραφικών, ώστε να προσφέρεται η δυνατότητα παρουσίασης. Καταληκτικός στόχος της εργασίας: Δημιουργία ενός μικρού ευέλικτου επεξεργαστή κειμένου σε C++, ο οποίος θα ενσωματώνει και κάποιες δυνατότητες επίδειξης ανάλυσης της ελληνικής γλώσσας.

Θεωρία Επεξεργασία Φυσικής Γλώσσας είναι ο κλάδος της Τεχνητής Νοημοσύνης που πραγματεύεται την ανάλυση, κατανόηση και παραγωγή κειμένων οποιασδήποτε φυσικής γλώσσας. Προσεγγίσεις ΕΦΓ: 1. η βασισμένη σε κανόνες (rule-based) και 2. ηστατιστική(statistical). Η εργασία αυτή είναι βασισμένη στη πρώτη. Εφαρμογές της ΕΦΓ 1. διάλογος με τον υπολογιστή 2. μηχανική μετάφραση

Βασικές αρχές της γλώσσας Γλώσσα - Τυπικές γλώσσες (formal languages) - θεωρία τυπικών γλωσσών Λέξεις = τερματικά σύμβολα, Φράσεις = μη τερματικά σύμβολα Γραμματική θεωρείται ένα πεπερασμένο σύνολο κανόνων που διέπουν τη δομή μίας γλώσσας. parse tree Η πρόταση αναλύεται έτσι σε άμεσα συστατικά: [ [ [ο] [μικρός] [Πέτρος] ] [τάισε [ [τη] [γάτα] ] ] ]. αμφισημία = 1 συμβολοσειρά, δύο παραγωγές, δύο δέντρα

Επίπεδα ανάλυσης της Φυσικής Γλώσσας Φωνολογικό φθόγγοι Μορφολογικό Κλίση, παραγωγή Συντακτικό φράσεις και προτάσεις. γραμματικές >>> κανόνες φραστικής δομής Σημασιολογικό Η σημασία της γλώσσας Πραγματολογικό Οι ερωτήσεις, οι διαταγές, οι παρακλήσεις, οι ευχές, δεν έχουν ακόμη βρει τα σημασιολογικά τους αντίστοιχα σε συστήματα

Τα στάδια ανάλυσης ΦΓ που ακολουθεί ο Μηχανικός - Γλωσσολόγος Βήμα 1ο Το Λεξικό. Περιέχει πληροφορία για κάθε λέξη της γλώσσας, τη λεξική πληροφορία. (tokenization) Στάδιο της αναγνώρισης και ταυτοποίησης των λεκτικών μονάδων. Άλλα πιθανά στάδια προεπεξεργασίας: i. Τη Γραμματική πληροφορία, που σχετίζεται με τα γραμματικά χαρακτηριστικά της λέξης, όπως μέρος του λόγου, πτώση, αριθμός, γένος, πρόσωπο, χρόνος κ.λ.π. Κάθε γραμματικό χαρακτηριστικό ορίζεται σε ένα προκαθορισμένο και πολύ περιορισμένο σύνολο τιμών. ii. Τη Σημασιολογική πληροφορία, η οποία αφορά στις σχέσεις που μπορεί να συνάψει η λέξη με άλλες λεξικές οντότητες. Η σημασιολογική πληροφορία προέρχεται αφενός από το επίπεδο των εννοιών και αφετέρου από τη συγκεκριμένη φυσική γλώσσα.

Τα στάδια ανάλυσης ΦΓ που ακολουθεί ο Μηχανικός - Γλωσσολόγος Βήμα 2ο Το Συντακτικό. Αφορά τους τρόπους που μπορούν να συνδυαστούν μεταξύ τους λέξεις με συγκεκριμένα γραμματικά χαρακτηριστικά για να σχηματίσουν φράσεις και προτάσεις. Το συντακτικό επίπεδο περιγράφεται από ένα σύνολο συντακτικών κανόνων. Βήμα 3ο Το Πραγματολογικό. Περιέχει την πληροφορία που είναι αναγκαία για να εξαχθεί το νόημα της πρότασης αλλά δεν περιέχεται σε αυτήν είτε βρίσκεται στο ίδιο κείμενο εκτός αυτής, είτε εντάσσεται στη Γνώση του Κόσμου. Κλασσικά παραδείγματα εφαρμογής της είναι τα γλωσσικά φαινόμενα της Έλλειψης και της Αναφοράς.

Φράσεις Οι φράσεις Είναι σύμπλοκα λέξεων με εσωτερική συνοχή και αυτοτέλεια Μονάδες ανάμεσα στην πρόταση και τη λέξη Μετακίνηση : τη γάτα τάισε ο μικρός Πέτρος Αντωνυμικοποιούνται: Αυτός την τάισε κλπ. Δομικές αμφισημίες [κάνε το δικό σου] = [[κάνε το] δικό σου] (= απόκτησέ το) =[κάνε [το δικό σου]] (= κάνε αυτό που θέλεις) Ονοματική, ρηματική, προθετική, επιρρηματική, επιθετική Μοντέλο διμερούς οργάνωσης της πρότασης (υποκείμενο/ κατηγόρημα, ΟΦ + ΡΦ, θέμα/ σχόλιο κλπ.).

Γραμματικές Τύπου 0: ελεύθερη - με κανόνες της μορφής σ->τ όπου: σ ανήκει V+ και τανήκειv* Τύπου 1: γραμματική με συμφραζόμενα (context sensitive grammar) - με κανόνες της μορφής μαν->μχν όπου: μ, ν ανήκουν V*, χ ανήκειv+ και ΑανήκειVN Τύπου 2: γραμματική χωρίς συμφραζόμενα (context free grammar) - με κανόνες της μορφής Α->χ όπου: χ ανήκειv* και Αανήκει VN Οι γραμματικές αυτές μπορούν να ορίσουν συχνά τη σύνταξη μιας γλώσσας. Τύπου 3: κανονική γραμματική (regular grammar) - με κανόνες της μορφής Α->α ήα->αβ όπου: χ ανήκειv*, Α, Β ανήκουνvn και αανήκειvτ ήείναιτοκενόσύμβολο.

Γραμματικές στην ΕΦΓ Κατηγορικές γραμματικές (attribute grammars), κατηγορικές γλώσσες ή γλώσσες πρώτης τάξης DCG (Define Clause Grammars) ή Γραμματικές Οριστικών προτάσεων ή Γραμματικές Ορισμένης Φράσης Γραμματικές ενεργοποίησης Παράδειγμα Γραμματικής Π = ΟΦ >> ΡΦ ΟΦ =!Άρθρο>>!Επίθετο>> Ουσιαστικό ΡΦ = (Ρήμα (Ρήμα >> ΟΦ) (Ρήμα >> ΟΦ >> ΟΦ) >>!Επίρρημα ΠΦ = Πρόθεση >> (ΟΦ Επίρρημα) Επίρρημα = πάνω κάτω δεξιά ΠΦ Άρθρο = ο η το του τον τους την Ουσιαστικό = γιατρός μητέρα Επίθετο = έξυπνος όμορφη χαζό Ρήμα = τρέχω χτυπώ δίνει παίρνουμε

Τεχνολογητές Οι τεχνολογητές (parsers) είναι υπολογιστικά συστήματα που επεξεργάζονται την φυσική γλώσσα, και προσδιορίζουν αν μια πρόταση παράγεται από μια συγκεκριμένη γραμματική. Υπάρχουν διάφορες στρατηγικές τεχνολόγησης (parsing). Οι δύο πιο βασικές είναι η καθοδική τεχνολόγηση (top-down parsing) και η ανοδική τεχνολόγηση (bottom-up parsing) ο τεχνολογητής που ακολουθεί την στρατηγική ανοδικής τεχνολόγησης, ξεκινά από κάτω, δηλαδή ταυτοποιεί τα τερματικά σύμβολα (λεξικές οντότητες) και χτίζει προοδευτικά τιςανώτερεςδομές. Στη καθοδική τεχνολόγηση γίνεται το ανάποδο.

Πείραμα Στόχος: Μία παραδειγματική γραμματική η οποία θα ήταν ικανή έως κάποιο βαθμό να ελέγξει την συντακτική ορθότητα προτάσεων της Ελληνικής Γλώσσας. Υπάρχοντες λεξικοί και σημασιολογικοί πόροι Επιλογή τύπου γραμματικής και τεχνολογητή Η ελληνική γλώσσα Λέξεις, γραμματικές κατηγορίες, παρατηρήσεις Λέξεις περιεχομένου και γραμματικές ή λειτουργικές λέξεις Οι κατεξοχήν γραμματικές κατηγορίες είναι αυτές του γένους, του αριθμού, της πτώσης, του προσώπου, του χρόνου, της έγκλισης και του ποιού ενέργειας Περιπτώσεις αμφισημίας (ουσιαστικά, επίθετα, αριθμητικά, επιρρήματα) πχ τον πολύ, το πολύ, πολύ όμορφα τον καλό το καλό η υπάλληλος ο υπάλληλος

Ονοματική Φράση Πληροφορίες της ΟΦ: Υποχρεωτικές: 1. Αριθμός 2. Πτώση 3. Γραμματικό γένος 4. Είδος αναφοράς Προαιρετικές : 1. Πρόσωπο (με προσωπική, αυτοπαθή ή κτητική αντωνυμία) 2. Χρόνος (με χρον. προσδιορισμούς) κ.ά. Ρηματική Φράση Πληροφορίες της ΡΦ: 1. Αριθμός 2. Πρόσωπο 3. Χρονική βαθμίδα 4. Ποιόν ενεργείας 5. Τροπικότητα 6. Διάθεση

Ονοματική εξειδίκευση άρθρα- επίθετα- αντωνυμίες- αναφορικές προτάσεις και κτητικά [ο Πέτρος ο χοντρός] [κάποιο πρόβλημα] [το καλό βιβλίο] (Χαρακτηρισμός της αναφοράς :επίθετα και αναφορικές προτάσεις) [ένα βάζο πανάκριβο] [ένα βάζο που είναι πανάκριβο] Επιθετικός προσδιορισμός - κατηγορηματικός προσδιορισμός - κατηγορούμενο (Ταξινομικοί-περιγραφικοί προσδιορισμοί) Θέση, σειρά και σύνταξη των επιθετικών προσδιορισμών [ο καλόςολόγος] [πράσινο λιβάδι] [θάλασσα αφροστολισμένη] Οι συνήθεις κατανομές ενός κατηγορηματικού προσδιορισμού [έντρομος ο κλέφτης] [ο Πέτρος άρρωστος δουλεύει] [μικρός ξενιτεύτηκε] Κατηγορούμενα κατηγορηματικά επίθετα [είναι έξυπνος] [βάδιζε καμαρωτός]

Πλαίσια υποκατηγοριοποίησης Διάκριση Ορισμάτων Συμπληρωμάτων-Προσαρτημάτων Πλαίσιο υποκατηγοριοποίησης (subcategorization frame) ονομάζεται ένας συνδυασμός ορισμάτων με το οποίο το ρήμα μπορεί να συν-εμφανιστεί Αμετάβατο ρήμα [ΟΦ] Δηλαδή : [ΟΦ]ΟΝΗΜαρίαέφυγε. Μεταβατικό ρήμα [ΟΦ][ΟΦ] [ΟΦ]ΟΝ[ΟΦ]ΑΙΤ Ο Γιάννης αγαπά την Εύα. Τρισθενές ρήμα [ΟΦ][ΟΦ][ΟΦ] [ΟΦ]ΟΝ[ΟΦ]ΓΕΝ[ΟΦ]ΑΙΤ Η Εύα έδωσε του Άρη το δώρο. Aμετάβατο ρήμα με ΠΦ [ΟΦ][ΠΦ]IN [ΟΦ]ΟΝ[ΠΦ]ΣΕ Η Μαρία ζει στην Αθήνα. Μεταβατικό με ΠΦ [ΟΦ][ΟΦ][ΠΦ]ΟΝ [ΟΦ]ΟΝ[ΟΦ]ΑΙΤ[ΠΦ]ΣΕ Η Άννα άφησε τη γόμα στο σπίτι. Δευτερ/σα πρόταση ως συμπλήρωμα [ΟΦ][ΔΠ]THAT [ΟΦ]ΟΝ[ΔΠ]ΟΤΙ Εγώ ξέρω οτι του πάει. Τρισθενές ρήμα με δευτερεύουσα πρόταση ως ένα συμπλήρωμα [ΟΦ][ΟΦ][ΔΠ]ΤΗΑΤ

Εργαστικά - Μεταβιβαστικά - Απρόσωπα Εργαστικά: πολλές φορές τα ρήματα βρίσκονται σε ενεργητική φωνή και ωστόσο, δεν προβάλλουν ως συντακτικό υποκείμενο τον δράστη της ενέργειας, αλλά τον δέκτη. Επίσης, ενώ η πρωτοτυπική, δηλαδή η κατεξοχήν χρήση των ρημάτων αυτών είναι μεταβατική, χρησιμοποιούνται και ως αμετάβατα. Ο Γιάννης στέγνωνε τα ρούχα του. ->Τα ρούχα στέγνωναν. Μεταβιβαστικά (σε γενικές γραμμές το αντίθετο ^) Τα χιόνια θα λειώσουν στα βουνά.-> Η άνοιξη θα λειώσει το χιόνι στα βουνά. Απρόσωπα ρήματα λέγονται αυτά που δε φανερώνουν ποιο από τα πρόσωπα του λόγου (= ομιλητής, ακροατής ή τρίτος) είναι το υποκείμενό τους

Δισθενή και τρισθενή ρήματα Δισθενή ρήματα: άμεσο αντικείμενο σε αιτιατική [Ο Γιάννης χτυπά τον ] εξαρτημένη πρόταση με ότι/ να [Θέλω να ] Τρισθενή ρήματα: αυτά που δηλώνουν μεταβίβαση κτήσης και συμπληρώνονται με ένα άμεσο και ένα έμμεσο αντικείμενο, [Έδωσα το βιβλίο στο Γιάννη] αυτά που συμπληρώνονται από ένα ονοματικό στοιχείο σε αιτιατική και μια εξαρτημένη πρόταση με ότι/ να,[αναγκάζω τον Γιάννη να ] αυτά που συμπληρώνονται από μια προθετική φράση/ αντικείμενοσεγενικήκαιτηνεξαρτημένηπρόταση/ αντικείμενο. [Λέω του Γιάννη ότι ] [Δίνω του Γιάννη τον στυλό]

Μεταβατική-αμετάβατη ρηματική σύνταξη Η μεταβατικότητα ορίζεται ως η δυνατότητα να χρησιμοποιηθεί το ρήμα με συμπληρώματα Έτσι, ως προς αυτήν την δυνατότητα, διακρίνουμε δύο τύπους χρήσης του ρήματος: 1. την αμετάβατη χρήση, δηλαδή τη χρήση χωρίς συμπλήρωμα και 2. τη μεταβατική, δηλαδή τη χρήση με συμπλήρωμα. Κατηγορίες Μεταβατικότητα 1. Κατεξοχήν μεταβατικά 2. Ενδιάμεση κατηγορία 3. Κατεξοχήν αμετάβατα 1. Αμετάβατα 2. Μονόπτωτα 3. Δίπτωτα

Συνδετικά ρήματα

Επιρρηματική εξειδίκευση 1. τα επιρρήματα [τώρα] 2. Τα επιρρηματικά προθετικά σύνολα [από σήμερα] 3. Οι εξαρτημένες επιρρηματικές προτάσεις [όταν έρθω] 4. Η επιρρηματική μετοχή (βλέποντας - χτυπώντας) Η εξειδίκευση της ρηματικής πληροφορίας μπορεί να είναι: 1. τοπική 2. χρονική 3. τροπική 4. ποσοτική 5. αιτιατική συντακτικές λειτουργίες των επιρρηματικών στοιχείων (προσδιορισμός ρήματος, συμπλήρωμα ρήματος, προσδιορισμός ολόκληρης πρότασης, προσδιορισμός άλλου επιρρηματικού στοιχείου, επεξήγηση σε άλλο επιρρηματικό στοιχείο, προσδιορισμός ονόματος, προσδιορισμός επιθέτου)

Παραδείγματα αμφισημίας και άλλα 1. Ο Γιάννης μιλά στο Δημήτρη - Ο Γιάννης μιλά στο τηλέφωνο - Ο Γιάννης μιλά με τον Δημήτρη - Ο Γιάννης μιλάει πολύ Ο Γιάννης μιλάει γρήγορα 2. Ο γιατρός δίνει του παππού φάρμακα - Ο μαθητής δίνει το βιβλίο του συμμαθητή του - Ο μαθητής δίνει το βιβλίο στο συμμαθητή του - Ο μαθητής δίνει το βιβλίο 3. Τον χτύπησε τον πυγμάχο - τον χτύπησε το χέρι 4. Ο πατέρας και αδελφός - Ο Γιάννης και ο Δημήτρης

Σύνδεση στοιχείων-φράσεων-προτάσεων Σύνθετη πρόταση [Παράταξη:Είμαι ράφτης και μιλώ Ελληνικά] Πλήρης / Ελλειπτική πρόταση [Εγώ τρέχω. / Τρέχω.] Ασύνδετο σχήμα [Ο έναςμιλά, ο άλλος σιωπά] Παρατακτική σύνδεση φράσεων/ στοιχείων [ούτε έξυπνος ούτε χαζός] [δίνει και παίρνει λεφτά] [δίνει κάτι και παίρνει κάτι] Παρατακτική / Υποτακτική σύνδεση [Ο ένας μιλά και ο άλλος σιωπά], [Θύμωσε επειδή μίλησα άσχημα] Δευτερεύουσες Προτάσεις (ειδικές, βουλητικές, ενδοιαστικές, ερωτηματικές, αναφορικές, αιτιολογικές, υποθετικές, εναντιωματικές, παραχωρητικές, συμπερασματικές, αποτελεσματικές, τελικές, σκοπού, χρονικές)

Ανάπτυξη Γραμματικής Ο αριθμός των κανόνων φτάνει τους 750. Οι κανόνες καλύπτουν από την κατασκευή σύνθετων προτάσεων (συνδυασμό κύριων και δευτερευουσών προτάσεων) έως την κατασκευή απλών προτάσεων. Συντακτικές δομές - Γραμματική Υποκείμενο, αντικείμενο, έμμεσο αντικείμενο, κατηγορούμενο, επιρρηματικό κατηγορούμενο, επιθετικός προσδιορισμός, κατηγορηματικός προσδιορισμός, επιρρηματικός προσδιορισμός, γενική προσδιοριστική, προσδιορισμός στο αντικείμενο (άμεσο και έμμεσο), παράθεση Διάταξη όρων Ρηματικό σθένος : αμετάβατα, μονόπτωτα, δίπτωτα Συνδετικά Κύριες - δευτερεύουσες προτάσεις Φράσεις (Ρηματικές, Ονοματικές, Προθετικές, Επιρρηματικές κλπ) Σύνθετες δομές στοιχείων, παρατακτική σύνδεση στοιχείων Επαναληψιμότητα [Έφαγε και κρέας και σαλάτα] Χρόνος [τρέχω, έτρεξα, θα τρέξω, έχω τρέξει κλπ] Λεξικό 3000 εγγραφές

Parser Spirit Boost (Open Source) Οι δηλώσεις των κανόνων ομοιάζουν με αυτές της τυπικής γλώσσας EBNF (Extended Backus-Normal Form). Τα δυναμικά του χαρακτηριστικά που επιτρέπουν σχηματισμό κανόνων που αλλάζουν δυναμικά κατά την εκτέλεση. Με το συγκεκριμένο εργαλείο μπορεί κανείς να υλοποιήσει παραμετρικούς parsers αλλά και γραμματικές ενεργοποίησης, συντακτικά δέντρα, κυκλικούς τεχνολογητές και πολλά ακόμη. Τέλος, αναφέρεται και το εξαιρετικό χαρακτηριστικό ότι επιτρέπεται η αριστερή αναδρομή.

Συμπερασματικά Λίγος χρόνος = συμβιβασμοί Λεξικοί πόροι Γραμματική Τεχνολογητής Ερευνητική εργασία = πολλά λάθη πριν προκύψει κάτι ορθότερο Ελλείψεις (γραμματική, ταχύτητα) Προοπτικές επέκτασης Σοβαρή μελέτη σε συνεργασία με γλωσσολόγο Ευχαριστίες Ευχαριστώ τον κ. Ιωάννη Ρεφανίδη για το ότι μου έδωσε την ευκαιρία να δουλέψω με ένα τόσο ενδιαφέρον θέμα αλλά και για τη συμπαράσταση του καθ όλη τη διαδικασία εκπόνησης της διπλωματικής αυτής εργασίας.