ΚΕΦΑΛΑΙΟ 4. Ενοποιητική Γραµµατική

Σχετικά έγγραφα
ΤΕΧΝΟΓΛΩΣΣΙΑ VIII ΛΟΓΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΔΙΔΑΣΚΟΝΤΕΣ: ΜΑΪΣΤΡΟΣ ΓΙΑΝΗΣ, ΠΑΠΑΚΙΤΣΟΣ ΕΥΑΓΓΕΛΟΣ ΑΣΚΗΣΗ: ΔΙΟΡΘΩΣΗ ΕΚΦΡΑΣΕΩΝ (Β )

4.4 Ερωτήσεις διάταξης. Στις ερωτήσεις διάταξης δίνονται:

Τεχνογλωσσία 8 Β' Εξάμηνο. Λογικός Προγραμματισμός Prolog. Άσκηση: Διορθωτής Εκφράσεων

Επικοινωνία Ανθρώπου Υπολογιστή. Β3. Κατανόηση φυσικής γλώσσας

Κεφάλαιο 3ο: Γραμματικοί φορμαλισμοί

γ. µαΐστρος - σ. µαρκαντωνάτου 17

Περιεχόμενα 1 Πρωτοβάθμια Λογική Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά και Πληροφορικής Μαθηματικά Πανεπιστήμιο ΙΙ Ιωαννίνων ) / 60

Α. Ερωτήσεις Ανάπτυξης

HY118- ιακριτά Μαθηµατικά. Συναρτήσεις. Συνάρτηση. Συνάρτηση: Τυπικός ορισµός Συναρτήσεις

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΣΗΜΑΣΙΟΛΟΓΙΑ - SEMANTICS

Η Έννοια της συνάρτησης

ΔΟΜΗΜΕΝΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Κεφάλαιο 8 : H γλώσσα προγραµµατισµού Pascal 1 ο Μέρος σηµειώσεων (Ενότητες 8.1 & 8.2 σχολικού βιβλίου)

Βάσεις Δεδομένων. Τ.Ε.Ι. Ιονίων Νήσων Σχολή Διοίκησης και Οικονομίας - Λευκάδα

Εισαγωγή στην Τοπολογία

HY118- ιακριτά Μαθηµατικά

ΑΣΚΗΣΗ 11: ΕΠΕΞΕΡΓΑΣΙΑ ΦΥΣΙΚΗΣ ΓΛΩΣΣΑΣ - ΣΥΝΤΑΚΤΙΚΗ ΑΝΑΛΥΣΗ (PARSING)

Ανοικτά και κλειστά σύνολα

Τεχνητή Νοημοσύνη. 21η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Συναρτησιακές Εξαρτήσεις. Βάσεις εδοµένων Ευαγγελία Πιτουρά 1

επιµέλεια Θοδωρής Πιερράτος

ΚΕΦΑΛΑΙΟ 3 ΤΟ ΔΙΩΝΥΜΙΚΟ ΘΕΩΡΗΜΑ

HY118- ιακριτά Μαθηµατικά

Υπολογιστικής Γλωσσολογίας (Computational Linguistics) και ο γλωσσικός µηχανικός (language

ΣΕΙΡΕΣ TAYLOR. Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων. Πολυώνυµο είναι κάθε συνάρτηση της µορφής:

Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrange

HY118- ιακριτά Μαθηµατικά

Κεφάλαιο 12 : ΥΠΟΠΡΟΓΡΑΜΜΑΤΑ

ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΙΚΗΣ ΑΝΑΛΥΣΗΣ Ι ( )

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Διακριτά Μαθηματικά. Ενότητα 8: Υπολογισιμότητα & Γλώσσες

( ) = inf { (, Ρ) : Ρ διαµέριση του [, ]}

Κεφάλαιο Τρία: Ψηφιακά Ηλεκτρονικά

3 Αναδροµή και Επαγωγή

HY118- ιακριτά Μαθηµατικά

11ο Πανελλήνιο Συνέδριο της ΕΕΦ, Λάρισα 30-31/03, 1-2/04/2006. Πρακτικά Συνεδρίου

Γενικές Παρατηρήσεις. Μη Κανονικές Γλώσσες - Χωρίς Συµφραζόµενα (1) Το Λήµµα της Αντλησης. Χρήση του Λήµµατος Αντλησης.

Μερικές διατάξεις. HY118- ιακριτά Μαθηµατικά. Μερικές διατάξεις, παράδειγµα. ιαγράµµατα Hasse: Αναπαράσταση σχέσεων µερικής διάταξης

Εισαγωγή στους Αλγόριθµους. Αλγόριθµοι. Ιστορικά Στοιχεία. Ο πρώτος Αλγόριθµος. Παραδείγµατα Αλγορίθµων. Τι είναι Αλγόριθµος

ΚΕΦΑΛΑΙΟ 7 ο. Έτσι ο προγραµµατισµός µε τη ΓΛΩΣΣΑ εστιάζεται στην ανάπτυξη του αλγορίθµου και τη µετατροπή του σε σωστό πρόγραµµα.

Γραµµατικοί κανόνες Κανόνες µεταγραφής συµβόλων

Γραµµατικοί κανόνες Κανόνες µεταγραφής συµβόλων

Όρια συναρτήσεων. ε > υπάρχει ( ) { } = ± ορίζονται αναλόγως. Η διατύπωση αυτών των ορισµών αφήνεται ως άσκηση. x y = +. = και για κάθε (, ) ( 0,0)

Τεχνητή Νοημοσύνη. 23η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

6. ΔΙΑΝΥΣΜΑΤΙΚΟΙ ΧΩΡΟΙ ΚΑΙ ΑΝΤΙΣΤΡΟΦΑ ΠΡΟΒΛΗΜΑΤΑ

Κεφάλαιο 4ο: Εντολές επιλογής

KΕΦΑΛΑΙΟ 1 ΧΡΗΣΙΜΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΝΝΟΙΕΣ. { 1,2,3,..., n,...

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ

Ανάπτυξη Μεγάλων Εφαρµογών στη Γλώσσα C (2)

C: Από τη Θεωρία στην Εφαρµογή 2 ο Κεφάλαιο

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

ΠΕΡΙΕΧΟΜΕΝΑ. Μονοδιάστατοι πίνακες Πότε πρέπει να χρησιμοποιούνται πίνακες Πολυδιάστατοι πίνακες Τυπικές επεξεργασίες πινάκων

Αλγόριθµοι και Πολυπλοκότητα

Όρια συναρτήσεων. ε > υπάρχει ( ) { } = ± ορίζονται αναλόγως. Η διατύπωση αυτών των ορισµών αφήνεται ως άσκηση. x y = +. = και για κάθε (, ) ( 0,0)

όπου D(f ) = (, 0) (0, + ) = R {0}. Είναι Σχήµα 10: Η γραφική παράσταση της συνάρτησης f (x) = 1/x.

ΙΙ ιαφορικός Λογισµός πολλών µεταβλητών. ιαφόριση συναρτήσεων πολλών µεταβλητών

Αρµονική Ανάλυση. Ενότητα: L 2 -σύγκλιση σειρών Fourier. Απόστολος Γιαννόπουλος. Τµήµα Μαθηµατικών

Μάθημα: Δ3. Δίκτυα Γνώσης και Σημασιολογικός Ιστός. Διάλεξη 01 & 02. Δρ. Γεώργιος Χρ. Μακρής

Μετασχηµατισµοί Laplace, Αναλογικά Συστήµατα, ιαφορικές Εξισώσεις

x=l ηλαδή η ενέργεια είναι µία συνάρτηση της συνάρτησης . Στα µαθηµατικά, η συνάρτηση µίας συνάρτησης ονοµάζεται συναρτησιακό (functional).

Μάθημα: Δ3. Δίκτυα Γνώσης και Σημασιολογικός Ιστός. Διάλεξη 02 & 03. Δρ. Γεώργιος Χρ. Μακρής

Μη γράφετε στο πίσω μέρος της σελίδας

Ασκήσεις μελέτης της ενότητας «Συντακτική Ανάλυση»

Σχεσιακή Άλγεβρα και Σχεσιακός Λογισμός. Σχεσιακή Άλγεβρα Σχεσιακός Λογισμός

Στοιχεία Θεωρίας Υπολογισµού (1): Τυπικές Γλώσσες, Γραµµατικές

Τεχνογλωσσία 8 Β' Εξάμηνο Λογικός Προγραμματισμός Prolog

Ποιές οι θεµελιώδεις δυνατότητες και ποιοί οι εγγενείς περιορισµοί των υπολογιστών ; Τί µπορούµε και τί δε µπορούµε να υπολογίσουµε (και γιατί);

Μοντελοποίηση Υπολογισμού. Γραμματικές Πεπερασμένα Αυτόματα Κανονικές Εκφράσεις

ΣΥΝΤΑΚΤΙΚΟΙ ΟΡΟΙ. Η σύνταξη μιας πρότασης

1.1 A. ΟΙ ΠΡΑΓΜΑΤΙΚΟΙ ΑΡΙΘΜΟΙ ΚΑΙ ΟΙ

ΣΕΤ ΑΣΚΗΣΕΩΝ 4. Προθεσµία: 8/1/12, 22:00

Επιλογή και επανάληψη. Λογική έκφραση ή συνθήκη

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής.

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος.

Ασκήσεις μελέτης της ενότητας «Συντακτική Ανάλυση»

Κανόνες παραγώγισης ( )

Το θεώρηµα πεπλεγµένων συναρτήσεων

Πώς είναι δυνατόν να είναι ισοδύναµες οι εξισώσεις που αναφέρονται στο ερώτηµα ii, αφού δεν έχουν το ίδιο πεδίο ορισµού 2 ;

char name[5]; /* define a string of characters */

o AND o IF o SUMPRODUCT

Συνεκτικά σύνολα. R είναι συνεκτικά σύνολα.

Ισότητα, Αλγεβρικές και Αναλυτικές Ιδιότητες Πραγματικών Ακολουθιών

Ο ΕΥΚΛΕΙ ΕΙΟΣ ΧΩΡΟΣ. Το εσωτερικό γινόµενο

ΚΕΦΑΛΑΙΟ 7 ΕΙ Η, ΤΕΧΝΙΚΕΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΑ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ

Παράρτηµα Β. Στοιχεία Θεωρίας Τελεστών και Συναρτησιακής Ανάλυσης [ ) ( )

HY118- ιακριτά Μαθηµατικά

ΕισαγωγήστουςΗ/Υ. PHP Hypertext Preprocessor

Συστήματα κ Τεχνολογίες Γνώσης Εργασίες στην Επεξεργασία Φυσικής Γλώσσας

Θέματα υπολογισμού στον πολιτισμό

Δοµές Δεδοµένων και Αλγόριθµοι - Εισαγωγή

KΕΦΑΛΑΙΟ 5 ΨΗΦΙΑΚΕΣ ΥΠΟΓΡΑΦΕΣ

Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ

Κεφάλαιο 3 ΠΑΡΑΓΩΓΟΣ. 3.1 Η έννοια της παραγώγου. y = f(x) f(x 0 ), = f(x 0 + x) f(x 0 )

Κλάσεις και Αντικείµενα

HY118- ιακριτά Μαθηµατικά

5.1 ΣΥΝΟΛΑ. 2. Παράσταση συνόλου. 3. Εποπτική παράσταση συνόλου : Γίνεται µε το διάγραµµα Venn, δηλαδή µε

Συµπληρωµατικές σηµειώσεις για τον «Επιστηµονικό Υπολογισµό» Χειµερινό εξάµηνο Τµήµα Μαθηµατικών, Πανεπιστήµιο Αιγαίου

ΑΝΤΙΜΕΤΑΘΕΤΙΚΗ ΑΛΓΕΒΡΑ ΕΑΡΙΝΟ ΕΞΑΜΗΝΟ, 2013 ΣΗΜΕΙΩΣΕΙΣ ΧΑΡΑ ΧΑΡΑΛΑΜΠΟΥΣ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ, ΑΠΘ

Το θεώρηµα αντίστροφης απεικόνισης. ) και ακόµη ότι η g f 1 1. g y

- Αναπαράσταση ακέραιας τιµής : - Εύρος ακεραίων : - Ακέραιοι τύποι: - Πράξεις µε ακεραίους (DIV - MOD)

Transcript:

ΚΕΦΑΛΑΙΟ 4 Ενοποιητική Γραµµατική 4.1. Γενικά Από τους πιο διαδεδοµένους φορµαλισµούς για την παράσταση γλωσσικής πληροφορίας είναι οι Ενοποιητικές Γραµµατικές κι ανάµεσά τους ο πιο απλός είναι ο φορµαλισµός της Ενοποιητικής Γραµµατικής Patr II. Ο φορµαλισµός αυτός αναπτύχθηκε στο SRI International και υπακούει στους περιορισµούς: Συµπαράθεση (concatenation) ως τη µόνη πράξη συνδυασµού συµβολοακολουθιών, και Ενοποίηση (unification) ως τη µόνη πράξη συνδυασµού πληροφορίας. Οι Γραµµατικές Ορισµένης Φράσης (ΓΟΦ) χρησιµοποιούν όρους, που µοιάζουν µε τους όρους της λογικής, για να παραστήσουν τα γλωσσικά αντικείµενα. Η σηµασία των όρων αυτών και των αντίστοιχων µεταβλητών εξαρτάται από τη θέση τους και όχι από το όνοµά τους. Έτσι, τα κατηγορήµατα (1) και (2), στο ακόλουθο παράδειγµα, είναι ισοδύναµα. (1) noun (Agr, Case, Gend). (2) noun ( _, _, _ ). (3) noun (agr(sg,3), nom, masc). Σηµείωση: στην Prolog τα ονόµατα των µεταβλητών είναι χρήσιµα για να ορίσουν την ταυτότητα κάποιου στιγµιότυπου, αλλά όχι για να ορίσουν κάποια οντολογία. np ( agr(num,pers), Case ) det ( agr(num,pers), Case, Gend ), adj ( agr(num,pers), Case,Gend ), n ( agr(num,pers), Case, Gend ). Οι γλωσσολόγοι αναλύουν τη γλώσσα µε βάση κάποια οντολογία, έχουν δηλαδή κατηγορίες όπως αριθµός, πτώση, γένος, πρόσωπο κλπ. Οι δοµές ιδιοτήτων επιτρέπουν την έκφραση των στοιχείων της οντολογίας αυτής. γ. µαΐστρος - σ. µαρκαντωνάτου 30

Παράδειγµα: (4) f1 cat: noun agr: f2 num: sg pers: 3 case: nom gend: masc 4.2. Ιδιότητες - Τιµές Οι φορµαλισµοί που βασίζονται στην ενοποίηση χρησιµοποιούν ως πεδίο πληροφορίας (informational domain) σύστηµα βασισµένο στις ιδιότητες (features) και τις τιµές (values) τους. Τα στοιχεία αυτού του πεδίου ονοµάζονται δοµές ιδιοτήτων. Χρησιµοποιούνται διαφορετικά ονόµατα στις διάφορες εργασίες: λειτουργικές δοµές (functional structures) (LFG), συλλογή ιδιοτήτων, πίνακας ιδιοτήτων ή κατηγοριών (GPSG), συναρτησιακές δοµές (FUG), όροι (DCG), κατευθυνόµενοι ακυκλικοί γράφοι ( στον φορµαλισµό Patr II). Ο κοινός συµβολισµός της δοµής ιδιοτήτων γίνεται µε τα άγκιστρα [ ]. Παράδειγµα: αριθµός : ενικός πρόσωπο : τρίτο Στους φορµαλισµούς που βασίζονται στην ενοποίηση είναι χαρακτηριστικό ότι και οι ίδιες οι τιµές των ιδιοτήτων µπορεί να είναι δοµηµένες (σύνθετες δοµές). Για παράδειγµα, η πιο πάνω δοµή µπορεί να είναι ένα συστατικό (µε όνοµα συµφωνία ) µιας άλλης δοµής: Παραδείγµατα συνθέτων δοµών: κατηγορία: ΟΦ συµφωνία:: αριθµός : ενικός πρόσωπο : τρίτο γ. µαΐστρος - σ. µαρκαντωνάτου 31

(5) f1 cat: noun agr: f2 num: sg pers: 3 case: nom gend: masc Το τελευταίο σηµαντικό χαρακτηριστικό των δοµών ιδιοτήτων είναι η ιδιότητα της σύγκλισης (reentrancy) κατά την οποία δύο ιδιότητες σε µια δοµή µπορεί να συµµερίζονται την ίδια τιµή. Πρέπει να ξεχωρίζουµε προσεκτικά τις δύο ιδιότητες µε µία τιµή από τις δύο ιδιότητες µε παρόµοια τιµή (πρβλ. πιο κάτω). 4. 2. 1. οµές Ιδιοτήτων Ορισµός: Οι δοµές ιδιοτήτων είναι µερικές συναρτήσεις από το σύνολο των ιδιοτήτων ή κατηγοριών ή κατηγορηµάτων (attributes) ή χαρακτηριστικών στο σύνολο που ορίζεται από την ένωση του συνόλου των ατοµικών τιµών (atomic values) µε το σύνολο των δοµών ιδιοτήτων. Θεωρώντας τη σύνθετη δοµή του παραδείγµατος (5): Το σύνολο ιδιοτήτων της δοµής f1 είναι: { cat, agr, case, gend } (Σηµειώνουµε ότι δεν έχει σηµασία η σειρά.) Το σύνολο τιµών της δοµής f1 είναι: { noun, f2, nom, masc }, και της δοµής f2: {sg, 3} Ορισµός: Μονοπάτι (path) σε µια δοµή είναι µια ακολουθία ιδιοτήτων που συµβολίζεται µέσα σε γωνιακές παρενθέσεις: <ιδιότητα τιµή> (π.χ.: <agreement number>). Το σύνολο των µονοπατιών (paths) είναι το σύνολο των ακολουθιών που µπορούν να σχηµατιστούν από το σύνολο των ιδιοτήτων της δοµής. Έτσι, το σύνολο µονοπατιών της δοµής f1 (5) είναι: { <cat >, <case >, <gend >, <agr num>, <agr mers> } Οι δοµές ιδιοτήτων µπορεί να είναι σύνθετες (complex) ή ατοµικές (atomic). Οι σύνθετες δοµές µπορεί να θεωρηθούν (όπως είπαµε) ως µερικές συναρτήσεις από ιδιότητες σε τιµές (που κι αυτές είναι ιδιότητες). γ. µαΐστρος - σ. µαρκαντωνάτου 32

Ο συµβολισµός D(f) υποδηλώνει την τιµή που συσχετίζεται µε την ιδιότητα f στη δοµή ιδιοτήτων D, π.χ.: D(number) = third. Παρόµοια, µπορούµε να αναφερθούµε στο πεδίο (domain) µιας δοµής ιδιοτήτων D µε τον συµβολισµό: dom(d) (π.χ.: dom(d) = {number, person} ). Μια δοµή µε κενό πεδίο συχνά ονοµάζεται κενή δοµή ή µεταβλητή. Οι µεταβλητές προφανώς συµβολίζονται [ ]. 4.2.1. Eρώτηση Έχει σηµασία η θέση των ζευγών χαρακτηριστικό-τιµή µέσα σε µια δοµή χαρακτηριστικών; 4. 2. 2. Σύγκλιση ( reentrancy) Στο παράδειγµα (6), που ακολουθεί, έχουµε ταυτότητα στιγµιοτύπου (token), δηλαδή το στιγµιότυπο είναι ένα. Στο παράδειγµα (7) έχουµε ταυτότητα τύπου, δηλαδή δύο διακριτές τιµές (στιγµιότυπα) ίδιου τύπου. (6) cat: vp (7) cat: vp agr: 1 num: sg agr: num: sg pers: 3 pers: 3 head: cat: v head: cat: v agr: 1 agr: num: sg pers: 3 Ο συµβολισµός που χρησιµοποιείται για να υποδηλώσει την ταυτότητα του στιγµιοτύπου είναι ένα τετραγωνάκι µε τον αριθµό ταυτότητας ( π.χ.: 1 ) 4. 2. 2. Eρωτήσεις 1. Τι είδους ταυτότητα έχουµε στις πιό κάτω προτάσεις (ι) Ο Χάρης είδε τον εαυτό του στον καθρέφτη. (ιι) Ο Χάρης είδε τον Χάρη στον καθρέφτη. 2. Τί είδους ταυτότητα εκφράζουν οι πιο κάτω όροι της Prolog: f (X, alpha, X). Έστω ότι η τιµή beta(gamma) αποδίδεται στην µεταβλητή Χ. Τι είδους ταυτότητα έχουµε; f (beta(gamma), alpha, beta(gamma) ). Σηµείωση: Ποια διαφορά βλέπετε ανάµεσα στους όρους και στις δοµές ιδιοτήτων; γ. µαΐστρος - σ. µαρκαντωνάτου 33

4. 2. 3. Τυποποίηση (Typing) cat: noun (8) agr: num: sg pers: 3 case: nom gend: masc tense: present Η δοµή (8) είναι µαθηµατικά ορθή σύµφωνα µε τον τρόπο που ορίσαµε τις δοµές χαρακτηριστικών - τιµών. Γλωσσολογικά όµως είναι απαράδεκτη (τουλάχιστον για τα Ελληνικά και τα Αγγλικά). Ως µαθηµατικά ορθή, όµως, θα µπορούσε να προκύψει σε οποιαδήποτε φάση της επεξεργασίας χωρίς να ενοχληθεί το υπολογιστικό σύστηµα που την υλοποιεί. Αυτό δεν είναι δυνατόν να συµβεί µε τους όρους που έχουν ορισµένο πλήθος συστατικών. Μία λύση θα ήταν να τυποποιηθούν οι δοµές ιδιοτήτων, ώστε να καθοριστεί ακριβώς και ο αριθµός και το είδος των ιδιοτήτων και των τιµών τους. 4. 2. 4. Εγκλεισµός (subsumption) Ορισµός: Μια δοµή χαρακτηριστικών Α εγκλείεται (subsumed) από µία δοµή ιδιοτήτων Β αν όλες οι ιδιότητες και τα µονοπάτια της Α υπάρχουν και στην Β. Επίσης: Κάθε ιδιότητα ή µονοπάτι της Α έχει την ίδια τιµή στην Α και στην Β αν οι τιµές τους είναι ατοµικές. Στην περίπτωση που οι τιµές τους είναι δοµές ιδιοτήτων, έστω Α1 και Β1 αντιστοίχως, τότε η Α1 εγκλείεται από την Β1. Όλες οι συγκλίσεις που υπάρχουν στην Α υπάρχουν και στην Β. Λέµε ότι µια πιο γενική δοµή περιέχει λιγότερη πληροφορία από µια άλλη ή ότι την εγκλείει. Μία ατοµική τιµή δεν εγκλείει ούτε εγκλείεται από άλλη ατοµική τιµή. Οι µεταβλητές εγκλείουν όλες τις άλλες δοµές ιδιοτήτων, ατοµικές και σύνθετες, επειδή αποτελούν την δοµή µε τη µικρότερη πληροφορία. Με τον εγκλεισµό µπορούµε να διατάξουµε τις δοµές ιδιοτήτων: γ. µαΐστρος - σ. µαρκαντωνάτου 34

1 D var 2 cat : NP D NP D NPsg 3 cat : NP agreement : number : sg 4 cat : NP agreement : number : sg person : 3rd D NPsg3 5 cat : NP agreement : number : sg person : 3rd D NPsg3Subj subject : number : sg person : 3rd 6 cat : NP D NPsg3Subj agreement : 1 number : sg person : 3rd subject : 1 Η διάταξη των πιο πάνω δοµών ιδιοτήτων είναι: ( 9 ) D var D NP D NPsg D NPsg3 D NPsg3Subj D NPsg3Subj Σηµείωση: Το σύµβολο υποδηλώνει τον εγκλεισµό. γ. µαΐστρος - σ. µαρκαντωνάτου 35

4. 2. 5. Ενοποίηση (Unification) και Γενίκευση (Generalisation) Ορισµός: Ενοποίηση δύο δοµών ιδιοτήτων είναι η µικρότερη δοµή ιδιοτήτων που εγκλείει και τις δύο. Ορισµός: Γενίκευση δύο δοµών ιδιοτήτων είναι η µεγαλύτερη δοµή χαρακτηριστικών που εγκλείεται και από τις δύο. Η ενοποίηση, εάν ερµηνευθεί ως πράξη (operation) επί των δοµών ιδιοτήτων, όταν είναι µη καταστροφική, παίρνει δύο δοµές ιδιοτήτων και απ αυτές κατασκευάζει µια τρίτη δοµή, την ενοποίησή τους. Όταν είναι καταστροφική, όπως στην Prolog, παίρνει δύο δοµές και τις αντικαθιστά µε την ενοποίησή τους. Η ενοποίηση, ως πράξη, είναι ανεξάρτητη σειράς εκτέλεσης. Aπό άποψη υπολογιστική οι όροι πλεονεκτούν σε ταχύτητα, γιαυτό και προτιµήθηκαν στην Prolog. 4. 3. Ενοποιητικές Γραµµατικές Η Ενοποιητικές Γραµµατικές είναι σύνολο Συµφραστικώς Ανεξάρτητων Κανόνων σχολιασµένων µε δοµές ιδιοτήτων. Τα σχόλια εκφράζουν περιορισµούς τους οποίους πρέπει να ικανοποιούν οι συµβολοακολουθίες που γίνονται αποδεκτές ως γραµµατικές προτάσεις. ηλαδή τα σχόλια εµποδίζουν την υπερπαραγωγή (overgeneration). (10) S NP VP num: Number num: Number person: Person person: Person case: nom tense: Tense (11) NP DET NOUN num: Num num: Num num: Num person: Person person: Person person: Person case: Case gender: Gen gender: Gen case: Case case: Case (12) DET η num: sg person: 3 gender: fm NOUN γάτα num: sg person: 3 gender: fm case: _ γ. µαΐστρος - σ. µαρκαντωνάτου 36

Ουσιαστικά όλη η πληροφορία βρίσκεται στο λεξικό (12) και διοχετεύεται (percolates) στις ιεραρχικά ανώτερες δοµές έτσι όπως καθορίζουν οι κανόνες (10) και (11). Καθοδόν συγκρητίζεται (merges) µε την πληροφορία που είναι συναρτηµένη µε τους κανόνες. 4. 3. Ερωτήσεις (α) ώστε τους κανόνες που ορίζουν VP µε αµετάβατο και µεταβατικό ρήµα. (β) Περιγράψτε πώς λειτουργεί η γραµµατική (γ) Πώς παίρνει τιµή το χαρακτηριστικό case. Στο παράδειγµα (8) χρησιµοποιούµε το συµβολισµό της PROLOG για να δείξουµε ότι οι τιµές ορισµένων µονοπατιών είναι ίδιες. Θα µπορούσαµε να χρησιµοποιήσουµε την έννοια της σύγκλισης και γιατί; 4. 4. Συµβολισµός PATR ΙΙ Ο συµβολισµός PATR ΙΙ προτάθηκε από τον Shieber το 1986 για να αντιµετωπιστούν προβλήµατα σαν και αυτά που φάνηκαν στις ασκήσεις 3.2 και 3.3 καθώς και για να υπάρξει ένα θεωρητικώς ανεξάρτητος συµβολισµός χρήσιµος για την κωδικοποίηση οποιασδήποτε ενοποιητικής γραµµατικής µε συµφραστικώς ανεξάρτητο σκελετό. Παραθέτουµε παράδειγµα ενός κανόνα σε συµβολισµό Patr II. (13) S NP VP <NP num > = < VP num > <NP person> = < VP person> <NP case> = nom <VP tense> = past 4. 4. Eρωτήσεις Μεταγράψτε τον ακόλουθο κανόνα σε PATR ΙΙ. NP DET NOUN [agr: 1 [case: nom]] [agr: 1 ] γ. µαΐστρος - σ. µαρκαντωνάτου 37

Βιβλιογραφία Ο Covington (1994) προσφέρει µια βατή εισαγωγή λίγο στο Αµερικάνικο εκπαιδευτικό ύφος. Εαν ενδιαφέρεστε για µια πιο σε βάθος περιγραφή και για περεταίρω προγράµµατα δείτε τους Gazdar and Mellish (1989) --- οι οποίοι όµως γράφουν σε Αγγλικό ύφος και είναι και πρωτοπόροι στο είδος (ίσως, λίγο δυσνόητοι). Για µια καλή εισαγωγή στις Ενοποιητικές Γραµµατικές δείτε τους Sag and Wasow. Για το PATR καθώς και για µια διεξοδική τυπική περιγραφή και κριτική των ενοποιητικών γραµµατικών της εποχής του δείτε τον Shieber (1986)---το βιβλίο δεν έχει χάσει ακόµη την επικαιρότητά του. Michael A. Convington. 1994. Natural Language Processing for Prolog Programmers. Prentice Hall: New Jersey, USA Gerald Gazdar and Chris Mellish. 1989. Natural Language Processing in Prolog: an introduction to computational linguistics. Wokingham: Addison-Wesley. Ivan A. Sag and Thomas Wasow. Syntactic Theory: A Formal Introduction. CSLI Publications, Leland Stanford Junior University (Partial Draft of September, 1997 (you can possibly download it from Stanford). Stuart M. Shieber. 1986. An Introduction to Unification Based Approaches to Grammar. Chicago: Chicago University Press. γ. µαΐστρος - σ. µαρκαντωνάτου 38