Γλωσσική Τεχνολογία 5 η Ενότητα: Ανάλυση πραγματείας 2014 15 Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/in/ 1
Οι διαφάνειες αυτές βασίζονται στην ύλη του βιβλίου Speech and Language Prcessing των D. Jurafsky και J.H. Martin, 2 η έκδοση, Pearsn Educatin, 2009. 2
Τι θα ακούσετε Συνοχή κειμένων και κατάτμηση πραγματείας. Αλγόριθμος TextTiling. Κατάτμηση με μηχανική μάθηση. Αξιολόγηση κατάτμησης. Καθολική συνεκτικότητα κειμένων. Σχέσεις συνεκτικότητας και θεωρία ρητορικής δομής. Παραγωγή δέντρων ρητορικής δομής. Αναφορικές εκφράσεις. Είδη αναφορικών εκφράσεων και επίλυσή τους με μηχανική μάθηση. Τοπική συνεκτικότητα κειμένων. Θεωρία επικέντρωσης και χρήση της στην επίλυση αναφορικών εκφράσεων. 3
Ανάλυση πραγματείας (discurse) Μελετάμε τις σχέσεις μεταξύ των προτάσεων (ή τμημάτων τους) ενός μονολόγου ή διαλόγου. Στην ενότητα αυτή θα εστιαστούμε κυρίως σε μονολόγους. Μελετάμε π.χ. τη συνεκτικότητα (cherence) των κειμένων. «Η Μαρία έκρυψε τα κλειδιά της μηχανής του Γιάννη. Ήταν μεθυσμένος.» (;) «Η Μαρία έκρυψε τα κλειδιά της μηχανής του Γιάννη. Της αρέσει το σπανάκι.» Στην 1 η περίπτωση μπορούμε πιο εύκολα να καταλάβουμε πώς σχετίζονται οι δύο προτάσεις (σχέση αιτιολόγησης). Μελετάμε επίσης αναφορικές εκφράσεις. «Πρόεδρος της Εταιρείας Γλωσσικής Τεχνολογίας ανέλαβε η κ. Μαρία Παπαδοπούλου. Η κ. Παπαδοπούλου δήλωσε ευτυχής. Υποσχέθηκε [ποιος;] ότι η εταιρεία θα επιστρέψει στην κερδοφορία. Η ΕΓΤ σημειώνει ζημίες εδώ και τρία χρόνια.»
Κατάτμηση πραγματείας Σε πολλά κείμενα υπάρχουν σημεία όπου αλλάζει το θέμα (ή το υπο-θέμα), τα οποία ίσως χρειάζεται να εντοπίσουμε. Αυτόματη κατάτμηση απομαγνητοφωνήσεων συναντήσεων. Κείμενο εφημερίδας που περιγράφει περισσότερα από ένα γεγονότα. Σε μια περίληψη, θέλουμε να περιλάβουμε προτάσεις για όλα τα γεγονότα του κειμένου. Βοηθάει η μελέτη της συνοχής (chesin) του κειμένου. Η συνοχή (όχι συνεκτικότητα) μεταξύ προτάσεων επιτυγχάνεται μέσω της επανάληψης των ίδιων ή σχετικών λέξεων (π.χ. συνώνυμα, υπερώνυμα), συν-αναφορικών εκφράσεων κλπ. «Ο Γιάννης καθάρισε την καμινάδα. Δεν ήθελε [ο Γιάννης] άλλα προβλήματα με το τζάκι.» Όσο έχουμε μεγάλη συνοχή, μάλλον δεν αλλάζει το θέμα.
Αλγόριθμος TextTiling (Hearst 1997) 1 ο στάδιο: λεκτικές μονάδες (tkens), αφαίρεση συχνών λέξεων (stp-list), αποκοπή καταλήξεων (stemming), κατάτμηση σε τμήματα των 20 χαρακτήρων («πλακίδια»). 2 ο στάδιο: υπολογισμός μέτρου ομοιότητας μεταξύ κάθε δύο συνεχόμενων πλακιδίων. Κάθε πλακίδιο παριστάνεται ως ένα διάνυσμα. Κάθε συνιστώσα του διανύσματος είναι η συχνότητα μιας λέξης. Ομοιότητα δύο πλακιδίων: το μέτρο συνημιτόνου τους. Μπορούμε να χρησιμοποιήσουμε και TF-IDF ή μέτρα σημασιολογικής συνάφειας (ενότητα 4) ή/και να λάβουμε υπόψη μας την ύπαρξη συν-αναφορών (βλ. παρακάτω). 3 ο στάδιο: εντοπισμός σημείων αλλαγής θέματος. Σημεία (μεταξύ διαδοχικών πλακιδίων) όπου πέφτει απότομα η ομοιότητα.
Ομοιότητα διαδοχικών πλακιδίων ομοιότητα 3 ο στάδιο: εντοπισμός σημείων αλλαγής θέματος. Μετράμε την πτώση y i 1 y i + (y i+1 y i ) από τις δύο γειτονικές κορυφές. 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 t1 t t2 t2 t t3 t3 t t4 t4 t t5 t5 t t6 t6 t t7 t7 t t8 t8 t t9 Υπερβαίνει π.χ. τη μέση πτώση συν μία διασπορά; Εναλλακτικά: ομαδοποίηση (clustering) πλακιδίων.
Κατάτμηση με επιβλεπόμενη μάθηση Εναλλακτικά: κατάτμηση πραγματείας ως πρόβλημα κατάταξης με επιβλεπόμενη μάθηση. Αντικείμενα προς κατάταξη: τα τέλη των προτάσεων. Κατηγορίες: αλλαγή ή όχι θέματος. Ιδιότητες: ομοιότητα μεταξύ προτάσεων (ενδεχομένως μετρημένη με πολλαπλά μέτρα), ύπαρξη ή όχι συγκεκριμένων λέξεων ή φράσεων (όπως στην κατάταξη κειμένων) κλπ. Συχνά βοηθάει ο εντοπισμός χαρακτηριστικών λέξεων ή φράσεων (discurse markers, cue phrases). «Καλησπέρα», «Μαζί μας τώρα ο», «Μείνετε μαζί μας». Μπορούμε να μάθουμε τέτοιες λέξεις/φράσεις με μεθόδους επιλογής ιδιοτήτων (π.χ. πληροφοριακό κέρδος).
Αξιολόγηση κατάτμησης πραγματείας Η ορθότητα, ανάκληση, ακρίβεια δεν ενδείκνυνται, γιατί τιμωρούν εξίσου μια μετατόπιση σημείου αλλαγής θέματος με μια πλήρη παράλειψη τέτοιου σημείου. αλλαγές που σημείωσε άνθρωπος αλλαγές που σημείωσε το σύστημα Σέρνουμε ένα παράθυρο από αριστερά προς τα δεξιά. Για κάθε θέση i του παραθύρου, εξετάζουμε τις αλλαγές μέσα στο παράθυρο: b i = αλλαγές ανθρώπου αλλαγές συστήματος WindwDiff = i b i Μήκος παραθύρου: π.χ. το μισό του μέσου τμήματος του ανθρώπου.
Συνεκτικότητα (cherence) Οι προτάσεις (ή και φράσεις) ενός κειμένου συνδέονται με σχέσεις συνεκτικότητας (ή «ρητορικές σχέσεις»). Έχουν προταθεί πολλά σύνολα σχέσεων. Οι σχέσεις του Hbbs (1979) συμπεριλαμβάνουν: Αποτέλεσμα (result): «Άρχισε να βρέχει. Το ρομπότ βραχυκύκλωσε.» Εξήγηση (explanatin): «Η Μαρία έκρυψε τα κλειδιά της μηχανής του Γιάννη. Ήταν μεθυσμένος.» Παραλληλισμός (parallel): «Ο Γιώργος ήθελε μια μπύρα. Η Μαρία ήθελε τσάι.» Επέκταση (elabrate): «Ο Γιώργος είναι από την Κύπρο. Μεγάλωσε στη Λευκωσία.»
Δέντρα με σχέσεις συνεκτικότητας Explanatin(S1) S1: Ο Γιάννης πήγε στο κατάστημα αυτοκινήτων του Βασίλη. S2: Ήθελε να αγοράσει ένα αυτοκίνητο. Explanatin(S2) Parallel(S2, S4) S4: Ήθελε να δει και πώς τα πηγαίνει ο Βασίλης με την κρίση της αγοράς. S3: Δεν πηγαίνει κανένα λεωφορείο στη νέα του δουλειά. Οι σχέσεις συνεκτικότητας συνθέτουν ένα δέντρο. Παρόμοιο με τα συντακτικά δέντρα των προτάσεων. Στις πιο πολλές σχέσεις, ένα παιδί είναι το κύριο. Αλλά σε μερικές σχέσεις (π.χ. παραλληλισμός) και τα δύο παιδιά είναι εξίσου σημαντικά.
Θεωρία ρητορικής δομής Ιδιαίτερα γνωστές είναι οι «ρητορικές σχέσεις» της θεωρίας ρητορικής δομής (RST, Mann & Thmpsn 1987). Περιλαμβάνουν μεταξύ άλλων: Μαρτυρία (evidence): «Ο Γιάννης είναι στο σπίτι του. Το αυτοκίνητό του είναι παρκαρισμένο απ έξω.» Επέκταση (elabratin): «Ο Γιώργος είναι από την Κύπρο. Μεγάλωσε στη Λευκωσία.» Αντίθεση (cntrast): «Ο Γιώργος ήταν χαρούμενος. Η Μαρία ήταν λυπημένη.» Υπόβαθρο (backgrund): «Η Μαρία πήγε στο σπίτι του Γιώργου. Είχαν τσακωθεί το πρωί.» Ακολουθία (sequence): «Η Μαρία πήγε στο σπίτι του Γιώργου. Χτύπησε την πόρτα.»
Δέντρο ρητορικής δομής S1 S6 sequence backgrund S1 S3 S2 S3 S2: Ήταν στεναχωρημένη. (όχι ακριβώς ) cause S3: Είχαν τσακωθεί το πρωί. S1: Η Μαρία πήγε στο σπίτι του Γιώργου. S5 S6 evidence backgrund S4 S6 S4: Χτύπησε την πόρτα. πυρήνας (nucleus) δορυφόρος (satellite) S5: Ήξερε ότι ο Γιώργος ήταν μέσα. S6: Το αυτοκίνητό του ήταν παρκαρισμένο απ έξω.
Πώς παράγουμε τα δέντρα; Αναγνώριση «συνδέσμων» (cnnectives, cue phrases). «Περπάτησε ως την πόρτα. Κατόπιν χτύπησε το κουδούνι.» «Όλα τα πουλιά πετούν. Εξαίρεση αποτελούν οι πιγκουίνοι.» Κατάτμηση σε τμήματα πραγματείας (discurse segments). Τα τμήματα δεν είναι πάντα προτάσεις. «[Δεν του μιλούσε], [επειδή ήταν θυμωμένη]». Μπορούμε π.χ. να χρησιμοποιήσουμε κανονικές εκφράσεις. Χρήσιμα και τα συντακτικά δέντρα των προτάσεων. Αναγνώριση σχέσεων μεταξύ τμημάτων. Οι σύνδεσμοι είναι συχνά αμφίσημοι. «[Ήξερε ότι ο Γιώργος ήταν μέσα], [επειδή (evidence) το αυτοκίνητό του ήταν απ έξω].» «[Δεν του μιλούσε], [επειδή (cause) ήταν θυμωμένη].» Για την αποσαφήνισή τους, μπορούμε να χρησιμοποιήσουμε ιδέες από την αποσαφήνιση εννοιών λέξεων.
Πώς παράγουμε τα δέντρα; (συνέχεια) Αναγνώριση σχέσεων μεταξύ τμημάτων. Μπορεί να μην υπάρχουν καν σύνδεσμοι! «Δεν του μιλούσε. Ήταν θυμωμένη.» «Ο Γιάννης ήθελε βουνό. Η Μαρία ήθελε θάλασσα.» Χρήση επιβλεπόμενης μάθησης. Εντοπίζουμε σε ένα σώμα κειμένων προτάσεις συνδεόμενες με συνδέσμους. Σημειώνουμε χειρωνακτικά τις σχέσεις. Εκπαιδεύουμε έναν ταξινομητή, ώστε να μαντεύει τις σχέσεις μεταξύ προτάσεων όταν υπάρχουν σύνδεσμοι. Αφαιρούμε τους συνδέσμους από τα παραδείγματα εκπαίδευσης. Εκπαιδεύουμε ταξινομητή που να μαντεύει σχέσεις προτάσεων και όταν δεν υπάρχουν σύνδεσμοι. Επεκτείνουμε το σύστημα για μικρότερα τμήματα Βλ. J&M για ιδέες ιδιοτήτων. Γενικά δύσκολο πρόβλημα
Αναφορικές εκφράσεις Οι αναφορικές εκφράσεις (referring expressins) αναφέρονται κυρίως σε οντότητες του κόσμου. Πρόεδρος της Εταιρείας Γλωσσικής Τεχνολογίας ανέλαβε η κ. Μαρία Παπαδοπούλου. Η κ. Παπαδοπούλου δήλωσε ευτυχής. Υποσχέθηκε [ποιος;] ότι η εταιρεία θα επιστρέψει στην κερδοφορία. Η ΕΓΤ σημειώνει ζημίες εδώ και τρία χρόνια. Αλυσίδες συν-αναφορών (creference chains): {«της Εταιρείας Γλωσσικής Τεχνολογίας», «η εταιρεία», «η ΕΓΤ»}, {«η κ. Μαρία Παπαδοπούλου», «η κ. Παπαδοπούλου», [ποιος;]}. Στα Αγγλικά τα «anaphra» και «cataphra» χρησιμοποιούνται όταν μια έκφραση αναφέρεται σε κάτι στο οποίο αναφέρεται και μια προηγούμενη ή επόμενη, αντίστοιχα, έκφραση. Αλλά και σε αφηρημένες οντότητες, γεγονότα κλπ. «Αυτή ήταν μια υπερ-αισιόδοξη δήλωση.»
Είδη αναφορικών εκφράσεων συνέχεια Αόριστες ονοματικές φράσεις (indefinite NPs). «Ο Γιάννης αγόρασε ένα αυτοκίνητο». Θεωρείται ότι εισάγουν (evke) μια οντότητα στο μοντέλο της πραγματείας του ακροατή. Μπορεί να αναφέρονται σε συγκεκριμένη οντότητα ή σε κατηγορία οντοτήτων ή γενικευμένο εκπρόσωπο. «Ήθελε να αγοράσει ένα αυτοκίνητο.» «Ήθελε να αγοράσει ένα αυτοκίνητο που είδε στην έκθεση.» Οριστικές ονοματικές φράσεις (definite NPs). «Έδειξε χθες το αυτοκίνητο στη (σε τη) Μαρία.» Θεωρείται ότι ο ακροατής ανασύρει (access) την αντίστοιχη οντότητα από το μοντέλο της πραγματείας. Κύρια ονόματα. Είτε εισάγουν είτε ανασύρουν. «Η Μαρία ενθουσιάστηκε.»
Είδη αναφορικών εκφράσεων συνέχεια Αντωνυμίες αλλά και κενές αναφορικές εκφράσεις. «Της έδειξε [ποιος;] το αυτοκίνητο. Εκείνη ενθουσιάστηκε.» Μπορούν να αναφερθούν μόνο σε πρόσφατες οντότητες. «Ο Γιάννης αγόρασε ένα αυτοκίνητο. Το έδειξε στη Μαρία. Η Μαρία ενθουσιάστηκε. Έφτιαξε μακαρονάδα. Κατόπιν τον κέρασε καφέ. Συζήτησαν για πολύ ώρα. Μετά πήγαν να το (;) φωτογραφίσουν / να φωτογραφίσουν το αυτοκίνητο.» Οι αντωνυμίες μπορούν να παίξουν και ρόλο μεταβλητών ποσοδεικτών (π.χ. «Κάθε ντάμα να σηκώσει το χέρι της»). Στα αγγλικά μερικές αντωνυμίες είναι πλεοναστικές («It rains», «It was Jhn wh bught the car»). Δεικτικές αντωνυμίες ή εκφράσεις. «Θέλω εκείνο/αυτό (το αυτοκίνητο)» (μακρινό/κοντινό). Στα Αγγλικά «demnstrative». Το «deictic» σημαίνει εκφράσεις των οποίων η σημασία εξαρτάται από το περιβάλλον (π.χ. «nw», «here»).
Επίλυση (reslutin) αναφορικών εκφράσεων Σε ποια οντότητα (προηγούμενη ή επόμενη) αναφέρεται μια αναφορική έκφραση; Μερικά συνήθως εύκολα και σίγουρα κριτήρια: Συμφωνία γένους, αριθμού, πτώσης. Δείτε στους J&M και τα περί «binding thery» στα Αγγλικά. Π.χ. «Jhn said that Bill bught him/himself a new car». Προτιμήσεις, δυσκολότερο να υπολογιστούν: Απόσταση: «Ο Γιάννης βρήκε έναν παλιό χάρτη στη ντουλάπα. Η Μαρία βρήκε έναν ακόμα παλιότερο στο μπαούλο. Έδειχνε [της Μαρίας] τη θέση ενός θησαυρού.» Περιορισμοί επιλογής ή/και γνώση του κόσμου: «Ο Γιάννης πήγε το αυτοκίνητο στο συνεργείο. Το άφησε για επισκευή.»
Επίλυση αναφορικών εκφράσεων συνέχεια Προτιμήσεις, δυσκολότερο να υπολογιστούν (συνέχεια): Παραλληλισμός: «Η Άννα πήγε με τη Μαρία για χορό. Η Ελένη πήγε μαζί της για ψώνια.» Συντακτικός ρόλος υποψηφίου: «Ο Γιάννης πήγε σε ένα μπαρ με το Νίκο. Ζήτησε [ποιος;] μια μπύρα.» Για επίλυση αγγλικών αντωνυμιών, πολύ γνωστός είναι ο αλγόριθμος του Hbbs (βλ. J&M). Εξετάζει και τα συντακτικά δέντρα της τρέχουσας και προηγούμενων προτάσεων. Συχνό baseline. Μπορούμε να χρησιμοποιήσουμε επιβλεπόμενη μάθηση. Ένα διάνυσμα για κάθε ζεύγος αναφορικών εκφράσεων. Ιδιότητες για τις παραπάνω προτιμήσεις συν π.χ. απόσταση διόρθωσης (για κύρια ονόματα), τύπος (πρόσωπο, εταιρεία, τοποθεσία), ιδιότητες από τη Θεωρία Επικέντρωσης (βλ. παρακάτω).
Θεωρία Επικέντρωσης (Centering Thery) Κάθε πρόταση (ή άλλο τμήμα) u n έχει ένα σύνολο C f (u n ) προς τα εμπρός κέντρων προσοχής (frward-lking centers). Κάθε μέλος του C f (u n ) είναι μια οντότητα του μοντέλου πραγματείας και εκφράζεται με ένα NP της u n. Αυτός ο αρύβαλλος βρέθηκε στη Δήλο. Ανάλογα με τους συντακτικούς ρόλους των NP τους, τα μέλη του C f (u n ) είναι λιγότερο ή περισσότερο περίοπτα (salient). Υποκείμενο > άμεσο αντικείμενο > έμμεσο αντικείμενο > Το πιο περίοπτο μέλος του C f (u n ) είναι το προτιμητέο (preferred) κέντρο c p (u n ) της u n. Το πιο περίοπτο μέλος του C f (u n 1 ) που εκφράζεται και στην u n είναι το προς τα πίσω κέντρο c b (u n ) (backwardlking center) της u n. Αυτός ο αρύβαλλος κατασκευάστηκε την αρχαϊκή περίοδο. Η αρχαϊκή περίοδος καλύπτει το διάστημα 700 480 π.χ.
Μεταβάσεις μεταξύ προτάσεων Συνέχεια (cntinue): c p u n = c b u n = c b (u n 1 ) Το c b u n = c b (u n 1 ) θεωρούμε ότι ισχύει, όταν το c b (u n 1 ) δεν ορίζεται. Αυτός ο αρύβαλλος βρέθηκε στη Δήλο. (cntinue) [Αυτός ο αρύβαλλος] κατασκευάστηκε την αρχαϊκή περίοδο. (cntinue) [Αυτός ο αρύβαλλος] ακολουθεί το μελανόμορφο ρυθμό. Ομαλή μετατόπιση: c p u n = c b u n c b (u n 1 ) Αυτός ο αρύβαλλος βρέθηκε στη Δήλο. (cntinue) [Αυτός ο αρύβαλλος] κατασκευάστηκε την αρχαϊκή περίοδο. (smth shift) Η αρχαϊκή περίοδος καλύπτει το διάστημα 700 480 π.χ. Διατήρηση (retain): c p u n c b u n = c b (u n 1 ) Ανώμαλη μετατόπιση: c p u n c b u n c b (u n 1 )
Μεταβάσεις μεταξύ προτάσεων συνέχεια NOCB: Κανένα μέλος του C f (u n 1 ) δεν εκφράζεται στην u n. Αυτός ο αρύβαλλος βρέθηκε στη Δήλο. (cntinue) [Αυτός ο αρύβαλλος] κατασκευάστηκε την αρχαϊκή περίοδο. (smth shift) Η αρχαϊκή περίοδος καλύπτει το διάστημα 700 480 π.χ. (NOCB) Αυτός ο αρύβαλλος είναι μελανόμορφος. Προτιμήσεις: cntinue > retain > smth > rugh > NOCB Χρήσιμες κατά την επίλυση αναφορικών εκφράσεων (βλ. παρακάτω) αλλά και στην παραγωγή κειμένων. Όταν εξετάζουμε διαδοχικές προτάσεις μιλάμε για τοπική συνεκτικότητα (lcal ή entity-based cherence). Ενώ όταν εξετάζουμε ολόκληρο το κείμενο (π.χ. δέντρο RST) μιλάμε για καθολική συνεκτικότητα.
Επίλυση αναφορικών εκφράσεων με CT Κανόνας 1: Αν κάποιο μέλος του C f (u n 1 ) εκφράζεται στην u n ως αντωνυμία, τότε και το c b u n πρέπει να εκφράζεται στην u n ως αντωνυμία. Κανόνας 2: Κατά την επίλυση αναφορικών εκφράσεων προτιμούμε cntinue > retain > smth > rugh > NOCB. Έχοντας απορρίψει πρώτα ερμηνείες που παραβιάζουν τον κανόνα 1 ή περιορισμούς γένους, αριθμού, πτώσης. Παράδειγμα: u 1 : Ο Γιάννης είδε ένα αυτοκίνητο στο κατάστημα. u 2 : Το [ποιο;] έδειξε [ποιος;] στο Βασίλη. u 3 : Το αγόρασε [ποιος;].
Επίλυση αναφορικών εκφράσεων συνέχεια u 1 : Ο Γιάννης είδε ένα αυτοκίνητο στο κατάστημα. C f u 1 ={Γιάννης, αυτοκίνητο, κατάστημα} c p u 1 =Γιάννης, c b u 1 =μη ορισμένο. u 2, 1 η ερμηνεία: Το έδειξε [ποιος;] στο Βασίλη. C f u 2 ={Γιάννης, αυτοκίνητο, Βασίλης} c p u 2 =Γιάννης, c b u 2 = Γιάννης. c b u 1 = μη ορισμένο. (cntinue) u 2, 2 η ερμηνεία: Το έδειξε [ποιος;] στο Βασίλη. C f u 2 ={Γιάννης, κατάστημα, Βασίλης} c p u 2 = Γιάννης, c b u 2 = Γιάννης. c b u 1 = μη ορισμένο. (cntinue) Και με τις δύο ερμηνείες cntinue. Θεωρούμε ότι προτιμάται η 1 η, επειδή το αυτοκίνητο ήταν πιο περίοπτο στο C f u 1.
Επίλυση αναφορικών εκφράσεων συνέχεια Άρα u 2 : Το έδειξε [ο Γιάννης] στο Βασίλη. C f u 2 ={Γιάννης, αυτοκίνητο, Βασίλης} c p u 2 = Γιάννης, c b u 2 = Γιάννης. c b u 1 = μη ορισμένο. (cntinue) u 3, 1 η ερμηνεία: Το αγόρασε [ποιος;]. C f u 3 ={Γιάννης, αυτοκίνητο} c p u 3 = Γιάννης, c b u 3 = Γιάννης. c b u 2 = Γιάννης. (cntinue) u 3, 2 η ερμηνεία: Το αγόρασε [ποιος;]. C f u 3 ={Βασίλης, αυτοκίνητο} c p u 3 = Βασίλης, c b u 3 = αυτοκίνητο. c b u 2 = Γιάννης. (rugh shift) Προτιμάται η 1 η (Γιάννης). Δε δουλεύει πάντα σωστά. Βλ. J&M. Δοκιμάστε και ερμηνείες όπου το «το» αναφέρεται στο κατάστημα.
Βιβλιογραφία Jurafsky & Martin: κεφάλαιο 21. Προαιρετική μελέτη: ενότητα 21.9. Μελετήστε επίσης (εντός εξεταστέας ύλης) το άρθρο «Mdeling Lcal Cherence: An Entity-Based Apprach» των R. Barzilay και M. Lapata, Cmputatinal Linguistics, 34(1), 2008. http://www.aclweb.rg/anthlgy/j08-1001 Όσοι ενδιαφέρεστε ιδιαίτερα, μπορείτε να διαβάσετε επίσης τα βιβλία: Frm Discurse t Lgic των H. Kamp και U. Reyle, Springer, 1993. The Thery and Practice f Discurse Parsing and Summarizatin του D. Marcu, MIT Press, 2000. 27