Γλωσσική Τεχνολογία. 5 η Ενότητα: Ανάλυση πραγματείας. Ίων Ανδρουτσόπουλος. http://www.aueb.gr/users/ion/



Σχετικά έγγραφα
Τίτλος Ειδικού Θεματικού Προγράμματος: «Διοίκηση, Οργάνωση και Πληροφορική για Μικρο-μεσαίες Επιχειρήσεις»

Η ΔΙΔΑΚΤΙΚΗ ΑΞΙΟΠΟΙΗΣΗ ΚΙΝΗΤΩΝ ΕΡΓΑΣΤΗΡΙΩΝ ΦΟΡΗΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ. στο μάθημα της Γλώσσας της ΣΤ ΔΗΜΟΤΙΚΟΥ

Όταν το μάθημα της πληροφορικής γίνεται ανθρωποκεντρικό μπορεί να αφορά και την εφηβεία.

Βουλευτικές Εκλογές 2011

ΕΘΝΙΚΗ ΣΥΝΟΜΟΣΠΟΝΔΙΑ ΕΛΛΗΝΙΚΟΥ ΕΜΠΟΡΙΟΥ ΔΕΛΤΙΟ ΤΥΠΟΥ

ΣΥΜΒΑΣΗ ΔΠΑ/ΕΠ-6489/2012

Η συμβολή του Πλάτωνα στα Μαθηματικά

Κανόνες λειτουργίας της Επιτροπής Ηθικής και Δεοντολογίας

ΟΜΟΦΩΝΗ ΑΠΟΦΑΣΗ. -Συνημμένα 14 Ψηφίσματα: Ψήφισμα 1: Για τη Χρηματοδότηση των ΑΕΙ. Ψήφισμα 2: Θέματα Ανθρώπινου Δυναμικού

ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗ ΛΟΓΙΣΤΙΚΗ

ΠΡΟΒΛΗΜΑΤΑ ΤΗΣ ΔΗΜΟΣΙΑΣ ΖΩΗΣ, ΜΙΑ ΨΥΧΑΝΑΛΥΤΙΚΗ ΠΡΟΣΕΓΓΙΣΗ

και ενδυόμενος με θεία αγάπη την ποδιά του ιατρού έδενε με τα γυμνά του χέρια τις πληγές των πασχόντων και έπειτα τις ασπαζόταν.

ΣΥΖΗΤΗΣΗ ΝΟΜΟΣΧΕΔΙΟΥ ΥΠ.ΓΕΩΡΓΙΑΣ

ΠΑΓΚΥΠΡΙΑ ΟΡΓΑΝΩΣΗ ΕΛΛΗΝΩΝ ΔΑΣΚΑΛΩΝ (ΠΟΕΔ) ΤΑΚΤΙΚΗ ΠΑΓΚΥΠΡΙΑ ΣΥΝΔΙΑΣΚΕΨΗ ΓΕΝΙΚΩΝ ΑΝΤΙΠΡΟΣΩΠΩΝ ΛΟΓΟΔΟΣΙΑ ΤΟΥ Δ.Σ. ΓΙΑ ΣΧΟΛΙΚΟ ΕΤΟΣ

Η ΔΙΑΘΕΜΑΤΙΚΗ ΤΗΣ ΔΙΑΘΕΜΑΤΙΚΗΣ

Πρώτη διδακτική πρόταση Χρωματίζοντας ένα σκίτσο

Φλωρεντία, 10 Δεκεμβρίου 1513 Προς τον: ΦΡΑΓΚΙΣΚΟ ΒΕΤΤΟΡΙ, Πρέσβη της Φλωρεντίας στην Αγία Παπική Έδρα, Ρώμη. Εξοχώτατε Πρέσβη,

ΟΜΙΛΙΑ ΤΟΥ ΒΟΥΛΕΥΤΗ Ν.Δ. Κου ΓΙΑΝΝΗ ΠΑΠΑΘΑΝΑΣΙΟΥ Στην συζήτηση εκδήλωση με θέμα: «ΟΙΚΟΝΟΜΙΑ 2011+»

Από το ξεκίνημά του ο ΤΙΤΑΝ εκφράζει

ΠΑΡΟΥΣΙΑΣΗ ΤΩΝ ΓΕΝΙΚΩΝ ΚΑΙ ΕΙΔΙΚΩΝ ΟΡΩΝ ΤΟΥ ΠΡΟΓΡΑΜΜΑΤΟΣ «ΑΣΦΑΛΩΣ ΚΑΤΟΙΚΕΙΝ» ΚΟΙΝΟΧΡΗΣΤΟΙ ΧΩΡΟΙ

ΔΙΑΔΟΣΗ ΘΕΡΜΟΤΗΤΑΣ Φυσική Β' Γυμνασίου. Επιμέλεια: Ιωάννης Γιαμνιαδάκης

Ατομικό ιστορικό νηπίου

«Ειρήνη» Σημειώσεις για εκπαιδευτικούς

ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Πρώτες βοήθειες και αντιλήψεις του πληθυσμού στους Νομούς Χανίων, Ηρακλείου, Λασιθίου και Μεσσηνίας

Το σχολείο πρέπει να ικανοποιεί με τα ωράριά του το πρόγραμμα των γονέων.

03-00: Βιομάζα για παραγωγή ενέργειας Γενικά ζητήματα εφοδιαστικών αλυσίδων

medreha Kωνσταντίνος Μαλίζος καθηγητής Ορθοπαιδικής, Ιατρική Σχολή Πανεπιστημίου Θεσσαλίας Πανεπιστημιακό Νοσοκομείο Λάρισας

Το Article 27 αναφέρεται στο κομμάτι του Καταστατικού των Η.Ε. κατά το οποίο δίνεται το δικαίωμα του βέτο στα μόνιμα μέλη του Συμβουλίου Ασφαλείας.

Γνωρίζω, Αγαπώ & Φροντίζω το Σώμα μου

Περιβάλλον και Ανάπτυξη ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ. Γραμματικογιάννης Α. Ηλίας. Επιβλέπων: Καθηγητής Δ. Ρόκος

Δασικά Οικοσυστήματα και Τεχνικά Έργα

ΠΕΡΙΛΗΨΗ ΤΟΥ ΠΑΙΧΝΙΔΙΟΥ

Μια «γριά» νέα. Εύα Παπώτη

Χρηματοδότηση των Συλλόγων στην εποχή της κρίσης

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΑΡΙΘΜΟΣ ΜΕΛΕΤΗΣ: 58/ 2014 ΝΟΜΟΣ ΘΕΣΠΡΩΤΙΑΣ ΔΗΜΟΣ ΗΓΟΥΜΕΝΙΤΣΑΣ Δ/ΝΣΗ ΤΕΧΝΙΚΩΝ ΥΠΗΡΕΣΙΩΝ ΜΕΛΕΤΗ

ΠΤΥΧΕΣ ΤΟΥ ΣΥΓΧΡΟΝΟΥ ΦΑΙΝΟΜΕΝΟΥ ΤΗΣ ΖΩΟΛΑΤΡΙΑΣ! ΛΑΜΠΡΟΥ Κ. ΣΚΟΝΤΖΟΥ Θεολόγου - καθηγητού Δε χρειάζεται να είναι κάποιος ειδικός για να διαπιστώσει

Υποψήφιοι Σχολικοί Σύμβουλοι

Συνωμοσία Πυρήνων της Φωτιάς - Πυρήνας Αντάρτικου Πόλης

Δημοκρίτειο Πανεπιστήμιο

Κυρίες και κύριοι συνάδελφοι, Η κατάσταση στη χώρα, κ. Πρωθυπουργέ, είναι πολύ ανησυχητική. Η κοινωνία βράζει. Η οικονομία βυθίζεται.

Δυσαρεστημένοι με τη ζωή τους οι 7 στους 10 Έλληνες

ΕΠΙΚΟΙΝΩΝΙΑ ΜΕ ΤΟΝ ΕΣΩΤΕΡΙΚΟ ΚΑΙ ΕΞΩΤΕΡΙΚΟ ΠΕΛΑΤΗ

Η ΨΥΧΗ ΚΑΙ Ο ΘΑΝΑΤΟΣ ( 1 )

ΟΜΙΛΙΑ ΠΡΟΕΔΡΟΥ Ο.Κ.Ε. κ. Χ. ΠΟΛΥΖΩΓΟΠΟΥΛΟΥ

ΔΕΛΤΙΟ ΤΥΠΟΥ. Ακολουθεί ολόκληρη η τοποθέτηση - παρέμβαση του Υπουργού Δ.Μ.&Η.Δ.

ΕΦΑΡΜΟΣΜΕΝΗ ΗΘΙΚΗ. Ενότητα 10: Φιλοσοφική Συμβουλευτική. Παρούσης Μιχαήλ. Τμήμα Φιλοσοφίας

Αναλυτικές οδηγίες διακοπής καπνίσματος βήμα προς βήμα

Ι ΑΚΤΙΚΗ ΠΑΡΕΜΒΑΣΗ ΣΤΗΝ ΠΑΡΑΓΩΓΗ ΓΡΑΠΤΟΥ ΛΟΓΟΥ ΣΕ ΤΜΗΜΑ ΕΝΤΑΞΗΣ ΕΥΤΕΡΟΒΑΘΜΙΑΣ ΕΚΠΑΙ ΕΥΣΗΣ

Συνοπτική Παρουσίαση. Ελλάδα

ΤΕΙ ΗΠΕΙΡΟΥ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ

ΟΜΙΛΙΑ ΠΡΩΘΥΠΟΥΡΓΟΥ ΚΑΙ ΠΡΟΕ ΡΟΥ ΤΟΥ ΠΑΣΟΚ ΓΙΩΡΓΟΥ ΠΑΠΑΝ ΡΕΟΥ. ΣΤΗΝ 11η ΣΥΝΟ Ο ΤΟΥ ΕΘΝΙΚΟΥ ΣΥΜΒΟΥΛΙΟΥ ΤΟΥ ΚΙΝΗΜΑΤΟΣ

ΑΣΦΑΛΙΣΗ ΑΥΤΟΚΙΝΗΤΟΥ

Ομιλία του Υφυπουργού Ανάπτυξης κου Θανάση Σκορδά στο CapitalVision 2012

ΤΟΜΟΣ Α ΕΙΣΑΓΩΓΗ ΣΤΟ ΔΙΚΑΙΟ

Κατερίνα Παναγοπούλου: Δημιουργώντας κοινωνικό κεφάλαιο την εποχή της κρίσης

Σοφία Γιουρούκου, Ψυχολόγος Συνθετική Ψυχοθεραπεύτρια

ενεργοί πολίτες για τη Μήλο οι θέσεις μας Υποψηφιότητα Αντώνη Καβαλιέρου δημοτικές εκλογές

ΟΜΙΛΙΑ ΣΤΗ ΣΥΓΚΕΝΤΡΩΣΗ ΤΟΥ ΣΥΝΔΙΚΑΤΟΥ ΜΕΤΑΛΛΟΥ ΓΙΑ ΤΟ ΑΤΥΧΗΜΑ ΣΤΗ ΧΑΛΥΒΟΥΡΓΙΑ. 9/12/2014, Αγ. Νικόλαος

Ευρετήριο πινάκων. Ασκήσεις και υπομνήματα

«Ο συγγραφέας στα σύγχρονα ΜΜΕ: ο λόγος και η απήχηση του»

Συνεταιριστική Οικονομία

Τα Robot. Από τον Τάλω στα σύγχρονα προγραμματιζόμενα Robot. Δήμητρα-Παρασκευή Γαβαλά. Μαθήτρια Γ3 Γυμνασίου, Ελληνικό Κολλέγιο Θεσσαλονίκης

Πρόταση για το νέο Σύνταγμα του Ελληνικού Κράτους.

ΚΩΔΙΚΑΣ ΔΕΟΝΤΟΛΟΓΙΑΣ

ΑΛΕΞΑΝΔΡΕΙΟ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΕΠΑΓΓΕΛΜΑΤΩΝ ΥΓΕΙΑΣ ΚΑΙ ΠΡΟΝΟΙΑΣ ΤΜΗΜΑ ΑΙΣΘΗΤΙΚΗΣ-ΚΟΣΜΗΤΟΛΟΓΙΑΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ

Η εργασία είναι αφιερωμένη σε όσους επέλεξαν να. ασχοληθούν με το κλάδο της φυσικοθεραπείας και. θεωρούν την φυσικοθεραπεία λειτούργημα και όχι

ΚΕΦΑΛΑΙΟ 8 ΣΥΜΠΕΡΑΣΜΑΤΑ

ΣΥΝΕΝΤΕΥΞΗ ΣΤΗΝ ΕΦΗΜΕΡΙΔΑ «ΚΡΗΤΙΚΗ ΕΝΗΜΕΡΩΣΗ» ΝΟΕΜΒΡΙΟΣ 2005

Τα Αναβολικά. Τα αναβολικά χωρίζονται στα φυσικά και στα συνθετικά.

ΟΜΙΛΙΑ ΕΥΑΓ.ΜΠΑΣΙΑΚΟΥ, ΕΙΔΙΚΟΥ ΕΙΣΗΓΗΤΗ ΝΕΑΣ ΔΗΜΟΚΡΑΤΙΑΣ, ΚΑΤΑ ΤΗ ΣΥΖΗΤΗΣΗ ΣΤΗ ΒΟΥΛΗ ΤΟΥ ΚΡΑΤΙΚΟΥ ΠΡΟΥΠΟΛΟΓΙΣΜΟΥ

ΟΡΓΑΝΩΣΗ ΕΝΟΤΗΤΩΝ Α ΤΑΞΗΣ ΕΝΟΤΗΤΑ 3

Έλλειψη εσωτερικής ελευθερίας

ΜΕ ΤΗ ΔΙΚΗ ΜΟΥ ΒΟΗΘΕΙΑ, ΤΟΥ ΑΥΤΟΚΡΑΤΟΡΙΚΟΥ ΚΗΠΟΥΡΟΥ ΔΗΛΑΔΗ, ΘΑ ΤΑ ΚΑΛΛΙΕΡΓΗΣΕΤΕ...

ΠΡΩΤΟΣ ΕΠΕΡΩΤΩΝ ΕΥΑΓΓΕΛΟΣ ΜΠΑΣΙΑΚΟΣ (ΕΛΑΙΟΚΑΛΛΙΕΡΓΙΑ)

Καθηγητές στο μικροσκόπιο, ιδιώτες στην έρευνα. Ο νέος νόμος-πλαίσιο για τα πανεπιστήμια. Εφημερίδα: ΤΟ ΒΗΜΑ Ρεπορτάζ: ΜΑΡΝΥ ΠΑΠΑΜΑΤΘΑΙΟΥ

ΠΟΙΟΤΙΚΗ ΔΙΕΡΕΥΝΗΣΗ ΤΩΝ ΑΠΟΨΕΩΝ ΤΗΣ ΕΛΛΗΝΙΚΗΣ ΚΟΙΝΩΝΙΑΣ ΓΙΑ ΤΗ ΣΥΓΚΡΟΤΗΣΗ ΤΗΣ ΙΔΑΝΙΚΗΣ ΠΟΛΙΤΕΙΑΣ

/νση: ΧΑΡΑΚΟΠΟΥΛΟΣ ΧΡΗΣΤΟΣ Μ. Αλεξάνδρου 49, 66100, ράµα Τηλ&φαξ: , κιν.: info@akademia.


ΟΜΙΛΙΑ ΤΟΥ ΠΡΟΕΔΡΟΥ ΤΗΣ Κ.Ο. ΤΟΥ ΣΥΡΙΖΑ / ΕΚΜ, ΑΛΕΞΗ ΤΣΙΠΡΑ ΣΤΗΝ ΠΑΝΕΛΛΑΔΙΚΗ ΣΥΝΔΙΑΣΚΕΨΗ ΤΟΥ ΣΥΡΙΖΑ / ΕΚΜ

Α. ΚΑΤΑΣΤΑΤΙΚΟ ΚΟΙΝΟΠΡΑΞΙΑΣ ΜΕ ΤΗΝ ΕΠΩΝΥΜΙΑ

Παραμονή Παγκόσμιας Ημέρας Αντικαταναλωτισμού*, 28 Νοεμβρίου 2008

Ενώνουμε δυνάμεις. Δείγματα Γραφής. Δυναμικά μπροστά ΑΝΔΡΕΑΣ Ζ. ΚΥΠΡΙΑΝΟΥ. Βουλευτής

ΘΕΣΕΙΣ ΤΟΥ ΣΥΝΔΕΣΜΟΥ ΓΙΑ ΤΗΝ ΑΝΑΜΟΡΦΩΣΗ ΤΟΥ ΘΕΣΜΙΚΟΥ ΠΛΑΙΣΙΟΥ ΑΝΑΘΕΣΗΣ ΚΑΙ ΕΚΠΟΝΗΣΗΣ ΜΕΛΕΤΩΝ

ΤΕΧΝΙΚΟ ΕΠΙΜΕΛΗΤΗΡΙΟ ΕΛΛΑΔΑΣ & ΠΕΡΙΦΕΡΕΙΑΚΟ ΤΜΗΜΑ ΚΕΝΤΡΙΚΗΣ ΚΑΙ ΔΥΤΙΚΗΣ ΘΕΣΣΑΛΙΑΣ ΤΟΥ Τ.Ε.Ε.

Διεπιστημονική γνώση και ενοποιημένη Απάντηση, δηλαδή: Ηθική Ψυχολογική Λογική Πολιτική Κοσμολογική

Ηράκλειο Αρ. Πρωτ.: 590

ΕΡΓΑΣΙΑ ΤΕΧΝΟΛΟΓΙΑΣ «ΚΑΤΟΙΚΙΔΙΑ ΖΩΑ»

ΦΙΛΟΣΟΦΙΑ ΤΟΥ ΔΙΚΑΙΟΥ. Ενότητα 7: Σχέση δικαίου-ηθικής-πολιτικής. Παρούσης Μιχαήλ. Τμήμα Φιλοσοφίας

στο ΕΣΠΑ του έργου ανέγερσης του 4ου Λυκείου Κέρκυρας.

Οι ιοί και οι ιογενείς λοιμώξεις του αναπνευστικού συστήματος στα παιδιά

1. Εισαγωγή. 2. Καταπολέμηση της φοροδιαφυγής

8 Μάρτη. Η βία κατά των γυναικών

ΥΠΟΣΤΗΡΙΞΗ ΑΝΑΣΚΑΦΙΚΟΥ ΕΡΓΟΥ

* Από την αγγλική λέξη «boss», αφεντικό. ** «Core houses» στο πρωτότυπο, μικρά ισόγεια σπίτια ανθεκτικής κατασκευής με πρόβλεψη επέκτασης. (Σ.τ.Ε.

ΠΡΑΚΤΙΚΟ ΣΥΝΤΑΞΗΣ ΤΕΧΝΙΚΩΝ ΠΡΟΔΙΑΓΡΑΦΩΝ ΤΟΥ ΔΙΑΓΩΝΙΣΜΟΥ ΓΙΑ ΤΙΣ ΥΠΗΡΕΣΙΕΣ ΕΠΙΣΚΕΥΗΣ ΚΑΙ ΣΥΝΤΗΡΗΣΗΣ ΗΛΕΚΤΡΟΜΗΧΑΝΟΛΟΓΙΚΩΝ ΕΓΚΑΤΑΣΤΑΣΕΩΝ ΚΤΙΡΙΟΥ

ΕΦΑΡΜΟΣΜΕΝΗ ΗΘΙΚΗ. Ενότητα 3: Το παράδειγμα της Τρέισι Λάτιμερ (συνέχεια) Παρούσης Μιχαήλ. Τμήμα Φιλοσοφίας

ΣΥΓΚΡΙΣΗ ΣΥΜΒΑΤΙΚΗΣ ΚΑΙ ΜΗΧΑΝΟΠΟΙΗΜΕΝΗΣ ΜΕΘΟΔΟΥ ΣΠΟΡΑΣ ΚΑΙ ΜΕΤΑΦΥΤΕΥΣΗΣ ΣΠΟΡΟΦΥΤΩΝ ΛΑΧΑΝΙΚΩΝ

ΚΩ ΙΚΑΣ ΕΟΝΤΟΛΟΓΙΑΣ ΤΗΣ ΕΤΑΙΡΕΙΑΣ ΜΕ ΤΗΝ ΕΠΩΝΥΜΙΑ «ΠΑΠΟΥΤΣΑΝΗΣ ΑΝΩΝΥΜΗ ΒΙΟΜΗΧΑΝΙΚΗ ΚΑΙ ΕΜΠΟΡΙΚΗ ΕΤΑΙΡΕΙΑ ΚΑΤΑΝΑΛΩΤΙΚΩΝ ΑΓΑΘΩΝ»

Η ΑΝΑΔΕΙΞΗ ΤΩΝ ΔΥΝΑΤΟΤΗΤΩΝ ΤΩΝ ΤΑΛΑΝΤΟΥΧΩΝ ΜΑΘΗΤΩΝ. Ανδρέας Πούλος

ΠΡΑΚΤΙΚΑ ΤΗΣ ΒΟΥΛΗΣ ΠΑΡΑΣΚΕΥΗ 30 ΑΠΡΙΛΙΟΥ

Transcript:

Γλωσσική Τεχνολογία 5 η Ενότητα: Ανάλυση πραγματείας 2014 15 Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/in/ 1

Οι διαφάνειες αυτές βασίζονται στην ύλη του βιβλίου Speech and Language Prcessing των D. Jurafsky και J.H. Martin, 2 η έκδοση, Pearsn Educatin, 2009. 2

Τι θα ακούσετε Συνοχή κειμένων και κατάτμηση πραγματείας. Αλγόριθμος TextTiling. Κατάτμηση με μηχανική μάθηση. Αξιολόγηση κατάτμησης. Καθολική συνεκτικότητα κειμένων. Σχέσεις συνεκτικότητας και θεωρία ρητορικής δομής. Παραγωγή δέντρων ρητορικής δομής. Αναφορικές εκφράσεις. Είδη αναφορικών εκφράσεων και επίλυσή τους με μηχανική μάθηση. Τοπική συνεκτικότητα κειμένων. Θεωρία επικέντρωσης και χρήση της στην επίλυση αναφορικών εκφράσεων. 3

Ανάλυση πραγματείας (discurse) Μελετάμε τις σχέσεις μεταξύ των προτάσεων (ή τμημάτων τους) ενός μονολόγου ή διαλόγου. Στην ενότητα αυτή θα εστιαστούμε κυρίως σε μονολόγους. Μελετάμε π.χ. τη συνεκτικότητα (cherence) των κειμένων. «Η Μαρία έκρυψε τα κλειδιά της μηχανής του Γιάννη. Ήταν μεθυσμένος.» (;) «Η Μαρία έκρυψε τα κλειδιά της μηχανής του Γιάννη. Της αρέσει το σπανάκι.» Στην 1 η περίπτωση μπορούμε πιο εύκολα να καταλάβουμε πώς σχετίζονται οι δύο προτάσεις (σχέση αιτιολόγησης). Μελετάμε επίσης αναφορικές εκφράσεις. «Πρόεδρος της Εταιρείας Γλωσσικής Τεχνολογίας ανέλαβε η κ. Μαρία Παπαδοπούλου. Η κ. Παπαδοπούλου δήλωσε ευτυχής. Υποσχέθηκε [ποιος;] ότι η εταιρεία θα επιστρέψει στην κερδοφορία. Η ΕΓΤ σημειώνει ζημίες εδώ και τρία χρόνια.»

Κατάτμηση πραγματείας Σε πολλά κείμενα υπάρχουν σημεία όπου αλλάζει το θέμα (ή το υπο-θέμα), τα οποία ίσως χρειάζεται να εντοπίσουμε. Αυτόματη κατάτμηση απομαγνητοφωνήσεων συναντήσεων. Κείμενο εφημερίδας που περιγράφει περισσότερα από ένα γεγονότα. Σε μια περίληψη, θέλουμε να περιλάβουμε προτάσεις για όλα τα γεγονότα του κειμένου. Βοηθάει η μελέτη της συνοχής (chesin) του κειμένου. Η συνοχή (όχι συνεκτικότητα) μεταξύ προτάσεων επιτυγχάνεται μέσω της επανάληψης των ίδιων ή σχετικών λέξεων (π.χ. συνώνυμα, υπερώνυμα), συν-αναφορικών εκφράσεων κλπ. «Ο Γιάννης καθάρισε την καμινάδα. Δεν ήθελε [ο Γιάννης] άλλα προβλήματα με το τζάκι.» Όσο έχουμε μεγάλη συνοχή, μάλλον δεν αλλάζει το θέμα.

Αλγόριθμος TextTiling (Hearst 1997) 1 ο στάδιο: λεκτικές μονάδες (tkens), αφαίρεση συχνών λέξεων (stp-list), αποκοπή καταλήξεων (stemming), κατάτμηση σε τμήματα των 20 χαρακτήρων («πλακίδια»). 2 ο στάδιο: υπολογισμός μέτρου ομοιότητας μεταξύ κάθε δύο συνεχόμενων πλακιδίων. Κάθε πλακίδιο παριστάνεται ως ένα διάνυσμα. Κάθε συνιστώσα του διανύσματος είναι η συχνότητα μιας λέξης. Ομοιότητα δύο πλακιδίων: το μέτρο συνημιτόνου τους. Μπορούμε να χρησιμοποιήσουμε και TF-IDF ή μέτρα σημασιολογικής συνάφειας (ενότητα 4) ή/και να λάβουμε υπόψη μας την ύπαρξη συν-αναφορών (βλ. παρακάτω). 3 ο στάδιο: εντοπισμός σημείων αλλαγής θέματος. Σημεία (μεταξύ διαδοχικών πλακιδίων) όπου πέφτει απότομα η ομοιότητα.

Ομοιότητα διαδοχικών πλακιδίων ομοιότητα 3 ο στάδιο: εντοπισμός σημείων αλλαγής θέματος. Μετράμε την πτώση y i 1 y i + (y i+1 y i ) από τις δύο γειτονικές κορυφές. 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 t1 t t2 t2 t t3 t3 t t4 t4 t t5 t5 t t6 t6 t t7 t7 t t8 t8 t t9 Υπερβαίνει π.χ. τη μέση πτώση συν μία διασπορά; Εναλλακτικά: ομαδοποίηση (clustering) πλακιδίων.

Κατάτμηση με επιβλεπόμενη μάθηση Εναλλακτικά: κατάτμηση πραγματείας ως πρόβλημα κατάταξης με επιβλεπόμενη μάθηση. Αντικείμενα προς κατάταξη: τα τέλη των προτάσεων. Κατηγορίες: αλλαγή ή όχι θέματος. Ιδιότητες: ομοιότητα μεταξύ προτάσεων (ενδεχομένως μετρημένη με πολλαπλά μέτρα), ύπαρξη ή όχι συγκεκριμένων λέξεων ή φράσεων (όπως στην κατάταξη κειμένων) κλπ. Συχνά βοηθάει ο εντοπισμός χαρακτηριστικών λέξεων ή φράσεων (discurse markers, cue phrases). «Καλησπέρα», «Μαζί μας τώρα ο», «Μείνετε μαζί μας». Μπορούμε να μάθουμε τέτοιες λέξεις/φράσεις με μεθόδους επιλογής ιδιοτήτων (π.χ. πληροφοριακό κέρδος).

Αξιολόγηση κατάτμησης πραγματείας Η ορθότητα, ανάκληση, ακρίβεια δεν ενδείκνυνται, γιατί τιμωρούν εξίσου μια μετατόπιση σημείου αλλαγής θέματος με μια πλήρη παράλειψη τέτοιου σημείου. αλλαγές που σημείωσε άνθρωπος αλλαγές που σημείωσε το σύστημα Σέρνουμε ένα παράθυρο από αριστερά προς τα δεξιά. Για κάθε θέση i του παραθύρου, εξετάζουμε τις αλλαγές μέσα στο παράθυρο: b i = αλλαγές ανθρώπου αλλαγές συστήματος WindwDiff = i b i Μήκος παραθύρου: π.χ. το μισό του μέσου τμήματος του ανθρώπου.

Συνεκτικότητα (cherence) Οι προτάσεις (ή και φράσεις) ενός κειμένου συνδέονται με σχέσεις συνεκτικότητας (ή «ρητορικές σχέσεις»). Έχουν προταθεί πολλά σύνολα σχέσεων. Οι σχέσεις του Hbbs (1979) συμπεριλαμβάνουν: Αποτέλεσμα (result): «Άρχισε να βρέχει. Το ρομπότ βραχυκύκλωσε.» Εξήγηση (explanatin): «Η Μαρία έκρυψε τα κλειδιά της μηχανής του Γιάννη. Ήταν μεθυσμένος.» Παραλληλισμός (parallel): «Ο Γιώργος ήθελε μια μπύρα. Η Μαρία ήθελε τσάι.» Επέκταση (elabrate): «Ο Γιώργος είναι από την Κύπρο. Μεγάλωσε στη Λευκωσία.»

Δέντρα με σχέσεις συνεκτικότητας Explanatin(S1) S1: Ο Γιάννης πήγε στο κατάστημα αυτοκινήτων του Βασίλη. S2: Ήθελε να αγοράσει ένα αυτοκίνητο. Explanatin(S2) Parallel(S2, S4) S4: Ήθελε να δει και πώς τα πηγαίνει ο Βασίλης με την κρίση της αγοράς. S3: Δεν πηγαίνει κανένα λεωφορείο στη νέα του δουλειά. Οι σχέσεις συνεκτικότητας συνθέτουν ένα δέντρο. Παρόμοιο με τα συντακτικά δέντρα των προτάσεων. Στις πιο πολλές σχέσεις, ένα παιδί είναι το κύριο. Αλλά σε μερικές σχέσεις (π.χ. παραλληλισμός) και τα δύο παιδιά είναι εξίσου σημαντικά.

Θεωρία ρητορικής δομής Ιδιαίτερα γνωστές είναι οι «ρητορικές σχέσεις» της θεωρίας ρητορικής δομής (RST, Mann & Thmpsn 1987). Περιλαμβάνουν μεταξύ άλλων: Μαρτυρία (evidence): «Ο Γιάννης είναι στο σπίτι του. Το αυτοκίνητό του είναι παρκαρισμένο απ έξω.» Επέκταση (elabratin): «Ο Γιώργος είναι από την Κύπρο. Μεγάλωσε στη Λευκωσία.» Αντίθεση (cntrast): «Ο Γιώργος ήταν χαρούμενος. Η Μαρία ήταν λυπημένη.» Υπόβαθρο (backgrund): «Η Μαρία πήγε στο σπίτι του Γιώργου. Είχαν τσακωθεί το πρωί.» Ακολουθία (sequence): «Η Μαρία πήγε στο σπίτι του Γιώργου. Χτύπησε την πόρτα.»

Δέντρο ρητορικής δομής S1 S6 sequence backgrund S1 S3 S2 S3 S2: Ήταν στεναχωρημένη. (όχι ακριβώς ) cause S3: Είχαν τσακωθεί το πρωί. S1: Η Μαρία πήγε στο σπίτι του Γιώργου. S5 S6 evidence backgrund S4 S6 S4: Χτύπησε την πόρτα. πυρήνας (nucleus) δορυφόρος (satellite) S5: Ήξερε ότι ο Γιώργος ήταν μέσα. S6: Το αυτοκίνητό του ήταν παρκαρισμένο απ έξω.

Πώς παράγουμε τα δέντρα; Αναγνώριση «συνδέσμων» (cnnectives, cue phrases). «Περπάτησε ως την πόρτα. Κατόπιν χτύπησε το κουδούνι.» «Όλα τα πουλιά πετούν. Εξαίρεση αποτελούν οι πιγκουίνοι.» Κατάτμηση σε τμήματα πραγματείας (discurse segments). Τα τμήματα δεν είναι πάντα προτάσεις. «[Δεν του μιλούσε], [επειδή ήταν θυμωμένη]». Μπορούμε π.χ. να χρησιμοποιήσουμε κανονικές εκφράσεις. Χρήσιμα και τα συντακτικά δέντρα των προτάσεων. Αναγνώριση σχέσεων μεταξύ τμημάτων. Οι σύνδεσμοι είναι συχνά αμφίσημοι. «[Ήξερε ότι ο Γιώργος ήταν μέσα], [επειδή (evidence) το αυτοκίνητό του ήταν απ έξω].» «[Δεν του μιλούσε], [επειδή (cause) ήταν θυμωμένη].» Για την αποσαφήνισή τους, μπορούμε να χρησιμοποιήσουμε ιδέες από την αποσαφήνιση εννοιών λέξεων.

Πώς παράγουμε τα δέντρα; (συνέχεια) Αναγνώριση σχέσεων μεταξύ τμημάτων. Μπορεί να μην υπάρχουν καν σύνδεσμοι! «Δεν του μιλούσε. Ήταν θυμωμένη.» «Ο Γιάννης ήθελε βουνό. Η Μαρία ήθελε θάλασσα.» Χρήση επιβλεπόμενης μάθησης. Εντοπίζουμε σε ένα σώμα κειμένων προτάσεις συνδεόμενες με συνδέσμους. Σημειώνουμε χειρωνακτικά τις σχέσεις. Εκπαιδεύουμε έναν ταξινομητή, ώστε να μαντεύει τις σχέσεις μεταξύ προτάσεων όταν υπάρχουν σύνδεσμοι. Αφαιρούμε τους συνδέσμους από τα παραδείγματα εκπαίδευσης. Εκπαιδεύουμε ταξινομητή που να μαντεύει σχέσεις προτάσεων και όταν δεν υπάρχουν σύνδεσμοι. Επεκτείνουμε το σύστημα για μικρότερα τμήματα Βλ. J&M για ιδέες ιδιοτήτων. Γενικά δύσκολο πρόβλημα

Αναφορικές εκφράσεις Οι αναφορικές εκφράσεις (referring expressins) αναφέρονται κυρίως σε οντότητες του κόσμου. Πρόεδρος της Εταιρείας Γλωσσικής Τεχνολογίας ανέλαβε η κ. Μαρία Παπαδοπούλου. Η κ. Παπαδοπούλου δήλωσε ευτυχής. Υποσχέθηκε [ποιος;] ότι η εταιρεία θα επιστρέψει στην κερδοφορία. Η ΕΓΤ σημειώνει ζημίες εδώ και τρία χρόνια. Αλυσίδες συν-αναφορών (creference chains): {«της Εταιρείας Γλωσσικής Τεχνολογίας», «η εταιρεία», «η ΕΓΤ»}, {«η κ. Μαρία Παπαδοπούλου», «η κ. Παπαδοπούλου», [ποιος;]}. Στα Αγγλικά τα «anaphra» και «cataphra» χρησιμοποιούνται όταν μια έκφραση αναφέρεται σε κάτι στο οποίο αναφέρεται και μια προηγούμενη ή επόμενη, αντίστοιχα, έκφραση. Αλλά και σε αφηρημένες οντότητες, γεγονότα κλπ. «Αυτή ήταν μια υπερ-αισιόδοξη δήλωση.»

Είδη αναφορικών εκφράσεων συνέχεια Αόριστες ονοματικές φράσεις (indefinite NPs). «Ο Γιάννης αγόρασε ένα αυτοκίνητο». Θεωρείται ότι εισάγουν (evke) μια οντότητα στο μοντέλο της πραγματείας του ακροατή. Μπορεί να αναφέρονται σε συγκεκριμένη οντότητα ή σε κατηγορία οντοτήτων ή γενικευμένο εκπρόσωπο. «Ήθελε να αγοράσει ένα αυτοκίνητο.» «Ήθελε να αγοράσει ένα αυτοκίνητο που είδε στην έκθεση.» Οριστικές ονοματικές φράσεις (definite NPs). «Έδειξε χθες το αυτοκίνητο στη (σε τη) Μαρία.» Θεωρείται ότι ο ακροατής ανασύρει (access) την αντίστοιχη οντότητα από το μοντέλο της πραγματείας. Κύρια ονόματα. Είτε εισάγουν είτε ανασύρουν. «Η Μαρία ενθουσιάστηκε.»

Είδη αναφορικών εκφράσεων συνέχεια Αντωνυμίες αλλά και κενές αναφορικές εκφράσεις. «Της έδειξε [ποιος;] το αυτοκίνητο. Εκείνη ενθουσιάστηκε.» Μπορούν να αναφερθούν μόνο σε πρόσφατες οντότητες. «Ο Γιάννης αγόρασε ένα αυτοκίνητο. Το έδειξε στη Μαρία. Η Μαρία ενθουσιάστηκε. Έφτιαξε μακαρονάδα. Κατόπιν τον κέρασε καφέ. Συζήτησαν για πολύ ώρα. Μετά πήγαν να το (;) φωτογραφίσουν / να φωτογραφίσουν το αυτοκίνητο.» Οι αντωνυμίες μπορούν να παίξουν και ρόλο μεταβλητών ποσοδεικτών (π.χ. «Κάθε ντάμα να σηκώσει το χέρι της»). Στα αγγλικά μερικές αντωνυμίες είναι πλεοναστικές («It rains», «It was Jhn wh bught the car»). Δεικτικές αντωνυμίες ή εκφράσεις. «Θέλω εκείνο/αυτό (το αυτοκίνητο)» (μακρινό/κοντινό). Στα Αγγλικά «demnstrative». Το «deictic» σημαίνει εκφράσεις των οποίων η σημασία εξαρτάται από το περιβάλλον (π.χ. «nw», «here»).

Επίλυση (reslutin) αναφορικών εκφράσεων Σε ποια οντότητα (προηγούμενη ή επόμενη) αναφέρεται μια αναφορική έκφραση; Μερικά συνήθως εύκολα και σίγουρα κριτήρια: Συμφωνία γένους, αριθμού, πτώσης. Δείτε στους J&M και τα περί «binding thery» στα Αγγλικά. Π.χ. «Jhn said that Bill bught him/himself a new car». Προτιμήσεις, δυσκολότερο να υπολογιστούν: Απόσταση: «Ο Γιάννης βρήκε έναν παλιό χάρτη στη ντουλάπα. Η Μαρία βρήκε έναν ακόμα παλιότερο στο μπαούλο. Έδειχνε [της Μαρίας] τη θέση ενός θησαυρού.» Περιορισμοί επιλογής ή/και γνώση του κόσμου: «Ο Γιάννης πήγε το αυτοκίνητο στο συνεργείο. Το άφησε για επισκευή.»

Επίλυση αναφορικών εκφράσεων συνέχεια Προτιμήσεις, δυσκολότερο να υπολογιστούν (συνέχεια): Παραλληλισμός: «Η Άννα πήγε με τη Μαρία για χορό. Η Ελένη πήγε μαζί της για ψώνια.» Συντακτικός ρόλος υποψηφίου: «Ο Γιάννης πήγε σε ένα μπαρ με το Νίκο. Ζήτησε [ποιος;] μια μπύρα.» Για επίλυση αγγλικών αντωνυμιών, πολύ γνωστός είναι ο αλγόριθμος του Hbbs (βλ. J&M). Εξετάζει και τα συντακτικά δέντρα της τρέχουσας και προηγούμενων προτάσεων. Συχνό baseline. Μπορούμε να χρησιμοποιήσουμε επιβλεπόμενη μάθηση. Ένα διάνυσμα για κάθε ζεύγος αναφορικών εκφράσεων. Ιδιότητες για τις παραπάνω προτιμήσεις συν π.χ. απόσταση διόρθωσης (για κύρια ονόματα), τύπος (πρόσωπο, εταιρεία, τοποθεσία), ιδιότητες από τη Θεωρία Επικέντρωσης (βλ. παρακάτω).

Θεωρία Επικέντρωσης (Centering Thery) Κάθε πρόταση (ή άλλο τμήμα) u n έχει ένα σύνολο C f (u n ) προς τα εμπρός κέντρων προσοχής (frward-lking centers). Κάθε μέλος του C f (u n ) είναι μια οντότητα του μοντέλου πραγματείας και εκφράζεται με ένα NP της u n. Αυτός ο αρύβαλλος βρέθηκε στη Δήλο. Ανάλογα με τους συντακτικούς ρόλους των NP τους, τα μέλη του C f (u n ) είναι λιγότερο ή περισσότερο περίοπτα (salient). Υποκείμενο > άμεσο αντικείμενο > έμμεσο αντικείμενο > Το πιο περίοπτο μέλος του C f (u n ) είναι το προτιμητέο (preferred) κέντρο c p (u n ) της u n. Το πιο περίοπτο μέλος του C f (u n 1 ) που εκφράζεται και στην u n είναι το προς τα πίσω κέντρο c b (u n ) (backwardlking center) της u n. Αυτός ο αρύβαλλος κατασκευάστηκε την αρχαϊκή περίοδο. Η αρχαϊκή περίοδος καλύπτει το διάστημα 700 480 π.χ.

Μεταβάσεις μεταξύ προτάσεων Συνέχεια (cntinue): c p u n = c b u n = c b (u n 1 ) Το c b u n = c b (u n 1 ) θεωρούμε ότι ισχύει, όταν το c b (u n 1 ) δεν ορίζεται. Αυτός ο αρύβαλλος βρέθηκε στη Δήλο. (cntinue) [Αυτός ο αρύβαλλος] κατασκευάστηκε την αρχαϊκή περίοδο. (cntinue) [Αυτός ο αρύβαλλος] ακολουθεί το μελανόμορφο ρυθμό. Ομαλή μετατόπιση: c p u n = c b u n c b (u n 1 ) Αυτός ο αρύβαλλος βρέθηκε στη Δήλο. (cntinue) [Αυτός ο αρύβαλλος] κατασκευάστηκε την αρχαϊκή περίοδο. (smth shift) Η αρχαϊκή περίοδος καλύπτει το διάστημα 700 480 π.χ. Διατήρηση (retain): c p u n c b u n = c b (u n 1 ) Ανώμαλη μετατόπιση: c p u n c b u n c b (u n 1 )

Μεταβάσεις μεταξύ προτάσεων συνέχεια NOCB: Κανένα μέλος του C f (u n 1 ) δεν εκφράζεται στην u n. Αυτός ο αρύβαλλος βρέθηκε στη Δήλο. (cntinue) [Αυτός ο αρύβαλλος] κατασκευάστηκε την αρχαϊκή περίοδο. (smth shift) Η αρχαϊκή περίοδος καλύπτει το διάστημα 700 480 π.χ. (NOCB) Αυτός ο αρύβαλλος είναι μελανόμορφος. Προτιμήσεις: cntinue > retain > smth > rugh > NOCB Χρήσιμες κατά την επίλυση αναφορικών εκφράσεων (βλ. παρακάτω) αλλά και στην παραγωγή κειμένων. Όταν εξετάζουμε διαδοχικές προτάσεις μιλάμε για τοπική συνεκτικότητα (lcal ή entity-based cherence). Ενώ όταν εξετάζουμε ολόκληρο το κείμενο (π.χ. δέντρο RST) μιλάμε για καθολική συνεκτικότητα.

Επίλυση αναφορικών εκφράσεων με CT Κανόνας 1: Αν κάποιο μέλος του C f (u n 1 ) εκφράζεται στην u n ως αντωνυμία, τότε και το c b u n πρέπει να εκφράζεται στην u n ως αντωνυμία. Κανόνας 2: Κατά την επίλυση αναφορικών εκφράσεων προτιμούμε cntinue > retain > smth > rugh > NOCB. Έχοντας απορρίψει πρώτα ερμηνείες που παραβιάζουν τον κανόνα 1 ή περιορισμούς γένους, αριθμού, πτώσης. Παράδειγμα: u 1 : Ο Γιάννης είδε ένα αυτοκίνητο στο κατάστημα. u 2 : Το [ποιο;] έδειξε [ποιος;] στο Βασίλη. u 3 : Το αγόρασε [ποιος;].

Επίλυση αναφορικών εκφράσεων συνέχεια u 1 : Ο Γιάννης είδε ένα αυτοκίνητο στο κατάστημα. C f u 1 ={Γιάννης, αυτοκίνητο, κατάστημα} c p u 1 =Γιάννης, c b u 1 =μη ορισμένο. u 2, 1 η ερμηνεία: Το έδειξε [ποιος;] στο Βασίλη. C f u 2 ={Γιάννης, αυτοκίνητο, Βασίλης} c p u 2 =Γιάννης, c b u 2 = Γιάννης. c b u 1 = μη ορισμένο. (cntinue) u 2, 2 η ερμηνεία: Το έδειξε [ποιος;] στο Βασίλη. C f u 2 ={Γιάννης, κατάστημα, Βασίλης} c p u 2 = Γιάννης, c b u 2 = Γιάννης. c b u 1 = μη ορισμένο. (cntinue) Και με τις δύο ερμηνείες cntinue. Θεωρούμε ότι προτιμάται η 1 η, επειδή το αυτοκίνητο ήταν πιο περίοπτο στο C f u 1.

Επίλυση αναφορικών εκφράσεων συνέχεια Άρα u 2 : Το έδειξε [ο Γιάννης] στο Βασίλη. C f u 2 ={Γιάννης, αυτοκίνητο, Βασίλης} c p u 2 = Γιάννης, c b u 2 = Γιάννης. c b u 1 = μη ορισμένο. (cntinue) u 3, 1 η ερμηνεία: Το αγόρασε [ποιος;]. C f u 3 ={Γιάννης, αυτοκίνητο} c p u 3 = Γιάννης, c b u 3 = Γιάννης. c b u 2 = Γιάννης. (cntinue) u 3, 2 η ερμηνεία: Το αγόρασε [ποιος;]. C f u 3 ={Βασίλης, αυτοκίνητο} c p u 3 = Βασίλης, c b u 3 = αυτοκίνητο. c b u 2 = Γιάννης. (rugh shift) Προτιμάται η 1 η (Γιάννης). Δε δουλεύει πάντα σωστά. Βλ. J&M. Δοκιμάστε και ερμηνείες όπου το «το» αναφέρεται στο κατάστημα.

Βιβλιογραφία Jurafsky & Martin: κεφάλαιο 21. Προαιρετική μελέτη: ενότητα 21.9. Μελετήστε επίσης (εντός εξεταστέας ύλης) το άρθρο «Mdeling Lcal Cherence: An Entity-Based Apprach» των R. Barzilay και M. Lapata, Cmputatinal Linguistics, 34(1), 2008. http://www.aclweb.rg/anthlgy/j08-1001 Όσοι ενδιαφέρεστε ιδιαίτερα, μπορείτε να διαβάσετε επίσης τα βιβλία: Frm Discurse t Lgic των H. Kamp και U. Reyle, Springer, 1993. The Thery and Practice f Discurse Parsing and Summarizatin του D. Marcu, MIT Press, 2000. 27