«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα



Σχετικά έγγραφα
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 5 ο : Σημασιολογική ανάλυση. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΣΗΜΑΣΙΟΛΟΓΙΑ - SEMANTICS

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 10 ο : Αποσαφήνιση εννοιών λέξεων. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

HY118-Διακριτά Μαθηματικά

ΚΑΤΗΓΟΡΗΜΑΤΙΚΟΣ ΛΟΓΙΣΜΟΣ Ι

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

Συστήματα Γνώσης. Θεωρητικό Κομμάτι Μαθήματος Ενότητα 2: Βασικές Αρχές Αναπαράστασης Γνώσης και Συλλογιστικής

4. Ο,τιδήποτε δεν ορίζεται με βάση τα (1) (3) δεν είναι προτασιακός τύπος.

Κατηγορηματικός Λογισμός (ΗR Κεφάλαιο )

Μοντέλα γλωσσικής επεξεργασίας: σύνταξη

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΤΕΧΝΟΓΛΩΣΣΙΑ VIII ΛΟΓΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΔΙΔΑΣΚΟΝΤΕΣ: ΜΑΪΣΤΡΟΣ ΓΙΑΝΗΣ, ΠΑΠΑΚΙΤΣΟΣ ΕΥΑΓΓΕΛΟΣ ΑΣΚΗΣΗ: ΔΙΟΡΘΩΣΗ ΕΚΦΡΑΣΕΩΝ (Β )

HY118-Διακριτά Μαθηματικά

Περιεχόμενα 1 Πρωτοβάθμια Λογική Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά και Πληροφορικής Μαθηματικά Πανεπιστήμιο ΙΙ Ιωαννίνων ) / 60

Μάθημα: Δ3. Δίκτυα Γνώσης και Σημασιολογικός Ιστός. Διάλεξη 02 & 03. Δρ. Γεώργιος Χρ. Μακρής

Τεχνητή Νοημοσύνη. 9η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Μάθημα: Δ3. Δίκτυα Γνώσης και Σημασιολογικός Ιστός. Διάλεξη 01 & 02. Δρ. Γεώργιος Χρ. Μακρής

Τεχνητή Νοημοσύνη. 21η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΑΡΣΗ ΑΜΦΙΣΗΜΙΑΣ ΛΕΞΕΩΝ (ΑΠΟΣΑΦΗΝΙΣΗ ΕΝΝΟΙΑΣ ΛΕΞΕΩΝ) WORD SENSE DISAMBIGUATION

Μεταγλωττιστές. Γιώργος Δημητρίου. Μάθημα 8 ο. Πανεπιστήμιο Θεσσαλίας - Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών

Επικοινωνία Ανθρώπου Υπολογιστή. Β3. Κατανόηση φυσικής γλώσσας

Υπολογιστικά & Διακριτά Μαθηματικά

Λογική. Προτασιακή Λογική. Λογική Πρώτης Τάξης

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Ενότητα 11: Λογική πρώτης τάξης. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Κεφάλαιο 4 Σημασιολογία μιας Απλής Προστακτικής Γλώσσας

HY118-Διακριτά Μαθηματικά

HY118-Διακριτά Μαθηματικά

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

ΠΛΗ 20, 3 η ΟΣΣ (Κατηγορηματική Λογική)

HY118-Διακριτά Μαθηματικά. Προτασιακός Λογισμός. Προηγούμενη φορά. Βάσεις της Μαθηματικής Λογικής. 02 Προτασιακός Λογισμός

Τεχνητή Νοημοσύνη ( )

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος.

Στοιχεία Κατηγορηματικής Λογικής

ΠΑΙΓΝΙΑ Παιχνίδια Γενική Θεώρηση μεγιστοποιήσει την πιθανότητά

Στοιχεία Κατηγορηματικής Λογικής

ΤΕΙ ΠΕΛΟΠΟΝΝΗΣΟΥ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ Τ.Ε.

Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Γλωσσική Τεχνολογία, Διδάσκων: Ι. Ανδρουτσόπουλος

ΣΧΕΣΙΑΚΟΣ ΛΟΓΙΣΜΟΣ. Tο Σχεσιακό Μοντέλο Σελίδα 1

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 4 ο : Συντακτική ανάλυση. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Λύσεις Σειράς Ασκήσεων 1

Μεταγλωττιστές. Γιώργος Δημητρίου. Μάθημα 1 ο. Πανεπιστήμιο Θεσσαλίας - Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών

Pascal, απλοί τύποι, τελεστές και εκφράσεις

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

8 η Ενότητα. Κατάκτηση του σημασιολογικού τομέα

Προτασιακή Λογική. Τμήμα Μηχανικών Πληροφορικής ΤΕ ΤΕΙ Ηπείρου Γκόγκος Χρήστος

Γνώση. Γνώση (knowledge) είναι ο κοινός παράγοντας (π.χ. κανόνες) που περιγράφει συνοπτικά τις συσχετίσεις μεταξύ των δεδομένων ενός προβλήματος.

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΣΥΝΤΑΞΗ: ΟΡΘΟΛΟΓΙΚΗ ΠΡΟΣΕΓΓΙΣΗ (FORMAL SYNTAX)

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 11 ο : Αυτόματη παραγωγή περιλήψεων. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Διακριτά Μαθηματικά. Ενότητα 6: Προτασιακός Λογισμός

Εργαστήριο Σημασιολογικού Ιστού

Τεχνητή Νοημοσύνη. 7η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Πληροφορική ΙΙ Θεματική Ενότητα 5

Μαθηματική Λογική και Λογικός Προγραμματισμός

HY118- ιακριτά Μαθηµατικά

ΠΛΗ 20, 3 η ΟΣΣ (Κατηγορηματική Λογική)

Description Logics. Γεώργιος Χρ. Μακρής MSc, MEd

Στοιχεία Κατηγορηματικής Λογικής

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Λογική. Ενότητα 1: Εισαγωγή. Δημήτρης Πλεξουσάκης Τμήμα Επιστήμης Υπολογιστών

ΚΕΦΑΛΑΙΟ 8 Η ΓΛΩΣΣΑ PASCAL

Προγραμματισμός Ηλεκτρονικών Υπολογιστών 1

Ασκήσεις μελέτης της 8 ης διάλεξης

\5. Κατηγορηματικός Λογισμός (Predicate Calculus)

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα

HY118- ιακριτά Μαθηµατικά

Τεχνητή Νοημοσύνη. 23η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ΛΟΓΙΣΜΟΣ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ, ΕΣΠΙ 1

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

Επαγωγικός Λογικός Προγραμματισμός και Aσαφείς Λογικές Περιγραφής

ΑΣΚΗΣΗ 11: ΕΠΕΞΕΡΓΑΣΙΑ ΦΥΣΙΚΗΣ ΓΛΩΣΣΑΣ - ΣΥΝΤΑΚΤΙΚΗ ΑΝΑΛΥΣΗ (PARSING)

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας

Τεχνογλωσσία 8 Β' Εξάμηνο Λογικός Προγραμματισμός Prolog

ΣΗΜΑΣΙΟΛΟΓΙΚΑ ΔΙΚΤΥΑ (SEMANTIC NETWORKS)

Μηχανική Μάθηση Μερωνυµιών για Αναγνώριση Γεγονότων

Γνώση. Γνώση (knowledge) είναι ο κοινός παράγοντας (π.χ. κανόνες) που περιγράφει συνοπτικά τις συσχετίσεις μεταξύ των δεδομένων ενός προβλήματος.

Μαθηματική Λογική και Λογικός Προγραμματισμός

Κεφάλαιο 3 Η Σημασιολογία των Γλωσσών Προγραμματισμού

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Λογική. Δημήτρης Πλεξουσάκης. 5ο μέρος σημειώσεων: Κατηγορηματικός Λογισμός (Predicate Calculus)

Θέματα Προγραμματισμού Η/Υ

Στοιχεία Προτασιακής Λογικής

Βασικοί τύποι δεδομένων (Pascal) ΕΠΑ.Λ Αλίμου Γ Πληροφορική Δομημένος Προγραμματισμός (Ε) Σχολ. Ετος Κων/νος Φλώρος

Λογικός Προγραμματισμός

Προγραμματισμός Η/Υ. Ενότητα 4: Εντολές Επιλογής

Αναπαράσταση Γνώσης. Αναπαράσταση Γνώσης με Λογική. Προτασιακή Λογική Λογική Πρώτης Τάξης

Λογική Δημήτρης Πλεξουσάκης Ασκήσεις στον Κατηγορηματικό Λογισμό Τμήμα Επιστήμης Υπολογιστών

ΔΙΑΛΕΞΗ ΙΙ ΕΝΑ ΒΗΜΑ ΠΑΡΑΠΑΝΩ ΜΕ SCRATCH ΕΠΙΛΕΓΩΝΤΑΣ & ΕΠΑΝΑΛΑΜΒΑΝΟΝΤΑΣ

ΑΡΧΗ 1ης ΣΕΛΙΔΑΣ. Α2. Να αναφέρετε ονομαστικά: i) τα αλγοριθμικά κριτήρια ii) τους τρόπους αναπαράστασης αλγορίθμου. (μονάδες 10)

Τεχνογλωσσία 8 Β' Εξάμηνο. Λογικός Προγραμματισμός Prolog. Άσκηση: Διορθωτής Εκφράσεων

Δομημένος Προγραμματισμός

K15 Ψηφιακή Λογική Σχεδίαση 3: Προτασιακή Λογική / Θεωρία Συνόλων

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ

Μεταγλωττιστές. Γιώργος Δημητρίου. Μάθημα 9 ο

Συστήματα κ Τεχνολογίες Γνώσης Εργασίες στην Επεξεργασία Φυσικής Γλώσσας

Σπουδαστές Γιαννουλάκης Αντρέας Α.Μ Τσουρουνάκης 'Αγγελος Α.Μ Μουτουσίδου Πόπη Α.Μ Εισηγητής: Ταφιάδης Χρ.

ΕΠΛ 434: Λογικός Προγραμματισμός

Μεταγλωττιστές. Σημασιολογική Ανάλυση. Εργαστήριο 9. Διδάσκοντες: Δρ. Γεώργιος Δημητρίου Δρ. Άχμεντ Μάχντι

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Λογική. Δημήτρης Πλεξουσάκης

Transcript:

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα Σεμινάριο 5: Σημασιολογική Ανάλυση Ευάγγελος Καρκαλέτσης, Γεώργιος Πετάσης Εργαστήριο Τεχνολογίας Γνώσεων & Λογισμικού, Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών, Ε.Κ.Ε.Φ.Ε. Δημόκριτος Τηλ.: 210-6503197, Fax: 210-6532175, {vangelis, petasis}@iit.demokritos.gr Ακαδημαϊκό Έτος: 2013 2014 Διεπιστημονικό-Διαπανεπιστημιακό ΠΜΣ «Τεχνογλωσσία», VIII κύκλος, 2013 2014

«Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση < 1 > Οι διαφάνειες αυτού του μαθήματος βασίζονται στο κεφάλαιο 17 του βιβλίου: «Speech and Language Processing» των D. Jurafsky και J.H. Martin, 2η έκδοση, Pearson, 2009 Το βιβλίο δεν απαιτείται για το μάθημα αυτό. Μερικά παραδείγματα βασίζονται σε διαφάνειες του Δρ. Ίων Ανδρουτσόπουλου, ΟΠΑ. http://www.aueb.gr/users/ion/

Σημασιολογία Ορισμός: Είναι η επιστημονική μελέτη του γλωσσικού νοήματος Τι είναι «σημασία» «έννοια» και «νόημα» Αγγλικά: What is the meaning of the sentence X Ελληνικά: Ποιο είναι το νόημα / η έννοια / η σημασία της πρότασης Χ «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 2

Σημασία (1) Μέχρι στιγμής, έχουμε επικεντρωθεί στην δομή της γλώσσας, και όχι στο τι σημαίνουν τα στοιχεία της Είδαμε ότι οι λέξεις μπορεί να έχουν διαφορετική σημασία, ανάλογα με το περιβάλλον μέσα στο οποίο έχουν χρησιμοποιηθεί «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 3

Σημασία (2) Καθημερινές εργασίες που χρειάζονται σημασιολογική ανάλυση: Απάντηση ερωτήματος σε διαγώνισμα Γνώση θέματος, και πώς συνήθως απαντώνται Παραγγελία φαγητού σε εστιατόριο διαβάζοντας τον κατάλογο, εκτέλεση συνταγής Γνώση σχετική με φαγητό, την προετοιμασία, εστιατόρια, Αναγνώριση του ότι έχεις προσβληθεί Εκμάθηση χρήσης λογισμικού διαβάζοντας το εγχειρίδιο Γνώση σχετική με Η/Υ, εφαρμογές, GUI, «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 4

Σημασιολογική ανάλυση Η μετατροπή μιας πρότασης φυσική γλώσσας σε μια σημασιολογική αναπαράσταση (ΣΑ) Η οποία αποτελείται από «πράγματα» που χρησιμοποιούνται για την αναπαράσταση καθημερινής, συνηθισμένης γνώσης του κόσμου «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 5

I have a car Πρωτοβάθμια Κατηγορηματική Λογική (First-Order Logic) Σημασιολογικό Δίκτυο (Semantic Network) Διάγραμμα Εννοιολογικής Εξάρτησης (Conceptual Dependency Diagram) Αναπαράσταση με Πλαίσια (Frame-based Representation) «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 6

Σημασιολογικές αναπαραστάσεις (1) Συνδέουν γλωσσικές μορφές με γνώση για τον κόσμο Διττή αναπαράσταση: Τι είναι; Σημασίας για την πρόταση Κατάστασης κάποιου κόσμου Οτιδήποτε εξυπηρετεί τους σκοπούς ενός προγράμματος που εκτελεί σημασιολογική ανάλυση «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 7

Σημασιολογικές αναπαραστάσεις (2) Θα καλύψουμε: Ποια είναι η σημασία μιας λέξης Πώς μπορούμε να αναπαραστήσουμε την σημασία Τι φορμαλισμοί μπορούν να χρησιμοποιηθούν Γλώσσες αναπαράστασης σημασίας «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 8

Αναπαράσταση σημασίας Επιθυμητά στοιχεία: Επαληθευσιμότητα (Verifiability) Σαφής Αναπαράσταση (Unambiguous Representation) Κανονική Μορφή (Canonical Form) Συμπερασμός (Inference) Εκφραστικότητα (Expressiveness) «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 9

Επαληθευσιμότητα (1) Η πλέον στοιχειώδης ιδιότητα: Ποια η σχέση μεταξύ της έννοιας της πρότασης, και του κόσμου, όπως τον ξέρουμε; Πρέπει να μπορούμε να καθορίσουμε το αληθές της αναπαράστασης Ένα σύστημα πρέπει να μπορεί να συγκρίνει, ταιριάζει: Την σημασιολογική αναπαράσταση με μια βάση γνώσης (ΒΓ) Η οποία περιέχει πληροφορία για τον κόσμο «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 10

Επαληθευσιμότητα (2) Does Maharani serve vegetarian food? Αν υποθέσουμε ότι η πρόταση σημαίνει: Maharani serves vegetarian food Μπορούμε να έχουμε την αναπαράσταση: Serves(Maharani, vegetarian food) Η οποία πρέπει να συγκριθεί με την βάση γνώσης Η οποία περιέχει γεγονότα για εστιατόρια Αν βρεθεί ταίριασμα «Ναι», αλλιώς «Όχι» Επαληθευσιμότητα: ικανότητα σύγκρισης μιας αναπαράστασης με μια βάση γνώσης για κάποιο κόσμο «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 11

Σαφής αναπαράσταση (1) Μια πρόταση μπορεί να έχει διαφορετικές σημασιολογικές αναπαραστάσεις Κάθε σημασιολογική αναπαράσταση περιγράφει μια σημασία Ανεξάρτητα από την αμφισημία της εισόδου, η τελική αναπαράσταση της σημασίας δεν πρέπει να είναι αμφίσημη Ενδιάμεσες αναπαραστάσεις μπορεί να φέρουν αμφισημία I wanna eat someplace that s close to ICSI. «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 12

Σαφής αναπαράσταση (2) Σχετική έννοια είναι και η ασάφεια (vagueness) Η σημασιολογική αναπαράσταση δεν προσδιορίζει επακριβώς το πραγματικό γεγονός «Θέλω να φάω Ιταλικό φαγητό» Δεν προκύπτουν πολλαπλές αναπαραστάσεις λόγω ασάφειας Όπως στην περίπτωση της αμφισημίας Η ασάφεια μπορεί να είναι αποδεκτή για κάποιες εφαρμογές Θεμιτή η ασάφεια στην σημασιολογική αναπαράσταση «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 13

I went to the bank. Ασάφεια ή αμφισημία Bank: τράπεζα, όχθη Αυτός είναι ψηλός. Είναι ζεστό. «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 14

Κανονική μορφή (1) Πολλαπλές προτάσεις εισόδου μπορεί να έχουν την ίδια σημασία Does Maharani have vegetarian dishes? Do they have vegetarian food at Maharani? Are vegetarian dishes served at Maharani? Does Maharani serve vegetarian fare? Εναλλακτική: Τέσσερις σημασιολογικές αναπαραστάσεις Αποθήκευση όλων των δυνατών αναπαραστάσεων στην βάση γνώσης (ΒΓ) «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 15

Κανονική μορφή (2) Λύση: ανάθεση σε όλες τις εισόδους με την ίδια σημασία, της ίδιας σημασιολογ. Αναπαράστασης Είναι εύκολο; Όχι! vegetarian fare, vegetarian dishes, vegetarian food Σημαίνουν το ίδιο πράγμα σε αυτό το περιβάλλον χρήσης Have, serve Είναι ισοδύναμα, άσχετα με την διαφορετική σύνταξη Τι μπορούμε να κάνουμε; «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 16

Παραγωγή κανονικής μορφής Αξιοποίηση θησαυρών για την συστηματική εξαγωγή ΣΑ Π.χ. έννοιες λέξεων (word senses) Food Dish Fare Υπάρχει κάποια κοινή έννοια; Αξιοποίηση συντακτικών δομών για την συστηματική εξαγωγή ΣΑ [S [NP Maharani] serves [NP vegetarian dishes]] [S [NP vegetarian dishes] are served at [NP Maharani]] «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 17

Συμπερασμός (1) Ένα πιο σύνθετο ερώτημα: Can vegetarians eat at Maharani? Αντί: Does Maharani serve vegetarian food? Γιατί έχουν την ίδια απάντηση; Μπορούμε να χρησιμοποιήσουμε την ίδια ΣΑ; (Όχι) Δεν σημαίνουν το ίδιο πράγμα! Απαντάμε το ίδιο επειδή: Ξέρουμε τι τρώνε οι χορτοφάγοι Ξέρουμε τι σερβίρουν τα χορτοφαγικά εστιατόρια Κάνουμε την σύνδεση Συμπερασμός «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 18

Συμπερασμός (2) Εξαγωγή συμπερασμάτων για την αλήθεια κατηγορημάτων (propositions) που δεν είναι ρητά εκφρασμένα στην ΓΒ Δεν περιέχονται αυτούσια στην ΓΒ serve(maharani, VegetarianFood) CanEat(Vegetarians, AtMaharani) «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 19

Εκφραστικότητα Είναι επιθυμητό μια ΣΑ να μπορεί να περιγράψει μια ευρεία γκάμα από γεγονότα για τον κόσμο Μια ΣΑ δεν πρέπει να θέτει σημαντικούς περιορισμούς Ιδανικά θέλουμε μια ΣΑ ικανή να αναπαραστήσει οποιαδήποτε «λογική» πρόταση Δεν είναι εύκολο να βρεθεί μια τέτοια ΣΑ Υπάρχουν ωστόσο ΣΑ που είναι αρκετά εκφραστικές, επιτρέποντας την μοντελοποίηση αρκετών πραγμάτων Πρωτοβάθμια Κατηγορηματική Λογική (First-Order Logic) «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 20

Σημασιολογική δομή γλώσσας (Meaning Structure of Language) Αφορά τρόπους με τους οποίους η φυσική γλώσσα μεταφέρει σημασία Οι φυσικές γλώσσες Χρησιμοποιούν δομές κατηγόρημα-όρισμα (predicate argument structure) Χρησιμοποιούν μεταβλητές Χρησιμοποιούν ποσοδείκτες (quantifiers) Χρησιμοποιούν συνθετική σημασιολογία (compositional semantics) Η σημασία κάθε έκφρασης ΦΓ υπολογίζεται ως συνάρτηση των σημασιών των επιμέρους μερών της «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 21

Συνθετικότητα (compositionality) Η αρχή της συνθετικότητας είναι σημαντική στην σημασιολογία: Η σημασία μιας έκφρασης είναι αυστηρά μια συνάρτηση των σημασιών των επιμέρους μερών της Επιτρέπει την δημιουργία ΣΑ με αυξητικό τρόπο (incrementally) Ο κατηγορικός λογισμός (predicate logic) δεν τηρεί αυτή την αρχή «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 22

Δομή κατηγόρημα-όρισμα (1) Αναπαριστά έννοιες (concepts) και σχέσεις μεταξύ τους Κάποιες λέξεις δρουν σαν ορίσματα, και κάποιες σαν κατηγορήματα: Ουσιαστικά: έννοιες ή ορίσματα κόκκινη(μπάλα) Επίθετα, επιρρήματα, ρήματα: κατηγορήματα κόκκινη(μπάλα) «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 23

Δομή κατηγόρημα-όρισμα (2) Τα ρήματα υπαγορεύουν περιορισμούς: Αριθμό, γένος, πτώση Γραμματικές κατηγορίες Θέση των φράσεων που τα συνοδεύουν I want Italian food. I want to spend less than five dollars. I want it to be close by here. NP want NP NP want Inf-VP NP want NP Inf-VP Subcategorisation frames «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 24

Δομή κατηγόρημα-όρισμα (3) I want Italian food. I want to spend less than five dollars. I want it to be close by here. NP want NP NP want Inf-VP NP want NP Inf-VP Το κατηγόρημα έχει δύο ορίσματα Και τα δύο ορίσματα είναι τύπου ΟΦ (NP) Το πρώτο όρισμα είναι πριν το ρήμα, και έχει τον ρόλο υποκειμένου Το δεύτερο όρισμα είναι μετά το ρήμα, και έχει ρόλο του (άμεσου) αντικειμένου «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 25

Σημασιολογικοί ρόλοι Σημασιολογικοί/θεματικοί ρόλοι (semantic/thematic roles): συμμετέχουν σε ένα γεγονός Ο υποκινητής μιας ενέργειας, ο αποδέκτης μιας ενέργειας, το αντικείμενο που μεταφέρει μια ενέργεια, κλπ. Σημασιολογικοί περιορισμοί (selectional restrictions): περιορίζουν τους τύπους των ορισμάτων Ο τρομοκράτης δολοφόνησε τον βουλευτή *Η αράχνη δολοφόνησε την μύγα Subcategorisation ρημάτων: Επιτρέπουν την αντιστοίχιση ορισμάτων από την επιφανειακή δομή με τον συντακτικό τους ρόλο Οι προθέσεις συμπεριφέρονται ανάλογα «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 26

Ένα μοντέλο για τον κόσμο των εστιατορίων Domain Matthew, Franco, Katie and Caroline Frasca, Med, Rio ItalianCuisine, MexicanCuisne, EclecticCuisine Noisy Frasca, Med and Rio are noisy Likes Matthew likes the Med Katie likes the Med and Rio Franco likes Frasca Caroline likes the Med and Rio Serves Med serves eclectic Rio serves Mexican Frasca serves Italian D = a, b, c, d, e, f, g, h, i, j a, b, c, d e, f, g h, i, j Noisy = {e, f, g} Likes = a, f, c, f, c, g, b, e, d, f, d, g Serves = {e, j, f, i, e, h} Αντικείμενα: στοιχεία του κόσμου Ιδιότητες: σύνολα από στοιχεία του κόσμου Σχέσεις: σύνολα από πλειάδες από στοιχεία του κόσμου «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 27

Πρωτοβάθμιος Κατηγορηματικός Λογισμός (1) First-Order Predicate Calculus: Παρέχει στέρεα υπολογιστική βάση για επαληθευσιμότητα, συμπερασμό και εκφραστικότητα Επιτρέπει τον προσδιορισμό της αλήθειας/ψεύδους ενός κατηγορήματος Επιτρέπει την συνθετικότητα της σημασίας Επιτρέπει την απάντηση ερωτημάτων (μέσω μεταβλητών) Επιτρέπει συμπερασμό «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 28

Πρωτοβάθμιος Κατηγορηματικός Λογισμός (2) «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 29

Όροι (terms): Σταθερές: Maharani ΠΚΛ: Σύνταξη Συναρτήσεις: LocationOf(Maharani) Μεταβλητές: x in LocationOf(x) Κατηγορήματα (predicates): σχέσεις μεταξύ αντικειμένων Serves(Maharani, VegetarianFood) Λογικοί τελεστές: επιτρέπουν σύνθεση σημασίας I only have $5 and I don t have a lot of time Have I, $5 Have(I, LotsOfTime) «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 30

ΠΚΛ: Σημασιολογία Εκφράσεις σε ΠΚΛ μπορούν να σχετιστούν με τις τιμές Αληθές (True) ή Ψευδές (False) «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 31

Μεταβλητές και ποσοδείκτες Existential ( ): Υπάρχει A restaurant that serves Mexican food near UMD x Restaurant x Serves(x. MexicanFood) Near(LocationOf x, LocationOf UMD ) Universal ( ): Για κάθε All vegetarian restaurants serve vegetarian food x VegeterianRestaurant x Serves(x. VegeterianFood) «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 32

Παραδείγματα Σε όλες τις γάτες αρέσει το γάλα. ( x)(iscat x Likes x, Milk ) Υπάρχει μια γάτα που της αρέσει το γάλα. ( x)(iscat x Likes x, Milk ) Προσοχή: ο τύπος ( x)(iscat x Likes x, Milk ) λέει «Υπάρχει ένα x που: (i) δεν είναι γάτα ή (ii) αν είναι γάτα του αρέσει το γάλα» Η Ψίτα συμπαθεί όλους τους σκύλους. ( x)(isdog x Likes Psita, x ) Προσοχή: ο τύπος ( x)(isdog x Likes Psita, x ) λέει «Τα πάντα είναι σκύλοι και αρέσουν στην Ψίτα». Υπάρχει μια γάτα που συμπαθεί όλους τους σκύλους. ( x)(iscat x ( y) IsDog y Likes x, y ) «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 33

Γιατί χρειαζόμαστε μεταβλητές; Προτάσεις με το ρήμα eat I ate. I ate a turkey sandwich. I ate a turkey sandwich at my desk. I ate at my desk. I ate lunch. I ate a turkey sandwich for lunch. I ate a turkey sandwich for lunch at my desk. Επτά διαφορετικές αναπαραστάσεις: Eating 1 (Speaker) Eating 2 (Speaker, TurkeySandwich) Eating 3 (Speaker, TurkeySandwich, Desk) Eating 4 (Speaker, Desk) Eating 5 (Speaker, Lunch) Eating 6 (Speaker, TurkeySandwich, Lunch) Eating 7 (Speaker, TurkeySandwich, Lunch, Desk) «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 34

Λύση με μεταβλητές Eating(v,w,x,y) Τα παραδείγματα πλέον γίνονται: ( w,x,y) Eating(Speaker,w,x,y) ( x,y) Eating(Speaker,TurkeySandwich,x,y) ( x) Eating(Speaker,TurkeySandwich,x,Desk) ( w,x) Eating(Speaker,w,x,Desk) ( w,y) Eating(Speaker,w,Lunch,y) ( y) Eating(Speaker,TurkeySandwich,Lunch,y) Eating(Speaker,TurkeySandwich,Lunch,Desk) «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 35

Συμπερασμός (1) Το κύριο κίνητρο για την χρήση της λογικής σαν ΣΑ, είναι επειδή επιτρέπει στέρεους (sound) και πλήρεις (complete) μεθόδους συμπερασμού Στην κατηγορική λογική, ένα κατηγόρημα P, που περιέχει τις μεταβλητές Q 1,, Q n, είναι έγκυρο αν το P είναι αληθές για όλες τις αληθείς τιμές των Q 1,, Q n «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 36

Συμπερασμός (2) Αν υποθέσουμε ότι έχουμε: Ένα σύνολο προτάσεων S 1,, S n Και τις αντίστοιχες ΣΑ P 1, P n Και θέλουμε να διαπιστώσουμε αν ένα Q είναι έγκυρο Αρκεί να ελέγξουμε αν το ακόλουθο είναι λογικά έγκυρο: P 1 P n Q «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 37

Σημειογραφία λ Επέκταση της σύνταξης του ΠΚΛ με εκφράσεις της μορφής: λ. x. P(x) Τελεστής που ενεργεί πάνω στην έκφραση: (λ-reduction) λ. x. P x P(A) A λ. x. λ. y. Near x, y Bacaro λ. y. Near(Bacaro, y) «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 38

Σύνταξη και Σημειολογία Δύο τρόποι συνδυασμού μεταξύ συντακτικής ανάλυσης και σημασιολογικής ανάλυσης 1. Οι δύο αναλύσεις γίνονται ταυτόχρονα, εμπλουτίζοντας την γραμματική με σημασιολογία 2. Η συντακτική ανάλυση πραγματοποιείται ανεξάρτητα, και με βάση το συντακτικό δέντρο δημιουργείται η σημασιολογική ερμηνεία «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 39

Σημασιολογία απλών προτάσεων «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 40

Υπολογισμός ΣΑ Ουσιαστικά μεταφράζουμε από μια φυσική σε μια τεχνητή γλώσσα, με αυστηρά ορισμένη σημασιολογία Αναγωγή λ «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 41

Σημασιολογικές προσαρτήσεις «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 42

Σημασιολογικές σχέσεις λέξεων Ομώνυμα: ίδια γραφή, διαφορετικές σημασίες Bank, γράμμα, άπειρος Συνώνυμα: διαφορετικές λέξεις, με περίπου την ίδια σημασία Αυτοκίνητο αμάξι, big large Υπερώνυμο υπώνυμο: ευρύτερη στενότερη έννοια Όχημα αυτοκίνητο, θηλαστικό άνθρωπος Αντίθετα: αντίθετη έννοια Μεγάλος μικρός «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 43

Wordnet Το δημοφιλέστερο ιεραρχικά οργανωμένο λεξικό της Αγγλικής (http://wordnet.princeton.edu/) Κάθε έννοια παριστάνεται από ένα σύνολο συνωνύμων (synset) που μπορούν να έχουν αυτή την έννοια Ιεραρχίες υπερωνύμων-υπωνύμων ανά μέρος του λόγου (ουσιαστικά, επίθετα, ρήματα, επιρρήματα) Παρέχει και άλλες σχέσεις Π.χ. μερώνυμα (το «παράθυρο» μέρος του «σπιτιού») «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 44

Αποσαφήνιση εννοιών λέξεων Επιλογή της σωστής έννοιας μιας λέξης σε ένα κείμενο (word sense disambiguation WSD) Χρήσιμο και σε άλλες εφαρμογές Επιλογή από τις δυνατές έννοιες μιας λέξης (Wordnet), ή κατασκευή των δυνατών εννοιών μιας λέξης (sense induction) Δημοφιλής η χρήση μηχανικής μάθησης «Τεχνογλωσσία» VIII, Σεμινάριο 5, Σημασιολογική Ανάλυση 45