ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 5 ο : Σημασιολογική ανάλυση. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: 2012 2013



Σχετικά έγγραφα
«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΣΗΜΑΣΙΟΛΟΓΙΑ - SEMANTICS

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 10 ο : Αποσαφήνιση εννοιών λέξεων. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

HY118-Διακριτά Μαθηματικά

ΚΑΤΗΓΟΡΗΜΑΤΙΚΟΣ ΛΟΓΙΣΜΟΣ Ι

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Συστήματα Γνώσης. Θεωρητικό Κομμάτι Μαθήματος Ενότητα 2: Βασικές Αρχές Αναπαράστασης Γνώσης και Συλλογιστικής

Μοντέλα γλωσσικής επεξεργασίας: σύνταξη

4. Ο,τιδήποτε δεν ορίζεται με βάση τα (1) (3) δεν είναι προτασιακός τύπος.

Κατηγορηματικός Λογισμός (ΗR Κεφάλαιο )

HY118-Διακριτά Μαθηματικά

Περιεχόμενα 1 Πρωτοβάθμια Λογική Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά και Πληροφορικής Μαθηματικά Πανεπιστήμιο ΙΙ Ιωαννίνων ) / 60

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Μάθημα: Δ3. Δίκτυα Γνώσης και Σημασιολογικός Ιστός. Διάλεξη 02 & 03. Δρ. Γεώργιος Χρ. Μακρής

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΑΡΣΗ ΑΜΦΙΣΗΜΙΑΣ ΛΕΞΕΩΝ (ΑΠΟΣΑΦΗΝΙΣΗ ΕΝΝΟΙΑΣ ΛΕΞΕΩΝ) WORD SENSE DISAMBIGUATION

Μάθημα: Δ3. Δίκτυα Γνώσης και Σημασιολογικός Ιστός. Διάλεξη 01 & 02. Δρ. Γεώργιος Χρ. Μακρής

Μεταγλωττιστές. Γιώργος Δημητρίου. Μάθημα 8 ο. Πανεπιστήμιο Θεσσαλίας - Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών

Τεχνητή Νοημοσύνη. 9η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Υπολογιστικά & Διακριτά Μαθηματικά

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 11 ο : Αυτόματη παραγωγή περιλήψεων. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 4 ο : Συντακτική ανάλυση. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Λογική. Προτασιακή Λογική. Λογική Πρώτης Τάξης

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Ενότητα 11: Λογική πρώτης τάξης. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Κεφάλαιο 4 Σημασιολογία μιας Απλής Προστακτικής Γλώσσας

HY118-Διακριτά Μαθηματικά

HY118-Διακριτά Μαθηματικά

ΤΕΧΝΟΓΛΩΣΣΙΑ VIII ΛΟΓΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΔΙΔΑΣΚΟΝΤΕΣ: ΜΑΪΣΤΡΟΣ ΓΙΑΝΗΣ, ΠΑΠΑΚΙΤΣΟΣ ΕΥΑΓΓΕΛΟΣ ΑΣΚΗΣΗ: ΔΙΟΡΘΩΣΗ ΕΚΦΡΑΣΕΩΝ (Β )

ΠΛΗ 20, 3 η ΟΣΣ (Κατηγορηματική Λογική)

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Επικοινωνία Ανθρώπου Υπολογιστή. Β3. Κατανόηση φυσικής γλώσσας

HY118-Διακριτά Μαθηματικά. Προτασιακός Λογισμός. Προηγούμενη φορά. Βάσεις της Μαθηματικής Λογικής. 02 Προτασιακός Λογισμός

Τεχνητή Νοημοσύνη ( )

Τεχνητή Νοημοσύνη. 21η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Στοιχεία Κατηγορηματικής Λογικής

ΠΑΙΓΝΙΑ Παιχνίδια Γενική Θεώρηση μεγιστοποιήσει την πιθανότητά

Στοιχεία Κατηγορηματικής Λογικής

ΤΕΙ ΠΕΛΟΠΟΝΝΗΣΟΥ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ Τ.Ε.

ΣΧΕΣΙΑΚΟΣ ΛΟΓΙΣΜΟΣ. Tο Σχεσιακό Μοντέλο Σελίδα 1

Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Γλωσσική Τεχνολογία, Διδάσκων: Ι. Ανδρουτσόπουλος

Λύσεις Σειράς Ασκήσεων 1

Pascal, απλοί τύποι, τελεστές και εκφράσεις

8 η Ενότητα. Κατάκτηση του σημασιολογικού τομέα

Προγραμματισμός Ηλεκτρονικών Υπολογιστών 1

Προτασιακή Λογική. Τμήμα Μηχανικών Πληροφορικής ΤΕ ΤΕΙ Ηπείρου Γκόγκος Χρήστος

Γνώση. Γνώση (knowledge) είναι ο κοινός παράγοντας (π.χ. κανόνες) που περιγράφει συνοπτικά τις συσχετίσεις μεταξύ των δεδομένων ενός προβλήματος.

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΣΥΝΤΑΞΗ: ΟΡΘΟΛΟΓΙΚΗ ΠΡΟΣΕΓΓΙΣΗ (FORMAL SYNTAX)

Μεταγλωττιστές. Γιώργος Δημητρίου. Μάθημα 1 ο. Πανεπιστήμιο Θεσσαλίας - Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών

HY118- ιακριτά Μαθηµατικά

ΠΛΗ 20, 3 η ΟΣΣ (Κατηγορηματική Λογική)

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος.

Στοιχεία Κατηγορηματικής Λογικής

Πληροφορική ΙΙ Θεματική Ενότητα 5

Μαθηματική Λογική και Λογικός Προγραμματισμός

ΚΕΦΑΛΑΙΟ 8 Η ΓΛΩΣΣΑ PASCAL

\5. Κατηγορηματικός Λογισμός (Predicate Calculus)

HY118- ιακριτά Μαθηµατικά

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα

Προγραμματισμός Η/Υ. Ενότητα 4: Εντολές Επιλογής

ΛΟΓΙΣΜΟΣ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ, ΕΣΠΙ 1

Εργαστήριο Σημασιολογικού Ιστού

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Διακριτά Μαθηματικά. Ενότητα 6: Προτασιακός Λογισμός

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

Ανάκτηση Πληροφορίας

Ανάκτηση Πληροφορίας

ΣΗΜΑΣΙΟΛΟΓΙΚΑ ΔΙΚΤΥΑ (SEMANTIC NETWORKS)

Κεφάλαιο 3 Η Σημασιολογία των Γλωσσών Προγραμματισμού

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Λογική. Ενότητα 1: Εισαγωγή. Δημήτρης Πλεξουσάκης Τμήμα Επιστήμης Υπολογιστών

Γνώση. Γνώση (knowledge) είναι ο κοινός παράγοντας (π.χ. κανόνες) που περιγράφει συνοπτικά τις συσχετίσεις μεταξύ των δεδομένων ενός προβλήματος.

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Λογική. Δημήτρης Πλεξουσάκης. 5ο μέρος σημειώσεων: Κατηγορηματικός Λογισμός (Predicate Calculus)

Μαθηματική Λογική και Λογικός Προγραμματισμός

Στοιχεία Προτασιακής Λογικής

Θέματα Προγραμματισμού Η/Υ

O μετασχηματισμός μιας «διαθεματικής» δραστηριότητας σε μαθηματική. Δέσποινα Πόταρη Πανεπιστήμιο Πατρών

Βασικοί τύποι δεδομένων (Pascal) ΕΠΑ.Λ Αλίμου Γ Πληροφορική Δομημένος Προγραμματισμός (Ε) Σχολ. Ετος Κων/νος Φλώρος

Λογικός Προγραμματισμός

Description Logics. Γεώργιος Χρ. Μακρής MSc, MEd

ΑΡΧΗ 1ης ΣΕΛΙΔΑΣ. Α2. Να αναφέρετε ονομαστικά: i) τα αλγοριθμικά κριτήρια ii) τους τρόπους αναπαράστασης αλγορίθμου. (μονάδες 10)

ΔΙΑΛΕΞΗ ΙΙ ΕΝΑ ΒΗΜΑ ΠΑΡΑΠΑΝΩ ΜΕ SCRATCH ΕΠΙΛΕΓΩΝΤΑΣ & ΕΠΑΝΑΛΑΜΒΑΝΟΝΤΑΣ

Αναπαράσταση Γνώσης. Αναπαράσταση Γνώσης με Λογική. Προτασιακή Λογική Λογική Πρώτης Τάξης

Λογική Δημήτρης Πλεξουσάκης Ασκήσεις στον Κατηγορηματικό Λογισμό Τμήμα Επιστήμης Υπολογιστών

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

ΑΣΚΗΣΗ 11: ΕΠΕΞΕΡΓΑΣΙΑ ΦΥΣΙΚΗΣ ΓΛΩΣΣΑΣ - ΣΥΝΤΑΚΤΙΚΗ ΑΝΑΛΥΣΗ (PARSING)

Δομημένος Προγραμματισμός

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 7 ο : Ανάκτηση πληροφορίας. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Ασκήσεις μελέτης της 8 ης διάλεξης

K15 Ψηφιακή Λογική Σχεδίαση 3: Προτασιακή Λογική / Θεωρία Συνόλων

Μεταγλωττιστές. Γιώργος Δημητρίου. Μάθημα 9 ο

Σπουδαστές Γιαννουλάκης Αντρέας Α.Μ Τσουρουνάκης 'Αγγελος Α.Μ Μουτουσίδου Πόπη Α.Μ Εισηγητής: Ταφιάδης Χρ.

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ

Συστήματα κ Τεχνολογίες Γνώσης Εργασίες στην Επεξεργασία Φυσικής Γλώσσας

ΕΠΛ 434: Λογικός Προγραμματισμός

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. WordNet

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Λογική. Δημήτρης Πλεξουσάκης

HY118- ιακριτά Μαθηµατικά. Νόµοι ισοδυναµίας. Κατηγορηµατικός Λογισµός. ιακριτά Μαθηµατικά, Εαρινό εξάµηνο Παρασκευή, 24/02/2017

Ρητή μετατροπή αριθμητικής τιμής σε άλλο τύπο. Τι θα τυπωθεί στον παρακάτω κώδικα;

Λογική Δημήτρης Πλεξουσάκης Φροντιστήριο 5: Προτασιακός Λογισμός: Κατασκευή Μοντέλων Τμήμα Επιστήμης Υπολογιστών

Διδακτική της Πληροφορικής ΙΙ

Εντολές επιλογής Επαναλήψεις (if, switch, while)

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Transcript:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 5 ο : Σημασιολογική ανάλυση Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013

Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 1 Οι διαφάνειες αυτού του μαθήματος βασίζονται στο κεφάλαιο 17 του βιβλίου: «Speech and Language Processing» των D. Jurafsky και J.H. Martin, 2η έκδοση, Pearson, 2009 Το βιβλίο δεν απαιτείται για το μάθημα αυτό.

Σημασιολογία Ορισμός: Είναι η επιστημονική μελέτη του γλωσσικού νοήματος Τι είναι «σημασία» «έννοια» και «νόημα» Αγγλικά: What is the meaning of the sentence X Ελληνικά: Ποιο είναι το νόημα / η έννοια / η σημασία της πρότασης Χ Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 2

Σημασία (1) Μέχρι στιγμής, έχουμε επικεντρωθεί στην δομή της γλώσσας, και όχι στο τι σημαίνουν τα στοιχεία της Είδαμε ότι οι λέξεις μπορεί να έχουν διαφορετική σημασία, ανάλογα με το περιβάλλον μέσα στο οποίο έχουν χρησιμοποιηθεί Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 3

Σημασία (2) Καθημερινές εργασίες που χρειάζονται σημασιολογική ανάλυση: Απάντηση ερωτήματος σε διαγώνισμα Γνώση θέματος, και πώς συνήθως απαντώνται Παραγγελία φαγητού σε εστιατόριο διαβάζοντας τον κατάλογο, εκτέλεση συνταγής Γνώση σχετική με φαγητό, την προετοιμασία, εστιατόρια, Αναγνώριση του ότι έχεις προσβληθεί Εκμάθηση χρήσης λογισμικού διαβάζοντας το εγχειρίδιο Γνώση σχετική με Η/Υ, εφαρμογές, GUI, Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 4

Σημασιολογική ανάλυση Η μετατροπή μιας πρότασης φυσική γλώσσας σε μια σημασιολογική αναπαράσταση (ΣΑ) Η οποία αποτελείται από «πράγματα» που χρησιμοποιούνται για την αναπαράσταση καθημερινής, συνηθισμένης γνώσης του κόσμου Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 5

I have a car Πρωτοβάθμια Κατηγορηματική Λογική (First-Order Logic) Σημασιολογικό Δίκτυο (Semantic Network) Διάγραμμα Εννοιολογικής Εξάρτησης (Conceptual Dependency Diagram) Αναπαράσταση με Πλαίσια (Frame-based Representation) Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 6

Σημασιολογικές αναπαραστάσεις (1) Συνδέουν γλωσσικές μορφές με γνώση για τον κόσμο Διττή αναπαράσταση: Τι είναι; Σημασίας για την πρόταση Κατάστασης κάποιου κόσμου Οτιδήποτε εξυπηρετεί τους σκοπούς ενός προγράμματος που εκτελεί σημασιολογική ανάλυση Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 7

Σημασιολογικές αναπαραστάσεις (2) Θα καλύψουμε: Ποια είναι η σημασία μιας λέξης Πώς μπορούμε να αναπαραστήσουμε την σημασία Τι φορμαλισμοί μπορούν να χρησιμοποιηθούν Γλώσσες αναπαράστασης σημασίας Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 8

Αναπαράσταση σημασίας Επιθυμητά στοιχεία: Επαληθευσιμότητα (Verifiability) Σαφής Αναπαράσταση (Unambiguous Representation) Κανονική Μορφή (Canonical Form) Συμπερασμός (Inference) Εκφραστικότητα (Expressiveness) Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 9

Επαληθευσιμότητα (1) Η πλέον στοιχειώδης ιδιότητα: Ποια η σχέση μεταξύ της έννοιας της πρότασης, και του κόσμου, όπως τον ξέρουμε; Πρέπει να μπορούμε να καθορίσουμε το αληθές της αναπαράστασης Ένα σύστημα πρέπει να μπορεί να συγκρίνει, ταιριάζει: Την σημασιολογική αναπαράσταση με μια βάση γνώσης (ΒΓ) Η οποία περιέχει πληροφορία για τον κόσμο Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 10

Επαληθευσιμότητα (2) Does Maharani serve vegetarian food? Αν υποθέσουμε ότι η πρόταση σημαίνει: Maharani serves vegetarian food Μπορούμε να έχουμε την αναπαράσταση: Serves(Maharani, vegetarian food) Η οποία πρέπει να συγκριθεί με την βάση γνώσης Η οποία περιέχει γεγονότα για εστιατόρια Αν βρεθεί ταίριασμα «Ναι», αλλιώς «Όχι» Επαληθευσιμότητα: ικανότητα σύγκρισης μιας αναπαράστασης με μια βάση γνώσης για κάποιο κόσμο Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 11

Σαφής αναπαράσταση (1) Μια πρόταση μπορεί να έχει διαφορετικές σημασιολογικές αναπαραστάσεις Κάθε σημασιολογική αναπαράσταση περιγράφει μια σημασία Ανεξάρτητα από την αμφισημία της εισόδου, η τελική αναπαράσταση της σημασίας δεν πρέπει να είναι αμφίσημη Ενδιάμεσες αναπαραστάσεις μπορεί να φέρουν αμφισημία I wanna eat someplace that s close to ICSI. Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 12

Σαφής αναπαράσταση (2) Σχετική έννοια είναι και η ασάφεια (vagueness) Η σημασιολογική αναπαράσταση δεν προσδιορίζει επακριβώς το πραγματικό γεγονός «Θέλω να φάω Ιταλικό φαγητό» Δεν προκύπτουν πολλαπλές αναπαραστάσεις λόγω ασάφειας Όπως στην περίπτωση της αμφισημίας Η ασάφεια μπορεί να είναι αποδεκτή για κάποιες εφαρμογές Θεμιτή η ασάφεια στην σημασιολογική αναπαράσταση Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 13

I went to the bank. Ασάφεια ή αμφισημία Bank: τράπεζα, όχθη Αυτός είναι ψηλός. Είναι ζεστό. Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 14

Κανονική μορφή (1) Πολλαπλές προτάσεις εισόδου μπορεί να έχουν την ίδια σημασία Does Maharani have vegetarian dishes? Do they have vegetarian food at Maharani? Are vegetarian dishes served at Maharani? Does Maharani serve vegetarian fare? Εναλλακτική: Τέσσερις σημασιολογικές αναπαραστάσεις Αποθήκευση όλων των δυνατών αναπαραστάσεων στην βάση γνώσης (ΒΓ) Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 15

Κανονική μορφή (2) Λύση: ανάθεση σε όλες τις εισόδους με την ίδια σημασία, της ίδιας σημασιολογ. Αναπαράστασης Είναι εύκολο; Όχι! vegetarian fare, vegetarian dishes, vegetarian food Σημαίνουν το ίδιο πράγμα σε αυτό το περιβάλλον χρήσης Have, serve Είναι ισοδύναμα, άσχετα με την διαφορετική σύνταξη Τι μπορούμε να κάνουμε; Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 16

Παραγωγή κανονικής μορφής Αξιοποίηση θησαυρών για την συστηματική εξαγωγή ΣΑ Π.χ. έννοιες λέξεων (word senses) Food Dish Fare Υπάρχει κάποια κοινή έννοια; Αξιοποίηση συντακτικών δομών για την συστηματική εξαγωγή ΣΑ [S [NP Maharani] serves [NP vegetarian dishes]] [S [NP vegetarian dishes] are served at [NP Maharani]] Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 17

Συμπερασμός (1) Ένα πιο σύνθετο ερώτημα: Can vegetarians eat at Maharani? Αντί: Does Maharani serve vegetarian food? Γιατί έχουν την ίδια απάντηση; Μπορούμε να χρησιμοποιήσουμε την ίδια ΣΑ; (Όχι) Δεν σημαίνουν το ίδιο πράγμα! Απαντάμε το ίδιο επειδή: Ξέρουμε τι τρώνε οι χορτοφάγοι Ξέρουμε τι σερβίρουν τα χορτοφαγικά εστιατόρια Κάνουμε την σύνδεση Συμπερασμός Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 18

Συμπερασμός (2) Εξαγωγή συμπερασμάτων για την αλήθεια κατηγορημάτων (propositions) που δεν είναι ρητά εκφρασμένα στην ΓΒ Δεν περιέχονται αυτούσια στην ΓΒ serve(maharani, VegetarianFood) CanEat(Vegetarians, AtMaharani) Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 19

Εκφραστικότητα Είναι επιθυμητό μια ΣΑ να μπορεί να περιγράψει μια ευρεία γκάμα από γεγονότα για τον κόσμο Μια ΣΑ δεν πρέπει να θέτει σημαντικούς περιορισμούς Ιδανικά θέλουμε μια ΣΑ ικανή να αναπαραστήσει οποιαδήποτε «λογική» πρόταση Δεν είναι εύκολο να βρεθεί μια τέτοια ΣΑ Υπάρχουν ωστόσο ΣΑ που είναι αρκετά εκφραστικές, επιτρέποντας την μοντελοποίηση αρκετών πραγμάτων Πρωτοβάθμια Κατηγορηματική Λογική (First-Order Logic) Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 20

Σημασιολογική δομή γλώσσας (Meaning Structure of Language) Αφορά τρόπους με τους οποίους η φυσική γλώσσα μεταφέρει σημασία Οι φυσικές γλώσσες Χρησιμοποιούν δομές κατηγόρημα-όρισμα (predicate argument structure) Χρησιμοποιούν μεταβλητές Χρησιμοποιούν ποσοδείκτες (quantifiers) Χρησιμοποιούν συνθετική σημασιολογία (compositional semantics) Η σημασία κάθε έκφρασης ΦΓ υπολογίζεται ως συνάρτηση των σημασιών των επιμέρους μερών της Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 21

Συνθετικότητα (compositionality) Η αρχή της συνθετικότητας είναι σημαντική στην σημασιολογία: Η σημασία μιας έκφρασης είναι αυστηρά μια συνάρτηση των σημασιών των επιμέρους μερών της Επιτρέπει την δημιουργία ΣΑ με αυξητικό τρόπο (incrementally) Ο κατηγορικός λογισμός (predicate logic) δεν τηρεί αυτή την αρχή Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 22

Δομή κατηγόρημα-όρισμα (1) Αναπαριστά έννοιες (concepts) και σχέσεις μεταξύ τους Κάποιες λέξεις δρουν σαν ορίσματα, και κάποιες σαν κατηγορήματα: Ουσιαστικά: έννοιες ή ορίσματα κόκκινη(μπάλα) Επίθετα, επιρρήματα, ρήματα: κατηγορήματα κόκκινη(μπάλα) Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 23

Δομή κατηγόρημα-όρισμα (2) Τα ρήματα υπαγορεύουν περιορισμούς: Αριθμό, γένος, πτώση Γραμματικές κατηγορίες Θέση των φράσεων που τα συνοδεύουν I want Italian food. NP want NP I want to spend less than five dollars. NP want Inf-VP I want it to be close by here. NP want NP Inf-VP Subcategorisation frames Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 24

Δομή κατηγόρημα-όρισμα (3) I want Italian food. Το κατηγόρημα έχει δύο ορίσματα NP want NP I want to spend less than five dollars. NP want Inf-VP I want it to be close by here. NP want NP Inf-VP Και τα δύο ορίσματα είναι τύπου ΟΦ (NP) Το πρώτο όρισμα είναι πριν το ρήμα, και έχει τον ρόλο υποκειμένου Το δεύτερο όρισμα είναι μετά το ρήμα, και έχει ρόλο του (άμεσου) αντικειμένου Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 25

Σημασιολογικοί ρόλοι Σημασιολογικοί/θεματικοί ρόλοι (semantic/thematic roles): συμμετέχουν σε ένα γεγονός Ο υποκινητής μιας ενέργειας, ο αποδέκτης μιας ενέργειας, το αντικείμενο που μεταφέρει μια ενέργεια, κλπ. Σημασιολογικοί περιορισμοί (selectional restrictions): περιορίζουν τους τύπους των ορισμάτων Ο τρομοκράτης δολοφόνησε τον βουλευτή *Η αράχνη δολοφόνησε την μύγα Subcategorisation ρημάτων: Επιτρέπουν την αντιστοίχιση ορισμάτων από την επιφανειακή δομή με τον συντακτικό τους ρόλο Οι προθέσεις συμπεριφέρονται ανάλογα Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 26

Ένα μοντέλο για τον κόσμο των εστιατορίων Domain Matthew, Franco, Katie and Caroline Frasca, Med, Rio ItalianCuisine, MexicanCuisne, EclecticCuisine Noisy Frasca, Med and Rio are noisy Likes Matthew likes the Med Katie likes the Med and Rio Franco likes Frasca Caroline likes the Med and Rio Serves Med serves eclectic Rio serves Mexican Frasca serves Italian D = a, b, c, d, e, f, g, h, i, j a, b, c, d e, f, g h, i, j Noisy = {e, f, g} Likes = a, f, c, f, c, g, b, e, d, f, d, g Serves = {e, j, f, i, e, h} Αντικείμενα: στοιχεία του κόσμου Ιδιότητες: σύνολα από στοιχεία του κόσμου Σχέσεις: σύνολα από πλειάδες από στοιχεία του κόσμου Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 27

Πρωτοβάθμιος Κατηγορηματικός Λογισμός (1) First-Order Predicate Calculus: Παρέχει στέρεα υπολογιστική βάση για επαληθευσιμότητα, συμπερασμό και εκφραστικότητα Επιτρέπει τον προσδιορισμό της αλήθειας/ψεύδους ενός κατηγορήματος Επιτρέπει την συνθετικότητα της σημασίας Επιτρέπει την απάντηση ερωτημάτων (μέσω μεταβλητών) Επιτρέπει συμπερασμό Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 28

Πρωτοβάθμιος Κατηγορηματικός Λογισμός (2) Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 29

Όροι (terms): Σταθερές: Maharani ΠΚΛ: Σύνταξη Συναρτήσεις: LocationOf(Maharani) Μεταβλητές: x in LocationOf(x) Κατηγορήματα (predicates): σχέσεις μεταξύ αντικειμένων Serves(Maharani, VegetarianFood) Λογικοί τελεστές: επιτρέπουν σύνθεση σημασίας I only have $5 and I don t have a lot of time Have I, $5 Have(I, LotsOfTime) Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 30

ΠΚΛ: Σημασιολογία Εκφράσεις σε ΠΚΛ μπορούν να σχετιστούν με τις τιμές Αληθές (True) ή Ψευδές (False) Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 31

Μεταβλητές και ποσοδείκτες Existential ( ): Υπάρχει A restaurant that serves Mexican food near UMD x Restaurant x Serves(x. MexicanFood) Near(LocationOf x, LocationOf UMD ) Universal ( ): Για κάθε All vegetarian restaurants serve vegetarian food x VegeterianRestaurant x Serves(x. VegeterianFood) Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 32

Παραδείγματα Σε όλες τις γάτες αρέσει το γάλα. ( x)(iscat x Likes x, Milk ) Υπάρχει μια γάτα που της αρέσει το γάλα. ( x)(iscat x Likes x, Milk ) Προσοχή: ο τύπος ( x)(iscat x Likes x, Milk ) λέει «Υπάρχει ένα x που: (i) δεν είναι γάτα ή (ii) αν είναι γάτα του αρέσει το γάλα» Η Ψίτα συμπαθεί όλους τους σκύλους. ( x)(isdog x Likes Psita, x ) Προσοχή: ο τύπος ( x)(isdog x Likes Psita, x ) λέει «Τα πάντα είναι σκύλοι και αρέσουν στην Ψίτα». Υπάρχει μια γάτα που συμπαθεί όλους τους σκύλους. ( x)(iscat x ( y) IsDog y Likes x, y ) Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 33

Γιατί χρειαζόμαστε μεταβλητές; Προτάσεις με το ρήμα eat I ate. I ate a turkey sandwich. I ate a turkey sandwich at my desk. I ate at my desk. I ate lunch. I ate a turkey sandwich for lunch. I ate a turkey sandwich for lunch at my desk. Επτά διαφορετικές αναπαραστάσεις: Eating 1 (Speaker) Eating 2 (Speaker, TurkeySandwich) Eating 3 (Speaker, TurkeySandwich, Desk) Eating 4 (Speaker, Desk) Eating 5 (Speaker, Lunch) Eating 6 (Speaker, TurkeySandwich, Lunch) Eating 7 (Speaker, TurkeySandwich, Lunch, Desk) Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 34

Λύση με μεταβλητές Eating(v,w,x,y) Τα παραδείγματα πλέον γίνονται: ( w,x,y) Eating(Speaker,w,x,y) ( x,y) Eating(Speaker,TurkeySandwich,x,y) ( x) Eating(Speaker,TurkeySandwich,x,Desk) ( w,x) Eating(Speaker,w,x,Desk) ( w,y) Eating(Speaker,w,Lunch,y) ( y) Eating(Speaker,TurkeySandwich,Lunch,y) Eating(Speaker,TurkeySandwich,Lunch,Desk) Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 35

Συμπερασμός (1) Το κύριο κίνητρο για την χρήση της λογικής σαν ΣΑ, είναι επειδή επιτρέπει στέρεους (sound) και πλήρεις (complete) μεθόδους συμπερασμού Στην κατηγορική λογική, ένα κατηγόρημα P, που περιέχει τις μεταβλητές Q 1,, Q n, είναι έγκυρο αν το P είναι αληθές για όλες τις αληθείς τιμές των Q 1,, Q n Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 36

Συμπερασμός (2) Αν υποθέσουμε ότι έχουμε: Ένα σύνολο προτάσεων S 1,, S n Και τις αντίστοιχες ΣΑ P 1, P n Και θέλουμε να διαπιστώσουμε αν ένα Q είναι έγκυρο Αρκεί να ελέγξουμε αν το ακόλουθο είναι λογικά έγκυρο: P 1 P n Q Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 37

Σημειογραφία λ Επέκταση της σύνταξης του ΠΚΛ με εκφράσεις της μορφής: λ. x. P(x) Τελεστής που ενεργεί πάνω στην έκφραση: (λ-reduction) λ. x. P x P(A) A λ. x. λ. y. Near x, y Bacaro λ. y. Near(Bacaro, y) Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 38

Σύνταξη και Σημειολογία Δύο τρόποι συνδυασμού μεταξύ συντακτικής ανάλυσης και σημασιολογικής ανάλυσης 1. Οι δύο αναλύσεις γίνονται ταυτόχρονα, εμπλουτίζοντας την γραμματική με σημασιολογία 2. Η συντακτική ανάλυση πραγματοποιείται ανεξάρτητα, και με βάση το συντακτικό δέντρο δημιουργείται η σημασιολογική ερμηνεία Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 39

Σημασιολογία απλών προτάσεων Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 40

Υπολογισμός ΣΑ Ουσιαστικά μεταφράζουμε από μια φυσική σε μια τεχνητή γλώσσα, με αυστηρά ορισμένη σημασιολογία Αναγωγή λ Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 41

Σημασιολογικές προσαρτήσεις Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 42

Σημασιολογικές σχέσεις λέξεων Ομώνυμα: ίδια γραφή, διαφορετικές σημασίες Bank, γράμμα, άπειρος Συνώνυμα: διαφορετικές λέξεις, με περίπου την ίδια σημασία Αυτοκίνητο αμάξι, big large Υπερώνυμο υπώνυμο: ευρύτερη στενότερη έννοια Όχημα αυτοκίνητο, θηλαστικό άνθρωπος Αντίθετα: αντίθετη έννοια Μεγάλος μικρός Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 43

Wordnet Το δημοφιλέστερο ιεραρχικά οργανωμένο λεξικό της Αγγλικής (http://wordnet.princeton.edu/) Κάθε έννοια παριστάνεται από ένα σύνολο συνωνύμων (synset) που μπορούν να έχουν αυτή την έννοια Ιεραρχίες υπερωνύμων-υπωνύμων ανά μέρος του λόγου (ουσιαστικά, επίθετα, ρήματα, επιρρήματα) Παρέχει και άλλες σχέσεις Π.χ. μερώνυμα (το «παράθυρο» μέρος του «σπιτιού») Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 44

Αποσαφήνιση εννοιών λέξεων Επιλογή της σωστής έννοιας μιας λέξης σε ένα κείμενο (word sense disambiguation WSD) Χρήσιμο και σε άλλες εφαρμογές Επιλογή από τις δυνατές έννοιες μιας λέξης (Wordnet), ή κατασκευή των δυνατών εννοιών μιας λέξης (sense induction) Δημοφιλής η χρήση μηχανικής μάθησης Γλωσσική Τεχνολογία, Μάθημα 5 ο, Σημασιολογική ανάλυση 45