ΓΛΩΙΚΗ ΣΓΥΝΟΛΟΓΙΑ ΓΙΑΓΩΓΗ
Ση είκαη Γιςζζηθή Σεπκμιμγία; Η ακάπηολε οπμιμγηζηηθώκ μμκηέιςκ επελενγαζίαξ πιενμθμνίαξ (γκώζεξ) πμο βνίζθεηαη ζε θοζηθή (ακζνώπηκε) γιώζζα (. ηαμαηάημξ-πακ/μημ Αηγαίμο) Πνμθμνηθόξ ιόγμξ Γπελενγαζία μμηιίαξ Γναπηόξ ιόγμξ Γπελενγαζία θοζηθήξ γιώζζαξ Γηθόκα εγγνάθμο - Οπηηθή Ακαγκώνηζε Υαναθηήνςκ
Όκμμα Γπηζηεμμκηθήξ Πενημπήξ Γπελενγαζία/Σεπκμιμγία Φοζηθήξ Γιώζζαξ (Νatural Language Processing) Πιενμθμνηθή, Γπηζηήμε Τπμιμγηζηώκ Τπμιμγηζηηθή Γιςζζμιμγία (Computational Linguistics) Γιςζζμιμγία Τπμιμγηζηηθή Φοπμγιςζζμιμγία (Computational psycho-linguistics) Φοπμιμγία
Γηαηί είκαη ζεμακηηθή; Γηα ηεκ ακάπηολε πημ εύπνεζηςκ θαη πνήζημςκ οπμιμγηζηηθώκ ζοζηεμάηςκ Δηεπαθή ζε θοζηθή γιώζζα οζηήμαηα θαηακόεζεξ μμηιίαξ Καιύηενα ζοζηήμαηα ακάθηεζεξ/ελαγςγήξ πιενμθμνίαξ από θείμεκα (WWW) Γηα ηεκ ακάπηολε ζοζηεμάηςκ μεπακηθήξ μεηάθναζεξ Γηα ηεκ θαιύηενε θαηακόεζε ηεξ ακζνώπηκεξ επηθμηκςκίαξ/έθθναζεξ
Τεζη Turing
U: You don t argue with me. S: Why do you think I don t argue with you? U: I m feeling a bit depressed S: Are you depressed often? U: I m feeling a bit jump XyZZy S: Why do you say you are feeling a bit jump XyZZy? Eliza (http://wwwai.ijs.si/eliza/eliza.html) Βαζίδεηαη ζηεκ ροπηαηνηθή πνμζέγγηζε ημο Carl Rogers (~1940-1950). O ζεναπεοηήξ δεκ πνμηείκεη, δεκ ζομβμοιεύεη, αιιά πνμηνέπεη ημκ αζζεκή κα ζοκεπίζεη κα μηιάεη, ώζηε κα θαηαιήλεη μόκμξ ημο ζηεκ ιύζε ημο πνμβιήμαηόξ ημο. Η Eliza είκαη έκα ζύζηεμα πμο ακαγκςνίδεη πνόηοπα ιέλεςκ/θνάζεςκ μέζα ζηεκ ενώηεζε ημο πνήζηε θαη απμθνίκεηαη ακηίζημηπα.
Γθανμμγέξ Γπελενγαζίαξ Φοζηθήξ Γιώζζαξ αοηόμαηε μεηάθναζε θεημέκςκ έλοπκε ακαδήηεζε ζημ δηαδίθηομ ακάθηεζε πιενμθμνίαξ από ζώμαηα θεημέκςκ δεμημονγία πενίιερεξ θεημέκμο θαηεγμνημπμίεζε θεημέκςκ θαηακόεζε θεημέκμο από ημκ οπμιμγηζηή ζύκζεζε θοζηθήξ γιώζζαξ δεμημονγία θηιηθώκ πνμξ ημ πνήζηε θαη εύπνεζηςκ δηεπαθώκ οπμζηήνηλε ζογγναθέα (δηόνζςζε μνζμγναθηθώκ θαη ζοκηαθηηθώκ ιαζώκ) Web Sentiment Analysis
Γθανμμγέξ Γπελενγαζίαξ Ομηιίαξ Αοημμαημπμηεμέκεξ οπενεζίεξ μέζς ηειεθώκμο Φςκεηηθόξ έιεγπμξ μεπακώκ/ζοζθεοώκ οζηήμαηα οπαγόνεοζεξ οζηήμαηα ακαγκώνηζεξ μμηιεηή
Πανάδεηγμα: Αοηόμαηε μεηάθναζε
Πανάδεηγμα: ύκζεζε είζοδος έξοδος Goldberg E: FoG: Synthesizing forecast text directly from weather maps
Πανάδεηγμα: Γλαγςγή πιενμθμνίαξ 19 March - A bomb went off this morning near a power tower in San Salvador leaving a large part of the city without energy, but no casualties have been reported. According to unofficial sources, the bomb - allegedly detonated by urban guerrilla commandos - blew up a power tower in the northwestern part of San Salvador at 0650 (1250 GMT). Incident type bombing Date March 19 Location El Salvador: San Salvador (city) Perpetrator urban guerilla commandos Physical target power tower Human target - Effect on physical target destroyed Effect on human target no injury or death Instrument bomb
Web Sentiment Analysis I love you but hate the current political climate. [no positive emotion or energy] 1 2 3 4 5 [very strong positive emotion] [no negative emotion] 1 2 3 4 5 [very strong negative emotion]
Δηεπηζηεμμκηθή πενημπή Γιςζζμιμγία: θαηακόεζε ηεξ πνήζεξ ηεξ γιώζζαξ Φοπμιμγία: θαηακόεζε ηεξ ακηίιερεξ θαη ηεξ παναγςγήξ ηεξ γιώζζαξ Γπηζηήμε Τπμιμγηζηώκ: ακάπηολε θαιύηενςκ θαη πημ εύπνεζηςκ εθανμμγώκ Σεπκεηή Νμεμμζύκε: ακάπηολε μμκηέιςκ ακζνώπηκμο ζοιιμγηζμμύ
Η Γκώζε ζηεκ γιώζζα Τι είμαι ξι λένειπ (ξρζιαζηικά, οήμαηα, άοθοα); Πωπ ζρμδέξμηαι μεηανύ ηξρπ; Τι ζημαίμξρμ ξι λένειπ; Πωπ ζρμβάλλξρμ ηα μξήμαηα ηωμ λένεωμ ζηιπ ποξηάζειπ;
Γπίπεδα γιςζζμιμγηθήξ γκώζεξ Φωμηηική και θωμξλξγική γμώζη: Πςξ ζπεμαηίδμκηαη μη ιέλεηξ από ήπμοξ. Μξοθξλξγική γμώζη: Πςξ ζπεμαηίδμκηαη μη ιέλεηξ από μμνθήμαηα: έ τρεχ-α Σρμηακηική γμώζη: Πςξ ζπεμαηίδμκηαη μη πνμηάζεηξ από ιέλεηξ. Σημαζιξλξγική γμώζη: Σμ κόεμα ηςκ ιέλεςκ θαη (ζοκδοαδόμεκα) κόεμα πνμηάζεςκ. Ποαγμαηξλξγική γμώζη: Πςξ μη πνμηάζεηξ πνεζημμπμημύκηαη ζε δηαθμνεηηθά ζομθναδόμεκα, θαη πςξ ηα ζομθναδόμεκα, θαη ε γκώζε ημο θόζμμο επενεάδμοκ ηεκ ενμεκεία μηαξ ιέλεξ.
Πανάδεηγμα: «Ασηός αγαπάει ηη Μαίρη.» Φςκμιμγία /a/ /f/ /t/ /o/ /s/ /a/ /g/ /a/ /p/ /a/ /i/ /t/ /i/ /m/ /e/ /r/ /i/ Μμνθμιμγία αοη-όξ: ακηςκομία, εκηθόξ, μκμμαζηηθή, ανζεκηθό αγαπ-άεη: νήμα, εκηθόξ, ηνίημ πνόζςπμ, εκεζηώηαξ ηε: μνηζηηθό άνζνμ, εκηθόξ, ζειοθό Μαίνε: θύνημ όκμμα, ζειοθό. : ζεμείμ ζηίλεξ, ηέιμξ πενηόδμο
Πανάδεηγμα: «Ασηός αγαπάει ηη Μαίρη.» ύκηαλε
Πανάδεηγμα: «Ασηός αγαπάει ηη Μαίρη.» εμαζημιμγία x love(x, mary) Πναγμαημιμγία love (john, mary)
Άιια παναδείγμαηα «- Οι πράζιμοι βάηρατοι έτοσμ μεγάλες μύηες» Σωζηή: ύκηαλε, εμαζημιμγία Λάθξπ: Πναγμαημιμγία «- Οι πράζιμες ιδέες έτοσμ μεγάλες μύηες» Σωζηή: ύκηαλε, Λάθξπ: εμαζημιμγία, Πναγμαημιμγία «- Μεγάλες έτοσμ οι πράζιμες ιδέες μύηες» Λάθξπ: ύκηαλε, εμαζημιμγία, Πναγμαημιμγία
Οη δοζθμιίεξ ηεξ γιώζζαξ Αζάθεηα (ambiguity) Φςκμιμγηθή ([filo]) Μμνθμιμγηθή (ηε/αρ - ηε/ανσ ) οκηαθηηθή (Γίδα ημκ άκηνα με ημ ηειεζθόπημ) εμαζημιμγηθή (Έπηαζα ημ πμκηίθη) Πναγμαημιμγηθή (Αοηή δμοιεύεη ζθιενά.) Κάζε είδμξ αζάθεηαξ απαηηεί γκώζε παναπάκς επηπέδςκ γηα κα επηιοζεί.
Οη δοζθμιίεξ ηεξ γιώζζαξ (ζοκ.) Δηαθμνεηηθμί ηνόπμη έθθναζεξ «Ασηό ηο κεθάλαιο είμαι εκηός ύλης.» «Ασηό ηο κεθάλαιο δεμ είμαι μέζα ζηημ ύλη.» Πιενμθμνία πμο εκκμείηαη «Τηλεθώμηζα ζηο ζπίηι ηης Λέμας για μα πάμε ζιμεμά. Σσμθώμηζε με ταρά.» Η Λέκα ήηακ ζημ ζπίηη ηεξ Η Λέκα απάκηεζε ζημ ηειέθςκμ Σεξ δήηεζα κα πάμε ζηκεμά Η ίδηα πνόηαζε μπμνεί κα έπεη δηαθμνεηηθό κόεμα ζε δηαθμνεηηθέξ πενηπηώζεηξ «Πώς είμαι ηο μερό;» οκεπόμεκε δεμημονγία κέςκ ιέλεςκ/εθθνάζεςκ «Θα ηο ζκαμάρω.»
Αζθήζεηξ Η πνόηαζε "Οη ειέθακηεξ πεηάκε" είκαη ιάζμξ a. ζημ μμνθμιμγηθό επίπεδμ b. ζημ πναγμαημιμγηθό επίπεδμ c. ζημ ζοκηαθηηθό επίπεδμ d. ζε θακέκα επίπεδμ Η πνόηαζε "Με άθμοζε εθείκμξ μ γηαηνόξ με ημ ζηεζμζθόπημ" έπεη a. μμνθμιμγηθή αζάθεηα b. ζοκηαθηηθή αζάθεηα c. ζεμαζημιμγηθή αζάθεηα d. όια ηα παναπάκς
Ιζημνηθά ζημηπεία Ονζμιμγηθή πνμζέγγηζε (1965-1985) Βαζίδεηαη ζηεκ ζεςνία ημο γιςζζμιόγμο Noam Chomsky Πνμζπάζεηα θςδηθμπμίεζεξ (ζεςνεηηθήξ μμκηειμπμίεζεξ) ηεξ γιςζζμιμγηθήξ γκώζεξ Η γιώζζα ζεςνείηαη ςξ μηα αθμιμοζία ζομβόιςκ
Ιζημνηθά ζημηπεία (ζοκ) Γμπεηνηθή/ζημπαζηηθή πνμζέγγηζε (1950-1965 θαη 1985-ζήμενα) Βαζίδεηαη ζηε ζεςνία ημο Claude Shannon γηα ηεκ απόδμζε πηζακμηήηςκ ζε γιςζζμιμγηθέξ δμμέξ Η ζύκζεηε θαη πενίπιμθε δμμή ηεξ γιώζζαξ μαζαίκεηαη θαζμνίδμκηαξ έκα γεκηθό μμκηέιμ ηεξ γιώζζαξ θαη ιαμβάκμκηαξ ηηξ ηημέξ ηςκ παναμέηνςκ μέζς ζηαηηζηηθώκ μεζόδςκ, ακαγκώνηζεξ πνμηύπςκ θαη μεπακηθήξ μάζεζεξ Πναθηηθά ζοζηήμαηα βάζεη ζςμάηςκ θεημέκςκ (corpus-based)
Ιζημνηθά ζημηπεία (ζοκ) 1950 1965: Έμθαζε ζηε μεπακηθή μεηάθναζε 1966 1978: Έμθαζε ζηε ζεμαζημιμγία 1979 1985: Έμθαζε ζηε ζύκηαλε 1986 2010: Έμθαζε ζηηξ ενγαζίεξ παμειμύ επηπέδμο, αλημιόγεζε 2010-ζήμενα: Έμθαζε ζημ θείμεκμ ημο θμηκςκηθμύ ηζημύ, ζηηξ ηεπκηθέξ βαζηάξ μάζεζεξ
Βηβιία Jurafsky, D. and J. H. Martin: Speech and Language Processing Prentice-Hall. 2008. ISBN 0131873210 Allen, J.: Natural Language Understanding (2 nd edition) The Benajmins/Cummings Publishing Company Inc. 1994. ISBN 0-8053-0334-0 Manning, C. D. and H. Schütze: Foundations of Statistical Natural Language Processing The MIT Press. 1999. ISBN 0-262-13360-1
Δηεοζύκζεηξ Association for Computational Linguistics (http://www.aclweb.org) Ικζηηημύημ Γπελενγαζίαξ ημο Λόγμο (http://www.ilsp.gr) The Natural Language Software Registry (http://registry.dfki.de) The Natural Language Toolkit (http://nltk.sourceforge.net) Survey of the State of the Art in Human Language Technology (http://www.cse.ogi.edu/cslu/hltsurvey/)