ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΕΙΣΑΓΩΓΗ

Σχετικά έγγραφα
ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος.

Ανάκτηση Πληροφορίας

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΛΟΓΟΥ ΚΑΙ ΑΚΟΗΣ

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΣΗΜΑΣΙΟΛΟΓΙΑ - SEMANTICS

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΛΟΓΟΥ ΚΑΙ ΑΚΟΗΣ

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΛΟΓΟΥ ΚΑΙ ΑΚΟΗΣ

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΣΤΟΝ ΠΑΓΚΟΣΜΙΟ ΙΣΤΟ & ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ

Κεφάλαιο 6ο: Παρόν και μέλλον της Υπολογιστικής Γλωσσολογίας

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΛΟΓΟΥ ΚΑΙ ΑΚΟΗΣ

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΑΡΣΗ ΑΜΦΙΣΗΜΙΑΣ ΛΕΞΕΩΝ (ΑΠΟΣΑΦΗΝΙΣΗ ΕΝΝΟΙΑΣ ΛΕΞΕΩΝ) WORD SENSE DISAMBIGUATION

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

Γλωσσική Τεχνολογία. Μάθημα 3 ο : Βασικές Γλωσσολογικές Έννοιες Ι: Μορφολογία. Βασιλική Σιμάκη

Προηγµένη ιασύνδεση µε τοπεριβάλλον

Μεταγλωττιστές Ενότητα 1: Εισαγωγή

Αξιολόγηση μεταφράσεων ιταλικής ελληνικής γλώσσας

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα. Συστήματα Αυτομάτου Ελέγχου. Ενότητα Α: Γραμμικά Συστήματα

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

Εργαστήριο Σημασιολογικού Ιστού

Διδακτική Γλωσσικών Μαθημάτων (ΚΠΒ307)

Ανάκτηση Πληροφορίας. Διδάσκων: Φοίβος Μυλωνάς. Διάλεξη #01

Αξιολόγηση μεταφράσεων ιταλικής ελληνικής γλώσσας

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα

Η εξέλιξη στα συστήματα Μηχανικής Μετάφρασης

ΜΑΘΗΜΑ: Μεταγλωττιστές

Θέματα υπολογισμού στον πολιτισμό

Διαγλωσσική μεταφορά και διαμεσολάβηση

Μαθησιακές δραστηριότητες με υπολογιστή

Φωνολογική Ανάπτυξη και Διαταραχές

Τεχνολογίες & Εφαρμογές Πληροφορικής Ενότητα 1: Εισαγωγικό Μάθημα

Εργαστήριο Σημασιολογικού Ιστού

Η πρόσληψη της Καινής Διαθήκης στη λογοτεχνία και την τέχνη

Εισαγωγή στη Γλωσσολογία Ι

Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών

Ιστορία της μετάφρασης

Ψηφιακά Mέσα Υπολογιστική Νοημοσύνη

Αξιολόγηση μεταφράσεων ιταλικής ελληνικής γλώσσας

ΠΡΟΚΗΡΥΞΗ ΔΙΑΠΑΝΕΠΙΣΤΗΜΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗ «ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ» ΠΡΟΣΚΛΗΣΗ ΥΠΟΒΟΛΗΣ ΥΠΟΨΗΦΙΟΤΗΤΩΝ

ΕΥΦΥΗΣ ΕΛΕΓΧΟΣ. Ενότητα #12: Εισαγωγή στα Nευρωνικά Δίκτυα. Αναστάσιος Ντούνης Τμήμα Μηχανικών Αυτοματισμού Τ.Ε.

Πληροφοριακά Συστήματα & Περιβάλλον Ασκήσεις

Συστήματα Γνώσης. Θεωρητικό Κομμάτι Μαθήματος Ενότητα 2: Βασικές Αρχές Αναπαράστασης Γνώσης και Συλλογιστικής

Λειτουργικά Συστήματα

Εισαγωγή στη διδακτική των γλωσσών Ασκήσεις

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΣΤΗΜΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

clarin:el δημιουργώ, επεξεργάζομαι, μοιράζομαι Στέλιος Πιπερίδης, Πένυ Λαμπροπούλου, Μαρία Γαβριηλίδου Ε.Κ. Αθηνά / ΙΕΛ

ΑΣΚΗΣΗ 11: ΕΠΕΞΕΡΓΑΣΙΑ ΦΥΣΙΚΗΣ ΓΛΩΣΣΑΣ - ΣΥΝΤΑΚΤΙΚΗ ΑΝΑΛΥΣΗ (PARSING)

Αλληλεπίδραση Ανθρώπου- Υπολογιστή & Ευχρηστία. Ενότητα 7: Κανόνες Σχεδίασης Σαπρίκης Ευάγγελος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών

Εισαγωγή στη Γλωσσολογία Ι

Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου. Πληροφορική II. Ενότητα 9 : Τεχνητή νοημοσύνη. Δρ. Γκόγκος Χρήστος

TEC610 Δυναμικές Εφαρμογές Διαδικτύου (ΣΤ εξάμηνο)

Εφαρµογές Τεχνολογιών Γλωσσικής Επεξεργασίας στα Συστήµατα Αναζήτησης των Ελληνικών Ακαδηµαϊκών Βιβλιοθηκών

Διοίκηση ανθρωπίνων Πόρων. Ενότητα 9: Εργασιακές σχέσεις και επικοινωνία Δρ. Καταραχιά Ανδρονίκη Τμήμα Λογιστικής και Χρηματοοικονομικής

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ Γλώσσες & Τεχνικές 4 ο Εξάμηνο. - Ενότητα 1 - Δημοσθένης Σταμάτης

Παιδαγωγοί και παιδαγωγική σκέψη στον ελληνόφωνο χώρο (18ος αιώνας Μεσοπόλεμος)

ΠΡΟΓΡΑΜΜΑ ΓΑΛΛΙΚΩΝ ΣΠΟΥΔΩΝ ΓΑΛ 102 Προφορικός λόγος 6 ΓΑΛ 103 Γραπτός λόγος I 6 ΓΑΛ 170 e-french 6 ΓΑΛ Μάθημα περιορισμένης επιλογής 6

Μηχανική - Ρευστομηχανική

Αγροτικός Τουρισμός. Ενότητα 9 η : Εκπαιδευτικές τεχνικές στον τουρισμό. Όλγα Ιακωβίδου Τμήμα Γεωπονίας ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Διαγλωσσική μεταφορά και διαμεσολάβηση

Οργανωσιακή Συμπεριφορά Ενότητα 8: Επικοινωνία στην οργάνωση

Μάθηση σε νέα τεχνολογικά περιβάλλοντα

Φωνολογική Ανάπτυξη και Διαταραχές

ΜΑΘΗΜΑ: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

Θερμοδυναμική - Εργαστήριο

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΑΛΛΗΛΟΓΡΑΦΙΑ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑ ΣΤΗΝ ΑΓΓΛΙΚΗ ΓΛΩΣΣΑ

Βάσεις Δεδομένων. Ενότητα 4: Μοντελοποίηση Συσχέτισης Οντοτήτων. Αθανάσιος Σπυριδάκος Τμήμα Διοίκησης Επιχειρήσεων

Εφαρμογές Συστημάτων Γεωγραφικών Πληροφοριών

Εφαρμογές Συστημάτων Γεωγραφικών Πληροφοριών

Ψηφιακή Επεξεργασία Εικόνας

Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών

Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών

Γνωστική Ψυχολογία 3

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Ενότητα 11: Λογική πρώτης τάξης. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Φωνολογική Ανάπτυξη και Διαταραχές

Αυτοματοποιημένη χαρτογραφία

Ανάκτηση Πληροφορίας

Ψυχογλωσσολογία. Ενότητα 4 : Επεξεργασία προτάσεων. Χριστίνα Μανουηλίδου, Επίκουρη Καθηγήτρια Τμήμα Φιλολογίας

Πληροφορική 2. Τεχνητή νοημοσύνη

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα. 4o Εργαστήριο Σ.Α.Ε

Τεχνητή Νοημοσύνη. 21η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ανοιχτά γλωσσικά δεδομένα: η υποδομή γλωσσικών πόρων και υπηρεσιών clarin:el

ΘΕΩΡΙΑ ΥΠΟΛΟΓΙΣΜΩΝ ΚΑΙ ΑΥΤΟΜΑΤΩΝ

Γνωστική Ψυχολογία 3

Ανάπτυξη γλωσσικών δεξιοτήτων στο νηπιαγωγείο: Διδακτικές προσεγγίσεις του προφορικού λόγου ΠΕΡΙΓΡΑΜΜΑ ΕΙΣΗΓΗΣΕΩΝ

Ψηφιακή Σχεδίαση. Ενότητα: ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ No:05. Δρ. Μηνάς Δασυγένης. Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών

Διαδικαστικός Προγραμματισμός

Διδακτική Πληροφορικής

openlaws Αυτοματοποιημένη κωδικοποίηση της ελληνικής νομοθεσίας με NLP Θοδωρής Παπαδόπουλος

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι. Ενότητα 2: Μοντελο Συσχετίσεων Οντοτήτων, Μελέτη Περίπτωσης: Η βάση δεδομένων των CD

ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΛΟΓΟΥ ΚΑΙ ΑΚΟΗΣ

Βάσεις Δεδομένων. Ενότητα 3: Σχεδιασμός και Διαχείριση Βάσεων Δεδομένων. Αθανάσιος Σπυριδάκος Τμήμα Διοίκησης Επιχειρήσεων

Διδακτική της Πληροφορικής

Διγλωσσία και Εκπαίδευση

Ανάκτηση Πληροφορίας

ΤΟ ΦΥΛΟ ΣΤΗΝ ΙΣΤΟΡΙΑ ΤΗΣ ΕΚΠΑΙΔΕΥΣΗΣ

Αλληλεπίδραση Ανθρώπου- Υπολογιστή & Ευχρηστία

Τεχνολογία Πολυμέσων. Ενότητα # 20: Υπηρεσίες καλύτερης προσπάθειας Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Επιμέλεια μεταφράσεων και εκδοτικός χώρος

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕ ΧΡΗΣΗ Η/Υ

Transcript:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΕΙΣΑΓΩΓΗ

Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο Ιόνιο Πανεπιστήμιο» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 2

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons 3

Ο προπτυχιακός φοιτητής Σπύρος Σαγιαδινός στην παρουσίαση της εργασίας που εκπόνησε η ομάδα του στο μάθημα, στο Πανελλήνιο Συνέδριο Τεχνητής Νοημοσύνης, SETN, Mάιος 2014 4

Τι είναι Γλωσσική Τεχνολογία; Η ανάπτυξη υπολογιστικών μοντέλων επεξεργασίας πληροφορίας (γνώσης) που βρίσκεται σε φυσική (ανθρώπινη) γλώσσα (Σ. Σταματάτος-Παν/μιο Αιγαίου). Προφορικός λόγος Επεξεργασία ομιλίας Γραπτός λόγος Επεξεργασία φυσικής γλώσσας Εικόνα εγγράφου - Οπτική Αναγνώριση Χαρακτήρων 5

Γιατί είναι σημαντική; Για την ανάπτυξη πιο εύχρηστων και χρήσιμων υπολογιστικών συστημάτων Διεπαφή σε φυσική γλώσσα Συστήματα κατανόησης ομιλίας Καλύτερα συστήματα ανάκτησης/εξαγωγής πληροφορίας από κείμενα (WWW) Για την ανάπτυξη συστημάτων μηχανικής μετάφρασης Για την καλύτερη κατανόηση της ανθρώπινης επικοινωνίας/έκφρασης 6

Τεστ Turing 7

8

9

Εφαρμογές Επεξεργασίας Φυσικής Γλώσσας αυτόματη μετάφραση κειμένων έξυπνη αναζήτηση στο διαδίκτυο ανάκτηση πληροφορίας από σώματα κειμένων δημιουργία περίληψης κειμένου κατηγοριοποίηση κειμένων κατανόηση κειμένου από τον υπολογιστή σύνθεση φυσικής γλώσσας δημιουργία φιλικών προς το χρήστη και εύχρηστων διεπαφών υποστήριξη συγγραφέα (διόρθωση ορθογραφικών και συντακτικών λαθών) Web Sentiment Analysis 10

Εφαρμογές Επεξεργασίας Ομιλίας Αυτοματοποιημένες υπηρεσίες μέσω τηλεφώνου Φωνητικός έλεγχος μηχανών/συσκευών Συστήματα υπαγόρευσης Συστήματα αναγνώρισης ομιλητή 11

Παράδειγμα: Αυτόματη μετάφραση 12

Παράδειγμα: Σύνθεση είσοδος έξοδος Goldberg E: FoG: Synthesizing forecast text directly from weather maps 13

Παράδειγμα: Εξαγωγή πληροφορίας 19 March - A bomb went off this morning near a power tower in San Salvador leaving a large part of the city without energy, but no casualties have been reported. According to unofficial sources, the bomb - allegedly detonated by urban guerrilla commandos - blew up a power tower in the northwestern part of San Salvador at 0650 (1250 GMT). Incident type bombing Date March 19 Location El Salvador: San Salvador (city) Perpetrator urban guerilla commandos Physical target power tower Human target - Effect on physical target destroyed Effect on human target no injury or death Instrument bomb 14

Web Sentiment Analysis I love you but hate the current political climate. [no positive emotion or energy] 1 2 3 4 5 [very strong positive emotion] [no negative emotion] 1 2 3 4 5 [very strong negative emotion] 15

Διεπιστημονική περιοχή Γλωσσολογία: κατανόηση της χρήσης της γλώσσας Ψυχολογία: κατανόηση της αντίληψης και της παραγωγής της γλώσσας Επιστήμη Υπολογιστών: ανάπτυξη καλύτερων και πιο εύχρηστων εφαρμογών Τεχνητή Νοημοσύνη: ανάπτυξη μοντέλων ανθρώπινου συλλογισμού 16

Όνομα Επιστημονικής Περιοχής Επεξεργασία/Τεχνολογία Φυσικής Γλώσσας (Νatural Language Processing) Πληροφορική, Επιστήμη Υπολογιστών Υπολογιστική Γλωσσολογία (Computational Linguistics) Γλωσσολογία Υπολογιστική Ψυχογλωσσολογία (Computational psycho-linguistics) Ψυχολογία 17

Eliza (http://www-ai.ijs.si/eliza/eliza.html) Βασίζεται στην ψυχιατρική προσέγγιση του Carl Rogers (~1940-1950). O θεραπευτής δεν προτείνει, δεν συμβουλεύει, αλλά προτρέπει τον ασθενή να συνεχίσει να μιλάει, ώστε να καταλήξει μόνος του στην λύση του προβλήματός του. Η Eliza είναι ένα σύστημα που αναγνωρίζει πρότυπα λέξεων/φράσεων μέσα στην ερώτηση του χρήστη και αποκρίνεται αντίστοιχα. U: You don t argue with me. S: Why do you think I don t argue with you? U: I m feeling a bit depressed S: Are you depressed often? U: I m feeling a bit jump XyZZy S: Why do you say you are feeling a bit jump XyZZy? 18

Η γνώση στην γλώσσα Τι είναι οι λέξεις (ουσιαστικά, ρήματα, άρθρα); Πως συνδέονται μεταξύ τους; Τι σημαίνουν οι λέξεις; Πως συμβάλλουν τα νοήματα των λέξεων στις προτάσεις; 19

Επίπεδα γλωσσολογικής γνώσης Φωνητική και φωνολογική γνώση: Πως σχηματίζονται οι λέξεις από ήχους. Μορφολογική γνώση: Πως σχηματίζονται οι λέξεις από μορφήματα: έ τρεχ-α Συντακτική γνώση: Πως σχηματίζονται οι προτάσεις από λέξεις. Σημασιολογική γνώση: Το νόημα των λέξεων και (συνδυαζόμενα) νόημα προτάσεων. Πραγματολογική γνώση: Πως οι προτάσεις χρησιμοποιούνται σε διαφορετικά συμφραζόμενα, και πως τα συμφραζόμενα, και η γνώση του κόσμου επηρεάζουν την ερμηνεία μιας λέξης. 20

Παράδειγμα: «Αυτός αγαπάει τη Μαίρη.» Φωνολογία /a/ /f/ /t/ /o/ /s/ /a/ /g/ /a/ /p/ /a/ /i/ /t/ /i/ /m/ /e/ /r/ /i/ Μορφολογία αυτ-ός: αντωνυμία, ενικός, ονομαστική, αρσενικό αγαπ-άει: ρήμα, ενικός, τρίτο πρόσωπο, ενεστώτας τη: οριστικό άρθρο, ενικός, θηλυκό Μαίρη: κύριο όνομα, θηλυκό. : σημείο στίξης, τέλος περιόδου 21

Παράδειγμα: «Αυτός αγαπάει τη Μαίρη.» Σύνταξη 22

Παράδειγμα: «Αυτός αγαπάει τη Μαίρη.» Σημασιολογία x love(x, mary) Πραγματολογία love (john, mary) 23

Άλλα παραδείγματα «- Οι πράσινοι βάτραχοι έχουν μεγάλες μύτες» Σωστή: Σύνταξη, Σημασιολογία Λάθος: Πραγματολογία «- Οι πράσινες ιδέες έχουν μεγάλες μύτες» Σωστή: Σύνταξη, Λάθος: Σημασιολογία, Πραγματολογία «- Μεγάλες έχουν οι πράσινες ιδέες μύτες» Λάθος: Σύνταξη, Σημασιολογία, Πραγματολογία 24

25

Οι δυσκολίες της γλώσσας Ασάφεια (ambiguity) Φωνολογική ([filo]) Μορφολογική (να δώσεις οι δόσεις) Συντακτική (Είδα τον άντρα με το τηλεσκόπιο) Σημασιολογική (Έπιασα το ποντίκι) Πραγματολογική (Τι μέρα έχουμε;) Κάθε είδος ασάφειας απαιτεί γνώση παραπάνω επιπέδων για να επιλυθεί. 26

Οι δυσκολίες της γλώσσας (συν.) Διαφορετικοί τρόποι έκφρασης «Πότε γεννήθηκε η Μαίρη;» «Πότε είναι τα γενέθλια της Μαίρης;» Πληροφορία που εννοείται «Τηλεφώνησα στο σπίτι της Λένας για να πάμε σινεμά. Συμφώνησε με χαρά.» Η Λένα ήταν στο σπίτι της Η Λένα απάντησε στο τηλέφωνο Της ζήτησα να πάμε σινεμά Η ίδια πρόταση μπορεί να έχει διαφορετικό νόημα σε διαφορετικές περιπτώσεις «Πώς είναι το νερό;» Συνεχόμενη δημιουργία νέων λέξεων/εκφράσεων «Θα το σκανάρω.» 27

Συνήθεις εργασίες στην ΕΦΓ Επισημείωση μερών του λόγου (part-of-speech tagging) Ανίχνευση ορίων φράσεων μέσα σε μια πρόταση (phrase boundary detection) Συντακτική ανάλυση (parsing) Άρση αμφισημίας λέξεων (word sense disambiguation) Αναγνώριση ονομάτων-οντοτήτων (named-entity recognition) Ανάθεση σημασιολογικών ρόλων (semantic role assignment) 28

Έρευνα αιχμής Εξαγωγή πληροφορίας από κείμενα συγκεκριμένης θεματικής περιοχής Οικονομικά Βιο-ιατρική Αυτόματη περίληψη μεγάλων κειμένων Αυτόματη μετάφραση προφορικού λόγου Ανάπτυξη πρακτόρων με ανθρώπινα χαρακτηριστικά συνομιλίας... 29

Γλώσσες προγραμματισμού Prolog & Lisp Εύκολος χειρισμός λιστών Πρωτότυπα εφαρμογών τεχνητής νοημοσύνης Perl Πληθώρα έτοιμων συναρτήσεων χειρισμού αλφαριθμητικών C & Java Εμπορικές και web-based εφαρμογές Ευρεία φορητότητα 30

Ιστορικά στοιχεία Ορθολογική προσέγγιση (1965-1985) Βασίζεται στην θεωρία του γλωσσολόγου Noam Chomsky Προσπάθεια κωδικοποίησης (θεωρητικής μοντελοποίησης) της γλωσσολογικής γνώσης Η γλώσσα θεωρείται ως μια ακολουθία συμβόλων 31

Ιστορικά στοιχεία (συν) Εμπειρική/στοχαστική προσέγγιση (1950-1965 και 1985-σήμερα) Βασίζεται στη θεωρία του Claude Shannon για την απόδοση πιθανοτήτων σε γλωσσολογικές δομές Η σύνθετη και περίπλοκη δομή της γλώσσας μαθαίνεται καθορίζοντας ένα γενικό μοντέλο της γλώσσας και λαμβάνοντας τις τιμές των παραμέτρων μέσω στατιστικών μεθόδων, αναγνώρισης προτύπων και μηχανικής μάθησης Πρακτικά συστήματα βάσει σωμάτων κειμένων (corpusbased) 32

Ιστορικά στοιχεία (συν) 1950 1965: Έμφαση στη μηχανική μετάφραση 1966 1978: Έμφαση στη σημασιολογία 1979 1985: Έμφαση στη σύνταξη 1986 σήμερα: Έμφαση στις εργασίες χαμηλού επιπέδου, αξιολόγηση 33

Βιβλία Jurafsky, D. and J. H. Martin: Speech and Language Processing Prentice-Hall. 2008. ISBN 0131873210 Allen, J.: Natural Language Understanding (2 nd edition) The Benajmins/Cummings Publishing Company Inc. 1994. ISBN 0-8053-0334-0 Manning, C. D. and H. Schütze: Foundations of Statistical Natural Language Processing The MIT Press. 1999. ISBN 0-262-13360-1 34

Διευθύνσεις Association for Computational Linguistics (http://www.aclweb.org) Ινστιτούτο Επεξεργασίας του Λόγου (http://www.ilsp.gr) The Natural Language Software Registry (http://registry.dfki.de) The Natural Language Toolkit (http://nltk.sourceforge.net) Survey of the State of the Art in Human Language Technology (http://www.cse.ogi.edu/cslu/hltsurvey/) 35