ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος: 2012 2013



Σχετικά έγγραφα
Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος.

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΠΡΟΓΡΑΜΜΑ ΓΑΛΛΙΚΩΝ ΣΠΟΥΔΩΝ ΓΑΛ 102 Προφορικός λόγος 6 ΓΑΛ 103 Γραπτός λόγος I 6 ΓΑΛ 170 e-french 6 ΓΑΛ Μάθημα περιορισμένης επιλογής 6

Ανάκτηση Πληροφορίας

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΛΟΓΟΥ ΚΑΙ ΑΚΟΗΣ

Επικοινωνία Ανθρώπου Υπολογιστή

Κεφάλαιο 6ο: Παρόν και μέλλον της Υπολογιστικής Γλωσσολογίας

Διδακτική Προγραμματισμού. Χαρίκλεια Τσαλαπάτα 20/2/2012

5. Λόγος, γλώσσα και ομιλία

Η εξέλιξη στα συστήματα Μηχανικής Μετάφρασης

Ο γραπτός λόγος στην αναπηρία. Ε. Ντεροπούλου

Γραμματισμός στο νηπιαγωγείο. Μαρία Παπαδοπούλου

Προπτυχιακές και µεταπτυχιακές εργασίες Μάρτιος 2005

Για την εξέταση των Αρχαίων Ελληνικών ως μαθήματος Προσανατολισμού, ισχύουν τα εξής:

ΠΑΡΆΡΤΗΜΑ Β Ενδεικτική Λίστα Διδασκόντων Μελών Δ.Ε.Π. του Τμήματος

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΕΙΣΑΓΩΓΗ

ΔΙΔΑΣΚΑΛΙΑ ΤΟΥ ΓΛΩΣΣΙΚΟΥ ΜΑΘΗΜΑΤΟΣ

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ Γλώσσες & Τεχνικές 4 ο Εξάμηνο. - Ενότητα 1 - Δημοσθένης Σταμάτης

ヤ Διδασκαλία της Γλώσσας στις τάξεις Γ & Δ

Εφαρµογές Τεχνολογιών Γλωσσικής Επεξεργασίας στα Συστήµατα Αναζήτησης των Ελληνικών Ακαδηµαϊκών Βιβλιοθηκών

ΥΠΟΥΡΓΕΙΟ ΠΑΙΔΕΙΑΣ ΚΑΙ ΠΟΛΙΤΙΣΜΟΥ- ΝΕΟΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ ΓΙΑ ΤΟ ΓΥΜΝΑΣΙΟ

Επαναληπτικές Ασκήσεις. Κάτια Κερμανίδου

Τα πρώιμα μοντέλα του Cummins. Α.Χατζηδάκη

Προγραμματισμός Η/Υ. Προτεινόμενα θέματα εξετάσεων Εργαστήριο. Μέρος 1 ό. ΤΕΙ Λάρισας- Σχολή Τεχνολογικών Εφαρμογών Τμήμα Πολιτικών Έργων Υποδομής

Μέθοδος-Προσέγγιση- Διδακτικός σχεδιασμός. A. Xατζηδάκη, Π.Τ.Δ.Ε. Παν/μιο Κρήτης

Τεχνητή Νοημοσύνη ( )

ΠΡΟΚΗΡΥΞΗ ΔΙΑΠΑΝΕΠΙΣΤΗΜΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗ «ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ» ΠΡΟΣΚΛΗΣΗ ΥΠΟΒΟΛΗΣ ΥΠΟΨΗΦΙΟΤΗΤΩΝ

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα

Αυτόματο Σύστημα Εύρεσης και Κατηγοριοποίησης Ευκαιριών Εργασίας Μηχανικών (ΕΥΡΗΚΑ)

Greek On The Go Μια εφαρμογή για iphone

υναµική σύνθεση νοηµάτων µε χρήση εικονικού βοηθού για την υποστήριξη της διδασκαλίας γλώσσας σε κωφούς µαθητές

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΑΡΧΕΣ ΤΗΣ ΕΠΙΣΤΗΜΗΣ ΤΩΝ Η/Υ

Αιτία παραποµπής Ε Ω ΣΥΜΠΛΗΡΩΝΕΤΕ ΣΤΟΙΧΕΙΑ ΤΟΥ ΙΣΤΟΡΙΚΟΥ ΤΟΥ ΠΑΙ ΙΟΥ ΚΑΙ ΤΟ ΛΟΓΟ ΤΗΣ ΠΑΡΑΠΟΜΠΗΣ.

Πληροφορίες για το νέο HSK

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 10 ο : Αποσαφήνιση εννοιών λέξεων. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Η ΔΙΔΑΣΚΑΛΙΑ ΤΟΥ ΛΕΞΙΛΟΓΙΟΥ ΣΤΟ ΔΗΜΟΤΙΚΟ ΣΧΟΛΕΙΟ

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

ΕΙΣΑΓΩΓΙΚΗ ΕΝΟΤΗΤΑ ΕΝΔΕΙΚΤΙΚΟ ΔΙΑΓΡΑΜΜΑ ΔΙΔΑΣΚΑΛΙΑΣ. ο εκπαιδευτικός) Προσέγγιση: ολική και αναλυτικοσυνθετική

using advanced personalized patient models and advanced interventions»

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΛΟΓΟΥ ΚΑΙ ΑΚΟΗΣ

ΜΑΘΗΜΑ: Εισαγωγή στις Αρχές της Επιστήμης των Η/Υ. 1 η ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ

2. ΣΥΝΟΠΤΙΚΗ ΠΕΡΙΓΡΑΦΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΡΟΓΡΑΜΜΑΤΩΝ ΣΠΟΥΔΩΝ ΕΝΓ

Ενότητες Γ3.1 - Γ3.2 - Γ3.3

Πηγές πληροφόρησης: Πρωτογενείς Δευτερογενείς Τριτογενείς

«Τεχνογλωσσία VIII» Εξαγωγή πληροφοριών από κείμενα

Ellogon: Μία Πλατφόρμα Επεξεργασίας Φυσικής Γλώσσας. Γεώργιος Πετάσης

ΠΡΟΚΗΡΥΞΗ ΙΑΠΑΝΕΠΙΣΤΗΜΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ ΣΤΗ «ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ» ΠΡΟΣΚΛΗΣΗ ΥΠΟΒΟΛΗΣ ΥΠΟΨΗΦΙΟΤΗΤΩΝ

ΓΛΩΣΣΙΚΟΙ ΠΟΡΟΙ & ΤΕΧΝΟΛΟΓΙΕΣ:

Α/Α Τύπος Εκφώνηση Απαντήσεις Το λογισµικό Άτλαντας CENTENNIA µπορεί να χρησιµοποιηθεί 1. Α) Στην ιστορία. Σωστό το ) Σωστό το Γ)

Πύλη Ηλεκτρονικής Μάθησης του ΕΔΙΑΜΜΕ

Καλές και κακές πρακτικές στη διδασκαλία της ελληνικής ως δεύτερης/ξένης γλώσσας. Άννα Ιορδανίδου ΠΤΔΕ Παν/μίου Πατρών

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 8 ο : Εξαγωγή πληροφορίας. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 4 ο : Συντακτική ανάλυση. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Αξιολόγηση μεταφράσεων ιταλικής ελληνικής γλώσσας

ΑΝΑΛΥΣΗ ΠΟΙΟΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ. Γεράσιμος Παπαναστασάτος, Ph.D. Αθήνα, Σεπτέμβριος 2016

ΑΝΑΛΥΣΗ ΠΟΙΟΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

Τεχνητή Νοημοσύνη. 21η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Θεωρητική προσέγγιση του Σημασιολογικού Ιστού στο χώρο της πολιτισμικής πληροφορίας: μία πρότυπη εφαρμογή στη βιβλιοθηκονομία

Δυσλεξία και Ξένη Γλώσσα

ΚΑΤΑΝΟΗΣΗ ΓΡΑΠΤΟΥ ΛΟΓΟΥ ΓΛΩΣΣΙΚΗ ΕΠΙΓΝΩΣΗ

ιπλωµατική εργασία: Νικόλαος Ματάνας Επιβλέπων Καθηγήτρια: Μπούσιου έσποινα

Μάθηση σε κίνηση (Mobile learning) Χαρίκλεια Τσαλαπάτα 16/11/2016

O μετασχηματισμός μιας «διαθεματικής» δραστηριότητας σε μαθηματική. Δέσποινα Πόταρη Πανεπιστήμιο Πατρών

Η φωνολογική επίγνωση. Ευφημία Τάφα

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

Μελέτη περίπτωσης εργαλεία κοινωνικής δικτύωσης - MultiBlog. Ισπανική γλώσσα. 33 φοιτητές (ενήλικες > 25 ετών) και 2 εκπαιδευτικοί

ΝΕΑ ΕΛΛΗΝΙΚΗ ΓΛΩΣΣΑ ΕΝΔΕΙΚΤΙΚΟΣ ΕΤΗΣΙΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Α ΤΑΞΗ ΓΥΜΝΑΣΙΟΥ

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΣΗΜΑΣΙΟΛΟΓΙΑ - SEMANTICS

ΦΟΡΜΑ ΑΞΙΟΛΟΓΗΣΗΣ. 1) Στάση του μαθητή/τριας κατά τη διάρκεια του μαθήματος: Δεν την κατέχει. Την κατέχει μερικώς. επαρκώς

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Προεπεξεργασία Κειμένου

ΜΙΛΑ ΜΑΘΕ. μαζί ΜΟΥ, μαζί ΜΟΥ ΗΜΕΡΟΛΟΓΙΟ Συμβουλές για την ανάπτυξη των δεξιοτήτων του παιδιού

ヤ Διδασκαλία της Γλώσσας στη Δ τάξη

ΔΙΔΑΚΤΙΚΗ ΤΗΣ ΧΗΜΕΙΑΣ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

Κεφάλαιο Ένα Επίπεδο 1 Στόχοι και Περιεχόμενο

Διδακτική Γλωσσικών Μαθημάτων (ΚΠΒ307)

ΠΡΟΔΙΑΓΡΑΦΕΣ - ΟΔΗΓΙΕΣ ΔΙΑΜΟΡΦΩΣΗΣ ΘΕΜΑΤΩΝ ΓΙΑ ΤΟ ΜΑΘΗΜΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ. ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ Διδακτική της Πληροφορικής

ΠΡΟΓΡΑΜΜΑ ΕΠΙΜΟΡΦΩΣΗΣ E-LEARNING ΕΜΠΕΙΡΙΚΗ ΚΟΙΝΩΝΙΚΗ ΕΡΕΥΝΑ ΤΜΗΜΑ ΚΟΙΝΩΝΙΟΛΟΓΙΑΣ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΑΙΓΑΙΟΥ ΤΜΗΜΑ ΚΟΙΝΩΝΙΟΛΟΓΙΑΣ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΚΡΗΤΗΣ

ΑΝΑΛΥΣΗ ΠΟΙΟΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Τεχνολογία Λογισμικού

ΘΕΜΑ 1 Τεχνικές Εξαγωγής Συµφράσεων από εδοµένα Κειµένου και Πειραµατική Αξιολόγηση

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΠΙΣΤΗΜΕΣ ΛΟΓΟΥ ΚΑΙ ΑΚΟΗΣ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Λογική. Ενότητα 1: Εισαγωγή. Δημήτρης Πλεξουσάκης Τμήμα Επιστήμης Υπολογιστών

Ενότητα 14 (XIV): Γλωσσική-Λεξιλογική προσέγγιση, επεξεργασία και γραμματικής ανακεφαλαίωση.

Η ανάλυση της κριτικής διδασκαλίας. Περιεχόμενο ή διαδικασία? Βασικό δίλημμα κάθε εκπαιδευτικού. Περιεχόμενο - η γνώση ως μετάδοση πληροφορίας

Προηγµένη ιασύνδεση µε τοπεριβάλλον

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 9 ο : Σύνολα χαρακτήρων και UNICODE. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ. ακαδ. έτους

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ (ΠΜΣ) «ΠΛΗΡΟΦΟΡΙΚΗ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΕΣ» ΤΟΥ ΤΜΗΜΑΤΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΟΥ Α.Π.Θ.

Πρόγραμμα Μεταπτυχιακών Σπουδών Π.Τ.Δ.Ε. Παν/μίου Κρήτης «Επιστήμες Αγωγής»

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ

Πιστοποίηση επάρκειας της ελληνομάθειας. Οδηγίες για την ανάπτυξη εξεταστικών ερωτημάτων

AΡΧΑΙΑ ΕΛΛΗΝΙΚΑ ΙΣΤΟΡΙΑ ΝΕΑ ΕΛΛΗΝΙΚΑ

ΔΙΑΦΟΡΟΠΟΙΗΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΠΡΟΓΡΑΜΜΑΤΩΝ

ΕΙΣΑΓΩΓΗ ΣΤΟΥΣ ΑΛΓΟΡΙΘΜΟΥΣ ΚΑΙ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ

ΕΙΣΑΓΩΓΙΚΗ ΣΥΝΔΙΚΑΛΙΣΤΙΚΗ ΕΚΠΑΙΔΕΥΣΗ - ΕΠΙΜΟΡΦΩΣΗ

Transcript:

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία Γεώργιος Πετάσης Ακαδημαϊκό Έτος: 2012 2013 ΤMHMA MHXANIKΩΝ Η/Υ & ΠΛΗΡΟΦΟΡΙΚΗΣ, Πανεπιστήμιο Πατρών, 2012 2013

Τι είναι η γλωσσική τεχνολογία; Η ανάπτυξη υπολογιστικών μοντέλων επεξεργασίας πληροφορίας εκφρασμένης σε φυσική γλώσσα Γλώσσα: μέσο καταγραφής και ανταλλαγής πληροφορίας Φυσική γλώσσα: μέσο για την επικοινωνία μεταξύ ανθρώπων Τεχνητή γλώσσα: μέσο για την επικοινωνία ανθρώπου - μηχανής Γλωσσική Τεχνολογία, Μάθημα 1 ο, Εισαγωγή στην γλωσσική τεχνολογία 1

Γλωσσική τεχνολογία Αυτόματη ανάλυση («κατανόηση»;) και παραγωγή γραπτών ή προφορικών εκφράσεων φυσικής γλώσσας Αυτόματη διόρθωση κειμένων, μηχανική μετάφραση, εξαγωγή πληροφορίας, αυτόματη παραγωγή περιλήψεων, συστήματα ερωταποκρίσεων, διαλογικά συστήματα, αυτόματη παραγωγή κειμένων, κ.α. Διάφορα μέσα περιέχουν φυσική γλώσσα Γραπτός λόγος (κείμενα), προφορικός λόγος (ομιλία), εικόνα εγγράφου, κλπ. Γλωσσική Τεχνολογία, Μάθημα 1 ο, Εισαγωγή στην γλωσσική τεχνολογία 2

Γιατί είναι σημαντική; (1) Πολύ μεγάλο μέρος της καταγεγραμμένης ανθρώπινης γνώσης είναι εκφρασμένο σε φυσική γλώσσα Γνώση οργανισμών: νόμοι, κανονισμοί, πατέντες, αναφορές, πρακτικά, αλληλογραφία, εγχειρίδια, οδηγίες, κλπ. Πληροφορία από/για χρήστες: ιστόχωροι οργανισμών, περιγραφές προϊόντων, ηλεκτρονική αλληλογραφία, ιστολόγια, επικοινωνία μέσω κοινωνικών δικτύων, φόρα συζητήσεων, κλπ. Γλωσσική Τεχνολογία, Μάθημα 1 ο, Εισαγωγή στην γλωσσική τεχνολογία 3

Γιατί είναι σημαντική; (2) Η ραγδαία ανάπτυξη του παγκόσμιου ιστού έχει καταστήσει μεγάλους όγκους πληροφορίας άμεσα προσβάσιμους Οδηγώντας στην υπερ-πληροφόρηση Η γλωσσική τεχνολογία έχει ήδη συμβάλει στην ανακάλυψη νέων τρόπων για την καλύτερη συμβίωσή μας με την τεχνολογία Συστήματα που: αναγνωρίζουν ομιλία και γραφή, κατανοούν κείμενα αρκετά καλά ώστε να μπορούν να επιλέγουν πληροφορίες, μεταφράζουν από μια γλώσσα σε άλλες, συνθέτουν ομιλία και κείμενα, κλπ. Γλωσσική Τεχνολογία, Μάθημα 1 ο, Εισαγωγή στην γλωσσική τεχνολογία 4

Όμως, δεν είναι εύκολη Η φυσική γλώσσα είναι περίπλοκη Πολλαπλοί τρόποι έκφρασης της ίδιας πληροφορίας, ασάφεια, ελλιπής πληροφορία, διαφορετικό νόημα ανάλογα το περιβάλλον, δημιουργία νέων εκφράσεων, κλπ. επειδή απευθύνεται σε ανθρώπους Οι οποίοι χρησιμοποιούν γνώση του κόσμου και εμπειρία για την κατανόηση της φυσικής γλώσσας Η μηχανή δυσκολεύεται σημαντικά Περιορισμένη γνώση του κόσμου: εστίαση σε θεματικές περιοχές, χρήση οντολογιών Γλωσσική Τεχνολογία, Μάθημα 1 ο, Εισαγωγή στην γλωσσική τεχνολογία 5

Ασάφεια Φωνολογική: «λύπη, λίπη, λείπει», «στον ώμο, στο νόμο» Μορφολογική: «η/την μητέρα» Συντακτική: «Κάνε το δικό σου.» Σημασιολογική: «τόνος», «σκοπός», «ρόκα» Πραγματολογική: «Ξέρεις τι ώρα είναι;» Γλωσσική Τεχνολογία, Μάθημα 1 ο, Εισαγωγή στην γλωσσική τεχνολογία 6

Πολλοί συναφείς όροι Επεξεργασία φυσικής γλώσσας (natural language processing) Κυρίως γραπτή γλώσσα, κύριος στόχος η δημιουργία υπολογιστικών συστημάτων, υποτομέας της ΤΝ Υπολογιστική γλωσσολογία (computational linguistics) Κυρίως γραπτή γλώσσα, κύριος στόχος η δημιουργία υπολογιστικών μοντέλων γλωσσολογικών θεωριών Θεωρητική προσέγγιση, πλέον συνώνυμο της ΕΦΓ Γλωσσική τεχνολογία (human language technology) Λιγότερο καθιερωμένος όρος, συνήθως περιλαμβάνει και τεχνολογίες αναγνώρισης και σύνθεσης φωνής, έμφαση στη δημιουργία χρήσιμων υπολογιστικών συστημάτων Γλωσσική Τεχνολογία, Μάθημα 1 ο, Εισαγωγή στην γλωσσική τεχνολογία 7

Ανάλυση και παραγωγή Υπολογιστική αναπαράσταση (π.χ. λογική έκφραση, πίνακας, στατιστικό μοντέλο) Υπολογιστική αναπαράσταση (π.χ. βάση δεδομένων, μετρήσεις, προδιαγραφές) Σύστημα ανάλυσης φυσικής γλώσσας Σύστημα παραγωγής φυσικής γλώσσας Κείμενο (π.χ. άρθρο εφημερίδας, ανάρτηση ιστολογίου, κλπ.) Κείμενο (π.χ. περιγραφή αντικειμένου, πρόγνωση καιρού, κλπ.) Γλωσσική Τεχνολογία, Μάθημα 1 ο, Εισαγωγή στην γλωσσική τεχνολογία 8

Επίπεδα ανάλυσης Προ-επεξεργασία Μορφολογική ανάλυση Συντακτική ανάλυση Σημασιολογική ανάλυση Ανάλυση πραγματείας Αναγνώριση λέξεων, προτάσεων, Πληροφορίες για τις λέξεις, όπως θέμα, κατάληξη, πρόσωπο, αριθμό, γένος, Συντακτική δομή περιόδων, ρόλοι των λέξεων, κλπ. Αναγνώριση του νοήματος των προτάσεων Αναφορικές εκφράσεις, σχέσεις μεταξύ προτάσεων Ανάλυση σχεδίου Σκοποί του χρήστη, σχέδια δράσεως, Γλωσσική Τεχνολογία, Μάθημα 1 ο, Εισαγωγή στην γλωσσική τεχνολογία 9

16:22 Σύντομη ανασκόπηση (1) Η γλωσσική τεχνολογία είναι τόσο παλιά, όσο και οι Η/Υ Η έρευνα ξεκίνησε την δεκαετία του 1950 Μεγάλη επιρροή άσκησε η έρευνα του Noam Chomsky Διατύπωσε θεωρίες σχετικά με την εκμάθηση της γλώσσας από τα παιδιά Όρισε μια ιεραρχία γλωσσών, αποτελούμενη από 4 κατηγορίες τυπικών γραμματικών (formal languages) Κανονικές, ανεξάρτητες από τα συμφραζόμενα, εξαρτημένες από τα συμφραζόμενα, απεριόριστες Γλωσσική Τεχνολογία, Μάθημα 1 ο, Εισαγωγή στην γλωσσική τεχνολογία 10

Σύντομη ανασκόπηση (2) 1950 1965: Πρώτα βήματα, έμφαση στην μηχανική μετάφραση 1965 1980: Έμφαση στην σημασιολογία 1980 1990: Έμφαση στην σύνταξη, την (στατιστική) μηχανική μετάφραση, την αναγνώριση ομιλίας 1990 σήμερα: Έμφαση στις εργασίες χαμηλού επιπέδου, την συνεργασία ΕΦΓ και μηχανικής μάθησης, την εξαγωγή πληροφορίας, την αξιολόγηση Γλωσσική Τεχνολογία, Μάθημα 1 ο, Εισαγωγή στην γλωσσική τεχνολογία 11

Παραδείγματα εφαρμογών (1) Υποστήριξη συγγραφής Ορθογραφική/συντακτική διόρθωση, συστήματα υπαγόρευσης Μετάφραση κειμένων Κατηγοριοποίηση και φιλτράρισμα κειμένων Μηχανές αναζήτησης Εξαγωγή πληροφορίας παραγωγή περίληψης Διεπαφές σε φυσική γλώσσα Σε βάσεις δεδομένων/μηχανές αναζήτησης, διαλογικά συστήματα, αυτοματοποιημένες υπηρεσίες μέσω τηλεφώνου Γλωσσική Τεχνολογία, Μάθημα 1 ο, Εισαγωγή στην γλωσσική τεχνολογία 12

Παραδείγματα εφαρμογών (2) Δρομολόγηση αλληλογραφίας Αυτόματος υποτιτλισμός Αντιστοίχηση βιογραφικών με αγγελίες ευρέσεως εργασίας Εξαγωγή στοιχείων για τον συγγραφέα από τον τρόπο γραφής (stylometry) Εντοπισμός αντιγράφων, αυθεντικότητα κειμένων, κλπ. Εντοπισμός συναισθήματος Γλωσσική Τεχνολογία, Μάθημα 1 ο, Εισαγωγή στην γλωσσική τεχνολογία 13

Κοινές εργασίες Αναγνώριση ομιλίας, OCR Καθάρισμα κειμένων (π.χ. από HTML) Αναγνώριση λέξεων/προτάσεων Αναγνώριση μερών του λόγου Ρηχή συντακτική ανάλυση Αναγνώριση ονομάτων οντοτήτων Εξαγωγή συσχετίσεων Αναγνώριση συναισθήματος/πολικότητας Αποσαφήνιση έννοιας λέξεων Γλωσσική Τεχνολογία, Μάθημα 1 ο, Εισαγωγή στην γλωσσική τεχνολογία 14

Πλατφόρμες Υποδομές ενθυλάκωσης εργαλείων ΕΦΓ GATE - http://gate.ac.uk/ Η πρώτη δημοφιλής πλατφόρμα Java Ellogon - http://www.ellogon.org/ Η πρώτη UNICODE πλατφόρμα C/C++/Tcl/ NLTK - http://nltk.org/ Η «εκπαιδευτική» πλατφόρμα Python Apache UIMA - http://uima.apache.org/ Η «ανερχόμενη» πλατφόρμα Java/C++ Γλωσσική Τεχνολογία, Μάθημα 1 ο, Εισαγωγή στην γλωσσική τεχνολογία 15

Ανασκόπηση Γλωσσική τεχνολογία: γλωσσικές δυνατότητες που ενσωματώνονται σε συστήματα πληροφορικής και επικοινωνιακής τεχνολογίας Αφορά την ανάλυση και παραγωγή φυσικής γλώσσας Είναι σημαντική και ταυτόχρονα δύσκολη Έξι επίπεδα ανάλυσης Σύντομη ανασκόπηση Ενδεικτικές εφαρμογές/κοινές εργασίες Πλατφόρμες ΕΦΓ Γλωσσική Τεχνολογία, Μάθημα 1 ο, Εισαγωγή στην γλωσσική τεχνολογία 17