(Εισαγωγή) Η αντιστοιχία αυτή δεν µοναδική (ένα προς ένα) ούτε αναγκαία. Αυτό αποδεικνύεται µε τον πλούτο των γλωσσών του ανθρώπου.



Σχετικά έγγραφα
ΜΑΘΗΜΑ: Εισαγωγή στις Αρχές της Επιστήμης των Η/Υ. 1 η ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ

Συστήματα Γνώσης. Θεωρητικό Κομμάτι Μαθήματος Ενότητα 2: Βασικές Αρχές Αναπαράστασης Γνώσης και Συλλογιστικής

Γλώσσες υψηλού επιπέδου Περιέχουν περισσότερες εντολές για την εκτέλεση πολύπλοκων εργασιών Τα προγράµµατα µεταφράζονται σε γλώσσα µηχανής είτε από το

Α. Ερωτήσεις Ανάπτυξης

ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι

ΚΕΦΑΛΑΙΟ 6 ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ. 03/01/09 Χαράλαμπος Τζόκας 1

Εισαγωγή στον προγραμματισμό

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 1 ο : Εισαγωγή στην γλωσσική τεχνολογία. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

Επιµέλεια Θοδωρής Πιερράτος

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ. Μάθημα 2 ο : Βασικές έννοιες. Γεώργιος Πετάσης. Ακαδημαϊκό Έτος:

ΑΕΠΠ Ερωτήσεις θεωρίας

ΗΥ Λογική. Διδάσκων: Δημήτρης Πλεξουσάκης Καθηγητής

6. 1 Η έννοια του προγράμματος

10. Με πόσους και ποιους τρόπους μπορεί να αναπαρασταθεί ένα πρόβλημα; 11. Περιγράψτε τα τρία στάδια αντιμετώπισης ενός προβλήματος.

ΚΕΦΑΛΑΙΟ 7 ΕΙ Η, ΤΕΧΝΙΚΕΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΑ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ

Ανάπτυξη Εφαρμογών σε Προγραμματιστικό Περιβάλλον κεφ.6 Εισαγωγή στον Προγραμματισμό

ΚΕΦΑΛΑΙΟ 6 ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ. Η επίλυση ενός προβλήματος με τον υπολογιστή περιλαμβάνει τρία εξίσου σημαντικά στάδια.

ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΣΗΜΑΣΙΟΛΟΓΙΑ - SEMANTICS

Κεφάλαιο 3 Η Σημασιολογία των Γλωσσών Προγραμματισμού

ΜΑΘΗΜΑΤΑ ΤΜΗΜΑΤΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΑΘΗΜΑ ΠΑΡΑ ΟΣΕΙΣ ΑΣΚΗΣΕΙΣ ΚΑΘΗΓΗΤΕΣ/ΤΡΙΕΣ

Κεφάλαιο 7 : Είδη, Τεχνικές, και Περιβάλλοντα Προγραµµατισµού

Ανάκτηση Πληροφορίας

κεφάλαιο Βασικές Έννοιες Επιστήμη των Υπολογιστών

Ο 19ος αιώνας Είδαμε ότι πρώτοι ιστορικο-συγκριτικοί επιστήμονες είχαν στόχο να εξηγήσουν τις ομοιότητες που παρατηρούσαν ανάμεσα στις γλώσσες. Είδαμε

Προγραμματισμός Η/Υ. Προτεινόμενα θέματα εξετάσεων Εργαστήριο. Μέρος 1 ό. ΤΕΙ Λάρισας- Σχολή Τεχνολογικών Εφαρμογών Τμήμα Πολιτικών Έργων Υποδομής

Κεφάλαιο 1. Εισαγωγή

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ. Λογική. Ενότητα 1: Εισαγωγή. Δημήτρης Πλεξουσάκης Τμήμα Επιστήμης Υπολογιστών

Μαλούτα Θεανώ Σελίδα 1

Γενικές Παρατηρήσεις. Μη Κανονικές Γλώσσες - Χωρίς Συµφραζόµενα (1) Το Λήµµα της Αντλησης. Χρήση του Λήµµατος Αντλησης.

Σύνοψη Θεωρίας ΟΡΙΣΜΟΣ ΚΑΙ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΑΛΓΟΡΙΘΜΩΝ

ΚΕΦΑΛΑΙΟ 6 - ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ

Ανάπτυξη Εφαρµογών σε Προγραµµατιστικό Περιβάλλον

ΕΙΔΗ,ΤΕΧΝΙΚΕΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΑ ΠΡΟΓΡΑΜΜΑΤΙ- ΣΜΟΥ

Στοιχεία Θεωρίας Υπολογισµού (1): Τυπικές Γλώσσες, Γραµµατικές

Ποιές οι θεµελιώδεις δυνατότητες και ποιοί οι εγγενείς περιορισµοί των υπολογιστών ; Τί µπορούµε και τί δε µπορούµε να υπολογίσουµε (και γιατί);

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΔΙΟΙΚΗΣΗΣ MANAGEMENT INFORMATION SYSTEMS (M.I.S.)

Κεφάλαιο 8. Βασικές Αρχές Αναπαράστασης Γνώσης και Συλλογιστικής. Τεχνητή Νοηµοσύνη - Β' Έκδοση

Ε Ι Α Γ Ω Γ Η Σ Ο Ν Π Ρ Ο Γ Ρ Α Μ Μ Α Σ Ι Μ Ο Κ Ε Υ Α Λ Α Ι Ο 6. Σο πρόγραμμα γράφεται σε κάποια γλώσσα προγραμματισμού.

Κεφάλαιο 6ο: Παρόν και μέλλον της Υπολογιστικής Γλωσσολογίας

Εισαγωγή στις Βάσεις Δεδομζνων II

Εισαγωγή στη Γνωστική Ψυχολογία. επ. Κωνσταντίνος Π. Χρήστου

ΑΛΓΟΡΙΘΜΟΙ. Τι είναι αλγόριθμος

Πτυχιακή Εργασία. Δημιουργία ενός survey για την Επεξεργασία Φυσικής Γλώσσας με Βάσεις Δεδομένων

Πληροφορική και Τεχνολογίες Πληροφορίας & Επικοινωνιών: Συνύπαρξη και παιδαγωγική πρακτική. Τάσος Μικρόπουλος Ιωάννα Μπέλλου Πανεπιστήμιο Ιωαννίνων

Π ρ ο γ ρ α μ μ α τ ι σ μ ό ς Β α σ ι κ έ ς έ ν ν ο ι ε ς Ι σ τ ο ρ ι κ ή α ν α δ ρ ο μ ή Η έννοια του προγράμματος Ιστορική αναδρομή

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ

Προγραμματισμός Υπολογιστών

Θέματα Μεταγλωττιστών

Γλωσσική Τεχνολογία. Εισαγωγή. Ίων Ανδρουτσόπουλος.

Γλώσσες Προγραμματισμού Μεταγλωττιστές

Γ ΚΠΣ ΕΠΕΑΕΚ ΙΙ ΜΕΤΡΟ 2.2, ΚΑΤΗΓΟΡΙΑ ΠΡΑΞΗΣ ια. ΕΡΓΟ: «ΠΕΡΙΒΑΛΛΟΝ - ΑΡΧΙΜΗΔΗΣ-Ενίσχυση ερευνητικών ομάδων του ΤΕΙ ΚΡΗΤΗΣ»

Μοντέλα. χαρακτηριστικά χωρίς να συνοδεύεται από λεπτοµέρειες.

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΑΡΧΕΣ ΤΗΣ ΕΠΙΣΤΗΜΗΣ ΤΩΝ Η/Υ

Μοντέλα γλωσσικής επεξεργασίας: σύνταξη

ΠΡΟΚΗΡΥΞΗ ΔΙΑΠΑΝΕΠΙΣΤΗΜΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗ «ΓΛΩΣΣΙΚΗ ΤΕΧΝΟΛΟΓΙΑ» ΠΡΟΣΚΛΗΣΗ ΥΠΟΒΟΛΗΣ ΥΠΟΨΗΦΙΟΤΗΤΩΝ

Ασκήσεις μελέτης της ενότητας «Συντακτική Ανάλυση»

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ

Πληροφορική 2. Γλώσσες Προγραμματισμού

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

Εισαγωγή στις Αρχές της Επιστήμης των ΗΥ

Θέματα Μεταγλωττιστών

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

Προγραμματισμός Η/Υ. Αλγόριθμοι. ΤΕΙ Ιονίων Νήσων Τμήμα Τεχνολόγων Περιβάλλοντος Κατεύθυνση Τεχνολογιών Φυσικού Περιβάλλοντος

Κεφάλαιο 2.3: Προγραμματισμός. Επιστήμη ΗΥ Κεφ. 2.3 Καραμαούνας Πολύκαρπος

PRAGMATIQUE ΠΡΑΓΜΑΤΟΛΟΓΙΑ. Αγγελική Αλεξοπούλου

Πληροφορική 2. Τεχνητή νοημοσύνη

Οπτική αντίληψη. Μετά?..

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Τεχνικές NLP Σχεδιαστικά Θέματα

Αρχές Προγραμματισμού Υπολογιστών

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Ασκήσεις μελέτης της ενότητας «Συντακτική Ανάλυση»

Μοντελοποίηση Υπολογισμού. Γραμματικές Πεπερασμένα Αυτόματα Κανονικές Εκφράσεις

Εισαγωγή στον Προγραμματισμό

Αναπαράσταση Γνώσης. Αναπαράσταση Γνώσης με Λογική. Προτασιακή Λογική Λογική Πρώτης Τάξης

Τεχνητή Νοημοσύνη (ΤΝ)

ΕΙΣΑΓΩΓΗ ΣΤΟΥΣ ΑΛΓΟΡΙΘΜΟΥΣ ΚΑΙ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ

«Ποιος θέλει να γίνει εκατομμυριούχος;» a la Ελληνικά

Η εξέλιξη στα συστήματα Μηχανικής Μετάφρασης

Η ΑΕΠΠ IN A GLANCE! ΦΡΟΝΤΙΣΤΗΡΙΑ ΠΟΛΥΜΕΝΗ

Επιµέλεια Θοδωρής Πιερράτος

Γεωργία Ε. Αντωνέλου Επιστημονικό Προσωπικό ΕΕΥΕΜ Μαθηματικός, Msc.

Περί της Ταξινόμησης των Ειδών

ΕΦΗΜΕΡΙ Α ΤΗΣ ΚΥΒΕΡΝΗΣΕΩΣ

ΚΑΤΑΝΟΗΣΗ ΑΝΑΛΥΣΗ ΕΠΙΛΥΣΗ. Ο προγραμματισμός ασχολείται με το σύνολο των εντολών που δίνονται στον υπολογιστή ώστε να υλοποιείται ο αλγόριθμος.

Ανδρέας Παπαζώης. Τμ. Διοίκησης Επιχειρήσεων

Παιδαγωγικές δραστηριότητες μοντελοποίησης με χρήση ανοικτών υπολογιστικών περιβαλλόντων

ιαφάνειες παρουσίασης #1

Παρουσίαση: Ανθρωποκεντρικός σχεδιασμός πολυμέσων ΜΙΚΡΟΠΟΥΛΟΥ ΕΥΓΕΝΙΑ ΓΤΠ61

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Προγραμματισμός Ι (HY120)

Μεταγλωττιστές. Γιώργος Δημητρίου. Μάθημα 1 ο. Πανεπιστήμιο Θεσσαλίας - Τμήμα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών

Μηχανές Turing (T.M) I

Μάθημα: Δ3. Δίκτυα Γνώσης και Σημασιολογικός Ιστός. Διάλεξη 01 & 02. Δρ. Γεώργιος Χρ. Μακρής

ΔΙΔΑΚΤΙΚΗ ΤΗΣ ΧΗΜΕΙΑΣ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΨΥΧΟΛΟΓΙΑ με έμφαση στις γνωστικές λειτουργίες. Θεματική Ενότητα 8: Γνωστική επανάσταση/τομείς της ψυχολογίας

Μάθημα: Δ3. Δίκτυα Γνώσης και Σημασιολογικός Ιστός. Διάλεξη 02 & 03. Δρ. Γεώργιος Χρ. Μακρής

Επιστήμη της Πληροφορικής. Εργασία του μαθητή Δημήτρη Τσιαμπά του τμήματος Α4

Διδακτική της Περιβαλλοντικής Εκπαίδευσης

Ανάπτυξη Εφαρμογών σε Προγραμματιστικό Περιβάλλον

Transcript:

ΚΕΦΑΛΑΙΟ 1 (Εισαγωγή) Επικοινωνία Η επικοινωνία αντιστοιχεί σε τόσο ευρύ γνωστικό πεδίο και χρησιµοποιείται ως όρος σε πολλές περιοχές του επιστητού που γίνεται δύσκολος ένας ακριβής ορισµός της. Με κάποια γενική προσέγγιση θα λέγαµε ότι επικοινωνία είναι η ηθεληµένη ανταλλαγή πληροφορίας και πραγµατώνεται από παραγόµενα και κατανοούµενα σηµεία (signs)επιλεγόµενα από σύστηµα συµβατικών σηµείων. Οι άνθρωποι, όπως άλλωστε όλα τα ζώα, χρησιµοποιούν ως µέσο επικοινωνίας περιορισµένο σύνολο σηµείων (χαµόγελο, χειραψία, χειρονοµίες, κινήσεις σώµατος κλπ). Επιπλέον ανέπτυξαν ένα πολύπλοκο και δοµηµένο σύστηµα σηµείων, τη γλώσσα, για να κοινωνήσουν ό,τι γνωρίζουν για τον κόσµο. Τα δελφίνια και οι χιµπατζήδες χρησιµοποιούν λεξιλόγιο αποτελούµενο από δεκάδες σηµεία και έχουν την ικανότητα να τα συµπαραθέτουν για να εκφραστούν. Ο άνθρωπος είναι το µόνο είδος που µπορεί αξιόπιστα να επικοινωνήσει χρησιµοποιώντας απέραντο πλήθος µηνυµάτων, ποιοτικά διαφορετικών µεταξύ τους. Ενώ, για παράδειγµα, η ουρά της µέλισσας µε το σκίρτηµά της προσδιορίζει τη γωνία από τον ήλιο και την απόσταση του σηµείου όπου βρίσκεται η τροφή, δηµιουργώντας θεωρητικά άπειρο πλήθος µηνυµάτων, αλλά όχι ποιοτικά διαφορετικών. Γλώσσα Οι λέξεις, που αποτελούν θεµελιώδεις νοηµατικές µονάδες της γλώσσας, συνδέονται µε σηµασίες ( meanings ) τις οποίες κοινωνούν οι άνθρωποι που επικοινωνούν µ αυτές. Αυτό επιτελείται κατά σύµβαση δηλούµενη ή υπονοούµενη. Το πιο απλό παράδειγµα αυτών των συµβάσεων αποτελούν τα κύρια ονόµατα που αντιστοιχούν συνήθως σε άτοµα (πρόσωπα, πόλεις, τοπωνύµια κλπ). Άλλο παράδειγµα αποτελούν τα ονόµατα γενικά που αντιστοιχούν στα διάφορα είδη των αντικειµένων και τα ρήµατα που αντιστοιχούν σε δράσεις (π..χ. δίνω το ρολόι του Γιώργου ), σε καταστάσεις (π.χ. η γάτα κοιµάται ) ή σε σχέσεις µεταξύ των αντικειµένων (π.χ. αιτία του Τρωικού πολέµου στάθηκε η ωραία Ελένη ). Η αντιστοιχία αυτή δεν µοναδική (ένα προς ένα) ούτε αναγκαία. Αυτό αποδεικνύεται µε τον πλούτο των γλωσσών του ανθρώπου. Τέλος, η κατανόηση της γλώσσας είτε από τον άνθρωπο είτε από τη µηχανή στηρίζεται στην κοινωνούµενη αυτή σύµβαση, που προαναφέρθηκε. Εποµένως τέτοιες κοινωνούµενες συµβάσεις είναι απαραίτητο να δοθούν στις µηχανές (τους υπολογιστές) ώστε να επιτελέσουν την επεξεργασία της φυσικής γλώσσας. Γιάνης Μαϊστρος - Στέλλα Μαρκαντωνάτου 1

Υπολογιστική Γλωσσολογία ή Επεξεργασία Φυσικής Γλώσσας Η επιστηµονική περιοχή που φέρει αυτόν τον τίτλο σε αδρές γραµµές καλύπτει τις ακόλουθες κατευθύνσεις. Σχεδιασµός και υλοποίηση υπολογιστικών µοντέλων της φυσικής γλώσσας, και πιο συγκεκριµένα: την αναγνώριση ή κατανόηση της φυσικής γλώσσας από υπολογιστή, και την παραγωγή φυσικής γλώσσας ή σύνθεση. Οι εφαρµογές της περιοχής αυτής αγκαλιάζουν: τον διάλογο µε τον υπολογιστή την µηχανική µετάφραση (από γλώσσα σε γλώσσα, από γλώσσα σε βάση δεδοµένων και αντιστρόφως κλπ), και την αναδίφηση (browsing) ή την διήθηση (filtering) κειµένων φυσικής γλώσσας από έναν πράκτορα ή παράγοντα (agent). Ο όρος Επεξεργασία Φυσικής Γλώσσας (Natural Language Processing) είναι παραδοσιακός και προέρχεται από τον οµώνυµο κλάδο της Τεχνητής Νόησης (Artificial Intelligence). Σήµερα αντιστοιχεί στην εφαρµοσµένη Υπολογιστική Γλωσσολογία. Υπολογιστική Γλωσσολογία Η µελέτη της γλώσσας αποτελεί αντικείµενο της κλασικής Γλωσσολογίας. Η Υπολογιστική Γλωσσολογία ως διεπιστηµονική γνωστική περιοχή βρίσκεται ανάµεσα στην Γλωσσολογία και την Πληροφορική. Ανήκει στις Γνωστικές (Cognitive) Επιστήµες και επικαλύπτεται µε την Τεχνητή Νόηση (Artficial Intelligence), κλάδο της Πληροφορικής (Computer Science), που ασχολείται µε τα υπολογιστικά µοντέλα της ανθρώπινης γνώσης. Η Υπολογιστική Γλωσσολογία έχει θεωρητικό και πρακτικό κλάδο. Η θεωρητική Υπολογιστική Γλωσσολογία πραγµατεύεται τις τυπικές θεωρίες παράστασης της γλωσσικής γνώσης και τους φορµαλισµούς που έχουν ανάγκη οι άνθρωποι για να παράγουν και να κατανοήσουν τη γλώσσα. Οι θεωρίες αυτές σήµερα έχουν φτάσει σε τέτοια πολυπλοκότητα που µόνο µε υπολογιστές µπορεί κανείς να τις διαχειριστεί. Οι επιστήµονες του κλάδου αυτού αναπτύσσουν τυπικά µοντέλα που εξοµοιώνουν απόψεις της ανθρώπινης γλωσσολογίας και τα υλοποιούν σε υπολογιστικά συστήµατα. Αυτά αποτελούν τη βάση αποτίµησης και περεταίρω ανάπτυξης των αντίστοιχων θεωριών. Στην περιοχή αυτή της επιστήµης σηµαντικό ρόλο παίζουν ευρήµατα από την Γνωστική Ψυχολογία. Επίσης, η Ψυχογλωσσολογία, κλάδος της Ψυχολογίας, εξετάζει τις γνωστικές διαδικασίες που συνιστούν την χρήση της ανθρώπινης γλώσσας. Η εφαρµοσµένη Υπολογιστική Γλωσσολογία εστιάζεται στα πρακτικά αποτελέσµατα της µοντελοποίησης της χρήσης της ανθρώπινης γλώσσας. Οι µέθοδοι, οι τεχνικές, τα εργαλεία και οι εφαρµογές αυτής της περιοχής συχνά συµπεριλαµβάνονται στον όρο (ανθρώπινη) γλωσσική µηχανική (language engineering) ή γλωσσική τεχνολογία (language technology). Παρότι τα σηµερινά υπολογιστικά συστήµατα απέχουν πολύ από τις ανθρώπινες ικανότητες έχουν πολλές πιθανές εφαρµογές. Στόχος είναι η ανάπτυξη συστηµάτων µε κάποια γνώση της ανθρώπινης γλώσσας. Τα συστήµατα αυτά χρησιµοποιούνται στην καλυτέρευση της επικοινωνίας ανθρώπου - µηχανής. Οι σηµερινοί υπολογιστές δεν καταλαβαίνουν τη γλώσσα µας αλλά, από την άλλη πλευρά, οι (τεχνητές) γλώσσες προγραµµατισµού είναι δύσκολο να µαθευτούν και δεν αντιστοιχούν στη δοµή της ανθρώπινης σκέψης. Γιάνης Μαϊστρος - Στέλλα Μαρκαντωνάτου 2

Η παράδοση της Επεξεργασίας Φυσικής Γλώσσας Με τους πρώτους υπολογιστές (1950-1960) ο χειρισµός αριθµών και στη συνέχεια λέξεων έδωσε τη δυνατότητα µιας πρώτης ηλεκτρονικής παράστασης και επεξεργασίας γλωσσικής γνώσης. Αργότερα, η µετρική και η στατιστική του κειµένου επέτρεψαν την καλλιέργεια της υφολογίας (style analysis) και της εύρεσης της ταυτότητας του συγγραφέα ή συντάκτη ενός κειµένου. Ακολούθησε η αυτόµατη δηµιουργία δεικτών (indices) και η εύρεση των λέξεων µέσα στα συµφραζόµενά τους (keywords in context: concordance lists). Σήµερα η περιοχή αυτή εξακολουθεί να καλλιεργείται και ονοµάζεται Literary and Linguistic Computing. (Την αποδίδουµε ελεύθερα ως Υπολογιστική Γραµµατεία και Γλωσσολογία). Η µηχανική (και όχι αυτόµατη) µετάφραση (machine translation) έδωσε τα πρώτα δείγµατα στα µέσα της δεκαετίας του 60. Ο T. Winograd το 1972, µε το σύστηµα SHRDLU, γραµµένο σε Lisp, προσέφερε το πρώτο σύστηµα κατανόησης φυσικής γλώσσας (natural language understanding) θεµελιώνοντας ουσιαστικά την περί υπάρξεως απόδειξη της περιοχής. Ερµηνεία ερωτήσεων, δηλώσεων και οδηγιών, ικανότητα συνεπαγωγής, εκµάθηση νέων λέξεων αποτέλεσαν µερικές από τις αρετές του συστήµατος. Η διαδικασιακή (procedural) ήταν η πρώτη µορφή παράστασης γνώσης. Ακολούθησε η δηλωτική (declarative). Η διαδικασιακή επιχειρεί να περιγράψει την κίνηση ή τη δράση και φιλοδοξεί να παραστήσει τη γνώση (γλωσσική ή µη) µε διαδικασίες, µε άλλα λόγια το πώς συµβαίνει η γνώση. Η δηλωτική επιχειρεί την παράσταση των συµβολικών δοµών καθαυτών, µ άλλα λόγια προσπαθεί να περιγράψει τι συµβαίνει. Ο δηλωτικός προγραµµατισµός εξελίχθηκε και συµπεριέλαβε κανόνες συνεπαγωγής (inference rules). Ο προγραµµατισµός αυτός λέγεται Λογικός Προγραµµατισµός και η σηµαντικότερη αντίστοιχη γλώσσα είναι η Prolog. Η επιβολή της οµής Τα αυτόµατα πεπερασµένων καταστάσεων (finite state automata: FSA) επιστρατεύτηκαν για να αναγνωριστούν γλωσσικές οντότητες (π.χ. λεξικά στοιχεία, µέρη του λόγου) και τα δίκτυα µεταφοράς πεπερασµένων καταστάσεων (Finite State Transition Networks: FSTN) για να δηµιουργήσουν γλωσσικές οντότητες. Σηµαντικό σηµείο αναφοράς στην περιοχή αυτή αποτελεί το πρόγραµµα ELIZA του J. Weizenbaum που βασίστηκε σ αυτά, το 1960. Τα αναδροµικά δίκτυα µεταφοράς (Recursive Transition Networks: RTN) που ακολούθησαν ήσαν δίκτυα µεταφοράς πεπερασµένων καταστάσεων (FSTN) µε αναδροµή. Μπορούσαν να παραστήσουν γραµµατικές του τύπου a n b n και τις παραστάσεις µε παρενθέσεις. Τα διευρυµένα δίκτυα µεταφοράς (Augmented Transition Networks: ATN) είχαν επιπλέον και µνήµη για να µην επαναλαµβάνουν διαδροµές. Παριστάνοντας δε µια µορφή δράσης ή ενέργειας (action) κατέστρεφαν τον δηλωτικό χαρακτήρα τους. Οι πρώτοι τεχνολογητές χάρτη ή συντακτικοί αναλυτές χάρτη (chart parsers) που κατέγραφαν τις πετυχηµένες απόπειρες, για να µην επαναλαµβάνουν άσκοπα τους ελέγχους νοµιµότητας, επιβιώνουν µέχρι σήµερα ως ιδέα µε διαφορετικές µεθόδους υλοποίησης. Γιάνης Μαϊστρος - Στέλλα Μαρκαντωνάτου 3

Με τη γέννηση της Prolog και της λογικής συνεπαγωγής (inference) που αυτή επιτρέπει δηµιουργήθηκαν οι πρώτοι Τεχνολογητές (parsers) γραµµατικών ορισµένης πρότασης (Definite Clause Grammars: DCG). Αυτοί είναι Τεχνολογητές γραµµατικών φραστικής δοµής (Phrase Structure Grammars: PSG) σε γλώσσα Prolog, και αναµιγνύουν διαδικασιακή µε δηλωτική µορφή παράστασης. Η αµφισηµία ως εγγενές στοιχείο της φυσικής γλώσσας που απαντάται σε όλα τα επίπεδα µελέτης της φυσικής γλώσσας, αποτελεί πονοκέφαλο της µηχανικής επεξεργασίας φυσικής γλώσσας. Έρχεται σε αντίθεση µε τον ντετερµινισµό των υπολογιστικών µηχανών και τις ντετερµινιστικές φιλοσοφικές δοξασίες. Η άρση της αµφισηµίας αποτέλεσε και αποτελεί πρόκληση στην έρευνα της Γλωσσολογίας και της Υπολογιστικής Γλωσσολογίας. Η παράσταση της Σηµασίας Η κατανόηση της γλώσσας (language understanding) µε µια λέξη αποτελεί την αντιστοίχιση σηµασίας (meaning) στις γλωσσικές µορφές, ενώ το αντίθετο ονοµάζεται γένεση γλώσσας (language generation). Ποια όµως µπορεί να είναι η δοµή που παριστάνει τη σηµασία (meaning); Η Τεχνητή Νόηση (Artificial Intelligence: AI) θεωρώντας τον νου ως υπολογιστική διάταξη πρότεινε την διαδικασία (procedure). Οι λογικοί (logicians) προτείνουν τη σηµασία απλών προτάσεων. Γεννιέται έτσι η λεγόµενη διαδικασιακή σηµασιολογία (procedural semantics). Η σηµασία µιας εντολής ή οδηγίας (command) είναι αυτή καθαυτή η διαδικασία που ακολουθείται για να υλοποιήσει την απαιτούµενη ενέργεια / δράση (action). Παρόµοια µε την εντολή που αντιστοιχίζεται έτσι στη δράση, η ερώτηση αντιστοιχίζεται στην απάντηση και η δήλωση (statement) στην νέα πληροφορία (new information) που αυτή εµπεριέχει. Υπάρχουν όµως όρια στην παράσταση της γνώσης µόνο µε τις διαδικασίες. Η διαδικασία µπορεί µόνο να τρέξει (run), µπορεί µόνο να εκτελεστεί. Με τα σηµασιολογικά δίκτυα (semantic networks) ο Schank το 1960 βασίζεται στη θεωρία των Katz και Fodor (1963) και εισηγείται 11 πρωταρχικά στοιχεία ή αρχέτυπα (primitives) τα οποία ισχυρίζεται ότι µπορούν να συνδυαστούν για να εκφράσουν όποιο γεγεονός του κόσµου. Η άποψή του για τις εννοιακές εξαρτήσεις (conceptual dedpendencies) παριστάνεται µε γραφήµατα (graphs) όπου κόµβοι (nodes) είναι οι έννοιες και οι µεταξύ τους σύνδεσµοι (links) οι σχέσεις εξάρτησης (dependencies). Ακολουθούν το 1975 τα πλαίσια (frames) του Minsky. Αυτά προσφέρουν την διαδικασία που ενεργοποιείται από δεδοµένα (data driven processing) που καταχωρούνται σε ειδικές θέσεις (slots) µέσα σ αυτά. Το 1970 το πρόγραµµα LUNAR του Woods, που απαντά σε ερωτήσεις για σεληνιακά πετρώµατα, αποτελεί ένα από τα πρώτα συστήµατα που χρησιµοποιούν τη λογική πρώτης τάξης (first order logic: FOL) για την παράσταση γνώσης. Η τυπική σηµασιολογία (formal semantics) µαζί µε τη φιλοσοφία της γλώσσας µας χαρίζουν την ιδέα πως η σηµασία είναι συνθετική (compositional semantics) µε απαρχή τις ιδέες του Frege (1890!). Σύµφωνα µ αυτή την άποψη η σηµασία µιας πρότασης συναπαρτίζεται από τις επιµέρους σηµασίες των συστατικών λέξεών της. Ο Montague (1974) εργάστηκε στην αρχή της συνθετικότητας για να αναλύσει προτάσεις φυσικής γλώσσας µε αρκετή επιτυχία. Γιάνης Μαϊστρος - Στέλλα Μαρκαντωνάτου 4

Πολλά υπολογιστικά συστήµατα αξιοποίησαν τις ιδέες των Katz και Fodor προκειµένου να άρουν τις αµφισηµίες µε τη µέθοδο των επιλεγοµένων περιορισµών (selectional restrictions). Σύµφωνα µ αυτή κάθε σηµασία µιας λέξης έχει και ένα σηµάδι (marker). Η σηµασία της πρότασης προκύπτει από τη συµφωνία µεταξύ των σηµαδιών των συστατικών της λέξεων. Ο ρόλος της Γνώσης Η παράσταση της γνώσης (knowledge representation) ήταν και είναι ακόµη µια από τις πιο ενδιαφέρουσες απόπειρες άρσης της αµφισηµίας. Το σύστηµα κατανόησης µιας πρότασης φυσικής γλώσσας θα πρέπει να διαθέτει γνώση για τον (περιορισµένο) κόσµο όπου αυτή η πρόταση βρίσκεται / εκφέρεται. Οι γραφές (scripts) του Schank (1977) εξετάζουν την αιτιότητα και την διαδοχή των γεγονότων. Κατά την άποψη αυτή µπορούµε να παραστήσουµε τη γνώση µας για πρωτοτυπικά γεγονότα ως ακολουθίες προσδοκοµένων ενεργειών / δράσεων (expected actions) σε µια γραφή (script) για τα γεγονότα. Σε κάθε πρωτότυπο στοιχείο γνώσης υποδεικνύεται κι ένα µοντέλο αναδίφησης (retrieval model). Θεµελιώνεται έτσι η κατανόηση που βασίζεται στις προσδοκίες (expectation based understanding). Πώς όµως να χειριστούµε αποκλίσεις από τις προσδοκόµενες ενέργειες; Η νέα Γλωσσική Τεχνολογία Σταχυολογούµε επιγραµµατικά σ αυτό το εισαγωγικό σηµείωµα µερικές από τις προόδους της Επεξεργασίας της Φυσικής Γλώσσας σε διαφόρους τοµείς εφαρµογής. Ο προγραµµατισµός (planning) εφαρµόστηκε στη ροµποτική σε συστήµατα που αξιοποιούν στοιχεία κατανόησης φυσικής γλώσσας στην παραγωγή. Η διαλογική συµπεριφορά του ανθρώπου µελετιέται διεπιστηµονικά και αξιοποιούνται τ αποτελέσµατα της έρευνας στον σχεδιασµό διεπικοινωνίας φυσικής γλώσσας (natural language interface / front ends) µε υπολογιστικά συστήµατα και βάσεις δεδοµένων. Η µηχανική µετάφραση περιορισµένων και κυρίως τεχνικών και διοικητικών εκφράσεων είναι εφικτή σήµερα µε τις νέες τεχνικές. Επίσης, η άντληση γραµµατικών στοιχείων από σώµατα (corpora). Τα στοιχεία γλωσσικής γνώσης στους επεξεργαστές κειµένου αυξάνουν ποιοτικά. Τέλος, η γένεση επεξήγησης (explanation generation) σε συστήµατα βάσεων γνώσης παρουσίασε πρόοδο (ειδικότερα σε συστήµατα ιατρικής συµβουλευτικής). Γιάνης Μαϊστρος - Στέλλα Μαρκαντωνάτου 5