ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΣΧΟΛΗ ΑΝΘΡΩΠΙΣΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΦΙΛΟΛΟΓΙΑΣ ΤΟΜΕΑΣ ΓΛΩΣΣΟΛΟΓΙΑΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΣΧΟΛΗ ΑΝΘΡΩΠΙΣΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΦΙΛΟΛΟΓΙΑΣ ΤΟΜΕΑΣ ΓΛΩΣΣΟΛΟΓΙΑΣ «Ανάλυση της ρηματικής φράσης με τη γλώσσα προγραμματισμού Prolog». Μπιλιανός Δημήτριος (2345) Πτυχιακή Εργασία

Τεχνικές πληροφορίες Για την εργασία αυτή χρησιμοποιήθηκαν τα παρακάτω: SWI-Prolog (έκδοση 6.0.0). http://www.swi-prolog.org/. Python (έκδοση 2.7.3). https://www.python.org/. Dia (έκδοση 0.97.2) για τη σχεδίαση δενδροδιαγραμμάτων και πινάκων https://wiki.gnome.org/apps/dia. To OpenOffice (έκδοση 3.2.0) για όλη την εργασία. Το project έχει σταματήσει. Η σύγχρονη εκδοχή: http://www.libreoffice.org/. Ευχαριστώ θερμά όσους έχουν βοηθήσει ή σχετίζονται με οποιονδήποτε τρόπο με τα παραπάνω projects. 3

Ευχαριστίες Αρχικά, θέλω να ευχαριστήσω το Τμήμα Φιλολογίας του Πανεπιστημίου Πατρών και ειδικά τους καθηγητές της ειδίκευσης Γλωσσολογίας για τις πολύτιμες γνώσεις που μου έδωσαν όλα αυτά τα χρόνια των σπουδών μου. Ειδικότερα, χρωστάω την ευγνωμοσύνη μου στην επιβλέπουσα καθηγήτριά μου κ. Ρούσσου, για την πολύτιμη καθοδήγηση, τα σχόλια και τις παρατηρήσεις της, καθ'όλη τη διάρκεια του ακαδημαϊκού έτους 2013-14 που υλοποιήθηκε η παρούσα πτυχιακή εργασία. Την ευχαριστώ θερμά για την υπομονή και τις διορθώσεις της. Επίσης ευχαριστώ θερμά την οικογένειά μου και τη σύντροφό μου Κατερίνα για την υπομονή και συμπαράστασή τους όλα αυτά τα χρόνια των σπουδών μου. Ειδικά ευχαριστώ την αδερφή μου Τέτα για τη βοήθειά της πάνω στην Prolog και την Python. Την Κατερίνα για τα εύστοχα σχόλιά της. Το Νίκο που μου έκανε γνωστό το έργο του Sipser πάνω στη θεωρία υπολογισμού. Τέλος ευχαριστώ όλους εκείνους που βοήθησαν εμμέσως στην υλοποίηση της εργασίας, μέσω της συνεισφοράς τους στα projects που αναφέρω στις τεχνικές πληροφορίες. Όσους έχουν συνεισφέρει με οποιονδήποτε τρόπο στη wikipedia, που βοηθά να είναι ελεύθερη η πρόσβαση στην πληροφορία από όλους, και όσους στηρίζουν γενικά το ελεύθερο λογισμικό και το ελεύθερο περιεχόμενο. 4

Κατάλογος Πινάκων 1. Κανόνες Φραστικής Δομής Χ'...16 2. Binding Principles...18 3. Παράδειγμα πλαισίου κατηγοριοποίησης...22 4. Οι βασικοί θ-ρόλοι...23 5. Chomsky hierarchy II...25 5

Κατάλογος Εικόνων 1. Η σημασία της δομικής επιβολής...18 2. "Merge"...19 3. παράδειγμα "merge"...20 4. "merge" II...20 5. Παραδείγματα δομής ορισμάτων...24 6. Chomsky hierarchy...25 7. Παράδειγμα άστοχης μετάφρασης...29 8. To prompt της Prolog (SWI-Prolog)...35 9. To ισοδύναμο σχήμα για την απάντηση στο (45δ)...51 10. Το parse tree του (46β)...52 11. Το συντακτικό δέντρο αναιτιατικής δομής ΡΦ...61 12. Η δομή του δίπτωτου ρήματος «δίνω»...62 13. H δομή του μεταβατικού ρήματος «φτιάχνω»...65 14. Η δομή του μεταβατικού ρήματος «επιδιορθώνω»...66 15. Το ανεργαστικό ρήμα ως καλυμμένο μεταβατικό...70 16. Ανάλυση μεταβατικών-ανεργαστικών ρημάτων...71 17. Ανάλυση (πρώτη) της ρηματικής φράσης του «βρέχει»...73 18. Ανάλυση παραδειγμάτων (69α) και (69β)...75 19. Ανάλυση (δεύτερη) του ρήματος καιρού «βρέχει»...79 20. Ανάλυση του «βρέχει+αντικείμενο»...80 21. Ανάλυση (ξανά) του «βρέχει»...81 22. Ανάλυση (τελική) του ρήματος «βρέχει»...84 6

Κατάλογος περιεχομένων Τεχνικές πληροφορίες...3 Ευχαριστίες...4 Κατάλογος πινάκων...5 Κατάλογος εικόνων...6 1 Πρόλογος...10 2 Γενετική Γραμματική Θεωρητικό Υπόβαθρο...14 2.1 Καθολική Γραμματική και το Επιχείρημα της Πενίας του Ερεθίσματος...14 2.2 Τάσεις στη Γενετική Γραμματική...15 2.3 Δομή ορισμάτων & Θ-ρόλοι...21 2.4 Ιεραρχία Chomsky...25 3 Από τη στατιστική προσέγγιση στο λογικό προγραμματισμό...27 3.1 Στατιστική επεξεργασία γλώσσας και κανόνες παραγωγής: Το παράδειγμα της Μετάφρασης Google...27 3.2 Λογικός Προγραμματισμός με την Prolog...32 3.2.1 Εξοικείωση με την Prolog...33 3.2.2 Λογικοί Τελεστές...36 3.2.3 Μεταβλητές...38 3.2.4 Κατηγορήματα με περισσότερα του ενός ορίσματα...39 3.2.5 Κανόνες...41 8

3.2.6 Eπαναδρομή (Recursion)...43 3.2.7 Λίστες...44 3.2.8 Definite Clause Grammar (DFG)...44 3.3 Συντακτική ανάλυση (parsing) στα Ελληνικά με την Prolog...52 3.3.1 Μερικές βασικές τεχνικές...52 3.3.2 Ανάλυση ρηματικής φράσης...56 3.3.2.1 Aνεργαστικά, αναιτιατικά και δίπτωτα ρήματα: Μια πρώτη προσέγγιση και κάποιες βασικές αρχές...56 3.3.2.2 Ανεργαστικά, αναιτιατικά και δίπτωτα ρήματα ΙΙ...59 3.3.2.3 Ανάλυση δομής μεταβατικών ρημάτων...63 3.3.2.4 Tα ρήματα καιρού (weather verbs)...72 4. Συμπεράσματα και μελλοντική εργασία...87 Βιβλιογραφία...89 9

Κεφάλαιο 1 Πρόλογος Από τα μέσα του 20ου αιώνα εμφανίστηκε στην επιστήμη της Γλωσσολογίας μια ιδέα αρκετά επαναστατική για τα μέτρα της εποχής: Η ικανότητα των ανθρώπων, ισχυρίστηκε ο διάσημος γλωσσολόγος Noam Chomsky, να χρησιμοποιούν τη γλώσσα, είναι έμφυτη. Αυτή η θέση προκάλεσε πολλή συζήτηση και αρκετές αντιδράσεις, καθώς η κυρίαρχη αντίληψη για τη γλώσσα εκείνη την εποχή ακολουθούσε τις αρχές του συμπεριφορισμού, με επικρατούσα άποψη ότι η γλωσσική κατάκτηση είναι βασικά αποτέλεσμα μιμητισμού (Fromkin, Rodman & Hyams, 2008: 439). Καθώς οι θέσεις του Chomsky για τη φύση της γλώσσας έπαιρναν τη θέση τους στο επίκεντρο της γλωσσολογικής έρευνας, είναι προφανές ότι προέκυψαν διάφορα ερωτήματα. Αν η γλώσσα έχει συγκεκριμένους κανόνες για την παραγωγή και την κατανόηση προτάσεων, ποιοι κανόνες ορίζουν ακριβώς τη γλώσσα; Και με ποιους τρόπους μπορούν αυτοί οι κανόνες να εκφραστούν, με τη σαφήνεια και τη συνέπεια που προβλέπουν τα γλωσσικά συστήματα, χωρίς πλεονασμούς ή ελλείψεις; Σε αυτά και σε άλλα θεμελιώδη ερωτήματα προσπάθησαν να δώσουν απαντήσεις ο Chomsky και άλλοι γλωσσολόγοι που ακολούθησαν την τσομσκιανή παράδοση. Αρχικά λοιπόν έγινε προσπάθεια να κατανοηθεί η δομή της γλώσσας ως ένα σύνολο από σχετικά ακριβείς κανόνες (Chomsky, 2007 : 145). Αυτοί οι κανόνες θα μπορούσαν να είναι της μορφής: (1) Πρόταση -> Ονοματικό Σύνολο, Ρηματικό Σύνολο. Ρηματικό Σύνολο -> Ρήμα. Ρηματικό Σύνολο -> Ρήμα, Ονοματικό Σύνολο. Ονοματικό Σύνολο -> Άρθρο, Όνομα. κοκ. Από νωρίς όμως έγινε αντιληπτό ότι η θεωρία των καθολικών κανόνων παραγωγής (production 10

rules), όπως στο (1), αντιμετώπιζε σοβαρά προβλήματα. Τα παιδιά κατακτούν, και μάλιστα σε πολύ υψηλό επίπεδο κατανόησης και παραγωγής, εξαιρετικά πολύπλοκες γραμματικές, έχοντας στη διάθεσή τους πολύ περιορισμένο αριθμό δεδομένων (poverty of the stimulus). Επομένως θα ήταν λογικό να μιλήσουμε για κάποιου είδους και μέχρι ενός σημείου γνώση a priori. To πρόβλημα είναι ότι αυτό έρχεται σε αντίθεση με τα δεδομένα του κόσμου που παρατηρούμε γύρω μας: Αν η γνώση της γλώσσας μας πηγάζει «από μέσα», είναι δύσκολο να εξηγήσουμε το μεγάλο αριθμό τόσο διαφορετικών στη γραμματική τους γλωσσών. Για να αντιμετωπιστεί αυτό το πρόβλημα, οι γλωσσολόγοι υπέθεσαν ότι η ποικιλία των κανόνων είναι επιφανειακή, και οι ίδιοι οι κανόνες θα πρέπει να υπάγονται σε κάποιες αρχές, επομένως καθήκον των γλωσσολόγων θα ήταν να συναγάγουν με αφαιρετικό τρόπο αυτές τις αρχές από τους κανόνες. Με λίγα λόγια, θα μπορούσαμε να πούμε ότι υπάρχουν στις γλώσσες κάποιες πολύ γενικές αρχές, και από εκεί και πέρα, κάποιες διαφοροποιήσεις που αποτελούν απλώς εναλλακτικές λύσεις που μπορούν να επιλεγούν από τους ομιλητές μιας γλώσσας, με άλλα λόγια, παραμετρικές επιλογές. Στη θεωρία Αρχών και Παραμέτρων (Principles and Parameters), θα μπορούσαμε να παρομοιάσουμε αυτές τις παραμετρικές επιλογές με διακόπτες, που σε μία γλώσσα μπορεί να είναι κλειστοί, ενώ σε κάποια άλλη ανοιχτοί. Στο πέρασμα του χρόνου, οι γλωσσολόγοι που ακολουθήσαν το μοντέλο του Chomsky της Γενετικής-Μετασχηματιστικής Γραμματικής, απομακρύνθηκαν από κάποιες αρχικές υποθέσεις. Για παράδειγμα, την τελευταία εικοσαετία με την εμφάνιση του Μινιμαλιστικού Προγράμματος, άρχισαν να εγκαταλείπονται υποθέσεις που σε παλαιότερα στάδια της γενετικής παράδοσης κατείχαν σχετικά κεντρικό ρόλο, μεταξύ άλλων, η έννοια της Kυβέρνησης (Government) (Chomsky, 2007: 228), η διάκριση Βαθείας και Επιφανειακής Δομής (Deep and Surface Structure) (Θεοφανοπούλου-Κοντού, 2002: 224), και η ύπαρξη γενικών κανόνων και δομών στις γλώσσες (Chomsky, 2007: 148). Η υπόθεση, από την άλλη, ότι το γλωσσικό φαινόμενο είναι κομμάτι της ανθρώπινης φύσης- ως αποτέλεσμα της ανθρώπινης εξέλιξης-, και ότι η γλωσσική κατάκτηση είναι μια διαδικασία η οποία είναι έμφυτη στον άνθρωπο, δεν παραμερίστηκε καθόλου στο Μινιμαλισμό. Με άλλα λόγια, παρέμεινε κεντρικό το ζήτημα της Καθολικής Γραμματικής (Universal Grammar): Οι άνθρωποι γεννιούνται έχοντας «προγραμματιστεί» από τη φύση τους να μάθουν και να χρησιμοποιούν μία γλώσσα, και υπάρχουν χαρακτηριστικά που τα μοιράζονται όλες οι γλώσσες. Κεντρικό ζήτημα όλα αυτά τα χρόνια παρέμεινε και η προσπάθεια να κατανοηθεί η γλώσσα με τη βοήθεια των υπολογιστών. Ήδη το 1936, ο Άλαν Τούρινγκ, χρησιμοποιώντας τα συμπεράσματα του Γκέντελ πάνω στα όρια των μαθηματικών (θεωρήματα μη-πληρότητας), εφηύρε τη μηχανή 11

Τούρινγκ, μια αφηρημένη, πανίσχυρη μηχανή, η οποία, όπως απέδειξε ο Τούρινγκ, θα ήταν σε θέση να υπολογίσει οτιδήποτε είναι δυνατό να υπολογιστεί αλγοριθμικά. Με αυτόν τον τρόπο προσέδωσε στον αλγόριθμο μία αυστηρή, τυπική διατύπωση. Είκοσι χρόνια αργότερα, ο Chomsky, με τη διάσημη Ιεραρχία Chomsky (Chomsky hierarchy), θα ιεραρχούσε τις γραμματικές, και αντίστοιχα τις γλώσσες που παράγονται από αυτές, σε τέσσερις κλάσεις, ανάλογα με τη μορφή των κανόνων τους (Παπασπύρου, Σκορδαλάκης, 2002: 30). Μέχρι και σήμερα, πεποίθηση μερίδας Γλωσσολόγων αλλά και επιστημόνων της Τεχνητής Νοημοσύνης παρέμενε πάντοτε ότι η γλώσσα είναι βασικά αποτέλεσμα μιας βέλτιστης υπολογιστικής διαδικασίας. Για παράδειγμα, στο Μινιμαλιστικό Πρόγραμμα, κάθε γλώσσα νοείται ως μηχανισμός (CHL, Computation of Human Language). H γλώσσα διαθέτει ένα Υπολογιστικό Τμήμα (Computational Component) και ένα Λεξικό (Lexicon). Το Υπολογιστικό Τμήμα χρησιμοποιεί τα στοιχεία του Λεξικού βάσει επιλογής από μία συγκεκριμένη αρίθμηση για να παραγάγει δομές (Θεοφανοπούλου-Κοντού, 2002: 226). Σύμφωνα με τα παραπάνω, η στροφή στους ηλεκτρονικούς υπολογιστές για την ανάλυση προτάσεων δεν προκύπτει απλώς και μόνο ως ανάγκη για την επίλυση πρακτικών προβλημάτων και τη δημιουργία χρήσιμων εργαλείων (λχ αυτόματοι μεταφραστές). Αν η ίδια η γλώσσα αποτελεί ένα υπολογιστικό σύστημα, είναι εύλογο το ερώτημα: Μπορεί ένας υπολογιστής να μας βοηθήσει να καταλάβουμε περισσότερα για τη γλώσσα; Η παρούσα διπλωματική εργασία έχει ως στόχο την υλοποίηση της ανάλυσης (parsing) διαφορετικών ειδών ρηματικής φράσης (ρφ/ρφ) με χρήση της γλώσσας λογικού προγραμματισμού Prolog. Ως θεωρητικό υπόβαθρο θα χρησιμοποιηθεί η Γενετική Γραμματική, ακολουθώντας ειδικά την πιο σύγχρονη εκδοχή της, αυτή του Μινιμαλιστικού Προγράμματος. Στη συνέχεια ακολουθεί μια μικρή εισαγωγή για κάθε κεφάλαιο. Στο κεφάλαιο 2 θα δοθούν σε πρώτη φάση οι βασικές αρχές της Γενετικής Γραμματικής. Έπειτα θα μιλήσουμε για τους θ-ρόλους και τη σχέση τους με την κατηγοριακή επιλογή, εστιάζοντας με αυτόν τον τρόπο στη σχέση της Σύνταξης με τη Σημασιολογία. Τέλος θα μιλήσουμε για την ιεραρχία Chomsky. Στο κεφάλαιο 3 θα ασχοληθούμε με το κυρίως ζήτημα που θα απασχολήσει την εργασία, δηλαδή με την ανάλυση ρηματικών φράσεων (ρφ/ρφ) με τη γλώσσα Prolog. Πριν την υλοποίηση θα πραγματοποιηθεί μία εισαγωγή στην Prolog, και θα δούμε μερικές βασικές τεχνικές parsing ειδικά για τα Ελληνικά. Για την αναπαράσταση των δενδροδιαγραμμάτων (syntax trees) θα 12

χρησιμοποιηθεί η γλώσσα προγραμματισμού Python. Στο κεφάλαιο 4 θα παρουσιαστούν τα συμπεράσματα της εργασίας και θα δούμε ποια στοιχεία θα μπορούσαν να διερευνηθούν στο μέλλον στην κατεύθυνση αυτής της εργασίας. 13

Κεφάλαιο 2 Γενετική Γραμματική - Θεωρητικό Υπόβαθρο 2.1 Καθολική Γραμματική και το Επιχείρημα της Πενίας του Ερεθίσματος Όπως είπαμε στον πρόλογο, οι γλωσσολόγοι υποθέτουν ότι υπάρχουν χαρακτηριστικά που τα μοιράζονται όλες οι γλώσσες. Μιλήσαμε ήδη, επομένως, για την Καθολική Γραμματική. Όμως, τι εννοούμε ακριβώς με τον όρο «Καθολική Γραμματική»; Καταρχάς πρέπει να ξεκαθαρίσουμε ότι λέγοντας «γραμματική», αναφερόμαστε στη γνώση που έχουν οι φυσικοί ομιλητές για τη γλώσσα τους, που αφορά όχι μόνο τους κανόνες της γραμματικής που μαθαίνουν τα παιδιά στο σχολείο (πχ «τα αρσενικά σε -ος σχηματίζουν γενική σε -ου») αλλά περιλαμβάνει ό,τι γνωρίζουν οι ομιλητές για τη γλώσσα τους (Fromkin, Rodman & Hyams, 2008: 49). Επομένως, οι φυσικοί ομιλητές της ελληνικής μπορούν να γνωρίζουν, ακόμη και αν δεν πήγαν ποτέ στο σχολείο, συγκεκριμένα πράγματα για τη γλώσσα τους που αφορούν τη σύνταξη, τη μορφολογία, το λεξικό κοκ, και έτσι μπορούν να κρίνουν ότι η πρόταση (1α) είναι γραμματική, ενώ η (1β) αντιγραμματική: (1α) (1β) Ο Γιώργος πλένει το αυτοκίνητο. *Ο αυτοκίνητο πλένει το Γιώργος. Καθολική Γραμματική ονομάζουμε τις αρχές που αντιπροσωπεύουν τις «καθολικές ιδιότητες όλων των γλωσσών» (Fromkin, Rodman & Hyams, 2008: 50). Εμπειρικά δεδομένα δείχνουν ότι η Καθολική Γραμματική είναι έμφυτη, μία «αρχική γνωσιακή κατάσταση» (Chomsky, 2007), και ότι η γλωσσική κατάκτηση επομένως δεν ξεκινά από μία αρχική κατάσταση tabula rasa. Πολλοί ερευνητές συμφωνούν με αυτό (βλ μεταξύ άλλων Chomsky, 2007: 29, Fromkin, Rodman & Hyams, 2008: 445). Η υπόθεση της εμφυτότητας τεκμηριώνεται από αυτό που ονομάζουμε πενία του ερεθίσματος (poverty of the stimulus) (Adger, 2003: 8). Φαίνεται ότι ο τεράστιος όγκος της γραμματικής που γνωρίζουμε υπερβαίνει τη γραμματική που θα έπρεπε να είχαμε μάθει μέσω της γλωσσικής εμπειρίας. Για παράδειγμα, είναι ενδιαφέρον ότι τα παιδιά δεν κάνουν ερωτήσεις μετακινώντας το 14

πρώτο ρήμα, αλλά το ρήμα της κύριας πρότασης (για περισσότερα βλ. Lasnik & Uriagereka, 2002): (2α) (2β) *Is the dog sleeping is dreaming of cookies? Is the dog who is sleeping dreaming of cookies? Για να δημιουργήσει το παιδί έναν τέτοιο κανόνα, ότι δηλαδή δε μετακινείται το πρώτο ρήμα αλλά αυτό της κύριας πρότασης, εφόσον δε διδάσκεται τη δομική εξάρτηση, θα πρέπει να ξέρει κάτι για τη δομή της πρότασης. Αλλιώς θα ήταν λογικό να περιμένουμε το 50% των παιδιών να πει το (2α), και το άλλο 50% το (2β), πράγμα που όμως δε συμβαίνει. Αναφερόμαστε λοιπόν στο λογικό πρόβλημα της κατάκτησης της γλώσσας του Chomsky, (2007: 146): Πώς εξηγείται η ταχύτητα, η ευκολία και η ομοιομορφία κατάκτησης με τόσο ανεπαρκή δεδομένα; Η Καθολική Γραμματική θα μπορούσε να δώσει μία απάντηση στο ερώτημα. Τα παιδιά δεν ξεκινούν από το μηδέν: Η Καθολική Γραμματική τα βοηθάει να εξαγάγουν τους κανόνες της γλώσσας τους (Fromkin, Rodman & Hyams, 2008: 449). 2.2 Τάσεις στη Γενετική Γραμματική Μια προσπάθεια να δείξουν οι γλωσσολόγοι ότι τα συστήματα φραστικής δομής δεν είναι τόσο πολύπλοκα όσο φαίνονται, επειδή ακριβώς υπάρχει κάτι γενικότερο στο οποίο υπάγονται, ήταν η θεωρία Χ' (X-bar theory) (Chomsky, 2007: 147). Είδαμε ήδη και στον πρόλογο, στο παράδειγμα (1), κάτι παρόμοιο με το (3). Δηλαδή, ένα σύνολο κανόνων επανεγγραφής (επειδή γράφουμε ξανά το αριστερό κομμάτι χρησιμοποιώντας το δεξί): (3) Ρηματική Φράση -> Ρήμα, Ονοματική Φράση Ρηματικη Φράση -> Ρήμα Ονοματική Φράση -> Άρθρο, Όνομα κτλ Καταλαβαίνουμε λοιπόν στο (3) ότι έχουμε Χ Φράση που μας δίνει Χ, και (προαιρετικά) κάτι άλλο. Επομένως μπορούμε να έχουμε έναν γενικό κανόνα «ΧΦ ->..Χ..» που λέει ότι ΧΦ είναι η προβολή της κεφαλής Χ. Η θεωρία Χ' μπορεί να περιγραφεί ως ένα σύνολο κανόνων σαν εκείνους που είδαμε στο (3), ως εξής: 15

Πίνακας 1: κανόνες φραστικής δομής Χ' Ο κανόνας (β) είναι προαιρετικός, επειδή τα προσαρτήματα είναι προαιρετικά: [ Το (ψηλο) (πανεμορφο) (επιβλητικο) (αιωνόβιο) πλατάνι]. Επίσης, στον κανόνα (γ) αναφερόμαστε σε όχι απαραίτητα ένα συμπλήρωμα [διαβάζω (το βιβλίο)]. Μπορεί να είναι περισσότερα ή και κανένα [τρέχω]. Η κεφαλή μπορεί να προηγείται (όπως συχνά συμβαίνει στα αγγλικά) ή να ακολουθεί (όπως συνήθως συμβαίνει στα γιαπωνέζικα). Επομένως, το Χ' είναι σημαντικό γιατί μας βοηθά να εκφράσουμε τη σχέση της κεφαλής με το χαρακτηριστή και το συμπλήρωμά της. Ο «χαρακτηριστής» ορίζεται δομικά, βάσει δηλαδή της θέσης του, και δεν αναφέρεται σε συγκεκριμένη κατηγορία (πχ Ρήμα, Όνομα, κτλ). Τέλος, καταλαβαίνουμε ότι στο επίπεδο της πρότασης δεν έχουμε μόνο προβολές που μπορεί να αφορούν το ρήμα ή το όνομα ή κάποιο επίθετο που είδαμε ως τώρα. Χρειάζεται και κάποια προβολή μιας κεφαλής που θα μας δίνει πληροφορίες για το είδος της πρότασης, για παράδειγμα αν είναι ερωτηματική ή όχι. Επίσης, θα πρέπει να θεωρήσουμε ότι υπάρχει μια κεφαλή για την κλίση, αφού η ρηματική κλίση παίζει κάποιο ρόλο στη σύνταξη [Για παράδειγμα, έστω η πρόταση «βλέπει τηλεόραση». Το «βλέπει» είναι στο τρίτο πρόσωπο καθώς αναφέρεται σε κάποιο συγκεκριμένο υποκείμενο, με το οποίο και συμφωνεί ως προς το πρόσωπο, και επίσης το ρήμα έχει και κάποια χρονική αναφορά (είναι στον ενεστώτα)]. 16

Η Κυβέρνηση και Αναφορική Δέσμευση (ΚΑΔ) αναθεώρησε κάποια ζητήματα σε σχέση με το μοντέλο Χ' (Chomsky 1981, 1986). H ΚΑΔ ήταν το πρώτο μοντέλο στο πλαίσιο της Γενετικής Γραμματικής που βασίστηκε στη θεωρία Αρχών και Παραμέτρων. Η κυβέρνηση σε επόμενα στάδια της γενετικής παράδοσης θεωρήθηκε προβληματική (βλ και πρόλογο για τη θεωρία Αρχών και Παραμέτρων αλλά και για την κυβέρνηση). Με τον όρο «Αναφορική Δέσμευση» (ΑΔ) εννοούμε τον τρόπο με τον οποίο ερμηνεύονται οι διάφορες ΟΦ-ορίσματα (θα δούμε παρακάτω τι συνιστά όρισμα) και τις συνθήκες που καθορίζουν την κατανομή τους (Θεοφανοπούλου-Κόντου, 2002: 168). Η ΑΔ είναι σχέση Συμφωνίας ανάμεσα σε δύο λεξικά στοιχεία: (4) John i likes himself i Με τον ενδείκτη (i) εκφράζουμε τη σχέση συναναφοράς. H αυτοπαθής παίρνει την αναφορά της από την ΟΦ (και όχι το αντίστροφο). Η αναφορική δέσμευση ορίζεται ως εξής: (5) Το α δεσμεύει το β αν έχουν την ίδια ένδειξη και το α επιβάλλεται δομικά στο β. Το α πρέπει να βρίσκεται σε θέση Α', δηλαδή θέση ορίσματος. (Θεοφανοπούλου-Κόντου, 2002: 172). Καταλαβαίνουμε λοιπόν ότι η έννοια της δομικής επιβολής (c-command) κατέχει κεντρικό ρόλο στην ΑΔ: (6) το α επιβάλλεται δομικά στο β ανν ο πρώτος διακλαδούμενος κόμβος που κυριαρχεί στο α κυριαρχεί και στο β, και το α δεν κυριαρχεί στο β, ούτε το β στο α. (βλ Radford, 2006). Επομένως, η αντιγραμματικότητα της πρότασης στην Εικόνα 1: 17

Εικόνα 1: Η σημασία της δομικής επιβολής εξηγείται ως εξής: Το John και το himself έχουν ίδια ένδειξη, όμως η ΑΦ1 είναι αυτή που επιβάλλεται δομικά στο himself, όχι η ΑΦ2. Στην ΚΑΔ, μέσω των αρχών στον Πίνακα 2, ορίζεται η κατανομή των τριών ειδών ΟΦ που αναγνωρίζονται. Αυτές είναι: α) τα αναφορικά στοιχεια (anaphors), β) οι αντωνυμίες (pronouns) και γ) οι R-expressions (ΟΦ με υποχρεωτικά ανεξάρτητη αναφορά): Πίνακας 2: Binding Principles 18

Τέλος, στην ΚΑΔ διακρίνουμε τα επίπεδα αναπαράστασης της Βαθείας και Επιφανειακής Δομής. Υπήρχε η υπόθεση ότι, για παράδειγμα, οι προτάσεις (7α, 7β) λένε λίγο πολύ το ίδιο πράγμα με λίγο πολύ τις ίδιες λέξεις, επομένως η Επιφανειακή Δομή των προτάσεων αυτών θα πρέπει να προκύπτει μέσω μετασχηματισμών από κάποια παρόμοια Βαθεία Δομή: (7α) (7β) Η κυβέρνηση έδωσε το επίδομα θέρμανσης. Το επίδομα θέρμανσης δόθηκε από την κυβέρνηση. Η διάκριση αυτή δεν υφίσταται σε επόμενα στάδια της γενετικής θεωρίας (βλ Chomsky, 1995). Στο Μινιμαλισμό υπάρχουν δύο βασικά επίπεδα: η Φωνητική Μορφή (αρθρωτικό σύστημα) και η Λογική Μορφή (εννοιολογικό), ενώ το υπολογιστικό σύστημα της γλώσσας (CHL) συνδέει τα δύο επίπεδα. Η παραγωγή της πρότασης νοείται ως δημιουργική διαδικασία βαθμιαίας συγχώνευσης (Merge) λέξεων ή δομών και της μετακίνησης (move), που λειτουργούν σύμφωνα με συγκεκριμένες αρχές. Βαση παραγωγής αποτελεί το Λεξικό, που τροφοδοτεί με λέξεις την παραγωγή. Λέγοντας «δημιουργική διαδικασία συγχώνευσης», θέλουμε να τονίσουμε την απόρριψη των έτοιμων δενδροδιαγραμμάτων της θεωρίας Χ'. Στο Μινιμαλιστικό Πρόγραμμα, η παραγωγή νοείται «εν τω γίγνεσθαι, με διαρκείς συνενώσεις στοιχείων» (Θεοφανοπούλου-Κόντου, 2002: 226). Ας δούμε στην Εικόνα 2 τη διαδικασία συγχώνευσης (Merge): Εικόνα 2: "Merge" Το αποτέλεσμα της συγχώνευσης χαρακτηρίζεται από αναδρομικότητα (Adger, 2003) (βλ και κεφάλαιο 3.2.6 για την αναδρομικότητα) και δίνει ένα νέο συντακτικό αντικείμενο. Το αποτέλεσμα της συγχώνευσης, σύμφωνα με την Εικόνα 2, είναι ασύμμετρο. Ας δούμε το παράδειγμα στην Εικόνα 3: 19

Εικόνα 3: παράδειγμα "merge" Το «γράμμα» συγχωνεύεται με το «ένα» και δημιουργείται ένα νέο συντακτικό αντικείμενο. Τώρα το νέο αυτό αντικείμενο μπορεί να συγχωνευτεί με κάποιο άλλο στοιχείο, όπως στην Εικόνα 4: Εικόνα 4: "merge" II Επομένως σε πρώτη φάση είχαμε μία συγχώνευση, και αργότερα, σε μια δεύτερη φάση, μία άλλη. Η διαδικασία «merge» μπορεί να επαναληφθεί μέχρι την εξάντληση των στοιχείων από μία συγκεκριμένη αρίθμηση (numeration). Οι δύο βασικές σχέσεις που είδαμε στη θεωρία Χ' (κεφαλή-συμπλήρωμα, κεφαλή-χαρακτηριστής) παραμένουν θεμελιώδεις. Κεντρικό ρόλο στο Μινιμαλισμό κατέχει η συμφωνία, στην οποία βασίζεται η σχέση κεφαλής-χαρακτηριστή. Από την άλλη, η σχέση κεφαλής-συμπληρώματος σχετίζεται με τις θεματικές σχέσεις (Θεοφανοπούλου-Κόντου, 2002: 224). Τότε, καταλαβαίνουμε ότι η σχέση της σύνταξης με τη σημασιολογία και τη μορφολογία αποτελούν ζητήματα μεγάλης σημασίας, όπως φυσικά και η οργάνωση του Λεξικού που, όπως είπαμε, αποτελεί τη βάση της παραγωγής. Τέλος, η παραγωγή πρέπει να είναι η βέλτιστη και να πληρούνται συγκεκριμένες αρχές οικονομίας (Adger, 2003). Έστω η πρόταση «Οι σκύλοι δαγκώνουν». Το ρήμα, που περιέχει στοιχεία κλίσης, 20

έχουμε ενδείξεις ότι θα πρέπει να μετακινείται στη φράση της κλίσης (ΚλΦ), και επίσης θα πρέπει να μετακινηθεί το «οι σκύλοι» στη [Χαρ, ΚλΦ], εφόσον χρειαζόμαστε ένα συντακτικό υποκείμενο (βλ κεφάλαιο 2.3). Μία μετακίνηση όμως θα πρέπει να προκαλείται από κάτι συγκεκριμένο: Η μετακίνηση (move) θα πρέπει να συμβαίνει για να ταιριάξουν κάποια χαρακτηριστικά (ερμηνεύσιμα) με κάποια άλλα (μη ερμηνεύσιμα). Ρόλος του υπολογιστικού συστήματος θα πρέπει να είναι να ξεκαθαρίσει τα ερμηνεύσιμα από τα μη ερμηνεύσιμα χαρακτηριστικά, διαγράφοντας τα μη ερμηνεύσιμα (Adger, 2003). Καταλαβαίνουμε λοιπόν ότι η φράση «οι σκύλοι» ερμηνεύεται: Αναφέρεται σε μία οντότητα στον πληθυντικό. Όμως ο πληθυντικός του «δαγκώνω» δεν ερμηνεύεται: Χρειάζεται μία σχέση με το υποκείμενο για να μπορέσουμε να το ερμηνεύσουμε από κοινού με αυτό. Επομένως το «οι σκύλοι» καταλαβαίνουμε ότι χρειάζεται να μετακινηθεί στη [Χαρ, ΚλΦ] όχι μόνο επειδή χρειαζόμαστε ένα συντακτικό υποκείμενο (βλ κεφάλαιο 2.3), αλλά και για να ελεγχθούν τα χαρακτηριστικά του από κοινού με αυτά της κλίσης (για περισσότερα βλ Adger, 2003: 67). 2.3 Δομή Ορισμάτων και Θ-ρόλοι To είδος του συμπληρώματος εξαρτάται γενικά από τις σημασιολογικές ιδιότητες του ρήματος. Για παράδειγμα, στην εικόνα 4 του κεφαλαίου 2.2, το «γράφει», που είναι ρήμα μεταβατικό, χρειάζεται κάποιο συμπλήρωμα. Στην προκειμένη περίπτωση, το συμπλήρωμα αυτό είναι το συστατικό «ένα γράμμα». Πώς ξέρουμε ότι είναι συστατικό μια ακολουθία από λέξεις; Υπάρχουν ορισμένα διαγνωστικά κριτήρια, όπως λχ εκείνα της κατανομής και της μετακίνησης, που μας βοηθούν σε αυτό. O Adger (2003) δίνει το παρακάτω παράδειγμα: (8α) (8β) I like Anson It's Anson that I like Αλλα ρήματα όπως το «νομίζω» και το «ελπίζω» παίρνουν ολόκληρες προτάσεις ως συμπλήρωμα, επομένως μια ΣΔΦ (Φράση Συμπληρωματικού Δείκτη) (για περισσότερα σχετικά με τους συμπληρωματικούς δείκτες και τα ρήματα που συντάσσονται με ΣΔ, βλ Ρούσσου, 2010). Αυτού του είδους οι πληροφορίες δίνονται στο Λεξικό με τη μορφή ενός πλαισίου υποκατηγοριοποίησης (subcategorization frame) (βλ Θεοφανοπούλου-Κόντου, 2002: 78) και θα πρέπει να προβάλλονται στη συντακτική δομή (Projection Principle, βλ Radford, 2006: 301): 21

Πίνακας 3: Παράδειγμα πλαισίου υποκατηγοριοποίησης Το πλαίσιο υποκατηγοριοποίησης, όμως, δεν μας δίνει πληροφορίες για το υποκείμενο αλλά μόνο για το συμπλήρωμα. Σύμφωνα με την Αρχή της Διευρυμένης Προβολής (ΑΔΠ) (Radford, 2006: 33), κάθε πρόταση χρειάζεται ένα συντακτικό υποκείμενο [παραδοσιακά, στη θέση του χαρακτηριστή της φράσης Χρόνου (Κλίσης στα Ελληνικά)]. Επομένως, θα χρησιμοποιήσουμε τον όρο κατηγοριακή επιλογή (c-selection) (Adger, 2003) που συμπεριλαμβάνει και την επιλογή του υποκειμένου από το κατηγόρημα αλλά και τυχόν συμπληρώματα. Σημασιολογικά, η πρόταση ορίζεται από το κατηγόρημα, που εκφράζει μια σχέση μίας ή περισσότερων οντοτήτων. Για παράδειγμα, το «γελάω» εκφράζει μια ιδιότητα που ισχύει για κάποια οντότητα (πχ Ο Γιάννης γελάει). Το «δίνω», μία ιδιότητα που ισχύει για τρεις οντότητες: κάποιος δίνει κάτι σε κάποιον. Επομένως, λέμε ότι το «γελάω» παίρνει ένα όρισμα, είναι δηλαδή μονοθέσιο κατηγόρημα, ενώ το «δίνω» που παίρνει τρία ορίσματα, είναι τριθέσιο. Το κάθε όρισμα ερμηνεύεται βάσει κάποιου θ-ρόλου: 22

Πίνακας 4: Οι βασικοί θ-ρόλοι Οι θ-ρόλοι του Πίνακα 4 είναι οι γενικώς αποδεκτοί από τους περισσότερους ερευνητές (βλ μεταξύ άλλων Θεοφανοπούλου-Κόντου, 2002: 90. Haegeman, 2006: 192). Εκτός των παραπάνω, η Haegeman (2006: 192) δίνει και το θ-ρόλο στο (9) ο οποίος θα μας απασχολήσει στην ανάλυση των ρημάτων καιρού: (9) CAUSE: unintentionally initiates the event. Πέρα από τους θ-ρόλους και τους περιορισμούς στην κατηγοριακή επίλογη (c-selection) που είδαμε ως τώρα, υπάρχουν και ορισμένοι σημασιολογικοί περιορισμοί των κατηγορημάτων (s-selection) (Adger, 2003: 68). Για παράδειγμα, το ρήμα «τρέχω» χρειάζεται ένα υποκείμενο ΑΦ [από εδώ και στο εξής, θα θεωρήσουμε ότι η κεφαλή μιας ΟΦ είναι το άρθρο, γιατί η αναφορά του ονόματος καθορίζεται από στοιχεία του άρθρου, πχ το άρθρο φέρει στοιχεία οριστικότητας], αλλά όχι οποιαδήποτε ΑΦ. Για παράδειγμα, μπορούμε να φανταστούμε εύκολα το «Γιώργο» να τρέχει, αλλά δύσκολα τη «βιβλιοθήκη». Το ζήτημα θα μας απασχολήσει ιδιαιτέρως στο κεφάλαιο 3. Σε κάθε περίπτωση, για να εκφράσουμε τη σχέση του κατηγορήματος με τα ορίσματά του, χρησιμοποιούμε το θεματικό πλέγμα (theta grid) ή δομή ορισμάτων. Ας δούμε τα παραδείγματα της Εικόνας 5: 23

Εικόνα 5: Παραδείγματα δομής ορισμάτων Εδώ οι πληροφορίες μας για τα ρήματα είναι πιο πλήρεις. Για παράδειγμα, το ρήμα «τρώω», έχει ρηματικά χαρακτηριστικά [+Ρ], και παίρνει μια ΑΦ ως εξωτερικό όρισμα, που έχει το ρόλο το δράστη. Επίσης, δίνουμε σε παρένθεση το λανθάνον όρισμα. Σε κάθε περίπτωση, κάποιος τρώει κάτι. Το ζήτημα θα μας απασχολήσει αργότερα στην εργασία κατά την ανάλυση των μεταβατικών ρημάτων. Πρέπει να πούμε ότι η σύνταξη, αν και καταλαβαίνουμε από τα παραπάνω ότι βρίσκεται σε στενή σχέση με τη σημασιολογία, διατηρεί την αυτονομία της (Adger, 2003). Δεν μπορούμε να προβλέψουμε τη συντακτική κατηγορία που επιλέγει ένα κατηγόρημα μέσω του θ-ρόλου: (10α) (10β) Αισθάνομαι [ΑΦ το χέρι του]. Αισθάνομαι [ΣΔΦ ότι κάτι υπάρχει]. Αν και αυτό που αισθάνομαι ανήκει στον ίδιο θ-ρόλο, βλέπουμε ότι είναι απαραίτητες οι συντακτικές πληροφορίες της κατηγοριακής επιλογής. 24

2.4 Ιεραρχία Chomsky Τη δεκαετία του 1950 ο Chomsky εξέτασε πόσα είδη γραμματικών μπορούν να οριστούν ανάλογα με τη μορφή των κανόνων παραγωγής τους, και κατέληξε, σύμφωνα με τη διάσημη Ιεραρχία Chomsky (Chomsky hierarchy) (Παπασπύρου, Σκορδαλάκης, 2002: 30), ότι υπάρχουν τέσσερις κλάσεις. Μιλάμε για ιεραρχία με την έννοια ότι η κάθε κλάση είναι υπερσύνολο των επόμενων: Εικόνα 6: Chomsky hierarchy Πίνακας 5: Chomsky hierarchy II Το σύμβολο "ε" έχει την έννοια της κενής συμβολοσειράς (empty string). Μια γλώσσα ονομάζεται 25

τύπου n (όπου n= 0,1,2,3) αν υπάρχει γραμματική τύπου n που την παράγει. Επομένως, με τους κανόνες μιας γραμματικής τύπου 0 μπορούμε να εκφράσουμε όλους τους κανόνες όλων των γραμματικών. Με μία γραμματική τύπου 1, μπορούμε να εκφράσουμε τις γλώσσες τύπου 1,2,3, άλλα όχι τύπου-0. Για να αποδείξουμε ότι μία γλώσσα δεν είναι τύπου 3 ή τύπου 2, χρησιμοποιούμε το λήμμα άντλησης (pumping lemma) για κανονικές (regular) γλώσσες και γλώσσες ανεξάρτητες συμφραζομένων (context-free) αντίστοιχα (βλ Sipser, 2008). Για παράδειγμα, το λήμμα άντλησης αποδεικνύει ότι η γλώσσα L = {a n b n : n 0}, δηλαδή μια n ακολουθία απο a που ακολουθείται από μια n ακολουθία απο b του αλφάβητου Σ = {a, b} δεν είναι κανονική (είναι ελεύθερη συμφραζομένων) (βλ Sipser, 2008: 88). Τέτοια ζητήματα της θεωρίας υπολογισμού ξεφεύγουν πάρα πολύ από το σκοπό αυτής της εργασίας. Οι διευκρινίσεις δίνονται για λόγους πληρότητας, επειδή ενίοτε οι παρόμοιοι κανόνες των τύπου-3 και τύπου-2 γραμματικών προκαλούν σύγχυση. Το ερώτημα που ενδιαφέρει αυτήν την εργασία είναι το εξής: Σε ποια κλάση ανήκουν οι φυσικές γλώσσες; Αν θέλουμε να είμαστε ακριβείς, οι φυσικές γλώσσες είναι γλώσσες τύπου-1. Επειδή δεν υπάρχουν αξιόπιστοι αλγόριθμοι για τις γλώσσες αυτού του τύπου, συχνά οι φυσικές γλώσσες περιγράφονται, με ορισμένες παραχωρήσεις βέβαια, με κανόνες παραγωγής τύπου-2 και τύπου-3. Ειδικά οι γραμματικές τύπου-2 μπορούν πάντοτε να γραφτούν με κανόνες που έχουν είτε τη μορφή (11α) είτε τη μορφή (11β): (11α) (11β) A -> α Α -> Β Γ Όπου με μικρά γράμματα γράφουμε τα τερματικά σύμβολα, και με κεφαλαία τα μη τερματικά. Τότε λέμε ότι η γραμματική είναι σε κανονική μορφή κατά Chomsky (Chomsky Normal Form, CNF) (Sipser, 2008: 122) και όπως είπαμε, μπορούμε να μετατρέψουμε κάθε γραμματική τύπου-2 σε CNF. Αυτό μας ενδιαφέρει γιατί, όπως θα δούμε παρακάτω, η συντριπτική πλειοψηφία των κανόνων που θα χρησιμοποιήσουμε στο πλαίσιο αυτής της εργασίας, θα είναι πρακτικά είτε τύπου (11α) είτε τύπου (11β). 26

Κεφάλαιο 3 Από τη στατιστική προσέγγιση στο λογικό προγραμματισμό 3.1 Στατιστική επεξεργασία γλώσσας και κανόνες παραγωγής. Το παράδειγμα της Μετάφρασης Google. Το Μάϊο του 2011, στο πλαίσιο της επετείου για τα 150 χρόνια ζωής του Tεχνολογικού Iνστιτούτου Μασαχουσέτης (Massachusetts Institute of Technology), έλαβε χώρα ένα συμπόσιο με τίτλο «Brains, Minds and Machines». Συμμετείχαν σε αυτό σημαντικοί επιστήμονες, μεταξύ άλλων ο Noam Chomsky, ο Joshua Tenenbaum και ο Steven Pinker, με σκοπό να συζητήσουν το παρελθόν, το παρόν και το μέλλον της Τεχνητής Νοημοσύνης. Ο Noam Chomsky, μιλώντας στο συμπόσιο (http://mit150.mit.edu/symposia/brains-mindsmachines), εμφανίστηκε μάλλον απαισιόδοξος. Κράτησε κριτική στάση απέναντι στη «νέα» Τεχνητή Νοημοσύνη, λέγοντας πως έχει υιοθετήσει ένα μοντέλο που θυμίζει αυτό του συμπεριφορισμού, μόνο πιο μοντέρνο και υπολογιστικά πιο εξελιγμένο. Άσκησε κριτική στην τάση του χώρου να χρησιμοποιεί υπερβολικά τα στατιστικά μοντέλα και τις στατιστικές τεχνικές. Αν και δεν αρνήθηκε την αξία των στατιστικών μοντέλων σε πρακτικό επίπεδο, για παράδειγμα σε μηχανές αναζήτησης, εξέφρασε την πεποίθηση ότι η στατιστική εκμάθηση για εξόρυξη δεδομένων (data mining) δύσκολα θα μπορέσει να φέρει στην επιφάνεια γενικές αρχές της φύσης της νοημοσύνης και με αυτόν τον τρόπο, ο τομέας της Τεχνητής Νοημοσύνης, δεν θα ανταποκριθεί στον επιστημονικό του ρόλο (Katz, 2012). Γι' αυτό, σύμφωνα με τον Chomsky, η Τεχνητή Νοημοσύνη βρίσκεται σε λάθος δρόμο. Στην κριτική του Chomsky πάνω στις μεθόδους της σύγχρονης Τεχνητής Νοημοσύνης απάντησε ο Peter Norvig, επικεφαλής έρευνας της Google, που υπεραμύνθηκε της χρήσης στατιστικών μοντέλων (Norvig, 2014), ενώ κατά το παρελθόν, και ο υπεύθυνος της Μετάφρασης Google, Franz Josef Och, είχε υπερασπιστεί την επιλογή των στατιστικών προσεγγίσεων στη μετάφραση (Och, 2005). Η Μετάφραση Google είναι ενα από τα πλέον γνωστά παραδείγματα στατιστικής μετάφρασης. Για να μεταφραστεί ένα κείμενο, δε χρησιμοποιείται κάποια γραμματική. Επομένως, δεν υπάρχουν 27

κανόνες παραγωγής, και η προσέγγιση έχει ως εξής: Αναζητούνται συγκεκριμένα μοτίβα (patterns) από άλλα έγγραφα που έχουν μεταφραστεί από ανθρώπους, προκειμένου να αποφασιστεί ποια είναι η καλύτερη μετάφραση, με άλλα λόγια, ποια μετάφραση είναι στατιστικά η πιο πιθανή για την κάθε περίπτωση. Αυτή η στρατηγική μετάφρασης ονομάζεται «στατιστική μηχανική μετάφραση» (GOOGLE, 2014). Παραβλέποντας τη γραμματική μιας γλώσσας, είναι λογικό να γίνονται λάθη. Δεν αναφερόμαστε στα «παραδοσιακά» λάθη στην Επεξεργασία Φυσικής Γλώσσας (NLP) η οποία βασίζεται σε κανόνες παραγωγής. Για παράδειγμα, στην πρόταση «Τακτοποίησε τα αρχεία...», πρέπει να παρθεί μια απόφαση: Είναι το ρήμα στην προστακτική του «τακτοποιώ», και το υποκείμενό του που εννοείται στο β' πρόσωπο ενικού, ή μήπως είναι το ρήμα στο τρίτο πρόσωπο του ενικού, στον αόριστο; Τέτοια ζητήματα προκαλούσαν πάντα δυσκολίες στην ακρίβεια των αναλυτών γραμματικών. Ακόμη κι αν στην πορεία της πρότασης παύσει η αμφισημία (για παράδειγμα: «Τακτοποίησε τα αρχεία του γραφείου της χθες το απόγευμα, καθώς βρήκε επιτέλους λίγο χρόνο»), χρειάζεται να γίνουν υπολογισμοί που δεν καταλήγουν πουθενά: Στο τέλος «καταργούνται» αφού θα επιλεγεί μία ερμηνεία μόνο (Rich, Knight, 1991: 393-394). Στην περίπτωση που η αμφισημία μιας πρότασης όπως η «Τακτοποίησε τα αρχεία.» ξεκαθαρίζεται από στοιχεία που δεν ανήκουν στην πρόταση (για παράδειγμα, αν το υποκείμενο είναι ήδη γνωστό και παραλείπεται σε μία γλώσσα pro-drop όπως τα ελληνικά), ο συντακτικός αναλυτής θα έχει πιθανώς ικανοποιηθεί από ένα αποτέλεσμα διαφορετικό από αυτό που θα ταίριαζε στην περίσταση. Η στατιστική μηχανική μετάφραση από την άλλη δεν ενδιαφέρεται καθόλου για κανόνες παραγωγής, και τα προβλήματά της έχουν συχνά άλλα αίτια. Ένα πρόβλημα είναι ότι η σύγχρονη γλωσσολογική θεωρία, αν και έχει απορρίψει τα «έτοιμα» δενδροδιαγράμματα των προτάσεων (Θεοφανοπούλου-Κοντού, 2002: 224) της θεωρίας Χ', έχει δείξει ότι ορισμένα στοιχεία του Λεξικού είναι αναγκαίο να συγχωνεύονται (Merge) με άλλα συντακτικά αντικείμενα προκειμένου να δημιουργηθούν καλοσχηματισμένες (well-formed) φράσεις (Adger, 2003: 61), επομένως χρειάζεται ένας κανόνας παραγωγής φραστικής δομής. O Adger εξηγεί ότι ρήματα όπως το donate εμπλέκουν τρία τέτοια συντακτικά αντικείμενα: κάποιος(1) δωρίζει κάτι(2) σε κάποιον(3). Αντιθέτως, ρήματα όπως το disappear, σχετίζονται με μόνο ένα (2003: 61). Κατά τη γνώμη μας, η κεντρική ιδέα της σχεδίασης ενός συντακτικού αναλυτή ίσως να είναι θεμελιωδώς ελαττωματική, αν παραβλέπει μία τέτοια ιδιότητα των φυσικών γλωσσών. Το πρόβλημα μας, επομένως, με την αποτυχία μιας ανάλυσης σαν την παρακάτω της Εικόνας 7: 28

Εικόνα 7: Παράδειγμα άστοχης μετάφρασης Δεν είναι η ίδια η αποτυχία της μετάφρασης αλλά κάτι που μπορεί να θεωρούμε γενικώς λάθος στην όλη προσέγγιση του προβλήματος: Θα προτιμούσαμε μια προσέγγιση στην οποία το ρήμα «δίνω» χρειάζεται να συνενωθεί τουλάχιστον με έναν συγκεκριμένο αριθμό προβλέψιμων συντακτικών αντικειμένων, για να μπορούμε να μιλάμε για καλοσχηματισμένα αποτελέσματα. Επομένως, είναι βασικό να προσεγγίσουμε το πρόβλημα με διαφορετικό τρόπο. Πρέπει να πούμε εδώ ότι αυτές οι σχέσεις ενός ρήματος με τα απαραίτητα συντακτικά στοιχεία που, όπως αναφέρει ο Adger (2003: 61), «ολοκληρώνουν» το ρήμα κατασκευάζοντας καλοσχηματισμένες φράσεις, παραδοσιακά και ειδικά στη θεωρία Κυβέρνησης και Αναφορικής Δέσμευσης, αναλύονται στο πλαίσιο της δομής ορισμάτων. Πιο συγκεκριμένα, το ρήμα donate θα πρέπει, ως τριθέσιο, να συνοδεύεται από τρία ορίσματα με αντίστοιχα τρεις θ-ρόλους: Το εξωτερικό όρισμα με το ρόλο του Δράστη, το Θέμα [ή Δέκτη, σύμφωνα με άλλες αναλύσεις: Κάποιες αναλύσεις δέχονται ότι Θέμα και Δέκτης είναι ένας ρόλος, άλλες, πάλι, δύο ξεχωριστοί: η Θεοφανοπούλου-Κοντού (2002: 90) αναφέρει ως παράδειγμα: διδάσκω το Γιάννη ΔΕΚΤΗΣ γραμματική ΘΕΜΑ (βλ και παρακάτω)], και το Στόχο, που εκφράζει το έμμεσο αντικείμενο. Παρόμοια αναλύεται και το ρήμα «δίνω» στην Εικόνα 7. Το πρόβλημα είναι ότι, αφού το Μινιμαλιστικό Πρόγραμμα καταργεί τη διάκριση Βαθείας Επιφανειακής Δομής, θα πρέπει να αποφασίσουμε τι συμβαίνει στους θ-ρόλους. Δεν υπάρχει συμφωνία στους ερευνητές περί αυτού. Υπάρχουν ακόμη ερευνητές που συντάσσονται με την κεντρική ιδέα της UTAH (Uniformity Of Theta Assignment Hypothesis), ή έστω κάποια παραλλαγή της υπόθεσης αυτής του Baker. Εξ'άλλου, και ο ίδιος ο Baker επανήλθε με μια αναθεωρημένη εκδοχή (Baker, 1997), «τοποθετώντας» την UTAH στο πλαίσιο του Μινιμαλισμού. Σε ό,τι αφορά την UTAH, σύμφωνα με την αρχική διατύπωση (1988: 46), «πανομοιότυπες θεματικές σχέσεις 29

μεταξύ στοιχείων δίνουν πανομοιότυπες δομικές σχέσεις στη Βαθεία Δομή». [Tα Object Experiencer ρήματα ψυχικού πάθους φαίνεται να παραβιάζουν την υπόθεση του Baker, όμως θα ήταν πολύ βιαστικό να υποθέσουμε ότι η UTAH καταρρίπτεται χωρίς να εξετάσουμε πρώτα πιθανές ερμηνείες του φαινομένου (βλ Landau, 2003)]. Από την άλλη, υπάρχουν ερευνητές που ακολουθούν διαφορετική προσέγγιση από εκείνη του Baker. Για παράδειγμα, για τους Hale & Keyser, δεν υπάρχουν καν θεματικές σχέσεις (1993: 93-94). Η ερμηνεία του ορίσματος, σύμφωνα με αυτήν την ανάλυση, εξαρτάται από τη θέση του στο συντακτικό δέντρο. Οι Manzini & Roussou (2000) προτείνουν μία ερμηνεία των θ-ρόλων όχι ως ρόλων αλλά ως χαρακτηριστικών που πρέπει να ελεγχθούν. Σε κάθε περίπτωση αυτά τα ζητήματα εντοπίζονται σαφώς στη διεπαφή (interface) Σύνταξης και Σημασιολογίας. Τα ορίσματα έχουν μορφο-συντακτική πραγμάτωση, ενώ οι θ-ρόλοι είναι οι ερμηνείες που αποδίδονται στα ορίσματα. Υπάρχει ένας συγκεκριμένος αριθμός οντοτήτων συγκεκριμένου είδους, που σχετίζονται με ένα κατηγόρημα, εκφράζοντας συγκεκριμένα σημασιολογικά χαρακτηριστικά του κατηγορήματος, που είναι απαραίτητα για να ολοκληρώσουν την ερμηνεία του. Επίσης, το κατηγόρημα αυτό χρειάζεται και επιλέγει, με συστηματικό τρόπο, συγκεκριμένης συντακτικής κατηγορίας (c-selectional) αντικείμενα, τα οποία σχετίζονται με τον έναν ή τον άλλον τρόπο με την «ολοκληρωμένη» σημασία, στην οποία συμβάλλουν οι «οντότητες» που αναφέραμε παραπάνω. Επομένως, μπορούμε να υιοθετήσουμε μινιμαλιστικά και κατ'αρχήν μία εκδοχή των θ-ρόλων, ως τουλάχιστον ένα «εργαλείο» που μπορεί να μας βοηθήσει να ερμηνεύσουμε με ένα σχετικά συστηματικό τρόπο τις έννοιες που περιγράφουν οι γλώσσες. Ως προς τον ακριβή αριθμό και το είδος των θ-ρόλων, δεν υπάρχει συμφωνία μεταξύ των ερευνητών: Το Θέμα και ο Δέκτης είναι δύο ξεχωριστοί ρόλοι, ή υποκατηγορίες ενός ρόλου; Ούτε για τους υπόλοιπους ρόλους υπάρχει συμφωνία. Για παράδειγμα, ερευνητές όπως ο Baker, αρνούνται ότι υπάρχει ξεχωριστά από τον Δράστη ο θ-ρόλος «Experiencer» (βιώνων μια ψυχολογική κατάσταση). Αυτούς τους θ-ρόλους o Baker τους θεωρεί «υποκατηγορίες» ενός ενιαίου θ-ρόλου (Landau, 2003). Η Θεοφανοπούλου-Κοντού (2002: 90-91) αναφέρει οκτώ θ-ρόλους, ενώ στη Haegeman (2006: 191-192) ο Δέκτης και το Θέμα είναι ξεχωριστοί ρόλοι, και προστίθενται επιπλέον δύο ρόλοι (Possessor, Cause). Είναι λογικό επομένως ότι διαφορετικές αναλύσεις μπορεί να δίνουν διαφορετικούς θ-ρόλους στα ορίσματα ενός συγκεκριμένου κατηγορήματος. Κατά τη γνώμη μας, αυτό μπορεί να είναι απολύτως λογικό, αν θεωρήσουμε τους θ-ρόλους ως ένα 30

απλό εργαλείο αναπαράστασης σε κάποιο επίπεδο διεπαφής της Σύνταξης με τη Σημασιολογία. Οι έννοιες που εκφράζονται μπορεί να είναι σαφείς, αλλά μπορούν να περιγράφονται με λογική συνέπεια με πολλούς τρόπους. Δε βλέπουμε κάτι απαγορευτικό ή θεμελιωδώς λάθος σε αυτό. Με παρόμοια λογική, μάλλον, αντιμετωπίζουν και πολλοί ερευνητές της Τεχνητής Νοημοσύνης τις γραμματικές πτώσεων (Rich & Knight, 1991: 406). O Fillmore (1968) στο πλαίσιο τότε της Μετασχηματιστικής Γραμματικής προσπάθησε να συστηματικοποιήσει τη σχέση μεταξύ της Επιφανειακής Δομής και των Εσωτερικών (Deep) Πτώσεων όπως ο Δράστης, ο Τόπος, το Όργανο/Μέσο κτλ, που αντιστοιχούν λίγο-πολύ στους ανάλογους θ-ρόλους, όπως περιγράφονται αναλυτικότερα στο πλαίσιο της Κυβέρνησης και Αναφορικής Δέσμευσης. Ο Dowty (1991) προτείνει δύο πρωτοτυπικούς θ-ρόλους, το Δράστη και το Δέκτη. Οι ιδιότητες των θ-ρόλων δεν θα μας απασχολήσουν άλλο. Αυτό που θα μας απασχολήσει, είναι το κατά πόσο συγκεκριμένες δομές ρηματικών φράσεων μπορούν να προβλεφθούν με σχετική ακρίβεια, από τη στιγμή που έχουμε ορίσει, α) τον αριθμό και το είδος (πχ εξωτερικό/εσωτερικό) των ορισμάτων του κατηγορήματος, β) τα κατηγοριακά χαρακτηριστικά (c-selectional features), και γ) στοιχεία που παραδοσιακά ονομάζονται «πτωτικά». Να ξεκαθαρίσουμε, όπως θα φανεί και στην πράξη, ότι ξεχωρίζουμε δύο «ειδών» πτώσεις, διακρίνουμε τη δομική Πτώση (structural Case) και τις εγγενείς (inherent) Πτώσεις. Η δομική Πτώση, σε αντίθεση με την εγγενή Πτώση, φέρει μη ερμηνεύσιμα (uninterpretable) χαρακτηριστικά (Chomsky, 2007). Για παράδειγμα, η Ονομαστική στα Ελληνικά μπορεί να αποδίδεται σε μία ΟΦ σε ρόλο Δράστη ή Δέκτη ανάλογα με την περίπτωση. Σύμφωνα με την ανάλυση του Adger (2003), η κεφαλή του Χρόνου στα Αγγλικά (στα Ελληνικά, η κεφαλή της Κλίσης) είναι υπεύθυνη για την Ονομαστική Πτώση (2003: 176), ενώ το ελαφρύ ρ (light v) είναι υπεύθυνο για την Αιτιατική Πτώση (2003: 177-178). Για γλώσσες όπως τα Ουαλικά με σειρά Ρ-Υ-Α, όπου μία δομή ανύψωσης (raising) στη θέση Χαρ, Κλφ φαίνεται να απουσιάζει, θα δεχθούμε ότι και πάλι η πτώση αποδίδεται απο την Κλφ με κάποιον τρόπο. Με τα παραπάνω δεν υπονοούμε σε καμία περίπτωση μία επιστροφή στην προσεγγίση της θεωρίας Χ' και τα «έτοιμα» συντακτικά δένδρα, στα οποία τοποθετούνται απλώς τα συντακτικά αντικείμενα. Προσπαθούμε να δούμε το πρόβλημα από μία διαφορετική οπτική: Μία επαρκής περιγραφή των λίγο ή πολύ αναμενόμενων συγχωνεύσεων ενός κατηγορήματος, στο βαθμό που τις ορίζουν οι παραπάνω προϋποθέσεις (α,β,γ), σε τι βαθμό θα ανταποκριθεί στις προσδοκίες μας για κάποια «προβλεψιμότητα» και «υπολογισιμότητα» σε επίπεδο αναπαράστασης δομής; Επομένως, θα θέλαμε κατ'αρχάς να ορίσουμε το πρόβλημά μας με όσο πιο πλήρη τρόπο γίνεται. Και σ'αυτό το εγχείρημα ελπίζουμε να μας βοηθήσει ο λογικός προγραμματισμός (logic programming), καθώς 31

χαρακτηρίζεται βασικά από αυτήν την ιδιότητα: Τα προβλήματα στο λογικό προγραμματισμό λύνονται, εφόσον έχουν περιγραφεί πλήρως. 3.2 Λογικός προγραμματισμός με την Prolog H Prolog είναι μια γλώσσα λογικού προγραμματισμού, με εφαρμογές κυρίως στην Τεχνητή Νοημοσύνη και την Επεξεργασία Φυσικής Γλώσσας, που δημιουργήθηκε στις αρχές της δεκαετίας του 1970 από τον Alain Colmerauer. H Prolog διαφέρει από «κλασικές» γλώσσες προγραμματισμού όπως η Basic ή η C, που ονομάζονται και διαδικαστικές (procedural). Σε αυτές τις γλώσσες ο τρόπος λειτουργίας είναι «αλγοριθμικός»: Προκειμένου να λύσουμε ένα πρόβλημα, ακολουθούμε βήμα-βήμα μία καθορισμένη ακολουθία ενεργειών. Αυτές οι ενέργειες, προκύπτουν από μία στρατηγική αλγοριθμική, «διαίρει και βασίλευε»: Το βασικό πρόβλημα πρέπει να «σπάσει» σε μικρότερα υποπροβλήματα, που λέγονται και «εργασίες», οι δε πολύπλοκες εργασίες με τη σειρά τους σε ακόμη πιο απλές, ώστε να είναι πιο εύκολες στην κατανόηση και επίλυση. Από τα παραπάνω, φυσικά, γίνεται αντιληπτό ότι ο προγραμματιστής θα πρέπει να γνωρίζει τον τρόπο που λύνεται το πρόβλημα εκ των προτέρων, και, αφού σχεδιάσει τον αλγόριθμο που το λύνει, απλώς μεταθέτει την επίλυσή του στον υπολογιστή, ώστε να εκμεταλλευτεί την ταχύτητα και την επεξεργαστική του ισχύ. Η Prolog από την άλλη, είναι μια γλώσσα λογικού προγραμματισμού που χαρακτηρίζεται σε μεγάλο βαθμό από τις αρχές του δηλωτικού (declarative) προγραμματισμού. Η κεντρική ιδέα είναι ότι, κατά μία έννοια, δεν είναι απαραίτητο να γνωρίζουμε από πριν τον τρόπο που λύνεται ένα πρόβλημα. Αντιθέτως σκοπός μας είναι να το ορίσουμε με πλήρη και ακριβή τρόπο, και ο υπολογιστής θα αναλάβει να το λύσει. Γενικά, στις γλώσσες λογικού προγραμματισμού, ο υπολογιστής, για κάποιες προτάσεις (δηλώσεις) που βασίζονται στη λογική πρώτου βαθμού (first-order logic), δίνει κάποια αποτελέσματα. Στην Prolog, πιο συγκεκριμένα, ενα πρόγραμμα περιγράφεται σαν μια σειρά λογικών ισχυρισμών (Rich & Knight, 1991: 177). Έτσι, αν ο προγραμματιστής θέλει κάποια διαφορετικά αποτελέσματα από ένα Χ πρόγραμμα, απλά τροποποιεί τις αρχικές δηλώσεις που αποτελούν το πρόγραμμά του, με άλλα λόγια, τις προτάσεις του προγράμματός του. Δεν επεμβαίνει στον «τρόπο» που λειτουργεί το πρόγραμμα για να βρει κάποια λύση. 32

Υπήρξε κάποια διαμάχη στον τομέα της Τεχνητής Νοημοσύνης για το αν η δηλωτική ή η αλγοριθμική προσέγγιση είναι καλύτερη. Τι είναι πιο σημαντικό; Να επικεντρωθούμε στο «ποιο είναι το πρόβλημα», περιγράφοντάς το επαρκώς; Ή να επικεντρωθούμε στο να βρούμε τον τρόπο που θα το λύσουμε; Για να είμαστε ακριβείς, στην πράξη, χρησιμοποιούμε και τις δύο στρατηγικές. Εξ'άλλου, τα όρια δεν είναι και τόσο σαφή. Επομένως, δεν υπάρχει και σαφής απάντηση στην ερώτηση (Rich & Knight, 1991: 177). Μπορούμε, πάντως, ανάλογα με το πρόβλημα, να επικεντρωθούμε στη μία ή την άλλη προσέγγιση, και είναι θετικό ότι έχουμε δύο διαφορετικά «εργαλεία» για τα προβλήματά μας, καθώς το καθένα συνδέεται με συγκεκριμένα πλεονεκτήματα. Η αλήθεια είναι ότι άλλα προβλήματα λύνονται καλύτερα με μία «αλγοριθμική» προσέγγιση. Άλλα, πάλι, είτε είναι πιο εύκολα διαχειρίσιμα με το δηλωτικό προγραμματισμό, είτε, για διάφορους λόγους, είναι πολύ δύσκολο να λυθούν με αλγοριθμικό τρόπο, οπότε ενδεχομένως η δηλωτική προσέγγιση αποτελεί μία εναλλακτική. Για παράδειγμα, το να σχεδιάσουμε έναν αρκετά αποτελεσματικό αλγόριθμο για ανάλυση φυσικών γλωσσών, στην πράξη αποδεικνύεται μια εξαιρετικά δύσκολη υπόθεση. Δεν είναι τυχαίο ότι μέχρι σήμερα δεν έχει υπάρξει κάποιος αλγόριθμος αρκετά αξιόπιστος για την ανάλυση context-sensitive γραμματικών. Προφανώς, εξ'αιτίας αυτού, η επιλογή context-free αλλά και κανονικών γραμματικών για την περιγραφή φυσικών γλωσσών αποτελεί κάποιου είδους αναγκαίο συμβιβασμό. Είπαμε παραπάνω ότι η κάθε προσέγγιση συνδέεται με συγκεκριμένα πλεονεκτήματα. Με αυτά, προφανώς, τα πλεονεκτήματα, συνδέεται και η επιλογή μας να χρησιμοποιήσουμε μια γλώσσα προγραμματισμού σαν την Prolog: Θα θέλαμε, με λίγα λόγια, να «φορτώσουμε» το βάρος της επίλυσης στον υπολογιστή, ενώ εμείς «φορτωνόμαστε» ένα διαφορετικό πρόβλημα: Να ορίσουμε με βέλτιστο τρόπο το πρόβλημά μας. Αλλά είναι η κατάλληλη ώρα, να δούμε σ'αυτό το σημείο πώς ακριβώς «σκέφτεται» η Prolog. 3.2.1 Εξοικείωση με την Prolog Ο καλύτερος τρόπος για να κατανοήσει κανείς τον τρόπο που δουλεύει η Prolog ώστε να εκμεταλλευτεί τις δυνατότητές της, είναι, όπως είναι λογικό, να τη γνωρίσει στην πράξη δουλεύοντας πάνω σε κάποιο πρόγραμμα. Φαίνεται, συχνά, στους προγραμματιστές που είναι συνηθισμένοι να δουλεύουν με διαδικαστικές γλώσσες προγραμματισμού όπως η C, ότι η Prolog 33

«κάνει τα δικά της», με άλλα λόγια, ότι δουλεύει με τον τρόπο που νομίζει εκείνη αντί αυτού που σκέφτεται ο προγραμματιστής. Το γεγονός ότι η Prolog θα ψάξει κανονικά όλες τις σωστές απαντήσεις, μπορεί να προβληματίσει τον προγραμματιστή που σκέφτεται «αλγοριθμικά», ιδιαίτερα εφόσον τα αποτελέσματα μπορεί να είναι διαφορετικά από αυτά που περίμενε! Ο κάθε προγραμματιστής είναι λογικό να έχει κάτι πολύ συγκεκριμένο στο μυαλό του. Επομένως, είναι σημαντικό να προσπαθήσει κανείς να κατανοήσει τη λογική της Prolog. Γιατί στην Prolog, για ο,τι γίνεται, υπάρχει μία λογική εξήγηση, ακόμη και πράγματα που εκ πρώτης όψεως φαίνονται παράδοξα. Στη συνέχεια λοιπόν θα εξετάσουμε την Prolog στην πράξη: (1) ξανθος(κωστας). ξανθος(νικος). καστανος(μιχαλης). Οι παραπάνω δηλώσεις στο (1) αποτελούν ένα πλήρες πρόγραμμα Prolog. Με τις τρεις αυτές δηλώσεις λέμε στο πρόγραμμά μας ότι ο Κώστας και ο Νίκος είναι ξανθοί, ενώ ο Μιχάλης είναι καστανός. Κάθε δήλωση (εντολή) στην Prolog τελειώνει με τελεία. Κάθε δήλωση από τις παραπάνω λέγεται γεγονός (fact) (ή και συνάρτηση), και αποτελείται από ένα κατηγόρημα (predicate) και ένα όρισμα (argument). Το πλήθος των ορισμάτων ονομάζεται arity. Επομένως για τη συνάρτηση «καστανός», λέμε ότι το arity είναι ένα, και αυτό το δηλώνουμε ως εξής: καστανος/1. Μία συνάρτηση μπορεί, όπως θα δούμε, να έχει πολλά ορίσματα. Τα απλά γεγονότα, όπως τα παραπάνω, είναι η πιο απλή μορφή πρότασης στην Prolog (Sterling & Shapiro, 1999: 11). Στο πρόγραμμά παραπάνω, καταλαβαίνουμε ότι κατηγορήματα των τριών δηλώσεων αποτελούν τα «ξανθός» και «καστανός» ενώ ορίσματα τα «Κώστας», «Νίκος», «Μιχάλης». Άφου γράψουμε το παραπάνω πρόγραμμα, το αποθηκεύουμε -ας το ονομάσουμε xrwma_malliwn- και μεταβαίνουμε στο prompt της Prolog: 34

Εικόνα 8: To prompt της Prolog (SWI-Prolog) Tώρα θα ζητήσουμε απο την Prolog να εκτελέσει το πρόγραμμα που γράψαμε. Για να είμαστε ακριβείς, απλώς θα φορτώσουμε το πρόγραμμα. Δε γίνεται κάποια διαδικασία ώστε το πρόγραμμα να τρέξει, όπως συμβαίνει στις κλασικές γλώσσες προγραμματισμού. Έτσι, αφού φορτωθεί το πρόγραμμα, απλώς παραμένει στη μνήμη. Εκτελείται, όπως θα δούμε, όταν γίνει κάποια κατάλληλη ερώτηση. Έτσι μπορεί να εκτελεστεί με μία ερώτηση μόνο ένα τμήμα του προγράμματος, με μία άλλη ερώτηση κάποιο άλλο, κ.ο.κ. Υπάρχει και η δυνατότητα της auto-executable εντολής. Για να φορτώσουμε το source file χρησιμοποιούμε την εντολή consult στο prompt: (2)?- consult(xrwma_malliwn). Τώρα η Prolog είναι έτοιμη να «ακούσει» τις ερωτήσεις μας, σχετικά με τις δηλώσεις που έχουμε κάνει στο πρόγραμμα «xrwma_malliwn». Παρατηρούμε το ερωτηματικό (?-) του prompt. Για να δούμε το πρόγραμμα που έχουμε φορτώσει στη μνήμη, χρησιμοποιούμε την εντολή listing. Aν μας ενδιαφέρει μία μόνο συνάρτηση, μπορούμε να περιορίσουμε τα αποτελέσματα. Για παράδειγμα, αν μας ενδιαφέρει μόνο το κατηγόρημα «ξανθός»: (3)?- listing(ξανθος). Για να λάβουμε την αναμενόμενη απάντηση: (4) ξανθος(κωστας). ξανθος(νικος). true. 35

Τι τύπου ερωτήσεις μπορούμε να κάνουμε, σχετικές με αυτό το απλό πρόγραμμα; Μπορούμε κατ'αρχάς να επαληθεύσουμε τις δηλώσεις που έχουμε κάνει: (5)?- ξανθος(κωστας). Για να πάρουμε την απάντηση: (6) true. Αν βέβαια ρωτήσουμε: (7)?- καστανος(κωστας). Θα πάρουμε την απάντηση: (8) false. 3.2.2 Λογικοί Τελεστές Η Prolog επιτρέπει τους λογικούς τελεστές ','(AND), ';'(OR). Πρόκειται για τη λογική σύζευξη και διάζευξη αντίστοιχα. Για παράδειγμα, η λογική σύζευξη δουλεύει ως εξής: (9)?- ξανθος(νικος), ξανθος(κωστας). true. Αντίστοιχα δουλεύει και η διάζευξη: (10)?- ξανθος(κωστας); καστανος(κωστας). true. Στο (9), η ερώτησή μας έχει τη σημασία: και ο Νίκος και ο Κώστας είναι ξανθοί. Στο (10), ο 36

Κώστας πρέπει να είναι είτε ξανθός είτε καστανός. Είναι σημαντικό να τονίσουμε δύο πράγματα σε αυτό το σημείο. Πρώτον, είναι σημαντικό να μην ξεχνάμε ποτέ ότι η Prolog δεν καταλαβαίνει τη σημασία των κατηγορημάτων «ξανθός», «καστανός» ή των ονομάτων λχ Κώστας. Θα μπορούσαμε να τα αντικαταστήσουμε με κάποιες ακολουθίες συμβόλων που δε σημαίνουν απολύτως τίποτε. Η συμβολοσειρά «lkjhozp», που δε σημαίνει τίποτε, μπορεί να σημαίνει για την Prolog όσα και η συμβολοσειρά «ξανθος». Επομένως, αφού η λέξη «ξανθός» δεν έχει κανένα νόημα για την Prolog, θα μπορούσε να ισχύει σε κάποιο πρόγραμμα, ο Κώστας να είναι εξίσου καστανός, οσο και ξανθός! Είναι κάτι που δεν αποκλείει η λογική. Δεύτερον, η Prolog απαντά ως εξής: Αν κάτι το γνωρίζει, απαντά true, δηλαδή: «Η πρόταση είναι αληθής». Αν δεν το γνωρίζει, απαντά false: (11)?- ξανθος(μιχαλης). false. Στο (11), για παράδειγμα, η Prolog δεν απαντά false βάσει κάποιου συλλογισμού, όπως: «Γνωρίζω ότι ο Μιχάλης είναι καστανός, άρα δεν είναι ξανθός». Η Prolog δεν καταλαβαίνει τέτοιες έννοιες. Απλά, προσπαθεί να ικανοποιήσει την λογική πρόταση: ξανθος(μιχαλης) -> true. Εφόσον δεν έχει κάποια τέτοια σχετική δήλωση στη μνήμη, επιστρέφει false. Σύμφωνα με τα παραπάνω εξηγείται και το παρακάτω παράδειγμα: (12)?- ξανθος(γιωργος). false. Η Prolog δεν ξέρει αν ο Γιώργος είναι ξανθός ή όχι, αφού δεν υπάρχουν καταχωρήσεις στο πρόγραμμα που έχουμε φορτώσει που αφορούν κάποιον Γιώργο. Επομένως η απάντηση της Prolog δε σημαίνει «ο Γιώργος δεν είναι ξανθός». Σημαίνει «δεν ξέρω αν ο Γιώργος είναι ξανθός, αφού δε γίνεται να ικανοποιήθει η συνάρτηση ξανθος(γιωργος) -> true». Ένας ακόμη χρήσιμος λογικός τελεστής είναι αυτός της άρνησης(not). Με αυτόν μπορούμε να κάνουμε ερωτήσεις όπως: 37