LECTURE 1 Context Free Phrase Structure Grammars (CFPSG) and Constituency CONTENTS 1. Two trends in the study of linguistic knowledge...1 2. The Symbolic Approach: Knowledge representation and formal languages...1 3. Context Free (CF) Grammars...1 4. Diagnostics for phrases...2 5. Application...3 6. Homework...4 7. References...5 1. Two trends in the study of linguistic knowledge A Symbolic approaches Formal languages and inferencing B Quantitative approaches Apply measurements on texts and do statistical analysis. Measurements may be applied on basic information such as n grams. However, they often apply on symbolic information (grammatical tags, syntactic tags etc) extracted with both quantitative and symbolic processing. 2. The Symbolic Approach: Knowledge representation and formal languages A formal language is a set of words, that is, finite strings of letters, symbols, or tokens that are defined in the language. The set from which these are taken is the alphabet over which the language is defined. A formal language is often defined by means of a formal grammar. Formal languages are often used as the basis for richer constructs endowed with semantics. Example Vocabulary {N, Det, Adj, NP} Formal Grammar NP Det (Adj) N (NP) Strings in the language { Det N, Det N NP, Det Adj N, Det Adj N NP, Det N Det N,...} A number of formal languages have been used in Linguistics: the language of transformational grammar/of Lexical Functional Grammar etc. Those languages are still evolving. Their alphabet, grammar and semantics are under constant scrutiny if evolution had stopped then the study of natural languages would have been concluded, but this has a long way to go! 3. Context Free (CF) Grammars 1
Most of the formal languages used in Linguistics are Context Free ones. CF languages are described by rules of the general type (1), where A is a non terminal symbol and γ a string consisting of terminal and non terminal symbols. (1) A γ A terminal symbol can not appear in the left hand of the rule (1) while a non terminal one can. Rules conforming to (1) are NP Det N VP V NP NP, VP are non terminal symbols. Det, N, V are terminal symbols. Central is the notion of part of speech (also a word class, a lexical class, or a lexical category): a linguistic category of lexical items that is generally defined by the syntactic or morphological behaviour of the lexical item in question. Most times, but not always, phrases develop around some predicate that is called the HEAD of the phrase and can be classified under one of the parts of speech that are available in the corresponding language. Sentences, however, have no lexical head. Table 1 gives an overview of the most common phrases and their names in Greek (EL) and English (EN). Part of Speech Phrase (EL) ABBR Part of Speech Phrase (EN) ΑΒΒR (EL) (EN) Όνομα Ονοματική Φράση ΟΦ Noun Noun Phrase ΝΡ Ρήμα Ρηματική Φράση ΡΦ Verb Verb Phrase VP Επίθετο Επιθετική Φράση ΕΦ Adjective Adjectival Phrase AP Πρόθεση Προθετική Φράση ΠΡΟΘΦ Preposition Prepositional PP Phrase Επίρρημα Επιρρηματική ΕπιρΦ Adverb Adverbial Phrase AdvP Φράση Πρόταση Π Sentence S Table 1. Parts of speech and corresponding phrases in Greek (EL) and English (EN) 4. Diagnostics for phrases (1) Distribution: the same string of words (morphology does not matter) can fulfill different grammatical functions. Subject Οι ποδοσφαιριστές μπήκαν στο γήπεδο The footballers entered the football pitch. Object Τα πλήθη καλωσορίζουν τους ποδοσφαιριστές The crowds welcome the footballers. 2
Phrase introduced with a preposition Έχουν γραφτεί τόσα πολλά για τους ποδοσφαιριστές So many things have been written about the footballers. (2) Substitution: A phrasal constituent can be replaced by pronouns. Οι ποδοσφαιριστές μπήκαν στο γήπεδο Ποιοι μπήκαν στο γήπεδο? The footballers entered the football pitch Who entered the football pitch? Τα πλήθη καλωσορίζουν τους ποδοσφαιριστές Ποιους καλωσορίζουν τα πλήθη? The crowds are welcoming the footballers Whom are the crowds welcoming? Έχουν γραφτεί πολλά για τους ποδοσφαιριστές Για ποιους έχουν γραφτεί πολλά? So many things have been written about the footballers About whom have so many things been written? Βαριέμαι την Υπολογιστική Γλωσσολογία I am bored of Computational Linguistics. Το ίδιο και εγώ So am I. (3) Coordination ( caution!!!) Θέλω [μακαρονάδα και παγωτό]. I would like [spaghetti and ice cream]. *Θέλω [μακαρονάδα και έρχεται ο Γιάννης]. * I would like [spaghetti and John is coming]. Πήγα [στην αγορά και στην θάλασσα]. I went [to the market and to the sea]. *Πήγα [στην αγορά και ντομάτες]. *I went [to the market and tomatoes]. However, coordination is possible across non phrasal constituents so this is a sufficient but not a necessary condition: Έδωσα [χρήματα] [στην Ελένη] και [την αγάπη μου] [στον Φάνη]. I gave [money] [to Helen] and [my love] [to Fanis]. 5. Application In the Greek text below there are several NPs (phrases built around a noun). In Table 2, some of those NPs are listed in the leftmost column. In the next columns are listed the diagnostics used to identify them. Μέσα στην ένταση και την τρέλα των στιγμών γίνονται δύο μεγάλα λάθη. Το πρώτο είναι η ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων, γενικώς και αορίστως. NPs Distribution Substitution Coordination 3
Μέσα στην ένταση και την τρέλα των στιγμών γίνονται δύο μεγάλα λάθη δαιμονοποίηση των δημοσίων υπαλλήλων Μέσα στην ένταση και την τρέλα των στιγμών γίνονται δύο μεγάλα λάθη. Έκανα δύο μεγάλα λάθη. Έστρεψαν την προσοχή τους στα δύο μεγάλα λάθη αγνοώντας τα μικρότερα. Το πρώτο είναι δαιμονοποίηση των δημοσίων υπαλλήλων, γενικώς και αορίστως. Αποδέχονται εύκολα την ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων, γενικώς και αορίστως. Τί γίνεται μέσα στην τρέλα και ένταση των στιγμών? Τί έκανες? Σε τί έστρεψαν την προσοχή τους? Ποιο ειναι το πρώτο? *Ποιο είναι το πρώτο, γενικώς και αορίστως? Τί αποδέχονται εύκολα? Μέσα στην ένταση και την τρέλα των στιγμών γίνονται δύο μεγάλα λάθη και δύο επικίνδυνες αβλεψίες. Το πρώτο είναι η ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων, γενικώς και αορίστως και η πάνδημη κατακραυγή τους. δαιμονοποίηση των δημοσίων υπαλλήλων δαιμονοποίηση των δημοσίων υπαλλήλων Οι δημόσιοι υπάλληλοι δαιμονοποιούνται δαιμονοποίησή τους Ποιανών δαιμονοποίηση...? Ποιοι δαιμονοποιούνται? δαιμονοποίηση των δημοσίων υπαλλήλων και των ιδιωτικών μεταφορέων Δαιμονοποιούν τους δημόσιους υπαλλήλους. Ποιους δαιμονοποιούν? Table 2. NPs and the identification diagnostics Note on Table 2. Substitution. Actually, the application of the criterion says that the set of words in question is a phrasal constituent in a given environment. A phrasal constituent is a structured set of words that plays a certain syntactic role in a phrase as such. The substitution criterion actually shows that a particular set of words fills a certain syntactic slot in the phrase. 6. Homework 1. In the text below underline the Noun Phrases (NPs). NPs are phrases that are built around a noun. However, NPs may contain many more things than a noun: they may contain relative clauses, other types of subordinated clause, a series of genitives etc 2. Create a table with as many columns and as many lines as necessary. In the leftmost column list the NPs you identified in the second paragraph of the text (the yellow one). In the remaining columns indicate the diagnostics you used to identify each case. Take Table 2 as an example H KAΘΗΜΕΡΙΝΗ Hμερομηνία : 28 09 11 Του Αλεξη Παπαχελα Η ανεξέλεγκτη δαιμονοποίηση 4
Μέσα στην ένταση και την τρέλα των στιγμών γίνονται δύο μεγάλα λάθη. Το πρώτο είναι η ανεξέλεγκτη δαιμονοποίηση των δημοσίων υπαλλήλων, γενικώς και αορίστως. Ωστόσο είναι άλλο πράγμα να μιλάμε για την ανάγκη μείωσης του δημόσιου τομέα και άλλο να τα βάζουμε προσωπικά με όποιον έτυχε να πάρει σύνταξη στα 50 ή να προσελήφθη σε μία ΔΕΚΟ χωρίς ιδιαίτερα προσόντα. Πηγαίνετε λίγο πίσω, όχι και πολύ πίσω, και σκεφθείτε πώς δούλευε το σύστημα. Ενας Ελληνας πολίτης τελείωνε μια σχολή και είχε τη βεβαιότητα ότι θα προσληφθεί στο Δημόσιο, γιατί «έτσι γινόταν». Ο άνθρωπος δεν είχε ιδέα ούτε για τη... δυναμική του χρέους ούτε για τίποτε άλλο. Ακολουθούσε πιστά τους κανόνες και τις παραδόσεις μιας κοινωνίας και ενός πολιτικού συστήματος. Αίφνης, ο εν λόγω άνθρωπος νιώθει ότι έχασε το έδαφος κάτω από τα πόδια του. Εχει κάνει τους λογαριασμούς του και τα κουμάντα του με βάση την αρχική «σύμβαση» με το πολιτικό σύστημα. Ηταν βέβαιος ότι θα έχει μια αξιοπρεπή σύνταξη, ότι θα μπορεί να πληρώνει τα φροντιστήρια των παιδιών του και τα κοινόχρηστα, χωρίς να σκέφτεται πότε θα ανάψει το καλοριφέρ. Υπάρχουν βεβαίως και οι εξαιρέσεις, όπως οι 50άρηδες συνταξιούχοι ΔΕΚΟ με μεγάλη σύνταξη που δουλεύουν και σε μια «μαύρη» εργασία... Δεν είναι όμως η πλειοψηφία. Είναι λάθος να δαιμονοποιούμε αυτούς τους ανθρώπους επειδή βρήκαν μια δουλειά όπως έκανε και ο υπόλοιπος κόσμος. 7. References Δήμητρα Θεοφανοπούλου Κοντού. 1989. Μετασχηματιστική Σύνταξη. Από την θεωρία στην πράξη. Αθήνα: Εκδόσεις Καρδαμίτσα Dalrymple, Mary. 2002. Syntax and Semantics 34: Lexical Functional Grammar. Academic Press 5