Επίκουρος Καθηγητής Ιωάννης Παραβάντης Τµήµα ιεθνών και Ευρωπαϊκών Σπουδών ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ Φεβρουάριος 2010 ΚΕΦΑΛΑΙΟ 1 Εισαγωγή στη Θεωρία Παιγνίων 1. Εισαγωγικοί όροι Η Θεωρία Παιγνίων (game theory) είναι διασκεδαστική και εύκολη αλλά απαιτεί να εξασκήσουµε εγκεφαλικούς µύες που συνήθως δεν ασκούνται πολύ στη ζωή µας. Επίσης, η Θεωρία Παιγνίων είναι γεµάτη µε όρους, που πρέπει να αναφέρουµε και να εξηγήσουµε ώστε να µπορούµε να συνεννοηθούµε. Υπάρχουν τρεις βασικές συνιστώσες σε κάθε παίγνιο (game): 1. παίκτες (players) 2. κινήσεις (moves) και 3. ανταµοιβές ή οφέλη ή κέρδη (payoffs). Οι παίκτες που συµµετέχουν σε ένα παίγνιο συµπεριφέρονται ορθολογικά (rational behavior) δηλαδή κινούνται έτσι ώστε να µεγιστοποιήσουν την ανταµοιβή τους. Υπάρχουν δυο βασικές κατηγορίες παιγνίων: 1. τα παίγνια ταυτόχρονων κινήσεων (simultaneous move games), που λέγονται και στατικά παίγνια (static games) και 2. τα παίγνια διαδοχικών κινήσεων (sequential move games), που λέγονται και δυναµικά παίγνια (dynamic games). Όµως, καθώς προχωρούµε σε πιο προχωρηµένες εφαρµογές της Θεωρίας Παιγνίων, θα δούµε ότι η διάκριση ανάµεσα σε αυτές τις δυο κατηγορίες είναι όλο και πιο ασθενής. Για την ανάλυση των παιγνίων ταυτόχρονων κινήσεων χρησιµοποιούµε τους πίνακες ανταµοιβής (payoff matrices), που αναφέρονται και ως κανονικές φόρµες (normal forms). Για την ανάλυση των παιγνίων διαδοχικών κινήσεων χρησιµοποιούµε τα δένδρα παιγνίων (game trees), που αναφέρονται και ως εκτενείς φόρµες (extensive forms). Ένα παίγνιο µπορεί να παίζεται µόνο µια φορά ή να είναι επαναλαµβανόµενο (repeated). Πολλά παίγνια στις διεθνείς σχέσεις είναι επαναλαµβανόµενα. Αναφερόµενοι στις σχέσεις µεταξύ των παικτών, τα παίγνια µπορεί να είναι συνεργατικά (cooperative) ή µη συνεργατικά (non-cooperative). Σε µερικά παίγνια, οι παίκτες µπορεί να έχουν κοινά συµφέροντα (shared interests), σε άλλα όχι. Τέλος, σε µερικά παίγνια µπορεί οι παίκτες να διαθέτουν τις ίδιες πληροφορίες (common information) ενώ σε άλλα όχι. Έχοντας εξοικειωθεί µε τους βασικούς όρους της θεωρίας παιγνίων, ας ρίξουµε τώρα µια σύντοµη µατιά στην ιστορία τους. 1
2. Σταθµοί στην ιστορική αναδροµή «Βίβλος» στο γνωστικό αντικείµενο της Θεωρίας Παιγνίων είναι το φηµισµένο βιβλίο «Theory of Games and Economic Behavior», των µαθηµατικών John von Neumann και Oscar Morgenstern, που δηµοσιεύτηκε το 1944 (και ανατυπώθηκε 6 φορές µέχρι το 1955): Από τότε, η θεωρία παιγνίων έχει επεκταθεί πολύ πέραν των ορίων της µαθηµατικής επιστήµης. Αυτό οφείλεται κυρίως στη συµβολή του John Nash, που έγινε κυρίως στις αρχές της δεκαετίας του 1950. Η ζωή του John Nash αποτυπώθηκε στη γνωστή κινηµατογραφική ταινία «A Beautiful Mind», όπου τον Nash υποδύθηκε ο ηθοποιός Russell Crowe, αν και µε αρκετές αποκλίσεις από την ιστορική πραγµατικότητα και επιστηµονική αλήθεια. 2
Στην δεκαετία που άρχισε το 1970, η θεωρία παιγνίων µετατράπηκε και σε εργαλείο ανάλυσης στρατηγικών προβληµάτων που απαντώνται στους χώρους των οικονοµικών (economics), της πολιτικής (politics), των διεθνών σχέσεων (international relations), των επιχειρήσεων (business) ακόµα και της βιολογίας (biology), όπως θα δούµε όταν εξετάσουµε σε µελλοντική ενότητα τα εξελικτικά παίγνια (evolutionary games). Μια πολύ σηµαντική αναφορά υπήρξε πρωτοπόρα στις εξελίξεις αυτές, ειδικά στην χρήση της Θεωρίας Παιγνίων στις διεθνείς σχέσεις: το βιβλίο του Thomas Schelling, «The Strategy of Conflict», που δηµοσιεύτηκε το 1960 και επανεκδόθηκε το 1980: Για το βιβλίο του Schelling θα µιλήσουµε σε ειδική ενότητα. Στο σηµείο αυτό αξίζει να αναφέρουµε ότι ο Schelling είναι ο εφευρέτης του όρου κρηµνοβασία ή ακροβασία (brinkmanship) που αναφέρεται στην τέχνη του να φτάνεις κάποιον στα άκρα (ώστε να εκµαιεύσεις µια ευνοϊκή για σένα έκβαση), το να παίζεις δηλαδή µε την φωτιά, όπως συνέβη στην κρίση της Κούβας (Cuban missile Crisis), στην οποία αναφερόταν ο Schelling. Ας εξετάσουµε τώρα περισσότερο τη φύση και το πεδίο εφαρµογών της θεωρίας παιγνίων. 3. Παίγνια και στρατηγικές Έχει γραφεί χαρακτηριστικά ότι η Θεωρία Παιγνίων είναι η µελέτη συγκρούσεων (study of conflict) όπως επίσης ότι ο ανταγωνισµός είναι η πιο ενδιαφέρουσα δραστηριότητα στην οποία ασχολούνται οι άνθρωποι («the most interesting thing that humans do is compete»). Έχει επίσης αναφερθεί ότι η Θεωρία Παιγνίων εξετάζει τη συµπεριφορά (αργότερα, που θα καταλαβαίνουµε την έννοια αυτού του όρου, θα λέµε «στρατηγικές επιλογές») διαφόρων οµάδων (parties) που συµµετέχουν σε µια απόφαση, όπου οι οµάδες δεν διαθέτουν απαραίτητα τις ίδιες πληροφορίες ούτε έχουν τους ίδιους στόχους (objectives). Σε τέτοιες περιπτώσεις, όπου είναι χρήσιµη η παιγνιοθεωρητική (game theoretic) προσέγγιση, κατά κανόνα οι πράξεις µιας οµάδας έχουν επιπτώσεις σε όλες τις άλλες οµάδες το πώς ακριβώς γίνεται αυτό µπορεί να µην είναι γνωστό. Αυτή η στρατηγική αλληλεξάρτηση (strategic interdependence) και η διαθεσιµότητα (ή µη των ίδιων) πληροφοριών (information) αποτελούν κρίσιµα συστατικά της Θεωρίας Παιγνίων. 3
Συχνά ακούµε τον όρο παίγνια µηδενικού αθροίσµατος (zero sum games), που στην πραγµατικότητα είναι παίγνια σταθερού αθροίσµατος (constant sum games) µε άθροισµα µηδέν. Σε παίγνια µηδενικού αθροίσµατος, τα συµφέροντα του ενός παίκτη είναι εκ διαµέτρου αντίθετα µε τα συµφέροντα των άλλων παικτών. Παράδειγµα παιγνίου µηδενικού αθροίσµατος είναι το σκάκι, όπου δεν γίνεται να κερδίσουν και οι δυο παίκτες εάν κερδίσει ο ένας, ο άλλος θα χάσει. Όµως, στα περισσότερα παίγνια που συναντάµε στην καθηµερινή ζωή, την οικονοµία, τις επιχειρήσεις, την πολιτική και τις διεθνείς σχέσεις, τα πράγµατα δεν είναι µαύρα-άσπρα δηλαδή τα παίγνια δεν είναι σταθερού αθροίσµατος. Υπάρχουν ζώνες κοινού συµφέροντος αλλά και κοινών αντιθέσεων και διαφορών. Έτσι, υπάρχουν συνδυασµοί αµοιβαία επωφελών αλλά και αµοιβαία επιζήµιων στρατηγικών. Ειδικά στον κόσµο των επιχειρήσεων, η εφαρµογή της Θεωρίας Παιγνίων σχετίζεται µε τον γνωστό όρο «co-opetition», δηλαδή συνεργασία (cooperation) και ανταγωνισµός (competition) µαζί. Όπως γράφουν χαρακτηριστικά οι Bradenburger και Nalebuff (1996), όταν οι επιχειρήσεις δηµιουργούν ή αυξάνουν το µέγεθος µια πίτας (π.χ. µιας αγοράς) τότε συνεργάζονται. Όταν έλθει η ώρα να µοιράσουν την πίτα, ανταγωνίζονται! Έτσι λοιπόν, η Θεωρία Παιγνίων είναι µια τεχνική που χρησιµοποιείται για την ανάλυση περιπτώσεων όπου για δυο (ή περισσότερους) συµµέτοχους (παίκτες, που µπορεί να είναι φυσικά πρόσωπα ή οµάδες), το αποτέλεσµα ή η έκβαση (outcome) µιας ενέργειας (action) εξαρτάται όχι µόνο από τον παίκτη που λαµβάνει την ενέργεια αλλά και από τις δράσεις του άλλου (ή των άλλων) παικτών! Σε τέτοιες περιπτώσεις, τα σχέδια (plans) ή οι στρατηγικές (strategies) ενός παίκτη εξαρτώνται από τις προσδοκίες (expectations) που έχει ο παίκτης για το τι θα κάνουν οι άλλοι παίκτες! Αυτή η εξάρτηση των αποφάσεων ενός παίκτη από τις αποφάσεις των άλλων παικτών, ονοµάζεται στρατηγική αλληλεξάρτηση (strategic interdependence) και τέτοιες καταστάσεις ονοµάζονται στρατηγικά παίγνια (strategic games) ή απλά παίγνια. Στα στρατηγικά παίγνια οι παίκτες έχουν επίγνωση αυτής της αλληλεξάρτησης! Η νοητική αυτή διεργασία, όπου οι παίκτες διαθέτουν περιορισµένες πληροφορίες για τις ενέργειες στις οποίες προτίθενται να προβούν οι άλλοι παίκτες και, ως εκ τούτου, είναι υποχρεωµένοι να προβούν σε (εύλογες) εικασίες, ονοµάζεται στρατηγική σκέψη (strategic thinking) ή και τακτική αλληλεπίδραση (tactical interaction). Η στρατηγική σκέψη αποτελεί το χαρακτηριστικό γνώρισµα της Θεωρίας Παιγνίων και µας φέρνει κοντά στo έργο και τα γραπτά του Schelling. Ας εξετάσουµε όµως µερικά συγκεκριµένα παραδείγµατα τέτοιων παιγνίων. 4. Παραδείγµατα παιγνίων Οι ανθρώπινες σχέσεις και οι δραστηριότητες κοινωνίας και οικονοµίας είναι γεµάτες από παραδείγµατα στρατηγικών παιγνίων. Αρχίζουµε µε παραδείγµατα από την προσωπική ζωή: Τα µέλη µιας οικογενείας διαφωνούν για τον καταµερισµό των εργασιών σε ένα νοικοκυριό. Ένα ζευγάρι πηγαίνει, στο πρώτο τους ραντεβού, σε ένα αρκετά καλό εστιατόριο. Ο καθένας από τους δυο προβληµατίζεται για το πώς να ντυθεί: καλά ή πρόχειρα; Συνεχίζουµε µε παραδείγµατα από την οικονοµία και τις επιχειρήσεις: υο µεγάλες εταιρείες (που λειτουργούν ολιγοπωλιακά σε µια αγορά) πρέπει να αποφασίσουν για την τιµή και την παραγόµενη ποσότητα των προϊόντων τους. 4
Μια εταιρεία εξετάζει το ενδεχόµενο εισόδου σε µια νέα αγορά, όπου οι υπάρχουσες εταιρείες µπορεί να προσπαθήσουν να την εµποδίσουν. Οι υπεύθυνοι χάραξης της οικονοµικής πολιτικής µιας χώρας (economic policy makers) µπορεί να εξετάζουν την επιβολή δασµών (tariffs) στις εισαγωγές (imports). Ακολούθως αναφέρουµε παραδείγµατα από τον αθλητισµό: Στο ένα ποδοσφαιρικό αγώνα, ένας παίκτης και ο τερµατοφύλακας της αντίπαλης οµάδας βρίσκονται αντιµέτωποι στη χτύπηµα ενός πέναλτι. Εάν αναφερόµαστε στο χτύπηµα πολλών πέναλτι µετά το τέλος ενός αγώνα και την εξάντληση της παράτασης, το παίγνιο γίνεται επιλαµβανόµενο (αν και οι παίκτες δεν είναι ίδιοι). ιαχειριστές (managers) και διοικήσεις οµάδων εµπλέκονται σε διαπραγµατεύσεις για την µεταγραφή παικτών. Γενικά, όπου ακούτε για διαπραγµατεύσεις υπάρχουν παίγνια. Ένας παίκτης του τένις προσπαθεί να αποφασίσει για το είδος και κατεύθυνση του επόµενου σερβίς. Και κλείνουµε µε µερικά παραδείγµατα από την πολιτική επιστήµη και τις διεθνείς σχέσεις: Ένας κακοποιός που έχει συλληφθεί και ανακρίνεται από την αστυνοµία, µπορεί να σκέφτεται είτε να οµολογήσει είτε να κρατήσει το στόµα του κλειστό, σε σχέση µε το τι κάνει ο συνεργός του που ανακρίνεται στο διπλανό δωµάτιο! Αυτό είναι το περίφηµο παίγνιο των φυλακισµένων (prisoner s dilemma), που είναι ένα από τα σηµαντικότερα «στοιχειακά» (atomic) παίγνια της θεωρίας παιγνίων, όπως τα αποκαλεί ο Stevens (2008), και θα εξεταστεί σε ειδική ενότητα. Αντίπαλοι σε πόλεµο εξετάζουν το ενδεχόµενο συνθηκολόγησης, ώστε να επικρατήσει ειρήνη. Αντίθετα, δυο χώρες µπορεί να εξετάζουν το ενδεχόµενο πολέµου. Στα περισσότερα από τα παραπάνω παραδείγµατα συναντούµε τα χαρακτηριστικά της στρατηγικής σκέψης. Ένας παίκτης πρέπει να σκεφτεί για την επιπτώσεις που µπορεί να έχουν οι ενέργειές του στους άλλους παίκτες. Οι άλλοι παίκτες κάνουν ανάλογες σκέψεις, την ίδια στιγµή! Όπως µπορείτε να φανταστείτε, η ανάλυση στρατηγικών καταστάσεων είναι περίπλοκη (complex) υπόθεση. Για τον λόγο αυτό χρειαζόµαστε δυνατά αναλυτικά εργαλεία όπως αυτά που θα µας διδάξει η θεωρία παιγνίων. 5. Ορθολογική συµπεριφορά Ας εµβαθύνουµε τώρα λίγο την ανάλυσή µας, ώστε να καταλάβουµε καλύτερα τη φύση ενός παιγνίου. Ένα βασικό συστατικό των παιγνίων είναι οι κανόνες (rules). Οι κανόνες ενός παιγνίου εµπεριέχουν πληροφορίες για την ταυτότητα (identity) των παικτών, τη γνώση (knowledge) των παικτών για το παιχνίδι και τους κανόνες του, τις πιθανές κινήσεις τους (moves) και την ανταµοιβή (payoff) που αντιστοιχεί σε κάθε πιθανή κίνηση. Στο σηµείο αυτό διευκρινίζουµε ότι οι στρατηγικές (strategies) εµπεριέχουν µια ή περισσότερες κινήσεις (moves). Σε παίγνια ταυτόχρονων κινήσεων που εξετάζονται µε κανονικές φόρµες (δηλαδή πίνακες ανταµοιβών, κινήσεις και στρατηγικές ταυτίζονται. Σε παίγνια διαδοχικών κινήσεων, που εξετάζονται µε εκτενείς φόρµες, οι στρατηγικές συνήθως περιέχουν πολλές κινήσεις. Επίσης αναφέρουµε ότι η έννοια της επίλυσης ενός παιγνίου ταυτίζεται µε την εύρεση του σηµείου ισορροπίας (equilibrium) αυτού, δηλαδή της πιθανότερης έκβασης του παιγνίου. Έτσι λοιπόν εφεξής όταν λέµε ότι θα επιλύσουµε ένα παίγνιο εννοούµε ότι θα βρούµε το σηµείο ισορροπίας του. 5
Όπως προαναφέραµε και φάνηκε από τα παραδείγµατα που εξετάσαµε, οι παίκτες µπορεί να είναι φυσικά πρόσωπα, οµάδες, οικογένειες, εταιρείες, γκρουπ ειδικών συµφερόντων που ασκούν πίεση στους λήπτες αποφάσεων (pressure groups), κυβερνήσεις (governments) ή ακόµα και ευφυή ζώα (intelligent animals). Ειδικά στην περίπτωση των ζώων, οι κινήσεις και οι στρατηγικές επιλέγονται όχι γιατί τα ζώα δρουν ορθολογικά αλλά γιατί είναι γενετικά προγραµµατισµένα. Αυτές τις έννοιες θα τις εξετάσουµε αναλυτικότερα στα εξελικτικά παίγνια. Οποιαδήποτε σκεπτόµενη οντότητα (thinking entity) που έχει την ικανότητα ορθολογικής συµπεριφοράς (rational behavior) µπορεί να συµµετέχει σε στρατηγικά παίγνια ως παίκτης. Όµως, οι παίκτες δεν συµπεριφέρονται πάντα ορθολογικά. Για παράδειγµα, δυο ερωτευµένοι έφηβοι, δεν παίζουν το παίγνιο των ραντεβού (dating game) µε ορθολογικό τρόπο. Ούτε ο Χίτλερ και ο Στάλιν ήταν ορθολογικοί παίκτες στις µάχες του ευτέρου Παγκοσµίου Πολέµου. Σε πολλά παίγνια, που έχουν οικονοµικό χαρακτήρα, η ανταµοιβή µετριέται σε χρήµα (π.χ. ευρώ ή δολάρια). Γενικά όµως, η ανταµοιβή µετριέται σε αόριστες µονάδες που λέγονται «utils» και µετράνε τη χρησιµότητα (utility) κάθε επιλογής. Έτσι και αλλιώς, στα περισσότερα παίγνια ενδιαφέρει η σχετική ιεράρχηση των εναλλακτικών επιλογών και όχι οι απόλυτες τιµές, για παράδειγµα, κατά πόσον µια έκβαση που φέρει ανταµοιβή ίση µε 3 είναι τρεις φορές πιο χρήσιµη από µια άλλη που χαρακτηρίζεται από ανταµοιβή ίση µε ένα. Λέµε χαρακτηριστικά ότι η ανταµοιβή είναι ιεραρχική (ordinal) µεταβλητή. 6. Ανακεφαλαίωση Ως ανακεφαλαίωση αυτών που έχουµε συζητήσει µέχρι τώρα, στα επόµενα σχήµατα εξετάζουµε πως ορίζει ένα σχετικό πανεπιστηµιακό βιβλίο (Carmichael, 2005) τους βασικούς όρους της θεωρίας παιγνίων. 6
Έχοντας εξετάσει τις βασικές έννοιες της θεωρίας παιγνίων, σε επόµενες ενότητες θα εξετάσουµε αναλυτικότερα αφενός µεν τα παίγνια ταυτόχρονων κινήσεων (simultaneous move games), που λέγονται και στατικά παίγνια (static games) αφετέρου δε τα παίγνια διαδοχικών κινήσεων (sequential move games), που λέγονται και δυναµικά παίγνια (dynamic games). Βιβλιογραφία Bradenburger, A.M. and B. Nalebuff (1996): Co-opetition, Currency-Doubleday. Carmichael, F. (2005): A Guide to Game Theory, Prentice Hall Financial Times. Dixit, A.K. and B.J. Nalebuff (2008): The Art of Strategy A Game Theorist's Guide to Success in Business and Life, Norton Dixit, A. and S. Skeath (2004): Games of Strategy, 2nd edition, W.W. Norton and Company. Schelling, T.C. (1980): The Strategy of Conflict, Harvard University. Stevens, S.P. (2008): Games People Play: Game Theory in Life, Business and Beyond, Parts I and II, The Teaching Company. Van Neumann, J. and O. Morgenstern (1944): Theory of Games and Economic Behavior, Princeton University Press. 7