Κεφάλαιο 4 Στο προηγούµενο κεφάλαιο ορίσαµε την ισορροπία κατά Nash και είδαµε ότι µια ισορροπία κατά Nash είναι: (α) ένα διάνυσµα από στρατηγικές, έτσι ώστε δεδοµένων των υπολοίπων στρατηγικών, ο παίκτης που εξετάζουµε κάνει το καλύτερο δυνατό, όταν ακολουθήσει την στρατηγική που υπάρχει στο διάνυσµα. (β) ένα διάνυσµα στρατηγικών, τέτοιο ώστε κανείς από τους παίκτες δεν έχει κίνητρο να αλλάξει την συµπεριφορά του, δεδοµένου ότι οι υπόλοιποι παίκτες ακολουθούν τις στρατηγικές που λεει αυτό το διάνυσµα /το µερίδιο τους. Ας προσπαθήσουµε τώρα να κάνουµε µια σύγκριση της ισορροπίας κατά Nash, και της ισορροπίας σε κυρίαρχες στρατηγικές έτσι ώστε να δούµε σε τι διαφέρουν. Ας υποθέσουµε ότι έχουµε δυο παίκτες: [ Π 1 (S 1, S 2 ), Π 2 (S 1, S 2 )] όπου Π 1 (S 1, S 2 ) είναι το αποτέλεσµα του παίκτη 1, όταν ο παίκτης 1 ακολουθεί την στρατηγική S 1 και ο παίκτης 2 την S 2. Όµοια ισχύει και για το Π 2 (S 1, S 2 ). Ας δούµε τώρα πως ορίζεται µια ισορροπία σε αυστηρά κυρίαρχες στρατηγικές. Μια ισορροπία σε αυστηρά κυρίαρχες στρατηγικές έχει τις εξής ιδιότητες: Π 1 (S 1 *, S 2 ), > Π 1 (S 1, S 2 ), S 1, S 2 Π 2 (S 1, S 2 *), > Π 2 (S 1, S 2 ), S 1, S 2 όπου (S 1 *, S 2 *) ισορροπία σε αυστηρά κυρίαρχες στρατηγικές. 41
Τι µας λέει αυτή η σχέση; Τα κέρδη του παίκτη 1 όταν ακολουθεί την στρατηγική S 1 *, είναι µεγαλύτερα από τα κέρδη του όταν ακολουθεί οποιαδήποτε άλλη στρατηγική, και αυτό ανεξάρτητα από την στρατηγική που ακολουθεί ο άλλος παίκτης. ηλαδή για κάθε S 1, S 2. To ίδιο ισχύει και για τον παίκτη 2. Για κάθε στρατηγική του παίκτη 1, η S 2 * δίνει περισσότερα κέρδη στον παίκτη 2 από ότι οποιαδήποτε άλλη στρατηγική S 2. Σηµείωση: Αυτό ισχύει για κάθε S 1, S 2 ακόµα και αν S 1 =S 1 * ή S 2 =S 2 *. Το γεγονός αυτό αποδεικνύει ότι µια ισορροπία σε αυστηρά κυρίαρχες στρατηγικές, είναι και ισορροπία κατά Nash. ΙΣΟΡΡΟΠΙΑ ΚΑΤΑ NASH Το (S 1 *, S 2 *) είναι ισορροπία κατά Nash αν ισχύει ότι: Π 1 (S 1 *, S 2 *) Π 1 (S 1, S 2 *), S 1 Π 2 (S 1 *, S 2 *) Π 2 (S 1 *, S 2 ), S 2 Σηµείωση: Μπορούµε να βάλουµε και ισότητα, διότι δεν είναι ανάγκη να είναι αυστηρή η ισορροπία κατά Nash. Όπως βλέπουµε, ο προσδιορισµός είναι διαφορετικός για κάθε µια σχέση. Το Π 1 (S 1 *, S 2 *) Π 1 (S 1 *, S 2 ), S 1 σηµαίνει ότι αν ο παίκτης 2 ακολουθεί την στρατηγική S 2 * στην ισορροπία κατά Nash τότε το καλύτερο που έχει να κάνει ο παίκτης 1 είναι ν ακολουθήσει την στρατηγική S 1 *. ηλαδή, τα κέρδη του ακολουθώντας την στρατηγική S 1 *, δεδοµένου ότι ο 2 ακολουθεί την στρατηγική S 2 *, είναι µεγαλύτερα από οποιαδήποτε άλλη στρατηγική. Το ίδιο πράγµα ισχύει και για τον παίκτη 2. Το παραπάνω αποτελεί µια µικρή διαφορά που µπορεί να διακρίνει κανείς στις δύο κατηγορίες ισορροπίας. Η ισορροπία σε αυστηρά κυρίαρχες στρατηγικές είναι πολύ πιο απαιτητική σαν ισορροπία από ότι η ισορροπία κατά Nash, διότι ισχύει για κάθε S 1, S 2. 42
Σηµείωση: Οι ορισµοί µπορούν να επεκταθούν για n αριθµό παικτών. Αυτό που εµείς θα πρέπει να κάνουµε είναι να κοιτάζουµε κάθε φορά τα κέρδη ενός παίκτη, δεδοµένου του τι κάνουν οι υπόλοιποι παίκτες. Ας δούµε τώρα ορισµένα παραδείγµατα προκειµένου να διαπιστώσουµε ότι ορισµένες φορές, ο αριθµός των ισορροπιών κατά Nash, είναι µεγαλύτερος από ένα. Στις περιπτώσεις αυτές θα δούµε πως επιλέγουµε την ισορροπία κατά Nash. Επιπλέον µέσα στο πλαίσιο αυτό, θα δούµε ορισµένα παίγνια (παίγνια συντονισµού) όπου η επιλογή της ισορροπίας είναι πιο εύκολη, ενώ σε ορισµένα άλλα που είναι περισσότερο παίγνια ανταγωνισµού η επιλογή µεταξύ των ισορροπιών είναι πιο δύσκολη. Παίγνιο συντονισµού Ας υποθέσουµε λοιπόν ότι έχουµε 2 επιχειρήσεις που αποφασίζουν ταυτόχρονα µεταξύ computer µε µικρές ή µεγάλες δισκέτες. (Β) Μ Μ (Α) Μ 1, 1-1,-1 µ -1,- 1 2, 2 Παρατηρούµε ότι αν οι δυο επιχειρήσεις συντονιστούν στην ίδια δισκέτα πετυχαίνουν κέρδη, ενώ αν διαλέξουν διαφορετικές θα έχουν απώλειες. Είναι προφανές λοιπόν ότι είναι καλύτερο να συντονιστούν σε µικρές δισκέτες, παρά σε µεγάλες (αφού τα κέρδη είναι µεγαλύτερα). Το παίγνιο αυτό είναι παίγνιο συντονισµού διότι και οι δύο εταιρείες έχουν κίνητρο να ακολουθήσουν την ίδια στρατηγική. Ας δούµε τώρα ποιες είναι οι ισορροπίες κατά Nash αυτού του παιγνίου. Αν η εταιρεία Α, ακολουθήσει τη στρατηγική «µεγάλη δισκέτα», η Β έχει σαν καλύτερη απάντηση επίσης τη «µεγάλη δισκέτα». 43
Αν η Α ακολουθήσει τη στρατηγική «µικρή», η καλύτερη απάντηση της Β, είναι να υιοθετήσει και εκείνη τη «µικρή». Με την ίδια λογική, βρίσκουµε ότι αν η Β επιλέξει «µεγάλη δισκέτα» η καλύτερη απάντηση της Α είναι «µεγάλη» και αντίστοιχα για «µικρή», «µικρή». (Β) Μ Μ (Α) Μ 1, 1-1,-1 µ -1,- 1 2, 2 Από τον πίνακα βλέπουµε ότι έχουµε δύο διανύσµατα - δυο συνδυασµούς στρατηγικών που είναι ισορροπίες κατά Nash: (Μ, Μ) και (µ, µ). Το ερώτηµα που γεννάται τώρα είναι µε ποιο τρόπο θα επιλέξουµε µεταξύ των δυο αυτών ισορροπιών; Καταρχήν, µέσα στο παιχνίδι δεν υπάρχει τρόπος, να πούµε ότι η µια ισορροπία είναι πιο ισορροπία από την άλλη. Υπάρχει ένα επιχείρηµα το οποίο είναι εκτός παιγνίου. Το επιχείρηµα αυτό λέγεται focal point (σηµείο εστίασης). Και ειδικά σε αυτό το παιγνίδι είναι ξεκάθαρο πως µπορούνε οι επιχειρήσεις να πετύχουν την καλή ισορροπία. Καλή ισορροπία µε την έννοια ότι το (µ, µ) = (2, 2) δίνει και στους δύο µεγαλύτερα κέρδη από ότι η ισορροπία (Μ, Μ) = (1, 1). Focal point: είναι ένας τρόπος µε τον οποίο συντονίζονται οι παίκτες, έτσι ώστε να πετύχουν κάποια από τις ισορροπίες, όταν υπάρχουν πολλαπλές. Στο παίγνιο αυτό, βλέπουµε ξεκάθαρα ότι και οι δύο θέλουν να πάνε στο (µ, µ) διότι έχουν περισσότερα κέρδη. Οπότε λίγο πολύ µπορούµε να σκεφτούµε ότι κάθε µια εταιρεία ξέρει ότι ο αντίπαλος της έχει τις ίδιες σκέψεις στο µυαλό του, οπότε τελικά και οι δύο θα επιλέξουν 44
ταυτόχρονα το συνδυασµό στρατηγικών (µ, µ) και θα πετύχουν υψηλότερα κέρδη. Η ισορροπία (µ, µ) είναι καλύτερη κατά Pareto από την ισορροπία (Μ, Μ), αφού δίνει µεγαλύτερα κέρδη και στις δύο επιχειρήσεις (χωρίς να χάνει κανείς). Σηµείωση: Όλα τα δεδοµένα του πίνακα είναι γνωστά. Λέµε ότι οι ισορροπίες είναι pareto ranked. ηλαδή, µπορούν να καταταχθούν κατά Pareto όπου το (µ, µ) είναι ψηλότερο σηµείο από το (Μ, Μ). Όταν µετακινηθούµε από το (Μ, Μ) στο (µ, µ) και οι δύο παίκτες έχουν µεγαλύτερα κέρδη χωρίς να χάνει κανείς. Άρα θα επιλέξουν (µ, µ) αλλά όχι επειδή υπάρχει µέσα στο παιγνίδι. Υπάρχει µια άλλη λογική εκτός του παιγνιδιού που λέγεται focal point και η οποία είναι ένας τρόπος συντονισµού. Και ποιος είναι ο συντονισµός στην προκειµένη περίπτωση; Και οι δύο ξέρουν ότι το (µ, µ) είναι καλύτερο και για τις δύο εταιρείες. Οπότε, λίγο πολύ είναι λογικό να συντονιστούν στην καλή ισορροπία. Αυτό είναι ένα παίγνιο συντονισµού. Ας δούµε τώρα ένα παίγνιο που είναι καθαρού συντονισµού. Έστω ότι έχουµε το ίδιο παίγνιο και ότι το µόνο που αλλάζει είναι τα κέρδη στο τετράγωνο (µ, µ). (Β) Μ µ (Α) Μ 1, 1-1,-1 Μ -1,- 1 1, 1 Εδώ τα πράγµατα είναι δύσκολα. εν µπορούµε να επιλέξουµε µεταξύ των δυο ισορροπιών. Ένα τέτοιο παίγνιο λέγεται παίγνιο αµιγούς συντονισµού (pure coordination game). Εδώ, δεν υπάρχει κανένας τρόπος µε πρώτη µατιά να γίνει η επιλογή της ισορροπίας. Μπορεί όµως, να είναι τέτοια η κουλτούρα στη χώρα, όπου το µικρό να αρέσει περισσότερο, άρα τότε θα υπάρχει πάλι focal point. 45
Θα δούµε τώρα ένα παράδειγµα µε τα µεταφορικά µέσα για να καταλάβουµε περισσότερο την έννοια του focal point. ίνονται 1000 αν πούµε όλοι µαζί ταυτόχρονα το ίδιο µεταφορικό µέσο. Αυτό είναι ένα παίγνιο αµιγούς συντονισµού, µε πάρα πολλές ισορροπίες. Οποιοδήποτε µεταφορικό µέσο, αν όλοι ονοµάσουν το ίδιο (µεταφορικό µέσο) είναι µια ισορροπία. Πρέπει όλες οι στρατηγικές να είναι οι ίδιες. Το focal point είναι έξω από το παιγνίδι. Το παιγνίδι µε την δισκέτα δεν είναι αµιγούς συντονισµού, απλά παιγνίδι συντονισµού, διότι υπάρχει ένα pareto ranking µεταξύ των ισορροπιών. Στο παίγνιο: (Β) Μ µ (Α) Μ 1, 1-1,-1 Μ -1,- 1 2, 2 χωρίς το focal point, θα οδηγηθούµε σε µια ισορροπία. Το αν θα είναι το (µ, µ) ή το (Μ, Μ) δεν το ξέρουµε. Για να επανέλθουµε στο παράδειγµα, µε τα µέσα µεταφορών στην Ολλανδία αν βάλουµε µια τέτοια ερώτηση υπάρχει µια πολύ µεγάλη πιθανότητα να πούνε όλοι ποδήλατο, γιατί το ποδήλατο είναι πολύ διαδεδοµένο. Οπότε υπάρχει κάποιο focal point. Η ΜΑΧΗ ΤΩΝ ΦΥΛΩΝ (The Battle of Sexes) Ας υποθέσουµε ότι έχουµε δύο ερωτευµένους οι οποίοι έχουν δύο επιλογές: είτε να πάνε στις ταυροµαχίες (Τ) είτε στον χορό (Χ). (Όπως είπαµε είναι ερωτευµένοι, οπότε θέλουν να πάνε στο ίδιο µέρος.) Αν πάνε σε διαφορετικά µέρη χάνουν και οι δύο. Ο άντρας προτιµά τις ταυροµαχίες, ενώ η γυναίκα το χορό. 46
(Γ) Τα Χ Τ 2, 1-1,-1 Χ -1,- 1 1, 2 Αν ο άντρας επιλέξει ταυροµαχίες το καλύτερο για την γυναίκα είναι να επιλέξει ταυροµαχίες. Αν ο άντρας επιλέξει χορό το καλύτερο για την γυναίκα είναι επίσης χορός. Αν η γυναίκα επιλέξει ταυροµαχίες, το καλύτερο για τον άντρα είναι ταυροµαχίες και αντίστοιχα χορό, αν η γυναίκα επιλέξει χορό. (Γ) Τ Χ (Α) Τ 2, 1-1,-1 Χ -1,- 1 1, 2 best response function Από τον πίνακα βλέπουµε ότι υπάρχουν δύο ισορροπίες κατά Nash. Παρατηρούµε επίσης ότι δεν µπορούµε να τις ταξινοµήσουµε κατά Pareto, διότι όταν µετακινηθούµε από την µια στην άλλη, κάποιος χάνει και κάποιος κερδίζει. Άρα εδώ, δεν υπάρχει ένα ξεκάθαρο κριτήριο µε βάση το οποίο να επιλέξουµε την ισορροπία. Η ισορροπία (Τ,Τ) είναι προτιµητέα από τον άντρα και (Χ, Χ) είναι προτιµητέα από την γυναίκα. Στο παίγνιο αυτό δεν υπάρχει focal point. Υπάρχουν δύο ισορροπίες και δεν υπάρχει τρόπος να επιλεγεί µια από αυτές. Ας δούµε τώρα, τι θα συνέβαινε από άποψη ισορροπιών κατά Nash, αν το παιγνίδι άλλαζε: δηλαδή αν υπήρχε κάποιος που έπαιρνε πρώτα την απόφαση και µετά ακολουθούσε κάποιος άλλος. Αυτό που θα κάνουµε τώρα είναι να συγκρίνουµε τις ισορροπίες κατά Nash της στρατηγικής µορφής ενός παιγνίου που είναι αρχικά σε αναλυτική µορφή, µε τις ισορροπίες κατά Νash, οι οποίες 47
προκύπτουν από την οπισθογενή επαγωγή (backwards induction) που είναι time consistent (διαχρονικά συνεπής). Σηµείωση: Το παιγνίδι έχει και µια τρίτη ισορροπία που είναι σε µεικτές στρατηγικές. Η ισορροπία κατά Nash δεν είναι τίποτα άλλο παρά το σηµείο τοµής των δύο best response functions. (το παίγνιο που είδαµε έχει δύο τοµές) Στο προηγούµενο παίγνιο υπάρχει διαχρονική συνέπεια: από την στιγµή που είναι ταυτόχρονη η επιλογή, υπάρχει µια χρονική στιγµή που παίζεται και τελειώνει. ιαχρονική συνέπεια σηµαίνει ότι δεν κάνει κάποιος µια απειλή σήµερα την οποία αύριο δεν θα εφαρµόσει ή στο µέλλον δεν κάνει κάτι που δεν θα ήταν λογικό να το κάνει, δεδοµένης της ιστορίας του παιγνίου. Ας δούµε τώρα ένα παράδειγµα προκειµένου να γίνει πιο κατανοητή η έννοια της διαχρονικής συνέπειας. Το πρόβληµα µε την ισορροπία κατά Nash, είναι ότι απαιτεί οι παίκτες να είναι πολύ ορθολογικοί. Να µπορούν δηλαδή, να κάνουν όλες τις σκέψεις πριν πάρουν την τελική τους απόφαση και να ξέρουν λίγο πολύ πως σκέφτεται ο άλλος. Όταν υπάρχουν πολλές ισορροπίες κατά Nash, πρέπει να βρεθούν στοιχεία εκτός παιγνίου τα οποία θα µας βοηθήσουν στην επιλογή µεταξύ των ισορροπιών. Για παράδειγµα, αν η γυναίκα είναι κυρίαρχη στο σπίτι, ως ισορροπία θα επιλεγεί το (X, X). Όπως αναφέραµε πιο πάνω υπάρχει και µια τρίτη ισορροπία που είναι σε µεικτές στρατηγικές στο παίγνιο αυτό, και η οποία είναι συµµετρική. ηλαδή µε µια πιθανότητα ο άντρας επιλέγει ταυροµαχίες και µε µια άλλη χορό. Το ίδιο κάνει και η γυναίκα. Στην περίπτωση αυτή µπορεί να προκύψει οτιδήποτε: είτε ταυροµαχία, είτε χορός, είτε οποιοσδήποτε άλλος συνδυασµός. Και αυτές οι στρατηγικές έχουν την ιδιότητα του best response (καλύτερες απαντήσεις δεδοµένου του τι κάνει ο αντίπαλος) και επιπλέον είναι και συµµετρικές. Το αποτέλεσµα όµως αυτών των στρατηγικών είναι χειρότερο από ο,τιδήποτε άλλο. ηλαδή θα βγει ένα αποτέλεσµα που είναι κοντά στο (-1,-1). 48
Σε προσδοκώµενους πλέον όρους, βγαίνουν αρνητικά αποτελέσµατα. Όπως είπαµε όµως αυτή είναι η τρίτη ισορροπία του παιγνίου. Ας δούµε τώρα κάτι άλλο. Ας υποθέσουµε ότι η γυναίκα αποφασίζει πρώτη και ο άντρας ακολουθεί. Θα βάλουµε ανάποδα τα αποτελέσµατα, διότι η γυναίκα είναι ο πρώτος παίκτης και ο άντρας ο δεύτερος. Για να δούµε, ποια είναι η στρατηγική µορφή αυτού του παιγνίου. Η γυναίκα έχει δυο στρατηγικές και ο άντρας τέσσερεις: (Α) Τ Τ Τ Χ Χ Τ Χ Χ ( Γ ) Τ 1, 2 1, 2-1, -1-1, -1 Χ -1, -1 2, 1-1, -1 2, 1 Ας υποθέσουµε ότι η γυναίκα επιλέγει ταυροµαχίες. Ποιες είναι οι καλύτερες απαντήσεις, που µπορεί να δώσει ο άντρας; Το Τ Τ και Τ Χ. Αν η γυναίκα επιλέξει χορός ο άντρας θα απαντήσει µε ΤΧ και ΧΧ. Αν ο άντρας επιλέξει T T, η καλύτερη απάντηση της γυναίκας είναι Τ. 49
Αν ο άντρας επιλέξει Τ Χ, η γυναίκα θα επιλέξει X. Αν επιλέξει ο άντρας Χ Τ, το Τ και Χ είναι το ίδιο για τη γυναίκα ενώ αν επιλέξει ο άντρας Χ Χ, η γυναίκα θα επιλέξει Χ. (Α) Τ Τα Τ Χ Χ Τ Χ Χ ( Γ ) T 1, 2 1, 2-1, -1-1, -1 Χ -1, -1 2 1-1, -1 2, 1 : Γυναίκα : Άντρας Από τον πίνακα παρατηρούµε ότι έχουµε τρεις ισορροπίες κατά Νash. Αν θυµηθούµε όταν ακολουθήσαµε το backwards induction είχαµε βρει µόνο µια ισορροπία. Είπαµε ότι αν το παιγνίδι φθάσει στο C ο άντρας θα επιλέξει ταυροµαχίες. Αν φθάσει στο D θα επιλέξει χορό. εδοµένου ότι η γυναίκα ξέρει τι θα κάνει ο άντρας στο µέλλον, θα επιλέξει χορό, συγκρίνοντας το 1 του (1, 2) µε το 2 του (2, 1). 50
Άρα η µόνη ισορροπία που προκύπτει από το backwards induction είναι το (Χ, Τ Χ). Σηµείωση: Υπενθυµίζουµε ότι λέµε (Τ Χ), διότι πρέπει να βάλουµε και την επιλογή του άντρα σε περίπτωση που κάνει κάποιο λάθος η γυναίκα και επιλέξει ταυροµαχίες. Άρα το (Χ, Τ Χ) είναι η ισορροπία που προκύπτει µε βάση την οπισθογενή επαγωγή (backwards induction). (Η ισορροπία είναι ένα διάνυσµα στρατηγικών κι εποµένως πρέπει να εκφράζεται σε στρατηγικές). Το αποτέλεσµα του παιγνιδιού είναι: (Χ, ΤΧ) (2,1). Συνεπώς το (2, 1) είναι αποτέλεσµα και όχι ισορροπία. Ίσως στο µυαλό µας αυτή τη στιγµή να υπάρχει η απορία: γιατί να βάλουµε Τ Χ για τον άντρα; Έχουµε πει σε προηγούµενες ενότητες ότι η στρατηγική είναι ένα πλήρες σχέδιο, το οποίο προσδιορίζει µια επιλογή σε όλους τους κόµβους στους οποίους θα µπορούσε να κληθεί ένας παίκτης, να πάρει µια απόφαση. εν σηµαίνει ότι πράγµατι θα κληθεί να πάρει µια απόφαση. Παραπάνω είδαµε ότι το παίγνιο έχει τρεις ισορροπίες κατά Nash: (Τ, Τ Τ), (Χ, Τ Χ), (Χ, Χ Χ). Ας δούµε τις ιδιότητες που παρουσιάζουν οι τρεις αυτές ισορροπίες. (Χ, Τ Χ): Η ισορροπία είναι λογική διότι βγαίνει από µια ανάλυση την οποία θα κάνουν οι παίκτες στο παιγνίδι, δεδοµένου ότι πρώτα παίρνει την απόφαση της η γυναίκα και µετά ο άντρας. Τι προβλήµατα έχουν οι δύο άλλες ισορροπίες; (Χ, Χ Χ): Η γυναίκα αποφασίζει χορό και ο άντρας αποφασίζει χορό, ότι και να συµβεί! ηλαδή, ο άντρας αποφασίζει χορό, όχι µόνο όταν η γυναίκα αποφασίζει χορό, αλλά ακόµα και όταν κάνει λάθος η γυναίκα και πει ταυροµαχίες. εδοµένου ότι παρατηρεί την απόφασή της γυναίκας, ότι είναι ταυροµαχίες, το να επιλέξει χορό δεν έχει κανένα νόηµα. Είναι µια χρονική ασυνέπεια, µε την 51
έννοια ότι ξέρει ότι η γυναίκα έχει αποφασίσει ταυροµαχίες. Άρα δεν είναι ορθολογικός. Το λάθος είναι ότι, παρότι βλέπει ότι η γυναίκα θέλει να πάει στις ταυροµαχίες αποφασίζει να πάει στο χορό. Ο άντρας αποφασίζει κάτι που δεν έχει νόηµα. (Τ, Τ Τ): Εδώ, ο άντρας επιβάλλει βασικά αυτό που θέλει. Πως το επιβάλλει; Ουσιαστικά, εδώ πρέπει να σκεφτούµε ότι ο άντρας την πρώτη στιγµή λέει: «εγώ θα πάω στις ταυροµαχίες ό,τι και να γίνει». Η γυναίκα αν ξέρει ότι ο άντρας θα πάει στις ταυροµαχίες ότι και να γίνει, θα πάει στις ταυροµαχίες. Αυτό είναι µια απειλή. Είναι αξιόπιστη; εν είναι αξιόπιστη γιατί αν η γυναίκα αποφασίσει να πάει στον χορό, η απειλή την οποία έχει εκτοξεύσει ο άντρας, είναι µια απειλή που δεν θα την πραγµατοποιήσει. Συνεπώς εδώ έχουµε µια διαχρονική ασυνέπεια. Εποµένως η µόνη ισορροπία που είναι διαχρονικά συνεπής, είναι η (Χ, Τ Χ), η οποία είναι µια τέλεια ισορροπία κατά Nash υποπαιγνίων. Επανάληψη: (Τ, ΤΤ): Λέει ο άντρας την στιγµή µηδέν: «εγώ θα πάω στις ταυροµαχίες ότι και να γίνει». Αν η γυναίκα τον πιστέψει, προφανώς θα πάει στις ταυροµαχίες. Αν όµως δεν τον πιστέψει και αποφασίσει να πάει στον χορό, δεδοµένης της απόφασης της γυναίκας τι θα κάνει ο άντρας; Θα επιλέξει χορό. Άρα η απειλή αυτή δεν είναι αξιόπιστη. (Χ, Χ Χ): Αυτό το παράπτωµα είναι πιο ελαφρύ. Μια χαζοµάρα. Λέει η γυναίκα: «ας πάµε στις ταυροµαχίες». Αν γίνει αυτό, προφανώς ο άντρας δεν θα πάει στον χορό, γιατί παρατηρεί την απόφαση της γυναίκας που είναι ταυροµαχίες. Άρα, αυτό έχει ένα στοιχείο που δεν είναι ορθολογικό. Άρα το (Χ, Χ Χ) είναι µια ισορροπία κατά Nash, αλλά δεν είναι µια ισορροπία συνεπής µε την έννοια ότι περιλαµβάνει ένα στοιχείο που δεν είναι λογικό εκτός ισορροπίας. Ποτέ δεν θα φτάσει το παιγνίδι στο (c), διότι η γυναίκα θα επιλέξει χορό. Αλλά, αν θα επιλεγούν µε µια µικρή πιθανότητα οι ταυροµαχίες, τι θα συνέβαινε; Αυτή είναι η λογική! 52
Σηµείωση: Ουσιαστικά πολλές φορές αυτό που κάνουµε είναι το εξής. Έχουµε ένα παίγνιο, βρίσκουµε µια ισορροπία και µετά λέµε: ας υποθέσουµε ότι υπάρχει µια µικρή αβεβαιότητα γύρω από το παιχνίδι. Ας υποθέσουµε µε µικρή πιθανότητα, η γυναίκα δεν είναι ορθολογική. Κάνουµε το perturbation του παιγνιδιού, και βλέπουµε αν σε αυτό το καινούριο version του παιγνιδιού συµβαίνει κάτι περίεργο. Αν συµβαίνει κάτι περίεργο, αυτό που έχουµε ορίσει ως ισορροπία του παιγνίου, δεν είναι µια λογική ισορροπία. Και εδώ, στο (Χ, Χ Χ) συµβαίνει κάτι περίεργο εκτός ισορροπίας, ενώ στο (Τ, Τ Τ) υπάρχει µια απειλή η οποία δεν είναι αξιόπιστη. Η υπόθεση µας εδώ είναι ότι οι 2 παίκτες παίρνουν ταυτόχρονα τις αποφάσεις τους. Γιατί; ιότι είναι η στρατηγική µορφή του παιγνίου, και στην στρατηγική µορφή γνωρίζουµε ότι δεν υπάρχει χρόνος. Άρα, οι αποφάσεις παίρνονται ταυτόχρονα (είναι σαν να παίρνονται ταυτόχρονα). Όµως ουσιαστικά ο άντρας λέει τι θα κάνει σε περίπτωση που η γυναίκα πει ταυροµαχία ( ΟΚ) και στην περίπτωση που η γυναίκα πει χορό ( ΟΚ). Είναι σχετικά δεσµευµένη απόφαση. Για παράδειγµα το Τ Τ είναι Τ στην περίπτωση που η γυναίκα πει Τ και στην περίπτωση που η γυναίκα πει Χ. Σηµείωση: Στην ισορροπία κατά Nash, οι παίκτες σκέφτονται τι σκέφτεται ο άλλος και πριν παίξουν, έχουν κάνει µια ολόκληρη δυναµική προσαρµογή στην ισορροπία. ηλαδή ουσιαστικά πριν παιχτεί το παιγνίδι, υπάρχει µια ολόκληρη λογική που οδηγεί και συγκλίνει στην ισορροπία. Αλλά είναι thought experiment. Εδώ έχουµε τρεις ισορροπίες κατά Nash και µόνο κάτω από το κριτήριο της διαχρονικής συνέπειας επιλέγουµε την (Χ, Τ Χ). Όµως, η διαχρονική συνέπεια είναι ένα κριτήριο, το οποίο θα δούµε στη συνέχεια αν είναι αποδεχτό. ΑΠΟΤΡΟΠΗ ΕΙΣΟ ΟΥ (ΕΝΤRING DETERRENCE) Με το παράδειγµα αυτό, θα δούµε ποιες είναι οι ισορροπίες κατά Nash αυτού του παιγνίου, καθώς και ποιες έχουν ή όχι λογική. 53
Ας υποθέσουµε ότι έχουµε ένα µονοπωλητή και ένα εν δυνάµει εισερχόµενο στην αγορά. Κάθε παίκτης έχει δύο στρατηγικές: Μ ΑΠΟ ΟΧΗ ΠΟΛΕΜΟΣ ΤΙΜΩΝ Ε ΟΧΙ 0, 100 0, 100 ΕΙΣΟ ΟΣ 40, 50-10, 0 Εδώ, δεδοµένου ότι ο εν δυνάµει εισερχόµενος γνωρίζει τι θα κάνει ο µονοπωλητής όταν εισέλθει (θα αποδεχτεί), ο δυνάµει εισερχόµενος εισέρχεται οπότε (είσοδος και αποδοχή) είναι η µόνη λογική ισορροπία, η οποία προκύπτει από την µέθοδο της οπισθογενούς επαγωγής (backwards induction). Ας δούµε τώρα τι γίνεται µε τις ισορροπίες κατά Nash. Αν ο εν δυνάµει εισερχόµενος, αποφασίσει να µην εισέλθει, ο µονοπωλητής είναι αδιάφορος αν θα τον αποδεχτεί ή θα τον πολεµήσει. Αν ο εν δυνάµει εισερχόµενος εισέλθει, ο µονοπωλητής είναι καλύτερα να αποδεχτεί την 54
είσοδο. Αν ο µονοπωλητής αποδεχτεί την είσοδο, το καλύτερο για τον εν δυνάµει εισερχόµενο είναι να εισέλθει. Αν ο µονοπωλητής, κάνει πόλεµο τιµών, το καλύτερο είναι να µην εισέλθει. (Μ) ΑΠΟ ΟΧΗ ΠΟΛΕΜΟΣ ΤΙΜΩΝ (Ε) ΟΧΙ 0, 100 0, 100 ΕΙΣΟ ΟΣ 40, 50-10, 0 Από τον πίνακα παρατηρούµε ότι έχουµε δύο ισορροπίες κατά Nash. Η µια είναι η κλασσική (είσοδος, αποδοχή) που βρήκαµε και πριν, και η δεύτερη είναι η (όχι, πόλεµος τιµών). Που στηρίζεται αυτή η καινούρια ισορροπία κατά Nash; Για µια ακόµα φορά, στηρίζεται σε µια απειλή η οποία δεν είναι αξιόπιστη. ιότι, ο µονοπωλητής λεει: «εγώ θα κάνω πόλεµο τιµών». Άρα, το καλύτερο για τον εν δυνάµει εισερχόµενο είναι να πει: «αφού θα µου κάνει πόλεµο τιµών, καλύτερα να µην εισέλθω». Το θέµα είναι ότι, ότι όταν ήδη εισέλθει ο εν δυνάµει εισερχόµενος, ο µονοπωλητής προφανώς θα αλλάξει την πολιτική του, και θα αποδεχθεί την είσοδο. 55