Κεφάλαιο 7ο Μιλήσαµε στο προηγούµενο κεφάλαιο για το τι θα συµβεί αν οι επιχειρήσεις ανταγωνίζονται σε τιµές. Επιπλέον µιλήσαµε για το πως αποδεικνύεται το παράδοξο του Bertrand και καθώς επίσης και για το τι θα συµβεί αν τα προϊόντα είναι διαφοροποιηµένα. Είχαµε τις καµπύλες ζήτησης: D 1 (P 1, P 2 ) = α bp 1 + dp 2 b > d > 0 D 2 (P 1, P 2 ) = α bp 2 + dp 1 Είπαµε ότι αυτό είναι ένα άλλο παράδειγµα, στο οποίο οι παίκτες έχουν άπειρες στρατηγικές και ότι ο τρόπος επίλυσης του είναι ο ίδιος µε τον τρόπο επίλυσης που είχαµε ακολουθήσει στον ανταγωνισµό σε ποσότητες. ηλαδή κάθε παίκτης θα µεγιστοποιήσει τα κέρδη του, δεδοµένου το τι κάνει ο άλλος και στη συνέχεια θα βρούµε την συνάρτηση αντίδρασης (βέλτιστης απάντησης). Οπότε ο παίκτης Ι θα: max(p 1 c)(α bp 1 +dp 2 ) P1 µεγιστοποιήσει τα κέρδη του, δεδοµένης της τιµής του άλλου, και από αυτή την µεγιστοποίηση θα βγει η συνάρτηση βέλτιστης απάντησης: (P 1 c)( b)+(α bp 1 +dp 2 ) = 0 1 P 1 = R 1 (P 2 ) = (α + dp2 + cb) Αυτό που θα κάνουµε τώρα είναι να βάλουµε σε ένα διάγραµµα τις συναρτήσεις βέλτιστης απάντησης και να βρούµε την ισορροπία. Θα τις βάλουµε στο διάγραµµα, διότι αυτό που µας ενδιαφέρει είναι να δούµε το επόµενο παίγνιο, στο οποίο οι δύο επιχειρήσεις δεν επιλέγουν ταυτόχρονα τις τιµές, αλλά τις επιλέγουν διαδοχικά. Τι θα συµβεί εδώ, και γιατί στο νέο αυτό παίγνιο, ο ακόλουθος έχει πλεονέκτηµα; Είχαµε πει, όταν συγκρίναµε το Cournot και Stackelberg, ότι όποια επιχείρηση διαλέγει πρώτα την ποσότητά της, αυτή έχει το πλεονέκτηµα και πετυχαίνει µεγαλύτερα κέρδη. Αυτό όµως δεν είναι µια γενική ιδιότητα σε αυτού του είδους τα παιγνίδια. Εξαρτάται από το παιγνίδι, εξαρτάται από τις µεταβλητές. Επιπλέον ορισµένες φορές το πλεονέκτηµα το έχει ο ηγέτης και ορισµένες πάλι το έχει ο ακόλουθος. Στη συνέχεια θα δούµε ένα παίγνιο, όπου το πλεονέκτηµα το έχει ο ακόλουθος. Πριν όµως, να δούµε πως λύνεται το πρόβληµα µας. Έχουµε βρει την συνάρτηση αντίδρασης της εταιρείας Ι: P 1 = R 1 (P 2 ) = 1 (α + dp2 + cb) και λόγω συµµετρίας έχουµε: 86
1 P 2 = R 2 (P 1 ) = (α + dp1 + cb) Λύνοντας τις δύο συναρτήσεις, µπορούµε να βρούµε την ισορροπία. Βέβαια στην συγκεκριµένη περίπτωση, βλέπουµε ότι όλα είναι συµµετρικά οπότε η ισορροπία επίσης είναι συµµετρική και µπορεί να χρησιµοποιηθεί καθαρά η έννοια της συµµετρίας. ηλαδή, από συµµετρία ξέρουµε ότι: P 1 * = P 2 * και µπορούµε να λύσουµε χρησιµοποιώντας µόνο µια συνθήκη πρώτης τάξης. Αντικαθιστώντας το P 2 * στην εξίσωση: 1 P 2 =R 2 (P 1 )= (α+dp1 +cb) Έχουµε: 1 P 2 * = (α + dp2 * + cb) P 2 * = α + dp 2 * + cd P 2 *( d) = α + cb α + cb P 1 *=P 2 *= d Αυτά τα είπαµε για να δούµε πως συµπληρώνεται το αρχικό πρόβληµα όπου οι δύο επιχειρήσεις επιλέγουν ταυτόχρονα την τιµή τους. ΙΑ ΟΧΙΚΗ ΕΠΙΛΟΓΗ ΤΙΜΩΝ Σε αυτό το παίγνιο, η µια επιχείρηση πρώτα εκλέγει την τιµή της, και µετά εκλέγει η άλλη. Προφανώς, η δεύτερη επιχείρηση και µε την λογική του backwards induction, ξέρει τι έχει γίνει στο παρελθόν, και αφού ξέρει τι έχει γίνει στο παρελθόν µπορεί να επιλέξει την τιµή της δίνοντας την καλύτερη απάντηση. Οπότε ξέρουµε ότι P 2 =R 2 (P 1 ) 87
Ξέρουµε αµέσως, ακολουθώντας την λογική του backwards induction ότι δεδοµένου οποιοδήποτε P 1, αυτό που θα κάνει η εταιρεία ΙΙ είναι να δώσει την καλύτερη δυνατή απάντηση. Οπότε, για να λύσουµε µαθηµατικά το πρόβληµα τι θα κάνουµε; Το πρόβληµα της 2 το έχουµε λύσει: 1 P 2 = R 2 (P 1 ) = (α + dp1 + cb) Πάµε πίσω στην εταιρεία Ι, η οποία θα µεγιστοποιήσει τα κέρδη της, κάτω από τον περιορισµό ότι P 2 =R 2 (P 1 ): max (P 1 c)(a bp 1 +dp 2 ) (1) 1 S.t P 2 =R 2 (P 1 )= (α+dp1 +cb) Aντικαθιστούµε το P 2 στο (1) και λύνουµε ως προς P 1. Βρίσκουµε το βέλτιστο P 1 και µετά βρίσκουµε και το P 2. Έτσι βρίσκουµε το (P 1 *, P 2 *) έτσι ώστε να αποτελεί µια ισορροπία που προκύπτει από την µέθοδο backwards induction: d max(p 1 c) α bp1 + (α + dp1 + cb) P1 dα d2 dc max(p 1 c) α bp1 + + P1 + P1 2 F.O.C. dα d2 dc d2 bp1 + + P + +(P 1 c) b + =0 2 α 1 dα d2 dc d2 α bp 1 + + P1 + bp 1 + 1 2 P d2 +bc =0 2 b ( Α) 644 44 74444 8 da dc d c 2 d P d 2 2 2 1 α + + + bc = bp1 + bp1 P1 ( A) P 1 *= 2 d b 1 P 2 *= ( A) α + d + cb d2 b Aυτό που βρίσκουµε δεν είναι το Nash equilibrium, αλλά η λύση από το backwards induction. Εδώ πέρα έχουµε την διαχρονική διάσταση του προβλήµατος. Αυτό που βρίσκουµε ουσιαστικά είναι η τέλεια ισορροπία υποπαιγνίων κατά Nash που θα δούµε πιο µετά. Το καινούριο στοιχείο στο παίγνιο αυτό είναι γιατί ο ακόλουθος πετυχαίνει µεγαλύτερα κέρδη; Και για να το δούµε αυτό, πρέπει να φτιάξουµε τις συναρτήσεις αντίδρασης: 88
1 P 1 =R 1 (P 1 )= (α+dp2 +cb), d > 0 b > 0 1 P 2 =R 2 (P 1 )= (α+dp1 +cb) Καταρχήν, βλέπουµε ότι έχουν θετική κλίση, και ξεκινούν από το σηµείο α + cb Tι συµβαίνει τώρα, όταν διαλέγει η πρώτη επιχείρηση, και µετά διαλέγει ή άλλη; Βλέπουµε από το: max(p 1 c)(α bp 1 +dp 2 ) P1 1 S. t P 2 =R 2 (P 1 )= (α+dp1 +cb) ότι αυτή που διαλέγει πρώτη θεωρεί σαν περιορισµό την καµπύλη αντίδρασης της δεύτερης. Άρα δεδοµένης της καµπύλης αντίδρασης R 2 (P 1 ), η επιχείρηση Ι θα µεγιστοποιήσει τα κέρδη της. ηλαδή θα κινηθεί στην ψηλότερη καµπύλη ίσου κέρδους που θα µπορέσει. Για να δούµε τώρα πως συµπεριφέρονται οι καµπύλες ίσου κέρδους, και ποια είναι η ισορροπία. Η ισορροπία είναι ένα σηµείο επαφής του περιορισµού P 2 =R 2 (P 1 ) και της καµπύλης ίσου κέρδους της εταιρείας Ι. Αρχικά τι ιδιότητες έχουν οι καµπύλες ίσου κέρδους της εταιρείας Ι; 89
Ας πάρουµε µια κάθετη. Σε αυτή την κάθετη η τιµή της Ι είναι σταθερή, ενώ όσο πάµε προς τα πάνω η τιµή της επιχείρησης ΙΙ αυξάνεται. Όσο αυξάνεται η τιµή της ΙΙ τι συµβαίνει; Η Ι µπορεί να κερδίσει περισσότερο, όσο µεγαλύτερη είναι η τιµή υποκατάστατου προϊόντος, τόσο αυξάνεται η ζήτηση της Ι: D 1 (P 1, P 2 )=α bp 1 +dp 2 d > 0 και µπορεί να αυξηθούν τα κέρδη της επιχείρησης Ι. Άρα η κατεύθυνση µας δίνει την κατεύθυνση όπου αυξάνονται τα κέρδη της Ι. Ποιες ιδιότητες έχουν οι καµπύλες ίσου κέρδους; Έχουν το πιο κάτω σχήµα. Η καµπύλη αντίδρασης της Ι στο σηµείο τοµής της µε την καµπύλη ίσου κέρδους αντιστοιχεί στο σηµείο όπου η καµπύλη ίσου κέρδους έχει κλίση µηδέν. 90
m: σηµείο επαφής της καµπύλης ίσου κέρδους µε την καµπύλη αντίδρασης της ΙΙ. Γιατί στο σηµείο A, B, C έχει κλίση µηδέν η καµπύλη ίσου κέρδους; ιότι είναι το µέγιστο κέρδος της εταιρίας Ι δεδοµένου µιας τιµής της ΙΙ. Η βέλτιστη αντίδραση σηµαίνει ότι η καµπύλη ίσου κέρδους πρέπει να έχει µηδενική κλίση στο σηµείο τοµής της. Άρα η καµπύλη αντίδρασης της Ι, R 1 (P 2 ) είναι ο γεωµετρικός τόπος των σηµείων που µεγιστοποιούνται τα κέρδη δεδοµένης της τιµής του αντιπάλου. Τι βλέπουµε από το σχήµα; Ότι η επιχείρηση Ι παίρνει ως δεδοµένη - ως περιορισµό, την καµπύλη αντίδρασης της ΙΙ. Και πάει στο ψηλότερο επίπεδο κερδών που µπορεί. Ποιο είναι το ψηλότερο επίπεδο; Είναι εκεί όπου η καµπύλη ίσου κέρδους της Ι εφάπτεται µε τον περιορισµό. Άρα η ισορροπία θα είναι στο m. Τι βλέπουµε στην ισορροπία; Ποιος από τους δύο έχει µεγαλύτερη τιµή; Στο σηµείο m είναι η ισορροπία του Stackelberg µε την έννοια ότι είναι ισορροπία στο µοντέλο του ηγέτη-ακόλουθου. Το Κ είναι η ισορροπία στην περίπτωση όπου οι 2 επιχειρήσεις εκλέγουνε ταυτόχρονα τις τιµές, η τοµή των 2 καµπυλών αντίδρασης. Τι βλέπουµε από εδώ. Ποια είναι µεγαλύτερη: η PS 1 ή PS 2 ; 91
Το βλέπουµε από το σχήµα. Από το αρχικό πρόβληµα ξέρουµε ότι έχουµε συµµετρία: α + cb P 1 *=P 2 *= στο Κ d Άρα ξέρουµε ότι το σηµείο Κ ανήκει στη γραµµή των 45. Αυτό σηµαίνει συµµετρία: ότι το σηµείο τοµής των καµπύλων αντίδρασης ανήκει στην γραµµή των 45 ο. Άρα η καµπύλη R 2 (P 1 ) έχει µικρότερη κλίση από την γωνιά των 45. Άρα αν µετακινηθούµε από το σηµείο Κ στο m, δεδοµένου ότι R 2 (P 1 ) έχει µικρότερη κλίση από 1, γνωρίζουµε ότι θα µεγαλώσει περισσότερο η P 1 αντί η P 2. Άρα ξεκινούµε από το σηµείο Κ, όπου οι δύο τιµές ισούνται, και φθάνουµε στο m όπου, αφού η κλίση R 2 (P 1 )είναι µικρότερη του 1 σηµαίνει ότι: PS 1 P 1 * > PS 2 P 2 * οριζόντια απόσταση κάθετη απόσταση Άρα από το σχήµα γνωρίζουµε ότι: PS 1 > P S 2 > Ρ 1 = Ρ 2 (τιµές ισορροπίας όταν επιλέγονται ταυτόχρονα οι τιµές.) 92
Άρα τι συµπεράσµατα βγάζουµε αµέσως; εδοµένου της αρχικής συµµετρίας, αν η µια από τις δύο επιχειρήσεις έχει ψηλότερη τιµή, θα κάνει λιγότερα κέρδη: Π 1 *=Π 2 *< Π S 1 < Π S 2 Αυτό φαίνεται και από τα γεγονός ότι καµπύλη Π 1 είναι πιο κάτω από την καµπύλη Π 1. Άρα έχουµε µετακινηθεί σε ψηλότερες καµπύλες ίσου κέρδους. ****Σηµείωση: Όλα αυτά τα αποτελέσµατα µπορεί να διαφέρουν χωρίς συµµετρία. ιότι µια ασυµµετρία υπέρ του ηγέτη µπορεί να µεταφραστεί σε µεγαλύτερα κέρδη για τον ηγέτη. Όµως, εδώ βλέπουµε την περίπτωση που τα πάντα είναι συµµετρικά. Παρόλο που τα πάντα είναι συµµετρικά, αν υπάρχει µια επιχείρηση που εκλέγει πρώτα την τιµή της και µια επιχείρηση που εκλέγει δεύτερη, έχει µεγαλύτερη κέρδη αυτή που εκλέγει δεύτερη και αυτό λέγεται πλεονέκτηµα του ακόλουθου. Άρα, υπάρχουν ορισµένα παίγνια όπου έχει πλεονέκτηµα αυτός που παίρνει πρώτος αποφάσεις, και υπάρχουν ορισµένα παίγνια που το πλεονέκτηµα το έχει ο ακόλουθος (last-mover advantage). Αντίθετα στο Stackelberg και Cournot µε ποσότητες είδαµε ότι είχαµε first-mover advantage. Και η λογική εδώ είναι η εξής: ο follower βλέπει ποια τιµή έθεσε ο leader ( PS 1 ) ( P S 2 ). oπότε πάει και θέτει µια µικρότερη τιµή Και αυτό φαίνεται µε το παράδειγµα που δώσαµε για τα οµοιογενή αγαθά. Τι είπαµε για τα οµοιογενή αγαθά; Ότι τιµή και να θέσει ο πρώτος, ο δεύτερος πάντα θα έχει την δυνατότητα να µειώνει λίγο την τιµή του, και να κερδίζει ολόκληρη την αγορά. Εδώ, το φαινόµενο δεν είναι τόσο δραµατικό. Θέτει ο πρώτος την τιµή, και ο δεύτερος κόβει λίγο από την τιµή και πετυχαίνει µεγαλύτερα κέρδη. Αυτά είναι παραδείγµατα, που βλέπουµε ποια είναι η µεθοδολογία και ποια τα συµπεράσµατα. (Στο διαγώνισµα θα µπορούσε να µπει κάτι που δεν θα έχει καµιά σχέση µε επιχειρήσεις. Απλώς θα έχει την ίδια λογική. Θα ερωτηθούµε π. χ υπάρχει first mover advantage κλπ; Θα µπορούσε να µας δωθεί ένα πρόβληµα µε στρατηγική ως προς την έρευνα και τεχνολογία ή ως προς κάτι άσχετο µε οικονοµικά). Είδαµε ότι όταν το προϊόν είναι οµοιογενές το οικονοµικό intuition είναι το ίδιο. Η δεύτερη επιχείρηση, βλέπει την τιµή της πρώτης την κόβει κατά ε και κερδίζει τα πάντα. Εδώ τα πράγµατα δεν είναι τόσο δραµατικά. Βλέπει την τιµή, την ρίχνει λίγο, κερδίζει περισσότερα αλλά όχι τα πάντα. 93
ΙΣΟΡΡΟΠΙΑ ΣΕ ΜΕΙΚΤΕΣ ΣΤΡΑΤΗΓΙΚΕΣ Υπάρχουν πολλά προβλήµατα που έχουν ασυνεχείς καµπύλες αντίδρασης. Έχοντας τώρα όλα τα εργαλεία στα χέρια µας, µπορούµε να λύσουµε προβλήµατα, όπου δεν υπάρχουν ισορροπίες σε αµιγείς στρατηγικές, άρα πρέπει να βρούµε την ισορροπία σε µεικτές στρατηγικές ή προβλήµατα στα οποία υπάρχουν ισορροπίες σε αµιγείς στρατηγικές αλλά υπάρχει επίσης κάποια ή κάποιες ισορροπίες σε µεικτές στρατηγικές. Ο λόγος για τον οποίο είπαµε ότι τα προβλήµατα σε µεικτές στρατηγικές είναι κατά κάποιο τρόπο ισοδύναµα µε τα προβλήµατα στα οποία οι παίκτες έχουν ένα άπειρο αριθµό στρατηγικών είναι ο εξής: όταν ένας παίκτης επιλέγει µεικτή στρατηγική, βασικά εκλέγει µια κατανοµή πιθανοτήτων πάνω στις αµιγείς στρατηγικές. ηλαδή, θα δούµε ότι το σύνολο στρατηγικών που έχει το άτοµο, είναι το σύνολο των πιθανοτήτων. Η πιθανότητα µπορεί να πάρει οποιαδήποτε τιµή από [0, 1]. Ας πούµε ότι έχουµε ένα άτοµο που έχει δύο στρατηγικές. Μια µεικτή στρατηγική ορίζεται σαν την κατανοµή πιθανότητας πάνω στις δύο αυτές στρατηγικές. Άρα πόσες στρατηγικές έχει το άτοµο στα χέρια του; Έχει άπειρες. Παράδειγµα: Ένα άτοµο µπορεί να πάει αριστερά ή δεξιά. Άρα έχει δύο στρατηγικές στα χέρια του: (Α, ) Ποια είναι µια µεικτή στρατηγική στην περίπτωση αυτή; Μια µεικτή στρατηγική, είναι να πάει δεξιά µε πιθανότητα p και αριστερά µε (1 p). (A, ) (p, 1 p) Άρα, ποιο είναι το σύνολο των στρατηγικών που έχει στα χέρια του; 0 p 1. Αυτό που θα επιλέξει δεν είναι πλέον αριστερά ή δεξιά. Θα επιλέξει την πιθανότητα µε την οποία θα πάει αριστερά (p). Άρα βλέπουµε ότι έχουµε ένα παίγνιο, όπου ο αριθµός των στρατηγών του παίχτη είναι άπειρο. Αλλά υπάρχει µια αντιστοιχία µεταξύ του υπολογισµού των µεικτών στρατηγικών και του παιγνίου µε άπειρες στρατηγικές. Η στρατηγική θα γραφτεί ως (A, ; p, 1 p). Παράδειγµα: Αν ένα άτοµο έχει τρεις στρατηγικές: αριστερά (Α), δεξιά ( ), ίσια (Ι) τι θα συµβεί; (Α, Ι, ) Εδώ χρειαζόµαστε 2 πιθανότητες. (Α, Ι, ) (P 1, P 2, 1 P 1 P 2 ) 94
Και βλέπουµε ότι αντί να έχουµε το διάστηµα 0 1, έχουµε ένα τρίγωνο. Σηµείωση: Το πρώτο που κοιτάζει κανείς είναι για ισορροπίες σε αµιγείς στρατηγικές. Αν υπάρχει ισορροπία σε αµιγείς στρατηγικές, τότε µετρούµε τις ισορροπίες σε αµιγείς στρατηγικές. Αν είναι 2 σηµαίνει ότι υπάρχει ακόµα µια σε µεικτές στρατηγικές. Αλλά υπάρχουν άλλα παίγνια που δεν έχουν ισορροπίες σε αµιγείς στρατηγικές. Θα δούµε ένα κλασσικό παίγνιο που δεν έχει ισορροπία σε αµιγείς στρατηγικές. ΠΕΤΡΑ ΧΑΡΤΙ ΚΑΙ ΨΑΛΙ Ι Έχουµε δύο παίκτες. Ο ένας κερδίζει και ο άλλος χάνει. Αυτός που κερδίζει παίρνει 1 και αυτός που χάνει δεν παίρνει τίποτα. Απλώς παίρνουν πόντους. Η πέτρα σπάει το ψαλίδι. Το χαρτί τυλίγει την πέτρα. Το ψαλίδι κόβει το χαρτί. Π Χ Ψ Π 0, 0 0, 1 1, 0 Χ 1, 0 0, 0 0, 1 Ψ 0, 1 1, 0 0, 0 Eίναι λοιπόν ξεκάθαρο ότι αν ο ένας ακολουθεί µια συγκεκριµένη στρατηγική, θα χάσει. Αν συνέχεια παίζει (χαρτί, χαρτί) ο άλλος θα τον ανακαλύψει, θα παίξει ψαλίδι, ψαλίδι και τελείωσε. Πως φαίνεται αυτό το πράγµα εδώ; Η καλύτερη απάντηση στην πέτρα είναι το χαρτί. Η καλύτερη απάντηση στο χαρτί είναι το ψαλίδι. Η καλύτερη απάντηση στο ψαλίδι είναι η πέτρα. 95
Π Χ Ψ Π 0, 0 0, 1 1, 0 Χ 1, 0 0, 0 0, 1 Ψ 0, 1 1, 0 0, 0 Σε αµιγείς στρατηγικές δεν υπάρχει ισορροπία. Είναι ξεκάθαρο ότι η ισορροπία σε µεικτές στρατηγικές είναι (Ρ π, Ρ x, Ρ ψ )=(1/3, 1/3, 1/3). Αλλά αυτό πρέπει να βρεθεί µε ένα συγκεκριµένο τρόπο. Απλώς κάναµε αυτό το παίγνιο, για να δούµε ότι υπάρχουν διάφορα παίγνια που δεν έχουν ισορροπίες σε αµιγείς στρατηγικές. Ένα άλλο παίγνιο το οποίο δεν έχει ισορροπίες σε αµιγείς στρατηγικές είναι το Matching Pennis. Κ Γ Κ -1, 1 1, -1 Γ -1, -1-1, 1 Εδώ πέρα δεν υπάρχει ισορροπία σε αµιγείς στρατηγικές. p 1-p q 1-q Κ Κ -1, 1 1, -1 Γ 1, -1-1, 1 Γ Θα πρέπει να υπάρχει τουλάχιστον µια ισορροπία σε µεικτές στρατηγικές. Εδώ, επειδή το παιγνίδι είναι πολύ συµµετρικό, υπάρχει µια µοναδική ισορροπία σε µεικτές στρατηγικές. Τώρα, θα χρησιµοποιήσουµε µια γενική µέθοδο που µπορεί να χρησιµοποιηθεί σε οποιαδήποτε παίγνιο. Η στρατηγική του παίκτη I είναι: (Κ, Γ; p, (1 p)) και του παίκτη II: (Κ, Γ; q, (1 q)) Για να δούµε τώρα ποια είναι η συνάρτηση αντίδρασης του παίχτη I, δεδοµένου ότι ο παίκτης II ακολουθεί την στρατηγική (K, Γ ; q, (1 q)) 96
Ο παίκτης I µπορεί να ακολουθήσει την στρατηγική Κ, Γ ή µια οποιαδήποτε ενδιάµεση στρατηγική. Αν ακολουθήσει την στρατηγική Κ, θα έχει κέρδη: Π 1 (Κ)=( 1)q+(1 q)1=1 2q Π 1 (Γ)=q( 1)+( 1)(1 q)=2q 1 H λογική είναι απλή: αν Π 1 (Κ) > Π 1 (Γ), αν δηλαδή 1 2q > 2q 1 q < ½ τότε Κ=(Κ, Γ; 1, 0) αν Π 1 (Κ) < Π 1 (Γ), αν δηλαδή 1 2q < 2q 1 q > ½ τότε Γ=(Κ, Γ; 0, 1) αν Π 1 (Κ) = Π 2 (Γ), αν δηλαδή 1 2q=2q 1 q = ½ τότε Γ=(Κ, Γ; p,1 p), 0 p 1, δηλαδή οποιαδήποτε απάντηση είναι βέλτιστη, ακόµα και p=0 ή p=1. Με p=0 σηµαίνει ότι δίνει απάντηση γράµµατα και p=1 κορώνα. Άρα ήδη έχουµε την καµπύλη αντίδρασης του Ι. Η καµπύλη αντίδρασης του Ι, R 1 (q) ορίζει για κάθε στρατηγική του ΙΙ, τι είναι το καλύτερο να κάνει ο παίκτης Ι. Τι είναι το διάγραµµα; Είναι ένα τετράγωνο που στον οριζόντιο άξονα εµφανίζεται η πιθανότητα p και στον άλλο q. Μόνο µε την πιθανότητα µπορούµε να χαρακτηρίσουµε ολόκληρη την στρατηγική του παίχτη Ι (µε πιθανότητα p) και του παίκτη ΙΙ (µε πιθανότητα q). Με µόνο ένα νούµερο δεν χρειαζόµαστε παραπάνω! Πως χαρακτηρίζεται η στρατηγική του παίχτη Ι; Από το p, όπου 0 p 1. Άρα η στρατηγική του παίχτη 1 είναι το ΑΒ. Η στρατηγική του παίκτη ΙΙ είναι το AC. Από τα παραπάνω, υπάρχει ένα q που είναι κρίσιµο: το q=½. 97
Αν το q > ½, τότε το p=1 (κορώνα). Αν το q < ½, τότε το καλύτερο για τον Ι είναι το p=0 (γράµµατα). Αν q=½, οτιδήποτε p είναι εντάξει (0 p 1). Άρα βρίσκουµε την συνάρτηση αντίδρασης του παίχτη Ι, R 1 (q). Την ίδια ανάλυση µπορούµε να κάνουµε και για τον παίχτη 2. Λόγω του ότι όλα είναι συµµετρικά, µπορούµε εύκολα να βρούµε την καµπύλη αντίδρασης του 2. Π 2 (Κ)=(1)p+(1 p)( 1)=2p 1 Π 2 (Γ)=( 1)p+(1)(1 p)=1 2p Αν Π 2 (Κ) > Π 2 (Γ) 2p 1 > 1 2p p > ½ τότε Κ=[Κ, Γ; 1, 0] Αν Π 2 (Κ) < Π 2 (Γ), αν δηλαδή 2p 1 < 1 2p p < ½ τότε Γ=[Κ, Γ; 0, 1] Αν Π 2 (Κ)=Π 2 (Γ), αν δηλαδή 2p 1=1 2p p=½ τότε (K, Γ; q, 1 q), 0 q 1 98
Ποια είναι η λύση; Το σηµείο τοµής των καµπυλών αντίδρασης. Άρα ποια είναι η ισορροπία, πως γράφουµε την ισορροπία και ποιο το αποτέλεσµα της ισορροπίας; Η ισορροπία κατά Nash σε µεικτές στρατηγικές είναι: [(Κ, Γ; ½, ½), (Κ, Γ; ½, ½)] Για τον παίχτη 1 Για τον παίχτη 2 Το p*=q*=½ δεν είναι η ισορροπία. Άρα βρήκαµε την ισορροπία, όµως ποιο είναι το αποτέλεσµα της ισορροπίας; Θα βρούµε τα αναµενόµενα κέρδη, τα οποία θα είναι µηδέν, για κάθε παίχτη. Γιατί θα είναι µηδέν; Υπάρχουν δύο τρόποι για να το δούµε: (1) ο πρώτος τρόπος είναι να πούµε: µε τι πιθανότητα θα παιχτεί ο κάθε συνδυασµός; ½ (2) Κ ½ Γ ½ (1) ½ Κ Γ ½ x ½ = ¼ -1, 1 ½ x ½ = ¼ 1, -1 ½ x ½ = ¼ 1, -1 ½ x ½ = ¼ -1, 1 Mε πιθανότητα 1/4. Άρα, οποιοσδήποτε συνδυασµός στρατηγικών, θα παιχτεί µε πιθανότητα ίση µε 1/4. Άρα κάθε παίκτης µε πιθανότητα 1/4 θα κερδίσει 1, θα χάσει 1 µε 1/4, θα κερδίσει 1 µε 1/4 και θα χάσει 1 µε πιθανότητα 1/4. Οπότε θα έχει αναµενόµενα κέρδη µηδενικά. 99
(2) Ένας πιο εύκολος τρόπος να βρούµε τα αναµενόµενα κέρδη είναι να πούµε το εξής: δεδοµένου ότι ο παίκτης ΙΙ ακολουθεί την στρατηγική ισορροπία q*=½, τι κέρδη κάνει ο παίκτης Ι όταν παίξει την στρατηγική κορώνα ή την στρατηγική γράµµατα; Είναι διαφορετικά τα κέρδη του όταν ακολουθεί γράµµατα ή όταν ακολουθεί κορώνα; ΟΧΙ. εδοµένου ότι ο παίκτης ΙΙ ακολουθεί την στρατηγική q*=½, τι κέρδη δίνει στον Ι η στρατηγική γράµµατα ή κορώνα; Του δίνει το ίδιο: Άρα ότι αναµένει να κερδίσει µε γράµµατα, αναµένει να κερδίσει και µε κορώνα όπως και µε οποιοδήποτε συνδυασµό των δύο. Άρα δεν είναι ανάγκη να αναλύσουµε για να δούµε µε τι πιθανότητα θα παιχτεί κάθε τετραγωνάκι. Μπορούµε να πάρουµε µια συγκεκριµένη στρατηγική (οποιαδήποτε από τις αµιγείς στρατηγικές χρησιµοποιείται στη µεικτή στρατηγική) και να υπολογίσουµε τα κέρδη στην στρατηγική αυτή; Απορία: Γιατί τα κέρδη θα είναι ίδια και µε Κ και µε Γ; ιότι και η Κ και τα Γ είναι βέλτιστη αντίδραση. Όπως επίσης βέλτιστη αντίδραση είναι και οποιοσδήποτε συνδυασµός των Κ και Γ. Τι σηµαίνει η καµπύλη αντίδρασης; 100
Όταν ο παίκτης 2 ακολουθεί µια στρατηγική q*=½, το καλύτερο που µπορεί να κάνει ο παίκτης Ι τι είναι; Ο,τιδήποτε και να παίξει είναι το καλύτερο. Τι σηµαίνει ο,τιδήποτε και να παίξει είναι το καλύτερο; Ότι τα κέρδη του, ο,τιδήποτε και να κάνει είναι τα ίδια. Άρα τα κέρδη του µε το να παίξει Γ είναι τα ίδια µε το να παίξει Κ. Άρα µπορούµε απλώς να υπολογίσουµε τα κέρδη του όταν για παράδειγµα παίξει Γ και να βρούµε τα κέρδη του τα αναµενόµενα, από την στρατηγική του. Το ίδιο ισχύει και για τον παίχτη ΙΙ, όταν ο Ι τηρεί τον κανόνα p*=½. Προσοχή, διότι αυτό είναι το κλειδί για να λυθούν πιο δύσκολα προβλήµατα µε µεικτές στρατηγικές. Σε µια µεικτή στρατηγική δεν είναι απαραίτητο να είναι όλες οι αµιγείς στρατηγικές. Για παράδειγµα είπαµε ότι µια στρατηγική που είναι αυστηρά κυριαρχούµενη, ποτέ δεν θα µπει σε µια ισορροπία κατά Nashο. Οπότε ορισµένες µόνο από τις αµιγείς στρατηγικές θα χρησιµοποιούνται στην µεικτή στρατηγική. Αυτές αποτελούν το support της κατανοµής των πιθανοτήτων. Ας πάρουµε αυτές τις αµιγείς στρατηγικές που χρησιµοποιούνται µε θετική πιθανότητα σε µια µεικτή στρατηγική. Όλες αυτές οι αµιγείς στρατηγικές θα δίνουνε τα ίδια κέρδη στον παίχτη. Εδώ είδαµε ότι και οι δύο αµιγείς στρατηγικές (Κ, Γ) χρησιµοποιούνται µε θετική πιθανότητα. Άρα και οι δύο αµιγείς στρατηγικές ανήκουν στο support της µεικτής στρατηγικής. Άρα και οι δύο αµιγείς στρατηγικές θα δίνουν στον παίχτη τα ίδια κέρδη. ****Σηµείωση: Αυτή είναι µια ιδιότητα πολύ πιο γενική που θα την χρησιµοποιήσουµε αργότερα, για να λύσουµε πολύ πιο δύσκολα προβλήµατα σε ισορροπίες σε µεικτές στρατηγικές. Είπαµε ότι σε µια µεικτή στρατηγική χρησιµοποιούνται µε πιθανότητα θετική κάποιες αµιγείς στρατηγικές. Στο συγκεκριµένο πρόβληµα και η κορώνα και τα γράµµατα χρησιµοποιούνται µε θετική πιθανότητα (½). Μεικτή στρατηγική σηµαίνει κατανοµή πιθανοτήτων πάνω σε αµιγείς στρατηγικές. Μια 101
µειχτή στρατηγική µπορεί να είναι κατανοµή πιθανοτήτων σε όλες τις αµιγείς στρατηγικές ενός παίχτη, ή σε ένα υποσύνολο τους. Ας πούµε ότι είναι σε ένα υποσύνολο. Τα κέρδη ενός παίχτη στην ισορροπία κατά Νash σε µειχτές στρατηγικές, όταν χρησιµοποιούµε µια οποιαδήποτε από τις αµιγείς στρατηγικές που ανήκουνε στο υποσύνολο των στρατηγικών που χρησιµοποιούνται στην µεικτή στρατηγική, είναι τα ίδια. Επίσης τα κέρδη του είναι µικρότερα αν χρησιµοποιήσει οποιαδήποτε αµιγή στρατηγική που δεν ανήκει στο support της µεικτής στρατηγικής. 102