Ενότητα 0: Παιχνίδια μ λλιπή πληροφόρηση Ρφανίδης Ιωάννης
Άδις Χρήσης Το παρόν κπαιδυτικό υλικό υπόκιται σ άδις χρήσης Creative Commons. ια κπαιδυτικό υλικό, όπως ικόνς, που υπόκιται σ άλλου τύπου άδιας χρήσης, η άδια χρήσης αναφέρται ρητώς.
Χρηματοδότηση Το παρόν κπαιδυτικό υλικό έχι αναπτυχθί στα πλαίσια του κπαιδυτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο Πανπιστήμιο Μακδονίας» έχι χρηματοδοτήσι μόνο τη αναδιαμόρφωση του κπαιδυτικού υλικού. Το έργο υλοποιίται στο πλαίσιο του Επιχιρησιακού Προγράμματος «Εκπαίδυση και Δια Βίου Μάθηση» και συγχρηματοδοτίται από την Ευρωπαϊκή Ένωση Ευρωπαϊκό Κοινωνικό Ταμίο) και από θνικούς πόρους. 3
Games with Incomplete Information Παιχνίδια μ λλιπή πληροφόρηση 4
νικά Ως παιχνίδια μ λλιπή πληροφόρηση ορίζονται αυτά στα οποία δν ίναι γνωστές σ όλους τους παίκτς όλς οι παράμτροι του παιχνιδιού, όπως: Ποιοι/πόσοι ίναι οι άλλοι παίκτς Ποις ίναι οι διαθέσιμς στρατηγικές στους άλλους παίκτς. Ποις ίναι οι αποδόσις των διάφορων στρατηγικών για τους άλλους παίκτς. κλπ 5
Παράδιγμα: Διαπραγμάτυση Ι /) Έστω δύο μέρη, Α και Β, τα οποία βρίσκονται σ μια κατάσταση αντιπαράθσης. Δύο χώρς, ργοδότης και ργαζόμνοι, δύο οδηγοί στο δρόμο, δύο συνάδλφοι κλπ Κάθ παίκτης μπορί να πιλέξι ίτ μια σκληρή Σ), ίτ μια μτριοπαθή Μ) αντιμτώπιση. Ο παίκτης Α ίναι ιδιαίτρα άκαμπτος. Έστω ότι υπάρχι αββαιότητα για το χαρακτήρα του παίκτη Β, άν δηλαδή ίναι άκαμπτος ή ήπιος. Έχουμ δύο πίνακς παιχνιδιού, έναν για κάθ τύπο του Β: Β Α Σ Μ Σ, 3,0 Μ 0,3, Β Α Σ Μ Σ,0 3, Μ 0,,3 Άκαμπτος Β Ήπιος Β 6
Παράδιγμα: Διαπραγμάτυση Ι /) Στο παράδιγμα αυτό τα πράγματα ίναι απλά: Ο παίκτης Α έχι κυρίαρχη στρατηγική την Σ, ανξάρτητα από την στάση του παίκτη Β. Ο παίκτης Β έχι κυρίαρχη στρατηγική την Σ στον πρώτο πίνακα και την Μ στο δύτρο. Οι παραπάνω στρατηγικές μπορούν να πιλγούν από τους παίκτς μ ββαιότητα και αποτλούν τη λύση του προβλήματος. Β Α Σ Μ Σ, 3,0 Μ 0,3, Β Α Σ Μ Σ,0 3, Μ 0,,3 Άκαμπτος Β Ήπιος Β 7
Παράδιγμα: Διαπραγμάτυση ΙΙ /3) Μια παραλλαγή του προηγούμνου παραδίγματος ίναι όταν το ένα μέρος θα ήθλ να προσαρμόσι τη συμπριφορά του βάσι της συμπριφοράς του άλλου μέρους. ια παράδιγμα, έστω σ μια διαπραγμάτυση ργοδότη/ργαζομένων Α/Β αντίστοιχα στους παρακάτω πίνακς), ο ργοδότης θα ήθλ να πιβραβύσι μια ήπια στάση των ργαζομένων δίνοντας τους μια μγαλύτρη αύξηση, όχι όμως μια άκαμπτη στάση. Β Α Σ Μ Σ, 3,0 Μ 0,3, Β Α Σ Μ Σ 0,0, Μ, 3,3 Άκαμπτος Β Ήπιος Β 8
Παράδιγμα: Διαπραγμάτυση ΙΙ /3) Στο παράδιγμα αυτό οι κυρίαρχς στρατηγικές για τον παίκτη Β ίναι οι ίδις, Σ για την πρώτη πρίπτωση και Μ για την δύτρη. Ο παίκτης Α πλέον έχι και αυτός διαφορτικές κυρίαρχς στρατηγικές, Σ για την πρώτη πρίπτωση και Μ για τη δύτρη. Το πρόβλημα για τον Α ίναι ότι δν γνωρίζι ξαρχής σ ποια από τις δύο πριπτώσις βρισκόμαστ! Β Α Σ Μ Σ, 3,0 Μ 0,3, Β Α Σ Μ Σ 0,0, Μ, 3,3 Άκαμπτος Β Ήπιος Β 9
Έστω ότι ο Α θωρί πως κατά 90% ο Β θα ίναι άκαμπτος και κατά 0% θα ίναι ήπιος. Εάν πιλέξι Σ, το αναμνόμνο όφλός του ίναι: 0.9 +0. =. Εάν πιλέξι Μ, το αναμνόμνο όφλός του ίναι: 0.9 0+0. 3=0.3 Άρα τον συμφέρι να πιλέξι Σ. Παράδιγμα: Διαπραγμάτυση ΙΙ 3/3) Στο συγκκριμένο παράδιγμα βρίσκουμ ύκολα ότι αν ο Β ίναι άκαμπτος μ πιθανότητα μγαλύτρη από 50%, ο Α πιλέγι Σ. Β Α Σ Μ Σ, 3,0 Μ 0,3, Β Α Σ Μ Σ 0,0, Μ, 3,3 Άκαμπτος Β Ήπιος Β 0
Παράδιγμα: Μάχη των φύλων /) Έστω το γνωστό παιχνίδι της μάχης των φύλων, όπου ο άντρας και η γυναίκα πρέπι να αποφασίσουν αν θα πάν στην Όπρα ή στο ήπδο. Ο άντρας προτιμά να πάι μαζί μ τη γυναίκα του. Έστω ότι δν ίναι γνωστό στον άντρα άν η γυναίκα του προτιμά να πάι μαζί μ τον άντρα της κάπου ή χώρια. Α ήπδο Όπρα ήπδο 3, 0,0 Όπρα 0,0,3 υναίκα προτιμά μαζί Α ήπδο Όπρα ήπδο 3,0 0,3 Όπρα 0,,0 υναίκα προτιμά χώρια
Παράδιγμα: Μάχη των φύλων /) Ο πληροφορημένος παίκτης η γυναίκα) δν έχι κάποια κυρίαρχη στρατηγική σ καμία από τις δύο πριπτώσις. Άρα, μολονότι γνωρίζι ποιος ίναι ο σωστός πίνακας παιχνιδιού, δν της ίναι ξκάθαρο τι να πιλέξι. Τα πράγματα ίναι ακόμη χιρότρα για τον άνδρα, ο οποίος, κτός από το ότι δν έχι καμία κυρίαρχη στρατηγική σ κανένα παιχνίδι, δν γνωρίζι καν ποιος ίναι ο σωστός πίνακας παιχνιδιού! Θα αναλύσουμ το παιχνίδι στις πόμνς διαφάνις. Α ήπδο Όπρα ήπδο 3, 0,0 Όπρα 0,0,3 υναίκα προτιμά μαζί Α ήπδο Όπρα ήπδο 3,0 0,3 Όπρα 0,,0 υναίκα προτιμά χώρια
Παρατήρηση Στα παραδίγματα που προηγήθηκαν θωρήσαμ αββαιότητα για τον ένα από τους δύο παίκτς. Στην πραγματικότητα μπορί να υπάρχι αββαιότητα και για τους δύο. Σ αυτή την πρίπτωση μπορί να έχουμ τόσους πίνακς παιχνιδιού, όσοι ίναι οι δυνατοί συνδυασμοί νδχόμνων καταστάσων των δύο παικτών. ΠΡΟΣΟΧΗ: Θωρούμ ότι το πλήθος των δυνατών διαφορτικών καταστάσων κάθ παίκτη ίναι ππρασμένο. 3
Ισορροπία Bayes-Nash /4) ια το παιχνίδι της μάχης των φύλων μ λλιπή πληροφόρηση κάνουμ τις ξής παραδοχές: Η γυναίκα γνωρίζι ποιος ίναι ο σωστός πίνακας του παιχνιδιού. Ο άνδρας δν γνωρίζι τον τύπο της γυναίκας του, ωστόσο γνωρίζι την πιθανότητα ρ ο πίνακας του παιχνιδιού να ίναι ο πρώτος η γυναίκα του τον αγαπά). Άρα η πιθανότητα ο σωστός πίνακας του παιχνιδιού να ίναι ο δύτρος ίναι -ρ. Και η γυναίκα γνωρίζι την τιμή του ρ. 4
Ισορροπία Bayes-Nash /4) Μτατρέπουμ το παιχνίδι σ κτατική μορφή, θωρώντας ότι ένας τρίτος παίκτης, η φύση, πιλέγι στην αρχή τον τύπο της γυναίκας. υναίκα Τύπος Φύση Ο Άνδρας Ο Ο 3, 0,0 0,0,3 ΠΡΟΣΟΧΗ: Τα πρώτα νούμρα αντιστοιχούν στον άνδρα 3,0 Τύπος Ο 0, Ο 0,3 Ο,0 5
Ισορροπία Bayes-Nash 3/4) Στο συγκκριμένο παιχνίδι ο άνδρας έχι έναν κόμβο απόφασης, άρα πρέπι να λάβι μία απόφαση: Οι καθαρές στρατηγικές του άνδρα ίναι οι και Ο. Μια μικτή στρατηγική του άνδρα μπορί να παρασταθί μ την πιθανότητα λ να πιλέξι άρα η πιθανότητα να πιλέξι Ο ίναι -λ). Η γυναίκα έχι δύο κόμβους απόφασης, άρα έχι να λάβι δύο αποφάσις: Οι καθαρές στρατηγικές της γυναίκας ίναι οι,),,ο), Ο,) και Ο,Ο). Μια μικτή στρατηγική για τη γυναίκα αποτλίται από ένα ζύγος πιθανοτήτων μ, μ ), όπου μ i ίναι η πιθανότητα η γυναίκα να πιλέξι όταν ο τύπος της ίναι i, i=,. Οι καθαρές στρατηγικές της γυναίκας αντιστοιχούν στις μικτές στρατηγικές,),,0), 0,) και 0,0). 6
Ισορροπία Bayes-Nash 4/4) Μια ισορροπία Bayes-Nash για το συγκκριμένο παιχνίδι ίναι ένας συνδυασμός πιθανοτήτων λ, μ, μ ), τέτοιος ώστ κάθ παίκτης και κάθ τύπος παίκτη) πιλέγι την καλύτρη απάντηση στην πιλογή του άλλου παίκτη: Η πιθανότητα μ μγιστοποιί το αναμνόμνο όφλος της γυναίκας τύπου, όταν ο άνδρας πιλέγι μ πιθανότητα λ. Η πιθανότητα μ μγιστοποιί το αναμνόμνο όφλος της γυναίκας τύπου, όταν ο άνδρας πιλέγι μ πιθανότητα λ. Η πιθανότητα λ μγιστοποιί το αναμνόμνο όφλος του άνδρα, ο οποίος πιστύι ότι η γυναίκα ίναι τύπου μ πιθανότητα ρ και πιλέγι μ πιθανότητα μ, νώ ίναι τύπου μ πιθανότητα -ρ και πιλέγι μ πιθανότητα μ. Στις πόμνς διαφάνις θα βρούμ κάποια σημία ισορροπίας Bayes-Nash μ καθαρές και μ μικτές στρατηγικές. 7
Ισορροπίς καθαρών Έστω ότι ο άνδρας αποφασίζι δηλαδή λ=). Η καλύτρη απάντηση της γυναίκας τύπου ίναι πίσης μ =) και της γυναίκας τύπου ίναι Ο μ =0). Θα λέγξουμ πότ η πιλογή του άνδρα ίναι η καλύτρη απάντηση στις πιλογές,ο) ή ισοδύναμα,0), της γυναίκας. Επιλέγοντας ο άνδρας έχι αναμνόμνο όφλος: 3 ρ+0 -ρ)=3ρ Αν πέλγ Ο, θα ίχ αναμνόμνο όφλος: 0 ρ+ -ρ)=-ρ στρατηγικών /3) Α ήπδο Όπρα ήπδο 3, 0,0 Όπρα 0,0,3 Α ήπδο Όπρα ήπδο 3,0 0,3 Όπρα 0,,0 υναίκα προτιμά μαζί υναίκα προτιμά χώρια 8
Ισορροπίς καθαρών στρατηγικών /3) Η πιλογή για τον άνδρα ίναι λοιπόν καλύτρη απάντηση στην πιλογή,ο) της γυναίκας, όταν 3 ρ -ρ ή ισοδύναμα ρ 0.5. Άρα, για ρ 0.5, ο συνδυασμός,,ο)), ή μ πιθανότητς λ=, μ =, μ =0) ίναι σημίο ισορροπίας κατά Bayes-Nash, μ καθαρές στρατηγικές. Παρόμοια μπορούμ να βρούμ ότι για ρ 0.75 υπάρχι το σημίο ισορροπίας Ο, Ο,)) ή λ=0, μ =0, μ =). Δν υπάρχι κανένα άλλο σημίο ισορροπίας μ καθαρές στρατηγικές! Α ήπδο Όπρα ήπδο 3, 0,0 Όπρα 0,0,3 Α ήπδο Όπρα ήπδο 3,0 0,3 Όπρα 0,,0 υναίκα προτιμά μαζί υναίκα προτιμά χώρια 9
Συνοψίζοντας: Ισορροπίς καθαρών στρατηγικών 3/3) ια ρ>0.75 υπάρχουν δύο σημία ισορροπίας μ καθαρές στρατηγικές, τα,,ο)) και Ο, Ο,)). ια 0.5<ρ<0.75 υπάρχι μόνο ένα σημίο ισορροπίας μ καθαρές στρατηγικές, το,,ο)). ια ρ<0.5 δν υπάρχι κανένα σημίο ισορροπίας μ καθαρές στρατηγικές. 0
Ισορροπίς μικτών στρατηγικών /7) Είναι προφανές ότι υπάρχουν και ισορροπίς μικτών στρατηγικών, ακόμη και για ρ<0.5. ια παράδιγμα, έστω ρ=0. Τότ ίναι σίγουρο ότι η γυναίκα ίναι τύπου, οπότ ισχύι μόνο ο δύτρος πίνακας του παιχνιδιού. Α ήπδο Όπρα ήπδο 3,0 0,3 Όπρα 0,,0 υναίκα προτιμά χώρια Το παιχνίδι τώρα μοιάζι μ το «μονά-ζυγά», το οποίο έχι ισορροπία Nash μ μικτές στρατηγικές. Πράγματι, για λ=0.5 και μ =0.5, οι δύο παίκτς ίναι αδιάφοροι για την πιλογή του αντιπάλου.
Έστω ότι ρ>0. Ισορροπίς μικτών στρατηγικών /7) Ας υποθέσουμ ότι ο άνδρας πιλέγι μ πιθανότητα λ. Εάν η γυναίκα τύπου πιλέξι, τότ το αναμνόμνο όφλός της ίναι: λ +-λ) 0=λ Εάν η γυναίκα τύπου πιλέξι Ο, το αναμνόμνο όφλός της ίναι: λ 0+-λ) 3=-λ) 3 Προφανώς η γυναίκα θα πιλέξι αυτό που τη συμφέρι πρισσότρο, κτός άν λ=3 -λ) ή λ=0.75, οπότ μπορί να πιλέξι οποιαδήποτ μικτή στρατηγική. Α ήπδο Όπρα ήπδο 3, 0,0 Όπρα 0,0,3 υναίκα προτιμά μαζί Α ήπδο Όπρα ήπδο 3,0 0,3 Όπρα 0,,0 υναίκα προτιμά χώρια
Παρόμοια: Ισορροπίς μικτών στρατηγικών 3/7) Εάν η γυναίκα τύπου πιλέξι, τότ το αναμνόμνο όφλός της ίναι: λ 0+-λ) =-λ Εάν η γυναίκα τύπου πιλέξι Ο, το αναμνόμνο όφλός της ίναι: λ 3+-λ) 0=3λ Προφανώς η γυναίκα θα πιλέξι αυτό που τη συμφέρι πρισσότρο, κτός άν -λ=3λ ή λ=0.5, οπότ μπορί να πιλέξι οποιαδήποτ μικτή στρατηγική. Α ήπδο Όπρα ήπδο 3, 0,0 Όπρα 0,0,3 υναίκα προτιμά μαζί Α ήπδο Όπρα ήπδο 3,0 0,3 Όπρα 0,,0 υναίκα προτιμά χώρια 3
Ισορροπίς μικτών στρατηγικών 4/7) Ας δούμ τώρα το πρόβλημα από την πλυρά του άνδρα. Έστω ότι η γυναίκα πιλέγι τη μικτή στρατηγική μ,μ ). Εάν ο άνδρας πιλέξι, το αναμνόμνο όφλός του ίναι: ρ μ 3+-ρ) μ 3 Εάν ο άνδρας πιλέξι Ο, το αναμνόμνο όφλός του ίναι: ρ -μ ) +-ρ) -μ ) Ο άνδρας θα πιλέξι ή Ο, ανάλογα μ το ποια από τις παραπάνω δύο κφράσις δίνι μγαλύτρο όφλος. Στην ιδική πρίπτωση που οι δύο παρακάνω κφράσις ίναι ίσς, ο άνδρας μπορί να πιλέξι μικτές στρατηγικές. Α ήπδο Όπρα ήπδο 3, 0,0 Όπρα 0,0,3 υναίκα προτιμά μαζί Α ήπδο Όπρα ήπδο 3,0 0,3 Όπρα 0,,0 υναίκα προτιμά χώρια 4
Ισορροπίς μικτών στρατηγικών 5/7) Ας προσπαθήσουμ να βρούμ μια μικτή ισορροπία: Έστω ότι ο άνδρας πιλέγι λ=0.75. Τότ η γυναίκα τύπου μπορί να πιλέξι οποιαδήποτ μικτή στρατηγική, δηλαδή οποιοδήποτ μ. Ωστόσο η γυναίκα τύπου θα πιλέξι υποχρωτικά Ο μ =0). Ο άντρας μπορί να πιλέξι μικτή στρατηγική μόνο όταν: ρ μ 3+-ρ) μ 3=ρ -μ ) +-ρ) -μ ) ή ισοδύναμα αφού μ =0) μ =/4ρ) για ρ 0.5 ια παράδιγμα, για ρ=0.5 έχουμ την μικτή ισορροπία: λ=0.75, μ =0.5, μ =0) 5
Παρόμοια: Ισορροπίς μικτών στρατηγικών 6/7) Έστω ότι ο άνδρας πιλέγι λ=0.5. Τότ η γυναίκα τύπου θα πιλέξι υποχρωτικά Ο, δηλαδή μ =0. Από την άλλη, η γυναίκα τύπου μπορί να πιλέξι οποιαδήποτ στρατηγική. Ο άντρας μπορί να πιλέξι μικτή στρατηγική μόνο όταν: ρ μ 3+-ρ) μ 3=ρ -μ ) +-ρ) -μ ) ή ισοδύναμα αφού μ =0) μ =/4-4ρ) για ρ 0.75 ια παράδιγμα, για ρ=0. έχουμ την μικτή ισορροπία: λ=0.5, μ =0, μ =0.35) 6
Ισορροπίς μικτών στρατηγικών 7/7) Τα αποτλέσματα που βρήκαμ δν ίναι γνικά, αλλά αφορούν μόνο το συγκκριμένο παράδιγμα. Η γνικότρη προσέγγιση που ακολουθήθηκ μπορί ωστόσο να φαρμοστί σ οποιοδήποτ ανάλογο παράδιγμα. Συμπρασματικά: Οι πληροφορημένοι παίκτς η γυναίκα στο συγκκριμένο παράδιγμα) πιλέγουν τη στρατηγική τους όπως στα παιχνίδια πλήρους πληροφόρησης. Πρέπι να πιλέξουν μια στρατηγική για κάθ τύπο παιχνιδιού. Οι μη πληροφορημένοι παίκτς ουσιαστικά καλούνται να αντιμτωπίσουν μικτές στρατηγικές, όπου οι πιθανότητς καθορίζονται από τη συχνότητα μφάνισης των διαφόρων τύπων παίκτη. 7
Παράδιγμα: Μάχη των φύλων ΙΙ /4) Στο παράδιγμα που ίδαμ ίχαμ λλιπή πληροφόρηση μόνο όσον αφορά τον τύπο της γυναίκας. Θα δίξουμ πώς η προσέγγιση γνικύται όταν υπάρχι λλιπή πληροφόρηση και για τον τύπο του άνδρα. Έστω ότι υπάρχουν δύο τύποι άνδρα: ο αισιόδοξος τύπος ), που θωρί ότι η πιθανότητα η γυναίκα να πιθυμί κοινή έξοδο ίναι ρ. ο απαισιόδοξος τύπος ), που θωρί ότι η πιθανότητα η γυναίκα να πιθυμί κοινή έξοδο ίναι ρ, όπου 0<ρ <ρ <. ΠΡΟΣΟΧΗ: Οι δύο διαφορτικοί τύποι άνδρα δν έχουν να κάνουν μ τη συνάρτηση οφέλους όπως συμβαίνι μ τη γυναίκα). Τέλος η γυναίκα γνωρίζι ότι η πιθανότητα ο άντρας της να ίναι αισιόδοξος ίναι q. Και ο άντρας γνωρίζι αυτή τη γνώση της γυναίκας. 8
Παράδιγμα: Μάχη των φύλων ΙΙ /4) Μια στρατηγική της γυναίκας αποτλίται, όπως και πριν, από δύο πιλογές, για τους δύο τύπους της γυναίκας. Οι καθαρές στρατηγικές της γυναίκας ίναι οι,),,ο), Ο,) και Ο,Ο). Οι μικτές στρατηγικές της γυναίκας ίναι όλα τα ζύγη μ,μ ), όπου μ i η πιθανότητα μ την οποία η γυναίκα τύπου i πιλέγι. Τώρα όμως και μια στρατηγική του άντρα αποτλίται από δύο μέρη, ένα για κάθ τύπο του άντρα. Οι καθαρές στρατηγικές του άντρα ίναι οι,),,ο), Ο,) και Ο,Ο). Οι μικτές στρατηγικές του άντρα ίναι όλα τα ζύγη λ,λ ), όπου λ i η πιθανότητα μ την οποία ο άντρας τύπου i πιλέγι. 9
Παράδιγμα: Μάχη των Μια ισορροπίας Bayes-Nash ίναι μια ττράδα: λ,λ ), μ,μ )) φύλων ΙΙ 3/4) τέτοια ώστ κάθ τύπος παίκτη να έχι πιλέξι μια βέλτιστη αναμνόμνη απάντηση στις πιλογές όλων των διαφόρων τύπων του αντιπάλου. ια παράδιγμα: η πιθανότητα μ μγιστοποιί το αναμνόμνο όφλος της γυναίκας τύπου, όταν ο άνδρας τύπου j πιλέγι μ πιθανότητα λ j και η πιθανότητα ο άνδρας να ίναι τύπου ίναι q. η πιθανότητα λ μγιστοποιί το αναμνόμνο όφλος του άνδρα τύπου, όταν η γυναίκα τύπου i πιλέγι μ πιθανότητα μ i και η πιθανότητα η γυναίκα να ίναι τύπου ίναι ρ. 30
Παράδιγμα: Μάχη των φύλων ΙΙ 4/4) Παρακάτω φαίνται η κτατική μορφή του παιχνιδιού, μ πρώτο παίκτη τη φύση να αποφασίζι για τους τύπους των δύο παικτών. Φύση Τύπος Άντρας υναίκα Ο Ο Τύπος Ο Ο Τύπος Τύπος Ο Ο Ο Ο Ο Ο Ο Ο 3,0 0, 0,3,0 3, 0,0 0,0,3 3, 0,0 0,0,3 3,0 0, 0,3,0 ΠΡΟΣΟΧΗ: Τα πρώτα νούμρα αντιστοιχούν στον άνδρα 3
νίκυση /) Το γνικότρο πλαίσιο που πρότιν ο Harsanyi 967, 968) για τη μλέτη των παιχνιδιών λλιπούς πληροφόρησης έχι ως ξής: Έστω ότι έχουμ δύο παίκτς. Έστω ότι υπάρχουν Μ διαφορτικοί τύποι για τον παίκτη, οι ψ, ψ,..., ψ Μ. Έστω ότι υπάρχουν L διαφορτικοί τύποι για τον παίκτη, οι θ, θ,..., θ L. Θωρούμ ότι στην αρχή κανένας παίκτης δν γνωρίζι τους τύπους των παικτών ούτ του αυτού του δηλαδή). Στην αρχή του παιχνιδιού η «φύση» αποφασίζι για τον τύπο κάθ παίκτη, έστω ψ j, θ i ). Κάθ παίκτης μαθαίνι το δικό του τύπο, όχι όμως του αντιπάλου. 3
νίκυση /) Ο παίκτης, αφού «πληροφορηθί» τον τύπο του ψ j, πιλέγι μια στρατηγική που μγιστοποιί το αναμνόμνο όφλός του, βάσι της κτίμησής του για τις πιθανότητς μφάνισης των διαφόρων τύπων του παίκτη. Παρόμοια, ο παίκτης, αφού «πληροφορηθί» τον τύπο του θ i, πιλέγι μια στρατηγική που μγιστοποιί το αναμνόμνο όφλός του, βάσι της κτίμησής του για τις πιθανότητς μφάνισης των διαφόρων τύπων του παίκτη. ΠΡΟΣΟΧΗ: Διαφορτικοί τύποι του ίδιου παίκτη μπορί να έχουν διαφορτικές κτιμήσις για τη συχνότητα μφάνισης των διαφόρων τύπων του άλλου παίκτη, όπως ίδαμ στη μάχη των φύλων ΙΙ. Ωστόσο, όλς οι κτιμήσις ίναι γνωστές και στους δύο παίκτς! Εάν μπορέσουμ να βρούμ ένα σύνολο στρατηγικών, μία για κάθ τύπο παίκτη, που να ίναι καλύτρς απαντήσις στις πιλογές των αντιπάλων, τότ έχουμ βρι ένα σημίο ισορροπίας Bayes-Nash 33
Εξαρτημένς πιθανότητς /) Προσοχή χριάζται όταν οι διάφορς κατανομές πιθανοτήτων ίναι ξαρτημένς μταξύ τους. ια παράδιγμα, στη μάχη των δύο φύλων ΙΙ, η πιθανότητα μφάνισης του νός τύπου συζύγου ξαρτάται από τον τύπο του άλλου συζύγου. ια παράδιγμα, η πιθανότητα μφάνισης μιας γυναίκας που πιθυμί κοινή έξοδο ξαρτάται από τον τύπο του άντρα αισιόδοξος ή απαισιόδοξος). Μ δδομένο όμως ότι οι δύο παίκτς έχουν κοινή γνώση για τις πιθανότητς, η ανξάρτητη πιθανότητα μφάνισης νός αισιόδοξου άντρα, q, τροποποιίται όταν γνωρίζουμ τι τύπος γυναίκας μφανίστηκ. 34
Εξαρτημένς πιθανότητς /) Οι κ των προτέρων ανξάρτητς πιθανότητς μφάνισης των διαφόρων συνδυασμών τύπων παικτών ίναι οι παρακάτω: Άνδρας υναίκα q ρ q ρ + q) ρ q ρ q ρ + q ρ ) θ Μαζί = ρ θ Χώρια ψ, αισιόδοξος q ρ q -ρ ) ψ, απαισιόδοξος -q) ρ -q) -ρ ) Μια γυναίκα τύπου λοιπόν θ ) θωρί ότι η ξαρτημένη πιθανότητα ο άντρας της να ίναι αισιόδοξος ίναι: Παρόμοια, ένας αισιόδοξος άντρας θωρί ότι η πιθανότητα η γυναίκα του να πιθυμί κοινή έξοδο ίναι: 35
Ισορροπίς καθαρών στρατηγικών /6) Θα λέγξουμ τώρα αν και πότ το σημίο,ο),,ο)), ή μ πιθανότητς το σημίο λ =, λ =0, μ =, μ =0), αποτλί σημίο ισορροπίας Bayes- Nash. Εάν ο άνδρας τύπου αισιόδοξος) πιλέξι, το αναμνόμνο όφλός του ίναι: ρ 3+-ρ ) 0=3 ρ Εάν ο άνδρας τύπου πιλέξι Ο, το αναμνόμνο όφλός του ίναι: ρ 0+-ρ ) =-ρ Ο άντρας τύπου πιλέγι λοιπόν ως καλύτρη απάντηση στις πιλογές,ο) της γυναίκας, όταν 3ρ -ρ ή ρ 0.5. Α ήπδο Όπρα ήπδο 3, 0,0 Όπρα 0,0,3 Α ήπδο Όπρα ήπδο 3,0 0,3 Όπρα 0,,0 υναίκα προτιμά μαζί υναίκα προτιμά χώρια 36
Ισορροπίς καθαρών στρατηγικών /6) Εάν ο άνδρας τύπου απαισιόδοξος) πιλέξι, το αναμνόμνο όφλός του ίναι: ρ 3+-ρ ) 0=3 ρ Εάν ο άνδρας τύπου πιλέξι Ο, το αναμνόμνο όφλός του ίναι: ρ 0+-ρ ) =-ρ Ο άντρας τύπου πιλέγι λοιπόν Ο ως καλύτρη απάντηση στις πιλογές,ο) της γυναίκας, όταν 3ρ -ρ ή ρ 0.5. Α ήπδο Όπρα ήπδο 3, 0,0 Όπρα 0,0,3 υναίκα προτιμά μαζί Α ήπδο Όπρα ήπδο 3,0 0,3 Όπρα 0,,0 υναίκα προτιμά χώρια 37
Ισορροπίς καθαρών στρατηγικών 3/6) ια τη γυναίκα τύπου, οι πιθανότητς να έχι έναν αισιόδοξο και έναν απαισιόδοξο άντρα αντίστοιχα ίναι: q = q ρ q ρ + q) ρ q = q) ρ q ρ + q) ρ ια τη γυναίκα τύπου, οι πιθανότητς να έχι έναν αισιόδοξο και έναν απαισιόδοξο άντρα αντίστοιχα ίναι: q = q ρ) q ρ ) + q) ρ ) q = q) ρ) q) ρ + q) ρ ) 38
Ισορροπίς καθαρών στρατηγικών 4/6) Εάν η γυναίκα τύπου πιλέξι, το αναμνόμνο όφλός της ίναι: q +q 0=q Εάν η γυναίκα τύπου πιλέξι O, το αναμνόμνο όφλός της ίναι: q 0+q 3=3 q Η γυναίκα τύπου πιλέγι λοιπόν ως καλύτρη απάντηση στις πιλογές,ο) του άνδρα, όταν q 3 q ή τλικά q ρ 3 ρ -q). Α ήπδο Όπρα ήπδο 3, 0,0 Όπρα 0,0,3 υναίκα προτιμά μαζί Α ήπδο Όπρα ήπδο 3,0 0,3 Όπρα 0,,0 υναίκα προτιμά χώρια 39
Ισορροπίς καθαρών στρατηγικών 5/6) Τέλος άν η γυναίκα τύπου πιλέξι, το αναμνόμνο όφλός της ίναι: q 0+q =q Εάν η γυναίκα τύπου πιλέξι O, το αναμνόμνο όφλός της ίναι: q 3+q 0=3 q Η γυναίκα τύπου πιλέγι λοιπόν Ο ως καλύτρη απάντηση στις πιλογές,ο) του άνδρα, όταν q 3 q ή τλικά 3 q -ρ )>=- q) -ρ ). Α ήπδο Όπρα ήπδο 3, 0,0 Όπρα 0,0,3 υναίκα προτιμά μαζί Α ήπδο Όπρα ήπδο 3,0 0,3 Όπρα 0,,0 υναίκα προτιμά χώρια 40
Ισορροπίς καθαρών στρατηγικών 6/6) Βρήκαμ τλικά ότι για να ίναι σημίο ισορροπίας Bayes-Nash το,ο,,ο) πρέπι να ισχύουν οι ανισότητς: ρ 0.5 ρ 0.5 q ρ 3 ρ -q) 3 q -ρ )>=-q) -ρ ) ια παράδιγμα, για ρ =0.8, ρ =0., οι δύο τλυταίς ανισότητς γίνονται: q 0.43 q 0.58 Άρα, για ρ =0.8, ρ =0. και q=0.7 το σημίο,ο,,ο) ίναι σημίο ισορροπίας Bayes-Nash. ια να βρούμ το σύνολο των τιμών q,ρ,ρ ) για τις οποίς το παραπάνω σημίο ίναι σημίο ισορροπίας, θα έπρπ να κάνουμ ένα διάγραμμα στο χώρο. 4
Κυριαρχία στρατηγικών /5) Στα παιχνίδια πλήρους πληροφόρησης ίδαμ την έννοια της κυριαρχίας στρατηγικών. Ειδικότρα: Εάν υπάρχι κυρίαρχη στρατηγική, ένας παίκτης παίζι πάντα αυτή. Εάν υπάρχουν κυριαρχούμνς στρατηγικές, αυτές δν πιλέγονται πότ από τους παίκτς. Η έννοια της κυριαρχίας ορίζται και για τα παιχνίδια λλιπούς πληροφόρησης. Σ παιχνίδι μ δύο παίκτς, μια στρατηγική s κυριαρχί έναντι μιας στρατηγικής s νός παίκτη, άν για κάθ συνδυασμό στρατηγικών όλων των τύπων του αντιπάλου του η s δίνι μγαλύτρο αναμνόμνο όφλος από την s. Ανάλογα για παιχνίδια μ πρισσότρους από δύο παίκτς. 4
Κυριαρχία στρατηγικών /5) Έστω το παιχνίδι της Διαπραγμάτυσης Ι ο παίκτης Α ίναι πάντα άκαμπτος). Στο παιχνίδι αυτό ο παίκτης Α δν γνωρίζι τον τύπο του Β. Οι στρατηγικές του Α ίναι δύο, οι Σ και Μ. Οι στρατηγικές του Β ίναι τέσσρις, οι Σ,Σ), Σ,Μ), Μ,Σ) και Μ,Μ). Η στρατηγική Σ του Α κυριαρχί έναντι της Μ πάντα. Παρόμοια, η στρατηγική Σ,Μ) του Β κυριαρχί έναντι των υπολοίπων πάντα. Β Α Σ Μ Σ, 3,0 Μ 0,3, Β Α Σ Μ Σ,0 3, Μ 0,,3 Άκαμπτος Β Ήπιος Β 43
Κυριαρχία στρατηγικών 3/5) Στο παιχνίδι της διαπραγμάτυσης ΙΙ, ο παίκτης Α θα ήθλ να ακολουθήσι παρόμοια τακτική μ τον Β σκληρή ή μτριοπαθή). Ο παίκτης Α πρέπι να αποφασίσι ωστόσο τι τακτική θα ακολουθήσι πριν ββαιωθί για την τακτική του Β. Οι στρατηγικές του Α ίναι οι Σ και Μ. Οι στρατηγικές του Β ίναι οι Σ,Σ), Σ,Μ), Μ,Σ), Μ,Μ). Β Α Σ Μ Σ, 3,0 Μ 0,3, Άκαμπτος Β Β Α Σ Μ Σ 0,0, Μ, 3,3 Ήπιος Β 44
Κυριαρχία στρατηγικών 4/5) Θα λέγξουμ αν και πότ η στρατηγική Σ του Α κυριαρχί της Μ. Θα πρέπι για κάθ στρατηγική του Β να έχι μγαλύτρο αναμνόμνο όφλος. Απέναντι στην Σ,Σ) του Β, οι στρατηγικές Σ και Μ του Α έχουν αναμνόμνο όφλος: Σ: ρ*+-ρ)*0=ρ Μ: ρ*0+-ρ)*=-ρ Θα πρέπι ρ -ρ ή ρ 0.5 Το ίδιο αποτέλσμα προκύπτι και για τις υπόλοιπς τρις στρατηγικές του Β. Άρα για ρ 0.5, η Σ κυριαρχί πί της Μ για τον Α και αντίστροφα για ρ<0.5). Προφανώς κυρίαρχη στρατηγική του Β ίναι η Σ,Μ). Β Α Σ Μ Σ, 3,0 Μ 0,3, Άκαμπτος Β Β Α Σ Μ Σ 0,0, Μ, 3,3 Ήπιος Β 45
Κυριαρχία στρατηγικών 5/5) Τέλος, στα παιχνίδια μ λλιπή πληροφόρηση μπορί να φαρμοστί και η παναλαμβανόμνη απαλοιφή κυριαρχούμνων στρατηγικών Iterated Elimination of Dominated Strategy, IEDS). Ο παίκτης Α μπορί να μην έχι αρχικά καμία κυριαρχούμνη στρατηγική, ύστρα όμως από την απαλοιφή κυριαρχούμνων στρατηγικών του Β μπορί να αποκτήσι και ο Α. Η διαδικασία αυτή μπορί να παναληφθί για πολλούς κύκλους! 46
Μλέτη πρίπτωσης: δυοπώλιο cournot μ λλιπή πληροφόρηση 47
Σύνοψη /3) Έχουμ δι την πρίπτωση του δυοπωλίου Cournot, όπου δυο ταιρίς, και, παράγουν ισοδύναμα προϊόντα. Οι ποσότητς παραγωγής των δύο ταιριών ίναι Q και Q. Η τιμή πώλησης του προϊόντος ίναι: P=a-bQ +Q ), a>0, b>0. Το κόστος παραγωγής ανά μονάδα προϊόντος ίναι κοινό για τις δύο ταιρίς και ίσο μ c. Έχουμ δι ότι η συνάρτηση καλύτρης απάντησης της ταιρίας i σ παραγωγή Q j της ταιρίας j, όπου i j, ίναι: R Q ) i j = a c bq b 0, j, άν Q άν Q j j > a c b a c b 48
b c a c a P b c a Q Q 9 ) 3 3 3 * * = = + = = = π π Το σημίο ισορροπίας Nash ίναι ένα σημίο Q *, Q *), για το οποίο ισχύι: Q *=R Q *) Q *=R Q *) Έχουμ δίξι ότι στο σημίο αυτό ισχύουν: Σύνοψη /3) 49
Σύνοψη 3/3) Στο διάγραμμα φαίνονται οι συναρτήσις καλύτρης απάντησης στο ίδιο διάγραμμα. Η τομή τους ίναι το σημίο ισορροπίας. 50
Δυοπώλιο μ λλιπή πληροφόρηση Έστω τώρα ότι υπάρχι αββαιότητα στην ταιρία σχτικά μ το κόστος παραγωγής της ταιρίας. Το κόστος παραγωγής της ταιρίας ίναι c. Το κόστος παραγωγής της ταιρίας ίναι c+. Την ακριβή τιμή του τη γνωρίζι μόνο η ταιρία. Θωρούμ ότι η απόκλιση έχι γνωστή κατανομή μ μέση τιμή όμως 0: Ε)=0 Θέλουμ να δούμ πώς μταβάλλονται οι παραγωγές των δύο ταιριών και τα κέρδη τους, ανάλογα μ την τιμή του. Επίσης θέλουμ να δούμ αν και πότ συμφέρι την ταιρία να φανρώσι το κόστος παραγωγής της. 5
b Q R Q R ) ) 0 = + > + + = = b c a Q b c a Q b bq c a Q R Q ) άν 0, ) άν, ) ) ) ια την ταιρία μ γνωστό κόστος παραγωγής c+) η συνάρτηση καλύτρης απάντησης βρίσκται ότι ίναι: Μπορούμ μάλιστα να παρατηρήσουμ ότι ισχύι: Επίσης παρατηρούμ ότι ΕQ )=Q 0), δηλαδή η αναμνόμνη παραγωγή της ταιρίας ως καλύτρη απάντηση στην παραγωγή της ταιρίας ίναι αυτή που θα ήταν αν =0. Ανάλυση /3) 5
Ανάλυση /3) Η ταιρία δν γνωρίζι ποια ίναι η παραγωγή της ταιρίας. Εάν η παραγωγή της ταιρίας ίναι Q ), τότ το κέρδος της ταιρίας για παραγωγή Q ίναι: π Q,)=[a-b Q +Q ))-c] Q Λόγω της αββαιότητας, η ταιρία πιθυμί να μγιστοποιήσι το αναμνόμνο κέρδος της, το οποίο ίναι: Επ Q,)=[a-b Q +ΕQ ))-c] Q Όμως ΕQ ) =Q 0), άρα το αναμνόμνο κέρδος της ίναι αυτό που θα ίχ αν το κόστος της ήταν c. Τλικά η καλύτρη απάντηση της ίναι: Q = R Q )) a c bq = b 0, 0), άν Q άν Q 0) 0) > a c b a c b 53
) 0) ) ), ) ) * * * * * * b Q c P Q c P π π = + = 0)) )) ) * * * * * * + = + + = + = P Q Q b a Q Q b a P Η τιμή για =0 b b c a Q b c a Q 3 ), 3 * = = Ένα σημίο ισορροπίας Bayes-Nash, Q *, Q *), θα πρέπι να έχι τις ιδιότητς: Q *=R Q *)) Q *)=R Q *) Μτά από λίγς πράξις προκύπτι το αποτέλσμα: Η τιμή που θα διαμορφωθί στην αγορά ίναι: Τα κέρδη των δύο ταιριών ίναι: Ανάλυση 3/3) 54
Συμπράσματα Η παραγωγή της δν αλλάζι. ια θτικό : Η παραγωγή της μιώνται. Η τιμή πώλησης αυξάνται. Τα κέρδη της αυξάνονται. Τα κέρδη της μιώνονται. Το ακριβώς αντίθτα συμπράσματα προκύπτουν για αρνητικό. 55
> = = b c a Q b c a Q b bq c a Q R Q ) άν 0, ) άν, ) )) + > + + = = b c a Q b c a Q b bq c a Q R Q ) άν 0, ) άν, ) ) ) Τι θα γινόταν άν η ταιρία γνώριζ την τιμή του ; Οι συναρτήσις καλύτρης απάντησης ίναι οι: Η μόνη διαφορά στις παραπάνω συναρτήσις σ σχέση μ την πρίπτωση λλιπούς πληροφόρησης της ταιρίας ) ίναι ότι η καλύτρη απάντηση της υπολογίζται βάσι της πραγματικής παραγωγής Q ) της ταιρίας και όχι της αναμνόμνης Q 0). Λύση μ πλήρη πληροφόρηση /) 56
) 3 ) 3 ) ) 3 ) 3 ) 3 * * * # * * # b Q c P b Q c P P P π π = + + = + = b b c a Q b b c a Q 3 3 ), 3 3 ) # # = + = Το σημίο ισορροπίας Nash ίναι πλέον το Q # ), Q # ): Η τιμή και τα κέρδη των ταιριών διαμορφώνονται ως: Λύση μ πλήρη πληροφόρηση /) 57
Συμπράσματα Εάν η ταιρία γνωρίζι την τιμή του, τότ για >0: Η ταιρία αυξάνι την παραγωγή της. Η ταιρία μιώνι την παραγωγή της, και μάλιστα πρισσότρο από όσο θα την μίων αν η δν γνώριζ την τιμή του. Η τιμή ίναι και πάλι αυξημένη σ σχέση μ την τιμή για =0, αλλά λιγότρο από όταν η δν γνώριζ την τιμή του. Τα κέρδη της ταιρίας ίναι λαφρώς αυξημένα. Τα κέρδη της ταιρίας ίναι σαφώς χαμηλότρα. Άρα, άν >0, δν συμφέρι στην ταιρία να φανρώσι το κόστος παραγωγής της. Ανάλογα αλλά αντίθτα) συμπράσματα προκύπτουν όταν <0. Μάλιστα, άν <0, συμφέρι την ταιρία να φανρώσι το κόστος παραγωγής της στους αντιπάλους. Συμπέρασμα: Εάν μια ταιρία δν φανρώνι το κόστος παραγωγής της, μάλλον αυτό ίναι μγάλο! 58
Τέλος Ενότητας