Σηματοδοτικά Παίγνια και Τέλεια Μπεϊζιανή Ισορροπία

Σχετικά έγγραφα
Το Υπόδειγμα της Οριακής Τιμολόγησης

Βασικές Αρχές της Θεωρίας Παιγνίων

- Παράδειγμα 2. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να

A 1 B 1 B 2 A 2 A 2 B 2

2. Διαφήμιση σε Αγορές όπου υπάρχουν πολλές Επιχειρήσεις

1. Επιλογή Διαφημιστικής Δαπάνης στη Μονοπωλιακή Αγορά

Ισορροπία σε Αγορές Διαφοροποιημένων Προϊόντων

Στατικά Παίγνια Ελλιπούς Πληροφόρησης

1. Επιλογή Ποιότητας στην Ολιγοπωλιακή Αγορά: Κάθετη Διαφοροποίηση Προϊόντος

Ενημερωτική Διαφοροποίηση Προϊόντος: Ο Ρόλος της Διαφήμισης

Αποτροπή Εισόδου: Το Υπόδειγμα των Spence-Dixit

Ολιγοπωλιακή Ισορροπία

(2) Χωροθετικά Υποδείγματα Διαφοροποιημένου Προϊόντος

Κριτικές στο Υπόδειγμα Cournot

Extensive Games with Imperfect Information

Γενική Ανταγωνιστική Ισορροπία

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΕΥΤΕΡΟ- ΚΥΡΙΑΡΧΟΥΜΕΝΗ ΣΤΡΑΤΗΓΙΚΗ- PRISONER S DILLEMA ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

F NF. t 1 = S. F NF F -1, 1 2, -1 NF 0, 2 0, 0 t 1 = W

Γενίκευση: Πλήρως Μη Γραμμική Τιμολόγηση

Διάλεξη 7. Θεωρία παιγνίων VA 28, 29

(γ) Τις μορφές στρατηγικής αλληλεπίδρασης που αναπτύσσονται

Κυριαρχία και μεικτές στρατηγικές Μεικτές στρατηγικές και κυριαρχία Είδαμε ότι μια στρατηγική του παίκτη i είναι κυριαρχούμενη, αν υπάρχει κάποια άλλη

Δεύτερο πακέτο ασκήσεων

Κεφάλαιο 28 Ολιγοπώλιο

ΑΠΑΝΤΗΣΕΙΣ ΠΟΛΛΑΠΛΗΣ ΕΠΙΛΟΓΗΣ Αρ. Απάντηση Αρ. Απάντηση Ερώτησης 1. A 6. C 2. C 7. A 3. A 8. E 4. B 9. A 5. E 10. C

Σηματοδότηση σηματοδοτήσουν

3. Ανταγωνισμός ως προς τις Τιμές: Το Υπόδειγμα Bertrand

ΟΙΚ 362 ΔΟΜΗ ΚΑΙ ΣΤΡΑΤΗΓΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ 7 η Σειρά Ασκήσεων. (Επιλογή Ποιότητας και Κάθετη Διαφοροποίηση Προϊόντος)

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0

Κεφάλαιο 29 Θεωρία παιγνίων

3. Παίγνια Αλληλουχίας

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΠΕΜΠΤΟ ΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.


Γενική Ανταγωνιστική Ισορροπία και Αποτελεσματικές κατά Pareto Κατανομές σε Ανταλλακτική Οικονομία

Επιλογή Ποιότητας και Κάθετη Διαφοροποίηση Προϊόντος

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

(2β) Το Υπόδειγμα της Κυκλικής Πόλης ή Υπόδειγμα του Salop

Γενική Ανταγωνιστική Ισορροπία σε Οικονομία με Έναν Καταναλωτή και Έναν Παραγωγό

B 1 A 1 B 2 A 2. t 1. t 3 w. t 2 A 3 B 3. t 4. t 5

ΑΣΚΗΣΗ 1 ΑΣΚΗΣΗ 2 ΑΣΚΗΣΗ 3

10/3/17. Κεφάλαιο 28 Ολιγοπώλιο. Μικροοικονομική. Ολιγοπώλιο. Ολιγοπώλιο. Ανταγωνισµός ποσότητας. Μια σύγχρονη προσέγγιση

ΠΜΣ Ενέργειας, Τμήμα ΔΕΣ, ΠαΠει

Άριστες κατά Pareto Κατανομές

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

Η προσδοκώµενη χρησιµότητα του κέρδους όταν η πιθανότητα η τιµή του προϊόντος Ρ1 είναι ψ, χ το επίπεδο παραγωγής και c(x) η συνάρτηση κόστους, είναι

Άριστες κατά Pareto Κατανομές και το Πρώτο Θεώρημα Ευημερίας

ΣΥΝΘΕΤΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Εργοδοτικές Εισφορές και Φορολογία στους Εργάτες

Μονοψωνιακή Ισορροπία

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Ηθικός Κίνδυνος. Το βασικό υπόδειγμα. Παρουσιάζεται ένα στοχαστικό πρόβλημα χρηματοδότησης όταν τα αντισυμβαλλόμενα μέρη έχουν συμμετρική πληροφόρηση.

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 7: Τέλεια ισορροπία Nash για υποπαίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Μοντέλα των Cournotκαι Bertrand

Διάκριση Τιμών 2 ου Βαθμού: Μη Γραμμική Τιμολόγηση (Nonlinear Pricing) - Η διάκριση τιμών 3 ου βαθμού προϋποθέτει ότι η μονοπωλιακή

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

( ) ΘΕΜΑ 1 κανονική κατανομή

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

Δυσμενής Επιλογή. Το βασικό υπόδειγμα

2. ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Μονοπωλιακή Ισορροπία - Αν η αγορά του αγαθού Α είναι πλήρως ανταγωνιστική, τότε η ατομική επιχείρηση θεωρεί δεδομένη την τιμή (p) και, επομένως,

Άριστες κατά Pareto Κατανομές και το Πρώτο Θεώρημα Ευημερίας

Θεωρία Σηματοδότησης

ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

(1β) Μη Χωροθετικά Υποδείγματα Διαφοροποιημένου Προϊόντος με Ενδογενές Πλήθος Επιχειρήσεων

Ζήτηση, Προσφορά και Ισορροπία στην Ανταγωνιστική Αγορά

Διάλεξη 3. Οικονομικά της ευημερίας. Οικονομικά της ευημερίας 3/9/2017. Περίγραμμα. Εργαλεία δεοντολογικής ανάλυσης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Θεωρία Παιγνίων-Ολιγοπώλιο σε ποσότητες

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΕΙ ΠΑΤΡΑΣ ΤΕΙ ΠΑΤΡΑΣ ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΏΝ ΠΑΙΓΝΙΩΝ- ΠΡΟΓΡΑΜΜΑ GAMBIT

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

Κατώτατος Μισθός. - Οι περιουσίες των καταναλωτών παριστάνονται από τα διανύσματα:


ΟΜΑΔΑ Β Σχολικό βιβλίο σελ ως «μεταβλητούς συντελεστές μαζί με το αντίστοιχο διάγραμμα. TC Συνολικό κόστος. VC Μεταβλητό κόστος

3. ΠΟΡΟΙ ΚΑΙ ΔΙΕΘΝΕΣ ΕΜΠΟΡΙΟ: ΥΠΟΔΕΙΓΜΑ HECKSCHER-OHLIN

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

Μικροοικονομική Ι. Ενότητα # 6: Θεωρία παιγνίων Διδάσκων: Πάνος Τσακλόγλου Τμήμα: Διεθνών και Ευρωπαϊκών Οικονομικών Σπουδών

A 2 B 2 Γ 2. u 1 (A 1, A 2 ) = 3 > 1 = u 1 (B 1, A 2 ) u 1 (A 1, Γ 2 ) = 1 > 0 = u 1 (B 1, Γ 2 ) A 2 B 2

Πλήρης ανταγωνισμός. Καθηγήτρια: Β. ΠΕΚΚΑ- ΟΙΚΟΝΟΜΟΥ. Υποψήφια Διδάκτωρ: Σ. ΤΑΚΑΟΓΛΟΥ

ΑΣΚΗΣΗ 1 Βρείτε την ισορροπία των ακόλουθων παιγνίων απαλείφοντας διαδοχικά τις κυριαρχούµενες στρατηγικές.

Κεφάλαιο 5 R (2, 3) R (3, 0)

Διάλεξη 3. Οικονομικά της ευημερίας 2/26/2016. Περίγραμμα. Εργαλεία δεοντολογικής ανάλυσης. Αποτελεσματικότητα κατά Pareto: ορισμός. ορισμός.

Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Νομισματική και Συναλλαγματική Πολιτική σε μια Μικρή Ανοικτή Οικονομία. Σταθερές ή Κυμαινόμενες Ισοτιμίες;

Κεφάλαιο 2ο (α) Αµιγείς Στρατηγικές (β) Μεικτές Στρατηγικές (α) Αµιγείς Στρατηγικές. Επαναλαµβάνουµε:

Notes. Notes. Notes. Notes Ε 10,10 0,3 Λ 3,0 2,2

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 12: Δημοπρασίες ανερχόμενων και κατερχόμενων προσφορών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Βρέντζου Τίνα Φυσικός Μεταπτυχιακός τίτλος ΜEd: «Σπουδές στην εκπαίδευση»

Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 6: Εκτατική μορφή παίγνιων. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Έστω ότι έχουµε 2 µάρκες υπολογιστών: A (Apricot), B (Banana) [ ιαρκή Αγαθά].

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Ασκήσεις μελέτης της 16 ης διάλεξης

Transcript:

Σηματοδοτικά Παίγνια και Τέλεια Μπεϊζιανή Ισορροπία - Ορισμός. Ένα παίγνιο ονομάζεται παίγνιο πλήρους πληροφόρησης (game of complete information) όταν κάθε παίκτης διαθέτει πλήρη πληροφόρηση για τις συναρτήσεις απόδοσης των υπόλοιπων παικτών. Παράδειγμα. Κάθε επιχείρηση γνωρίζει τις συναρτήσεις κόστους όλων των υπόλοιπων επιχειρήσεων που συμμετέχουν στην αγορά ενός αγαθού. - Ορισμός 2. Ένα παίγνιο ονομάζεται παίγνιο μη πλήρους πληροφόρησης (game of incomplete information) όταν τουλάχιστον ένας παίκτης δε διαθέτει πλήρη πληροφόρηση για τη συνάρτηση απόδοσης κάποιου άλλου παίκτη που συμμετέχει στο παίγνιο. Παράδειγμα. Μια επιχείρηση δε γνωρίζει τη συνάρτηση κόστους μιας άλλης επιχείρησης που συμμετέχει στην αγορά ενός αγαθού.

- Η ανάλυση ενός παιγνίου μη πλήρους πληροφόρησης απαιτεί να ληφθούν υπόψη οι πεποιθήσεις (beliefs) των παικτών για τις συναρτήσεις απόδοσης των υπόλοιπων παικτών (π.χ. για το κόστος των υπόλοιπων επιχειρήσεων) που συμμετέχουν στο παίγνιο. - Σύμφωνα με την προσέγγιση του Harsanyi (967), η συνάρτηση απόδοσης κάθε παίκτη καθορίζεται από την πραγματοποίηση μιας τυχαίας μεταβλητής. - Δηλαδή: Η φύση επιλέγει την τιμή της τυχαίας μεταβλητής που καθορίζει τον τύπο (τη συνάρτηση απόδοσης π.χ. το κόστος) κάθε παίκτη και κάθε παίκτης γνωρίζει τον δικό του τύπο αλλά δε γνωρίζει με βεβαιότητα τον τύπο των υπόλοιπων παικτών που συμμετέχουν στο παίγνιο. - Τα παίγνια αυτής της μορφής ονομάζονται Μπεϊζιανά παίγνια (Bayesian games). -H πιο συνηθισμένη κατηγορία Μπεϊζιανών παιγνίων είναι τα σηματοδοτικά παίγνια. 2

- Ορισμός 3. Ένα σηματοδοτικό παίγνιο (signaling game) είναι ένα δυναμικό παίγνιο ατελούς πληροφόρησης στο οποίο συμμετέχουν δύο παίκτες,2 και έχει την εξής χρονική διάρθρωση: Στάδιο. Η φύση επιλέγει τον τύπο (t i ) του παίκτη από ένα σύνολο εφικτών τύπων T = { t,..., t n } σύμφωνα με μια κατανομή n πιθανότητας pt ( i), όπου pt ( i) > 0 και pt ( i) =. - Για απλούστευση, υποθέτουμε ότι: Υπάρχουν δύο πιθανοί τύποι του παίκτη, δηλαδή T = { t, t2}. Κάθε τύπος επιλέγεται με ίση πιθανότητα από τη φύση, δηλαδή pt ( ) = pt ( ) = /2. 2 Στάδιο 2. Οπαίκτης (Αποστολέας Sender) παρατηρεί τον τύπο του (t i ) και επιλέγει μια ενέργεια (στέλνει ένα μήνυμα) m από ένα σύνολο εφικτών ενεργειών/μηνυμάτων M = { LR, }. (δηλαδή, οπαίκτης επιλέγει L ή R) i= 3

Στάδιο 3. Οπαίκτης2(Παραλήπτης Receiver) παρατηρεί την ενέργεια/μήνυμα (αλλά όχι τον τύπο) του παίκτη και επιλέγει μια ενέργεια α από ένα σύνολο εφικτών ενεργειών A = { U, D}. (δηλαδή, οπαίκτης2 επιλέγει U ή D) - Παρατήρηση. Σε αρκετές εφαρμογές, τα σύνολα T, M ή/και Α μπορεί να είναι συνεχή διαστήματα. Παράδειγμα. Οπαίκτης μπορεί να είναι μια επιχείρηση που επιλέγει την τιμή ( p 0) στην οποία θα πουλήσει το προϊόν της, οπότε: M = [0, + ). - Οι συναρτήσεις απόδοσης των παικτών είναι u ( t, m, α), u ( t, m, α). i 2 - Η βασική ιδέα ενός σηματοδοτικού παιγνίου είναι ότι ο παίκτης στέλνει ένα μήνυμα (m) με σκοπό να σηματοδοτήσει τον τύπο του (δηλαδή να αποκαλύψει την κρυμμένη πληροφορία) στον παίκτη 2. - Παράδειγμα σηματοδοτικού παιγνίου. Στο υπόδειγμα της αγοράς εργασίας του Spence (974): Οπαίκτης είναι ο εργάτης και ο τύπος του παίκτη είναι η (χαμηλή ή υψηλή) παραγωγική ικανότητα του εργάτη. i 4

Οπαίκτης2 είναι ο εργοδότης (η επιχείρηση). Η ενέργεια/μήνυμα του παίκτη είναι το επίπεδο εκπαίδευσης που επιλέγει ο εργάτης. Η ενέργεια του παίκτη 2 είναι ο μισθός που πληρώνει η επιχείρηση στον εργάτη. - Παρατήρηση. Γνωρίζουμε ότι η στρατηγική κάθε παίκτη είναι ένα πλήρες σχέδιο δράσης, δηλαδή προσδιορίζει μια ενέργεια για κάθε πιθανή περίσταση υπό την οποία καλείται να κάνει την επιλογή του ο συγκεκριμένος παίκτης. Άρα: Η στρατηγική του παίκτη προσδιορίζει την ενέργεια/μήνυμα του παίκτη για κάθε πιθανό τύπο που μπορεί να επιλέξει η φύση δηλαδή ηστρατηγικήτουπαίκτη είναι ένα ζεύγος ενεργειών: ( mt ( ), mt ( )) 2 [όπου i του είναι t i ] mt ( ) { LR, } είναι η ενέργεια/μήνυμα του παίκτη όταν ο τύπος Ο χώρος στρατηγικών (δηλαδή το σύνολο των εφικτών στρατηγικών) 5 του παίκτη είναι: ( ( ), ( )) ((, ),(, ),(, ),(, )) S = m t m t = L L L R R L R R 2

- Οι στρατηγικές (L,L) και (R,R) του παίκτη ονομάζονται συγκεντρωτικές στρατηγικές (pooling strategies), διότιόλοιοιπιθανοί τύποι του παίκτη επιλέγουν την ίδια ενέργεια. - Οι στρατηγικές (L,R) και (R,L) του παίκτη ονομάζονται διαχωριστικές στρατηγικές (separating strategies), διότι κάθε πιθανός τύπος του παίκτη επιλέγει διαφορετική ενέργεια. Η στρατηγική του παίκτη 2 προσδιορίζει την ενέργεια του παίκτη 2 για κάθε πιθανή ενέργεια που μπορεί να επιλέξει ο παίκτης δηλαδή η στρατηγική του παίκτη 2 είναι ένα ζεύγος ενεργειών: ( al ( ), ar ( )) [όπου am ( ) { U, D} του παίκτη είναι m] είναι η ενέργεια του παίκτη 2 όταν η ενέργεια Ο χώρος στρατηγικών (δηλαδή το σύνολο των εφικτών στρατηγικών) του παίκτη 2 είναι: ( ) ( ) S2 = a( L), a( R) = ( U, U),( U, D),( D, U),( D, D) 6

- Ορισμός 4. Ένα σύστημα πεποιθήσεων (system of beliefs) του παίκτη 2 προσδιορίζει την πιθανότητα μ( t με την οποία ο i / m) παίκτης 2 πιστεύει ότι ο τύπος του παίκτη είναι t i, δεδομένου ότι ο παίκτης επιλέγει την ενέργεια m { L, R}, όπου: μ( ti / m) 0 και μ( ti / m) = 2 i= - Δηλαδή, ένα σύστημα πεποιθήσεων του παίκτη 2 προσδιορίζει τις πιθανότητες: μ( t/ L), μ( t2/ L) = μ( t/ L) μ( t / R), μ( t / R) = μ( t / R) 2 - Ορισμός 5. Μια τέλεια Μπεϊζιανή ισορροπία (Perfect Bayesian Equilibrium PBE) ενός σηματοδοτικού παιγνίου αποτελείται από ένα ζεύγος στρατηγικών ( m*( t), m*( t2) ),( a*( L), a*( R) ) των παικτών,2 και ένα σύστημα πεποιθήσεων ( μ*( t/ L), μ*( t/ R) ) του παίκτη 2 τέτοια ώστε: 7

(i) Οι πεποιθήσεις του παίκτη 2 μετά την παρατήρηση κάθε ενέργειας που επιλέγεται με θετική πιθανότητα στην ισορροπία (beliefs along the equilibrium path) προσδιορίζονται από τον κανόνα του Bayes: Pm ( / ti) Pt ( i) Pm ( / ti) Pt ( i) μ *( ti / m) = = P( m) P( m/ t ) P( t ) + P( m/ t ) P( t ) 2 2 (ii) Κάθε ενέργεια του παίκτη 2 (με δεδομένες τις πεποιθήσεις του) μεγιστοποιεί την αναμενόμενη χρησιμότητα του παίκτη 2 (δηλαδή αποτελεί την άριστη αντίδραση του παίκτη 2 σε κάθε πιθανή ενέργεια (m) του παίκτη ): { a} 2 a*( m) = arg max μ( ti / m) U2( ti, m, a) i= (iii) Κάθε ενέργεια του παίκτη (για κάθε πιθανό τύπο του παίκτη και με δεδομένη τη στρατηγική ισορροπίας του παίκτη 2) μεγιστοποιεί τη χρησιμότητα του παίκτη : m*( t ) = arg max U ( t, m, a*) i { m} i 8

( ) - Παρατήρηση. Αν η στρατηγική ισορροπίας m*( t), m*( t2) του παίκτη είναι συγκεντρωτική (δηλαδή αν όλοι οι τύποι του παίκτη επιλέγουν την ίδια ενέργεια στην ισορροπία), τότε η ισορροπία του παιγνίου ονομάζεται συγκεντρωτική (pooling equilibrium). Αντίθετα, αν η στρατηγική ισορροπίας ( m*( t), m*( t2) ) του παίκτη είναι διαχωριστική (δηλαδή αν κάθε τύπος του παίκτη επιλέγει διαφορετική ενέργεια στην ισορροπία), τότε η ισορροπία του παιγνίου ονομάζεται διαχωριστική (separating equilibrium). Μεθοδολογία Υπολογισμού PBE σε Σηματοδοτικά Παίγνια - Σε κάθε σηματοδοτικό παίγνιο της μορφής που περιγράφτηκε παραπάνω, υπάρχουν τέσσερις πιθανές ισορροπίες: (i) Διαχωριστική ισορροπία όπου ο τύπος t του παίκτη επιλέγει L και ο τύπος t 2 του παίκτη επιλέγει R. (ii) Διαχωριστική ισορροπία όπου ο τύπος t του παίκτη επιλέγει R και ο τύπος t 2 του παίκτη επιλέγει L. 9

(iii) Συγκεντρωτική ισορροπία όπου και οι δύο τύποι του παίκτη επιλέγουν L. (iv) Συγκεντρωτική ισορροπία όπου και οι δύο τύποι του παίκτη επιλέγουν R. - Για να υπολογίσουμε τις ισορροπίες του παιγνίου, ακολουθούμε τα εξής βήματα: Βήμα. Αποφασίζουμε αν αναζητούμε μια διαχωριστική ή συγκεντρωτική ισορροπία και αποδίδουμε μια στρατηγική mt ( ), mt ( 2) στον παίκτη. ( ) Βήμα 2. Χρησιμοποιούμε τον κανόνα του Bayes για να υπολογίσουμε τις πεποιθήσεις μ( t του παίκτη 2 μετά από κάθε i / m) ενέργεια (m) που επιλέγεται με θετική πιθανότητα από τον παίκτη στην ισορροπία (beliefs along the equilibrium path), ενώ αποδίδουμε τυχαίες πεποιθήσεις στον παίκτη 2 μετά από κάθε ενέργεια του παίκτη που δεν επιλέγεται στην ισορροπία (beliefs off the equilibrium path). 0

- Βήμα 3. Υπολογίζουμε τις άριστες αντιδράσεις (α(l), α(r)) του παίκτη 2 σε κάθε πιθανή ενέργεια m { L, R} του παίκτη (με δεδομένες τις πεποιθήσεις που υπολογίσαμε στο προηγούμενο βήμα). - Βήμα 4. Ελέγχουμε αν κάποιος τύπος του παίκτη έχει κίνητρο να αποκλίνει από τη στρατηγική που του αποδώσαμε στο πρώτο βήμα. Αν κανένας τύπος του παίκτη δεν έχει κίνητρο να αποκλίνει από τη στρατηγική που του αποδώσαμε στο πρώτο βήμα, τότε το ζεύγος στρατηγικών ( mt ( ), mt ( 2) ), (α(l), α(r)) και το σύστημα πεποιθήσεων( μ( t/ L), μ( t/ R) ) που προσδιορίσαμε παραπάνω αποτελούν μια τέλεια Μπεϊζιανή ισορροπία (PBE) του παιγνίου. Αν κάποιος τύπος του παίκτη έχει κίνητρο να αποκλίνει από τη στρατηγική που του αποδώσαμε στο πρώτο βήμα, τότε το ζεύγος στρατηγικών ( mt ( ), mt ( 2) ), (α(l), α(r)) και το σύστημα πεποιθήσεων μ( t/ L), μ( t/ R) που προσδιορίσαμε παραπάνω δεν αποτελούν μια PBE του παιγνίου. ( )

- Βήμα 5. Επιστρέφουμε στο Βήμα και αποδίδουμε μια διαφορετική στρατηγική στον παίκτη (μέχρι να ολοκληρώσουμε τη διερεύνηση και των τεσσάρων πιθανών ισορροπιών του παιγνίου). Παράδειγμα (Υπολογισμός PBE σε Σηματοδοτικό Παίγνιο). - Το παρακάτω σχήμα παριστάνει ένα σηματοδοτικό παίγνιο σε εκτεταμένη μορφή (extensive form), όπου έχουμε υποθέσει τις εξής συναρτήσειςαπόδοσηςγιατουςπαίκτες,2: u( t, L, U) =, u( t, L, D) = 4, u( t, R, U) = 2, u( t, R, D) = 0 u ( t, L, U) = 2, u ( t, L, D) = 0, u ( t, R, U) =, u ( t, R, D) = 2 2 2 2 u2( t, L, U) = 3, u2( t, L, D) = 0, u2( t, R, U) =, u2( t, R, D) = 0 u ( t, L, U) = 4, u ( t, L, D) =, u ( t, R, U) = 0, u ( t, R, D) = 2 2 2 2 2 2 2 2 2 2

(, 3) (4,0) U D μ( t / L) L t R μ ( t / R) U D (2,) (0,0) pt ( ) = /2 Ν (2,4) (0,) U D L t 2 pt ( 2) = /2 μ( t / L) 2 R μ( t / R) 2 U D (, 0) (, 2) 3

Αναζήτηση Διαχωριστικών Ισορροπιών (i) Διερευνούμε την πιθανή ύπαρξη διαχωριστικής ισορροπίας όπου ο τύπος t του παίκτη επιλέγει L και ο τύπος t 2 του παίκτη επιλέγει R. - Βήμα. Η στρατηγική που αποδίδουμε στον παίκτη είναι: ( mt ( ), mt ( )) = ( LR, ) 2 - Βήμα 2. Αφού και οι δύο ενέργειες L,R επιλέγονται με θετική πιθανότητα στην ισορροπία, αμφότερες οι πεποιθήσεις μ μ του παίκτη 2 ανήκουν στο μονοπάτι ισορροπίας και προσδιορίζονται σύμφωνα με τον κανόνα του Bayes: i μ PL ( / t) Pt ( ) (/2) = = = ( t / L) PL ( / t) Pt ( ) + PL ( / t2) Pt ( 2) (/2) + 0 (/2) μ( t / L) = μ( t / L) = 0 i μ 2 PR ( / t) Pt ( ) 0(/2) = = = ( t / R) 0 PR ( / t) Pt ( ) + PR ( / t2) Pt ( 2) 0 (/ 2) + (/ 2) μ( t / R) = μ( t / R) = 2 ( t / L), ( t / R) 4

- Άρα, το σύστημα πεποιθήσεων του παίκτη 2 είναι: μ( t / L) =, μ( t / R) = 0 - Βήμα 3. Υπολογίζουμε την άριστη αντίδραση του παίκτη 2 σε κάθε πιθανή ενέργεια του παίκτη (με δεδομένο το σύστημα πεποιθήσεων του παίκτη 2). Άριστη Αντίδραση παίκτη 2 στην ενέργεια L του παίκτη - Η αναμενόμενη απόδοση του παίκτη 2 αν επιλέξει U είναι: Eu ( LU, ) = μ( t / L) u( t, LU, ) + μ( t / L) u( t, LU, ) = 3 2 2 2 2 2 - Η αναμενόμενη απόδοση του παίκτη 2 αν επιλέξει D είναι: Eu ( L, D) = μ( t / L) u ( t, L, D) + μ( t / L) u ( t, L, D) = 0 2 2 2 2 2 - Άρα: Eu ( L, U ) = 3 > Eu ( L, D) = 0 2 2 H άριστη αντίδραση του παίκτη 2 στην ενέργεια L του παίκτη είναι να επιλέξει U, δηλαδή: α ( L) = U. 5

Άριστη Αντίδραση παίκτη 2 στην ενέργεια R του παίκτη - Η αναμενόμενη απόδοση του παίκτη 2 αν επιλέξει U είναι: Eu( RU, ) = μ( t / R) u( t, RU, ) + μ( t / R) u( t, RU, ) = 0 2 2 2 2 2 - Η αναμενόμενη απόδοση του παίκτη 2 αν επιλέξει D είναι: Eu( RD, ) = μ( t/ R) u( t, RD, ) + μ( t / R) u( t, RD, ) = 2 2 2 2 2 2 - Άρα: Eu ( R, D) = 2 > Eu ( R, U ) = 0 2 2 H άριστη αντίδραση του παίκτη 2 στην ενέργεια R του παίκτη είναι να επιλέξει D, δηλαδή: α ( R) = D. - Συμπέρασμα. Η στρατηγική του παίκτη 2 είναι: ( al ( ), ar ( )) = ( UD, ) - Βήμα 4. Ελέγχουμε αν κάποιος τύπος του παίκτη έχει κίνητρο να αποκλίνει από τη στρατηγική που του αποδώσαμε στο πρώτο βήμα. Έλεγχος για τον τύπο t - Η απόδοση του παίκτη αν ακολουθήσει την αποδιδόμενη στρατηγική και επιλέξει L είναι: u( t, L, U ) = 6

- Η απόδοση του παίκτη αν αποκλίνει από την αποδιδόμενη στρατηγική και επιλέξει R είναι: u ( t, R, D ) = 0 - Άρα: Οτύπος t δεν έχει κίνητρο να αποκλίνει από την αποδιδόμενη στρατηγική mt ( ) = L. Έλεγχος για τον τύπο t 2 - Η απόδοση του παίκτη αν ακολουθήσει την αποδιδόμενη στρατηγική και επιλέξει R είναι: u( t2, R, D ) = - Η απόδοση του παίκτη αν αποκλίνει από την αποδιδόμενη στρατηγική και επιλέξει L είναι: u ( t, L, U ) = 2 2 - Άρα: Οτύπος t 2 έχει κίνητρο να αποκλίνει από την αποδιδόμενη στρατηγική mt ( ) = R. 2 Αφού υπάρχει κάποιος τύπος του παίκτη που έχει κίνητρο να αποκλίνει από την αποδιδόμενη στρατηγική ( mt (, δεν ), mt ( 2)) = ( LR, ) υπάρχει διαχωριστική ισορροπία όπου ο τύπος t επιλέγει L και ο τύπος t 2 επιλέγει R. 7

- Βήμα 5. Επιστρέφουμε στο Βήμα και αποδίδουμε μια διαφορετική στρατηγική στον παίκτη. (ii) Διερευνούμε την πιθανή ύπαρξη διαχωριστικής ισορροπίας όπου ο τύπος t του παίκτη επιλέγει R και ο τύπος t 2 του παίκτη επιλέγει L. - Βήμα. Η στρατηγική που αποδίδουμε στον παίκτη είναι: ( mt ( ), mt ( )) = ( RL, ) 2 - Βήμα 2. Αφού και οι δύο ενέργειες L,R επιλέγονται με θετική πιθανότητα στην ισορροπία, αμφότερες οι πεποιθήσεις του παίκτη 2 ανήκουν στο μονοπάτι ισορροπίας και προσδιορίζονται σύμφωνα με τον κανόνα του Bayes: PL ( / t) Pt ( ) 0(/2) i μ( t / L) = = = 0 PL ( / t) Pt ( ) + PL ( / t) Pt ( ) 0 (/2) + (/2) μ( t / L) = μ( t / L) = i μ t 2 R 2 2 PR ( / t) Pt ( ) (/2) = = = ( / ) PR ( / t) Pt ( ) + PR ( / t2) Pt ( 2) (/2) + 0 (/2) μ( t / R) = μ( t / R) = 0 2 8

- Άρα, το σύστημα πεποιθήσεων του παίκτη 2 είναι: μ( t / L) = 0, μ( t / R) = - Βήμα 3. Υπολογίζουμε την άριστη αντίδραση του παίκτη 2 σε κάθε πιθανή ενέργεια του παίκτη (με δεδομένο το σύστημα πεποιθήσεων του παίκτη 2). Άριστη Αντίδραση παίκτη 2 στην ενέργεια L του παίκτη - Η αναμενόμενη απόδοση του παίκτη 2 αν επιλέξει U είναι: Eu ( LU, ) = μ( t / L) u( t, LU, ) + μ( t / L) u( t, LU, ) = 4 2 2 2 2 2 - Η αναμενόμενη απόδοση του παίκτη 2 αν επιλέξει D είναι: Eu( LD, ) = μ( t/ L) u( t, LD, ) + μ( t / L) u( t, LD, ) = 2 2 2 2 2 - Άρα: Eu ( L, U ) = 4 > Eu ( L, D) = 2 2 H άριστη αντίδραση του παίκτη 2 στην ενέργεια L του παίκτη είναι να επιλέξει U, δηλαδή: α ( L) = U. 9

Άριστη Αντίδραση παίκτη 2 στην ενέργεια R του παίκτη - Η αναμενόμενη απόδοση του παίκτη 2 αν επιλέξει U είναι: Eu( RU, ) = μ( t / R) u( t, RU, ) + μ( t / R) u( t, RU, ) = 2 2 2 2 2 - Η αναμενόμενη απόδοση του παίκτη 2 αν επιλέξει D είναι: Eu( RD, ) = μ( t/ R) u( t, RD, ) + μ( t / R) u( t, RD, ) = 0 2 2 2 2 2 - Άρα: Eu ( R, U ) = > Eu ( R, D) = 0 2 2 H άριστη αντίδραση του παίκτη 2 στην ενέργεια R του παίκτη είναι να επιλέξει U, δηλαδή: α ( R) = U. - Συμπέρασμα. Η στρατηγική του παίκτη 2 είναι: ( al ( ), ar ( )) = ( UU, ) - Βήμα 4. Ελέγχουμε αν κάποιος τύπος του παίκτη έχει κίνητρο να αποκλίνει από τη στρατηγική που του αποδώσαμε στο πρώτο βήμα. Έλεγχος για τον τύπο t - Η απόδοση του παίκτη αν ακολουθήσει την αποδιδόμενη στρατηγική και επιλέξει R είναι: u( t, R, U ) = 2 20

- Η απόδοση του παίκτη αν αποκλίνει από την αποδιδόμενη στρατηγική και επιλέξει L είναι: u ( t, L, U ) = - Άρα: Οτύπος t δεν έχει κίνητρο να αποκλίνει από την αποδιδόμενη στρατηγική mt ( ) = R. Έλεγχος για τον τύπο t 2 - Η απόδοση του παίκτη αν ακολουθήσει την αποδιδόμενη στρατηγική και επιλέξει L είναι: u( t2, L, U ) = 2 - Η απόδοση του παίκτη αν αποκλίνει από την αποδιδόμενη στρατηγική και επιλέξει R είναι: u ( t, R, U ) = 2 - Άρα: Οτύπος t 2 δεν έχει κίνητρο να αποκλίνει από την αποδιδόμενη στρατηγική mt ( ) = L. 2 Αφού κανένας τύπος του παίκτη δεν έχει κίνητρο να αποκλίνει από την αποδιδόμενη στρατηγική ( mt (, υπάρχει ), mt ( 2)) = ( RL, ) διαχωριστική ισορροπία όπου ο τύπος t επιλέγει R και ο τύπος t 2 επιλέγει L. H ισορροπία αυτή είναι: 2

( mt ( ), mt ( )) = ( RL, ) 2 ( al ( ), ar ( )) = ( UU, ) μ( t / L) = 0 μ( t / R) = (Στρατηγική ισορροπίας του παίκτη ) (Στρατηγική ισορροπίας του παίκτη 2) (Πεποιθήσεις που υποστηρίζουν τις στρατηγικές ισορροπίας) - Βήμα 5. Επιστρέφουμε στο Βήμα και αποδίδουμε μια διαφορετική στρατηγική στον παίκτη. Αναζήτηση Συγκεντρωτικών Ισορροπιών (iii) Διερευνούμε την πιθανή ύπαρξη συγκεντρωτικής ισορροπίας όπου και οι δύο τύποι t, t 2 του παίκτη επιλέγουν L. - Βήμα. Η στρατηγική που αποδίδουμε στον παίκτη είναι: ( mt ( ), mt ( )) = ( LL, ) 2 22

- Βήμα 2. Αφού μόνο η ενέργεια L επιλέγεται με θετική πιθανότητα στην ισορροπία, μόνο η πεποίθηση μ( t / L) του παίκτη 2 ανήκει στο μονοπάτι ισορροπίας και προσδιορίζεται σύμφωνα με τον κανόνα του Bayes: PL ( / t) Pt ( ) (/2) i μ( t / L) = = = /2 PL ( / t) Pt ( ) + PL ( / t) Pt ( ) (/2) + (/2) 2 2 2 μ( t / L) = μ( t / L) = /2 - Αφού η ενέργεια R δεν επιλέγεται στην ισορροπία, αποδίδουμε προς στιγμή μια τυχαία πεποίθηση μ( t / R) στον παίκτη 2 μετά την παρατήρηση της ενέργειας R: i μ( t / R) = λ [0,] μ( t / R) = μ( t / L) = λ 2 - Άρα, το σύστημα πεποιθήσεων του παίκτη 2 είναι: μ( t / L) = /2, μ( t / R) = λ [0,] 23

- Βήμα 3. Υπολογίζουμε την άριστη αντίδραση του παίκτη 2 σε κάθε πιθανή ενέργεια του παίκτη (με δεδομένο το σύστημα πεποιθήσεων του παίκτη 2). Άριστη Αντίδραση παίκτη 2 στην ενέργεια L του παίκτη - Η αναμενόμενη απόδοση του παίκτη 2 αν επιλέξει U είναι: Eu ( LU, ) = μ( t / L) u ( t, LU, ) + μ( t / L) u( t, LU, ) = 7/2 2 2 2 2 2 - Η αναμενόμενη απόδοση του παίκτη 2 αν επιλέξει D είναι: Eu ( L, D) = μ( t / L) u ( t, L, D) + μ( t / L) u ( t, L, D) = /2 2 2 2 2 2 - Άρα: Eu ( L, U ) = 7/2 > Eu ( L, D) = /2 2 2 H άριστη αντίδραση του παίκτη 2 στην ενέργεια L του παίκτη είναι να επιλέξει U, δηλαδή: α ( L) = U. Άριστη Αντίδραση παίκτη 2 στην ενέργεια R του παίκτη - Η αναμενόμενη απόδοση του παίκτη 2 αν επιλέξει U είναι: Eu( RU, ) = μ( t / R) u( t, RU, ) + μ( t / R) u( t, RU, ) = λ 2 2 2 2 2 24

- Η αναμενόμενη απόδοση του παίκτη 2 αν επιλέξει D είναι: Eu ( R, D) = μ( t / R) u ( t, R, D) + μ( t / R) u ( t, R, D) = 2( λ) 2 2 2 2 2 - Άρα: Eu ( R, U ) = λ Eu ( R, D) = 2( λ) λ 2 / 3 2 2 H άριστη αντίδραση του παίκτη 2 στην ενέργεια R του παίκτη είναι: ar ( ) = D U, αν λ 2/3, αν λ 2/3 - Συμπέρασμα. Η στρατηγική του παίκτη 2 είναι: al ( ) ar ( ) = = U D U, αν λ 2/3, αν λ 2/3 25

- Βήμα 4. Ελέγχουμε αν κάποιος τύπος του παίκτη έχει κίνητρο να αποκλίνει από τη στρατηγική που του αποδώσαμε στο πρώτο βήμα. Έλεγχος για τον τύπο t - Η απόδοση του παίκτη αν ακολουθήσει την αποδιδόμενη στρατηγική και επιλέξει L είναι: u( t, L, U ) = - Αν ο παίκτης αποκλίνει από την αποδιδόμενη στρατηγική και επιλέξει R, τότε: Για λ 2/3 u( t, R, D ) = 0 λ 2/3, ο παίκτης2 επιλέγει D και η απόδοση του παίκτη είναι: - Άρα: Για, οτύπος t δεν έχει κίνητρο να αποκλίνει από την αποδιδόμενη στρατηγική mt ( ) = L. Για λ 2/3, οπαίκτης2 επιλέγει U και η απόδοση του παίκτη είναι: u ( t, R, U ) = 2 λ 2/3 - Άρα: Για, οτύπος t έχει κίνητρο να αποκλίνει από την αποδιδόμενη στρατηγική mt ( ) = L. 26

- Συμπέρασμα. Οτύπος t του παίκτη δεν έχει κίνητρο να αποκλίνει από την αποδιδόμενη στρατηγική mt ( ) = L αν και μόνο αν λ 2/3. Έλεγχος για τον τύπο t 2 - Η απόδοση του παίκτη αν ακολουθήσει την αποδιδόμενη στρατηγική και επιλέξει L είναι: u( t2, L, U ) = 2 - Αν ο παίκτης αποκλίνει από την αποδιδόμενη στρατηγική και επιλέξει R, τότε: λ 2/3 u ( t, R, D ) = Για 2, ο παίκτης2 επιλέγει D και η απόδοση του παίκτη είναι: λ 2/3 - Άρα: Για, οτύπος t 2 δεν έχει κίνητρο να αποκλίνει από την αποδιδόμενη στρατηγική mt ( 2) = L. Για λ 2/3, οπαίκτης2 επιλέγει U και η απόδοση του παίκτη είναι: u ( t, R, U ) = 2 λ 2/3 - Άρα: Για, οτύπος t 2 δεν έχει κίνητρο να αποκλίνει από την αποδιδόμενη στρατηγική mt ( ) = L. 2 27

- Συμπέρασμα 2. Οτύπος t 2 του παίκτη δεν έχει κίνητρο να αποκλίνει από την αποδιδόμενη στρατηγική mt ( ) = L για κάθε λ [0,]. - Συνδυάζουμε τα συμπεράσματα,2 και καταλήγουμε στο εξής γενικό συμπέρασμα: λ 2/3 - Συμπέρασμα. Αν, κανένας τύπος του παίκτη δεν έχει κίνητρο να αποκλίνει από την αποδιδόμενη στρατηγική ( mt ( ), mt ( 2)) = ( LL, ) και, επομένως, υπάρχει συγκεντρωτική ισορροπία όπου και οι δύο τύποι επιλέγουν L. H ισορροπία αυτή είναι: 2 ( mt ( ), mt ( )) = ( LL, ) 2 ( al ( ), ar ( )) = ( UD, ) μ( t / L) = /2 μ( t / R) = λ [0,2/3] (Στρατηγική ισορροπίας του παίκτη ) (Στρατηγική ισορροπίας του παίκτη 2) (Πεποιθήσεις που υποστηρίζουν τις στρατηγικές ισορροπίας) - Βήμα 5. Επιστρέφουμε στο Βήμα και αποδίδουμε μια διαφορετική στρατηγική στον παίκτη. 28

(iii) Διερευνούμε την πιθανή ύπαρξη συγκεντρωτικής ισορροπίας όπου και οι δύο τύποι t, t 2 του παίκτη επιλέγουν R. - Βήμα. Η στρατηγική που αποδίδουμε στον παίκτη είναι: ( mt ( ), mt ( )) = ( RR, ) 2 - Βήμα 2. Αφού μόνο η ενέργεια R επιλέγεται με θετική πιθανότητα στην ισορροπία, μόνο η πεποίθηση μ( t / R) του παίκτη 2 ανήκει στο μονοπάτι ισορροπίας και προσδιορίζεται σύμφωνα με τον κανόνα του Bayes: PR ( / t) Pt ( ) (/2) i μ( t / R) = = = /2 PR ( / t) Pt ( ) + PR ( / t) Pt ( ) (/2) + (/2) 2 2 2 μ( t / R) = μ( t / R) = /2 - Αφού η ενέργεια L δεν επιλέγεται στην ισορροπία, αποδίδουμε προς στιγμή μια τυχαία πεποίθηση μ( t / L) στον παίκτη 2 μετά την παρατήρηση της ενέργειας L: i μ( t / L) = λ [0,] μ( t / L) = μ( t / L) = λ 2 29

- Άρα, το σύστημα πεποιθήσεων του παίκτη 2 είναι: μ( t / L) = λ [0,], μ( t / R) = /2 - Βήμα 3. Υπολογίζουμε την άριστη αντίδραση του παίκτη 2 σε κάθε πιθανή ενέργεια του παίκτη (με δεδομένο το σύστημα πεποιθήσεων του παίκτη 2). Άριστη Αντίδραση παίκτη 2 στην ενέργεια L του παίκτη - Η αναμενόμενη απόδοση του παίκτη 2 αν επιλέξει U είναι: Eu ( LU, ) = μ( t / L) u ( t, LU, ) + μ( t / L) u ( t, LU, ) = 4 λ 2 2 2 2 2 - Η αναμενόμενη απόδοση του παίκτη 2 αν επιλέξει D είναι: Eu( LD, ) = μ( t/ L) u( t, LD, ) + μ( t / L) u( t, LD, ) = λ 2 2 2 2 2 - Άρα: Eu ( L, U ) = 4 λ > Eu ( L, D) = λ 2 2 H άριστη αντίδραση του παίκτη 2 στην ενέργεια L του παίκτη είναι να επιλέξει U, δηλαδή: α ( L) = U. 30

Άριστη Αντίδραση παίκτη 2 στην ενέργεια R του παίκτη - Η αναμενόμενη απόδοση του παίκτη 2 αν επιλέξει U είναι: Eu( RU, ) = μ( t / R) u( t, RU, ) + μ( t / R) u( t, RU, ) = /2 2 2 2 2 2 - Η αναμενόμενη απόδοση του παίκτη 2 αν επιλέξει D είναι: Eu ( R, D) = μ( t / R) u ( t, R, D) + μ( t / R) u ( t, R, D) = 2 2 2 2 2 - Άρα: Eu ( R, D) = > Eu ( R, U ) = /2 2 2 H άριστη αντίδραση του παίκτη 2 στην ενέργεια R του παίκτη είναι να επιλέξει D, δηλαδή: α ( R) = D. - Συμπέρασμα. Η στρατηγική του παίκτη 2 είναι: ( al ( ), ar ( )) = ( UD, ) - Βήμα 4. Ελέγχουμε αν κάποιος τύπος του παίκτη έχει κίνητρο να αποκλίνει από τη στρατηγική που του αποδώσαμε στο πρώτο βήμα. 3

Έλεγχος για τον τύπο t - Η απόδοση του παίκτη αν ακολουθήσει την αποδιδόμενη στρατηγική και επιλέξει R είναι: u( t, R, D ) = 0 - Η απόδοση του παίκτη αν αποκλίνει από την αποδιδόμενη στρατηγική και επιλέξει L είναι: u ( t, L, U ) = - Άρα: Οτύπος t έχει κίνητρο να αποκλίνει από την αποδιδόμενη στρατηγική mt ( ) = R. Αφού υπάρχει κάποιος τύπος του παίκτη που έχει κίνητρο να αποκλίνει από την αποδιδόμενη στρατηγική ( mt ( ), mt ( 2)) = ( RR, ), δεν υπάρχει συγκεντρωτική ισορροπία όπου και οι δύο τύποι του παίκτη επιλέγουν R. Εφόσον ολοκληρώσαμε τη διερεύνηση και των τεσσάρων πιθανών ισορροπιών του παιγνίου, σταματάμε την αναζήτηση. 32