Στατικά Παίγνια Ελλιπούς Πληροφόρησης



Σχετικά έγγραφα
Το Υπόδειγμα της Οριακής Τιμολόγησης

Σηματοδοτικά Παίγνια και Τέλεια Μπεϊζιανή Ισορροπία

Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Διάλεξη 7. Θεωρία παιγνίων VA 28, 29

Βασικές Αρχές της Θεωρίας Παιγνίων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Κεφάλαιο 28 Ολιγοπώλιο


Διάλεξη 8. Ολιγοπώλιο VA 27

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 12: Δημοπρασίες ανερχόμενων και κατερχόμενων προσφορών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Κριτικές στο Υπόδειγμα Cournot

Κεφ. 9 Ανάλυση αποφάσεων

Δεύτερο πακέτο ασκήσεων

Α2 Β2 Γ2 2 Α1 1,0 5,-1-1,-2 9,-2 Β1 2,1-2,0 0,2 0,-1 Γ1 0,3 14,2 2,1 8,1 1 1,2 0,1 3,0-1,0

Ισορροπία σε Αγορές Διαφοροποιημένων Προϊόντων

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Κεφάλαιο 29 Θεωρία παιγνίων

- Παράδειγμα 2. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να

ΑΣΚΗΣΗ 1 Βρείτε την ισορροπία των ακόλουθων παιγνίων απαλείφοντας διαδοχικά τις κυριαρχούµενες στρατηγικές.

Σηματοδότηση σηματοδοτήσουν

Ολιγοπωλιακή Ισορροπία

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Κυριαρχία και μεικτές στρατηγικές Μεικτές στρατηγικές και κυριαρχία Είδαμε ότι μια στρατηγική του παίκτη i είναι κυριαρχούμενη, αν υπάρχει κάποια άλλη

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

3. Ανταγωνισμός ως προς τις Τιμές: Το Υπόδειγμα Bertrand

Αποτροπή Εισόδου: Το Υπόδειγμα των Spence-Dixit

Δυσμενής Επιλογή. Το βασικό υπόδειγμα

Β. Βασιλειάδης Αν. Καθηγητής. Επιχειρησιακή Ερευνα Διάλεξη 6 η - Θεωρεία Παιγνίων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΟΧΑΣΤΙΚΑ ΜΟΝΤΕΛΑ

Ηθικός Κίνδυνος. Το βασικό υπόδειγμα. Παρουσιάζεται ένα στοχαστικό πρόβλημα χρηματοδότησης όταν τα αντισυμβαλλόμενα μέρη έχουν συμμετρική πληροφόρηση.

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

10/3/17. Κεφάλαιο 28 Ολιγοπώλιο. Μικροοικονομική. Ολιγοπώλιο. Ολιγοπώλιο. Ανταγωνισµός ποσότητας. Μια σύγχρονη προσέγγιση

x < A y f(x) < B f(y).

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

2. Διαφήμιση σε Αγορές όπου υπάρχουν πολλές Επιχειρήσεις

(γ) Τις μορφές στρατηγικής αλληλεπίδρασης που αναπτύσσονται

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΡΙΤΟ-ΙΣΟΡΡΟΠΙΑ ΚΑΤΑ NASH ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

6. Παίγνια αλληλοδιαδοχικών κινήσεων και η αξία του περιορισμού των επιλογών κάποιου ατόμου

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Ολιγοπώλιο Με ιαφοροποιηµένο Προϊόν 1

A 2 B 2 Γ 2. u 1 (A 1, A 2 ) = 3 > 1 = u 1 (B 1, A 2 ) u 1 (A 1, Γ 2 ) = 1 > 0 = u 1 (B 1, Γ 2 ) A 2 B 2

ΑΣΚΗΣΗ 1 ΑΣΚΗΣΗ 2 ΑΣΚΗΣΗ 3

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ

Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 11: Σχεδίαση μηχανισμών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

1. Επιλογή Ποιότητας στην Ολιγοπωλιακή Αγορά: Κάθετη Διαφοροποίηση Προϊόντος

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 9: Λύσεις παιγνίων δύο παικτών

Βιομηχανική Οργάνωση ΙΙ: Θεωρίες Κρατικής Παρέμβασης & Ανταγωνισμού

ΑΝΑΛΥΣΗ 1 ΠΡΩΤΟ ΜΑΘΗΜΑ, Μ. Παπαδημητράκης.

B 1 A 1 B 2 A 2. t 1. t 3 w. t 2 A 3 B 3. t 4. t 5

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

Η «κατάρα του νικητή»

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Το υπόδειγμα Klein-Monti

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ EKΤΟ ΔΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ II ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

F NF. t 1 = S. F NF F -1, 1 2, -1 NF 0, 2 0, 0 t 1 = W

Διάλεξη 3. Οικονομικά της ευημερίας. Οικονομικά της ευημερίας 3/9/2017. Περίγραμμα. Εργαλεία δεοντολογικής ανάλυσης

10/3/17. Κεφάλαιο 26 Μονοπωλιακή συμπεριφόρά. Μικροοικονομική. Πώς πρέπει να τιµολογεί ένα µονοπώλιο; Πολιτικές διάκρισης τιµών

ΜΟΝΟΠΩΛΙΑΚΟΣ ΑΝΤΑΓΩΝΙΣΜΟΣ, ΟΛΙΓΟΠΩΛΙΑ, ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Από το Γυμνάσιο στο Λύκειο Δειγματικός χώρος Ενδεχόμενα Εύρεση δειγματικού χώρου... 46

Notes. Notes. Notes. Notes Ε 10,10 0,3 Λ 3,0 2,2

Πανεπιστήμιο Δυτικής Αττικής Σχολή Μηχανικών Τμήμα Μηχανικών Τοπογραφίας και Γεωπληροφορικής. Εισαγωγή στην Οικονομία.

Άριστες κατά Pareto Κατανομές και το Πρώτο Θεώρημα Ευημερίας

E[ (x- ) ]= trace[(x-x)(x- ) ]

Λύσεις 2ης Ομάδας Ασκήσεων


Kεφάλαιο 10. Πόσα υποπαίγνια υπάρχουν εδώ πέρα; 2 υποπαίγνια.

δημιουργία: επεξεργασία: Ν.Τσάντας

( ) ΘΕΜΑ 1 κανονική κατανομή

ΑΝΑΛΥΣΗ 1 ΕΝΑΤΟ ΜΑΘΗΜΑ, Μ. Παπαδημητράκης.

Θεωρία Λήψης Αποφάσεων

Μαθηματική Εισαγωγή Συναρτήσεις

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 4: Η τραγωδία των κοινών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Ενημερωτική Διαφοροποίηση Προϊόντος: Ο Ρόλος της Διαφήμισης

To 2 ο Θεμελιώδες Θεώρημα Ευημερίας

Notes. Notes. Notes. Notes

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 8: Πεπερασμένα επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Ακαδημαϊκό έτος Τμήμα Οικονομικών Επιστημών Χειμώνας-Άνοιξη Μάθημα: Δημόσια Οικονομική Διδασκαλία: Γεωργία Καπλάνογλου

Ζήτηση, Προσφορά και Ισορροπία στην Ανταγωνιστική Αγορά

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 6. Πιθανότητες

Μαθηματική Εισαγωγή Συναρτήσεις

Διάλεξη 3. Οικονομικά της ευημερίας 2/26/2016. Περίγραμμα. Εργαλεία δεοντολογικής ανάλυσης. Αποτελεσματικότητα κατά Pareto: ορισμός. ορισμός.

A 1 B 1 B 2 A 2 A 2 B 2

ΕΝΤΟΛΕΣ. 7.1 Εισαγωγικό μέρος με επεξήγηση των Εντολών : Επεξήγηση των εντολών που θα

Τ Ε Ι Ιονίων Νήσων Τμήμα Εφαρμογών Πληροφορικής στη Διοίκηση και την Οικονομία. Υπεύθυνος: Δρ. Κολιός Σταύρος

Το Κεντρικό Οριακό Θεώρημα

Γενική Ανταγωνιστική Ισορροπία και Αποτελεσματικές κατά Pareto Κατανομές σε Ανταλλακτική Οικονομία

Transcript:

ΣΤΑΤΙΚΑ ΠΑΙΓΝΙΑ ΕΛΛΙΠΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ 67 Στατικά Παίγνια Ελλιπούς Πληροφόρησης ΣΤΟ ΠΑΡOΝ ΚΕΦAΛΑΙΟ ξεκινά η ανάλυση των παιγνίων ελλιπούς πληροφόρησης, τα οποία ονομάζονται και μπεϋζιανά παίγνια (bayesa games) Θυμηθείτε πως σε ένα παίγνιο πλήρους πληροφόρησης οι συναρτήσεις οφέλους των παικτών αποτελούν κοινή γνώση Σε ένα παίγνιο ελλιπούς πληροφόρησης, αντίθετα, ένας τουλάχιστον παίκτης δεν είναι βέβαιος σχετικά με τις συναρτήσεις οφέλους κάποιου άλλου παίκτη Ένα κοινό παράδειγμα στατικού παιγνίου ελλιπούς πληροφόρησης είναι η δημοπρασία με ενσφράγιστες προσφορές: κάθε συμμετέχων γνωρίζει τη δική του αξιολόγηση για το πωλούμενο αγαθό, όμως δεν γνωρίζει την αξιολόγηση κανενός άλλου οι προσφορές κατατίθενται σε σφραγισμένους φακέλους, έτσι ώστε οι κινήσεις των παικτών να μπορούν να θεωρηθούν ταυτόχρονες Εντούτοις, τα μπεϋζιανά παίγνια με το μεγαλύτερο οικονομικό ενδιαφέρον είναι δυναμικά Όπως θα δούμε στο Κεφάλαιο 4, η ύπαρξη ιδιωτικής πληροφόρησης οδηγεί σε προσπάθειες από πλευράς όσων διαθέτουν πληροφόρηση να επικοινωνήσουν (ή να παραπλανήσουν) και σε προσπάθειες των μη ενημερωμένων να μάθουν και να αποκριθούν Αυτά τα ζητήματα είναι εγγενώς δυναμικά Στην Ενότητα 3 θα ορίσουμε την κανονικής μορφής παράσταση ενός στατικού μπεϋζιανού παιγνίου και την μπεϋζιανή ισορροπία κατά Nash σε ένα τέτοιο παίγνιο Επειδή οι ορισμοί αυτοί είναι πολύ αφηρημένοι και κάπως περίπλοκοι, θα κάνουμε μια εισαγωγή στις βασικές ιδέες με ένα απλό παράδειγμα τον ανταγωνισμό κατά Couro με ασύμμετρη πληροφόρηση Στην Ενότητα 3 θα ασχοληθούμε με τρεις εφαρμογές Πρώτα, θα ερμηνεύσουμε φορμαλιστικά την έννοια της μικτής στρατηγικής που δώσαμε στο Κεφάλαιο : η μικτή στρατηγική του παίκτη j εκφράζει την αβεβαιότητα του παίκτη σε σχέση με την επιλογή αμιγούς στρατηγικής του παίκτη j, ενώ η επιλογή του j εξαρτάται από την ερμηνεία μιας μικρής ποσότητας

68 ιδιωτικής πληροφόρησης Δεύτερον, θα αναλύσουμε μια δημοπρασία με ενσφράγιστες προσφορές στην οποία οι αξιολογήσεις των συμμετεχόντων αποτελούν ιδιωτική πληροφόρηση, ενώ η αξιολόγηση του πωλητή είναι γνωστή Τέλος, θα εξετάσουμε την περίπτωση στην οποία και ο πωλητής και ο αγοραστής έχουν ιδιωτική πληροφόρηση (όπως όταν μια εταιρεία γνωρίζει την οριακή παραγωγικότητα ενός εργάτη και ο εργάτης γνωρίζει τις ευκαιρίες που διαθέτει εκτός εταιρείας) Θα αναλύσουμε ένα παίγνιο συναλλαγής που ονομάζεται διπλή δημοπρασία: ο πωλητής ορίζει μια απαιτούμενη τιμή και ταυτόχρονα ο αγοραστής ορίζει μια προσφερόμενη τιμή η συναλλαγή πραγματοποιείται στο μέσο όρο των δύο τιμών αν η δεύτερη ξεπερνά την πρώτη Στην Ενότητα 33 θα διατυπώσουμε και θα αποδείξουμε την Αρχή της Αποκάλυψης και θα υποδείξουμε με συντομια πώς μπορεί να εφαρμοστεί σε παίγνια σχεδίασης μηχανισμών όταν οι παίκτες έχουν ιδιωτική πληροφόρηση 3 Θεωρία: Στατικά Μπεϋζιανά Παίγνια και Μπεϋζιανή Ισορροπία κατά Nash 3A Ένα παράδειγμα: Ανταγωνισμός κατά Couro υπό Ασύμμετρη Πληροφόρηση Θεωρήστε ένα υπόδειγμα δυοπωλίου κατά Couro με την αντίστροφη συνάρτηση ζήτησης να δίνεται από τη σχέση PQ ( ) =a Q, όπου Q= + είναι η συνολική ποσότητα στην αγορά Η συνάρτηση κόστους της εταιρείας είναι C( ) =c Η συνάρτηση κόστους της εταιρείας, όμως, είναι C( ) =c με πιθανότητα θ και C( ) =c με πιθανότητα θ, όπου c < c Επιπλέον, η πληροφόρηση είναι ασύμμετρη: η εταιρεία γνωρίζει τη συνάρτηση κόστους της ίδιας και της εταιρείας, ενώ η εταιρεία γνωρίζει τη δική της συνάρτηση κόστους και μόνο ότι το οριακό κόστος της εταιρείας είναι c με πιθανότητα θ και c με πιθανότητα θ (Η εταιρεία θα μπορούσε να είναι νεοεισελθούσα στο συγκεκριμένο κλάδο ή ίσως να έχει μόλις εφεύρει μια νέα τεχνολογία) Όλα τα παραπάνω αποτελούν κοινή γνώση: η εταιρεία γνωρίζει ότι η εταιρεία έχει περισσότερη πληροφόρηση, η εταιρεία γνωρίζει ότι η εταιρεία το γνωρίζει, κλπ Φυσικά, η εταιρεία θα θέλει να επιλέξει διαφορετική (προφανώς μικρότερη) ποσότητα εάν το οριακό της κόστος είναι υψηλό παρά εάν είναι χαμηλό Η εταιρεία, από τη μεριά της, θα πρέπει να αναμένει ότι η εταιρεία ίσως προσαρμόσει την ποσότητά της στο κόστος της, με αυτό τον τρόπο Έστω ότι ) και ) είναι οι επιλογές ποσότητας της εται-

ΣΤΑΤΙΚΑ ΠΑΙΓΝΙΑ ΕΛΛΙΠΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ 69 ρείας ως συνάρτηση του κόστους της και έστω η επιλογή ποσότητας της εταιρείας Αν το κόστος της εταιρείας είναι υψηλό, θα επιλέξει την ( ) c ώστε να αποτελεί λύση του: max[( a ) c ] Αντίστοιχα, αν το κόστος της εταιρείας είναι χαμηλό, η ) πρέπει να αποτελεί λύση του: max[( a ) c ] Τέλος, η εταιρεία γνωρίζει ότι το κόστος της εταιρείας είναι υψηλό με πιθανότητα θ και πρέπει να αναμένει ότι η επιλογή ποσότητας της εταιρείας θα είναι ) ή ), ανάλογα με το κόστος της εταιρείας Συνεπώς, η εταιρεία επιλέγει την ώστε να αποτελεί λύση του: max θ[( a )) c] + ( θ)[( α )) c] ώστε να μεγιστοποιήσει το αναμενόμενο κέρδος της Οι συνθήκες πρώτης τάξης για τα τρία αυτά προβλήματα αριστοποίησης είναι: ( ) a c C =, ( ) a c C =, και θα [ ) c ] + ( θ)[ α ) c] = Υποθέστε πως αυτές οι συνθήκες πρώτης τάξης χαρακτηρίζουν τις λύσεις των προηγούμενων προβλημάτων αριστοποίησης (Θυμηθείτε από το Πρόβλημα 6 ότι σε ένα δυοπώλιο κατά Couro πλήρους πληροφόρησης, αν τα κόστη των εταιρειών είναι σημαντικά διαφορετικά τότε στην ισορροπία η εταιρεία με υψηλό κόστος δεν παράγει τίποτα Ως άσκηση, βρείτε μια ικανή συνθήκη για να αποφύγουμε ανάλογα προβλήματα εδώ) Οι λύσεις στις παραπάνω συνθήκες πρώτης τάξης είναι: a c +c θ ) = + c), 3 6

70 και a c +c θ ) = c) 3 6 = a c + θc +( θ)c 3 Συγκρίνετε τα ), ) και με την ισορροπία κατά Couro υπό πλήρη πληροφόρηση και κόστη c και c Υποθέτοντας πως οι τιμές των c και c είναι τέτοιες ώστε οι ποσότητες ισορροπίας και των δύο εταιρειών να είναι αμφότερες θετικές, στην περίπτωση πλήρους πληροφόρησης η εταιρεία παράγει = ( a c +cj)/3 Στην περίπτωση ελλιπούς πληροφόρησης, αντίθετα, η ποσότητα ) είναι μεγαλύτερη από ( a c +c)/3 και η ) είναι μικρότερη από ( a c +c)/3 Αυτό συμβαίνει επειδή η εταιρεία όχι μόνο προσαρμόζει την ποσότητά της στο κόστος της αλλά αποκρίνεται και στο γεγονός ότι η εταιρεία δεν μπορεί να κάνει μια τέτοια προσαρμογή Αν το κόστος της εταιρείας είναι υψηλό, για παράδειγμα, παράγει λιγότερο επειδή το κόστος της είναι υψηλό αλλά παράγει περισσότερο και επειδή γνωρίζει πως η εταιρεία θα παραγάγει μια ποσότητα που μεγιστοποιεί το αναμενόμενο κέρδος της, άρα θα είναι μικρότερη από την ποσότητα που θα παρήγε αν γνώριζε πως το κόστος της εταιρείας είναι υψηλό ( Ένα στοιχείο αυτού του παραδείγματος που πιθανώς οδηγήσει σε παρανοήσεις είναι ότι το είναι ακριβώς ίσο με τις αναμενόμενες άριστες ποσότητες που θα παρήγε η εταιρεία στα δύο αντίστοιχα παίγνια πλήρους πληροφόρησης Αυτό στη γενική περίπτωση δεν ισχύει σκεφτείτε, για παράδειγμα, την περίπτωση όπου το συνολικό κόστος της εταιρείας είναι c ) 3B Κανονικής μορφής παράσταση των στατικών μπεϋζιανών παιγνίων Θυμηθείτε ότι η κανονικής μορφής παράσταση ενός παιγνίου πλήρους πληροφόρησης παικτών είναι G= { S S; u u }, όπου S είναι ο χώρος στρατηγικής του παίκτη και u( s,, s) είναι το όφελος του παίκτη όταν οι παίκτες επιλέξουν τις στρατηγικές ( s,, s ) Όμως, όπως αναλύσαμε στην Ενότητα 3B, σε ένα παίγνιο ταυτόχρονων κινήσεων πλήρους πληροφόρησης, μια στρατηγική για έναν παίκτη είναι απλώς μια δράση, συνεπώς μπορούμε να γράψουμε G= { A A; u u }, όπου A είναι ο χώρος δράσης του παίκτη και u( a,, a ) είναι το όφελος του παίκτη όταν οι παίκτες επιλέξουν τις δράσεις ( a,, a ) Για να προετοιμαστούμε για την περιγραφή της χρονικής δομής ενός στατικού παιγνίου ελλιπούς πληροφόρησης, θα περιγράψουμε τη χρονική δομή ενός στατικού παιγνίου πλήρους

ΣΤΑΤΙΚΑ ΠΑΙΓΝΙΑ ΕΛΛΙΠΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ 7 πληροφόρησης ως εξής: () οι παίκτες επιλέγουν ταυτόχρονα δράσεις (ο παίκτης επιλέγει την a από τον εφικτό σύνολο A ) και έπειτα () λαμβάνονται τα οφέλη u( a,, a ) Τώρα, θέλουμε να αναπτύξουμε την κανονικής μορφής παράσταση ενός παιγνίου ταυτόχρονων κινήσεων ελλιπούς πληροφόρησης, το οποίο ονομάζεται επίσης στατικό μπεϋζιανό παίγνιο Το πρώτο βήμα είναι να παραστήσουμε την ιδέα ότι κάθε παίκτης γνωρίζει την δική του συνάρτηση οφέλους αλλά μπορεί να μην είναι βέβαιος σχετικά με τις συναρτήσεις οφέλους των άλλων παικτών Έστω ότι οι πιθανές συναρτήσεις οφέλους του παίκτη συμβολίζονται u( a,, a; ), όπου αποκαλείται ο τύπος του και ανήκει σε ένα σύνολο πιθανών τύπων (ή χώρο τύπων) T Κάθε τύπος αντιστοιχεί σε μια διαφορετική συνάρτηση οφέλους που μπορεί να έχει ο παίκτης Ως αφηρημένο παράδειγμα, υποθέστε πως ο παίκτης έχει δύο πιθανές συναρτήσεις οφέλους Θα λέγαμε ότι ο παίκτης έχει δύο τύπους, και, ότι ο χώρος τύπων του παίκτη είναι T = {, } και πως οι δύο συναρτήσεις οφέλους του παίκτη είναι u( a,, a; ) και u( a,, a; ) Μπορούμε επίσης να χρησιμοποιήσουμε την ιδέα ότι κάθε ένας από τους τύπους ενός παίκτη αντιστοιχεί σε διαφορετική συνάρτηση οφέλους για να παραστήσουμε την πιθανότητα ότι ο παίκτης μπορεί να έχει διαφορετικά σύνολα εφικτών δράσεων, ως εξής Έστω, για παράδειγμα, ότι το σύνολο εφικτών δράσεων του παίκτη είναι {a,b} με πιθανότητα και {a,b,c} με πιθανότητα Μπορούμε τότε να πούμε ότι ο έχει δύο τύπους ( και, όπου η πιθανότητα του είναι ) ενώ μπορούμε να ορίσουμε το εφικτό σύνολο δράσεων του ως {a,b,c} και για τους δύο τύπους αλλά να ορίσουμε το όφελος από την επιλογή της δράσης c ως για τον τύπο Για ένα πιο συγκεκριμένο παράδειγμα, θεωρήστε το παίγνιο του Couro που είδαμε στην προηγούμενη Ενότητα Δράσεις των εταιριών είναι οι επιλογές ποσοτήτων τους, και Η εταιρεία έχει δύο πιθανές συναρτήσεις κόστους και άρα δύο πιθανές συναρτήσεις κέρδους ή οφέλους και π (, ; c ) = [( a ) c ] π (, ; c ) = [( a ) c ] Η Η Η εταιρεία έχει μόνο μια πιθανή συνάρτηση οφέλους: π (, ; c ) = [( a ) c] Λέμε πως ο χώρος τύπων της εταιρείας είναι T = { c, c} και πως ο χώρος τύπων της εταιρείας είναι T= {} c

7 Με δεδομένο τον ορισμό του τύπου ενός παίκτη, το να πούμε ότι ο παίκτης γνωρίζει τη συνάρτηση οφέλους του ισοδυναμεί με το να πούμε πως ο παίκτης γνωρίζει τον τύπο του Παρομοίως, λέγοντας πως ο παίκτης μπορεί να μην είναι βέβαιος για τις συναρτήσεις οφέλους των άλλων παικτών ισοδυναμεί με το να πούμε πως ο παίκτης μπορεί να μην είναι βέβαιος για τους τύπους των άλλων παικτών, που συμβολίζονται με = {,,, +,, } Χρησιμοποιούμε το T για να συμβολίσουμε το σύνολο όλων των πιθανών τιμών του, ενώ χρησιμοποιούμε την κατανομή πιθανότητας p( ) για να συμβολίσουμε την εκτίμηση (belef) του παίκτη σχετικά με τους τύπους των άλλων παικτών, με δεδομένη τη γνώση του παίκτη για τον δικό του τύπο, Σε κάθε εφαρμογή που θα αναλύσουμε στην Ενότητα 3 (και σε μεγάλο μέρος της βιβλιογραφίας) οι τύποι των παικτών είναι ανεξάρτητοι, οπότε το p( ) δεν εξαρτάται από το, άρα μπορούμε να γράφουμε την εκτίμηση του παίκτη ως p ( ) Υπάρχουν, όμως, περιβάλλοντα στα οποία οι τύποι των παικτών συσχετίζονται, και επιτρέπουμε κάτι τέτοιο στον ορισμό που δίνουμε για ένα στατικό μπεϋζιανό παίγνιο, γράφοντας την εκτίμηση του παίκτη ως p ( ) Συνδυάζοντας τις νέες έννοιες των τύπων και των εκτιμήσεων με τα ήδη γνωστά στοιχεία της κανονικής μορφής παράστασης ενός στατικού παιγνίου πλήρους πληροφόρησης έχουμε την κανονικής μορφής παράσταση ενός στατικού μπεϋζιανού παιγνίου Ορισμός: Η κανονικής μορφής παράσταση ενός στατικού μπεϋζιανού παιγνίου παικτών ορίζει τους χώρους δράσεις των παικτών Α,, Α, τους χώρους τύπων τους Τ,, Τ, τις εκτιμήσεις τους p,, p και τις συναρτήσεις οφέλους τους, u,, u Ο τύπος του παίκτη,, είναι γνωστός μόνο στον παίκτη, καθορίζει τη συνάρτηση οφέλους του παίκτη, u( a,, a; ) και ανήκει στο σύνολο των πιθανών τύπων, Τ Η εκτίμηση του παίκτη, p( ) περιγράφει την αβεβαιότητα του παίκτη σχετικά με τους πιθανούς τύπους των άλλων παικτών, με δεδομένο το δικό του τύπο, Συμβολίζουμε το παίγνιο αυτό ως G= { A,, A; T,, T; p,, p; u,, u } Ακολουθώντας το arsay (967), θα υποθέσουμε πως η χρονική δομή [ΣτΕ] Ο όρος belef έχει μεταφραστεί στη σχετική βιβλιογραφία και ως πεποίθηση Φανταστείτε πως δύο εταιρείες ανταγωνίζονται για να αναπτύξουν μια νέα τεχνολογία Η πιθανότητα επιτυχίας κάθε εταιρείας εξαρτάται εν μέρει από το πόσο δύσκολη είναι η ανάπτυξη αυτής της τεχνολογίας, κάτι που δεν είναι γνωστό Κάθε εταιρεία γνωρίζει μόνο αν έχει επιτύχει η ίδια και όχι αν έχει επιτύχει η άλλη Αν, όμως, η εταιρεία έχει επιτύχει, τότε είναι πιθανότερο η τεχνολογία να είναι εύκολο να αναπτυχθεί, άρα και πιο πιθανό να έχει επιτύχει και η εταιρεία Συνεπώς, η εκτίμηση της εταιρείας σχετικά με τον τύπο της εταιρείας εξαρτάται από τη γνώση της εταιρείας για το δικό της τύπο

ΣΤΑΤΙΚΑ ΠΑΙΓΝΙΑ ΕΛΛΙΠΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ 73 ενός στατικού μπεϋζιανού παιγνίου είναι ως εξής: () η φύση διαμορφώνει ένα διάνυσμα τύπων = (,, ), όπου το επιλέγεται από το σύνολο πιθανών τύπων Τ () η φύση αποκαλύπτει το στον παίκτη, αλλά σε κανέναν άλλο παίκτη (3) οι παίκτες επιλέγουν ταυτόχρονα δράσεις, ο παίκτης επιλέγει a από το εφικτό σύνολο A και έπειτα (4) λαμβάνονται τα οφέλη u( a,, a; ) Εισάγοντας τις φανταστικές κινήσεις που κάνει η φύση στα βήματα () και (), περιγράψαμε ένα παίγνιο ελλιπούς πληροφόρησης ως παίγνιο ατελούς πληροφόρησης, όπου με ατελή πληροφόρηση εννοούμε (όπως και στο Κεφάλαιο ) ότι σε κάποια κίνηση στο παίγνιο, ο παίκτης που έχει δικαίωμα κίνησης δεν γνωρίζει το πλήρες ιστορικό του παιγνίου ως εκεί Εδώ, επειδή στο βήμα () η φύση αποκαλύπτει τον τύπο του παίκτη στον παίκτη αλλά όχι στον παίκτη j, ο παίκτης j δεν γνωρίζει το πλήρες ιστορικό του παιγνίου όταν επιλέγονται οι δράσεις στο βήμα (3) Για να ολοκληρωθεί η ανάλυση της κανονικής μορφής παράστασης των στατικών μπεϋζιανών παιγνίων, χρειάζεται να καλυφθούν δύο ελαφρώς πιο τεχνικά σημεία Πρώτον, υπάρχουν παίγνια στα οποία ο παίκτης έχει ιδιωτική πληροφόρηση όχι μόνο για τη δική του συνάρτηση οφέλους αλλά και για τη συνάρτηση οφέλους κάποιου άλλου παίκτη Στο Πρόβλημα 3, για παράδειγμα, το υπόδειγμα κατά Couro με ασύμμετρη πληροφόρηση της Ενότητας 3Α μεταβάλλεται ώστε τα κόστη να είναι συμμετρικά και να αποτελούν κοινή γνώση, όμως η μια εταιρεία γνωρίζει το επίπεδο ζήτησης και η άλλη δεν το γνωρίζει Αφού το επίπεδο ζήτησης επηρεάζει τις συναρτήσεις οφέλους και των δύο παικτών, ο τύπος της πληροφορημένης εταιρείας υπεισέρχεται στη συνάρτηση οφέλους της απληροφόρητης εταιρείας Στην περίπτωση παικτών, περιλαμβάνουμε αυτή την πιθανότητα επιτρέποντας στο όφελος του παίκτη να εξαρτάται όχι μόνο από τις δράσεις ( a,, a ) αλλά και από όλους τους τύπους (,, ) Γράφουμε αυτή τη συνάρτηση οφέλους ως u( a,, a;,, ) Το δεύτερο τεχνικό σημείο σχετίζεται με τις εκτιμήσεις, p ( ) Θα υποθέσουμε πως αποτελεί κοινή γνώση το γεγονός ότι στο βήμα () της χρονικής δομής ενός στατικού μπεϋζιανού παιγνίου, η φύση επιλέγει ένα διάνυσμα τύπων = (,, ) σύμφωνα με την αρχική, αδέσμευτη κατανομή πιθανότητας p () Όταν έπειτα η φύση αποκαλύπτει το στο παίκτη, αυτός μπορεί να υπολογίσει την εκτίμηση p( ), χρησιμοποιώντας τον κανόνα του Bayes 3 3 Ο κανόνας του Bayes παρέχει έναν τύπο για το ( ) PA B, την (δεσμευμένη) πιθανότητα ότι ένα γεγονός Α θα συμβεί με δεδομένο ότι ένα γεγονός Β έχει ήδη συμβεί Έστω P(A), P(B) και P(A, B) είναι οι (αρχικές) πιθανότητες (δηλαδή, οι πιθανότητες προτού έχουν την ευκαιρία να συμβούν είτε το Α είτε το Β) να συμβεί το Α, να συμβεί το Β και να συμβούν και

74 p (, ) p (, ) p = = ( ) p ( ) p (, ) T Επίσης, οι άλλοι παίκτες μπορούν να υπολογίσουν τις διάφορες εκτιμήσεις που πιθανώς έχει ο παίκτης, ανάλογα με τον τύπο του, δηλαδή το p( ) για κάθε στο Τ Όπως σημειώσαμε και παραπάνω, συχνά θα υποθέτουμε πως οι τύποι των παικτών είναι ανεξάρτητοι, οπότε το p( ) δεν θα εξαρτάται από το, αλλά και πάλι θα προκύπτει από την αρχική κατανομή p () Σε αυτή την περίπτωση, οι άλλοι παίκτες γνωρίζουν την εκτίμηση που έχει ο σχετικά με τους τύπους τους 3C Ορισμός της μπεϋζιανής ισορροπίας κατά Nash Θέλουμε τώρα να ορίσουμε μια έννοια ισορροπίας για τα στατικά μπεϋζιανά παίγνια Για να το πετύχουμε, πρέπει πρώτα να ορίσουμε τους χώρους στρατηγικής των παικτών σε ένα τέτοιο παίγνιο Θυμηθείτε από τις Ενότητες 3B και 4B ότι η στρατηγική ενός παίκτη είναι ένα πλήρες σχέδιο δράσης που καθορίζει μια εφικτή δράση σε κάθε ενδεχόμενο μπροστά στο οποίο θα μπορούσε να κληθεί ο παίκτης να δράσει Δεδομένης της χρονικής δομής ενός στατικού μπεϋζιανού παιγνίου, στο οποίο η φύση ξεκινά το παίγνιο επιλέγοντας τους τύπους των παικτών, μια (αμιγής) στρατηγική για τον παίκτη πρέπει να καθορίζει μια εφικτή δράση για κάθε δυνατό τύπο του παίκτη Ορισμός: Σε ένα στατικό μπεϋζιανό παίγνιο G= { A,, A ; T,, ; T p p,, ; p u,, } u, η στρατηγική του παίκτη είναι μια συνάρτηση s( ), όπου για κάθε τύπο στο T, η s( ) καθορίζει μια δράση από το εφικτό σύνολο Α που θα επέλεγε ο τύπος αν επιλεγόταν από τη φύση Αντίθετα με τα (είτε στατικά είτε δυναμικά) παίγνια πλήρους πληροφόρησης, σε ένα μπεϋζιανό παίγνιο, οι χώροι στρατηγικής δεν περιλαμβάνονται στην κανονικής μορφής παράσταση του παιγνίου Σε ένα στατικό μπεϋζιανό παίγνιο, οι χώροι στρατηγικής κατασκευάζονται από τους χώρους τύπων και δράσης: το σύνολο των πιθανών (αμιγών) στρατηγικών του παίκτη, S, είναι το σύνολο όλων των πιθανών συναρτήσεων με πεδίο ορισμού Τ και πεδίο τιμών A Σε μια στρατηγική διαφοροποίησης το Α και το Β, αντίστοιχα Ο κανόνας του Bayes λέει πως PA B ( ) = PAB (, )/ PB ( ) Δηλαδή, η δεσμευμένη πιθανότητα του Α δεδομένου του Β ισούται με την πιθανότητα ότι θα συμβεί και το Α και το Β διαιρούμενη με την αρχική πιθανότητα ότι θα συμβεί το Β

ΣΤΑΤΙΚΑ ΠΑΙΓΝΙΑ ΕΛΛΙΠΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ 75 (separag sraegy), για παράδειγμα, κάθε τύπος από το Τ, επιλέγει μια διαφορετική δράση a από το A Σε μια στρατηγική ομοιοταυτοποίησης (poolg sraegy), αντίθετα, όλοι οι τύποι επιλέγουν την ίδια δράση Αυτή η διάκριση μεταξύ στρατηγικών διαφοροποίησης και ομοιοταυτοποίησης έχει μεγάλη σημασία για τη μελέτη των δυναμικών παιγνίων ελλιπούς στρατηγικής που θα κάνουμε στο Κεφάλαιο 4 4 Κάνουμε μια εισαγωγή σε αυτή τη διάκριση εδώ μόνο για να βοηθήσουμε στην περιγραφή της ευρείας γκάμας στρατηγικών που μπορούν να κατασκευαστούν από ένα δεδομένο ζεύγος χώρων δράσης και τύπων, Τ και A Μπορεί να φαίνεται περιττό να απαιτούμε από τη στρατηγική του παίκτη να καθορίζει μια πιθανή δράση για κάθε έναν από τους πιθανούς τύπους του Στο κάτω κάτω, αφού η φύση έχει διαλέξει ένα συγκεκριμένο τύπο και τον έχει αποκαλύψει στον παίκτη, μπορεί να μοιάζει ότι ο παίκτης δεν χρειάζεται να ασχοληθεί με τις δράσεις στις οποίες θα προχωρούσε αν η φύση είχε επιλέξει έναν άλλο τύπο Από την άλλη, ο παίκτης πρέπει να εξετάσει τι θα κάνουν οι άλλοι παίκτες και το τι θα κάνουν εξαρτάται από το τι σκέφτονται ότι θα κάνει ο παίκτης, για κάθε του T Συνεπώς, για να αποφασίσει τι θα κάνει αφού έχει επιλεχθεί ο τύπος του, ο παίκτης θα χρειαστεί να σκεφτεί τι θα είχε κάνει στην περίπτωση που είχε επιλεχθεί ο καθένας από τους άλλους τύπους του στο T Εξετάστε ως παράδειγμα, το παίγνιο Couro με ασύμμετρη πληροφόρηση της Ενότητας 3Α Υποστηρίξαμε πως η λύση στο παίγνιο αποτελείται από τρεις επιλογές ποσοτήτων: ), ) και Σύμφωνα με τον ορισμό της στρατηγικής που μόλις δώσαμε, το ζεύγος ( ), )) είναι η στρατηγική της εταιρείας και η είναι η στρατηγική της εταιρείας Είναι εύκολο να φανταστούμε πως η εταιρεία θα επιλέξει διαφορετικές ποσότητες ανάλογα με το κόστος της Είναι εξίσου σημαντικό να σημειώσουμε, ωστόσο, πως η μια και μοναδική επιλογή ποσότητας της εταιρείας 4 [ΣτΕ] Οι όροι separag και poolg sraeges μεταφράζονται συνήθως στη βιβλιογραφία ως διαχωριστικές και συγκεντρωτικές στρατηγικές Παραταύτα προκρίθηκαν οι όροι στρατηγικές διαφοροποίησης και ομοιοταυτοποίησης γιατί εκφράζουν καλύτερα το ουσιαστικό νόημα που εμπεριέχει μια μπεϋζιανή στρατηγική, η οποία αποτελεί ουσιαστικά μια συνάρτηση από τύπους σε δράσεις Η πλέον συνηθισμένη εφαρμογή είναι τα «παίγνια ταυτοποίησης» (screeg games) Στα παίγνια αυτά ένας απληροφόρητος παίκτης προσφέροντας ένα μενού εναλλακτικών επιλογών σε έναν πληροφορημένο παίκτη προσπαθεί να εκμαιεύσει την ιδιωτική πληροφορία του πληροφορημένου παίκτη (δηλαδή να μάθει τον τύπο του και συνακόλουθα να τον ταυτοποιήσει) Έτσι λοιπόν, σε μια στρατηγική διαφοροποίησης, οι τύποι ενός παίκτη «διαφοροποιούνται» αναμεταξύ τους καθώς επιλέγουν διαφορετικές δράσεις κι έτσι ουσιαστικά αποκαλύπτεται ο τύπος τους Από την άλλη, σε μια στρατηγική ομοιοταυτοποίησης, όλοι οι τύποι ενός παίκτη επιλέγουν την ίδια δράση κι έτσι ουσιαστικά ταυτοποιούνται από τους λοιπούς παίκτες ως «όμοιοι»

76 θα πρέπει να λάβει υπόψη τον τρόπο με τον οποίο το κόστος της εταιρείας θα επηρεάσει την ποσότητα της εταιρείας Συνεπώς, δεδομένου ότι η έννοια ισορροπίας μας απαιτεί η στρατηγική της εταιρείας να αποτελεί άριστη απόκριση στη στρατηγική της εταιρείας, η στρατηγική της εταιρείας πρέπει να είναι ένα ζεύγος ποσοτήτων, μια για κάθε πιθανό τύπο κόστους, ειδάλλως η εταιρεία δεν μπορεί να υπολογίσει κατά πόσο η στρατηγική της αποτελεί όντως άριστη απόκριση στη στρατηγική της εταιρείας Γενικότερα, δεν θα ήμασταν σε θέση να εφαρμόσουμε την έννοια της ισορροπίας κατά Nash σε μπεϋζιανά παίγνια αν επιτρέπαμε στη στρατηγική ενός παίκτη να μην καθορίζει τι θα έκανε ο παίκτης στην περίπτωση που κάποιοι συγκεκριμένοι τύποι επιλέγονταν από τη φύση Ο συλλογισμός αυτός είναι ανάλογος με αυτόν που κάναμε στο Κεφάλαιο, όπου μπορεί να είχε φανεί περιττό ότι απαιτήσαμε η στρατηγική του παίκτη σε ένα δυναμικό παίγνιο πλήρους πληροφόρησης να καθορίζει μια εφικτή δράση σε κάθε πιθανό ενδεχόμενο μπροστά στο οποίο ο παίκτης θα μπορούσε κληθεί να κινηθεί Αλλά επίσης δεν θα μπορούσαμε να έχουμε εφαρμόσει την έννοια της ισορροπίας κατά Nash στα δυναμικά παίγνια πλήρους πληροφόρησης αν είχαμε επιτρέψει στη στρατηγική ενός παίκτη να αφήνει ακαθόριστες τις δράσεις του παίκτη μπροστά σε ορισμένα ενδεχόμενα Με δεδομένο τον ορισμό μιας στρατηγικής σε μπεϋζιανό παίγνιο, στρεφόμαστε τώρα στον ορισμό μιας μπεϋζιανής ισορροπίας κατά Nash Παρά την περιπλοκότητα των συμβολισμών σε αυτό τον ορισμό, η κεντρική ιδέα είναι και απλή και γνωστή: η στρατηγική κάθε παίκτη πρέπει να αποτελεί άριστη απόκριση στις στρατηγικές των άλλων παικτών Δηλαδή, μια μπεϋζιανή ισορροπία κατά Nash είναι απλώς μια ισορροπία κατά Nash ενός μπεϋζιανού παιγνίου Ορισμός: Σε ένα στατικό μπεϋζιανό παίγνιο G= { A,, A ; T,, T ; p p,, ; p u,, u }, οι στρατηγικές s = ( s,, s ) αποτελούν μια μπεϋζιανή ισορροπία κατά Nash (σε αμιγείς στρατηγικές) αν για κάθε παίκτη και για κάθε έναν από τους τύπους του στο T, το s ( ) αποτελεί λύση του: max u ( s( ),, s, a, s+ ( + ), a, s+ ( + ),, s( ) ;) p( ) a A T Δηλαδή, κανένας παίκτης δεν θέλει να αλλάξει τη στρατηγική του, ακόμη και αν η αλλαγή περιλαμβάνει μόνο μια δράση από έναν τύπο Είναι απλό να δείξουμε ότι σε ένα πεπερασμένο στατικό μπεϋζιανό παίγνιο (δηλαδή, ένα παίγνιο στο οποίο το είναι πεπερασμένο και τα ( Α,, Α) και ( T,, T ) είναι όλα πεπερασμένα σύνολα) υπάρχει μια μπεϋζιανή ισορροπία κατά Nash, ίσως σε μικτές στρατηγικές Η απόδειξη

ΣΤΑΤΙΚΑ ΠΑΙΓΝΙΑ ΕΛΛΙΠΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ 77 ομοιάζει ιδιαίτερα με την απόδειξη ύπαρξης μιας ισορροπίας κατά Nash σε μικτές στρατηγικές σε πεπερασμένα παίγνια πλήρους πληροφόρησης, και γι αυτό εδώ την παραλείπουμε 3 Εφαρμογές 3Α Επιστροφή στις Μικτές Στρατηγικές Όπως αναφέραμε στην Ενότητα 3Α ο arsay (973) πρότεινε ότι η μικτή στρατηγική του παίκτη j μπορεί να εκφράζει την αβεβαιότητα του παίκτη σχετικά με την επιλογή αμιγούς στρατηγικής του παίκτη j και πως, με τη σειρά της, η επιλογή του j να εξαρτάται από την ύπαρξη έστω και «μικρής έκτασης» ιδιωτικής πληροφόρησης Θα δώσουμε τώρα μια πιο ακριβή διατύπωση αυτής της ιδέας: μια ισορροπία κατά Nash σε μικτές στρατηγικές σε ένα παίγνιο πλήρους πληροφόρησης μπορεί (σχεδόν πάντα) να ερμηνευθεί ως μια μπεϋζιανή ισορροπία κατά Nash σε αμιγείς στρατηγικές σε ένα στενά συνδεδεμένο παίγνιο με μια μικρή δόση ελλιπούς πληροφόρησης (Θα παραβλέψουμε τις σπάνιες περιπτώσεις όπου δεν είναι δυνατή μια τέτοια ερμηνεία) Για να χρησιμοποιήσουμε γνωστούς μας όρους, η κρίσιμη παράμετρος μιας ισορροπίας κατά Nash σε μικτές στρατηγικές δεν είναι τόσο ότι ο παίκτης j επιλέγει τυχαία μια στρατηγική, όσο ότι ο παίκτης είναι αβέβαιος σχετικά με την επιλογή του παίκτη j είτε αυτή η αβεβαιότητα μπορεί να προκύπτει λόγω τυχαιότητας, είτε (όπως είναι πιθανότερο) λόγω μιας μικρής ποσότητας ελλιπούς πληροφόρησης, όπως στο παράδειγμα που ακολουθεί Θυμηθείτε ότι στη Μάχη των Φύλων υπάρχουν δύο ισορροπίες κατά Nash σε αμιγείς στρατηγικές (Όπερα, Όπερα) και (Αγώνας, Αγώνας) και μια ισορροπία κατά Nash σε μικτές στρατηγικές στην οποία ο/η Κρις επιλέγει Όπερα με πιθανότητα /3 και η/ο Πατ επιλέγει Αγώνα με πιθανότητα /3 Κρις Πατ Όπερα Αγώνας Όπερα, 0, 0 Αγώνας 0, 0, Η Μάχη των Φύλων Υποθέστε, τώρα, πως παρόλο που γνωρίζονται αρκετό καιρό, ο/η Κρις