Διάλεξη 7. Θεωρία παιγνίων VA 28, 29



Σχετικά έγγραφα
HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

Κεφάλαιο 29 Θεωρία παιγνίων

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

Βασικές Αρχές της Θεωρίας Παιγνίων

- Παράδειγμα 2. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να

Κυριαρχία και μεικτές στρατηγικές Μεικτές στρατηγικές και κυριαρχία Είδαμε ότι μια στρατηγική του παίκτη i είναι κυριαρχούμενη, αν υπάρχει κάποια άλλη

Notes. Notes. Notes. Notes Ε 10,10 0,3 Λ 3,0 2,2

Δεύτερο πακέτο ασκήσεων

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

Διάλεξη 8. Ολιγοπώλιο VA 27

Κεφάλαιο 28 Ολιγοπώλιο

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 2: Ισορροπία Nash. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Μικροοικονομική Ι. Ενότητα # 6: Θεωρία παιγνίων Διδάσκων: Πάνος Τσακλόγλου Τμήμα: Διεθνών και Ευρωπαϊκών Οικονομικών Σπουδών

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

6. Παίγνια αλληλοδιαδοχικών κινήσεων και η αξία του περιορισμού των επιλογών κάποιου ατόμου

ΠΜΣ Ενέργειας, Τμήμα ΔΕΣ, ΠαΠει


Στατικά Παίγνια Ελλιπούς Πληροφόρησης

Μελέτη πάνω στην εφαρμογή της θεωρίας παιγνίων σε θέματα πολεμικών τακτικών και στρατηγικής.


HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

ΜΟΝΟΠΩΛΙΑΚΟΣ ΑΝΤΑΓΩΝΙΣΜΟΣ, ΟΛΙΓΟΠΩΛΙΑ, ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

10/3/17. Κεφάλαιο 28 Ολιγοπώλιο. Μικροοικονομική. Ολιγοπώλιο. Ολιγοπώλιο. Ανταγωνισµός ποσότητας. Μια σύγχρονη προσέγγιση

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΡΙΤΟ-ΙΣΟΡΡΟΠΙΑ ΚΑΤΑ NASH ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

δημιουργία: επεξεργασία: Ν.Τσάντας

Παιγνιακά Μοντέλα Σύγκρουσης και Συνεργασίας

A 2 B 2 Γ 2. u 1 (A 1, A 2 ) = 3 > 1 = u 1 (B 1, A 2 ) u 1 (A 1, Γ 2 ) = 1 > 0 = u 1 (B 1, Γ 2 ) A 2 B 2

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 8: Πεπερασμένα επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Κοινωνικά Δίκτυα Θεωρία Παιγνίων

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Ολιγοπώλιο. Εισαγωγή στην Οικονομική Επιστήμη Ι. Αρ. Διάλεξης: 11

Τμήμα Διεθνών και Ευρωπαϊκών Σπουδών. Ιωάννης Παραβάντης. Επίκουρος Καθηγητής. Απρίλιος 2016

ΤΟΥΡΙΣΤΙΚΗ ΟΙΚΟΝΟΜΙΚΗ. ΚΕΦΑΛΑΙΟ 15.3 ΜΟΡΦΕΣ ΚΑΙ ΙΣΟΡΡΟΠΙΑ ΤΗΣ ΤΟΥΡΙΣΤΙΚΗΣ ΑΓΟΡΑΣ Το τουριστικό ολιγοπώλιο

Κεφάλαιο 4. Στο προηγούµενο κεφάλαιο ορίσαµε την ισορροπία κατά Nash και είδαµε ότι µια ισορροπία

16 Η θεωρία παιγνίων

Εκτεταμένα Παίγνια (Extensive Games)

Ένα Παίγνιο (game) ορίζεται ως μια δραστηριότητα με τα ακόλουθα τρία χαρακτηριστικά:

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Σηματοδοτικά Παίγνια και Τέλεια Μπεϊζιανή Ισορροπία

Κεφάλαιο 13ο Eπαναλαµβανόµενα παίγνια (Repeated Games)

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΕΥΤΕΡΟ- ΚΥΡΙΑΡΧΟΥΜΕΝΗ ΣΤΡΑΤΗΓΙΚΗ- PRISONER S DILLEMA ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

Κριτικές στο Υπόδειγμα Cournot

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

Κεφάλαιο 2ο (α) Αµιγείς Στρατηγικές (β) Μεικτές Στρατηγικές (α) Αµιγείς Στρατηγικές. Επαναλαµβάνουµε:

Κεφάλαιο 9 ο Κ 5, 4 4, 5 0, 0 0,0 5, 4 4, 5. Όπως βλέπουµε το παίγνιο δεν έχει καµιά ισορροπία κατά Nash σε αµιγείς στρατηγικές διότι: (ΙΙ) Α Κ

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ EKΤΟ ΔΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ II ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

Συνδυαστικά Παίγνια. ιαµόρφωση Παιγνίων. Θέµατα σε Πάιγνια Μηδενικού Αθροίσµατος

Κεφάλαιο 7ο. max(p 1 c)(α bp 1 +dp 2 )

Κεφάλαιο 5 R (2, 3) R (3, 0)

Θεωρία Παιγνίων και Αποφάσεων

ΑΣΚΗΣΗ 1 ΑΣΚΗΣΗ 2 ΑΣΚΗΣΗ 3

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Κεφάλαιο 8 ο Τ 3, 1-1, -1 Χ -1, -1 1, 3

Θεωρία Παιγνίων-Ολιγοπώλιο σε ποσότητες

Β. Βασιλειάδης Αν. Καθηγητής. Επιχειρησιακή Ερευνα Διάλεξη 6 η - Θεωρεία Παιγνίων

Μεταξύ του µονοπωλίου και του τέλειου ανταγωνισµού


ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΕΤΑΡΤΟ ΠΑΙΓΝΙΑ ΜΗ ΕΝΙΚΟΥ ΑΘΡΟΙΣΜΑΤΟΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΕΙ ΠΑΤΡΑΣ ΤΕΙ ΠΑΤΡΑΣ ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΏΝ ΠΑΙΓΝΙΩΝ- ΠΡΟΓΡΑΜΜΑ GAMBIT

2. Διαφήμιση σε Αγορές όπου υπάρχουν πολλές Επιχειρήσεις

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ 1. Κοινά χαρακτηριστικά

Το Υπόδειγμα της Οριακής Τιμολόγησης

Οικονομία των ΜΜΕ. Ενότητα 8: Παίγνια και ολιγοπωλιακές επιχειρήσεις

Πακέτο Επιχειρησιακή Έρευνα #02 ==============================================================

Notes. Notes. Notes. Notes

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Ολιγοπωλιακή Ισορροπία

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 7: Τέλεια ισορροπία Nash για υποπαίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΘΕΩΡΙΑ ΤΩΝ ΠΑΙΓΝΙΩΝ I.

Μικροοικονομική Ανάλυση ΙΙ

(γ) Τις μορφές στρατηγικής αλληλεπίδρασης που αναπτύσσονται

1. Επιλογή Ποιότητας στην Ολιγοπωλιακή Αγορά: Κάθετη Διαφοροποίηση Προϊόντος

B 1 A 1 B 2 A 2. t 1. t 3 w. t 2 A 3 B 3. t 4. t 5

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ

* τη µήτρα. Κεφάλαιο 1o

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΠΕΜΠΤΟ ΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

Βιομηχανική Οργάνωση ΙΙ: Θεωρίες Κρατικής Παρέμβασης & Ανταγωνισμού

Βασικές Έννοιες Θεωρίας Παιγνίων

Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης

Evolutionary Equilibrium

2. ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΑΣΚΗΣΗ 10. Λύση. π/ P1 =0 => P1+P2+4=0 => 4P1=1004+P2 => P1= 1004+P2 = R1(P2) 4 P2= 1004+P1 = R2(P1) 4

ΑΣΚΗΣΗ 1 Βρείτε την ισορροπία των ακόλουθων παιγνίων απαλείφοντας διαδοχικά τις κυριαρχούµενες στρατηγικές.

3. Ανταγωνισμός ως προς τις Τιμές: Το Υπόδειγμα Bertrand

Διάλεξη 10. Γενική Ισορροπία VA 30

Ισορροπία σε Αγορές Διαφοροποιημένων Προϊόντων

Παίγνια Συμφόρησης. ημήτρης Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Εθνικό Μετσόβιο Πολυτεχνείο

Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α

Transcript:

Διάλεξη 7 Θεωρία παιγνίων VA 28, 29

Θεωρία παιγνίων Στη θεωρία παιγνίων χρησιμοποιούμε υποδείγματα για τη στρατηγική συμπεριφορά των οικονομικών μονάδων που καταλαβαίνουν ότι οι ενέργειές τους επηρεάζουν τις ενέργειες άλλων μονάδων.

Μερικές εφαρμογές της θεωρίας παιγνίων Η μελέτη των ολιγοπωλίων (κλάδων που περιέχουν λίγες μόνο επιχειρήσεις) Η μελέτη των καρτέλ: π.χ. OPEC Η μελέτη εξωτερικών επιδράσεων: π.χ. η χρησιμοποίηση μιας κοινής πηγής πόρων όπως για παράδειγμα η αλιεία. Η μελέτη στρατιωτικών στρατηγικών.

Τι είναι ένα παίγνιο; Ένα παίγνιο αποτελείται από Ένα σύνολο παικτών. Ένα σύνολο στρατηγικών για κάθε παίκτη. Τις αποδόσεις κάθε παίκτη για κάθε σύνολο στρατηγικών κάθε παίκτη.

Παίγνια δύο παικτών Η αλληλεπίδραση στρατηγικών μπορεί να περιλαμβάνει πολλούς παίκτες & πολλές στρατηγικές, εμείς όμως θα μελετήσουμε μόνο τα παίγνια εκείνα που υπάρχουν δύο παίκτες, ο καθένας από τους οποίους μπορεί να επιλέξει μόνο μεταξύ δύο στρατηγικών.

Ένα παράδειγμα παιγνίου δυο παικτών Οι παίκτες αποκαλούνται 1 και 2. Οπαίκτης1 έχει δυο στρατηγικές, τις Πάνω και Κάτω. Οπαίκτης2 έχει δυο στρατηγικές, τις Αριστερά και Δεξιά. Ο πίνακας που δείχνει τις αποδόσεις και για τους δύο παίκτες για κάθε έναν από τους τέσσερις πιθανούς στρατηγικούς συνδυασμούς είναι ο πίνακας αποδόσεων του παιγνίου.

Ένα παράδειγμα παιγνίου δυο παικτών Α Δ Π Κ (1,2) (2,1) (0,1) (1,0) Αυτός είναι ο πίνακας αποδόσεων του παιγνίου. Η απόδοση του παίκτη 1 εμφανίζεται πρώτη. Η απόδοση του παίκτη 2 εμφανίζεται δεύτερη.

Ένα παράδειγμα παιγνίου δυο παικτών Α Δ Π Κ (1,2) (2,1) (0,1) (1,0) Αυτός είναι ο πίνακας αποδόσεων του παιγνίου. Π.χ. αν ο 1 παίζει Πάνω και ο 2 παίζει Δεξιά τότε η απόδοση του A είναι 0 και η απόδοση του B είναι 1.

Ένα παράδειγμα παιγνίου δυο παικτών Α Δ Π Κ (1,2) (2,1) (0,1) (1,0) Αυτός είναι ο πίνακας αποδόσεων του παιγνίου. Και αν ο παίκτης 1 παίζει Κάτω και ο 2 παίζει Δεξιά τότε η απόδοση του παίκτη 1 είναι 1 και η απόδοση του παίκτη 2 είναι 0.

Ένα παράδειγμα παιγνίου δυο παικτών Α Δ Π Κ (1,2) (2,1) (0,1) (1,0) Μια κατανομή στρατηγικών του παιγνίου είναι π.χ. ένα ζεύγος (Π,Δ) όπου το πρώτο στοιχείο είναι η στρατηγική που επιλέγει ο παίκτης 1 και το δεύτερο είναι η στρατηγική που επιλέγει ο παίκτης 2.

Ένα παράδειγμα παιγνίου δυο παικτών Α Δ Π Κ (1,2) (2,1) (0,1) (1,0) Ποιο θα είναι το αποτέλεσμα ενός τέτοιου παιγνίου; Ποια δηλαδή θα είναι η λύση του παιγνίου;

Ένα παράδειγμα παιγνίου δυο παικτών Α Δ Π Κ (1,2) (2,1) (0,1) (1,0) ΑπότηνάποψητουΠαίκτη1 είναι πάντα καλύτερο γι αυτόν να επιλέξει Κάτω

Ένα παράδειγμα παιγνίου δυο παικτών Α Δ Π Κ (1,2) (2,1) (0,1) (1,0) ΑπότηνάποψητουΠαίκτη1 είναι πάντα καλύτερο γι αυτόν να επιλέξει Κάτω ΑπότηνάποψητουΠαίκτη2 είναι παντα καλυτερο γι αυτόν να επιλέξει Αριστερά

Ένα παράδειγμα παιγνίου δυο παικτών Α Δ Π Κ (1,2) (2,1) (0,1) (1,0) Συνεπώς, η λύση του παιγνίου είναι η κατανομή στρατηγικών (Κ,Α): ο παίκτης1 παίζει Κάτω και ο παίκτης 2 παίζει Αριστερά

Ένα παράδειγμα παιγνίου δυο παικτών Α Δ Π Κ (1,2) (2,1) (0,1) (1,0) Έχουμε δηλαδή για κάθε παίκτη κυρίαρχη στρατηγική: μια άριστη στρατηγική ανεξάρτητα από το ποια στρατηγική επιλέγει ο άλλος παίκτης.

Ισορροπία κατά Nash Α Δ Π Κ (3,9) (0,0) (1,8) (2,1) Η λύση κυρίαρχης στρατηγικής είναι καλή όταν συμβαίνει, δεν συμβαίνει όμως συχνά. Το παραπάνω παίγνιο δεν έχει λύση κυρίαρχης στρατηγικής.

Ισορροπία κατά Nash Α Δ Π Κ (3,9) (0,0) (1,8) (2,1) Μια κατανομή στρατηγικών αποτελεί μια ισορροπία κατά Νash, αν η επιλογή του παίκτη 1, με δεδομένη την επιλογή του παίκτη 2, είναι άριστη, και ταυτόχρονα εάν η επιλογή του παίκτη 2, με δεδομένη την επιλογή του 1, είναι άριστη.

Πως βρίσκουμε τις ισορροπίες Nash; Α Δ Π Κ (3,9) (1,8) (0,0) (2,1)

Πως βρίσκουμε τις ισορροπίες Nash; Α Δ Π Κ (3,9) (1,8) (0,0) (2,1) Ισορροπίες κατά Νash: (Π, Α) με απόδοση (3, 9) (Κ, Δ) με απόδοση (2, 1)

Πως βρίσκουμε τις ισορροπίες Nash; Ένα ζεύγος στρατηγικών όπου κάθε στρατηγική του κάθε παίκτη είναι η καλύτερη απόκριση στη στρατηγική του άλλου παίκτη είναι ισορροπία κατά Nash

Ισορροπία κατά Nash Παίκτης B Α Δ Παίκτης A Π Κ (3,9) (0,0) (1,8) (2,1) (Π,Α) και (Κ,Δ) είναι και οι δύο ισορροπίες κατά Nash για το παίγνιο. Αλλά ποιά θα δούμε στη πράξη; Παρατηρήστε ότι η (Π,Α) προτιμάται από την (Κ,Δ) και από τους δύο παίκτες. Πρέπει τότε να δούμε να πραγματοποιείται μόνο η (Π,Α);

Το δίλημμα του φυλακισμένου ΓιαναδούμεανείναιτακατάPareto άριστα αποτελέσματα αυτά που βλέπουμε στην εκτέλεση ενός παιγνίου, σκεφτείτε ένα διάσημο δεύτερο παράδειγμα ενός παιγνίου δυο παικτών που ονομάζεται το δίλημμα του φυλακισμένου

Το δίλημμα του φυλακισμένου Κλάϊντ Α Ο Μπόνι Α Ο (-,-) (-30,-1) (-1,-30) (-10,-10)

Το δίλημμα του φυλακισμένου Α Κλάϊντ Ο Μπόνι Α Ο (-,-) (-30,-1) (-1,-30) (-10,-10) Αν η Μπόνι παίζει Άρνηση τότε η κάλλιστη απόκριση του Κλάϊντ είναι Ομολογία

Το δίλημμα του φυλακισμένου Α Κλάϊντ Ο Μπόνι Α Ο (-,-) (-30,-1) (-1,-30) (-10,-10) Αν η Μπόνι παίζει Άρνηση τότε η κάλλιστη απόκριση του Κλάϊντ είναι Ομολογία. Αν τώρα ο Κλάιντ παίζει Ομολογία τότε η κάλλιστη απόκριση της Μπόνι είναι Ομολογία και όχι Άρνηση.

Το δίλημμα του φυλακισμένου Α Κλάϊντ Ο Μπόνι Α Ο (-,-) (-30,-1) (-1,-30) (-10,-10) Αν η Μπόνι παίζει Ομολογία τότε η κάλλιστη απόκριση του Κλάϊντ είναι Ομολογία

Το δίλημμα του φυλακισμένου Α Κλάϊντ Ο Μπόνι Α Ο (-,-) (-30,-1) (-1,-30) (-10,-10) Αν η Μπόνι παίζει Ομολογία τότε η κάλλιστη απόκριση του Κλάϊντ είναι Ομολογία. Αν τώρα ο Κλάιντ παίζει Ομολογία τότε η κάλλιστη απόκριση της Μπόνι είναι Ομολογία.

Το δίλημμα του φυλακισμένου Α Κλάϊντ Ο Μπόνι Α Ο (-,-) (-30,-1) (-1,-30) (-10,-10) Έτσι, η μόνη ισορροπία κατά Nash γι αυτό το παίγνιο είναι (Ο,Ο), ακόμακαιανη(α,α) έχεικαιγιατημπόνικαι για τον Κλάϊντ καλύτερα αποτελέσματα. Η ισορροπία κατά Nash είναι αναποτελεσματική κατά Pareto.

Το δίλημμα του φυλακισμένου Α Κλάϊντ Ο Μπόνι Α Ο (-,-) (-30,-1) (-1,-30) (-10,-10) Το πρόβλημα είναι ότι δεν υπάρχει τρόπος συντονισμού των ενεργειών των φυλακισμένων. Εάν μπορούσαν να εμπιστευτούν ο ένας τον άλλο, θα βελτίωναν και οι δυο τη θέση τους.

Στατικά παίγνια ταυτοχρόνων κινήσεων Και στα δύο παραδείγματα που είδαμε, οι παίκτες επιλέγουν τη στρατηγική τους ταυτόχρονα και το παίγνιο παίζεται μια μόνο φορά. Τέτοια παίγνια ονομάζονται στατικά παίγνια ταυτοχρόνων κινήσεων (oneshot games).

Δυναμικά παίγνια διαδοχικών κινήσεων Υπάρχουν όμως παίγνια όπου ένας παίκτης παίζει πριν τον άλλο. Τέτοια παίγνια είναι τα διαδοχικά ή δυναμικά παίγνια. Ο παίκτης που παίζει πρώτος είναι ο ηγέτης. Ο παίκτης που παίζει δεύτερος είναι ο ακόλουθος.

Ένα παράδειγμα διαδοχικού παιγνίου Μερικές φορές ένα παίγνιο έχει περισσότερες από μια ισορροπίες κατά Nash και είναι δύσκολο να πεις τι είναι πιο πιθανό να συμβεί. Ωστόσο, αν ένα παίγνιο είναι δυναμικό, μπορούμε μερικές φορές να ισχυριστούμε ότι μια ισορροπία κατά Nash είναι πιθανότερο να συμβεί από μια άλλη.

Ένα παράδειγμα διαδοχικού παιγνίου Α Δ Π Κ (3,9) (0,0) (1,8) (2,1) Η (Π,Α) και η (Κ,Δ) είναι και οι δύο ισορροπίες κατά Nash όταν αυτό το παίγνιο παίζεται ταυτόχρονα και δεν έχουμε τρόπο να κρίνουμε ποιά ισορροπία είναι πιθανότερο να συμβεί.

Ένα παράδειγμα διαδοχικού παιγνίου Α Δ Π Κ (3,9) (0,0) (1,8) (2,1) Υποθέστε αντ αυτού ότι το παίγνιο παίζεται διαδοχικά, με τον παίκτη 1 να ηγείται και τον παίκτη 2 να ακολουθεί. Είναι καλύτερα τότε να ξαναγράψουμε το παίγνιο στην εκτεταμένη του μορφή.

Ένα παράδειγμα διαδοχικού παιγνίου Π 1 Κ 2 2 Ο 1 παίζει πρώτος. Ο 2 παίζει δεύτερος. Α Δ Α Δ 3 9 1 8 0 0 2 1

Ένα παράδειγμα διαδοχικού παιγνίου Π 1 Κ 2 2 Ο 1 παίζει πρώτος. Ο 2 παίζει δεύτερος. Α Δ Α Δ (3,9) (1,8) (0,0) (2,1) Η (Π,Α) είναι μια ισορροπία κατά Nash.

Ένα παράδειγμα διαδοχικού παιγνίου B Π A Κ B Ο 1 παίζει πρώτος. Ο 2 παίζει δεύτερος. Α Δ Α Δ (3,9) (1,8) (0,0) (2,1) H (Π,Α) είναι μια ισορροπία κατά Nash. H (Κ,Δ) είναι μια ισορροπία κατά Nash. Ποια είναι πιθανότερο να συμβεί;

Ένα παράδειγμα διαδοχικού παιγνίου Π 1 Κ 2 2 Ο 1 παίζει πρώτος. Ο 2 παίζει δεύτερος. Α Δ Α Δ (3,9) (1,8) (0,0) (2,1) Για να βρούμε τη λύση αυτού του παιγνίου αναλύουμε το παίγνιο από το τέλος προς την αρχή. Ξεκινάμε δηλαδή από τις στρατηγικές του «ακόλουθου» παίκτη, του παίκτη 2.

Ένα παράδειγμα διαδοχικού παιγνίου Π 1 Κ 2 2 Ο 1 παίζει πρώτος. Ο 2 παίζει δεύτερος. Α Δ Α Δ (3,9) (1,8) (0,0) (2,1) Οπαίκτης2 μεταξύ των στρατηγικών του Α και Δ επιλέγει Α αριστερά (διότι 9 >8)και Δ δεξιά (διότι 0< 1).

Ένα παράδειγμα διαδοχικού παιγνίου Π 1 Κ 2 2 Ο 1 παίζει πρώτος. Ο 2 παίζει δεύτερος. Α Δ Α Δ (3,9) (1,8) (0,0) (2,1) Οπαίκτης2 μεταξύ των στρατηγικών του Α και Δ επιλέγει Α αριστερά και Δ δεξιά. Το θέμα τώρα είναι ότι οπαίκτης1 το ξέρει αυτό, άρα δοθέντος ότι ο παίκτης 2 επιλέγει Α αριστερά και Δ δεξιά, τι επιλέγει αυτός;

Ένα παράδειγμα διαδοχικού παιγνίου Π 1 Κ 2 2 Ο 1 παίζει πρώτος. Ο 2 παίζει δεύτερος. Α Δ Α Δ (3,9) (1,8) (0,0) (2,1) Επειδή 3 >2 οπαίκτης1 επιλέγει να παίξει Π. Οπότε η ισορροπία (Π,Α) με απόδοση (3,9) είναι η πιθανότερη ισορροπία κατά Νash

Μικτές στρατηγικές Α Δ Π Κ (1,2) (0,4) (0,) (3,2) Εδώ είναι ένα νέο παίγνιο. Υπάρχει ισορροπία κατά Nash;

Μικτές στρατηγικές Α Δ Π Κ (1,2) (0,4) (0,) (3,2) Το παίγνιο δεν παρουσιάζει ισορροπία Nash σε καθαρές στρατηγικές. Ωστόσο, είναι ένα παίγνιο με πεπερασμένο αριθμό παικτών και στρατηγικών οπότε θα έχει σίγουρα τουλάχιστον μία ισορροπία Νash. Αναζητούμε ισορροπία Νash σε μικτές στρατηγικές.

Μικτές στρατηγικές Αντί να παίζει Πάνω ή Κάτω, ο παίκτης1 επιλέγει μια κατανομή πιθανοτήτων (π Π,1-π Π ), που σημαίνει ότι με πιθανότητα π Π οπαίκτης1 θα παίξει Πάνω και με πιθανότητα 1-π Π θα παίξει Κάτω. Οπαίκτης1 αναμιγνύει τις καθαρές στρατηγικές Πάνω και Κάτω. Η κατανομή πιθανότητας (π Π,1-π Π ) είναι μια μικτή στρατηγική για τον παίκτη 1.

Μικτές στρατηγικές Ομοίως, ο παίκτης 2 επιλέγει μια κατανομή πιθανοτήτων (π Α,1-π Α ), που σημαίνει ότι με πιθανότητα π Α ο παίκτης 2 θα παίξει Αριστερά και με πιθανότητα 1-π Α θα παίξει Δεξιά. Ο παίκτης 2 αναμιγνύει τις καθαρές στρατηγικές Αριστερά και Δεξιά. Η κατανομή πιθανοτήτων (π Α,1-π Α ) είναι μια μικτή στρατηγική για τον παίκτη 2.

Μικτές στρατηγικές Α Δ Π Κ (1,2) (0,4) (0,) (3,2) Αυτό το παίγνιο δεν έχει ισορροπία κατά Nash σε καθαρές στρατηγικές, αλλά έχει ισορροπία κατά Nash σε μικτές στρατηγικές. Πώς την βρίσκουμε;

Μικτές στρατηγικές Α,π Α Δ,1-π Α Π,π Π Κ,1-π Π (1,2) (0,4) (0,) (3,2)

Μικτές στρατηγικές Α,π Α Δ,1-π Α Π,π Π Κ,1-π Π (1,2) (0,4) (0,) (3,2) Αν ο παίκτης 2 παίξει Αριστερά η αναμενόμενη απόδοσή του είναι 2π Π + (1 π Π )

Μικτές στρατηγικές Α,π Α Δ,1-π Α Π,π Π Κ,1-π Π (1,2) (0,4) (0,) (3,2) Αν ο παίκτης 2 παίξει Αριστερά η αναμενόμενη απόδοσή του είναι 2π Π + (1 π Π ) Αν ο παίκτης 2 παίξει Δεξιά η αναμενόμενη απόδοσή του είναι 4π Π + 2(1 π Π )

Μικτές στρατηγικές Α,π Α Δ,1-π Α Π,π Π Κ,1-π Π (1,2) (0,4) (0,) (3,2) Αν 2π Π + (1 π Π ) > 4π Π + 2(1 π Π ) τότε οπαίκτης2 θα έπαιζε μόνο Αριστερά. Αλλά τότε θα είχαμε ισορροπία Nash σε καθαρές και όχι σε μικτές στρατηγικές.

Μικτές στρατηγικές Α,π Α Δ,1-π Α Π,π Π Κ,1-π Π (1,2) (0,4) (0,) (3,2) Αν 2π Π + (1 π Π ) < 4π Π + 2(1 π Π ) τότε οπαίκτης2 θα έπαιζε μόνο Δεξιά. Αλλά τότε θα είχαμε ισορροπία Nash σε καθαρές και όχι σε μικτές στρατηγικές.

Μικτές στρατηγικές Α,π Α Δ,1-π Α Π,π Π Κ,1-π Π (1,2) (0,4) (0,) (3,2) Άρα, για να υπάρχει ισορροπία Nash σε μικτές στρατηγικές, o παίκτης 2 πρέπει να είναι αδιάφορος μεταξύ του να παίξει Αριστερά ή Δεξιά, δηλ. 2π Π + (1 π Π ) = 4π Π + 2(1 π Π )

Μικτές στρατηγικές Α,π Α Δ,1-π Α Π,π Π Κ,1-π Π (1,2) (0,4) (0,) (3,2) Άρα, για να υπάρχει ισορροπία Nash σε μικτές στρατηγικές, o παίκτης 2 πρέπει να είναι αδιάφορος μεταξύ του να παίξει Αριστερά ή Δεξιά, δηλ. 2π Π + (1 π Π ) = 4π Π + 2(1 π Π ) ππ = 3/

Μικτές στρατηγικές Α,π Α Δ,1-π Α Π, Κ, 3 2 (1,2) (0,4) (0,) (3,2) Άρα για να υπάρχει ισορροπία Nash σε μικτές στρατηγικές, o παίκτης 2 πρέπει να είναι αδιάφορος μεταξύ του να παίξει Αριστερά ή Δεξιά, δηλ. 2π Π + (1 π Π ) > 4π Π + 2(1 π Π ) π Π = 3/

Μικτές στρατηγικές Α,π Α Δ,1-π Α Π, Κ, 3 2 (1,2) (0,4) (0,) (3,2)

Μικτές στρατηγικές Π, Κ, 3 2 Α,π Α Δ,1-π Α (1,2) (0,4) (0,) (3,2) Αν ο παίκτης 1 παίξει Πάνω η αναμενόμενη απόδοσή του είναι 1 π Α + 0 (1 π Α ) = π Α

Μικτές στρατηγικές Π, Κ, 3 2 Α,π Α Δ,1-π Α (1,2) (0,4) (0,) (3,2) Αν ο παίκτης 1 παίξει Πάνω η αναμενόμενη απόδοσή του είναι 1 π Α + 0 (1 π Α ) = π Α Αν ο παίκτης 1 παίξει Κάτω η αναμενόμενη απόδοσή του είναι 0 π Α + 3 (1 π Α ) = 3(1 π Α )

Αν Π, Κ, 3 2 π Α > 3(1 π Α ) Μικτές στρατηγικές Α,π Α Δ,1-π Α (1,2) (0,4) (0,) (3,2) τότε ο παίκτης 1 θα έπαιζε μόνο Πάνω. ΑλλάδενυπάρχουνισορροπίεςNash σε μικτές όπου οπαίκτης1 να παίζει μόνο Πάνω.

Αν Π, Κ, 3 2 π Α <3(1 π Α ) Μικτές στρατηγικές Α,π Α Δ,1-π Α (1,2) (0,4) (0,) (3,2) τότε ο παίκτης 1 θα έπαιζε μόνο Κάτω. ΑλλάδενυπάρχουνισορροπίεςNash σε μικτές όπου οπαίκτης1 να παίζει μόνο Κάτω.

Μικτές στρατηγικές Α,π Α Δ,1-π Α Π, Κ, 3 2 (1,2) (0,4) (0,) (3,2) Άρα για να υπάρχει μια ισορροπία Nash σε μικτές, o παίκτης 1 πρέπει να είναι αδιάφορος μεταξύ του να παίξει Πάνω ή Κάτω, δηλ. π Α =3(1 π Α )

Μικτές στρατηγικές Α,π Α Δ,1-π Α Π, Κ, 3 2 (1,2) (0,4) (0,) (3,2) Άρα για να υπάρχει μια ισορροπία Nash σε μικτές, o παίκτης 1 πρέπει να είναι αδιάφορος μεταξύ του να παίξει Πάνω ή Κάτω, δηλ. π Α = 3(1 π Α ) π Α = 3 / 4

Μικτές στρατηγικές Π, Κ, 3 2 3 1 4 4 Α, Δ, (1,2) (0,4) (0,) (3,2) Άρα για να υπάρχει μια ισορροπία Nash σε μικτές, o παίκτης 1 πρέπει να είναι αδιάφορος μεταξύ του να παίξει Πάνω ή Κάτω, δηλ. π Α = 3(1 π Α ) π Α = 3 / 4

Μικτές στρατηγικές Π, Κ, 3 2 3 Α, Δ, 4 1 4 (1,2) (0,4) (0,) (3,2) Έτσι, ημόνηnash ισορροπία του παιγνίου θέλει τον παίκτη 1 να παίζει την μικτή στρατηγική (3/, 2/) και τον παίκτη 2 να παίζει την μικτή στρατηγική (3/4, 1/4).

Μικτές στρατηγικές Π, Κ, 3 2 3 1 4 4 Α, Δ, (1,2) 9/20 (0,4) (0,) (3,2) Οι αποδόσεις θα είναι (1,2) με πιθανότητα 3 3 = 4 9 20

Μικτές στρατηγικές Π, Κ, 3 2 3 1 4 4 Α, Δ, (1,2) (0,4) 9/20 3/20 (0,) (3,2) Οι αποδόσεις θα είναι (0,4) με πιθανότητα 3 1 = 4 3 20

Μικτές στρατηγικές Π, Κ, 3 2 3 1 4 4 Α, Δ, (1,2) (0,4) 9/20 3/20 (0,) 6/20 (3,2) Οι αποδόσεις θα είναι (0,) με πιθανότητα 2 3 = 4 6 20

Μικτές στρατηγικές Π, Κ, 3 2 3 1 4 4 Α, Δ, (1,2) (0,4) 9/20 3/20 (0,) (3,2) 6/20 2/20 Οι αποδόσεις θα είναι (3,2) με πιθανότητα 2 1 = 4 2 20

Μικτές στρατηγικές Π, Κ, 3 2 3 1 4 4 Α, Δ, (1,2) (0,4) 9/20 3/20 (0,) (3,2) 6/20 2/20

Μικτές στρατηγικές Π, Κ, 3 2 3 1 4 4 Α, Δ, (1,2) (0,4) 9/20 3/20 (0,) (3,2) 6/20 2/20 Η αναμενόμενη απόδοση του παίκτη 1 στην ισορροπία Nash σε μικτές είναι: 9 1 3 6 0 0 20 + 2 3 3 20 + 20 + 20 = 4.

Μικτές στρατηγικές Π, Κ, 3 2 3 1 4 4 Α, Δ, (1,2) (0,4) 9/20 3/20 (0,) (3,2) 6/20 2/20 Η αναμενόμενη απόδοση του παίκτη 2 στην ισορροπία Nash σε μικτές είναι: 2 9 3 6 4 20 + 2 16 2 20 + 20 + 20 =.

Πόσες ισορροπίες κατά Nash; Ένα παίγνιο με πεπερασμένο αριθμό παικτών και πεπερασμένο αριθμό στρατηγικών, έχει τουλάχιστον μια ισορροπία Nash. Έτσι, αν το παίγνιο δεν έχει ισορροπία Nash σε καθαρές στρατηγικές τότε θα πρέπει να έχει τουλάχιστον μια ισορροπία Nash σε μικτές στρατηγικές.

Παραδείγματα