HAL R. VARIAN Μικροοικονομική Μια σύγχρονη προσέγγιση 3 η έκδοση
Κεφάλαιο 29 Θεωρία παιγνίων
Θεωρία παιγνίων Η θεωρία παιγνίων βοηθά στην ανάλυση της στρατηγικής συμπεριφοράς από φορείς που κατανοούν ότι οι ενέργειές τους επηρεάζουν τις ενέργειες άλλων φορέων.
Εφαρµογές της θεωρίας παιγνίων Η μελέτη των ολιγοπωλίων (κλάδων που περιέχουν λίγες μόνο εταιρείες) Η μελέτη των καρτέλ, π.χ. ΟΠΕΚ Η μελέτη των εξωτερικών επιδράσεων, π.χ. η χρήση ενός κοινού πόρου, όπως ενός ιχθυοτροφείου.
Εφαρµογές της θεωρίας παιγνίων Η μελέτη στρατιωτικών στρατηγικών. Διαπραγματεύσεις. Ο τρόπος λειτουργίας των αγορών.
Τι είναι τα παίγνια; Ένα παίγνιο αποτελείται από μια ομάδα παικτών μια ομάδα στρατηγικών για κάθε παίκτη τις αποδόσεις σε κάθε παίκτη για κάθε πιθανή επιλογή στρατηγικών από τους παίκτες.
Παίγνια δύο παικτών Ένα παίγνιο με μόνο δύο παίκτες είναι ένα παίγνιο δύο παικτών. Θα μελετήσουμε μόνο παίγνια στα οποία υπάρχουν δύο παίκτες και καθένας απ αυτούς μπορεί να επιλέξει μεταξύ μόνο δύο ενεργειών.
Ένα παράδειγµα παιγνίου δύο παικτών Οι παίκτες ονομάζονται A και B. Ο παίκτης A έχει δύο ενέργειες, Πάνω (U) και Κάτω (D).
Ένα παράδειγµα παιγνίου δύο παικτών Ο παίκτης B έχει δύο ενέργειες, Αριστερά (L) και Δεξιά (R). Ο πίνακας που δείχνει τις αποδόσεις των δύο παικτών για καθέναν από τους τέσσερις πιθανούς συνδυασμούς ενεργειών είναι ο πίνακας αποδόσεων του παιγνίου.
Ένα παράδειγµα παιγνίου δύο παικτών L R U D (3,9) (0,0) (1,8) (2,1) Αυτός είναι ο πίνακας αποδόσεων του παιγνίου. Η απόδοση του παίκτη Α εμφανίζεται πρώτη. Η απόδοση του παίκτη B εμφανίζεται δεύτερη.
Ένα παράδειγµα παιγνίου δύο παικτών L R U D (3,9) (0,0) (1,8) (2,1) Μία σύνοδος του παιγνίου είναι ένα ζεύγος όπως το (U,R) όπου το 1 ο στοιχείο είναι η ενέργεια που επιλέγει ο παίκτης A και το 2 ο είναι η ενέργεια που επιλέγει ο παίκτης B.
Ένα παράδειγµα παιγνίου δύο παικτών L R U D (3,9) (0,0) (1,8) (2,1) Αυτός είναι ο πίνακας αποδόσεων του παιγνίου. π.χ. αν ο A παίξει Πάνω (U) και ο Β παίξει δεξιά (R), τότε η απόδοση του Α είναι 1 και η απόδοση του Β είναι 8.
Ένα παράδειγµα παιγνίου δύο παικτών L R U D (3,9) (0,0) (1,8) (2,1) Αυτός είναι ο πίνακας αποδόσεων του παιγνίου. και αν ο A παίξει Κάτω (D) και ο B παίξει Δεξιά (R), τότε η απόδοση του Α είναι 2 και η απόδοση του Β είναι 1.
Ένα παράδειγµα παιγνίου δύο παικτών L R U D (3,9) (0,0) (1,8) (2,1) Πώς είναι πιθανό να παίξουν οι παίκτες σ' αυτό το παίγνιο;
Ένα παράδειγµα παιγνίου δύο παικτών L R Είναι πιθανό να παιχτεί το (U,R); U D (3,9) (0,0) (1,8) (2,1)
Ένα παράδειγµα παιγνίου δύο παικτών L R Είναι πιθανό να παιχτεί το (U,R); U D (3,9) (0,0) (1,8) (2,1) Αν ο Β παίξει Δεξιά, τότε η καλύτερη απάντηση του Α είναι Κάτω, επειδή βελτιώνει έτσι την απόδοση του Α από 1 σε 2. Άρα, το (U,R) δεν είναι πιθανό.
Ένα παράδειγµα παιγνίου δύο παικτών L R Είναι πιθανό να παιχτεί το (D,R); U D (3,9) (0,0) (1,8) (2,1)
Ένα παράδειγµα παιγνίου δύο παικτών L R Είναι πιθανό να παιχτεί το (D,R); U D (3,9) (0,0) (1,8) (2,1) Αν ο Β παίξει Δεξιά, τότε η καλύτερη απάντηση του A είναι Κάτω.
Ένα παράδειγµα παιγνίου δύο παικτών L R Είναι πιθανό να παιχτεί το (D,R); U D (3,9) (0,0) (1,8) (2,1) Αν ο Β παίξει Δεξιά, τότε η καλύτερη απάντηση του A είναι Κάτω. Αν ο A παίξει κάτω, τότε η καλύτερη απάντηση του Β είναι Δεξιά. Άρα, το (D,R) είναι πιθανό.
Ένα παράδειγµα παιγνίου δύο παικτών L R Είναι πιθανό να παιχτεί το (D,L); U D (3,9) (0,0) (1,8) (2,1)
Ένα παράδειγµα παιγνίου δύο παικτών L R Είναι πιθανό να παιχτεί το (D,L); U D (3,9) (0,0) (1,8) (2,1) Αν ο A παίξει κάτω, τότε η καλύτερη απάντηση του B είναι Δεξιά, άρα το (D,L) δεν είναι πιθανό.
Ένα παράδειγµα παιγνίου δύο παικτών L R Είναι πιθανό να παιχτεί το (U,L); U D (3,9) (0,0) (1,8) (2,1)
Ένα παράδειγµα παιγνίου δύο παικτών L R Είναι πιθανό να παιχτεί το (U,L); U D (3,9) (0,0) (1,8) (2,1) Αν ο A παίξει Πάνω, η καλύτερη απάντηση του B είναι Αριστερά.
Ένα παράδειγµα παιγνίου δύο παικτών L R Είναι πιθανό να παιχτεί το (U,L); U D (3,9) (0,0) (1,8) (2,1) Αν ο A παίξει Πάνω, η καλύτερη απάντηση του B είναι Αριστερά. Αν ο Β παίξει Αριστερά, η καλύτερη απάντηση του A είναι Πάνω. Άρα, το (U,L) είναι πιθανό.
Ισορροπία Nash Μια σύνοδος του παιγνίου όπου κάθε στρατηγική είναι μια καλύτερη απάντηση στον άλλον είναι μια Ισορροπία κατά Nash. Το παράδειγμά μας έχει δύο ισορροπίες κατά Nash: (U,L) και (D,R).
Ένα παράδειγµα παιγνίου δύο παικτών L R U D (3,9) (0,0) (1,8) (2,1) (U,L) και (D,R) είναι αμφότερες ισορροπίες Nash για το παίγνιο.
Ένα παράδειγµα παιγνίου δύο παικτών L R U D (3,9) (0,0) (1,8) (2,1) (U,L) και (D,R) είναι αμφότερες ισορροπίες Nash για το παίγνιο. Αλλά ποια θα δούμε; Σημειώστε ότι αμφότεροι οι παίκτες προτιμούν το (U,L) από το (D,R). Πρέπει τότε να δούμε μόνο το (U,L);
Το δίληµµα του φυλακισµένου Για να καταλάβετε αν τα προτιμώμενα κατά Pareto αποτελέσματα είναι αυτά που βλέπουμε στη διαδικασία ενός παιγνίου, εξετάζουμε το διάσημο παράδειγμα που ονομάζεται Δίλημμα του φυλακισμένου.
Το δίληµµα του φυλακισµένου S Κλάιντ C Μπόνι S C (-5,-5) (-30,-1) (-1,-30) (-10,-10) Πώς είναι πιθανό να παίξουν οι παίκτες σ' αυτό το παίγνιο;
Το δίληµµα του φυλακισµένου S Κλάιντ C Μπόνι S C (-5,-5) (-30,-1) (-1,-30) (-10,-10) Εάν η Μπόνι παίζει Σιωπή (S), τότε η καλύτερη απάντηση του Κλάιντ είναι Ομολογία (C).
Το δίληµµα του φυλακισµένου S Κλάιντ C Μπόνι S C (-5,-5) (-30,-1) (-1,-30) (-10,-10) Εάν η Μπόνι παίζει Σιωπή (S), τότε η καλύτερη απάντηση του Κλάιντ είναι Ομολογία (C). Εάν η Μπόνι παίζει Ομολογία (C), τότε η καλύτερη απάντηση του Κλάιντ είναι Ομολογία (C).
Το δίληµµα του φυλακισµένου S Κλάιντ C Μπόνι S C (-5,-5) (-30,-1) (-1,-30) (-10,-10) Ανεξάρτητα από το παιχνίδι της Μπόνι, η καλύτερη απάντηση του Κλάιντ είναι πάντα Ομολογία. Η Ομολογία είναι μια κυρίαρχη στρατηγική για τον Κλάιντ.
Το δίληµµα του φυλακισµένου S Κλάιντ C Μπόνι S C (-5,-5) (-30,-1) (-1,-30) (-10,-10) Ομοίως, ανεξάρτητα από το παιχνίδι του Κλάιντ, η καλύτερη απάντηση της Μπόνι είναι πάντα Ομολογία. Η Ομολογία είναι μια κυρίαρχη στρατηγική για την Μπόνι.
Το δίληµµα του φυλακισµένου S Κλάιντ C Μπόνι S C (-5,-5) (-30,-1) (-1,-30) (-10,-10) Άρα, μόνο η ισορροπία κατά Nash γι αυτό το παίγνιο είναι (C,C), ακόμα κι αν το (S,S) δίνει στους Μπόνι και Κλάιντ καλύτερες αποδόσεις. Η μόνη ισορροπία Nash είναι αναποτελεσματική.
Ποιος παίζει πότε; Στα δύο παραδείγματα, οι παίκτες επέλεξαν τις στρατηγικές τους ταυτόχρονα. Τέτοια παίγνια είναι ταυτόχρονα παίγνια.
Ποιος παίζει πότε; Αλλά υπάρχουν άλλα παίγνια στα οποία ο ένας παίκτης παίζει πριν τον άλλον. Τέτοια παίγνια ονομάζονται διαδοχικά παίγνια. Ο παίκτης που παίζει πρώτος είναι ο ηγέτης και ο παίκτης που παίζει δεύτερος είναι ο ακόλουθος.
Ένα παράδειγµα διαδοχικού παιγνίου Μερικές φορές ένα παίγνιο έχει περισσότερες από μία ισορροπία Nash και είναι δύσκολο να καταλάβουμε ποια είναι πιο πιθανό να συμβεί. Όταν ένα παίγνιο είναι διαδοχικό, είναι πιθανό μερικές φορές να ισχυριστούμε ότι μία από τις ισορροπίες Nash είναι πιο πιθανό να συμβεί από την άλλη.
Ένα παράδειγµα διαδοχικού παιγνίου L R U D (3,9) (0,0) (1,8) (2,1) Τα (U,L) και (D,R) είναι αμφότερα NE (ισορροπία Nash) όταν αυτό το παίγνιο παίζεται ταυτόχρονα και δεν μπορούμε να αποφασίσουμε ποια ισορροπία είναι πιθανότερο να συμβεί.
Ένα παράδειγµα διαδοχικού παιγνίου L R U D (3,9) (0,0) (1,8) (2,1) Έστω ότι αντίθετα, το παίγνιο παίζεται διαδοχικά, με τον A να ξεκινά και τον B να ακολουθεί. Μπορούμε να γράψουμε ξανά το παίγνιο στην εκτατική μορφή του.
Ένα παράδειγµα διαδοχικού παιγνίου A B U D B Ο Α παίζει πρώτος. Ο Β παίζει δεύτερος. L R L R (3,9) (1,8) (0,0) (2,1)
Ένα παράδειγµα διαδοχικού παιγνίου A B U D B Ο Α παίζει πρώτος. Ο Β παίζει δεύτερος. L R L R (3,9) (1,8) (0,0) (2,1) Το (U,L) είναι ισορροπία Nash.
Ένα παράδειγµα διαδοχικού παιγνίου A B U D B Ο Α παίζει πρώτος. Ο Β παίζει δεύτερος. L R L R (3,9) (1,8) (0,0) (2,1) Το (U,L) είναι ισορροπία Nash. Το ίδιο και το (D,R). Η μία ισορροπία είναι πιο πιθανό να συμβεί;
Ένα παράδειγµα διαδοχικού παιγνίου A B U D B Ο Α παίζει πρώτος. Ο Β παίζει δεύτερος. L R L R (3,9) (1,8) (0,0) (2,1) Εάν ο A παίζει U τότε ο B ακολουθεί με L και ο A παίρνει 3.
Ένα παράδειγµα διαδοχικού παιγνίου A B U D B Ο Α παίζει πρώτος. Ο Β παίζει δεύτερος. L R L R (3,9) (1,8) (0,0) (2,1) Εάν ο A παίζει U τότε ο B ακολουθεί με L και ο A παίρνει 3. Εάν ο A παίζει D τότε ο B ακολουθεί με R και ο A παίρνει 2.
Ένα παράδειγµα διαδοχικού παιγνίου A B U D B Ο Α παίζει πρώτος. Ο Β παίζει δεύτερος. L R L Εάν ο A παίζει U τότε ο B ακολουθεί με L και ο A παίρνει 3. Εάν ο A παίζει D τότε ο B ακολουθεί με R και ο A παίρνει 2. R (3,9) (1,8) (0,0) (2,1) Άρα, (U,L) είναι το πιθανό NE.
Ένα παράδειγµα διαδοχικού παιγνίου L R U D (3,9) (0,0) (1,8) (2,1) Το αρχικό παράδειγμά μας για ακόμα μία φορά. Έστω ότι παίζεται ταυτόχρονα. Ανακαλύψαμε ότι το παίγνιο έχει δύο ισορροπίες Nash: (U,L) και (D,R).
Ένα παράδειγµα διαδοχικού παιγνίου L R U D (3,9) (0,0) (1,8) (2,1) Θεωρούμε ότι ο παίκτης A επιλέγει να παίξει U ή D, αλλά κανέναν συνδυασμό των δύο, δηλ., να παίξει αμιγώς U ή D. Τα U και D είναι οι αμιγείς στρατηγικές του παίκτη A.
Ένα παράδειγµα διαδοχικού παιγνίου L R U D (3,9) (0,0) (1,8) (2,1) Ομοίως, τα L και R είναι οι αμιγείς στρατηγικές του παίκτη Β.
Ένα παράδειγµα διαδοχικού παιγνίου L R U D (3,9) (0,0) (1,8) (2,1) Συνεπώς, τα (U,L) και (D,R) είναι ισορροπίες Nash αμιγούς στρατηγικής. Πρέπει κάθε παίγνιο να έχει τουλάχιστον μία ισορροπία Nash αμιγούς στρατηγικής;
Αµιγείς στρατηγικές L R U D (1,2) (0,4) (0,5) (3,2) Αυτό είναι ένα νέο παίγνιο. Υπάρχουν ισορροπίες Nash αμιγούς στρατηγικής;
Αµιγείς στρατηγικές L R U D (1,2) (0,4) (0,5) (3,2) Είναι το (U,L) ισορροπία Nash;
Αµιγείς στρατηγικές L R U D (1,2) (0,4) (0,5) (3,2) Είναι το (U,L) ισορροπία Nash; Όχι. είναι το (U,R) ισορροπία Nash;
Αµιγείς στρατηγικές L R U D (1,2) (0,4) (0,5) (3,2) Είναι το (U,L) ισορροπία Nash; Όχι. Είναι το (U,R) ισορροπία Nash; Όχι. Είναι το (D,L) ισορροπία Nash;
Αµιγείς στρατηγικές L R U D (1,2) (0,4) (0,5) (3,2) Είναι το (U,L) ισορροπία Nash; Όχι. Είναι το (U,R) ισορροπία Nash; Όχι. Είναι το (D,L) ισορροπία Nash; Όχι. Είναι το (D,R) ισορροπία Nash;
Αµιγείς στρατηγικές L R U D (1,2) (0,4) (0,5) (3,2) Είναι το (U,L) ισορροπία Nash; Όχι. Είναι το (U,R) ισορροπία Nash; Όχι. Είναι το (D,L) ισορροπία Nash; Όχι. Είναι το (D,R) ισορροπία Nash; Όχι.
Αµιγείς στρατηγικές L R U D (1,2) (0,4) (0,5) (3,2) Άρα το παίγνιο δεν έχει ισορροπίες Nash σε αμιγείς στρατηγικές. Ακόμα κι έτσι, το παίγνιο έχει μια ισορροπία Nash, αλλά σε μεικτές στρατηγικές.
Μεικτές στρατηγικές Αντί να παίζει αμιγώς Πάνω ή κάτω, ο παίκτης A επιλέγει μια κατανομή πιθανότητας (p U,1-p U ), που σημαίνει ότι με πιθανότητα p U ο παίκτης A θα παίξει Πάνω και με πιθανότητα 1-p U θα παίξει Κάτω. Ο παίκτης A αναμειγνύει τις αμιγείς στρατηγικές Πάνω και Κάτω. Η κατανομή πιθανότητας (p U,1-p U ) είναι μια μεικτή στρατηγική για τον παίκτη A.
Μεικτές στρατηγικές Ομοίως, ο παίκτης B επιλέγει μια κατανομή πιθανότητας (p L,1-p L ), που σημαίνει ότι με πιθανότητα p L ο παίκτης B θα παίξει Αριστερά και με πιθανότητα 1-p L θα παίξει Δεξιά. Ο παίκτης B αναμειγνύει τις αμιγείς στρατηγικές Αριστερά και Δεξιά. Η κατανομή πιθανότητας (p L,1-p L ) είναι μια μεικτή στρατηγική για τον παίκτη B.
Μεικτές στρατηγικές L R U D (1,2) (0,4) (0,5) (3,2) Αυτό το παίγνιο δεν έχει ισορροπία Nash σε αμιγείς στρατηγικές, αλλά έχει ισορροπία Nash σε μεικτές στρατηγικές. Πώς υπολογίζεται αυτή;
Μεικτές στρατηγικές L, p L R, 1-p L U, p U D, 1-p U (1,2) (0,4) (0,5) (3,2)
Μεικτές στρατηγικές L, p L R, 1-p L U, p U D, 1-p U (1,2) (0,4) (0,5) (3,2) Η αναμενόμενη τιμή του Α για την επιλογή Πάνω είναι ;;
Μεικτές στρατηγικές L, p L R, 1-p L U, p U D, 1-p U (1,2) (0,4) (0,5) (3,2) Η αναμενόμενη τιμή του Α για την επιλογή Πάνω είναι p L. Η αναμενόμενη τιμή του Α για την επιλογή Κάτω είναι ;;
Μεικτές στρατηγικές L, p L R, 1-p L U, p U D, 1-p U (1,2) (0,4) (0,5) (3,2) Η αναμενόμενη τιμή του Α για την επιλογή Πάνω είναι p L. Η αναμενόμενη τιμή του Α για την επιλογή Κάτω είναι 3(1 - p L ).
Μεικτές στρατηγικές L, p L R, 1-p L U, p U D, 1-p U (1,2) (0,4) (0,5) (3,2) Η αναμενόμενη τιμή του Α για την επιλογή Πάνω είναι p L. Η αναμενόμενη τιμή του Α για την επιλογή Κάτω είναι 3(1 - p L ). Εάν p L > 3(1 - p L ) τότε ο A θα επιλέξει μόνο Πάνω, αλλά δεν υπάρχει NE στην οποία ο A παίζει μόνο Πάνω.
Μεικτές στρατηγικές L, p L R, 1-p L U, p U D, 1-p U (1,2) (0,4) (0,5) (3,2) Η αναμενόμενη τιμή του Α για την επιλογή Πάνω είναι p L. Η αναμενόμενη τιμή του Α για την επιλογή Κάτω είναι 3(1 - p L ). Εάν p L < 3(1 - p L ) τότε ο A θα επιλέξει μόνο Κάτω, αλλά δεν υπάρχει NE στην οποία ο A παίζει μόνο Κάτω.
Μεικτές στρατηγικές L, p L R, 1-p L U, p U D, 1-p U (1,2) (0,4) (0,5) (3,2) Εάν υπάρχει NE απαραίτητα p L = 3(1 - p L ) Þ p L = 3/4, δηλ., ο τρόπος που ο B αναμειγνύει τα Αριστερά και Δεξιά πρέπει να καθιστά τον A αδιάφορο μεταξύ Πάνω και Κάτω.
Μεικτές στρατηγικές L, 3/4 R, 1/4 U, p U D, 1-p U (1,2) (0,4) (0,5) (3,2) Αν υπάρχει NE, απαραίτητα p L = 3(1 - p L ) Þ p L = 3/4, δηλ., ο τρόπος με τον οποίο ο B αναμειγνύει τα Αριστερά και Δεξιά πρέπει να καθιστά τον A αδιάφορο μεταξύ Πάνω και Κάτω.
Μεικτές στρατηγικές L, 3/4 R, 1/4 U, p U D, 1-p U (1,2) (0,4) (0,5) (3,2)
Μεικτές στρατηγικές L, 3/4 R, 1/4 U, p U D, 1-p U (1,2) (0,4) (0,5) (3,2) Η αναμενόμενη τιμή του Β για την επιλογή Αριστερά είναι ;;
Μεικτές στρατηγικές L, 3/4 R, 1/4 U, p U D, 1-p U (1,2) (0,4) (0,5) (3,2) Η αναμενόμενη τιμή του Β για την επιλογή Αριστερά είναι 2p U + 5(1 - p U ). Η αναμενόμενη τιμή του Β για την επιλογή Δεξιά είναι ;;
Μεικτές στρατηγικές L, 3/4 R, 1/4 U, p U D, 1-p U (1,2) (0,4) (0,5) (3,2) Η αναμενόμενη τιμή του Β για την επιλογή Αριστερά είναι 2p U + 5(1 - p U ). Η αναμενόμενη τιμή του Β για την επιλογή Δεξιά είναι 4p U + 2(1 - p U ).
Μεικτές στρατηγικές L, 3/4 R, 1/4 U, p U D, 1-p U (1,2) (0,4) (0,5) (3,2) Η αναμενόμενη τιμή του Β για την επιλογή Αριστερά είναι 2p U + 5(1 - p U ). Η αναμενόμενη τιμή του Β για την επιλογή Δεξιά είναι 4p U + 2(1 - p U ). Αν 2p U + 5(1 - p U ) > 4p U + 2(1 - p U ) τότε ο B θα επιλέξει μόνο Αριστερά, αλλά δεν υπάρχει NE όπου ο B παίζει μόνο Αριστερά.
Μεικτές στρατηγικές L, 3/4 R, 1/4 U, p U D, 1-p U (1,2) (0,4) (0,5) (3,2) Η αναμενόμενη τιμή του Β για την επιλογή Αριστερά είναι 2p U + 5(1 - p U ). Η αναμενόμενη τιμή του Β για την επιλογή Δεξιά είναι 4p U + 2(1 - p U ). Αν 2p U + 5(1 - p U ) < 4p U + 2(1 - p U ) τότε ο B παίζει μόνο Δεξιά, αλλά δεν υπάρχει NE όπου ο B παίζει μόνο Δεξιά.
Μεικτές στρατηγικές L, 3/4 R, 1/4 U, 3/5 D, 2/5 (1,2) (0,4) (0,5) (3,2) Αν υπάρχει ΝΕ, τότε απαραίτητα 2p U + 5(1 - p U ) = 4p U + 2(1 - p U ) Þ p U = 3/5, δηλ., ο τρόπος που ο A αναμειγνύει τα Πάνω και Κάτω πρέπει να καθιστά τον B αδιάφορο μεταξύ Αριστερά και Δεξιά.
Μεικτές στρατηγικές L, 3/4 R, 1/4 U, 3/5 D, 2/5 (1,2) (0,4) (0,5) (3,2) Η μοναδική ισορροπία Nash του παιγνίου είναι όταν ο A παίζει τη μεικτή στρατηγική (3/5, 2/5) και ο B παίζει τη μεικτή στρατηγική (3/4, 1/4).
Μεικτές στρατηγικές U, 3/5 D, 2/5 (1,2) 9/20 L, 3/4 R, 1/4 (0,4) (0,5) (3,2) Η απόδοση θα είναι (1,2) με πιθανότητα 3/5 3/4 = 9/20.
Μεικτές στρατηγικές U, 3/5 D, 2/5 (1,2) 9/20 L, 3/4 R, 1/4 (0,4) 3/20 (0,5) (3,2) Η απόδοση θα είναι (0,4) με πιθανότητα 3/5 1/4 = 3/20.
Μεικτές στρατηγικές U, 3/5 D, 2/5 (1,2) 9/20 (0,5) 6/20 L, 3/4 R, 1/4 (0,4) 3/20 (3,2) Η απόδοση θα είναι (0,5) με πιθανότητα 2/5 3/4 = 6/20.
Μεικτές στρατηγικές U, 3/5 D, 2/5 (1,2) 9/20 L, 3/4 R, 1/4 (0,5) 6/20 (0,4) 3/20 (3,2) 2/20 Η απόδοση θα είναι (3,2) με πιθανότητα 2/5 1/4 = 2/20.
Μεικτές στρατηγικές U, 3/5 D, 2/5 (1,2) 9/20 L, 3/4 R, 1/4 (0,5) 6/20 (0,4) 3/20 (3,2) 2/20 Η αναμενόμενη απόδοση σε NE του Α είναι 1 9/20 + 3 2/20 = 3/4.
Μεικτές στρατηγικές U, 3/5 D, 2/5 (1,2) 9/20 L, 3/4 R, 1/4 (0,5) 6/20 (0,4) 3/20 (3,2) 2/20 Η αναμενόμενη απόδοση σε NE του Α είναι 1 9/20 + 3 2/20 = 3/4. Η αναμενόμενη απόδοση σε NE του Β είναι 2 9/20 + 4 3/20 + 5 6/20 + 2 2/20 = 16/5.
Πόσες ισορροπίες Nash; Ένα παίγνιο με πεπερασμένο αριθμό παικτών, όπου καθένας έχει πεπερασμένο αριθμό αμιγών στρατηγικών, έχει τουλάχιστον μία ισορροπία Nash. Άρα, αν το παίγνιο δεν έχει καμία ισορροπία Nash αμιγούς στρατηγικής, πρέπει να έχει τουλάχιστον μία ισορροπία Nash μεικτής στρατηγικής.
Επαναλαµβανόµενα παίγνια Ένα στρατηγικό παίγνιο που επαναλαμβάνεται με ένα παίξιμο σε καθεμία από πολλές περιόδους. Οι στρατηγικές που είναι λογικές για τους παίκτες εξαρτώνται κυρίως από το αν το παίγνιο επαναλαμβάνεται μόνο σε πεπερασμένο αριθμό περιόδων επαναλαμβάνεται σε αόριστο αριθμό περιόδων.
Επαναλαµβανόµενα παίγνια Ένα σημαντικό παράδειγμα είναι το επαναλαμβανόμενο Δίλημμα του φυλακισμένου. Δείτε παρακάτω την εκδοχή της μίας περιόδου αυτού που εξετάσαμε νωρίτερα.
Το δίληµµα του φυλακισµένου S Κλάιντ C Μπόνι S C (-5,-5) (-30,-1) (-1,-30) (-10,-10) Έστω ότι αυτό το παίγνιο θα παίζεται σε καθεμία από μόνο 3 περιόδους, t = 1, 2, 3. Ποιο είναι το πιθανό αποτέλεσμα;
Το δίληµµα του φυλακισµένου S Κλάιντ C Μπόνι S C (-5,-5) (-30,-1) (-1,-30) (-10,-10) Έστω ότι είμαστε στην αρχή της περιόδου t = 3 (δηλ., το παίγνιο έχει ήδη παιχτεί δύο φορές). Τι θα πρέπει να κάνει ο Κλάιντ; Τι θα πρέπει να κάνει η Μπόνι;
Το δίληµµα του φυλακισµένου S Κλάιντ C Μπόνι S C (-5,-5) (-30,-1) (-1,-30) (-10,-10) Έστω ότι είμαστε στην αρχή της περιόδου t = 3 (δηλ., το παίγνιο έχει ήδη παιχτεί δύο φορές). Τι θα πρέπει να κάνει ο Κλάιντ; Τι θα πρέπει να κάνει η Μπόνι; Αμφότεροι πρέπει να επιλέξουν Ομολογία (C).
Το δίληµµα του φυλακισµένου S Κλάιντ C Μπόνι S C (-5,-5) (-30,-1) (-1,-30) (-10,-10) Τώρα, έστω ότι είμαστε στην αρχή της περιόδου t = 2. Οι Κλάιντ και Μπόνι περιμένουν ότι ο άλλος θα επιλέξει Ομολογία στην επόμενη περίοδο. Τι θα πρέπει να κάνει ο Κλάιντ; Τι θα πρέπει να κάνει η Μπόνι;
Το δίληµµα του φυλακισµένου S Κλάιντ C Μπόνι S C (-5,-5) (-30,-1) (-1,-30) (-10,-10) Τώρα, έστω ότι είμαστε στην αρχή της περιόδου t = 2. Οι Κλάιντ και Μπόνι περιμένουν ότι ο άλλος θα επιλέξει Ομολογία στην επόμενη περίοδο. Τι θα πρέπει να κάνει ο Κλάιντ; Τι θα πρέπει να κάνει η Μπόνι; Αμφότεροι πρέπει να επιλέξουν Ομολογία.
Το δίληµµα του φυλακισµένου S Κλάιντ C Μπόνι S C (-5,-5) (-30,-1) (-1,-30) (-10,-10) Στην αρχή της περιόδου t = 1, οι Κλάιντ και Μπόνι αναμένουν ότι ο άλλος θα επιλέξει Ομολογία στις δύο επόμενες περιόδους; Τι θα πρέπει να κάνει ο Κλάιντ; Τι θα πρέπει να κάνει η Μπόνι;
Το δίληµµα του φυλακισµένου S Κλάιντ C Μπόνι S C (-5,-5) (-30,-1) (-1,-30) (-10,-10) Στην αρχή της περιόδου t = 1, οι Κλάιντ και Μπόνι αναμένουν ότι ο άλλος θα επιλέξει Ομολογία στις δύο επόμενες περιόδους; Τι θα πρέπει να κάνει ο Κλάιντ; Τι θα πρέπει να κάνει η Μπόνι; Αμφότεροι πρέπει να επιλέξουν Ομολογία.
Το δίληµµα του φυλακισµένου S Κλάιντ C Μπόνι S C (-5,-5) (-30,-1) (-1,-30) (-10,-10) Η μόνη αξιόπιστη (τέλεια για το μέρος του παιχνιδιού) NE γι αυτό το παίγνιο είναι οι Κλάιντ και Μπόνι να επιλέγουν Ομολογία σε κάθε περίοδο.
Το δίληµµα του φυλακισµένου S Κλάιντ C Μπόνι S C (-5,-5) (-30,-1) (-1,-30) (-10,-10) Η μόνη αξιόπιστη (τέλεια για το μέρος του παιχνιδιού) NE γι αυτό το παίγνιο είναι οι Κλάιντ και Μπόνι να επιλέγουν Ομολογία σε κάθε περίοδο. Αυτό ισχύει ακόμα κι αν το παίγνιο επαναλαμβάνεται για μεγάλο, αλλά πεπερασμένο αριθμό περιόδων.
Το δίληµµα του φυλακισµένου S Κλάιντ C Μπόνι S C (-5,-5) (-30,-1) (-1,-30) (-10,-10) Αλλά αν το παίγνιο επαναλαμβάνεται για αόριστο αριθμό περιόδων, τότε έχει πολύ μεγάλο αριθμό αξιόπιστων NE.
Το δίληµµα του φυλακισµένου S Κλάιντ C Μπόνι S C (-5,-5) (-30,-1) (-1,-30) (-10,-10) Το (C,C) για πάντα είναι μια τέτοια NE. Αλλά το (S,S) μπορεί επίσης να είναι NE επειδή ένας παίκτης μπορεί να τιμωρήσει τον άλλο επειδή δεν συνεργάζεται (δηλ., επειδή επέλεξε Ομολογία).
Απαγορεύεται η αναδημοσίευση ή αναπαραγωγή του παρόντος έργου με οποιονδήποτε τρόπο χωρίς γραπτή άδεια του εκδότη, σύμφωνα με το Ν. 2121/1993 και τη Διεθνή Σύμβαση της Βέρνης (που έχει κυρωθεί με τον Ν. 100/1975) 96