10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

HA. VAIAN Μικροοικονομική Μια σύγχρονη προσέγγιση 3 η έκδοση Κεφάλαιο 29 Θεωρία παιγνίων Θεωρία παιγνίων Η θεωρία παιγνίων βοηθά στην ανάλυση της στρατηγικής συμπεριφοράς από φορείς που κατανοούν ότι οι ενέργειές τους επηρεάζουν τις ενέργειες άλλων φορέων. Εφαρµογές της θεωρίας παιγνίων Η μελέτη των ολιγοπωλίων (κλάδων που περιέχουν λίγες μόνο εταιρείες) Η μελέτη των καρτέλ, π.χ. ΟΠΕΚ Η μελέτη των εξωτερικών επιδράσεων, π.χ. η χρήση ενός κοινού πόρου, όπως ενός ιχθυοτροφείου. Εφαρµογές της θεωρίας παιγνίων Τι είναι τα παίγνια; Η μελέτη στρατιωτικών στρατηγικών. Διαπραγματεύσεις. Ο τρόπος λειτουργίας των αγορών. Ένα παίγνιο αποτελείται από μια ομάδα παικτών μια ομάδα στρατηγικών για κάθε παίκτη τις αποδόσεις σε κάθε παίκτη για κάθε πιθανή επιλογή στρατηγικών από τους παίκτες. 1

Παίγνια δύο παικτών Ένα παίγνιο με μόνο δύο παίκτες είναι ένα παίγνιο δύο παικτών. Θα μελετήσουμε μόνο παίγνια στα οποία υπάρχουν δύο παίκτες και καθένας απ αυτούς μπορεί να επιλέξει μεταξύ μόνο δύο ενεργειών. Οι παίκτες ονομάζονται A και. Ο παίκτης A έχει δύο ενέργειες, Πάνω () και Κάτω (). Ο παίκτης έχει δύο ενέργειες, Αριστερά () και Δεξιά (). Ο πίνακας που δείχνει τις αποδόσεις των δύο παικτών για καθέναν από τους τέσσερις πιθανούς συνδυασμούς ενεργειών είναι ο πίνακας αποδόσεων του παιγνίου. Αυτός είναι ο πίνακας αποδόσεων του παιγνίου. Η απόδοση του παίκτη Α εμφανίζεται πρώτη. Η απόδοση του παίκτη εμφανίζεται δεύτερη. Αυτός είναι ο πίνακας αποδόσεων του παιγνίου. Μία σύνοδος του παιγνίου είναι ένα ζεύγος όπως το (,) όπου το 1 ο στοιχείο είναι η ενέργεια που επιλέγει ο παίκτης A και το 2 ο είναι η ενέργεια που επιλέγει ο παίκτης. π.χ. αν ο A παίξει Πάνω () και ο Β παίξει δεξιά (), τότε η απόδοση του Α είναι 1 και η απόδοση του Β είναι 8. 2

Αυτός είναι ο πίνακας αποδόσεων του παιγνίου. και αν ο A παίξει Κάτω () και ο παίξει Δεξιά (), τότε η απόδοση του Α είναι 2 και η απόδοση του Β είναι 1. Πώς είναι πιθανό να παίξουν οι παίκτες σ' αυτό το παίγνιο; παιχτεί το (,); παιχτεί το (,); Αν ο Β παίξει Δεξιά, τότε η καλύτερη απάντηση του Α είναι Κάτω, επειδή βελτιώνει έτσι την απόδοση του Α από 1 σε 2. Άρα, το (,) δεν είναι πιθανό. παιχτεί το (,); παιχτεί το (,); Αν ο Β παίξει Δεξιά, τότε η καλύτερη απάντηση του A είναι Κάτω. 3

παιχτεί το (,); παιχτεί το (,); Αν ο Β παίξει Δεξιά, τότε η καλύτερη απάντηση του A είναι Κάτω. Αν ο A παίξει κάτω, τότε η καλύτερη απάντηση του Β είναι Δεξιά. Άρα, το (,) είναι πιθανό. παιχτεί το (,); παιχτεί το (,); Αν ο A παίξει κάτω, τότε η καλύτερη απάντηση του είναι Δεξιά, άρα το (,) δεν είναι πιθανό. παιχτεί το (,); παιχτεί το (,); Αν ο A παίξει Πάνω, η καλύτερη απάντηση του είναι Αριστερά. Αν ο A παίξει Πάνω, η καλύτερη απάντηση του είναι Αριστερά. Αν ο Β παίξει Αριστερά, η καλύτερη απάντηση του A είναι Πάνω. Άρα, το (,) είναι πιθανό. 4

Ισορροπία Nash Μια σύνοδος του παιγνίου όπου κάθε στρατηγική είναι μια καλύτερη απάντηση στον άλλον είναι μια Ισορροπία κατά Nash. Το παράδειγμά μας έχει δύο ισορροπίες κατά Nash: (,) και (,). (,) και (,) είναι αμφότερες ισορροπίες Nash για το παίγνιο. Για να καταλάβετε αν τα προτιμώμενα κατά Pareto αποτελέσματα είναι αυτά που βλέπουμε στη διαδικασία ενός παιγνίου, εξετάζουμε το διάσημο παράδειγμα που ονομάζεται Δίλημμα του φυλακισμένου. (,) και (,) είναι αμφότερες ισορροπίες Nash για το παίγνιο. Αλλά ποια θα δούμε; Σημειώστε ότι αμφότεροι οι παίκτες προτιμούν το (,) από το (,). Πρέπει τότε να δούμε μόνο το (,); Πώς είναι πιθανό να παίξουν οι παίκτες σ' αυτό το παίγνιο; Εάν η παίζει Σιωπή (), τότε η καλύτερη απάντηση του είναι Ομολογία (). 5

Εάν η παίζει Σιωπή (), τότε η καλύτερη απάντηση του είναι Ομολογία (). Εάν η παίζει Ομολογία (), τότε η καλύτερη απάντηση του είναι Ομολογία (). Ανεξάρτητα από το παιχνίδι της, η καλύτερη απάντηση του είναι πάντα Ομολογία. Η Ομολογία είναι μια κυρίαρχη στρατηγική για τον. Ομοίως, ανεξάρτητα από το παιχνίδι του, η καλύτερη απάντηση της είναι πάντα Ομολογία. Η Ομολογία είναι μια κυρίαρχη στρατηγική για την. Άρα, μόνο η ισορροπία κατά Nash γι αυτό το παίγνιο είναι (,), ακόμα κι αν το (,) δίνει στους και καλύτερες αποδόσεις. Η μόνη ισορροπία Nash είναι αναποτελεσματική. Ποιος παίζει πότε; Στα δύο παραδείγματα, οι παίκτες επέλεξαν τις στρατηγικές τους ταυτόχρονα. Τέτοια παίγνια είναι ταυτόχρονα παίγνια. Ποιος παίζει πότε; Αλλά υπάρχουν άλλα παίγνια στα οποία ο ένας παίκτης παίζει πριν τον άλλον. Τέτοια παίγνια ονομάζονται διαδοχικά παίγνια. Ο παίκτης που παίζει πρώτος είναι ο ηγέτης και ο παίκτης που παίζει δεύτερος είναι ο ακόλουθος. 6

Μερικές φορές ένα παίγνιο έχει περισσότερες από μία ισορροπία Nash και είναι δύσκολο να καταλάβουμε ποια είναι πιο πιθανό να συμβεί. Όταν ένα παίγνιο είναι διαδοχικό, είναι πιθανό μερικές φορές να ισχυριστούμε ότι μία από τις ισορροπίες Nash είναι πιο πιθανό να συμβεί από την άλλη. Τα (,) και (,) είναι αμφότερα NE (ισορροπία Nash) όταν αυτό το παίγνιο παίζεται ταυτόχρονα και δεν μπορούμε να αποφασίσουμε ποια ισορροπία είναι πιθανότερο να συμβεί. A Ο Α παίζει πρώτος. Ο Β παίζει δεύτερος. Έστω ότι αντίθετα, το παίγνιο παίζεται διαδοχικά, με τον A να ξεκινά και τον να ακολουθεί. Μπορούμε να γράψουμε ξανά το παίγνιο στην εκτατική μορφή του. A A Ο Α παίζει πρώτος. Ο Β παίζει δεύτερος. Ο Α παίζει πρώτος. Ο Β παίζει δεύτερος. Το (,) είναι ισορροπία Nash. Το (,) είναι ισορροπία Nash. Το ίδιο και το (,). Η μία ισορροπία είναι πιο πιθανό να συμβεί; 7

A A Ο Α παίζει πρώτος. Ο Β παίζει δεύτερος. Ο Α παίζει πρώτος. Ο Β παίζει δεύτερος. Εάν ο A παίζει τότε ο ακολουθεί με και ο A παίρνει 3. Εάν ο A παίζει τότε ο ακολουθεί με και ο A παίρνει 3. Εάν ο A παίζει τότε ο ακολουθεί με και ο A παίρνει 2. A Εάν ο A παίζει τότε ο ακολουθεί με και ο A παίρνει 3. Εάν ο A παίζει τότε ο ακολουθεί με και ο A παίρνει 2. Ο Α παίζει πρώτος. Ο Β παίζει δεύτερος. Άρα, (,) είναι το πιθανό NE. Το αρχικό παράδειγμά μας για ακόμα μία φορά. Έστω ότι παίζεται ταυτόχρονα. Ανακαλύψαμε ότι το παίγνιο έχει δύο ισορροπίες Nash: (,) και (,). Θεωρούμε ότι ο παίκτης A επιλέγει να παίξει ή, αλλά κανέναν συνδυασμό των δύο, δηλ., να παίξει αμιγώς ή. Τα και είναι οι αμιγείς στρατηγικές του παίκτη A. Ομοίως, τα και είναι οι αμιγείς στρατηγικές του παίκτη Β. 8

Αµιγείς στρατηγικές Συνεπώς, τα (,) και (,) είναι ισορροπίες Nash αμιγούς στρατηγικής. Πρέπει κάθε παίγνιο να έχει τουλάχιστον μία ισορροπία Nash αμιγούς στρατηγικής; Αυτό είναι ένα νέο παίγνιο. Υπάρχουν ισορροπίες Nash αμιγούς στρατηγικής; Αµιγείς στρατηγικές Αµιγείς στρατηγικές Είναι το (,) ισορροπία Nash; Είναι το (,) ισορροπία Nash; Όχι. είναι το (,) ισορροπία Nash; Αµιγείς στρατηγικές Αµιγείς στρατηγικές Είναι το (,) ισορροπία Nash; Όχι. Είναι το (,) ισορροπία Nash; Όχι. Είναι το (,) ισορροπία Nash; Είναι το (,) ισορροπία Nash; Όχι. Είναι το (,) ισορροπία Nash; Όχι. Είναι το (,) ισορροπία Nash; Όχι. Είναι το (,) ισορροπία Nash; 9

Αµιγείς στρατηγικές Αµιγείς στρατηγικές Είναι το (,) ισορροπία Nash; Όχι. Είναι το (,) ισορροπία Nash; Όχι. Είναι το (,) ισορροπία Nash; Όχι. Είναι το (,) ισορροπία Nash; Όχι. Άρα το παίγνιο δεν έχει ισορροπίες Nash σε αμιγείς στρατηγικές. Ακόμα κι έτσι, το παίγνιο έχει μια ισορροπία Nash, αλλά σε μεικτές στρατηγικές. Αντί να παίζει αμιγώς Πάνω ή κάτω, ο παίκτης A επιλέγει μια κατανομή πιθανότητας (p,1-p ), που σημαίνει ότι με πιθανότητα p ο παίκτης A θα παίξει Πάνω και με πιθανότητα 1-p θα παίξει Κάτω. Ο παίκτης A αναμειγνύει τις αμιγείς στρατηγικές Πάνω και Κάτω. Η κατανομή πιθανότητας (p,1-p ) είναι μια μεικτή στρατηγική για τον παίκτη A. Ομοίως, ο παίκτης επιλέγει μια κατανομή πιθανότητας (p,1-p ), που σημαίνει ότι με πιθανότητα p ο παίκτης θα παίξει Αριστερά και με πιθανότητα 1-p θα παίξει Δεξιά. Ο παίκτης αναμειγνύει τις αμιγείς στρατηγικές Αριστερά και Δεξιά. Η κατανομή πιθανότητας (p,1-p ) είναι μια μεικτή στρατηγική για τον παίκτη., p, 1-p, p, 1-p Αυτό το παίγνιο δεν έχει ισορροπία Nash σε αμιγείς στρατηγικές, αλλά έχει ισορροπία Nash σε μεικτές στρατηγικές. Πώς υπολογίζεται αυτή; 10

, p, 1-p, p, 1-p, p, 1-p, p, 1-p Η αναμενόμενη τιμή του Α για την επιλογή Πάνω είναι ;; Η αναμενόμενη τιμή του Α για την επιλογή Πάνω είναι p. Η αναμενόμενη τιμή του Α για την επιλογή Κάτω είναι ;;, p, 1-p, p, 1-p, p, 1-p, p, 1-p Η αναμενόμενη τιμή του Α για την επιλογή Πάνω είναι p. Η αναμενόμενη τιμή του Α για την επιλογή Κάτω είναι 3(1 - p ). Η αναμενόμενη τιμή του Α για την επιλογή Πάνω είναι p. Η αναμενόμενη τιμή του Α για την επιλογή Κάτω είναι 3(1 - p ). Εάν p > 3(1 - p ) τότε ο A θα επιλέξει μόνο Πάνω, αλλά δεν υπάρχει NE στην οποία ο A παίζει μόνο Πάνω., p, 1-p, p, 1-p, p, 1-p, p, 1-p Η αναμενόμενη τιμή του Α για την επιλογή Πάνω είναι p. Η αναμενόμενη τιμή του Α για την επιλογή Κάτω είναι 3(1 - p ). Εάν p < 3(1 - p ) τότε ο A θα επιλέξει μόνο Κάτω, αλλά δεν υπάρχει NE στην οποία ο A παίζει μόνο Κάτω. Εάν υπάρχει NE απαραίτητα p = 3(1 - p ) Þ p = 3/4, δηλ., ο τρόπος που ο αναμειγνύει τα Αριστερά και Δεξιά πρέπει να καθιστά τον A αδιάφορο μεταξύ Πάνω και Κάτω. 11

, p, 1-p Αν υπάρχει NE, απαραίτητα p = 3(1 - p ) Þ p = 3/4, δηλ., ο τρόπος με τον οποίο ο αναμειγνύει τα Αριστερά και Δεξιά πρέπει να καθιστά τον A αδιάφορο μεταξύ Πάνω και Κάτω., p, 1-p, p, 1-p, p, 1-p Η αναμενόμενη τιμή του Β για την επιλογή Αριστερά είναι ;; Η αναμενόμενη τιμή του Β για την επιλογή Αριστερά είναι 2p + 5(1 - p ). Η αναμενόμενη τιμή του Β για την επιλογή Δεξιά είναι ;;, p, 1-p Η αναμενόμενη τιμή του Β για την επιλογή Αριστερά είναι 2p + 5(1 - p ). Η αναμενόμενη τιμή του Β για την επιλογή Δεξιά είναι 4p + 2(1 - p )., p, 1-p Η αναμενόμενη τιμή του Β για την επιλογή Αριστερά είναι 2p + 5(1 - p ). Η αναμενόμενη τιμή του Β για την επιλογή Δεξιά είναι 4p + 2(1 - p ). Αν 2p + 5(1 - p ) > 4p + 2(1 - p ) τότε ο θα επιλέξει μόνο Αριστερά, αλλά δεν υπάρχει NE όπου ο παίζει μόνο Αριστερά. 12

, p, 1-p, 3/5, 2/5 Η αναμενόμενη τιμή του Β για την επιλογή Αριστερά είναι 2p + 5(1 - p ). Η αναμενόμενη τιμή του Β για την επιλογή Δεξιά είναι 4p + 2(1 - p ). Αν 2p + 5(1 - p ) < 4p + 2(1 - p ) τότε ο παίζει μόνο Δεξιά, αλλά δεν υπάρχει NE όπου ο παίζει μόνο Δεξιά. Αν υπάρχει ΝΕ, τότε απαραίτητα 2p + 5(1 - p ) = 4p + 2(1 - p ) Þ p = 3/5, δηλ., ο τρόπος που ο A αναμειγνύει τα Πάνω και Κάτω πρέπει να καθιστά τον αδιάφορο μεταξύ Αριστερά και Δεξιά., 3/5, 2/5, 3/5, 2/5 (1,2) 9/20 (0,4) Η μοναδική ισορροπία Nash του παιγνίου είναι όταν ο A παίζει τη μεικτή στρατηγική (3/5, 2/5) και ο παίζει τη μεικτή στρατηγική (3/4, 1/4). Η απόδοση θα είναι (1,2) με πιθανότητα 3/5 3/4 = 9/20., 3/5, 2/5 (1,2) 9/20 (0,4) 3/20, 3/5, 2/5 (1,2) 9/20 (0,5) 6/20 (0,4) 3/20 (3,2) Η απόδοση θα είναι (0,4) με πιθανότητα 3/5 1/4 = 3/20. Η απόδοση θα είναι (0,5) με πιθανότητα 2/5 3/4 = 6/20. 13

, 3/5, 2/5 (1,2) 9/20 (0,5) 6/20 (0,4) 3/20 (3,2) 2/20, 3/5, 2/5 (1,2) 9/20 (0,5) 6/20 (0,4) 3/20 (3,2) 2/20 Η απόδοση θα είναι (3,2) με πιθανότητα 2/5 1/4 = 2/20. Η αναμενόμενη απόδοση σε NE του Α είναι 1 9/20 + 3 2/20 = 3/4., 3/5, 2/5 (1,2) 9/20 (0,5) 6/20 (0,4) 3/20 (3,2) 2/20 Η αναμενόμενη απόδοση σε NE του Α είναι 1 9/20 + 3 2/20 = 3/4. Η αναμενόμενη απόδοση σε NE του Β είναι 2 9/20 + 4 3/20 + 5 6/20 + 2 2/20 = 16/5. Πόσες ισορροπίες Nash; Ένα παίγνιο με πεπερασμένο αριθμό παικτών, όπου καθένας έχει πεπερασμένο αριθμό αμιγών στρατηγικών, έχει τουλάχιστον μία ισορροπία Nash. Άρα, αν το παίγνιο δεν έχει καμία ισορροπία Nash αμιγούς στρατηγικής, πρέπει να έχει τουλάχιστον μία ισορροπία Nash μεικτής στρατηγικής. Επαναλαµβανόµενα παίγνια Ένα στρατηγικό παίγνιο που επαναλαμβάνεται με ένα παίξιμο σε καθεμία από πολλές περιόδους. Οι στρατηγικές που είναι λογικές για τους παίκτες εξαρτώνται κυρίως από το αν το παίγνιο επαναλαμβάνεται μόνο σε πεπερασμένο αριθμό περιόδων επαναλαμβάνεται σε αόριστο αριθμό περιόδων. Επαναλαµβανόµενα παίγνια Ένα σημαντικό παράδειγμα είναι το επαναλαμβανόμενο Δίλημμα του φυλακισμένου. Δείτε παρακάτω την εκδοχή της μίας περιόδου αυτού που εξετάσαμε νωρίτερα. 14

Έστω ότι αυτό το παίγνιο θα παίζεται σε καθεμία από μόνο 3 περιόδους, t = 1, 2, 3. Ποιο είναι το πιθανό αποτέλεσμα; Έστω ότι είμαστε στην αρχή της περιόδου t = 3 (δηλ., το παίγνιο έχει ήδη παιχτεί δύο φορές). Τι θα πρέπει να κάνει ο ; Τι θα πρέπει να κάνει η ; Έστω ότι είμαστε στην αρχή της περιόδου t = 3 (δηλ., το παίγνιο έχει ήδη παιχτεί δύο φορές). Τι θα πρέπει να κάνει ο ; Τι θα πρέπει να κάνει η ; Αμφότεροι πρέπει να επιλέξουν Ομολογία (). Τώρα, έστω ότι είμαστε στην αρχή της περιόδου t = 2. Οι και περιμένουν ότι ο άλλος θα επιλέξει Ομολογία στην επόμενη περίοδο. Τι θα πρέπει να κάνει ο ; Τι θα πρέπει να κάνει η ; Τώρα, έστω ότι είμαστε στην αρχή της περιόδου t = 2. Οι και περιμένουν ότι ο άλλος θα επιλέξει Ομολογία στην επόμενη περίοδο. Τι θα πρέπει να κάνει ο ; Τι θα πρέπει να κάνει η ; Αμφότεροι πρέπει να επιλέξουν Ομολογία. Στην αρχή της περιόδου t = 1, οι και αναμένουν ότι ο άλλος θα επιλέξει Ομολογία στις δύο επόμενες περιόδους; Τι θα πρέπει να κάνει ο ; Τι θα πρέπει να κάνει η ; 15

Στην αρχή της περιόδου t = 1, οι και αναμένουν ότι ο άλλος θα επιλέξει Ομολογία στις δύο επόμενες περιόδους; Τι θα πρέπει να κάνει ο ; Τι θα πρέπει να κάνει η ; Αμφότεροι πρέπει να επιλέξουν Ομολογία. Η μόνη αξιόπιστη (τέλεια για το μέρος του παιχνιδιού) NE γι αυτό το παίγνιο είναι οι και να επιλέγουν Ομολογία σε κάθε περίοδο. Η μόνη αξιόπιστη (τέλεια για το μέρος του παιχνιδιού) NE γι αυτό το παίγνιο είναι οι και να επιλέγουν Ομολογία σε κάθε περίοδο. Αυτό ισχύει ακόμα κι αν το παίγνιο επαναλαμβάνεται για μεγάλο, αλλά πεπερασμένο αριθμό περιόδων. Αλλά αν το παίγνιο επαναλαμβάνεται για αόριστο αριθμό περιόδων, τότε έχει πολύ μεγάλο αριθμό αξιόπιστων NE. Απαγορεύεται η αναδημοσίευση ή αναπαραγωγή του παρόντος έργου με οποιονδήποτε τρόπο χωρίς γραπτή άδεια του εκδότη, σύμφωνα με το Ν. 2121/1993 και τη Διεθνή Σύμβαση της Βέρνης (που έχει κυρωθεί με τον Ν. 100/1975) Το (,) για πάντα είναι μια τέτοια NE. Αλλά το (,) μπορεί επίσης να είναι NE επειδή ένας παίκτης μπορεί να τιμωρήσει τον άλλο επειδή δεν συνεργάζεται (δηλ., επειδή επέλεξε Ομολογία). 96 16