Βασικές Αρχές της Θεωρίας Παιγνίων



Σχετικά έγγραφα
- Παράδειγμα 2. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να

Σηματοδοτικά Παίγνια και Τέλεια Μπεϊζιανή Ισορροπία

Ενημερωτική Διαφοροποίηση Προϊόντος: Ο Ρόλος της Διαφήμισης

Κριτικές στο Υπόδειγμα Cournot

(γ) Τις μορφές στρατηγικής αλληλεπίδρασης που αναπτύσσονται

Ολιγοπωλιακή Ισορροπία

Το Υπόδειγμα της Οριακής Τιμολόγησης

Ισορροπία σε Αγορές Διαφοροποιημένων Προϊόντων

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

3. Ανταγωνισμός ως προς τις Τιμές: Το Υπόδειγμα Bertrand

Κοινωνικά Δίκτυα Θεωρία Παιγνίων

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΕΥΤΕΡΟ- ΚΥΡΙΑΡΧΟΥΜΕΝΗ ΣΤΡΑΤΗΓΙΚΗ- PRISONER S DILLEMA ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

2. Διαφήμιση σε Αγορές όπου υπάρχουν πολλές Επιχειρήσεις

Μεταξύ του µονοπωλίου και του τέλειου ανταγωνισµού

1. Επιλογή Ποιότητας στην Ολιγοπωλιακή Αγορά: Κάθετη Διαφοροποίηση Προϊόντος

Κεφάλαιο 29 Θεωρία παιγνίων

Διάλεξη 7. Θεωρία παιγνίων VA 28, 29

Δεύτερο πακέτο ασκήσεων

Κεφάλαιο 28 Ολιγοπώλιο

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

(2) Χωροθετικά Υποδείγματα Διαφοροποιημένου Προϊόντος

δημιουργία: επεξεργασία: Ν.Τσάντας

Αποτροπή Εισόδου: Το Υπόδειγμα των Spence-Dixit

ΠΜΣ Ενέργειας, Τμήμα ΔΕΣ, ΠαΠει

Μικροοικονομική Ι. Ενότητα # 6: Θεωρία παιγνίων Διδάσκων: Πάνος Τσακλόγλου Τμήμα: Διεθνών και Ευρωπαϊκών Οικονομικών Σπουδών

Μικροοικονομική Ανάλυση ΙΙ

ΟΙΚ 362 ΔΟΜΗ ΚΑΙ ΣΤΡΑΤΗΓΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ 7 η Σειρά Ασκήσεων. (Επιλογή Ποιότητας και Κάθετη Διαφοροποίηση Προϊόντος)

1. Επιλογή Διαφημιστικής Δαπάνης στη Μονοπωλιακή Αγορά

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0

(2β) Το Υπόδειγμα της Κυκλικής Πόλης ή Υπόδειγμα του Salop

6. Παίγνια αλληλοδιαδοχικών κινήσεων και η αξία του περιορισμού των επιλογών κάποιου ατόμου

Μονοπωλιακή Ισορροπία - Αν η αγορά του αγαθού Α είναι πλήρως ανταγωνιστική, τότε η ατομική επιχείρηση θεωρεί δεδομένη την τιμή (p) και, επομένως,

ΤΟΥΡΙΣΤΙΚΗ ΟΙΚΟΝΟΜΙΚΗ. ΚΕΦΑΛΑΙΟ 15.3 ΜΟΡΦΕΣ ΚΑΙ ΙΣΟΡΡΟΠΙΑ ΤΗΣ ΤΟΥΡΙΣΤΙΚΗΣ ΑΓΟΡΑΣ Το τουριστικό ολιγοπώλιο

Άριστες κατά Pareto Κατανομές και το Πρώτο Θεώρημα Ευημερίας

Ένα Παίγνιο (game) ορίζεται ως μια δραστηριότητα με τα ακόλουθα τρία χαρακτηριστικά:

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

Άριστες κατά Pareto Κατανομές

Οικονομικά Υποδείγματα: Εισαγωγικές Έννοιες - Τα οικονομικά υποδείγματα περιγράφουν τη συμπεριφορά επιχειρήσεων-καταναλωτών και την αλληλεπίδρασή

Ολιγοπώλιο Με ιαφοροποιηµένο Προϊόν 1

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

Ολιγοπώλιο. Εισαγωγή στην Οικονομική Επιστήμη Ι. Αρ. Διάλεξης: 11

10/3/17. Κεφάλαιο 28 Ολιγοπώλιο. Μικροοικονομική. Ολιγοπώλιο. Ολιγοπώλιο. Ανταγωνισµός ποσότητας. Μια σύγχρονη προσέγγιση

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Επιλογή Ποιότητας και Κάθετη Διαφοροποίηση Προϊόντος

ΟΙΚΟΝΟΜΙΚΗ ΤΩΝ ΔΙΚΤΥΩΝ ΚΑΙ ΤΗΣ ΠΛΗΡΟΦΟΡΗΣΗΣ (ECΟ465) ΤΗΛΕΠΙΚΟΙΝΩΝΙΕΣ ΜΕΡΟΣ Α

Γενική Ανταγωνιστική Ισορροπία και Αποτελεσματικές κατά Pareto Κατανομές σε Ανταλλακτική Οικονομία

Βασικές Έννοιες Θεωρίας Παιγνίων

A 2 B 2 Γ 2. u 1 (A 1, A 2 ) = 3 > 1 = u 1 (B 1, A 2 ) u 1 (A 1, Γ 2 ) = 1 > 0 = u 1 (B 1, Γ 2 ) A 2 B 2

Τμήμα Διεθνών και Ευρωπαϊκών Σπουδών. Ιωάννης Παραβάντης. Επίκουρος Καθηγητής. Απρίλιος 2016

Α2 Β2 Γ2 2 Α1 1,0 5,-1-1,-2 9,-2 Β1 2,1-2,0 0,2 0,-1 Γ1 0,3 14,2 2,1 8,1 1 1,2 0,1 3,0-1,0

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΕΙ ΠΑΤΡΑΣ ΤΕΙ ΠΑΤΡΑΣ ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΏΝ ΠΑΙΓΝΙΩΝ- ΠΡΟΓΡΑΜΜΑ GAMBIT

Διάκριση Τιμών 2 ου Βαθμού: Μη Γραμμική Τιμολόγηση (Nonlinear Pricing) - Η διάκριση τιμών 3 ου βαθμού προϋποθέτει ότι η μονοπωλιακή

(1β) Μη Χωροθετικά Υποδείγματα Διαφοροποιημένου Προϊόντος με Ενδογενές Πλήθος Επιχειρήσεων

Γενίκευση: Πλήρως Μη Γραμμική Τιμολόγηση

Θεωρία Παιγνίων και Αποφάσεων

Άριστες κατά Pareto Κατανομές και το Πρώτο Θεώρημα Ευημερίας

Σύντομος πίνακας περιεχομένων

Philip McCann Αστική και περιφερειακή οικονομική. 2 η έκδοση. Chapter 1

Στατικά Παίγνια Ελλιπούς Πληροφόρησης

Μονοψωνιακή Ισορροπία

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Διάλεξη 8. Ολιγοπώλιο VA 27

Κατώτατος Μισθός. - Οι περιουσίες των καταναλωτών παριστάνονται από τα διανύσματα:

Γενική Ανταγωνιστική Ισορροπία

Πλεόνασμα του Καταναλωτή, Πλεόνασμα του Παραγωγού και η Αποτελεσματικότητα της Ανταγωνιστικής Αγοράς - Η αλληλεπίδραση της συνολικής ζήτησης και της

ΜΟΝΟΠΩΛΙΑΚΟΣ ΑΝΤΑΓΩΝΙΣΜΟΣ, ΟΛΙΓΟΠΩΛΙΑ, ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

2. Έστω ότι η αγοραία συνάρτηση ζήτησης για κάποιο αγαθό είναι:

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ EKΤΟ ΔΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ II ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 7: Τέλεια ισορροπία Nash για υποπαίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Παιγνιακά Μοντέλα Σύγκρουσης και Συνεργασίας

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Οικονομία των ΜΜΕ. Ενότητα 8: Παίγνια και ολιγοπωλιακές επιχειρήσεις

Βασικές Έννοιες Θεωρίας Παιγνίων

Εργοδοτικές Εισφορές και Φορολογία στους Εργάτες

ΔΗΜΟΣΙΑ ΟΙΚΟΝΟΜΙΚΗ Ι

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΠΕΜΠΤΟ ΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 12: Δημοπρασίες ανερχόμενων και κατερχόμενων προσφορών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

To 2 ο Θεμελιώδες Θεώρημα Ευημερίας

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Αλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες

10/3/17. Κεφάλαιο 26 Μονοπωλιακή συμπεριφόρά. Μικροοικονομική. Πώς πρέπει να τιµολογεί ένα µονοπώλιο; Πολιτικές διάκρισης τιµών

Εισαγωγή στην Οικονομική Ανάλυση

Notes. Notes. Notes. Notes Ε 10,10 0,3 Λ 3,0 2,2

Συμπληρωματικές Σημειώσεις για τη Διάλεξη 8

Έστω ότι έχουµε 2 µάρκες υπολογιστών: A (Apricot), B (Banana) [ ιαρκή Αγαθά].

Διάλεξη 6. Μονοπωλιακή Συμπεριφορά VA 25

ΘΕΜΑΤΑ ΤΕΛΙΚΩΝ ΕΞΕΤΑΣΕΩΝ

Μικροοικονομική. Μορφές αγοράς

Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ» Του σπουδαστή ΚΑΡΑΜΙΓΚΟΥ ΘΕΜΙΣΤΟΚΛΗ

Πλήρης ανταγωνισμός. Καθηγήτρια: Β. ΠΕΚΚΑ- ΟΙΚΟΝΟΜΟΥ. Υποψήφια Διδάκτωρ: Σ. ΤΑΚΑΟΓΛΟΥ

Η θεωρία Weber Προσέγγιση του ελάχιστου κόστους

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

Mικροοικονοµικές Πολιτικές της ΕΕ. Χρυσοβαλάντου Μήλλιου Οικονοµικό Πανεπιστήµιο Αθηνών

ΑΛΓΟΡΙΘΜΙΚΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Πανεπιστήµιο Αθηνών Εαρινό Εξάµηνο 2007 ιδάσκων : Ηλίας Κουτσουπιάς

Θεωρία: dq1 dq1 dq1 P1 E1. dq2 dq2 dq2 P2 E2 1 1 P E E. d π dp dc dq dq dq. dp dc dq dq

Διάκριση Τιμών. p, MR, MC. p Μ Μ Ε. p *

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

H 2 = H 1 H 1 H 3 = H 2 H 1 = H 1 H 1 H 1

Transcript:

Βασικές Αρχές της Θεωρίας Παιγνίων - Ορισμός. Αν οι επιλογές μιας επιχείρησης εξαρτώνται από την αναμενόμενη αντίδραση των υπόλοιπων επιχειρήσεων που συμμετέχουν στην αγορά, τότε υπάρχει στρατηγική αλληλεπίδραση μεταξύ των επιχειρήσεων. Παράδειγμα. Μια επιχείρηση επιλέγει την τιμή στην οποία θα πουλήσει το προϊόν της (ή την ποσότητα προϊόντος που θα παράγει ή την τοποθεσία όπου θα εγκατασταθεί ή το ύψος των δαπανών της για έρευνα και ανάπτυξη κ.λπ.) λαμβάνοντας υπόψη την αναμενόμενη αντίδραση των υπόλοιπωνεπιχειρήσεωνπουσυμμετέχουνστηναγορά. - Παρατήρηση. Αν η αγορά ενός αγαθού είναι πλήρως ανταγωνιστική ή μονοπωλιακή, τότε δεν υπάρχει στρατηγική αλληλεπίδραση μεταξύ των επιχειρήσεων. Αν η αγορά είναι πλήρως ανταγωνιστική, τότε το μέγεθος κάθε μεμονωμένης επιχείρησης είναι πολύ μικρό σε σχέση με το μέγεθος της αγοράς και, επομένως, οι επιλογές της μεμονωμένης επιχείρησης δεν επηρεάζουν την ισορροπία στην αγορά. 1

Οι υπόλοιπες επιχειρήσεις δεν αντιδρούν στις επιλογές της μεμονωμένης επιχείρησης, δηλαδή δεν υπάρχει στρατηγική αλληλεπίδραση μεταξύ των επιχειρήσεων στην ανταγωνιστική αγορά. Αν η αγορά είναι μονοπωλιακή, τότε υπάρχει μόνο μία επιχείρηση στην αγορά και, επομένως, δεν υπάρχει στρατηγική αλληλεπίδραση με άλλες επιχειρήσεις. - Σε όλες τις άλλες μορφές διάρθρωσης της αγοράς (ολιγοπώλιο, μονοπωλιακός ανταγωνισμός κ.λπ.), υπάρχει στρατηγική αλληλεπίδραση μεταξύ των επιχειρήσεων. - Για να αναλύσουμε τη στρατηγική αλληλεπίδραση των επιχειρήσεων, χρησιμοποιούμε τη θεωρία των παιγνίων. - Ορισμός. Κάθε κατάσταση στρατηγικής αλληλεπίδρασης όπου το τελικό αποτέλεσμα εξαρτάται από τις επιλογές όλων των δρώντων παραγόντων ονομάζεται παίγνιο. 2

- Κάθε παίγνιο ορίζεται πλήρως από: (i) Ένα σύνολο παικτών. (ii) Ένα σύνολο διαθέσιμων στρατηγικών για κάθε παίκτη. (iii) Μια συνάρτηση απόδοσης για κάθε παίκτη. (i) Παίκτες - Ορισμός. Κάθε παράγοντας που λαμβάνει αποφάσεις σε ένα παίγνιο ονομάζεται παίκτης. - Το σύνολο των παικτών που συμμετέχουν σε ένα παίγνιο συμβολίζεται με: N = {1,2,..., n}, όπου n 2 είναι το πλήθος των παικτών. - Οι παίκτες μπορούν να είναι άτομα, επιχειρήσεις, κράτη κ.λπ. (ii) Στρατηγικές - Ορισμός. Κάθε ενέργεια ή ακολουθία ενεργειών που μπορεί να επιλέξει ένας παίκτης ονομάζεται στρατηγική. - Η στρατηγική ενός παίκτη ορίζει ένα πλήρες σχέδιο δράσης για τον 3 συγκεκριμένο παίκτη μέχρι την ολοκλήρωση του παιγνίου.

-H στρατηγική κάθε παίκτη i=1,,n συμβολίζεται με s i. - To σύνολο όλων των διαθέσιμων στρατηγικών ενός παίκτη i ονομάζεται χώρος στρατηγικών (strategy space) και συμβολίζεται με S i. Παράδειγμα. Η στρατηγική μιας επιχείρησης i μπορεί να είναι η τιμή (p i ) στην οποία πουλάει το προϊόν της, οπότε: s = p, S = [0, + ) (iii) Aποδόσεις i i i - Ορισμός. Η απόδοση (u i ) ενός παίκτη i δείχνει το όφελος (χρησιμότητα, κέρδος κ.λπ.) του συγκεκριμένου παίκτη για κάθε συνδυασμό στρατηγικών ( s1,..., s n ) και παριστάνεται από μια συνάρτηση απόδοσης u ( s,..., s ). i 1 n - Άρα, κάθε παίγνιο (G) n παικτών περιγράφεται από τους χώρους στρατηγικών και τις συναρτήσεις απόδοσης των παικτών: G = { S,..., S ; u ( s,..., s ),..., u ( s,..., s )} 1 n 1 1 n n 1 n - Υπόθεση. Όλοι οι παίκτες είναι πλήρως ορθολογικοί (rational). Δηλαδή: Κάθε παίκτης i επιλέγει τη στρατηγική του ώστε να μεγιστοποιεί την απόδοσή του. ( s i ) κατά τρόπο 4

Κατηγορίες Παιγνίων - Ορισμός 1. (i) Ένα παίγνιο ονομάζεται στατικό (static game ή simultaneous moves game) όταν όλοι οι παίκτες επιλέγουν ταυτόχρονα τις στρατηγικές τους. Γενικότερα, ένα παίγνιο ονομάζεται στατικό όταν κάθε παίκτης επιλέγει τη στρατηγική του χωρίς να γνωρίζει τις επιλογές των άλλων παικτών (έστω και αν οι αποφάσεις των παικτών λαμβάνονται σε διαφορετικές χρονικές στιγμές). (ii) Ένα παίγνιο ονομάζεται δυναμικό (dynamic game ή sequential game) όταν οι επιλογές των παικτών γίνονται διαδοχικά (όχι ταυτόχρονα) και κάθε παίκτης διαθέτει κάποια πληροφόρηση σχετικά με τις επιλογές των προηγούμενων παικτών. Στην ενότητα αυτή, εξετάζουμε μόνο στατικά παίγνια. - Ορισμός 2. (i) Ένα παίγνιο ονομάζεται παίγνιο τέλειας πληροφόρησης (game of complete information) όταν κάθε παίκτης γνωρίζει τις συναρτήσεις απόδοσης των υπόλοιπων παικτών. 5

(ii) Ένα παίγνιο ονομάζεται παίγνιο ατελούς πληροφόρησης (game of incomplete information ή Bayesian Game) όταν τουλάχιστον ένας παίκτης δε γνωρίζει με βεβαιότητα τη συνάρτηση απόδοσης κάποιου άλλου παίκτη. - Παράδειγμα. Σε έναν πλειστηριασμό (auction), κάθε συμμετέχων παίκτης γνωρίζει την αξία που αποδίδει ο ίδιος στο δημοπρατούμενο αγαθό αλλά δε γνωρίζει με βεβαιότητα την αξία που αποδίδουν στο αγαθό οι άλλοι παίκτες (δηλαδή δε γνωρίζει τη μέγιστη τιμή που είναι διατεθειμένοι να πληρώσουν οι υπόλοιποι συμμετέχοντες). Στην ενότητα αυτή, εξετάζουμε μόνο παίγνια τέλειας πληροφόρησης. Ισορροπία κατά Nash * * -H ισορροπία ( s1,..., s n ) ενός παιγνίου είναι μια πρόβλεψη για το αποτέλεσμα του παιγνίου δηλαδή, είναι μια πρόβλεψη για τη στρατηγική που θα ακολουθήσει κάθε παίκτης i=1,,n. 6

- Στο υπόδειγμα της προσφοράς-ζήτησης, η ισορροπία στην αγορά ενός αγαθού είναι μια κατάσταση όπου όλοι οι αγοραστές και όλοι οι πωλητές είναι ικανοποιημένοι και, επομένως, κανένας από τους συμμετέχοντες στην αγορά δεν έχει κίνητρο να μεταβάλλει τη συμπεριφορά του. Δηλαδή: Όλοι οι καταναλωτές που επιθυμούν να αγοράσουντοαγαθόστηδεδομένητιμήισορροπίας αγοράζουν, πράγματι, το αγαθό και όλες οι επιχειρήσεις που είναι διατεθειμένες να πουλήσουν το αγαθό στη δεδομένη τιμή ισορροπίας πουλάνε, πράγματι, το αγαθό. - Αναζητούμε μια παρόμοια έννοια ισορροπίας στα υποδείγματα της θεωρίας παιγνίων δηλαδή, αναζητούμε * * ένα συνδυασμό στρατηγικών ( s1,..., s n ) τέτοιον ώστε κανένας παίκτης να μην έχει κίνητρο να μεταβάλλει τη συμπεριφορά του. - Η έννοια της ισορροπίας που χρησιμοποιείται συνήθως στα παιγνιοθεωρητικά υποδείγματα είναι η ισορροπία κατά Nash.

* * - Ορισμός. Ένας συνδυασμός στρατηγικών ( s1,..., s n ) είναι μια ισορροπία κατά Nash (Nash Equilibrium) εάν (για κάθε παίκτη * i) η στρατηγική s i αποτελεί την άριστη αντίδραση του * * * * παίκτη i στις στρατηγικές ( s1,..., si 1, si+ 1,..., sn) των υπόλοιπων παικτών. - Δηλαδή: Για κάθε παίκτη i, η στρατηγική μεγιστοποιεί την απόδοση του παίκτη i με δεδομένες τις στρατηγικές * * * * ( s,..., s, s,..., s ) των υπόλοιπων παικτών. 1 i 1 i+ 1 n s = arg max u ( s,..., s, s, s,..., s ), i= 1,..., n. * * * * * i { s } i 1 i 1 i i+ 1 n i - Ειδική Περίπτωση. Σε ένα παίγνιο δύο παικτών, ένας * * συνδυασμός στρατηγικών ( s1, s2) είναι μια ισορροπία κατά * Nash εάν η στρατηγική s 1 αποτελεί την άριστη αντίδραση του * παίκτη 1 στη στρατηγική s 2 του παίκτη 2 και ηστρατηγική αποτελεί την άριστη αντίδραση του παίκτη 2 στη στρατηγική * s 1 του παίκτη 1: * * * u ( s, s ) u ( s, s ), s S 1 1 2 1 1 2 1 1 u ( s, s ) u ( s, s ), s S * * * 2 1 2 2 1 2 2 2 * s i 8 * s 2

- Παράδειγμα 1. Το Δίλημμα του Φυλακισμένου (Prisoner s Dilemma) - Δύο ύποπτοι συλλαμβάνονται από την αστυνομία και κατηγορούνται για κάποιο έγκλημα. - Η αστυνομία δεν έχει αρκετά στοιχεία για να τους καταδικάσει, εκτός αν ο ένας (τουλάχιστον) εκ των δύο ομολογήσει. - Οι ύποπτοι κρατούνται σε χωριστά κελιά και ο εισαγγελέας εξηγεί στον καθένα τις συνέπειες των διάφορων επιλογών που έχει στη διάθεσή του. Αν δεν ομολογήσει κανένας, τότε (λόγω έλλειψης επαρκών στοιχείων) θα καταδικαστούν και οι δύο σε φυλάκιση μόνο ενός έτους. Αν ομολογήσουν και οι δύο, τότε θα καταδικαστούν και οι δύο σε φυλάκιση έξι ετών. Αν ομολογήσει ο ένας αλλά δεν ομολογήσει ο άλλος, τότε αυτός που ομολόγησε θα αφεθεί ελεύθερος και αυτός που δεν ομολόγησε θα καταδικαστεί σε φυλάκιση εννιά ετών (έξι έτη για το έγκλημα και τρία επιπλέον έτη για παρακώλυση του έργου της δικαιοσύνης ). 9

- Αυτή η κατάσταση στρατηγικής αλληλεπίδρασης περιγράφεται από ένα παίγνιο δύο παικτών, όπου: Οι δύο παίκτες είναι οι ύποπτοι 1,2. Κάθε παίκτης έχει στη διάθεσή του δύο στρατηγικές: να μην ομολογήσει [δηλαδή να τηρήσει τη συμφωνία μη ομολογίας που είχε κάνει με τον συνεργό του πριν τη σύλληψή τους να συνεργαστεί (Cooperate C) με τον σύντροφό του] ή να ομολογήσει [δηλαδή να αθετήσει τη συμφωνία μη ομολογίας που είχε κάνει με τον συνεργό του πριν τη σύλληψή τους να ξεγελάσει (Defect D) τον σύντροφό του]. O χώρος στρατηγικών για κάθε παίκτη i=1,2 είναι: S1 = S2 = { C, D} Οι αποδόσεις ( u1, u2) δείχνουν τα έτη φυλάκισης που θα εκτίσουν οι παίκτες 1,2 για κάθε συνδυασμό στρατηγικών ( s και 1, s2) παριστάνονται από τον παρακάτω πίνακα αποδόσεων (payoff matrix): 10

C Παίκτης 2 D Παίκτης 1 C D (-1,-1) (-9,0) (0,-9) (-6,-6) - Δηλαδή, οι συναρτήσεις απόδοσης u1( s1, s2), u2( s1, s2) των παικτών παίρνουντιςεξήςτιμές: u1( C, C) = 1, u1( C, D) = 9, u1( D, C) = 0, u1( D, D) = 6 u ( C, C) = 1, u ( C, D) = 0, u ( D, C) = 9, u ( D, D) = 6 2 2 2 2 - Ο πίνακας αποδόσεων αποτελεί μια αναπαράσταση του παιγνίου σε κανονική (ή στρατηγική) μορφή (Normal Form Representation of the Game). 11

- Για να υπολογίσουμε την ισορροπία(ή τις ισορροπίες) κατά Nash του παιγνίου, ακολουθούμε την παρακάτω μεθοδολογία. Βήμα 1. Βρίσκουμε την άριστη αντίδραση κάθε παίκτη σε κάθε διαθέσιμη στρατηγική του άλλου παίκτη και την παριστάνουμε με το αντίστοιχο βέλος ιδίου συμφέροντος. Παίκτης 1 Παίκτης 2 C D 1 1 2 2 C D Άριστες Αντιδράσεις Παίκτη 2 - Αν ο παίκτης 1 επιλέξει C, τότε η άριστη αντίδραση του παίκτη 2 είναι να επιλέξει D, διότι: u ( C, D) = 0 > u ( C, C) = 1 2 2 12

- Αν ο παίκτης 1 επιλέξει D, τότε η άριστη αντίδραση του παίκτη 2 είναι να επιλέξει D, διότι: u ( D, D) = 6 > u ( D, C) = 9 2 2 Άριστες Αντιδράσεις Παίκτη 1 - Αν ο παίκτης 2 επιλέξει C, τότε η άριστη αντίδραση του παίκτη 1 είναι να επιλέξει D, διότι: u ( D, C) = 0 > u ( C, C) = 1 1 1 - Αν ο παίκτης 2 επιλέξει D, τότε η άριστη αντίδραση του παίκτη 1 είναι να επιλέξει D, διότι: u1( D, D) = 6 > u1( C, D) = 9 * * Βήμα 2. Ένας συνδυασμός στρατηγικών ( s είναι μια ισορροπία 1, s2) κατά Nash εάν τα βέλη ιδίου συμφέροντος των παικτών σχηματίζουν κλειστό κύκλωμα στον συγκεκριμένο συνδυασμό. * s 1 (δηλαδή εάν η στρατηγική αποτελεί την άριστη αντίδραση του * * παίκτη 1 στη στρατηγική s 2 του παίκτη 2 και η στρατηγική s 2 αποτελεί * την άριστη αντίδραση του παίκτη 2 στη στρατηγική του παίκτη 1) s 1

Ισορροπία κατά Nash: ( s, s ) = ( D, D) * * 1 2 - Άρα, οι αποδόσεις (χρησιμότητες) ισορροπίας των παικτών είναι: ( u, u ) = ( 6, 6) * * 1 2 - Παρατήρηση. Στην ισορροπία κατά Nash, κανένας παίκτης δεν έχει κίνητρο να μεταβάλλει τη συμπεριφορά του. Δεδομένου ότι ο παίκτης 1 επιλέγει D, η άριστη αντίδραση του παίκτη 2 είναι να επιλέξει D (δηλαδή ο παίκτης 2 δεν έχει κίνητρο να αποκλίνει από τη στρατηγική ισορροπίας s * 2 = D). Δεδομένου ότι ο παίκτης 2 επιλέγει D, η άριστη αντίδραση του παίκτη 1 είναι να επιλέξει D (δηλαδή ο παίκτης 1 δεν έχει κίνητρο να αποκλίνει από τη στρατηγική ισορροπίας s * 1 = D). - Αντίθετα, σε όλους τους υπόλοιπους συνδυασμούς στρατηγικών τουλάχιστον ένας παίκτης έχει κίνητρο να μεταβάλλει τη συμπεριφορά του και να επιλέξει διαφορετική στρατηγική. - Παράδειγμα. Έστωότιοιπαίκτες1,2 συμφωνούν εκ των προτέρων 14 να επιλέξουν το συνδυασμό (s 1,s 2 )=(C,C). Τότε:

Δεδομένου ότι ο παίκτης 2 επιλέγει C, η άριστη αντίδραση του παίκτη 1 είναι να επιλέξει D δηλαδή, ο παίκτης1 έχει κίνητρο να μεταβάλλει τη συμπεριφορά του και να επιλέξει διαφορετική στρατηγική. Δεδομένου ότι ο παίκτης 1 επιλέγει C, η άριστη αντίδραση του παίκτη 2 είναι να επιλέξει D δηλαδή, ο παίκτης2 έχει επίσης κίνητρο να μεταβάλλει τη συμπεριφορά του και να επιλέξει διαφορετική στρατηγική. Ο συνδυασμός στρατηγικών (s 1,s 2 )=(C,C) δεν είναι ευσταθής και, επομένως, δεν αποτελεί ισορροπία κατά Nash του παιγνίου. (διότι τουλάχιστον ένας από τους παίκτες έχει κίνητρο να αποκλίνει και να επιλέξει διαφορετική στρατηγική.) - Όμοια, ο συνδυασμός στρατηγικών (s 1,s 2 )=(C,D) δεν είναι ισορροπία κατά Nash (δεν είναι ευσταθής), διότι: Δεδομένου ότι ο παίκτης 2 επιλέγει D, η άριστη αντίδραση του παίκτη 1 είναι να επιλέξει D δηλαδή, ο παίκτης 1 έχει κίνητρο να μεταβάλλει τη συμπεριφορά του και να επιλέξει διαφορετική στρατηγική. 15

- Τέλος, ο συνδυασμός στρατηγικών (s 1,s 2 )=(D,C) δεν είναι ισορροπία κατά Nash, διότι: Δεδομένου ότι ο παίκτης 1 επιλέγει D, η άριστη αντίδραση του παίκτη 2 είναι να επιλέξει D δηλαδή, ο παίκτης 2 έχει κίνητρο να μεταβάλλει τη συμπεριφορά του και να επιλέξει διαφορετική στρατηγική. Αξιολόγηση Ισορροπίας κατά Nash U 1-6 -9 (D,C) (C,C) -1 0-1 U 2 (D,D) -6 (C,D) -9 16

- Ο συνδυασμός χρησιμοτήτων ισορροπίας είναι ( u, u ) = ( 6, 6). * * 1 2 * * - Η ισορροπία Nash ( s1, s2) = ( D, D) είναι άριστη κατά Pareto αν δεν υπάρχει άλλος εφικτός συνδυασμός χρησιμοτήτων που να ωφελεί ταυτόχρονα και τους δύο παίκτες (σε σχέση με το συνδυασμό χρησιμοτήτων ισορροπίας). - Δηλαδή: Η ισορροπία Nash είναι άριστη κατά Pareto αν δεν υπάρχει δυνατότητα μετακίνησης από το σημείο ισορροπίας κατά τρόπο ώστε να ωφελούνται ταυτόχρονα και οι δύο παίκτες. - Αλλά, η μετακίνηση από το συνδυασμό στρατηγικών ισορροπίας (D,D) στο συνδυασμό (C,C) θα ωφελούσε ταυτόχρονα και τους δύο παίκτες, διότι: u1( C, C) = 1 > u1( D, D) = 6 u ( C, C) = 1 > u ( D, D) = 6 2 2 Η ισορροπία Nash ( s, s ) = ( D, D) * * 1 2 δεν είναι άριστη κατά Pareto. 17

- Άρα: Και οι δύο παίκτες θα ωφελούνταν (θα είχαν υψηλότερη απόδοση) αν μπορούσαν να συνεργαστούν και να μην ομολογήσουν δηλαδή αν επέλεγαν το συνδυασμό στρατηγικών (C,C). - Ωστόσο, ο συγκεκριμένος συνδυασμός στρατηγικών δεν είναι ευσταθής (διότι κάθε παίκτης έχει κίνητρο να αποκλίνει και να επιλέξει D όταν ο άλλος παίκτης επιλέγει C). Οι παίκτες 1,2 παγιδεύονται στην αναποτελεσματική Nash ισορροπία (D,D), η οποία είναι ανεπιθύμητη και για τους δύο. Ισορροπία σε Κυρίαρχες Στρατηγικές - Υποθέτουμε ένα παίγνιο δύο παικτών G = { S1, S2; u1( s1, s2), u2( s1, s2)}. - Ορισμός 1. (i) Η στρατηγική s 1 S1 ονομάζεται κυρίαρχη στρατηγική (dominant strategy) για τον παίκτη 1 αν αποτελεί την άριστη αντίδραση του παίκτη 1 σε οποιαδήποτε επιλεγόμενη στρατηγική του παίκτη 2: u ( s, s ) u ( s, s ), s S, s S 1 1 2 1 1 2 1 1 2 2 18

(ii) Η στρατηγική s ονομάζεται κυρίαρχη στρατηγική (dominant 2 S2 strategy) για τον παίκτη 2 αν αποτελεί την άριστη αντίδραση του παίκτη 2 σε οποιαδήποτε επιλεγόμενη στρατηγική του παίκτη 1: u ( s, s ) u ( s, s ), s S, s S 2 1 2 2 1 2 1 1 2 2 - Ορισμός 2. Ένας συνδυασμός στρατηγικών ( s 1, s 2) είναι μια ισορροπία σε κυρίαρχες στρατηγικές (dominant strategy equilibrium) αν η στρατηγική s αποτελεί κυρίαρχη στρατηγική για τον παίκτη 1 και η στρατηγική s 1 αποτελεί κυρίαρχη στρατηγική για τον παίκτη 2: 2 u ( s, s ) u ( s, s ), s S, s S 1 1 2 1 1 2 1 1 2 2 u ( s, s ) u ( s, s ), s S, s S 2 1 2 2 1 2 1 1 2 2 - Παράδειγμα 1 (συνέχεια). Ελέγχουμε αν υπάρχει ισορροπία σε κυρίαρχες στρατηγικές στο προηγούμενο παράδειγμα, ακολουθώντας την παρακάτω μεθοδολογία. Βήμα 1. Βρίσκουμε την άριστη αντίδραση κάθε παίκτη σε κάθε διαθέσιμη στρατηγική του άλλου παίκτη και την παριστάνουμε με το αντίστοιχο βέλος ιδίου συμφέροντος (βλ. σελ. 12). 19

Βήμα 2. (i) Ελέγχουμε αν υπάρχει κυρίαρχη στρατηγική για τον παίκτη 1. s 1 - Μια στρατηγική είναι κυρίαρχη στρατηγική για τον παίκτη 1 αν όλα τα βέλη ιδίου συμφέροντος του παίκτη 1 καταλήγουν στη στρατηγική Η στρατηγική D αποτελεί κυρίαρχη στρατηγική για τον παίκτη 1: (ii) Ελέγχουμε αν υπάρχει κυρίαρχη στρατηγική για τον παίκτη 2. s 2 - Μια στρατηγική είναι κυρίαρχη στρατηγική για τον παίκτη 2 αν όλα τα βέλη ιδίου συμφέροντος του παίκτη 2 καταλήγουν στη στρατηγική Η στρατηγική D αποτελεί κυρίαρχη στρατηγική για τον παίκτη 2: - Παρατήρηση. Αν δεν υπάρχει κυρίαρχη στρατηγική για τον παίκτη 1 ή / και για τον παίκτη 2, τότε δεν υπάρχει ισορροπία σε κυρίαρχες στρατηγικές. Βήμα 3. Αν η στρατηγική είναι μια κυρίαρχη στρατηγική για τον παίκτη 1 και η στρατηγική s 2 είναι μια κυρίαρχη στρατηγική για τον παίκτη 2, τότε ο συνδυασμός στρατηγικών ( s είναι μια ισορροπία σε κυρίαρχες 1, s 2) στρατηγικές. - Στο παράδειγμα, έχουμε ήδη βρει: Ισορροπία σε Κυρίαρχες Στρατηγικές: s 1 s 1 = D, s 2 = D ( s, s ) = ( D, D) 1 2 s 1. s s 2. s 1 2 = = D D 20

- Παρατήρηση. Στοσυγκεκριμένοπαράδειγμα, η ισορροπία σε κυρίαρχες στρατηγικές ταυτίζεται με την ισορροπία κατά Nash: * * ( s, s ) = ( s, s ) = ( D, D) 1 2 1 2 - Γενικά: Κάθε ισορροπία σε κυρίαρχες στρατηγικές αποτελεί πάντα ισορροπία κατά Nash, αλλά το αντίστροφο δεν ισχύει πάντα. - Δηλαδή, ένας συνδυασμός στρατηγικών που αποτελεί ισορροπία κατά Nash δεν είναι αναγκαστικά ισορροπία σε κυρίαρχες στρατηγικές. 21