ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ 1. Κοινά χαρακτηριστικά

Σχετικά έγγραφα
ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΕΥΤΕΡΟ- ΚΥΡΙΑΡΧΟΥΜΕΝΗ ΣΤΡΑΤΗΓΙΚΗ- PRISONER S DILLEMA ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΠΕΜΠΤΟ ΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

Κεφάλαιο 29 Θεωρία παιγνίων

Κεφάλαιο 2ο (α) Αµιγείς Στρατηγικές (β) Μεικτές Στρατηγικές (α) Αµιγείς Στρατηγικές. Επαναλαµβάνουµε:

Διάλεξη 7. Θεωρία παιγνίων VA 28, 29

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

- Παράδειγμα 2. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να

Βασικές Αρχές της Θεωρίας Παιγνίων

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

Σηματοδοτικά Παίγνια και Τέλεια Μπεϊζιανή Ισορροπία

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

Κεφάλαιο 9 ο Κ 5, 4 4, 5 0, 0 0,0 5, 4 4, 5. Όπως βλέπουµε το παίγνιο δεν έχει καµιά ισορροπία κατά Nash σε αµιγείς στρατηγικές διότι: (ΙΙ) Α Κ

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

Κεφάλαιο 4. Στο προηγούµενο κεφάλαιο ορίσαµε την ισορροπία κατά Nash και είδαµε ότι µια ισορροπία

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

Κυριαρχία και μεικτές στρατηγικές Μεικτές στρατηγικές και κυριαρχία Είδαμε ότι μια στρατηγική του παίκτη i είναι κυριαρχούμενη, αν υπάρχει κάποια άλλη

Παιγνιακά Μοντέλα Σύγκρουσης και Συνεργασίας

Κεφάλαιο 5 R (2, 3) R (3, 0)

ΟΙΚΟΝΟΜΙΚΗ ΤΗΣ ΒΙΟΜΗΧΑΝΙΚΗΣ ΟΡΓΑΝΩΣΗΣ

* τη µήτρα. Κεφάλαιο 1o

Extensive Games with Imperfect Information

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

ΠΜΣ Ενέργειας, Τμήμα ΔΕΣ, ΠαΠει

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΕΤΑΡΤΟ ΠΑΙΓΝΙΑ ΜΗ ΕΝΙΚΟΥ ΑΘΡΟΙΣΜΑΤΟΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

ΑΛΓΟΡΙΘΜΙΚΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Πανεπιστήµιο Αθηνών Εαρινό Εξάµηνο 2007 ιδάσκων : Ηλίας Κουτσουπιάς

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 2: Ισορροπία Nash. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΕΙ ΠΑΤΡΑΣ ΤΕΙ ΠΑΤΡΑΣ ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΏΝ ΠΑΙΓΝΙΩΝ- ΠΡΟΓΡΑΜΜΑ GAMBIT

Kεφάλαιο 10. Πόσα υποπαίγνια υπάρχουν εδώ πέρα; 2 υποπαίγνια.

Κοινωνικά Δίκτυα Θεωρία Παιγνίων

Δεύτερο πακέτο ασκήσεων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Εκτεταμένα Παίγνια (Extensive Games)

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ EKΤΟ ΔΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ II ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΡΙΤΟ-ΙΣΟΡΡΟΠΙΑ ΚΑΤΑ NASH ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

3. Παίγνια Αλληλουχίας

3 ΙΣΟΡΡΟΠΙΕΣ 3 ΙΣΟΡΡΟΠΙΕΣ

B 1 A 1 B 2 A 2. t 1. t 3 w. t 2 A 3 B 3. t 4. t 5

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 6: Εκτατική μορφή παίγνιων. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Κεφάλαιο 8 ο Τ 3, 1-1, -1 Χ -1, -1 1, 3

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 7: Τέλεια ισορροπία Nash για υποπαίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

δημιουργία: επεξεργασία: Ν.Τσάντας

Θεωρία Παιγνίων και Αποφάσεων

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 9: Λύσεις παιγνίων δύο παικτών

Κεφάλαιο 13ο Eπαναλαµβανόµενα παίγνια (Repeated Games)

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

Notes. Notes. Notes. Notes Ε 10,10 0,3 Λ 3,0 2,2

Κεφάλαιο 7ο. max(p 1 c)(α bp 1 +dp 2 )

Στατικά Παίγνια Ελλιπούς Πληροφόρησης


Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Θεωρία Παιγνίων-Ολιγοπώλιο σε ποσότητες

Ένα Παίγνιο (game) ορίζεται ως μια δραστηριότητα με τα ακόλουθα τρία χαρακτηριστικά:

A 1 B 1 B 2 A 2 A 2 B 2

Μοντέλα των Cournotκαι Bertrand

Επίλυση Προβλημάτων 1

Βασικές Έννοιες Θεωρίας Παιγνίων

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

A 2 B 2 Γ 2. u 1 (A 1, A 2 ) = 3 > 1 = u 1 (B 1, A 2 ) u 1 (A 1, Γ 2 ) = 1 > 0 = u 1 (B 1, Γ 2 ) A 2 B 2

Τεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Βασικές Έννοιες Θεωρίας Παιγνίων

Κεφάλαιο 28 Ολιγοπώλιο

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Β. Βασιλειάδης Αν. Καθηγητής. Επιχειρησιακή Ερευνα Διάλεξη 6 η - Θεωρεία Παιγνίων

Βασικές Έννοιες Θεωρίας Παιγνίων

Επίλυση προβληµάτων. Περιγραφή προβληµάτων Αλγόριθµοι αναζήτησης Αλγόριθµοι τυφλής αναζήτησης Αλγόριθµοι ευρετικής αναζήτησης

ΑΣΚΗΣΗ 1 ΑΣΚΗΣΗ 2 ΑΣΚΗΣΗ 3

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 8: Παίγνια πλήρους και ελλιπούς πληροφόρησης

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Α2 Β2 Γ2 2 Α1 1,0 5,-1-1,-2 9,-2 Β1 2,1-2,0 0,2 0,-1 Γ1 0,3 14,2 2,1 8,1 1 1,2 0,1 3,0-1,0

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0

ΑΣΚΗΣΗ 1 Βρείτε την ισορροπία των ακόλουθων παιγνίων απαλείφοντας διαδοχικά τις κυριαρχούµενες στρατηγικές.

Ολιγοπώλιο Με ιαφοροποιηµένο Προϊόν 1

ΑΣΚΗΣΗ 10. Λύση. π/ P1 =0 => P1+P2+4=0 => 4P1=1004+P2 => P1= 1004+P2 = R1(P2) 4 P2= 1004+P1 = R2(P1) 4

Οµάδες ψηφοφόρων Αρ. Μελών Οµάδων Προτιµήσεις Α 1 x > y > z Β 1 y > z >x Γ 1 z > x > y

ΜΑΘΗΜΑΤΙΚΗ ΠΡΟΤΥΠΟΠΟΙΗΣΗ ΣΤΙΣ ΣΥΓΧΡΟΝΕΣ ΤΕΧΝΟΛΟΓΙΕΣ ΚΑΙ ΣΤΗΝ ΟΙΚΟΝΟΜΙΑ

x=l ηλαδή η ενέργεια είναι µία συνάρτηση της συνάρτησης . Στα µαθηµατικά, η συνάρτηση µίας συνάρτησης ονοµάζεται συναρτησιακό (functional).

Πανεπιστήμιο Πειραιώς. Τμήμα Οργάνωση και Διοίκηση Επιχειρήσεων

Πανεπιστήµιο Πειραιώς Τµήµα Πληροφορικής

6. Παίγνια αλληλοδιαδοχικών κινήσεων και η αξία του περιορισμού των επιλογών κάποιου ατόμου

Μελέτη πάνω στην εφαρμογή της θεωρίας παιγνίων σε θέματα πολεμικών τακτικών και στρατηγικής.

Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrange

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 8: Πεπερασμένα επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Ενότητα: Πράξεις επί Συνόλων και Σώµατα Αριθµών

Παίγνια. Κώστας Ρουµανιάς. Τµήµα ιεθνών και Ευρωπαϊκών Σπουδών Οικονοµικό Πανεπιστήµιο Αθηνών. 14 Μαΐου 2015

Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α

HY118- ιακριτά Μαθηµατικά. Παράδειγµα. Από τα συµπεράσµατα στις υποθέσεις Αποδείξεις - Θεωρία συνόλων. Από τις υποθέσεις στα συµπεράσµατα...

Εισαγωγή στην Τοπολογία

Έστω ότι έχουµε 2 µάρκες υπολογιστών: A (Apricot), B (Banana) [ ιαρκή Αγαθά].

ΘΕΩΡΙΑ ΤΩΝ ΠΑΙΓΝΙΩΝ I.

Συνδυαστικά Παίγνια. ιαµόρφωση Παιγνίων. Θέµατα σε Πάιγνια Μηδενικού Αθροίσµατος

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

(GNU-Linux, FreeBSD, MacOsX, QNX

H 2 = H 1 H 1 H 3 = H 2 H 1 = H 1 H 1 H 1

Transcript:

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ 1 Εφαρµόζονται σε αγορές που δεν είναι Walrasian. ηλαδή σε αγορές που οι πρωταγωνιστές δεν είναι λήπτες τιµών π.χ. ολιγοπώλιο. Τέτοιες αγορές τις µελετούµε µε παίγνια. Κοινά χαρακτηριστικά Players-Παίκτες Rules- Κανόνες. Τιµωρείσαι εάν τους παραβιάσεις. Actions/ Strategies- Ενέργειες/ Στρατηγικές Strategic Interdependence- Στρατηγική αλληλεξάρτηση. Πριν κάνω κάτι, λαµβάνω υπόψη τον αντίπαλο µου. Outcome-Αποτέλεσµα. Εξαρτάται όχι µόνο από εµένα, αλλά και από τον αντίπαλό µου. Παίγνια σε στρατηγική µορφή Κυριαρχία (dominance) και επαναλαµβανόµενη κυριαρχία (iterated dominance). To δίληµµα του φυλακισµένου. Ασθενής κυριαρχία Ισορροπία Nash σε καθαρές στρατηγικές Παίγνια σε εκτεταµένη (extensive) µορφή Παίγνια και θεωρία ολιγοπωλίου Ο Von Newman θεωρείται ως ο πατέρας της θεωρίας παιγνίων. Οι Newman και Μorgenstern (1949) έγραψαν Games and Decisions. Ακόµα σηµαντικός σταθµός θεωρείται: Nash (1950): Nash Equilibrium. 1 Στην προετοιµασία των σηµειώσεων αυτού του κεφαλαίου είχα την πολύτιµη βοήθεια του υπ. ιδάκτορα του Τµήµατος µας κ. Κ. Κουνετά που τον ευχαριστώ θερµά. Σελ. 1

Zero-Sum Games: Ότι χάνεις εσύ, κερδίζω εγώ (στα οικονοµικά δεν εφαρµόζεται αυτός ο τύπος παιγνίου). Κατηγοριοποίηση Παιγνίων. Α. ιάκριση ως προς την Συνεργασία 1. Παίγνια Συνεργασίας (Cooperative Games) Οι δυο παίκτες επιχειρούν να µοιράσουνε,µια δεδοµένη πίτα. εσµεύονται µε νοµική ισχύ, δηλ. υπογραφουν συµβόλαια, τα οποία αν τα παραβιάσουν θα υποστούν τις συνέπειες. Π.χ. εργοδότες-σωµατεία (Παίγνια ιαπραγµάτευσης: Bargaining) 2. Παίγνια Μη Συνεργασίας (Non Cooperative Games) εν υπάρχουν ρητές δεσµεύσεις. Κάθε παίκτης θέλει να αυξήσει το προσωπικό του όφελος. Β. ιάκριση ως προς την Πληροφόρηση Η πληροφόρηση είναι πολύ σηµαντική υπόθεση για τα παίγνια. Η πληροφόρηση αφορά (α) την ιστορία του παιγνίου και (β) τα χαρακτηριστικά του αντιπάλου περιβάλλοντος, 1. Τέλεια Πληροφόρηση (Perfect Information) Ο παίκτης έχει τέλεια πληροφόρηση όταν κάθε φορά που θα θέλει να κάνει µια ενέργεια (κίνηση) γνωρίζει τι έγινε από τη αρχή του παιγνίου µέχρι την στιγµή που θα κάνει την κίνηση. ηλαδή γνωρίζει επ ακριβώς τα πάντα για την ιστορία του παιγνίου. 2. Ατελής Πληροφόρηση (Imperfect Information) Υπάρχει όταν ο παίκτης έστω και µία φορά εάν κάνει κίνηση δεν γνωρίζει κάτι από το παρελθόν. 3. Πλήρη Πληροφόρηση ( Complete Information) Σελ. 2

Ένας παίκτης έχει πλήρη πληροφόρηση όταν γνωρίζει τα πλήρη χαρακτηριστικά του παιγνίου, δηλαδή γνωρίζει µε ακρίβεια τον αντίπαλο του. Π.χ. όλα τα χαρακτηριστικά του οικονοµικού περιβάλλοντος του παιγνίου. 4. Ελλιπής Πληροφόρηση ( Incomplete Information) Ο παίκτης δεν γνωρίζει µε ακρίβεια τον αντίπαλο του. Ο παίκτης γνωρίζει την ιστορία του άλλου, αλλά δεν γνωρίζει χαρακτηριστικά αγοράς (όπως η τεχνολογία του άλλου ). Σε αυτή την περίπτωση, οι δύο παίκτες δεν ξέρουν τις αποδόσεις του παιγνίου. O Harsangi (1970) έδειξε ότι κάθε παίγνιο ελλιπούς πληροφόρησης µπορεί να µετασχηµατιστεί σε παίγνιο ατελούς πληροφόρησης (το οποίο µπορεί να αναλυθεί). Έθεσε έναν ψευδοπαίκτη, φύση, Nature, και έτσι έλυσε το πρόβληµα. Ο Nature µετατρέπει τα παίγνια σε L, τα κάνει να ξεκινάνε όλα από την ίδια αρχή. Β. ιάκριση ως προς τον χρόνο 1. Στατικά Παίγνια Είναι τα παίγνια στα οποία δεν υπάρχει αύριο. Παίζονται µία κα έξω (one short games). Οι παίκτες δεν ενδιαφέρονται για το αύριο. Είναι ταυτόχρονων κινήσεων παίγνια (simultaneous move one short games). Σαν ταυτόχρονη κίνηση ορίζεται: εν γνωρίζω τι έχει κάνει ή τι έκανε ο αντίπαλος µου. 2. υναµικά Παίγνια Οι παίκτες σκέφτονται και το αύριο. εν παίζουν µια και έξω. Λαµβάνουν υπόψη τους και τις επιπτώσεις αυτών των ενεργειών στο µέλλον. Sequential Move Games Dynamics Repeated Games Σελ. 3

Παίγνια σε στρατηγική (κανονική) µορφή Ένα παίγνιο n ατόµων σε στρατηγική µορφή (ή αλλιώς κανονική µορφή) έχει 3 στοιχεία: i. Έναν πεπερασµένο σύνολο παικτών I = { 12,,...,n} ii. Για κάθε παίκτη i, ένα πεπερασµένο σύνολο στρατηγικών S. Έστω ότι µε ( 1 2 n s = s,s,...,s ) συµβολίζουµε µια n αδα στρατηγικών που η κάθε µια αντιστοιχεί σε έναν παίκτη. Αυτή η n αδα καλείται στρατηγικός συνδυασµός ή προφίλ στρατηγικής. Το σύνολο S = S1 S 2... Sn υποδηλώνει το σύνολο των n αδωνστρατηγικών. iii. Για κάθε παίκτη i, υπάρχει µια συνάρτηση πληρωµής (payoff function) P:S i R, η οποία συνδέει κάθε συνδυασµό στρατηγικών s = s,s,...,s µε ( ) πληρωµές P ( p 1, p 2,..., p ) για τον παίκτη i. Με δεδοµένο ότι έχουµε µια τέτοια συνάρτηση για κάθε παίκτη i συνολικά υπάρχουν n τέτοιες συναρτήσεις πληρωµών. i n i 1 2 n Αν ο τυπικός παίκτης συµβολίζεται µε συµβολίζονται µε το (διάνυσµα) συµβολιστεί ως ( s,s i i). i όλοι οι υπόλοιποι παίκτες (οι αντίπαλοι του) i. Άρα ένα τυπικό προφίλ στρατηγικής µπορεί να Κυριαρχία και Επαναλαµβανόµενη Κυριαρχία (Dominance and Iterated Dominance). Ορισµός: H καθαρή (pure) στρατηγική παίκτη i αν υπάρχει ' si s i είναι (αυστηρά) κυριαρχούµενη για τον ' S i τέτοια ώστε: u ( s,s ) > u( s,s ) s. i i i i i i Σελ. 4

Αν σε ένα συγκεκριµένο παίγνιο ένας παίκτης διαθέτει µια κυριαρχούµενη στρατηγική είναι λογικό να αναµένεται ότι ο παίκτης δεν θα ακολουθήσει αυτή την στρατηγική. Το ίληµµα του Φυλακισµένου Το παίγνιο του διλήµµατος του φυλακισµένου, του οποίου ο πίνακας πληρωµών δίνεται παρακάτω, είναι ένα παράδειγµα παιγνίου όπου η απάλειψη σε ένα γύρω των κυριαρχούµενων στρατηγικών µας δίνει τη δυνατότητα να λύσουµε το παίγνιο. Σε γενικές γραµµές πάντως πρέπει να έχουµε υπόψη µας ότι µπορεί να υπάρχουν διαδοχικές απαλείψεις κυριαρχούµενων στρατηγικών. Αυτή η προσέγγιση, δηλαδή η διαρκής µείωση των διαθέσιµων στρατηγικών µε την απάλειψη των κυριαρχούµενων, ονοµάζεται και επαναλαµβανόµενη κυριαρχία (iterated dominance). Παίκτης 1 Το ίληµµα του Φυλακισµένου Παίκτης 2 Οµολογία Μη οµολογία Οµολογία -5, -5 0,-8 Μη οµολογία -8,0-1, -1 Αν σε κάποιο παίγνιο, όλες οι στρατηγικές, εκτός από µια για κάθε παίκτη, µπορούν να απαλειφθούν µε το κριτήριο ότι είναι κυριαρχούµενες (πιθανότατα µε έναν επαναληπτικό τρόπο) τότε λέµε ότι το παίγνιο είναι επιλύσιµο µε κυριαρχία (dominance solvable). Ο παρακάτω πίνακας αµοιβών δίνει ένα τέτοιο παίγνιο. Σελ. 5

Παίκτης 1 Παίκτης 2 LF ΜD RG ΤP 4,3 2,7 0,4 ΜL 5,5 5,-1-4,-2 ΒT 3,5 1,5 1,6 1. Για τον παίκτη 1 η ΒT είναι κυριαρχούµενη από την TP. Απαλείφουµε την ΒT 2. Στο παίγνιο που «αποµένει», για τον παίκτη 2, η RG είναι κυριαρχούµενη από την LF. Απαλείφουµε την RG. 3. Στο παίγνιο που «αποµένει», για τον παίκτη 1, η TP είναι κυριαρχούµενη από την ML. Απαλείφουµε την TP 4. Στο παίγνιο που «αποµένει», για τον παίκτη 2, η MD είναι κυριαρχούµενη από την LF. Απαλείφουµε την MD. Έτσι προκύπτει η µοναδική ισορροπία (ML, LF) του συγκεκριµένου παιγνίου µε την µέθοδο των διαδοχικών απαλοιφών των κυριαρχούµενων στρατηγικών. Ασθενής Κυριαρχία (Weak Dominance) Ορισµός: H καθαρή (pure)στρατηγική παίκτη i αν υπάρχει ' si ανισότητα ισχύει για κάποιο s i. s i είναι (αυστηρά) κυριαρχούµενη για τον ' S i τέτοια ώστε: u ( s,s ) u( s,s ) s i i i i i i, όπου η αυστηρή Μια τέτοια περίπτωση απεικονίζεται στον επόµενο πίνακα αµοιβών. Συγκεκριµένα για τον παίκτη 1 οι στρατηγικές ML και ΤΡ είναι κυριαρχούµενες από την BT. Απαλείφουµε λοιπόν τις ML και TP. Έτσι οι ισορροπίες είναι τα ζεύγη στρατηγικών (BT, LF) και (ΒΤ,RG). Παίκτης 2 LF RG ΤP 4,3 2,7 Παίκτης 1 ΜL 5,5 5,-1 ΒT 3,5 1,5 Σελ. 6

Ισορροπία Nash Σε πολλές περιπτώσεις τα παραπάνω κριτήρια της κυριαρχίας, ισχυρής και ασθενούς, δεν είναι χρήσιµα αφού καµία από τις στρατηγικές των παικτών δεν είναι κυριαρχούµενη. Σε αυτές τις περιπτώσεις ο ακόλουθος ορισµός είναι το κεντρικό πλαίσιο επίλυσης στη θεωρία παιγνίων: Ορισµός (Ισορροπία Nash σε καθαρές στρατηγικές): Ένα προφίλ στρατηγικής ( s,s * * i i) είναι Nash ισορροπία για κάθε παίκτη iαν: * * * ( ) ( ) u s,s u s,s s S i i i i i i i i Για παράδειγµα στον επόµενο πίνακα αµοιβών που αντιστοιχεί σε κάποιο παίγνιο η µόνη ισορροπία κατά Nash είναι η (ΒΤ,RG). Παίκτης 1 Παίκτης 2 LF ΜD RG ΤP 0,4 4,0 5,3 ΜL 4,0 0,4 5,3 ΒT 3,5 3,5 6,6 Μια ισορροπία κατά Nash είναι ένας συνδυασµός στρατηγικών στον οποίο κάθε παίκτης επιλέγει την βέλτιστη αντίδραση στις στρατηγικές που επιλέγονται από άλλους παίκτες. Στην περίπτωση του διλήµµατος του φυλακισµένου η περίπτωση που κάθε παίκτης επιλέγει την οµολογία είναι µια ισορροπία κατά Nash (αν υπάρχει µια ισορροπία που προκύπτει από κυρίαρχες στρατηγικές πρέπει επίσης να είναι ισορροπία κατά Nash). Γενικά µπορεί να υποστηριχθεί ότι αν υπάρχει ένας προφανής τρόπος να «παιχθεί» το συγκεκριµένο παίγνιο αυτός πρέπει να οδηγεί σε ισορροπία κατά Nash. Φυσικά µπορεί να υπάρχουν περισσότερες ισορροπίες κατά Nash και άρα η ύπαρξη ισορροπίας κατά Nash δεν συνεπάγεται «ότι υπάρχει και ένας προφανής τρόπος ανάπτυξης (παιξίµατος) του παιγνίου». Σελ. 7

Το ερώτηµα που προκύπτει σε αυτό το σηµείο είναι: «µε ποιον τρόπο βρίσκουµε την ισορροπία κατά Nash σε ένα απλό παίγνιo;». Ας εξετάσουµε τι ακόλουθο παίγνιο που ονοµάζεται «η µάχη των φύλλων (battle of sexes). Ο Σύζυγος H Μάχη των Φύλλων Η Σύζυγος Ποδόσφαιρο Όπερα Ποδόσφαιρο 2,1-1,-1 Όπερα -1,-1 1,2 Από πρώτη άποψη πρέπει να εξετάσουµε όλους τους στρατηγικούς συνδυασµούς και για κάθε έναν να ελέγξουµε αν οι συνθήκες για την ύπαρξης ισορροπίας Nash ικανοποιούνται. Στον παραπάνω πίνακα αµοιβών: (a). Ας αρχίσουµε µε τον συνδυασµό (ποδόσφαιρο, ποδόσφαιρο). (a1). Ας δούµε τις πληρωµές από την άποψη του συζύγου. Αν η σύζυγος δεχθεί να πάει στο ποδόσφαιρο, η συγκεκριµένη επιλογή είναι άριστη γι αυτόν αφού 2>-1. (a2). Ας δούµε τώρα τις πληρωµές από την άποψη της συζύγου. Αν ο σύζυγος αποφασίσει να πάει στο ποδόσφαιρο, είναι το ποδόσφαιρο άριστη επιλογή γι αυτήν? Ναι επειδή 1>-1. Με βάση τα δύο παραπάνω ο συνδυασµός (ποδόσφαιρο, ποδόσφαιρο) είναι ισορροπία κατά Nash. (b). Στην συνέχεια ας εξετάσουµε τον συνδυασµό (ποδόσφαιρο, όπερα). (b1). Ας δούµε τώρα τις πληρωµές από την άποψη του συζύγου. Αν η σύζυγος αποφασίσει να πάει στην όπερα, είναι το ποδόσφαιρο άριστη επιλογή γι αυτόν? Όχι επειδή αν πάει στο ποδόσφαιρο αµείβεται µε 1 ενώ θα µπορούσε να έχει αµοιβή ίση µε 1 αν πήγαινε µαζί µε την σύζυγό του στην όπερα. ηλαδή, γι αυτό τον συνδυασµό στρατηγικών η συνθήκη της Nash ισορροπίας δεν ικανοποιείται. Σελ. 8

(b2). Θα µπορούσαµε να εξετάσουµε αυτό τον συνδυασµό στρατηγικών από την πλευρά της συζύγου αλλά δεδοµένου ότι οι συνθήκες της Nash ισορροπίας δεν ικανοποιούνται στο (b1) δεν χρειάζεται να ασχοληθούµε µε κάτι τέτοιο. Κατά συνέπεια ο συνδυασµός (ποδόσφαιρο, όπερα) δεν αποτελεί ισορροπία κατά Nash. (c). Στην συνέχεια ας εξετάσουµε τον συνδυασµό (όπερα, όπερα). Είναι εύκολο να δούµε ότι και το (c1) αλλά και το (c2) αποτελούν Nash ισορροπίες. (d). Τέλος ελέγχοντας τον συνδυασµό (όπερα, ποδόσφαιρο), µπορούµε µε ανάλογο τρόπο όπως παραπάνω να συµπεράνουµε ότι δεν αποτελεί Nash ισορροπία. Συµπερασµατικά, σε αυτό το παίγνιο, υπάρχουν δυο Nash ισορροπίες, και συγκεκριµένα οι: (όπερα, όπερα) και (ποδόσφαιρο, ποδόσφαιρο). Αν το παίγνιο είχε τρεις στρατηγικές για κάθε παίκτη θα υπήρχαν 9 πιθανοί στρατηγικοί συνδυασµοί για να ελεγχθούν αν αποτελούν ισορροπίες κατά Nash. Ισορροπία Nash σε Μικτές Στρατηγικές Κάποια παίγνια δεν επιδέχονται την ύπαρξη ισορροπίας κατά Nash στη περίπτωση καθαρών στρατηγικών. Ας εξετάσουµε το παρακάτω παίγνιο που ονοµάζεται το matching pennies. Παίκτης 1 Matching Pennies Παίκτης 2 Κεφαλή Γράµµατα Κεφαλή 1,-1-1,1 Γράµµατα -1,1 1,-1 Σελ. 9

Είναι σηµαντικό να παρατηρήσουµε ότι αυτό το παίγνιο δεν φαίνεται να έχει καµιά ισορροπία κατά Nash, τουλάχιστον µε την έννοια που την έχουµε ορίσει µέχρι τώρα. Στην πραγµατικότητα όµως έχει µια ισορροπία κατά Nash σε µικτές στρατηγικές. Το πρώτο βήµα σε αυτή την κατεύθυνση είναι να διευρύνουµε τον χώρο των στρατηγικών µε την κατασκευή κατανοµών πιθανοτήτων στο σύνολο των στρατηγικών Si Ορισµός (Μικτή Στρατηγική): Μια µικτή στρατηγική s i είναι µια κατανοµή πιθανοτήτων στο σύνολο των καθαρών στρατηγικών Στο matching pennies παίγνιο µια καθαρή στρατηγική θα µπορούσε να είναι η Κεφαλή. Μια µικτή στρατηγική θα µπορούσε να είναι Κεφαλή µε πιθανότητα 1/3 και γράµµατα µε πιθανότητα 2/3. Αξίζει να σηµειωθεί σε αυτό το σηµείο ότι η καθαρή στρατηγική είναι µόνο µια ειδική περίπτωση µιας µικτής στρατηγικής. Η ισορροπία κατά Nash µπορεί τώρα να ορισθεί µε τον συνηθισµένο τρόπο αλλά χρησιµοποιώντας την έννοια της µικτής στρατηγικής αντί της έννοιας της καθαρής στρατηγικής. Ορισµός (Ισορροπία κατά Nash): Ένα προφίλ µικτής στρατηγικής είναι ισορροπία κατά Nash αν για κάθε παίκτη i ισχύει: ( σ *, σ * ) (, 1 ) ui i i ui si s si Si Η θεµελιώδης ιδιότητα µιας ισορροπίας Nash µικτών στρατηγικών σε ένα παίγνιο 2 ατόµων είναι ότι η κατανοµή πιθανοτήτων που επιλέγει κάθε παίκτης πρέπει να είναι τέτοια ώστε να κάνει τον άλλο παίκτη αδιάφορο µεταξύ των στρατηγικών που «τυχαιοποιούνται». Σε ένα παίγνιο από τις επιλογές κάθε παίκτη για κάθε συνδυασµό n ατόµων η από κοινού κατανοµή που προκύπτει ( n 1) παικτών πρέπει να είναι τέτοια ώστε ο n στος παίκτης να λαµβάνει την ίδια αναµενόµενη πληρωµή από κάθε µια από τις στρατηγικές που µπορεί να επιλέξει µε θετική πιθανότητα. Από την στιγµή που έχουµε εισάγει τις ισορροπίες µικτών στρατηγικών στο σύνολο των ισορροπιών Nash έχουµε το ακόλουθο θεώρηµα: Σελ. 10

Θεώρηµα (Existence): Κάθε παίγνιο µε πεπερασµένο αριθµό παικτών και πεπερασµένο αριθµό στρατηγικών έχει µια τουλάχιστον Nash ισορροπία. Είναι λοιπό φανερό ότι αν ένα παίγνιο δεν έχει ισορροπία σε καθαρές στρατηγικές η χρήση των µικτών στρατηγικών είναι πολύ χρήσιµη. Εντούτοις, ακόµα και σε παίγνια που έχουν µια ή περισσότερες ισορροπίες Nash καθαρών στρατηγικών, θα µπορούσαν να υπάρχουν περισσότερες ισορροπίες µικτών στρατηγικών. Για παράδειγµα, θα µπορούσαµε να βρούµε µια ισορροπία Nash µικτών στρατηγικών στην «Μάχη των Φύλλων». Παίγνια σε Εκτεταµένη Μορφή. Η εκτεταµένη µορφή των παιγνίων είναι ιδιαίτερα χρήσιµη όταν η αλληλεπίδραση µεταξύ των παικτών έχει κατά κύριο λόγο δυναµικό χαρακτήρα. Τα παίγνια σε εκτεταµένη µορφή δίνουν µια καθαρή περιγραφή της σειράς που κινούνται οι παίκτες, τις επιλογές που πραγµατοποιούν, τις πληροφορίες που διαθέτουν κ.ο.κ. Η εκτεταµένη µορφή παιγνίων απεικονίζεται µε ένα δένδρο παιγνίου. Η περιγραφή τους περιλαµβάνει τα ακόλουθα στοιχεία: 1. Ένα πεπερασµένο σύνολο παικτών I { 1, 2,,..., n} =. Επιπρόσθετα, µπορεί να υπάρχει ένας επιπλέον παίκτης που καλύπτει-αντιπροσωπεύει τον παράγοντα της αβεβαιότητας και ονοµάζεται «Φύση» (nature) και συνήθως συµβολίζεται µε N. 2. Ένα δένδρο παιγνίου αποτελείται από ένα σύνολο κόµβων (nodes) που συνδέονται µε µια δυαδική σχέση που ταυτόχρονα εµπεριέχει και το στοιχείο της προτεραιότητας. Μπορούµε να το σκεφτούµε σαν ένα σχηµατισµό κόµβων και κλάδων. Ένας κόµβος ή πιο ακριβώς ένας κόµβος απόφασης αντιπροσωπεύει ένα σηµείο στο οποίο ένας παίκτης ή η φύση πρέπει να επιλέξει µια κίνηση. Η επιλογή µιας κίνησης µεταφέρει τον παίκτη προς την κάτω πλευρά του παιγνίου σε έναν επόµενο κόµβο. Η ιδέα ενός αρχικού κόµβου Σελ. 11

και του(ων) τερµατικού(ων) κόµβου(ων) είναι προφανής σε αυτό το πλαίσιο. Ένα δένδρο παιγνίου είναι ένας σχηµατισµός κόµβων και κλάδων που ξεκινούν από τον αρχικό κόµβο και καταλήγουν στους τελικούς κόµβους, µε τον περιορισµό ότι δεν υπάρχουν κλειστοί βρόγχοι (loops) στο δένδρο. 3. Σε κάθε κόµβο, αντιστοιχείται ένας παίκτης ή η φύση. Αυτή η αντιστοίχηση είναι απλά ένας τρόπος για να ορίσουµε ποιος παίκτης πρέπει να επιλέξει σε αυτό τον κόµβο. 4. Για κάθε κόµβο, υπάρχει ένα πεπερασµένο σύνολο, A, διαθέσιµων επιλογώνκινήσεων που οδηγεί στους αµέσως επόµενους κόµβους. 5. Οι κόµβοι κάθε παίκτη διαχωρίζονται σε πληροφοριακά σύνολα τα οποία µετρούν την καταλληλότητα των διαθέσιµων πληροφοριών που είναι διαθέσιµα σε αυτόν τον παίκτη όταν επιλέγει µια ενέργεια. Αν δυο κόµβοι βρίσκονται στο ίδιο πληροφοριακό σύνολο, ο παίκτης γνωρίζει ξέρει ότι βρίσκεται σε έναν από τους δύο κόµβους αλλά δεν ξέρει σε ποιον ακριβώς. 6. Μια αντιστοίχηση πληρωµών, µια για κάθε παίκτη, σε κάθε τερµατικό κόµβο. 7. Μια κατανοµή πιθανοτήτων για τις πιθανές καταστάσεις της «φύσης». Η έννοια της στρατηγικής είναι σχετικά απλή στην περίπτωση ενός παιγνίου κανονικής µορφής. Όµως στην περίπτωση των παιγνίων εκτεταµένης µορφής, είναι περισσότερη περίπλοκη. Για να αντιληφθούµε τι είναι για τον παίκτη i, ένα τυπικό στοιχείο του συνόλου στρατηγικής S, έστω h ένα τυπικό πληροφοριακό σύνολο του i παίκτη και Ah το σύνολο των ενεργειών που είναι διαθέσιµες σε αυτό το i ( ) πληροφοριακό σύνολο. Μια καθαρή στρατηγική για τον παίκτη i ορίζει ποια ενέργεια πρέπει να αναλάβει σε καθένα από τα πληροφοριακά του σύνολα. Το σύνολο όλων των στρατηγικών για αυτό τον παίκτη δίνεται από: S i h ( ) = A h Σελ. 12

Πρέπει να σηµειωθεί ότι είναι πολύ σηµαντική η αντιδιαστολή µεταξύ ενεργειών και στρατηγικών για ένα παίγνιο εκτεταµένης µορφής. Μια στρατηγική είναι ένα πλήρες σχέδιο ενεργειών. Ενέργειες και Στρατηγικές Παίγνιο 1 1 A B 2 2 C L R L R 1 1 (1,0) (0,1) D (0,0) (1,1) (2,2) (0,0) Στο παραπάνω παίγνιο ο παίκτης 1 έχει συνολικά 4 ενέργειες: Α,Β,C και D. Ο 2 έχει την L και R. Ο 1 κινείται σε τρεις κόµβους σε κάθε έναν από τους οποίους έχει 2 πιθανές ενέργειες. Άρα ο συνολικός αριθµός στρατηγικών για τον παίκτη 1 είναι 2x2x2=8. Για παράδειγµα, µια από τις στρατηγικές του παίκτη 1 είναι: επιλέγει Α αρχικά και στην συνέχεια αν ο παίκτης 2 παίξει L τότε επιλέγει C ενώ αν ο παίκτης 2 παίξει R τότε επιλέγει D. Μια τέτοια στρατηγική γραφεται ως ACD. Οι 8 στρατηγικές του παίκτη 1 είναι: 1. ACC 2. ACD 3. ADC 4. ADD 5. BCC 6. BCD 7. BDC 8. BDD Σελ. 13

O παίκτης 2 από την άλλη πλευρά έχει δύο ενέργειες, L και R, και 4 στρατηγικές: 1. LL 2. LR 3. RL 4. RR Παίγνιο 2 1 A B 2 L R L R 1 (1,0) (0,1) C D C D (0,0) (1,1) (2,2) (0,0) Στο παίγνιο 2, από την άλλη πλευρά, ο παίκτης 1 κινείται µόνο σε δύο διαφορετικά πληροφοριακά σύνολα (κάθε κόµβος είναι επίσης ένα συνηθισµένο πληροφοριακό σύνολο). Έτσι, ο 1 έχει µόνο 4 στρατηγικές: AC, AD, BC και BD. Ο παίκτης 2 έχει µόνο 2 ενέργειες και επίσης 2 στρατηγικές: L και R. Από την στρατηγική στην εκτεταµένη µορφή. 2 Actions 1 Actions Σ Μ Σ 3,3 0,4 Μ 4,0 1,1 Όπου Σ= συνεργασία και Μ= µη συνεργασία Σελ. 14

Άσχετα τι θα κάνει ο άλλος, εγώ ( ο παίκτης 1) θα επιλέξω να παίξω Μ. Άρα (Μ,Μ)=(1,1). Αυτή είναι η έννοια της αλληλεξάρτησης. Επιχειρώ το καλύτερο (best) για εµένα και καταλήγω σε κάτι χειρότερο. Αυτό το παίγνιο λέγεται στατικό παίγνιο µη συνεργασίας ατελούς πληροφόρησης. Στα ταυτόχρονα παίγνια δεν έχει σηµασία ποιος ξεκινά δηλ. ο πρώτος ή ο δεύτερος. Απεικόνιση ιδίου παιγνίου σε εκτεταµένη µορφή- Extensive form. Ο παίκτης 2 δεν ξέρει εάν προηγήθηκε το Σ ή το Μ δηλαδή δεν γνωρίζει αν ο παίκτης 1 έπαιξε Σ ή Μ. Σε δυναµικά παίγνια αυτή η µορφή θα είναι προτιµότερη, ειδικά σε ελλιπή πληροφόρηση. Η εκτεταµένη µορφή είναι η πληρέστερη µορφή περιγραφής ενός παιγνίου. Όταν το παίγνιο είναι ελλιπούς πληροφόρησης, τότε θα το παρουσιάζουµε σε εκτεταµένη µορφή. Η εκτεταµένη µορφή αποτελείται από ένα δέντρο παιγνίου (game tree) µε διατεταγµένους κόµβους. Οι κόµβοι αυτοί, είναι κόµβοι απόφασης (decision nodes) ενώ οι τερµατικοί κόµβοι είναι κόµβοι αποδόσεων (Payoff nodes). Αυτοί οι κόµβοι είναι διατεταγµένοι µε ορισµένο τρόπο. Ακολουθούν δηλαδή την µορφή του δένδρου όπως στο επόµενο σχήµα: Σελ. 15

και δεν µπορούν να κάνουν κύκλους όπως στο παρακάτω γράφηµα. ηλαδή υπάρχει ένα µόνο µονοπάτι για να πάω από τον τελικό στον αρχικό κόµβο. Σε κάθε κόµβο αντιστοιχεί ένας µόνος παίκτης ο οποίος κινείται, δηλαδή παίρνει απόφαση. (Σε κάθε κόµβο θα έχουµε και την φύση). Από κάθε κόµβο ξεκινά ένα σύνολο διαθεσίµων ενεργειών (actions) για κάθε παίκτη. Κάθε ενέργεια οδηγεί µόνο σε ένα κόµβο, είτε κόµβο απόφασης είτε τερµατικό (terminal payoff ) κόµβο. Στρατηγική (strategy) Ενέργεια (action) Η στρατηγική: λέει σε κάθε παίκτη τι θα κάνει όταν πρόκειται να κινηθεί. Είναι κανόνας, ο οποίος δεν του επιβάλλεται, αλλά τον αποφασίζει ο ίδιος ο παίκτης. Είναι βάθος ενεργειών. Η ενέργεια: παρατίθεται σε κάθε κόµβο. Πληροφοριακά Σύνολα (Information Sets). Οι κόµβοι απόφασης ενός παιγνίου χωρίζονται σε σύνολα πληροφοριών που έχουν τα εξής χαρακτηριστικά: 1. Σε κάθε Information Set κινείται ο ίδιος ο παίκτης, ένας παίκτης 2. εν είναι δυνατόν µερικοί κόµβοι ενός συνόλου πληροφοριών να προηγούνται στην δενδροµορφία άλλων κόµβων, του ιδίου συνόλου πληροφοριών. 3. Από όλους τους κόµβους του ιδίου συνόλου πληροφοριών εκπορεύονται ίδιες ενέργειες. Σελ. 16

4. Τερµατικοί: κόµβοι οι οποίοι δίνουν τις αποδόσεις για κάθε παίκτη. ηλαδή, σε κάθε τερµατικό κόµβο υπάρχει κατανοµή αποδόσεων για κάθε παίκτη. Ανάλυση Παιγνίων Εκτεταµένης Μορφής. Με δεδοµένο λοιπόν ότι µπορούµε να καταγράψουµε τις στρατηγικές των παικτών σε ένα παίγνιο εκτεταµένης µορφής όπως παραπάνω, τίθεται το ερώτηµα πως µπορούµε να εντοπίσουµε ισορροπίες Nash σε ένα τέτοιοι παίγνιο. Απλά µετατρέπουµε το παίγνιο εκτεταµένης µορφής σε παίγνιο κανονικής µορφής. Σε κάθε παίγνιο εκτεταµένης µορφής αντιστοιχεί ένα παίγνιο στρατηγικής µορφής. Από την άλλη πλευρά ένα παίγνιο στρατηγικής µορφής µπορεί να αντιστοιχεί σε µεγαλύτερο αριθµό παιγνίων εκτεταµένης µορφής. Η κανονική µορφή του παιγνίου 2 είναι η ακόλουθη. Από τον πίνακα αµοιβών του παιγνίου αυτού είναι εύκολο να δούµε ότι υπάρχουν 2 καθαρές στρατηγικές Nash ισορροπίας: (AC,R) και (AD,L). Παίκτης 1 Παίκτης 2 L R AC 0,0 2,2 AD 1,1 0,0 BC 1,0 0,1 BD 1,0 0,1 Κανόνας Όταν ένας παίκτης γνωρίζει κάτι (π.χ. ενέργεια του άλλου παίκτη, φύση του άλλου) όταν κληθεί να κάνει κίνηση, τότε αυτό το κάτι πρέπει να προηγείται στην δενδροµορφία. Στρατηγική µορφή παιγνίου..ένα παράδειγµα παιγνίου σε εκτεταµένη µορφή είναι το ακόλουθο: Σελ. 17

Υπάρχει Imperfect information αφού ο παίκτης 2 δεν ξέρει τι έχει κάνει ο παίκτης 1 S 1 = σύνολο στρατηγικών του παίκτη 1 Α 1 = action set του παίκτη 1 Α 1 : (Σ, Μ) = S 1 Α 2 : (Σ, Μ) = S 2 Στρατηγικές αποδόσεις του παίκτη 1 (Π 1 ) Π 1 ( ΣΣ, ) = 3 Π 1 ( ΣΜ, ) = 0 ( S, S ): 1 (, ) 4 Π 1 ( ΜΜ, ) = 1 Π1 1 2 Π ΜΣ= Στρατηγικές αποδόσεις του παίκτη 2 (Π 2 ) Π 2 ( ΣΣ, ) = 3 Π 2 ( ΣΜ, ) = 4 ( S, S ): 2 (, ) 0 Π 2 ( ΜΜ, ) = 1 Π2 1 2 Π ΜΣ= Σελ. 18

Αναπαράσταση σε Στρατηγική Μορφή 1 2 Actions Actions Σ Μ Σ 3,3 0,4 Μ 4,0 1,1 Σελ. 19