ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Σχετικά έγγραφα
ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 8: Πεπερασμένα επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 2: Ισορροπία Nash. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 7: Τέλεια ισορροπία Nash για υποπαίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Οικονομικά Μαθηματικά

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα. Συστήματα Αυτομάτου Ελέγχου. Ενότητα Α: Γραμμικά Συστήματα

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 3: Δυοπώλιο Cournot. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 12: Δημοπρασίες ανερχόμενων και κατερχόμενων προσφορών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Οικονομικά Μαθηματικά

Οικονομία των ΜΜΕ. Ενότητα 8: Παίγνια και ολιγοπωλιακές επιχειρήσεις

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Θεωρία Πιθανοτήτων & Στατιστική

Υπολογιστικά & Διακριτά Μαθηματικά

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

Υπολογιστικά & Διακριτά Μαθηματικά

Οικονομικά Μαθηματικά

Χρηματοοικονομική Ι. Ενότητα 5: Η Χρονική Αξία του Χρήματος (2/2) Ιωάννης Ταμπακούδης. Τμήμα Οργάνωσης και Διοίκησης Επιχειρήσεων ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗ Ι

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕ ΧΡΗΣΗ Η/Υ

Οικονομικά Μαθηματικά

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ. Πιθανότητες. Συνδυαστική Ανάλυση Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας

Στατιστική Επιχειρήσεων Ι

Οικονομικά Μαθηματικά

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 11: Σχεδίαση μηχανισμών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 8: Παίγνια πλήρους και ελλιπούς πληροφόρησης

Θεωρία Πιθανοτήτων & Στατιστική

ΜΑΘΗΜΑΤΙΚΑ ΓΙΑ ΟΙΚΟΝΟΜΟΛΟΓΟΥΣ

ΑΞΙΟΛΟΓΗΣΗ ΕΠΕΝΔΥΣΕΩΝ

Οικονομικά Μαθηματικά

Μικροοικονομική Ι. Ενότητα # 6: Θεωρία παιγνίων Διδάσκων: Πάνος Τσακλόγλου Τμήμα: Διεθνών και Ευρωπαϊκών Οικονομικών Σπουδών

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

Λογιστικές Εφαρμογές Εργαστήριο

ΑΣΚΗΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΜΑΘΗΜΑ: ΔΙΔΑΣΚΩΝ: Δρ. Μαυρίδης Δημήτριος. ΤΜΗΜΑ: Εισαγωγή στην Διοίκηση Επιχειρήσεων

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

Διεθνείς Οικονομικές Σχέσεις και Ανάπτυξη

Γενικά Μαθηματικά Ι. Ενότητα 12: Κριτήρια Σύγκλισης Σειρών. Λουκάς Βλάχος Τμήμα Φυσικής ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Υπολογιστικά & Διακριτά Μαθηματικά

ΘΕΩΡΙΑ ΥΠΟΛΟΓΙΣΜΩΝ ΚΑΙ ΑΥΤΟΜΑΤΩΝ

ΜΑΚΡΟΟΙΚΟΝΟΜΙΚΗ. Ενότητα 6: Ζήτηση χρήματος Αγορά Χρήματος. Γεώργιος Μιχαλόπουλος Τμήμα Λογιστικής-Χρηματοοικονομικής

ΝΟΜΙΣΜΑΤΙΚΗ ΟΙΚΟΝΟΜΙΚΗ ΠΟΛΙΤΙΚΗ. Ενότητα 3: Αγορά Χρήματος και επιτόκια. Γεώργιος Μιχαλόπουλος Τμήμα Λογιστικής-Χρηματοοικονομικής

Οικονομικά Μαθηματικά

ΜΑΘΗΜΑΤΙΚΑ ΓΙΑ ΟΙΚΟΝΟΜΟΛΟΓΟΥΣ

Διάλεξη 7. Θεωρία παιγνίων VA 28, 29

Οικονομικά Μαθηματικά

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Cretive Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπ

Μικροβιολογία & Υγιεινή Τροφίμων

Γενικά Μαθηματικά Ι. Ενότητα 15: Ολοκληρώματα Με Ρητές Και Τριγωνομετρικές Συναρτήσεις Λουκάς Βλάχος Τμήμα Φυσικής

Ηλεκτρονικοί Υπολογιστές ΙΙ

Οικονομικά Μαθηματικά

ΔΙΕΘΝΕΙΣ ΕΠΕΝΔΥΣΕΙΣ ΚΑΙ ΔΙΕΘΝΕΣ ΕΜΠΟΡΙΟ

Λογισμός 3. Ενότητα 19: Θεώρημα Πεπλεγμένων (γενική μορφή) Μιχ. Γ. Μαριάς Τμήμα Μαθηματικών ΑΝΟΙΚΤΑ ΑΚΑ ΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Χρηματοοικονομική Ι. Ενότητα 4: Η Χρονική Αξία του Χρήματος (1/2) Ιωάννης Ταμπακούδης. Τμήμα Οργάνωσης και Διοίκησης Επιχειρήσεων ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗ Ι

Μαθηματικά. Ενότητα 3: Εξισώσεις και Ανισώσεις 1 ου βαθμού. Σαριαννίδης Νικόλαος Τμήμα Λογιστικής και Χρηματοοικονομικής

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

Υπολογιστικά & Διακριτά Μαθηματικά

Πληροφορική. Εργαστηριακή Ενότητα 3 η : Επεξεργασία Κελιών Γραμμών & Στηλών. Ι. Ψαρομήλιγκος Τμήμα Λογιστικής & Χρηματοοικονομικής

Αυτοματοποιημένη χαρτογραφία

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

ΘΕΩΡΙΑ ΥΠΟΛΟΓΙΣΜΩΝ ΚΑΙ ΑΥΤΟΜΑΤΩΝ

Χρηματοοικονομική Ι. Ενότητα 7: Μετοχικοί τίτλοι. Ιωάννης Ταμπακούδης. Τμήμα Οργάνωσης και Διοίκησης Επιχειρήσεων ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗ Ι

Μαθηματικά. Ενότητα 9: Όριο Συνάρτησης στο Διηνεκές. Σαριαννίδης Νικόλαος Τμήμα Λογιστικής και Χρηματοοικονομικής

Πολιτική Οικονομία Ενότητα

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι. Ενότητα 8: SQL (Πρακτική Εξάσκηση 2) Ευαγγελίδης Γεώργιος. Τμήμα Εφαρμοσμένης Πληροφορικής ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Μοντελοποίηση Λογικών Κυκλωμάτων

Εκκλησιαστικό Δίκαιο. Ενότητα 10η: Ιερά Σύνοδος της Ιεραρχίας και Διαρκής Ιερά Σύνοδος Κυριάκος Κυριαζόπουλος Τμήμα Νομικής Α.Π.Θ.

Ηλεκτρονικοί Υπολογιστές IV

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕ ΧΡΗΣΗ Η/Υ

Ανάλυση ισορροπίας και κινητικότητας σπονδυλικής στήλης

Ασκήσεις 3 ου Κεφαλαίου

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

Υπολογιστικά & Διακριτά Μαθηματικά

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 9: Λύσεις παιγνίων δύο παικτών

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

Βιομηχανική Οργάνωση ΙΙ: Θεωρίες Κρατικής Παρέμβασης & Ανταγωνισμού

Τίτλος Μαθήματος: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ

Οικονομικά Μαθηματικά

Συστήματα Υποστήριξης Αποφάσεων

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

Μεταλλευτική Οικονομία

Κεφάλαιο 13ο Eπαναλαµβανόµενα παίγνια (Repeated Games)

Εργαστήριο Χημείας Ενώσεων Συναρμογής

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

Υπολογιστικά & Διακριτά Μαθηματικά

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι. Ενότητα 7α: SQL (NULL, Διαίρεση) Ευαγγελίδης Γεώργιος. Τμήμα Εφαρμοσμένης Πληροφορικής ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Ι

Λογική. Δημήτρης Πλεξουσάκης. Ασκήσεις 2ου Φροντιστηρίου: Προτασιακός Λογισμός: Κανονικές Μορφές, Απλός Αλγόριθμος Μετατροπής σε CNF/DNF, Άρνηση

Υδραυλικά & Πνευματικά ΣΑΕ

ΔΙΕΘΝΕΙΣ ΕΠΕΝΔΥΣΕΙΣ ΚΑΙ ΔΙΕΘΝΕΣ ΕΜΠΟΡΙΟ

Transcript:

Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια Ρεφανίδης Ιωάννης

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς. 2

Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο Πανεπιστήμιο Μακεδονίας» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 3

Infinitely repeated games Απείρως επαναλαμβανόμενα παιχνίδια 4

Γενικά (1/2) Όταν ένα παιχνίδι επαναλαμβάνεται άπειρες φορές, δεν μπορούμε να θεωρήσουμε ως συνολικό όφελος το άθροισμα για τα επί μέρους παιχνίδια. Υπάρχουν διάφοροι τρόποι αντιμετώπισης των απειροαθροισμάτων, όπως: Μέσος όρος Προεξόφληση μελλοντικών αποδόσεων Θα χρησιμοποιήσουμε την τελευταία μέθοδο, σύμφωνα με την οποία: Υπάρχει ένας παράγοντας προεξόφλησης (discount factor) δ<1. Η σημερινή αξία μιας απόδοσης u t τη χρονική στιγμή t είναι δ t u t. Αν θεωρήσουμε σταθερή μέση απόδοση u σε κάθε χρονική στιγμή, η συνολική απόδοση του παιχνιδιού είναι: u ολ = t δ = t u u δ = t= 0 t= 0 1 u δ 5

Γενικά (2/2) Ο παράγοντας προεξόφλησης μπορεί να ερμηνευτεί με πολλούς τρόπους: Εάν το όφελος είναι χρηματικές αποδόσεις, τότε ο παράγοντας προεξόφλησης μπορεί να θεωρηθεί ότι σχετίζεται με το επιτόκιο της τράπεζας. Εάν δεν είναι γνωστό το πλήθος των επαναλήψεων του παιχνιδιού, ο παράγοντας προεξόφλησης είναι η πιθανότητα που δίνουμε κάθε φορά στο να υπάρξει ακόμη μια επανάληψη. Γενικότερα ένας παίκτης προτιμά μια άμεση απόδοση έναντι μιας μελλοντικής απόδοσης. 6

Στρατηγική ενεργοποίησης (1/5) Έστω το παιχνίδι ΔΦ (στην απλή του μορφή, με αποδόσεις τέτοιες ώστε μεγαλύτεροι αριθμοί να είναι καλύτεροι) το οποίο παίζεται απείρως επαναλαμβανόμενα. Έστω το παρακάτω ζεύγος στρατηγικών: Οι παίκτες συμφωνούν να παίξουν (ΔΟ, ΔΟ) για πάντα. Εάν όμως κάποιος παίκτης ομολογήσει, στο εξής και οι δύο θα επιλέγουν Ο για πάντα. Η παραπάνω στρατηγική (κοινή και για τους δύο παίκτες) ονομάζεται στρατηγική ενεργοποίησης (trigger strategy). Η στρατηγική χωρίζεται σε δύο μέρη: Στο μέρος πρώτο, όπου κανείς παίκτης δεν ομολογεί, κάθε παίκτης ενδεχομένως θα είχε την τάση να ομολογήσει. Στο δεύτερο μέρος, όπου και οι δύο παίκτες ομολογούν, κανείς παίκτης δεν έχει την τάση (από μόνος του) να μην-ομολογήσει. 7

t δ + 1 1 10 1 δ Στρατηγική ενεργοποίησης (2/5) Έστω ότι ύστερα από t-1 γύρους, όπου οι δύο παίκτες τήρησαν τη συμφωνία, είμαστε στην επανάληψη t. Έστω ότι ένας παίκτης, π.χ. ο Α, σκέφτεται να ομολογήσει. Το γεγονός ότι έχουν προηγηθεί t-1 γύροι δεν αλλάζει ουσιαστικά σε τίποτα τη συμπεριφορά των παικτών στον t-1 γύρο. Το παιχνίδι που ξεκινά στον t γύρο είναι ίδιο με αυτό που ξεκίνησε στον πρώτο γύρο, εφόσον οι παίκτες τηρούν τη συμφωνία. Το άμεσο όφελός του θα είναι δ t 15 (αντί για δ t 14 αν τηρούσε τη συμφωνία). Το όφελός του από τους επόμενους γύρους θα είναι: Β Α Ο ΔΟ Ο 10, 10 15, 0 ΔΟ 0, 15 14 14 Προσοχή: Μεγαλύτερες αποδόσεις θεωρούνται καλύτερες. 8

t 1 δ 14 1 δ Στρατηγική ενεργοποίησης (3/5) Εάν δεν έσπαγε τη συμφωνία, τότε το όφελός του για τους επόμενους (άπειρους) γύρους θα ήταν: Θα συνέφερε τον Α να σπάσει τη συμφωνία, εάν ίσχυε: t δ 1 t 14 < δ 1 δ δ < t 15 + δ ή 1 5 + 1 1 10 1 δ Β Α Ο ΔΟ Ο 10, 10 15, 0 ΔΟ 0, 15 14 14 9

Στρατηγική ενεργοποίησης (4/5) Άρα, για δ>1/5 δεν συμφέρει κανέναν παίκτη να σπάσει τη συμφωνία. Σε αυτή την περίπτωση, η στρατηγική ενεργοποίησης είναι σημείο ισορροπίας, αφού κανείς παίκτης δεν τολμά να την αλλάξει μεμονωμένα! Γενικότερα, η στρατηγική ενεργοποίησης επιβραβεύει την καλή συμπεριφορά ή, ισοδύναμα, τιμωρεί την κακή συμπεριφορά, όταν ο παράγοντας προεξόφλησης τείνει στη μονάδα, όσο δηλαδή αυξάνει η βαρύτητα του μέλλοντος. Αντίστοιχη συμπεριφορά δεν υπάρχει στα πεπερασμένα παιχνίδια, γιατί το μέλλον είναι πεπερασμένο. Β Α Ο ΔΟ Ο 10, 10 15, 0 ΔΟ 0, 15 14 14 10

Στρατηγική ενεργοποίησης (5/5) Η στρατηγική ενεργοποίησης που είδαμε δεν είναι η μοναδική. Μια παραλλαγή της θα μπορούσε να είναι η εξής: Αρχικά οι παίκτες παίζουν εναλλάξ (Ο,ΔΟ) και (ΔΟ,Ο). Εάν κάποια στιγμή ένας παίκτης αθετήσει τη συμφωνία, στη συνέχεια και οι δύο παίκτες παίζουν (Ο,Ο) για πάντα. Η παραπάνω στρατηγική βέβαια δεν αποτελεί σημείο ισορροπίας Nash, μιας και οι παίκτες κερδίζουν κατά μέσο όρο 7.5 ανά γύρο, λιγότερο από ότι κερδίζουν στο σημείο ισορροπίας Nash. Ανάλογα με τις επιμέρους αποδόσεις του παιχνιδιού γύρου, κάποια εκ των δύο στρατηγικών ενεργοποίησης που είδαμε (στην προκειμένη περίπτωση η πρώτη) έχει καλύτερη συνολική απόδοση. Β Α Ο ΔΟ Ο 10, 10 15, 0 ΔΟ 0, 15 14 14 11

Επιεικής στρατηγική Η επιεικής στρατηγική είναι παραλλαγή της στρατηγικής ενεργοποίησης: Η «τιμωρία» λήγει μετά από κάποιον αριθμό γύρων. Οι παίκτες συμφωνούν να παίξουν (ΔΟ, ΔΟ) για πάντα. Εάν όμως κάποιος παίκτης ομολογήσει, ο άλλος παίκτης επιλέξει Ο για τους επόμενους Τ γύρους. Για να αποτελεί η παραπάνω στρατηγική σημείο ισορροπίας, πρέπει να επιλέξουμε το Τ με τέτοιο τρόπο ώστε κανέναν παίκτη να μην τον συμφέρει να αθετήσει τη συμφωνία. Μετά από (αρκετές...) πράξεις βρίσκεται η αναγκαία συνθήκη για να αποτελεί η παραπάνω στρατηγική σημείο ισορροπίας. Β Α Ο ΔΟ Ο 10, 10 15, 0 ΔΟ 0, 15 14 14 12

Το κοινό θεώρημα (1/2) Το ερώτημα που τίθεται για τα απείρως επαναλαμβανόμενα παιχνίδια είναι το εξής: Πόσοι (και ποιοι) είναι εκείνοι οι συνδυασμοί στρατηγικών που οδηγούν σε ισορροπία; Η απάντηση είναι: Πάρα πολλοί. Θα αποδείξουμε για το ΔΦ. Ορίζουμε ως κύκλο συμπεριφοράς μια ακολουθία γύρων, όπου οι δύο παίκτες για Τ 1 γύρους επιλέγουν (ΔΟ, ΔΟ), στη συνέχεια για Τ 2 γύρους επιλέγουν (Ο,Ο), στη συνέχεια για Τ 3 γύρους επιλέγουν (Ο,ΔΟ) και τέλος για Τ 4 γύρους επιλέγουν (Ο,ΔΟ). Πρέπει να ισχύει T=Τ 1 +Τ 2 +Τ 3 +Τ 4 >0 13

Το κοινό θεώρημα (2/2) Ένας κύκλος συμπεριφοράς χαρακτηρίζεται ατομικά λογικός (individually rational) εάν το όφελος για κάθε έναν από τους δύο παίκτες για όλο τον κύκλο είναι μεγαλύτερο ή ίσο από ό,τι αν επέλεγαν συνέχεια (Ο,Ο). Το κοινό θεώρημα (folk theorem): Από κάθε ατομικά λογικό κύκλο μπορεί να κατασκευαστεί μια τέλεια ισορροπία υποπαιγνίου, εάν συνδυάσουμε τον κύκλο με την στρατηγική ενεργοποίησης και έναν συντελεστή προεξόφλησης κοντά στη μονάδα. Φυσικά ο συντελεστής προεξόφλησης είναι μια «φυσική σταθερά» του προβλήματος και δεν είναι στο χέρι μας να τον επηρεάσουμε. Όσο πιο κοντά στη μονάδα είναι ο συντελεστής προεξόφλησης, τόσο περισσότερους συνδυασμούς στρατηγικών που να αποτελούν ισορροπία μπορούμε να κατασκευάσουμε. Αν λάβουμε υπόψη και την επιεική στρατηγική, οι συνδυασμοί μπορεί να γίνουν άπειροι. 14

Τέλος Ενότητας