Εκτεταμένα Παίγνια (Extensive Games) Παύλος Στ. Εφραιµίδης Τοµέας Λογισµικού και Ανάπτυξης Εφαρµογών Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Εκτεταμένα Παίγνια Τα στρατηγικά παίγνια δεν λαµβάνουν υπόψη την πιθανή ακολουθιακή φύση της λήψης αποφάσεων Αντίθετα, στο µοντέλο των εκτεταµένων παιγνίων (extensive games) περιγράφεται ρητά η ακολουθιακή φύση της λήψης αποφάσεων Algorithmic Game Theory Extensive Games 2
Παράδειγμα: Παίγνιο Εισβολής Δύο παίκτες Ο πρώτος παίκτης (κάτοχος) κατέχει μια θέση και αντιμετωπίζει την πιθανότητα εισβολής από τον δεύτερο παίκτη (διεκδικητή) Κινήσεις: Ο διεκδικητής μπορεί είτε να κάνει εισβολή είτε όχι. Αν κάνει την εισβολή, τότε ο κάτοχος της θέσης μπορεί είτε να αποσυρθεί είτε να πολεμήσει. Το παράδειγμα μπορεί να αφορά δύο εταιρείες όπου η μία κατέχει ένα μονοπώλιο και μπορεί να το διεκδικήσει η δεύτερη, δύο πολιτικούς σε μια μονοεδρική περιφέρεια, κτλ. Το παραπάνω πρόβλημα μπορεί να μοντελοποιηθεί ως εκτεταμένο παίγνιο. Algorithmic Game Theory Extensive Games 3
Παίγνιο εισβολής Παίκτες(players): Ο διεκδικητής και ο κάτοχος. Τερματικά ιστορικά (terminal histories): (Εντός, Απόσυρση), (Εντός, Μάχη), και Εκτός Συνάρτηση παίκτη(player function) P( ) = διεκδικητής και P(Εντός) = κάτοχος Προτιμήσεις(preferences) Διεκδικητής: u1(εντός, Απόσυρση)=2, u1(εκτός)=1, u1(εντός, Μάχη)=0 Κάτοχος: u2(εκτός)=2, u2(εντός, Απόσυρση)=1, u2(εντός, Μάχη)=0 Algorithmic Game Theory Extensive Games 4
Παίκτες(players): Παίγνιο εισβολής Ο διεκδικητής και ο κάτοχος. Τερματικά ιστορικά (terminal histories): (Εντός, Απόσυρση), (Εντός, Μάχη), και Εκτός Συνάρτηση παίκτη(player function) P( ) = διεκδικητής και P(Εντός) = κάτοχος Προτιμήσεις(preferences) Διεκδικητής: u1(εντός, Απόσυρση)=2, u1(εκτός)=1, u1(εντός, Μάχη)=0 Κάτοχος: u2(εκτός)=2, u2(εντός, Απόσυρση)=1, u2(εντός, Μάχη)=0 Algorithmic Game Theory Extensive Games 5
ΝΕ εκτεταμένου παιγνίου Algorithmic Game Theory Extensive Games 6
strategic form Ένας τρόπος εύρεσης των NE ενός εκτεταμένου παιγνίου στο οποίο κάθε παίκτης έχει στη διάθεση του ένα πεπερασμένο πλήθος κινήσεων, είναι να παραθέσουμε τις στρατηγικές κάθε παίκτη, να βρούμε την έκβαση για προφίλ στρατηγικών, και να αναλύσουμε τα δεδομένα αυτά σαν στρατηγικό παίγνιο Αυτό που προκύπτει με την παραπάνω διαδικασία είναι η στρατηγική μορφή (strategic form) του εκτεταμένου παιγνίου Algorithmic Game Theory Extensive Games 7
η στρατηγική μορφή του παιγνίου εισβολής Algorithmic Game Theory Extensive Games 8
Παράδειγμα Algorithmic Game Theory Extensive Games 9
Στρατηγική Μορφή Algorithmic Game Theory Extensive Games 10
SubgamePerfect Equilibrium (SPE) Subgameperfect equilibrium (υποπαιγνιακάτέλεια ισορροπία) ή Subgameperfect Nash equilibrium: Είναι ένα προφίλ στρατηγικών σε ένα εκτεταμένο παίγνιο τέτοια ώστε αναπαριστά μια ισορροπία Nash για κάθε υποπαίγνιο του εκτεταμένου παιγνίου. Υποπαίγνιοεκτεταμένου παιγνίου: Ορίζεται ένα για κάθε μη-τερματικό ιστορικό. Το υποπαίγνιογια το κενό ιστορικό είναι το συνολικό (αρχικό) παίγνιο. Κάθε πεπερασμένο εκτεταμένο παίγνιο έχει ένα subgameperfect equilibrium. Algorithmic Game Theory Extensive Games 11
Subgame perfect equilibrium (SPE) vs NE ΚάθεSPE είναι ένα NE. Ένα SPE είναι ένα προφίλ στρατηγικών που ορίζει ένα NE για κάθε υποπαίγνιο. Σε ένα NE η κίνηση κάθε παίκτη είναι βέλτιστη εάν όλοι οι υπόλοιποι παίκτες εμμείνουν στη στρατηγική τους σε όλη τη διάρκεια της ακολουθιακής εξέλιξης του εκτεταμένου παιγνίου. Algorithmic Game Theory Extensive Games 12
Παραδείγματα Το παίγνιο εισβολής NE: (In, Acquiesce) και (Out, Fight) SPE: Το NE (In, Acquiesce) είναι και SPE Το NE (Out, Fight) όμως δεν είναι. Εάν ο διεκδικητής (πρώτος παίκτης) αντί για Out παίξει In,τότε ο κάτοχος (δεύτερος παίκτης) είναι προτιμότερο να παίξει Acquiesce. Algorithmic Game Theory Extensive Games 13
Backward induction (αντίστροφη επαγωγή) Νωρίτερα βρήκαμε SPE ενός παιγνίου, υπολογίζοντας πρώτα τα NE του παιγνίου και ελέγχοντας στη συνέχεια για καθένα από αυτά εάν είναι SPE. Ένας πιο άμεσος τρόπος είναι η διαδικασία του backward induction. Εφαρμόζεται σε εκτεταμένα παίγνια πεπερασμένου ορίζοντα (όλες οι τερματικές ιστορίες έχουν πεπερασμένο μήκος) Algorithmic Game Theory Extensive Games 14
Backward induction Ξεκινούμε από την τελευταίο γύρο και επιλέγουμε τις βέλτιστες κινήσεις του παίκτη για τα υποπαίγνια μήκους 1. Μετά πάμε στον προτελευταίο γύρο και επιλέγουμε τη βέλτιστη πρώτη κίνηση για τα υποπαίγνιο μήκους 2. Συνεχίζουμε έτσι μέχρι να φτάσουμε στον αρχικό κόμβο του παιγνίου. Algorithmic Game Theory Extensive Games 15
Παραδείγματα Ultimatum Game Stackelberg competition Buying Votes Algorithmic Game Theory Extensive Games 16
The Ultimatum game Ενότητα 6.1 στο βιβλίο Algorithmic Game Theory Extensive Games 17
Stackelberg smodel of duopoly Heinrich Freiherr von Stackelberg Αφορά παίγνια στα οποία παίζει πρώτα ένας παίκτης (πχ. που έχει κυρίαρχη θέση στην αγορά) και στη συνέχεια αποκρίνονται οι υπόλοιποι παίκτες Μπορούμε να αναλύσουμε του παίγνιο του Cournotως Stackelberggame: Σε αυτή την περίπτωση ο πρώτος παίκτης κατά κανόνα αποκομίζει μεγαλύτερα κέρδη σε σχέση με το NE του παιγνίου Cournot. image from wikipedia Ενότητα 6.2 στο βιβλίο Algorithmic Game Theory Extensive Games 18
Εξαγορά ψήφων (buying votes) Ενότητα 6.3 στο βιβλίο Algorithmic Game Theory Extensive Games 19
Πηγές -Αναφορές An Introduction to Game Theory, Κεφάλαιο 5 An Introduction to Game Theory, Κεφάλαιο 6 Algorithmic Game Theory Extensive Games 20