Θεωρία Παιγνίων και Αποφάσεων Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων Ε. Μαρκάκης Επικ. Καθηγητής
Παίγνια πολλών παικτών 2
Παίγνια με > 2 παίκτες Όλοι οι ορισμοί που έχουμε δει γενικεύονται και σε παίγνια με περισσότερους παίκτες Κυρίαρχες στρατηγικές και σημεία ισορροπίας ορίζονται ανεξαρτήτως του αριθμού των παικτών Όμως: η αναπαράσταση δεν μπορεί να γίνει πλέον με 2διάστατους πίνακες Για παίγνια n παικτών θέλουμε n-διάστατους πίνακες 3
Παίγνια σε κανονική μορφή Ορισμός: Ένα παίγνιο σε κανονική μορφή αποτελείται από ένα σύνολο παικτών N = {1, 2,..., n} Για κάθε παίκτη i, ένα σύνολο διαθέσιμων στρατηγικών S i Για κάθε παίκτη i, μια συνάρτηση ωφέλειας u i : S 1 x... x S n R Προφίλ στρατηγικών: Κάθε διάνυσμα της μορφής (s 1,..., s n ), με s i S i Κάθε προφίλ αντιστοιχεί σε μια έκβαση του παιγνίου 4
Ορολογία Δεδομένου ενός διανύσματος s = (s 1,..., s n ), συμβολίζουμε με s i το διάνυσμα στο οποίο έχουμε αφαιρέσει την i-οστή συντεταγμένη (αν το s είναι προφίλ στρατηγικών, αφαιρούμε απλά την στρατηγική του π. i): s i = (s 1,..., s i-1, s i+1,..., s n ) Π.χ. αν s = (3, 5, 7, 8), τότε s -3 = (3, 5, 8) s -1 = (5, 7, 8) Το αρχικό προφίλ s μπορούμε να το γράφουμε και ως s = (s i, s i )
Κυρίαρχες στρατηγικές Μια στρατηγική s i του π. i ονομάζεται κυρίαρχη (dominant) αν u i (s i, s -i ) u i (s, s -i ) για κάθε στρατηγική s S i και για κάθε προφίλ s -i των υπόλοιπων παικτών Μια στρατηγική s i του π. i ονομάζεται αυστηρά κυρίαρχη (strictly dominant) αν u i (s i, s -i ) > u i (s, s -i ) για κάθε στρατηγική s S i και για κάθε προφίλ s -i των υπόλοιπων παικτών Παρατηρήσεις (όπως και στα παίγνια 2 παικτών): Μπορεί να υπάρχουν περισσότερες από μια κυρίαρχες στρατηγικές για έναν παίκτη, αν δίνουν την ίδια ωφέλεια σε όλα τα προφίλ Κάθε παίκτης μπορεί να έχει το πολύ μια αυστηρά κυρίαρχη στρατηγική Μια αυστηρά κυρίαρχη στρατηγική είναι και κυρίαρχη 6
Σημεία ισορροπίας κατά Nash Ορισμός: Ένα προφίλ στρατηγικών s = (s 1,..., s n ) είναι σημείο ισορροπίας κατά Nash (Nash equilibrium), αν κανένας παίκτης δεν έχει κίνητρο να αλλάξει μονομερώς την στρατηγική του, βλέποντας τις επιλογές των άλλων παικτών Δηλαδή πρέπει για κάθε παίκτη i να ισχύει ότι: u i (s i, s -i ) u i (s, s -i ) για κάθε στρατηγική s S i 7
Πολυπλοκότητα εύρεσης Με μια πρώτη ματιά: Μπορούμε να δοκιμάσουμε με brute force όλα τα προφίλ Έστω ότι έχουμε n παίκτες Και έστω m επιλογές για κάθε παίκτη: S i = m Θα πρέπει να ελέγξουμε m n προφίλ! Αρκετά πιο δύσκολο πρόβλημα από ότι στην περίπτωση των 2 παικτών Σε πολλές περιπτώσεις όμως μπορούμε να εκμεταλλευτούμε συμμετρίες ή άλλες ιδιότητες και να μειώσουμε την πολυπλοκότητα 8
Παράδειγμα 1: Παίγνια συμφόρησης (Conges}on games) A s B t C Παίγνια συμφόρησης (απλοϊκή εκδοχή): Ένα σύνολο χρηστών θέλει να μετακινηθεί από το σημείο s στο σημείο t 3 δυνατές διαδρομές, A, B, C Χρονική καθυστέρηση σε κάθε διαδρομή: συνάρτηση του αριθμού παικτών που επιλέγουν την διαδρομή d A (x) = 5x, d B (x) = 7.5x, d C (x) = 10x, 9
Παράδειγμα 1: Παίγνια συμφόρησης (Conges}on games) A s B t C Έστω n = 5 παίκτες Για κάθε παίκτη i, S i = {A, B, C} Πιθανά προφίλ: 3 5 = 243 Ωφέλειες: αυξάνονται όταν μειώνεται η καθυστέρηση Στο προφίλ s = (A, C, A, B, A} u 1 (s) = -15, u 2 (s) = -10, u 3 (s) = -15, u 4 (s) = -7.5, u 5 (s) = -15 10
Παράδειγμα 1: Παίγνια συμφόρησης (Conges}on games) A s B t C Δεν είναι ανάγκη να εξετάσουμε και τα 243 προφίλ Συμμετρία: Σε κάθε διαδρομή, η καθυστέρηση δεν εξαρτάται από το ποιοι την επέλεξαν, αλλά μόνο από το πόσοι την επέλεξαν Η συμμετρία μειώνει σημαντικά την αναζήτηση Μπορούμε να εκμεταλλευτούμε κι άλλες ιδιότητες Π.χ. Δεν υπάρχει σημείο ισορροπίας όπου καποια διαδρομή δεν χρησιμοποιείται από κανέναν παίκτη Άσκηση: βρείτε (αν υπάρχουν) τα σημεία ισορροπίας 11
Παράδειγμα 2: Το δίλημμα των απεργών Ένα σύνολο από n εργάτες σκέφτονται να απεργήσουν για να διεκδικήσουν τα αιτήματά τους S i = {Απεργώ (Α), Δεν απεργώ (Δ)} Αν απεργήσουν όλοι, τα αιτήματα πραγματοποιούνται, και δεν χάνεται ο μισθός για τις μέρες που απέργησαν Αν έστω κι ένας δεν απεργήσει, τότε Τα αιτήματα δεν πραγματοποιούνται Όσοι απέργησαν, χάνουν το μισθό τους για τις μέρες απεργίας 12
Παράδειγμα 2: Το δίλημμα των απεργών Προτιμήσεις: Το καλύτερο για κάθε παίκτη είναι να απεργήσουν όλοι [προφίλ (Α, Α,..., Α)] Το χειρότερο για κάθε παίκτη είναι να απεργήσει και τουλάχιστον ένας άλλος να μην απεργήσει Για κάθε π. i, τα προφίλ στα οποία δεν απεργεί έχουν την ίδια ωφέλεια για αυτόν Πλήθος προφίλ: 2 n, εκθετικά μεγάλος αριθμός Όμως κι εδώ μπορούμε να εκμεταλλευτούμε ότι οι παίκτες έχουν την ίδια συνάρτηση ωφέλειας Ανάλυση των προφίλ: (Α, Α,..., Α): σημείο ισορροπίας (Δ, Δ,..., Δ): ομοίως Προφίλ με τουλ. 1 Α και τουλ. 1 Δ: δεν είναι σημείο ισορροπίας Πόρισμα: Είτε πρέπει να γίνεται μαζικά μια απεργία είτε να μην γίνεται καθόλου! 13
Απλοποιήσεις παιγνίων: Αυστηρή και ασθενής κυριαρχία 14
Prisoner s Dilemma Ας επανέλθουμε στο δίλημμα του φυλακισμένου Είχαμε δει ότι η στρατηγική D είναι κυρίαρχη Συλλογισμός του π. 1: Αν ο π. 2 δεν ομολογήσει, με συμφέρει να ομολογήσω Αν ο π. 2 ομολογήσει, με συμφέρει να ομολογήσω 3, 3 0, 4 4, 0 1, 1 Ομοίως για τον π. 2 Κάθε παίκτης πιστεύει ότι δεν έχει νόημα να επιλέξει την στρατηγική C Η στρατηγική C κυριαρχείται από την D C D C D 15
Αυστηρά κυριαρχούμενες στρατηγικές Ορισμός: Μια στρατηγική s i του π. i κυριαρχεί αυστηρά μια άλλη στρατηγική s αν για οποιοδήποτε προφιλ s -i των υπόλοιπων παικτών, ισχύει ότι u i (s i, s -i ) > u i (s, s -i ) H στρατηγική s θα λέγεται αυστηρά κυριαρχούμενη 16
Αυστηρά κυριαρχούμενες στρατηγικές Μια αυστηρά κυριαρχούμενη στρατηγική δεν χρησιμοποιείται σε κανένα σημείο ισορροπίας Άρα, μπορούμε να αφαιρέσουμε τις αυστηρά κυριαρχούμενες στρατηγικές, και να επικεντρωθούμε σε ένα μικρότερο παίγνιο Σε κάποιες περιπτώσεις, οδηγούμαστε έτσι σε αρκετά απλούστερα παίγνια 17
Επαναλαμβανόμενη αφαίρεση αυστηρά κυριαρχούμενων στρατηγικών Η B του π. 1 κυριαρχείται από την T και την C Οι στρατηγικές του π. 2 δεν κυριαρχούνται Αν ο π. 1 είναι λογικός, δεν θα επιλέξει την B T C B L M R (4, 4) (4, 1) (3, 0) (3, 1) (3, 4) (4, 0) (2, 0) (2, 0) (2, 6) Δεν πρέπει να επιλέξω την B 18
Επαναλαμβανόμενη αφαίρεση αυστηρά κυριαρχούμενων στρατηγικών Αν ο π. 2 ξέρει ότι ο π. 1 είναι λογικός, υποθέτει ότι ο π. 1 δεν επιλέγει την B Τότε και ο π. 2 δεν πρέπει να επιλέξει την R Δεν πρέπει να επιλέξω B T C B L M R (4, 4) (4, 1) (3, 0) (3, 1) (3, 4) (4, 0) (2, 0) (2, 0) (2, 6) Άρα δεν πρέπει να επιλέξω την R 19
Επαναλαμβανόμενη αφαίρεση αυστηρά κυριαρχούμενων στρατηγικών Συνεχίζοντας έτσι... Δεν παίζω την B Άρα δεν επιλέγω R Άρα δεν επιλέγω C T C B L M R (4, 4) (4, 1) (3, 0) (3, 1) (3, 4) (4, 0) (2, 0) (2, 0) (2, 6) 20
Επαναλαμβανόμενη αφαίρεση αυστηρά κυριαρχούμενων στρατηγικών Πώς τρέχουμε τον αλγόριθμο επαναλαμβανόμενης αφαίρεσης: Δεδομένου ενός παίγνίου n παικτών Διαλέγουμε έναν παίκτη i που έχει τουλ. 1 αυστηρά κυριαρχούμενη στρατηγική Διαγράφουμε μία από τις αυστηρά κυριαρχούμενες στρατηγικές του π. I repeat un}l: δεν υπάρχει παίκτης που να έχει αυστηρά κυριαρχούμενη στρατηγική 21
Επαναλαμβανόμενη αφαίρεση αυστηρά κυριαρχούμενων στρατηγικών Παρατήρηση: Οι στρατηγικές που επιβιώνουν αυτή την διαδικασία δεν εξαρτώνται από την σειρά με την οποία κάνουμε την αφαίρεση δλδ, δεν έχει σημασία ποιον παίκτη θα διαλέγουμε σε καθε βήμα Θεώρημα: Έστω G ένα παίγνιο n παικτών και G το παίγνιο που προκύπτει από την επαναλαμβανόμενη αφαίρεση αυστηρά κυριαρχούμενων στρατηγικών. Το G και το G έχουν τα ίδια σημεία ισορροπίας δλδ, δεν καταστρέφουμε κανένα σημείο ισορροπίας με αυτή την διαδικασία, μόνο απλοποιούμε το παίγνιο 22
Ασθενώς κυριαρχούμενες στρατηγικές Ορισμός: Μια στρατηγική s i του π. i κυριαρχεί ασθενώς μια άλλη στρατηγική s αν για οποιοδήποτε προφιλ s -i των υπόλοιπων παικτών, ισχύει ότι u i (s i, s -i ) u i (s, s -i ) και για τουλάχιστον 1 προφίλ s -i έχουμε u i (s i, s -i ) > u i (s, s -i ) H s θα λέγεται ασθενώς κυριαρχούμενη 23
Ασθενώς κυριαρχούμενες στρατηγικές T B L R 1, 1 0, 0 0, 0 0, 0 2, 2 3, 0 0, 3 3, 3 Όταν αφαιρούμε ασθενώς κυριαρχούμενες στρατηγικές, μπορεί να χάσουμε κάποια σημεία ισορροπίας Στα παραπάνω παίγνια: Η T κυριαρχεί ασθενώς την B Η L κυριαρχεί ασθενώς την R όμως, το (B, R) είναι σημείο ισορροπίας Παρατήρηση: Στο 2 ο παίγνιο, έχουμε και καλύτερη συνολική ωφέλεια όταν οι παίκτες επιλέγουν ασθενώς κυριαρχούμενες 24 στρατηγικές T B L R
Επαναλαμβανόμενη αφαίρεση αυστηρά κυριαρχούμενων στρατηγικών Μπορούμε να κάνουμε την ίδια διαδικασία όπως με τις αυστηρά κυριαρχούμενες στρατηγικές ΟΜΩΣ: Η σειρά με την οποία αφαιρούμε έχει σημασία Δαιφορετικές σειρές αφαίρεσης μπορεί να αφαιρέσουν διαφορετικά σημεία ισορροπίας Υπάρχει περίπτωση να χάσουμε όλα τα σημεία ισορροπίας με αυτή την διαδικασία? 25
Επαναλαμβανόμενη αφαίρεση αυστηρά κυριαρχούμενων στρατηγικών Θεώρημα: Σε κάθε παίγνιο, υπάρχει πάντα τουλάχιατον 1 σημείο ισορροπίας που επιβιώνει όταν κάνουμε επαναλαμβανόμενη αφαίρεση ασθενώς κυριαρχούμενων στρατηγικών επομένως: αν μας νοιάζει απλά να βρούμε ένα σημείο ισορροπίας, μπορούμε να απλοποιήσουμε το παίγνιο, χωρίς να μας απασχολεί η σειρά αφαίρεσης 26