Κεφάλαιο 2 ο Μέχρι τώρα δώσαµε τα στοιχεία ενός παιγνίου σε µορφή δέντρου και σε µορφή µήτρας. Τώρα θα ορίσουµε τη στρατηγική στην αναλυτική µορφή του παιγνίου (η στρατηγική ορίζεται από κάθε στήλη ή γραµµή της µήτρας στην στρατηγική µορφή). Αλλά τι είναι η στρατηγική, στην αναλυτική µορφή ενός παιγνίου; Αυτό είναι αρκετά πιο πολύπλοκο. Αρχικά θα µιλήσουµε για: (α) Αµιγείς Στρατηγικές (Pure Strategies) και αργότερα για (β) Μεικτές Στρατηγικές (Μixed Strategies) (α) Αµιγείς Στρατηγικές. Αµιγής στρατηγική ενός παίκτη I, είναι ένα πλήρες σχέδιο που προσδιορίζει µια επιλογή (action) σε κάθε ένα από τα σύνολα πληροφόρησης (κόµβους, εάν µιλάµε για τέλεια πληροφόρηση), στα οποία ο παίκτης I θα πρέπει να πάρει απόφαση στην περίπτωση που του ζητηθεί. Τι σηµαίνει αυτό; Σηµαίνει ότι ο παίκτης από την αρχή του παιγνίου πρέπει να έχει αποφασίσει τι επιλογές θα κάνει ακόµα και στην περίπτωση που ποτέ δεν θα κληθεί να τις εφαρµόσει. Επαναλαµβάνουµε: Μια αµιγής στρατηγική είναι ένα πλήρες σχέδιο (πλήρες: από τώρα µέχρι το τέλος του παιγνιδιού για όλες τις πιθανές εκδοχές του παιχνιδιού). Το παιχνίδι µπορεί να ακολουθήσει ένα συγκεκριµένο δρόµο, όµως υπάρχουν π.χ. 10000 δρόµοι που θα µπορούσε να ακολουθήσει το παιγνίδι. Στους 10000 αυτούς δρόµους κάθε φορά που θα µπορούσε να κληθεί ο παίκτης, πρέπει να έχει έτοιµη την απάντηση του, τη στιγµή µηδέν. Πρέπει να έχει ετοιµάσει το σχέδιο του από τώρα, για όλα τα ενδεχόµενα. Μια στρατηγική είναι κάτι περίπλοκο, διότι µπορεί κάποιος να είναι σχεδόν σίγουρος ότι το παιγνίδι θα πάρει µια συγκεκριµένη τροπή (άρα σε πολλές περιπτώσεις που θα είναι εκτός ισορροπίας του παιχνιδιού δεν θα κληθεί ποτέ να πάρει απόφαση) όµως ο ίδιος θα πρέπει να προσδιορίσει τη στιγµή µηδέν, τι θα έκανε στην περίπτωση που θα του ζητιόταν να πάρει µια απόφαση. Αν δεν υπάρχει τέλεια πληροφόρηση τη στιγµή που ο παίκτης θα κληθεί να πάρει την απόφαση του, δηλαδή δεν γνωρίζει ο ίδιος τι έχει συµβεί στο παρελθόν (µε άλλα λόγια δεν ξέρει τι έχει κάνει ο αντίπαλός του), τότε δεν θα ξέρει σε ποιο κόµβο βρίσκεται. Θα πρέπει λοιπόν να πάρει µια απόφαση, άσχετα αν βρίσκεται στον πάνω ή κάτω κόµβο. Συνεπώς αντί για κόµβους είναι καλύτερα να µιλούµε για σύνολα πληροφόρησης, έτσι ώστε να καλύψουµε και τα παίγνια που δεν έχουν τέλεια πληροφό- 18
ρηση. Βρίσκεται λοιπόν σε ένα σύνολο πληροφόρησης, και σε αυτό το σύνολο πληροφόρησης πρέπει να προσδιορίσουµε τι απόφαση θα πάρει ο παίκτης. Παραδείγµατα: Παίγνιο στο οποίο υπάρχει τέλεια πληροφόρηση Έστω ότι ο παίκτης Ι αποφασίζει µεταξύ l και r, και ο παίκτης ΙΙ µεταξύ L και R. Γνωρίζουµε ότι οι παίκτες έχουν τέλεια πληροφόρηση συνεπώς το κάθε σύνολο πληροφόρησης θα έχει ένα µόνο κόµβο. ηλαδή τα (α), (b), (c), (d), (e) είναι σύνολα πληροφόρησης. Τα ερωτήµατα που τίθενται τώρα είναι πως θα ορίσουµε µια στρατηγική για τον παίκτη Ι και πώς για τον παίκτη II; Σε πόσους κόµβους ο παίκτης Ι µπορεί να κληθεί να πάρει απόφαση και σε πόσους ο παίκτης II; Ας εξετάσουµε πρώτα την πλευρά του παίκτη I. O παίκτης I, όπως βλέπουµε από το διάγραµµα 15, παίρνει απόφαση σε δυο κόµβους: (α) και (b). Συνεπώς η στρατηγική του θα αποτελείται από δυο στοιχεία, ίσα δηλαδή µε τον αριθµό των κόµβων στους οποίους ο παίκτης µπορεί να κληθεί να πάρει απόφαση. Ας δούµε λοιπόν ένα παράδειγµα µιας στρατηγικής, το οποίο µπορεί να µας φανεί παράλογο: π.χ. l r (α) (β) 19
Στον κόµβο (α) ο παίκτης Ι αποφασίζει l. Αν αποφασίσει l το παιγνίδι πάει προς τα πάνω, οπότε δεν θα κληθεί ποτέ να πάρει απόφαση στον κόµβο (b). Αυτό όµως δεν έχει καµία σηµασία. Θα πρέπει να ορίσουµε τι θα κάνει ο παίκτης I και στον κόµβο (b). Όπως είπαµε και στην αρχή η στρατηγική του θα πρέπει να είναι ένα πλήρες σχέδιο. Οπότε, το ότι µια κίνηση l, αποκλείει το παιχνίδι να πάει προς τα κάτω, δεν σηµαίνει ότι δεν πρέπει να προσδιορίσουµε τι θα κάνει ο παίκτης Ι στον κόµβο (b). To (l r) είναι µια τυπική στρατηγική του παίκτη Ι. Το ερώτηµα που τίθεται τώρα είναι πόσες στρατηγικές έχει στην διάθεση του ο παίκτης Ι; Η απάντηση είναι ότι έχει 4 στρατηγικές: έχει δύο επιλογές στον κόµβο (α) και 2 επιλογές στον κόµβο (b). ηλαδή: l l r r l r r l Ας δούµε τώρα αντίστοιχα την πλευρά του παίκτη ΙΙ. Μια τυπική στρατηγική του θα αποτελείται από 3 στοιχεία αφού ο παίκτης ΙΙ καλείται να πάρει απόφαση σε τρεις κόµβους και σε κάθε ένα από αυτούς έχει δυο επιλογές. Συνολικά ο παίκτης ΙΙ έχει 8 στρατηγικές (2 3 ): LLL, LLR, LRL, LRR, RLL, RLR, RRL, RRR Για παράδειγµα η στρατηγική: L R L (c ) (d) (e) µας δείχνει ότι στον κόµβο (c) ο παίκτης II θα αποφασίσει L, στον κόµβο (d) θα αποφασίσει R (και θα τελειώσει το παιγνίδι) αλλά παρόλα αυτά θα πρέπει να αποφασίσει τι θα συµβεί και στον κόµβο (e), όπου αποφασίζει L. 20
Κάθε παίγνιο σε αναλυτική µορφή έχει και την αντίστοιχη στρατηγική του µορφή. Στρατηγική µορφή παιγνίου: c, d, e, a, b L L L L L R L R L L R R R L L R L R R R L R R R L l G G G G L L L L L r G G G G L L L L R l L G G G L G G G R r G G G G G G G G Ο παίκτης Ι έχει 4 στρατηγικές και ο ΙΙ έχει 8. Πως φτιάξαµε τη στρατηγική µορφή του παιγνίου; Χρειάζεται πολύ προσοχή προκειµένου να βρούµε σε κάθε κουτάκι το αντίστοιχο αποτέλεσµα. Γιατί; ιότι πρέπει πάντοτε να θυµόµαστε σε ποιο κόµβο αντιστοιχεί η κάθε επιλογή. Το πρώτο στοιχείο της στρατηγικής του παίκτη Ι αντιστοιχεί στον κόµβο (α) και το δεύτερο στον κόµβο (b). Αν λοιπόν ο παίκτης Ι αποφασίσει να πάει προς τα πάνω ( l ), τότε το παιχνίδι πάει προς τα πάνω και συνεπώς το σχετικό στοιχείο της στρατηγικής του θα είναι στον κόµβο (c). Για τον παίκτη ΙΙ είπαµε ότι τα στοιχεία από τα οποία αποτελείται η στρατηγική του είναι 3 Π.χ. L L R (c) (d) (e) Συνεπώς πρέπει να κοιτάζουµε το πρώτο στοιχείο. Έτσι στις δύο πρώτες σειρές του πίνακα, το µόνο που είναι σχετικό είναι το πρώτο στοιχείο της στρατηγικής του παίκτη ΙΙ. Άρα ξεχνάµε τα υπόλοιπα και κοιτάζουµε µόνο τα πρώτο στοιχείο. Άρα l και L µας δίνει G και l R µας δίνει L (α) (c) (α) (c) 21
Στην τρίτη γραµµή, ο παίκτης Ι πάει προς τα κάτω. Άρα ποια είναι τα στοιχεία από την στρατηγική του παίκτη ΙΙ που πρέπει να κοιτάξουµε; Το δεύτερο και τρίτο. Συνεπώς το πρώτο στοιχείο είναι άσχετο στην περίπτωση αυτή. As σταθούµε για λίγο εδώ κι ας παρατηρήσουµε τη µήτρα. Υπάρχει κάποια στρατηγική που έχει κάποιο ιδιαίτερο χαρακτηριστικό; Όπως θα δούµε αργότερα η στρατηγική rr είναι µια κυρίαρχη στρατηγική (dominant). Γιατί; ιότι αυτή η στρατηγική είναι καλύτερη από όλες τις υπόλοιπες. Και µε αυτή την στρατηγική ο παίκτης Ι µπορεί να κερδίσει το παιγνίδι χωρίς πρόβληµα. Αυτό ισχύει για τον παίκτη Ι, γιατί για τον παίκτη ΙΙ η µόνη στρατηγική η οποία είναι ασθενώς κυρίαρχη είναι η RLL διότι κερδίζει τρεις φορές και χάνει µια (ενώ στις υπόλοιπες χάνει). Έτσι και αλλιώς όµως, ο Ι θα επιλέξει πρώτος το rr, οπότε το παιγνίδι θα τελειώσει. Από τα παραπάνω βλέπουµε ότι οι αµιγείς στρατηγικές είναι ένα πλήρες σχέδιο και ότι πολλές από τις στρατηγικές που προκύπτουν δεν είναι λογικό να υπάρχουν. Έτσι για το παράδειγ- µά µας ανεξάρτητα από το αν ο Ι αποφασίσει να πάει προς τα πάνω ( l ) θα πρέπει να πάρει απόφαση για την περίπτωση που πάει προς τα κάτω (r), (ασχέτως αν ποτέ δεν θα πάει). Αυτός είναι ο ορισµός της αµιγούς στρατηγικής. Είδαµε λοιπόν, πως µπορούµε να µετατρέψουµε ένα παιγνίδι από αναλυτική µορφή σε στρατηγική µορφή. Στη συνέχεια της ανάλυσής µας θα προετοιµάσουµε το έδαφος, για να εισάγουµε διάφορα είδη ισορροπίας όπως: (α) ισορροπία κυρίαρχων στρατηγικών, (b) ισορροπία κατά Nash, ( c) Τέλεια ισορροπία παιγνίου Παίγνιο χωρίς τέλεια πληροφόρηση. Ας υποθέσουµε ότι έχουµε µια εταιρεία Α, που πρώτα αποφασίζει αν θα εισαγάγει ή όχι ένα νέο προϊόν και µετά παίρνει απόφαση για το αν θα κάνει ή όχι διαφήµιση. Την απόφαση της δεν την παρατηρεί η εταιρεία Β. Παρατηρεί µόνο αν έχει εισαχθεί ή όχι ένα καινούριο προϊόν στην αγορά. Επιπλέον, η εταιρεία Β, αποφασίζει µεταξύ διαφήµισης ή όχι. Όπως παρατηρούµε από το διάγραµµα 16 για την εταιρεία Α υπάρχουν τρία σύνολα πληροφόρησης (κόµβοι) στα οποία πρέπει να πάρει απόφαση εφόσον κληθεί, ενώ για την εταιρεία Β υπάρχουν 2 σύνολα πληροφόρησης. 22
Ας δούµε τώρα µε βάση το διάγραµµα 16 πόσα στοιχεία έχει µια στρατηγική της επιχείρησης Α. Έχει 3 στοιχεία: π.χ. Νέο (α) (b) (c) Μια τυπική στρατηγική της επιχείρησης Β είναι να κάνει διαφήµιση τόσο στην περίπτωση (d) όσο και στην (ε). ηλαδή: D D (d) (e) Συνολικά ο παίκτης Α έχει 8 στρατηγικές (2 3 ) ενώ ο παίκτης Β έχει 4 (2 2 ). 23
Η στρατηγική µορφή του παιγνίου είναι η ακόλουθη: e, d α b c Ο Ο Ο Ο Ν 2, 1 2, 1 14, 0 14, 0 Ν Ο 2, 1 2, 1 14, 0 14, 0 Ν Ο 0, 7 0, 7 10, 5 10, 5 Ν Ο Ο 0, 7 0, 7 10, 5 10, 5 Ο ½, ½ 2, 0 ½, ½ 2, 0 Ο Ο 0, 2 1, 1 0, 2 1, 1 Ο Ο ½, ½ 2, 0 ½, ½ 2, 0 Ο Ο Ο 0, 2 1, 1 0, 2 1, 1 Αν ο Α επιλέξει Νέο, τότε κινούµαστε προς τα πάνω, στο δεύτερο στοιχείο της στρατηγικής του παίκτη Α (b), και συνεπώς το µόνο σχετικό στοιχείο της στρατηγικής του παίκτη Β είναι το πρώτο στοιχείο (d). Ας δούµε τώρα ένα ακόµη παράδειγµα, στο οποίο διαφοροποιώντας τις υποθέσεις πληροφόρησης αλλάζει τελείως η στρατηγική µορφή. Έστω λοιπόν ότι έχουµε δύο εταιρείες (1 και 2) που αποφασίζουν µεταξύ µεγάλης (Μ) και µικρής δισκέτας (µ). Πρώτα αποφασίζει η εταιρεία 1 και µετά ακολουθεί η εταιρεία 2 η οποία παρατηρεί και µετά παίρνει τη δική της απόφαση. Το παίγνιο αυτό σε στρατηγική µορφή είναι µια µήτρα 2 4. Το µεγάλο (Μ) µας πάει προς τα πάνω, άρα το µόνο που παίζει ρόλο είναι το πρώτο στοιχείο της στρατηγικής του παίκτη 2. Το µικρό (µ) µας πάει προς τα κάτω, άρα το µόνο που παίζει ρόλο είναι το δεύτερο στοιχείο της στρατηγικής του παίκτη 2. 24
M M Μ µ µ Μ µ µ Μ 1, 1 1, 1-1, -1-1, -1 Μ -1, -1 2, 2-1, -1 2, 2 Αν όµως οι δύο εταιρείες αποφασίζουν ταυτόχρονα, δηλ. όταν η 2 παίρνει την απόφαση της δεν ξέρει την απόφαση της 1, τότε η στρατηγική µορφή του παιγνίου δεν είναι 2 4 αλλά 2 2. ιαγραµµατικά: 25
ισορροπίες Παρατηρούµε λοιπόν ότι τώρα βρισκόµαστε µπροστά σ ένα παίγνιο µε τελείως διαφορετικές Μ Μ Μ 1, 1-1, -1 Μ -1, -1 2, 2 Από το παράδειγµα αυτό φαίνεται ξεκάθαρο ότι µια διαφοροποίηση στο είδος της πληροφόρησης που έχουν οι παίκτες, µας δίνει τελείως διαφορετικό παίγνιο, το οποίο µε τη σειρά του µας οδηγεί σε τελείως διαφορετικές λύσεις. Όπως θα δούµε αργότερα το πρώτο παίγνιο έχει 2 ισορροπίες κατά Nash ενώ το άλλο έχει περισσότερες. 26