http://users.uom.gr/~acg 1 Στοιχεία από τη Θεωρία Παιγνίων Ιστορικά στοιχεία: Antoine Augustin Cournot (1801-1877), Cournot duopoly, 1838 John von Neumann (1903-1957), θεμελίωσε τη θεωρία παιγνίων ως κλάδο των μαθηματικών, (παίγνια μηδενικού αθροίσματος, 1928) John von Neumann και Oskar Morgenstern (1902-1977), «Theory of Games and Economic Behaviour», 1944, παίγνια μηδενικού αθροίσματος. νάλυση αποφάσεων σε καταστάσεις στρατηγικής αλληλεπίδρασης (strategic interdependence) John Forbes Jr., (1928-2015) ισορροπία σε παίγνια μη μηδενικού αθροίσματος (non-cooperative games equilibrium), Nobel 1994 John Harsanyi (1920-2000), games of incomplete information and Reinhard Selten (1930-2016), dynamic strategic interaction, Nobel 1994 Robert Aumann(1930-) and Thomas Schelling (1921-2016), conflict and cooperation, Nobel 2005 Με τι ασχολείται η Θεωρία Παιγνίων Μελέτη των στοιχείων που χαρακτηρίζουν καταστάσεις ανταγωνιστικής αλληλεξάρτησης (στρατηγικής αλληλεπίδρασης) με έμφαση στη διαδικασία λήψης αποφάσεων περισσοτέρων του ενός ληπτών απόφασης (αντιπάλων=παικτών) Παίγνια μηδενικού αθροίσματος Παίγνια μη μηδενικού αθροίσματος Παίγνια σταθερού αθροίσματος Παίγνια μη σταθερού αθροίσματος Παίγνια δύο ή n παικτών με n > 2 Παίγνια με ή χωρίς συνεργασία (cooperative non-cooperative) Παίγνια μη ορθολογιστών παικτών (π.χ. φύση) ασικές Έννοιες Παίγνιο (game): Κατάσταση κατά την οποία δύο ή περισσότεροι ορθολογιστές παίκτες (άτομα ή συλλογικές οντότητες) με αντικρουόμενους (ενδεχομένως) στόχους και συμφέροντα, επιλέγουν τρόπους ενέργειας (στρατηγικές), δημιουργώντας συνθήκες ανταγωνιστικής αλληλεξάρτησης, με στόχο του κάθε παίκτη την ικανοποίηση του δικού του συμφέροντος. Το αποτέλεσμα είναι συνδυασμός των επιλογών όλων των παικτών. Παραδείγματα; Στοιχεία παιγνίου: Παίκτες, κανόνες που διέπουν το παίγνιο, πληροφορίες που υπάρχουν ή δεν υπάρχουν κατά τη διάρκεια του παιγνίου, αξιολόγηση των διαφόρων αποτελεσμάτων από τους παίκτες, μεταβλητές ελέγχου Παίκτης (player): αυτόνομη μονάδα λήψης απόφασης. Άτομο, ομάδα, επιχείρηση, κράτος, σωματείο κ.λπ. Προσπαθεί να βελτιστοποιήσει τη δική του ευημερία εγωιστικά έναντι των αντιπάλων του βασιζόμενος στους κανόνες, στους πόρους και στις πληροφορίες που έχει στη διάθεσή του (ορθολογιστής παίκτης) ασικές Έννοιες (συνέχεια) Στρατηγική (strategy): Είναι το σύνολο των κανόνων που ορίζουν τις εφικτές επιλογές τις οποίες δύναται να ακολουθεί σε κάθε κίνησή του ο παίκτης μέχρι το τέλος του παιγνίου. ναζητούνται στρατηγικές που μεγιστοποιούν ή ελαχιστοποιούν την αντικειμενική συνάρτηση κάθε παίκτη. μιγής Στρατηγική (pure strategy): Κάθε παίκτης επιλέγει μία μόνο από τις δυνατές στρατηγικές του με πιθανότητα ίση με τη μονάδα. Μικτή Στρατηγική (mixed strategy): Περιλαμβάνει συνδυασμό στρατηγικών οι οποίες επιλέγονται με κάποια πιθανότητα. Πίνακας αποτελεσμάτων (payoff matrix): Υποδεικνύει τα αποτελέσματα του παιγνίου για κάθε συνδυασμό στρατηγικών. http://users.uom.gr/~acg 2 http://users.uom.gr/~acg 3 http://users.uom.gr/~acg 4 Γενική μορφή πίνακα πληρωμών παιγνίου δύο παικτών Παίκτης Παίκτης 1 2 n 1 α11,b11 α12,b12 α1n,b1n 2 α21,b21 α22,b22 α2n,b2n m αm1,bm1 αm2,bm2 αmn,bmn Γενικός πίνακας πληρωμών για ένα παίγνιο δύο παικτών όταν ο κερδίζει αij, ο κερδίζει bij Το κέρδος και η ζημία είναι σχετικές έννοιες (όπως γνωρίζετε) Παίγνιο δύο παικτών μηδενικού αθροίσματος Δύο μόνο παίκτες αντίπαλοι παίκτης (παίκτης των σειρών) και παίκτης (παίκτης των στηλών) Το παιχνίδι παριστάνεται από έναν πίνακα πληρωμών, που συνήθως αναφέρεται στα κέρδη για τον παίκτη Ο παίκτης διαθέτει m στρατηγικές Ο παίκτης διαθέτει n στρατηγικές ν ο παίκτης επιλέξει τη στρατηγική i και ο παίκτης τη στρατηγική Bj τότε: ο παίκτης κερδίζει αij και ο παίκτης χάνει αij. Ο πίνακας μπορεί να έχει και αρνητικά στοιχεία Γενική μορφή πίνακα παιγνίου μηδενικού αθροίσματος Παίκτης Παίκτης 1 2 n 1 α11,-α11 α12,-α12 α1n,-α1n 2 α21,-α21 α22,-α22 α2n,-α2n m αm1,-αm1 αm2,-αm2 αmn,-αmn όταν ο κερδίζει αij, ο «κερδίζει» -αij. πλή μορφή πίνακα παιγνίου μηδενικού αθροίσματος Παίκτης Παίκτης 1 2 n 1 α11 α12 α1n 2 α21 α22 α2n m αm1 αm2 αmn για τον παίκτη όταν ο κερδίζει αij, ο «κερδίζει» -αij. http://users.uom.gr/~acg 5 http://users.uom.gr/~acg 6 http://users.uom.gr/~acg 7 http://users.uom.gr/~acg 8 Άλλα στοιχεία Η στρατηγική μπορεί να αναφέρεται σε μία ακολουθία ενεργειών ή σε μία μεμονωμένη ενέργεια Οι παίκτες είναι ορθολογιστές επομένως επιλέγουν τις στρατηγικές τους με μόνο στόχο τη δική τους ευημερία και συμφέροντα βάσει των στοιχείων του πίνακα και δεν αντιδρούν συναισθηματικά Τα στοιχεία του πίνακα αντιπροσωπεύουν κέρδος υπό την ευρεία έννοια χρησιμότητα, ωφέλεια (=utility) για τον κάθε παίκτη από κάθε συνδυασμό δύο στρατηγικών Πλήρης πληροφόρηση = ρχή κοινής γνώσης (common knowledge principle) Οι ορθολογιστές παίκτες γνωρίζουν τη δομή του πίνακα πληρωμών, γνωρίζουν ότι οι ορθολογιστές αντίπαλοί τους γνωρίζουν τη δομή αυτή, γνωρίζουν ότι οι αντίπαλοί τους γνωρίζουν ότι γνωρίζουν τη δομή αυτή, κ.ο.κ. Καθημερινές καταστάσεις και κλασικά προβλήματα Εφαρμογές στην οικονομία και διοίκηση επιχειρήσεων, στη βιολογία, πληροφορική και τεχνολογίες επικοινωνιών, πολιτική και κοινωνιολογία (φυσικά), γεωστρατηγική, εξοπλισμοί, τεχνολογία, κανόνες οδικής κυκλοφορίας, χαμηλά τιμολόγια κλήσεων ή ηλεκτρικού ρεύματος, αγορά μεταχειρισμένων οχημάτων, αντιγραφή στις εξετάσεις, διαδίκτυο και γενικά σε κάθε κοινωνική και επαγγελματική κατάσταση. Το δίλημμα του κρατούμενου (Prisoner s Dilemma) Η κούρσα των εξοπλισμών (arm race) To πρόβλημα της διαφήμισης To παιγνίδι της δειλίας (chicken game) Η μάχη των δύο φύλων (Bach or Stravinsky;) Περιεχόμενο Ενότητας Διδακτικοί Στόχοι Κλασικά παίγνια δύο παικτών μη μηδενικού αθροίσματος Διαγραφή κυριαρχούμενων (υποδεέστερων) στρατηγικών Ισορροπία σε παίγνια μη μηδενικού αθροίσματος (αμιγείς στρατηγικές) Παίγνια δύο παικτών μηδενικού αθροίσματος Παίγνια σταθερού αθροίσματος Ισορροπία σε παίγνια μηδενικού ή σταθερού αθροίσματος (αμιγείς στρατηγικές) Το κριτήριο minimax για την εύρεση ισορροπίας στα παίγνια μηδενικού αθροίσματος Μεικτές στρατηγικές σε παίγνια μη μηδενικού αθροίσματος Ισορροπία με μεικτές στρατηγικές σε παίγνια μη μηδενικού αθροίσματος Μεικτές στρατηγικές σε παίγνια μηδενικού (ή σταθερού) αθροίσματος Γραφική μέθοδος διαγραφής υποδεέστερων στρατηγικών Επίλυση παιγνίων μηδενικού ή σταθερού αθροίσματος με γραμμικό προγραμματισμό Πριν προχωρήσουμε να θυμάστε: Η θεωρία παιγνίων δεν μας υποδεικνύει κατ ανάγκη τη καλύτερη δυνατή λύση ΛΛ την πιο «λογική». ό,τι κι αν σημαίνει αυτό! Δηλαδή την υπερέχουσα στρατηγική αυτή που οδηγεί σε ελαχιστοποίηση της (μέγιστης) ζημίας ανεξάρτητα τι θα κάνει ο αντίπαλος ό,τι κι αν σημαίνει και αυτό κόμη κι αν φανερά, υπάρχουν στρατηγικές που μπορούν να οδηγήσουν σε καλύτερα αποτελέσματα και για τους δύο αντιπάλους ταυτόχρονα. Τι «φταίει»; http://users.uom.gr/~acg 9 http://users.uom.gr/~acg 10 http://users.uom.gr/~acg 11 http://users.uom.gr/~acg 12 Παράδειγμα 1 - Prisoner s Dilemma Παράδειγμα 1 - Prisoner s Dilemma (συνέχεια) Η αστυνομία έχει συλλάβει επ αυτοφώρω δύο τύπους που είχαν διαρρήξει ένα κατάστημα, αλλά αυτοί πρόλαβαν να πετάξουν τα κλοπιμαία. Έτσι, δεν υπάρχουν επαρκείς αποδείξεις για να καταδικαστούν για κλοπή (μόνο για διάρρηξη). ΕΚΤΟΣ αν ομολογήσει τουλάχιστον ένας. Τους βάζουν σε ξεχωριστά δωμάτια ανάκρισης και ο αστυνόμος επισκέπτεται τον καθένα ξεχωριστά και τους λέει τα εξής: «Προς το παρόν, το ξέρεις ότι κατηγορείσαι μόνο για διάρρηξη, δηλαδή πάς για ένα μήνα φυλακή εσύ και ο συνάδελφός σου. Γνωρίζω ότι εσείς διαπράξατε την κλοπή, αλλά δεν μπορώ να το αποδείξω, εκτός αν ομολογήσεις. ν είσαι συνεργάσιμος και ομολογήσεις ότι εσείς κάνατε την κλοπή, τότε εσένα θα σε απαλλάξω από κάθε κατηγορία και φεύγεις τώρα καθαρός, ενώ ο συνάδελφος σου θα κατηγορηθεί για διάρρηξη και κλοπή και θα «φάει» 12 μήνες. Έχε υπόψη, ότι αν ομολογήσετε και οι δυο σας, αυτό είναι καλό αλλά φανερά η ομολογία σας θα έχει μικρότερη αξία και θα «φάτε» και οι δύο από οκτώ μήνες. Σε ενημερώνω, ότι έχω ήδη κάνει την ίδια προσφορά και στο συνάδελφό σου και περιμένω την απάντησή του.! και επίσης, δεν θα περιμένω για πολύ την απάντησή σου! Prisoner s Dilemma (1) Με άλλα λόγια: o ν παραμείνουν και οι δυο σιωπηλοί τιμωρούνται με ένα μήνα φυλάκιση o ν ο ένας προδώσει το συνάδελφό του απαλλάσσεται (εφόσον ο άλλος μείνει πιστός) o ν ομολογήσουν και οι δύο τότε καταδικάζονται σε οκτώ μήνες φυλακή ο καθένας o Υποθέτουμε ότι οι παίκτες ενδιαφέρονται ορθολογιστικά να μειώσει ο καθένας τους το χρόνο της ποινής του όσο γίνεται περισσότερο o Έχουμε ένα παίγνιο μη-μηδενικού αθροίσματος στο οποίο οι δύο παίκτες είτε «παραμένουν πιστοί» ο ένας στο άλλο είτε «καρφώνει» ο ένας τον άλλο Prisoner s Dilemma (2) 1 (σιωπή) 2 (ομολογία) 1 (σιωπή) -1, -1-12, 0 2 (ομολογία) 0, -12-8, -8 http://users.uom.gr/~acg 13 http://users.uom.gr/~acg 14 http://users.uom.gr/~acg 15 http://users.uom.gr/~acg 16
http://users.uom.gr/~acg 17 Prisoner s Dilemma (3) Prisoner s Dilemma (4) Prisoner s Dilemma (5) Prisoner s Dilemma (6) Το παίγνιο από την πλευρά του παίκτη ν π.χ. ήξερε ότι ο παίκτης θα μείνει σιωπηλός: Το παίγνιο από την πλευρά του παίκτη ν π.χ. ήξερε ότι ο παίκτης θα ομολογήσει: Το παίγνιο από την πλευρά του παίκτη ν π.χ. ήξερε ότι ο παίκτης θα μείνει σιωπηλός: Το παίγνιο από την πλευρά του παίκτη ν π.χ. ήξερε ότι ο παίκτης θα ομολογήσει: 1 (σιωπή) 2 (ομολογία) 1 (σιωπή) 2 (ομολογία) 1 (σιωπή) 2 (ομολογία) 1 (σιωπή) 2 (ομολογία) 1 (σιωπή) -1, * -12, 0 1 (σιωπή) -1, -1-12, * 1 (σιωπή) *, -1 *, 0 1 (σιωπή) -1, -1-12, 0 2 (ομολογία) 0, * -8, -8 2 (ομολογία) 0, -12-8, * 2 (ομολογία) 0, -12-8, -8 2 (ομολογία) *, -12 *, -8 Ποια θα ήταν η απόφαση του ; Ποια θα ήταν η απόφαση του ; Ποια θα ήταν η απόφαση του ; Ποια θα ήταν η απόφαση του ; Συγκρίνετε συνολικά τη στρατηγική 1 με την 2 Συγκρίνετε συνολικά τη στρατηγική 1 με την 2 http://users.uom.gr/~acg 18 http://users.uom.gr/~acg 19 http://users.uom.gr/~acg 20 Prisoner s Dilemma (7) Pure Strategy Equilibrium Prisoner s Dilemma (8) Prisoner s Dilemma (9) 1 (σιωπή) 2 (ομολογία) 1 (σιωπή) -1, -1-12, 0 2 (ομολογία) 0, -12-8, -8 Τελικά ποια είναι η απόφαση των δύο παικτών ; Είναι βέλτιστη ή λογική ; τομικά ορθολογιστές ή συλλογικά ορθολογιστές; Ισορροπία με αμιγείς στρατηγικές με ωφέλειες (utilities) 1 (σιωπή) 2 (ομολογία) 1 (σιωπή) 3, 3 1, 4 2 (ομολογία) 4, 1 2, 2 Η μονάδα (1) εκφράζει τη χαμηλότερη προτίμηση - ωφέλεια και το 4 την υψηλότερη προτίμηση - ωφέλεια. Προσοχή: πάντα με βάση την υπόθεση ότι ο καθένας επιθυμεί να ελαχιστοποιήσει την ποινή του! Η ομολογία υπερισχύει αυστηρά της σιωπής (strict dominance) (και για τους δύο παίκτες) H σιωπή είναι αυστηρά υποδεέστερη στρατηγική της ομολογίας (strictly dominated) και για τους δύο παίκτες) Ένας ορθολογιστής παίκτης δεν θα επέλεγε ποτέ μία αυστηρά υποδεέστερη στρατηγική (εκτός αν η πίστη στο τι θα κάνει ο φίλος του είναι στιβαρή ή δεν θέλει να καταστρέψει τη φιλία τους ή τρομάζει στη σκέψη τι τον περιμένει όταν ο άλλος θα βγει από τη φυλακή κ.λπ., όμως, όλα αυτά, διαφοροποιούν το βασικό κανόνα του παιγνίου που ήταν ότι επιθυμούν την ελάχιστη δυνατή ποινή για τον εαυτό τους) Μέθοδος διαγραφής υποδεέστερων (κυριαρχούμενων) στρατηγικών http://users.uom.gr/~acg 21 http://users.uom.gr/~acg 22 http://users.uom.gr/~acg 23 http://users.uom.gr/~acg 24 Γενικό συμπέρασμα ύπαρξη σημείου ισορροπίας Τι εξασφαλίζει η ύπαρξη σημείου ισορροπίας ;; Prisoner s Dilemma (10) Εύρεση της ισορροπίας (αμιγείς στρατηγικές) Prisoner s Dilemma (11) Evolutionary version Axelrod s tournament (1980) Δείτε αυτό: Car lights Σε ελεύθερη απόδοση, ένα ζεύγος στρατηγικών για τους δύο παίκτες αποτελεί σημείο ισορροπίας όταν κανένας από τους δύο δεν μπορεί να κερδίσει κάτι περισσότερο μεταβάλλοντας τη στρατηγική του μονομερώς (Pure Strategy Εquilibrium) Συχνά, η εναλλακτική του κοινού συμφέροντος δεν είναι πάντα η επιλογή (θεωρητικά) λογικά ατομικά ορθολογιστών παικτών ενώ επίσης συχνά, φαινομενικά λογικές επιλογές οδηγούν σε ζημιές (όλους μαζί) 1 (σιωπή) 2 (ομολογία) 1 (σιωπή) 3, 3 1, 4 2 (ομολογία) 4, 1 2, 2 Για κάθε συνδυασμό στρατηγικών, ελέγχουμε τη «διάθεση» κάθε παίκτη να μετακινηθεί σε καλύτερη στρατηγική. ν σε κάποιο κελί η «διάθεση» αυτή είναι αρνητική και για τους δυο, τότε έχουμε ισορροπία με αμιγείς στρατηγικές. Ισοδύναμα, βρίσκουμε την καλύτερη πληρωμή κάθε παίκτη σε σχέση με την κάθε στρατηγική του άλλου. ν οι καλύτερες των δύο παικτών συμπίπτουν στο ίδιο κελί τότε εκεί έχουμε ισορροπία με αμιγείς στρατηγικές. Tit for Tat (Συνεργάσου νταπόδωσε) Success in an evolutionary "game" is correlated with the following characteristics: Be nice: cooperate, never be the first to defect. Be provocable: return defection for defection, cooperation for cooperation (retaliate) Don't be envious: be fair with your partner Forgiving Don't be too clever: or, don't try to be tricky Tit for Tar is a clear, nice, provocable, and forgiving strategy. High Low Ηigh 1, 1 3, 0 Low 0, 3 2, 2 Προσοχή! Η πιθανή επανάληψη του παιγνίου αλλάζει τα δεδομένα (τα υπόλοιπα στην παράδοση!!! ) Πηγή: The evolution of cooperation - Wikipedia http://users.uom.gr/~acg 25 http://users.uom.gr/~acg 26 http://users.uom.gr/~acg 27 http://users.uom.gr/~acg 28 Και αυτό: A working couple Work Home Work 3, 3 2, 1 Home 1, 2 4, 4 Και αυτό: A couple in love? Love Silent Love 4, 4 0, 1 Silent 1, 0 2, 2 Παράδειγμα 2 Το πρόβλημα της κούρσας των εξοπλισμών (1) Δύο ανταγωνιζόμενοι συνασπισμοί κρατών ή μεμονωμένα κράτη επιλέγουν ανάμεσα σε δύο στρατηγικές. Είτε την περαιτέρω ανάπτυξη και αγορά οπλικών συστημάτων είτε τη μείωση των εξοπλιστικών τους προγραμμάτων. Το θέμα είναι ότι τα οπλικά συστήματα κοστίζουν ΠΟΛΥ με παράπλευρα προβλήματα στην αναπτυξιακή στρατηγική μιας χώρας. πό την άλλη πλευρά, οι εξοπλισμοί προσδίδουν αίσθημα ασφάλειας απέναντι σε ανταγωνιστικούς ή εχθρικούς συνασπισμούς. Το πρόβλημα της κούρσας των εξοπλισμών (2) (preference values) 1 (μείωση) 2 (ανάπτυξη) 1 (μείωση) 3, 3 1, 4 2 (ανάπτυξη) 4, 1 2, 2 Ποια είναι τελικά η ισορροπία του παραπάνω παιγνίου ; Όμοια προβλήματα: Διεθνές εμπόριο και δασμοί μεταξύ δύο κρατών Διαφήμιση ομοειδούς προϊόντος δύο ανταγωνιστών Μπορείτε να σκεφτείτε όμοιες καταστάσεις σε παίγνια με περισσότερους από 2 παίκτες ; (tragedy of commons) http://users.uom.gr/~acg 29 http://users.uom.gr/~acg 30 http://users.uom.gr/~acg 31 http://users.uom.gr/~acg 32
http://users.uom.gr/~acg 33 Παράδειγμα 3 Ένα γενικότερο παράδειγμα 1 2 1 7, -6 5, 0 2-4, 8 2, 9 Παράδειγμα 4 Ένα λίγο πιο δύσκολο παράδειγμα 1 2 1 5, 5 0, 3 2 3, 0 1, 1 Παράδειγμα 5 - Chicken Game (1) Δύο έφηβοι (και όχι μόνο) ανταγωνίζονται με αυτοκίνητα. ρίσκονται στα άκρα ενός δρόμου και οδηγούν με μεγάλη ταχύτητα ο ένας προς τον άλλο (στην ίδια λωρίδα, σε πορεία σύγκρουσης). υτός που θα δειλιάσει πρώτος (chicken) και θα στρίψει το τιμόνι για να αποφύγει τη σύγκρουση χάνει, αφού ο ο άλλος αποδεικνύεται πιο θαρραλέος (δύο περιπτώσεις). εβαίως, υπάρχουν ακόμη δύο περιπτώσεις: να δειλιάσουν και οι δύο (και να στρίψουν το τιμόνι για να αποφύγουν τη σύγκρουση) ή να παραμείνουν και οι δύο θαρραλέοι ανόητοι μέχρι το τέλος (όπως Chicken Game (2) 1 (συνεχίζει) 2 (αποφεύγει) 1 (συνεχίζει) -10, -10 2, -2 2 (αποφεύγει) -2, 2 0, 0 Μπορείτε να βρείτε τι θα επιλέξουν οι δύο παίκτες; Μπορείτε να βρείτε τι θα πρέπει να επιλέξουν οι δύο παίκτες; Μπορείτε να βρείτε τι θα πρέπει να επιλέξουν οι δύο παίκτες; ενδεχομένως θα τους χαρακτηρίσει ένας κοινός φίλος, ξεπροβοδίζοντας τους στον επικήδειο). Ενδιαφέρουσα σημείωση: Μεικτή στρατηγική : Ενδιαφέρουσα σημείωση: Μεικτή στρατηγική : A: (1/3, 2/3), B: (1/3, 2/3), Value (A) = Value (B) = 5/3 Case: Η κρίση των Σοβιετικών πυραύλων στην Κούβα (1962) A: (1/5, 4/5), B: (1/5, 4/5), Value (A) = Value (B) = -2/5 Τότε γιατί να μην ισορροπήσουν στο συνδυασμό (2, 2) ; http://users.uom.gr/~acg 34 http://users.uom.gr/~acg 35 http://users.uom.gr/~acg 36 Παράδειγμα 6 Battle of the Sexes (Bach or Stravinsky;) (1) Ένας άνδρας και μία γυναίκα συμφωνούν να συναντηθούν σε ραντεβού για να πάνε μαζί σε μία εκδήλωση. Όμως, υπάρχει ένα πρόβλημα. Υπάρχουν δύο υποψήφιες εκδηλώσεις που μπορούν να πάνε: ένα κονσέρτο στο μέγαρο μουσικής ή ο τελικός αγώνας κυπέλου στο ποδόσφαιρο. Σημαντικό στοιχείο είναι ότι επιθυμούν (preference) να είναι μαζί παρά να μείνουν μόνοι τους (κονσέρτο ή αγώνας, αν είσαι μόνος δεν έχει αξία). Υποθέτουμε, ότι δεν υπάρχει επικοινωνία μεταξύ τους και ο καθένας απλά εμφανίζεται στην εκδήλωση που επιλέγει (δεν υπάρχουν ακόμη εύχρηστες τεχνολογίες επικοινωνιών) Battle of the Sexes (Bach or Stravinsky;) (2) Γυναίκα Γ1 (Κονσέρτο) Γ2 (Ποδόσφαιρο) 1 (Κονσέρτο) 1, 2 0, 0 Άνδρας 2 (Ποδόσφαιρο) 0, 0 2, 1 Μπορείτε να βρείτε τι θα επιλέξουν οι δύο παίκτες; Coordination game (παίγνιο συντονισμού. π.χ. τεχνολογικά standards) Ενδιαφέρουσα σημείωση: Μεικτή στρατηγική : A: (1/3, 2/3), Γ: (2/3, 1/3), Value (A) = Value (B) = 2/3 Ποιο είναι το παράδοξο εδώ ; Παίγνια δύο παικτών μηδενικού (ή σταθερού) αθροίσματος Παράδειγμα 7 Δύο πολιτικοί επιλέγουν το κύριο θέμα στο οποίο θα επικεντρώσουν σε τηλεοπτική αναμέτρηση. Ο καθένας έχει τρεις στρατηγικές, όχι κατ ανάγκη ίδιες. Η σχετική αποτελεσματικότητα αύξηση στις ψήφους του πολιτικού ως ποσοστό των συνολικών ψήφων- που θα προκύψει στο τέλος της συζήτησης, εξαρτάται από τους συνδυασμούς των θεμάτων που επιλέγουν και δίνεται στον ακόλουθο πίνακα πληρωμών για τον παίκτη (των σειρών). για τον Πολιτικός 1 2 3 Πολιτικός 1-1 7 3 2 1 1 2 3-5 -3 1 για τον Πολιτικός Πολιτικός 1 2 3 1 1-1 5 2-7 -1 3 3-3 -2-1 Οι παίκτες γνωρίζουν τη δομή του πίνακα, γνωρίζουν ότι οι αντίπαλοί τους το γνωρίζουν κ.ο.κ. Επιλέγουν ταυτοχρόνως στρατηγική χωρίς να επικοινωνούν, χωρίς συνεργασία και χωρίς να έχουν ενημερωθεί εκ των προτέρων για την επιλογή του αντιπάλου τους Ποια στρατηγική πρέπει να επιλέξει κάθε πολιτικός ;; http://users.uom.gr/~acg 37 http://users.uom.gr/~acg 38 http://users.uom.gr/~acg 39 http://users.uom.gr/~acg 40 Διαγραφή υποδεέστερων στρατηγικών Μία στρατηγική είναι υποδεέστερη (κυριαρχούμενη) μίας άλλης (που ονομάζεται υπερέχουσα ή κυρίαρχη) όταν η κυρίαρχη στρατηγική είναι τουλάχιστον τόσο «καλή» όσο και η υποδεέστερη. σθενής και ισχυρή κυριαρχία (weak and strict dominance) Παράδειγμα 7 (συνέχεια-1) B1 B2 B3 B1 B2 A1-1 7 3 A1-1 7 A2 1 1 2 A2 1 1 Παράδειγμα 7 (συνέχεια-2) B1 B2 B1 A1-1 7 A1-1 A2 1 1 A2 1 Παράδειγμα 7 (συνέχεια-3) B1 B1 A1-1 A2 1 A2 1 B1 B2 B3 B1 B2 B3 A1-1 7 3 A1-1 7 3 A2 1 1 2 A2 1 1 2 A3-5 -3 1 Ο ορθολογιστής παίκτης δεν εφαρμόζει ποτέ την στρατηγική 3 (γιατί;;) Ο ορθολογιστής παίκτης γνωρίζοντας ότι ο δεν θα εφαρμόσει ποτέ την στρατηγική 3 (και γνωρίζοντας ότι ο γνωρίζει ότι το γνωρίζει κ.ο.κ.) δεν εφαρμόζει ποτέ τη δική του στρατηγική 3 αφού είναι υποδεέστερη (από ποιά;;) Προσοχή! Κατά τη διαδικασία απαλοιφής των υποδεεστέρων στρατηγικών, είναι δυνατό, μία στρατηγική που αρχικά δεν ήταν υποδεέστερη, να καταστεί στη συνέχεια υποδεέστερη και τελικά να απομακρυνθεί από τον πίνακα πληρωμών. Η σειρά απαλοιφής δεν έχει σημασία αν έχουμε ισχυρή κυριαρχία. Ο παίκτης γνωρίζοντας ότι ο δεν θα εφαρμόσει ποτέ την στρατηγική 3 (και γνωρίζοντας ότι ο γνωρίζει ότι το γνωρίζει κ.ο.κ.) δεν εφαρμόζει ποτέ τη στρατηγική 2 αφού είναι υποδεέστερη της 1 ης στρατηγικής του. Οι στρατηγικές 2 η και 3 η του παίκτη θα μπορούσαν να είχαν διαγραφεί ταυτόχρονα ήδη στο προηγούμενο βήμα Γνωρίζοντας ο παίκτης ότι ο γνωρίζει όλα τα προηγούμενα, τότε δεν θα εφαρμόσει την 1 η στρατηγική του αφού είναι υποδεέστερη της 2 ης στρατηγικής του. Στο παράδειγμα, το σημείο ισορροπίας (saddle point) είναι εκείνο που προκύπτει όταν ο παίκτης εφαρμόζει τη 2 η στρατηγική του και ο την 1 η. Η πιθανή εφαρμογή άλλης στρατηγικής πέρα από το σημείο ισορροπίας, έχει απάντηση από τον αντίπαλο η οποία δυσχεραίνει τη θέση του. http://users.uom.gr/~acg 41 http://users.uom.gr/~acg 42 http://users.uom.gr/~acg 43 http://users.uom.gr/~acg 44 Ισορροπία με το κριτήριο minimax Το σημείο ισορροπίας (οριακό σημείο) ονομάζεται «τιμή του παιγνίου», συμβολίζεται με V (value of the game) και παρατηρούμε ότι είναι το μεγαλύτερο στη στήλη του και το μικρότερο στη σειρά του (saddle point, σαγματικό σημείο). B1 B2 B3 row min A1-1 7 3-1 A2 1 1 2 1* A3-5 -3 1-5 column max 1* 7 3 V=1 Οι δύο άριστες -αμιγείς- στρατηγικές συνθέτουν τη λύση του παιγνίου σύμφωνα με την οποία το καλύτερο που μπορεί να πετύχει ο είναι κερδίσει 1% των ψήφων ενώ το καλύτερο που μπορεί να πετύχει ο είναι να χάσει 1% των ψήφων. Στρατηγική maximin και minimax B1 B2 B3 min A1-1 7 3-1 A2 1 1 2 1* Maximin σημείο A3-5 -3 1-5 max 1* 7 3 V=1 Minimax σημείο Ο αντικειμενικός σκοπός του είναι να μεγιστοποιήσει τα κέρδη του ενώ του να ελαχιστοποιήσει τη ζημιά του. Θα ισορροπήσουν εκεί όπου ο θα μεγιστοποιεί το ελάχιστο κέρδος του και ο θα ελαχιστοποιεί τη μέγιστη ζημιά του. Δηλαδή, ουσιαστικά, θα ισορροπούν εκεί όπου και οι δύο θα ελαχιστοποιούν τη μέγιστη ζημιά που μπορούν να υποστούν. Γενικό Συμπέρασμα Σύμφωνα με το κριτήριο minimax, σε έναν πίνακα πληρωμών για τον παίκτη, ο παίκτης επιλέγει, εκείνη τη στρατηγική που θα του δώσει το μεγαλύτερο από τα ελάχιστα των σειρών (maximin τιμή) και ο παίκτης επιλέγει εκείνη τη στρατηγική που θα του δώσει το ελάχιστο από τα μέγιστα των στηλών (minimax τιμή). Η maximin τιμή ονομάζεται κατώτερη τιμή και η minimax ανώτερη τιμή του παιγνίου. Όταν οι δύο τιμές ταυτίζονται το παίγνιο έχει λύση με αμιγείς στρατηγικές και η λύση είναι σταθερή (stable) δηλαδή υπάρχει ένα μοναδικό σημείο ισορροπίας που δίνει την τιμή του παιγνίου, V Είναι ισοδύναμη διαδικασία της ισορροπίας στα γενικά παίγνια, αλλά εφαρμόζεται μόνο σε παίγνια μηδενικού ή σταθερού αθροίσματος Παράδειγμα 8 B1 B2 B3 min A1-3 -2 6-3 A2 2 0 2 0* Maximin σημείο A3 5-2 -4-4 max 5 0* 6 V=0 Minimax σημείο Σύμφωνα με το κριτήριο minimax, και οι δύο παίκτες θα εφαρμόσουν τη 2 η στρατηγική τους. Το παίγνιο αυτό ονομάζεται δίκαιο (fair game) επειδή V=0. Θα μπορούσε να βρεθεί το σημείο ισορροπίας και οι άριστες αμιγείς στρατηγικές με διαδοχικές απαλοιφές των υποδεέστερων στρατηγικών των δύο παικτών ;;; http://users.uom.gr/~acg 45 http://users.uom.gr/~acg 46 http://users.uom.gr/~acg 47 http://users.uom.gr/~acg 48
http://users.uom.gr/~acg 49 Παράδειγμα 9: Δύο ανταγωνιστικές επιχειρήσεις και μοιράζονται τις πωλήσεις ενός προϊόντος σε μία περιοχή. Ο συνολικός ετήσιος τζίρος των πωλήσεων είναι περίπου σταθερός και ανέρχεται στα 200 εκατομμύρια ευρώ. Κάθε μία επιχείρηση για να αποσπάσει πωλήσεις από την άλλη, εξετάζει τρία εναλλακτικά σενάρια μάρκετινγκ. (1) βελτίωση ποιότητας, (2) βελτίωση συσκευασίας, (3) αύξηση διαφημιστικής δαπάνης. Το κόστος των τριών λύσεων είναι περίπου ίδιο, αλλά υψηλό, οπότε μία μόνο στρατηγική θα εφαρμοστεί από κάθε επιχείρηση. κολουθεί ο πίνακας πληρωμών για την επιχείρηση. Παίγνιο δύο παικτών σταθερού αθροίσματος Το άθροισμα των ανταμοιβών των παικτών είναι μία σταθερά c Τιμή της σταθεράς: θετική οι παίκτες μοιράζονται κάποια ανταμοιβή, αρνητική μοιράζονται κάποιο κόστος. Παίγνιο μηδενικού αθροίσματος ;; παιγνίου c=200 1 2 3 min 1 95 105 110 95 2 120 90 115 90 3 125 120 130 120* max 125 120* 130 V=120 π.χ. αν η επιλέξει την 1 η και η τη 3 η, η θα πραγματοποιήσει πωλήσεις 110 εκ. και η πωλήσεις 90 εκ. Η διαδικασία επίλυσης είναι ίδια με τα παίγνια μηδενικού αθροίσματος. Σύμφωνα με το κριτήριο minimax η άριστη λύση είναι: A: A3, B: B2 και V() = 120. Πόσο είναι το V(B); Θα μπορούσε να βρεθεί το σημείο ισορροπίας και οι άριστες αμιγείς στρατηγικές με διαδοχικές απαλοιφές των υποδεέστερων στρατηγικών των δύο παικτών ;; Πώς διαμορφώνεται ο πίνακας ως γενικό παίγνιο μη μηδενικού αθροίσματος; Μεικτές Κάθε παίκτης ακολουθεί τις στρατηγικές του με βάση κάποια κατανομή (σχέδιο) πιθανοτήτων, (δηλαδή σε κάθε στρατηγική του αντιστοιχίζει μια πιθανότητα να την ακολουθήσει). Σκοπός του είναι, να εντοπίσει εκείνο το σχέδιο πιθανοτήτων που να μην έχει κίνητρο να το αλλάξει με βάση το προσδοκώμενο κέρδος. Η κατανομή των πιθανοτήτων με βάση την οποία επιλέγει τις στρατηγικές του, ονομάζεται μεικτή ή τυχαία στρατηγική (ranzomized mixed strategy) Η μεικτή αυτή στρατηγική ενός παίκτη είναι εκείνη που θα αφήνει τον αντίπαλό του αδιάφορο μεταξύ των αμιγών στρατηγικών που έχει στη διάθεσή του (δηλαδή το κέρδος του παίκτη επιτυγχάνεται ανεξάρτητα από τις επιλογές-μεικτές στρατηγικές του αντιπάλου του). Πιο συγκεκριμένα ; xi : η πιθανότητα ο παίκτης να εφαρμόσει τη στρατηγική i yj: η πιθανότητα ο παίκτης B να εφαρμόσει τη στρατηγική Bj Πρακτικά, κάθε παίκτης προσδιορίζει το «πρόγραμμα» βάσει του οποίου θα παίξει το παιγνίδι δίνοντας τέτοιες τιμές στις αντίστοιχες πιθανότητες με ώστε να ισχύει ο παραπάνω κανόνας. Τα πιθανά «προγράμματα» - πολιτικές συμβολίζονται με τα διανύσματα πιθανοτήτων (x1, x2,, xm) και (,,, yn) και είναι στην ουσία οι μεικτές στρατηγικές. m n x i 1 και y j 1 ;;; i 1 j1 http://users.uom.gr/~acg 50 http://users.uom.gr/~acg 51 http://users.uom.gr/~acg 52 Άλλες πληροφορίες για τις μεικτές στρατηγικές Μία μικτή στρατηγική (x1, x2,, xm) με ένα xi = 1 (και τα υπόλοιπα μηδενικά) υποδεικνύει ότι εφαρμόζεται η αμιγής στρατηγική i (δηλαδή με πιθανότητα μονάδα) Δείτε ξανά στα προηγούμενα παραδείγματα τις μεικτές (υπό την ευρεία έννοια) στρατηγικές που εφάρμοσαν οι παίκτες Ποιο είναι το φυσικό νόημα της μεικτής στρατηγικής (x1, x2, x3) = (1/2, 1/2, 0) για τον και (,, y3) = (1/3, 1/3, 1/3) για τον ;; Θεώρημα για τις μεικτές στρατηγικές: Σε κάθε πεπερασμένο παίγνιο υπάρχει πάντοτε μία ισορροπία με μεικτές στρατηγικές (πέρα και πάνω από τις πιθανές ισορροπίες με αμιγείς στρατηγικές) Μεικτές σε παίγνια μηδενικού ή σταθερού αθροίσματος Παράδειγμα 10 1 2 3 row min 1 0-2 2-2* 2 5 4-3 -3 3 2 3-4 -4 col. max 5 4 2* -22 Εδώ, η εύρεση μεικτής στρατηγικής έχει νόημα όταν δεν υπάρχει σημείο ισορροπίας (ασταθής λύση). Η ανώτερη και η κατώτερη τιμή του παιγνίου δεν είναι ίδιες, οπότε οι παίκτες δεν ισορροπούν σε ένα κοινό σημείο στο οποίο να ελαχιστοποιούν τη μέγιστη ζημιά τους. Δηλαδή, γνωρίζοντας κάθε παίκτης τη δομή του πίνακα, παρατηρεί ότι για κάθε στρατηγική του αντιπάλου του υπάρχει πάντα μία καλύτερη «απάντηση». του παραδείγματος 10 με τον Η/Υ (POM-QM) Η αναμενόμενη τιμή του παιγνίου (V) βρίσκεται ανάμεσα στην κατώτερη και στην ανώτερη τιμή (δηλαδή στο διάστημα (-2, 2) ). υτό, ισχύει ΓΕΝΙΚ (;) Τι είναι πρακτικά η «Μεικτή Στρατηγική» στα παίγνια μηδενικού αθροίσματος; Κάθε παίκτης ακολουθεί τις στρατηγικές του με βάση κάποια κατανομή (σχέδιο) πιθανοτήτων. Σκοπός του είναι, να εντοπίσει εκείνο το σχέδιο πιθανοτήτων που να μην έχει κίνητρο να το αλλάξει με βάση το προσδοκώμενο κέρδος. Ειδικότερα: Ο σκοπός του είναι να μεγιστοποιεί το ελάχιστο προσδοκώμενο κέρδος του (δηλαδή να ελαχιστοποιεί τη μέγιστη προσδοκώμενη ζημιά του). Η κατανομή των πιθανοτήτων με βάση την οποία επιλέγει τις στρατηγικές του, ονομάζεται μεικτή ή τυχαία στρατηγική (ranzomized mixed strategy). Η μεικτή στρατηγική ενός παίκτη είναι εκείνη που αφήνει τον αντίπαλό του αδιάφορο μεταξύ των αμιγών στρατηγικών του (δηλαδή το κέρδος του παίκτη επιτυγχάνεται ανεξάρτητα από τις επιλογές-μεικτές στρατηγικές του αντιπάλου του). http://users.uom.gr/~acg 53 http://users.uom.gr/~acg 54 http://users.uom.gr/~acg 55 http://users.uom.gr/~acg 56 Θεώρημα minimax για τις μικτές στρατηγικές Όταν εφαρμόζονται μεικτές στρατηγικές, τότε υπάρχει πάντα, για κάθε παίκτη, μία άριστη μικτή στρατηγική σύμφωνα με το κριτήριο minimax, που οδηγεί σε σταθερή λύση, ώστε κανένας παίκτης να μην μπορεί να βελτιώσει τη θέση του και να ελαχιστοποιεί τη μέγιστη ζημιά που μπορεί να υποστεί, ανεξάρτητα από τη μικτή στρατηγική του αντιπάλου (!) Έστω: V(A), το προσδοκώμενο κέρδος του και V(B), η προσδοκώμενη ζημιά του Τότε V(A) = V(B) = V, είναι το σημείο ισορροπίας για τις άριστες μικτές στρατηγικές αναμενόμενη τιμή του παιγνίου m n V xiy jaij i1 j1 Περίπτωση 1 η Παίγνιο μηδενικού αθροίσματος διάστασης 2 2 Παράδειγμα 11 1 2 min 1-2 6-2 2 5 1 1* max 5* 6 1V5 Δεν υπάρχει σημείο ισορροπίας με αμιγείς στρατηγικές. Ορίζουμε πιθανότητες εφαρμογής κάθε στρατηγικής από κάθε παίκτη και συνεχίζουμε για τον εντοπισμό των άριστων μικτών στρατηγικών και της προσδοκώμενης τιμής του παιγνίου. Πιθανότητες για κάθε στρατηγική παραδείγματος 11 1 1 x1-2 6 2 x2 5 1 Εντοπισμός άριστης μεικτής στρατηγικής για παίκτη : Υπολογίζουμε τις αναμενόμενες πληρωμές στον παίκτη A: V(A, B1) και V(A, B2). Ισχύει ότι: V(B, B1) = -V(A, B1) και V(B, B2) = -V(A, B2) Εξισώνουμε τις V(A, B1) και V(A, B2) και υπολογίζουμε έτσι τις πιθανότητες x1 και x2 Υπολογίζουμε το V(A) από μία εκ των V(A, B1) ή V(A, B2) 2 Εφαρμογή στο παράδειγμα 11 (1) Εντοπισμός άριστης μικτής στρατηγικής για τον παίκτη Ο ακολουθεί τη στρατηγική 1 με πιθανότητα x1, και τη στρατηγική 2 με πιθανότητα x2. Φυσικά, x1 + x2 = 1. δηλαδή: V(A, B1) = -2x1 + 5x2 = -2x1 + 5(1-x1) = -7x1 + 5 V(A, B2)= 6x1 + 1x2 = 6x1 + 1-x1 = 5x1 + 1 Επειδή πρέπει να ισχύει ότι V(A, B1) = V(A, B2), έχουμε ότι: -7x1 + 5 = 5x1 + 1 δηλαδή 12x1 = 4, οπότε x1=1/3 και x2=2/3 http://users.uom.gr/~acg 57 http://users.uom.gr/~acg 58 http://users.uom.gr/~acg 59 http://users.uom.gr/~acg 60 Εφαρμογή στο παράδειγμα 11 (2) υτό σημαίνει, ότι ο θα πρέπει να ακολουθεί τη στρατηγική 1 με πιθανότητα x1 = 1/3 και την 2 με πιθανότητα x2 = 2/3. Το προσδοκώμενο κέρδος του είναι (με αντικατάσταση στο V(A, B1) ή στο V(A, B2)): V(A) = -2(1/3) + 5(2/3) = 6(1/3) + 1(2/3) =8/3 Το αναμενόμενο αυτό κέρδος είναι ανεξάρτητο της μικτής στρατηγικής που χρησιμοποιεί ο παίκτης. Π.χ.: αν ο ακολουθεί μία τυχαία μικτή στρατηγική έστω: για τη 1: y=1/4 και για τη 2: (1-y)=3/4, τότε: V(A)=(1/4)(-2 1/3 + 5 2/3) + (3/4)(6 1/3 + 1 2/3) = 8/3. Εφαρμογή στο παράδειγμα 11 (3) Γενικότερα, αν ο ακολουθεί οποιαδήποτε τυχαία μεικτή στρατηγική έστω: (, ) με + =1, τότε έχουμε: V(A)=()(-2 1/3 + 5 2/3) + (1-)(6 1/3 + 1 2/3) = ()(8/3) + (1-)(8/3) = ( + 1 )(8/3) = 8/3. υτό συμβαίνει, διότι οι πιθανότητες που βρέθηκαν για τον παίκτη (1/3 και 2/3) ήταν αποτέλεσμα της απαίτησης να ισχύει V(A, B1) = V(A, B2) = V (δηλ. ο αδιάφορος). Κάτι, που πάντα επαληθεύει την ισχύ της ακόλουθης: V(A) = () V(A, B1) + V(A, B2) = ( + ) V = V Εντοπισμός άριστης στρατηγικής για τον παίκτη B Ο ακολουθεί τη στρατηγική 1 με πιθανότητα, και τη στρατηγική B2 με πιθανότητα. ς θέσουμε αμέσως =y και = 1-y. ν ο A ακολουθήσει τη στρατηγική A1, η προσδοκώμενη ζημιά του παίκτη B είναι: V(B, A1) = -2y + 6(1-y) ν ο ακολουθήσει την 2, τότε η αναμενόμενη ζημιά του είναι: V(, 2) = 5y + 1(1-y). Για να ελαχιστοποιεί ο τη μέγιστη ζημιά που μπορεί να υποστεί θα πρέπει: V(, 1) = V(, 2), οπότε είναι: -2y + 6(1-y) = 5y + 1(1-y) δηλαδή 12y = 5 που δίνει y=5/12, (1-y)=7/12. Εντοπισμός άριστης στρατηγικής για τον παίκτη B (συνέχεια) υτό σημαίνει ότι ο θα πρέπει να ακολουθεί τη στρατηγική 1 με πιθανότητα = 5/12 και την B2 με πιθανότητα = 7/12. Προσδοκώμενη ζημιά του (αντικατάσταση στο V(, 1) ή στο V(, 2)): V() = -2 5/12 + 6 7/12 = 5 5/12 + 1 7/12 = 8/3 που είναι ίσο με το V(A). Η αναμενόμενη αυτή ζημιά είναι ανεξάρτητη της μικτής στρατηγικής που χρησιμοποιεί ο παίκτης A. http://users.uom.gr/~acg 61 http://users.uom.gr/~acg 62 http://users.uom.gr/~acg 63 http://users.uom.gr/~acg 64
http://users.uom.gr/~acg 65 Σύνοψη άριστης λύσης παραδείγματος 11 Παίκτης : (x1, x2) = (1/3, 2/3), V(A) = 8/3 Παίκτης B: (, ) = (5/12, 7/12), V(B) = V(A) = V = 8/3 Επομένως, μακροπρόθεσμα, αν το παιγνίδι επαναληφθεί πολλές φορές, καθώς το πλήθος των επαναλήψεων τείνει στο άπειρο, στις 12 επαναλήψεις του παιγνίου ο παίκτης θα ακολουθεί 4 φορές την 1 και 8 φορές την 2, ενώ ο παίκτης θα ακολουθεί 5 φορές την 1 και 7 φορές την 2. Επισήμανση φυσικό νόημα: Η τιμή του παιγνίου V=8/3, δεν σημαίνει πως κάθε φορά που επαναλαμβάνεται το παιγνίδι ο κερδίζει 8/3 και ο χάνει 8/3, αλλά, ότι αν οι δύο παίκτες επαναλάβουν το παίγνιο πολλές φορές με βάση τις πιθανότητες που υπολογίστηκαν, τότε το μέσο κέρδος του είναι 8/3 (η προσδοκώμενη ζημιά του ). Περίπτωση 2 η Παίγνιο μηδενικού αθροίσματος διάστασης 2 n Παράδειγμα 12 1 2 y3 y4 y5 1 x1 1 4-2 -3 5-3 2 x2 4 3 5 2-1 -1* col. Max 4 4 5 2* 5-1V2 3 4 5 row min Θα μπορούσαν να απομακρυνθούν κάποιες υποδεέστερες στρατηγικές ;;; Παράδειγμα 12 (συνέχεια) V(A, B1) = x1 + 4x2 = x1 + 4(1-x1) = -3x1 + 4 V(A, B2) = 4x1 + 3x2 = 4x1 + 3(1-x1) = x1 + 3 V(A, B3) = -2x1 + 5x2 = -2x1 + 5(1-x1) = -7x1 + 5 V(A, B4) = -3x1 + 2x2 = -3x1 + 2(1-x1) = -5x1 + 2 V(A, B5) = 5x1 x2 = 5x1 (1-x1) = 6x1 1 Γραφική Μέθοδος (μείωση της διάστασης του πίνακα) http://users.uom.gr/~acg 66 http://users.uom.gr/~acg 67 http://users.uom.gr/~acg 68 Γραφική επίλυση παραδείγματος 12 (Η/Υ-POM-QM) Παράδειγμα 12 (συνέχεια-1) Μείωση της διάστασης του πίνακα διαγραφή των υποδεέστερων που εντοπίστηκαν στη γραφική αναπαράσταση 4 y4 5 y5 1 x1-3 5 2 x2 2-1 διάστασης 22 Παράδειγμα 12 (συνέχεια-2) Εντοπισμός άριστης μεικτής στρατηγικής για τον παίκτη V(A, B4) = -3x1 + 2x2 και V(A, B5) = 5x1 - x2. Οπότε V(A, B4) = V(A, B5), δηλαδή -3x1 + 2x2 = 5x1 - x2 Άρα, 8x1 = 3x2 και επειδή x1 + x2 = 1 προκύπτει ότι x1=3/11 και x2=8/11. ντικαθιστώντας την άριστη μικτή στρατηγική του σε οποιοδήποτε από τα V(A, B4) και V(A, B5) παίρνουμε την άριστη αναμενόμενη τιμή (μέγιστο προσδοκώμενο κέρδος σύμφωνα με το κριτήριο minimax) για τον παίκτη : V(A) = -3 3/11 + 2 8/11 = 7/11 Παράδειγμα 12 (συνέχεια-3) Εντοπισμός άριστης μικτής στρατηγικής για τον παίκτη V(, 1) = V(, 2) δηλαδή -3y4 + 5y5 = 2y4 1y5 Άρα, 5y4 = 6y5 και επειδή y4 + y5 = 1 προκύπτει ότι y4=6/11 και y5=5/11 ντικαθιστώντας την άριστη μικτή στρατηγική του B σε οποιοδήποτε από τα V(B, A1) και V(B, A2) παίρνουμε την άριστη αναμενόμενη τιμή (ελάχιστη προσδοκώμενη ζημιά σύμφωνα με το κριτήριο minimax) για τον παίκτη B: V() = -3 6/11 + 5 5/11 = 7/11 http://users.uom.gr/~acg 69 http://users.uom.gr/~acg 70 http://users.uom.gr/~acg 71 http://users.uom.gr/~acg 72 Σύνοψη της άριστης λύσης του παραδείγματος 12 O παίκτης εφαρμόζει τη μικτή στρατηγική: x1=3/11, x2=8/11, με maximin κέρδος V(A) = 7/11 O παίκτης εφαρμόζει τη μικτή στρατηγική: ==y3=0, y4=6/11, y5=5/11, με minimax ζημιά V() = 7/11 Περίπτωση 3 η Παίγνιο μηδενικού αθροίσματος διάστασης m 2 Παράδειγμα 13 1 2 min 1 x1-2 4-2 2 x2 5-3 -3 3 x3 4 2 2* 4 x4 2 1 1 Παράδειγμα 13 (συνέχεια) V(B, A1) = -2 + 4 V(B, A2) = 5 3 V(B, A3) = 4 + 2 V(B, A4) = 2 + Γραφική Μέθοδος (μείωση της διάστασης του πίνακα) V(B, A1) V(B, A2) V(B, A3) minimax Η προσδοκώμενη τιμή παιγνίου είναι V = V(A) = V(B) = 7/11. max 5 4* 2V4 Φυσικό νόημα (;;) http://users.uom.gr/~acg 73 http://users.uom.gr/~acg 74 http://users.uom.gr/~acg 75 http://users.uom.gr/~acg 76 Γραφική επίλυση παραδείγματος 13 (Η/Y - POM-QM) Παράδειγμα 13 (συνέχεια-1) Παράδειγμα 13 (συνέχεια-2) Παράδειγμα 13 (συνέχεια-3) Μείωση της διάστασης του πίνακα διατήρηση των στρατηγικών 1 και 3 που καθορίζουν το σημείο minimax. 1 2 1 x1-2 4 3 x3 4 2 διάστασης 2 2 Εντοπισμός άριστης μικτής στρατηγικής για τον παίκτη V(, 1) = V(, 3) δηλαδή: -2 + 4 = 4 + 2 Άρα, 3 = (και + = 1) οπότε: = 1/4 και = 3/4 ντικαθιστώντας την άριστη μικτή στρατηγική του B σε οποιοδήποτε από τα V(B, A1) και V(B, A3) παίρνουμε την άριστη αναμενόμενη τιμή (ελάχιστη προσδοκώμενη ζημιά σύμφωνα με το κριτήριο minimax) για τον παίκτη B: V() = -2 0.25 + 4 0.75 = 2.5 Εντοπισμός άριστης μικτής στρατηγικής για τον παίκτη V(A, B1) = V(A, B2) δηλαδή -2x1 + 4x3 = 4x1 + 2x3 Άρα, 3x1 = x3 και επειδή x1 + x3 = 1 προκύπτει ότι x1 = 1/4 και x3 = 3/4 ντικαθιστώντας την άριστη μικτή στρατηγική του A σε οποιοδήποτε από τα V(A, B1) και V(A, B2) παίρνουμε την άριστη αναμενόμενη τιμή (μέγιστο προσδοκώμενο κέρδος σύμφωνα με το κριτήριο minimax) για τον παίκτη : V() = -2 0.25 + 4 0.75 = 2.5 http://users.uom.gr/~acg 77 http://users.uom.gr/~acg 78 http://users.uom.gr/~acg 79 http://users.uom.gr/~acg 80
http://users.uom.gr/~acg 81 Σύνοψη της άριστης λύσης του παραδείγματος 13 O παίκτης εφαρμόζει τη μικτή στρατηγική: x1 = 1/4, x2 = 0, x3 = 3/4, x4 = 0, με maximin κέρδος V(A) = 2.5 O παίκτης εφαρμόζει τη μικτή στρατηγική: = 1/4 και = 3/4, με minimax ζημιά V() = 2.5 Παράδειγμα 10 (επιστροφή) 1 2 3 min 1 0-2 2-2* 2 5 4-3 -3 3 2 3-4 -4 max 5 4 2* -2V2 Δεν υπάρχει σημείο ισορροπίας (ασταθής λύση). Η άριστη λύση θα μπορούσε να βρεθεί ξεκινώντας με απαλοιφή των υποδεέστερων στρατηγικών (το σκιασμένο Παράδειγμα 10 (συνέχεια) V(, 1) = 0x1 + 5(1-x1) = 5 5x1 V(, 2) = -2x1 + 4(1-x1) = 4 6x1 V(, 3) = 2x1 3(1-x1) = -3 + 5x1 V = V(A) = V(B) = (5-5x1) + (4 6x1) + y3 (-3 + 5x1) Γραφική επίλυση παραδείγματος 10 στον Η/Υ 1 υποδεέστερη maximin τμήμα του πίνακα δείχνει τις εναπομένουσες στρατηγικές) και μετά με την Η προσδοκώμενη τιμή παιγνίου είναι V = V(A) = V(B) = 2.5 Φυσικό νόημα (;;;) εφαρμογή της περίπτωσης 2 2. ν, χάριν παραδείγματος, διαγράψουμε μόνο την 3 τότε θα ήταν 2 3 και η διαδικασία επίλυσης θα ήταν η ακόλουθη. http://users.uom.gr/~acg 82 http://users.uom.gr/~acg 83 http://users.uom.gr/~acg 84 Παράδειγμα 10 (συνέχεια-1) Μείωση της διάστασης του πίνακα διατήρηση των στρατηγικών 2 και 3 που καθορίζουν το σημείο maximin. 2 3 y3 1 x1-2 2 2 1-x1 4-3 διάστασης 2 2 Παράδειγμα 10 (συνέχεια-2) Εντοπισμός άριστης μικτής στρατηγικής για τον παίκτη V(A, B2) = V(A, B3) δηλαδή -4 6x1 = -3 + 5x1 Άρα, x1 = 7/11 και 1-x1 = 4/11 Οπότε: V() = 4-6 (7/11) = 2/11 Εντοπισμός άριστης μικτής στρατηγικής για τον παίκτη V(, 1) = V(, 2) δηλαδή -2 + 2y3 = 42 3y3 Άρα: 6 =5y3 και επειδή + y3 = 1 προκύπτει ότι = 5/11 και y3 =1 - = 6/11 Οπότε: V(B) = -2 (5/11) + 2 (6/11) = 2/11 Σύνοψη της άριστης λύσης του παραδείγματος 10 O παίκτης εφαρμόζει τη μικτή στρατηγική: x1 = 7/11, x2 = 1-x1 = 4/11, με maximin κέρδος V(A) = 2/11 O παίκτης εφαρμόζει τη μικτή στρατηγική: = 0, = 5/11 και y3 = 1- = 6/11, και V() = 2/11 Η προσδοκώμενη τιμή παιγνίου είναι V = V(A) = V(B) = 2/11 Σύνοψη άριστης λύσης παραδείγματος 10 (Η/Υ - POM-QM) Φυσικό νόημα (;;;) http://users.uom.gr/~acg 85 http://users.uom.gr/~acg 86 http://users.uom.gr/~acg 87 http://users.uom.gr/~acg 88 Παράδειγμα 14 (πολλαπλά σημεία ισορροπίας) Οι υπολογισμοί του παραδείγματος 14 (Η/Υ - POM-QM) B1 B2 B3 row min A1 4 3 3 3* A2 3 3 3 3* A3 2 1 6 1 column max 4 3* 6 V=3 B1 B2 B3 B1 B2 B3 A1 4 3 3 A1 4 3 3 A2 3 3 3 1η A2 3 3 3 A3 2 1 6 2η A3 2 1 6 3η 3η 1η http://users.uom.gr/~acg 89 4η 2η http://users.uom.gr/~acg 90 http://users.uom.gr/~acg 91 Επίλυση παιγνίου με γραμμικό προγραμματισμό Παράδειγμα 15 B1 B2 B3 row min y3 A1 x1 0-1 1-1 A2 x2 1 0-1 -1 A3 x3-1 1 0-1 col. max 1 1 1-1V1 Μπορείτε να σκεφτείτε ένα παιγνίδι που ταιριάζει ; http://users.uom.gr/~acg 92 Παράδειγμα 15 (συνέχεια-1) V(, 1) = 0x1 + x2 x3 = x2 x3 V(, 2) = -1x1 + 0x2 + x3 = -x1 + x3 V(, 3) = x1 x2 + 0x3 = x1 x2 V = V(A) = V(B) = (x2 x3) + (-x1 + x3) + y3 (x1 x2) Παράδειγμα 15 (συνέχεια-2) Ο παίκτης επιλέγει μικτή στρατηγική τέτοια ώστε (σύμφωνα με το κριτήριο minimax) να μεγιστοποιεί το ελάχιστο κέρδος που μπορεί να αποκομίσει. Έστω ότι αυτό το κέρδος συμβολίζεται με x4. Τότε, ισχύει ότι: x4 V(, 1), x4 V(, 2) και x4 V(, 3) και επειδή θέλουμε να είναι όσο γίνεται μεγαλύτερο θα πρέπει επίσης: Maximize z = x4 Τέλος, τα x1, x2 και x3 είναι πιθανότητες και ισχύει ότι: x1 + x2 + x3 = 1 όπου x1, x2, x3 0 και x4 R Παράδειγμα 15 (συνέχεια-3) Γενική Μορφή Max z = x4 x4 x2 x3 x4 -x1 + x3 x4 x1 x2 x1 + x2 + x3 = 1 και x1, x2, x3 0 και x4 R (Σχεδόν) Κανονική Μορφή Max z = x4 x2 + x3 + x4 0 x1 x3 + x4 0 -x1 + x2 + x4 0 x1 + x2 + x3 = 1 και x1, x2, x3 0 και x4 R Παράδειγμα 15 (συνέχεια-4) ν εργαστούμε με ανάλογο τρόπο για τον παίκτη το αντίστοιχο μοντέλο γραμμικού προγραμματισμού είναι: Γενική Μορφή Min w = y4 y4 - + y3 y4 y3 y4 - + + + y3 = 1 και,, y3 0 και y4 R (Σχεδόν) Κανονική Μορφή Min w = y4 + y3 + y4 0 + y3 + y4 0 + y4 0 + + y3 = 1 και,, y3 0 και y4 R http://users.uom.gr/~acg 93 http://users.uom.gr/~acg 94 http://users.uom.gr/~acg 95 http://users.uom.gr/~acg 96
http://users.uom.gr/~acg 97 Παράδειγμα 15 (συνέχεια-5) Ποια σχέση συνδέει τα δύο μοντέλα;; Για να λύσουμε το γραμμικό μοντέλο του παίκτη ή του μπορούμε να μετασχηματίσουμε τη μεταβλητή x4, ή τη μεταβλητή y4, κατά το γνωστό μετασχηματισμό των μεταβλητών που δεν περιορίζονται ως προς το πρόσημο. Εναλλακτικά, προσθέτουμε σε κάθε στοιχείο του πίνακα πληρωμών, μία σταθερά ίση με την απόλυτη τιμή του πλέον αρνητικού στοιχείου του πίνακα. Έτσι η τιμή του μετασχηματισμένου παιγνίου, θα είναι μη αρνητική και μάλιστα μεγαλύτερη από την κανονική, κατά την απόλυτη αυτή τιμή. Στο παράδειγμα, προσθέτουμε την -1 = 1. Το νέο x4 που βελτιστοποιείται, θα είναι κατά μία μονάδα μεγαλύτερο από την πραγματική του άριστη τιμή. Παράδειγμα 15 (συνέχεια-6) Ο μετασχηματισμένος πίνακας πληρωμών B1 B2 B3 y3 row min A1 x1 1 0 2 0 A2 x2 2 1 0 0 A3 x3 0 2 1 0 col. max 2 2 2 0V2 Παράδειγμα 15 (συνέχεια-7) Το μετασχηματισμένο γραμμικό μοντέλο Max z = x'4 -x1 2x2 + x'4 0 x2 2x3 + x'4 0-2x1 x3 + x'4 0 x1 + x2 + x3 = 1 και x1, x2, x3 x'4 0 Επίλυση του παραδείγματος 15 (Η/Υ - QSB) http://users.uom.gr/~acg 98 http://users.uom.gr/~acg 99 http://users.uom.gr/~acg 100 Σύνοψη της άριστης λύσης του παραδείγματος 15 O παίκτης εφαρμόζει τη μικτή στρατηγική: x1 = 1/3, x2 = 1/3, και x3 = 1/3, με maximin κέρδος x'4 = 1 για το μετασχηματισμένο μοντέλο, άρα V(A) = 1 1 = 0. πό τις σκιώδεις (δυϊκές) τιμές βρίσκουμε τη λύση για τον παίκτη που εφαρμόζει τη μικτή στρατηγική: = 1/3, = 1/3 και y3 = 1/3, με minimax ζημιά V() = 0 Παράδειγμα 14 (επιστροφή) Επίλυση με γραμμικό προγραμματισμό B1 B2 B3 row min A1 4 3 3 3* A2 3 3 3 3* A3 2 1 6 1 column max 4 3* 6 V=3 Παράδειγμα 14 (συνέχεια-1) Max z = x4 4x1 + 3x2 + 2x3 - x4 > 0 3x1 + 3x2 + x3 - x4 > 0 3x1 + 3x2 + 6x3 - x4 > 0 x1 + x2 + x3 = 1 Επίλυση του παραδείγματος 14 (Η/Υ - QSB) Η προσδοκώμενη τιμή παιγνίου είναι V = V(A) = V(B) = 0 (δίκαιο παιγνίδι) Στο παράδειγμα αυτό, όλα τα στοιχεία του πίνακα πληρωμών είναι μη αρνητικά οπότε δεν χρειάζεται μετασχηματισμός αφού ούτως ή άλλως όλες οι μεταβλητές θα είναι μη αρνητικές. και x1, x2, x3, x4 0 http://users.uom.gr/~acg 101 http://users.uom.gr/~acg 102 http://users.uom.gr/~acg 103 http://users.uom.gr/~acg 104 Eναλλακτική άριστη λύση του παραδείγματος 14 Παράδειγμα 16 Η Ένωση Καλαθοσφαιριστών (παίκτης ) διαπραγματεύεται με την Ένωση Σωματείων (παίκτης ) για να συμφωνήσουν σε μία ελάχιστη ετήσια αμοιβή. Κάθε πλευρά, έχει τρεις στρατηγικές. Κάθε συνδυασμός στρατηγικών, οδηγεί σε ένα ελάχιστο (αναμενόμενο) ετήσιο ποσό. Οι στρατηγικές των καλαθοσφαιριστών είναι: 1) αποχώρηση από τη διαπραγμάτευση, 2) επιθετική στάση, 3) παρελκυστική στάση. Για τα σωματεία είναι: 1) αποφυγή ρήξης, 2) σθεναρή στάση, 3) «δώστε ό,τι θέλουν». Στον επόμενο πίνακα δίνονται τα ποσά που μπορούν να πετύχουν οι καλαθοσφαιριστές B1 B2 B3 min A1 30 10 35 10 A2 25 15 30 15* A3 10 25 15 10 max 30 25* 35 15V25 Παράδειγμα 16 - επίλυση Η στρατηγική 3 της Ένωσης Σωματείων απαλείφεται ως υποδεέστερη της 1. B1 B2 A1 x1 30 10 A2 x2 25 15 A3 x3 10 25 V(B, A1) = 30 + 10 = 30 + 10(1 ) = 10 + 20 V(B, A2) = 25 + 15 = 25 + 15(1 ) = 15 + 10 V(B, A3) = 10 + 25 = 10 + 25(1 ) = 25 15 Γραφική επίλυση παραδείγματος 16 (Η/Υ - POM-QM) V(B, A1) V(B, A3) V(B, A2) minimax http://users.uom.gr/~acg 105 http://users.uom.gr/~acg 106 http://users.uom.gr/~acg 107 http://users.uom.gr/~acg 108 Παράδειγμα 16 (συνέχεια-1) Μείωση της διάστασης του πίνακα διατήρηση των 2 και 3 που καθορίζουν το σημείο minimax. 1 2 2 x2 25 15 3 x3 10 25 διάστασης 2 2 Παράδειγμα 16 (συνέχεια-2) Εντοπισμός άριστης μικτής στρατηγικής για τον παίκτη V(, 2) = V(, 3) δηλαδή 15 + 10= 25 15 Άρα, 25 = 10 =2/5 και = 3/5 ντικαθιστώντας την άριστη μικτή στρατηγική του B σε οποιοδήποτε από τα V(B, A2) και V(B, A3) παίρνουμε την άριστη αναμενόμενη τιμή για τον παίκτη B: V() = 25-15 2/5 = 19 (=15 + 10 2/5) Εντοπισμός άριστης μικτής στρατηγικής για τον παίκτη V(A, B1) = 25x2 + 10x3 και V(A, B2) = 15x2 + 25x3 Οπότε V(A, B4) = V(A, B5), δηλαδή 25x2+10x3 = 15x2+25x3 Άρα, 10x2 = 15x3 και επειδή x2 + x3 = 1 προκύπτει ότι x2 = 3/5 και x3 = 2/5. ντικαθιστώντας την άριστη μικτή στρατηγική του σε οποιοδήποτε από τα V(A, B1) και V(A, B2) παίρνουμε την άριστη αναμενόμενη τιμή για τον παίκτη : V(A) = 25 3/5 + 10 2/5 = 19 Σύνοψη της άριστης λύσης του παραδείγματος 16 O παίκτης εφαρμόζει τη μικτή στρατηγική: x1 = 0, x2 = 3/5 και x3 = 2/5, με maximin κέρδος V(A) = 19 O παίκτης εφαρμόζει τη μικτή στρατηγική: =2/5, = 3/5 και y3 =0, με minimax ζημιά V() = 19 Η προσδοκώμενη τιμή παιγνίου είναι V = V(A) = V(B) = 19 http://users.uom.gr/~acg 109 http://users.uom.gr/~acg 110 http://users.uom.gr/~acg 111 http://users.uom.gr/~acg 112
http://users.uom.gr/~acg 113 Παράδειγμα 17 Δύο επιχειρήσεις A και B παράγουν υβρίδια, σπόρους και άλλα αγροτικά υλικά και δραστηριοποιούνται στην ίδια γεωγραφική περιοχή. Σχεδιάζουν την προώθηση ενός βελτιωμένου υβριδίου καλαμποκιού για την επόμενη περίοδο καλλιέργειας. Προκειμένου να αποσπάσουν μεγαλύτερο μερίδιο της αγοράς δύνανται να εφαρμόσουν διάφορες στρατηγικές οι οποίες είναι: α) διαφήμιση σε τηλεοπτικά μέσα, β) προσωπική ενημέρωση των αγροτών πόρτα-πόρτα, γ) ανταγωνιστική τιμή του προϊόντος και η τέταρτη στρατηγική που αφορά μόνο την εταιρεία, είναι δ) δυνατότητα χρηματοδότησης από την ΕΕ μέρους του κόστους ανάπτυξης του νέου προϊόντος. Η αύξηση του ποσοστού των πωλήσεων για την επιχείρηση έναντι της, για κάθε συνδυασμό στρατηγικών, δίνεται στον επόμενο πίνακα. Παράδειγμα 17 (συνέχεια-1) 1 2 3 min y3 1 x1 3-2 4-2 2 x2-3 6-2 -3 3 x3 1-1 3-1 4 x4 0 4 1 0* max 3* 6 4 0V3 Να επιλυθεί με τη μέθοδο του γραμμικού προγραμματισμού για τον παίκτη Παράδειγμα 17 (συνέχεια-2) Το μοντέλο γραμμικού προγραμματισμού για τον παίκτη Minimize w = y4 y4 3 2 + 4y3 y4 3 + 6 2y3 y4 + 3y3 y4 4 + y3 + + y3 = 1 και,, y3 0 και y4 R Προσθέτουμε σε όλα τα στοιχεία του πίνακα το -3 = 3 Παράδειγμα 17 (συνέχεια-3) Το μετασχηματισμένο μοντέλο γρ. προγραμματισμού Minimize w = y'4-6 7y3 + y'4 0-9 y3 + y'4 0-4 2 6y3 + y'4 0-3 7 4y3 + y'4 0 + + y3 = 1 και,, y3, y'4 0 http://users.uom.gr/~acg 114 http://users.uom.gr/~acg 115 http://users.uom.gr/~acg 116 Επίλυση του παραδείγματος 17 (Η/Υ - QSB) Σύνοψη της άριστης λύσης του παραδείγματος 17 Η τιμή του παιγνίου είναι V = 4.3333 (=13/3) 3 = 4/3 πό τις δυϊκές τιμές (οι αντίθετες τιμές των σκιωδών τιμών) Γραφική παράσταση του παρ. 17 μετά την απαλοιφή της 3 V(B, A2) V(B, A1) V(B, A4) Παράδειγμα 17 (συνέχεια-4) Μείωση της διάστασης του πίνακα διατήρηση των 1 και 4 που καθορίζουν το σημείο minimax. βλέπουμε ότι ο παίκτης εφαρμόζει τη μικτή στρατηγική: x1 = 4/9, x2 = 0, x3 = 0 και x4 = 5/9, με V(A) = 4/3 O παίκτης εφαρμόζει τη μικτή στρατηγική: =2/3, = 1/3 και y3 = 0, με V() = 4/3 1 2 1 x1 3-2 4 x4 0 4 Η προσδοκώμενη τιμή παιγνίου είναι V = V(A) = V(B) = 4/3 minimax διάστασης 2 2 που δίνει τα ίδια αποτελέσματα με τον γραμμικό προγραμματισμό. http://users.uom.gr/~acg 117 http://users.uom.gr/~acg 118 http://users.uom.gr/~acg 119 http://users.uom.gr/~acg 120 Παράδειγμα 18 (παίγνιο σταθερού αθροίσματος) Δύο επιχειρήσεις A και B δραστηριοποιούνται στην αγορά της συνδρομητικής τηλεόρασης. Ο συνολικός τζίρος του κλάδου ξεπερνά τα 500 (εκατομμύρια χρηματικές μονάδες) και οι δύο επιχειρήσεις πρακτικά μοιράζονται το ποσό αυτό (το υπόλοιπο πάει σε μικρότερες επιχειρήσεις του κλάδου). Σχεδιάζοντας τη στρατηγική τους προκειμένου να αποσπάσουν μεγαλύτερο μερίδιο της αγοράς έχουν τις ακόλουθες πολιτικές: (1) αύξηση διαφημιστικής δαπάνης σε τηλεοπτικά μέσα, (2) πακέτα προσφορών και μείωση τιμής, (3) ενσωμάτωση της προσφοράς ψηφιακής πλατφόρμας σε πακέτα τηλεφωνίας και Internet και (4) ανάπτυξη εναλλακτικών ηλεκτρονικών καναλιών προώθησης του προϊόντος (µόνο η επιχείρηση ). Ο ετήσιος τζίρος που αναμένεται να προκύψει για την επιχείρηση, για κάθε συνδυασμό στρατηγικών, δίνεται στον πίνακα που ακολουθεί. Παράδειγμα 18 (συνέχεια) Εταιρείας Εταιρείας 1 2 3 4 1 200 250 300 300 2 250 400 200 100 3 225 300 150 150 Να εφαρμόσετε την κατάλληλη μεθοδολογία προκειμένου να προσδιορίσετε την άριστη στρατηγική για κάθε επιχείρηση καθώς και τον ετήσιο τζίρο της κάθε επιχείρησης. Μακροπρόθεσμα ποια επιχείρηση φαίνεται να ευνοείται από το αποτέλεσμα, αν ο συνολικός ετήσιος τζίρος παραμένει σταθερός ; Παράδειγμα 18 - επίλυση B1 B2 3 B4 min A1 200 250 300 300 200* A2 250 400 200 100 100 A3 225 300 150 150 150 max 250* 400 300 300 200V250 Παράδειγμα 18 (συνέχεια) Η στρατηγικές 2 και B3 ως υποδεέστερες (;;) απαλείφονται V(B, A1) = 200 + 300y4 V(B, A2) = 250 + 100y4 V(B, A3) = 225 + 150y4 B1 B4 y4 A1 x1 200 300 A2 x2 250 100 A3 x3 225 150 ( + y4 =1) http://users.uom.gr/~acg 121 http://users.uom.gr/~acg 122 http://users.uom.gr/~acg 123 http://users.uom.gr/~acg 124 Γραφική επίλυση παραδείγματος 18 (Η/Υ - POM-QM) Παράδειγμα 18 (συνέχεια επίλυσης -1) Μείωση της διάστασης του πίνακα, διαγραφή της «υποδεέστερης» 3, όπως φάνηκε στη γραφική αναπαράσταση 1 4 y4 1 x1 200 300 2 x2 250 100 διάστασης 2 2 Παράδειγμα 18 (συνέχεια επίλυσης -2) Εντοπισμός άριστης μικτής στρατηγικής για τον παίκτη V(, 1) = V(, 2) δηλαδή: 200 + 300y4 = 250 + 100y4 και επειδή + y4 = 1 έχουμε: 50 = 200(1-) Άρα, 250 = 200 =4/5 και y4 = 1/5 ντικαθιστώντας την άριστη μικτή στρατηγική του παίκτη B σε οποιοδήποτε από τα V(B, A1) και V(B, A2) παίρνουμε την άριστη αναμενόμενη τιμή για τον παίκτη B (δηλαδή το τμήμα του συνολικού τζίρου που «αφήνει» στον ): V() = 200(0,8) +300(0,2) = 220 Παράδειγμα 18 (συνέχεια επίλυσης -3) Εντοπισμός άριστης μικτής στρατηγικής για τον παίκτη V(, 1) = V(, 4) δηλαδή: 200x1 + 250x2 = 300x1 + 100x2 και επειδή x1 + x2 = 1 έχουμε ότι: 100x1 = 150(1-x1) Άρα, 250x1 = 150 x1=3/5 και x2 = 2/5 ντικαθιστώντας την άριστη μικτή στρατηγική του παίκτη A σε οποιοδήποτε από τα V(A, B1) και V(A, B4) παίρνουμε την άριστη αναμενόμενη τιμή για τον παίκτη A (δηλαδή το τμήμα του συνολικού τζίρου (500) που καρπώνεται ο ): V() = 200(0,6) +250(0,4) = 220 ΠΡΟΣΟΧΗ! Ο παίκτης καρπώνεται 500-220 = 280 (παίγνιο σταθερού αθροίσματος με πίνακα πληρωμών στον παίκτη ) http://users.uom.gr/~acg 125 http://users.uom.gr/~acg 126 http://users.uom.gr/~acg 127 http://users.uom.gr/~acg 128
http://users.uom.gr/~acg 129 Σύνοψη της άριστης λύσης του παραδείγματος 18 O παίκτης εφαρμόζει τη μικτή στρατηγική: x1 = 3/5 και x2 = 2/5, x3 = 0, με maximin κέρδος V(A) = 220 O παίκτης εφαρμόζει τη μικτή στρατηγική: =4/5, =0, y3 =0, y4 = 1/5, με minimax «ζημιά» V() = 220 Η προσδοκώμενη τιμή παιγνίου είναι V = V(A) = V(B) = 220 ΠΟΥ ΣΗΜΙΝΕΙ, ΟΤΙ ΜΚΡΟΠΡΟΘΕΣΜ ο παίκτης καρπώνεται 220 (εκ. χ.μ.) και ο παίκτης 500-220=280 (εκ. χ.μ.). Συνεπώς, ευνοημένος είναι ο παίκτης. Παράδειγμα 18 (επίλυση με LP) Το μοντέλο γραμμικού προγραμματισμού για τον παίκτη Minimize w = y5 y5 200 + 250 + 300y3 + 300y4 y5 250 + 400 + 200y3 + 100y4 y5 225 + 300 + 150y3 + 150y4 + + y3 + y4 = 1 και,, y3, y4 0 αλλά και y5 0 (;;) Επίλυση του παραδείγματος 18 (Η/Υ - QSB) Παράδειγμα 19 Δύο πωλητές παγωτού και, δραστηριοποιούνται το καλοκαίρι σε μία μακρόστενη παραλία. Τα προϊόντα τους έχουν ίδιες τιμές. Μπορούν να επιλέξουν που θα τοποθετήσουν το κιόσκι τους στην παραλία αυτή. Στο σχήμα της επόμενης σελίδας, η ευθεία παριστάνει την παραλία και τα σημεία, πέντε διαδοχικές ισαπέχουσες θέσεις, όπου μπορούν να τοποθετήσουν ο καθένας το κιόσκι του (ακόμα και στο ίδιο σημείο και οι δύο). Οι πελάτες τους κατανέμονται σχετικά ομοιόμορφα σε όλη τη παραλία (βλ. εικόνα). Επίσης, δεν έχουν διάθεση να περπατούν άσκοπα στον ήλιο. Που πιστεύετε ότι θα τοποθετήσουν τα περίπτερά τους οι πωλητές; Σε ποια γενικότερα συμπεράσματα σας οδηγεί η απάντησή σας; http://users.uom.gr/~acg 130 http://users.uom.gr/~acg 131 http://users.uom.gr/~acg 132 Παράδειγμα 19 (συνέχεια) Λύση Right Player Left Player A B C D E A 0 0,5 1 1,5 2 B 3,5 1 1,5 2 2,5 C 3 2,5 2 2,5 3 D 2,5 2 1,5 3 3,5 E 2 1,5 1 0,5 4 Εντοπίστε το σημείο ισορροπίας Παράδειγμα 20 (Matching Pennies Game) Είναι απόγευμα στο κυλικείο. Ο Γιώργος (τεταρτοετής ΟΔΕ, θαμώνας κυλικείου) συζητά με την Μαρία (πρωτοετής ΟΔΕ, θαμώνας αναγνωστηρίου), την οποία γνώρισε πρόσφατα στις «εγγραφές πρωτοετών». κριβέστερα, μόνο ο Γιώργος μιλάει ασταμάτητα, κυρίως για 1 ή 2 θέματα που αφήνουν παγερά αδιάφορη τη Μαρία (π.χ. το ένα είναι το ποδόσφαιρο). Η Μαρία, έτοιμη να «κόψει φλέβες», διακρίνοντας στην είσοδο μία φίλη της, βρίσκει την ευκαιρία να ξεφύγει από τη φλυαρία του Γιώργου και ψελλίζοντας μία δικαιολογία κατευθύνεται προς εκεί. Ο Γιώργος φωνάζει από την άλλη άκρη: «Εντάξει, θα σε δω αύριο στο πάρτι υποδοχής των πρωτοετών», γνωρίζοντας ότι η Μαρία σκεφτόταν να πάει. υτή, δεν αντιστέκεται στον πειρασμό να απαντήσει καθώς απομακρύνεται: «Όχι, αν μπορώ να το αποφύγω!». ργότερα, στο δωμάτιο της παρέα με τη φίλη της, η Μαρία συνειδητοποιεί ότι βρίσκεται σε δίλημμα. Θέλει να πάει στο πάρτι, όμως υπάρχει κίνδυνος να πέσει πάνω στο Γιώργο. Η εναλλακτική ιδέα είναι να πάει, ως συνήθως, στο αναγνωστήριο για μελέτη αλλά η ζωή δεν είναι μόνο διάβασμα! Λόγω της φράσης που πέταξε φεύγοντας, ο Γιώργος γνωρίζει ότι θέλει να τον αποφύγει. Και είναι πιθανόν αυτός, αντί να πάει στο πάρτι, να της στήσει καρτέρι στο αναγνωστήριο. πό την άλλη πλευρά, αν αυτός πάει στο αναγνωστήριο, τότε εκείνη γιατί να μην πάει στο πάρτι; έβαια αν ο Γιώργος ακολουθήσει τη σκέψη της τότε μπορεί να πάει κι αυτός στο πάρτι για να την πετύχει εκεί! Παράδειγμα 20 (συνέχεια-1) Όταν ο Γιώργος έμεινε μόνος του, σκέφτηκε ότι για μια ακόμη φορά τα έκανε θάλασσα με αυτή την αδικαιολόγητη έμμονη του με τον ΠΟΚ (το ένα από τα δύο θέματα που λέγαμε). Σκέφτεται όμως ότι αν του δοθεί μια δεύτερη ευκαιρία, μπορεί επιτέλους να ωριμάσει και να αλλάξει τη διάθεση της Μαρίας απέναντί του. Έχει βέβαια αντιληφθεί ότι μάλλον θα θελήσει να τον αποφύγει, οπότε εκείνη μπορεί να μην έρθει στο πάρτι. Ο Γιώργος όμως, γνωρίζει ότι η Μαρία συχνάζει εναλλακτικά στο αναγνωστήριο. πό την άλλη πλευρά, συνειδητοποιεί ότι αν και αυτή σκέφτεται τα ίδια κάτι που πράγματι συμβαίνει όπως είδαμε παραπάνω- τότε η Μαρία μπορεί όντως να πάει στο πάρτι ακριβώς για να τον αποφύγει. Ο Γιώργος έχει ζαλιστεί σε επίπεδο ιλίγγου (δεν φημίζεται άλλωστε για την αναλυτική του σκέψη!) Είναι άγνωστο αν η αμηχανία του Γιώργου οφείλεται στο γεγονός ότι δεν γνωρίζει από στοιχειώδη θεωρία παιγνίων ώστε να βοηθηθεί να λύσει το πρόβλημά του (το θέμα αυτό δεν διδάσκεται στο κυλικείο). Είναι εξίσου αμφίβολο αν η θεωρία παιγνίων (και γενικά η Ποσοτική νάλυση) μπορεί να δώσει λύσεις σε προβλήματα όπως το παραπάνω. Παρ όλα αυτά, διαμορφώστε το σενάριο ως παίγνιο και βρείτε την άριστη μεικτή στρατηγική για κάθε παίκτη καθώς και την τιμή του παιγνιδιού. Περιγράψτε το φυσικό νόημα της άριστης λύσης που βρήκατε. Παράδειγμα 20 (συνέχεια-2) Λύση ή γενικά Γιώργος Γιώργος Εντοπίστε το σημείο ισορροπίας Μαρία Π 1-1 Π -1 1 Μαρία Π α -α Π -α α http://users.uom.gr/~acg 133 http://users.uom.gr/~acg 134 http://users.uom.gr/~acg 135 http://users.uom.gr/~acg 136 Παράδειγμα 21 Τα κόμματα των Δημοκρατικών και των Ρεπουμπλικάνων διεξάγουν ταυτοχρόνως συνέδρια για να αναδείξουν τον υποψήφιό τους για τις προεδρικές εκλογές. Υπάρχουν τρεις υποψήφιοι στο ΔΚ για το χρίσμα, ενώ στο ΡΚ οι υποψήφιοι είναι δύο. Στον επόμενο πίνακα υπάρχουν εκτιμήσεις αναλυτών αναφορικά με τα ποσοστά (εκλεκτόρων) που μπορεί να κερδίσει κάθε κόμμα στις επερχόμενες προεδρικές εκλογές, ανάλογα με τον συνδυασμό υποψηφίων που θα πάρουν τελικά το χρίσμα. Είναι λογικό, κάθε κόμμα να θέλει να αναδείξει τον υποψήφιο που φαίνεται να μπορεί να μεγιστοποιήσει τη διαφορά, σε ποσοστό εκλεκτόρων που θα τον υποστηρίξουν, κατά τις προεδρικές εκλογές. Να διαμορφώσετε το πρόβλημα ως παίγνιο, κατασκευάζοντας κατάλληλο πίνακα πληρωμών (που να αναφέρεται στο Δημοκρατικό κόμμα). Να βρείτε την άριστη στρατηγική για κάθε κόμμα και την τιμή του παιγνιδιού. Σχολιάστε την άριστη λύση. Παράδειγμα 21 (συνέχεια-1) Υποψήφιος ΔΚ Υποψήφιος ΡΚ Ποσοστό εκλεκτόρων που αναμένεται να κερδίσουν οι Δημοκρατικοί (%) D1 R1 75 D1 R2 25 D2 R1 30 D2 R2 60 D3 R1 50 D3 R2 20 Να κατασκευαστεί ο πίνακας πληρωμών και να βρεθεί η ισορροπία των δύο κομμάτων. Μην βιαστείς να πας στην επόμενη σελίδα! Σκέψου πρώτα! Παράδειγμα 21 (συνέχεια-2) Λύση Republicans Democrats R1 R2 D1 50-50 D2-40 20 D3 0-60 Ποια είναι η ισορροπία του παιγνίου; Παράδειγμα 21 (συνέχεια-3) Ήταν απαραίτητη η γραφική επίλυση ; http://users.uom.gr/~acg 137 http://users.uom.gr/~acg 138 http://users.uom.gr/~acg 139 http://users.uom.gr/~acg 140 Παράδειγμα 21 (συνέχεια-4) Μετά την ολοκλήρωση της αλγεβρικής επίλυσης, οι άριστες μεικτές στρατηγικές είναι: ΔΚ : (3/8, 5/8, 0) ΡΚ : (7/16, 9/16) Τιμή του παιγνίου : V() = -6,25 (=-50/8) Φυσικό νόημα; Παράδειγμα 22 (Cournot Duopoly) Δύο επιχειρήσεις (Ε1, Ε2) επικρατούν σε μία αγορά και παράγουν ένα όμοιο προϊόν (υποθέτουμε για ευκολία σε ακέραιες μονάδες). Δεν υπάρχει συνεργασία και η (φθίνουσα) συνάρτηση ζήτησης καθορίζει την τιμή του προϊόντος. Οι δύο επιχειρήσεις ανταγωνίζονται σε σχέση με την ποσότητα παραγωγής (που καθορίζει την τιμή του προϊόντος στην αγορά) και φυσικά δρουν ορθολογιστικά. Έστω: P1 = P2 = P, η τιμή του προϊόντος της Ε1 ή της Ε2 Q1 = παραγόμενη ποσότητα της Ε1 και Q2 = ποσότητα της Ε2 C1 = C2 = C = 3 χ.μ., μοναδιαίο κόστος παραγωγής ίδιο Q = Q1 + Q2, συνολική ζήτηση Όπου P = f(q) = 30 4Q για Q 5 και P = 0 για Q > 5 Π1 = f(q)*q1 C*Q1, συνάρτηση κέρδους της Ε1 Π2 = f(q)*q2 C*Q2, συνάρτηση κέρδους της Ε2 Παράδειγμα 22 (συνέχεια 1) Οπότε για Q1, Q2 = 0, 1, 2, 3, 4, 5 έχουμε ότι: Π1 = [30 4 (Q1 + Q2)]*Q1 3*Q1 Π2 = [30 4 (Q1 + Q2)]*Q2 3*Q2 όταν Q = Q1 + Q2 5 και Π1 = 3*Q1 Π2 = 3*Q2 όταν Q = Q1 + Q2 > 5 Να κατασκευαστεί ο πίνακας πληρωμών και να βρεθεί η άριστη στρατηγική για κάθε επιχείρηση (μην τολμήσετε να γυρίσετε σελίδα αν δεν φτιάξετε Παράδειγμα 22 (συνέχεια 2) Μπορείτε να επαληθεύσετε τον πίνακα και να βρείτε την ισορροπία ; πρώτα το δικό σας πίνακα!!) http://users.uom.gr/~acg 141 http://users.uom.gr/~acg 142 http://users.uom.gr/~acg 143 http://users.uom.gr/~acg 144