ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Σημειώσεις μαθημάτων

Σχετικά έγγραφα
2. ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ


ΑΣΚΗΣΗ 1 ΑΣΚΗΣΗ 2 ΑΣΚΗΣΗ 3

δημιουργία: επεξεργασία: Ν.Τσάντας

ΘΕΩΡΙΑ ΤΩΝ ΠΑΙΓΝΙΩΝ I.

Κεφ. 9 Ανάλυση αποφάσεων

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης


Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α

( ) ΘΕΜΑ 1 κανονική κατανομή

Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Πακέτο Επιχειρησιακή Έρευνα #02 ==============================================================

Β. Βασιλειάδης Αν. Καθηγητής. Επιχειρησιακή Ερευνα Διάλεξη 6 η - Θεωρεία Παιγνίων

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 9: Λύσεις παιγνίων δύο παικτών

Κεφάλαιο 29 Θεωρία παιγνίων

Περιεχόμενα. 1. Ανάλυση ευαισθησίας. (1) Ανάλυση ευαισθησίας (2) Δυϊκό πρόβλημα (κανονική μορφή) (3) Δυαδικός προγραμματισμός (4) Ανάλυση αποφάσεων

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ

Πληροφοριακά Συστήματα Διοίκησης. Θεωρία Αποφάσεων

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Θεωρία Παιγνίων και Αποφάσεων

Το Υπόδειγμα της Οριακής Τιμολόγησης

Κοινωνικά Δίκτυα Θεωρία Παιγνίων

Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Μελέτη πάνω στην εφαρμογή της θεωρίας παιγνίων σε θέματα πολεμικών τακτικών και στρατηγικής.

Κυριαρχία και μεικτές στρατηγικές Μεικτές στρατηγικές και κυριαρχία Είδαμε ότι μια στρατηγική του παίκτη i είναι κυριαρχούμενη, αν υπάρχει κάποια άλλη

Τεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 8: Πεπερασμένα επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΛΥΜΕΝΕΣ ΕΦΑΡΜΟΓΕΣ ΣΤΟ 2 ο ΚΕΦΑΛΑΙΟ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Μικροοικονομική Ι. Ενότητα # 6: Θεωρία παιγνίων Διδάσκων: Πάνος Τσακλόγλου Τμήμα: Διεθνών και Ευρωπαϊκών Οικονομικών Σπουδών

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΕΥΤΕΡΟ- ΚΥΡΙΑΡΧΟΥΜΕΝΗ ΣΤΡΑΤΗΓΙΚΗ- PRISONER S DILLEMA ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

- Παράδειγμα 2. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να

Βασικές Αρχές της Θεωρίας Παιγνίων

K15 Ψηφιακή Λογική Σχεδίαση 7-8: Ανάλυση και σύνθεση συνδυαστικών λογικών κυκλωμάτων

Α2 Β2 Γ2 2 Α1 1,0 5,-1-1,-2 9,-2 Β1 2,1-2,0 0,2 0,-1 Γ1 0,3 14,2 2,1 8,1 1 1,2 0,1 3,0-1,0

Διάλεξη 7. Θεωρία παιγνίων VA 28, 29

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

Γραφική Λύση & Πρότυπη Μορφή Μαθηματικού Μοντέλου

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. ΤΕΛΙΚΕΣ ΕΞΕΤΑΣΕΙΣ (Ημερομηνία, ώρα)

Δεύτερο πακέτο ασκήσεων

ΕΦΑΡΜΟΣΜΕΝΗ ΜΙΚΡΟΟΙΚΟΝΟΜΙΚΗ. Υπεύθυνος μαθήματος Καθηγητής Μιχαήλ Ζουμπουλάκης


ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ» Του σπουδαστή ΚΑΡΑΜΙΓΚΟΥ ΘΕΜΙΣΤΟΚΛΗ

ΑΣΚΗΣΗ 1 Βρείτε την ισορροπία των ακόλουθων παιγνίων απαλείφοντας διαδοχικά τις κυριαρχούµενες στρατηγικές.

Περιεχόμενα. Πρόλογος 3

Θεωρία Δυαδικότητας ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ. Η παρουσίαση προετοιμάστηκε από τον Ν.Α. Παναγιώτου. Επιχειρησιακή Έρευνα

Κεφάλαιο 28 Ολιγοπώλιο

Γραμμικός Προγραμματισμός Μέθοδος Simplex

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 7: Τέλεια ισορροπία Nash για υποπαίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΜΟΝΟΠΩΛΙΑΚΟΣ ΑΝΤΑΓΩΝΙΣΜΟΣ, ΟΛΙΓΟΠΩΛΙΑ, ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Κεφάλαιο 4: Επιλογή σημείου παραγωγής

Σηματοδοτικά Παίγνια και Τέλεια Μπεϊζιανή Ισορροπία

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων Ι Σύνολο- Περιεχόμενο Μαθήματος

Κεφάλαιο 4: Επιλογή σημείου παραγωγής

10/3/17. Κεφάλαιο 28 Ολιγοπώλιο. Μικροοικονομική. Ολιγοπώλιο. Ολιγοπώλιο. Ανταγωνισµός ποσότητας. Μια σύγχρονη προσέγγιση

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΕΛΙΚΕΣ ΕΞΕΤΑΣΕΙΣ (11/05/2011, 9:00)

ΛΟΓΙΣΜΟΣ ΜΙΑΣ ΜΕΤΑΒΛΗΤΗΣ, ΕΣΠΙ 1

Τα παρακάτω σύνολα θα τα θεωρήσουμε γενικά γνωστά, αν και θα δούμε πολλές από τις ιδιότητές τους: N Z Q R C

3.7 Παραδείγματα Μεθόδου Simplex

Κεφάλαιο 2ο (α) Αµιγείς Στρατηγικές (β) Μεικτές Στρατηγικές (α) Αµιγείς Στρατηγικές. Επαναλαµβάνουµε:

Ο Π Ε Υ Ελάχιστα γραμμών Ο *maximin (A) Π Ε Υ * minimax (B)

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΕΤΑΡΤΟ ΠΑΙΓΝΙΑ ΜΗ ΕΝΙΚΟΥ ΑΘΡΟΙΣΜΑΤΟΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

Περιεχόμενα. Πρόλογος 3

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 8: Παίγνια πλήρους και ελλιπούς πληροφόρησης

Notes. Notes. Notes. Notes

Στο στάδιο ανάλυσης των αποτελεσµάτων: ανάλυση ευαισθησίας της λύσης, προσδιορισµός της σύγκρουσης των κριτηρίων.

Ισορροπία σε Αγορές Διαφοροποιημένων Προϊόντων

Περιεχόμενα Πρόλογος 5ης αναθεωρημένης έκδοσης ΚΕΦΆΛΆΙΟ 1 Ο ρόλος της επιχειρησιακής έρευνας στη λήψη αποφάσεων ΚΕΦΆΛΆΙΟ 2.

Συνδυαστικά Παίγνια. ιαµόρφωση Παιγνίων. Θέµατα σε Πάιγνια Μηδενικού Αθροίσµατος

Ανάλυση Νεκρού Σημείου Σημειώσεις

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΡΙΤΟ-ΙΣΟΡΡΟΠΙΑ ΚΑΤΑ NASH ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

Επίλυση προβληµάτων. Περιγραφή προβληµάτων Αλγόριθµοι αναζήτησης Αλγόριθµοι τυφλής αναζήτησης Αλγόριθµοι ευρετικής αναζήτησης

Αλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο

Α) Κριτήριο Προσδοκώμενης Χρηματικής Αξίας Expected Monetary Value (EMV)

3. Παίγνια Αλληλουχίας

Γραμμικός Προγραμματισμός

Μ Α Θ Η Μ Α Τ Α Γ Λ Υ Κ Ε Ι Ο Υ

ΚΕΦΑΛΑΙΟ ΕΚΤΟ ΜΟΡΦΕΣ ΑΓΟΡΑΣ. 1. Τι πρέπει να κατανοήσει ο μαθητής

Διαχείριση Εφοδιαστικής Αλυσίδας Μέρος 5 Αξιολόγηση Εναλλακτικών Σεναρίων ΔΡ. ΙΩΑΝΝΗΣ ΡΟΜΠΟΓΙΑΝΝΑΚΗΣ

Transcript:

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Σημειώσεις μαθημάτων Περιεχόμενα ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ... 2 Σκοπός... 2 Μαθησιακοί στόχοι... 2 1. Παίγνια και λήψη αποφάσεων... 2 2. Μαθηματική διατύπωση παιγνίων... 6 3. Παίγνια μηδενικού αθροίσματος με αμιγείς στρατηγικές... 8 3 Παίγνια μηδενικού αθροίσματος με μεικτές στρατηγικές... 17 3.1 Αλγεβρικός προσδιορισμός μεικτών στρατηγικών σε παίγνια 2x2... 19 3.2 Προσδιορισμός μεικτών στρατηγικών σε παίγνια 2xm ή mx2... 23 3.3 Προσδιορισμός μεικτών στρατηγικών με γραμμικό προγραμματισμό... 26 4 Παίγνια μη σταθερού αθροίσματος... 28 5 Παίγνια με διαδοχικές κινήσεις... 36 1

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Σκοπός Σκοπός του μαθήματος στην ανάλυση τεχνικών για τη λήψη στρατηγικών αποφάσεων σε ανταγωνιστικό περιβάλλον. Σε αντίθεση με τη θεωρία αποφάσεων, όπου το κύριο ζήτημα για τον λήπτη αποφάσεων ήταν να αντιμετωπίσει και να διαχειριστεί την αβεβαιότητα με τη μορφή τυχαίων γεγονότων που επηρεάζουν τα αποτελέσματα των αποφάσεών του, η θεωρία παιγνίων αναδεικνύει την αλληλεπίδραση των αποφάσεων διαφορετικών μερών στο πλαίσιο ανταγωνισμού ή συνεργασίας. Οι τεχνικές και μεθοδολογίες που παρουσιάζονται έχουν στόχο να εισαγάγουν τον φοιτητή στις βασικές έννοιες της θεωρίας παιγνίων και να αναδείξουν την εφαρμογή τους σε θέματα ανάλυσης και σχεδιασμού στρατηγικών αποφάσεων. Η θεωρία παιγνίων έχει αναπτυχθεί σε μεγάλο βαθμό τόσο σε ό,τι αφορά την ανάπτυξη αντίστοιχων μαθηματικών μεθόδων και μοντέλων όσο και εφαρμογών, σε σημείο που να αποτελεί αυτόνομο επιστημονικό ή, ακριβέστερα, διεπιστημονικό πεδίο, και η ύλη του μαθήματος περιλαμβάνει τις βασικές έννοιες που έχουν άμεση σχέση με τη φιλοσοφία της επιχειρησιακής έρευνας ως εργαλειοθήκης υποστήριξης λήψης αποφάσεων. Μαθησιακοί στόχοι Με την ολοκλήρωση του κεφαλαίου, ο μελετητής θα είναι σε θέση: Να αντιληφθεί τον ρόλο και τη σημασία της θεωρίας παιγνίων στη λήψη στρατηγικών αποφάσεων σε περιβάλλον ανταγωνισμού. Να διακρίνει τις βασικές κατηγορίες και τις αντίστοιχες μορφές μοντέλων που χρησιμοποιούνται στη θεωρία παιγνίων. Να διαμορφώνει μοντέλα θεωρίας παιγνίων που περιγράφουν πραγματικές κατά στάσεις λήψης αποφάσεων προσδιορίζοντας τα βασικά στοιχεία του παιγνίου: παίκτες, στρατηγικές, απολαβές. Να εφαρμόζει τις βασικές τεχνικές επίλυσης σε ένα παίγνιο και να ερμηνεύει με επιχειρησιακούς όρους τη λύση που προκύπτει. 1. Παίγνια και λήψη αποφάσεων Η λήψη αποφάσεων αναφέρεται σε συνθήκες αβεβαιότητας, όταν δηλαδή o λήπτης αποφάσεων είχε να αντιμετωπίσει διαφορετικά τυχαία ενδεχόμενα τα οποία επηρέαζαν τα αποτελέσματα που προέκυπταν από κάθε δυνατή επιλογή του. Σε πολλές περιπτώσεις, όμως, ιδιαίτερα όταν οι επιλογές του και οι αποφάσεις του επηρεάζουν άλλα άτομα, ο λήπτης αποφάσεων έχει να αντιμετωπίσει όχι τυχαία ενδεχόμενα αλλά τις αντίστοιχες επιλογές και αποφάσεις των άλλων οι οποίες διαμορφώνουν το τελικό αποτέλεσμα. 2

Με τον όρο παίγνιο (game) ορίζουμε το περιβάλλον της λήψης αποφάσεων όταν δηλαδή υπάρχουν δύο ή οι περισσότεροι εμπλεκόμενοι λήπτες αποφάσεων όπου οι αποφάσεις του ενός επηρεάζουν το αποτέλεσμα υπόλοιπους εμπλεκομένους. Παρόμοιες καταστάσεις αντιμετωπίζουμε καθημερινά προσωπική μας ζωή: όταν παίζουμε ένα παιχνίδι στρατηγικής, όπως το σκάκι, σε μια διαπραγμάτευση της τιμής ενός προϊόντος, το αν θα περάσουμε ή θα σταματήσουμε σε ένα πορτοκαλί φανάρι κυκλοφορίας ή σε μια διασταύρωση κ.ο.κ., αλλά παρόμοιες καταστάσεις αντιμετωπίζουν και ομάδες ατόμων: διαπραγματεύσεις για συλλογικές συμβάσεις (εργαζόμενοι-διοίκηση), πολιτικές εξαγγελίες (αντίπαλα κόμματα), τιμολογιακές πολιτικές, είσοδος ή όχι σε μια νέα αγορά κ.λπ., ή ακόμα και έθνη μνημόνια συνεργασίας, τρόποι αντίδρασης σε μια πρόκληση ή ακόμα και σε μια εμπλοκή κ.λπ. Οι αποφάσεις του κάθε μέρους αλλά και των υπόλοιπων εμπλεκομένων αυτές τις περιπτώσεις διαμορφώνουν το τελικό αποτέλεσμα για όλους. Με αυτή την έννοια, τα παίγνια θεωρούνται εργαλεία λήψης στρατηγικών αποφάσεων. θεωρία παιγνίων (Game Theory) είναι η μελέτη των διαδικασιών λήψης αποφάσεων σε παρόμοιες συνθήκες ανταγωνισμού. Οι εφαρμογές της επεκτείνονται σε πολλές επιστημονικές περιοχές, όπως η Οικονομία, 01 Πολιτικές Επιστήμες, η Νομική, η Βιολογία και η Πληροφορική. Η θεωρία παιγνίων ξεκίνησε να προσδιορίζεται ως ένα διακριτό πεδίο όταν το 1918 ο John von Neumann δημοσίευσε μια σχετική εργασία και ακολούθησε το 1944 το βιβλίο του θεωρία παιγνίων και οικονομική συμπεριφορά, στα οποία περιλαμβάνεται και η μέθοδος προσδιορισμού αμοιβαία αποδεκτών λύσεων στα παίγνια μηδενικού αθροίσματος με δύο παίκτες, όπως θα δούμε στη συνέχεια. Η ανάπτυξη του πεδίου συνεχίστηκε και εστιάστηκε κυρίως σε παίγνια συνεργασίας όπου αναλύονται στρατηγικές για άτομα και ομάδες ατόμων υποθέτοντας ότι μπορούν να επιβάλλουν την τήρηση συμφωνιών μεταξύ τους για την εφαρμογή συγκεκριμένων στρατηγικών. Από το 1950 και μετά, η θεωρία παιγνίων αναπτύσσεται ραγδαία τόσο από θεωρητικής πλευράς των μαθηματικών μοντέλων που χρησιμοποιεί όσο και των εφαρμογών της, με αποτέλεσμα από το 1970 έως σήμερα οκτώ από τα βραβεία Νόμπελ στην οικονομία να απονεμηθούν σε δεκατρείς επιστήμονες για τη σημαντική τους συνεισφορά στην ερμηνεία οικονομικών φαινομένων συμπεριφορών με χρήση της θεωρίας παιγνίων. Η θεωρία παιγνίων και η θεωρία αποφάσεων έχουν ένα κοινό σημείο, και οι δύο λειτουργούν υποστηρικτικά στη λήψη αποφάσεων. θα μπορούσαμε να πούμε ότι η θεωρία αποφάσεων αποτελεί κατηγορία όπου ο «αντίπαλος» παίκτης είναι η «τύχη», η οποία εκφράζεται όχι με συνειδητές επιλογές, με τυχαία συμβάντα που επηρεάζουν τα αποτελέσματα απόφασης. Έτσι σε αντίθεση με τη θεωρία αποφάσεων όπου o λήπτης αποφάσεων εκτιμά τα αποτελέσματα των δικών του επιλογών με βάση την αβεβαιότητα που υπάρχει στο περιβάλλον, στη θεωρία παιγνίων οι εκτιμήσεις των αποτελεσμάτων βασίζονται στο πώς τα άλλα ενδιαφερόμενα μέρη (π.χ. ανταγωνιστές, συνεργάτες κ.λπ.) θα μπορούσαν να απαντήσουν σε κάθε δυνατή επιλογή απόφασης. 3

H διαφορά μεταξύ αποφάσεων και παιγνίων Σε μια ατομική εργασία ένας φοιτητής υπολογίζει το πόσο χρόνο θα αφιερώσει λαμβάνοντας υπόψη τον στόχο (βαθμό που επιδιώκει), τον διαθέσιμο χρόνο του και το πώς θα τον κατανείμει μεταξύ της συγκεκριμένης εργασίας και των άλλων υποχρεώσεών του ώστε να επιτύχει συνολικά ένα καλό αποτέλεσμα για το εξάμηνο. Όλοι οι παραπάνω παράγοντες ανήκουν στη δικαιοδοσία του λήπτη αποφάσεων. Ο μόνος απρόβλεπτος (τυχαίος με κάποια έννοια) παράγοντας είναι ο τρόπος βαθμολογίας από τους καθηγητές. Αντίθετα, σε μια ομαδική εργασία το περιβάλλον λήψης αποφάσεων είναι διαφορετικό. Ο φοιτητής μπορεί να σκεφτεί ότι αν αφιερώσει πάρα πολύ χρόνο, αλλά υπόλοιποι δεν πράξουν ανάλογα, αυτό δεν θα του δώσει καλό αποτέλεσμα στη 'συγκεκριμένη εργασία, αλλά θα του στερήσει και χρόνο που θα μπορούσε να αφιερώσει σε άλλες εργασίες. Πιθανόν να αρχίσει να σκέφτεται ότι, αν τα υπόλοιπα μέλη ομάδας αφιερώσουν αρκετό χρόνο, τότε μπορεί να εκμεταλλευτεί την περίπτωση καταβάλλοντας μικρότερη προσπάθεια και αφιερώνοντας τον χρόνο του σε άλλες εργασίες. Προφανώς όμως οι ίδιες σκέψεις περνούν από το μυαλό όλων των μελών της ομάδας. Άρα, ο καθένας αρχίζει να σκέφτεται πώς θα αντιδράσουν οι υπόλοιποι σε οποιαδήποτε στρατηγική επιλέξει και τι συνέπειες αυτό θα έχει για τον εαυτό του/της. Δομικά στοιχεία κάθε παιγνίου Τα βασικά δομικά στοιχεία σε κάθε παίγνιο περιλαμβάνουν: Παίκτες (Players): Σε κάθε παίγνιο υπάρχουν δύο οι περισσότεροι παίκτες οι οποίοι ενδιαφέρονται να λάβουν αποφάσεις, τα αποτελέσματα των οποίων επηρεάζονται από τις των άλλων παικτών. Γενικά μπορούμε να διακρίνουμε τα παίγνια ως παίγνια 2 παικτών ή παίγνια Ν παικτών. Η έμφαση του μαθήματος δίνεται για λόγους ευκολίας στα παίγνια 2 παικτών. Στρατηγικές (Strategies): Κάθε παίκτης έχει προσδιορίσει και έχει στη διάθεσή του στρατηγικές και είναι σε θέση να επιλέξει μεταξύ αυτών. Το πλήθος των στρατηγικών για κάθε παίκτη μπορεί να είναι πεπερασμένο ή άπειρο. Απολαβές (Payoffs): H επιλογή συγκεκριμένης στρατηγικής από τον κάθε παίκτη οδηγεί σε συγκεκριμένα μετρήσιμα αποτελέσματα που στη θεωρία παιγνίων απολαβές (payoffs) για τον κάθε παίκτη, για τα οποία υπάρχουν σαφείς σχέσεις τίμησης (preference relationships). Οι σχέσεις προτίμησης μπορεί να είναι προφανείς (π.χ. αν μετρούνται με οικονομικούς όρους, τότε η επίτευξη μεγαλύτερου κέρδους είναι προτιμότερη από την επίτευξη μικρότερου κέρδους) ή να καθορίζονται από τον παίκτη σε κλίμακα κατάταξης (ordinal scale) όλων των δυνατών αποτελεσμάτων. Παραδοχές Οι βασικές παραδοχές, αν και αποτελεί ζητούμενο αν όντως ισχύουν στην πράξη, στις οποίες στηρίζεται η ανάλυση των παιγνίων από την πλευρά της συμπεριφοράς των παικτών είναι οι εξής: Ορθολογισμός (Rationality): Είναι αντίστοιχη με τη βασική αρχή της θεωρίας με βάση την οποία μεταξύ 2 επιλογών ο κάθε παίκτης επιλέγει αυτή που του δίνει το καλύτερο αποτέλεσμα ανεξάρτητα από το αποτέλεσμα για τους υπόλοιπους παίκτες. Πλήρης πληροφόρηση (Common Knowledge): Όλοι οι παίκτες είναι σε θέση να εκτιμήσουν τις πιθανές στρατηγικές των άλλων παικτών και τα αντίστοιχα αποτελέσματα που θα προκύψουν. 4

Στο πλαίσιο αυτό διαμορφώνονται πολλές κατηγορίες παιγνίων ανάλογα με το χρονισμό λήψης αποφάσεων από τους παίκτες, τα αποτελέσματα, την πληρότητα της πληροφορίας για κάθε παίκτη, την επιδίωξη σύγκρουσης ή συνεργασίας κ.ο.κ. Κάποιες από τις βασικές κατηγορίες παιγνίων περιλαμβάνουν: Παίγνια μηδενικού/μη μηδενικού αθροίσματος (zero sum/non-zero sum): σε ένα παίγνιο μηδενικού αθροίσματος το συνολικό όφελος για όλους τους παίκτες μετέχουν είναι μηδέν για οποιονδήποτε συνδυασμό στρατηγικών (στην περίπτωση με δύο παίκτες, το κέρδος του ενός αποτελεί ζημία του άλλου). Μια γενικότερη κατηγορία περιλαμβάνει τα παίγνια σταθερού αθροίσματος (constant sum), στα οποία οι επιλογές των παικτών δεν μπορούν ούτε να αυξήσουν ούτε και να μειώσουν το όφελος. Πολλά παίγνια, ιδιαίτερα στην οικονομία, είναι μη μηδενικού (ή σταθερού) αθροίσματος, όπως για παράδειγμα στον καθορισμό τιμολογιακής πολιτικής από ανταγωνιστές, όπου κάτω από ορισμένες προϋποθέσεις μπορεί να υπάρξουν αυξημένα οφέλη για όλους τους παίκτες μέσω της αύξησης του μεγέθους της αγοράς. Παίγνια με ταυτόχρονες/διαδοχικές κινήσεις (simultaneous/sequential): Σε ορισμένα παίγνια θεωρούμε ότι οι παίκτες λαμβάνουν τις αποφάσεις τους ταυτόχρονα, αν όχι κυριολεκτικά, τουλάχιστον χωρίς να γνωρίζει ο κάθε παίκτης τις κινήσεις του άλλου (κάτι που ισοδυναμεί με την ταυτόχρονη λήψη αποφάσεων). Αντίθετα, στα παίγνια με διαδοχικές κινήσεις o κάθε παίκτης γνωρίζει τις προηγούμενες κινήσεις του αντίπαλου παίκτη. Οι διαφορές μεταξύ παιγνίων με ταυτόχρονες και διαδοχικές κινήσεις επηρεάζουν και την απεικόνιση των δεδομένων του παιγνίου. Στα παίγνια με ταυτόχρονες κινήσεις τα δεδομένα του παιγνίου απεικονίζονται σε μορφή πίνακα αντίστοιχο με τον πίνακα αποφάσεων που είδαμε στο προηγούμενο κεφάλαιο, κάτι που ονομάζουμε κανονική μορφή (normal form), ενώ τα παίγνια με διαδοχικές κινήσεις απεικονίζονται με τη μορφή δένδρου, σε αυτό που ονομάζουμε εκτεταμένη μορφή (extensive form). Συμμετρικά/Ασύμμετρα (Symmetric/Asymmetric) παίγνια: Ένα συμμετρικό παίγνιο είναι εκείνο στο οποίο το αποτέλεσμα από μια συγκεκριμένη στρατηγική εξαρτάται μόνο από τις στρατηγικές του άλλου παίκτη και όχι από τον συγκεκριμένο παίκτη. Να το θέσουμε διαφορετικά: εάν η αντιστροφή των παικτών δεν επηρεάζει τα αποτελέσματα, τότε το παίγνιο είναι συμμετρικό, αλλιώς ασύμμετρο. Παίγνια συνεργασίας/μη συνεργασίας (cooperative/non-cooperative): Μεγάλο μέρος της θεωρίας παιγνίων καταλαμβάνει η θεώρηση μορφών παιγνίων όπου οι παίκτες είναι σε θέση να διαμορφώσουν δεσμεύσεις που μπορούν να τηρηθούν και οδηγούν σε αμοιβαίο όφελος. Σε ένα παίγνιο μη συνεργασίας αυτή η εκδοχή θεωρείται μη πιθανή. Οι στρατηγικές και οι τεχνικές τήρησης των συμφωνηθέντων, καθώς και οι τρόποι αντίδρασης σε περίπτωση παραβίασης των συμφωνηθέντων αποτελούν καίρια ζητήματα για παίγνια αυτής της κατηγορίας. Παίγνια με τέλεια/ατελή πληροφόρηση (Perfect information/imperfect information): Ο βαθμός πληροφόρησης κάθε παίκτη είναι σημαντικός ιδιαίτερα σε παίγνια με διαδοχικές κινήσεις. Τέλεια πληροφόρηση σημαίνει ότι ο κάθε παίκτης γνωρίζει όλες τις προηγούμενες κινήσεις που έχουν κάνει οι άλλοι παίκτες, πριν αποφασίσει για τις δικές του επιλογές. Η Τέλεια πληροφόρηση δεν πρέπει να συγχέεται με την πλήρη πληροφόρηση που αναφέρθηκε προηγουμένως ως μια βασική παραδοχή της θεωρίας παιγνίων. Πλήρης πληροφόρηση σημαίνει ότι ο κάθε παίκτης γνωρίζει τις 5

πιθανές επιλογές του(των) άλλου(ων) παίκτη(ών), αλλά όχι και ποια από αυτές έχει επιλέξει (όπως είναι η κατάσταση σε ένα παίγνιο με ταυτόχρονες κινήσεις). Άλλες πιο εξειδικευμένες κατηγορίες παιγνίων περιλαμβάνουν συνδυαστικά (combinatorial), μη πεπερασμένα (infinitely long), διακριτά/συνεχή (discrete/ continuous), διαφορικά (differential), πολλαπλών παικτών (many-player and population), εξελικτικά (evolutionary) παίγνια, καθώς και μεταπαίγνια (metagames), δηλαδή παίγνια των οποίων στόχος είναι η διαμόρφωση κανόνων για άλλα παίγνια. Όπως είναι προφανές, η θεωρία παιγνίων συνιστά έναν ευρύ κλάδο έρευνας και δεν είναι δυνατόν να καλυφθεί πλήρως στο πλαίσιο του παρόντος μαθήματος. Στη συνέχεια του κεφαλαίου θα μελετήσουμε αυτό που αποκαλούμε κλασική θεωρία παιγνίων, η οποία εστιάζει στο γενικό ερώτημα: «ποια είναι η καλύτερη απόφαση μπορώ να πάρω σε ένα δεδομένο οικονομικό σενάριο, όπου μπορώ να εκτιμήσω που θα προκύψει από αποφάσεις μου αντίστοιχες των άλλων οι οποίοι επίσης επιθυμούν να βελτιστοποιήσουν τη θέση τους;». Στο πλαίσιο αυτό θα εξετάσουμε τα χαρακτηριστικά διαφορετικών κατηγοριών προβλημάτων παιγνίων και τις αντίστοιχες προσεγγίσεις προσδιορισμού λύσεων που στις τεχνικές της επιχειρησιακής έρευνας. 2. Μαθηματική διατύπωση παιγνίων Η μαθηματική διατύπωση της κανονικής μορφής ενός παιγνίου με η παίκτες έχει ως εξής: Συμβολίζουμε με Ν={1,,n} το σύνολο των η παικτών και με A, το σύνολο των διαφορετικών εναλλακτικών στρατηγικών του παίκτη i. Το σύνολο όλων των δυνατών συνδυασμών των στρατηγικών των η παικτών ορίζεται ως: Α=Α1 Α2 Αn, όπου κάθε στοιχείο του συνόλου Α να αντιστοιχεί σε ένα διάνυσμα στρατηγικών των n παικτών α=(α1,α2,,αn) Το αποτέλεσμα ή η απολαβή για τον παίκτη i ως συνάρτηση του διανύσματος α των στρατηγικών των παικτών ορίζεται ως μία συνάρτηση: ui : A R, όπου ui(a) η απολαβή για τον παίκτη i όταν το προφίλ των στρατηγικών των παικτών είναι το α. H παραπάνω διατύπωση οδηγεί εύκολα στην απεικόνιση του παιχνιδιού με τη μορφή πίνακα, όπως θα δούμε στο παράδειγμα που ακολουθεί. 6

Παράδειγμα: παίγνιο καθορισμού τιμολογιακής πολιτικής Δύο καφετέριες σε παραθαλάσσιο θέρετρο, o «ΓΛΑΡΟΣ» και τα «KYMATA» έχουν αποκτήσει δικαιώματα από τον δήμο για να τοποθετήσουν ξαπλώστρες στην παραλία κατά τη διάρκεια του καλοκαιριού. Τα δικαιώματα που πλήρωσαν για την σεζόν ανέρχονται σε 2.000 η καθεμία και ο χώρος που τους διατέθηκε θεωρούν ότι μπορεί να καλύψει τη ζήτηση, ενώ αντιμετωπίζουν και ανταγωνισμό από άλλες κοντινές παραλίες. Και οι δύο προβληματίζονται για την τιμολογιακή πολιτική που θα ακολουθήσουν. Τα δεδομένα του προβλήματος έχουν ως εξής: και οι δύο θεωρούν2 σενάρια τιμών: υψηλή τιμή (Υ) 2 ανά ξαπλώστρα και χαμηλή τιμή 1 ανά ξαπλώστρα. Με τη χαμηλή τιμή αναμένεται να ενοικιαστούν 12.000 ξαπλώστρες στη διάρκεια της σεζόν, ενώ με την υψηλή τιμή των 2 οι ενοικιάσεις θα περιοριστούν στις 8.000. Αν και οι δύο έχουν την ίδια τιμή, οι επισκέπτες θα μοιραστούν ισομερώς ενώ αν η μία χρεώσει υψηλή τιμή και η άλλη χαμηλή, όλοι οι επισκέπτες θα προτιμήσουν αυτή με τη χαμηλή τιμή και κανείς την άλλη (μια απλοποιημένη παραδοχή που δεν επηρεάζει τη δομή του προβλήματος). Σύμφωνα με τη μαθηματική διατύπωση των προηγούμενων σχέσεων έχουμε: Ν={1,2} με Α1 = {Χ,Υ} και Α2 = {Χ,Υ} χωρίς να σημαίνει ότι οι στρατηγικές διαφορετικών παικτών είναι σε όλα τα παίγνια οι ίδιες. Α=Α1 Α2={( Χ,Χ), (Χ,Υ), (Υ,Χ), (Υ,Υ)} με συναρτήσεις απολαβών για τους δύο παίκτες που με βάση τα δεδομένα του προβλήματος έχουν ως εξής: Πίνακας απολαβών ΟΙ τιμές των συναρτήσεων απολαβών μπορούν να απεικονιστούν στον πίνακα απολαβών του παιγνίου (κανονική μορφή), όπως παρακάτω: Πίνακας 1: Πίνακας απολαβών παιγνίου καθορισμού τιμολογιακής πολιτικής ΚΥΜΑΤΑ Χ Υ ΓΛΑΡΟΣ Χ 4, 4 10, -2 Υ -2, 10 6, 6 Οι δύο τιμές σε κάθε κελί αντιπροσωπεύουν τις απολαβές του παιγνίου, δηλαδή τα αποτελέσματα για τους παίκτες ΓΛΑΡΟΣ και ΚΥΜΑΤΑ αντίστοιχα, σε χιλιάδες ευρώ. Για παράδειγμα, η επιλογή χαμηλής τιμής από την καφετέρια ΓΛΑΡΟΣ και υψηλής από την καφετέρια ΚΥΜΑΤΑ θα έχει ως αποτέλεσμα κέρδος 10.000 για την πρώτη και ζημία 2.000 για τη δεύτερη. 7

Σύμφωνα με την κατηγοριοποίηση των παιγνίων που αναπτύξαμε προηγουμένως, το συγκεκριμένο παίγνιο είναι ένα συμμετρικό παίγνιο μη σταθερού αθροίσματος (το άθροισμα των απολαβών είναι διαφορετικό για κάθε ζεύγος στρατηγικών). Το συγκεκριμένο πρόβλημα είναι μια εφαρμογή του γνωστού ως «Το δίλημμα του φυλακισμένου» προβλήματος στη θεωρία παιγνίων. Η προσέγγιση για την επίλυση Προβλημάτων μη σταθερού αθροίσματος θα αναπτυχθεί αναλυτικά στην Ενότητα 5. 3. Παίγνια μηδενικού αθροίσματος με αμιγείς στρατηγικές Τα παίγνια μηδενικού αθροίσματος (zero sum games) αποτελούν την πλέον απλούστερη εκδοχή παιγνίων. Το βασικό χαρακτηριστικό αυτών των παιγνίων είναι ότι το άθροισμα των απολαβών για κάθε σενάριο στρατηγικών των παικτών είναι πάντα μηδέν, δηλαδή σε ένα παίγνιο δύο παικτών, τα κέρδη του ενός παίκτη αποτελούν ζημίες για τον άλλο παίκτη. Χρησιμοποιώντας τη μαθηματική διατύπωση της προηγούμενης ενότητας, αν α1 και α2 είναι οι στρατηγικές των δύο παικτών για τις αντίστοιχες απολαβές u1 και u2 τότε ισχύει ότι: u1(α1,α2) =-u2(α1,α2) Γενικότερα, για ένα παίγνιο μηδενικού αθροίσματος με Ν παίκτες ισχύει: N u i (a 1, a 2,.., a n ) = 0 i=1 Αντίστοιχα, ένα παίγνιο σταθερού αθροίσματος ορίζεται από τη σχέση: N u i (a 1, a 2,.., a n ) = c, i=1 όπου c σταθερά. Κάθε παίγνιο σταθερού αθροίσματος μπορεί να μετασχηματιστεί με κανονικοποίηση σε παίγνιο μηδενικού αθροίσματος μέσω ενός γραμμικού μετασχηματισμού όπως: u i (a 1, a 2,.., a n ) = u i (a 1, a 2,.., a n ) c/n Επομένως, η μεθοδολογία για την επίλυση παιγνίων σταθερού αθροίσματος ακριβώς η ίδια με τη μεθοδολογία επίλυσης παιγνίων μηδενικού αθροίσματος που θα εξετάσουμε σε αυτή την ενότητα. Παράδειγμα: Παίγνιο μηδενικού αθροίσματος Δύο μεγάλα σουπερμάρκετ τροφίμων, Α και Β, ανταγωνίζονται μεταξύ σε συγκεκριμένη γεωγραφική περιοχή. Δεδομένου ότι δεν υπάρχει περιθώριο μεγέθυνσης της αγοράς, καθεμία επιχείρηση εξετάζει στρατηγικές μάρκετινγκ για να αυξήσει το μερίδιο της αγοράς, μειώνοντας αντίστοιχα το μερίδιο της αγοράς της ανταγωνίστριας 8

επιχείρησης. Πιθανές στρατηγικές και για τις δύο επιχειρήσεις περιλαμβάνουν: Ι) προσφορά κουπονιού έκπτωσης για πωλήσεις άνω των 80, ΙΙ) προσφορές σε συγκεκριμένες ημέρες τις εβδομάδας, ΙΙΙ) αύξηση δαπανών προώθησης ειδικών προσφορών και IV) προσφορά πιστωτικής κάρτας πελάτη. Τα αποτελέσματα από τις 4 διαφορετικές στρατηγικές δεν θα αποφέρουν τα ίδια αποτελέσματα σε κάθε σουπερμάρκετ διότι η πελατειακή τους βάση είναι διαφορετική. Οι ειδικοί του μάρκετινγκ έπειτα από ανάλυση της αγοράς έχουν καταλήξει ότι ο παρακάτω πίνακας απολαβών απεικονίζει τα αποτελέσματα σε όρους μεριδίων αγοράς για τις δύο επιχειρήσεις ανάλογα με το σενάριο στρατηγικών που θα υλοποιηθεί. Πίνακας 2: Πίνακας απολαβών για τους παίκτες Α κοι Β (μερίδια αγοράς %) Το πρώτο στοιχείο σε κάθε ζεύγος τιμών αφορά το αποτέλεσμα για τον παίκτη Α, ενώ το δεύτερο στοιχείο είναι το αποτέλεσμα για τον παίκτη Β. Επειδή το παίγνιο είναι μηδενικού αθροίσματος (το κέρδος του Α είναι ζημία για τον Β), το άθροισμα των αποτελεσμάτων σε κάθε συνδυασμό στρατηγικών είναι μηδενικό. Στα παίγνια μηδενικού αθροίσματος o πίνακας απολαβών συνήθως περιέχει τις απολαβές για τον έναν από τους δύο παίκτες (π.χ. παίκτη Α), δεδομένου ότι οι απολαβές τον παίκτη Β είναι ακριβώς αντίθετες. Έτσι, ο παραπάνω πίνακας απολαβών (Πίνακας 2) μπορεί να διατυπωθεί συνοπτικά όπως ο Πίνακας 3 παρακάτω: Πίνακας 3: Πίνακας απολαβών για τους παίκτες Α και Β (μερίδια αγοράς %) Για παράδειγμα, αν o Α επιλέξει τη στρατηγική ΙΙ και ο Β την IV, τότε ο Α θα αυξήσει το μερίδιο αγοράς κατά 2 ποσοστιαίες μονάδες, ενώ το αντίστοιχο μερίδιο του Β θα μειωθεί κατά 2 ποσοστιαίες μονάδες. Επομένως, ενώ ο παίκτης Α ενδιαφέρεται για τη μεγιστοποίηση των απολαβών του Πίνακα 3, ο παίκτης Β ενδιαφέρεται για την ελαχιστοποίησή τους. 9

Υποτίθεται ότι ισχύει η βασική παραδοχή της πλήρους πληροφόρησης, δηλαδή και οι δύο παίκτες έχουν πλήρη γνώση των πιθανών στρατηγικών του άλλου παίκτη και της εκτίμησης των αποτελεσμάτων. Αμιγείς στρατηγικές Σκοπός των παικτών σε κάθε παίγνιο είναι o προσδιορισμός των βέλτιστων στρατηγικών τους. Στην περίπτωση που αυτό επιτυγχάνεται με την επιλογή μίας μόνο από τις εναλλακτικές στρατηγικές, τότε λέμε ότι έχουμε ένα παίγνιο με αμιγείς στρατηγικές (pure strategies). Αντίθετα, στην περίπτωση που η βέλτιστη θέση κάθε παίκτη επιτυγχάνεται με την επιλογή ενός συνδυασμού στρατηγικών, τότε έχουμε ένα παίγνιο με μεικτές στρατηγικές (mixed strategies). Στρατηγικές maximin και minimax Λαμβάνοντας υπόψη την παραδοχή ότι οι παίκτες ενεργούν ορθολογικά, ας εξετάσουμε πώς θα ενεργούσαν οι παίκτες Α και Β στο παίγνιο του παραδείγματος. Ας υποθέσουμε ότι o παίκτης Α επιλέγει τη στρατηγική Ι. Το αποτέλεσμα που θα προκύψει εξαρτάται από τη στρατηγική που θα επιλέξει ο παίκτης Β σε αυτή την περίπτωση. Επειδή ο Β ενδιαφέρεται να μειωθεί όσο το δυνατόν το κέρδος του Α ώστε να αυξηθεί το δικό του όφελος (θυμηθείτε ότι έχουμε ένα παίγνιο μηδενικού αθροίσματος), o παίκτης Β θα επιλέξει τη στρατηγική ΙΙ, ώστε ο Α να έχει το χειρότερο δυνατό αποτέλεσμα, κάτι που αντιστοιχεί στο καλύτερο σε αυτή την περίπτωση αποτέλεσμα για τον B. Επομένως, με την επιλογή της στρατηγικής Ι, ο Α δεν μπορεί να ελπίζει σε τίποτα καλύτερο ως αποτέλεσμα από το -2, δηλαδή το ελάχιστο (minimum) της σειράς. Με την ίδια λογική, για τις υπόλοιπες στρατηγικές τα αποτελέσματα που μπορεί να αναμένει ο παίκτης Α είναι τα ελάχιστα κάθε σειράς, δηλαδή -1 αν επιλέξει τη στρατηγική ΙΙ, 1 για τη στρατηγική ΙΙΙ και -1 για τη στρατηγική IV (Πίνακας 4). Πίνακας 4: Maximin πίνακας απολαβών για τον παίκτη Α Προφανώς, ο Α ενδιαφέρεται να επιλέξει μεταξύ των τεσσάρων εναλλακτικών στρατηγικών εκείνη που θα του δώσει το καλύτερο αποτέλεσμα, δεδομένης της προσπάθειας του B να περιορίσει τις απολαβές του Α για να αυξήσει τις δικές του. Επομένως, από τις τέσσερις στρατηγικές θα επιλέξει την ΙΙΙ, δηλαδή αυτή που αντιστοιχεί στο μέγιστο από τα ελάχιστα των σειρών (maximin). Με την ίδια λογική μπορούμε να δούμε και τις κινήσεις του παίκτη B. Αν o Β επιλέξει τη στρατηγική Ι, o Α θα επιλέξει την ΙΙ γιατί του δίνει το καλύτερο αποτέλεσμα για τη δεδομένη επιλογή του B. Επομένως το αποτέλεσμα για τον B θα είναι το 1,5 (αύξηση του μεριδίου του Α και κατά συνέπεια μείωση του δικού του κατά 1,5). Με παρόμοια λογική το αποτέλεσμα στρατηγικές του B ορίζεται ως το μέγιστο της αντίστοιχης στήλης όπως φαίνεται στον πίνακα 5. 10

Επειδή επιδίωξη του B είναι η επίτευξη του καλύτερου δυνατού αποτελέσματος, θα επιλέξει το μικρότερο από τα μέγιστα κάθε στήλης (minimax), στη συγκεκριμένη περίπτωση τη ΙΙΙ, από την οποία χάνει 1 ποσοστιαία μονάδα που είναι το καλύτερο δυνατό αποτέλεσμα σε σχέση με τα αποτελέσματα των υπόλοιπων στρατηγικών. Πίνακας 5: Minimax για τον παίκτη Β - Σημείο ισορροπίας Σημείο ισορροπίας Επειδή σκοπός και των δύο παικτών είναι η επίτευξη του καλύτερου δυνατού αποτε λέσματος, ο παίκτης Α ακολουθεί πάντα την τακτική maximin που οδηγεί στην επιλογή της στρατηγικής ΙΙΙ, ενώ ο παίκτης Β την τακτική minimax που οδηγεί στην επιλογή της στρατηγικής ΙΙ. Παρατηρούμε ότι στο συγκεκριμένο παίγνιο οι αντίστοιχες απόλαβές που αντιστοιχούν στις τακτικές maximin και minimax είναι ίσες μεταξύ τους. Σε αυτή την περίπτωση λέμε ότι έχουμε σημείο ισορροπίας στο παίγνιο, η οποία προκύπτει από αμιγείς στρατηγικές (pure strategies) των παικτών, και η τιμή του παιγνίου (value of the game) είναι ίση με την τιμή του πίνακα απολαβών στο σημείο ισορροπίας (equilibrium) του παιγνίου. Σημείο ισορροπίας: Μαθηματική συνθήκη Η μαθηματική συνθήκη για να υπάρχει σημείο ισορροπίας σε ένα παίγνιο δύο παικτών διατυπώνεται ως εξής: Έστω Α=Α1 Α2 το σύνολο όλων των δυνατών συνδυασμών των στρατηγικών των δύο παικτών, με κάθε στοιχείο του συνόλου να αντιστοιχεί σε ένα διάνυσμα στρατηγικών των 2 παικτών α=(α1, α2), και έστω u1=(α1, α2) και u2=(α1, α2) οι αντίστοιχες απολαβές για τους παίκτες Α και Β. Ένα σενάριο στρατηγικών (α 1, α 2 ) αποτελεί σημείο ισορροπίας όταν ισχύει: u1(α 1, α 2 )= max a 1 A 1 { min a 2 A 2 {u 1 (a 1, a 2 )}} και u2(α 1, α 2 )= max a 2 A 2 { min a 1 A 1 {u 2 (a 1, a 2 )}} Για την περίπτωση των παιγνίων σταθερού αθροίσματος ή μηδενικού αθροίσματος, όπου u 1 (a 1, a 2 ) = u 2 (a 1, a 2 ) 11

μπορεί να αποδειχθεί ότι για το σημείο ισορροπίας, αν υπάρχει, ισχύει: u 1 (α 1, α 2 ) = max a 1 A 1 { min a 2 A 2 {u 1 (a 1, a 2 )}} = min a 2 A 2 { max a 1 A 1 {u 1 (a 1, a 2 )}} όπου u 1 (a 1, a 2 ) τα στοιχεία του πίνακα απολαβών. Ερμηνεία του σημείου ισορροπίας σε ένα παίγνιο Κατ' αρχάς, όπως προκύπτει από την προηγούμενη παράγραφο, δεν υπάρχει σε όλα τα παίγνια σημείο ισορροπίας. Στη συνέχεια του κεφαλαίου θα εξετάσουμε περιπτώσεις προσδιορισμού βέλτιστων στρατηγικών σε παίγνια όπου δεν υπάρχει σημείο ισορροπίας, όπως και περιπτώσεις σημείου ισορροπίας σε παίγνια μη μηδενικού αθροίσματος. Στις περιπτώσεις όπου υπάρχει σημείο ισορροπίας, αυτό προσδιορίζει αμιγείς στρατηγικές των παικτών που είναι βέλτιστες με βάση τον δεδομένο πίνακα απολαβών. Δηλαδή, κανένας παίκτης δεν μπορεί να επωφεληθεί από τη στρατηγική που εφαρμόζει ο αντίπαλός του ώστε να βελτιώσει τη δική του θέση. Στο συγκεκριμένο παράδειγμα, το σημείο ισορροπίας δηλώνει ότι ο παίκτης Α εφαρμόζει τη στρατηγική ΙΙΙ και ο παίκτης Β τη στρατηγική ΙΙ. Τον παίκτη Α δεν τον συμφέρει να επιλέξει μια άλλη στρατηγική, διότι το αποτέλεσμα θα είναι χειρότερο για αυτόν, γιατί ο Β θα παραμείνει στη ΙΙ. Αν, για παράδειγμα, προτιμήσει τη στρατηγική Ι, τότε ο Β παραμένει στη ΙΙ, με αποτέλεσμα 0, που είναι χειρότερο για τον Α και καλύτερο για τον Β. Επομένως, ο Α δεν έχει κανένα κίνητρο να εγκαταλείψει τη maximin στρατηγική του. Αντίστοιχη είναι και η κατάσταση για τον B (μπορείτε να το επαληθεύσετε δοκιμάζοντας). Αυτό οδηγεί και παίκτες να παραμένουν στις αμιγείς στρατηγικές του σημείου ισορροπίας. Το σημείο ισορροπίας δεν δηλώνει ότι και οι δύο παίκτες κερδίζουν. Στο συγκεκριμένο παράδειγμα ο Α έχει κέρδος μίας ποσοστιαίας μονάδας, ενώ αντίστοιχα ο B ζημιά μίας μονάδας. Δηλώνει όμως ότι αυτό είναι το καλύτερο αποτέλεσμα που μπορεί να προκύψει για τον κάθε παίκτη. Μη ύπαρξη σημείου ισορροπίας Όπως αναφέραμε, δεν έχουν όλα τα παίγνια σημείο ισορροπίας. Ο Πίνακας 6 αφορά ένα παίγνιο μηδενικού αθροίσματος 2 παικτών, όπου ο παίκτης Α έχει 4 στρατηγικές και ο παίκτης B έχει 3 εναλλακτικές, με τα στοιχεία του πίνακα να αντιπροσωπεύουν τις απολαβές για τον παίκτη Α. Πίνακας 6: Παίγνιο χωρίς σημείο ισορροπίας 12

Εξετάζοντας τις τακτικές maximin και minimax για τους δύο παίκτες, καταλήγουμε ότι για τον παίκτη Α η καλύτερη στρατηγική είναι η Α-Ι με τιμή 0, ενώ για τον Β η στρατηγική Β-Ι με τιμή 1. Επειδή οι δύο τιμές δεν είναι ίσες, δεν υπάρχει σημείο ισορροπίας. Τι συμβαίνει όταν δεν υπάρχει σημείο ισορροπίας; Ας υποθέσουμε ότι ο παίκτης Β επιλέγει τη στρατηγική Β-Ι. Τότε είναι προς το συμφέρον του παίκτη Α αυτός να επιλέξει τη στρατηγική Α-ΙΙΙ, διότι θα του δώσει αποτέλεσμα 1, το οποίο είναι καλύτερο από το 0 που αντιστοιχεί στη στρατηγική Α-Ι. Αλλά αν ο Α προχωρήσει με τη στρατηγική Α-ΙΙΙ, ο Β θα επιλέξει τη Β-ΙΙΙ, η οποία δίνει το καλύτερο για αυτόν αποτέλεσμα (θυμηθείτε ότι το χειρότερο αποτέλεσμα για τον Α είναι το καλύτερο για τον Β, επειδή το παίγνιο είναι μηδενικού αθροίσματος). Ναι, αλλά αν ο Β επιλέξει τη Β-ΙΙΙ, τότε με τη σειρά του ο Α θα αλλάξει και θα επιλέξει την A-IV, που του δίνει το καλύτερο αποτέλεσμα στη στήλη Β-ΙΙΙ. Στη συνέχεια o Β θα επιλέξει τη Β-Ι, που του δίνει το καλύτερο αποτέλεσμα στη σειρά A-IV, και ο κύκλος θα συνεχίζεται επ' άπειρον. Επομένως, δεν υπάρχουν αμιγείς στρατηγικές για τους δύο παίκτες. Υποδεέστερες και κυρίαρχες στρατηγικές Υποδεέστερες στρατηγικές Μία στρατηγική ενός παίκτη σε ένα παίγνιο καλείται υποδεέστερη στρατηγική (dominated strategy) όταν τα αποτελέσματά (απολαβές) της είναι χειρότερα από τα αντίστοιχα άλλης εναλλακτικής στρατηγικής για όλες τις πιθανές στρατηγικές του αντίπαλου παίκτη. Σε μαθηματική μορφή, η συνθήκη για να χαρακτηριστεί μια στρατηγική α i του παίκτη i ως υποδεέστερη είναι: α i Α1-{α i } u i (a 1, a i, a n ) < u i (a 1, a i, a n ) Για παράδειγμα στον Πίνακα 6 η στρατηγική Α-ΙΙ είναι υποδεέστερη της Α-Ι γιατί οι τιμές της σειράς Α-ΙΙ (-1, 1, 1,5) είναι όλες μικρότερες από τις αντίστοιχες τιμές της σειράς Α-Ι (0, 4, 2). Οι υποδεέστερες στρατηγικές ενός παίκτη μπορούν να διαγραφούν διότι δεν πρόκειται να επιλεγούν ποτέ, καθότι υπάρχει τουλάχιστον μια άλλη εναλλακτική στρατηγική που δίνει καλύτερα αποτελέσματα, ανεξάρτητα από την επιλογή που θα κάνει ο αντίπαλος παίκτης. Έτσι, ο Πίνακας 6 είναι ισοδύναμος με τον Πίνακα 7, στον οποίο η στρατηγική Α-ΙΙ έχει απαλειφθεί. Πίνακας 7: Απαλοιφή της Α-ΙΙ ως υποδεέστερης 13

Στον πίνακα που προκύπτει παρατηρούμε επίσης ότι η στρατηγική Β-ΙΙ είναι υποδεέστερη και της Β-Ι αλλά και της Β-ΙΙΙ, επειδή οι τιμές της στήλης Β-ΙΙ είναι μεγαλύτερες των αντίστοιχων τιμών των Β-Ι και Β-ΙΙΙ (ο παίκτης Β προσπαθεί να ελαχιστοποιήσει την τιμή του παιγνίου σε ένα παίγνιο μηδενικού αθροίσματος). Επομένως, η στρατηγική Β-ΙΙ μπορεί να διαγραφεί και έτσι το παίγνιο περιορίζεται ακόμα περισσότερο σε έναν πίνακα 3x2. Πίνακας 8: Απαλοιφή της Β-ΙΙ ως υποδεέστερης Στο σημείο αυτό παρατηρούμε ότι δεν υπάρχουν άλλες υποδεέστερες στρατηγικές. Προσοχή στη διαγραφή υποδεέστερων στρατηγικών Οι υποδεέστερες στρατηγικές πρέπει πάντα να απαλείφονται από τον πίνακα απολαβών. Δεν έχει σημασία αν ξεκινούμε την αναζήτηση μεταξύ αυτών του παίκτη Α (σειρές) ή αυτών του παίκτη B (στήλες). Μετά την απαλοιφή κάποιας υποδεέστερης στρατηγικής ενός παίκτη, μπορεί κάποιες στρατηγικές του άλλου παίκτη που δεν ήταν υποδεέστερες να μεταπέσουν σε κατάσταση υποδεέστερης στρατηγικής. Για παράδειγμα, n στρατηγική Β-ΙΙ στον αρχικό Πίνακα 6 δεν είναι υποδεέστερη της Β-ΙΙΙ, αφού στη 2η σειρά 1<1.5 (άρα υπάρχει ένα στοιχείο της Β-ΙΙ που είναι καλύτερο του αντίστοιχου της Β-ΙΙΙ). Μετά όμως την απαλοιφή της Α-ΙΙ, το στοιχείο αυτό δεν υπάρχει και η Β-ΙΙ είναι υποδεέστερη της Β-ΙΙΙ. Η απαλοιφή των υποδεέστερων στρατηγικών από τον πίνακα απολαβών του παιγνίου μειώνει τις διαστάσεις του παιγνίου απομακρύνοντας τις στρατηγικές που δεν θα ήταν ποτέ υποψήφιες για επιλογή. Κυρίαρχες στρατηγικές Μια στρατηγική ενός παίκτη σε ένα παίγνιο καλείται κυρίαρχη στρατηγική (dominant strategy) όταν τα αποτελέσματά (απολαβές) της είναι καλύτερα από τα αντίστοιχα όλων των άλλων εναλλακτικών στρατηγικών για όλες τις πιθανές στρατηγικές του αντίπαλου παίκτη. Σε μαθηματική μορφή, η συνθήκη για να χαρακτηριστεί μια στρατηγική α i - του παίκτη i ως κυρίαρχη είναι: u i (a 1, a i, a n ) > u i (a 1, a i, a n ) a i A i {a i } 14

Είναι προφανές ότι, εάν υπάρχει μία κυρίαρχη στρατηγική, όλες οι άλλες στρατηγικές του παίκτη είναι υποδεέστερες αυτής (το αντίθετο δεν ισχύει) και ο παίκτης θα επιλέξει την κυρίαρχη στρατηγική. Παράδειγμα: Παίγνιο με υποδεέστερες και κυρίαρχη στρατηγική Δύο υποψήφιοι σε μια εκλογική αναμέτρηση σχεδιάζουν τη στρατηγική προεκλογικών εξαγγελιών ώστε να προσελκύσουν όσο το δυνατόν περισσότερες ψήφους από μια περιφέρεια που συγκεντρώνει 70.000 ψηφοφόρους, με τελείως ανομοιογενή οικονομικά χαρακτηριστικά ενδιαφέροντα (π.χ. αστικές, βιομηχανικές, αγροτικές περιοχές). Παρόλο που η συγκεκριμένη περιφέρεια είναι μικρή σε μέγεθος, μπορεί να επηρεάσει το τελικό αποτέλεσμα των εκλογών. Τα επιτελεία των δύο υποψηφίων κατέληξαν ότι τρία είναι τα βασικά θέματα που ενδιαφέρουν συγκεκριμένες μερίδες πολιτών: a) μέτρα ενίσχυσης του αγροτικού εισοδήματος, β) η εγκατάσταση και λειτουργία Χώρων Υγιεινής Ταφής Απορριμμάτων (ΧΥΤΑ) και γ) επαναλειτουργία ενός μικρού αεροδρομίου, το οποίο σταμάτησε να λειτουργεί πριν από λίγα χρόνια με εκχώρηση σε Ιδιώτη επενδυτή. Τα επιτελεία των δύο πολιτικών εκτιμούν ότι η κατανομή των ψήφων εξαρτάται από το ποιο θα είναι το καίριο ζήτημα που θα αναδείξουν οι υποψήφιοι σε συνδυασμό με τις γενικότερες πολιτικές κατευθύνσεις του κόμματος που εκπροσωπούν. Ο Πίνακας 9 περιλαμβάνει τις εκτιμήσεις για τις ψήφους που θα συγκεντρώσει ο υποψήφιος Α ανάλογα με τη στρατηγική που θα επιλέξει να ακολουθήσει ο ίδιος, αλλά και ο αντίπαλός του. Προφανώς ο αριθμός των ψήφων του υποψηφίου Β είναι ό,τι απομένει από τον συνολικό αριθμό των 70.000 ψήφων. Πίνακας 9: Πίνακας απολαβών για τον υποψήφιο Α (σε χιλιάδες ψήφους) Το συγκεκριμένο παίγνιο είναι ένα παίγνιο σταθερού αθροίσματος. Oι απολαβές για τον υποψήφιο Β υπολογίζονται αν από το σύνολο των 70.000 ψήφων αφαιρεθούν οι ψήφοι του υποψηφίου Α. Έτσι, ο υποψήφιος Α ενδιαφέρεται για τη μεγιστοποίηση των απολαβών του Πίνακα 9, ενώ αντίθετα ο Β για την ελαχιστοποίηση. Αν εφαρμόσουμε τις τεχνικές maximin για τον Α και minimax για τον Β, μπορούμε να δούμε ότι υπάρχει σημείο ισορροπίας που ορίζεται από τις στρατηγικές Α-β και Β-α με τιμή του παιγνίου V = 25, δηλαδή 25.000 ψήφοι για τον Α και 45.000 για τον Β. Ας εξετάσουμε όμως το πρόβλημα από την πλευρά των υποδεέστερων και κυρίαρχων στρατηγικών, εφαρμόζοντας την παρακάτω γενική διαδικασία επίλυσης παιγνίων μηδενικού ή σταθερού αθροίσματος. Διαδικασία επίλυσης παιγνίων μηδενικού ή σταθερού αθροίσματος 15

Βήμα 1 Ελέγχουμε την ύπαρξη κυρίαρχων στρατηγικών για τον παίκτη Α και τον παίκτη Β. Αν υπάρχει κυρίαρχη στρατηγική έστω και για τον έναν παίκτη, το παίγνιο έχει σημείο ισορροπίας, το οποίο ορίζεται από την κυρίαρχη στρατηγική του ενός παίκτη και τη βέλτιστη στρατηγική του άλλου ως προς την κυρίαρχη στρατηγική του πρώτου. Αν δεν υπάρχει κυρίαρχη στρατηγική για κανέναν παίκτη, συνεχίζουμε στο επόμενο βήμα. Βήμα 2 Ελέγχουμε την ύπαρξη υποδεέστερων στρατηγικών για τον παίκτη Α (ή Β, δεν έχει σημασία η σειρά). Αν βρεθεί υποδεέστερη στρατηγική, την απαλείφουμε και επιστρέφουμε στο βήμα 1. Αν όχι, προχωρούμε στο επόμενο βήμα. Βήμα 3 Εφαρμόζουμε τις τακτικές maximin και minimax για την πιθανή εύρεση σημείου ισορροπίας. Αν βρεθεί σημείο ισορροπίας, έχουμε λύση με αμιγείς στρατηγικές. Αν δεν βρεθεί σημείο ισορροπίας, τότε προχωρούμε στο βήμα 4. Βήμα 4 Εφαρμόζουμε τη μεθοδολογία προσδιορισμού μεικτών στρατηγικών πτύσσεται αναλυτικά στην επόμενη Ενότητα 4). Η εφαρμογή της παραπάνω διαδικασίας στο παίγνιο των δύο υποψηφίων έχει ως εξής: 1 η επανάληψη Βήμα 1 Καταρχήν εξετάζουμε την ύπαρξη κυρίαρχων στρατηγικών. Για τον παίκτη Α, η Α-β είναι καλύτερη της Α-α, αλλά όχι καλύτερη της Α-γ, ούτε η Α-γ είναι καλύτερη της Α-α, επομένως δεν υπάρχει κυρίαρχη στρατηγική σε αυτό το σημείο. Το ίδιο και τον παίκτη B, όπου δεν όπου δεν υπάρχει κάποια στήλη της οποίας όλα τα στοιχεία να είναι μικρότερα από τα αντίστοιχα όλων των άλλων. Προχωρούμε στο επόμενο βήμα. Βήμα 2 Εξετάζουμε την ύπαρξη υποδεέστερων στρατηγικών για τον υποψήφιο Α. Η στρατηγική Α-α είναι υποδεέστερη της Α-β (όλα τα στοιχεία της σειράς Α-α είναι μικρότερα των αντίστοιχων της σειράς Α-β). Για τον παίκτη Β δεν υπάρχουν υποδεέστερες στρατηγικές (δεν υπάρχει καμία στήλη της οποίας τα στοιχεία να είναι μεγαλύτερα των αντίστοιχων στοιχείων μιας άλλης στήλης). Επομένως, η στρατηγική Α-α απαλείφεται και το παίγνιο περιορίζεται σε δύο στρατηγικές για τον παίκτη Α, τις Α-β και Α-γ, ενώ ο παίκτης Β διατηρεί προς το παρόν όλες τις στρατηγικές του, όπως φαίνεται στον Πίνακα 11. Πίνακες 10-11: Διαγραφή της Α-α και η μορφή του παίγνιου μετά την 1 η επανάληψη Επιστρέφουμε στο βήμα 1. 2η επανάληψη Βήμα 1 Εξετάζοντας τον Πίνακα απολαβών 11 που προέκυψε μετά την απαλοιφή της υποδεέστερης στρατηγικής για την ύπαρξη κυρίαρχων στρατηγικών, διαπιστώνουμε 16

ότι δεν υπάρχουν. Για τον υποψήφιο Α, η Α-β δεν είναι πάντα καλύτερη από την Α-γ ούτε αντίστροφα, για δε τον υποψήφιο Β, η Β-α υπερέχει της Β-β, αλλά όχι πάντα και της Β-γ και επίσης η Β-γ δεν υπερέχει πάντα της Β-α και της Β-β. Επομένως, προχωρούμε ξανά στον προσδιορισμό υποδεέστερων στρατηγικών στον Πίνακα 11. Βήμα 2 Εξετάζουμε την ύπαρξη υποδεέστερων στρατηγικών στον Πίνακα 12 για τον υποψήφιο Α. Η στρατηγική Α-β δεν είναι υποδεέστερη της Α-γ (όλα τα στοιχεία της σειράς Α-β δεν είναι μικρότερα των αντίστοιχων της σειράς Α-γ) και αντίστροφα. Για τον παίκτη Β, όμως, σε αυτή την επανάληψη υπάρχουν υποδεέστερες στρατηγικές. Συγκεκριμένα, η Β-β είναι υποδεέστερη της Β-α γιατί όλα τα στοιχεία της στήλης Β-β είναι μεγαλύτερα από τα αντίστοιχα της Β-α (δίνουν μεγαλύτερο αριθμό ψήφων στον υποψήφιο Α και επομένως μικρότερο στον Β). Επομένως, η στρατηγική Β-β απαλείφεται και το παίγνιο περιορίζεται σε δύο στρατηγικές για τον παίκτη Α, τις Α-β και Α-γ, και δύο για τον παίκτης B, τις Β-α και Β-γ, όπως φαίνεται στον Πίνακα 13. Πίνακες 12-13: Διαγραφή της Β-β και η μορφή του παίγνιου μετά την 2 η επανάληψη Επιστρέφουμε στο βήμα 1. 3ηεπανάληψη Βήμα 1 Εξετάζοντας τον Πίνακα απολαβών 13 που προέκυψε μετά την απαλοιφή και της Β-β, διαπιστώνουμε ότι η στρατηγική Α-β είναι κυρίαρχη στρατηγική για τον υποψήφιο Α (του δίνει, ανεξάρτητα από το ποια στρατηγική θα επιλέξει ο υποψήφιος Β, αντίστοιχα μεγαλύτερο αριθμό ψήφων από την Α-γ, που είναι η μόνη άλλη εναλλακτική που έχει μείνει μετά την απαλοιφή της υποδεέστερης). Επομένως, ο υποψήφιος επιλέγει τη στρατηγική Α-β. Ο Β δεν έχει κυρίαρχη στρατηγική, αλλά από τη στιγμή που ο υποψήφιος Α θα επιλέξει την Α-β ως κυρίαρχη στρατηγική, ο υποψήφιος Β θα επιλέξει τη στρατηγική Β-α έναντι της Β-γ, γιατί περιορίζει τον υποψήφιο Α σε 25.000 ψήφους επομένως του δίνει τις υπόλοιπες 45.000 ψήφους. 3 Παίγνια μηδενικού αθροίσματος με μεικτές στρατηγικές Όπως είδαμε και στην προηγούμενη ενότητα, υπάρχουν παίγνια μηδενικού ή σταθερού αθροίσματος στα οποία δεν υπάρχουν σημεία ισορροπίας, δηλαδή οι παίκτες δεν μπορούν να ακολουθήσουν αμιγείς στρατηγικές. Σε αυτή την περίπτωση η κατάσταση ισορροπίας επιτυγχάνεται μέσω μεικτών στρατηγικών, δηλαδή την εφαρμογή περισσότερων από μίας στρατηγικών από κάθε παίκτη σε συγκεκριμένη αναλογία (ή συχνότητα επαναλήψεων). Επομένως, μεικτή στρατηγική (mixed strategy) είναι μια στρατηγική κατά την οποία ο παίκτης εφαρμόζει διαφορετικές στρατηγικές με συγκεκριμένη πιθανότητα εμφάνισης ή επανάληψης για την καθεμία. 17

Το 1944, ο ]ohn νοη Neumann και ο Oskar Morgenstern απέδειξαν ότι σε κάθε παίγνιο μηδενικού αθροίσματος με πεπερασμένο πλήθος στρατηγικών για κάθε παίκτη υπάρχει σημείο ισορροπίας που καθορίζεται από μεικτές στρατηγικές των παικτών. Αργότερα, το 1951, ο John Nash επέκτεινε την ισχύ του θεωρήματος αποδεικνύοντας ότι κάθε παίγνιο πεπερασμένου μεγέθους -όχι μόνο μηδενικού αθροίσματος- έχει τουλάχιστον ένα σημείο ισορροπίας μεικτών στρατηγικών. Ας θεωρήσουμε το παράδειγμα του παιγνίου δύο παικτών μηδενικού αθροίσματος με πίνακα απολαβών τον Πίνακα 14. Πίνακας 14: Παίγνιο μηδενικού αθροίσματος 4x3 Παρατηρούμε ότι για τον παίκτη Α η στρατηγική A-IV είναι υποδεέστερη της Α-Ι (-2<0, 2<4, 1,5< 2) και το ίδιο ισχύει για τη στρατηγική Α-ΙΙ, η οποία επίσης είναι υποδεέστερη της Α-Ι (-1<0, 1<4, 1,5<2). Επίσης, για τον παίκτη Β η στρατηγική Β-ΙΙ είναι υποδεέστερη της Β-Ι (4>0, 1>-1, 2>1, 2>-2) Μετά την απαλοιφή των υποδεέστερων στρατηγικών για τους δύο παίκτες, ο πίνακας απολαβών του παιγνίου περιορίζεται σε δύο στρατηγικές ανά παίκτη, όπως φαίνεται στον Πίνακα 15. Πίνακας 15: Παίγνιο χωρίς σημείο ισορροπίας Η εφαρμογή των τεχνικών maximin και minimax δεν καταλήγει σε σημείο ισορροπίας για το παίγνιο. Επομένως, όποια και να είναι η επιλογή ενός παίκτη, ο έτερος παίκτης έχει πλεονέκτημα αλλαγής της στρατηγικής κ.ο.κ. Για παράδειγμα, επιλέγοντας ο Α την Α-Ι, 0 B επιλέγει τη Β-Ι, αλλά τότε ο Α επιλέγει την Α-ΙΙΙ και ο Β απαντά στη συνέχεια με Β-ΙΙΙ, στην οποία απαντά ο Α με Α-Ι κ.ο.κ. 18

Στα παίγνια όπου δεν υπάρχει σημείο ισορροπίας, κάθε παίκτης πρέπει να ακολουθεί μεικτή στρατηγική, δηλαδή να επιλέγει διαφορετικές στρατηγικές με συγκεκριμένη πιθανότητα για την καθεμία. Στο συγκεκριμένο παράδειγμα κάθε παίκτης διαθέτει δύο στρατηγικές, έχουμε δηλαδή ένα παίγνιο 2x2. Το ζητούμενο είναι να προσδιοριστούν οι πιθανότητες με τις οποίες κάθε παίκτης επιλέγει τις στρατηγικές του. Άνω και κάτω όριο στην τιμή του παιγνίου Όπως θα δούμε και στην Ενότητα 3, μπορούμε να αποδείξουμε ότι οι τιμές maximin και rninimax προσδιορίζουν το κάτω και άνω όριο (lower and upper value) της τιμής ισορροπίας του παιγνίου με μεικτές στρατηγικές και θα τις συμβολίσουμε με: V=max{min(a ij )} i j V=min j {max(a ij )} i όπου a ij τα στοιχεία του πίνακα απολαβών (16) Επομένως, όταν αυτές είναι ίσες, έχουμε ισορροπία με αμιγείς στρατηγικές, ενώ αν δεν υπάρχει σημείο ισορροπίας με αμιγείς στρατηγικές, η τιμή ισορροπίας του του παιγνίου με μεικτές στρατηγικές βρίσκεται μεταξύ των δύο αυτών ορίων. 3.1 Αλγεβρικός προσδιορισμός μεικτών στρατηγικών σε παίγνια 2x2 Συνεχίζοντας με το προηγούμενο παράδειγμα, ας υποθέσουμε ότι o παίκτης Α επιλέγει τη στρατηγική Α-Ι, με πιθανότητα p και επομένως τη στρατηγική Α-ΙΙΙ με 1-p. Αντίστοιχα, ο παίκτης Β επιλέγει τη στρατηγική Β-Ι με πιθανότητα q και τη στρατηγική Β-ΙΙΙ με πιθανότητα 1-q, όπως στον Πίνακα 16. Πίνακας 16: Πιθανότητες σε μεικτές στρατηγικές Βασική αρχή στον καθορισμό μεικτής στρατηγικής Ο βασικός στόχος στον καθορισμό βέλτιστης μεικτής στρατηγικής για έναν παίκτη είναι να αφαιρέσει κάθε πλεονέκτημα από τον άλλον παίκτη στο να επιλέξει μία εκ των στρατηγικών του, να τον καταστήσει δηλαδή αδιάφορο (χωρίς προτίμηση) ως προς ποια από ις επιλογές του είναι η καλύτερη. Ας δούμε δύο περιπτώσεις ώστε να κατανοήσουμε τι ακριβώς συμβαίνει στις μεικτές στρατηγικές: Αν p=1 και επομένως 1-p=0, αυτό σημαίνει ότι ο παίκτης Α επιλέγει πάντα τη στρατηγική Α-Ι, οπότε ο παίκτης Β σε αυτή την περίπτωση επιλέγει τη Β-Ι, που του δίνει καλύτερα αποτελέσματα από τη Β-ΙΙΙ. (Ο Β επιδιώκει την ελαχιστοποίηση των απολαβών του πίνακα.) 19

Αν p=0,25 και επομένως 1-p=0,75, αυτό σημαίνει ότι o παίκτης Α επιλέγει τις στρατηγικές Α-Ι και Α-ΙΙΙ με πιθανότητες 25% (1 στις 4 φορές) και 75% (3 στις 4) αντίστοιχα. Τότε το αναμενόμενο αποτέλεσμα για τον παίκτη Β αν επιλέξει τη στρατηγική Β-Ι θα είναι 0,25(0)+ 0,75(1) = 0,75, ενώ το αναμενόμενο αποτέλεσμα από τη Β-ΙΙΙ θα είναι 0,25(2)+0,75(-1) = -0,25, οπότε ο Β σε αυτή την περίπτωση επιλέγει τη Β-ΙΙΙ, που του δίνει καλύτερα αποτελέσματα από τη Β-Ι. Υπολογισμός πιθανοτήτων στη μεικτή στρατηγική λοιπόν για τον παίκτη Α είναι να επιλέξει τις πιθανότητες για τις δύο στρατηγικές με τέτοιον τρόπο ώστε τα αναμενόμενα αποτελέσματα από τον πίνακα απολαβών για τον παίκτη Β να είναι ίσα μεταξύ τους, έτσι ώστε ο Β να μην έχει κανένα πλεονέκτημα στην επιλογή μίας εκ των δύο στρατηγικών του. Ακριβώς το αντίστοιχο ισχύει για τον παίκτη Β. Οι πιθανότητες για τις δύο στρατηγικές του πρέπει να καθοριστούν με τρόπο που να καθιστούν τα αναμενόμενα αποτελέσματα των δύο στρατηγικών του Α ίσα μεταξύ τους. Παίκτης Α Αν οι πιθανότητες του παίκτη Α για τις δύο στρατηγικές του είναι ρ και 1 -p αντίστοιχα, το αναμενόμενο κέρδος για τον παίκτη Β για καθεμία από τις δικές του στρατηγικές του Είναι: Β-Ι: p(0)+(1-p)(1)=1-p (17) Β-ΙΙΙ: p(2)+(1-p)(-1)=-1+3p (18) Η μεικτή στρατηγική του Α είναι βέλτιστη όταν τα αναμενόμενα κέρδη του Β εξισώνονται. Από τις (17) και (18) προκύπτει: 1-p=-1+3p=>-4p=-2=>p=0,5 και επομένως 1-p=0,5 Παίκτης Β Αν οι πιθανότητες του παίκτη Β για τις δύο στρατηγικές του είναι q και 1 - q αντίστοιχα, το αναμενόμενο κέρδος για τον παίκτη Α για καθεμία από τις δικές του στρατηγικές του είναι: A1: q(0)+(1-q)=2-2q (19) Α-ΙΙΙ: q(1)+(1-q)(-1)=-1+2q (20) Ομοίως, η μεικτή στρατηγική του Β είναι βέλτιστη όταν τα αναμενόμενα κέρδη του Β εξισώνονται, και από τις (19) και (20) προκύπτει: 2-2q=-1+2q=>-4q=-3=>q=0,75 και επομένως 1-q=0,25 Παρατηρούμε ότι για τις συγκεκριμένες τιμές των πιθανοτήτων οι απολαβές για τους δύο παίκτες είναι ίσες μεταξύ τους και ορίζουν την τιμή ισορροπίας του παιγνίου: V(A)=0,75(0)+0,25(1)=0,75(1)+0,25(-1)=0,50 V(B)=0,5(0)+0,5(-1)=0,5(2)+0,5(-1)=0,50 Επομένως, όταν το παίγνιο επαναλαμβάνεται, ο παίκτης Α επιλέγει στο 50% των περιπτώσεων τη στρατηγική Α-Ι και στο 50% την Α-ΙΙΙ, ενώ ο παίκτης Β επιλέγει στο 75% (3 στις 4) των περιπτώσεων τη στρατηγική Β-Ι και στο 25% (1 στις 4) τη 20

στρατηγική Β-ΙΙΙ, με αποτέλεσμα η τιμή του παιγνίου για τον παίκτη Α να είναι ίση με αυτή του παίκτη B. Έτσι, ο παίκτης Α έχει κέρδος 0,50 ενώ ο B χάνει 0,50. V = V(A) = V(B) = 0,50 Τιμή ισορροπίας Όπως τονίσαμε και προηγουμένως, η κατάσταση της ισορροπίας σε ένα παίγνιο είτε αυτή επιτυγχάνεται με αμιγείς είτε με μεικτές στρατηγικές, δεν σημαίνει ότι και οι δύο παίκτες λαμβάνουν ίσες απολαβές -κάτι που δεν είναι εξάλλου εφικτό σε ένα παίγνιο μηδενικού αθροίσματος- αλλά ότι αυτή είναι η καλύτερη στρατηγική για καθέναν από τους παίκτες. Ο παραπάνω αλγεβρικός τρόπος προσδιορισμού μεικτών στρατηγικών σε παίγνιο μηδενικού αθροίσματος μπορεί να επεκταθεί και σε οποιοδήποτε παίγνιο όπου οι παίκτες μετά την απαλοιφή τυχόν υποδεέστερων στρατηγικών διαθέτουν τον ίδιο αριθμό στρατηγικών. Καθορισμός μεικτών στρατηγικών σε παίγνιο 3x3 Στο παίγνιο μηδενικού αθροίσματος του Πίνακα 17 δεν υπάρχουν υποδεέστερες στρατηγικές για κανέναν από τους δύο παίκτες και επίσης, μετά την εφαρμογή των κριτηρίων maximin και minimax, διαπιστώνουμε ότι δεν υπάρχει σημείο ισορροπίας. Πίνακας 17: Παίγνιο μηδενικού αθροίσματος 3x3 Επομένως, προχωρούμε στην αναζήτηση μεικτών στρατηγικών, θέτοντας πιθανότητες (p1, p2, p3) για τις στρατηγικές του παίκτη Α και (q1, q2, q3) αντίστοιχα για τον παίκτη Β. Παίκτης Β Έτσι για μια δεδομένη μεικτή στρατηγική του παίκτη B, οι απολαβές για παίκτη Α έχουν ως εξής: V(A1)=7q1+4q2+q3 V(A2) =2q1-1q2+5q3 V(A3)= 3q1+8q2 O παίκτης B επιθυμεί να καθορίσει τις τιμές των πιθανοτήτων q1, q2, q3 με τέτοιον τρόπο, ώστε V(A1) = V(A2) = V(A3). Από τη σχέση αυτή παράγονται δύο εξισώσεις: V(A1)=V(A2)=> 7q1+4q2+q3=2q1-1q2+5q3 =>5q1+5q2-4q3=0 (21) V(A1)=V(A3)=> 7q1+4q2+q3=3q1+8q2=>4q1-4q2+4q3=0 (22) 21

Επίσης, οι πιθανότητες q1, q2, q3, εξ ορισμού πρέπει να αθροίζουν στη μονάδα, άρα έχουμε: q1+q2+q3=1 (23) Η επίλυση του συστήματος των γραμμικών εξισώσεων (21), (22) και (23) δίνει τις τιμές των q1, q2, q3. (21) -5 x (23): 5q1+5q2-4q3-5(q1+q2+q3)=-5=>9q3=-5=>q3=5/9 (22) -4 x (23): 4q1-4q2+4q3-4(q1+q2+q3)=-4=>-8q2-3q3=-4=> -8q2-(5/9)=-4=> q2=7/24 (23) Με αντικατάσταση τιμών: q1=1-5/9=7/24=> q1=11/72 Επομένως, ο παίκτης Β επιλέγει τις τρεις στρατηγικές του με πιθανότητες (11/72, 7/24, 5/9) ή ισοδύναμα (11/72, 21/72, 40/72). Παίκτης Α Αντίστοιχη είναι η προσέγγιση για τον παίκτη Α, όπου για μία δεδομένη μεικτή στρατηγική του οι απολαβές για τον παίκτη Β έχουν ως εξής: V(B1) =7p1+2p2+3p3 V(B2) =4p1-1p2+8p3 V(B3)=1p1+5p2 Ο παίκτης Α επιθυμεί να καθορίσει τις τιμές των πιθανοτήτων p1,p2,p3 με τέτοιον τρόπο ώστε V(B1) = V(B2) = V(B3). Από τη σχέση αυτή παράγονται δύο εξισώσεις: V(B1)=V(B2)=> 7p1+2p2+3p3=4p1-1p2+8p3=>3p1+3p2-5p3=0 (24) V(B1)=V(B3)=7p1+2p2+3p3=1p1+5p2=6p1+3p2+3p3=0 (25) Επίσης, οι πιθανότητες p1, p2, p3, εξ ορισμού πρέπει να αθροίζουν στη μονάδα, άρα έχουμε: p1+p2+p3=1 (26) H επίλυση του συστήματος των γραμμικών εξισώσεων (24), (25) και (26) δίνει τις τιμές των p1, p2, p3 (24)-3x(26): 3p1+3p2-5p3-3(p1+p2+p3)=-3=>-8p3=-3=>p3=3/8 (25)+3x(26): 6p1-3p2+3p3+3(p1+p2+p3)=3=> 9p1 +6p3=3=>9p1+ 6(3/8) = 3=> 9p1=3-9/4 =>9p1=3/4=>p1=3/36 (26) Με αντικατάσταση τιμών: p2= 1-3/8-3/36=>p2=39/72 Επομένως, o παίκτης Α επιλέγει τις τρεις στρατηγικές του με πιθανότητες (3/36, 39/72, 3/8) ή ισοδύναμα (6/72, 39/72, 27/72). Τιμή ισορροπίας Η τιμή ισορροπίας του παιγνίου είναι 201/72, η οποία υπολογίζεται με αντικατάσταση των πιθανοτήτων που ορίζουν τις μεικτές στρατηγικές κάθε παίκτη στον υπολογισμό των απολαβών του άλλου παίκτη. 22

V(A1) = 7(11/72) + 4(21/72) + (40/72) = 201/72 V(A2)= 2(11/72) - 1(21/72) + 5(40/72) = 201/72 V(A3) = 3(11/72) + 8(21/72) = 201/72 V(B1) = 7(6/72)+2(39/72)+ 3(27/72) = 201/72 V(B2) = 4(6/72) - 1(39/72) + 8(27/72) = 201/72 V(B3) = 1(6/72) + 5(39/72) = 201/72 3.2 Προσδιορισμός μεικτών στρατηγικών σε παίγνια 2xm ή mx2 Στην περίπτωση που ο ένας εκ των δύο παικτών, μετά την απαλοιφή υποδεέστερων στρατηγικών, διαθέτει μόνο δύο στρατηγικές, ενώ ο άλλος παίκτης περισσότερες από δύο, είναι δυνατόν να εφαρμοστεί ο αλγεβρικός προσδιορισμός των πιθανοτήτων που καθορίζουν τις μεικτές στρατηγικές όπως αναπτύχθηκε στην προηγούμενη ενότητα. Σε αυτή την περίπτωση απαιτείται η μείωση των στρατηγικών του παίκτη που διαθέτει πάνω δύο στρατηγικές σε μόνο δύο στρατηγικές, ώστε το παίγνιο να μετατραπεί σε ένα 2x2 παίγνιο. Αυτό μπορεί να επιτευχθεί εξετάζοντας τις απολαβές για τον παίκτη με τις περισσότερες από δύο στρατηγικές σε σχέση με τη μεικτή στρατηγική που θα ακολουθήσει ο παίκτης που διαθέτει μόνο δύο στρατηγικές. Η γραφική μέθοδος επίλυσης που θα αναπτύξουμε στη συνέχεια εξηγεί τον μηχανισμό μείωσης ενός παιγνίου διαστάσεων ή mx2 σε ένα παίγνιο διαστάσεων 2x2. Παράδειγμα: Μεικτή στρατηγική σε παίγνιο 4x4 Δύο εταιρείες κινητής τηλεφωνίας έχουν προχωρήσει στην εγκατάσταση δικτύου οπτικών ινών που μοιράζονται και προχωρούν στην παροχή και υπηρεσιών σταθερής τηλεφωνίας με μειωμένες τιμές σχετικά με τον κύριο πάροχο σταθερής τηλεφωνίας εκτιμώντας ότι θα αποσπάσουν συνολικά ένα τμήμα της αγοράς υπηρεσιών σταθερής τηλεφωνίας σε επιχειρήσεις με συνολικό ετήσιο κύκλο εργασιών 300.000.000. Οι δύο εταιρείες μπορούν να χρησιμοποιήσουν τέσσερις διαφορετικές στρατηγικές στην προσπάθειά τους να αποσπάσουν το μεγαλύτερο τμήμα της παραπάνω αγοράς οι οποίες είναι οι ακόλουθες: 1) Προσφορά μειωμένης τιμής για ενδοεταιρικές επικοινωνίες. 2) πακέτα προσφορών στους εργαζομένους. 3) Πάγια σταθερή τιμή στη χρήση της σταθερής τηλεφωνίας ανεξαρτήτως τηλεπικοινωνιακού όγκου. 4) Διαφημιστικά banner των πελατών στην ιστοσελίδα της εταιρείας. Ο πίνακας που ακολουθεί περιλαμβάνει τις εκτιμήσεις για τον ετήσιο τζίρο για την εταιρεία Α, για κάθε συνδυασμό των παραπάνω στρατηγικών. 23

Απαλοιφή υποδεέστερων στρατηγικών Η στρατηγική Α3 υποδεέστερη της ΑΙ (180 < 200, 250 < 300, 150 < 160, 60 < 80). Επίσης η στρατηγική Β2 είναι υποδεέστερη της ΒΙ (300 > 200, 240 > 180, 250 > 180, 160) και η B υποδεέστερη της 84 (160 > 80, 140 > 120, 150 > 60, 250 > 240). Μετά την απαλοιφή των υποδεέστερων στρατηγικών Α3, Β2 και Β3, ο πίνακας απολαβών διαμορφώνεται ως εξής: Πίνακας 18: Πίνακας απολαβών έπειτα από απαλοιφή υποδεέστερων στρατηγικών Διαπιστώνουμε, όπως φαίνεται στον Πίνακα 8, ότι οι τιμές του maximin και minimax κριτηρίου δεν συμπίπτουν, επομένως δεν υπάρχει σημείο ισορροπίας με αμιγείς στρατηγικές και οι δύο παίκτες θα ακολουθήσουν μεικτές στρατηγικές. Ο παίκτης Β διαθέτει δύο στρατηγικές, τη ΒΙ και τη Β4, τις οποίες θα επιλέγει με πιθανότητες q και 1-q αντίστοιχα. Ας δούμε ποιες είναι οι τιμές του παιγνίου για τον παίκτη Α για καθεμία από τις τρειις στρατηγικές του: V(A1) = 200q + 80(1 -q) = 80 + 120q (27) V(A2) = 180q + 120(1 - q) = 120 + 60q (28) V(A4) = 1609 + 240(1 -q) = 240-80q (29) (27) Ανάλογα με την τιμή q που θα επιλέξει ο παίκτης Β, o παίκτης Α θα επιλέξει δική του στρατηγική αυτή που του δίνει μεγαλύτερη τιμή. Για παράδειγμα, για q = 0: V(A4)=240, V(A2)=120, V(A1)=80, όπως φαίνονται και στο διάγραμμα του Σχήματος 1, για q=0,2 πάλι ισχύει V(A4) > V(A2) > V(A1), ενώ για q = 1, η V(A1) είναι η μεγαλύτερη τιμή για τον Α. Το διάγραμμα του Σχήματος 1 παρουσιάζει τη γραφική παράσταση των τριών συναρτήσεων (27), (28) και (29) της τιμής του παιγνίου για τον παίκτη Α για τιμές του q μεταξύ 0 και 1. 24