Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ» Του σπουδαστή ΚΑΡΑΜΙΓΚΟΥ ΘΕΜΙΣΤΟΚΛΗ



Σχετικά έγγραφα
δημιουργία: επεξεργασία: Ν.Τσάντας

ΘΕΩΡΙΑ ΤΩΝ ΠΑΙΓΝΙΩΝ I.

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

ΑΣΚΗΣΗ 1 ΑΣΚΗΣΗ 2 ΑΣΚΗΣΗ 3

Κεφ. 9 Ανάλυση αποφάσεων

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Β. Βασιλειάδης Αν. Καθηγητής. Επιχειρησιακή Ερευνα Διάλεξη 6 η - Θεωρεία Παιγνίων

Βασικές Αρχές της Θεωρίας Παιγνίων

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

Αλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες


Θεωρία Παιγνίων και Αποφάσεων

2. ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Δεύτερο πακέτο ασκήσεων

Περιεχόμενα. 1. Ανάλυση ευαισθησίας. (1) Ανάλυση ευαισθησίας (2) Δυϊκό πρόβλημα (κανονική μορφή) (3) Δυαδικός προγραμματισμός (4) Ανάλυση αποφάσεων


Κεφάλαιο 29 Θεωρία παιγνίων

z = c 1 x 1 + c 2 x c n x n

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

- Παράδειγμα 2. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να

Μελέτη πάνω στην εφαρμογή της θεωρίας παιγνίων σε θέματα πολεμικών τακτικών και στρατηγικής.

Θεωρία Δυαδικότητας ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ. Η παρουσίαση προετοιμάστηκε από τον Ν.Α. Παναγιώτου. Επιχειρησιακή Έρευνα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Γραμμικός Προγραμματισμός Μέθοδος Simplex

Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α

3.7 Παραδείγματα Μεθόδου Simplex

ΤΕΙ Χαλκίδας Σχολή Διοίκησης και Οικονομίας Τμήμα Διοίκησης Επιχειρήσεων

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 9: Λύσεις παιγνίων δύο παικτών

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

Επιχειρησιακή Έρευνα I

Κοινωνικά Δίκτυα Θεωρία Παιγνίων

6. Παίγνια αλληλοδιαδοχικών κινήσεων και η αξία του περιορισμού των επιλογών κάποιου ατόμου

Notes. Notes. Notes. Notes Ε 10,10 0,3 Λ 3,0 2,2

Συνδυαστική Βελτιστοποίηση Εισαγωγή στον γραμμικό προγραμματισμό (ΓΠ)

ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΤΗΣ ΜΕΘΟΔΟΥ SIMPLEX

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

Διάλεξη 7. Θεωρία παιγνίων VA 28, 29

Πακέτο Επιχειρησιακή Έρευνα #02 ==============================================================

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ

10/3/17. Κεφάλαιο 28 Ολιγοπώλιο. Μικροοικονομική. Ολιγοπώλιο. Ολιγοπώλιο. Ανταγωνισµός ποσότητας. Μια σύγχρονη προσέγγιση

Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Στοχαστικές Στρατηγικές

( ) ΘΕΜΑ 1 κανονική κατανομή

Notes. Notes. Notes. Notes

ΚΕΦΑΛΑΙΟ 4. Ακέραια Πολύεδρα

Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Επιχειρησιακή Έρευνα I

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Α2 Β2 Γ2 2 Α1 1,0 5,-1-1,-2 9,-2 Β1 2,1-2,0 0,2 0,-1 Γ1 0,3 14,2 2,1 8,1 1 1,2 0,1 3,0-1,0

ΓΡΑΜΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ (Γ.Π.).) (LINEAR PROGRAMMING)

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

A 2 B 2 Γ 2. u 1 (A 1, A 2 ) = 3 > 1 = u 1 (B 1, A 2 ) u 1 (A 1, Γ 2 ) = 1 > 0 = u 1 (B 1, Γ 2 ) A 2 B 2

Ολιγοπωλιακή Ισορροπία

Επιχειρησιακή Έρευνα I

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 8: Πεπερασμένα επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Γραφική Λύση & Πρότυπη Μορφή Μαθηματικού Μοντέλου

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 12: Δημοπρασίες ανερχόμενων και κατερχόμενων προσφορών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΓΡΑΜΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΚΑΙ ΜΕΘΟΔΟΣ SIMPLEX, διαλ. 3. Ανωτάτη Σχολή Παιδαγωγικής και Τεχνολογικής Εκπαίδευσης 29/4/2017

ΤΕΙ υτικής Μακεδονίας -Τµήµα ιοίκησης επιχειρήσεων- Μάθηµα: Ποσοτικές µέθοδοι στη διοίκηση επιχειρήσεων- ΣΤ Εξάµηνο

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΕΤΑΡΤΟ ΠΑΙΓΝΙΑ ΜΗ ΕΝΙΚΟΥ ΑΘΡΟΙΣΜΑΤΟΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Τμήμα Μηχανικών Πληροφορικής ΤΕ Δυϊκότητα. Γκόγκος Χρήστος ΤΕΙ Ηπείρου Επιχειρησιακή Έρευνα. τελευταία ενημέρωση: 1/12/2016

Άριστες κατά Pareto Κατανομές και το Πρώτο Θεώρημα Ευημερίας

Άριστες κατά Pareto Κατανομές και το Πρώτο Θεώρημα Ευημερίας

ΕΝΑΣ ΔΙΚΡΙΤΗΡΙΟΣ ΑΛΓΟΡΙΘΜΟΣ SIMPLEX

Κυριαρχία και μεικτές στρατηγικές Μεικτές στρατηγικές και κυριαρχία Είδαμε ότι μια στρατηγική του παίκτη i είναι κυριαρχούμενη, αν υπάρχει κάποια άλλη

Fermat, 1638, Newton Euler, Lagrange, 1807

Το παράδοξο του St. Petersburg Η θεωρία του καταναλωτή σε περιβάλλον αβεβαιότητας που εξετάσαμε μπόρεσε να δώσει απάντηση σε κάποια ερωτήματα που πριν

Εισαγωγή στο Γραμμικό Προγραμματισμό. Χειμερινό Εξάμηνο

ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΑΚ. ΕΤΟΣ ΔΙΑΛΕΞΗ 6 η -Η ΔΥΙΚΗ ΜΕΘΟΔΟΣ SIMPLEX

Ένα Παίγνιο (game) ορίζεται ως μια δραστηριότητα με τα ακόλουθα τρία χαρακτηριστικά:

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Για την τοπική μελέτη μιας συνάρτησης f ενδιαφέρον έχει η συμπεριφορά της συνάρτησης γύρω απο κάποια θέση x 0

Τεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Case 08: Επιλογή Διαφημιστικών Μέσων Ι ΣΕΝΑΡΙΟ (1)

Case 10: Ανάλυση Νεκρού Σημείου (Break Even Analysis) με περιορισμούς ΣΕΝΑΡΙΟ

Μεταξύ του µονοπωλίου και του τέλειου ανταγωνισµού

Συμπληρωματικές Σημειώσεις για τη Διάλεξη 8

ΑΣΚΗΣΗ 1 Βρείτε την ισορροπία των ακόλουθων παιγνίων απαλείφοντας διαδοχικά τις κυριαρχούµενες στρατηγικές.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Ασκήσεις μελέτης της 6 ης διάλεξης

Επιχειρησιακή Έρευνα

Άριστες κατά Pareto Κατανομές

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 11: Σχεδίαση μηχανισμών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Πληροφοριακά Συστήματα Διοίκησης. Θεωρία Αποφάσεων

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Αναζητάμε το εβδομαδιαίο πρόγραμμα παραγωγής που θα μεγιστοποιήσει 1/20

ΑΛΓΟΡΙΘΜΟΙ Ενότητα 10

Τμήμα Εφαρμοσμένης Πληροφορικής

Κεφάλαιο 2ο (α) Αµιγείς Στρατηγικές (β) Μεικτές Στρατηγικές (α) Αµιγείς Στρατηγικές. Επαναλαµβάνουµε:

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Transcript:

Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ» Του σπουδαστή ΚΑΡΑΜΙΓΚΟΥ ΘΕΜΙΣΤΟΚΛΗ Επιβλέπων Δρ. ΓΕΡΟΝΤΙΔΗΣ ΙΩΑΝΝΗΣ Αναπληρωτής Καθηγητής ΚΑΒΑΛΑ 2006 0

ΠΕΡΙΕΧΟΜΕΝA Σελίδα ΕIΣΑΓΩΓΗ 3 ΚΕΦΑΛΑΙΟ 1 ο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΑΙΓΝΙΩΝ 1.1 Η ιστορία στην θεωρία παιγνίων 5 1.2 Βασικές έννοιες παιγνίων 6 1.2.1 Παιχνίδια δύο ατόμων, μηδενικού αθροίσματος και σταθερού 8 αθροίσματος: σημεία σάγματος 1.2.2 Βασική υπόθεση για το παιχνίδι δύο προσώπων μηδενικού 9 αθροίσματος 1.2.3 Παιχνίδια δύο παιχτών σταθερού αθροίσματος 12 ΚΕΦΑΛΑΙΟ 2 ο ΣΤΡΑΤΗΓΙΚΕΣ ΠΑΙΓΝΙΩΝ 2.1 Αμιγής στρατηγική 14 2.2 Στρατηγική maximin και minimax 15 2.3 Σημείο ισορροπίας 17 2.4 Κυρίαρχη στρατηγική 20 2.5 Μικτή στρατηγική 22 ΚΕΦΑΛΑΙΟ 3 ο ΠΑΙΓΝΙΑ ΔΥΟ ΠΡΟΣΩΠΩΝ ΜΗ ΣΤΑΘΕΡΟΥ ΠΟΣΟΥ 3.1 Το δίλημμα του φυλακισμένων 26 3.2 Ορισμός 27 ΚΕΦΑΛΑΙΟ 4 ο ΘΕΩΡΙΑ ΠΑΙΧΝΙΔΙΩΝ n-προσωπων 1

4.1 Παραδείγματα 33 4.2 Ο πυρήνας παιχνιδιού n-προσώπων 36 4.3 Αξία shapley 44 ΚΕΦΑΛΑΙΟ 5 ο ΓΡΑΜΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΚΑΙ ΠΑΙΧΝΙΔΙΑ ΜΗΔΕΝΙΚΟΥ ΑΘΡΟΙΣΜΑΤΟΣ 5.1 Γραμμικός προγραμματισμός στη θεωρία παιγνίων 49 5.2 Παιχνίδια μηδενικού αθροίσματος 67 ΚΕΦΑΛΑΙΟ 6 ο ΓΡΑΦΙΚΗ ΜΕΘΟΔΟΣ ΕΠΙΛΥΣΗΣ ΠΑΙΓΝΙΟΥ 6.1 Παίγνιο 2xn 72 6.2 Παίγνιο nx2 76 2

ΕΙΣΑΓΩΓΗ Στην εργασία αυτήν θα ασχοληθούμε με την παρουσίαση των βασικών εννοιών και τεχνικών της θεωρίας παιγνίων με την οποία αντιμετωπίζουμε καταστάσεις ανταγωνιστικής αλληλεξάρτησης μεταξύ δύο ή περισσότερων παιχτών. Στην αρχή θα αναφερθούμε στης βασικές έννοιες της θεωρίας παιγνίων που χρησιμοποιούμε για την λήψη αποφάσεων σε καταστάσεις ανταγωνισμού ή σύγκρουσης. Στην συνέχεια θα αναπτύξουμε τα είδη στρατηγικής δηλαδή την αμιγή στρατηγική για την επίλυση παιγνίων δύο παικτών μηδενικού αθροίσματος, στα οποία υπάρχει σημείο ισορροπίας. Κατόπιν θα επιλύσουμε ένα παίγνιο δύο- παιχτών μηδενικού αθροίσματος που δεν έχει σημείο ισορροπίας, χρησιμοποιώντας μικτές στρατηγικές των δύο - παιχτών. Ακόμα θα δείξουμε πως ένα παίγνιο 2 n n n 2 για μπορεί να μετατραπεί με τη γραφική μέθοδο σε ένα παίγνιο 2 2 n 2, επίλυση του οποίου είναι και ποιο εύκολη. Επίσης θα παρουσιάσουμε και τον τρόπο, με τον οποίο ένα παίγνιο χωρίς σημείο ισορροπίας μπορεί να διαμορφωθεί ως μοντέλο γραμμικού προγραμματισμού, ώστε να επιλυθεί με την μέθοδο simplex. Η εργασία αυτή αποτελείται από έξη κεφάλαια: Στο πρώτο κεφάλαιο, θα ασχοληθούμε με της βασικές έννοιες των παιγνίων αλλά και με την ιστορία της θεωρίας των παιγνίων. Θα δώσουμε τον ορισμό του παίχτη(player) και της στρατηγικής(strategy). Επίσης θα δούμε τα παίγνια 2-προσωπων μηδενικού αθροίσματος αλλά και σταθερού αθροίσματος. Στο δεύτερο κεφάλαιο, θα ασχοληθούμε με τις στρατηγικές παιγνίων δηλαδή με την αμιγή στρατηγική, κυρίαρχη στρατηγική και μικτή στρατηγική, αλλά και τη στρατηγική minimax και maximin και το σημείο ισορροπίας. Στο τρίτο κεφάλαιο, θα ασχοληθούμε με τα παίγνια δυο προσώπων μη σταθερού ποσού. θα δούμε τον ορισμό και θα αναπτύξουμε το δίλημμα, η 3

του φυλακισμένου χρησιμοποιώντας μερικά παραδείγματα για την καλύτερη κατανόηση του διλήμματος. Στο τέταρτο κεφάλαιο, θα δούμε και θα αναπτύξουμε την θεωρία παιγνίων n- προσώπων μέσο του ορισμού και παραδειγμάτων. Στην συνέχεια μερικά παραδείγματα θα μας βοηθήσουν στην καλύτερη κατανόηση του Πυρήνα των παιχνιδιών n-προσώπων, ενώ θα αναφερθούμε και στην αξία shαpley δίνοντας και εκεί κάποια παραδείγματα. Στο κεφάλαιο πέντε, θα ασχοληθούμε με τον γραμμικό προγραμματισμό στην θεωρία παιγνίων μέσω ενός παραδείγματος του γνωστού παιχνιδιού πέτρα, ψαλίδι, χαρτί με την βοήθεια πινάκων και μεταβλητών, αλλά επίσης και τα προβλήματα του γραμμικού προγραμματισμού για τον παίκτη γραμμών και στηλών αλλά και η μεταξύ τους σχέση. Τέλος θα δούμε και τα παιχνίδια μηδενικού αθροίσματος. Τέλος στο έκτο κεφάλαιο, θα δούμε την γραφική μέθοδο επίλυσης παιγνίων. Στην αρχή θα εξετάσουμε την γραφική μέθοδο 2xn και στην συνέχεια την γραφική μέθοδο nx2. 4

ΚΕΦΑΛΑΙΟ 1o: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΑΙΓΝΙΩΝ 1.1 Η ΙΣΤΟΡΙΑ ΤΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Η ιστορία των παιχνιδιών matrix και οι γενικεύσεις τους αρχίζει το 1910 με το θεώρημα σταθερού σημείου του Brouwer. Η μαθηματική δήλωση αυτού του θεωρήματος είναι λίγο δυσνόητη, αλλά η ερμηνεία δεν είναι. Το 1928, John Von Neumann χρησιμοποίησε το θεώρημα σταθερού σημείου του Brouwer για να δείξει ότι κάθε μηδενικού - αθροίσματος παίγνιο έχει μια "minimax" λύση, για να καταδείξει αποτελεσματικά ότι κάθε τέτοιο παιχνίδι έχει μια ισορροπία. Η χρήση του θεωρήματος σταθερού σημείου του Brouwer, από τον Von Neumann δεν απέδωσε το αναμενόμενο αποτέλεσμα, αφού ήταν μη εποικοδομητική και δεν παρείχε κανέναν τρόπο με τον οποίο να υπολογίσει το σταθερό σημείο. Το 1947, George Dantzig επινόησε τη μέθοδο Simplex, η οποία υπολογίζει εύκολα τις λύσεις σε γραμμικά προγράμματα. Αργότερα εκείνο το έτος, σε μια γιορταστική συνομιλία σε έναν σταθμό σιδηροδρόμου στο Princeton, ο Dantzig ενημέρωσε το Von Neumann για την εργασία του για το γραμμικό προγραμματισμό. Ο Von Neumann αμέσως συνειδητοποίησε ότι το πρόγραμμα 16.1 κατασκευάζει μια λύση στο μηδενικό παιχνίδι matrix του. Αυτό σήμανε ότι οι λύσεις σε αυτά τα παιχνίδια όχι μόνο υπήρχαν αλλά μπορούσαν και να βρεθούν. Επίσης σήμανε ότι, ως αναλυτικό εργαλείο, το θεώρημα σταθερού σημείου του Brouwer ήταν ξεπερασμένο όσον αφορά στα μηδενικά παιχνίδια matrix. Το 1950-1951 ο John Nash δημοσίευσε κάποια άρθρα του που χρησιμοποίησαν το θεώρημα σταθερού σημείου του Brouwer για να καταδείξουν την ύπαρξη διάφορων τύπων ισορροπιών, συμπεριλαμβανομένης αυτής για ένα βισμούθιο - παιχνίδι matrix. Για αυτήν την εργασία, ο Nash μοιράστηκε το βραβείο Νόμπελ στα οικονομικά σε 1994. Το 1964-1965, ο Carl Lemke δημοσίευσε ένα ζευγάρι άρθρων με συνυπογράφοντα τον Τ. Howson, το οποίο εισήγαγε τις συμπληρωματικές 5

μεθόδους άξονα. Αυτές οι μέθοδοι αναδιοργανώνουν το σχέδιο άξονα στη μέθοδο Simplex του Dantzig στους τρόπους που κατασκευάζουν μια ισορροπία για ένα διμητρώο παιχνίδι, υπολογίζουν τις λύσεις στα "τετραγωνικά" προγράμματα, και λύνουν άλλα προβλήματα. Σχεδόν αμέσως ο Herbert Scarf είδε πώς να προσαρμόσει τις ιδέες των Lemke και Howson για να κατασκευάσει μια κατά προσέγγιση λύση στο πρόβλημα σταθερού σημείου του Brouwer και με αυτόν τον τρόπο να υπολογίσει προσεγγιστικά τις οικονομικές ισορροπίες. 1.2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΑΙΓΝΙΩΝ Η λήψη αποφάσεων διαφέρει από προβλήματα σε προβλήματα και αυτό αφού σε πολλά προβλήματα υπάρχει μόνο ένας ιθύνων που έχει σαν σκοπό να εφαρμόσει αυτές τις ενέργειες ώστε να μεγιστοποιήσει την ευημερία του/της. Η θεωρία παιχνιδιών είναι η μελέτη των προτύπων λήψης αποφάσεων δύο ή περισσότερων υπεύθυνων για τη λήψη αποφάσεων οι των οποίων ενέργειες έχουν επιπτώσεις στην ο ένας του άλλου ευημερία. Τα μοντέλα της θεωρίας παιχνιδιών καλύπτουν την ανταγωνιστική συμπεριφορά, τη συνεταιριστική συμπεριφορά, και τα μίγματα των δύο. Τα παιχνίδια που έχουν τρεις ή περισσότερους τύπους παικτών μπορούν να διαμορφώσουν το σχηματισμό των συνασπισμών, δηλαδή των ομάδων συμμετεχόντων που ενώνονται μαζί για να βελτιώσουν την ευημερία τους εις βάρος του υπολοίπου. Σε περίπτωση ανταγωνισμού ή σύγκρουσης, απάντηση στα προβλήματα για την σωστή λήξη αποφάσεων μπορεί να δοθεί μέσα από την θεωρία παιγνίων. Θα μπορούσαμε να θεωρήσουμε ως παίγνιο (game) την κατάσταση εκείνη, κατά την οποία δύο ή περισσότεροι ορθολογικοί παίκτες με αντικρουόμενους στόχους επιλέγουν τρόπους ενεργές, που δημιουργούν συνθήκες ανταγωνιστικής αλληλεξάρτησης. Τα στοιχεία του παιγνίου είναι οι παίκτες, οι κανόνες που το διέπουν, οι πληροφορίες, οι αξιολόγηση των διάφορων αποτελεσμάτων από τους παίκτες αλλά και οι μεταβολές που ελέγχονται από αυτούς. Τα στοιχεία αυτά είναι κοινά σε όλες τις 6

ανταγωνιστικές καταστάσεις και αποτελούν το θεμέλιο λίθο της θεωρίας παιγνίων. Ο παίκτης (player) θεωρείται αυτόνομη μονάδα λήψης της απόφασης, παρά το γεγονός ότι δεν ελέγχει όλους τους παράγοντες που επηρεάζουν το αποτέλεσμα του παιγνίου. Ο παίκτης μπορεί να είναι ομάδα ατόμων, επιχείρηση ή ένα άτομο και έχει ένα αντικειμενικό σκοπό που μέσα από τους κανόνες του παιγνίου προσπαθεί να βελτιστοποίηση. Στρατηγική (strategy) ενός παίκτη είναι το σύνολο των κανόνων που ορίζουν τις εφικτές επιλογές, τις οποίες δύναται να ακολουθεί σε κάθε κίνηση του μέχρι το τέλος του παιγνίου, γνωρίζονται όλες τις πληροφορίες που αφορούν τις κινήσεις του αντίπαλου παίκτη. Η έννοια της στρατηγικής είναι η ίδια σε όλα τα ανταγωνιζόμενα μέρη, είτε πρόκειται για άτομα, είτε για επιχειρήσεις. Στην θεωρία παιγνίων υπάρχουν 2 είδη στρατηγικής, την αμιγή και την μικτή στρατηγική. Αμιγής στρατηγική (pure strategy) είναι εκείνη, στην οποία κάθε παίκτης επιλέγει μια μόνο από τις δυνατές στρατηγικές του στο ακέραιο, δηλαδή με πιθανότητα ίση με την μονάδα, ενώ δεν επιλέγει καμιά από της υπόλοιπες. Η μικτή στρατηγική (mixed strategy) περιλαμβάνει συνδυασμό στρατηγικών, καθεμία από τις οποίες επιλέγεται με πιθανότητα μικρότερη της μονάδας. Η θεωρία παιχνιδιών διαδραματίζει τους σημαντικούς ρόλους στην πολιτική, την επιχείρηση, τις στρατιωτικές υποθέσεις και στην πολιτικές επιστήμες, τα οικονομικά και την έρευνα διαδικασιών. Στην θεωρία παιγνίων διέπεται από την παραδοχή, ότι ο αριθμός των παιχτών είναι πεπερασμένος ( n 2 ). Δύο όροι που έρχονται γρήγορα να απασχολήσουν είναι το παίγνιο μηδενικού αθροίσματος (zero sum game) και το παίγνιο μη μηδενικού αθροίσματος (nonzero sum game). Παίγνιο μηδενικού αθροίσματος (zero sum game) είναι εκείνο, στο οποίο το κέρδος του ενός παίκτη είναι το ίσο με την ζημία του άλλου ή των άλλων παιχτών. Αντίθετα, αν αυτό δεν συμβαίνει, επειδή κάποιο τρίτο μέρος λαμβάνει ορισμένες ανταμοιβές, τότε πρόκειται για παίγνιο μη μηδενικού αθροίσματος (nonzero sum game). Ένα παίγνιο 2- παιχτων περιγράφεται συνήθως με ένα πίνακα αποδόσεων ή πληρωμών ή ανταμοιβών (payoff matrix) που δείχνει τα αποτελέσματα των στρατηγικών 7

των παιχτών. Σε αυτά τα παίγνια, λύση είναι η βέλτιστη στρατηγική όλων των παιχτών. 1.2.1 Παιχνίδια Δύο Ατόμων, Μηδενικού Αθροίσματος και Σταθερού Αθροίσματος: Σημεία Σάγματος Χαρακτηριστικά των παιχνιδιών δύο ατόμων μηδενικού αθροίσματος. 1. Υπάρχουν δύο παίκτες (αποκαλούμενοι παίκτης στηλών και παίκτης σειρών). 2. Ο παίκτης σειρών πρέπει να επιλέξει 1 από τις m στρατηγικές. Ταυτόχρονα, ο παίκτης στηλών πρέπει να επιλέξει 1 από τις n στρατηγικές. 3. Εάν ο παίκτης σειρών επιλέγει την i-οστή στρατηγική και ο παίκτης στηλών επιλέγει την j-οστή στρατηγική κατόπιν ο παίκτης σειρών λαμβάνει μια ανταμοιβή του a ij και ο παίκτης στηλών χάνει ένα ποσό a ij. Κατά συνέπεια, μπορούμε να σκεφτούμε ότι η ανταμοιβή a ij του παίκτη σειρών προέρχεται από τον παίκτη στηλών. Ένα τέτοιο παιχνίδι καλείται μηδενικό παιχνίδι δύο παικτών (two person), το οποίο αντιπροσωπεύεται στον πίνακα 1.1 (η πίνακας ανταμοιβής του παιχνιδιού). Όπως προηγουμένως δηλώθηκε, το a ij, είναι η ανταμοιβή Πίνακας 1.1 Στρατηγική σειρών Στρατηγική στηλών Στήλη 1 στήλη 2 στήλη n Σειρά 1 a 11 a 12 a 1n Σειρά 2 a 21 a 22 a 2n : : : : Σειρά m a m1 a m2 a mn του παίκτη σειρών (και η απώλεια του παίκτη στηλών) εάν ο παίκτης σειρών επιλέγει την i-οστή στρατηγική και ο παίκτης στηλών επιλέγει την j-οστή στρατηγική. 8

Πίνακας 1.2 1 2 3-1 2 1-2 0 Παραδείγματος χάριν, στο μηδενικό παιχνίδι δύο προσώπων στον πίνακα 1.2, ο παίκτης σειρών θα λάβει δύο μονάδες (και ο παίκτης στηλών θα χάσει δύο μονάδες) εάν ο παίκτης σειρών επέλεξε τη δεύτερη στρατηγική και ο παίκτης στηλών επέλεξε την πρώτη στρατηγική. Ένα μηδενικό παιχνίδι δύο προσώπων έχει την ιδιότητα ότι για οποιαδήποτε επιλογή των στρατηγικών, το ποσό των ανταμοιβών στους παίκτες είναι μηδέν. Σε ένα μηδενικό παιχνίδι, κάθε ευρώ που κάθε παίκτης κερδίζει βγαίνει από την τσέπη του άλλου παίκτη, έτσι οι δύο παίκτες έχουν συνολικά συγκρουόμενα ενδιαφέροντα. Κατά συνέπεια, η συνεργασία μεταξύ των δύο παιχτών δεν θα ευδοκιμούσε. Ο John von Neumann και ο Oskar Morgenstern ανέπτυξαν μια θεωρία για το πώς τα μηδενικά παιχνίδια δύο προσώπων πρέπει να παιχτούν, βασισμένος στην ακόλουθη υπόθεση θεωρία. 1.2.2 Βασική υπόθεση για το παιχνίδι δύο προσώπων μηδενικού αθροίσματος Κάθε παίκτης επιλέγει μια στρατηγική που του επιτρέπει να κάνει το καλύτερο που μπορεί, δεδομένου ότι ο αντίπαλος ξέρει τη στρατηγική που ακολουθεί. Θα χρησιμοποιήσουμε αυτήν την υπόθεση για να καθορίσουμε πώς οι παίκτες σειρών και στηλών πρέπει να παίξουν το παιχνίδι δύο προσώπων μηδενικού αθροίσματος του πίνακα 1.3. Πινακας 1.3 9

Στρατηγική Στρατηγική στηλών σειρών Στήλη 1 στήλη 2 στήλη 3 Σειρά 1 4 4 10 4 Σειρά 2 2 3 1 1 Σειρά 3 6 5 7 5 6 5 10 5 Πώς θα έπρεπε ο παίκτης σειρών να παίξει αυτό το παιχνίδι; Εάν επιλέξει τη σειρά 1, κατόπιν η υπόθεση υπονοεί ότι ο παίκτης στηλών θα πρέπει να επιλέξει τη στήλη 1 ή τη στήλη 2 και θα κρατήσει τον παίκτη σειρών σε μια ανταμοιβή τεσσάρων μονάδων (ο μικρότερος αριθμός στη σειρά 1 τον πίνακα παιχνιδιών). Ομοίως, εάν ο παίκτης σειρών επιλέξει τη σειρά 2, κατόπιν η υπόθεση υπονοεί ότι ο παίκτης στηλών θα επιλέξει τη στήλη 3 και θα κρατήσει την ανταμοιβή του παίκτη σειρών σε μια μονάδα (ο μικρότερος ή ελάχιστος αριθμός στη δεύτερη σειρά του πίνακα παιχνιδιών). Εάν ο παίκτης σειρών επιλέξει τη σειρά 3, κατόπιν θα κρατηθεί στο μικρότερο αριθμό στην τρίτη σειρά (5) Κατά συνέπεια, η υπόθεση υπονοεί ότι ο παίκτης σειρών πρέπει να επιλέξει τη σειρά που έχει το μεγαλύτερο ελάχιστο. Επειδή max (4, 1, 5) = 5, ο παίκτης σειρών πρέπει να επιλέξει τη σειρά 3. Με την επιλογή της σειράς 3, ο παίκτης σειρών μπορεί να εξασφαλίσει ότι θα κερδίσει το μικρότερο max (min σειρών) = πέντε μονάδες. Από την πλευρά του παίκτη στηλών, εάν επιλέξει τη στήλη 1, τότε ο παίκτης σειρών θα επιλέξει τη στρατηγική που καθιστά τις απώλειες του παίκτη στηλών όσο το δυνατόν μεγαλύτερες (και τα κέρδη του παίκτη σειρών όσο το δυνατόν μεγαλύτερα). Κατά συνέπεια, εάν ο παίκτης στηλών επιλέξει τη στήλη 1, τότε ο παίκτης σειρών θα επιλέξει τη σειρά 3 (επειδή ο μεγαλύτερος αριθμός στην πρώτη στήλη είναι τα 6 στην τρίτη σειρά). Ομοίως, εάν ο παίκτης στηλών επιλέξει τη στήλη 2, τότε ο παίκτης σειρών θα επιλέξει πάλι τη σειρά 3, επειδή 5 = max (4, 3, 5). Τέλος, εάν ο παίκτης στηλών επιλέξει τη στήλη 3, τότε ο παίκτης σειρών θα επιλέξει τη σειρά 1, αναγκάζοντας το παίκτη στηλών για να χάσει 10 = max (10, 1,7) μονάδες. 10

Κατά συνέπεια, ο φορέας στηλών μπορεί να κρατήσει τις απώλειές του στο ελάχιστο (max στηλών) = min (6,5, 10) = 5 με την επιλογή της στήλης 2. Έχουμε δείξει ότι ο παίκτης σειρών μπορεί να εξασφαλίσει ότι θα κερδίσει τουλάχιστον πέντε μονάδες και ο παίκτης στηλών μπορεί να κρατήσει τον παίκτη σειρών κερδίζοντας το πολύ πέντε μονάδες. Κατά συνέπεια, η μόνη λογική έκβαση αυτού του παιχνιδιού για τον παίκτη σειρών είναι να κερδίσει ακριβώς πέντε μονάδες ενώ ο παίκτης σειρών δεν μπορεί να περιμένει να κερδίσει περισσότερες από πέντε μονάδες, επειδή ο παίκτης στηλών (με την επιλογή της στήλης 2) μπορεί να κρατήσει τον παίκτης σειρών κερδίζοντας πέντε μονάδες. Ο πίνακας παιχνιδιών που μόλις αναλύσαμε ικανοποιεί τη συνθήκη του σημείου σάγματος. max(row min)= min (column max) all rows all columns (1.1) Οποιοδήποτε παιχνίδι δύο προσώπων μηδενικού αθροίσματος που ικανοποιεί την (1.1) λέγεται ότι έχει ένα σημείο σάγματος. Εάν το παιχνίδι δύο προσώπων μηδενικού αθροίσματος έχει ένα σημείο σάγματος, τότε ο παίκτης σειρών πρέπει να επιλέξει οποιαδήποτε στρατηγική (σειράς) επιτυγχάνοντας το max στην αριστερή πλευρά της (1.1). Ο παίκτης στηλών πρέπει να επιλέξει οποιαδήποτε στρατηγική (στήλης) επιτυγχάνοντας το min στη δεξιά πλευρά της (1.1) Κατά συνέπεια, στο παιχνίδι που μόλις αναλύσαμε εμφανίστηκε ένα σημείο σάγματος όπου ο παίκτης σειρών επέλεξε τη σειρά 3 και ο παίκτης στηλών επέλεξε την στήλη 2. Ο παίκτης σειρών θα μπορούσε να σιγουρέψει τη λήψη μιας ανταμοιβής τουλάχιστον πέντε μονάδων (από την επιλογή της βέλτιστης στρατηγικής της σειράς 3), και ο παίκτης στηλών μπόρεσε να εξασφαλίσει ότι ο παίκτης σειρών θα λάβει μια ανταμοιβή το πολύ πέντε μονάδων (με την επιλογή της βέλτιστης στρατηγικής της στήλης 2). Εάν ένα παιχνίδι έχει ένα σημείο σάγματος, τότε καλούμε την κοινή τιμή για τις δύο πλευρές της (1.1), αξία (β) του παιχνιδιού για τον παίκτη σειρών. Κατά συνέπεια, αυτό το παιχνίδι έχει αξία 5 μονάδων. 11

Ένας εύκολος τρόπος να επισημανθεί ένα σημείο σάγματος είναι να παρατηρηθεί ότι η ανταμοιβή για ένα σημείο σάγματος πρέπει να είναι ο μικρότερος αριθμός στη σειρά της και ο μεγαλύτερος αριθμός στη στήλη της. Κατά συνέπεια, όπως το κεντρικό σημείο της σέλας ενός αλόγου, ένα σημείο σάγματος για ένα παιχνίδι δύο προσώπων μηδενικού αθροίσματος είναι ένα τοπικό ελάχιστο στη μια κατεύθυνση (κοιτώντας τις σειρές) και ένα τοπικό μέγιστο σε μια άλλη κατεύθυνση (κοιτώντας τις στήλες). Ένα σημείο σάγματος μπορεί επίσης να θεωρηθεί ως σημείο ισορροπίας δεδομένου ότι κανένας παίκτης δεν μπορεί να ωφεληθεί από μια μονομερή αλλαγή στη στρατηγική. Παραδείγματος χάριν, εάν ο παίκτης σειρών επρόκειτο να αλλάξει από τη βέλτιστη στρατηγική της σειράς 3 (είτε στη σειρά 1 είτε τη σειρά 2), η ανταμοιβή του θα μειωνόταν, ενώ εάν ο παίκτης στηλών άλλαζε από τη βέλτιστη στρατηγική της στήλης 2 (είτε στη στήλη 1 είτε τη στήλη 3), η ανταμοιβή του παίκτη σειρών (και οι απώλειες του παίκτη στηλών) θα αυξάνονταν. Κατά συνέπεια, ένα σημείο σάγματος είναι ευσταθές δεδομένου ότι κανένας παίκτης δεν έχει κάποιο κίνητρο για να απομακρυνθεί από αυτό. 1.2.3 Παιχνίδια δύο παιχτών σταθερού αθροίσματος Στην περίπτωση που ένα παιχνίδι δύο παιχτών δεν είναι μηδενικό, οι δύο παίκτες μπορούν να είναι σε συνολική σύγκρουση. Ένα παιχνίδι δύο παιχτών σταθερού-ποσού είναι ένα παιχνίδι δύο παικτών στο οποίο, για οποιαδήποτε επιλογή και των στρατηγικών του παίκτη, η ανταμοιβή του παίκτη σειρών και η ανταμοιβή του παίκτη στηλών αθροίζουν σε μία σταθερή αξία c. Φυσικά, ένα μηδενικό παιχνίδι δύο παιχτών είναι ακριβώς ένα παιχνίδι δύο παιχτών σταθερός-ποσού με c = 0, Ένα παιχνίδι δύο παιχτών σταθερούποσού διατηρεί το χαρακτηριστικό γνώρισμα ότι οι παίκτες σειρών και στηλών είναι σε συνολική σύγκρουση, επειδή μια μοναδιαία αύξηση στην ανταμοιβή του παίκτη σειρών θα οδηγεί πάντα σε μια μοναδιαία μείωση στην ανταμοιβή του παίκτη στηλών. Γενικά, οι βέλτιστες στρατηγικές και η αξία για ένα παιχνίδι δύο παιχτών σταθερού-ποσού μπορούν να βρεθούν με τις ίδιες 12

μεθόδους που χρησιμοποιείται για να βρεθούν οι βέλτιστες στρατηγικές και η αξία για ένα μηδενικό παιχνίδι δύο παιχτών 13

ΚΕΦΑΛΑΙΟ 2ο ΣΤΡΑΤHΓΙΚΕΣ ΠΑΙΓΝΙΩΝ 2.1 ΑΜΙΓΗΣ ΣΤΡΑΤΗΓΙΚΗ Για να κατανοήσουμε καλύτερα τις έννοιες της προηγούμενης ενότητας, ας εξετάσουμε τον πίνακα 2.1, που είναι ο πίνακας αποτελεσμάτων ενός παιγνίου δύο-παικτών μηδενικού-αθροίσματος. Στο παίγνιο αυτό υπάρχουν δύο παίκτες, ο Α και ο Β, καθένας από τους οποίους έχει δύο στρατηγικές, ο Α τις Α1, και Α2 και ο Β τις Β1, και Β2. Οι τιμές του πίνακα αντιπροσωπεύουν το κέρδος (ή ζημιά) του παίκτη Α και επομένως και τη ζημιά (ή κέρδος) του παίκτη Β, μια και όπως αναφέραμε, στο παίγνιο δύο-παικτών μηδενικούαθροίσματος το κέρδος του ενός παίκτη είναι ίσο με τη ζημιά του άλλου. Αν ο παίκτης Α ακολουθήσει τη στρατηγική Α1, και ο παίκτης Β τη στρατηγική Β1 το κέρδος του Α θα είναι 8, ίσο με τη ζημιά του Β, ενώ αν ο Β ακολουθήσει τη στρατηγική Β2, η ζημιά του Α θα είναι 4, ίση με το κέρδος του Β. Αν τώρα ο Α επιλέξει τη στρατηγική Α2 και ο Β τη στρατηγική Β1. το κέρδος του Α θα είναι 6, ενώ αν ο Β επιλέξει, τη Β2, το κέρδος του Α θα είναι 5. Ο πίνακας 2.1 είναι ο πίνακας αποδόσεων του παίκτη Α. Αν θέλουμε να βρούμε τον πίνακα πληρωμών του παίκτη Β, απλώς αλλάζουμε τα πρόσημα τον στοιχείων του πίνακα 2.1. ΠΙΝΑΚΑΣ 2.1 Πίνακας αποδόσεων Στρατηγικές Στρατηγικές Β Α Β 1 Β 2 Α 1 8-4 Α 2 6 5 Κατά τη διάρκεια του παιγνίου, οι παίκτες γνωρίζουν τόσο τις δικές τους στρατηγικές. όσο και τις στρατηγικές του αντιπάλου τους. Παρατηρώντας τα στοιχεία του πίνακα 2.1. Βλέπουμε ότι το παίγνιο ευνοεί τον παίκτη Α. επειδή 14

όλα τα στοιχεία του πίνακα, εκτός από ένα, είναι θετικά. Επομένως, αντικειμενικός σκοπός του παίκτη Α είναι η μεγιστοποίηση του κέρδους και του Β η ελαχιστοποίηση της ζημιάς του. Αν και το παίγνιο αυτό δεν ευνοεί τον παίκτη Β, παρόλα αυτά θα πρέπει να το παίξει, προκειμένου να ελαχιστοποιήσει τη ζημιά του. Αν ο Α επιλέξει τη στρατηγική Α1, το ελάχιστο κέρδος του θα είναι -4, δηλαδή ζημιά 4, ενώ αν επιλέξει την Α2, θα είναι ικανοποιημένοι με κέρδος 5. Αντίθετα, ο παίκτης Β επιλέγοντας τη Β1 διατρέχει τον κίνδυνο να έχει ζημιά 8, ενώ αν επιλέξει τη Β2, η μέγιστη ζημιά του θα είναι 5. Επειδή ο Α ενδιαφέρεται για το μέγιστο δυνατό κέρδος και ο Β για την ελάχιστη ζημιά, γνωρίζοντας ο καθένας τους τον αντικειμενικό σκοπό του αντιπάλου, συνάγεται ότι ο Α θα ακολουθεί πάντα τη στρατηγική Α2, αναμένοντας κέρδος 5 και ο Β τη στρατηγική Β2 με ζημιά 5. Επομένως, οι άριστες στρατηγικές των παικτών είναι για τον Α η στρατηγική Α2, και για το Β η στρατηγική Β2. Οι δύο αυτές άριστες στρατηγικές συνθέτουν τη λύση του παιγνίου, σύμφωνα με την οποία ο Α έχει κέρδος 5 και ο Β ζημιά 5. Η τιμή 5 ονομάζεται τιμή τον παιγνίου (value of the game) και συμβολίζεται με το γράμμα V, δηλαδή V = 5. 2.2 Στρατηγική maximin και minimax Είδαμε προηγουμένως για το συγκεκριμένο παράδειγμα, που το επαναλαμβάνουμε και στον πίνακα 2.2. ότι ο παίκτης Α δεν θα ακολουθήσει την Α1 διότι κερδίζει περισσότερα με την επιλογή Α2,. δηλαδή έχει κέρδος 5 έναντι κέρδους -4. Ο παίκτη Β γνωρίζοντας αυτό δεν θα ακολουθήσει τη Β1, επειδή η ζημιά του θα είναι μεγαλύτερη. Το ελάχιστο κέρδος για τις δύο επιλογές του Α είναι: Επιλόγη Α 1 :ελάχιστο κέρδος = -4 Επιλογή Α 2 :ελάχιστο κερδος = 5 Το μέγιστο των ελαχίστων, που το συμβολίζουμε με maximin, είναι για τον παίκτη Α maximin = 5. Η μέγιστη ζημιά για τις δύο επιλογές του Β είναι: 15

Επιλογή Β 1 :μέγιστη ζημιά = 8 Επιλογή Β 2 :μέγιστη ζημιά = 5 Το ελάχιστο των δύο μεγίστων για τον παίκτη Β είναι minimax = 5. ΠΙΝΑΚΑΣ 2.2 Πίνακας πληρωμών Στρατηγικές Α Στρατηγικές Β Ελάχιστο σειράς Β 1 Β 2 Α 1 8-4 -4 Α 2 6 5 5* Μέγιστο στήλης 8 5* V = 5 Επειδή, όπως γνωρίζουμε, αντικειμενικός σκοπός του Α είναι η επίτευξη του μέγιστου δυνατού κέρδους και του Β η ελάχιστη δυνατή ζημιά, ο Α θα ακολουθεί τη στρατηγική maximin, δηλαδή θα επιλέγει πάντα το μέγιστο των ελάχιστων στοιχείων των σειρών του πίνακα 2.2. ενώ ο Β θα ακολουθεί τη στρατηγική minimax, δηλαδή θα επιλέγει πάντα το ελάχιστο των μέγιστων στοιχείων των στηλών. Στην περίπτωση αυτή, ισχύει η σχέση: max i min[ a ] = min j ij j max[ a ] i ij = V i =1,2 j = 1,2 όπου [ ] a ij ο πίνακας αποδόσεων και V η τιμή του παιγνίου. Γενικά, όταν ισχύει η παραπάνω) ισότητα, ο παίκτης Α κερδίζει V, αλλά εμποδίζεται από τον παίκτη Β να κερδίσει περισσότερο από V. Σύμφωνα με τα κριτήρια maximin και minimax, η λύση του παραδείγματος του Πίνακα 2.2 είναι: max i min j [ a ij ] = a 22 = 5 δηλαδή, η λύση του παιγνίου προκύπτει από τις επιλογές Α2 και Β2, με τιμή του παιγνίου V = 5. Όταν η τιμή ενός παιγνίου είναι ίση με μηδέν, το παίγνιο αυτό θεωρείται δίκαιο (fair game) 16

2.3 ΣΗΜΕΙΟ ΙΣΟΡΡΟΠΙΑΣ Εάν σε ένα παίγνιο το στοιχείο του πίνακα αποδόσεων της στρατηγικής maximin είναι το ίδιο με το στοιχείο της στρατηγικής minimax, το στοιχείο αυτό ονομάζεται σημείο ισορροπίας ή σαγματικό σημείο (saddle point) και δίνει την τιμή του παιγνίου. Το σημείο ισορροπίας σε ένα παίγνιο, εφόσον φυσικά υπάρχει, είναι πάντα το μικρότερο στοιχείο της σειράς και το μεγαλύτερο της στήλης στον πίνακα πληρωμών και προσδιορίζει τον τρόπο με τον οποίο οι παίκτες επιλέγουν τις στρατηγικές τους. Λόγω του σημείου αυτού κανένας από τους παίκτες δεν είναι δυνατό να επωφεληθεί από τη στρατηγική που εφαρμόζει ο αντίπαλος του, ώστε να βελτιώσει τη θέση του. Στο παράδειγμα μας, μόλις ο παίκτης Β διαπιστώσει ότι ο Α θα επιλέξει τη στρατηγική Α2, ο Β δεν θα αλλάξει τη στρατηγική Β2, διότι διαφορετικά θα μεγαλώσει η ζημιά του από 5 σε 6. Το ίδιο φυσικά συμβαίνει και με τον παίκτη Α, αν αντί για την Α2 επιλέξει την A1. Αυτό σημαίνει, ότι οι παίκτες Α και Β θα χρησιμοποιούν πάντα τις στρατηγικές maximin και minimax αντίστοιχα, οπότε η λύση του παιγνίου είναι σταθερή (stable) με τιμή παιγνίου V = 5. Η ιδέα μιας ισορροπίας είναι κεντρική στα οικονομικά: Κάθε παίκτης ενεργεί για συμφέρον του/της, και οι παίκτες αλληλεπιδρούν ο ένας με τον άλλον μέσω μιας αγοράς στους τρόπους που εμποδίζουν την συνασπισμός - διαμόρφωση. Η ιδέα μιας σταθερής λύσης είναι ικανή για τα πρότυπα στα οποία οι πράκτορες έχουν τα κίνητρα για να διαμορφώσουν τους συνασπισμούς και στα οποία έχουν την ευκαιρία να κάνουν έτσι. Μια σταθερή λύση πρέπει να είναι μια ισορροπία, φυσικά, αλλά μια ισορροπία δεν χρειάζεται να είναι σταθερή. Μια κυρίαρχη στρατηγική είναι μια καλύτερη απάντηση σε όλες τις ενέργειες που οι άλλοι φορείς να πάρουν. Μερικά παιχνίδια έχουν τις κυρίαρχες στρατηγικές, αλλά πιο πολύ όχι. Μια κυρίαρχη στρατηγική μπορεί να φανεί να είναι ιδανική, αλλά το δίλημμα του φυλακισμένου δείχνει ότι μια άλλη λύση μπορεί να είναι καλύτερα ακόμα, εάν μπορεί να επιβληθεί. 17

Το δίλημμα του φυλακισμένου Τίθεται με τον ακόλουθο τρόπο: δύο άτομα Α και Β είναι ύποπτα και συλλαμβάνονται για τη διάπραξη μιας εγκληματικής πράξης. Οι αστυνομικές αρχές ανακρίνουν σε ξεχωριστούς χώρους, και διακρίνουμε τις παρακάτω περιπτώσεις: αν κανείς τους δε ομολογήσει, τότε και οι δύο θα εκτίσουν ποινή φυλάκισης ενός έτους. Αν ένας από τους δύο ομολογήσει, ενώ ο άλλος όχι, ο πρώτος μένει ελεύθερος και ο δεύτερος θα εκτίσει ποινή φυλάκισης 6 ετών τέλος, αν ομολογήσουν και οι δύο, η ποινή και των δύο θα είναι 3 έτη και των καθένα. ΠΙΝΑΚΑΣ 2.3 ΔΙΛΗΜΜΑ ΤΟΥ ΦΥΛΑΚΙΣΜΕΝΟΥ Έτη ποινής για φυλακισμένο Α Έτη ποινής φυλάκισης για φυλακισμένου Β Δεν ομολογεί Ομολογεί Δεν ομολογεί Α = 1 Β = 1 Α = 6 Β = 0 Ομολογεί Α = 0 Β = 6 Α = 3 Β = 3 Το παίγνιο αυτό ξεκινά με έναν αριθμητικό πίνακα, μερικές φορές εξαιρετικά σύνθετο και οι στρατηγικές είναι οι βέλτιστες δυνατές κινήσεις των παιχτών. Αν χρησιμοποιήσουμε την ψυχρή λογική, τις πιθανότητες και την άλγεβρα, προκύπτουν τα εξής συμπεράσματα ότι: γενικά, είναι καλύτερα κάθε παίκτης να μην ενεργεί εγωιστικά. Αυτό που κάνει ένας παίκτης και είναι επωφελές για τον ίδιο μπορεί να αποδειχθεί λιγότερο επωφελές αν λάβει υπόψη τις πιθανές 18

ενέργειες των υπολοίπων. Έτσι, η καλύτερη απόφαση, ή η βέλτιστη στρατηγική, περνά σε πολλές περιπτώσεις, από λύσεις συνεργασίας. Με τον τρόπο αυτόν, όλοι θα έχουν τα μεγαλύτερα δυνατά οφέλη σε συνδυασμό με την μικρότερη δυνατή ζημιά. Στο δίλημμα του φυλακισμένου, η εμπειρία έχει δείξει ότι το παίκτες τείνουν να προτιμούν την κατάδοση παρά την ομολογία (οι όποιες μαθηματικά είναι ισοδύναμες). Το δίλημμα του φυλακισμένου θα το εξετάσουμε σε άλλη παράγραφο πιο αναλυτικά και με παραδείγματα. Θα πρέπει να σημειώσουμε, ότι υπάρχουν παίγνια δύο-παικτών μηδενικού-αθροίσματος χωρίς σημείο ισορροπίας. Ας εξετάσουμε, για παράδειγμα, τον πίνακα 2.4, όπου ο παίκτης Α έχει δύο στρατηγικές και ο παίκτης Β τρεις. Το maximin του Α είναι 4 και το minimax του Β6. Είναι δηλαδή, max min α ij min max a ij, οπότε στο παίγνιο αυτό δεν υπάρχει σημείο ισορροπίας. Πίνακες αποδόσεων χωρίς σημείο ισορροπίας θα εξετάσουμε στις επόμενες ενότητες του κεφαλαίου αυτού. ΠΙΝΑΚΑΣ 2.4 Παίγνιο χωρίς σημείο ισορροπίας Στρατηγικές Στρατηγικές Β Ελάχιστο σειράς Α Β 1 Β 2 Β 3 Α 1 8 2-4 2 Α 2 6 9 5 4* Μέγιστο στήλης 6* 9 8 4 6 Από την άλλη πλευρά, σ' ένα πίνακα αποτελεσμάτων είναι δυνατό να υπάρχουν περισσότερα από ένα σαγματικά σημεία. Στο παράδειγμα του πίνακα 2.5 υπάρχουν δύο σημεία ισορροπίας και επομένως οι άριστες στρατηγικές των παικτών είναι δύο και αντιστοιχούν στις στρατηγικές Α 1 και Β 1 η πρώτη και στις στρατηγικές Α 1 και Β 1 η δεύτερη, με τιμή παιγνίου V = 2. 19

ΠΙΝΑΚΑΣ 2.5 Παίγνιο με δύο σημεία ισορροπίας Στρατηγικές Στρατηγικές Β Ελάχιστο σειράς Α Β 1 Β 2 Β 3 Α 1 2* 6 2 2* Α 2-2 1 0-2 Α 3 1 3-4 -4 Μέγιστο στήλης 2* 6 2* V = 2 2.4 ΚΥΡΙΑΡΧΗ ΣΤΡΑΤΗΓΙΚΗ Στη θεωρία παιγνίων, μεγάλη σημασία έχει και η έννοια της κυρίαρχης ή υπερέχουσας στρατηγικής, με την οποία είναι δυνατή η μείωση των διαστάσεων ενός πίνακα αποδόσεων. Αυτό γίνεται με απαλοιφή των υποδεέστερων στρατηγικών, δηλαδή των στρατηγικών εκείνων τις οποίες ο παίκτης δεν θα επιλέξει ποτέ, επειδή κυριαρχούνται από κάποια άλλη. Με άλλα λόγια, μια στρατηγική ενός παίκτη μπορεί να απομακρυνθεί από το παίγνιο, αν κάθε στοιχείο της είναι το ίδιο ή χειρότερο από το αντίστοιχο στοιχείο κάποιας άλλης στρατηγικής τον. ΠΙΝΑΚΑΣ 2.6 Παίγνιο με κυρίαρχες στρατηγικές Στρατηγικές Στρατηγικές Β Α Β 1 Β 2 Β 3 Α 1 3 2 4 Α 2 1 2 3 Α 3-2 0 1 Στον πίνακα 2.6 βλέπουμε ένα παίγνιο δύο-παικτών μηδενικού-αθροίσματος με τρεις επιλογές για κάθε παίκτη. Η στρατηγική Α 2, είναι υποδεέστερη της Α 1 διότι κάθε στοιχείο της είναι ίου ή μικρότερο από το αντίστοιχο στοιχείο της Α 1.Το ίδιο ισχύει και για τη στρατηγική Α 3. Επομένως, η Α 1 κυριαρχεί των 20

στρατηγικών Α 2 και Α 3, δηλαδή το κέρδος από την Α 1 είναι μεγαλύτερο ή ίσο από το αντίστοιχο κέρδος της Α 2 ή της Α 3, για όλες τις επιλογές του παίκτη Β. Έτσι οι στρατηγικές Α 2 και Α 3, μπορούν να απομακρυνθούν από τον πίνακα πληρωμών, χωρίς να μεταβληθεί η τιμή του παιγνίου. Με τον ίδιο τρόπο προκύπτει, ότι για τον παίκτη Β η Β 2 κυριαρχεί της Β 3, δηλαδή ο Β δεν θα ακολουθήσει ποτέ τη Β 3, επειδή η ζημιά του από τη Β 3 είναι μεγαλύτερη από εκείνη της Β 2 για όλες τις επιλογές του παίκτη Α. Από τα παραπάνω είναι φανερό, ότι μια σειρά είναι υποδεέστερη μιας άλλης, όταν όλα τα στοιχεία της είναι μικρότερα ή ίσα από τα αντίστοιχα στοιχεία της άλλης σειράς, ενώ μια στήλη είναι υποδεέστερη μιας άλλης στήλης, όταν όλα τα στοιχεία της είναι μεγαλύτερα ή ίσα από τα αντίστοιχα στοιχεία της άλλης στήλης. ΠΙΝΑΚΑΣ 2.7 Πίνακας μετά τη διαγραφή των Α 2, Α 3, Β 3 Στρατηγικές Στρατηγικές Β Α Β 1 Β 2 Α 1 3 2* Μετά τη διαγραφή των υποδεεστέρων στρατηγικών Α2, Α3 και Β3 ο πίνακας αποδόσεων του παραδείγματος παίρνει τη μορφή του πίνακα 2.7, από τον οποίο είναι φανερό, ότι η Β1 είναι υποδεέστερη της Β2 δηλαδή ο παίκτης Β θα ακολουθεί πάντα τη Β2, αφού η ζημιά του από τη Β1 είναι μεγαλύτερη από τη ζημιά της Β2. Με άλλα λόγια, η λύση του παιγνίου είναι να ακολουθεί ο παίκτης Α τη στρατηγική Α, και ο παίκτης Β τη στρατηγική Β2, με τιμή παιγνίου V = 2. Από την επίλυση του παραδείγματος είναι φανερό, ότι η απομάκρυνση των υποδεέστερων στρατηγικών μπορεί να οδηγήσει στον εντοπισμό της λύσης του παιγνίου χωρίς την εφαρμογή του κριτηρίου minimax (maximin). Σημειώνουμε επίσης ότι κατά τη διαδικασία απαλοιφής των υποδεέστερων στρατηγικών είναι δυνατό μια στρατηγική, που αρχικά δεν ήταν υποδεέστερη, να καταστεί στη συνέχεια υποδεέστερη και να απομακρυνθεί από τον πίνακα αποδόσεων. 21

2.5 ΜΙΚΤΗ ΣΤΡΑΤΗΓΙΚΗ Εκτός από τα παίγνια δύο-παικτών με σημείο ισορροπίας που η λύση τους είναι αρκετά εύκολη με το κριτήριο minimax, υπάρχουν όμως παίγνια που δεν έχουν σημείο ισορροπίας, οπότε οι παίκτες δεν μπορούν να ακολουθήσουν αμιγείς στρατηγικές. Στις περιπτώσεις αυτές για την επίλυση του παιγνίου οι παίκτες χρησιμοποιούν μικτές στρατηγικές, δηλαδή επιλέγουν τις στρατηγικές τους με πιθανότητα μικρότερη της μονάδας. Ένα παίγνιο χωρίς σημείο ισορροπίας δίνεται στον πίνακα 2.8. ΠΙΝΑΚΑΣ 2.8 Παίγνιο χωρίς σημείο ισορροπίας Στρατηγικές Α Στρατηγικές Β Β 1 Β 2 Ελάχιστο σειράς Α 1-2 5-2 Α 2 4 1 1* Μέγιστο στήλης 4* 5 1 4 Στο παίγνιο αυτό δεν υπάρχει σημείο ισορροπίας, επειδή το μέγιστο των ελαχίστων των σειρών είναι 1 και το ελάχιστο των μεγίστων των στηλών 4. Εδώ βλέπουμε, ότι δεν είναι φανερός ο τρόπος με τον οποίο οι δύο παίκτες επιλέγουν τις στρατηγικές τους, επειδή για κάθε συνδυασμό στρατηγικών ο ένας παίκτης μπορεί να επωφεληθεί αλλάζοντας μονομερώς την αρχική του επιλογή. Για παράδειγμα, ας υποθέσουμε ότι επιλέγουν ταυτόχρονα ο Α την Α1 και ο Β τη Β1 Για το λόγο ότι οι δύο παίκτες είναι ορθολογιστές, ο Α θα αλλάξει από μόνος του την Α1 επιλέγοντας την Α2, ώστε αντί για ζημιά 2 να έχει κέρδος 4. Μόλις ο Β διαπιστώσει αυτή την αλλαγή, θα επιλέξει τη στρατηγική Β2, ώστε αντί για ζημιά 4 να έχει ζημιά 1. Βέβαια, μετά την αλλαγή αυτή, ο Α θα επιλέξει την Α, αντί της Α2, ώστε να έχει κέρδος 5 αντί 1, κ.ο.κ. Επομένως. η αρχική τους επιλογή, να ακολουθήσει δηλαδή ο Α την Α1 και ο Β τη Β1 είναι λύση ασταθής (unstable). 22

Στα παίγνια χωρίς σημείο ισορροπίας, κάθε παίκτης πρέπει να ακολουθεί μικτή στρατηγική, δηλαδή πρέπει να προσδιορίσει την πιθανότητα με την οποία θα επιλέγει κάθε στρατηγική του, ώστε να μεγιστοποιήσει το ελάχιστο προσδοκώμενο κέρδος (ελαχιστοποιήσει τη μέγιστη προσδοκώμενη ζημιά), ανεξάρτητα από τις επιλογές τον αντιπάλου τον. Πιο συγκεκριμένα, ο παίκτης Α θα ακολουθεί μικτή maximin στρατηγική και ο παίκτης Β μικτή minimax στρατηγική. Έστω, ότι ο παίκτης Α επιλέγει την Α, με πιθανότητα p και την Α2 με πιθανότητα (1- p ) και ο Β επιλέγει τη Β1 με πιθανότητα q και τη Β, με πιθανότητα (1- q ), όπως δίνεται στον πίνακα 2.9 ΠΙΝΑΚΑΣ 2.9 Παίγνιο με μικτή στρατηγική Στρατηγικές Α Στρατηγικές Β B 1 B 2 q (1-q) A 1 p -2 5 A 2 (1-p) 4 1 Αν ο Α ακολουθεί την Α1, με πιθανότητα p και την Α2, με πιθανότητα (1- p ) και ο Β ακολουθεί πάντοτε τη Β1, τότε το προσδοκώμενο κέρδος του A, το οποίο το συμβολίζουμε με V=(Α, Β1), θα είναι: V(Α,Β 1 ) = -2p + 4(1-p) = -6p + 4. Αν όμως ο Β ακολουθεί πάντοτε τη Β2, το προσδοκώμενο κέρδος του Α, το V (Α, Β2), θα είναι: V(Α,Β,) = 5p + 1(1-p) = 4p + 1. Για να βρούμε τη βέλτιστη μικτή στρατηγική του παίκτη Α, θα πρέπει το προσδοκώμενο κέρδος του να είναι το ίδιο για κάθε στρατηγική που μπορεί να 23

ακολουθεί ο παίκτης Β. Με άλλα λόγια, ο παίκτης Α θα πρέπει να επιλέξει την πιθανότητα p με τρόπο, ώστε να ισχύει: V(Α,B 1,) = V(Α,Β 2 ), δηλαδή, θα προσδιορίσει την καλύτερη δυνατή στρατηγική, η οποία είναι ανεξάρτητη της στρατηγικής που υιοθετεί ο παίκτης Β. Έτσι. για την άριστη στρατηγική του Α έχουμε: ή 10p = 3-6p + 4 = 4p + 1 δηλαδή p = 0,3. (1-p) = 0,7. Αυτό σημαίνει ότι ο Α θα πρέπει να ακολουθεί τη στρατηγική Α1 με πιθανότητα 0,3 και την Α2, με πιθανότητα 0.7, δηλαδή στις δέκα φoρές που παίζει το παίγνιο τρεις φορές θα ακολουθεί την Α1, και δύο φορές την Α2. Το προσδοκώμενο κέρδος του Α είναι πάλι: V(Α) = V(Α,Β 1,) = V(Α,Β 2,) = = -2 0.3 + 4 0.7 = 5 0.3 + 1 0.7 = 2.2. Το κέρδος αυτό είναι ανεξάρτητο των πιθανοτήτων που χρησιμοποιεί ο παίκτης Β για τις επιλογές του. Αν για παράδειγμα, ο Β ακολουθεί τη Β1, με πιθανότητα 0.2 και τη Β2, με πιθανότητα 0.8. το προσδοκώμενο κέρδος του Α, είναι πάλι: V(Α) = 0.2(-2 0.3 + 4 0.7) + 0.8(5 0.3 + 1 0.7) = 2.2. Ας βρούμε όμως τώρα την άριστη στρατηγική για τον παίκτη Β. υποθέτοντας ότι ακολουθεί τη στρατηγική Β1 με πιθανότητα ν και τη Β2, με πιθανότητα (1- y). Για να έχει ο Β την ελάχιστη δυνατή ζημιά, θα πρέπει, σύμφωνα με τα προηγούμενα, να είναι: 24

V(Β,Α 1,) = V(Β,Α 2 ), δηλαδή -2q + 5 (1-q) = 4q + 1 (1-q) ή 10q = 4 δηλαδή q = 0.4, (1-q) = 0.6 Με άλλα λόγια, στις δέκα φορές που παίζει ο Β το παίγνιο, πρέπει τέσσερις φορές να ακολουθεί τη στρατηγική Β1 και έξι φορές τη στρατηγική Β2. Η ελάχιστη προσδοκώμενη ζημιά του Β είναι: V(Β) = V(Β,Α1) = V(Β,Α2) = = -2 0.4 + 5 0.6 = 4 0.4 + 1 0.6 = 2.2, όσο και το προσδοκώμενο κέρδος του Α, επειδή πρόκειται για παίγνιο δύοπαικτών μηδενικού-αθροίσματος. Βέβαια, θα πρέπει να επισημάνουμε ότι η τιμή του παιγνίου V = 2.2, δεν σημαίνει πως κάθε φορά που οι δύο παίκτες παίζουν το παίγνιο ο Α θα κερδίζει 2.2 και ο Β θα χάνει 2.2, αλλά ότι αν οι δύο παίκτες παίξουν το παίγνιο πολλές φορές, το προσδοκώμενο κέρδος του Α θα είναι 2.2, όση και η προσδοκώμενη ζημιά του Β. Από τα παραπάνω προκύπτει ότι, όταν οι δύο παίκτες παίζουν το παίγνιο πολλές φορές, η λύση του παιγνίου είναι η ακόλουθη; α) Ο παίκτης Α στις δέκα φορές που παίζει το παίγνιο ακολουθεί τρεις φορές τη Α1, και επτά φορες την Α2. β) Ο παίκτης Β στις δέκα φορές που παίζει το παίγνιο ακολουθεί τέσσερις φορες τη Β1, και έξι φορες τη Β2. γ) Αν κάθε παίκτης ακολουθεί την άριστη μικτή στρατηγική του, η προσδοκώμενη τιμή του παιγνίου θα είναι V = 2.2. 25

ΚΕΦΑΛΑΙΟ 3ο ΠΑΙΓΝΙΑ ΔΥΟ ΠΡΟΣΩΠΩΝ - ΜΗ ΣΤΑΘΕΡΟΥ ΠΟΣΟΥ Τα περισσότερα θεωρητικά μοντέλα παιγνίων επιχειρησιακών καταστάσεων δεν είναι παίγνια σταθερού ποσού, επειδή είναι ασυνήθιστο για τους επιχειρησιακούς ανταγωνιστές να είναι στη συνολική σύγκρουση. Σε αυτό το κεφάλαιο, περιγράφουμε εν συντομία την ανάλυση των παιχνιδιών δυο προσώπων μη σταθερού-ποσού στα οποία η συνεργασία μεταξύ των παικτών δεν επιτρέπεται. Αρχίζουμε με την περιγραφή του διλήμματος του φυλακισμένου. ΤΟ ΔΙΛΛΗΜΑ ΤΩΝ ΦΥΛΑΚΙΣΜΕΝΩΝ Δύο φυλακισμένοι που δραπέτευσαν και συμμετείχαν σε μια ληστεία είναι συλληφθέντες εκ νέου και αναμένουν τη ποινή για το νέο έγκλημά τους. Αν και είναι και οι δύο ένοχοι, ο δικαστής της περιοχής δεν είναι βέβαιος ότι έχει αρκετά στοιχεία για να τους καταδικάσει. ΠΙΝΑΚΑΣ 3.1 Πίνακας ανταμοιβής για το δίλημμα του φυλακισμένου Φυλακισμένος 2 Φυλακισμένος 1 Ομολογία Μη ομολογία Ομολογία (-5, -5) (0, -20) Μη ομολογία (-20, 0) (-1, -1) Για να τους προσελκύσει και να καταθέσει ο ένας ενάντια στον άλλο, ο δικαστής της περιοχής λέει σε κάθε φυλακισμένο τα εξής: " Εάν μόνο ένας από σας ομολογήσει και καταθέσει εναντίον του συνεργάτη του, το πρόσωπο που ομολογεί θα μείνει ελεύθερο ενώ το πρόσωπο που δεν ομολογεί θα καταδικαστεί σίγουρα σε εικοσαετή ποινή φυλάκισης. Εάν και οι δύο από σας ομολογήσετε, τότε και οι δύο θα καταδικαστείτε σε 5ετή φυλάκιση. Τέλος, εάν 26

κανένας από σας δεν ομολογήσει, θα καταδικαστεί ο καθένας σε φυλάκιση 1 έτους. "Τι θα πρέπει να κάνει κάθε φυλακισμένος; Εάν υποθέσουμε ότι οι φυλακισμένοι δεν μπορούν να επικοινωνήσουν ο ένας με τον άλλον, οι στρατηγικές και οι αποδόσεις για κάθε ένα δίνονται στον πίνακα 3.1. Ο πρώτος αριθμός σε κάθε κελί αυτού του πίνακα είναι η απόδοση (αρνητική, επειδή τα έτη στη φυλακή είναι ανεπιθύμητα) για το φυλακισμένο 1, και ο δεύτερος αριθμός σε κάθε κελί είναι απόδοση για το φυλακισμένο 2. Σημειώστε ότι το άθροισμα των αποδόσεων σε κάθε κελί μεταβάλλεται από ένα μέγιστο σημείο -2 (-1-1) σε έναν χαμηλό -20 (-20 + 0). Κατά συνέπεια, αυτό δεν είναι ένα δύο παικτών παιχνίδι σταθερού αθοίσματος. Υποθέτουμε ότι κάθε φυλακισμένος επιδιώκει να αποβάλλει οποιεσδήποτε κυρίαρχες στρατηγικές από τον εαυτό του. Για κάθε φυλακισμένο, μπορεί να ακολουθήσει όποια στρατηγική αποφασίσει, είτε την στρατηγική "ομολογήσετε ότι" είτε την στρατηγική "μην ομολογήσετε". Εάν κάθε φυλακισμένος ακολουθεί δική του ("ομολογήσετε") στρατηγική, εντούτοις, κάθε φυλακισμένος θα περάσει 5 έτη στη φυλακή. Αφ' ετέρου, εάν κάθε φυλακισμένος επιλέξει την "μην ομολογήσετε" στρατηγική, κατόπιν κάθε φυλακισμένος θα περάσει μόνο 1 έτος στη φυλακή. Κατά συνέπεια, εάν κάθε φυλακισμένος επιλέγει την στρατηγική του να μην ομολογήσουν, είναι καλύτερα και για τους δύο από το να επιλέξουν την στρατηγική του να ομολογήσουν και οι δύο. ΟΡΙΣΜΟΣ Όπως στο παιχνίδι δυο προσώπων μηδενικού αθροίσματος, η επιλογή της στρατηγικής από κάθε παίκτη (φυλακισμένος) είναι ένα σημείο ισορροπίας εάν κανένας παίκτης δεν μπορεί να ωφεληθεί από μια μονομερή αλλαγή στρατηγικής. Κατά συνέπεια, (-5, -5) είναι ένα σημείο ισορροπίας, επειδή εάν καθένας φυλακισμένος αλλάξει τη στρατηγική του, τότε η απόδοση του μειώνεται (από -5 έως -20). Σαφώς, εντούτοις, κάθε φυλακισμένος είναι καλύτερος στο σημείο (-1, -1). Για να δούμε ότι η έκβαση (-1,-1) μπορεί να μην εμφανιστεί, παρατηρούμε ότι (-1,-1) δεν είναι ένα σημείο ισορροπίας, διότι εάν είμαστε 27

αυτήν την περίοδο στην έκβαση (-1,-1), καθένας φυλακισμένος μπορεί να αυξήσει την απόδοσή του (από -1 έως 0) με την αλλαγή της στρατηγικής του από "μην ομολογήσετε" στο "να ομολογήσετε" (δηλαδή κάθε φυλακισμένος μπορεί να ωφεληθεί προδίδοντας τον αντίπαλο). Αυτό επεξηγεί μια σημαντική πτυχή του παιχνιδιού «δίλημμα του φυλακισμένου»: Εάν οι παίκτες συνεργάζονται (εάν κάθε φυλακισμένος επιλέγει την στρατηγική του "μην ομολογείς"), τότε κάθε παίκτης μπορεί να κερδίσει προδίδοντας τον αντίπαλό του (υποθέτοντας ότι η στρατηγική του παραμένει ίδια). Εάν και οι δύο παίκτες προδώσουν ο ένας τον άλλο, τότε και για τους δύο θα είναι σε χειρότερη θέση από την επιλογή της συνεταιριστικής στρατηγική τους. Αυτή η ανωμαλία δεν εμφανίζεται σε ένα παιχνίδι δυο προσώπων σταθερού ποσού. ΠΙΝΑΚΑΣ 3.2 Το δίλημμα ενός φυλακισμένου Πίνακας απόδοσης Παίκτης 1 Παίκτης 2 NC C NC (P, P) (T, S) C (S, T) (R, R) Τυπικότερα, το παιχνίδι διλήμματος ενός φυλακισμένου μπορεί να περιγραφεί όπως στον πίνακα 3.2, όπου NC = μη συνεργαζόμενη δράση C = συνεργαζόμενη δράση P = τιμωρία για την μη συνεργασία S = απόδοση του πρόσωπου που προδίδει τον αντίπαλο του R = απόδοση για τη συνεργασία εάν και οι δύο φορείς συνεργάζονται T = κίνητρο για τη προδοσία του αντιπάλου. Σε ένα παιχνίδι διλήμματος φυλακισμένων, (P, P) είναι ένα σημείο ισορροπίας. Αυτό απαιτεί P > S. Για να μην είναι το ένα (R, R) σημείο ισορροπίας απαιτείται T > Ρ. Το παιχνίδι είναι λογικό μόνο εάν R > P. Κατά συνέπεια, 28

προκειμένου ο πίνακας 3.2 να αντιπροσωπεύει το παιχνίδι του διλήμματος ενός φυλακισμένου, απαιτείται να ισχύει T > R > P > S. Το παιχνίδι διλήμματος των φυλακισμένων είναι ενδιαφέρον επειδή εξηγεί γιατί δύο αντίπαλοι αποτυγχάνουν συχνά να συνεργαστούν μεταξύ τους. Αυτό εμφανίζεται στα παραδείγματα 3.1 και 3.2. ΠΑΡΑΔΕΙΓΜΑ 3.1 Το δίλημμα του φυλακισμένου στη διαφήμιση Δύο ανταγωνιστικά εστιατόρια τα Ταβέρνα Α και Ταβέρνα Β προσπαθούν να καθορίσουν τους προϋπολογισμούς διαφήμισής τους για το επόμενο έτος. Και τα δύο εστιατόρια έχουν συνολικές πωλήσεις 240 εκατομμύρια και μπορούν να διαθέσουν το καθένα 6 εκατομμύρια η 10 εκατομμύρια για διαφήμιση. Εάν το ένα εστιατόριο δαπανήσει περισσότερα χρήματα από άλλο, τότε το εστιατόριο που θα δαπανήσει περισσότερα χρήματα θα έχει τις πωλήσεις 190 εκατομμυρίων. Εάν και οι δύο επιχειρήσεις δαπανήσουν το ίδιο ποσό στη διαφήμιση, τότε θα έχουν ίσες πωλήσεις. Υποθέτουμε ότι κάθε εστιατόριο ενδιαφέρεται να μεγιστοποιήσει το ποσό (συμβολή των πωλήσεων στο κέρδος) - (έξοδα διαφήμισης). Να βρεθεί ένα σημείο ισορροπίας για αυτό το παιχνίδι. Λύση Ο πίνακας αποδόσεων είναι ο 3.3. Εάν προσδιορίσουμε τη δαπάνη 10 εκατομμυρίων στη διαφήμιση ως μη συνεταιριστική δράση και τη δαπάνη 6 εκατομμυρίων ως συνεταιριστική δράση, τότε το (2, 2) (που αντιστοιχεί σε έντονη διαφήμιση και από τα δύο εστιατόρια) είναι ένα σημείο ισορροπίας. ΠΙΝΑΚΑΣ 3.3 Πίνακας αποδόσεων για το παιχνίδι διαφήμισης. Ταβέρνα Β Ταβέρνα Α 10 εκατομμύρια 6 εκατομμύρια 10 εκατομμύρια (2,2) (9,-1) 6 εκατομμύρια (-1,9) (6,6) 29

Αν και τα δύο εστιατόρια έχουν καλύτερη απόδοση στο (6,6) απ ότι στο (2,2), το (6,6) είναι ασταθές διότι και τα δύο εστιατόρια μπορεί κερδίσουν μεταβάλλοντας τη στρατηγική τους. Κατά συνέπεια προκειμένου να διατηρήσουν το μερίδιο αγοράς που κατέχουν, θα πρέπει και τα δύο εστιατόρια να δαπανήσουν σε εντατική διαφήμιση. ΠΑΡΑΔΕΙΓΜΑ 3.2 Το δίλημμα του φυλακισμένου στον εξοπλιστικό ανταγωνισμό. Δύο έθνη το Α και το Β συμμετέχουν σε ένα εξοπλιστικό ανταγωνισμό στον οποίο κάθε έθνος έχει δύο πιθανές στρατηγικές: Ανάπτυξη ενός νέου πυραύλου ή διατήρηση της υπάρχουσας κατάστασης (status quo). Ο πίνακας αποδόσεων είναι ο 3.4 και βασίζεται στην υπόθεση ότι εάν μόνο ένα έθνος αναπτύξει ένα νέο πύραυλο, τότε το έθνος με το νέο πύραυλο θα κατακτήσει το άλλο έθνος. Σε αυτήν την περίπτωση, ο κατακτητής κερδίζει 20 μονάδες ενώ ο ηττημένος χάνει 100 μονάδες. Επίσης υποθέτουμε ότι το κόστος ανάπτυξης του νέου πυραύλου είναι 10 μονάδες. Να προσδιοριστεί ένα σημείο ισορροπίας για αυτό το παιχνίδι. Λύση Χαρακτηρίζοντας τους όρους "ανάπτυξη νέου πυραύλου" ως μη συνεταιριστική δράση και "διατήρηση της υπάρχουσας κατάστασης" ως συνεταιριστικό δράση, βλέπουμε ότι το (-10,-10) (και τα δύο έθνη που επιλέγουν τη μη συνεταιριστική δράση) είναι ένα σημείο ισορροπίας. Αν και το (0, 0) παρέχει και στα δύο έθνη καλύτερη απόδοση από το (-10, -10), βλέπουμε ότι σε αυτήν την κατάσταση, κάθε έθνος μπορεί να κερδίσει από μία προδοσία. Κατά συνέπεια το (0, 0) δεν είναι ευσταθές σημείο. Το παράδειγμα αυτό δείχνει πώς η προσπάθεια διατήρησης της ισορροπίας της δύναμης μπορεί να οδηγήσει σε ένα συνεχή εξοπλιστικό ανταγωνισμό. 30

ΠΙΝΑΚΑΣ 3.4 Πίνακας απόδοσης του εξοπλιστικού ανταγωνισμού Έθνος Β Έθνος Α Ανάπτυξη νέου πυραύλου Διατήρηση υπάρχουσας κατάστασης Ανάπτυξη νέου πυραύλου (-10,-10) (10, -100) Διατήρηση κατάστασης υπάρχουσας (-10, -100) (0, 0) ΠΑΡΑΔΕΙΓΜΑ 3.3 Παιχνίδι του Κοτόπουλου Το παιχνίδι δυο προσώπων - μη σταθερού ποσού δεν είναι παιχνίδι διλήμματος ενός φυλακισμένου όπως τα προηγούμενα. Ο Κώστας κινείται προς το Γιάννη σε έναν εγκαταλειμμένο δρόμο. Κάθε πρόσωπο έχει δύο στρατηγικές: παρεκκλίνετε ή μην παρεκκλίνετε. Ο πίνακας απόδοσης είναι ο 3.5. Να βρεθούν τα σημεία ισορροπίας αυτού του παιχνιδιού. Λύση Στα σημεία (5, -5) και (-5, 5) κανένας παίκτης δεν μπορεί να κερδίσει από μια μονομερή αλλαγή στη στρατηγική. Κατά συνέπεια τα (5, -5) και (-5, 5) είναι και τα δύο σημεία ισορροπίας ΠΙΝΑΚΑΣ 3.5 Πίνακας ανταμοιβής για παιχνίδι παρέκκλισης Γιάννης Κώστας Παρέκκλιση Μη παρέκκλιση Παρέκκλιση (0, 0) (-5, 5) Μη Παρέκκλιση (5, -5) (-100, -100) 31

Όπως τα παιχνίδια σταθερού ποσού, ένα παιχνίδι μη σταθερού ποσού μπορεί να μη έχει ένα σημείο ισορροπίας στις καθαρές στρατηγικές. Αποδεικνύεται ότι εάν επιτρέπονται μικτές στρατηγικές, τότε σε οποιοδήποτε παιχνίδι δυο προσώπων - μη σταθερού ποσού, κάθε παίκτης έχει μια στρατηγική ισορροπίας (υπό την έννοια ότι εάν ένας παίκτης παίζει τη στρατηγική ισορροπίας, ο άλλος παίκτης δεν μπορεί να ωφεληθεί παρεκκλίνοντας από τη στρατηγική ισορροπίας) [see Owen (1982, p. 127)]. 32

ΚΕΦΑΛΑΙΟ 4ο ΘΕΩΡΙΑ ΠΑΙΧΝΙΔΙΩΝ n-προσωπων 4.1 ΠΑΡΑΔΕΙΓΜΑΤΑ Σε πολλές ανταγωνιστικές καταστάσεις, υπάρχουν περισσότεροι από δύο ανταγωνιστές. Έχοντας αυτό υπόψη, στρέφουμε τώρα την προσοχή μας στα παιχνίδια με τρεις ή περισσότερους παίκτες. Έστω ότι N = {1..2,...,n} είναι το σύνολο παικτών. Οποιοδήποτε παιχνίδι με n παίκτες είναι ένα παιχνίδι n- προσώπων. Για το σκοπό αυτό, ένα παιχνίδι n-προσώπων προσδιορίζεται από τη χαρακτηριστική συνάρτηση του παιχνιδιού. ΟΡΙΣΜΟΣ Για κάθε υποσύνολο παιχνιδιού δίνει το ποσό S του vs ( ) N, η χαρακτηριστική συνάρτηση ότι τα μέλη του S v ενός μπορούν να είναι βέβαια ότι θα έχουν να παίρνουν αν ενεργούν από κοινού και διαμορφώνουν έναν συνασπισμό. Κατά συνέπεια, η που τα μέλη του S vs ( ) παίκτες που δεν είναι στο S. μπορεί να καθοριστεί από τον υπολογισμό του ποσού μπορούν να πάρουν χωρίς οποιαδήποτε βοήθεια από τους Παράδειγμα 4.1.1 Το παιχνίδι του φάρμακου Ο Γιώργος έχει εφεύρει ένα νέο φάρμακο το οποίο δεν μπορεί να κατασκευάσει το φάρμακο ο ίδιος, αλλά μπορεί να πωλήσει τον τύπο του φαρμάκου στην επιχείρηση 2 ή την επιχείρηση 3. Η τυχερή επιχείρηση θα μοιραστεί κέρδος 1 εκατομμύριο με το Γιώργο. Να βρεθεί η χαρακτηριστική συνάρτηση για αυτό το παιχνίδι. Λύση Έστω ότι ο Γιώργος είναι ο παίκτης 1, η επιχείρηση 2 είναι ο παίκτης 2, και η επιχείρηση 3 είναι παίκτης 3. Η χαρακτηριστική συνάρτηση για αυτό το παιχνίδι είναι: 33

v({ }) v({1}) v({2}) v({3}) v({2,3}) 0 v({1,2}) v({1,3}) v({1,2,3}) 1.000.000 Παράδειγμα 4.1.2 Το παιχνίδι των απορριμμάτων Κάθε ένας από τέσσερις ιδιοκτήτες έχει μια τσάντα των απορριμμάτων και πρέπει να την πετάξει στην ιδιοκτησία κάποιου. Εάν b τσάντες απορριμμάτων ρίπτονται στο συνασπισμό των ιδιοκτητών, κατόπιν ο συνασπισμός λαμβάνει μια απόδοση παιχνίδι. Λύση b. Να βρεθεί η χαρακτηριστική συνάρτηση για αυτό το Το καλύτερο που τα μέλη οποιουδήποτε συνασπισμού μπορούν να κάνουν είναι να πετάξουν τα όλα απορρίμματα τους στην ιδιοκτησία που δεν είναι στο S. Κατά συνέπεια, η χαρακτηριστική συνάρτηση για το παιχνίδι των απορριμμάτων ( S είναι το πλήθος των παικτών στο S ) δίνεται από: v({ S}) (4 S ) (αν S 4) v({1, 2,3, 4}) 4 (αν S =4) (4.1) Η εξίσωση (4.1) προκύπτει επειδή εάν οι παίκτες είναι στο S, πρέπει να πετάξουν τα απορρίμματα τους στα μέλη του S. Παράδειγμα 4.1.3 Το παιχνίδι των αγροτεμαχίων Ο παίκτης 1 είναι κύριος ενός αγροτεμαχίου το οποίο το εκτιμάει σε 10.000. Ο παίκτης 2 είναι ένας υπόδιαιρέτης που μπορεί να αναπτύξει το έδαφος και να αυξήσει την αξία του 20,000. Ο φορέας 3 είναι ένας υπόδιαιρέτης που μπορεί να αναπτύξει το έδαφος και να αυξήσει την αξία του 30,000. Δεν υπάρχει κανένας άλλος υποψήφιος αγοραστής. Βρείτε τη χαρακτηριστική συνάρτηση για αυτό το παιχνίδι. 34

Λύση: Σημειώνεται ότι οποιοσδήποτε συνασπισμός που δεν περιέχει το φορέα 1 έχει μια αξία ή τιμή 0. Κατά συνέπεια, λαμβάνουμε την ακόλουθη χαρακτηριστική συνάρτηση: v({1}) 10.000, v({ }) v({2}) v({3}) 0, v({1,2}) 20.000 v({1,3}) 30.000, v({2,3}) 0, v({1,2,3}) 30.000. ώστε το Θεωρούμε δύο οποιασδήποτε υποσύνολα των συνόλων A και το B δεν έχουν κοινούς παίκτες ( A B A και B έτσι ). Τότε για κάθε ένα από τα παραπάνω παραδείγματα (και οποιοδήποτε παιχνίδι n-προσώπων), η χαρακτηριστική συνάρτηση ικανοποιεί την ακόλουθη ανισότητα: v( A B) v( A) v( B) (4.2) Η ιδιότητα αυτή της χαρακτηριστικής συνάρτησης καλείται υπεραθροιστικότητα. Η σχέση (4.2) είναι σωστή, αφού όταν οι παίκτες του συνόλου A B είναι μαζί, μια από τις επιλογές τους (αλλά όχι η μόνη επιλογή τους) είναι να αφήσουν τους παίκτες στο A και το B να τα βγάλουν πέρα μόνοι τους. Αυτό θα οδηγούσε στο συνασπισμό να λαμβάνει ένα ποσό v( A) v( B). Κατά συνέπεια το v( A B) πρέπει να είναι τουλάχιστον τόσο μεγάλο όσο το v( A) v( B). Υπάρχουν πολλές λύσεις για τα παιχνίδια n-προσώπων. Μια τέτοια λύση πρέπει να προσδιορίζει την απόδοση που κάθε παίκτης θα λάβει. Συγκεκριμένα, έστω x ( x1, x2,..., x n ) το διάνυσμα απόδοσης σύμφωνα με το οποίο ο παίκτης i λαμβάνει μια απόδοση x i. Για να είναι το x (,,..., ) x1 x2 x n λύση θα πρέπει να ικανοποιεί n v( N) x (ομαδική λογική) (4.3) i 1 i 35

x v({ i}) (για κάθε i N), (μεμονομένη λογική) i (4.4) Εάν το x ικανοποιεί και (4.3) και (4.4), τότε λέμε ότι το x είναι ένας καταλογισμός. Η εξίσωση (4.3) δηλώνει ότι οποιοδήποτε λογικό διάνυσμα απόδοσης πρέπει να δίνει σε όλους στους παίκτες ένα ποσό που είναι ίσο με το ποσό που μπορεί να επιτευχθεί από τον υπερσυνασπισμό αποτελούμενο από όλους τους παίκτες. Η σχέση (4.4) δηλώνει ότι παίκτης i πρέπει να λάβει μια απόδοση τουλάχιστον τόσο μεγάλη όπως εκείνη που μπορεί να πάρει για τον εαυτό του, δηλαδή v({ i}). Για παράδειγμα ο πίνακας 4.1 παρουσιάζει τα διανύσματα απόδοσης του παραδείγματος 4.1.3. Οποιαδήποτε λύση για τα παιχνίδια n-προσώπων επιλέγει κάποιο υποσύνολο του συνόλου καταλογισμών (ενδεχομένως κενών) ως λύση στο παιχνίδι n-προσώπων. Στις συνέχεια, παρουσιάζονται δύο λύσεις, ο πυρήνας και την αξία Shapley. Δείτε Owen (1999) για άλλες εννοιών λύσεις για τα παιχνίδια n-προσώπων. Τα προβλήματα που περιλαμβάνουν τη θεωρία παιχνιδιών n-προσώπων είναι στο τέλος αυτού του κεφαλαίου. ΠΙΝΑΚΑΣ 4.1 x (10.000, 10.000, 510.000 ) Nαι Είναι το x καταλογισμός; (5.000, 2.000, 55.000 ) Όχι, x1 v({1}), έτσι παραβιάζεται η (4.4) (12.000, 519.000, -1.000 ) Όχι, παραβιάζεται η (4.4) (11.000, 11.000, 11.000 ) Όχι, παραβιάζεται η (4.3) 4.2 Ο ΠΥΡΗΝΑΣ ΠΑΙΧΝΙΔΙΟΥ n-προσωπων Μια σημαντική λύση για ένα παιχνίδι n-προσώπων είναι ο πυρήνας. Πριν ορίσουμε τον πυρήνα, πρέπει να ορίσουμε την έννοια της κυριαρχίας. Για ένα καταλογισμό x ( x1, x2,..., x n ), λέμε ότι ο καταλογισμός y ( y1, y2,..., y n ) επικρατεί του x μέσω ενός συνασπισμού S (συμβολικά y S x ) εάν: 36