Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

Σχετικά έγγραφα
Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

1 Εισαγωγή στις Συνδυαστικές Δημοπρασίες - Combinatorial Auctions

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

1 Εισαγωγή στις Συνδυαστικές Δημοπρασίες - Combinatorial Auctions

Θεωρία Δυαδικότητας ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ. Η παρουσίαση προετοιμάστηκε από τον Ν.Α. Παναγιώτου. Επιχειρησιακή Έρευνα

ΘΕΩΡΙΑ ΤΩΝ ΠΑΙΓΝΙΩΝ I.

- ΟΡΙΟ - ΣΥΝΕΧΕΙΑ ΣΥΝΑΡΤΗΣΗΣ ΕΝΟΤΗΤΑ 6: ΜΗ ΠΕΠΕΡΑΣΜΕΝΟ ΟΡΙΟ ΣΤΟ

Επιχειρησιακή Έρευνα I

Αλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες

δημιουργία: επεξεργασία: Ν.Τσάντας

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0

z = c 1 x 1 + c 2 x c n x n

Συνδυαστική Βελτιστοποίηση Εισαγωγή στον γραμμικό προγραμματισμό (ΓΠ)

Τμήμα Εφαρμοσμένης Πληροφορικής

Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α

ΤΕΙ Χαλκίδας Σχολή Διοίκησης και Οικονομίας Τμήμα Διοίκησης Επιχειρήσεων

Διαχείριση Εφοδιαστικής Αλυσίδας ΙΙ

ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΑΚ. ΕΤΟΣ ΔΙΑΛΕΞΗ 6 η -Η ΔΥΙΚΗ ΜΕΘΟΔΟΣ SIMPLEX

Περιεχόμενα. 1. Ανάλυση ευαισθησίας. (1) Ανάλυση ευαισθησίας (2) Δυϊκό πρόβλημα (κανονική μορφή) (3) Δυαδικός προγραμματισμός (4) Ανάλυση αποφάσεων

3.7 Παραδείγματα Μεθόδου Simplex

Θεωρία Παιγνίων και Αποφάσεων

Συνδυαστική Βελτιστοποίηση Εισαγωγή στον γραμμικό προγραμματισμό (ΓΠ)

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

ΓΡΑΜΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΚΑΙ ΜΕΘΟΔΟΣ SIMPLEX, διαλ. 3. Ανωτάτη Σχολή Παιδαγωγικής και Τεχνολογικής Εκπαίδευσης 29/4/2017

Συνδυαστική Βελτιστοποίηση Εισαγωγή στον γραμμικό προγραμματισμό (ΓΠ)

Fermat, 1638, Newton Euler, Lagrange, 1807

Κεφ. 9 Ανάλυση αποφάσεων

Γραμμικός Προγραμματισμός Μέθοδος Simplex

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2016

Τμήμα Μηχανικών Πληροφορικής ΤΕ Δυϊκότητα. Γκόγκος Χρήστος ΤΕΙ Ηπείρου Επιχειρησιακή Έρευνα. τελευταία ενημέρωση: 1/12/2016

- Παράδειγμα 2. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

Γραφική Λύση & Πρότυπη Μορφή Μαθηματικού Μοντέλου

Επιχειρησιακή Έρευνα

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 8: Δημοπρασίες. Ε. Μαρκάκης. Επικ. Καθηγητής

ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΤΗΣ ΜΕΘΟΔΟΥ SIMPLEX

ΑΣΚΗΣΗ 1 ΑΣΚΗΣΗ 2 ΑΣΚΗΣΗ 3

ΠΑΡΑΔΕΙΓΜΑΤΑ ΘΕΜΑ Β. Να μελετήσετε ως προς τη μονοτονία και τα ακρότατα τις παρακάτω συναρτήσεις: f (x) = 0 x(2ln x + 1) = 0 ln x = x = e x =

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α

Λύσεις θεμάτων Επιχειρησιακής Έρευνας (17/09/2014)

Άριστες κατά Pareto Κατανομές

ΕΝΝΟΙΕΣ ΚΑΙ ΕΦΑΡΜΟΓΕΣ, διαλ. 4. Ανωτάτη Σχολή Παιδαγωγικής και Τεχνολογικής Εκπαίδευσης 6/5/2017

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2017

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Μέθοδος μέγιστης πιθανοφάνειας

Επιχειρησιακή Έρευνα. Εισαγωγική Διάλεξη

ΕΝΟΤΗΤΑ III ΒΑΣΙΚΕΣ ΜΕΘΟ ΟΙ ΑΝΑΛΥΣΗΣ

Κεφάλαιο 5ο: Ακέραιος προγραμματισμός

ΑΚΕΡΑΙΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ & ΣΥΝΔΥΑΣΤΙΚΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ. Κεφάλαιο 3 Μορφοποίηση Προβλημάτων Ακέραιου Προγραμματισμού

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Θεωρία Αλγόριθμοι Γραμμικής Βελτιστοποίησης 28/3/2012. Lecture07 1

Γραμμικός Προγραμματισμός

Πληροφοριακά Συστήματα Διοίκησης. Επισκόπηση μοντέλων λήψης αποφάσεων Τεχνικές Μαθηματικού Προγραμματισμού

ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ

Β. Βασιλειάδης Αν. Καθηγητής. Επιχειρησιακή Ερευνα Διάλεξη 6 η - Θεωρεία Παιγνίων

0x2 = 2. = = δηλαδή η f δεν. = 2. Άρα η συνάρτηση f δεν είναι συνεχής στο [0,3]. Συνεπώς δεν. x 2. lim f (x) = lim (2x 1) = 3 και x 2 x 2

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

ΔΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΣΥΝΟΠΤΙΚΗ ΘΕΩΡΕΙΑ ΜΕΘΟΔΟΛΟΓΙΑ ΛΥΜΕΝΑ ΠΑΡΑΔΕΙΓΜΑΤΑ

Εισαγωγή. Οπως είδαµε για την εκκίνηση της Simplex χρειαζόµαστε µια Αρχική Βασική Εφικτή Λύση. υϊσµός

12. ΑΝΙΣΩΣΕΙΣ Α ΒΑΘΜΟΥ. είναι δύο παραστάσεις μιας μεταβλητής x πού παίρνει τιμές στο

Γραμμικός Προγραμματισμός

Επιχειρησιακή Έρευνα I

min f(x) x R n b j - g j (x) = s j - b j = 0 g j (x) + s j = 0 - b j ) min L(x, s, λ) x R n λ, s R m L x i = 1, 2,, n (1) m L(x, s, λ) = f(x) +

Μοντέλα των Cournotκαι Bertrand

Επιχειρησιακή Έρευνα I

Τ.Ε.Ι. ΚΑΒΑΛΑΣ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΛΗΡΟΦΟΡΙΩΝ «ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ» Του σπουδαστή ΚΑΡΑΜΙΓΚΟΥ ΘΕΜΙΣΤΟΚΛΗ

Γραμμικός Προγραμματισμός

Επιχειρησιακή Έρευνα I

ΑΛΓΟΡΙΘΜΙΚΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Πανεπιστήµιο Αθηνών Εαρινό Εξάµηνο 2007 ιδάσκων : Ηλίας Κουτσουπιάς

( ) ΘΕΜΑ 1 κανονική κατανομή

Κυριαρχία και μεικτές στρατηγικές Μεικτές στρατηγικές και κυριαρχία Είδαμε ότι μια στρατηγική του παίκτη i είναι κυριαρχούμενη, αν υπάρχει κάποια άλλη

1. ΓΡΑΜΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

Τμήμα Διοίκησης Επιχειρήσεων

Κεφάλαιο 4: Διαφορικός Λογισμός

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

2. ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Θεωρία Καταναλωτή. Υποδειγματοποίηση της συμπεριφοράς του καταναλωτή. Βασική έννοια: Βελτιστοποίηση υπό περιορισμό.

Βασική Εφικτή Λύση. Βασική Εφικτή Λύση

Η γραφική μέθοδος επίλυσης προβλημάτων Γραμμικού Προγραμματισμού

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ»

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 9: Λύσεις παιγνίων δύο παικτών

ΣΥΣΤHΜΑΤΑ ΑΠΟΦAΣΕΩΝ ΣΤΗΝ ΠΑΡΑΓΩΓH

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

Δυϊκότητα. Δημήτρης Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Εθνικό Μετσόβιο Πολυτεχνείο

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Περιεχόμενα Πρόλογος 5ης αναθεωρημένης έκδοσης ΚΕΦΆΛΆΙΟ 1 Ο ρόλος της επιχειρησιακής έρευνας στη λήψη αποφάσεων ΚΕΦΆΛΆΙΟ 2.


Γραμμικός Προγραμματισμός

Κεφάλαιο 28 Ολιγοπώλιο

Ελαχιστοποίηση του Κόστους

Άριστες κατά Pareto Κατανομές και το Πρώτο Θεώρημα Ευημερίας

2.4 Μια Πρώτη Προσέγγιση στην Ανάλυση Ευαισθησίας

Μορφές αποδείξεων Υπάρχουν πολλά είδη αποδείξεων. Εδώ θα δούμε τα πιο κοινά: Εξαντλητική μέθοδος ή μέθοδος επισκόπησης. Οταν το πρόβλημα έχει πεπερασμ

Transcript:

Θεωρία Παιγνίων και Αποφάσεων Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος Ε. Μαρκάκης Επικ. Καθηγητής

Περίληψη Παίγνια μηδενικού αθροίσματος PessimisIc play Αμιγείς max-min και min-max στρατηγικές Μεικτές max-min και min-max στρατηγικές Υπολογισμός σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος Το θεώρημα του von Neumann Αλγόριθμοι για 2x2 παίγνια 2xn παίγνια nxm 0-sum παίγνια μέσω γραμμικού προγραμματισμού 2

Σημεία ισορροπίας: Ύπαρξη Το θεώρημα του Nash εξασφαλίζει ΜΟΝΟ την ύπαρξη και όχι την εύρεση σημείων ισορροπίας Απόδειξη βασισμένη σε fixed point theorems Brouwer s fixed point theorem Η απόδειξη του θεωρήματος δεν «υποδεικνύει» κάποιον αλγόριθμο υπολογισμού σημείων ισορροπίας Μπορούμε να έχουμε αποδοτικούς αλγορίθμους για παίγνια 2 παικτών? Για παίγνια περισσότερων παικτών? 3

Παίγνια Μηδενικού Αθροίσματος 4

Παίγνια μηδενικού αθροίσματος (0-sum games) Μια ειδική περίπτωση παιγνίων κανονικής μορφής Είναι παίγνια όπου σε κάθε προφίλ αμιγών στρατηγικών (s, t) με s S 1, t S 2 u 1 (s, t) + u 2 (s, t) = 0 Η ωφέλεια του ενός παίκτη ισούται με την απώλεια του άλλου Αναφέρονται και ως πλήρως ανταγωνιστικά παίγνια (strictly compeiive) Αν γνωρίζουμε τον πίνακα ωφέλειας του ενός παίκτη, τότε ξέρουμε και τον πίνακα του άλλου Σύμβαση: για την αναπαράσταση τέτοιων παιγνίων θα χρησιμοποιούμε τον πίνακα Α του π. 1 Ο πίνακας του π. 2 είναι ο -Α 4 2 1 3 5

Παίγνια μηδενικού αθροίσματος Πώς πρέπει να επιλέξουμε στρατηγική σε τέτοια παίγνια? Θα επικεντρωθούμε πρώτα σε αμιγείς στρατηγικές Ιδέα: PessimisIc play Σκεπτικό κάθε παίκτη: Ό,τι και να διαλέξω, ο άλλος παίκτης θα διαλέξει τη στρατηγική που ελαχιστοποιεί τη δική μου ωφέλεια Σκεπτικό π. 1: Το χειρότερο σενάριο όταν διαλέγω κάποια γραμμή, είναι ο π. 2 να επιλέξει τη στήλη με τη χειρότερη ωφέλεια πάνω σε αυτή τη γραμμή Άρα, καλύτερα να διαλέξω τη γραμμή που εξασφαλίζει το καλύτερο χειρότερο σενάριο Δηλαδή τη γραμμή με το υψηλότερο ελάχιστο στοιχείο Ομοίως για τον π. 2 6

Παίγνια μηδενικού αθροίσματος Ορισμοί Για τον π. 1: Το καλύτερο από τα χειρότερα σενάρια αποφέρει ωφέλεια τουλάχιστον ίση με v 1 = max i min j A ij Βλέπουμε σε κάθε γραμμή το ελάχιστο και επιλέγουμε τη γραμμή με το καλύτερο ελάχιστο Για τον π. 2: Οι ωφέλειες του πίνακα Α αντιστοιχούν σε ζημιά/χασούρα για τον π. 2 Το καλύτερο από τα χειρότερα σενάρια έχει ζημιά στον π. 2 ίση με v 2 = min j max i A ij Βλέπουμε σε κάθε στήλη το μέγιστο και επιλέγουμε τη στήλη με το μικρότερο μέγιστο 7

Παράδειγμα 1 Η τιμή v 1 είναι η ελάχιστη ωφέλεια που μπορεί να εγγυηθεί ο π. 1 ανεξαρτήτως του τι θα επιλέξει ο π. 2 Ομοίως η v 2 είναι η μέγιστη ζημιά που μπορεί να εγγυηθεί ο π. 2 ανεξαρτήτως του τι θα επιλέξει ο π. 1 Υπολογισμός του v 1 για τον π. 1: Αν διαλέξω την γραμμή 1, στη χειρότερη περίπτωση παίρνω 2 Αν διαλέξω τη γραμμή 2, στη χειρότερη περίπτωση παίρνω 1 Άρα v 1 = 2 Ομοίως για το v 2 του π. 2: v 2 = 3 4 2 1 3 8

Παράδειγμα 1 v 1 = 2 < v 2 = 3 Μια στρατηγική που εγγυάται ωφέλεια τουλάχιστον v 1 ονομάζεται max-min στρατηγική για τον π. 1 Αντίστοιχα για τον π. 2, μια min-max στρατηγική εγγυάται απώλεια το πολύ v 2 Αν οι παίκτες ακολουθήσουν τις max-min και min-max στρατηγικές τους, τελικό προφίλ = 1 η γραμμή κ 2 η στήλη Είναι σημείο ισορροπίας αυτό το προφίλ? Όχι Έχει σημεία ισορροπίας με αμιγείς στρατηγικές το παίγνιο? Οχι 4 2 1 3 9

Παράδειγμα 2 Υπολογισμός του v 1 για τον π. 1: Γραμμή 1, min = 4 Γραμμή 2, min = 1 Γραμμή 3, min = 0 Γραμμή 4, min = 4 v 1 = max {4, 1, 0, 4} = 4 Υπολογισμός του v 2 για τον π. 2: Στήλη 1, max = 4 Στήλη 2, max = 6 Στήλη 3, max = 7 Στήλη 4, max = 4 v 2 = min {4, 6, 7, 4} = 4 s 1 s 2 s 3 s 4 t 1 t 2 t 3 t 4 4 5 6 4 2 6 1 3 1 0 0 2 4 4 7 4 10

Παράδειγμα 2 Σε αντίθεση με το Παράδειγμα 1, εδώ έχουμε v 1 = v 2 Προτεινόμενες στρατηγικές: s 1 ή s 4 για τον π. 1 t 1 ή t 4 για τον π. 2 To pessimisic play εδώ οδηγεί σε 4 πιθανά προφίλ Παρατήρηση: i. Ίδιες ωφέλειες και στα 4 προφίλ ii. iii. Και τα 4 προφίλ είναι σημεία ισορροπίας! Δεν υπάρχει κανένα άλλο σημείο ισορροπίας s 1 s 2 s 3 s 4 t 1 t 2 t 3 t 4 4 5 6 4 2 6 1 3 1 0 0 2 4 4 7 4 11

Παράδειγμα 3 Υπολογισμός του v 1 για τον π. 1: Γραμμή 1, min = 4 Γραμμή 2, min = 0 Γραμμή 3, min = 1 v 1 = max {4, 0, 1} = 4 Υπολογισμός του v 2 για τον π. 2: Στήλη 1, max = 4 Στήλη 2, max = 6 Στήλη 3, max = 5 v 2 = min {4, 6, 5} = 4 Και εδώ έχουμε v 1 = v 2 s 1 s 2 s 3 t 1 t 2 t 3 4 6 5 2 1 0 1 3 1 12

Παράδειγμα 3 Προτεινόμενο προφίλ: (s 1, t 1 ) To pessimisic play εδώ οδηγεί στο μοναδικό σημείο ισορροπίας του παιγνίου! Σύμπτωση? s 1 s 2 s 3 t 1 t 2 t 3 4 6 5 2 1 0 1 3 1 13

Σημεία ισορροπίας με αμιγείς στρατηγικές Θεώρημα: Για κάθε πεπερασμένο παίγνιο μηδενικού αθροίσματος 2 παικτών: v 1 v 2 Υπάρχει σημείο ισορροπίας με αμιγείς στρατηγικές αν και μόνο αν v 1 = v 2 Αν (s, t) και (s, t ) είναι σημεία ισορροπίας με αμιγείς στρατηγικές, τότε και τα προφίλ (s, t ), (s, t) είναι σημεία ισορροπίας Όταν έχουμε πολλά σημεία ισορροπίας με αμιγείς στρατηγικές, οι ωφέλειες είναι σε όλες το ίδιο (v 1 για τον π. 1 και -v 1 για τον π. 2) 14

Σημεία ισορροπίας με αμιγείς στρατηγικές Πόρισμα: Σε παίγνια όπου v 1 < v 2, δεν υπάρχει σημείο ισορροπίας με αμιγείς στρατηγικές Σε αρκετά παίγνια μηδενικού αθροίσματος, έχουμε ότι max i min j Α ij min j max i Α ij Άρα το pessimisic play με αμιγείς στρατηγικές δεν οδηγεί πάντα σε σημείο ισορροπίας Ιδέα: Να χρησιμοποιήσουμε pessimisic play με μεικτές στρατηγικές! 15

Σημεία ισορροπίας με αμιγείς στρατηγικές Μπορούμε να χρησιμοποιήσουμε τους ίδιους ορισμούς για max-min και min-max στρατηγικές, επιτρέποντας πλέον μεικτές στρατηγικές Ορισμοί: w 1 = max p min q u 1 (p, q) w 2 = min q max p u 1 (p, q) Μπορούμε να δείξουμε εύκολα ότι v 1 w 1 w 2 v 2 Έχουμε βελτιστοποίηση ως προς ένα μεγαλύτερο χώρο στρατηγικών Πώς θα υπολογίσουμε τις τιμές w 1 και w 2? 16

Επιστροφή στο Παράδειγμα 1 Υπενθύμιση: v 1 = 2 < v 2 = 3 Θα βρούμε πρώτα το w 1 = max p min q u 1 (p, q) Πρέπει να ψάξουμε για μια στρατηγική p = (p 1, p 2 ) = (p 1, 1 p 1 ) του π. 1 Λήμμα: Δεδομένης στρατηγικής p του π. 1, η ποσότητα min q u 1 (p, q) ελαχιστοποιείται σε αμιγή στρατηγική του π. 2 Δλδ, δεν χρειάζεται να γίνουν και οι 2 βελτιστοποιήσεις (max κ min) ως προς μεικτές στρατηγικές 4 2 1 3 17

Ανάλυση Παραδείγματος 1 Άρα ο υπολογισμός απλουστεύεται ως εξής: w 1 = max p min q u 1 (p, q) = max p min{ u 1 (p, e 1 ), u 1 (p, e 2 ) } = max p1 min{ 4p 1 + 1-p 1, 2p 1 + 3(1-p 1 ) } = max p1 min{ 3p 1 + 1, 3 p 1 } 4 2 1 3 18

Ανάλυση Παραδείγματος 1 w 1 = max p1 min { 3p 1 + 1, 3 p 1 } Χρειάζεται να μεγιστοποιήσουμε το minimum 2 γραμμών 4 2 1 3 0 1/2 1 p 1 19

Ανάλυση Παραδείγματος 1 w 1 = max p1 min { 3p 1 + 1, 3 p 1 } Χρειάζεται να μεγιστοποιήσουμε το minimum 2 γραμμών 4 2 1 3 Η μια γραμμή είναι αύξουσα Η άλλη φθίνουσα Το min. μεγιστοποιείται στο σημείο τομής! p 1 = 1/2 0 1/2 1 p 1 20

Ανάλυση Παραδείγματος 1 Συνοψίζοντας: w 1 = max p min q u 1 (p, q) = max p1 min { 3p 1 + 1, 3 p 1 } = 3*1/2 + 1 = 5/2 Άρα ο π. 1 αρκεί να παίξει τη στρατηγική p = (1/2, 1/2) για να εγγυηθεί μέση ωφέλεια 5/2 ανεξαρτήτως της επιλογής του π. 2 Με μεικτές στρατηγικές, ο π. 1 μπορεί να εγγυηθεί καλύτερη ωφέλεια (αφού v 1 = 2) 4 2 1 3 21

Ανάλυση Παραδείγματος 1 Αν κάνουμε παρόμοια ανάλυση για τον π. 2: w 2 = min q max p u 1 (p, q) = min q max{ u 1 (e 1, q), u 1 (e 2, q) } = min q1 max{ 4q 1 + 2(1-q 1 ), q 1 + 3(1-q 1 ) } = min q1 max{ 2q 1 + 2, 3 2q 1 } 4 2 1 3 Τώρα θέλουμε να ελαχιστοποιήσουμε το max 2 γραμμών 22

Ανάλυση Παραδείγματος 1 w 2 = min q1 max{ 2q 1 + 2, 3 2q 1 } Και πάλι η μια ευθεία είναι αύξουσα και η άλλη φθίνουσα 4 2 1 3 0 1/4 1 q 1 23

Ανάλυση Παραδείγματος 1 w 2 = min q1 max{ 2q 1 + 2, 3 2q 1 } Και πάλι η μια ευθεία είναι αύξουσα και η άλλη φθίνουσα 4 2 1 3 Το max. ελαχιστοποιείται στο σημείο τομής! q 1 = 1/4 min-max στρατηγική: (1/4, 3/4) 0 1/4 1 q 1 24

Ανάλυση Παραδείγματος 1 Τελικά συμπεράσματα: Στρατηγικές των 2 παικτών p = (1/2, 1/2), q = (1/4, 3/4) w 1 = w 2 = 5/2 Άρα με μεικτές στρατηγικές, και οι 2 παίκτες εγγυώνται κάτι καλύτερο στον εαυτό τους Ενώ με αμιγείς στρατηγικές max i min j Α ij min j max i Α ij Με μεικτές έχουμε ισότητα max p min q u 1 (p, q) = min q max p u 1 (p, q) Επίσης, το προφίλ που βρήκαμε είναι και σημείο ισορροπίας! (ελέγξτε το) 4 2 1 3 25

Σημεία ισορροπίας με μεικτές στρατηγικές Θεώρημα (von Neumann 1928): Για κάθε πεπερασμένο παίγνιο μηδενικού αθροίσματος: 1. w 1 = w 2 (η τιμή αυτή είναι γνωστή ως αξία του παιγνίου) 2. Το προφίλ (p, q), με το οποίο επιτυγχάνεται η αξία του παιγνίου αποτελεί σημείο ισορροπίας 3. Αν (p, q) και (p, q ) είναι σημεία ισορροπίας, τότε και τα προφίλ (p, q ), (p, q) είναι επίσης σημεία ισορροπίας 4. Όταν υπάρχουν πολλά σημεία ισορροπίας, οι ωφέλειες είναι σε όλες το ίδιο (w 1 για τον π. 1 και -w 1 για τον π. 2) 26

Σημεία ισορροπίας με μεικτές στρατηγικές Συμπεράσματα από το Θεώρημα του von Neumann Για την οικογένεια των 0-sum παιγνίων, είναι λυμένα όλα τα προβληματικά ζητήματα που έχουμε δει για τα σημεία ισορροπίας - Η ύπαρξη είναι εγγυημένη - Ακόμα κι αν υπάρχουν πολλά σημεία ισορροπίας, όλα έχουν ακριβώς τις ίδιες ωφέλειες - Μπορούμε να διαλέξουμε οποιοδήποτε από τα σημεία ισορροπίας 27

Σημεία ισορροπίας με μεικτές στρατηγικές Υπολογισμός σημείων ισορροπίας Μέχρι τώρα είδαμε πώς να βρίσκουμε σημεία ισορροπίας σε 2x2 0-sum παίγνια Η τεχνική μπορεί να γενικευθεί και σε 2xn ή σε nx2 0-sum παίγνια Όταν ένας παίκτης έχει 2 αμιγείς στρατηγικές, η εύρεση της μεικτής max-min ή min-max στρατηγικής του ανάγεται σε πρόβλημα βελτιστοποίησης 1 μεταβλητής - Εν τέλει, αυτό συνεπάγεται ότι και για τον άλλο παίκτη θα έχουμε πρόβλημα 1 μεταβλητής 28

Παράδειγμα 4 t 1 t 2 t 3 t 4 s 1 6 5 3 5 s 2 1 2 6 4 Έλεγχος πρώτα για ισορροπία με αμιγείς στρατηγικές v 1 = max {3, 1} = 3 v 2 = min {6, 5, 6, 5} = 5 Αφού v 1 v 2, θα ψάξουμε για ισορροπία με μεικτές στρατηγικές Θα ξεκινήσουμε με την εύρεση της μεικτής στρατηγικής του π. 1 δλδ του παίκτη που έχει 2 στρατηγικές Αν το παίγνιο ήταν nx2, θα ξεκινούσαμε με τον π. 2 29

Παράδειγμα 4 t 1 t 2 t 3 t 4 s 1 6 5 3 5 s 2 1 2 6 4 Ψάχνουμε για στρατηγική p = (p 1, p 2 ) = (p 1, 1 p 1 ) του π. 1 Κάνοντας παρόμοια ανάλυση όπως και στο παράδειγμα 1, έχουμε: w 1 = max p min q u 1 (p, q) = max p min{ u 1 (p, e 1 ), u 1 (p, e 2 ), u 1 (p, e 3 ), u 1 (p, e 4 ) } = max p1 min{ 6p 1 + 1-p 1, 5p 1 + 2(1-p 1 ), 3p 1 + 6(1-p 1 ), 5p 1 + 4(1-p 1 ) } = max p1 min{ 5p 1 + 1, 3p 1 + 2, 6 3p 1, p 1 + 4 } 30

Παράδειγμα 4 t 1 t 2 t 3 t 4 s 1 6 5 3 5 s 2 1 2 6 4 Άρα w 1 = max p1 min{ f 1 (p 1 ), f 2 (p 1 ), f 3 (p 1 ), f 4 (p 1 ) }, όπου: f 1 (p 1 ) = 5p 1 + 1, f 2 (p 1 ) = 3p 1 + 2, f 3 (p 1 ) = 6 3p 1, f 4 (p 1 ) = p 1 + 4 Θέλουμε να μεγιστοποιήσουμε το min. 4 ευθειών Γενικά σε 2xn, μεγιστοποιούμε το min. n ευθειών 31

Παράδειγμα 4 f 1 (p 1 ) = 5p 1 + 1, f 2 (p 1 ) = 3p 1 + 2, f 3 (p 1 ) = 6 3p 1, f 4 (p 1 ) = p 1 + 4 6 f 3 5 4 f 4 3 2 1 f 2 f 1 0 1/2 2/3 1 p 1 32

6 5 4 3 2 1 f 1 (p 1 ) = 5p 1 + 1, f 2 (p 1 ) = 3p 1 + 2, f 3 (p 1 ) = 6 3p 1, f 4 (p 1 ) = p 1 + 4 f 3 f 4 f 2 f 1 Παράδειγμα 4 To min{ f 1 (p 1 ), f 2 (p 1 ), f 3 (p 1 ), f 4 (p 1 ) } αντιστοιχεί σε μια τεθλασμένη γραμμή - Ξεκινά με την f 1, μετά με την f 2 και μετά με την f 3 Η max-min στρατηγική του π. 1 αντιστοιχεί στο μέγιστο σημείο της τεθλασμένης Άρα στο σημείο τομής f 2 (p 1 ) = f 3 (p 1 ) p 1 = 2/3 0 1/2 2/3 1 p 1 33

Παράδειγμα 4 t 1 t 2 t 3 t 4 s 1 6 5 3 5 s 2 1 2 6 4 Άρα, max-min στρατηγική του π. 1: p = (2/3, 1/3) w 1 = f 2 (2/3) = f 3 (2/3) = 4 Πώς θα ξεκινούσαμε την ανάλυση του π. 2? Γενικά μια στρατηγική του π. 2 περιγράφεται από 3 παραμέτρους: q = (q 1, q 2, q 3, 1 q 1 q 2 q 3 ) Δύσκολο να το αναλύσουμε έτσι και να βελτιστοποιήσουμε ως προς 3 μεταβλητές 34

Παράδειγμα 4 t 1 t 2 t 3 t 4 s 1 6 5 3 5 s 2 1 2 6 4 Ιδέα: Ο π. 1 καθόρισε την στρατηγική p = (2/3, 1/3), χρησιμοποιώντας μόνο τις f 2 και f 3 Δηλαδή, τις στήλες 2 και 3 Οι υπόλοιπες στρατηγικές του π. 2, δεν εμπλέκονται στον υπολογισμό των max-min και min-max τιμών Άρα θα ψάξουμε για στρατηγική του π. 2 της μορφής: q = (0, q 2, 1 q 2, 0) 35

Παράδειγμα 4 t 1 t 2 t 3 t 4 s 1 6 5 3 5 s 2 1 2 6 4 Θέλουμε να βελτιστοποιήσουμε ως προς q = (0, q 2, 1-q2, 0) Δηλαδή ως προς q 2 w 2 = min q max p u 1 (p, q) = min q2 max{ u 1 (e 1, (0, q 2, 1 q 2, 0)), u 1 (e2, (0, q 2, 1 q 2, 0)) } = min q2 max{ 5q 2 + 3(1-q 2 ), 2q 2 + 6(1-q 2 ) } = min q2 max{ 2q 2 + 3, 6 4q 2 } 36

Παράδειγμα 4 w 2 = min q2 max{ 2q 2 + 3, 6 4q 2 } Από εδώ υπάρχουν 2 ισοδύναμοι τρόποι για να συνεχίσουμε 1. Κάνουμε την ανάλυση για τον π. 2 με την γραφική παράσταση όπως ακριβώς στο παράδειγμα 1 2. Χρησιμοποιώντας το θεώρημα του von Neumann - Ξέρουμε από το θεώρημα ότι w 1 = w 2 - Άρα w 2 = 4 - Το w 2 επιτυγχάνεται με την 2η κ 3η στήλη του π. 2 - Άρα μπορούμε να λύσουμε την εξίσωση 2q 2 + 3 = 4 ή την εξίσωση 6 4q 2 = 4 - Και οι 2 δίνουν ως λύση την q 2 = ½ Τελικό συμπέρασμα: - w 1 = w 2 = 4 - Τελικό προφίλ στρατηγικών: ((2/3, 1/3), (0, 1/2, 1/2, 0)) - Το προφίλ αυτό είναι και το μοναδικό σημείο ισορροπίας του παιγνίου 37

Παίγνια nxm Μπορούμε να γενικεύσουμε αυτή τη μεθοδολογία σε nxm παίγνια με n 3 και m 3? Πρέπει να ψάξουμε για στρατηγική του π. 1 στη μορφή p = (p 1, p 2, p 3, 1 p 1 p 2 p 3 ) Αν ξεκινήσουμε με την ίδια μεθοδολογία: s 1 s 2 s 3 s 4 t 1 t 2 t 3 t 4 6 5 3 5 1 2 6 4 3 8 3 2 5 4 2 0 w 1 = max p min q u 1 (p, q) = max p min{ u 1 (p, e 1 ), u 1 (p, e 2 ), u 1 (p, e 3 ), u 1 (p, e 4 ) } = max p1,p2,p3 min{ 6p 1 + p 2 + 3p 3 + 5(1 p 1 p 2 p 3 ), 5p 1 + 2p 2 + 8p 3 + 4(1 p 1 p 2 p 3 ),...,...} Πρόβλημα 3 μεταβλητών, δεν γίνεται γραφική παράσταση όπως πριν! 38

Παίγνια nxm Χρειαζόμαστε μια πιο γενική τεχνική Μπορούμε να εξετάσουμε αν η απόδειξη του θεωρήματος του von Neumann συνεπάγεται κάποιον αλγόριθμο Η αρχική απόδειξη (1928) δυστυχώς δεν είναι κατασκευαστική Στηρίζεται σε fixed point theorems Όμως: σε αντίθεση με το θεώρημα του Nash, υπάρχει εναλλακτική απόδειξη του θ. von Neumann, που είναι αλγοριθμική Η εύρεση του w 1 και της στρατηγικής του π. 1 μπορεί να μοντελοποιηθεί σαν πρόβλημα γραμμικού προγραμματισμού Η εύρεση της στρατηγικής του π. 2 μοντελοποιείται σαν το δυικό πρόβλημα του π. 1 39

Γραμμικός προγραμματισμός Τι είναι ένα γραμμικό πρόγραμμα? Οποιοδήποτε πρόβλημα βελτιστοποίησης όπου Η αντικειμενική συνάρτηση είναι γραμμική Οι περιορισμοί είναι επίσης γραμμικοί Μπορούμε να έχουμε και ανισότητες με ή και ισότητες στους περιορισμούς Μπορούμε να λύνουμε γραμμικά προγράμματα σε εύλογο χρόνο, ακόμα και με εκατοντάδες περιορισμούς ή μεταβλητές (Matlab, AMPL,...) 40

Γραμμικός προγραμματισμός Βασικό συστατικό της απόδειξης του von Neumann: Θεώρημα δυικότητας γραμμικού προγραμματισμού: Σε κάθε γραμμικό πρόγραμμα μεγιστοποίησης, αντιστοιχεί ένα δυικό γραμμικό πρόγραμμα ελαχιστοποίησης, έτσι ώστε Το αρχικό ΓΠ έχει βέλτιστη λύση,αν και μόνο αν το δυικό έχει βέλτιστη λύση Η βέλτιστη τιμή (όταν υπάρχει) και στις 2 αντικειμενικές συναρτήσεις είναι ίδια OPT + - 41

Εύρεση σημείων ισορροπίας σε 0-sum παίγνια Έστω ένα 0-sum παίγνιο με nxm πίνακα Α για τον π. 1 Πόρισμα [από την απόδειξη του θ. von Neumann]: Οι max-min και min-max στρατηγικές των π. 1 και 2 δίνονται από την βέλτιστη λύση των γραμμικών προγραμμάτων: Πρωτεύον ΓΠ Δυικό ΓΠ 42

Παράδειγμα 5 s 1 s 2 s 3 t 1 t 2 t 3 t 4 6 5 3 5 1 2 6 4 3 8 3 2 v 1 = 3, v 2 = 5 Αναγκαστικά θα χρησιμοποιήσουμε γραμμικό προγραμματισμό Ψάχνουμε για στρατηγικές p = (p 1, p 2, p 3 ) και q = (q 1, q 2, q 3, q 4 ) 43

Παράδειγμα 5 Λύνοντας τα 2 γραμμικά προγράμματα με οποιοδήποτε σχετικό πακέτο λογισμικού, βρίσκουμε το σημείο ισορροπίας Πρωτεύον ΓΠ max w s.t. w 6p 1 + p 2 + 3p 3 w 5p 1 + 2p 2 + 8p 3 s 1 s 2 s 3 t 1 t 2 t 3 t 4 6 5 3 5 1 2 6 4 3 8 3 2 Δυικό ΓΠ min w s.t. w 6q 1 + 5q 2 + 3q 3 + 5q 4 w q 1 + 2q 2 + 6q 3 + 4q 4 w 3p 1 + 6p 2 + 3p 3 w 5p 1 + 4p 2 + 2p 3 p 1 + p 2 + p 3 = 1 p 1, p 2, p 3 0 w 3q 1 + 8q 2 + 3q 3 + 2q 4 q 1 + q 2 + q 3 + q 4 = 1 q 1, q 2, q 3, q 4 0 44

Ανακεφαλαίωση Υπάρχει πάντα σημείο ισορροπίας σε 0-sum παίγνια, όταν επιτρέπουμε μεικτές στρατηγικές w 1 = w 2 = αξία του παιγνίου Αν υπάρχουν πολλά σημεία ισορροπίας, όλα έχουν την ίδια ωφέλεια για τους παίκτες (w 1 για τον π. 1 και -w 1 για τον π. 2) Η αξία του παιγνίου, καθώς και οι max-min και min-max στρατηγικές μπορούν να υπολογιστούν σε πολυωνυμικό χρόνο 45

0-sum παίγνια και βελτιστοποίηση Περαιτέρω συνδέσεις με την Πληροφορική και την θεωρία αλγορίθμων: 1. Κάθε γραμμικό πρόγραμμα είναι ισοδύναμο με ένα 0-sum παίγνιο Η λύση οποιουδήποτε ΓΠ ανάγεται στην εύρεση ενός σημείου ισορροπίας ενός 0-sum παιγνίου 2. Για όλα τα αλγοριθμικά προβλήματα που λύνονται σε πολυωνυμικό χρόνο (κλάση P), η επίλυσή τους μπορεί να αναχθεί στην επίλυση ενός 0-sum παιγνίου! 46

0-sum παίγνια και βελτιστοποίηση Η κλάση P 0-sum παίγνια Shortest paths, minimum spanning trees, soring,... Matching Pennies, Πέτρα-Ψαλίδι- Χαρτί,... 47

Και μια ακόμα παρατήρηση Όλα όσα έχουμε δει για 0-sum παίγνια ισχύουν και για παίγνια σταθερού αθροίσματος Ένα παίγνιο είναι σταθερού αθροίσματος αν σε κάθε προφίλ αμιγών στρατηγικών (s, t) με s S 1, t S 2 u 1 (s, t) + u 2 (s, t) = c, για κάποια παράμετρο c Γιατί? Μπορούμε να αφαιρέσουμε από τον πίνακα του π. 1 το c σε κάθε κελί και να το μετατρέψουμε έτσι σε 0-sum παίγνιο Τέτοιοι μετασχηματισμοί δεν αλλοιώνουν το σύνολο των σημείων ισορροπίας 48