ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Σχετικά έγγραφα
ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2017

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2016

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

1 Εισαγωγή στις Συνδυαστικές Δημοπρασίες - Combinatorial Auctions

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

1 Εισαγωγή στις Συνδυαστικές Δημοπρασίες - Combinatorial Auctions

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

ΑΣΚΗΣΗ 1 ΑΣΚΗΣΗ 2 ΑΣΚΗΣΗ 3

Κεφάλαιο 29 Θεωρία παιγνίων

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

Θεωρία Παιγνίων και Αποφάσεων

Διάλεξη 7. Θεωρία παιγνίων VA 28, 29

δημιουργία: επεξεργασία: Ν.Τσάντας

Notes. Notes. Notes. Notes Ε 10,10 0,3 Λ 3,0 2,2


Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 9: Λύσεις παιγνίων δύο παικτών

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Κυριαρχία και μεικτές στρατηγικές Μεικτές στρατηγικές και κυριαρχία Είδαμε ότι μια στρατηγική του παίκτη i είναι κυριαρχούμενη, αν υπάρχει κάποια άλλη

2. ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Δεύτερο πακέτο ασκήσεων

Β. Βασιλειάδης Αν. Καθηγητής. Επιχειρησιακή Ερευνα Διάλεξη 6 η - Θεωρεία Παιγνίων

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 2: Ισορροπία Nash. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής


Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 8: Δημοπρασίες. Ε. Μαρκάκης. Επικ. Καθηγητής

( ) ΘΕΜΑ 1 κανονική κατανομή

Τεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Κεφάλαιο 2ο (α) Αµιγείς Στρατηγικές (β) Μεικτές Στρατηγικές (α) Αµιγείς Στρατηγικές. Επαναλαµβάνουµε:

ΘΕΩΡΙΑ ΤΩΝ ΠΑΙΓΝΙΩΝ I.

Περιεχόμενα. 1. Ανάλυση ευαισθησίας. (1) Ανάλυση ευαισθησίας (2) Δυϊκό πρόβλημα (κανονική μορφή) (3) Δυαδικός προγραμματισμός (4) Ανάλυση αποφάσεων

- Παράδειγμα 2. Εκτέλεση Πέναλτι ή Κορώνα-Γράμματα (Heads or Tails) - Ένας ποδοσφαιριστής ετοιμάζεται να εκτελέσει ένα πέναλτι, το οποίο προσπαθεί να

Μοντέλα των Cournotκαι Bertrand

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 8: Παίγνια πλήρους και ελλιπούς πληροφόρησης

Στοχαστικές Στρατηγικές

Α2 Β2 Γ2 2 Α1 1,0 5,-1-1,-2 9,-2 Β1 2,1-2,0 0,2 0,-1 Γ1 0,3 14,2 2,1 8,1 1 1,2 0,1 3,0-1,0

Συνδυαστικά Παίγνια. ιαµόρφωση Παιγνίων. Θέµατα σε Πάιγνια Μηδενικού Αθροίσµατος

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α

Κεφάλαιο 9 ο Κ 5, 4 4, 5 0, 0 0,0 5, 4 4, 5. Όπως βλέπουµε το παίγνιο δεν έχει καµιά ισορροπία κατά Nash σε αµιγείς στρατηγικές διότι: (ΙΙ) Α Κ

2.1 ΠΡΑΞΕΙΣ ΚΑΙ ΟΙ ΙΔΙΟΤΗΤΕΣ ΤΟΥΣ

ΛΥΜΕΝΕΣ ΕΦΑΡΜΟΓΕΣ ΣΤΟ 2 ο ΚΕΦΑΛΑΙΟ

10/3/17. Κεφάλαιο 28 Ολιγοπώλιο. Μικροοικονομική. Ολιγοπώλιο. Ολιγοπώλιο. Ανταγωνισµός ποσότητας. Μια σύγχρονη προσέγγιση

A 2 B 2 Γ 2. u 1 (A 1, A 2 ) = 3 > 1 = u 1 (B 1, A 2 ) u 1 (A 1, Γ 2 ) = 1 > 0 = u 1 (B 1, Γ 2 ) A 2 B 2

Παραδείγματα (2) Διανυσματικοί Χώροι

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Ανταγωνιστική Ανάθεση Πόρων και Παίγνια Συμφόρησης

Βασικές Έννοιες Θεωρίας Παιγνίων

Πρώτο πακέτο ασκήσεων

I. ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ. math-gr

ΑΝΑΛΥΣΗ 1 ΤΕΤΑΡΤΟ ΜΑΘΗΜΑ, Μ. Παπαδημητράκης.

3.7 Παραδείγματα Μεθόδου Simplex

Περιληπτικά, τα βήματα που ακολουθούμε γενικά είναι τα εξής:


ΑΛΓΟΡΙΘΜΙΚΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Πανεπιστήµιο Αθηνών Εαρινό Εξάµηνο 2007 ιδάσκων : Ηλίας Κουτσουπιάς

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΤΡΙΤΟ-ΙΣΟΡΡΟΠΙΑ ΚΑΤΑ NASH ΑΚΑΔΗΜΑΙΚΟ ΕΤΟΣ

Ασκήσεις μελέτης της 6 ης διάλεξης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Θεωρία παραγωγού. Μικροοικονομική Θεωρία Ι / Διάλεξη 11 / Φ. Κουραντή 1

Κεφάλαιο 9. Έλεγχοι υποθέσεων

1.1 ΓΡΑΜΜΙΚΑ ΣΥΣΤΗΜΑΤΑ

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1

ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΤΗΣ ΜΕΘΟΔΟΥ SIMPLEX

Η μέθοδος Simplex. Χρήστος Γκόγκος. Χειμερινό Εξάμηνο ΤΕΙ Ηπείρου

Βασικές Αρχές της Θεωρίας Παιγνίων

Αλγοριθμική Θεωρία Παιγνίων: Εισαγωγή και Βασικές Έννοιες

ΛΥΜΕΝΕΣ ΑΣΚΗΣΕΙΣ ΣΤΙΣ ΣΥΝΑΡΤΗΣΕΙΣ

Θεώρημα Βolzano. Κατηγορία 1 η Δίνεται η συνάρτηση:

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΕΙ ΠΑΤΡΑΣ ΤΕΙ ΠΑΤΡΑΣ ΣΗΜΕΙΩΣΕΙΣ ΜΑΘΗΜΑΤΟΣ ΕΠΙΧΕΙΡΗΣΙΑΚΏΝ ΠΑΙΓΝΙΩΝ- ΠΡΟΓΡΑΜΜΑ GAMBIT

Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΣΤΑ ΓΕΝΙΚΑ ΜΑΘΗΜΑΤΙΚΑ

ΜΕΘΟΔΟΛΟΓΙΕΣ & ΑΣΚΗΣΕΙΣ ΓΙΑ ΤΗΝ ΑΛΓΕΒΡΑ ΤΗΣ Α ΛΥΚΕΙΟΥ

Κεφάλαιο 4. Στο προηγούµενο κεφάλαιο ορίσαµε την ισορροπία κατά Nash και είδαµε ότι µια ισορροπία

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Μορφές αποδείξεων Υπάρχουν πολλά είδη αποδείξεων. Εδώ θα δούμε τα πιο κοινά: Εξαντλητική μέθοδος ή μέθοδος επισκόπησης. Οταν το πρόβλημα έχει πεπερασμ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΠΑΙΓΝΙΑ Παιχνίδια Γενική Θεώρηση μεγιστοποιήσει την πιθανότητά

3. Παίγνια Αλληλουχίας

Σχόλια στα όρια. Γενικά

ΚΕΦΑΛΑΙΟ 3ο: ΔΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΕΝΟΤΗΤΑ 3: ΕΦΑΠΤΟΜΕΝΗ [Κεφάλαιο 2.1: Πρόβλημα εφαπτομένης του σχολικού βιβλίου]. ΠΑΡΑΔΕΙΓΜΑΤΑ ΘΕΜΑ Β

Κάνοντας ακριβέστερες μετρήσεις με την βοήθεια των Μαθηματικών. Ν. Παναγιωτίδης, Υπεύθυνος ΕΚΦΕ Ν. Ιωαννίνων

Τσάπελη Φανή ΑΜ: Ενισχυτική Μάθηση για το παιχνίδι dots. Τελική Αναφορά

Λύσεις των Θεμάτων του Διαγ/τος στην Τάξη και Σχόλια-Ιούνιος 2011

Άριστες κατά Pareto Κατανομές

ΑΛΓΕΒΡΑ Β ΛΥΚΕΙΟΥ Κεφ. 1 - Συστήματα 1

Κοινωνικά Δίκτυα Θεωρία Παιγνίων

Διαχείριση Εφοδιαστικής Αλυσίδας ΙΙ

Transcript:

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015 Λύσεις 2η σειράς ασκήσεων Προθεσμία παράδοσης: 18 Μαίου 2015 Πρόβλημα 1. (14 μονάδες) Το πρόβλημα αυτό είναι μία παραλλαγή του divide-the-dollar game. Δείτε επίσης και εδώ: http://en.wikipedia.org/wiki/ultimatum_game. Ένα ποσό των 100 ευρώ πρέπει να μοιραστεί μεταξύ 2 παικτών ως αμοιβή για κάποια κοινή εργασία τους. Οι παίκτες πρέπει να συμφωνήσουν για το πόσο πρέπει να πάρει ο καθένας με τους εξής κανόνες: Ο παίκτης 1 κάνει μία προσφορά στον παίκτη 2, η οποία δηλώνει πόσα πιστεύει ο παίκτης 1 ότι θα έπρεπε να πάρει ο παίκτης 2. Ο παίκτης 2, πριν ακούσει την προσφορά, αποφασίζει τι θεωρεί αυτός ως δίκαιη κατανομή και περιμένει να ακούσει τον παίκτη 1. Οι αποφάσεις και των 2 παικτών πρέπει να είναι πολλαπλάσιο του 25, από 0 ως 100. Στο τέλος, αν η προσφορά του παίκτη 1 ήταν μεγαλύτερη ή ίση από αυτό που θεωρεί δίκαιο ο παίκτης 2, τότε η μοιρασιά γίνεται με βάση την προσφορά του παίκτη 1. Σε αντίθετη περίπτωση, κανένας παίκτης δεν παίρνει τίποτα. 1. Να αναπαραστήσετε το παίγνιο σε κανονική μορφή (δηλ. με μορφή πινάκων). 2. Υπάρχει κάποια στρατηγική για κάποιον από τους 2 παίκτες που να είναι κυρίαρχη? 3. Βρείτε όλα τα σημεία ισορροπίας με αμιγείς στρατηγικές. 4. Δείξτε μια πιθανή εκτέλεση της επαναλαμβανόμενης αφαίρεσης ασθενώς κυριαρχούμενων στρατηγικών. Έχουμε πει στην τάξη ότι το τελικό παίγνιο μπορεί να εξαρτάται από την σειρά με την οποία αφαιρούμε ασθενώς κυριαρχούμενες στρατηγικές. Υπάρχει εκτέλεση της επαναλαμβανόμενης αφαίρεσης που αν την ακολουθήσουμε χάνονται κάποια από τα αρχικά σημεία ισορροπίας? 1. Οι διαθέσιμες στρατηγικές του κάθε παίκτη είναι να διαλέξει ένα ποσό από τις τιμές {0, 25, 50, 75, 100}, όπου για παράδειγμα με τη στρατηγική 25 για τον παίκτη 1, εννοούμε ότι κάνει την προσφορά (75, 25), να πάρει δηλαδή 25 ο παίκτηης 2. Η κανονική μορφή του παιγνίου είναι: 0 25 50 75 100 0 100,0 0,0 0, 0 0,0 0,0 25 75,25 75,25 0, 0 0,0 0,0 50 50,50 50,50 50,50 0,0 0,0 75 25,75 25,75 25,75 25,75 0,0 100 0,100 0,100 0,100 0,100 0,100 2. Εύκολα βλέπουμε ότι για τον πρώτο παίκτη δεν υπάρχει κυρίαρχη στρατηγική, αφού δεν υπάρχει γραμμή που να υπερισχύει (ή να είναι ίση) των άλλων σε όλες τις συντεταγμένες, ενώ για τον δεύτερο παίκτη οι στρατηγικές 0 και 25 είναι κυρίαρχες. 1

3. Σημεία ισορροπίας είναι τα στοιχεία στη διαγώνιο, δηλαδή τα ζευγάρια στρατηγικών (0, 0), (25, 25), (50, 50), (75, 75), (100, 100), καθώς επίσης και το σημείο (0, 100). Συνολικά 6 σημεία ισορροπίας. 4. Οι στρατηγικές 50, 75, 100 του παίκτη 2, είναι ασθενώς κυριαρχούμενες στο αρχικό παίγνιο επομένως μπορούμε να ξεκινήσουμε αφαιρώντας οποιαδήποτε από αυτές. Αφαιρώντας αυτές τις στρατηγικές, μετά βλέπουμε ότι οι στρατηγικές 50, 75, και 100 του παίκτη 1 είναι αυστηρά κυριαρχούμενες (άρα και ασθενώς κυριαρχούμενες). Επομένως τελικά θα μείνουμε με ένα 2 2 παίγνιο, όπου επιβιώνουν οι στρατηγικές 0 και 25 και για τους 2 παίκτες. Χάνουμε έτσι 4 από τα 6 σημεία ισορροπίας. Ειδικά για τον παίκτη 2, εκ των προτέρων μπορούσαμε να πούμε ότι όπως και να γίνει η αφαίρεση, οι στρατηγικές 0 και 25 του παίκτη 2 θα επιβιώσουν πάντα. Αυτό συμβαίνει γιατί είναι κυρίαρχες στρατηγικές. Όταν αφαιρούμε κυριαρχούμενες στρατηγικές, ποτέ δεν θα μπορέσουμε να αφαιρέσουμε κυρίαρχες στρατηγικές. Πρόβλημα 2. (16 μονάδες) Έστω το εξής παίγνιο: W X Y Z A 15, 42 13, 40 9, 23 0, 23 B 2, 19 2, 14 5, 13 1, 0 C 20, 7 20, 5 11, 3 1, 2 D 20, 45 3, 11 3, 5 1, 2 Αποφασίστε αν ισχύουν οι παρακάτω προτάσεις. Δικαιολογήστε την απάντησή σας σε κάθεμια από τις προτάσεις. 1. Η στρατηγική Β κυριαρχείται αυστηρά από την Α. 2. Η X κυριαρχεί αυστηρά την Y. 3. Η D κυριαρχεί ασθενώς την B. 4. Η Z κυριαρχείται ασθενώς από την W. 5. Δεν υπάρχει κυρίαρχη στρατηγική για τον παίκτη 1. 6. Η Z είναι βέλτιστη απόκριση στην A. 7. Η C είναι βέλτιστη απόκριση στην W. 8. Το παίγνιο έχει τουλάχιστον ένα αυστηρό σημείο ισορροπίας με αμιγείς στρατηγικές. Λ, Σ, Λ, Σ, Λ, Λ, Σ, Λ Πρόβλημα 3. (10 μονάδες) 2

Έστω το παίγνιο 4, 5 3, 1 3, 2 3, 4 3, 2 5, 1 4, 3 2, 5 4, 3 Θεωρήστε την εξής επαναληπτική διαδικασία, που συνήθως αναφέρεται ως better response dynamics: έστω ότι ξεκινάτε από κάποιο στοιχείο του πίνακα, και εάν υπάρχει κάποια εφικτή κίνηση για έναν από τους 2 παίκτες, που βελτιώνει αυστηρά την χρησιμότητά του (δεδομένου ότι ο άλλος δεν αλλάζει), την ακολουθείτε. Μια τέτοια κίνηση λέγεται καλύτερη απόκριση (δεν είναι απαραίτητα η βέλτιστη δυνατή απόκριση, αλλά σίγουρα βελτιώνει τη χρησιμότητα ενός εκ των 2 παικτών). Αν σε ένα βήμα του αλγορίθμου υπάρχουν περισσότερες από μία καλύτερες αποκρίσεις για έναν παίκτη ή αν και οι 2 παίκτες διαθέτουν καλύτερες αποκρίσεις, ακολουθείτε μία από αυτές αυθαίρετα. Μπορεί αυτός ο αλγόριθμος να έχει κυκλική συμπεριφορά? Αν ναι, επιδείξτε όλα τα αρχικά σημεία του συγκεκριμένου παιγνίου, από τα οποία μπορεί να οδηγηθεί σε κύκλο ο αλγόριθμος. Ας ονομάσουμε s 1, s 2, s 3 τις 3 στρατηγικές του παίκτη 1, οι οποίες αντιστοιχούν στις 2 γραμμές του πίνακα, και ομοίως t 1, t 2, t 3 τις 3 στρατηγικές του παίκτη 2. Εύκολα βλέπουμε ότι το προφίλ (s 1, t 1 ) είναι σημείο ισορροπίας, και επομένως αν ξεκινήσουμε από εκεί δεν μπορούμε να οδηγηθούμε σε κύκλο. Για καθένα από τα υπόλοιπα 8 σημεία όμως, μπορεί να προκύψει κυκλική συμπεριφορά. Για παράδειγμα ας πάρουμε το προφίλ (s 2, t 1 ). Μπορούμε να έχουμε τον κύκλο: (s 2, t 1 ) 1 (s 3, t 1 ) 2 (s 3, t 2 ) 1 (s 2, t 2 ) 2 (s 2, t 1 ) (1) Παραπάνω σε κάθε βέλος φαίνεται ποιος από τους 2 παίκτες αλλάζει στρατηγική για να πάμε στο επόμενο προφίλ. Με παρόμοιο τρόπο μπορούμε να εντοπίσουμε κύκλους αν ξεκινήσουμε και από τα άλλα σημεία. Π.χ. ξεκινώντας από το (s 1, t 3 ) έχουμε: (s 1, t 3 ) 1 (s 2, t 3 ) 2 (s 2, t 2 ) Όταν φτάσουμε στο (s 2, t 2 ) από εκεί μπορούμε να οδηγηθούμε στον κύκλο που είδαμε παραπάνω στην (1). Πρόβλημα 4. (10 μονάδες) Θεωρήστε το εξής παίγνιο που μοντελοποιεί το δίλημμα του φυλακισμένου με τις επιλογές {C, D} για κάθε παίκτη. C D C 2,2 0, 3 D 3, 0 1, 1 Ορίζουμε ένα νέο παίγνιο με βάση το παραπάνω, όπου τώρα η τελική χρησιμότητα του κάθε παίκτη εξαρτάται και από την χρησιμότητα που έχει ο άλλος παίκτης στο αρχικό παίγνιο. Αν π.χ. (s, t) είναι το ζεύγος στρατηγικών που επιλέγουν οι 2 παίκτες τότε η τελική χρησιμότητα του παίκτη 1 είναι u 1(s, t) = u 1 (s, t) + αu 2 (s, t) 3

όπου α μια παράμετρος με α [0, 1], και u 1 (s, t), u 2 (s, t) είναι οι χρησιμότητες στο αρχικό παίγνιο. Ομοίως για τον παίκτη 2 έχουμε u 2 (s, t) = u 2(s, t) + αu 1 (s, t) 1. Δείξτε σε μορφή πινάκων ποιο είναι το παίγνιο που προκύπτει όταν α = 1. Αποτελεί το νέο παίγνιο αναπαράσταση του διλήμματος του φυλακισμένου? 2. Βρείτε για ποιες τιμές του α, το νέο παίγνιο εξακολουθεί να μοντελοποιεί το δίλημμα του φυλακισμένου? 1. Για οποιαδήποτε τιμή του α, το παιχνίδι γίνεται: C D C 2 + 2α, 2 + 2α 3α, 3 D 3, 3α 1 + α, 1 + α Επομένως για α = 1, έχουμε το εξής παίγνιο: C D C 4, 4 3, 3 D 3, 3 2, 2 Για να αποτελεί το νέο παίγνιο αναπαράσταση του διλήμματος του φυλακισμένου, θα πρέπει η διάταξη των προτιμήσεων και των 2 παικτών να είναι όπως και στο αρχικό παίγνιο. Θα πρέπει δηλαδή για τον παίκτη 1 να ισχύει ότι: u 1(D, C) > u 1(C, C) > u 1(D, D) > u 1(C, D) (2) Ομοίως κάτι αντίστοιχο θα πρέπει να ισχύει και για τον παίκτη 2. Όπως βλέπουμε όμως στον παραπάνω πίνακα, έχουμε ότι u 1 (D, C) < u 1 (C, C). Επομένως το παίγνιο αυτό δεν αποτελεί αναπαράσταση του διλήμματος του φυλακισμένου. 2. Χρησιμοποιώντας την (2) για τον παίκτη 1, θα πρέπει να ισχύει ότι: 3 > 2 + 2α > 1 + α > 3α Για να ισχύουν όλες αυτές οι ανισότητες μαζί, θα πρέπει α < 1/2. Άρα μόνο για α [0, 1/2) έχουμε μοντελοποίηση του διλήμματος του φυλακισμένου. Πρόβλημα 5. (20 μονάδες) Βρείτε όλα τα σημεία ισορροπίας στα παρακάτω παίγνια μηδενικού αθροίσματος (και με αμιγείς και με μεικτές στρατηγικές). Χρησιμοποιήστε τη μέθοδο που είδαμε στην τάξη για 2 n παίγνια μηδενικού αθροίσματος. (i) (7 μονάδες) [ 1 6 4 2 4 ]

(ii) (13 μονάδες) [ -2 5 1 0-4 3-3 -1 3 8 ] (i) Εύκολα βλέπουμε ότι δεν υπάρχει σημείο ισορροπίας με αμιγείς στρατηγικές. Επομένως, ψάχνουμε για μεικτές. Έστω ότι ο π. 1 επιλέγει μία μεικτή στρατηγική (π, 1 π). Για να υπολογίσουμε την αξία του παιγνίου κοιτάμε την ποσότητα: max π min{π + 4(1 π), 6π + 2(1 π)} = max min{4 3π, 2 + 4π} (3) π Το σημείο τομής των 2 ευθειών είναι το π = 2/7. Άρα στο σημείο ισορροπίας που ψάχνουμε ο π. 1 θα παίξει την στρατηγική (2/7, 5/7) και η αξία του παιγνίου θα είναι v = 22/7. Για τον π. 2, έστω (σ, 1 σ) η στρατηγική που θα επιλέξει. Η ποσότητα που μας ενδιαφέρει είναι: min max{σ + 6(1 σ), 4σ + 2(1 σ)} = min max{6 5σ, 2 + 2σ} (4) σ σ Αρκεί να βρούμε το σημείο τομής των 2 ευθειών (στο οποίο θα πρέπει η χρησιμότητα του π.1 να γίνεται ίση με 22/7). Το σημείο τομής είναι σ = 4/7. Άρα το σημείο ισορροπίας είναι το προφίλ ( (2/7, 5/7), (4/7, 3/7) ). Εναλλακτικά θα μπορούσαμε να είχαμε λύσει την εξίσωση 6 5σ = 22/7 αφού στο σημείο ισορροπίας η τιμή minmax ισούται με την τιμή maxmin. (ii) Πάλι βλέπουμε ότι δεν υπάρχει σημείο ισορροπίας με αμιγείς στρατηγικές. Έστω ότι ο π. 1 παίζει μία μεικτή στρατηγική (π, 1 π). Για να υπολογίσουμε την αξία του παιγνίου κοιτάμε τη χρησιμότητα που θα έχει ο παίκτης 1 για κάθε επιλογή του παίκτη 2: f 1 = 2π + 3(1 π) = 3 5π f 2 = 5π 3(1 π) = 3 + 8π f 3 = π (1 π) = 1 + 2π f 4 = 3(1 π) = 3 3π f 5 = 4π + 8(1 π) = 8 12π Για τον παίκτη 1 μας ενδιαφέρει η ποσότητα: max min{f 1, f 2, f 3, f 4, f 5 } (5) π Μπορούμε τώρα να κάνουμε τη γραφική παράσταση των 5 συναρτήσεων, δείτε Σχήμα 1. Εμάς μας ενδιαφέρει η ποσότητα min{f 1, f 2, f 3, f 4, f 5 }, η οποία είναι η τεθλασμένη γραμμή με το πιο έντονο χρώμα στο Σχήμα 1. Παρατηρούμε ότι το 5

min{f1, f2, f3, f4, f5 } αρχικά επιτυγχάνεται από την f2, στη συνέχεια από την f3, μετά από την f1 (η πρώτη φθίνουσα που συναντάμε πάνω στην τεθλασμένη του min), και τέλος από την f5. Άρα η μεγιστοποίηση του min επιτυγχάνεται στο σημείο τομής της f1 με την f3, που δίνει π = 4/7. Επομένως, ο π. 1 θα επιλέξει την στρατηγική (4/7, 3/7) και η αξία του παιγνίου είναι v 1 = v = 1/7. Σχήμα 1: Η γραφική παράσταση των 5 συναρτήσεων. Για τον π. 2, θα πρέπει να θεωρήσουμε μία υποψήφια στρατηγική της μορφής (σ, 0, 1 σ, 0, 0), καθώς μόνο οι ευθείες f1, f3 επιτυγχάνουν τη minimum χρησιμότητα όταν ο παίκτης 1 παίζει τη στρατηγική (4/7, 3/7). Η στρατηγική του παίκτη 2 θα πρέπει να εξισώνει το ποσό που παίρνει ο παίκτης 1 για κάθεμια από τις στρατηγικές του. Συνεπώς προκύπτει η εξίσωση: 2σ + 1 σ = 3σ (1 σ) σ = 2/7 Επομένως το προφίλ ((4/7, 3/7), (2/7, 0, 5/7, 0, 0)) είναι το μοναδικό σημείο ισορροπίας. Πρόβλημα 6. (20 μονάδες) Θεωρήστε την εξής παραλλαγή του joint project game: Δύο φοιτητές έχουν αποφασίσει να κάνουν μαζί την 1η εργασία στις Δομές Δεδομένων. Οι επιλογές που έχει ο κάθε παίκτης είναι να αποφασίσει τι επίπεδο προσπάθειας θα καταβάλει. 6

Για την μοντελοποίηση, ας υποθέσουμε ότι για τον παίκτη i, το επιπεδο προσπάθειας αντιστοιχεί σε έναν αριθμό x i [0, 1], i = 1, 2. Όταν ένας παίκτης i καταβάλει προσπάθεια x i, αυτό έχει κάποιο κόστος (για τον χρόνο που ξόδεψε, την πνευματική κούραση, κτλ) που δίνεται από μια συνάρτηση c i (x i ). Επίσης, όταν το επίπεδο προσπάθειας για τους 2 παίκτες είναι x 1, x 2 αντίστοιχα, τότε παράγεται ένα όφελος για τους φοιτητές που δίνεται από μια συνάρτηση f(x 1, x 2 ). Θεωρούμε ότι κάθε φοιτητής κερδίζει την μισή από την παραγόμενη ωφέλεια, ανεξάρτητα από το πόσο δούλεψε. Π.χ. μια τέλεια εργασία στις Δομές θα αντιστοιχούσε σε ωφέλεια 20, κι επομένως κάθε φοιτητής θα έπαιρνε 10. (i) (7 μονάδες) Βρείτε τα σημεία ισορροπίας με αμιγείς στρατηγικές του παιγνίου όταν f(x 1, x 2 ) = 3x 1 x 2 και c i (x i ) = x 2 i, i = 1, 2. Τι συνέπειες θα έχει αυτό για την υλοποίηση της εργασίας; (ii) (7 μονάδες) Βρείτε ξανά τα σημεία ισορροπίας με αμιγείς στρατηγικές όταν τώρα f(x 1, x 2 ) = 3x 1 x 2 + 4(x 1 + x 2 ), c 1 (x 1 ) = 2x 2 1, και c 2(x 2 ) = 3x 2 2. (iii) (3 μονάδες) Υπάρχει προφίλ στρατηγικών στο ερώτημα (i) όπου και οι 2 παίκτες θα έχουν καλύτερη χρησιμότητα από ότι στα σημεία ισορροπίας που βρήκατε; (iv) (3 μονάδες) Όπως έχουμε δει και στο μάθημα, σε ένα προφίλ στρατηγικών (x 1, x 2 ), το κοινωνικό όφελος (social welfare) ορίζεται ως: SW (x 1, x 2 ) = u 1 (x 1, x 2 ) + u 2 (x 1, x 2 ). Για παίγνια 2 παικτών, έστω SW max = max x1,x 2 SW (x 1, x 2 ) το βέλτιστο κοινωνικό όφελος που μπορεί να προκύψει, όπου η βελτιστοποίηση είναι ως προς όλες τις πιθανές στρατηγικές. Έστω επίσης SW το ελάχιστο κοινωνικό όφελος που μπορεί να προκύψει σε ένα σημείο ισορροπίας κατά Nash. Τι συμπέρασμα βγάζετε για την ποσότητα SW max /SW στο παίγνιο του ερωτήματος (i); Ο λόγος αυτός αναφέρεται και ως τίμημα της αναρχίας¹, καθώς δείχνει την απόκλιση που μπορεί να έχει η στρατηγική και μη συνεργατική συμπεριφορά των παικτών από μια συντονισμένη προσπάθεια προς βελτιστοποίηση του κοινωνικού οφέλους. (i) Η χρησιμότητα του παίκτη 1 είναι u 1 (x 1, x 2 ) = f(x 1, x 2 )/2 c 1 (x 1 ). Παμε να βρούμε τη βέλτιστη απόκριση του παίκτη 1. Για οποιοδήποτε ζεύγος στρατηγικών x 1, x 2, έχουμε ότι η χρησιμότητα του παίκτη 1 είναι: 3x 1 x 2 2 x 2 1 Αν πάρουμε την παράγωγο ως προς x 1, η μεγιστοποίηση συμβαίνει όταν: u 1 (x 1, x 2 ) x 1 = 0 x 1 = 3 4 x 2 Ομοίως αν κάνουμε τα ίδια για τον παίκτη 2, θα πάρουμε ότι x 2 = 3/4x 1. H μόνη λύση των 2 αυτών εξισώσεων στο [0, 1], είναι x 1 = x 2 = 0. Άρα έχουμε ένα μοναδικό σημείο ισορροπίας, στο οποίο η εργασία στις Δομές δεν θα γίνει. Το αποτέλεσμα αυτό είναι απόρροια της μορφής που έχει η συνάρτηση ¹Πληροφοριακά, μπορείτε να δείτε την εργασία όπου εισήχθη η σχετική ορολογία: Elias Koutsoupias, Christos Papadimitriou, Worst Case Equilibria, Computer Science Review, 3(2), 65-69, 2009. 7

f(x 1, x 2 ). Δηλαδή η f είναι τέτοια ώστε αν ένας παίκτης δεν δουλέψει καθόλου (π.χ. αν x 2 = 0), τότε η ωφέλεια είναι μηδενική ανεξάρτητα του πόσο θα δουλέψει ο άλλος παίκτης. Αυτη η συνάρτηση λοιπόν μοντελοποιεί περιπτώσεις όπου απαιτείται οπωσδήποτε συνεργασία μεταξύ των παικτών για να υπάρξει μη μηδενική ωφέλεια! Στο επόμενο ερώτημα, το μοντέλο είναι λίγο διαφορετικό έτσι ώστε αν ένας παίκτης καταβάλει κάποια προσπάθεια, τότε θα παραχθεί κάποια ωφέλεια ακόμα κι αν ο άλλος παίκτης δεν δουλέψει καθόλου. (ii) Κάνοντας την ίδια διαδικασία, έχουμε πλέον τώρα ότι η χρησιμότητα για τον παίκτη 1 είναι: 3 2 x 1x 2 + 4 2 (x 1 + x 2 ) 2x 2 1. Μηδενίζοντας την παράγωγο έχουμε: u 1 (x 1, x 2 ) x 1 = 0 x 1 = 3 8 x 2 + 1 2 Με τον ίδιο τρόπο η εξίσωση που θα πάρουμε από την χρησιμότητα του παίκτη 2 είναι: u 2 (x 1, x 2 ) x 2 = 0 x 2 = 1 4 x 1 + 1 3 Λύνοντας το σύστημα των 2 εξισώσεων παίρνουμε: x 1 = 20 29 και x 2 = 44 87. (iii) Υπάρχουν πολλές τέτοιες επιλογές. Π.χ. αν επιλέξουν x 1 = 1, x 2 = 1, τότε θα έχουν και οι 2 χρησιμότητα 1/2. (iv) Στο ερώτημα (i), έχουμε βρει ένα σημείο ισορροπίας όπου και οι 2 παίκτες έχουν μηδενική χρησιμότητα. Επομένως το κοινωνικό όφελος στο σημείο αυτό είναι 0. Δεδομένου ότι στο ερώτημα (iii) βρήκαμε προφίλ όπου το κοινωνικό όφελος είναι αυστηρά μεγαλύτερο του μηδεν, αυτό σημαίνει ότι το μέγιστο κοινωνικό όφελος είναι μια θετική ποσότητα. Συνεπώς το τίμημα της αναρχίας εδώ γίνεται άπειρο, αφού έχουμε να διαιρέσουμε μια θετική ποσότητα με μηδέν. Αυτό δείχνει ότι στο συγκεκριμένο παίγνιο, η στρατηγική και μη συνεργατική συμπεριφορά των παικτών μπορεί να έχει ως αποτέλεσμα μια κατάσταση όπου βγαίνουν όλοι χαμένοι. 8