ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2016

Σχετικά έγγραφα
ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2017

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

1 Εισαγωγή στις Συνδυαστικές Δημοπρασίες - Combinatorial Auctions

1 Εισαγωγή στις Συνδυαστικές Δημοπρασίες - Combinatorial Auctions

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

ΑΣΚΗΣΗ 1 ΑΣΚΗΣΗ 2 ΑΣΚΗΣΗ 3

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 8: Δημοπρασίες. Ε. Μαρκάκης. Επικ. Καθηγητής

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.


ΑΛΓΟΡΙΘΜΙΚΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Πανεπιστήµιο Αθηνών Εαρινό Εξάµηνο 2007 ιδάσκων : Ηλίας Κουτσουπιάς

Δεύτερο πακέτο ασκήσεων

δημιουργία: επεξεργασία: Ν.Τσάντας

Θεωρία Παιγνίων και Αποφάσεων

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 8: Παίγνια πλήρους και ελλιπούς πληροφόρησης

10/3/17. Μικροοικονομική. Κεφάλαιο 29 Θεωρία παιγνίων. Μια σύγχρονη προσέγγιση. Εφαρµογές της θεωρίας παιγνίων. Τι είναι τα παίγνια;

2. ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0

Κεφάλαιο 29 Θεωρία παιγνίων

Ασκήσεις μελέτης της 6 ης διάλεξης

ΑΣΚΗΣΗ 1 Βρείτε την ισορροπία των ακόλουθων παιγνίων απαλείφοντας διαδοχικά τις κυριαρχούµενες στρατηγικές.

( ) ΘΕΜΑ 1 κανονική κατανομή

HAL R. VARIAN. Μικροοικονομική. Μια σύγχρονη προσέγγιση. 3 η έκδοση

Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α

I. ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ. math-gr

Α2 Β2 Γ2 2 Α1 1,0 5,-1-1,-2 9,-2 Β1 2,1-2,0 0,2 0,-1 Γ1 0,3 14,2 2,1 8,1 1 1,2 0,1 3,0-1,0

Παραδείγματα Διανυσματικοί Χώροι Ι. Λυχναρόπουλος


με Τέλος πάντων, έστω ότι ξεκινάει ένα άλλο υποθετικό σενάριο που απλά δεν διευκρινίζεται. Για το i) θα έχουμε , 2

Παραδείγματα (2) Διανυσματικοί Χώροι

Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α

Κυριαρχία και μεικτές στρατηγικές Μεικτές στρατηγικές και κυριαρχία Είδαμε ότι μια στρατηγική του παίκτη i είναι κυριαρχούμενη, αν υπάρχει κάποια άλλη

Β. Βασιλειάδης Αν. Καθηγητής. Επιχειρησιακή Ερευνα Διάλεξη 6 η - Θεωρεία Παιγνίων

ΘΕΩΡΙΑ ΤΩΝ ΠΑΙΓΝΙΩΝ I.

Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 12: Δημοπρασίες ανερχόμενων και κατερχόμενων προσφορών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΛΥΜΕΝΕΣ ΕΦΑΡΜΟΓΕΣ ΣΤΟ 2 ο ΚΕΦΑΛΑΙΟ

EMOJITO! 7 Δίσκοι Ψηφοφορίας. 100 Κάρτες Συναισθημάτων. 1 Ταμπλό. 7 Πιόνια παικτών. 2-7 Παίκτες

Τεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Notes. Notes. Notes. Notes Ε 10,10 0,3 Λ 3,0 2,2

Κεφάλαιο 2ο (α) Αµιγείς Στρατηγικές (β) Μεικτές Στρατηγικές (α) Αµιγείς Στρατηγικές. Επαναλαµβάνουµε:

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΣΤΑ ΓΕΝΙΚΑ ΜΑΘΗΜΑΤΙΚΑ

Από το Γυμνάσιο στο Λύκειο Δειγματικός χώρος Ενδεχόμενα Εύρεση δειγματικού χώρου... 46

Αριθμητική Ανάλυση και Εφαρμογές

0x2 = 2. = = δηλαδή η f δεν. = 2. Άρα η συνάρτηση f δεν είναι συνεχής στο [0,3]. Συνεπώς δεν. x 2. lim f (x) = lim (2x 1) = 3 και x 2 x 2

Παραδείγματα (1 ο σετ) Διανυσματικοί Χώροι

ΚΕΦΑΛΑΙΟ 3 ΤΟ ΔΙΩΝΥΜΙΚΟ ΘΕΩΡΗΜΑ

ΕΡΓΑΣΙΕΣ 4 ου ΚΕΦΑΛΑΙΟΥ. 1 η Ομάδα: Ερωτήσεις πολλαπλής επιλογής

Μοντέλα των Cournotκαι Bertrand

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

ΕΡΓΑΣΙΕΣ 4 ου ΚΕΦΑΛΑΙΟΥ. 1 η Ομάδα: Ερωτήσεις πολλαπλής επιλογής


Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 9: Λύσεις παιγνίων δύο παικτών

ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ 12) ΕΡΓΑΣΙΑ 1 η Ημερομηνία Αποστολής στον Φοιτητή: 17 Οκτωβρίου 2011

Μιγαδικοί Αριθμοί. Μαθηματικά Γ! Λυκείου Θετική και Τεχνολογική Κατεύθυνση. Υποδειγματικά λυμένες ασκήσεις Ασκήσεις προς λύση

Ισορροπία σε Αγορές Διαφοροποιημένων Προϊόντων

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Παραδείγματα (2 ο σετ) Διανυσματικοί Χώροι Επιμέλεια: Ι. Λυχναρόπουλος

Συνδυαστικά Παίγνια. ιαµόρφωση Παιγνίων. Θέµατα σε Πάιγνια Μηδενικού Αθροίσµατος

Κεφάλαιο 7ο. max(p 1 c)(α bp 1 +dp 2 )

Κεφάλαιο 4: Επιλογή σημείου παραγωγής

Οµάδες ψηφοφόρων Αρ. Μελών Οµάδων Προτιµήσεις Α 1 x > y > z Β 1 y > z >x Γ 1 z > x > y

1 ης εργασίας ΕΟ Υποδειγματική λύση

ΣΥΣΤΗΜΑΤΑ. Για την επίλυση ενός γραμμικού συστήματος με την χρήση των οριζουσών βασική είναι η παρακάτω επισήμανση:

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Ηθικός Κίνδυνος. Το βασικό υπόδειγμα. Παρουσιάζεται ένα στοχαστικό πρόβλημα χρηματοδότησης όταν τα αντισυμβαλλόμενα μέρη έχουν συμμετρική πληροφόρηση.

ΚΕΦΑΛΑΙΟ 3ο: ΔΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΕΝΟΤΗΤΑ 3: ΕΦΑΠΤΟΜΕΝΗ [Κεφάλαιο 2.1: Πρόβλημα εφαπτομένης του σχολικού βιβλίου]. ΠΑΡΑΔΕΙΓΜΑΤΑ ΘΕΜΑ Β

ΣΥΝΘΕΤΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Μαθηματικά: Αριθμητική και Άλγεβρα. Μάθημα 3 ο, Τμήμα Α. Τρόποι απόδειξης

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Περιεχόμενα. 1. Ανάλυση ευαισθησίας. (1) Ανάλυση ευαισθησίας (2) Δυϊκό πρόβλημα (κανονική μορφή) (3) Δυαδικός προγραμματισμός (4) Ανάλυση αποφάσεων

Λύσεις 4ης Ομάδας Ασκήσεων

Κεφάλαιο 4: Επιλογή σημείου παραγωγής

Άσκηση 1 Να βρεθούν οι συντεταγμένες του σημείου A(x, y), αν αυτές επαληθεύουν την ισότητα: x 2 6xy + 11y 2 8y + 8 = 0

1.2 Δραστηριότητα: Εισαγωγή στο όριο ακολουθίας

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Διάλεξη 7. Θεωρία παιγνίων VA 28, 29

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 2. Σταύρος Παπαϊωάννου

Α) Αν η διάμεσος δ του δείγματος Α είναι αρνητική, να βρεθεί το εύρος R του δείγματος.

Μ Α Θ Η Μ Α Τ Α Γ Λ Υ Κ Ε Ι Ο Υ

Κατηγορία 1 η. Σταθερή συνάρτηση Δίνεται παραγωγίσιμη συνάρτηση f : 0, f '( x) 0 για κάθε εσωτερικό σημείο x του Δ

3.7 Παραδείγματα Μεθόδου Simplex

Εισαγωγικά Παραδείγματα: Παρατηρήσεις:

ΠΡΑΓΜΑΤΙΚΟΙ ΑΡΙΘΜΟΙ - ΠΡΑΞΕΙΣ

Κεφάλαιο 4. Στο προηγούµενο κεφάλαιο ορίσαµε την ισορροπία κατά Nash και είδαµε ότι µια ισορροπία

Παραδείγματα Ιδιοτιμές Ιδιοδιανύσματα

V. Διαφορικός Λογισμός. math-gr

Transcript:

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2016 Λύσεις 2ης σειράς ασκήσεων Προθεσμία παράδοσης: 25 Ιουνίου 2016 Πρόβλημα 1. (18 μονάδες) Έστω το εξής παίγνιο: W X Y Z A 21, 42 21, 40 19, 23 5, 23 B 2, 19 2, 14 3, 13 1, 0 C 20, 7 20, 5 11, 3 1, 2 D 20, 5 3, 4 3, 5 5, 6 Αποφασίστε αν ισχύουν οι παρακάτω προτάσεις. Δικαιολογήστε την απάντησή σας σε κάθεμια από τις προτάσεις. 1. Η στρατηγική C κυριαρχείται αυστηρά από την Α. Σωστό 2. Η W κυριαρχεί ασθενώς την Z. Λάθος 3. Η D κυριαρχεί ασθενώς την B. Σωστό 4. Η Y κυριαρχείται ασθενώς από την W. Σωστό 5. Δεν υπάρχει ασθενώς κυρίαρχη στρατηγική για τον παίκτη 1. Λάθος 6. Η W είναι βέλτιστη απόκριση στην C. Σωστό 7. Η Z είναι βέλτιστη απόκριση στην A. Λάθος 8. Το παίγνιο έχει τουλάχιστον ένα αυστηρό σημείο ισορροπίας με αμιγείς στρατηγικές. Σωστό 9. Υπάρχει σημείο ισορροπίας με αμιγείς στρατηγικές και κοινωνικό όφελος το πολύ 13. Σωστό 1

Πρόβλημα 2. (12 μονάδες) Θεωρήστε το εξής παίγνιο που αναφέρεται συνήθως ως δημοπρασία all-pay : Υπάρχουν 2 παίκτες, και μία ποσότητα ενός αγαθού προς πώληση που και για τους 2 έχει την ίδια χρηματική αξία K > 0. Οι 2 παίκτες υποβάλλουν ενσφράγιστες προσφορές για τη συνολική ποσότητα, οι οποίες μπορεί να είναι πραγματικοί αριθμοί στο διάστημα [0, K]. Νικητής στη δημοπρασία είναι ο παίκτης που δηλώνει τη μεγαλύτερη προσφορά. Οι διαφορές με τις δημοπρασίες που είδαμε στο μάθημα είναι ότι α) σε περίπτωση ίσων προσφορών, οι 2 παίκτες παίρνουν τη μισή ποσότητα ο καθένας, η οποία έχει αξία K/2, β) ανεξάρτητα με το ποιος κερδίζει, και οι 2 παίκτες πληρώνουν αυτό που δήλωσαν. Τέτοια παίγνια μοντελοποιούν ορισμένες καταστάσεις ανταγωνισμού για την ανάπτυξη ενός νέου προϊόντος. Περιπτώσεις π.χ. όπου και οι 2 εταιρείες πληρώνουν κάποιο κόστος για την επένδυση και την ανάπτυξη του προϊόντος αλλά όπου μόνο η μία από αυτές υπερισχύει στην αγορά μπορούν να μοντελοποιηθούν ως ένα τέτοιο παίγνιο. (i) (4 μονάδες) Να εκφράσετε μαθηματικά τις συναρτήσεις χρησιμότητας των 2 παικτών, u 1 (b 1, b 2 ), και u 2 (b 1, b 2 ), αντίστοιχα, όπου u 1 (b 1, b 2 ) είναι η χρησιμότητα του παίκτη 1, όταν ο ίδιος δηλώνει b 1 και ο παίκτης 2 δηλώνει b 2 (και αντίστοιχα για τον παίκτη 2). Δείξτε ότι το παίγνιο αυτό δεν έχει σημεία ισορροπίας με αμιγείς στρα- (ii) (8 μονάδες) τηγικές. Λύση. (i) Η συνάρτηση χρησιμότητας του παίκτη 1 είναι ως εξής: K b 1, αν b 1 > b 2 u 1 (b 1, b 2 ) = K/2 b 1, αν b 1 = b 2 (1) b 1, αν b 1 < b 2 Ομοίως για τον παίκτη 2 θα έχουμε μια παρόμοια συνάρτηση: K b 2, αν b 2 > b 1 u 2 (b 1, b 2 ) = K/2 b 2, αν b 1 = b 2 (2) b 2, αν b 2 < b 1 (ii) Για να δείξουμε ότι δεν υπάρχει σημείο ισορροπίας με αμιγείς στρατηγικές, ας υποθέσουμε ότι υπάρχει ένα τέτοιο σημείο (b 1, b 2 ). Θα δούμε ότι αυτό οδηγεί σε άτοπο. Καταρχήν αν b 1 > b 2, τότε ο παίκτης 1 θα είχε κίνητρο να δηλώσει κάτι λιγότερο (αλλά μεγαλύτερο του b 2 ) έτσι ώστε να πληρώσει λιγότερο. Αν δηλώσει π.χ. b 1 ϵ, για κάποιο ϵ < b 1 b 2, τότε ο παίκτης 1 εξακολουθεί να κερδίζει Κ αλλά πληρώνει λιγότερο. Ομοίως δεν θα μπορούσε να ισχύει ότι b 2 < b 1. Άρα καταλήγουμε ότι αν υπάρχει σημείο ισορροπίας, θα πρέπει να ισχύει ότι b 1 = b 2. Αφού έχουμε υποθέσει ότι b i [0, K], μπορουμε να θεωρησουμε τις εξής 2 υποπεριπτώσεις. Αν b 1 = b 2 > K/2, τότε η χρησιμότητα και των 2 θα ήταν αρνητική, και κάθε παίκτης θα είχε κίνητρο να κάνει κατι διαφορετικό (π.χ. να δηλώσει 0 για να μην πληρώσει, ή σε περίπτωη που b 1 K, να δηλώσει κατι παραπάνω για να κερδίσει όλη την ποσότητα). Αν b 1 = b 2 K/2, τότε κάθε παίκτης θα είχε κίνητρο να δηλώσει λίγο παραπάνω, για να κερδίσει όλη την ποσότητα. Άρα βγάζουμε το συμπέρασμα ότι 2

δεν γίνεται να υπάρχει σημείο ισορροπίας με b 1 = b 2. Επομένως έχουμε καταλήξει σε άτοπο και δεν είναι δυνατό να υπάρχει σημείο ισορροπίας με αμιγείς στρατηγικές. Πρόβλημα 3. (13 μονάδες) Η άσκηση αυτή σκοπό έχει να δείξει ότι η έννοια του σημείου ισορροπίας με αμιγείς στρατηγικές από μόνη της, δεν είναι πάντα κατάλληλη για να μοντελοποιήσει τι συμβαίνει στην πραγματικότητα, και ειδικά σε παίγνια που μοντελοποιούν εκλογικές διαδικασίες. Έστω ότι 4 φοιτητικές παρατάξεις ανταγωνίζονται για να εκλεγεί ένας εκπρόσωπος φοιτητών. Ας υποθέσουμε ότι στην ψηφοφορία θα συμμετέχουν 50 φοιτητές. Κάθε φοιτητής καλείται να ψηφίσει μία παράταξη και επίσης κάθε φοιτητής έχει τις δικές του προτιμήσεις, οι οποίες εκφράζονται μέσω μιας ολικής διάταξης. Στον πίνακα 1 βλέπουμε τις προτιμήσεις όλων των φοιτητών, π.χ. οι φοιτητές 11 ως 20 προτιμούν να εκλεγεί εκπρόσωπος από την παράταξη Π 3, η δεύτερη προτίμηση τους είναι να εκλεγεί εκπρόσωπος από την Π 1, η τρίτη προτίμηση είναι η Π 2, και τελευταία προτίμηση είναι η Π 4. Κάθε φοιτητής μπορεί αν θέλει να ψηφίσει κάποια παράταξη που δεν είναι η πρώτη του προτίμηση, αν κρίνει οτι έτσι θα προκαλέσει μια καλύτερη έκβαση για αυτόν και θα αποκλείσει το να εκλεγεί κάποιος που είναι πιο κάτω στις προτιμήσεις του. Τέλος, θεωρούμε ότι σε περίπτωση ισοβαθμίας ευνοείται η παράταξη με τον χαμηλότερο δείκτη. Προτιμήσεις Φοιτ. 1-10 Π 1 Π 2 Π 3 Π 4 Φοιτ. 11-20 Π 3 Π 1 Π 2 Π 4 Φοιτ. 21-30 Π 1 Π 4 Π 3 Π 2 Φοιτ. 31-40 Π 2 Π 1 Π 3 Π 4 Φοιτ. 41-50 Π 3 Π 2 Π 4 Π 1 Πίνακας 1: Προτιμήσεις φοιτητών σε μορφή διάταξης. (i) (4 μονάδες) Δείξτε έναν τρόπο αναπαράστασης της διαδικασίας αυτής ως παίγνιο κανονικής μορφής, περιγράφοντας τις διαθέσιμες στρατηγικές και χρησιμοποιιώντας κατάλληλες συναρτήσεις χρησιμότητας (υπάρχουν πολλοί διαφορετικοί τρόποι, και μπορείτε αν θέλετε να περιγράψετε με λόγια τις συναρτήσεις, αρκεί να είναι ξεκάθαρο από την περιγραφή σας τι τιμές παίρνουν σε όλα τα σημεία του πεδίου ορισμού τους). (ii) (6 μονάδες) Δείξτε¹ ότι για κάθε i {1, 2, 3, 4}, υπάρχει σημείο ισορροπίας του παιγνίου στο οποίο κερδίζει η παράταξη i. (iii) (3 μονάδες) Ποιος είναι ο ελάχιστος αριθμός ψηφοφόρων που πρέπει να μην ψηφίσει την πραγματική του προτίμηση σε σημείο ισορροπίας με νικητή την παράταξη Π 2 ; ¹Για όσους κάνουν την προγραμματιστική εργασία: η παρατήρηση αυτή δειχνει ότι υπάρχουν πολλά σημεία ισορροπίας τα οποία είναι απίθανο να συμβούν στην πράξη. Ένα από τα πράγματα που καλείστε να δείτε στην προγραμματιστική εργασία είναι αν χρησιμοποιώντας τη λογική των best response αλγορίθμων αποκλείονται τέτοιου είδους σημεία και αν έχετε σύγκλιση στα πιο ρεαλιστικά σημεία ισορροπίας μιας εκλογής. 3

Λύση. (i) Τυπικά η αναπαράσταση χρειάζεται έναν πίνακα με 50 διαστάσεις, αφού έχουμε 50 παίκτες. Όμως δεν είναι ανάγκη να γράψουμε έναν τέτοιο πίνακα. Αρκεί να περιγράψουμε περιφραστικά τη συνάρτηση χρησιμότητας του κάθε παίκτη. Ας θεωρήσουμε π.χ. έναν φοιτητή με id από 1 ως 10. Χρειάζεται απλά να περιγράψουμε τη χρησιμότητα του παίκτη σε κάθε πιθανή έκβαση. Π.χ. θα μπορούσαμε να περιγράψουμε τη συνάρτηση του ως εξής: σε κάθε προφίλ στο οποίο κερδίζει η παράταξη 1, ας πούμε ότι η χρησιμότητα του παίκτη είναι 20. Μετέπειτα, θεωρούμε ότι η χρησιμότητά του σε όλα τα προφίλ όπου κερδίζει η παράταξη 2 είναι 15, στα προφίλ όπου κερδίζει η παράταξη 3 είναι 10, και σε αυτά στα οποία κερδίζει η παράταξη 4 είναι 5. Μια τέτοια συνάρτηση είναι συνεπής με τις προτιμήσεις του πάικτη 1, όπως δίνονται από τον πίνακα 1. Μπορούμε επίσης να χρησιμοποιήσουμε διαφορετικά νούμερα, εφόσον οι χρησιμότητες μενουν συνεπείς ως προς τις προτιμήσεις. Ομοίως μπορούμε να περιγράψουμε και τις συναρτήσεις χρησιμότητας των άλλων παικτών. (ii) Θεωρήστε το προφίλ στο οποίο όλοι οι φοιτητές ψηφίζουν την παράταξη i. Μπορεί στην πράξη να μην συμβεί ποτέ κάτι τέτοιο, όμως είναι ένα επιτρεπτό προφίλ. Είναι εύκολο να δει κανείς ότι το προφίλ αυτό είναι σημείο ισορροπίας. Κανένας παίκτης από μόνος του δεν μπορεί να αλλάξει το αποτέλεσμα αλλάζοντας την ψήφο του, αφού η παράταξη i θα εξακολουθεί να έχει 49 ψήφους. (iii) Θα πρέπει τουλάχιστον 9 φοιτητές που δεν έχουν την Π 2 ως πρώτη προτίμηση να την ψηφίσουν για να καταλήξουμε με νικητή την Π 2. Για παράδειγμα αν 5 φοιτητές από την ομάδα 1-10 και 4 φοιτητές από την ομάδα 11-20, ψηφίσουν Π 2, και οι υπόλοιποι ψηφίσουν την πραγματική τους πρώτη προτίμηση, τότε θα βγει νικητής η Π 2 με 19 ψήφους. Το προφίλ αυτό είναι σημείο ισορροπίας, καθώς κανένας φοιτητής δεν μπορεί αλλάζοντας μόνο αυτός την ψήφο του να επιβάλει ένα διαφορετικό αποτέλεσμα που να τον συμφέρει. 4

Πρόβλημα 4. (18 μονάδες) Βρείτε όλα τα σημεία ισορροπίας στα παρακάτω παίγνια μηδενικού αθροίσματος (και με αμιγείς και με μεικτές στρατηγικές). Χρησιμοποιήστε τη μέθοδο που είδαμε στην τάξη για 2 n παίγνια μηδενικού αθροίσματος. (i) (6 μονάδες) [ 1 6 4 2 ] (ii) (12 μονάδες) [ -4 2 0 3-2 4-1 0-3 1 ] Λύση. (i) Καταρχήν εύκολα βλέπουμε ότι δεν υπάρχει σημείο ισορροπίας με αμιγείς στρατηγικές, αφού v 1 = 2 και v 2 = 4. Επομένως θα ψάξουμε για μεικτές στρατηγικές. Έστω ότι ο π. 1 επιλέγει μία μεικτή στρατηγική (π, 1 π). Για να υπολογίσουμε την αξία του παιγνίου κοιτάμε την ποσότητα: max π min{π + 4(1 π), 6π + 2(1 π)} = max min{4 3π, 2 + 4π} (3) π Το σημείο τομής των 2 ευθειών είναι το π = 2/7. Άρα στο σημείο ισορροπίας που ψάχνουμε ο π. 1 θα παίξει την στρατηγική (2/7, 5/7) και η αξία του παιγνίου θα είναι v = 22/7. Για τον π. 2, έστω (σ, 1 σ) η στρατηγική που θα επιλέξει. Η ποσότητα που μας ενδιαφέρει είναι: min max{σ + 6(1 σ), 4σ + 2(1 σ)} = min max{6 5σ, 2 + 2σ} (4) σ σ Αρκεί να βρούμε το σημείο τομής των 2 ευθειών (στο οποίο θα πρέπει η χρησιμότητα του π.1 να γίνεται ίση με 22/7). Το σημείο τομής είναι σ = 4/7. Άρα το σημείο ισορροπίας είναι το προφίλ ( (2/7, 5/7), (4/7, 3/7) ). Εναλλακτικά θα μπορούσαμε να είχαμε λύσει την εξίσωση 6 5σ = 22/7 αφού στο σημείο ισορροπίας η τιμή minmax ισούται με την τιμή maxmin. (ii) Πάλι βλέπουμε ότι δεν υπάρχει σημείο ισορροπίας με αμιγείς στρατηγικές, επομένως ψάχνουμε για μεικτές. Έστω ότι ο π. 1 παίζει μία μεικτή στρατηγική (π, 1 π). Για να υπολογίσουμε την αξία του παιγνίου κοιτάμε τη χρησιμότητα που θα έχει ο παίκτης 1 για κάθε επιλογή του παίκτη 2: f 1 = 4π + 4(1 π) = 4 8π f 2 = 2π (1 π) = 1 + 3π f 3 = 0π + 0(1 π) = 0 f 4 = 3π 3(1 π) = 3 + 6π f 5 = 2π + (1 π) = 1 3π 5

Για τον παίκτη 1 μας ενδιαφέρει η ποσότητα: max min{f 1, f 2, f 3, f 4, f 5 } (5) π Μπορούμε τώρα να κάνουμε τη γραφική παράσταση των 5 συναρτήσεων, και να δούμε τη συνάρτηση min{f 1, f 2, f 3, f 4, f 5 }, η οποία αντιστοιχεί σε μια τεθλασμένη γραμμή όπως κάναμε και στο μάθημα. Αν κάνουμε τη γραφική παράσταση θα δούμε ότι το min{f 1, f 2, f 3, f 4, f 5 } αρχικά επιτυγχάνεται από την f 4, στη συνέχεια από την f 5 και μετά από την f 1. Οπτικά μπορούμε να δούμε ότι το μέγιστο του min{f 1, f 2, f 3, f 4, f 5 } είναι στο σημείο τομής της f 4 με την f 5. Αν οπτικά δεν είμαστε σίγουροι, τότε πρέπει να θεωρήσουμε και τα 2 υποψήφια σημεία τομής που προκύπτουν, δηλαδή και την τομή της f 4 με την f 5, καθώς και την τομή της f 5 με την f 1. Λύνοντας την εξίσωση f 4 = f 5, παίρνουμε π = 4/9. Για αυτό το σημείο θα πρέπει να θεωρήσουμε μία υποψήφια στρατηγική του παίκτη 2 της μορφής (0, 0, 0, σ, 1 σ), καθώς μόνο οι ευθείες f 4, f 5 επιτυγχάνουν την ελάχιστη χρησιμότητα όταν ο παίκτης 1 παίζει τη στρατηγική (4/9, 5/9). Η στρατηγική του παίκτη 2 θα πρέπει να εξισώνει το ποσό που παίρνει ο παίκτης 1 για κάθεμια από τις στρατηγικές του. Συνεπώς έχουμε την εξίσωση: 3σ + ( 2)(1 σ) = ( 3)σ + (1 σ) σ = 1/3 Επομένως το προφίλ στρατηγικών ((4/9, 5/9), (0, 0, 0, 1/3, 2/3)) είναι σημείο ισορροπίας. Είναι έυκολο να δείτε ότι αν είχατε θεωρήσει το σημείο τομής της f 5 με την f 1, αυτό δεν θα οδηγούσε σε σημείο ισορροπίας, καθώς η εξίσωση που θα προέκυπτε δεν δίνει λύση για το σ στο διάστημα [0,1] (σε αυτή την περίπτωση θα έπρεπε να θεωρήσουμε για τον παίκτη 2 στρατηγικές της μορφής (σ, 0, 0, 0, 1 σ) ). Τέλος, η αξία του παιγνίου είναι η χρησιμότητα των 2 παικτών, η οποία ταυτίζεται με την τιμή της f 4 για π = 4/9. Άρα v = v 1 = v 2 = 1/3. Πρόβλημα 5. (22 μονάδες) (i) (8 μονάδες) Όπως είδαμε στο μάθημα, σε ένα προφίλ στρατηγικών (x, y), το κοινωνικό όφελος (social welfare) ορίζεται ως: SW (x, y) = u 1 (x, y) + u 2 (x, y). Για παίγνια 2 παικτών, έστω SW max = max x,y SW (x, y), το βέλτιστο κοινωνικό όφελος που μπορεί να προκύψει, όπου η βελτιστοποίηση είναι ως προς όλες τις πιθανές στρατηγικές. Έστω επίσης SW το ελάχιστο κοινωνικό όφελος που μπορεί να προκύψει σε ένα σημείο ισορροπίας κατά Nash. Ο λόγος SW max /SW αναφέρεται ως τίμημα της αναρχίας², καθώς δείχνει την απόκλιση που μπορεί να έχει η μη συνεργατική, στρατηγική συμπεριφορά των παικτών από μια συντονισμένη προσπάθεια προς βελτιστοποίηση του κοινωνικού οφέλους. Θεωρήστε την παραλλαγή του παιγνίου Bach-Stravinsky που φαίνεται παρακάτω και υπολογίστε το τίμημα της αναρχίας ως προς τα σημεία ισορροπίας με αμιγείς στρατηγικές. ²Ενημερωτικά, μπορείτε να δείτε την εργασία όπου εισήχθη η σχετική ορολογία: Elias Koutsoupias, Christos Papadimitriou, Worst Case Equilibria, Computer Science Review, 3(2), 65-69, 2009. 6

[ 3, 1 0, 0 0, 0 1, 4 Κατόπιν, βρείτε τα σημεία ισορροπίας και με μεικτές στρατηγικές, και υπολογίστε ξανά το τίμημα της αναρχίας αν συμπεριλάβετε και αυτά τα σημεία. Υπάρχει διαφορά στο τίμημα της αναρχίας σε σχέση με πριν; (ii) (14 μονάδες) Βρείτε όλα τα σημεία ισορροπίας με αμιγείς και με μεικτές στρατηγικές στο παρακάτω παίγνιο. Λύση. ] 0, 0 5, 2 3, 3 2, 4 3, 3 5, 1-2, 4 1, 0 2, 1 (i) Έχουμε ότι SW max = 5. Επίσης έχουμε 2 σημεία ισορροπίας με αμιγείς στρατηγικές και το ελάχιστο κοινωνικό όφελος που επιτυγχάνεται σε αυτά είναι 4. Άρα το τίμημα της αναρχίας είναι 5/4. Αν θέλουμε να συμπεριλάβουμε και σημεία ισορροπίας με μεικτές στρατηγικές, βλέπουμε ότι υπάρχει ένα ακόμα σημείο, και είναι το προφίλ ((4/5, 1/5), (1/4, 3/4)) (μπορείτε να το υπολογίσετε με όποια μέθοδο θέλετε από αυτές που έχουμε δει). Το μέσο κοινωνικό όφελος σε αυτό το σημείο είναι 4 5 1 4 (3 + 1) + 1 5 3 31 (4 + 1) = 4 20 < 4 Παρατηρούμε ότι αυτό το σημείο δίνει μικρότερο όφελος και από τα 2 προηγούμενα σημεία. Άρα το νέο τίμημα της αναρχίας θα είναι SW max /SW = 5 31 20 = 100 31 Βλέπουμε ότι το τίμημα της αναρχίας αυξήθηκε σε σχέση με πριν (το οποίο είναι αναμενόμενο αφού σε σημεία ισορροπίας με μεικτές στρατηγικές υπάρχει θετική πιθανότητα να επιλεγούν κακές στρατηγικές, π.χ. στο παράδειγμά μας, με πιθανότητα μεγαλύτερη από 3/5, το κοινωνικό όφελος είναι 0). (i) Η τρίτη γραμμή κυριαρχείται αυστηρά από τις άλλες δύο, επομένως μπορούμε να την αφαιρέσουμε και να μείνουμε έτσι με το παιχνίδι [ 0, 0 5, 2 3, 3 2, 4 3, 3 5, 1 Έχουμε ένα σημείο ισορροπίας με αμιγείς στρατηγικές, που αντιστοιχεί στην 2η γραμμή και 1η στήλη. Ψάχνοντας για μεικτές στρατηγικές, έστω x = (π, 1 π) μια ] 7

υποψήφια μεικτή στρατηγική του παίκτη 1. Υπολογίζουμε τις ποσότητες u 2 (x, e j ) για κάθε στήλη j. f 1 = 0π + 4(1 π) = 4 4π f 2 = 2π + 3(1 π) = 3 π f 3 = 3π + (1 π) = 1 + 2π Εμάς μας ενδιαφέρει η ποσότητα max{f 1, f 2, f 3 }, η οποία αντιστοιχεί σε μια τεθλασμένη γραμμή με 3 τμήματα. Παρατηρούμε ότι το max{f 1, f 2, f 3 } αρχικά επιτυγχάνεται από την f 1, στη συνέχεια από την f 2, και μετά από την f 3 (η πρώτη αύξουσα που συναντάμε πάνω στην τεθλασμένη του max). Άρα θα έχουμε 2 υποψήφια σημεία να εξετάσουμε, το σημείο τομής της f 1 με την f 2, και το σημείο τομής της f 2 με την f 3. Το πρώτο είναι το π 1 = 1/3, και το δεύτερο είναι το π 2 = 2/3. 1ο υποψήφιο σημείο: Για την υποψήφια στρατηγική (1/3, 2/3) του παίκτη 1, ψάχνουμε να δούμε αν μπορούμε να βρούμε στρατηγική για τον παίκτη 2. Επειδή αυτό το υποψήφιο σημείο προήλθε από την τομή της f 1 με την f 2, κοιτάμε για στρατηγική του παίκτη 2 στη μορφή (s, 1 s, 0). Για να υπάρχει ισορροπία θα πρέπει να ισχύει ότι 0 s + 5 (1 s) = 2 s + 3 (1 s) s = 1/2 Άρα το προφίλ ((1/3, 2/3), (1/2, 1/2, 0)) είναι σημείο ισορροπίας 2ο υποψήφιο σημείο: Για την υποψήφια στρατηγική (2/3, 1/3) του παίκτη 1, ακολουθώντας το ίδιο σκεπτικό, θα κοιτάξουμε για στρατηγική του παίκτη 2 στη μορφή (0, s, 1 s). Για να υπάρχει ισορροπία θα πρέπει να ισχύει ότι 5 s + 3 (1 s) = 3 s + 5 (1 s) s = 1/2 Άρα και το προφίλ ((2/3, 1/3), (0, 1/2, 1/2)) είναι σημείο ισορροπίας Επομένως βρήκαμε συνολικά 3 σημεία ισορροπίας, 1 με αμιγείς στρατηγικές και 2 με μεικτές. Πρόβλημα 6. (13 μονάδες) Το παράδειγμα αυτό σχετίζεται με εφαρμογές όπου γίνεται χρήση ενός κοινού πόρου από πολλούς παίκτες (π.χ. πόροι δικτύου). Έστω ότι ένας αριθμός από n φοιτητές βρίσκεται στο CSLab2. Έχοντας όλοι τελειώσει με τις εργασίες τους, αποφασίζουν να περάσουν τον υπόλοιπο χρόνο τους κατεβάζοντας ταινίες, μουσική, κτλ. Επειδή οι πόροι του δικτύου είναι περιορισμένοι, όταν προσπαθούν πολλοί ταυτόχρονα να κατεβάσουν μεγάλο όγκο δεδομένων, το σύστημα δεν ανταποκρίνεται. Έστω ότι υπάρχει ένα κατώφλι για το μέγιστο όγκο δεδομένων που μπορούν να ζητήσουν ταυτόχρονα οι φοιτητές, και για απλότητα έστω ότι είναι ίσο με 1 (αυτό μπορεί να αντιστοιχεί π.χ. σε 1 GB ή 1 TB). Κάθε φοιτητής μπορεί να επιλέξει μία ποσότητα x i από δεδομένα που θέλει να κατεβάσει, και υποθέτουμε ότι x i [0, 1]. Δεδομένων των επιλογών όλων των φοιτητών, η χρησιμότητα του καθένα εξαρτάται, αφενός από τη δική του επιλογή αλλά και από το τι επέλεξαν αθροιστικά όλοι 8

μαζί. Για την ακρίβεια, σε ένα προφίλ στρατηγικών x = (x 1, x 2,, x n ) η χρησιμότητα του φοιτητή i δίνεται από: u i (x) = { xi (1 n j=1 x j), αν n j=1 x j 1 0, αν n j=1 x j > 1 Η παραπάνω φόρμουλα σημαίνει απλά ότι όταν οι αιτήσεις για δεδομένα υπερβαίνουν αθροιστικά το όριο, οι παίκτες έχουν μηδενική χρησιμότητα, αφού δεν εξυπηρετείται κανένας (ή υπάρχουν πάρα πολύ μεγάλες καθυστερήσεις). Αντιθέτως, όταν η χρήση του δικτύου δεν υπερβαίνει το κατώφλι, τότε η χρησιμότητα δίνεται από τον πάνω κλάδο της συνάρτησης, και είναι ανάλογη του ποσού που κατεβάζει ο παίκτης i και αντιστρόφως ανάλογη της συνολικής αίτησης για δεδομένα από όλους τους παίκτες (δηλαδή από τη συνολική χρήση, καθώς μεγαλύτερη χρήση προκαλεί καθυστερήσεις). (i) (4 μονάδες) Εκφράστε τη βέλτιστη απόκριση ενός παίκτη i, BR(x i ), ως συνάρτηση των στρατηγικών των υπολοίπων παικτών x i = (x 1, x 2,, x i 1, x i+1,, x n ). (ii) (6 μονάδες) Για n = 2, βρείτε όλα τα σημεία ισορροπίας με αμιγείς στρατηγικές. Μπορείτε να χρησιμοποιήσετε το ερώτημα (i) για να βρείτε τις βέλτιστες αποκρίσεις BR(x 2 ) και BR(x 1 ) για τους 2 παίκτες αντίστοιχα. Σχολιάστε για κάθε σημείο ισορροπίας τη χρήση που γίνεται στο δίκτυο και τις χρησιμότητες των παικτών. (iii) (3 μονάδες) Για n = 3, υπάρχει σημείο ισορροπίας όπου όλοι οι παίκτες έχουν αυστηρά θετική χρησιμότητα; Λύση. (i) Έστω x i = (x 1, x 2,, x i 1, x i+1,, x n ), ένα προφίλ στρατηγικών όλων των παικτών εκτός του παίκτη i. Για να βρούμε τη βέλτιστη απόκριση του παίκτη i, θα διακρίνουμε 2 περιπτώσεις. Έστω α = j i x j το άθροισμα απο τις ποσότητες των δεδομένων που επιλέγουν να κατεβάσουν οι υπόλοιποι φοιτητές εκτός του i. Όταν α < 1, τότε υπάρχει περιθώριο για τον παίκτη i να μην έχει μηδενική χρησιμότητα αν επιλέξει κάποια ποσότητα στο διάστημα [0, 1 α) (αν επιλέξει ποσότητα x i 1 α, η χρησιμότητα του είναι 0 αφού αθροιστικά θα υπερβούν το 1). Αν x i [0, 1 α), η χρησιμότητα σύμφωνα με την εξίσωση (6) θα είναι u i (x) = x i (1 n x j ) = x i (1 x i α) = (1 α)x i x 2 i j=1 Η συνάρτηση αυτή είναι πολυώνυμο 2ου βαθμού με θετικό συντελεστή για τον γραμμικό όρο και αρνητικό για τον τετραγωνικό όρο. Μια τέτοια συνάρτηση έχει μέγιστο στο σημείο μηδενισμού της παραγώγου (έχουμε δει και στο μάθημα τέτοιου είδους συναρτήσεις, π.χ. στα παίγνια Cournot). Επομένως: u i = 0 x i = 1 α x i 2 Επομένως καταλήγουμε ότι η βέλτιστη απόκριση για γον παίκτη i είναι να επιλέξει ακριβώς το μισό από την επιτρεπόμενη ποσότητα, προτού υπερβούν το 1 αθροιστικά. 9 (6)

Όταν τώρα α 1, τότε πάλι με βάση την εξίσωση (6), η χρησιμότητα του παίκτη i είναι 0 ανεξάρτητα του τι θα κάνει ο ίδιος. Επομένως όλες οι στρατηγικές είναι βέλτιστες αποκρίσεις. Συνοψίζοντας, η συνάρτηση βέλτιστης απόκρισης δίνεται από τον τύπο: BR(x i ) = { 1 j i x j 2, αν j i x j < 1 κάθε x i [0, 1], αν j i x j 1 (7) (ii) Με n = 2, χρησιμοποιούμε την εξίσωση από το προηγούμενο ερώτημα, η οποία απλοποιείται αρκετά. Για τον παίκτη 1 π.χ. έχουμε ότι το άθροισμα για τις ποσότητες των υπόλοιπων παικτών είναι απλά x 2, επομένως η βέλτιστη απόκριση του παίκτη 1 είναι BR(x 2 ) = { 1 x2 2, αν x 2 < 1 κάθε x 1 [0, 1], αν x 2 = 1 (8) Και ομοίως για τον παίκτη 2, η βέλτιστη απόκριση όταν ο παίκτης 1 παίξει x 1 είναι: BR(x 1 ) = { 1 x1 2, αν x 1 < 1 κάθε x 2 [0, 1], αν x 1 = 1 (9) Ο πιο βολικός τρόπος για να συνεχίσουμε είναι να κάνουμε τις 2 γραφικές παραστάσεις μαζί (την μία ως προς τον άξονα x 1, και την άλλη ως προς τον αξονα x 2 όπως κάναμε με κάποια παραδείγματα στην τάξη). Στον άξονα x 2, στο σημείο x 2 = 1, θα πρεπει να συμπεριλάβουμε μια κάθετη γραμμή προς τον αξονα για να υποδηλώσουμε ότι όλες οι στρατηγικές είναι βέλτιστες για τον παίκτη 1 όταν ο π. 2 παίζει x 2 = 1, και ομοίως για τον άξονα x 1. Από τη γραφική παράσταση προκύπτει ότι έχουμε 2 σημεία ισορροπίας (2 σημεία τομής). Tο ένα προκύπτει από την επίλυση του συστήματος: x 1 = (1 x 2 )/2, x 2 = (1 x 1 )/2 και δίνει x 1 = x 2 = 1/3. Το δεύτερο σημείο είναι το προφίλ x 1 = x 2 = 1. Από αυτά τα 2 σημεία ισορροπίας, το πρώτο αντιστοιχεί σε μια σχετικά εύλογη λύση συμβιβασμού όπου κάθε φοιτητής αποφασίζει να μην ζητήσει πολύ μεγάλο όγκο δεδομένων και έτσι το σύστημα δεν υπερφορτώνεται. Το δεύτερο σημείο δείχνει μια κατάσταση που συμβαίνει και στην πράξη κάποιες φορές. Συγκεκριμένα οι 2 φοιτητές συμπεριφέρονται άπληστα, και καθένας αποφασίζει να ζητήσει τη μέγιστη δυνατή ποσότητα. Αυτό οδηγεί τελικά σε μια κατάσταση όπου κανένας από τους 2 δεν μπορεί να κατεβάσει τίποτα. Στα οικονομικά ένα τέτοιο φαινόμενο αποκαλείται tragedy of the commons (δείτε σχετικές πληροφορίες π.χ. στο wikipedia για το διαμοιρασμό κοινών πόρων) (iii) Με n = 3, αν κάνουμε μια παρόμοια ανάλυση, χρησιμοποιώντας πάλι τη φόρμουλα από το ερώτημα (i), θα δούμε ότι υπάρχει σημείο ισορροπίας όπου x 1 = x 2 = x 3 = 1/4. Αυτό οδηγεί σε θετική χρησιμότητα για όλους τους παίκτες. Και για γενικό n, η ανάλυση δειχνει ότι υπάρχει πάντα τέτοιο σημείο με x i = 1/(n + 1). 10

Πρόβλημα 7. (12 μονάδες) Ένα ζευγάρι έχει αποφασίσει ότι θα χωρίσει και τη μέρα της μετακόμισης πρέπει να μοιράσουν κάποια από τα πράγματα που έχουν αγοράσει από κοινού. Εξακολουθούν όμως να υπάρχουν διαφωνίες για το ποιος θα κρατήσει το ipad, τη μηχανή espresso, το ποδήλατο, και την τηλεόραση. Ας ονομάσουμε τα αγαθά αυτά ως A, B, C, D αντίστοιχα. Προκειμένου να λύσουν τις διαφορές τους ειρηνικά, αποφασίζουν τελικά να εφαρμόσουν το εξής διαδεδομένο πρωτόκολλο (γνωστό στη βιβλιογραφία για διαχείριση πόρων ως divide-and-choose ή cut-and-choose): Στην πρώτη φάση, ο άντρας (παίκτης 1) θα προτείνει μια μοιρασιά των 4 αγαθών σε 2 υποσύνολα, με 2 αγαθά το καθένα. Π.χ. μία πιθανή επιλογή είναι η (AB, CD), που σημαίνει ότι ο ένας θα πάρει το ipad και τη μηχανή espresso, ενώ ο άλλος θα πάρει το ποδήλατο και την τηλεόραση. Η πρόταση του άντρα δεν καθορίζει ποιος θα πάρει το κάθε υποσύνολο, απλά προτείνει μια διαμέριση των αγαθών. Στην δεύτερη φάση, η γυναίκα (παίκτης 2) διαλέγει για τον εαυτό της το ένα από τα 2 υποσύνολα της μοιρασιάς που της προτάθηκε. Ο άντρας παίρνει τα εναπομείναντα 2 αγαθά. Π.χ. στην πρόταση (AB, CD), η γυναίκα έχει να επιλέξει αν θα πάρει τα A, B ή αν θέλει να πάρει τα C, D. (i) (4 μονάδες) Σχεδιάστε το δέντρο που απεικονίζει το παίγνιο. Για τις χρησιμότητες των 2 παικτών, χρησιμοποιήστε τα εξής στοιχεία: Για τον παίκτη 1, η ωφέλειά του (π.χ. σε εκατοντάδες ευρώ) για κάθε αγαθό είναι: v 1 (A) = 3, v 1 (B) = 6, v 1 (C) = 1, και v 1 (D) = 3. Για τον παίκτη 2, οι ωφέλειες είναι v 2 (A) = 3, v 2 (B) = 5, v 2 (C) = 4, και v 2 (D) = 1. Θεωρούμε επίσης ότι η αξία του κάθε παίκτη αν αποκτήσει 2 αγαθά είναι το άθροισμα των 2 αξιών (έχει προσθετική συνάρτηση ωφέλειας). (ii) (6 μονάδες) Βρείτε το ή τα υποπαιγνιακά τέλεια σημεία ισορροπίας. Υπάρχει κάποια άλλη μοιρασιά των αγαθών που να επιτυγχάνει καλύτερο κοινωνικό όφελος από τα σημεία ισορροπίας που βρήκατε; (iii) (2 μονάδες) Αν έπρεπε να αναπαραστήσετε το παίγνιο σε κανονική μορφή, με μορφή πινάκων, τι διαστάσεις θα είχε ο πίνακας; Δεν χρειάζεται να γράψετε την αναπαράσταση αυτή. Λύση. (i) Το δέντρο έχει 2 επίπεδα, στο πρώτο ο παίκτης 1 προτείνει μια πιθανή διαμέριση και στο δεύτερο ο παίκτης 2 επιλέγει ποια αγαθά θα πάρει. Οι επιλογές του παίκτη 1 είναι 3 (επειδή απλά προτείνει πιθανές διαμερίσεις αλλά δεν καθορίζει ποιος παίρνει κάθε υποσύνολο). Χρησιμοποιούμε το συμβολισμό AB CD για να δηλώσουμε την διαμέριση όπου το ένα υποσύνολο αποτελείται από τα αγαθά A και Β, και το δεύτερο υποσύνολο από τα C και D. Το δέντρο του παιγνίου φαίνεται στο Σχήμα 1. (ii) Αν κάνουμε ανάλυση με προς τα πίσω επαγωγή, θα δούμε εύκολα ότι υπάρχει ένα υποπαιγνιακά τέλειο σημείο ισορροπίας, στο οποίο η στρατηγική του παίκτη 1 είναι να προτείνει τη διαμέριση AC BD, ενώ η στρατηγική του παίκτη 2 είναι: Αν δεις AB CD, διάλεξε το σύνολο ΑΒ. 11

Σχήμα 1: Το δέντρο του παιγνίου για το Πρόβλημα 7. Αν δεις AC BD, διάλεξε το σύνολο AC. Αν δεις AD BC, διάλεξε το σύνολο ΒC. Επομένως στο σημείο ισορροπίας αυτό που θα γίνει είναι ότι ο παίκτης 1 θα καταλήξει με τα αγαθά B και D, και ο παίκτης 2 με τα αγαθά A και C. Το κοινωνικό όφελος από αυτή την μοιρασία είναι 16, το οποίο είναι και το βέλτιστο δυνατό. Δεν υπάρχει άλλη μοιρασιά που να επιτυγχάνει καλύτερο όφελος (αυτό δεν ισχύει πάντα, τυχαίνει να είναι έτσι στο συγκεκριμένο παράδειγμα). (iii) Ο πίνακας θα είχε διαστάσεις 3 8. Πρόβλημα 8. (12 μονάδες) Έστω το εξής παίγνιο εκτεταμένης μορφής: Ο ιδιοκτήτης μιας εταιρείας (παίκτης 1) προσλαμβάνει έναν υπάλληλο (πάικτης 2) και του αναθέτει κάποια δουλειά. Ο ιδιοκτήτης πρώτα ανακοινώνει στον υπάλληλο τον μισθό που θα πάρει, έστω x 0, με x R. Στη συνέχεια, ο υπάλληλος βλέπει τον μισθό του και αποφασίζει για το πόση προσπάθεια θα καταβάλει για τη δουλειά που έχει να κάνει. Έστω y 0 το επίπεδο της προσπάθειας, με y R. Θεωρούμε ότι οι συναρτήσεις χρησιμότητας των 2 παικτών είναι: u1 (x, y) = 2 y x u2 (x, y) = x y2 + αxy 2 Το α παραπάνω είναι μια θετική σταθερά (διαισθητικά, η χρησιμότητα του ιδιοκτήτη 12

μειώνεται όσο αυξάνεται ο μισθός και αυξάνεται όσο πιο σκληρά εργάζεται ο υπάλληλος, ενώ το αντίθετο ισχύει για τον υπάλληλο). Εκφράστε τη βέλτιστη απόκριση του υπαλλήλου ως συνάρτηση του μι- (i) (3 μονάδες) σθού. (ii) (9 μονάδες) Βρείτε όλα τα υποπαιγνιακά τέλεια σημεία ισορροπίας (χρησιμοποιώντας προς τα πίσω επαγωγή). Λύση. (i) Θα πρέπει να παραγωγίσουμε ως προς y. Έχουμε: u 2 y = 0 y = αx Άρα η βέλτιστη απόκριση είναι BR(x) = αx. (ii) Για να εφαρμόσουμε προς τα πίσω επαγωγή (παρά το ότι έχουμε άπειρο παίγνιο) ξεκινάμε με τον παίκτη που παίζει τελευταίος, άρα με τον παίκτη 2. Από το προηγούμενο ερώτημα, παίρνουμε ότι όποια προσφορά x δει ο παίκτης 2, θα επιλέγει να παίζει y = αx. Για τον παίκτη 1 τώρα, με δεδομένο ότι ο παίκτης 2 θα παίζει αx, η συνάρτηση χρησιμότητας πλέον του παίκτη 1 γίνεται: u 1 (x) = 2 αx x Επομένως ο παίκτης 1 θα βρει τη βέλτιστη επιλογή του μηδενίζοντας την παράγωγο αυτής της συνάρτησης. u 1 x = 0 x = α Άρα, υπάρχει ένα μόνο υποπαιγνιακά τέλειο σημείο ισορροπίας, το προφίλ στο οποίο ο παίκτης 1 διαλέγει μισθό α και στο οποίο ο πάικτης 2 διαλέγει την προσφορά του παίκτη 1, πολλαπλασιασμένη με α. 13