ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2017 2η σειρά ασκήσεων Προθεσμία παράδοσης: 16 Ιουνίου 2017 Πρόβλημα 1. (18 μονάδες) Έστω το εξής παίγνιο: W X Y Z A 15, 42 13, 40 9, 23 0, 23 B 2, 19 2, 14 5, 13 1, 0 C 20, 7 20, 5 11, 3 1, 2 D 20, 45 3, 11 3, 5 1, 2 Αποφασίστε αν ισχύουν οι παρακάτω προτάσεις. Δικαιολογήστε την απάντησή σας σε κάθεμια από τις προτάσεις. 1. Η στρατηγική Β κυριαρχείται αυστηρά από την Α. 2. Η X κυριαρχεί αυστηρά την Y. 3. Η D κυριαρχεί ασθενώς την B. 4. Η Z κυριαρχείται ασθενώς από την W. 5. Δεν υπάρχει κυρίαρχη στρατηγική για τον παίκτη 1. 6. Η Z είναι βέλτιστη απόκριση στην A. 7. Η C είναι βέλτιστη απόκριση στην W. 8. Το παίγνιο έχει τουλάχιστον ένα αυστηρό σημείο ισορροπίας με αμιγείς στρατηγικές. 9. Υπάρχει σημείο ισορροπίας με κοινωνικό όφελος κάτω του 30. Πρόβλημα 2. (12 μονάδες) Δύο άνεργοι απόφοιτοι του τμήματός μας ψάχνουν για δουλειά. Ξαφνικά ανακαλύπτουν ότι 2 εταιρείες προσφέρουν από μια θέση η κάθεμια. Η εταιρεία 1 προσφέρει μηνιαίο μισθό w 1, η εταιρεία 2 προσφέρει μηνιαίο μισθό w 2, και επίσης οι μισθοί αυτοί ικανοποιούν την εξής σχέση: 1 2 w 1 < w 2 < 2w 1 Ας υποθέσουμε ότι καθένας από τους 2 αποφοίτους πρέπει να αποφασίσει να κάνει αίτηση μόνο σε μια από τις 2 δουλειές (π.χ. επειδή δεν προλαβαίνουν να ετοιμάσουν τα δικαιολογητικά και για τις 2 θέσεις). Ας υποθέσουμε επίσης ότι οι εταιρείες θα αποφασίσουν ως εξής όταν δουν τις αιτήσεις: Αν οι 2 απόφοιτοι έκαναν αίτηση σε διαφορετικές εταιρείες, 1
τότε καθενας τους θα παρει την δουλειά για την οποία έκανε αίτηση, με τον αντίστοιχο μισθό. Αν τώρα και οι 2 έκαναν αίτηση στην ίδια εταιρεία, τότε η εν λόγω εταιρεία θα τους προσλάβει part-time και τους 2, δίνοντας στον καθένα τις μισές μηνιαίες αποδοχές, από τον μισθό που θα έδινε σε εναν full-time υπάλληλο. (i) (5 μονάδες) Να αναπαραστήσετε το παίγνιο σε κανονική μορφή (δηλ. με μορφή πινάκων). Ως χρησιμότητα θεωρήστε το μηνιαίο μισθό του κάθε υπαλλήλου. Βρείτε όλα τα σημεία ισορροπίας και με αμιγείς και με μεικτές στρα- (ii) (7 μονάδες) τηγικές. Πρόβλημα 3. (15 μονάδες) Έστω ότι ένας δημοπράτης τρέχει τον μηχανισμό VCG, με 5 διαθέσιμα αγαθά και 3 παίκτες. Υποθέτουμε ότι οι παίκτες διαθέτουν προσθετικές συναρτήσεις ωφέλειας και ότι η ωφέλεια των παικτών για κάθε αγαθό δίνεται από τον παρακάτω πίνακα V (όπου v ij είναι η ωφέλεια του παίκτη i για το αγαθό j): V = 30 41 11 30 18 35 10 10 25 15 20 20 50 5 20 Οι κανόνες της δημοπρασίας είναι ότι κάθε προσφορά για κάθε αγαθό πρέπει να είναι ακέραιος αριθμός και ότι σε περίπτωση ισοβαθμίας κερδίζει ο παίκτης με τον χαμηλότερο δείκτη. Δείξτε ποια θα είναι η ανάθεση των αγαθών και οι πληρωμές των παικτών αν όλοι οι παίκτες δηλώσουν τις πραγματικές τους ωφέλειες σύμφωνα με τον παραπάνω πίνακα. Ποια τα έσοδα του δημοπράτη; Έστω τώρα ότι οι παίκτες 1 και 2, κάνουν μια συμμαχία, με σκοπό να μειώσουν τις πληρωμές τους για τα αγαθά που κερδίζουν, χωρίς όμως να αλλάξει η τωρινή ανάθεση των αγαθών. Αν υποθέσουμε ότι ο παίκτης 3 συνεχίζει να δηλώνει τις πραγματικές του ωφέλειες, ποια είναι η μέγιστη μείωση στα έσοδα του δημοπράτη που μπορούν να πετύχουν οι παίκτες 1 και 2 για τα αγαθά που παίρνουν, και τι προσφορές πρέπει να δηλώσουν για να το πετύχουν αυτό; (Υπάρχουν αρκετοί διαφορετικοί τρόποι για την επίτευξη του στόχου τους.) Πρόβλημα 4. (15 μονάδες) Βρείτε όλα τα σημεία ισορροπίας στα παρακάτω παίγνια μηδενικού αθροίσματος (και με αμιγείς και με μεικτές στρατηγικές). Χρησιμοποιήστε τη μέθοδο που είδαμε στην τάξη για 2 n παίγνια μηδενικού αθροίσματος. [ -2 5 1 0-4 3-3 -1 3 8 Πρόβλημα 5. (25 μονάδες) Βρείτε όλα τα σημεία ισορροπίας με αμιγείς και με μεικτές στρατηγικές στα παρακάτω 2 παίγνια: (i) (6 μονάδες) [ 1, 2 4, 1 3, 2 2, 3 2
(ii) (12 μονάδες) [ 0, 0 5, 2 3, 4 6,5 2, 6 3, 5 5, 3 1,0 (iii) (7 μονάδες) Όπως είδαμε στο μάθημα, σε ένα προφίλ στρατηγικών (x, y), το κοινωνικό όφελος (social welfare) ορίζεται ως: SW (x, y) = u 1 (x, y) + u 2 (x, y). Για παίγνια 2 παικτών, έστω SW max = max x,y SW (x, y), το βέλτιστο κοινωνικό όφελος που μπορεί να προκύψει, όπου η βελτιστοποίηση είναι ως προς όλες τις πιθανές στρατηγικές. Έστω επίσης SW το ελάχιστο κοινωνικό όφελος που μπορεί να προκύψει σε ένα σημείο ισορροπίας κατά Nash. Ο λόγος SW max /SW αναφέρεται ως τίμημα της αναρχίας¹, καθώς δείχνει την απόκλιση που μπορεί να έχει η μη συνεργατική, στρατηγική συμπεριφορά των παικτών από μια συντονισμένη προσπάθεια προς βελτιστοποίηση του κοινωνικού οφέλους. Για τα παραπάνω 2 παίγνια, υπολογίστε πρώτα το τίμημα της αναρχίας ως προς τα σημεία ισορροπίας με αμιγείς στρατηγικές (αν υπάρχουν τέτοια σημεία). Κατόπιν υπολογίστε εκ νέου το τίμημα της αναρχίας αν συμπεριλάβετε και τα σημεία ισορροπίας με μεικτές στρατηγικές. Πρόβλημα 6. (15 μονάδες) Θεωρήστε τη δημοπρασία πρώτης τιμής με ενσφράγιστες προσφορές, για ένα αγαθό, που είδαμε στο μάθημα. Πιο συγκεκριμένα, έστω ότι υπάρχουν n παίκτες, η αποτίμηση του παίκτη i για το αγαθό είναι v i και ισχύει ότι v 1 > v 2 >... > v n > 0. Νικητής στη δημοπρασία είναι ο παίκτης που δηλώνει τη μεγαλύτερη προσφορά και η τιμή που πληρώνει είναι ακριβώς η προσφορά που δηλώνει. Κάνουμε επίσης την υπόθεση ότι σε περίπτωση ισοβαθμίας, νικητής είναι ο παίκτης με τον μικρότερο δείκτη. Δείξτε γιατί σε οποιοδήποτε σημείο ισορροπίας με αμιγείς στρατηγικές πρέπει να ισχύει ότι: 1. Οι 2 υψηλότερες προσφορές είναι ίσες, και μία από αυτές έχει υποβληθεί από τον παίκτη 1 (που θα είναι και ο νικητής λόγω του κανόνα για τις ισοπαλίες). 2. Οι 2 αυτές υψηλότερες προσφορές ανήκουν στο διάστημα [v 2, v 1. Θεωρήστε δηλαδή ένα οποιοδήποτε σημείο ισορροπίας κατά Nash, έστω (b 1, b 2,..., b n ) και δείξτε ότι θα πρεπει να ισχύουν τα παραπάνω (στο μάθημα είδαμε ένα τέτοιο συγκεκριμένο σημείο ισορροπίας στη δημοπρασία πρώτης τιμής, δεν είναι όμως και μοναδικό). Δείξτε επίσης και την αντίθετη κατεύθυνση: Οποιοδήποτε προφίλ στρατηγικών που ικανοποιεί τις 2 παραπάνω συνθήκες αποτελεί και σημείο ισορροπίας κατά Nash. Πρόβλημα 7. (18 μονάδες) Δύο αδέλφια κληρονομούν τρία διαμερίσματα. Η διαθήκη γράφει μόνο ότι ο μεγάλος αδελφός θα πρέπει να πάρει τα δύο από τα τρία διαμερίσματα, χωρίς να προσδιορίζει ποια, και ότι θα πρέπει να συμφωνήσουν τα δυο αδέλφια μεταξύ τους για το πώς θα τα μοιραστούν. Προκειμένου να αποφευχθούν δικαστικές διαμάχες, τα δύο αδέλφια αποφασίζουν τελικά να χρησιμοποιήσουν το εξής πρωτόκολλο για να ¹Ενημερωτικά, μπορείτε να δείτε την εργασία όπου εισήχθη η σχετική ορολογία: Elias Koutsoupias, Christos Papadimitriou, Worst Case Equilibria, Computer Science Review, 3(2), 65-69, 2009. 3
αποφασίσουν: Στον πρώτο γύρο, θα διαλέξει ένα από τα τρία διαμερίσματα ο μεγάλος αδελφός (παίκτης 1). Το διαμέρισμα αυτό πάει στην κατοχή του. Στον δεύτερο γύρο, ο μικρός αδελφός (παίκτης 2) θα διαλέξει ένα από τα υπόλοιπα δύο, το οποίο και θα έρθει στην κατοχή του. Και τέλος το διαμέρισμα που θα έχει απομείνει, θα το αποκτήσει ο μεγάλος αδελφός ². (i) (4 μονάδες) Σχεδιάστε το δέντρο που απεικονίζει το παίγνιο. Για τις χρησιμότητες των 2 παικτών, ας ονομάσουμε τα διαμερίσματα ως Α, Β, Γ. Οι προτιμήσεις του μεγάλου αδελφού είναι ότι πρωτίστως θα ήθελε το Α, ως δεύτερη προτίμηση έχει το Β, και μετά το Γ. Η αξία που έχει για αυτόν το κάθε διαμέρισμα είναι η διπλάσια από την αξία για το προηγούμενο στη σειρά προτίμησης. Έτσι, η ωφέλειά του (π.χ. σε εκατοντάδες χιλ. ευρώ) είναι: v 1 (A) = 4, v 1 (B) = 2, και v 1 (Γ) = 1. Θεωρούμε επίσης ότι η αξία του παίκτη 1 αν αποκτήσει 2 διαμερίσματα είναι το άθροισμα των 2 αξιών (έχει προσθετική συνάρτηση ωφέλειας). Για τον παίκτη 2 τώρα, οι προτιμήσεις είναι διαφορετικές: θα ήθελε πρωτίστως το Β, μετά το Γ, και τελευταίο το Α. Η συνάρτηση ωφέλειας του ικανοποιεί: v 2 (B) = 4, v 2 (Γ) = 2, και v 2 (A) = 1. (ii) (8 μονάδες) Βρείτε το ή τα υποπαιγνιακά τέλεια σημεία ισορροπίας. Υπάρχει υποπαιγνιακά τέλειο σημείο ισορροπίας, στο οποίο ο παίκτης 1 στον πρώτο γύρο δεν διαλέγει το διαμέρισμα που θέλει περισσότερο (το Α); Βελτιστοποιείται το κοινωνικό όφελος στα σημεία ισορροπίας που βρήκατε; (iii) (2 μονάδες) Αν έπρεπε να αναπαραστήσετε το παίγνιο σε κανονική μορφή, με μορφή πινάκων, τι διαστάσεις θα είχε ο πίνακας; Δεν χρειάζεται να γράψετε την αναπαράσταση αυτή. (iv) (4 μονάδες) Υπάρχει σημείο ισορροπίας κατά Nash, στο οποίο η ιστορία που πραγματοποιείται διαφέρει από τα υποπαιγνιακά τέλεια σημεία ισορροπίας; Και πάλι, δεν απαιτείται απαραίτητα η αναπαράσταση με πίνακα για να απαντήσετε σε αυτό το ερώτημα, μπορείτε να επιχειρηματολογήσετε με βάση το δέντρο. Πρόβλημα 8. (12 μονάδες) Έστω το εξής παίγνιο εκτεταμένης μορφής: Ο ιδιοκτήτης μιας εταιρείας (παίκτης 1) προσλαμβάνει έναν υπάλληλο (πάικτης 2) και του αναθέτει κάποια δουλειά. Ο ιδιοκτήτης πρώτα ανακοινώνει στον υπάλληλο τον μισθό που θα πάρει, έστω x 0, με x R. Στη συνέχεια, ο υπάλληλος βλέπει τον μισθό του και αποφασίζει για το πόση προσπάθεια θα καταβάλει για τη δουλειά που έχει να κάνει. Έστω y 0 το επίπεδο της προσπάθειας, με y R. Θεωρούμε ότι οι συναρτήσεις χρησιμότητας των 2 παικτών είναι: u 1 (x, y) = 2 y x u 2 (x, y) = x y2 2 + αxy Το α παραπάνω είναι μια θετική σταθερά (διαισθητικά, η χρησιμότητα του ιδιοκτήτη μειώνεται όσο αυξάνεται ο μισθός και αυξάνεται όσο πιο σκληρά εργάζεται ο υπάλληλος, ²Μια γενίκευση αυτού του round-robin αλγορίθμου με πολλά αδέλφια και διαμερίσματα χρησιμοποιείται για την επιλογή νέων παικτών στο NBA draft, καθώς και σε άλλες αθλητικές ομοσπονδίες (όπου τα διαμερίσματα αντιστοιχούν σε νέους παίκτες που έρχονται στο ΝΒΑ, και τα αδέλφια σε ομάδες του NBA). 4
ενώ το αντίθετο ισχύει για τον υπάλληλο). (i) (3 μονάδες) Εκφράστε τη βέλτιστη απόκριση του υπαλλήλου ως συνάρτηση του μισθού. (ii) (9 μονάδες) Βρείτε όλα τα υποπαιγνιακά τέλεια σημεία ισορροπίας (χρησιμοποιώντας προς τα πίσω επαγωγή). 5