ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Τελικές Εξετάσεις Τρίτη 15 Ιανουαρίου 2008 ιάρκεια εξέτασης: 3 ώρες (13:00-16:00) ΘΕΜΑ 1 ο (2,5 µονάδες) Κάθε ένας από δύο παίκτες κατέχει από µια µονάδα πόρου (π.χ. χρήµατα). Κάθε παίκτης θα πρέπει να επιλέξει τι µέρος του πόρου θα χρησιµοποιήσει για να πολεµήσει τον αντίπαλο, και τι µέρος θα χρησιµοποιήσει παραγωγικά. Εάν κάθε παίκτης επιλέξει να αφιερώσει µέρος y i στην "µάχη", τότε το συνολικό όφελος θα είναι f(y 1,y 2 )=2-y 1 -y 2 και ο παίκτης i θα λάβει ένα ποσοστό p i (y 1,y 2 ) του οφέλους, το οποίο ισούται µε: 1 if yi > y j pi ( y1, y2) = 1/ 2 if yi = y j 0 if yi < y j Κάθε παίκτης ενδιαφέρεται µόνο για το δικό του όφελος, επιθυµώντας να το µεγιστοποιήσει. Βρείτε το/τα σηµείο/α ισορροπίας Nash του παιχνιδιού. Υπόδειξη: Εξετάστε πρώτα ζεύγη (y 1,y 2 ) µε y 1 y 2, µετά εξετάστε την περίπτωση y 1 =y 2 <1 και τέλος εξετάστε την περίπτωση y 1 =y 2 =1. Έστω ένας συνδυασµός στρατηγικών (y 1,y 2 ) µε y 1 y 2. Υποθέτουµε, χωρίς βλάβη της γενικότητας, ότι y 1 <y 2. Σε αυτή την περίπτωση, ο παίκτης 1 δεν κερδίζει τίποτα ενώ ο παίκτης 2 κερδίζει 1-y 1 -y 2. Υποθέτουµε τώρα ότι y 2 <1. Σε αυτή την περίπτωση, ο παίκτης 1 έχει κάθε λόγο να αυξήσει τις "πολεµικές" του δαπάνες και να ξεπεράσει οριακά την τιµή y 2, κερδίζοντας έτσι αυτό 1-2y 2. Άρα, οποιοσδήποτε συνδυασµός στρατηγικών (y 1,y 2 ) µε y 1 y 2 µε y 1 <1 και y 2 <1 δεν αποτελεί σηµείο ισορροπίας Nash. Εάν ωστόσο y 2 =1, τότε το καλύτερο που µπορεί να κάνει ο παίκτης 1 είναι να επιλέξει y 1 =1. Όµως σε αυτή την περίπτωση το κέρδος του παραµένει µηδενικό, οπότε δεν έχει λόγο να το κάνει. Μπορούµε λοιπόν να πούµε ότι οριακά, για y i <y j =1, έχουµε σηµείο ισορροπίας Nash. Έστω τώρα η περίπτωση y 1 =y 2 <1. Το κέρδος καθενός εκ των δύο παικτών είναι 0.5(2-y 1 -y 2 ). Ο συνδυασµός αυτός ωστόσο δεν αποτελεί σηµείο ισορροπίας Nash, µιας και οποιοσδήποτε παίκτης µπορεί να αυξήσει τις "πολεµικές" του δαπάνες απειροελάχιστα και να διπλασιάσει το όφελός του. Τέλος, έστω y 1 =y 2 =1. Ο συνδυασµός αυτών επιλογών αποτελεί σηµείο ισορροπίας Nash, µε µηδενικό όφελος για κάθε παίκτη. Πράγµατι, οποιαδήποτε µείωση στις πολεµικές δαπάνες δεν µπορεί να αυξήσει το όφελος ενός παίκτη (αλλά ούτε και να το µειώσει). ΘΕΜΑ 2 ο (2,5 µονάδες) Έστω 3 παίκτες οι οποίοι έχουν να µοιράσουν 5 αντικείµενα. Στον παρακάτω πίνακα φαίνεται η αξία κάθε αντικειµένου για κάθε παίκτη. Αντικείµενα Παίκτες Ι1 Ι2 Ι3 Ι4 Ι5
Π1 3 7 4 8 1 Π2 4 6 2 9 3 Π3 5 1 4 7 6 Η διαδικασία του µοιράσµατος γίνεται ως εξής: Πρώτα επιλέγει ο παίκτης Π1 κάποιο αντικείµενο, µετά επιλέγει ο παίκτης Π2 κάποιο αντικείµενο από τα εναποµείναντα και µετά ο παίκτης Π3 από τα εναποµείναντα. Η παραπάνω διαδικασία επαναλαµβάνεται µέχρι να εξαντληθούν τα αντικείµενα. Το όφελος για κάθε παίκτη ισούται µε την υποκειµενική αξία των αντικειµένων που επέλεξε. Με βάση τα δεδοµένα της άσκησης βρείτε τα αντικείµενα που τελικά επιλέγουν οι παίκτες. Υπόδειξη: Για να περιορίσετε το µέγεθος του δένδρου του παιχνιδιού, µην περιλαµβάνετε στις επιλογές του κάθε παίκτη ενδεχόµενες κυριαρχούµενες στρατηγικές. Επίσης, σε περίπτωση που διαπιστώσετε την ύπαρξη κυρίαρχων στρατηγικών, µπορείτε να τις επιλέξετε άµεσα χωρίς να ελέγξετε τις υπόλοιπες. Κατασκευάζουµε το δένδρου του παιχνιδιού και βαθµολογούµε τα φύλλα. Στη συνέχεια εφαρµόζουµε την τεχνική της προς τα πίσω επαγωγής και βρίσκουµε τη λύση του παιχνιδιού. Για να περιορίσουµε το µέγεθος του δένδρου του παιχνιδιού δεν περιλαµβάνουµε στις επιλογές κάθε παίκτη ενδεχόµενες κυριαρχούµενες στρατηγικές. Ως τέτοια µπορεί να θεωρηθεί η χειρότερη από τις επιλογές που έχει στη διάθεση του ο παίκτης κάθε φορά που είναι η σειρά του να επιλέξει. Επιπλέον, όταν κάθε παίκτης επιλέγει για τελευταία φορά (κάτι που συµβαίνει µε τη µοναδική επιλογή του παίκτη Π3 αλλά και µε τις δεύτερες επιλογές των παικτών Π1 και Π2, υπάρχει κυρίαρχη στρατηγική και αυτή είναι η βέλτιστη επιλογή τους από τα εναποµείναντα αντικείµενα. Με βάση τον παραπάνω συλλογισµό κατασκευάστηκε το δένδρο που ακολουθεί. Όπως φαίνεται από τη λύση, οι παίκτες κατά σειρά επιλέγουν τα αντικείµενα Ι4, Ι2, Ι5, Ι3 και Ι1. µε τελικό όφελος για τους τρεις παίκτες 12, 10 και 6 µονάδες αντίστοιχα.
Π1 Π2 Π3 Π1 Π2 (10,11,6) 12 (10,11,6) 124 1243 12435 (10,11,6) 1 14 145 1452 14523 (10,5,7) (10,5,7) 15 154 1542 15423 (10,7,7) 21 (10,7,7) 214 2143 21435 2 24 245 2453 24531 25 254 2543 25431-3 31 314 3142 31425 32 324 3241 32415 34 345 3452 34521 (15,6,6) 41 (15,6,6) 415 4152 41523 4 42 425 4253 42531 (11,9,4) (11,9,4) 45 451 4513 45312
ΘΕΜΑ 3 ο (2,5 µονάδες) Θεωρήστε ότι το παιχνίδι του 1 ου θέµατος επαναλαµβάνεται επ' άπειρο. Βρείτε ένα τέλειο σηµείο ισορροπίας Nash για υποπαίγνια το οποίο µεγιστοποιεί το µακροπρόθεσµο όφελος των δύο παικτών, χρησιµοποιώντας στρατηγική ενεργοποίησης. Για ποιες τιµές του συντελεστή προεξόφλησης δ η συµφωνία που βρήκατε είναι σταθερή; Είναι προφανές ότι το σηµείο ισορροπίας Nash που βρέθηκε στο 1 ο θέµα δεν είναι ιδιαίτερα επιθυµητό, µιας και δεν δίνει καθόλου όφελος στους παίκτες. Αντίθετα, ο συνδυασµός εκείνος που µεγιστοποιεί το όφελος των δύο παικτών είναι ο y 1 =y 2 =0, αποδίδοντας µία µονάδα οφέλους σε κάθε παίκτη. Εφόσον λοιπόν το παιχνίδι επαναλαµβάνεται επ' άπειρο, οι παίκτες θα µπορούσαν να κάνουν τη συµφωνία να επιλέγουν πάντα y 1 =y 2 =0. Εάν σε κάποιο γύρο κάποιος παίκτης σπάσει τη συµφωνία, στο εξής οι παίκτες θα επιλέγουν για πάντα y 1 =y 2 =1, µε µηδενικό όφελος για όλους τους επόµενους γύρους. Το µακροπρόθεσµο όφελος ενός παίκτη, εφόσον δεν σπάσει η συµφωνία, είναι 1+δ+δ 2 + =1/(1-δ). Εάν σε κάποιο γύρο ο τυχαίος παίκτης i σπάσει τη συµφωνία, θα επιλέξει να αυξήσει το yi απειροελάχιστα, έτσι ώστε αφενός να µην µειωθεί το συνολικό όφελος (που ήταν 2 µονάδες), αφετέρου να το προσποριστεί όλο µόνος του. Το βραχυπρόθεσµο κέρδος του παίκτη λοιπόν εφόσον σπάσει τη συµφωνία είναι 2. Στους επόµενους γύρους όµως θα ενεργοποιηθεί η τιµωρία οπότε το όφελος για όλους τους επόµενους γύρους θα είναι 0. Για να µην σπάσει λοιπόν η συµφωνία θα πρέπει να ισχύει 2 1/(1-δ). Λύνοντας ως προς δ βρίσκουµε ότι ικανή και αναγκαία συνθήκη για να διατηρηθεί η συµφωνία είναι η δ 0.5. ΘΕΜΑ 4 ο (2,5 µονάδες) Ο παίκτης Α είναι κάτοχος ενός αυτοκινήτου το οποίο εµφανίζει µια βλάβη. Ο Α πηγαίνει το αυτοκίνητο στο συνεργείο, όπου ο τεχνικός (παίκτης Β) καλείται να διαγνώσει τη βλάβη. Υπάρχουν δύο περιπτώσεις: Η βλάβη να είναι µεγάλη, µε πιθανότητα r, όπου 0<r<1, και η βλάβη να είναι µικρή, µε πιθανότητα 1-r. Ο τεχνικός έχει δύο επιλογές: Να πει την αλήθεια σχετικά µε τη βλάβη ή όχι. Εάν πει την αλήθεια, το κέρδος του από την ενδεχόµενη ανάθεση της επιδιόρθωσης είναι π. Εάν πει ψέµατα, κάτι που µπορεί να συµβεί µόνο εάν η βλάβη είναι µικρή αλλά αυτός την εµφανίσει ως µεγάλη, το κέρδος του από την ενδεχόµενη ανάθεση της επιδιόρθωσης είναι π', όπου π'>π. Ο πελάτης δεν µπορεί να διαγνώσει µόνος του το µέγεθος της βλάβης, ωστόσο γνωρίζει την τιµή του r. Οι επιλογές του πελάτη είναι δύο: Να αναθέσει την επιδιόρθωση του αυτοκινήτου στον τεχνικό ή όχι (οπότε θα ψάξει για άλλον τεχνικό). Το τελευταίο µπορεί να συµβεί µόνο στην περίπτωση που ο τεχνικός ισχυριστεί ότι η βλάβη είναι µεγάλη. Η αµοιβή του τεχνικού για επιδιόρθωση µεγάλης βλάβης είναι Ε, ενώ για επιδιόρθωση µικρής βλάβης είναι Ι, όπου Ε>Ι. Σε περίπτωση µη-αποδοχής της προσφοράς του τεχνικού, η ταλαιπωρία για τον κάτοχο του αυτοκινήτου είναι Ε'>Ε εάν η ζηµιά είναι µεγάλη και Ι'>Ι εάν η ζηµιά είναι µικρή. Θεωρείστε επίσης ότι Ε>Ι'. Θεωρείστε ότι οι δύο παίκτες αποφασίζουν ταυτόχρονα και πριν µάθουν το µέγεθος της ζηµιάς (δηλαδή ο πελάτης αποφασίζει αν θα δεχθεί ή όχι την προσφορά επιδιόρθωσης, και ο πωλητής αποφασίζει εάν θα είναι ειλικρινής ή όχι, πριν µάθει εάν αυτή αφορά µεγάλη ή µικρή ζηµιά). Ωστόσο, σε περίπτωση που η διάγνωση αφορά µικρή βλάβη, ο πελάτης πάντα δέχεται την προσφορά, ενώ σε περίπτωση που η βλάβη είναι µεγάλη, ο τεχνικός είναι πάντα ειλικρινής. α) Κατασκευάστε τον πίνακα του παιχνιδιού. Τοποθετείστε µέσα στα κελιά τα αναµενόµενα οφέλη των δύο παικτών για τις διάφορες περιπτώσεις (0,5). β) Βρείτε το/τα σηµείο/α ισορροπίας Nash µε καθαρές στρατηγικές (αν υπάρχουν). (1) γ) Βρείτε το/τα σηµείο/α ισορροπίας Nash µε µικτές στρατηγικές. (1)
Για διευκόλυνση µπορείτε να χρησιµοποιείστε τις παρακάτω τιµές για τις σταθερές του προβλήµατος: r=1/2, I=2, E=6, I'=3, E'=7, π=1, π'=5. α) Στον παρακάτω πίνακα φαίνονται τα αναµενόµενα οφέλη των δύο παικτών για τους τέσσερις συνδυασµούς στρατηγικών: Πελάτης Τεχνικός έχεται ( ) Απορρίπτει (Α) Ειλικρινής (Ε) π, -re-(1-r)i (1-r)π, -rε'-(1-r)i Ψεύτης (Ψ) rπ+(1-r)π', -Ε 0, -re'-(1-r)i' Αντικαθιστώντας τις συγκεκριµένες τιµές της άσκησης ο παραπάνω πίνακας γίνεται: Πελάτης Τεχνικός έχεται ( ) Απορρίπτει (Α) Ειλικρινής (Ε) 1, -4 0.5, -4.5 Ψεύτης (Ψ) 2, -6 0, -5 β) Από τον πίνακα µε τις αριθµητικές τιµές προκύπτει ότι δεν υπάρχει σηµείο ισορροπίας µε καθαρές στρατηγικές. Από τον προηγούµενο πίνακα φαίνεται ότι το µοναδικό σηµείο ισορροπίας µε καθαρές στρατηγικές θα µπορούσε να είναι το (Ψ, ), εφόσον όµως ίσχυε E<-rE'-(1-r)I' (κάτι που για τις συγκεκριµένες τιµές των παραµέτρων δεν ισχύει). Μπορεί επίσης εύκολα να αποδειχθεί ότι δεν υπάρχει άλλο σηµείο ισορροπίας µε καθαρές στρατηγικές. γ) Έστω ότι οι δύο παίκτες επιλέγουν µικτές στρατηγικές. Ειδικότερα, ο τεχνικός επιλέγει Ε µε πιθανότητα p και Ψ µε πιθανότητα 1-p. Παρόµοια, ο πελάτης επιλέγει µε πιθανότητα q και Α µε πιθανότητα 1-q. Η σχέση µεταξύ p και 1-p θα πρέπει να είναι τέτοια, ώστε οι δύο επιλογές του πελάτη να είναι ισοδύναµες: p(re+(1-r)i)+(1-p)e=p(re'+(1-r)i)+(1-p)(re'+(1-r)i') Λύνοντας ως προς p βρίσκουµε: E [ re + (1 r) I ] p= (1 r)( E I ) Παρόµοια, η σχέση µεταξύ q και 1-q θα πρέπει να είναι τέτοια, ώστε οι δύο επιλογές του τεχνικού να είναι ισοδύναµες: qπ+(1-q)π=q[rπ+(1-r)π'] Λύνοντας ως προς q βρίσκουµε q=π/π'. Αντικαθιστώντας για τις συγκεκριµένες τιµές των παραµέτρων βρίσκουµε p=1/1.5=2/3=0.66 και q=1/5=0.2. ΘΕΜΑ 5 ο (2,5 µονάδες) Υπάρχει µια µονάδα ενός προϊόντος προς πώληση και δύο υποψήφιοι αγοραστές, Α και Β. Κάθε υποψήφιος αγοραστής µπορεί να είναι είτε τύπου 1 είτε τύπου 2, µε ίσες πιθανότητες. Για έναν υποψήφιο αγοραστή τύπου 1 το αντικείµενο έχει υποκειµενική αξία θ, ενώ για έναν υποψήφιο αγοραστή τύπου 2 το αντικείµενο έχει υποκειµενική αξία µ, όπου θ>µ>0. α) Ποια είναι η κυρίαρχη στρατηγική για κάθε τύπο παίκτη σε δηµοπρασία σφραγισµένων προσφορών δεύτερης τιµής; (1) β) Ποιο είναι το αναµενόµενο όφελος του πωλητή ανά δηµοπρατούµενο αντικείµενο στη δηµοπρασία σφραγισµένων προσφορών δεύτερης τιµής; (1,5)
α) Η κυρίαρχη στρατηγική για κάθε τύπο παίκτη είναι να προσφέρει το µέγιστο που είναι διατεθειµένος να πληρώσει για να αποκτήσει το αντικείµενο. β) Με δεδοµένο ότι οι δύο τύποι παικτών είναι ισοπίθανοι, υπάρχουν τέσσερα ισοπίθανα σενάρια εξέλιξης του παιχνιδιού: Και οι δύο παίκτες είναι τύπου 1 Και οι δύο παίκτες είναι τύπου 2 Ο πρώτος παίκτης είναι τύπου 1 και ο δεύτερος τύπου 2 Ο πρώτος παίκτης είναι τύπου 2 και ο δεύτερος τύπου 1 Λαµβάνοντας υπόψη την κυρίαρχη στρατηγική κάθε τύπου παίκτη, το κέρδος του διοργανωτή θα είναι θ στην πρώτη περίπτωση και µ στις υπόλοιπες τρεις. Άρα το αναµενόµενο κέρδος του διοργανωτή είναι (θ+3µ)/4. ΑΠΑΝΤΗΣΤΕ 4 ΑΠΟ ΤΑ ΠΑΡΑΠΑΝΩ 5 ΘΕΜΑΤΑ (Ενδεικτικές λύσεις θα αναρτηθούν µετά την εξέταση στο site του µαθήµατος)