ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015 Λύσεις 1ης σειράς ασκήσεων Προθεσμία παράδοσης: 22 Απριλίου 2015 Πρόβλημα 1. (20 μονάδες) Καθώς εξαντλούνται τα αποθέματα πετρελαίου, ο πετρελαϊκός όμιλος Al Khalifa θέλει να αποφασίσει για το αν θα κάνει νέες γεωτρήσεις σε μία προτεινόμενη περιοχή. Το συμβούλιο πρέπει να αποφασίσει σύντομα για το αν συμφέρει να γίνει η γεώτρηση (επιλογή a 1 ) ή όχι (επιλογή a 2 ). Υπάρχει αβεβαιότητα για το κατά πόσο το επίκεντρο της γεώτρησης θα είναι ξηρό και χωρίς κοιτάσματα (τύπος θ 1 ), μέτριο σε κοιτάσματα (τύπος θ 2 ) ή πολύ πλούσιο σε κοιτάσματα (τύπος θ 3 ). Το χρηματικό όφελος ή η ζημιά (σε χιλιάδες ευρώ) για τις διάφορες δυνατές εκβάσεις φαίνεται παρακάτω : επιλογή τύπος a 1 a 2 θ 1-70 0 θ 2 50 0 θ 3 200 0 Πίνακας 1: Χρηματική ωφέλεια με βάση την απόφαση και τον τύπο. Με κόστος 10 χιλιάδες ευρώ, ο όμιλος μπορεί να διενεργήσει σεισμικά πειράματα για να καθορισθεί η γεωλογική δομή του εδάφους. Τα πειράματα θα δείξουν αν η δομή είναι (α) ακατάλληλη (έκβαση 1 ) ή (β) μέτριας απόδοσης (έκβαση 2 ) ή (γ) ελπιδοφόρα (έκβαση 3 ). Η από κοινού κατανομή πιθανότητας για την έκβαση των πειραμάτων και τον τύπο της γεώτρησης δίνεται από τον παρακάτω πίνακα: έκβαση πειραμάτων τύπος 1 2 3 θ 1 0.3 0.15 0.05 θ 2 0.09 0.12 0.09 θ 3 0.02 0.08 0.10 Πίνακας 2: Πιθανότητες για τις τομές των πιθανών ενδεχομένων. Για παράδειγμα, η πιθανότητα η δομή του εδάφους να είναι ακατάλληλη και η γεώτρηση να είναι πλούσια σε κοιτάσματα είναι 0.02: P (θ 3 1 ) = 0.02. Έστω ότι χρησιμοποιούμε το κριτήριο της μεγιστοποίησης του μέσου χρηματικού κέρδους. (i) (5 μονάδες) Χωρίς τα πειράματα, ποια είναι η βέλτιστη επιλογή? (Για τον υπολογισμό των εκτιμήσεων για τα P (θ 1 ), P (θ 2 ), P (θ 3 ), χρησιμοποιήστε τον Πίνακα 2) (ii) (3 μονάδες) Να υπολογιστεί η αξία της τέλειας πληροφόρησης. 1
(iii) (9 μονάδες) Μαζί με τα πειράματα, ποια είναι η βέλτιστη επιλογή? Σχεδιάστε το συνολικό δέντρο αποφάσεων και υποδείξτε στο δέντρο την προτεινόμενη στρατηγική. (iv) (3 μονάδες) Έστω ότι το κόστος των πειραμάτων ήταν α. Για ποιες τιμές του α είναι συμφέρον να γίνουν τα πειράματα? (i) Από τον πίνακα 2 προκύπτει ότι P (θ 1 ) = 0.5, P (θ 2 ) = 0.3, P (θ 3 ) = 0.2. Με την επιλογή a 2, το κέρδος είναι 0. Με την επιλογή a 1, το μέσο κέρδος είναι 0.5 ( 70) + 0.3 50 + 0.2 200 = 20, άρα χωρίς τα πειράματα η a 1 είναι η βέλτιστη επιλογή. (ii) Αν μπορούσαμε να έχουμε τέλεια πληροφόρηση, τότε αν το επίκεντρο της γεώτρησης ήταν τύπου θ 1, θα διαλέγαμε a 2, ενώ στις άλλες 2 περιπτώσεις θα διαλέγαμε a 1. Επομένως το συνολικό μέσο κέρδος θα ήταν: 0.5 0 + 0.3 50 + 0.2 200 = 55. Η αξία της τέλειας πληροφόρησης είναι το ποσό κατά το οποίο αυξάνεται το μέσο κέρδος μας σε σχέση με την επιλογή που κάνουμε υπό αβεβαιότητα. Είναι δηλαδή: EV P I = 55 20 = 35 (iii) Το δέντρο απόφασης φαίνεται στο Σχήμα 1. Υπολογίζουμε πρώτα τις πιθανότητες για τα 1, 2, 3. Από τον πίνακα 2 προκύπτει ότι P ( 1 ) = 0.41, P ( 2 ) = 0.35, P ( 3 ) = 0.24. Στη συνέχεια πρέπει να υπολογίσουμε τις δεσμευμένες πιθανότητες P (θ i \ j ) για όλα τα i, j. Για αυτό χρησιμοποιούμε τον τύπο P (θ i \ j ) = P (θ i j )/P ( j ). Οι υπολογισμοί των δεσμευμένων πιθανοτήτων συνοψίζονται στον παρακάτω πίνακα: έκβαση πειραμάτων τύπος 1 2 3 θ 1 30/41 15/35 5/24 θ 2 9/41 12/35 9/24 θ 3 2/41 8/35 10/24 Πίνακας 3: Δεσμευμένες πιθανότητες P (θ i \ j ) για i = 1, 2, 3, j = 1, 2, 3. Πλέον έχουμε υπολογίσει όλες τις ποσότητες που χρειαζόμαστε για να εφαρμόσουμε την προς τα πίσω επαγωγή (backward induction). Π.χ., για να υπολογίσουμε το μέσο κέρδος αν ισχύει το 1 και επιλέξουμε το a 1, θα έχουμε: ( 70) P (θ 1 \ 1 ) + 50 P (θ 2 \ 1 ) + 200 P (θ 3 \ 1 ) = 30.48 Ομοίως υπολογίζουμε και τις υπόλοιπες μέσες τιμές, από τις οποίες προκύπτει ότι η βέλτιστη στρατηγική είναι: Αν 1, επιλέγουμε a 2, αν 2 ή 3 επιλέγουμε a 1. Το μέσο κέρδος από αυτή τη στρατηγική είναι 32.5 και το κόστος του πειράματος είναι 10, άρα το τελικό μέσο κέρδος είναι 22.5 που είναι μεγαλύτερο από το κέρδος χωρίς τα πειράματα που βρήκαμε στο (i). Επομένως η προτεινόμενη στρατηγική είναι να γίνουν τα πειράματα και στο υποδέντρο των πειραμάτων να ακολουθηθεί η βέλτιστη στρατηγική που περιγράψαμε παραπάνω. 2
Σχήμα 1: Το δέντρο απόφασης για το Πρόβλημα 1. (iv) Έστω ότι το κόστος των πειραμάτων ήταν c. Για να συμφέρει το πείραμα θα πρέπει το τελικό μέσο κέρδος να είναι μεγαλύτερο από 20 (δηλαδή από το μέσο κέρδος αν δεν γίνουν πειράματα). Θα πρέπει λοιπόν να ισχύει ότι 32.5 c 20, άρα c 12.5. Πρόβλημα 2. (15 μονάδες) Σκοπός της άσκησης είναι να αναλύσετε το δέντρο απόφασης που φαίνεται στo Σχήμα 2, όταν οι προτιμήσεις ενός αποφασίζοντα δεν εκφράζονται από τη μέση χρηματική τιμή. (i) (5 μονάδες) Αν ο ΑΜ σας λήγει σε άρτιο αριθμό, επιλέξτε μία συνάρτηση χρησιμότητας π(x) που να εκφράζει συντηρητική συμπεριφορά. Διαφορετικά επιλέξτε μια συνάρτηση που να εκφράζει ριψοκίνδυνη συμπεριφορά. Δικαιολογήστε την ορθότητα της επιλογής σας. Η συνάρτηση θα πρέπει να δίνεται από μία φόρμουλα (μην χρησιμοποιήσετε δηλαδή κλαδικές συναρτήσεις). Επιπλέον, η συνάρτηση π(x) που θα διαλέξετε, θα πρέπει να ικανοποιεί τις παραδοχές που είδαμε στο μάθημα για την ανάλυση δέντρων με τη χρήση βασικών κληρώσεων παραμέτρου π, θα πρέπει δηλαδή να είναι κανονικοποιημένη αναφορικά με τα ποσά που εμφανίζονται στο δέντρο του Σχήματος 2. (ii) (10 μονάδες) Αναλύστε το δέντρο του Σχήματος 2 με βάση την συνάρτηση χρησιμότητας π(x) από το προηγούμενο υποερώτημα. Ποια είναι η προτεινόμενη στρατηγική? Ενημερώστε το δέντρο κατάλληλα. (i) Έστω ότι έχουμε έναν συντηρητικό αποφασίζοντα. Μπορούμε να ξεκινήσουμε με την συνάρτηση u(x) = x. Χρειάζεται όμως να κάνουμε κάποια κανονικοποίηση. Εδώ 3
Σχήμα 2: Το δέντρο απόφασης για το Πρόβλημα 2. X max = 800 και X min = 100. Αφού πρέπει να ισχύει ότι π(x min ) = 0, και π(x max ) = 1, μπορούμε να σκεφτούμε ότι θα κάνουμε την κανονικοποίηση επιλέγοντας κάποια συνάρτηση της μορφής π(x) = (u(x) a)/b, με τη χρήση δηλαδή δύο παραμέτρων a, b. Για να βρούμε το a, χρησιμοποιούμε τη σχέση π(x min ) = 0. Από εκεί παίρνουμε αμέσως ότι 100 a = 0, άρα a = 10. Χρησιμοποιώντας τώρα την π(x max ) = 1 για να βρούμε το b, έχουμε ( 800 10)/b = 1 που συνεπάγεται ότι b = 10( 8 1) = 18.28. (ii) Η ανάλυση μπορεί να γίνει με προς τα πίσω επαγωγή όπως ακριβώς έχουμε δει στο μάθημα. Πρόβλημα 3. (10 μονάδες) Ας υποθέσουμε ότι σε ένα άτομο προτείνονται τα εξής 2 στοιχήματα: στο 1ο, θα πρέπει να πληρώσει 100 ευρώ για ένα λαχνό ο οποίος κερδίζει 400 ευρώ με πιθανότητα 1/2 και 36 ευρώ πάλι με πιθανότητα 1/2. Στο 2ο, πληρώνει 100 ευρώ για ένα λαχνό, ο οποίος κερδίζει 225 ευρώ με πιθανότητα 2/3, και 81 ευρώ με πιθανότητα 1/3. (i) Αν η συνάρτηση χρησιμότητας του εν λόγω ατόμου είναι η u(x) = x + 100, ποια η βέλτιστη απόφαση του αποφασίζοντα; (ii) Αν η συνάρτηση χρησιμότητας είναι γραμμική, αλλάζει τώρα η βέλτιστη απόφαση; (i) Για το πρώτο στοίχημα, αφού πληρώνουμε 100 ευρώ για τη συμμετοχή, η μέση χρησιμότητα είναι: 1 1 1 1 (400 100) + 100 + (36 100) + 100 = 400 + 36 = 13 2 2 2 2 Για το δεύτερο στοίχημα, έχουμε αντίστοιχα μέση χρησιμότητα ίση με: 2 1 2 1 (225 100) + 100 + (81 100) + 100 = 225 + 81 = 13 3 3 3 3 4
Επομένως ο αποφασίζων είναι αδιάφορος μεταξύ των 2 στοιχημάτων, μπορεί να επιλέξει οποιοδήποτε από τα 2. (ii) Αν η συνάρτηση χρησιμότητας είναι γραμμική, π.χ. της μορφής ax + b, τότε αρκεί να συγκρίνουμε το μέσο χρηματικό ποσό στο κάθε στοίχημα. Στο 1ο στοίχημα, έχουμε μέσο χρηματικό ποσό: 1/2 400 + 1/2 (36) 100 = 118. Στο 2ο στοίχημα έχουμε αντίστοιχα: 2/3 225 + 1/3 (81) 100 = 77. Άρα θα προτιμήσει το 1ο στοίχημα. Πρόβλημα 4. (15 μονάδες) (i) (11 μονάδες) Βρείτε τον συντελεστή αποφυγής κινδύνου τ(x) για τις παρακάτω συναρτήσεις. Θεωρήστε ως πεδίο ορισμού το [0, ), δεν μας ενδιαφέρει δηλαδή τι συμβαίνει για αρνητικές τιμές του x. 1. u 1 (x) = 3 + 6e 2x 2. u 2 (x) = ln(x + 2) 3. u 3 (x) = 8 + 3e 5x 4. u 4 (x) = x 2 + 3x Μπορείτε να συγκρίνετε τις 4 αυτές συναρτήσεις και να τις ταξινομήσετε από αυτήν που εκφράζει την πιο ριψοκίνδυνη συμπεριφορά σε αυτή με την πιο συντηρητική; Δικαιολογήστε την απάντησή σας. (ii) (4 μονάδες) Έστω ένας επενδυτής με αρχικό κεφάλαιο 5000 ευρώ κι έστω ότι σκέφτεται να κάνει μια επένδυση με τα εξής χαρακτηριστικά: με πιθανότητα 1/5 έχει καθαρό κέρδος 3000 ευρώ, με πιθανότητα 2/5 έχει καθαρό κέρδος 1000 ευρώ, ενώ με πιθανότητα 2/5 χάνει 3000 ευρώ. Έστω ότι για τον συγκεκριμένο επενδυτή, ισχύει τ(x) < 0 για κάθε x. Μπορούμε μόνο με αυτή την πληροφορία να αποφασίσουμε αν θα κάνει την επένδυση, χωρίς να γνωρίζουμε τίποτα περαιτέρω για τη συνάρτηση χρησιμότητας του επενδυτή; Αν ξέραμε ότι ισχύει τ(x) > 0 για κάθε x, αλλάζει η απάντησή σας; (i) Ας ονομάσουμε τ 1, τ 2, τ 3, τ 4, τους συντελεστές αποφυγής κινδύνου των 4 συναρτήσεων αντίστοιχα. Υπολογίζοντας τις παραγώγους, παίρνουμε: 1. τ 1 (x) = 2, x [0, ), 2. τ 2 (x) = 1 x+2, 3. τ 3 (x) = 5, 4. τ 4 (x) = 2 2x+3. Οι πρώτες 2 συναρτήσεις εκφράζουν συντηρητικούς αποφασίζοντες αφού είναι θετικοί οι συντελεστές για όλες τις τιμές του x στο [0, ). Μεταξύ αυτών των 2, η πρώτη είναι η πιο συντηρητική αφού τ 2 (x) < τ 1 (x), x [0, ). Οι επόμενες 2 εκφράζουν 5
ριψοκίνδυνη συμπεριφορά, και επειδή τ 3 (x) < τ 4 (x), x [0, ), η 3η είναι η πιο ριψοκίνδυνη. Επομένως, η κατάταξη από την πιο ριψοκίνδυνη στην πιο συντηρητική είναι u 3, u 4, u 2, u 1. (ii) Το μέσο χρηματικό ποσό που προκύπτει από την συγκεκριμένη επένδυση είναι: 1 5 (5000 + 3000) + 2 5 (5000 + 1000) + 2 (5000 3000) = 4800 < 5000 5 Αν η επένδυση δεν γίνει, ο αποφασίζων έχει ένα βέβαιο ποσό των 5000 ευρώ. Όταν ξέρουμε μόνο ότι τ(x) < 0, τότε απλά ξέρουμε ότι ο αποφασίζων είναι διαθέσιμος να ρισκάρει για καποια επένδυση που μπορεί να έχει μέσο χρηματικό ποσό κάτω των 5000, δεν μπορούμε όμως να ξέρουμε πόσο ριψοκίνδυνος είναι. Επομένως δεν μπορούμε να βγάλουμε ένα συμπέρασμα για όλους τους ριψοκίνδυνους αποφασίζοντες. Αντιθέτως, όταν τ(x) > 0, έχουμε συντηρητικό αποφασίζοντα, ο οποίος σίγουρα θα προτιμήσει ένα βέβαιο ποσό των 5000 από μια επένδυση που έχει μικρότερη μέση χρηματική τιμή. Επομένως για τη συγκεκριμένη επένδυση μπορούμε να συμπεράνουμε ότι όλοι οι συντηρητικοί αποφασίζοντες θα την αρνηθούν. Πρόβλημα 5. (10 μονάδες) Ένας επενδυτής έχει αρχικό κεφάλαιο K ευρώ και σκέφτεται να επενδύσει όλο το κεφάλαιο αυτό σε μετοχές μιας εταιρείας. Κατόπιν μελέτης, αποφασίζει ότι η απόδοση των μετοχών μπορεί να μοντελοποιηθεί σαν μια συνεχή τυχαία μεταβλητή r. (i) Έστω ότι η συνάρτηση χρησιμότητας του επενδυτή είναι η u(x) = x, κι έστω ότι η απόδοση r, ακολουθεί ομοιόμορφη κατανομή στο διάστημα [α, β], για κάποιες παραμέτρους α, β. Υπολογίστε τη μέση χρησιμότητα του επενδυτή ως συνάρτηση των παραμέτρων K, α, και β. Αν α = 0.05, και β = 0.1, θα γίνει τελικά η συγκεκριμένη επένδυση; (ii) Έστω τώρα ότι η συνάρτηση χρησιμότητας του επενδυτή είναι η u(x) = x, κι έστω ότι η απόδοση r, ακολουθεί μια κατανομή στο διάστημα [α, β], με συνάρτηση πυκνότητας πιθανότητας f(r). Αν η μέση τιμή της r είναι µ = E[r], και χωρίς να γνωρίζετε τίποτα περαιτέρω για την μορφή της f, υπολογίστε τη μέση χρησιμότητα ως συνάρτηση των παραμέτρων K και µ. Σχολιάστε πώς εξαρτάται η απόφαση του επενδυτή να κάνει την επένδυση από την τιμή µ. i) Αν η απόδοση ειναι r, τοτε το τελικό ποσό είναι (1 + r)k. Επιπλέον, αφού η r είναι οποιόμορφα κατανεμημένη στο [a, b] για τη συναρτηση πυκνότητας πιθανότητας της ισχύει f(r) = 1 b a, r [a, b]. Για τη μέση χρησιμότητα έχουμε: E(u((1+r)K)) = b a u((1+r)k)f(r)dr = 1 b a b a 1 [2(1 + r) 3/2 (1 + r)kdr = K b a 3 Αντικαθιστώντας τις τιμές για τα a, b παίρνουμε μέση χρησιμότητα: E(u((1 + r)k)) = 2 ( K (1, 1) 3/2 (0, 95) 3/2) 1, 012 K, 0, 45 ] b a. 6
που είναι μεγαλύτερο από την χρησιμότητα στην περίπτωση που δεν γίνει η επένδυση αφού u(k) = K. Επομένως, θα γίνει η επένδυση. ii) Στην περίπτωση αυτή έχουμε E(u((1 + r)k)) = E((1 + r)k) = KE(1 + r) = K(1 + µ). Για να συμφέρει τον επενδυτή να κάνει την επένδυση θα πρέπει E(u((1 + r)k)) > u(k) K(1 + µ) > K µ > 0. Πρόβλημα 6. (10 μονάδες) Στη Νέα Ορλεάνη, μετά τον τυφώνα Κατρίνα, πολλες ασφαλιστικές εταιρείες προσφέρουν ποικίλα προγράμματα κάλυψης για ολική καταστροφή σπίτιού από πλημμύρα, φωτιά, κτλ. Έστω ένας υποψήφιος πελάτης, ο οποίος κατέχει ένα σπίτι αξίας W ευρώ. Υπάρχει η δυνατότητα ο πελάτης αυτός να αγοράσει ένα πρόγραμμα κάλυψης το οποίο λειτουργεί ως εξής (υποθέτουμε ότι είναι ένα πρόγραμμα με διάρκεια κάποιο συγκεκριμένο χρονικό διάστημα, π.χ. 1 έτος): Ο πελάτης αποφασίζει μέχρι ποιο ποσό θέλει να ασφαλίσει το σπίτι, π.χ., μπορεί να διαλέξει να κανει μια ασφάλεια για q ευρώ, όπου αναγκαστικά q W (θεωρούμε ότι η ασφαλιστική εταιρεία ξέρει την αντικειμενική αξία του σπιτιού και δεν δέχεται ασφάλεια αξίας μεγαλύτερης του W ). Αν ο πελάτης αγοράσει κάλυψη q ευρώ, πληρώνει στην εταιρεία x q ευρώ, οπου x < 1 (συνήθως το x είναι αρκετά μικρότερο του 1). Σε περίπτωση ολικής καταστροφής του σπιτιού εντός του χρονικού διαστήματος όπου ισχύει το πρόγραμμα, η εταιρεία δίνει στον πελάτη q ευρώ. Αν δεν συμβεί τίποτα εντός του διαστήματος αυτού, ο πελάτης απλά έχει χάσει x q ευρώ. Έστω ότι με βάση τη συχνότητα για τους τυφώνες, τα tornadoes, την πιθανή άνοδο των νερών, και όλα τα άλλα φαινόμενα που πλήττουν κατά καιρούς τη Νέα Ορλεάνη, υπάρχει πιθανότητα p το σπίτι του πελάτη να καταστραφεί ολικά, εντός του χρονικού διαστήματος που καλύπτει το πρόγραμμα. Έστω επίσης ότι η συνάρτηση χρησιμότητας του πελάτη είναι η u(x) = x. Αν W = 100, 000, p = 0.01, και x = 0.02, εξηγήστε τι ποσό κάλυψης q πρέπει να αγοράσει ο πελάτης. Κάντε την ανάλυση πρώτα παραμετρικά και αντικαταστήστε τις τιμές των παραμέτρων που δίνονται στο τέλος. Το ποσό q κάλυψης που θα αγοράσει το άτομο θα μεγιστοποιήσει την αναμενόμενη χρησιμότητα p u(q xq) + (1 p) u(w xq) = p q xq + (1 p) W xq. Η σχέση αυτή αιτιολογείται ως εξής: Αν το σπίτι καταστραφεί, ο ιδιοκτήτης θα λάβει το ποσό q της κάλυψης μείον το ποσό xq που πλήρωσε για να την αγοράσει, σύνολο q xq (το σπίτι έχει πλέον χαθεί). Αφού η πιθανότητα καταστροφής του σπιτιού είναι p, συνεπάγεται ότι η αναμενόμενη χρησιμότητα από την καταστροφή του σπιτιού είναι p u(q xq). Από την άλλη, το σπίτι δεν θα καταστραφεί με πιθανότητα (1 p), οπότε σε αυτή την περίπτωση η αξία του είναι W xq και επομένως η αναμενόμενη χρησιμότητα είναι (1 p) u(w xq). 7
Θέλουμε να προσδιορίσουμε το ποσό q που μεγιστοποιεί την αναμενόμενη χρησιμότητα, οπότε θεωρούμε τη συνάρτηση f(q) = p q xq + (1 p) W xq ορισμένη στο [0, W ]. Έχουμε f (q) = p 1 x 2 p Λύνοντας την f (q ) = 0 βρίσκουμε ότι x(1 p) 2 W xq. q = W p2 (1 x) x(p 2 + x 2px). Είναι εύκολο να ελέγξει κανείς ότι το πρόσημο της f αλλάζει από θετικό σε αρνητικό στο q και άρα εκεί μεγιστοποιείται η f εφόσον q [0, W ]. Αν q / [0, W ] τότε η f μεγιστοποιείται στο 0 ή στο W. Εδώ, κάνουμε την αντικατάσταση των παραμέτρων και έχουμε q = 24.873, 1. Επομένως, ο πελάτης πρέπει να αγοράσει ποσό κάλυψης 24.873, 1 ευρώ. 8