ΜΕΘΟΔΟΙ ΛΗΨΗΣ ΑΠΟΦΑΣΕΩΝ ΜΕ ΑΓΝΩΣΤΕΣ ΠΙΘΑΝΟΤΗΤΕΣ ΕΚΒΑΣΗΣ ΤΩΝ ΔΙΑΦΟΡΩΝ ΕΝΔΕΧΟΜΕΝΩΝ ΤΟ ΠΡΟΒΛΗΜΑ ΤΟΥ ΕΦΗΜΕΡΙΔΟΠΩΛΗ Ένα μικρό μαγαζί πωλεί μια εφημερίδα. Πληρώνει 30 χ.μ. ανά φύλλο για να τα προμηθευτεί, ενώ τα πωλεί προς 40 χ.μ. ανά φύλλο. Αν Τότε d i = παραγγελθέντα φύλλα i θ j = πωληθέντα φύλλα j (ΕΣΟΔΑ ΕΞΟΔΑ) = u ij = 40*θ j 30*d i, αν i j 40* d i 30*d i = 10*d i, αν i j ΚΑΤΑΣΚΕΥΑΖΟΥΜΕ ΤΟΝ ΠΙΝΑΚΑ ΑΠΟΠΛΗΡΩΜΩΝ (PAYOFF MATRIX) Έστω 16 {d, θ} 24
d i / θ j 16 17 18 19 20 21 22 23 24 16 160 160 160 160 160 160 160 160 160 17 130 170 170 170 170 170 170 170 170 18 100 140 180 180 180 180 180 180 180 19 70 110 150 190 190 190 190 190 190 20 40 80 120 160 200 200 200 200 200 21 10 50 90 130 170 210 210 210 210 22-20 20 60 100 140 180 220 220 220 23-50 -10 30 70 110 150 190 230 230 24-80 -40 0 40 80 120 160 200 240 Μέγιστη Αποπληρωμή: Παραγγέλλει: 24, Πωλεί: 24 d=24 και θ=16 u = 40*u j - 30*d i = 40*16 30*24 = 640-720= -80 u = -80 ΚΙΝΔΥΝΟΣ ΜΙΚΡΟΤΕΡΗΣ ΑΠΟΠΛΗΡΩΜΗΣ d=16 και θ=16 u = 10*d i = 16*10 = 160 u = 160 ΠΟΛΥ ΜΙΚΡΟΤΕΡΟΣ ΚΙΝΔΥΝΟΣ ΓΙΑ d=16 ΑΠΟ ΟΤΙ ΓΙΑ d=24
ΘΕΩΡΗΤΙΚΟ ΕΛΑΧΙΣΤΟ: 1 ΘΕΩΡΗΤΙΚΟ ΜΕΓΙΣΤΟ: Χωρητικότητα του μαγαζιού (Οι αριθμοί 16 και 24 είναι αυθαίρετη επιλογή) ΚΡΙΤΗΡΙΑ ΛΗΨΗΣ ΑΠΟΦΑΣΗΣ ΥΠΟ ΑΒΕΒΑΙΟΤΗΤΑ (α) ΜΑΧΜΙΝ (συναντάται και ως Wald criterion) - Αντιριψοκίνδυνο κριτήριο (συντηρητικό) - Για κάθε απόφαση d i βρίσκουμε το χειρότερο αποτέλεσμα u ij * - Επιλέγουμε την απόφαση i που μας δίνει το μέγιστο από τα χειρότερα u ij * ------------------- - Abraham Wald (Hungarian: Wald Ábrahám, October 31, 1902 December 13, 1950) was a mathematician born in Cluj, in the then Austria Hungary (present-day Romania) who contributed to decision theory, geometry, and econometrics, and founded the field of statistical sequential analysis. [1] He spent his researching years at Columbia University. - Από Ρουμανο-Εβραϊκή οικογένεια, δεν πήγαινε σχολείο το Σάββατο κι έτσι δέχτηκε κατ οίκον βασική μόρφωση. Αργότερα αναγνωρίστηκαν οι ικανότητές του και φοίτησε στην Βιέννη. Πέθανε ξαφνικά σε αεροπορικό δυστύχημα στις Ινδίες. Μετά το θάνατό του δέχτηκε «επίθεση» για τον τρόπο σχεδίασης των πειραμάτων του και την επιστημονικότητα των προσεγγίσεών του, από τον επίσης μεγάλο στατιστικό Fisher, ωστόσο τις ιδέες του υπερασπίστηκε η υπόλοιπη επιστημονική κοινότητα και ιδιαίτερα ο Neymann (Jerzy Spława-Neyman, Polish mathematician and statistician - the first to introduce confidence interval into statistical hypothesis testing)
Π.Χ. ΜΑΧΜΙΝ του εφημεριδοπώλη d 16 = 160 d 17 = 130 d 18 = 100 d 19 = 70 d 20 = 40 max {160, 130,., -50, -80} = d 21 = 10 = 160 d 16 d 22 = -20 (η πιο συντηρητική απόφαση) d 23 = -50 d 24 = -80
(β) ΜΑΧΙΜΑΧ - Ριψοκίνδυνο κριτήριο (ενδιαφερόμαστε μόνο για το καλύτερο που μπορεί να μας συμβεί) - Για κάθε απόφαση βρίσκουμε το καλύτερο αποτέλεσμα u ij * - Επιλέγουμε την απόφαση με τη μέγιστη u ij * - Μεγιστοποιείται έτσι η μέγιστη αποπληρωμή
Π.Χ. ΜΑΧΙΜΑΧ του εφημεριδοπώλη d 16 = 160 d 17 = 170 d 18 = 180 d 19 = 190 d 20 = 200 max {160, 170,, 230, 240} = d 21 = 210 = 240 d 24 d 22 = 220 (η πιο ριψοκίνδυνη απόφαση) d 23 = 230 d 24 = 240
(γ) Κριτήριο Hurwicz -ΜΑΧΜΙΝ vs MAXIMAX είναι εκ διαμέτρου αντίθετα Hurwicz: εξισορρόπηση των δύο τάσεων με χρήση ενός δείκτη αισιοδοξίας α 0 α 1 Για κάθε απόφαση d i, υπολογίζεται η τιμή Hurwicz από τη σχέση Η(i) = α * max j { u ij } + (1-α) * min j { u ij } Επιλέγεται η απόφαση που μεγιστοποιεί το Η(i) ------------------ ** Leonid Hurwicz: Γεννημένος στη Μόσχα (1917), πολωνός πολίτης με εβραϊκές ρίζες, Νομπελίστας το 2008 σε ηλικία 90 ετών (Emeritus Prof. University of Minessota, USA), λίγους μήνες πριν το θάνατό του. Νόμπελ για τη συμβολή του στη θεωρία μηχανισμών. Εκ των θεμελιωτών της θεωρίας παιγνίων και των εφαρμογών της. Hurwicz tackled a problem that the field of economics didn t traditionally consider: When markets don t allocate resources efficiently, or at all, what sort of allocation mechanisms can be created that will do so?
Βασική Ενέργεια: Η σωστή επιλογή / ρύθμιση του δείκτη αισιοδοξίας α, από τον λήπτη απόφασης α = 0 maxmin κριτήριο (απαισιοδοξία) α = 1 maximax κριτήριο (αισιοδοξία) π.χ. παράδειγμα εφημεριδοπώλη για Hurwicz με α = 0.5 Η(16) = 0.5 * max {160,, 160} + (1-0.5) * min {160,, 160} Η(17) = 0.5 * max {130,, 170} + (1-0.5) * min {130,, 170}........................ Η(24) = 0.5 * max {-80,..., 240} + (1-0.5) * min {-80,..., 240}
H(16) = 80 + 80 = 160 H(17) = 85 + 65 = 150 H(18) = 50 + 90 = 140 H(19) = 35 + 95 = 130 H(20) = 20 +100= 120 max{160, 150,, 80} = 160........... (Άρα για α=0.5 επιλέγουμε d=16) H(24) = 80 Για α ϵ [0.5, 1] κινούμαστε προς αισιοδοξία Για α ϵ [0, 0.5] κινούμαστε προς απαισιοδοξία
δ) ΜΙΝ-ΜΑΧ ΔΙΑΦΥΓΟΝΤΟΣ ΚΕΡΔΟΥΣ Κριτήριο Savage (Min-Max Regret): Ελαχιστοποίηση του διαφυγόντος κέρδους - Βήματα εκτίμησης βέλτιστης απόφασης κατά Savage: - 1) Για κάθε απόφαση d i και ενδεχόμενο θ j υπολογίζουμε τη διαφορά της αποπληρωμής u ij του πίνακα αποπληρωμής (payoff matrix) με την αποπληρωμή u ij* που θα είχαμε αν παίρναμε τη βέλτιστη απόφαση για το θ j. Τοποθετούμε τις διαφορές αυτές r ij σε νέο πίνακα (πίνακας διαφυγόντος κέρδους ή opportunity loss table) r ij = u ij max {u ij* } ---------------------- Leonard Jimmie Savage, Statistician (born 1917): the sure-thing principle (1954), contribution to Brownian motion & mathematical finance
2) Για κάθε κατάσταση θ του αρχ. πίνακα αποπληρωμών (πιθανό ενδεχόμενο - δηλ. στήλη ή state of nature) βρίσκουμε αρχικά το μέγιστο και το αφαιρούμε κατ απόλυτο τιμή - από όλα τα άλλα στοιχεία της στήλης. Στον πίνακα διαφυγόντος κέρδους (regret) που προκύπτει, σημειώνουμε το μέγιστο r ij* κάθε απόφασης (δηλαδή το max ανά γραμμή) και στη συνέχεια επιλέγουμε την απόφαση που ελαχιστοποιεί τα r ij* δηλαδή τo min των max). d\θ 16 17 18 19 20 21 22 23 24 16 0 10 20 30 40 50 60 70 80 17 30 0 10 20 30 40 50 60 70 18 60 30 0 10 20 30 40 50 60 19 90 60 30 0 10 20 30 40 50 20 120 90 60 30 0 10 20 30 40 21 150 120 90 60 30 0 10 20 30 22 180 150 120 90 60 30 0 10 20 23 210 180 150 120 90 60 30 0 10 24 240 210 180 150 120 90 60 30 0 ( επιλέγουμε το min των max r ij * )
Για d = 16 r ij * = 80 d = 17 r ij * = 70 d = 18 r ij * = 60 το μικρότερο διαφυγόν κέρδος βέλτιστη είναι η d = 18 - Ιδιαίτερα ελκυστικό κριτήριο (π.χ. εκ των υστέρων βράβευση υπαλλήλων εταιρειών) ε) Κριτήριο LAPLACE - Θεωρούμε όλα τα ενδεχόμενα ισοπίθανα να συμβούν εφόσον αγνοούμε την πιθανότητά τους - Επιλέγουμε την απόφαση που μεγιστοποιεί την προσδοκώμενη αποπληρωμή: d i = max i Σ j u i ---------------- Ο Πιέρ Σιμόν Λαπλάς (Pierre-Simon Laplace, 23 Μαρτίου 1749-5 Μαρτίου 1827) ήταν Γάλλος μαθηματικός, αστρονόμος και φιλόσοφος. Οι μελέτες του πάνω στη μηχανική του αστρονομικού συστήματος έδωσαν τεράστια ώθηση στην έρευνα του διαστήματος. Εκπόνησε σημαντικό έργο και στον διαφορικό λογισμό.
L (d 16 ) = (1/9) * Σ 9 {u 16 } = (1/9)*(9*160)=160 L (d 17 ) = (1/9) * Σ 9 {u 17 } = (1/9)*(130+8*170)=166 L (d 18 ) = (1/9) * Σ 9 {u 18 } = (1/9)*(100+140+7*180)=176 L (d 19 ) = (1/9) * Σ 9 {u 19 } = (1/9)*(70+110+150+6*190)=174........................... max {d 16, d 17,. d 24 } = 176 ΕΠΙΛΕΓΕΤΑΙ Η d=18
ΠΑΡΑΤΗΡΗΣΕΙΣ: Πολλά Κριτήρια Πρόβλημα επιλογής κριτηρίου ΒΕΛΤΙΣΤΟ ΚΡΙΤΗΡΙΟ Βασικές αρχές ορθολογισμού - Δεν υπάρχουν σαφείς αρχές ανάλυσης του τρόπου επιλογής κριτηρίου βάσει ορθολογισμού - Υπάρχουν αναγκαίες αρχές (π.χ. αντιστοιχία: κάθε πίστη σε ένα γεγονός οφείλει να αντιστοιχεί σε αδιάσειστα γεγονότα) (π.χ. συνοχή: η πίστη σε ένα γεγονός πρέπει να εμφανίζει συνεκτική μορφή)
Παράδειγμα Μια επιχείρηση θέλει να αποφασίσει το μέγεθος του εργοστασίου που θα ανεγείρει για την παραγωγή ενός νέου προϊόντος. Έχουμε 3 επιλογές: d 1 : μικρό εργοστάσιο d 2 : σχετικά μεγάλο d 3 : πολύ μεγάλο ΠΙΝΑΚΑΣ ΑΠΟΠΛΗΡΩΜΗΣ θ1 θ2 θ3 d 1 50-8 0 d 2-10 64 12 d 3-15 12 66
ΜΙΝΜΑΧ χειρότερο κάθε γραμμής {-8, -10, -15}, καλύτερο των χειρότερων {-8} d 1 ΜΑΧΙΜΑΧ καλύτερο κάθε γραμμής {50, 64, 66}, καλύτερο των καλύτερων {66} d 3 HURWICZ (α=0.3) Η1 = α*max + (1-a)* min = (0.3)*50 + (0.7)*(-8)=9.4 H2 = 0.3*64 + 0.7*(-10) = 12.2 H3 = 0.3*66 + 0.7*(-15) = 9.3 άρα max {H1, H2, H3} =12.2 d 2 Αρχικός Πίνακας Αποπληρωμής θ1 θ2 θ3 max κάθε στήλης Πίν. Διαφ. Κέρδ.(αφαιρ. Max στήλης) d 1 50-8 0 {50} 0 72 66 d 2-10 64 12 {64} 60 0 54 d 3-15 12 66 {66} 65 52 0 Στον πίνακα διαφυγόντος κέρδους παίρνω το max κάθε γραμμής {72, 60, 65} και μετά επιλέγω το min των max 60 άρα d 2 L1 = (1/3)*(50)+(1/3)*(-8)+(1/3)*(0)=42/3=14 L2 = (1/3)*(-10)+(1/3)*(64)+(1/3)*(12)=66/3=22 L3 = (1/3)*(-15)+(1/3)*(12)+(1/3)*(66)=63/3=21 max {L1, L2, L3} = 22 άρα d 2