Πιθανολογική Ανάλυση Αποφάσεων
Αβεβαιότητα Known knowns Ποσοτικοποιήσιμη Πιθανότητα Known unknowns Εκτίμηση ενδεχομένου Unknown unknowns Αρνητική επίδραση Ρίσκο
Black Swan
Πιθανολογική Προσέγγιση Θεωρούμε θ R τυχαία μεταβλητή. Φυσική ποσότητα που αντανακλά την αβεβαιότητα. Το μοντέλο απόφασης τίθεται σε πιθανοτικούς όρους. Οι σχετικές πιθανότητες είναι γνωστές ή μπορούν να εκτιμηθούν.
Πιθανολογική Προσέγγιση Η μεταβλητή θ χαρακτηρίζει το μοντέλο απόφασης και περιγράφεται από μια εκ των προτέρων (a priori) κατανομή πιθανότητας: p Θ (θ) Η a priori πιθανότητα αντανακλά τη γνώση μας σχετικά με το πόσο πιθανή αναμένουμε να είναι μια μελλοντική κατάσταση. Π.χ., αν γνωρίζουμε από προηγούμενα πειράματα μια περιοχή πιθανών τιμών μιας ποσότητας, μπορούμε να εκφράσουμε τη γνώση αυτή χρησιμοποιώντας εκ των προτέρων κατανομή η οποία συγκεντρώνεται πάνω στην περιοχή αυτή.
Παράδειγμα Διαδικασία κατηγοριοποίησης ειδών. Η μεταβλητή θ εκφράζει την μελλοντική κατάσταση: θ= θ 1, για είδος 1, θ = θ 2, για είδος 2.
Παράδειγμα Στο παρόν παράδειγμα, η a priori πιθανότητα εκφράζει την πιθανότητα να δούμε το ένα ή το άλλο είδος στον ιμάντα μεταφοράς. Η a priori πιθανότητα μπορεί να διαφοροποιείται: Αν δούμε ίσο αριθμό των ειδών σε δεδομένο χρόνο, τότε οι a priori πιθανότητες είναι ίσες. Ανάλογα με την εποχή, μπορεί να δούμε περισσότερα από το ένα είδος. Οι καταστάσεις είναι αμοιβαία αποκλειόμενες και c 1 = i=1 P(θ i )
Παρατηρήσεις Θέλουμε να αποσπάσουμε πληροφορία για την θ, βασισμένοι στην παρατήρηση μιας συλλογής X = (X 1,, X d ) σχετιζόμενων τυχαίων μεταβλητών (παρατηρήσεις). Αν κάνουμε χρήση των δεδομένων x που παρατηρούνται, μπορούμε να υπολογίσουμε μια εκ των υστέρων κατανομή πιθανότητας p Θ X (θ x) Αυτή εμπεριέχει όλη την πληροφορία που το x παρέχει για το θ. Π.χ., στο παράδειγμα: μήκος, πλάτος, φωτεινότητα, θέση πτερυγίου, κλπ.
Υπό Συνθήκη Πιθανότητα Η υπό συνθήκη πυκνότητα πιθανότητας εκφράζει την πυκνότητα πιθανότητας του χαρακτηριστικού x, δεδομένης της κατάστασης θ: p(x θ) p(x θ i ) p(x θ 1 ) p(x θ 2 ) x
A Posteriori Πιθανότητα Εάν γνωρίζουμε την a priori και την υπό συνθήκη πυκνότητα; Εκ των υστέρων (a posteriori) πιθανότητα: εκφράζει την πιθανότητα μιας κατάστασης, δεδομένων των παρατηρήσεων: P θ x. Τύπος Bayes: p ΘΧ θ, x = p Θ X θ x p X x = p X θ (x θ)p Θ (θ) p Θ X θ x = p X Θ x θ p Θ (θ) p X (x) = p X θ x θ p Θ (θ) p X θ x θ p θ (θ )
Μπεϋζιανή Προσέγγιση Υποθέτουμε ότι γνωρίζουμε: Μια a priori κατανομή p Θ ή f Θ, ανάλογα αν η Θ είναι διακριτή ή συνεχής. Μια δεσμευμένη κατανομή p X Θ ή f X Θ, ανάλογα αν η Θ είναι διακριτή ή συνεχής. A priori p Θ Διαδικασία Παρατήρησης x A posteriori υπολογισμός Απόφαση Δεσμευμένη p X Θ
Μοντέλο Απόφασης Θεωρούμε: Το διακριτό σύνολο των καταστάσεων Θ = θ 1,, θ m την αβέβαιη παράμετρο θ. για Ένα σύνολο A = a 1,, a n πιθανών δράσεων - εναλλακτικών. Μια συνάρτηση απώλειας (loss function) λ a i, θ j : Α Θ R
Μοντέλο Απόφασης Υποθέτουμε ότι έχουμε στη διάθεσή μας το αποτέλεσμα ενός πειράματος X R d που σχετίζεται με την άγνωστη παράμετρο. Ορισμός. Η τριάδα (Θ,Α,λ(θ,α)), εφοδιασμένη με την τυχαία μεταβλητή Χ (παρατηρήσεις), ορίζουν ένα Στατιστικό Πρόβλημα Απόφασης. Παρατηρώντας Χ=x, ποια είναι η ενδεδειγμένη απόφαση;
Μοντέλο Απόφασης Έστω X R d ο δειγματικός χώρος όλων των πιθανών αποτελεσμάτων του πειράματος. Ορίζουμε ως κανόνα απόφασης τον τελεστή d: X A; d x = α A, Υποδεικνύει τον τρόπο δράσης, παρατηρώντας X=x από το πείραμα. Θέλουμε να καθορίσουμε τη στρατηγική που οδηγεί στο μικρότερο κόστος. Η απόφαση έχει αιτιοκρατική σχέση με τα δεδομένα του πειράματος.
Κίνδυνος Ορισμός. Έστω ένας κανόνας απόφασης d και μια a priori κατανομή p Θ (θ). Ορίζουμε ως εκ των υστέρων κίνδυνο (a posteriori risk) τη συνάρτηση R d x = j=1 Όμοια, για το συνεχές πρόβλημα: m λ d(x), θ j P( θ j x) R d x = λ d x, θ p θ x dθ
Κίνδυνος Παρατηρούμε ότι: R d x = E Θ Χ [λ d x, θ ] Αξιολόγηση διαφορετικών αποφάσεων. Παρατηρώντας X=x, η απόφαση d 1 (x) προτιμάται έναντι της d 2 (x), εάν R(d 1 x ) R(d 2 x )
Στρατηγική Μπεϋζιανή Προσέγγιση 1. Αναγνώριση Μορφοποίηση στατιστικού προβλήματος απόφασης. 2. Αρχίζουμε με μια εκ των προτέρων κατανομή p Θ ή f Θ για την αβέβαιη τυχαία μεταβλητή παράμετρο εισόδου Θ. 3. Έχουμε ένα μοντέλο p X Θ ή f X Θ του διανύσματος παρατήρησης Χ. 4. Αφού παρατηρήσουμε την τιμή x της X, δημιουργούμε την εκ των υστέρων κατανομή της Θ, χρησιμοποιώντας την κατάλληλη παραλλαγή του κανόνα του Bayes. 5. Αξιολογούμε τις αποφάσεις με βάση τον a posteriori κίνδυνο.
Παράδειγμα Το κέντρο ελέγχου νοσημάτων σχεδιάζει τον εμβολιασμό έναντι μιας μεταλλαγμένης μορφής του ιού της γρίπης τύπου Α. Πρόσφατες έρευνες έδειξαν ότι το 35% του πληθυσμού βρίσκεται σε κίνδυνο. Η ανίχνευση του πόσο ευάλωτος είναι κάποιος έναντι του ιού δημιουργεί απαγορευτικό κόστος για να εφαρμοστεί σε ολόκληρο τον πληθυσμό. Για τον λόγο αυτό, αναπτύχθηκε ένα απλό δερματικό τεστ, το οποίο όμως δεν είναι εντελώς αξιόπιστο.
Παράδειγμα Αποτελέσματα τεστ Ήπια Αντίδραση Οξεία Αντίδραση Ανοσία 0.69 0.31 Μη ανοσία 0.26 0.74 (Πιθανότητες) Κόστος Μη εμβολιασμός ευάλωτου ατόμου: 210 χ.μ. Εμβολιασμός ατόμου που δεν το χρειάζεται: 90 χ.μ.
Παράδειγμα Στατιστικό Πρόβλημα Απόφασης Μορφοποίηση Παραμετρικός χώρος: Θ = θ 1, θ 2 θ 1 εκφράζει την περίπτωση ανοσίας, θ 2 εκφράζει την έλλειψη ανοσίας. A priori πιθανότητες: p θ 1 = 0.65 και p θ 2 = 0.35 Δράσεις: A = α 1, α 2 α 1 =εμβολιάζω, α 2 =δεν εμβολιάζω
Παράδειγμα Μορφοποίηση Συνάρτηση κόστους: λ(α,θ) α 1 α 2 θ 1 90 0 θ 2 0 210
Παράδειγμα Μορφοποίηση Αποτελέσματα Πειράματος X= x 1, x 2 x 1 : περίπτωση ήπιας αντίδρασης, x 2 : περίπτωση οξείας αντίδρασης. p(x θ) x 1 x 2 θ 1 0.69 0.31 θ 2 0.26 0.74 (δεσμευμένη πιθανότητα)
Παράδειγμα Μορφοποίηση Κανόνες Απόφασης Σύνολο δυνατών αποφάσεων: D = d 1, d 2, d 3, d 4, Κανόνας Απόφασης Παρατήρηση x 1 x 2 d:x A Ερμηνεία d 1 α 1 α 1 Αγνοούμε το τεστ εμβολιασμός όλων d 2 α 1 α 2 Εμβολιασμός ήπιας αντίδρασης d 3 α 2 α 1 Εμβολιασμός οξείας αντίδρασης d 4 α 2 α 2 Αγνοούμε το τεστ κανένας εμβολιασμός (Δράσεις)
Παράδειγμα Υπολογισμός a posteriori πιθανοτήτων. Τύπος Bayes: p x 1 θ 1 p(θ 1 ) p θ 1 x 1 = p x 1 θ 1 p θ 1 + p x 1 θ 2 p(θ 2 ) (0.69)(0.65) = 0.69 0.65 + (0.26)(0.35) = 0.82 Όμοια: p(θ x) θ 1 θ 2 x 1 0.82 0.18 x 2 0.46 0.54
Παράδειγμα A posteriori κίνδυνος της απόφασης d 1 : και R d 1 x 1 = 2 j=1 λ d 1 x 1, θ j p(θ j x 1 ) = λ d 1 x 1, θ 1 p θ 1 x 1 + λ d 1 x 1, θ 2 p θ 2 x 1 = λ α 1, θ 1 p θ 1 x 1 + λ α 1, θ 2 p θ 2 x 1 = 90 0.82 + 0 0.18 = 73.8 R d 1 x 2 = 2 j=1 λ d 1 x 2, θ j p(θ j x 2 ) = λ α 1, θ 1 p θ 1 x 2 + λ α 1, θ 2 p θ 2 x 2 = 90 0.46 + 0 0.54 = 41.4
Παράδειγμα Όμοια για τις d 2, d 3, d 4. Συνοψίζοντας: R(d(x)) d 1 d 2 d 3 d 4 x = x 1 73.8 73.8 37.8 37.8 x = x 2 41.4 113.4 41.4 113.4 (a posteriori κίνδυνος/απόφαση) Παρατήρηση: η απόφαση d 3 είναι η λιγότερο επικίνδυνη.
Ολικός Κίνδυνος A posteriori risk matrix Απόφαση Παρατηρήσεις x 1 x n d 1 R(d 1 x 1 ) R(d 1 x n ) d m R(d m x 1 ) R(d m x n ) Συνάρτηση μάζας πιθανότητας της τ.μ. X: P X = x j = p j, j = 1,, n d = arg min i ER i = arg min i m j=1 p j R(d i x j )
Ολικός Κίνδυνος «Συνεχές Πρόβλημα» Έστω ότι η τ.μ. X ακολουθεί κατανομή με συνεχή συνάρτηση πυκνότητας πιθανότητας f X x. Με ανάλογο τρόπο, ο ολικός κίνδυνος ορίζεται ως εξής: ER d = R d x f X x dx Άριστη απόφαση: d = arg min d ER(d)
Χαρακτηριστικά Οι αβέβαιες ποσότητες αντιμετωπίζονται ως τυχαίες μεταβλητές. Χρησιμοποιούνται κατανομές πιθανότητας για να περιγράψουν την κατάσταση της γνώσης μας, πριν παρατηρήσουμε δεδομένα. Εξάγονται συμπεράσματα για τις αβέβαιες ποσότητες στη βάση του κανόνα του Bayes. Αξιοποίηση των παρατηρηθέντων δεδομένων για τον επανακαθορισμό των αρχικών κατανομών. Η Μπεϋζιανή προσέγγιση παρέχει έναν φυσικό τρόπο να επαναπροσδιορίσουμε τις εκ των προτέρων απόψεις μας με βάση νέα δεδομένα.
Χαρακτηριστικά Η εκ των προτέρων κατανομή αποτελεί σημείο προβληματισμού (προέλευση, επίδραση). Άτομα με διαφορετικές εκ των προτέρων πιθανότητες ενδεχομένως να οδηγηθούν σε διαφορετικά συμπεράσματα. Συμβαίνει στην καθημερινή ζωή, άτομα με διαφορετική πληροφόρηση να οδηγούνται σε διαφορετικές αποφάσεις. Η εκ των προτέρων κατανομή είναι μια ειλικρινής αποτίμηση των εκ των προτέρων απόψεών μας σχετικά με τις παραμέτρους του μοντέλου. Παρότι υπάρχει διστακτικότητα να δοθούν τέτοιες υποκειμενικές κατανομές, πολλές φορές συμβαίνει ότι τέτοιες εκ των προτέρων πληροφορίες είναι διαθέσιμες.
Βιβλιογραφία Δελλαπόρτας Π., Τσιαμυρτζής Π., Στατιστική κατά Bayes. Μπερτσέκας Δ., Τσιτσικλής Γ., Εισαγωγή στις Πιθανότητες με Στοιχεία Στατιστικής. Berger J., Statistical Decision Theory and Bayesian Analysis. Lee P., Bayesian Statistics: An Introduction. Congdon, Bayesian Statistical Modelling.
Αυτοί οι άνθρωποι αντιμετωπίζουν κίνδυνο Πόσο μεγάλος είναι αυτός ο κίνδυνος;
Piper Alpha, 6 Ιουλίου 1988, 167 θάνατοι
«Συχνοτική» Πιθανότητα Πιθανότητα Αριθμός Θανάτων
Οπτική Ρίσκου Πιθανολογική με βάση τα ιστορικά στοιχεία Χ Αντίληψη
Οπτική Ρίσκου Ο Kahneman υποστηρίζει ότι έχουμε μία δυσκολία στην εκτίμηση των ρίσκων: Είτε τα αγνοούμε εντελώς/ παραβλέπουμε είτε τους δίνουμε πολύ μεγάλη βαρύτητα Kahneman s book «Thinking fast and slow»
Οπτική Ρίσκου Υπήρχαν συνολικά 23 βομβαρδισμοί μεταξύ του Δεκεμβρίου 2001 και του Σεπτεμβρίου 2004, σε μέσα μαζικής μεταφοράς, που οδήγησαν σε 236 θανάτους. Ο αριθμός των χρηστών λεωφορείων ημερησίως ήταν περίπου 1.3 εκατ. εκείνη την περίοδο. Για κάθε επιβαίνοντα το ρίσκο ήταν πολύ μικρό. Αλλά δεν ήταν ίδια η αντίληψή τους. Οι ταξιδιώτες απέφευγαν με κάθε τρόπο την χρήση μέσων μαζικής μεταφοράς.
Το ρίσκο είναι πολύ περισσότερο από αξίες και πιθανότητες