ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ Γνωριµία και ερµηνεία των πιθανοτήτων Χρήση σε πρακτικά προβλήµατα και σε θέµατα στατιστικής συµπερασµατολογίας. Προσθετικός και πολλαπλασιαστικός κανόνας των πιθανοτήτων Έννοια της δεσµευµένης πιθανότητας, του σχετικού κινδύνου και των ανεξαρτήτων ενδεχοµένων Εκτέλεση βασικών πράξεων που περιέχουν πιθανότητες Προβλήµατα διαδικασίας λήψης αποφάσεων εφαρµόζοντας τον κανόνα του Bayes
ΟΡΙΣΜΟΣ ΠΙΘΑΝΟΤΗΤΑΣ Ορισµός: Η πιθανότητα µιας έκβασης ενός τυχαίου πειράµατος είναι το ποσοστό των φορών στις οποίες θα συνέβαινε η έκβαση αυτή σε µια µακρά σειρά ταυτοτικών επαναλήψεων του πειράµατος. Παραδείγµατα: α) Ζάρι β) Νόµισµα N A lim p( A) n N Πολλά βιολογικά πειράµατα µπορούν να θεωρηθούν ως τυχαία πειράµατα. Π.χ. Αριθµός γεννήσεων αγοριών στην Ελλάδα, καρκίνος του µαστού στις Ελληνίδες κλπ.
ΑΝΑΠΑΡΑΣΤΑΣΗ ΣΥΝΟΛΩΝ Παράδειγµα 2.3. Τυχαίο πείραµα: στρίβουµε ένα νόµισµα τρεις φορές. Υπάρχουν οκτώ εκβάσεις που αποτελούν τον δειγµατικόχώροτουπειράµατος, Ω = {ΚΚΚ, ΚΚΓ, ΚΓΚ, ΚΓΓ, ΓΚΚ, ΓΚΓ, ΓΓΚ, ΓΓΓ}, όπου το Κ δηλώνει κεφάλι και το Γ γράµµατα. Ας δούµε τώραµερικά ενδεχόµενα: = {ΚΚΚ, ΚΚΓ, ΓΚΚ, ΓΚΓ}, Ε = {ΚΚΓ, ΚΓΓ, ΓΚΓ, ΓΓΓ}, Ζ = {ΚΚΚ, ΚΚΓ, ΚΓΚ, ΚΓΓ, ΓΚΚ, ΓΚΓ, ΓΓΚ}, Η = {ΓΓΓ}, Θ = {ΚΚΚ, ΚΚΓ, ΚΓΚ, ΚΓΓ, ΓΚΚ, ΓΚΓ, ΓΓΚ, ΓΓΓ}, και Ι ={} Ε. ΚΚΚ. ΓΚΓ.... ΓΚΚ. ΚΚΓ... ΚΓΓ. ΓΓΓ Η
ΟΡΙΣΜΟΙ ειγµατικός χώρος πειράµατος. Τοσύνολοόλωντωνεκβάσεωνενός τυχαίου πειράµατος. Συµβολίζεται µε Ω. Ενδεχόµενο είναι ένα σύνολο εκβάσεων. Συµβολίζονται µε κεφαλαία γράµµατα, A, B, Γ κλπ. Στοιχειώδες ενδεχόµενο. Ενδεχόµενο που αποτελείται από τo µικρότερο δυνατό αποτέλεσµα. Αδύνατο ενδεχόµενο. Ενδεχόµενο που δεν θα γίνει ποτέ. Π.χ σε ένα ζάρι να έρθει το 7. Βέβαιο ενδεχόµενο. Ενδεχόµενο που ταυτίζεται µε τον δειγµατικό χώρο. Συµπληρωµατικό (ενδεχόµενο) ενός ενδεχοµένου A ορίζεται το ενδεχόµενο που έχει όλες τις εκβάσεις του δειγµατικού χώρου Ω που δεν ανήκουν στο A. Συµβολίζεται µε A c Ένωση δύο ενδεχοµένων: A B Τοµή δύο ενδεχοµένων: Ασυµβίβαστα ενδεχόµενα: A B A B = Ø
ΚΑΝΟΝΕΣ ΠΙΘΑΝΟΤΗΤΩΝ 1) Οι πιθανότητες είναι αριθµοί µεταξύ 0 και 1. 2) Η πιθανότητα του Ω είναι ίση µε 1, δηλ. P(Ω) = 1. 3) Αν A B = Ø τότε P(A B) = P(A) + P(B). 4) Ηπιθανότηταενόςενδεχοµένου βρίσκεται προσθέτοντας τις πιθανότητες των εκβάσεων του. 5) Όλες οι εκβάσεις µαζί έχουν πιθανότητα ίση προς 1. 6) Ηπιθανότηταναµη συµβεί ένα ενδεχόµενο Α, P(A c ), είναι ίση προς 1 µείον την πιθανότητα του να συµβεί, δηλαδή P(A c ) = 1-P(A). 7) P(Ø) = 0. 8) Ο προσθετικός νόµος των πιθανοτήτων: Αν τα A και B είναι δύο ενδεχόµενα, τότε P(A B) = P(A) + P(B) - P(A B).
Παράδειγµα 2.2. Ο παρακάτω 2x2 πίνακας δείχνει την διασταυρωτή ταξινόµηση 10000 ανδρών ηλικίας 35-75 ετών σύµφωνα µε παχυσαρκία και υπέρταση. ΑΝ ΡΙΚΟΣ ΠΛΗΘΥΣΜΟΣ Υπερτασικοί Μη υπερτασικοί Σύνολο Παχύσαρκοι 1500 1500 3000 Μη παχύσαρκοι 500 6500 7000 Σύνολο 2000 8000 10000
Συµβολισµός: ΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ PAB ( ) = P( A B) PB ( ) Πιθανότητα να συµβεί το ενδεχόµενο Α µε δεδοµένο ότι συµβαίνει το ενδεχόµενο Β ΑΝΕΞΑΡΤΗΤΑ ΕΝ ΕΧΟΜΕΝΑ Αν P(A B)=P(A) ή P(B A)=P(B) ή P(A Β)= P(A) P(B) τότε τα δύο ενδεχόµενα ονοµάζονται ανεξάρτητα Η πιθανότητα να συµβεί το ενδεχόµενο Α δεν εξαρτάται από το να συµβεί το ενδεχόµενο Β ΣΧΕΤΙΚΟΣ ΚΙΝ ΥΝΟΣ (RELATIVE RISK) Ο σχετικός κίνδυνος είναι λόγος δύο δεσµευµένων πιθανοτήτων: P( A B) RR = P c ( A B ) είχνει την «επικινδυνότητα» µιας κατάστασης ως προς την µη ύπαρξη της
NOMOΣ ΟΛΙΚΗΣ ΠΙΘΑΝΟΤΗΤΑΣ Αν Α, Β, B c ενδεχόµενα, τότε ισχύει ο παρακάτω νόµος P(A) = P(A B)P(B) + P(A B c )P(B c ). Γενικότερα ένα ενδεχόµενο Α µπορεί να εκφραστεί σε ένα σύνολο ανά δύο ανεξάρτητων ενδεχοµένων Β 1, Β 2, Β 3, Β 4,..Β m Όπου B i B j = Ø. Επίσης η ένωση τους παράγει τον δειγµατικόχώροω. m PA ( ) = PAB ( i) PB ( i ) i= 1 NOMOΣ ΤΟΥBAYES Ισχύουν οι ίδιες προϋποθέσεις όπως και στον νόµο της ολικής πιθανότητας PB ( A) = i m i= 1 PAB ( ) PB ( ) i PA ( B) PB ( ) i i i
Παράδειγµα 2.6. Ένα εργαστηριακό τεστ ορού αίµατος είναι 95% αποτελεσµατικό στην ταυτοποίηση (διάγνωση) µιας ασθένειας όταν αυτή είναι, πραγµατικά, παρούσα. Παράλληλα όµως, το τεστ δίνει ένα ψευδώς θετικό αποτέλεσµα σε 1% των υγιών ατόµων στους οποίους δίνεται. Έστω ότι το ποσοστό του πληθυσµού που έχει αυτή την ασθένεια είναι 0,5% (αυτό το ποσοστό ονοµάζεται επιπολασµός της ασθένειας). Μ αυτά τα στοιχεία, ποια είναι η πιθανότητα θετικού αποτελέσµατος για ένα τυχαία επιλεγµένο άτοµο (αγνώστου κατάστασης υγείας) απ αυτόν τον πληθυσµό; Παρατηρήσεις. Τα ενδεχόµενα ασθενής και µη ασθενής είναι ασυµβίβαστα Τα ενδεχόµενα θετικού και test αντιστοιχούν σε δεσµευµένες πιθανότητες P(+ A) και P(+ B) όπου Α και Β τα ενδεχόµενα να έχει και να µην έχει την ασθένεια
Χρήση δενδροδιαγράµµατος (για την έκφραση δεσµευµένων πιθανοτήτων) P(A) A P(B A) B P(A c ) A c P(B A c ) B Το δενδρόγραµµα χρησιµοποιείται για την έκφραση των δεσµευµένων πιθανοτήτων. Μπορεί να χρησιµοποιηθεί στον υπολογισµό της ολικής πιθανότητας καθώς και στο Νόµο του Bayes. To άθροισµα των πιθανοτήτων των «κλαδιών» είναι ίσο µε την µονάδα.
ΛΥΣΗ ΠΑΡΑ ΕΙΓΜΑΤΟΣ 2.6 0,95 + 0,005 Ασθ 0,05-0,995 Υ 0,01 + 0,99 - Εποµένως, P(A) =P(+ Ασθ) P(Ασθ) +P(+ Y) P(Y)= 0,95 x 0,005 + 0,01 x 0,995 = 0,0147.
Παράδειγµα 2.7. Τα άτοµα ενόςπληθυσµού µπορούν να ταξινοµηθούν σε τρεις γονότυπους, ΒΒ, Ββ και ββ που εµφανίζονται µε πιθανότητες 0,1, 0,7 και 0,2, αντίστοιχα. Από τα άτοµα ΒΒ, 1% έχουν πιθανότητα (προδιάθεση) µιας ασθένειας, ενώ οι αντίστοιχες πιθανότητες αυτής της ασθένειας για τα άτοµα Ββ είναι 2% και για τα άτοµα ββ είναι 10%. Μ αυτά τα δεδοµένα, ποια είναι η πιθανότητα για ένα τυχαία επιλεγµένο άτοµο απ αυτό τον πληθυσµό ναέχειπροδιάθεσηγι αυτή την ασθένεια; 0,1 0,7 ΒΒ Ββ 0,01 0,02 Α Α 0,2 ββ 0,10 Α Εποµένως P(A) = 0,01 x 0,1 + 0,02 x 0,7 + 0,10 x 0,2 = 0,035. Παράδειγµα 2.7 συνεχ. Ποια είναι η πιθανότητα ενός τυχαία επιλεγµένου ατόµου που έχει την ασθένεια να έχει γονότυπο ΒΒ;
Παράδειγµα 2.8. Με βάση τα συµπτώµατα ενός ασθενούς, ογιατρός νοµίζει ότι η πιθανότητα στεφανιαίας καρδιακής νόσου (ΣΚΝ) είναι περίπου 50:50 και παραπέµπει να γίνει ένα τεστ κοπώσεως (ΤΚ) για παραπέρα αξιολόγηση του ασθενούς. Έστω Α+ και Α- το ενδεχόµενο ο ασθενής να έχει ή να µην έχει ΣΚΝ, αντίστοιχα. Παρόµοια έστω T+ και T- το ενδεχόµενο το ΤΚ να είναι θετικό ή αρνητικό, αντίστοιχα. Είναι γνωστό ότι το ΤΚ είναι 80% αποτελεσµατικόστοναείναιθετικόόταντο άτοµο έχει πράγµατι ΣΚΝ, δηλαδή P(T+ Α+) = 0,80. Παράλληλα, (P(T- Α-) = 0,74. 0,5 0,5 A + A - 0,80 0,20 0,74 0,26 T + T - T + P(Α+ T+) = P(T+ Α+)P(Α+) / [P(T+ Α+)P(Α+) + P(T+ Α-)P(Α-)] = 0,80 x 0,50/(0,80 x 0,50 + 0,26 x 0,50) = 0,755 P(Α- T-) = P(T- Α-)P(Α-) / [P(T- Α+)P(Α+) + P(T- Α-)P(Α-)] = 0,74 x 0,50/(0,20 x 0,50 + 0,74 x 0,50) = 0,787 T -