ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ Τμήμα Βιολογικών Εφαρμογών & Τεχνολογιών Βιοστατιστική, Κεφάλαιο 3: Πιθανότητες Λύσεις ασκήσεων 1 Στο διπλανό πίνακα αναπαράγεται ο αρχικός πίνακας, της ταξινόμησης των νεόφυτων κωνοφόρων σύμφωνα με το είδος και την επιβίωση, συμπεριλαμβάνοντας την περιθώρια στήλη με τα αθροίσματα των ειδών και την περιθώρια γραμμή με τα αθροίσματα επιβίωσης ή όχι. (αʹ) Σύμφωνα με τα ζητούμενα, εάν ορίσουμε τα ενδεχόμενα για ένα νεόφυτο κωνοφόρο Είδος νεοφύτου Επιβίωση Ναι Οχι Σύνολο Θαλάσσια Πεύκη 1430 0 1970 Τραχεία Πεύκη 1950 70 00 Σύνολο 3380 610 3990 Ξ = {Δεν επιβίωσε} και Θ = {Είναι Θαλάσσια Πεύκη}, τότε από τα δεδομένα του παραπάνω πίνακα P (Ξ) = 61 197 399, P (Θ) = 399 και P (Ξ Θ) = 399 = 18 133, άρα i. P (Ξ Θ) = 61 399 + 197 399 399 = 68 133 = 51.13%, είναι το ποσοστό των νεοφύτων που ξηράθηκαν ή είναι Θαλάσσιας Πεύκης ή, ισοδύναμα, η πιθανότητα με την οποία ένα νεόφυτο που θα εκλεγεί τυχαία από την αναδάσωση θα έχει ξηραθεί ή θα είναι Θαλάσσιας Πεύκης. ii. Απευθείας από τον πίνακα ή με τον τύπο της δεσμευμένης πιθανότητας, P (Ξ Θ) = 197 = 7.41% είναι το ποσοστό νεοφύτων που ξηράθηκαν από αυτά που είναι Θαλάσσιας Πεύκης ή, ισοδύναμα, η πιθανότητα με την οποία εάν εκλεγεί τυχαία ένα νεόφυτο Θαλάσσιας Πεύκης, δε θα επιβιώσει. (βʹ) Επειδή P (Ξ) = 197 P (Ξ Θ) = 61, η έλλειψη αντοχής του νεοφύτου στο κλίμα της περιοχής δεν είναι ανεξάρτητη από το αν είναι είδους Θαλάσσιας Πεύκης. (γʹ) Εστω τα ενδεχόμενα T i = {το νεόφυτο i είναι Τραχείας Πεύκης}, i = 1,,. Τότε P (T 1 T ) = P (T 1 )P (T T 1 ) = 0 399 01 398 = 6767 6467 = 0.557 είναι η πιθανότητα με την οποία δύο νεόφυτα, που θα εκλεγούν τυχαία και διαδοχικά από το σύνολο, θα είναι είδους Τραχείας Πεύκης. Σύμφωνα με τα ζητούμενα, εάν για ένα άτομο ορίσουμε τα ενδεχόμενα, A = { Εχει την ασθένεια A}, B = { Εχει την ασθένεια B} και M = { Εχει μία από τις A, B}, τότε δίνονται οι P (A) = 0.10, P (B) = 0.05 και P (A B) = 0.0 οπότε: (αʹ) Με τον πολλαπλασιαστικό νόμο έχουμε ότι P (A B) = P (A B)P (B) = 1 100 και επιπλέον P (A B) = 10 100 + 5 100 1 100 = 7 50, οπότε με τον πρώτο νόμο του De Morgan, βρίσκουμε ότι P (A c B c ) = P {(A B) c } = 1 P (A B) = 43 50 = 86% είναι η πιθανότητα με την οποία ένα άτομο του πληθυσμού δεν έχει καμία από τις δύο ασθένειες ή, ισοδύναμα, το 86% του πληθυσμού δεν έχει καμία από τις δύο ασθένειες. (βʹ) M = (A B c ) (A c B) = (A B) (B A) και (A B) (B A) =, άρα χρησιμοποιώντας τους τύπους για τις πιθανότητες των διαφορών (A B) και (B A) και τα αποτελέσματα στο αʹ βρίσκουμε ότι P (M) = P (A B) + P (B A) = P (A B) P (A B) = 7 50 1 100 = 13 100 είναι η πιθανότητα με την οποία ένα άτομο του πληθυσμού έχει (μόνο) μία από τις δύο ασθένειες ή, ισοδύναμα, το 13% του πληθυσμού έχει μία από τις δύο ασθένειες. Σημείωση: μπορούσαμε αμέσως να γράψουμε ότι M = (A B) (A B), που είναι η διαφορά της ένωσης των ενδεχομένων μείον την τομή τους, και επειδή προφανώς A B = {(A B) (A B)} (A B) = M (A B), M (A B) =, έχουμε άμεσα ότι P (M) = P (A B) P (A B). 3 Σύμφωνα με τα ζητούμενα ορίζουμε τα ενδεχόμενα X i = {το σαλιγκάρι i είναι είδους X}, i = 1,,. Τότε, εφόσον οι αιχμαλωσίες των δύο υδρόβιων σαλιγκαριών γίνονται διαδοχικά και χωρίς επανατοποθέτηση, (αʹ) Εφαρμόζοντας τον πολλαπλασιαστικό νόμο βρίσκουμε ότι, P (X 1 X ) = P (X 1 )P (X X 1 ) = 10 50 9 49 = 9 45 = 3.67% Διδάσκων: Καθηγητής Κωνσταντίνος Αδαμίδης.
Λύσεις ασκήσεων Βιοστατιστική Πιθανότητες είναι η πιθανότητα με την οποία και τα δύο σαλιγκάρια θα είναι είδους X. (βʹ) Με το Θεώρημα της Ολικής Πιθανότητας και το αποτέλεσμα στο αʹ βρίσκουμε ότι, P (X ) = P (X c 1 X ) + P (X 1 X ) = P (X c 1)P (X X c 1) + P (X 1 X ) = 40 50 10 49 + 9 45 = 1 5 = 0% είναι η πιθανότητα με την οποία το δεύτερο σαλιγκάρι θα είναι είδους X. ( Οπως αναμενόταν, P (X ) = P (X 1 ) κι ας είναι η αιχμαλωσία χωρίς επανατοποθέτηση, θυμηθείτε το αποτέλεσμα που παρουσιάζεται στο Παράδειγμα 3.18 του βιβλίου.) (γʹ) Με τα αποτελέσματα στα αʹ και βʹ βρίσκουμε ότι, P (X 1 X ) = 1 5 + 1 5 9 45 = 89 45 = 36.33% είναι η πιθανότητα με την οποία τουλάχιστον ένα από τα δύο σαλιγκάρια θα είναι είδους X. (δʹ) Με τον πρώτο νόμο του De Morgan και το αποτέλεσμα στο γʹ (όπως στη λύση του ζητήματος.αʹ) βρίσκουμε ότι, P (X1 c X) c = P {(X 1 X ) c } = 1 P (X 1 X ) = 156 45 = 63.67% είναι η πιθανότητα με την οποία κανένα από τα δύο σαλιγκάρια δε θα είναι είδους X, δηλαδή είναι η πιθανότητα με την οποία και τα δύο σαλιγκάρια θα είναι είδους Y. Εναλλακτικά, θα μπορούσε να εφαρμοστεί ο πολλαπλασιαστικός νόμος ώστε P (X1 c X) c = P (X1)P c (X c X1) c = 40 50 39 49 = 156 45. (εʹ) Χρησιμοποιώντας τα αποτελέσματα στα αʹ και βʹ (όπως στη λύση του ζητήματος.βʹ), βρίσκουμε ότι P {(X 1 X ) (X 1 X )} = P (X 1 X ) P (X 1 X ) = 89 45 9 45 = 16 49 = 3.65% είναι η πιθανότητα με την οποία το ένα από τα δύο σαλιγκάρια θα είναι είδους X. Εναλλακτικά, επειδή P (X 1 ) = P (X ) έχουμε (από τον τύπο της διαφοράς) ότι P (X 1 X ) ( = P (X 1 X c ) ) = P (X X 1 ) ( = P (X X c 1) ), οπότε, χρησιμοποιώντας το αʹ, η ζητούμενη πιθανότητα είναι P (X 1 X ) + P (X X 1 ) = P (X 1 X ) ( = P (X X 1 ) ) = {P (X 1 ) P (X 1 X )} = ( 1 5 ) 9 45 = 16 49, ή ισοδύναμα P (X 1 X c ) + P (X c 1 X ) = P (X 1 X c ) ( = P (X c 1 X ) ) = P (X 1 )P (X c X 1 ) = 10 50 40 49 = 16 49. Προφανώς αυτή η εναλλακτική αντιμετώπιση δεν μπορούσε να εφαρμοστεί στη λύση του ζητήματος.βʹ γιατί είχαμε ότι P (A) P (B). 4 (αʹ) P (A) = P (A B) = 1 4 τα A και B είναι ανεξάρτητα. Εναλλακτικά, P (A B) = P (A)P (B) = 1 8 τα A και B είναι ανεξάρτητα. (βʹ) Αφού τα A, B είναι ανεξάρτητα ενδεχόμενα έχουμε ότι, P (A B) = P (A) + P (B) P (A)P (B) P (B) = P (A B) P (A) 1 P (A) P (B c ) = 3 = P (Bc A), = 3 1 1 γιατί, από τη θεωρία, εάν τα A, B είναι ανεξάρτητα τότε και τα A, B c είναι ανεξάρτητα, και αντίστροφα. (γʹ) Εστω τα ενδεχόμενα εργασίας την επόμενη πενταετία E i = {ο εργαζόμενος i θα παραμείνει στην εργασία του}, i = 1,. Η λύση είναι ανάλογη με τις λύσεις των ζητημάτων 3γʹ 3εʹ και αʹ, βʹ, με τη διαφορά ότι τα E i είναι ανεξάρτητα ενδεχόμενα επειδή οι εργαζόμενοι ανήκουν σε διαφορετικές επιχειρήσεις. Δίνεται ότι P (E 1 ) = 1 4, P (E ) = 1 3, οπότε: i. P (E 1 E ) = P (E 1 ) + P (E ) P (E 1 )P (E ) = 1 4 + 1 3 1 1 = 1. ii. P (E1 c E) c = P (E1)P c (E) c = 3 4 3 = 1, επειδή και τα συμπληρωματικά ενδεχόμενα είναι ανεξάρτητα. Εναλλακτικά, με τον πρώτο νόμο του De Morgan P (E1 c E) c = P {(E 1 E ) c } = 1 P (E 1 E ) = 1. iii. Χρησιμοποιώντας το αποτέλεσμα στο i βρίσκουμε ότι P {(E 1 E ) (E 1 E )} = P (E 1 E ) P (E 1 E ) = 1 1 1 = 5 1 = 41.67%. = 1 3
Πιθανότητες Βιοστατιστική Λύσεις ασκήσεων 3 Εναλλακτικά, με τους τύπους της διαφοράς P (E 1 E ) + P (E E 1 ) = P (E 1 ) + P (E ) P (E 1 E ) = 7 1 1 = 5 1, ή ισοδύναμα, με τον πολλαπλασιαστικό νόμο επειδή τα E 1, E c (και τα E c 1, E ) είναι ανεξάρτητα. P (E 1 E c ) + P (E c 1 E ) = 1 4 3 + 3 4 1 3 = 5 1, Οι λύσεις των ασκήσεων 5 9 που ακολουθούν, εκτός του ζητήματος 6αʹ, βασίζονται στα Θεωρήματα Ολικής Πιθανότητας και του Bayes. 5 (Καρκίνος προστάτη.) Το θετικό αποτέλεσμα της εξέτασης PSA εξαρτάται από το αν ο εξεταζόμενος άνδρας, ηλικίας άνω των πενήντα ετών, νοσεί από καρκίνο του προστάτη ή όχι. Άρα οι πιθανότητες, στα αʹ και βʹ, θα υπολογιστούν εφαρμόζοντας τα Θεωρήματα της Ολικής Πιθανότητας και του Bayes αντίστοιχα. Σύμφωνα με τα ζητούμενα, εάν ορίσουμε τα ενδεχόμενα για έναν άνδρα άνω των πενήντα ετών C = { Εχει καρκίνο προστάτη} και T + = {Θετικό τεστ PSA}, T +c = T, τότε δίνεται ότι P (T + C c ) = 0.14 (η πιθανότητα εσφαλμένα θετικού τεστ), P (T C) = 0.30 (η πιθανότητα εσφαλμένα αρνητικού τεστ) και P (C) = 0.16 P (C c ) = 0.84. Άρα P (T + C) = 1 P (T C) = 0.70 είναι η πιθανότητα σωστού θετικού τεστ, οπότε: (αʹ) P (T + ) = P (T + C)P (C) + P (T + C c )P (C c ) = 0.70 0.16 + 0.14 0.84 = 87 150 =.96% είναι η πιθανότητα θετικής διάγνωσης καρκίνου προστάτη με το τεστ PSA. (βʹ) P (C T + ) = P (T + C)P (C)/P (T +) = 14 15 / 87 150 = 0 41 = 48.78% είναι η πιθανότητα με την οποία νοσεί με καρκίνο προστάτη άνδρας που είχε διαγνωστεί θετικός στον καρκίνο προστάτη με την εξέταση PSA. Συνεπώς η θετική προβλεπτική αξία του τεστ είναι λίγο κάτω από το 50% και χαρακτηρίζεται χαμηλή ως διαγνωστικό εργαλείο (στην πράξη, τέτοια τιμή πιθανότητας σημαίνει ότι ο γιατρός θα μπορούσε να ρίξει ένα νόμισμα για να δει αν ο άνδρας έχει καρκίνο προστάτη, αντί να τον υποβάλει στην εξέταση...!). 6 (αʹ) (Ανεργία και ηλικία.) Σύμφωνα με τα ζητούμενα, εάν ορίσουμε τα ενδεχόμενα για κάτοικο της πόλης N = {Νέος από 5 έως 30 ετών} και A = {Άνεργος}, τότε δίνεται ότι P (N) = 0.15, P (A) = 0.30 και P (N A) = 0.30. Άρα, P (A N) = P (N A)P (A) = 9 100 οπότε: i. P (A N) = 30 100 + 15 100 9 100 = 9 5 = 36% είναι το ποσοστό των κατοίκων της πόλης που είναι νέοι ή άνεργοι, ή η πιθανότητα με την οποία ένας κάτοικος της πόλης είναι νέος ή άνεργος. ii. P (A N) = P (A N)/P (N) = 9 100 / 15 100 = 3 5 = 60% είναι το ποσοστό ανεργίας στους νέους της πόλης, ή η πιθανότητα με την οποία ένας νέος της πόλης είναι άνεργος. (βʹ) (Φτώχεια και οικογενειακή κατάσταση.) Η φτώχεια εξαρτάται από τον αν η οικογένεια είναι μονογονεϊκή ή με ζευγάρι. Εάν ορίσουμε τα ενδεχόμενα, για μία οικογένεια, Φ = {Είναι φτωχή} και M = {Είναι μονογονεϊκή}, τότε δίνεται ότι P (Φ M) = 0.5, P (Φ M c ) = 0.40 και P (M) = 0.30 P (M c ) = 0.70, οπότε: i. P (Φ) = P (Φ M)P (M) + P (Φ M c )P (M c ) = 0.5 0.30 + 0.40 0.70 = 71 00 = 35.5% είναι το ποσοστό των φτωχών οικογενειών της πόλης, ή η πιθανότητα με την οποία μία οικογένεια της πόλης είναι φτωχή. ii. P (M Φ) = P (Φ M)P (M)/P (Φ) = 3 40 / 71 00 = 15 71 = 1.13% είναι το ποσοστό των μονογονεϊκών οικογενειών στις φτωχές οικογένειες της πόλης, ή η πιθανότητα με την οποία φτωχή οικογένεια θα είναι μονογονεϊκή. 7 (αʹ) (Μη εξυπηρετούμενα δάνεια και οικογενειακή κατάσταση.) Η κατοχή μη εξυπηρετούμενου δανείου εξαρτάται από το αν ο δανειολήπτης είναι έγγαμος ή άγαμος. Σύμφωνα με τα ζητούμενα, εάν ορίσουμε τα ενδεχόμενα, για ένα δανειολήπτη, E = {Είναι έγγαμος} και M = { Εχει μη εξυπηρετούμενο δάνειο}, τότε δίνεται ότι P (M E) = 0.045, P (M E c ) = 0.05 και P (E c ) = 0.43 P (E) = 0.57, οπότε: i. P (M) = P (M E)P (E) + P (M E c )P (E c ) = 0.045 0.57 + 0.05 0.43 = 91 500 = 3.64% είναι το ποσοστό των μη εξυπηρετούμενων δανείων, ή η πιθανότητα με την οποία ένας δανειολήπτης έχει δάνειο που έπαψε να εξυπηρετεί. ii. P (E M) = P (M E)P (E)/P (M) = 0.045 0.57/ 91 500 = 513 78 = 70.47% είναι το ποσοστό των εγγάμων στους δανειολήπτες με ληξιπρόθεσμες οφειλές, ή η πιθανότητα με την οποία ένας
4 Λύσεις ασκήσεων Βιοστατιστική Πιθανότητες δανειολήπτης με ληξιπρόθεσμη οφειλή είναι έγγαμος. (βʹ) (Πρόωρη συνταξιοδότηση και φύλο.) Η πρόωρη συνταξιοδότηση εξαρτάται από το φύλο του εργαζομένου. Εάν ορίσουμε τα ενδεχόμενα, για έναν εργαζόμενο, Γ = {Είναι γυναίκα} και Σ = {Υποβολή αίτησης πρόωρης συνταξιοδότησης}, τότε δίνεται ότι P (Σ Γ ) = 0.60, P (Σ Γ c ) = 0.30 και P (Γ ) = 0.45 P (Γ c ) = 0.55 οπότε: P (Σ) = P (Σ Γ )P (Γ ) + P (Σ Γ c )P (Γ c ) = 60 100 45 100 + 30 100 55 100 = 87 00 = 0.435 είναι η πιθανότητα υποβολής αίτησης πρόωρης συνταξιοδότησης, και P (Γ Σ) = P (Σ Γ )P (Γ )/P (Σ) = 7 100 / 87 00 = 18 9 = 0.607 είναι η πιθανότητα με την οποία, εάν εκλεγεί τυχαία μια αίτηση πρόωρης συνταξιοδότησης, θα έχει υποβληθεί από γυναίκα. 8 (αʹ) (Προσέλευση στην εργασία και μέσο μεταφοράς.) Η έγκαιρη προσέλευση στην εργασία εξαρτάται από το μέσο μετακίνησης του υπαλλήλου. Εάν ορίσουμε τα ενδεχόμενα, για έναν υπάλληλο, Π = { Εγκαιρη προσέλευση στην εργασία} και = {Χρήση δημόσιου μέσου μεταφοράς}, τότε δίνεται ότι P (Π ) = 9 10, P (Π c ) = 7 10, P ( ) = 3 4 P ( c ) = 1 4 και ζητούνται οι P ( c Π) και P ( Π), οπότε: P (Π) = P (Π )P ( ) + P (Π c )P ( c ) = 9 10 3 4 + 7 10 1 4 = 17 0 = 0.85 είναι η πιθανότητα έγκαιρης προσέλευσης στην εργασία, και P ( c Π) = P (Π c )P ( c ) P (Π) = 7/40 17/0 = 7 34 = 0.059, P ( Π) = 1 P ( c Π) = 7 34 = 0.7941. είναι οι πιθανότητες με τις οποίες υπάλληλος που προσήλθε έγκαιρα στην εργασία του χρησιμοποίησε είτε το αυτοκίνητό του, είτε δημόσιο μέσο μεταφοράς αντίστοιχα. (βʹ) (Συναγερμός και κίνδυνος.) Το ενδεχόμενο ενεργοποίησης του συναγερμού εξαρτάται από την ύπαρξη πραγματικού κινδύνου ή όχι. Σύμφωνα με τα ζητούμενα, εάν ορίσουμε τα ενδεχόμενα E = {Ενεργοποίηση συναγερμού} και K = { Υπαρξη πραγματικού κινδύνου}, τότε δίνεται ότι P (E K) = 0.99, P (E K c ) = 0.001 και P (K) = 0.05 P (K c ) = 0.95, οπότε: P (E) = P (E K)P (K) + P (E K c )P (K c ) = 0.99 0.05 + 0.001 0.95 = 1009 0000 = 0.05045 είναι η πιθανότητα ενεργοποίησης του συναγερμού, και P (K E) = P (E K)P (K)/P (E) = 0.99 0.05/0.05045 = 990 1009 = 0.981. είναι η πιθανότητα με την οποία η ενεργοποίηση του συναγερμού θα οφείλεται σε πραγματικό κίνδυνο. 9 (αʹ) (Σωστή απάντηση και προετοιμασία.) Το ενδεχόμενο σωστής απάντησης εξαρτάται από το αν ο φοιτητής είναι προετοιμασμένος ή απροετοίμαστος για την εξέταση. Σύμφωνα με τα ζητούμενα, εάν ορίσουμε τα ενδεχόμενα Σ = {Σωστή απάντηση} και Π = {Προετοιμασμένος φοιτητής}, τότε προφανώς P (Σ Π) = 1 και επιπλέον δίνεται ότι P (Σ Π c ) = 1 c, P (Π) = p P (Πc ) = 1 p, οπότε: i. P (Σ) = P (Σ Π)P (Π) + P (Σ Π c )P (Π c ) = 1 p + 1 c (1 p) = 1 c + p( ) 1 1 c είναι η πιθανότητα σωστής απάντησης. ii. P (Π c Σ) = P (Σ Π c )P (Π c )/P (Σ) = (1 p){1 + p(c 1)} 1 είναι η πιθανότητα με την οποία ο φοιτητής που απάντησε σωστά δε γνώριζε την απάντηση (ήταν απροετοίμαστος), ή το ποσοστό των απροετοίμαστων φοιτητών σ αυτούς που απάντησαν σωστά. Οταν δίνονται πέντε επιλογές στην ερώτηση (c = 5) και το ποσοστό των προετοιμασμένων φοιτητών είναι p = 0.6 τότε από τις εκφράσεις των πιθανοτήτων στα i και ii βρίσκουμε, αντίστοιχα, ότι 17 το ποσοστό των σωστών απαντήσεων θα είναι 5 = 68% και ότι το ποσοστό των απροετοίμαστων φοιτητών σ αυτούς που απάντησαν σωστά θα είναι 17 = 11.76%. (βʹ) (Το «παράδοξο» με το κουτί του Bertrant.) Το ενδεχόμενο εκλογής χρυσού νομίσματος εξαρτάται από την εκλογή κουτιού. Σύμφωνα με τα ζητούμενα, εάν ορίσουμε τα ενδεχόμενα K i = {Εκλογή κουτιού i}, i = 1,, 3, και X = {Εκλογή χρυσού νομίσματος}, τότε προφανώς P (X K 1 ) = 1, P (X K ) = 0, P (X K 3 ) = 1 και επιπλέον P (K i) = 1 3, i = 1,, 3,
Πιθανότητες Βιοστατιστική Λύσεις ασκήσεων 5 οπότε: P (X) = P (X K 1 )P (K 1 ) + P (X K )P (K ) + P (X K 3 )P (K 3 ) = 1 1 3 + 0 1 3 + 1 1 3 = 1 είναι η πιθανότητα εκλογής χρυσού νομίσματος, και P (K 1 X) = P (X K 1 )P (K 1 )/P (X) = 1 3 / 1 = 3 είναι η πιθανότητα με την οποία το χρυσό νόμισμα που εξελέγη ανήκε στο K 1.