Κεφάλαιο 7 Τυχαίες Μεταβλητές και Διακριτές Κατανομές Πιθανοτήτων
Τυχαίες Μεταβλητές Τυχαία μεταβλητή είναι μια συνάρτηση ή ένας κανόνας που αντιστοιχίζει έναν αριθμό σε κάθε αποτέλεσμα ενός τυχαίου πειράματος. Εναλλακτικά, τιμή μιας τυχαίας μεταβλητής είναι ένα αριθμητικό ενδεχόμενο. Αντί να μιλάμε για το ενδεχόμενο ρίψης ενός νομίσματος με όρους {κορώνα, γράμματα} το εξετάζουμε ως «τον αριθμό των φορών που έρχεται κορώνα όταν στρίβουμε ένα νόμισμα» {1, 0} (αριθμητικά ενδεχόμενα)
Δύο Τύποι Τυχαίων Μεταβλητών Διακριτή Τυχαία Μεταβλητή που μπορεί να πάρει ένα πεπερασμένο αριθμό τιμών π.χ. τιμές στο ρίξιμο του ζαριού: 2, 3, 4,, 12 Συνεχής Τυχαία Μεταβλητή Αναλογία: της οποίας οι τιμές δεν είναι διακριτές, δεν είναι πεπερασμένες π.χ. χρόνος (30,1 λεπτά; 30,10000001 λεπτά;) Οι Ακέραιοι είναι Διακριτοί, ενώ οι Πραγματικοί Αριθμοί είναι Συνεχείς
Κατανομή Πιθανοτήτων Κατανομή πιθανοτήτων είναι ένας πίνακας, ένας τύπος υπολογισμού, ή ένα γράφημα που περιγράφει τις τιμές μιας τυχαίας μεταβλητής και την πιθανότητα κάθε τιμής. Αφού περιγράψαμε μια τυχαία μεταβλητή (που μπορεί να είναι διακριτή ή συνεχής), έχουμε δύο τύπους κατανομής πιθανοτήτων: Διακριτή Κατανομή Πιθανοτήτων (σε αυτό το κεφάλαιο) και Συνεχής Κατανομή Πιθανοτήτων (Κεφάλαιο 8)
Συμβολισμός Πιθανότητας Ένα κεφαλαίο γράμμα συμβολίζει το όνομα της τυχαίας μεταβλητής, συνήθως το X. Το αντίστοιχο μικρό γράμμα συμβολίζει την τιμή της τυχαίας μεταβλητής. Η πιθανότητα, η τυχαία μεταβλητή X να ισούται με x είναι: P(X = x)
Παράδειγμα 7.1 Η έκδοση Statistical Abstract of the United States δημοσιεύεται κάθε χρόνο. Περιέχει μεγάλη ποικιλία στατιστικών πληροφοριών και πινάκων που βασίζονται στην επίσημη απογραφή και σε άλλες πηγές. Στόχος της είναι να παρέχει ενημέρωση για κάθε είδους χαρακτηριστικά των κατοίκων και της ζωής στη χώρα. Μια από τις ερωτήσεις που τέθηκαν στην απογραφή ήταν σχετικά με τον αριθμό έγχρωμων τηλεοράσεων ανά νοικοκυριό. Ο παρακάτω πίνακας συνοψίζει τα στοιχεία. Αναπτύξτε την κατανομή πιθανοτήτων της τυχαίας μεταβλητής του αριθμού έγχρωμων τηλεοράσεων ανά νοικοκυριό.
Παράδειγμα 7.1. Αριθμός Έγχρωμων Τηλεοράσεων Αριθμός Νοικοκυριών (σε χιλιάδες) 0 1.218 1 32.379 2 37.961 3 19.387 4 7.714 5 2.842 Σύνολο 101.501
Παράδειγμα 7.1 Οι κατανομές πιθανοτήτων μπορούν να υπολογιστούν από σχετικές συχνότητες. 1.218 101.501 = 0,012 π.χ. P(X=4) = 0.076 = 7.6%
Παράδειγμα 7.1 Π.χ. ποια είναι η πιθανότητα να υπάρχει τουλάχιστον μία τηλεόραση αλλά όχι περισσότερες από τρεις σε κάθε δεδομένο νοικοκυριό; «τουλάχιστον μία τηλεόραση αλλά όχι περισσότερες από τρεις» P(1 X 3) = P(Χ=1) + P(Χ=2) + P(Χ=3) = 0.319 + 0.374 + 0.191 = 0.884
Πληθυσμοί/Κατανομή Πιθανοτήτων Η διακριτή κατανομή πιθανοτήτων αντιπροσωπεύει ένα πληθυσμό Παράδειγμα 7.1 τον αριθμό των τηλεοράσεων ανά νοικοκυριό Από τη στιγμή που έχουμε πληθυσμούς, μπορούμε να τους περιγράψουμε υπολογίζοντας διάφορες παραμέτρους. Π.χ. τον (αριθμητικό) μέσο του πληθυσμού και τη διασπορά του πληθυσμού.
Αριθμητικός Μέσος Πληθυσμού (Αναμενόμενη Τιμή) Ο αριθμητικός μέσος πληθυσμού είναι ο σταθμισμένος μέσος όρος όλων των τιμών. Οι σταθμίσεις αποτελούν τις πιθανότητες. Η παράμετρος αυτή ονομάζεται επίσης και αναμενόμενη τιμή της Χ και συμβολίζεται ως E(X). Ε(Χ)=μ=Σxf(x), όπου f(x)=p(x=x), x=0,1,2,
Διασπορά Πληθυσμού Η διασπορά πληθυσμού υπολογίζεται ομοίως. Είναι ο σταθμισμένος μέσος όρος των τετραγώνων των αποκλίσεων από τον αριθμητικό μέσο. V(X)=σ 2 = Σ(x-μ) 2 f(x) Όπως και πριν, υπάρχει μια απλουστευμένη διατύπωση V(X)=E(X 2 )-(E(X)) 2 Η τυπική απόκλιση είναι η ίδια όπως και πριν:
Παράδειγμα 7.2 Βρείτε τον αριθμητικό μέσο, τη διασπορά, και την τυπική απόκλιση του αριθμού έγχρωμων τηλεοράσεων ανά νοικοκυριό από το Παράδειγμα 7.1 E(X)= 0(0.012) + 1(0.319) + 2(0.374) + 3(0.191) + 4(0.076) + 5(0.028) = 2.084
Παράδειγμα 7.2 Βρείτε τον αριθμητικό μέσο, τη διασπορά, και την τυπική απόκλιση του αριθμού έγχρωμων τηλεοράσεων ανά νοικοκυριό από το Παράδειγμα 7.1. = (0 2.084) 2 (0.012) + (1 2.084) 2 (0.319)+ +(5 2.084) 2 (0.028) = 1.107
Παράδειγμα 7.2 Βρείτε τον αριθμητικό μέσο, τη διασπορά, και την τυπική απόκλιση του αριθμού έγχρωμων τηλεοράσεων ανά νοικοκυριό από το Παράδειγμα 7.1. = 1.052
Νόμοι της Αναμενόμενης Τιμής E(c) = c Η αναμενόμενη τιμή μιας σταθεράς (c) είναι απλώς η τιμή της σταθεράς. E(X + c) = E(X) + c E(cX) = ce(x) Μπορούμε να «βγάλουμε εκτός παρένθεσης» μια σταθερά από την έκφραση της αναμενόμενης τιμής (είτε ως τμήμα ενός αθροίσματος με μια τυχαία μεταβλητή Χ είτε ως ένα συντελεστή μιας τυχαίας μεταβλητής Χ).
Παράδειγμα 7.3 Οι μηνιαίες πωλήσεις έχουν ένα αριθμητικό μέσο 25,000 ευρώ και μια τυπική απόκλιση 4,000 ευρώ. Τα κέρδη υπολογίζονται πολλαπλασιάζοντας τις πωλήσεις με το 30% και αφαιρώντας τα σταθερά κόστη των 6,000 ευρώ. Βρείτε τον αριθμητικό μέσο μηνιαίου κέρδους. 1) Περιγράψτε το πρόβλημα με αλγεβρικούς όρους: οι πωλήσεις έχουν αριθμητικό μέσο 25,000 E(Πωλήσεων) = 25,000 τα κέρδη υπολογίζονται ως Κέρδος = 0.30(Πωλήσεων) 6,000
Παράδειγμα 7.3 Οι μηνιαίες πωλήσεις έχουν ένα αριθμητικό μέσο 25,000 ευρώ και μια τυπική απόκλιση 4,000 ευρώ. Τα κέρδη υπολογίζονται πολλαπλασιάζοντας τις πωλήσεις με το 30% και αφαιρώντας τα σταθερά κόστη των 6,000 ευρώ. Βρείτε τον αριθμητικό μέσο μηνιαίου κέρδους. E(Κέρδους) =E[0.30(Πωλήσεων) 6,000] =E[0.30(Πωλήσεων] 6,000 [κανόνας #2] =0.30E(Πωλήσεων) 6,000 [κανόνας #3] =0.30(25,000) 6,000 = 1,500 Επομένως, ο αριθμητικός μέσος μηνιαίου κέρδους είναι 1,500 ευρώ.
Νόμοι της Διασποράς V(c) = 0 Η διασπορά μιας σταθεράς (c) είναι μηδέν. V(X + c) = V(X) Η διασπορά μιας τυχαίας μεταβλητής και μια σταθερά είναι απλώς η διασπορά της τυχαίας μεταβλητής. V(cX) = c 2 V(X) Η διασπορά μιας τυχαίας μεταβλητής επί ένα σταθερό συντελεστή είναι ο συντελεστής στο τετράγωνο επί την διασπορά της τυχαίας μεταβλητής.
Παράδειγμα 7.3 Οι μηνιαίες πωλήσεις έχουν ένα αριθμητικό μέσο 25,000 ευρώ και μια τυπική απόκλιση 4,000 ευρώ. Τα κέρδη υπολογίζονται πολλαπλασιάζοντας τις πωλήσεις με το 30% και αφαιρώντας τα σταθερά κόστη των 6,000 ευρώ. Βρείτε την τυπική απόκλιση των μηνιαίων κερδών. 1) Περιγράψτε το πρόβλημα με αλγεβρικούς όρους: οι πωλήσεις έχουν τυπική απόκλιση 4,000 V(Πωλήσεων) = 4,000 2 = 16,000,000 (θυμηθείτε τη σχέση μεταξύ τυπικής απόκλισης και διασποράς) τα κέρδη υπολογίζονται ως Κέρδος = 0.30(Πωλήσεων) 6,000
Παράδειγμα 7.3 Οι μηνιαίες πωλήσεις έχουν ένα αριθμητικό μέσο 25,000 ευρώ και μια τυπική απόκλιση 4,000 ευρώ. Τα κέρδη υπολογίζονται πολλαπλασιάζοντας τις πωλήσεις με το 30% και αφαιρώντας τα σταθερά κόστη των 6,000 ευρώ. Βρείτε την τυπική απόκλιση των μηνιαίων κερδών. 2) Η διασπορά του κέρδους είναι V(Κέρδους) =V[0.30(Πωλήσεων) 6,000] =V[0.30(Πωλήσεων)] [κανόνας #2] =(0.30) 2 V(Πωλήσεων) [κανόνας #3] =(0.30) 2 (16,000,000) = 1,440,000 Και πάλι, η τυπική απόκλιση είναι η τετραγωνική ρίζα της διασποράς, επομένως η τυπική απόκλιση του Κέρδους = (1.440.000) 1/2 = 1,200 ευρώ.
Διμεταβλητές Κατανομές Μέχρι τώρα εξετάσαμε τις μονομεταβλητές κατανομές, δηλαδή κατανομές πιθανοτήτων σε μία μεταβλητή. Όπως ίσως μαντεύετε, διμεταβλητές κατανομές είναι πιθανότητες συνδυασμών δύο μεταβλητών. Οι διμεταβλητές κατανομές πιθανοτήτων ονομάζονται επίσης και συνδυασμένη πιθανότητα. Η κατανομή συνδυασμένης πιθανότητας της Χ και Υ είναι ένας πίνακας ή ένας τύπος υπολογισμού που εμπεριέχει τις συνδυασμένες πιθανότητες για όλα τα ζεύγη αξιών x και y, και συμβολίζεται ως f(x,y). f(x,y) = P(X=x και Y=y)
Παράδειγμα 7.4 Ο Χρήστος και η Υβόννη είναι κτηματομεσίτες. Ας συμβολίσουμε με X τον αριθμό κατοικιών που θα πωλήσει ο Χρήστος σε ένα μήνα και με Υ τον αριθμό κατοικιών που θα πωλήσει η Υβόννη σε ένα μήνα. Μια ανάλυση των παρελθόντων μηνιαίων επιδόσεών τους έχει τις παρακάτω συνδυασμένες πιθανότητες (διμεταβλητή κατανομή πιθανοτήτων ).
Ολικές Πιθανότητες Μπορούμε να υπολογίσουμε τις ολικές πιθανότητες αθροίζοντας κατά σειρά και κατά στήλη για να ορίσουμε τις πιθανότητες του Χ και του Υ ξεχωριστά: Π.χ η πιθανότητα να πωλήσει ο Χρήστος 1 κατοικία είναι P(X=1) =0.50
Περιγραφή Διμεταβλητής Κατανομής Μπορούμε να περιγράψουμε τον αριθμητικό μέσο, τη διασπορά και την τυπική απόκλιση κάθε μεταβλητής σε μια διμεταβλητή κατανομή εργαζόμενοι με τις ολικές πιθανότητες οι ίδιοι τύποι όπως και στις μονομεταβλητές κατανομές.
Συμμεταβλητότητα Η συμμεταβλητότητα δύο διακριτών μεταβλητών ορίζεται ως εξής: COV(X,Y)=E(XY)-E(X)E(Y)
Συντελεστής Συσχέτισης Ο συντελεστής συσχέτισης υπολογίζεται με τον ίδιο τρόπο που περιγράφηκε ενωρίτερα
Παράδειγμα 7.4 Υπολογίστε τη συμμεταβλητότητα και τον συντελεστή συσχέτισης μεταξύ των αριθμών των κατοικιών που πωλούνται από τον Χρήστο και την Υβόννη. COV(X,Y) = (0 0.7)(0 0.5)(0.12) + (1 0.7)(0 0.5)(0.42) + + (2 0.7)(2 0.5)(0.01) = 0.15 = 0.15/[(0.64)(0.67)] = 0.35 Υπάρχει μια ασθενής, αρνητική συσχέτιση μεταξύ των δύο μεταβλητών.
Άθροισμα Δύο Μεταβλητών Η διμεταβλητή κατανομή μας επιτρέπει να αναπτύξουμε την κατανομή πιθανοτήτων κάθε συνδυασμού των δύο μεταβλητών, ενώ ιδιαίτερου ενδιαφέροντος είναι το άθροισμα των δύο μεταβλητών Στο παράδειγμα του Χρήστου και της Υβόννης της πώλησης κατοικιών, μπορούμε να δημιουργήσουμε μια κατανομή πιθανοτήτων για να απαντήσουμε σε ερωτήσεις του είδους «ποια είναι η πιθανότητα να πωληθούν δύο κατοικίες;» P(X+Y=2) = 0.07 + 0.06 + 0.06 = 0.19
Άθροισμα Δύο Μεταβλητών Ομοίως, μπορούμε να υπολογίσουμε την αναμενόμενη τιμή, τη διασπορά και την τυπική απόκλιση του X+Y με τον συνήθη τρόπο E(X + Y) = 0(0.12) + 1(0.63) + 2(0.19) + 3(0.05) + 4(0.01) = 1.2 V(X + Y) = (0 1.2) 2 (0.12) + + (4 1.2) 2 (0.01) = 0.56 x y V ( X Y ).56.75
Νόμοι Μπορούμε να εξάγουμε νόμους της αναμενόμενης τιμής και της διασποράς για το άθροισμα των δύο μεταβλητών, ως εξής E(X + Y) = E(X) + E(Y) V(X + Y) = V(X) + V(Y) + 2COV(X, Y) Εάν X και Y είναι ανεξάρτητες, COV(X, Y) = 0 και επομένως V(X + Y) = V(X) + V(Y)
Διαφοροποίηση Χαρτοφυλακίου και Διασπορά Στοιχείων Ενεργητικού Πάρτε έναν επενδυτή που διαμορφώνει ένα χαρτοφυλάκιο αποτελούμενο μόνο από δύο μετοχές, επενδύοντας $4,000 στη μία μετοχή και $6,000 στη δεύτερη. Έστω ότι τα αποτελέσματα μετά 1 έτος είναι: Αποτελέσματα σε ένα έτος Αρχική Αξία επένδυσης Απόδοση Μετοχή Επένδυση Μετά Ένα Έτος Επένδυσης 1 $4,000 $5,000 R 1 = 0.25 (25%) 2 $6,000 $5,400 R 2 =-0.10 (-10%) Σύνολο $10,000 $10,400 R p = 0.04 ( 4%) ή R p = w 1 R 1 + w 2 R 2 = (0.4)(0.25) + (0.6)(-0.10) = 0.04
Διαφοροποίηση Χαρτοφυλακίου και Διασπορά Στοιχείων Ενεργητικού Αναμενόμενη Τιμή και Διασπορά Χαρτοφυλακίου Δύο Μετοχών E(R p ) = w 1 E(R 1 ) + w 2 E(R 2 ) V(R p ) = w 12 V(R 1 ) + w 22 V(R 2 ) + 2w 1 w 2 COV(R 1, R 2 ) = w 12 σ 12 + w 22 σ 22 + 2w 1 w 2 ρσ 1 σ 2 όπου w 1 και w 2 είναι οι αναλογίες ή συντελεστές στάθμισης των επενδύσεων 1 και 2, E(R 1 ) και E(R 2 ) είναι οι αναμενόμενες τιμές τους, σ 1 και σ 2 οι τυπικές αποκλίσεις τους, και ρ είναι ο συντελεστής συσχέτισης.
Παράδειγμα 7.5 Ένας επενδυτής έχει αποφασίσει να διαμορφώσει ένα χαρτοφυλάκιο τοποθετώντας τα χρήματά του κατά 25% σε μετοχές της εταιρείας McDonald s και κατά 75% σε μετοχές της εταιρείας Cisco Systems. Ο επενδυτής υποθέτει ότι οι αναμενόμενες αποδόσεις θα είναι 8% και 15% αντιστοίχως, και ότι η τυπική απόκλιση θα είναι 12% και 22% αντιστοίχως. a Βρείτε την αναμενόμενη απόδοση του χαρτοφυλακίου. b Υπολογίστε την τυπική απόκλιση των αποδόσεων του χαρτοφυλακίου υποθέτοντας ότι (i) οι αποδόσεις των δύο μετοχών έχουν απόλυτα θετική συσχέτιση (ii) ο συντελεστής συσχέτισης είναι 0,5 (iii) οι αποδόσεις των δύο μετοχών δεν έχουν καμία συσχέτιση
Παράδειγμα 7.5 a Οι αναμενόμενες τιμές των δύο μετοχών είναι E(R 1 ) = 0.08 και E(R 2 ) = 0.15 Οι συντελεστές στάθμισης είναι w 1 = 0.25 και w 2 = 0.75. Επομένως, E(R 2 ) = w 1 E(R 1 ) + w 2 E(R 2 ) = 0.25(0.08) + 0.75(0.15) = 0.1325
Παράδειγμα 7.5 Οι τυπικές αποκλίσεις είναι σ 1 = 0.12 και σ 2 = 0.22. Άρα, V(R p ) = w 12 σ 12 + w 22 σ 22 + 2w 1 w 2 ρσ 1 σ 2 = (0.25 2 )(0.12 2 ) + (0.75 2 )(0.22 2 ) + 2(0.25)(0.75)ρ (0.12)(0.22) = 0.0281 + 0.0099 ρ Όταν ρ = 1 V(R p ) = 0.0281 + 0.0099(1) = 0.0380 Όταν ρ = 0.5 V(R p ) = 0.0281 + 0.0099(0.5) = 0.0331 Όταν ρ = 0 V(R p ) = 0.0281 + 0.0099(0) = 0.0281
Διαφοροποίηση Χαρτοφυλακίου στην πράξη Οι τύποι που είδαμε σε αυτή την ενότητα προϋποθέτουν ότι γνωρίζουμε τις αναμενόμενες τιμές, τη διασπορά, και τη συμμεταβλητότητα (ή τον συντελεστή συσχέτισης) των επενδύσεων που μας ενδιαφέρουν. Το ερώτημα που προκύπτει είναι πώς υπολογίζουμε αυτές τις παραμέτρους; Η πιο συνηθισμένη πρακτική είναι η εκτίμηση των παραμέτρων από ιστορικά δεδομένα, χρησιμοποιώντας στατιστική δειγμάτων.
Χαρτοφυλάκια με Περισσότερες των Δύο Μετοχών Μπορούμε να επεκτείνουμε τους τύπους που περιγράφουν τον αριθμητικό μέσο και τη διασπορά των αποδόσεων ενός χαρτοφυλακίου δύο μετοχών σε ένα χαρτοφυλάκιο οποιουδήποτε αριθμού μετοχών. Αναμενόμενη Τιμή και Διασπορά ενός Χαρτοφυλακίου k Μετοχών E(R p ) = V(R p ) = k i 1 k i 1 w E( w i R i ) k k 2 2 i i 2 w iw jcov(r i, R j) i 1 j i 1 όπου R i είναι η απόδοση της μετοχής i, w i είναι η αναλογία του χαρτοφυλακίου που επενδύθηκε στη μετοχή i, και k είναι ο αριθμός μετοχών του χαρτοφυλακίου.
Διωνυμική Κατανομή Διωνυμική κατανομή είναι η κατανομή πιθανοτήτων που προέρχεται από ένα «διωνυμικό πείραμα». Τα διωνυμικά πειράματα έχουν τις παρακάτω ιδιότητες: Σταθερό αριθμό δοκιμών, που συμβολίζεται με n. Κάθε δοκιμή έχει δύο πιθανά αποτελέσματα, μια «επιτυχία» και μια «αποτυχία». P(επιτυχίας)=p (και επομένως: P(αποτυχίας)=1 p), για όλες τις δοκιμές. Οι δοκιμές είναι ανεξάρτητες, κάτι που σημαίνει ότι το αποτέλεσμα μιας δοκιμής δεν επηρεάζει το αποτέλεσμα οποιασδήποτε άλλης δοκιμής.
Επιτυχία και Αποτυχία είναι απλώς «ετικέτες» σε ένα διωνυμικό πείραμα, δεν συνιστούν καμία αξιολογική κρίση. Για παράδειγμα, η ρίψη ενός νομίσματος θα καταλήξει είτε σε κορώνα είτε σε γράμματα. Εάν ορίσουμε το «κορώνα» ως επιτυχία τότε αναγκαστικά τα «γράμματα» θεωρούνται αποτυχία (στο βαθμό που επιχειρούμε να φέρουμε «κορώνα»). Άλλες έννοιες του διωνυμικού πειράματος: Ένας υποψήφιος σε εκλογές κερδίζει ή χάνει Ένας υπάλληλος είναι άνδρας ή γυναίκα
Διωνυμική Τυχαία Μεταβλητή Τυχαία μεταβλητή ενός διωνυμικού πειράματος ορίζεται ο αριθμός επιτυχιών σε n δοκιμές, και ονομάζεται διωνυμική τυχαία μεταβλητή. Π.χ. ρίψη ενός νομίσματος 10 φορές 1) Σταθερός αριθμός δοκιμών n=10 2) Κάθε δοκιμή έχει δύο πιθανά αποτελέσματα {κορώνα (επιτυχία), γράμματα (αποτυχία)} 3) P(επιτυχίας)= 0.50; P(αποτυχίας)=1 0.50 = 0.50 4) Οι δοκιμές είναι ανεξάρτητες (π.χ.. Το αποτέλεσμα «κορώνα» στην πρώτη ρίψη δεν θα έχει καμία επίπτωση στις επόμενες ρίψεις του νομίσματος). Επομένως, η ρίψη ενός νομίσματος δέκα φορές είναι ένα διωνυμικό πείραμα αφού πληρούνται όλες οι προϋποθέσεις.
Διωνυμική Τυχαία Μεταβλητή Η διωνυμική τυχαία μεταβλητή μετρά τον αριθμό επιτυχιών σε n δοκιμές του διωνυμικού πειράματος. Μπορεί να έχει τιμές από 0, 1, 2,, n. Επομένως, είναι μια διακριτή τυχαία μεταβλητή. Για τον υπολογισμό της πιθανότητας που σχετίζεται με κάθε τιμή χρησιμοποιούμε τον τύπο: για x=0, 1, 2,, n
Pat Statsdud Ο Pat Statsdud είναι ένας (κακός) φοιτητής του μαθήματος της στατιστικής. Η στρατηγική του Pat για την επικείμενη εξέταση είναι να βασιστεί στην τύχη. Η εξέταση συνίσταται από 10 ερωτήσεις πολλαπλής επιλογής. Κάθε ερώτηση έχει πέντε πιθανές απαντήσεις, μόνο μία εκ των οποίων είναι σωστή. Ο Pat σχεδιάζει να μαντεύει στην τύχη την απάντηση της κάθε ερώτησης. Ποια είναι η πιθανότητα να μην πετύχει ο Pat καμία σωστή απάντηση; Ποια είναι η πιθανότητα να πετύχει ο Pat δύο σωστές απαντήσεις;
Pat Statsdud Ο Pat Statsdud είναι ένας (κακός) φοιτητής του μαθήματος της στατιστικής. Η στρατηγική του Pat για την επικείμενη εξέταση είναι να βασιστεί στην τύχη. Η εξέταση συνίσταται από 10 ερωτήσεις πολλαπλής επιλογής. Κάθε ερώτηση έχει πέντε πιθανές απαντήσεις, μόνο μία εκ των οποίων είναι σωστή. Ο Pat σχεδιάζει να μαντεύει στην τύχη την απάντηση της κάθε ερώτησης. Τότε n=10 και P(επιτυχίας) = 1/5 = 0.20
Pat Statsdud Είναι αυτό ένα διωνυμικό πείραμα; Εξετάστε τις συνθήκες: Υπάρχει σταθερός πεπερασμένος αριθμός δοκιμών (n=10). Μια απάντηση μπορεί να είναι είτε σωστή είτε λανθασμένη. Η πιθανότητα μιας σωστής απάντησης (P(επιτυχίας)=0.20) δεν μεταβάλλεται από ερώτηση σε ερώτηση. Κάθε απάντηση είναι ανεξάρτητη από τις άλλες.
Pat Statsdud n=10 και P(επιτυχίας) = 0.20 Ποια είναι η πιθανότητα να μην είναι καμία απάντηση σωστή; Δηλαδή x= 0, επομένως θέλουμε να γνωρίζουμε την P(Χ=0) Ο Pat, χρησιμοποιώντας την στρατηγική της εικασίας, έχει πιθανότητες 11% να απαντήσει λάθος σε όλες τις ερωτήσεις.
Pat Statsdud n=10 και P(επιτυχίας) = 0.20 Ποια είναι η πιθανότητα ο Pat να απαντήσει σωστά σε δύο ερωτήσεις; Δηλαδή x= 2, επομένως θέλουμε να ξέρουμε την P(Χ=2) Ο Pat έχει πιθανότητες 30% να απαντήσει σωστά σε ακριβώς δύο ερωτήσεις χρησιμοποιώντας τη στρατηγική της εικασίας.
Αθροιστική Πιθανότητα Μέχρι τώρα χρησιμοποιήσαμε τη διωνυμική κατανομή πιθανοτήτων για να βρούμε τις πιθανότητες επιμέρους τιμών του Χ. Η απάντηση στην ερώτηση: «Βρείτε την πιθανότητα αποτυχίας του Pat στην εξέταση» απαιτεί μια αθροιστική πιθανότητα, δηλαδή, P(X x) Εάν ο βαθμός στην εξέταση είναι χαμηλότερος του 50% (δηλαδή, 5 σωστές απαντήσεις από τις 10), τότε θεωρείται αποτυχία στην εξέταση. Επομένως, θέλουμε να γνωρίζουμε ποιο είναι το P(X 4) για να απαντήσουμε
Pat Statsdud P(X 4) = P(Χ=0) + P(Χ=1) + P(Χ=2) + P(Χ=3) + P(Χ=4) Ήδη γνωρίζουμε ότι P(Χ=0) = 0.1074 και P(Χ=2) = 0.3020. Χρησιμοποιώντας τον διωνυμικό τύπο για τον υπολογισμό των άλλων: P(Χ=1) = 0.2684, P(Χ=3) = 0.2013, και P(Χ=4) = 0.0881 Έχουμε P(X 4) = 0.1074 + 0.2684 + + 0.0881 = 0.9672 Επομένως, είναι πιθανό κατά 97% ότι ο Pat θα αποτύχει στην εξέταση χρησιμοποιώντας τη στρατηγική των εικασιών και των τυχαίων απαντήσεων.
Λειτουργία =BINOMDIST() στο Excel Υπάρχει μια λειτουργία διωνυμικής κατανομής σε Excel που μπορεί επίσης να χρησιμοποιηθεί για τον υπολογισμό αυτών των πιθανοτήτων. Για παράδειγμα: Ποια είναι η πιθανότητα ο Pat να δώσει δύο σωστές απαντήσεις; επιτυχίες δοκιμές P(επιτυχίας) αθροιστικά (δηλαδή, P(X x);) P(X=2)=0.3020
Λειτουργία =BINOMDIST() Excel Υπάρχει μια λειτουργία διωνυμικής κατανομής σε Excel που μπορεί επίσης να χρησιμοποιηθεί για τον υπολογισμό αυτών των πιθανοτήτων. Για παράδειγμα: Ποια είναι η πιθανότητα ο Pat να αποτύχει στην εξέταση; # επιτυχίες # δοκιμές P(επιτυχίας) αθροιστικά (δηλαδή, P(X x);) P(X 4)=0,9672
Διωνυμική Κατανομή Όπως ίσως αναμένετε, έχουν αναπτυχθεί γενικοί τύποι για τον αριθμητικό μέσο, τη διασπορά, και την τυπική απόκλιση μιας διωνυμικής τυχαίας μεταβλητής. Αυτοί είναι οι εξής:
Κατανομή Poisson Έχοντας πάρει το όνομά της από τον Simeon Poisson, η κατανομή Poisson είναι μια διακριτή κατανομή πιθανοτήτων και αναφέρεται στο πλήθος ενδεχομένων (γνωστών και ως επιτυχιών) εντός ενός συγκεκριμένου χρονικού διαστήματος ή συγκεκριμένου χώρου/πεδίου. Για παράδειγμα: Ο αριθμός αυτοκινήτων που καταφθάνουν σε ένα συνεργείο για σέρβις σε 1 ώρα (Το χρονικό διάστημα είναι 1 ώρα). Ο αριθμός των ελαττωμάτων σε ένα τόπι ύφασμα (Το συγκεκριμένο πεδίο είναι ένα τόπι ύφασμα). Ο αριθμός ατυχημάτων σε 1 μέρα σε ένα συγκεκριμένο τμήμα του αυτοκινητόδρομου. (Το διάστημα ορίζεται τόσο από το χρόνο, 1 ημέρα, όσο και από το χώρο, το συγκεκριμένο τμήμα του αυτοκινητόδρομου.)
Το Πείραμα Poisson Όπως κι ένα διωνυμικό πείραμα, ένα πείραμα Poisson έχει τέσσερις χαρακτηριστικές ιδιότητες: Ο αριθμός επιτυχιών που προκύπτουν σε οποιοδήποτε διάστημα είναι ανεξάρτητος από τον αριθμό επιτυχιών που συμβαίνουν σε οποιοδήποτε άλλο διάστημα. Η πιθανότητα επιτυχίας σε ένα διάστημα είναι η ίδια για όλα τα διαστήματα ίσου μεγέθους Η πιθανότητα επιτυχίας είναι ανάλογη του μεγέθους του διαστήματος. Η πιθανότητα περισσοτέρων της μιας επιτυχιών σε ένα διάστημα προσεγγίζει το μηδέν καθώς το διάστημα γίνεται μικρότερο.
Κατανομή Poisson Τυχαία μεταβλητή Poisson είναι το πλήθος [αριθμός] επιτυχιών που προκύπτουν σε μια χρονική περίοδο ή σε χωρικό διάστημα σε ένα πείραμα Poisson. επιτυχίες Π.χ. Κατά μέσο όρο 96 φορτηγά φθάνουν σε μια συνοριακή διέλευση κάθε ώρα. χρόνος Π.χ. Ο αριθμός των τυπογραφικών λαθών σε μια νέα έκδοση βιβλίου είναι κατά μέσο όρο 1.5 ανά 100 σελίδες. επιτυχίες (;!) διάστημα
Κατανομή Πιθανοτήτων Poisson Η πιθανότητα ότι μια τυχαία μεταβλητή Poisson θα πάρει μια τιμή x δίδεται από τη σχέση: f(x)=p(x=x)=e -μ μ x /x!, x=0,1, όπου μ είναι ο αριθμητικός μέσος επιτυχιών στο διάστημα και e είναι η βάση των φυσικών λογαρίθμων.
Παράδειγμα 7.6 Ένας καθηγητής στατιστικής παρατήρησε ότι το πλήθος [αριθμός] των τυπογραφικών λαθών σε νέες εκδόσεις βιβλίων διαφέρει σημαντικά από βιβλίο σε βιβλίο. Μετά από σχετική ανάλυση καταλήγει ότι ο αριθμός των λαθών είναι μια κατανομή Poisson με ένα αριθμητικό μέσο 1.5 ανά 100 σελίδες. Ποια είναι η πιθανότητα να μην βρει ο καθηγητής κανένα τυπογραφικό λάθος;
Παράδειγμα 7.6 Ένας καθηγητής στατιστικής παρατήρησε ότι το πλήθος [αριθμός] των τυπογραφικών λαθών σε νέες εκδόσεις βιβλίων διαφέρει σημαντικά από βιβλίο σε βιβλίο. Μετά από σχετική ανάλυση καταλήγει ότι ο αριθμός των λαθών είναι μια κατανομή Poisson με ένα αριθμητικό μέσο 1.5 ανά 100 σελίδες. Ο καθηγητής επιλέγει τυχαία100 σελίδες ενός νέου βιβλίου. Ποια είναι η πιθανότητα να μην υπάρχει κανένα λάθος; Δηλαδή, ποιο είναι το P(X=0) με δεδομένο ότι µ = 1.5; «Υπάρχει πιθανότητα περίπου 22% να μην βρεθεί κανένα λάθος»
Παράδειγμα 7.7 Ανατρέξτε στο παράδειγμα 7.6. Έστω ότι ο καθηγητής μόλις έχει λάβει ένα αντίγραφο ενός νέου βιβλίου στατιστικής. Βλέπει ότι υπάρχουν 400 σελίδες. α Ποια η πιθανότητα να μην υπάρχουν καθόλου τυπογραφικά λάθη; β Ποια η πιθανότητα να υπάρχουν πέντε ή λιγότερα τυπογραφικά λάθη;
Κατανομή Poisson Όπως αναφέρθηκε στην κατανομή Poisson Η πιθανότητα μιας επιτυχίας είναι ανάλογη του μεγέθους του διαστήματος Επομένως, γνωρίζοντας ένα ποσοστό 1.5 τυπογραφικών λαθών ανά 100 σελίδες, μπορούμε να προσδιορίσουμε μια μέση τιμή για ένα βιβλίο 400 σελίδων ως εξής: =1.5(4) = 6 λάθη / 400 σελίδες
Παράδειγμα 7.7 Για ένα βιβλίο 400 σελίδων, ποια είναι η πιθανότητα να μην υπάρχει κανένα τυπογραφικό λάθος; P(X=0) = «υπάρχει μια πολύ μικρή πιθανότητα να μην υπάρχει κανένα τυπογραφικό λάθος»
Παράδειγμα 7.7 Για ένα βιβλίο 400 σελίδων, ποια είναι η πιθανότητα να υπάρχουν πέντε ή λιγότερα τυπογραφικά λάθη; P(X 5) = P(X=0) + P(X=1) + =0,446 «υπάρχει πιθανότητα περίπου 45% να υπάρχουν 5 ή λιγότερα λάθη»
Παράδειγμα 7.7 To Excel είναι μια ακόμη καλύτερη εναλλακτική: