Κανονική κατανομή Η πιο σημαντική κατανομή πιθανοτήτων της στατιστικής είναι η κανονική κατανομή. Η κανονική κατανομή είναι συνεχής κατανομή, σε αντίθεση με την διωνυμική που είναι διακριτή κατανομή. Τα περισσότερα συνεχή φαινόμενα ακολουθούν είτε με ακρίβεια είτε με μεγάλη προσέγγιση την κανονική κατανομή. Η κανονική κατανομή είναι η σπουδαιότερη για τη στατιστική, τη δειγματοληψία και τις πιθανότητες κατανομή. Μελετήθηκε αρχικά από τον de Moivre και στη συνέχεια από τους Gauss και Laplace. Η συνάρτηση πυκνότητας πιθανότητας της κανονικής μεταβλητής είναι: f(x) = e σ π x-μ - σ όπου μ η είναι η μέση τιμή της κατανομής και σ η τυπική απόκλιση. Παρατηρήσεις: Η καμπύλη της κανονικής κατανομής έχει σχήμα καμπάνας. Η ευθεία x=μ είναι άξονας συμμετρίας της καμπύλης. Η τ.μ. παίρνει τιμές σε όλο το R. Ο οριζόντιος άξονας αποτελεί ασύμπτωτη της καμπύλης. x-μ - Ισχύει: Ρ(α<x<β)= e σ dx, σ π β α Ρ(x<β)= β x-μ - σ e dx σ π Σημασία για την κατανόηση της κανονικής κατανομή και για την λύση προβλημάτων έχει το παρακάτω σχήμα (καμπύλη συχνοτήτων) όπου, σ>0 (η s) είναι η τυπική απόκλιση της μεταβλητής και μ (ή x ) η μέση τιμή της:
Όπως όλες οι καμπύλες συχνοτήτων, προκύπτει ως προσέγγιση του πολυγώνου συχνοτήτων των τιμών μιας συνεχούς μεταβλητής. Αυξάνοντας, δηλαδή, το μέγεθος του δείγματος και κατασκευάζοντας το ιστόγραμμα με ολοένα και μικρότερου πλάτους κλάσεις, το αντίστοιχο πολύγωνο προσεγγίζει μια ομαλή-λεία καμπύλη. Η κανονική καμπύλη έχει κωδωνοειδή μορφή, είναι συμμετρική και οι «ουρές» της πλησιάζουν τον οριζόντιο άξονα ομαλά (ασυμπτωτικά). Η μέση τιμή και η διάμεσος ταυτίζονται. Επίσης, η κορυφή ταυτίζεται με τη μέση τιμή και τη διάμεσο. Έτσι, η περιοχή που παρουσιάζει τη μεγαλύτερη πυκνότητα, βρίσκεται και αυτή στο μέσο της κατανομής. Δηλαδή, όταν οι τιμές μιας μεταβλητής είναι κανονικά κατανεμημένες, τότε γύρω από τη μέση τιμή τους υπάρχουν σχετικά πολλές τιμές ενώ μακριά από τη μέση τιμή βρίσκονται σχετικά λίγες τιμές. Το εμβαδόν του χωρίου που περικλείεται από την καμπύλη της κανονικής κατανομής και τον άξονα των τιμών της Χ είναι ίσο με και εκφράζει την πιθανότητα η Χ να P X πάρει κάποια τιμή μεταξύ - και +, δηλ. =. Το εμβαδόν που περικλείεται κάτω από την καμπύλη και μεταξύ των αριθμών μ-σ και μ+σ είναι 68% περίπου. Το εμβαδόν που περικλείεται κάτω από την καμπύλη και μεταξύ των αριθμών μ-σ και μ+σ είναι 95% περίπου. Το εμβαδόν που περικλείεται κάτω από την καμπύλη και μεταξύ των αριθμών μ-3σ και μ+3σ είναι 99,7% περίπου.
Επομένως: Ρ(μ-σΧμ+σ)=0,68, Ρ(μ-σΧμ+σ)=0,95 και Ρ(μ- 3σΧμ+3σ)=0,997. 3
Αντίστοιχα, το εμβαδόν του σκιαγραφημένου χωρίου Α στο παρακάτω σχήμα, εκφράζει την πιθανότητα η Χ να πάρει κάποια τιμή μεταξύ των τιμών α και β, δηλαδή, A=P(α X β). το εμβαδόν του σκιαγραφημένου χωρίου Β στο επόμενο σχήμα, εκφράζει την πιθανότητα η Χ να πάρει κάποια τιμή μικρότερη ή ίση του α, δηλαδή, B=P(X α).. 4
το εμβαδόν του σκιαγραφημένου χωρίου Γ στο επόμενο σχήμα, εκφράζει την πιθανότητα η Χ να πάρει κάποια τιμή μεγαλύτερη ή ίση του α, δηλαδή, Γ=P(X α). Η πιθανότητα P(X=x) είναι μηδέν Αυτός είναι και ο λόγος που στις συνεχείς μεταβλητές έχουμε: P(X α)=p(x<α), P(X α)=p(x>α) και P(α X β)=p(α<x<β) =P(α X<β)=P(α<X β). Όταν η τυχαία μεταβλητή Χ ακολουθεί την κανονική κατανομή με μέση τιμή μ και τυπική απόκλιση σ ισχύει ο ακόλουθος συμβολισμός: Χ Ν(μ,σ ). Η Τυποποιημένη κανονική Κατανομή Η κανονική κατανομή που έχει μέση τιμή 0 και τυπική απόκλιση (άρα και διασπορά ), ονομάζεται τυποποιημένη κανονική κατανομή (standard normal distribution). Μια τυχαία μεταβλητή που ακολουθεί την τυποποιημένη κανονική κατανομή, έχει επικρατήσει να συμβολίζεται με Ζ, δηλαδή ΖΝ(0,). 5
Μια σημαντική ιδιότητα: Αν ΧΝ(μ,σ ) τότε η τ.μ. Ζ= Παράδειγμα: Ν(0,). Αν ΧΝ(00,5 ) να υπολογισθεί η πιθανότητα Ρ(5<Χ<30). Ζ= = 00 Ν(0,). 5 5 00 00 30 00 Επομένως Ρ(5<Χ<30)=Ρ 5 5 5 =Ρ(<Ζ<)=0,359 (από τον μικροϋπολογιστή). Παράδειγμα: Η τ.μ. Χ ακολουθεί την κανονική κατανομή με μ=0 και σ=30. Να υπολογισθούν οι πιθανότητες: α) Ρ[5 x 0], β) Ρ[x<35]. Λύση: 6
α) Ρ[5x 30)=0.0644. β) Ρ[x<35]= 0.7977. 0 x-0-0]= e 30 dx =0.0644, ή Ρ[5x 0]=normCdf(5,0,0, 30 π 35 5 e 30 π x-0-30 dx =0.7977 ή Ρ[x<35]=normCdf( 9Ε999,35,0,30)= Αν γνωρίζουμε ότι η Χ ακολουθεί την κανονική κατανομή με μ=0 και σ=30, μπορούμε να υπολογίσουμε το α, όπου Ρ(Χ<α)=0.79767, με τη βοήθεια της εντολής invnorm(0.79767,0,30). Πράγματι : invnorm(0.79767,0,30)=35. 7