Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium Iii
Η Κανονική Κατανομή
Λέμε ότι μία τυχαία μεταβλητή X, ακολουθεί την Κανονική Κατανομή με παραμέτρους και και συμβολίζουμε X N, αν έχει συνάρτηση πυκνότητας πιθανότητας 1 x 1 f x e x Αποδεικνύεται ότι EX και VarX Η καμπύλη της Κανονικής Κατανομής έχει σχήμα «καμπάνας» και είναι συμμετρική ως προς τον άξονα που διέρχεται από τα μέση τιμή της. Μαρίνα Σύρπη (016) 3
Η μορφή της «καμπάνας» εξαρτάται από τις παραμέτρους και. Η μεταβολή της παραμέτρου στον οριζόντιο άξονα., μετακινεί την καμπύλη πάνω Η μεταβολή της παραμέτρου καμπύλης. αλλάζει το ύψος και το πλάτος της Μαρίνα Σύρπη (016) 4
Το πρόβλημα του υπολογισμού των πιθανοτήτων στην Κανονική Κατανομή Έστω η τυχαία μεταβλητή X N 10, και ότι θέλουμε να υπολογίσουμε την πιθανότητα ότι η X να παίρνει τιμές μεγαλύτερες από το 13. Δηλαδή, θέλουμε να υπολογίσουμε την P X 13 Η πιθανότητα ισούται με το εμβαδόν κάτω από την καμπύλη της Κανονικής Κατανομής, που βρίσκεται δεξιά του 13, αλλά ο υπολογισμός αυτός είναι ιδιαίτερα περίπλοκος. 13 1 x 1 P X 13 e dx ; Μαρίνα Σύρπη (016) 5
Η Τυποποιημένη Κανονική Κατανομή N 0, 1 1 1 Η Κανονική Κατανομή με παραμέτρους και ονομάζεται Τυποποιημένη (ή Τυπική) Κανονική Κατανομή. Η Τυποποημένη Κανονική Κατανομή N 0, 1 Η τυχαία μεταβλητή που ακολουθεί την τυποποιημένη Κανονική Κατανομή ονομάζεται Τυποποιημένη Τυχαία Μεταβλητή και συμβολίζεται με Z, δηλαδή Z N 0, 1 Μαρίνα Σύρπη (016) 6
Υπολογισμός Πιθανοτήτων στην N 0, 1 z P Z z Για την τυποποποημένη τυχαία μεταβλητή Z, η πιθανότητα να παίρνει τιμές μικρότερες ή ίσες από μία δεδομένη τιμή z συμβολίζονται με z, και δίνονται υπολογισμένες σε πίνακα. Οι τιμές z z 1 z Pa Z b b a z P Z z έχουν τις παρακάτω ιδιότητες Μαρίνα Σύρπη (016) 7
Υπολογισμός Πιθανοτήτων στην N 0, 1 - Παράδειγμα 1 Έστω ότι θέλουμε να βρούμε την πιθανότητα P Z 1.5. Αυτή συμπίπτει με το εμβαδόν κάτω από την καμπύλη της τυποποιημένης Κανονικής Κατανομής, που βρίσκεται αριστερά του 1.5 και βρίσκεται στη διασταύρωση της γραμμής 1.5 και της στήλης 0.0 (αφού 1.5 + 0.0 = 1.5) του πίνακα της Τυποποιημένης Κανονικής Κατανομής. Επομένως, PZ 1.5 1.50.93574 Επίσης, PZ 1.5 1 1.510.93574 0.0646 Μαρίνα Σύρπη (016) 8
Υπολογισμός Πιθανοτήτων στην N 0, 1 - Παράδειγμα P(Z > -0,86) PZ 0.86 0.861 0.8051 0.1949 P Z 0.86 1 0.86 1 1 0.86 0.86 0.8051 Μαρίνα Σύρπη (016) 9
Υπολογισμός Πιθανοτήτων σε οποιαδήποτε Κανονική Κατανομή Όταν έχουμε μια τυχαία μεταβλητή X που ακολουθεί κάποια Κανονική Κατανομή N,, τότε ο υπολογισμός πιθανοτήτων για την X μετασχηματίζεται σε υπολογισμό πιθανοτήτων της τυποποιημένης τυχαίας μεταβλητής Z, με τη χρήση του παρακάτω θεωρήματος. «Αν η τυχαία μεταβλητή X ακολουθεί την Κανονική Κατανομή N, τότε X είναι τυχαία μεταβλητή που ακολουθεί την τυπική Κανονική Κατανομή N 0, 1» Δηλαδή X Z και οι πιθανότητες υπολογίζονται με με τη χρήση του πίνακα της Κανονικής Κατανομής. Μαρίνα Σύρπη (016) 10
Υπολογισμός Πιθανοτήτων στην Κανονική Κατανομή - Παράδειγμα 3 Έστω ότι X N 5, 16. Τότε και Μαρίνα Σύρπη (016) 11
Μαρίνα Σύρπη (016) 1
Υπολογισμός Πιθανοτήτων στην Κανονική Κατανομή - Ασκήσεις Το αποτέλεσμα ενός I.Q. test ακολουθεί Κανονική Κατανομή με μέση τιμή 100 και τυπική απόκλιση 100. Να υπολογιστούν οι πιθανότητες ( α ) Το αποτέλεσμα του I.Q. test να ξεπερνά τις 18 μονάδες. ( β ) Το αποτέλσμα του I.Q. test να βρίσκεται μεταξύ 90 και 100 μονάδων. Το υπόλοιπο λογαριασμού σε ένα Τραπεζικό Λογαριασμό ακολουθεί την Κανονική Κατανομή με μέσο 4.5 χιλ. και τυπική απόκλιση 0.5 χιλ.. Να βρεθεί η πιθανότητα το υπόλοιπο ενός τυχαίου λογαρισμού να υπερβαίνει τις 5 χιλ. Σε μία Τράπεζα, το ύψος των καταθέσων όψεως, ακολουθεί την Κανονική Κατανομή με μέσο 500 και τυπική απόκλιση 150. Να υπολογιστεί η πιθανότητα το ύψος μιας τυχαία επιλεγμένα κατάθεσης να είναι μεταξύ 317 και 770. Μαρίνα Σύρπη (016) 13
Κατανομή του Δειγματικού Μέσου Κατανομές Δειγματοληψίας
Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν πληθυσμό αποδίδει διαφορετικές τιμές στον δειγματικό μέσο X, είναι αυτονόητο ότι ο δειγματικός μέσος είναι ο ίδιος μια τυχαία μεταβλητή. Για να μπορέσουμε λοιπόν να χρησιμοποιήσουμε αποτελεσματικά τον δειγματικό μέσο στην στατιστική συμπερασματολογία, θα πρέπει πρώτα να προσδιορίσουμε τη συμπεριφορά του. Με άλλα λόγια, θα πρέπει πρώτα να βρούμε την κατανομή του δειγματικού μέσου. Ονομάζουμε Κατανομή Δειγματοληψίας του δειγματικού μέσου, τη συνάρτηση κατανομής πιθανότητας της τυχαίας μεταβλητής X. Μαρίνα Σύρπη (016) 15
Πώς δημιουργείται η κατανομή δειγματοληψίας του δειγματικού μέσου ένα πολύ απλό παράδειγμα. Η κατανομή δειγματοληψίας του δειγματικού μέσου δημιουργείται όταν από τον πληθυσμό πάρουμε όλα τα δυνατά δείγματα μεγέθους n, και υπολογίσουμε τους δειγματικούς τους μέσους. Έστω λοιπόν ότι έχουμε έναν πληθυσμό μεγέθους N 6 ότι οι τιμές που παίρνει η μεταβλητή X που ενδιαφερόμαστε να μελετήσουμε είναι 1,, 3, 4, 5, 6. X και % f i 0,16 0,11 0,06 0,01-0,04 1 3 4 5 6 Χ Έχουμε επομένως μία μεταβλητή η οποία ακολουθεί την ομοιόμορφη κατανομή και της οποίας ο αριθμητικός μέσος είναι 1 3 4 5 6 1 3, 5 6 6 Μαρίνα Σύρπη (016) 16
Πώς δημιουργείται η κατανομή δειγματοληψίας του δειγματικού μέσου ένα πολύ απλό παράδειγμα. Έστω λοιπόν τώρα, ότι δεν προχωράμε στον υπολογισμό του αριθμητικού μέσου στον πληθυσμό αλλά αποφασίζουμε να εξάγουμε συμπεράσματα γι αυτόν από τον δειγματικό μέσο, που υπολογίζεται επιλέγοντας τυχαίο δείγμα μεγέθους n 4. Είναι γνωστό ότι από ένα σύνολο 6 αντικειμένων μπορούμε να σχηματίσουμε 15 διαφορετικές τετράδες, όταν η επιλογή των αντικειμένων γίνεται χωρίς επανάθεση. Έτσι, από τον πληθυσμό μας δημιουργούνται τα εξής 15 δείγματα μεγέθους 4. 1 1,, 3, 4 1,, 3, 5 3 1,, 3, 6 4 1,, 4, 5 5 1,, 4, 6 6 1,, 5, 6 7 1, 3, 4, 5 8 1, 3, 4, 6 9 1, 3, 5, 6 10 1, 4, 5, 6 11, 3, 4, 5 1, 3, 4, 6 13, 3, 5, 6 14, 4, 5, 6 15 3, 4, 5, 6 Μαρίνα Σύρπη (016) 17
Πώς δημιουργείται η κατανομή δειγματοληψίας του δειγματικού μέσου ένα πολύ απλό παράδειγμα. Από αυτά τα 15 ισοπίθανα δείγματα, βρίκουμε ότι ο δειγματικός μέσος μπορεί να πάρει τις παρακάτω τιμές. 1,5,75 3 3 4 3 5 3,5 6 3,5 7 3,5 8 3,5 9 3,75 10 4 11 3, 5 1 3,75 13 4 14 4,5 15 4,5 Έτσι λοιπόν, οι δειγματικοί μέσοι που υπολογίζονται από όλα τα δυνατά δείγματα μεγέθους 4 που μπορούμε να πάρουμε από τον πληθυσμό χωρίς επανάληψη, σχηματίζουν μία κατανομή. 0,0 0,18 % f i Κατανομή δειγματοληψίας του μέσου X 0,16 0,14 0,1 0,10 0,08 0,06 0,04 0,0 0,00,5,75 3 3,5 3,5 3,75 4 4,5 4,5 Δημιουργείται όλες τις διαφορετικές τιμές που λαμβάνει ο δειγματικός μέσος, όταν από τον πληθυσμό πάρουμε όλα τα δυνατά δείγματα ενός δεδομένου μεγέθους n X Μαρίνα Σύρπη (016) 18
Η Κατανομή του δειγματικού μέσου φαίνεται Κανονική, και όχι μόνον αυτό! % f i % f i 0,16 0,14 0,1 0,10 0,08 0,06 0,04 0,0 0,00 0,0 0,18 1 3 4 5 6 Χ Ξεκινήσαμε από έναν πληθυσμό με Ομοιόμορφη Κατανομή, και παίρνοντας όλα τα δυνατά δείγματος ίδιου μεγέθους, προσδιορίσαμε την κατανομή του δειγματικού μέσου, η οποία φαίνεται να είναι Κανονική. 0,16 0,14 0,1 0,10 0,08 0,06 0,04 0,0 Επιπλέον, όπως φαίνεται από το ιστόγραμμα, ο μέσος της κατανομής δειγματοληψίας είναι ίσος με τον μέσο της μεταβλητής X στον πληθυσμό. 0,00,5,75 3 3,5 3,5 3,75 4 4,5 4,5 X Δηλαδή 3,5 X, όπου ο μέσος της μεταβλητής X στον πληθυσμό και X ο μέσος όλων των δειγματικών μέσων (μέγεθος δειγμάτων n=4) Μαρίνα Σύρπη (016) 19
Κεντρικό Οριακό Θεώρημα Έστω τα τυχαία δείγματα μεγέθους n, που επιλέγονται από έναν πληθυσμό με μέση τιμή, και διασπορά Ο δειγματικός μέσος X είναι μία τυχαία μεταβλητή που ακολουθεί προσσεγγιστικά Κανονική Κατανομή με μέση τιμή και διασπορά δηλαδή X X N, και Z N0, 1 n n 1) Εάν ο πληθυσμός που μελετάμε ακολουθεί Κανονική Κατανομή, τότε ο δειγματικός μέσος X ακολουθεί επίσης Κανονική Κατανομή, οποιοδήποτε και αν είναι το μέγεθος του δείγματος που επιλέγουμε. ) Εάν ο πληθυσμός που μελετάμε δεν ακολουθεί Κανονική Κατανομή, τότε ο δειγματικός μέσος X ακολουθεί Κανονική Κατανομή, όταν το μέγεθος του δείγματος είναι μεγάλο. 3) Η τυπική απόκλιση n των δειγματικών μέσων ονομάζεται τυπικό σφάλμα του μέσου και εκφράζει το μέγεθος του σφάλματος της εκτιμώμενης από την πραγματική τιμή. n Μαρίνα Σύρπη (016) 0
Όσο το μέγεθος n του δείγματος μεγαλώνει, η κατανομή του δειγματικού μέσου τείνει προς την Κανονική Κατανομή, οποιαδήποτε και αν είναι η κατανομή του πληθυσμού. Μαρίνα Σύρπη (016) Επίσης, η διασπορά του γίνεται ολοένα μικρότερη, καθώς το μέγεθος του δείγματος μεγαλώνει. Αυτό σημαίνει, ότι το σύνολο των δειγματικών τιμών του μέσου, δηλαδή το σύνολο των δυνατών εκτιμήσεων που μπορούμε να πάρουμε από δείγματα μεγέθους n, συγκεντρώνονται σε ένα πολύ μικρό διάστημα γύρω από το μέσο των δειγματικών μέσων, και συνεπώς γύρω από την πραγματική τιμή της παραμέτρου στον πληθυσμό. 1