ΚΑΝΟΝΙΚΗ ΚΑΤΑΝΟΜΗ Ορισμός και Ιδιότητες H κανονική κατανομή norml distriution θεωρείται η σπουδαιότερη κατανομή της Θεωρίας Πιθανοτήτων και της Στατιστικής. Οι λόγοι που εξηγούν την εξέχουσα θέση της, είναι βασικά δύο: α Πολλές τυχαίες μεταβλητές περιγράφονται ικανοποιητικά από την κανονική κατανομή ή περιγράφονται από κατανομές που μπορούν να προσεγγισθούν από την κανονική κατανομή. β Οι ιδιότητες της κανονικής κατανομής αξιοποιούνται στη Στατιστική Συμπερασμασματολογία. Ουσιαστικά, η κανονική κατανομή, αποτελεί το θεμέλιο της Στατιστικής Συμπερασμασματολογίας. Στο πλαίσιο του μαθήματος, δε μπορούμε να αναφερθούμε περισσότερο στον δεύτερο από τους παραπάνω λόγους μιας και η ύλη δεν θα επεκταθεί σε αυτό το αντικείμενο. Ας εξηγήσουμε, τουλάχιστον, γιατί η κανονική κατανομή βρίσκει εφαρμογή σε μεγάλο πλήθος φαινομένων και πειραμάτων. Το «μυστικό» που εξηγεί το μεγάλο εύρος εφαρμογών της κανονικής κατανομής, βρίσκεται σε ένα εκπληκτικά ισχυρό θεωρητικό αποτέλεσμα της Θεωρίας Πιθανοτήτων το οποίο επιβεβαιώνεται και πειραματικά. Πρόκειται για το Κεντρικό Οριακό Θεώρημα Centrl Limit Theorem τις βάσεις του οποίου έθεσαν δύο μεγάλοι Μαθηματικοί. Ο de Moivre το 1718 και έναν αιώνα αργότερα, το 181, ο Lplce. Σε αυτό το σημείο, δε θα διατυπώσουμε αυστηρά, ούτε θα αποδείξουμε, το Κεντρικό Οριακό Θεώρημα. Θα προσπαθήσουμε να εξηγήσουμε μόνο το νόημα και τη σημασία του. Σύμφωνα με το Κεντρικό Οριακό Θεώρημα, το άθροισμα και -επομένως- η μέση τιμή, μεγάλου αριθμού ανεξάρτητων παρατηρήσεων, ακολουθεί κατά προσέγγιση κανονική κατανομή, ανεξαρτήτως από το ποια κατανομή ακολουθούν οι παρατηρήσεις. Πώς, όμως, αυτό το αποτέλεσμα ερμηνεύει τη μεγάλη εφαρμοσιμότητα της κανονικής κατανομής; Σε πολλά φαινόμενα και πειράματα, οι τιμές διαφόρων χαρακτηριστικών μεταβλητών, είναι αποτέλεσμα αθροιστικής επίδρασης πολλών ανεξάρτητων αιτιών-παραγόντων κανένα από τα οποία δεν υπερισχύει των άλλων. Για παράδειγμα, ο χρόνος αναμονής σε μια ουρά, είναι αποτέλεσμα πολλών παραγόντων, όπως, η ημέρα της εβδομάδας, η ώρα της ημέρας, η αποτελεσματικότητα του υπαλλήλου, το είδος της συναλλαγής που διεκπεραιώνεται, κ.ά.
Καθένας από τους παράγοντες αυτούς επιφέρει ένα θετικό ή αρνητικό αποτέλεσμα και όλοι μαζί αθροιστικά συντελούν στη διαμόρφωση του τελικού αποτελέσματος. Τέτοια χαρακτηριστικά μεταβλητές, εμφανίζονται σε πολλά φαινόμενα και πειράματα. Το Κεντρικό Οριακό Θεώρημα λέει ότι αυτά ακριβώς τα χαρακτηριστικά περιγράφονται ικανοποιητικά από την κανονική κατανομή. Επιπλέον, το Κεντρικό Οριακό Θεώρημα συνδέει την κανονική κατανομή με οποιαδήποτε άλλη κατανομή αφού δεν προϋποθέτει να ακολουθούν οι παρατηρήσεις την κανονική κατανομή, γεγονός το οποίο, απαντάει, επίσης, στο ερώτημα, γιατί η κανονική κατανομή βρίσκει εφαρμογή σε μεγάλο πλήθος φαινομένων και πειραμάτων. Η κανονική κατανομή, λοιπόν, είναι η πιο σημαντική από τις συνεχείς κατανομές. Στη βιβλιογραφία αναφέρεται και ως «Νόμος των σφαλμάτων» ή «κατανομή του Guss». Αν μια συνεχής τ.μ. X έχει συνάρτηση πυκνότητας πιθανότητας που δίνεται από τη σχέση fx x μ 1 σ e, για σ π x, τότε λέμε ότι η X ακολουθεί την κανονική κατανομή με παραμέτρους μ και σ και τη συμβολίζουμε ~ N μ, σ X. Η f x ως συνάρτηση πυκνότητας πιθανότητας ικανοποιεί ότι f x 0 για x και f x dx 1. Αποδεικνύεται ότι αν X ~ N μ, σ, τότε η αναμενόμενη τιμή και η διακύμανση της X, δίνονται αντίστοιχα από τις σχέσεις E X xf x dx μ και Vr X x f x dx E X σ. Η γραφική παράσταση της f x είναι μια καμπύλη σε σχήμα καμπάνας και ονομάζεται κανονική καμπύλη:
Η κανονική καμπύλη είναι συμμετρική γύρω από την κάθετο στο σημείο x μ. Επομένως η μέση τιμή, η διάμεσος και η επικρατούσα τιμή συμπίπτουν. Επίσης έχει μέγιστο στο σημείο x μ και ισούται με x μ σ. 1 f x. Τα σημεία καμπής βρίσκονται στα x μ σ και σ π Το διάστημα Το διάστημα Το διάστημα σχεδόν όλες. μ σ περιέχει προσεγγιστικά το 68% από όλες τις μετρήσεις. μ σ περιέχει προσεγγιστικά το 95% από όλες τις μετρήσεις. μ 3σ περιέχει προσεγγιστικά το 99.8% από όλες τις μετρήσεις, δηλαδή
Τυπική Κανονική κατανομή Η τυχαία μεταβλητή λέμε ότι ακολουθεί την τυπική ή τυποποιημένη κανονική κατανομή, όταν ακολουθεί την κανονική κατανομή με παραμέτρους 0 μ και 1 σ. Στην περίπτωση αυτή, υπολογίζουμε τις πιθανότητες δηλαδή τα εμβαδά κάτω από την κανονική καμπύλη από τους πίνακες των αθροιστικών πιθανοτήτων που βρίσκονται στο παράρτημα. Παράδειγμα: Αν ~ N0,1 να βρεθούν: α 0.85 β 0.85. Απάντηση: α 80 0. 0.85 β 198 0. 0.80 1 0.85 Ιδιότητες: i 1 ii iii iv 1 v vi 1 vii ] [1 1
Παράδειγμα: Αν ~ N0,1 να βρεθούν: α 1.96 β 1.96 γ 1.96 1.96 δ.81 0.65 ε 1.76 στ.87 1.3 Απάντηση: α 1.96 0. 975 β 1.96 1 0.975 0. 05 γ 1.96 1.96 0.975 1 0. 95 δ.81 0.65.81 0.65 1 0.9975 0.74 1 0.7397 ε 1.76 0.9608 1 0. 916 στ.87 1.3.87 1.3 0.9979 0.8907 0. 107 Παράδειγμα: Αν ~ N0,1 να βρεθούν οι τιμές του : α 0. 9693 β 0. 381 γ 0. 7357 δ 0. 0793 Απάντηση:
α Από τους πίνακες, 1. 87 β 0.381 1 1 0.381 0. 6179. Από τους πίνακες, 0. 30 γ Από τους πίνακες, 0.63 0. 7357. Επομένως 0. 63 δ Επειδή 1 0.0793 0. 907 και από τους πίνακες 1.41 0. 907, 1.41. Μέχρι τώρα είδαμε πως υπολογίζουμε τις πιθανότητες από τους πίνακες, όταν έχουμε να κάνουμε με μια τυχαία μεταβλητή που ακολουθεί την τυπική κανονική κατανομή. Τώρα θα δούμε πως βρίσκουμε τις πιθανότητες όταν έχουμε να κάνουμε με μια τ.μ. X ~ N μ, σ. Στην περίπτωση αυτή μετασχηματίζουμε οποιαδήποτε κανονική κατανομή σε τυπική κανονική κατανομή, ως ακολούθως: Η τ.μ. X μ, είναι εκ κατασκευής τέτοια ώστε ~ N0,1. σ Για παράδειγμα αν X ~ N300,5 και ζητάμε την X 91, γράφουμε: X 300 91 300 X 91 1.8 1 1.8 0.0359 5 5 Παράδειγμα: Ο χρόνος που χρειάζεται καθημερινά ο ταχυδρόμος για να παραδώσει τα γράμματα των κατοικιών σε κάποιο δρόμο ακολουθεί την κανονική κατανομή με μέσο 1 λεπτά και τυπική απόκλιση λεπτά. Να υπολογίσετε τον αριθμό των ημερών το χρόνο 365 ημέρες όπου ο ταχυδρόμος χρειάζεται για παράδοση γραμμάτων α σε περισσότερο από 17 λεπτά β σε λιγότερο από 10 λεπτά γ μεταξύ 9 και 13 λεπτών
Απάντηση: Έστω X η τ.μ. «ο χρόνος παράδοσης των γραμμάτων στο συγκεκριμένο δρόμο». Τότε ~ N1, X. X 1 17 1 α X 17.5 1 0.9938 0. 006 Επομένως ο ζητούμενος αριθμός το χρόνο είναι 3650.006. 7, δηλαδή περίπου ημέρες. X 1 10 1 β X 10 1 1 0.8413 0. 1587 Επομένως ο ζητούμενος αριθμός το χρόνο είναι 3650.1587 57. 9, δηλαδή περίπου 58 ημέρες. γ 9 1 X 1 13 1 9 X 13 1.5 0.5 0.6915 0.933 1 0.647 Επομένως ο ζητούμενος αριθμός το χρόνο είναι 3650.647 88, δηλαδή 88 ημέρες. Σημείωση: Παρατηρείστε ότι επειδή η X είναι συνεχής τ.μ. οι πιθανότητες των 9 X 13, 9 X 13, 9 X 13, 9 X 13 δεν διαφέρουν. Παράδειγμα: Αν η τ.μ. X ~ N100,36 και X 0. 8907 να βρεθεί η τιμή του. X Απάντηση: Από την X 0. 8907, έχουμε ότι 0. 8907, άρα 100 0.8907. Από τους πίνακες 1.3 0. 8907, επομένως 6 100 1.3 100 61.3 107.38. 6
Παράδειγμα: Τα αντρικά πουλόβερ κατατάσσονται σε 4 κατηγορίες μεγέθους S, M, L, XL που αντιστοιχούν σε περίμετρο στήθους κάτω από 85 cm για το S, 85-105 cm για το M, 105-15 cm για το L και πάνω από 15 cm για το XL. Αν η περίμετρος X του αντρικού στήθους ακολουθεί την N 100,49 και πρόκειται να κατασκευάσουμε συνολικά 1000 πουλόβερ, πόσα θα πρέπει να κατασκευάσουμε για κάθε κατηγορία μεγέθους για να ανταποκριθούμε στην αναμενόμενη ζήτηση; Απάντηση: Αν η τ.μ. X «αντρική περίμετρος στήθους», τότε X ~ N100,7. Αρχικά θα υπολογίσουμε την πιθανότητα που αντιστοιχεί στα δεδομένα όρια για κάθε κατηγορία: X 100 85 100 X 85.14 1.14 7 7 1 0.9838 0.016. 85 100 X 100 105 100 85 X 105.14 0.71 7 7 7 0.71.14 0.7611 0.016 0.7449. 105 100 X 100 15 100 105 X 15 0.71 7 7 7 3.57 0.71 0.9998 0.7611 0.387. 3.57 X 100 15 100 X 15 3.57 1 3.57 7 7 1 0.9998 0.000. Επομένως για 1000 πουλόβερ, η αναμενόμενη ζήτηση για κάθε κατηγορία μεγέθους είναι: κάτω από 85 cm S 0.016 1000 16 πουλόβερ 85 105 cm M 0.7449 1000 745 πουλόβερ 105 15 cm L 0.387 1000 39 πουλόβερ πάνω από 15 cm XL 0.000 1000 0 πουλόβερ