Η Κανονική Κατανομή. Εργαστήριο Μαθηματικών & Στατιστικής/ Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 81

Σχετικά έγγραφα
Η Κανονική Κατανομή κανονική κατανομή (normal distribution) Κεντρικό Οριακό Θεώρημα (Central Limit Theorem) συνδέει οποιαδήποτε άλλη κατανομή

Ορισμός και Ιδιότητες

14/11/2016. Στατιστική Ι. 7 η Διάλεξη (Βασικές συνεχείς κατανομές)

Στατιστική Επιχειρήσεων Ι. Βασικές συνεχείς κατανομές

Το Κεντρικό Οριακό Θεώρημα

1 x-μ - 2 σ. e σ 2π. f(x) =

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα

Περιεχόμενα της Ενότητας. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς Κατανομές Πιθανότητας. Συνεχείς Κατανομές Πιθανότητας.

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

& 4/12/09 Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ

Η Κανονική Κατανομή. Κανονικές Κατανομές με την ίδια διασπορά και διαφορετικές μέσες τιμές.

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων

Εισαγωγή στην Κανονική Κατανομή. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη

Η Διωνυμική Κατανομή. μαθηματικών. 2 Ο γονότυπος μπορεί να είναι ΑΑ, Αα ή αα.

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

. Τι πρακτική αξία έχουν αυτές οι πιθανότητες; (5 Μονάδες)

ΚΑΤΑΝΟΜΗ ΠΥΚΝΟΤΗΤΑΣ ΠΙΘΑΝΟΤΗΤΑΣ

ΟΜΑΔΟΠΟΙΗΣΗ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ

Εργαστήριο Μαθηµατικών & Στατιστικής. 1 η Πρόοδος στο Μάθηµα Στατιστική 5/12/08 Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ. 3 ο Θέµα

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Στατιστική Ι. Ενότητα 7: Κανονική Κατανομή. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ

Κεφάλαιο 8 Συνεχείς Κατανομές Πιθανοτήτων

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΟΥ ΕΠΑ.Λ. Δ. Ε. ΚΟΝΤΟΚΩΣΤΑΣ ΜΑΘΗΜΑΤΙΚΟΣ

Ελλιπή δεδομένα. Εδώ έχουμε Στον πίνακα που ακολουθεί δίνεται η κατά ηλικία κατανομή 1275 ατόμων

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ TECHNOLOGICAL EDUCATIONAL INSTITUTE OF WESTERN GREECE

ΑΣΚΗΣΕΙΣ Γ.Π. ΚΕΦ 1,2,3

ΑΣΥΜΜΕΤΡΙΑ Ας υποθέσουμε, ότι κατά την μελέτη της κατανομής δύο μεταβλητών, καταλήγουμε στα παρακάτω ιστογράμματα.

ΣΤΑΤΙΣΤΙΚΗ. Ερωτήσεις του τύπου «Σωστό - Λάθος» 1. Το χρώμα κάθε αυτοκινήτου είναι ποιοτική μεταβλητή. Σ Λ

ΣΤΑΤΙΣΤΙΚΗ 1 Τί λέγεται πληθυσμός τι άτομα και τι μεταβλητή ενός πληθυσμού 2. Ποιες μεταβλητές λέγονται ποιοτικές ή κατηγορικές; 3.

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Pr(10 X 15) = Pr(15 X 20) = 1/2, (10.2)

Ποσοτικές Μέθοδοι., Εισηγητής: Ν.Κυρίτσης, MBA, Ph.D. Candidate,,

3. Κατανομές πιθανότητας

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Διαστήματα εμπιστοσύνης, εκτίμηση ακρίβειας μέσης τιμής

ΕΡΩΤΗΣΕΙΣ ΘΕΩΡΙΑΣ. για τα οποία ισχύει y f (x) , δηλαδή το σύνολο, x A, λέγεται γραφική παράσταση της f και συμβολίζεται συνήθως με C

F x h F x f x h f x g x h g x h h h. lim lim lim f x

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Α) Αν η διάμεσος δ του δείγματος Α είναι αρνητική, να βρεθεί το εύρος R του δείγματος.

Η παρουσίαση που ακολουθεί, αφορά την κανονική κατανομή και σκοπό έχει τη διευκόλυνση των φοιτητών του τμήματος Ηλεκτρολόγων Μηχανικών & Μηχανικών

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2011 για τα Τμήματα Ε.Τ.Τ. και Γ.Β. στη Στατιστική 25/02/2011

ΜΑΘΗΜΑΤΙΚΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ - ΟΙΚΟΝΟΜΙΑΣ & ΠΛΗΡΟΦΟΡΙΚΗΣ Γ ΛΥΚΕΙΟΥ ΘΕΩΡΙΑ & ΑΠΟΔΕΙΞΕΙΣ

Ενδεικτικές ασκήσεις ΔΙΠ 50

, όπου x = 0,1,..., Έτσι, για την πιθανότητα σε ένα έτος να μην υπάρξουν θάνατοι ζώων από τον εμβολιασμό έχουμε, 2! !

Εισαγωγή στη Στατιστική

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2013 στη Στατιστική

Για την τοπική μελέτη μιας συνάρτησης f ενδιαφέρον έχει η συμπεριφορά της συνάρτησης γύρω απο κάποια θέση x 0

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΥΝΔΥΑΣΤΙΚΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΜΑΘΗΜΑΤΙΚΩΝ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

ΚΕΦΑΛΑΙΟ 2 ο : ΣΤΑΤΙΣΤΙΚΗ

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8

Α. Έστω δύο σύνολα Α και Β. Ποιά διαδικασία ονομάζεται συνάρτηση με πεδίο ορισμού το Α και πεδίο τιμών το Β;

Πίνακας-1 Επίπεδο εκπαίδευσης πατέρα 2

Μια από τις σημαντικότερες δυσκολίες που συναντά ο φυσικός στη διάρκεια ενός πειράματος, είναι τα σφάλματα.

X = = 81 9 = 9

ΣΧ0ΛΗ ΤΕΧΝ0Λ0ΓΙΑΣ ΤΡΟΦΙΜΩΝ & ΔΙΑΤΡΟΦΗΣ ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΡΟΦΙΜΩΝ ΕΡΓΑΣΤΗΡΙΟ: ΟΡΓΑΝΟΛΗΠΤΙΚΟΥ ΕΛΕΓΧΟΥ ΓΙΑΝΝΑΚΟΥΡΟΥ ΜΑΡΙΑ ΤΑΛΕΛΛΗ ΑΙΚΑΤΕΡΙΝΗ

ΣΤΑΤΙΣΤΙΚΟΙ ΠΙΝΑΚΕΣ. ΓΕΝΙΚΟΙ (περιέχουν όλες τις πληροφορίες που προκύπτουν από μια στατιστική έρευνα) ΕΙΔΙΚΟΙ ( είναι συνοπτικοί και σαφείς )

Διάλεξη 1 Βασικές έννοιες

Συμπεριφορά συναρτήσεως σε κλειστές φραγμένες περιοχές. (x 0, y 0, f(x 0, y 0 ) z = L(x, y)

ΘΕΜΑΤΑ ΠΑΝΕΛΛΑΔΙΚΩΝ-ΣΤΑΤΙΣΤΙΚΗΣ. Να γράψετε στο τετράδιο σας τον πίνακα των τιμών της μεταβλητής Χ σωστά συμπληρωμένο.

Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ

Μ Α Θ Η Μ Α Τ Α Γ Λ Υ Κ Ε Ι Ο Υ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

Στατιστική Ι (ΨΥΧ-1202) ΑΣΚΗΣΕΙΣ

Άσκηση 1: Λύση: Για το άθροισμα ισχύει: κι επειδή οι μέσες τιμές των Χ και Υ είναι 0: Έτσι η διασπορά της Ζ=Χ+Υ είναι:

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

Στατιστική Επιχειρήσεων ΙΙ


Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

ΜΑΘΗΜΑΤΙΚΑ. 1 ο ΔΙΑΓΩΝΙΣΜΑ. ΘΕΜΑ 1 ο Δίνεται η συνάρτηση f x. Ι. Το πεδίο ορισμού της f είναι:., 1 υ -1, B. 1, Γ. -1,., 1.

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Transcript:

Η Κανονική Κατανομή H κανονική κατανομή (ormal dstrbuto) θεωρείται η σπουδαιότερη κατανομή της Θεωρίας Πιθανοτήτων και της Στατιστικής Οι λόγοι που εξηγούν την εξέχουσα θέση της, είναι βασικά δύο: ) Πολλές τυχαίες μεταβλητές περιγράφονται ικανοποιητικά από την κανονική κατανομή ή περιγράφονται από κατανομές που μπορούν να προσεγγισθούν από την κανονική κατανομή ) Οι ιδιότητες της κανονικής κατανομής αξιοποιούνται στη Στατιστική Συμπερασμασματολογία Ουσιαστικά, η κανονική κατανομή, αποτελεί το θεμέλιο της Στατιστικής Συμπερασμασματολογίας Στο Β Μέρος, θα έχουμε την ευκαιρία να διαπιστώσουμε πόσο σημαντική είναι η κανονική κατανομή στη Στατιστική Συμπερασματολογία Προς το παρόν, ας σταθούμε λίγο περισσότερο στον πρώτο από τους παραπάνω λόγους Ας προσπαθήσουμε, δηλαδή, να εξηγήσουμε γιατί η κανονική κατανομή βρίσκει εφαρμογή σε πολλά φαινόμενα και πειράματα Το «μυστικό» που εξηγεί το μεγάλο εύρος εφαρμογών της κανονικής κατανομής, βρίσκεται σε ένα εκπληκτικά ισχυρό θεωρητικό αποτέλεσμα της Θεωρίας Πιθανοτήτων το οποίο επιβεβαιώνεται και πειραματικά Πρόκειται για το Κεντρικό Οριακό Θεώρημα (Cetral Lmt Theorem) τις βάσεις του οποίου έθεσαν δύο μεγάλοι Μαθηματικοί Ο Abraham De Movre το 7 και, έναν αιώνα περίπου αργότερα, το 8, ο Laplace Σε αυτό το σημείο, δε θα διατυπώσουμε αυστηρά, ούτε θα αποδείξουμε, το Κεντρικό Οριακό Θεώρημα Θα προσπαθήσουμε να εξηγήσουμε μόνο το νόημα και τη σημασία του Αργότερα, θα δώσουμε μια πληρέστερη διατύπωση Σύμφωνα με το Κεντρικό Οριακό Θεώρημα, το άθροισμα και επομένως - η μέση τιμή, μεγάλου αριθμού ανεξάρτητων παρατηρήσεων, ακολουθεί κατά προσέγγιση κανονική κατανομή, ανεξαρτήτως από το ποια κατανομή ακολουθούν οι παρατηρήσεις Πώς, όμως, αυτό το αποτέλεσμα ερμηνεύει τη μεγάλη εφαρμοσιμότητα της κανονικής κατανομής; Είναι απλό Σε πολλά φαινόμενα και πειράματα, οι τιμές διαφόρων χαρακτηριστικών (μεταβλητών), είναι αποτέλεσμα αθροιστικής επίδρασης πολλών ανεξάρτητων αιτίων-παραγόντων κανένα από τα οποία δεν υπερισχύει των άλλων Για παράδειγμα, ο χρόνος αναμονής σε μια ουρά, είναι αποτέλεσμα πολλών παραγόντων, όπως, η ημέρα της εβδομάδας, η ώρα της ημέρας, η αποτελεσματικότητα του υπαλλήλου, το είδος της συναλλαγής που διεκπεραιώνεται, κά Επίσης, το βάρος των ζώων μιας κτηνοτροφικής μονάδας, οφείλεται σύμφωνα με τους ειδικούς, σε πληθώρα παραγόντων όπως, η ατομικότητα του ζώου, η φυλή, το γένος, οι συνθήκες διατροφής, οι συνθήκες ενσταυλισμού, κά Καθένας από τους παράγοντες αυτούς επιφέρει ένα θετικό ή αρνητικό αποτέλεσμα και όλοι μαζί αθροιστικά συντελούν στη διαμόρφωση του τελικού αποτελέσματος Τέτοια χαρακτηριστικά (μεταβλητές), εμφανίζονται σε πολλά φαινόμενα και πειράματα Το Κεντρικό Οριακό Θεώρημα λεει ότι αυτά ακριβώς τα χαρακτηριστικά περιγράφονται ικανοποιητικά από την κανονική κατανομή Επιπλέον, το Κεντρικό Οριακό Θεώρημα συνδέει την κανονική κατανομή με οποιαδήποτε άλλη κατανομή (αφού δεν προϋποθέτει να ακολουθούν οι παρατηρήσεις την κανονική κατανομή), γεγονός το οποίο, απαντάει, επίσης, στο ερώτημα, γιατί η κανονική κατανομή βρίσκει εφαρμογή σε μεγάλο πλήθος φαινομένων και πειραμάτων Πρέπει να τονίσουμε ότι για να αποδειχθεί ότι ένα συγκεκριμένο χαρακτηριστικό (μεταβλητή) προσεγγίζεται ικανοποιητικά από την κανονική κατανομή, πρέπει να Εργαστήριο Μαθηματικών & Στατιστικής/ Γ Παπαδόπουλος (wwwauagr/gpapadopoulos) 8

γίνουν μετρήσεις που να επαληθεύουν ένα τέτοιο συμπέρασμα Μια από τις πρώτες εφαρμογές της κανονικής κατανομής, έγινε το 809 από το μεγάλο Γερμανό Μαθηματικό Carl F Gauss ο οποίος διαπίστωσε ότι τα σφάλματα που γίνονται σε αστρονομικές παρατηρήσεις μπορούν να περιγραφούν ικανοποιητικά από την κανονική κατανομή Στη συνέχεια, διαπιστώθηκε επίσης, ότι τα τυχαία σφάλματα (όχι τα συστηματικά) που εμφανίζονται σε διάφορες μετρήσεις ακολουθούν με ικανοποιητική προσέγγιση κανονική κατανομή Για το λόγο αυτό, η κανονική κατανομή ονομάζεται και κατανομή των σφαλμάτων (law of errors) Επίσης, είναι γνωστή ως κατανομή του Gauss (Gaussa dstrbuto), για τη μεγάλη συνεισφορά του Gauss στην ανάδειξη των ιδιοτήτων και της σημασίας της Κανονική κατανομή ονομάσθηκε στις αρχές του 0 ου αιώνα από τον Pearso Όμως, για το πώς και από ποιόν εισήχθη η κανονική κατανομή, θα αναφερθούμε αργότερα όταν μιλήσουμε πιο αναλυτικά για το Κεντρικό Οριακό Θεώρημα Τέλος, ως πρόσθετη σχετική πληροφορία, αναφέρουμε ότι στο γερμανικό χαρτονόμισμα των δέκα μάρκων υπήρχαν, φωτογραφία του Gauss, η κανονική καμπύλη και ο μαθηματικός τύπος της!! Η συνάρτηση πυκνότητας της κανονικής κατανομής δίνεται από τον τύπο, ( x μ ) σ f ( x) = e, < x < + σ π όπου, σ > 0 η τυπική απόκλιση και μ η μέση τιμή της μεταβλητής, με < μ < + Η γραφική της παράσταση είναι γνωστή ως κανονική καμπύλη και έχει κωδωνοειδή μορφή Παρατηρείστε ότι στον τύπο της συνάρτησης πυκνότητας της κανονικής κατανομής, εμφανίζονται δύο πολύ «διάσημοι» άρρητοι αριθμοί: ο π, 4 και ο e, 7 Ιδιότητες της κανονικής καμπύλης Η κανονική καμπύλη είναι συμμετρική και οι «ουρές» της πλησιάζουν τον οριζόντιο άξονα ομαλά (ασυμπτωτικά) Η μέση τιμή και η διάμεσος ταυτίζονται Επίσης, η κορυφή ταυτίζεται με τη μέση τιμή και τη διάμεσο Έτσι, η περιοχή που παρουσιάζει τη μεγαλύτερη πυκνότητα, βρίσκεται και αυτή στο μέσο της κατανομής Δηλαδή, όταν οι τιμές μιας μεταβλητής είναι κανονικά κατανεμημένες, τότε γύρω από τη μέση τιμή τους υπάρχουν σχετικά πολλές τιμές ενώ μακριά από τη μέση τιμή βρίσκονται σχετικά λίγες τιμές Για παράδειγμα, αν το ύψος των ελλήνων, ηλικίας 8 έως 5 ετών, είναι κανονικά κατανεμημένο, με μέση τιμή 70 cm και τυπική απόκλιση 5 cm, τότε μεταξύ 70 cm και 75 cm βρίσκονται περισσότερα άτομα από όσα βρίσκονται μεταξύ 80 cm και 85 cm Επίσης, πολύ λίγα άτομα έχουν ύψος μεγαλύτερο από 85 cm ή μικρότερο από 55 cm Δες και το σχόλιο στη σελίδα 88 Ενδεικτική της αναγνώρισης της σημασίας της κανονικής κατανομής και του έργου του Gauss Αυτός ο τύπος υπήρχε στο χαρτονόμισμα των δέκα μάρκων!! Εργαστήριο Μαθηματικών & Στατιστικής/ Γ Παπαδόπουλος (wwwauagr/gpapadopoulos) 8

Παρατηρείστε ότι η καμπύλη της συνάρτησης πυκνότητας της κανονικής κατανομής, 099 παρουσιάζει μέγιστη τιμή, ίση με =, στη θέση x = μ και στις θέσεις σ π σ x = μ σ και x = μ + σ παρουσιάζει σημεία καμπής Είναι φανερό, ότι η συνάρτηση πυκνότητας της κανονικής κατανομής δεν ορίζει μια συγκεκριμένη κανονική καμπύλη αλλά μια οικογένεια κανονικών καμπύλων Έτσι, για διαφορετικές τιμές των παραμέτρων μ και σ παίρνουμε διαφορετικές κανονικές καμπύλες Για παράδειγμα, οι κατανομές, είναι όλες κανονικές κατανομές, με ίδια μέση τιμή και διαφορετικές τυπικές αποκλίσεις Επίσης, οι κατανομές, είναι όλες κανονικές κατανομές με ίδιες τυπικές αποκλίσεις και διαφορετικές μέσες τιμές Είναι φανερό, ότι αλλαγή της μέσης τιμής προκαλεί μόνο μετατόπιση της κανονικής καμπύλης σε μια νέα θέση Αλλαγή, της τυπικής απόκλισης, όμως, προκαλεί αλλαγή Εργαστήριο Μαθηματικών & Στατιστικής/ Γ Παπαδόπουλος (wwwauagr/gpapadopoulos) 8

στην κανονική καμπύλη (χωρίς, φυσικά να αλλάζει η κωδωνοειδής μορφή της) Για παράδειγμα, όσο μικρότερη είναι η τυπική απόκλιση, τόσο ψηλότερη και τόσο πιο στενή είναι η κανονική καμπύλη Δηλαδή, τόσο μικρότερο είναι το διάστημα στο οποίο, πρακτικά, εκτείνεται η κατανομή Επισημαίνουμε ότι οι παράμετροι μ και σ χαρακτηρίζουν την κανονική κατανομή, δηλαδή, μπορούμε να την προσδιορίσουμε πλήρως αν γνωρίζουμε μόνο τη μέση τιμή της, μ και την τυπική απόκλισή της, σ Η κανονική κατανομή με μέση τιμή μ και διασπορά σ (δηλαδή τυπική απόκλιση σ ) συμβολίζεται με N ( μ, σ ) Το εμβαδόν του χωρίου που περικλείεται από την καμπύλη της συνάρτησης πυκνότητας και τον άξονα των τιμών της Χ είναι ίσο με και εκφράζει την πιθανότητα η Χ να πάρει κάποια τιμή μεταξύ και + Ανάλογα, το εμβαδόν του σκιαγραφημένου χωρίου Α στο επόμενο σχήμα, εκφράζει την πιθανότητα η Χ να πάρει κάποια τιμή μεταξύ των τιμών α και β, δηλαδή, A = α X β ) το εμβαδόν του σκιαγραφημένου χωρίου Β στο επόμενο σχήμα, εκφράζει την πιθανότητα η Χ να πάρει κάποια τιμή μικρότερη ή ίση του α, δηλαδή, B = X α) το εμβαδόν του σκιαγραφημένου χωρίου Γ στο επόμενο σχήμα, εκφράζει την πιθανότητα η Χ να πάρει κάποια τιμή μεγαλύτερη ή ίση του α, δηλαδή, Γ = X a) Επισήμανση: Πρέπει να επισημάνουμε ότι η τιμή f (x) της συνάρτησης πυκνότητας για συγκεκριμένη τιμή x της Χ, δεν αντιστοιχεί σε πιθανότητα, δηλαδή, δεν ισχύει f ( x) = P ( X = x) Εξάλλου, στις συνεχείς μεταβλητές, η πιθανότητα P ( X = x) είναι μηδέν 4 Τι εκφράζει επομένως η f (x) ; Η f (x) εκφράζει πυκνότητα, δηλαδή, όσο μεγαλύτερη είναι η τιμή f (x) τόσο περισσότερο πιθανό είναι να πάρει η μεταβλητή X τιμές κοντά στο x Ερώτηση: Η f (x) μπορεί να πάρει τιμές μεγαλύτερες του ; 4 Αυτός είναι και ο λόγος που στις συνεχείς μεταβλητές έχουμε: P ( X α ) = X < α), X α ) = X > α ) και P ( α X β ) = α < X < β ) = P ( α X < β ) = = P ( α < X β ) Εργαστήριο Μαθηματικών & Στατιστικής/ Γ Παπαδόπουλος (wwwauagr/gpapadopoulos) 84

Η Τυποποιημένη Κανονική Κατανομή Η κανονική κατανομή που έχει μέση τιμή 0 και τυπική απόκλιση (άρα και διασπορά ), συμβολίζεται με N (0,) και ονομάζεται τυποποιημένη (ή τυπική) κανονική κατανομή (stadard ormal dstrbuto) Μια τυχαία μεταβλητή που ακολουθεί την τυποποιημένη κανονική κατανομή, έχει επικρατήσει να συμβολίζεται με Ζ και η συνάρτηση πυκνότητάς της με ϕ (z) Προφανώς είναι: ϕ ( z) = e, < z < + π Σύμφωνα με τα προηγούμενα, η καμπύλη της τυποποιημένης κανονικής κατανομής z στη θέση x = 0 παρουσιάζει μέγιστη τιμή (ίση με = 0 99 ) και στις θέσεις π x = και x = παρουσιάζει σημεία καμπής Υπολογισμός πιθανοτήτων Σύμφωνα με όσα ήδη έχουμε αναφέρει, ο υπολογισμός πιθανοτήτων, ανάγεται στον υπολογισμό εμβαδών επιπέδων χωρίων Δυστυχώς, καμία από τις γνωστές τεχνικές ολοκλήρωσης δε μας επιτρέπει τον αναλυτικό υπολογισμό του κατάλληλου, κατά περίπτωση, ορισμένου ολοκληρώματος της f (x) Στην πράξη, για να υπολογίσουμε τις πιθανότητες που αφορούν τις τιμές τυχαίας μεταβλητής που ακολουθεί κανονική κατανομή N ( μ, σ ), χρησιμοποιούμε τον πίνακα της τυποποιημένης κανονικής κατανομής N (0,) Ο πίνακας της τυποποιημένης κανονικής κατανομής 5, μας δίνει την πιθανότητα P ( Z z) για όλα τα z από 0 έως 59 με βήμα 00 Ας συμβολίσουμε αυτή την πιθανότητα με Φ (z) Προφανώς πρόκειται για τη συνάρτηση κατανομής της τυποποιημένης κανονικής κατανομής, δηλαδή, Φ ( z) = P ( Z z) Ο πίνακας, επομένως, της τυποποιημένης κανονικής κατανομής μας δίνει το εμβαδόν του σκιαγραφημένου χωρίου το οποίο συμβολίζεται με Φ (z) 5 Υπάρχει σε κάθε βιβλίο Πιθανοτήτων και Στατιστικής Εργαστήριο Μαθηματικών & Στατιστικής/ Γ Παπαδόπουλος (wwwauagr/gpapadopoulos) 85

Από τη συμμετρία της κανονικής καμπύλης, εύκολα προκύπτει ότι: Φ ( z) = Φ( z), δηλαδή, P ( Z z) = Φ( z) = Φ( z) Σημείωση: Η ιδιότητα αυτή εξηγεί γιατί ο πίνακας της τυποποιημένης κανονικής κατανομής δίνει τις τιμές της Φ (z) μόνο για μη αρνητικά z Εύκολα, επίσης, προκύπτει ότι: P ( α Z β ) = Φ( β ) Φ( α) P ( α Z α) = Φ( α) Φ( α ) = Φ( α) P ( Z > a) = Z α) = Φ( α) Είναι φανερό, ότι μπορούμε πλέον, να υπολογίσουμε οποιαδήποτε πιθανότητα για τη Ζ με βάση μόνο τις τιμές Φ (z) του πίνακα της τυποποιημένης κανονικής κατανομής Ας δούμε μερικά παραδείγματα: P ( Z 0) = Φ(0) = 05 P ( Z,7) = Φ(7) = 0947 P ( Z > 7) = Z 7) = Φ(7) = 0947 = 0085 P ( Z 55) = Φ( 55) = Φ(55) = 0994 = 06 P ( 55 Z ) = Φ() Φ( 55) = Φ() [ Φ(55)] = = Φ() + Φ(55) = 098 + 0994 = 095 P ( Z ) = Φ() = 084 = 0686 68% P ( Z ) = Φ() = 0977 = 09544 955% P ( Z ) = Φ() = 09987 = 09974 997% Ερώτηση: Μπορείτε να εξηγήσετε γιατί ο πίνακας της τυποποιημένης κανονικής κατανομής δίνει τις τιμές της Φ (z) μέχρι z = 59 ; Όπως, ήδη, έχουμε αναφέρει, μέσω του πίνακα της τυποποιημένης κανονικής κατανομής, μπορούμε να υπολογίσουμε πιθανότητες για οποιαδήποτε κανονική κατανομή N ( μ, σ ) Αυτό μπορεί να γίνει διότι έχει αποδειχθεί ότι: Αν η τυχαία μεταβλητή Χ ακολουθεί μια κανονική κατανομή N( μ, σ ) τότε η τυχαία μ μεταβλητή Z = X, ακολουθεί την τυποποιημένη κανονική N (0,) σ Έτσι, αν η τυχαία μεταβλητή Χ, ακολουθεί κανονική κατανομή με μ = 5 και σ =, η πιθανότητα P ( X 4) μπορεί να υπολογισθεί ως εξής: 5 X 5 4 5 P ( X 4) = P ( ) = 04 Z 5) =,,, = Φ(5) Φ(04) = 08944 0668 = 06 Εργαστήριο Μαθηματικών & Στατιστικής/ Γ Παπαδόπουλος (wwwauagr/gpapadopoulos) 86

Στο παρακάτω σχήμα φαίνεται ο μετασχηματισμός της N (5, ) στην N (0,) Παράδειγμα : Έχει παρατηρηθεί ότι ο χρόνος που χρειάζεται ένα ασθενοφόρο για να φθάσει από ένα κέντρο υγείας, στο πλησιέστερο περιφερειακό νοσοκομείο, ακολουθεί κατά προσέγγιση κανονική κατανομή με μέση τιμή μ = 7 m και τυπική απόκλιση σ = m Να βρεθεί η πιθανότητα, ο χρόνος που θα χρειασθεί το ασθενοφόρο για να φθάσει στο περιφερειακό νοσοκομείο να είναι α) το πολύ 5 m β) περισσότερο από m και γ) τουλάχιστον m και το πολύ m X 7 X 7 Απάντηση: α) P ( X 5) = ) = Z 067) = Φ( 067) = = Φ(067) = 07486 = 05 X 7 7 β) P ( X > ) = > ) = Z > 67) = Z 67) = = Φ(67) = 0955 = 00475 7 X 7 7 γ) P ( X ) = P ( ) = Z ) = = Φ() = 0908 = 0864 Παράδειγμα : Στην Περιγραφική Στατιστική, όπως θα δούμε στη συνέχεια, χρησιμοποιείται ένας κανόνας, γνωστός ως εμπειρικός κανόνας (emprcal rule) γιατί πολύ συχνά επαληθεύεται εμπειρικά σε διάφορα πειράματα και φαινόμενα, σύμφωνα με τον οποίο, αν η κατανομή ενός δείγματος τιμών μιας τυχαίας μεταβλητής είναι κανονική, τότε το ποσοστό των τιμών του δείγματος που απέχει από τη μέση τιμή του, λιγότερο α) από μια τυπική απόκλιση είναι περίπου 68% β) από δύο τυπικές αποκλίσεις είναι περίπου 95% και γ) από τρεις τυπικές αποκλίσεις είναι περίπου 997% Ας αποδείξουμε αυτό τον κανόνα και μάλιστα, σε γενικότερη μορφή: Αν μια τυχαία μεταβλητή Χ ακολουθεί μια κανονική κατανομή N ( μ, σ ), τότε το ποσοστό των τιμών της που απέχει από τη μέση τιμή μ λιγότερο από k τυπικές αποκλίσεις είναι ίσο με Φ( k ) Απάντηση: Πρέπει να δείξουμε ότι μ k σ X μ + k σ ) = Φ( k) Πράγματι, X μ μ k σ X μ + k σ ) = k σ X μ + k σ ) = k + k) = σ = k Z + k) = Φ( k) Έτσι, για k =,,, έχουμε: P ( μ σ X μ + σ ) = Φ() = 0686 68% P ( μ σ X μ + σ ) = Φ() = 09544 955% Εργαστήριο Μαθηματικών & Στατιστικής/ Γ Παπαδόπουλος (wwwauagr/gpapadopoulos) 87

P ( μ σ X μ + σ ) = Φ() = 09974 997% Η Κανονική Κατανομή Σχόλιο: Ίσως σας έχει δημιουργηθεί το εξής ερώτημα: Πώς είναι δυνατόν τυχαίες μεταβλητές που παίρνουν μόνο θετικές τιμές ή πεπερασμένου πλήθους τιμές, όπως μεταβλητές που εκφράζουν μήκη, χρόνους ζωής, χρονική διάρκεια φαινομένων κλπ, να περιγράφονται από την κανονική κατανομή η οποία θεωρητικά παίρνει άπειρου πλήθους τιμές και μάλιστα από το μέχρι το + ; Για παράδειγμα, η πιθανότητα P ( X > α) έχει κάποια τιμή όσο μεγάλο και αν είναι το α Αν όμως Χ είναι το ύψος του ανθρώπου και έχει διαπιστωθεί ότι προσεγγίζεται από την κανονική κατανομή, τότε αυτό σημαίνει ότι με βάση το μoντέλο μας (την κανονική κατανομή) θα υπήρχε ένα ποσοστό ανθρώπων, έστω πολύ μικρό, με ύψος Χ>0 μέτρα!!! Επίσης, η πιθανότητα P ( X < 0) έχει κάποια τιμή Δηλαδή, θα υπήρχε ένα ποσοστό ανθρώπων, έστω πολύ μικρό, με αρνητικό ύψος!!! Τι μπορεί να συμβαίνει; Μια πρώτη εξήγηση είναι η εξής Οι πιθανότητες αυτές είναι πολύ μικρές και στην πράξη θεωρούνται μηδέν Για παράδειγμα, η πιθανότητα να είναι αρνητικός ο χρόνος που θα χρειασθεί το ασθενοφόρο για να φθάσει στο περιφερειακό νοσοκομείο (βλ παράδειγμα-) είναι ίση με: X 7 0 7 P ( X < 0) = < ) = Z < 57) = Φ( 57) = Φ(57), η οποία πρακτικά είναι μηδέν Όμως, αυτή η εξήγηση δε φαίνεται ικανοποιητική, αφού μπορεί οι πιθανότητες αυτές πρακτικά να είναι μηδέν, αλλά θεωρητικά δεν είναι μηδέν και επομένως το θεωρητικό μοντέλο φαίνεται «προβληματικό» Η απάντηση είναι η εξής: Πρέπει να διακρίνουμε την κανονική κατανομή αυτή καθαυτή, από τα τυχαία φαινόμενα που προσεγγίζονται ικανοποιητικά από την κανονική κατανομή Η κανονική κατανομή δεν είναι «νόμος της φύσης» Είναι, απλά, ένα μοντέλο το οποίο ορίζεται με μια μαθηματική συνάρτηση Τίποτε περισσότερο και τίποτε λιγότερο Η κανονική κατανομή δηλαδή, δεν εκφράζει-περιγράφει απολύτως και εξ ορισμού το τυχαίο φαινόμενο που μας ενδιαφέρει Το πόσο «καλά» το εκφράζει, δηλαδή, το πόσο μας βοηθάει να το κατανοήσουμε, είναι πρόβλημα δικό μας και της Στατιστικής, όχι της κανονικής κατανομής! Ας δούμε ένα διαφορετικό παράδειγμα Παράδειγμα : Οι υποψήφιοι για εγγραφή σε ένα Μεταπτυχιακό Τμήμα Πανεπιστημίου, υποβάλλονται σε ένα τεστ Το τεστ έχει σχεδιασθεί έτσι ώστε οι βαθμοί των υποψηφίων στο τεστ να κατανέμονται κανονικά με μέση τιμή 00 και τυπική απόκλιση α) Αν η Εργαστήριο Μαθηματικών & Στατιστικής/ Γ Παπαδόπουλος (wwwauagr/gpapadopoulos) 88

πολιτική του Πανεπιστημίου είναι να δέχεται ως φοιτητές το 5% των υποψηφίων με το μεγαλύτερο βαθμό στο τεστ, ποιος είναι ο μικρότερος βαθμός που επιτρέπει την εισαγωγή στο Μεταπτυχιακό Τμήμα; β) Τι βαθμό πρέπει να έχει γράψει ένας υποψήφιος στο τεστ για να κατατάσσεται στο 0% των υποψηφίων με το μικρότερο βαθμό στο τεστ; Απάντηση: Έστω Χ η βαθμολογία των υποψηφίων στο τεστ Δίνεται ότι, X ~ N(00, ) α) Ζητάμε την τιμή x της Χ για την οποία ισχύει: P ( X x) = 0 5 Επομένως, X 00 x 00 x 00 X x) = 05 ) = 05 Z ) = 05 x 00 x 00 x 00 Z < ) = 05 Z < ) = 05 Z < ) = 085 00 Φ( x ) = 085 Κάνοντας «αντίστροφη αναζήτηση» στον πίνακα της τυποποιημένης κανονικής κατανομής, βλέπουμε ότι το εμβαδόν (η πιθανότητα) 085 βρίσκεται μεταξύ των εμβαδών 08485 και 08508 που αντιστοιχούν στις τιμές 0 0 + 04 και 04 και με παρεμβολή βρίσκουμε, z = = 05 x 00 Επομένως, = 05 x = 6 Άρα, η ζητούμενη βαθμολογία είναι 6 Δηλαδή, για να ανήκει ένας υποψήφιος στο 5% των υποψηφίων με το μεγαλύτερο βαθμό στο τεστ, πρέπει να πάρει βαθμό τουλάχιστον ίσο με 6 β) Έστω η τιμή x της Χ για την οποία ισχύει, P ( X x) = 0 0 Έχουμε: X 00 x 00 x 00 P ( X x) = 00 ) = 00 Z ) = 0 0 x 00 x 00 00 x Φ( ) = 00 Φ( ) = 00 Φ( ) = 090 Έτσι, με «αντίστροφη αναζήτηση» στον πίνακα της τυποποιημένης κανονικής κατανομής, 8 + 9 βρίσκουμε z = = 85 και επομένως έχουμε 00 x = 85 x = 9 Άρα, για να κατατάσσεται ένας υποψήφιος στο 0% Εργαστήριο Μαθηματικών & Στατιστικής/ Γ Παπαδόπουλος (wwwauagr/gpapadopoulos) 89

των υποψηφίων με το μικρότερο βαθμό στο τεστ, πρέπει να έχει πάρει βαθμό μικρότερο από 9 Σημείωση: Είναι προφανές ότι με την προηγούμενη μέθοδο υπολογίζουμε τα ποσοστημόρια της κατανομής Η τιμή z της Z ~ N(0,) για την οποία ισχύει ότι, P ( Z > z) = α, 0 < α <, ονομάζεται άνω α -ποσοστιαίο σημείο της τυποποιημένης κανονικής κατανομής και συμβολίζεται με z α Δηλαδή, ισχύει ότι: P ( Z > zα ) = α Προφανώς, λόγω συμμετρίας της κατανομής, ισχύει: z = z α α Άσκηση: Δείξτε ότι α) z και β) z = 0 0 = 099 Απάντηση: α) Από τον ορισμό του άνω α -ποσοστιαίου σημείου z α, για α = 0 0, έχουμε, P ( Z > z0 0) = 00 Z z00) = 00 Φ( z00) = 00 Φ( z0 0) = 099 και επομένως με «αντίστροφη αναζήτηση» στον πίνακα της τυποποιημένης κανονικής κατανομής παίρνουμε, z 0 0 = β) Από τον ορισμό του άνω α -ποσοστιαίου σημείου z α, για α = 0 99, έχουμε, Z > z0 99 ) = 099 Z z099 ) = 099 Φ( z099 ) = 099 Φ( z0 99 ) = 099 και επομένως με «αντίστροφη αναζήτηση» στον πίνακα της τυποποιημένης κανονικής κατανομής παίρνουμε, z 099 = z0 99 = (Φυσικά, μπορούσαμε να χρησιμοποιήσουμε απευθείας τη σχέση, z α = zα, δηλαδή, z = z = z = ) 099 00 00 Παράδειγμα 4: Μια αυτόματη μηχανή συσκευασίας τροφίμων έχει προγραμματισθεί να συσκευάζει δημητριακά σε συσκευασίες των 5kgr Έχει παρατηρηθεί ότι η ποσότητα δημητριακών κάθε συσκευασίας ακολουθεί κανονική κατανομή με μέση τιμή μ = 5 kgr και τυπική απόκλιση σ = 0 kgr α) Τι ποσοστό των συσκευασιών περιέχει ποσότητα που υπερβαίνει τα 6kgr; β) Σε τι ποσότητα πρέπει να ρυθμισθεί η μηχανή έτσι ώστε μόνο στο 000 των περιπτώσεων η ποσότητα δημητριακών στη συσκευασία να υπερβαίνει τα 6kgr; Απάντηση: Έστω Χ η ποσότητα που περιέχεται στις συσκευασίες α) X ~ N(5, 0 ) Εύκολα υπολογίζεται ότι το ποσοστό συσκευασιών που υπερβαίνουν τα 6kgr, δηλαδή, η πιθανότητα X > 6) είναι 0587 β) X ~ N( μ, 0 ) Πρέπει να προσδιορισθεί η μέση τιμή μ ώστε P ( X > 6) = 000 Εργαστήριο Μαθηματικών & Στατιστικής/ Γ Παπαδόπουλος (wwwauagr/gpapadopoulos) 90

Έχουμε: X μ 6 μ X 6) = 000 X 6) = 0999 ) = 0999 0 0 6 μ 6 μ Z ) = 0999 Φ( ) = 0999 0 0 6 μ Άρα, = 09 μ = 9 Δηλαδή, η μηχανή πρέπει να ρυθμισθεί στα 9kgr 0 Συχνά, σε πρακτικά προβλήματα, ενδιαφέρουν πιθανότητες κάποιας τυχαίας μεταβλητής η οποία εκφράζει το άθροισμα άλλων ανεξάρτητων τυχαίων μεταβλητών που η κάθε μια ακολουθεί κανονική κατανομή Ας δούμε ένα τέτοιο πρόβλημα και πώς αντιμετωπίζεται Παράδειγμα 5: Στα ζώα μιας κτηνοτροφικής μονάδας δίνεται τροφή τρεις φορές την ημέρα Η ποσότητα θερμίδων που παίρνουν κάθε φορά είναι κανονική τυχαία μεταβλητή Το διαιτολόγιο έχει ρυθμισθεί έτσι, ώστε την πρώτη φορά που δίνεται τροφή η μέση ποσότητα θερμίδων που παίρνουν να είναι μ = 500 cal με τυπική απόκλιση σ = 50cal, τη δεύτερη να είναι μ = 700 cal με σ = 00 cal και την τρίτη να είναι μ = 800cal με σ = 00cal Αν οι ποσότητες θερμίδων που παίρνουν τα ζώα τις τρεις φορές είναι ανεξάρτητες μεταξύ τους, ποια είναι η πιθανότητα η συνολική ημερήσια ποσότητα θερμίδων που παίρνει ένα τυχαία επιλεγμένο ζώο της μονάδας να είναι μεταξύ 975cal και 05cal Απάντηση: Έστω X, X, X η ποσότητα θερμίδων που παίρνει το ζώο την η, τη η και την η φορά αντίστοιχα (ημερησίως) Γνωρίζουμε ότι το διαιτολόγιο έχει ρυθμισθεί έτσι ώστε: X ~ N(500, 50 ), X ~ N(700, 00 ) και X ~ N(800, 00 ) Η συνολική ημερήσια ποσότητα θερμίδων S που παίρνει το ζώο, προφανώς εκφράζεται από το άθροισμα X + X + X, δηλαδή, S = X + X + X Είναι προφανές ότι για να απαντήσουμε στο ερώτημα που τίθεται (και σε άλλα παρόμοια) πρέπει να γνωρίζουμε την κατανομή της S Γι αυτή την κατανομή, μας πληροφορεί η ακόλουθη πρόταση (Δίνεται χωρίς απόδειξη) Αν X,, X, X ανεξάρτητες τυχαίες μεταβλητές με X ~ N(, σ ) =,,,, τότε, S = X ~ N( μ + μ + + μ, σ + σ + + σ ) Αν για κάθε = μ, =,,, είναι X ~ N( μ, σ ) δηλαδή αν οι X, X,, X είναι ανεξάρτητες και ισόνομες κανονικές κατανομές, τότε, S = X ~ N( μ, σ ) Επειδή οι X, X, X είναι ανεξάρτητες, από την παραπάνω πρόταση έχουμε ότι S ~ N(500 + 700 + 800, 50 + 00 + 00 ) ή S ~ N(000, 5500) Άρα για την ζητούμενη πιθανότητα έχουμε: Εργαστήριο Μαθηματικών & Στατιστικής/ Γ Παπαδόπουλος (wwwauagr/gpapadopoulos) 9 =

975 000 S 000 05 000 975 < S < 05) = < < ) = 5500 5500 5500 = P ( 0 < Z < 0) = Φ(0) = 07 Παρατήρηση: Από την προηγούμενη πρόταση εύκολα προκύπτει η ακόλουθη: Αν X,, X, X ανεξάρτητες τυχαίες μεταβλητές με ~ N( μ, σ ) X για κάθε X =,,,, τότε, = σ X = ~ N( μ, ) Γενικότερα, αν X, X,, X ανεξάρτητες τυχαίες μεταβλητές με X ~ N( μ, σ ), X μ + μ + + μ σ + σ + + σ =,,,, τότε, X = ~ N(, ) = Παράδειγμα 5 (Συνέχεια): Ποια είναι η πιθανότητα, η μέση ποσότητα θερμίδων που παίρνει ένα τυχαία επιλεγμένο ζώο σε ένα χρόνο (65 ημέρες) να είναι μεταξύ 975cal και 05cal Απάντηση: Έστω S η συνολική ποσότητα θερμίδων που παίρνει το ζώο την ημέρα, S = =,,,65 Επειδή, S ~ N(000, 5500) θα έχουμε 5500 S = ~ N(000, ) 65 65 975 000 S 000 05 000 και επομένως, P (975 < S < 05) = < < ) = 5500 65 5500 65 5500 65 = P ( 08 < Z < 08) = Φ(08) = 0964 65 Ερώτηση: Τι καταλαβαίνετε από την παρακάτω εικόνα 6 ; 6 Η εικόνα αυτή δημοσιεύθηκε στη σελίδα της έκδοσης Bechmarkg Huma Laguage Techologes (HLT) progress Europe, The EUROMAP study, Adrew Joschelye ad Rose Lockwood, Copehage, 00 Εργαστήριο Μαθηματικών & Στατιστικής/ Γ Παπαδόπουλος (wwwauagr/gpapadopoulos) 9

Η Κατανομή vo Mses Η Κανονική Κατανομή Στις κυκλικές μεταβλητές, δηλαδή, στις μεταβλητές που μετρώνται σε κυκλική κλίμακα, η πλέον χρησιμοποιούμενη κατανομή είναι η κατανομή vo Mses Η κατανομή vo Mses, έχει ανάλογα χαρακτηριστικά με την κανονική κατανομή (και αντίστοιχα μεγάλη χρησιμότητα), γι αυτό στη βιβλιογραφία συναντάται και ως κυκλική κανονική κατανομή (crcular ormal) Αν η κατανομή μιας τυχαίας κυκλικής μεταβλητής, για παράδειγμα, μιας τυχαίας μεταβλητής κατεύθυνσης Θ, περιγράφεται από την κατανομή vo Mses, τότε, η συνάρτηση πυκνότητας της Θ δίνεται από τον τύπο: kσυν ( ϑ μ ) f ( ϑ) = e π I 0 ( k) όπου: μ η μέση κατεύθυνση (με τιμές σε διάστημα πλάτους π όπως και η Θ), k παράμετρος που παίρνει μη αρνητικές τιμές ( κ 0 ) και εκφράζει τη συγκέντρωση π των τιμών της Θ γύρω από τη μέση κατεύθυνση και κ e k cos Ι = ϑ 0 ( ) dϑ π (τιμή της 0 συνάρτησης Bessel) Για μεγάλα k, η κατανομή vo Mses προσεγγίζει την κανονική κατανομή με μ = θ και σ = (όσο αυξάνεται το k, τόσο αυξάνεται και η πιθανότητα να πάρει η k μεταβλητή Θ, τιμή κοντά στη μέση κατεύθυνση) Για μικρά k, δηλαδή όταν το k πλησιάζει στο 0, η κατανομή vo Mses προσεγγίζει την ομοιόμορφη κατανομή (σε διάστημα πλάτους π), δηλαδή, στην περίπτωση αυτή, όλες οι κατευθύνσεις έχουν την ίδια πιθανότητα ή, ακριβέστερα, για κάθε ϑ, δηλαδή, για κάθε κατεύθυνση ϑ, η πιθανότητα να πάρει η μεταβλητή Θ τιμή κοντά στη ϑ είναι για όλα τα ϑ ίδια 7 Σημείωση: Αν ϑ, ϑ,, ϑ δείγμα από πληθυσμό που ακολουθεί κατανομή vo Mses, τότε, για την εφαρμογή μεθόδων της Στατιστικής Συμπερασματολογίας (πχ στατιστικοί έλεγχοι), η παράμετρος k εκτιμάται μέσω του μέσου μέτρου r του διανύσματος r (υπάρχουν σχετικοί πίνακες που δίνουν εκτιμήσεις των τιμών του k για διάφορες τιμές του r ) 7 ή και αλλιώς, η πιθανότητα να πάρει η Θ τιμή σε ένα διάστημα είναι ανάλογη του πλάτους του διαστήματος Εργαστήριο Μαθηματικών & Στατιστικής/ Γ Παπαδόπουλος (wwwauagr/gpapadopoulos) 9

Τιμές των πιθανοτήτων Φ( z) = Z z) της τυποποιημένης κανονικής κατανομής N (0,) για z 0 Για z < 0, ισχύει: Φ( z) = Φ( z) Εργαστήριο Μαθηματικών & Στατιστικής/ Γ Παπαδόπουλος (wwwauagr/gpapadopoulos) 94