Start Random numbers Distributions p-value Confidence interval.

Σχετικά έγγραφα
Ηλεκτρονικοί Υπολογιστές I

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Εισαγωγή στην Εκτιμητική

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ

η πιθανότητα επιτυχίας. Επομένως, η συνάρτηση πιθανοφάνειας είναι ίση με: ( ) 32 = p 18 1 p

ΟΝΟΜΑΤΕΠΩΝΥΜΟ : Αντικείμενο: Εισαγωγή στο στατιστικό πακέτο R και στις δυνατότητές του για δημιουργία γραφημάτων. Χρήση του λογισμικού RStudio.

Κατανομές Πιθανοτήτων. Γεωργία Φουτσιτζή, Καθηγήτρια, Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πανεπιστήμιο Ιωαννίνων Ακαδ.

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 11 Μαρτίου /24

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test)

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΑΣΚΗΣΕΙΣ ΔΙΑΣΤΗΜΑΤΩΝ ΕΜΠΙΣΤΟΣΥΝΗΣ. Άσκηση 1. Βρείτε δ/μα εμπιστοσύνης για τη μέση τιμή μ κανονικού πληθυσμού όταν n=20,

Θεωρία Πιθανοτήτων & Στατιστική

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

HMY 799 1: Αναγνώριση Συστημάτων

Ηλεκτρονικοί Υπολογιστές IV

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

Δειγματικές Κατανομές

Διάλεξη 1 Βασικές έννοιες

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ


Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Στατιστική Συμπερασματολογία

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

ΗΥ-SPSS Statistical Package for Social Sciences 6 ο ΜΑΘΗΜΑ. ΧΑΡΑΛΑΜΠΟΣ ΑΘ. ΚΡΟΜΜΥΔΑΣ Διδάσκων Τ.Ε.Φ.Α.Α., Π.Θ.

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Δείγμα (μεγάλο) από οποιαδήποτε κατανομή

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 :

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

Ενδεικτικές Ασκήσεις Μάθηµα : Στατιστική 1

3. Κατανομές πιθανότητας

Θεωρία Πιθανοτήτων & Στατιστική

Θεωρητικές Κατανομές Πιθανότητας

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Θέματα Στατιστικής στη γλώσσα R

Είδη Μεταβλητών. κλίµακα µέτρησης

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

ΤΕΧΝΙΚΗ ΥΔΡΟΛΟΓΙΑ Πιθανοτική προσέγγιση των υδρολογικών μεταβλητών

Κεφάλαιο 4 Κανονική Κατανομή. Πέτρος Ε. Μαραβελάκης, Επίκουρος Καθηγητής, Πανεπιστήμιο Πειραιώς

ΘΕΜΑΤΑ Α : ΕΚΦΩΝΗΣΕΙΣ - ΛΥΣΕΙΣ

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΚΕΦΑΛΑΙΟ ΕΙΣΑΓΩΓΗ... 25

1991 US Social Survey.sav

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

ΑΝΑΛΥΣΗ ΣΥΧΝΟΤΗΤΑΣ ΥΔΡΟΛΟΓΙΚΩΝ ΦΑΙΝΟΜΕΝΩΝ

Ενότητα 3: Ανάλυση Διακύμανσης κατά ένα παράγοντα One-Way ANOVA

Το τυπικό σφάλμα του μέσου (standard error of mean) ενός δείγματος

Στατιστική Επιχειρήσεων ΙΙ

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Περιγραφική στατιστική

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

ΚΑΤΑΝΟΜΈΣ. 8.1 Εισαγωγή. 8.2 Κατανομές Συχνοτήτων (Frequency Distributions) ΚΕΦΑΛΑΙΟ

Πανεπιστήμιο Πελοποννήσου

ΥΔΡΟΛΟΓΙΑ. Ενότητα 3:Στατιστική και πιθανοτική ανάλυση υδρομετεωρολογικών μεταβλητών- Ασκήσεις. Καθ. Αθανάσιος Λουκάς

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΔΙΕΡΕΥΝΗΣΗ ΚΛΙΜΑΤΙΚΩΝ ΑΛΛΑΓΩΝ ΓΙΑ ΤΟ ΝΗΣΙ ΤΗΣ ΝΑΞΟΥ

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Η παρουσίαση που ακολουθεί, αφορά την κανονική κατανομή και σκοπό έχει τη διευκόλυνση των φοιτητών του τμήματος Ηλεκτρολόγων Μηχανικών & Μηχανικών

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

HMY 429: Εισαγωγή στην Επεξεργασία Ψηφιακών. Χρόνου (Ι)

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

= p 20 1 p p Το σημείο στο οποίο μηδενίζεται η παραπάνω μερική παράγωγος είναι

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

Τυχαία μεταβλητή (τ.μ.)

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

ρ. Ευστρατία Μούρτου

3 ο Μέρος Χαρακτηριστικά τυχαίων μεταβλητών

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΙΑΤΡΙΚΗ ΦΥΣΙΚΗ eclass: PHYS215 Π. Παπαγιάννης

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Συνεχείς Κατανομές. Κώστας Γλυκός ΜΑΘΗΜΑΤΙΚΟΣ. Ασκήσεις για ΑΕΙ και ΤΕΙ. Kglykos.gr. σε Συνεχείς Κατανομές. τεχνικές. 30 ασκήσεις.

159141,9 64 x n 1 n

ΣΤΑΤΙΣΤΙΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΒΙΟΣΤΑΤΙΣΤΙΚΗ. ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

Στατιστική Ι (ΨΥΧ-122) Διάλεξη 2

ΕΙΣΑΓΩΓΗ ΣΤΟ EXCEL. , και οι γραμμές συμβολίζονται με 1,2,3, Μπορούμε να αρχίσουμε εισάγοντας ορισμένα στοιχεία ως εξής.

1.4 Λύσεις αντιστρόφων προβλημάτων.

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Έλεγχος υπόθεσης: διαδικασία αποδοχής ή απόρριψης της υπόθεσης

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

Transcript:

Υπολογιστική Στατιστική με τη γλώσσα R Κατανομές και έλεγχοι υποθέσεων Αθανάσιος Σταυρακούδης http://stavrakoudis.econ.uoi.gr 19 Δεκεμβρίου 2013 1 / 33

Επισκόπηση 1 1 Start 2 Random numbers 3 Distributions 4 p-value 5 Confidence interval 2 / 33

Απλές πράξεις με την R > x < c ( 1, 2, 3, 4 ) > min ( x ) [ 1 ] 1 > max( x ) [ 1 ] 4 > sum( x ) [ 1 ] 10 > mean( x ) [ 1 ] 2. 5 > median ( x ) [ 1 ] 5 > var ( x ) [ 1 ] 1.666667 > s q r t ( x ) [ 1 ] 1. 000000 1. 414214 1. 732051 2. 000000 > x ˆ2 [ 1 ] 1 4 9 16 3 / 33

Νέο γράφημα boxplot > x < c ( 1, 5, 2, 7, 8 ) > summary( x ) Min. 1 s t Qu. Median Mean 3 rd Qu. Max. 1. 0 2. 0 5. 0 4. 6 7. 0 8. 0 > boxplot ( x ) 1 2 3 4 5 6 7 8 4 / 33

Συνδυακύμανση και συσχέτιση > x < c ( 1, 5, 2, 7, 8 ) > y < c ( 2, 9, 3, 6, 1 0 ) > var ( x, y ) [ 1 ] 9.25 > cov ( x, y ) [ 1 ] 9.25 > cor ( x, y ) [ 1 ] 0.857917 5 / 33

Γράφημα τυπικής κανονικής κατανομής φ(x) = 1 2π e 1 2 x2 > x < seq ( 4,4, length =201) > y < 1/ s q r t (2 p i ) exp( x ˆ2/ 2) > p l o t ( x, y, type= l ) > png ( n o r n a l 1. png ) > p l o t ( x, y, type= l, c o l= b l u e ) > dev. o f f ( ) 6 / 33

Πολλές γραμμές στο ίδιο γράφημα > x < seq ( 4, 4, by =0.01) > y1 < dnorm( x, mean=0, sd=2/ 3) > y2 < dnorm( x, mean=0, sd=1) > y3 < dnorm( x, mean=0, sd=3/ 2) > png ( normal2. png ) > p l o t ( x, y1, type= l, c o l= red ) > l i n e s ( x, y2, type= l, c o l= b l u e ) > l i n e s ( x, y3, type= l, 7 / 33

Σκίαση περιοχών 1 > x <- seq(156, 188, length=501) 2 > y <- dnorm(x, mean=172, sd=4) 3 > x1 <- seq(178, 188, length=101) 4 > y1 <- dnorm(x1, mean=172, sd=4) 5 > png("normal3.png") 6 > plot(x, y, type="l", lwd=2) 7 > polygon(c(178,x1,188), c(0,y1,0), 8 + col="gray") 9 > dev.off() 8 / 33

Επισκόπηση 2 1 Start 2 Random numbers 3 Distributions 4 p-value 5 Confidence interval 9 / 33

Τυχαίοι αριθμοί με την R Κανονική Κατανομή > rnorm (30) > rnorm (30,mean=15, sd=3) > x < rnorm (30,mean=15, sd=3) Ομοιόμορφη Κατανομή > r u n i f (50) > r u n i f (50, min=0, max=4) > x < r u n i f (50, min=0, max=4) 10 / 33

Άσκηση Να κατασκευαστούν 100 τυχαίοι αριθμοί από κανονική κατανομή (0,1), να δοθούν τα περιγραφικά στατιστικά, και να κατασκευαστεί ιστόγραμμα συχνοτήτων > x < rnorm ( 1 0 0, mean=0, sd =1) > min ( x ) [ 1 ] 2.502098 > max( x ) [ 1 ] 2.683640 > mean( x ) [ 1 ] 0.1715795 > s q r t ( var ( x ) ) [ 1 ] 0.9961516 11 / 33

Σκέδαση και κύρτωση library(moments) > l i b r a r y ( moments ) > k u r t o s i s ( x ) > skewness ( x ) kurt = skew = 1 n n i=1 (x i x) 4 ( 1 n n i=1 (x i x) 2) 2 1 n n i=1 (x i x) 3 ( 1 n n i=1 (x i x) 2) 3/2 12 / 33

Επισκόπηση 3 1 Start 2 Random numbers 3 Distributions 4 p-value 5 Confidence interval 13 / 33

Η συνάρτηση dnorm Το ύψος της καμπύλης κανονικής κατατομής > dnorm ( 0 ) [ 1 ] 0.3989423 > dnorm ( 1 ) [ 1 ] 0.2419707 > dnorm( 1) [ 1 ] 0.2419707 > dnorm ( 1, 1 0, 5 ) [ 1 ] 0.01579003 > v < c ( 1,0,1) > dnorm( v ) [ 1 ] 0. 2419707 0. 3989423 0. 2419707 14 / 33

Η συνάρτηση pnorm Το ολοκλήρωμα της συνάρτησης πιθανότητας > pnorm ( 0 ) [ 1 ] 0. 5 > pnorm ( 1, mean=0, sd=1) [ 1 ] 0.8413447 > pnorm( 1, mean=0) [ 1 ] 0.1586553 > pnorm ( 1, mean=10, sd=5) [ 1 ] 0.03593032 > v < c ( 1,0,1) > pnorm( v ) [ 1 ] 0. 1586553 0. 5000000 0. 8413447 15 / 33

Διαγραμματική επεξήγηση της συνάρτησης pnorm 1 1 2π e 1 2 x2 = 0.8413447 1 1 2π e 1 2 x2 = 0.1586553 > pnorm ( 1 ) [ 1 ] 0.8413447 > 1 pnorm ( 1 ) [ 1 ] 0.1586553 16 / 33

Η συνάρτηση qnorm Σε ποιο x η πιθανότητα είναι p; > qnorm ( 0. 2 5 ) [ 1 ] 0.6744898 > qnorm ( 0. 2 5, mean=0) [ 1 ] 0.6744898 > qnorm ( 0. 2 5, mean=0, sd=2) [ 1 ] 1.34898 > v < c ( 0. 2, 0. 5, 0. 9 ) > qnorm( v, mean=1, sd =1) [ 1 ] 0.1583788 1.0000000 2.2815516 x0 1 2π e 1 2 x2 = p 17 / 33

Συναρτήσεις κανονικής κατανομής 4 βασικές συναρτήσεις dnorm Η πυκνότητα πιθανότητας d στο σημείο x pnorm Η πιθανότητα p στο σημείο x qnorm Σε ποιο σημείο x η πυκνότητα πιθανότητας είναι d rnorm Τυχαίοι αριθμοί από κανονική κατανομή Το ίδιο μοτίβο για άλλες κατανομές dt Η πυκνότητα πιθανότητας d στο σημείο x της κατανομής t pbinom Η πιθανότητα p στο σημείο x της διωνυμικής κατανομής qchisq Σε ποιο σημείο x η πυκνότητα πιθανότητας της κατανομής χ 2 είναι d rgamma Τυχαίοι αριθμοί από τη γάμμα κατανομή 18 / 33

Συναρτήσεις t κατανομής 4 βασικές συναρτήσεις f (t) = Γ( ν+1 2 ) νπ Γ( ν 2 ) ) ν+1 (1 + t2 2 ν rt Αποδίδει τυχαίους αριθμούς από την t κατανομή dt Υπολογίζει το ύψος της καμπύλης της t κατανομής pt Υπολογίζει το ολοκλήρωμα της t κατανομής qt Υπολογίζει το σημείο στο οποίο η t κατανομή έχει δεδομένο ολοκλήρωμα, δηλαδή είναι η αντίστροφη της συνάρτησης pt. 19 / 33

Η κατανομή t διαγραμματικά > x < seq ( 4, 4, by =0.01); y1 < dt ( x, df =2) > y2 < dt ( x, df =5); y3 < dt ( x, df =10) > p l o t ( x, y1, y l i m=c ( 0, 0. 5 ), l t y =1, type= l, y l a b= D e n s i t y > l i n e s ( x, y2, l t y =2); l i n e s ( x, y3, l t y =3) 20 / 33

Επισκόπηση 4 1 Start 2 Random numbers 3 Distributions 4 p-value 5 Confidence interval 21 / 33

Υψος μέχρι 178 cm Το ύψος (που ακολουθεί κανονική κατανομή) 40 φοιτητών έχει μέσο 172 cm και τυπική απόκλιση 4 cm. Ποια είναι η πιθανότητα κάποιος να έχει ύψος μέχρι 178 cm; 1 > pnorm(178, mean=172, sd=4) 2 [1] 0.9331928 y 10 2 8 6 4 2 0 160 165 170 175 180 185 x Επίσης 1 > qnorm(0.9331928, mean=172,sd=4) 2 [1] 178 3 > dnorm(178, mean=172,sd=4) 4 [1] 0.0323794 178 2 2(4) 2 dx 1 e (x 172) 2π4 22 / 33

Υψος άνω των 178 cm Το ύψος 40 φοιτητών έχει μέσο 172 cm και τυπική απόκλιση 4 cm. Ποια είναι η πιθανότητα κάποιος να έχει ύψος πάνω από 178 cm; 1 > pnorm(178,172,4,lower.tail=f) 2 [1] 0.0668072 Επίσης 1 > qnorm(0.0668072, 172, 4, 2 + lower.tail=f) 3 [1] 178 4 > dnorm(178, 172, 4) 5 [1] 0.0323794 y 10 2 8 6 4 2 0 160 165 170 175 180 185 178 2 2(4) 2 dx 1 e (x 172) 2π4 x 23 / 33

Βάρος άνω του 1 κιλού Το καθαρό βάρος γάλατος που παράγει μια βιομηχανία ακολουθεί κανονική κατανομή με μέσο 1 κιλό και διακύμανση 0.012. Ποια είναι η πιθανότητα να πάρουμε ένα κουτί γάλα με βάρος μεγαλύτερο των 1010 γραμμαρίων; 1 1 - pnorm(1.01, 1, 0.012) 2 [1] 0.2023284 Επίσης 1 > qnorm(0.2023284, 1, 0.012, 2 + lower.tail=f) 3 [1] 1.01 4 > dnorm(1.01, 1, 0.012) y 30 20 10 0 0.94 0.96 0.98 1 1.02 1.04 x 1.06 1.01 2 2(1.02) 2 dx 1 e (x 1) 2π1.02 24 / 33

Βάρος περίπου 1 κιλό Το καθαρό βάρος γάλατος που παράγει μια βιομηχανία ακολουθεί κανονική κατανομή με μέσο 1 κιλό και διακύμανση 0.012. Ποια είναι η πιθανότητα να πάρουμε ένα κουτί γάλα με βάρος μεταξύ 995 και 1005 γραμμαρίων; 1 > pnorm(1.005, 1, 0.012) - 2 + pnorm(0.995, 1, 0.012) 3 [1] 0.3230778 Επίσης 1 > dnorm(0.995, 1, 0.012) 2 [1] 30.48103 y 30 20 10 0 0.94 0.96 0.98 1 1.02 1.04 x 1.06 1.005 0.995 2 2(1.02) 2 dx 1 e (x 1) 2π1.02 25 / 33

Βάρος ακριβώς 1 κιλό Το καθαρό βάρος γάλατος που παράγει μια βιομηχανία είναι τυχαία συνεχής μεταβλητή που ακολουθεί κανονική κατανομή με μέσο 1 κιλό και διακύμανση 0.012. Ποια είναι η πιθανότητα να πάρουμε ένα κουτί γάλα με βάρος ακριβώς 1 κιλό; Χωρίς απάντηση. Σκεφτείτε μόνοι σας. +1 στον τελικό βαθμό στην/ον πρώτη/ο που θα διατυπώσει τη σωστή απάντηση. 26 / 33

Βάρος ακριβώς 1 κιλό Το καθαρό βάρος γάλατος που παράγει μια βιομηχανία είναι τυχαία συνεχής μεταβλητή που ακολουθεί κανονική κατανομή με μέσο 1 κιλό και διακύμανση 0.012. Ποια είναι η πιθανότητα να πάρουμε ένα κουτί γάλα με βάρος ακριβώς 1 κιλό; Χωρίς απάντηση. Σκεφτείτε μόνοι σας. +1 στον τελικό βαθμό στην/ον πρώτη/ο που θα διατυπώσει τη σωστή απάντηση. y 30 20 10 0 0.94 0.96 0.98 1 1.02 1.04 x 1.06 1 1 2 2(1.02) 2 dx 1 e (x 1) 2π1.02 27 / 33

Επισκόπηση 5 1 Start 2 Random numbers 3 Distributions 4 p-value 5 Confidence interval 28 / 33

Διάστημα εμπιστοσύνης του μέσου x z α/2 σ x < µ < x + z α/2 σ x > x < c ( 3, 5, 8, 2, 5, 6, 2, 9 ) > m < mean( x ) [ 1 ] 5 > sd < s q r t ( var ( x ) ) [ 1 ] 2.618615 > n < length ( x ) [ 1 ] 8 > e < qt ( 0. 9 7 5, df=n 1) sd/ s q r t ( n ) [ 1 ] 2.189217 > m e [ 1 ] 2.810783 > m+e [ 1 ] 7.189217 29 / 33

Ελεγχος υποθέσεων Ερώτημα Να βρεθεί αν το διάνυσμα τιμών x έχει μέσο μικρότερο του 5. Υπολογισμός z > x < c ( 5, 2, 7, 4, 5 ) > m < mean( x ) > sd < s q r t ( var ( x ) ) > n < length ( x ) > (m 5)/ ( sd/ s q r t ( n ) ) [ 1 ] 0.492366 Μη απόρριψη z = x µ 0 σ/ n H 0 : x < 5 H α : x 5 > pnorm( 0.492366) 30 / 33

Ελεγχος του μέσου του πληθυσμού με γνωστή διακύμανση Εστω ένα δείγμα 12 παρατηρήσεων που προέρχεται από κανονική κατανομή έχει μέσο 50. Η τυπική απόκλιση του πληθυσμού είναι ίση με 4. Ας κάνουμε την υπόθεση πως ο μέσος είναι μικρότερος του 52. H 0 : µ 52 H α : µ < 52 > n < 12 > xbar < 50 > sigma < 4 > mu < 52 > z < ( xbar mu) / ( sigma / s q r t ( n ) ) > p < pnorm( z ) > p [ 1 ] 0.04163226 Η τιμή pval=0.0416 μας λέει ότι απορρίπτεται η H 0 σε επίπεδο σημαντικότητας 5%, αλλά όχι σε επίπεδο σημαντικότητας 1%. 31 / 33

Ελεγχος του μέσου του πληθυσμού με γνωστή διακύμανση Ας υποθέσουμε πως έχουμε ένα δείγμα που προέρχεται από πληθυσμό, που ακολουθεί την κανονική κατανομή αλλά δεν ξέρουμε τη διακύμανση. Εστω ότι θέλουμε να ελέγξουμε αν ο μέσος του πληθυσμού είναι μικρότερος του 52: H 0 : µ 52 H α : µ < 52 > x < c (45, 48, 50, 52, 48, 51, 55, 50, 53, 54, 49, 45) > n < length ( x ) > mx < mean( x ) > sigma < sd ( x ) > mu < 52 > z < (mx mu) / ( sigma / s q r t ( n ) ) > p < pt ( z, df=n 1) > p [ 1 ] 0.02722336 Η τιμή pval=0.027 μας λέει πως απορρίπτεται η H 0 σε επίπεδο σημαντικότητας 5%, αλλά όχι σε επίπεδο σημαντικότητας 1%. 32 / 33

Σχόλια και ερωτήσεις Σας ευχαριστώ για την προσοχή σας Είμαι στη διάθεσή σας για σχόλια, απορίες και ερωτήσεις 33 / 33