ar a t a d o l a Vio 2
Karl Pearson (27 March 1857 27 April 1936)
F1 1 2 3 4 1 11 6 9 14 40 2 7 6 7 9 29 3 14 5 7 11 37 4 11 4 7 20 42 5 22 2 12 16 52 65 23 42 70 200 r 1 n c 1
συχν τητα κελιο 100 σ νολογραµµ ς είγµατα F1 απογόνων * Κλάσεις Παραγ ωγής Γύρης Cros stabulation 11 100 27.5 40 = 16 100 30.8 52 =
11 100 27.5 40 = F1 1 2 3 4 1 11 6 9 14 40 2 7 6 7 9 29 3 14 5 7 11 37 4 11 4 7 20 42 5 22 2 12 16 52 65 23 42 70 200 16 100 30.8 52 =
σ νολογραµµ ς σ νολοστ λης αναµεν µενη είγµατα συχν F1 απογόνων τητα = * Κλάσεις Παραγ ωγής Γύρης γενικ σ νολο 40 65 = 13.0 200 50 72 = 18.2 200
40 65 = 13.0 200 F1 1 2 3 4 1 11 6 9 14 40 2 7 6 7 9 29 3 14 5 7 11 37 4 11 4 7 20 42 5 22 2 12 16 52 65 23 42 70 200
είγµατα F1 απογόνων * Κλ άσεις Παραγ ωγής Γύρης Cros stabulation Count: Συχνότητα Expected Count: Αναµενόµενη Συχνότητα
2 2 ( ) 2 2 παρατηρο µενη συχν τητα αναµεν µενη συχν τητα Χ = αναµεν µενη συχν τητα 2 2 2 ( ) ( ) ( ) 2 11 13,0 6 4,6 16 18, 2 Χ = + + + = 12,125 13,0 4,6 18, 2
2 2 2 Ανατρέχουµε στους Πίνακες της 2 Κατανοµής
2 (12) 0,05 =21,03 (12) 0,05 2 =12,125 2 =12,125<21,03= 21,03= 2 (12) (12) 0,05 2 < 2
α χ χ 2 α Περιοχή Μη Απόρριψης της Η 0
Από το δείγµα γενικεύουµε για τον αντίστοιχο Πληθυσµό
a b b c X 2 δειγµατικό Βαθµοί Ελευθερίας Παρατηρούµενη Στάθµη Σηµαντικότηταςp-value Chi-Square Tests b b b Ανp<α, τότε απορρίπτεται η Η 0 Ανp α, η Η 0 δεν απορρίπτεται
2
Φυλλοφόρα µοσχεύµατα έξι ποικιλιών ελιάς που ριζοβόλησαν ή όχι µετά από 84 ηµέρες κάτω από υδρονέφωση 85 75 160 87 73 160 97 63 160 109 51 160 109 51 160 150 10 160 637 323 960
Η : p = p = = p Η 0 1 2 6 1 Στατιστικός Έλεγχος : τουλ χιστον δ ο ποσοστ διαφ ρουν
2 2 2 2 85 87 150 + + + = 160 160 160 440, 406 X 2 2 637 440, 406 960 = = 637 323 2 960 79,40
2 (5) 0,05 =11,07 (5) 0,05 2 =79,40 2 =79,40>11,07= 2 (5) (5) 0,05 2 > 2
Φυλλοφόρα µοσχεύµατα δύο ποικιλιών ελιάς που ριζοβόλησαν ή όχι µετά από 84 ηµέρες κάτω από υδρονέφωση 100 60 160 109 51 160 209 111 320
n 11 n 12 n 1. n 21 n 22 n 2. n.1 n.2 n..
Η : p = Η p 0 1 2 Στατιστικός Έλεγχος : ταδ οποσοστ διαφ ρουν ( p p ) 1 1 2
(1,1) 11= 160 209 = 104,5 320 (2,1) 21= 160 209 = 104,5 320 (1,2) 12= 160 111 = 55,5 320 (2,2) 22= 160 111 = 55,5 320
ιόρθωση Συνέχειας τουyates ( ) ( ) ( ) ( ) 2 2 2 2 100 104,5 0,5 60 55,5 0,5 109 104,5 0,5 51 55,5 0,5 2 X = + + + = 104,5 55,5 104,5 55,5 = 0,88 Γενική Σχέση X 2 = O E E 1 2 2 Ο: Παρατηρούµενη Συχνότητα Ε: Αναµενόµενη-Θεωρητική Συχνότητα
Β Τρόπος X 2 320 (100 51) (109 60) 320 2 = = 209 111 160 160 2 0,88 Γενική Σχέση X 2 = n n n n n n 2 n n n n.. 11 22 12 21.. 1. 2..1.2 2
2 (1) 0,05 =3,84 (1) 0,05 2 =0,88 2 =0,88<3,84= 2 (1) (1) 0,05 2 < 2
z z = pˆ pˆ 1 2 1 1 pq ˆ ˆ( + ) n n 1 2 X 2 = ( pˆ pˆ ) 2 1 2 1 1 pq ˆ ˆ( + ) n n 1 2
{ } R= z > z a pˆ 1 pˆ z= 2 s /2 ˆ ˆ 1 1 s pq + n n 1 2 Σύµφωνα µε τη Μηδενική Υπόθεση τα δύο ποσοστά είναι ίσα και εποµένως µπορούµε να συγχωνεύσουµε τα δύο δείγµατα σε ένα και να υπολογίσουµε ένα κοινόp(καιq=1-p) Τυπικό Σφάλµα της ιαφοράς των ύο Ποσοστών
s s 2 1 1 2 2 pˆ 1 pˆ 2 n1 n2 pˆ pˆ 1 2 pˆ qˆ pˆ qˆ = + pˆ qˆ = + n pˆ qˆ n 1 1 2 2 1 2
2 2
2
2
18-24 24 4 23 82 12 25-34 42 2 20 146 13 35-44 54 0 12 136 18 45-54 40 1 6 121 9 55-64 37 1 7 68 15 65+ 20 5 3 61 13
Κλάσεις Ηλικιών * Πρόβληµα Crosstabulation
Κλάσεις Ηλικιών * Πρόβληµα Crosstabulation
Κλάσεις Ηλικιών * Πρόβληµα Crosstabulation
s i 1 ( S i s 2i ( S i vr n I i n % vr n I i n %. pm s 2i ( eu l a V 0 95..... lh i 0 t o a Ri.... 0 5 e h s... b b c L i 5 75 3 65 1........ t i a i c os s A 5 d l a Vi 1. s t i n u p x n i m i t n u p x e e a v h t i ra t s ht w i s. i t c i s t a ti s d i ra d n a t s. c. Sig. p-value Chi-Square Tests )d d e l o ra C t n e M o )d d e l o ra C t n e M o g. g. l a t e e cn d e C o 9 9 l a t e e cn d e C o 9 9 g. S i ys A d n u B o r U p p e d n u B o r ew L o g. S i d n u B o r U p p e d n u B o r ew L o g. S i )d d e d 0 0 0 0 0 0 b 0 0 0 0 0 0 2 a 0 84 ra e u S q ihc n os ra P e 0 0 0 0 0 0 b 0 0 0 0 0 0 2 63 1 5. 5 d o o k e L i 0 0 0 0 0 0 b 0 0 60 2. 5 t s T e t ca E x s ' r F i ra en en L i 3 0 3 9 72 1 92 0 5 5 84 5 2 63 b y ra n o 9 9 s es a C N o 3. 3 d c o t e c e em u m e ht 5. n a ht s s l e d c o t e c e )% 0 0. 2 ( s ll e c 6 a. 7 73 6 8 82 72 d e es g n ble a t d l e pm a s 0 0 0 0 1 n d o es a B b. 1 0 6. s d ez e ht Αφούp<0,05 η Μηδενική Υπόθεση απορρίπτεται σε επίπεδο σηµαντικότηταςα=0,05
Symmetric Measures c c Η τιµή του δείκτη συνάφειαςvτου Cramer µαρτυρά ασθενούς εντάσεως συσχέτιση µεταξύ των δύο χαρακτηριστικών που διασταυρώνονται
V X 2 p=min(k-1, l-1). V = Np k l Παίρνει τιµές στο διάστηµα [0, 1]
V Cramer (συνέχεια) Οι Νόρµες αυτές είναι γενικές. Το τι είναι βιολογικά σηµαντικό εξαρτάται κάθε φορά από το πεδίο έρευνας και τα χαρακτηριστικά που εξετάζονται.
Κλάσεις Ηλικιών * Πρόβληµα Crosstabulation Adjusted Residual: ιορθωµένο Τυποποιηµένο Υπόλοιπο
2 α α α α
συνέχεια i+ + j ij N i+ + j i+ + j 1 1 N N N i+ + j i j F ij ( i= 1, k, j= 1,, l).
συνέχεια ij ij
100% 90% 80% 70% 60% 50% 40% Υγεία Οικονοµικό Σπουδές Στεγαστικό Τζόγος 30% 20% 10% 0% 18-24 ετών 25-34 35-44 45-54 55-64 65+ Κλάσεις Ηλικιών
Παραγοντικό Επίπεδο της Correspondence Analysis
συνέχεια 32 268 300 51 199 250. 67 233 300 150 700 850 Τα σύνολα γραµµών προκαθορισµένα π.χ. λόγω Στρωµατοποιηµένης Τυχαίας ειγµατοληψίας
One-Sample Kolmogorov-Smirnov Test Αφούp<0,05 η Μηδενική Υπόθεση Απορρίπτεται, τα δεδοµένα ΕΝ προσαρµόζονται στην Κανονική Κατανοµή
οθείσα Αναλογία
Test Statistics Αφούp>0,05 η Μηδενική Υπόθεση ΕΝ Απορρίπτεται, τα δεδοµένα προσαρµόζονται στην δοθείσα αναλογία
p α
συνέχεια 0 1 0,03125 2,72 1 12 0,15625 13,59 2 27 0,31250 27,19 3 32 0,31250 27,19 4 12 0,15625 13,59 5 3 0,03125 2,72 87 1,0000 87???
συνέχεια n p 0 5 5 1 1 P( X = 0) = 0,03125 0 = 2 2 1 4 5 1 1 P( X = 1= 0,15625 1 = 2 2 κλπ..
συνέχεια
συνέχεια p
συνέχεια 2 X ( ) ( ) ( ) 2 2 2 2 1 2,72 12 13,59 3 2,72 = + + + = 2,72 13,59 2,72 2,34 2 2 α
συνέχεια 2 (5) 0,05 =11,07 (5) 0,05 2 =2,34 2 =2,34<11,07= 2 (5) (5) 0,05 2 < 2 Η µηδενική Υπόθεση παραµένει
συνέχεια α α
<0,55 0 0,0154 2,59 0,55-1,05 5 0,0247 4,15 1,05-1,55 8 0,0500 8,40 1,55-2,05 20 0,0861 14,46 2,05-2,55 20 0,1253 21,05 2,55-3,05 27 0,1547 25,99 3,05-3,55 30 0,1617 27,17 3,55-4,05 20 0,1432 24,06 4,05-4,55 13 0,1075 18,06 4,55-5,05 11 0,0684 11,49 5,05-5,55 7 0,0368 6,18 5,55-6,05 7 0,0168 2,82 >6,05 0 0,0094 1,58 168 1,0000 168,00
συνέχεια α X = 3,18 s= 1,22 Στην πράξη υπολογίζονται από το δείγµα
συνέχεια α
συνέχεια Y 3,18 0,55 3,18 P( Y 0,55) = P ( 2,16) 1,22 1,22 = P z = = 0,5000 0, 4846= 0,0154 0,55 3,18 Y 3,18 1,55 3,18 P(0,55 Y 1,55) = P 1,22 1,22 1,22 = = P( 2,16 z 1,75) = 0, 4846 0, 4599= 0,0247
-2,16 +2,16 συνέχεια
συνέχεια
συνέχεια
συνέχεια Πόσοι είναι οι βαθµοί ελευθερίας στην περίπτωση που δίνονται οι παράµετροιµκαισ;
συνέχεια 2 X 2 2 2 ( ) ( ) ( ) 2 0 2,59 5 4,15 0 1,58 = + + + = 15,30 2,59 4,15 1,58 2 2 α
συνέχεια 2 (10) 0,05 =18,31 (10) 0,05 2 =15,30 2 =15,30<18,31= 18,31= 2 (10) (10) 0,05 2 < 2 Η µηδενική Υπόθεση παραµένει
συνέχεια α α
Cochran
: P(A) 0 P(B) 0, : ( / )= ( ) : P(A B) P(A / B) = P(B) : P(A B) = P(A) P(B),,. 1, 2,, n, P(A 1) 0, P(A2) 0,, P(A n) 0 : P(A1 A2 A 3... A n) = P(A 1) P(A 2) P(A 3).... P(A n),
Η : p = p = p = p = p, j= 1, 4 0 1 j 2 j 3 j 4 j 5 j Η αναλογία (%) για τηνjκλάση γύρης στο πρώτο δείγµα µηδικής
συνέχεια r1 Ρ( Α= ε γµα1) = n c1 Ρ( Β=Κ λ ση1) = n r1 c1 Ρ( 1 Κ 1) = n n r 1 : c 1 : n: r c r c αναµεν µενη συχν τητα = n ( ) = n n n 1 1 1 1
X 1 2 j l 1 11 12 1 j 1l 1+ 2 21 22 2 j 2l 2 + i i1 i2 ij il kj kl k k1 k 2 i + k + + 1 + 2 + j + l
X 1 2 1 2 j l 11 12 1 + 1 + 21 22 2 + 2 + 1 j 1 + 2 j 2 + 1 l 1 + 1 2l 1 + i i1 i2 ij il + + 1 i i + k k1 k 2 kj kl + 1 k + N k + N + 1 + 2 i + k + + j N 2 i k N + l
X 1 2 j l 1 2 11 12 + 1 + 2 21 22 + 1 + 2 1 j + j 2 j + j + N 1l 1 + l N 2l 2+ + l i 1 i 2 ij il i i + 1 + 2 + l N k 1 k 2 kj kl k k + 1 + 2 + j + l N 1 1 1 1 + j + +
Χ Υ Υ X 1 2 j l 1 11 12 1 j 1l N 2 2 21 22 2 j 2l N i i i1 i2 ij il N k k k1 k 2 kj kl N 1 + = r1 + = + = + = r r 2 i r k N c + 1 2 = 1 + = c2 N + j N + l = c = c j l =1 N
1 2 j l X 1 11 / N 12 / N 1 j / N 1l / N 2 21 / N 22 / N 2 j / N 2l / N i i1 / N i2 / N ij / N il / N / N k 2 / N kj / N kl / N k k1
Επιστήµες Εισαγωγή στη Στατιστική για Βιολογικές Εφαρµογές Στατιστική: Θεωρία- Περιγραφική Στατιστική Στατιστική: Θεωρία- Εφαρµογές Πολυδιάστατη Ανάλυση εδοµένων: Μέθοδοι και Εφαρµογές
ar a t a d o l a Vio