Distribuţia binomială Teste statistice neparametrice nominale. M. Popa

Distribuţia binomială Teste statistice neparametrice nominale M. Popa

a) parametrice Teste statistice inferenţele sunt probate prin utilizarea parametrilor populaţiei (indicatori care descriu tendinţa centrală şi împrăştierea valorilor) testele t, corelaţia, ANOVA b) neparametrice inferenţele sunt probate prin raportare la probabilitatea evenimentelor aleatoare în final, rezultatul eşantionului se raportează tot la un model teoretic (distribuţie de nul)

exemplu evaluarea eficienţei unei proceduri terapeutice anxiolitice: a) măsurarea cantitativă a anxietăţii, înainte-după aplicarea testului t pentru eşantioane dependente b) chestionarea la sfârşitul terapiei ameliorat (80%) fără efect (20%)

Când se utilizează teste neparametrice? variabila dependentă este măsurată pe scale calitative (nominală, ordinală) variabila dependentă este măsurată pe scală parametrică, dar... nu respectă condiţiile pentru test parametric (normalitate, omogenitatea împrăştierii) transformare calitativă (grupare de frecvenţe, ordonare după rang) volum foarte mic al eşantionului

avantaje ale testelor neparametrice nu presupun condiţii la fel de restictive (normalitatea distribuţiei, omogenitatea varianţei, etc.) ceea ce reduce mult situaţiile în care nu sunt aplicabile; calcule sunt relativ simple şi uşor de efectuat manual concepte şi metode mai uşor de înţeles; se pot utiliza pe scale ale căror calităţi de măsurare sunt slabe (ordinale, nominale); pot fi utilizate în cazul variabilelor afectate de valori extreme care nu pot fi eliminate.

dezavantaje ale testelor neparametrice se bazează pe măsurări nominale şi ordinale, prin natura lor, mai puţin precise decât cele cantitative (de interval sau de raport) au o putere mai redusă decât testele parametrice de a proba că ipoteza cercetării este adevărată; tind sa fie utilizate şi în situaţii în care se pot utiliza teste parametrice deşi se bazează pe calcule elementare, adesea acestea pot fi destul de complexe şi de laborioase.

Distribuţia binomială Concepte: evenimente dihotomice sexul la naştere (M/F) răspunsul la o întrebare (Corect/Eronat) starea după tratament (Vindecat/Nevindecat) încercare (observaţie) fiecare naştere; fiecare întrebare; fiecare tratament

Distribuţia binomială Distribuţia binomială descrie frecvenţa de apariţie ale unui anumit eveniment de tip dihotomic... sexul M/F, corect-greşit, ameliorat-neschimbat, etc... Pevenimentul vizat (feminin, corect, ameliorat...) Qevenimentul complementar (Q1-P) (masculin, greşit, )...în contextul unei serii de observaţii (încercări) un număr de naşteri, mai multe întrebări, mai mulţi subiecţi trataţi numărul observaţiilor (încercărilor) este simbolizat cu N distribuţia binomială diferă în funcţie de nr. încercărilor observaţiilor (N) probabilitatea de apariţie a evenimentului (P) şansă teoretică de apariţie a evenimentului la aruncarea unei monede, o singură dată, probabilitatea teoretică de apariţie a mărcii este P1/20.5 iar QP0.5

Abraham De Moivre (1667-1754) - teoria probabilităţilor Jakob Bernoulli (1654-1705) - distribuţia evenimentelor dihotomice

un exemplu practic... patru întrebări de statistică răspuns dihotomic corect / greşit un student dă 4 răspunsuri corecte! răspunsurile sunt bazate pe învăţare sau pe şansa de a le fi ghicit pe toate?

eveniment P(C) individuală P(C) cumulată (multiplicare) 1 E C 0.5 0.5 2 E C 0.5 0.5*0.50.25 3 E C 0.5 0.5*0.5*0.50.125 4 E C 0.5 0.5*0.5*0.5*0.50.0625 4 răspunsuri corecte nu indică suficient de sigur cunoştinţe P0.0625 > alfa0.05

C C C C C C C E C C E C C C E E C C C C E E E E C C C E E C E E E C C C E C C E E C E C E C E E E E C C E E C E E E E E E E C E Nr. răsp. corecte 0 1 2 3 4 Frecvenţa 1 4 6 4 1 P(C) 1/160.0625 4/160.25 6/160.375 4/160.25 1/160.0625 Dis tr ibuția b in om ia lă (N 4 ) 0,4 0,3 0,2 0,1 0 0,3 75 0,2 5 0,2 5 0,0 6 2 5 0,0 6 25 0 1 2 3 4

0.5 0.25 0.375 0.25 0.125 0.25 0.125 0 1 2 distributia binomială N2 0,25 0 1 2 3 4 distribuţia binomială N4 0,2256 0 1 2 3 4 5 6 distribuţia binomială N6 0,2 0,1934 0,1934 0,15 0,1208 0,1208 0,1 0,05 0 0,0161 0,0002 0,0029 0,0537 0,0537 0,0161 0,0029 0,0002 0 1 2 3 4 5 6 7 8 9 10 11 12 distribuţia binomială (N12)

Pentru P Q? Exemplu: patru variante de răspuns la fiecare întrebare numai una este corectă probabilitatea răspunsului corect (P) este ¼0.25 distribuţia binomială nu este simetrică la valori mici ale lui N, dar tinde să devină simetrică pe măsură ce N creşte. nu există un răspuns exact cu privire la valoarea lui N pentru care distribuţia binomială este aproximată suficient de bine de cea normală. se acceptă faptul că pentru P0.5, N nu trebuie să fie mai mare de 20-25 pentru P apropiat de 0 sau 1 se impune o valoare pentru N de cel puţin 100.

se poate lua în considerare aproximarea distribuţiei binomiale cu o distribuţie normală putem exprima valorile z în termeni de N, P şi Q z X µ σ z X N * P N * P * Q

pentru 8 răspunsuri corecte la un chestionar cu 10 întrebări z X N P N P Q 8 10 0.5 10 0.5 0.5 8 5 2.5 3 1.581 1.897 sub curba normală... p(z1.897) 0.0294 pentru alfa0.05, unilateral putem respinge ipoteza de nul admitem că studentul nu a răspuns la întâmplare pentru alfa0.05, bilateral admitem ipoteza de nul (z2.56)

Pentru 4 variante de răspuns la fiecare întrebare, din care una este corectă (8 răspunsuri corecte din 10 întrebări): P1/40.25 iar Q3/40.75 z X N * P N * P * Q z 8 10*0.25 10*0.25* 0.75 8 2.5 1.875 5.5 1.369 4.01 z calculat (4.01) > z critic; alfa0.05, bilateral (1.96)

Teste z pentru proporţii, bazate pe distribuţia binomială 1. Testul z pentru proporţia unui eşantion în raport cu populaţia 2. Testul z pentru diferenţa dintre proporţiile a două eşantioane independente 3. Testul semnului (pentru eşantioane dependente)

1. Testul z pentru proporţia unui eşantion în raport cu populaţia echivalentul pentru date nominale al testului z parametric pentru un singur eşantion Exemplu: pe un eşantion aleator de 100 de subiecţi dintro anumită comunitate, procentul stângacilor este de 20%, în timp ce studiile la nivelul populaţiei generale indică un procent de stângaci de numai 15%. există o anomalie a lateralităţii?

z z X N * P N * P * Q p P PQ N prin împărţirea simultană a numărătorului şi numitorului cu N p (mic) probabilitatea măsurată a evenimentului cercetat, P (mare) probabilitatea aceluiaşi eveniment la nivelul populaţiei, Q probabilitatea complementară a lui P, N volumul eşantionului. z 0.20 0.15 0.15 0.85 100 0.05 0.127 100 1.42 p(z1.42) pe curba normală0.0778 (mai mare decât alfa0.05) acceptăm ipoteza de nul proporţia stângacilor nu depăşeşte semnificativ proporţia la nivelul populaţiei generale.

Testul z pentru proporţii implică testarea semnificaţiei unui procent observat în raport procentul populaţiei (atunci când este cunoscut), pentru evenimente de tip dihotomic. Exemplu se poate răspunde la întrebarea dacă un procent 55% de nou născuţi băieţi este neobişnuit de mare, ştiind care este procentul general al noilor născuţi băieţi Pentru situaţiile în care evenimentele cercetate nu sunt de tip dihotomic, se aplică alte teste statistice, despre care vom vorbi mai târziu.

2. Testul z pentru diferenţa dintre proporţiile a două eşantioane independente două eşantioane din două ţări diferite (n 1 100) stângaci (P 1 0.15) (n290) stângaci (P 2 0.25) este numărul stângacilor din ţara 2 mai mare decât cel din ţara 1? ipoteza cercetării: P 1 P 2 ipoteza de nul: P 1 P 2 (P 1 -P 2 0) P 1 şi P 2 probabilităţile unui eveniment aleator de tip binomial, evenimentul complementar (Q 1, respectiv Q 2 ) este caracteristica de a fi dreptaci (vom ignora acum faptul că pot exista şi ambidextri ).

z ( p p ) 1 2 σ ( P P2 ) ( p p ) 1 2 1 p 1 şi p 2 sunt proporţiile evenimentului la nivelul eşantioanelor P 1 şi P 2 sunt proporţiile evenimentului la nivelul populaţiei (ipoteza de nul) σ(p 1 -p 2 ) este eroarea standard a distribuţiei de eşantionare σ p1 * q1 p2 * p + ( p ) 1 2 n n 1 2 q 2 q 1 1-p 1 q 2 1-p 2 n 1 şi n 2 sunt volumele celor două eşantioane

z p 1 1 1 * q n p 1 + p 2 p 2 * q n 2 2 pt. eşant. mici (N<30) z p 1 1 1 p2 2* n 1 2* n p1 * q1 p2 * q2 + n n 1 2 2 z 0.15*0.85 100 0.15 0.25 + 0.25*0.75 90 0.10 0.001+ 0.002 0.10 0.054 1.85 pt. alfa0.05, bilateral se admite ipoteza de nul

3. Testul semnului 1710 - John Arbuthnot se utilizează pentru compararea proporţiilor obţinute pe un eşantion evaluat în două situaţii diferite echivalentul neparametric al testului t pentru eşantioane dependente Exemplu: Un psiholog clinician aplică o metodă de reducere a manifestărilor de tip fobic la un grup de 8 de subiecţi. După un număr de şedinţe îi întreabă pe cei 8 subiecţi dacă se simt mai bine decât la începutul tratamentului. 6 afirmă că se simt mai bine 2 afirmă că nu simt nici o modificare (să admitem că nimeni nu răspuns că se simte mai rău ) se poate decide că metoda este eficientă? John Arbuthnot (1667-1735)

ipoteza cercetării: metoda are efect procentul de ameliorare este semnificativ mai mare decât cel al absenţei oricărui efect al terapiei Ipoteza de nul metoda nu are efect eficienţa/ineficienţa terapiei sunt echivalente (PQ0.5) P(ameliorare) 6/80.75 Este P(ameliorare) semnificativ diferit de cel al ipotezei de nul (0.5)?

z X N * P N * P * Q corecţia Yeates z X N * P 0.5 N * P * Q pentru datele noastre... z 6 8*0.75 0.5 8*0.75*0.25 0.5 1.22 0.40 p (z-0.4) 0.844 (mai mare decât alfa0.05) acceptăm ipoteza de nul datele nu susţin efectul terapiei