Distribuţia binomială Teste statistice neparametrice nominale. M. Popa

Σχετικά έγγραφα
Curs 10 Funcţii reale de mai multe variabile reale. Limite şi continuitate.

Distribuţia multinomială Testul chi-pătrat. M. Popa

TESTE STATISTICE PENTRU DATE ORDINALE. M. Popa

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor X) functia f 1

sunt comparate grupuri formate din subiecńi diferińi, evaluańi în condińii diferite testul t pentru eşantioane independente ANOVA

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor

Scoruri standard Curba normală (Gauss) M. Popa

NOTIUNI DE BAZA IN STATISTICA

Curs 4 Serii de numere reale

(a) se numeşte derivata parţială a funcţiei f în raport cu variabila x i în punctul a.

Metode iterative pentru probleme neliniare - contractii

Planul determinat de normală şi un punct Ecuaţia generală Plane paralele Unghi diedru Planul determinat de 3 puncte necoliniare

5. FUNCŢII IMPLICITE. EXTREME CONDIŢIONATE.

Statistică descriptivă Distribuția normală Estimare. Călinici Tudor 2015

Integrala nedefinită (primitive)

MARCAREA REZISTOARELOR

9 Testarea ipotezelor statistice

V.7. Condiţii necesare de optimalitate cazul funcţiilor diferenţiabile

8 Intervale de încredere

Statisticǎ - curs 4. 1 Generalitǎţi privind ipotezele statistice şi problema verificǎrii ipotezelor statistice 2

Curs 1 Şiruri de numere reale

Subiecte Clasa a VII-a

riptografie şi Securitate

Metode de interpolare bazate pe diferenţe divizate

7 Distribuţia normală

Variabile statistice. (clasificare, indicatori)

Componente şi Circuite Electronice Pasive. Laborator 3. Divizorul de tensiune. Divizorul de curent

a n (ζ z 0 ) n. n=1 se numeste partea principala iar seria a n (z z 0 ) n se numeste partea

Aplicaţii ale principiului I al termodinamicii la gazul ideal

Analiza în curent continuu a schemelor electronice Eugenie Posdărăscu - DCE SEM 1 electronica.geniu.ro

5.4. MULTIPLEXOARE A 0 A 1 A 2

Statisticǎ - curs 3. 1 Seria de distribuţie a statisticilor de eşantioane 2. 2 Teorema limitǎ centralǎ 5. 3 O aplicaţie a teoremei limitǎ centralǎ 7


Subiecte Clasa a VIII-a

Analiza bivariata a datelor

III. Serii absolut convergente. Serii semiconvergente. ii) semiconvergentă dacă este convergentă iar seria modulelor divergentă.

Valori limită privind SO2, NOx şi emisiile de praf rezultate din operarea LPC în funcţie de diferite tipuri de combustibili

ESTIMAREA PARAMETRILOR STATISTICI. Călinici Tudor

Modelarea şi Simularea Sistemelor de Calcul Distribuţii ( lab. 4)

Recapitulare - Tipuri de date

a. 11 % b. 12 % c. 13 % d. 14 %

5.5. REZOLVAREA CIRCUITELOR CU TRANZISTOARE BIPOLARE

Proiectarea filtrelor prin metoda pierderilor de inserţie

Laborator 11. Mulţimi Julia. Temă

Fig Impedanţa condensatoarelor electrolitice SMD cu Al cu electrolit semiuscat în funcţie de frecvenţă [36].

R R, f ( x) = x 7x+ 6. Determinați distanța dintre punctele de. B=, unde x și y sunt numere reale.

* K. toate K. circuitului. portile. Considerând această sumă pentru toate rezistoarele 2. = sl I K I K. toate rez. Pentru o bobină: U * toate I K K 1

DISTANŢA DINTRE DOUĂ DREPTE NECOPLANARE

COLEGIUL NATIONAL CONSTANTIN CARABELLA TARGOVISTE. CONCURSUL JUDETEAN DE MATEMATICA CEZAR IVANESCU Editia a VI-a 26 februarie 2005.

Curs 14 Funcţii implicite. Facultatea de Hidrotehnică Universitatea Tehnică "Gh. Asachi"

Conice. Lect. dr. Constantin-Cosmin Todea. U.T. Cluj-Napoca

Sisteme diferenţiale liniare de ordinul 1

ANALIZA DATELOR EXPERIMENTALE

POPULAŢIE NDIVID DATE ORDINALE EŞANTION DATE NOMINALE

RĂSPUNS Modulul de rezistenţă este o caracteristică geometrică a secţiunii transversale, scrisă faţă de una dintre axele de inerţie principale:,

Erori statistice Puterea testului statistic Mărimea efectului. Marian Popa

Coeficientul de corelaţie Pearson(r) M. Popa

DistributiiContinue de Probabilitate Distributia Normala

Cursul 6. Tabele de incidenţă Sensibilitate, specificitate Riscul relativ Odds Ratio Testul CHI PĂTRAT

V O. = v I v stabilizator

Seminariile Capitolul X. Integrale Curbilinii: Serii Laurent şi Teorema Reziduurilor

Analiza datelor de marketing utilizand S.P.S.S. - analiza diferentiala -

TEMA 9: FUNCȚII DE MAI MULTE VARIABILE. Obiective:

Examen AG. Student:... Grupa:... ianuarie 2011

Câmp de probabilitate II

Componente şi Circuite Electronice Pasive. Laborator 4. Măsurarea parametrilor mărimilor electrice

PRELEGEREA XII STATISTICĂ MATEMATICĂ

Capitolul 2 - HIDROCARBURI 2.4.ALCADIENE

Mihai Orzan joi, 19:30, sala 1406

5.1. Noţiuni introductive

Seminar 5 Analiza stabilității sistemelor liniare

Elemente de bază în evaluarea incertitudinii de măsurare. Sonia Gaiţă Institutul Naţional de Metrologie Laboratorul Termometrie

Masurarea variabilitatii Indicatorii variaţiei(împrăştierii) lectia 5 16 martie 2 011

INTRODUCERE ÎN STATISTICA MEDICALĂ

3 Distribuţii discrete clasice

Capitolul 14. Asamblari prin pene

Capitolul ASAMBLAREA LAGĂRELOR LECŢIA 25

EDITURA PARALELA 45 MATEMATICĂ DE EXCELENŢĂ. Clasa a X-a Ediţia a II-a, revizuită. pentru concursuri, olimpiade şi centre de excelenţă


1. Distribuţiile teoretice 2. Intervalul de încredere pentru caracteristicile cantitative (medii) Histograma Nr. valori Nr. de clase de valori

Esalonul Redus pe Linii (ERL). Subspatii.

APLICAȚIILE MEDICALE ALE CALCULULUI PROBABILITĂŢILOR. Călinici Tudor 2016

Asupra unei inegalităţi date la barajul OBMJ 2006

SEMINAR 14. Funcţii de mai multe variabile (continuare) ( = 1 z(x,y) x = 0. x = f. x + f. y = f. = x. = 1 y. y = x ( y = = 0

SERII NUMERICE. Definiţia 3.1. Fie (a n ) n n0 (n 0 IN) un şir de numere reale şi (s n ) n n0

TESTAREA IPOTEZELOR STATISTICE

Functii Breviar teoretic 8 ianuarie ianuarie 2011

BARAJ DE JUNIORI,,Euclid Cipru, 28 mai 2012 (barajul 3)

Curs 2 Şiruri de numere reale

Ecuaţia generală Probleme de tangenţă Sfera prin 4 puncte necoplanare. Elipsoidul Hiperboloizi Paraboloizi Conul Cilindrul. 1 Sfera.

Capitolul 2 - HIDROCARBURI 2.5.ARENE

Erori si incertitudini de măsurare. Modele matematice Instrument: proiectare, fabricaţie, Interacţiune măsurand instrument:

riptografie şi Securitate

Msppi. Curs 3. Modelare statistica Exemplu. Studiu de caz

Capitolul 2 - HIDROCARBURI 2.3.ALCHINE

I3: PROBABILITǍŢI - notiţe de curs

T R A I A N ( ) Trigonometrie. \ kπ; k. este periodică (perioada principală T * =π ), impară, nemărginită.

I3: PROBABILITǍŢI - notiţe de curs

Capitolul 4. Integrale improprii Integrale cu limite de integrare infinite

Problema a II - a (10 puncte) Diferite circuite electrice

Transcript:

Distribuţia binomială Teste statistice neparametrice nominale M. Popa

a) parametrice Teste statistice inferenţele sunt probate prin utilizarea parametrilor populaţiei (indicatori care descriu tendinţa centrală şi împrăştierea valorilor) testele t, corelaţia, ANOVA b) neparametrice inferenţele sunt probate prin raportare la probabilitatea evenimentelor aleatoare în final, rezultatul eşantionului se raportează tot la un model teoretic (distribuţie de nul)

exemplu evaluarea eficienţei unei proceduri terapeutice anxiolitice: a) măsurarea cantitativă a anxietăţii, înainte-după aplicarea testului t pentru eşantioane dependente b) chestionarea la sfârşitul terapiei ameliorat (80%) fără efect (20%)

Când se utilizează teste neparametrice? variabila dependentă este măsurată pe scale calitative (nominală, ordinală) variabila dependentă este măsurată pe scală parametrică, dar... nu respectă condiţiile pentru test parametric (normalitate, omogenitatea împrăştierii) transformare calitativă (grupare de frecvenţe, ordonare după rang) volum foarte mic al eşantionului

avantaje ale testelor neparametrice nu presupun condiţii la fel de restictive (normalitatea distribuţiei, omogenitatea varianţei, etc.) ceea ce reduce mult situaţiile în care nu sunt aplicabile; calcule sunt relativ simple şi uşor de efectuat manual concepte şi metode mai uşor de înţeles; se pot utiliza pe scale ale căror calităţi de măsurare sunt slabe (ordinale, nominale); pot fi utilizate în cazul variabilelor afectate de valori extreme care nu pot fi eliminate.

dezavantaje ale testelor neparametrice se bazează pe măsurări nominale şi ordinale, prin natura lor, mai puţin precise decât cele cantitative (de interval sau de raport) au o putere mai redusă decât testele parametrice de a proba că ipoteza cercetării este adevărată; tind sa fie utilizate şi în situaţii în care se pot utiliza teste parametrice deşi se bazează pe calcule elementare, adesea acestea pot fi destul de complexe şi de laborioase.

Distribuţia binomială Concepte: evenimente dihotomice sexul la naştere (M/F) răspunsul la o întrebare (Corect/Eronat) starea după tratament (Vindecat/Nevindecat) încercare (observaţie) fiecare naştere; fiecare întrebare; fiecare tratament

Distribuţia binomială Distribuţia binomială descrie frecvenţa de apariţie ale unui anumit eveniment de tip dihotomic... sexul M/F, corect-greşit, ameliorat-neschimbat, etc... Pevenimentul vizat (feminin, corect, ameliorat...) Qevenimentul complementar (Q1-P) (masculin, greşit, )...în contextul unei serii de observaţii (încercări) un număr de naşteri, mai multe întrebări, mai mulţi subiecţi trataţi numărul observaţiilor (încercărilor) este simbolizat cu N distribuţia binomială diferă în funcţie de nr. încercărilor observaţiilor (N) probabilitatea de apariţie a evenimentului (P) şansă teoretică de apariţie a evenimentului la aruncarea unei monede, o singură dată, probabilitatea teoretică de apariţie a mărcii este P1/20.5 iar QP0.5

Abraham De Moivre (1667-1754) - teoria probabilităţilor Jakob Bernoulli (1654-1705) - distribuţia evenimentelor dihotomice

un exemplu practic... patru întrebări de statistică răspuns dihotomic corect / greşit un student dă 4 răspunsuri corecte! răspunsurile sunt bazate pe învăţare sau pe şansa de a le fi ghicit pe toate?

eveniment P(C) individuală P(C) cumulată (multiplicare) 1 E C 0.5 0.5 2 E C 0.5 0.5*0.50.25 3 E C 0.5 0.5*0.5*0.50.125 4 E C 0.5 0.5*0.5*0.5*0.50.0625 4 răspunsuri corecte nu indică suficient de sigur cunoştinţe P0.0625 > alfa0.05

C C C C C C C E C C E C C C E E C C C C E E E E C C C E E C E E E C C C E C C E E C E C E C E E E E C C E E C E E E E E E E C E Nr. răsp. corecte 0 1 2 3 4 Frecvenţa 1 4 6 4 1 P(C) 1/160.0625 4/160.25 6/160.375 4/160.25 1/160.0625 Dis tr ibuția b in om ia lă (N 4 ) 0,4 0,3 0,2 0,1 0 0,3 75 0,2 5 0,2 5 0,0 6 2 5 0,0 6 25 0 1 2 3 4

0.5 0.25 0.375 0.25 0.125 0.25 0.125 0 1 2 distributia binomială N2 0,25 0 1 2 3 4 distribuţia binomială N4 0,2256 0 1 2 3 4 5 6 distribuţia binomială N6 0,2 0,1934 0,1934 0,15 0,1208 0,1208 0,1 0,05 0 0,0161 0,0002 0,0029 0,0537 0,0537 0,0161 0,0029 0,0002 0 1 2 3 4 5 6 7 8 9 10 11 12 distribuţia binomială (N12)

Pentru P Q? Exemplu: patru variante de răspuns la fiecare întrebare numai una este corectă probabilitatea răspunsului corect (P) este ¼0.25 distribuţia binomială nu este simetrică la valori mici ale lui N, dar tinde să devină simetrică pe măsură ce N creşte. nu există un răspuns exact cu privire la valoarea lui N pentru care distribuţia binomială este aproximată suficient de bine de cea normală. se acceptă faptul că pentru P0.5, N nu trebuie să fie mai mare de 20-25 pentru P apropiat de 0 sau 1 se impune o valoare pentru N de cel puţin 100.

se poate lua în considerare aproximarea distribuţiei binomiale cu o distribuţie normală putem exprima valorile z în termeni de N, P şi Q z X µ σ z X N * P N * P * Q

pentru 8 răspunsuri corecte la un chestionar cu 10 întrebări z X N P N P Q 8 10 0.5 10 0.5 0.5 8 5 2.5 3 1.581 1.897 sub curba normală... p(z1.897) 0.0294 pentru alfa0.05, unilateral putem respinge ipoteza de nul admitem că studentul nu a răspuns la întâmplare pentru alfa0.05, bilateral admitem ipoteza de nul (z2.56)

Pentru 4 variante de răspuns la fiecare întrebare, din care una este corectă (8 răspunsuri corecte din 10 întrebări): P1/40.25 iar Q3/40.75 z X N * P N * P * Q z 8 10*0.25 10*0.25* 0.75 8 2.5 1.875 5.5 1.369 4.01 z calculat (4.01) > z critic; alfa0.05, bilateral (1.96)

Teste z pentru proporţii, bazate pe distribuţia binomială 1. Testul z pentru proporţia unui eşantion în raport cu populaţia 2. Testul z pentru diferenţa dintre proporţiile a două eşantioane independente 3. Testul semnului (pentru eşantioane dependente)

1. Testul z pentru proporţia unui eşantion în raport cu populaţia echivalentul pentru date nominale al testului z parametric pentru un singur eşantion Exemplu: pe un eşantion aleator de 100 de subiecţi dintro anumită comunitate, procentul stângacilor este de 20%, în timp ce studiile la nivelul populaţiei generale indică un procent de stângaci de numai 15%. există o anomalie a lateralităţii?

z z X N * P N * P * Q p P PQ N prin împărţirea simultană a numărătorului şi numitorului cu N p (mic) probabilitatea măsurată a evenimentului cercetat, P (mare) probabilitatea aceluiaşi eveniment la nivelul populaţiei, Q probabilitatea complementară a lui P, N volumul eşantionului. z 0.20 0.15 0.15 0.85 100 0.05 0.127 100 1.42 p(z1.42) pe curba normală0.0778 (mai mare decât alfa0.05) acceptăm ipoteza de nul proporţia stângacilor nu depăşeşte semnificativ proporţia la nivelul populaţiei generale.

Testul z pentru proporţii implică testarea semnificaţiei unui procent observat în raport procentul populaţiei (atunci când este cunoscut), pentru evenimente de tip dihotomic. Exemplu se poate răspunde la întrebarea dacă un procent 55% de nou născuţi băieţi este neobişnuit de mare, ştiind care este procentul general al noilor născuţi băieţi Pentru situaţiile în care evenimentele cercetate nu sunt de tip dihotomic, se aplică alte teste statistice, despre care vom vorbi mai târziu.

2. Testul z pentru diferenţa dintre proporţiile a două eşantioane independente două eşantioane din două ţări diferite (n 1 100) stângaci (P 1 0.15) (n290) stângaci (P 2 0.25) este numărul stângacilor din ţara 2 mai mare decât cel din ţara 1? ipoteza cercetării: P 1 P 2 ipoteza de nul: P 1 P 2 (P 1 -P 2 0) P 1 şi P 2 probabilităţile unui eveniment aleator de tip binomial, evenimentul complementar (Q 1, respectiv Q 2 ) este caracteristica de a fi dreptaci (vom ignora acum faptul că pot exista şi ambidextri ).

z ( p p ) 1 2 σ ( P P2 ) ( p p ) 1 2 1 p 1 şi p 2 sunt proporţiile evenimentului la nivelul eşantioanelor P 1 şi P 2 sunt proporţiile evenimentului la nivelul populaţiei (ipoteza de nul) σ(p 1 -p 2 ) este eroarea standard a distribuţiei de eşantionare σ p1 * q1 p2 * p + ( p ) 1 2 n n 1 2 q 2 q 1 1-p 1 q 2 1-p 2 n 1 şi n 2 sunt volumele celor două eşantioane

z p 1 1 1 * q n p 1 + p 2 p 2 * q n 2 2 pt. eşant. mici (N<30) z p 1 1 1 p2 2* n 1 2* n p1 * q1 p2 * q2 + n n 1 2 2 z 0.15*0.85 100 0.15 0.25 + 0.25*0.75 90 0.10 0.001+ 0.002 0.10 0.054 1.85 pt. alfa0.05, bilateral se admite ipoteza de nul

3. Testul semnului 1710 - John Arbuthnot se utilizează pentru compararea proporţiilor obţinute pe un eşantion evaluat în două situaţii diferite echivalentul neparametric al testului t pentru eşantioane dependente Exemplu: Un psiholog clinician aplică o metodă de reducere a manifestărilor de tip fobic la un grup de 8 de subiecţi. După un număr de şedinţe îi întreabă pe cei 8 subiecţi dacă se simt mai bine decât la începutul tratamentului. 6 afirmă că se simt mai bine 2 afirmă că nu simt nici o modificare (să admitem că nimeni nu răspuns că se simte mai rău ) se poate decide că metoda este eficientă? John Arbuthnot (1667-1735)

ipoteza cercetării: metoda are efect procentul de ameliorare este semnificativ mai mare decât cel al absenţei oricărui efect al terapiei Ipoteza de nul metoda nu are efect eficienţa/ineficienţa terapiei sunt echivalente (PQ0.5) P(ameliorare) 6/80.75 Este P(ameliorare) semnificativ diferit de cel al ipotezei de nul (0.5)?

z X N * P N * P * Q corecţia Yeates z X N * P 0.5 N * P * Q pentru datele noastre... z 6 8*0.75 0.5 8*0.75*0.25 0.5 1.22 0.40 p (z-0.4) 0.844 (mai mare decât alfa0.05) acceptăm ipoteza de nul datele nu susţin efectul terapiei