Prelucrarea caracteristicilor calitative Definiţia probabilităţii; P A = Nr. cazuri favorabile/nr.cazuri posibile sau existente Probabilitatea matematică se stabileşte apriori; probabilitatea empirică (experimentală) Probabilitatea fundamentală se stabileşte aposteriori; probabilitatea empirică (experimentală) nr. nascuti vii de sex M nr. nascuti vii de sex F Masculin: p = 0,515 Feminin: q = 0,485 P = 51,5 % Q = 48,5 % P n N x100 p + q = 1 P + Q = 100 51,5% 48,5%
Probabilitatea fundamentală In biostatistică, în studiul fenomenelor de masă acţionează probabilitatea fundamentală, care este o probabilitate medie. Probabilitatea producerii unui eveniment, merge de la imposibilitatea producerii lui şi până la certitudine, şi variază între 0 1, 0 100, fără a atinge cele două extreme. Cu cât probabilitatea se apropie de 1 sau 100 cu atât probabilitatea producerii evenimentului este mai mare. Dacă p sau P este egal cu ½, atunci sunt şanse egale ca evenimentul să se producă sau să nu se producă.
Probabilităţi simple Probabilităţi compuse reprezintă probabilitatea de a se realiza în acelaşi timp fie unul, fie altul din mai multe evenimente P 3 şi P 5 produsul celor două probabilităţi P 3 sau P 5 suma celor două probabilităţi Caracteristici calitative alternative p + q = 1 P + Q = 100
Prelucrarea datelor statistice calitative Probabilitatea nu se aplică pe caz în parte ci pe colectivitate Prelucrarea datelor statistice în cazul caracteristicilor calitative, se realizează prin calculul frecvenţei acestora Frecvenţa relativă a apariţiei unui eveniment este considerată probabilitatea acelui eveniment. De aceea, frecvenţa se notează cu P Calculul variaţiei (dispersiei) unei frecvenţe (deviaţia standard) σ Px Q
Calculul erorii standard pentru frecvenţe μ σ n μ PxQ n Generalizarea datelor Intervalul de încredere sau de siguranţă statistică IC x t μ IC P t μ IC = LI LS
Definiţia IC Este intervalul în care pornind de la media pe eşantion, dacă studiem caracteristici cantitative sau de la frecvenţa pe eşantion, în cazul caracteristicilor calitative, putem estima, media sau frecvenţa pentru colectivitatea generală (N) IC stabileşte media sau frecvenţa pentru colectivitatea generală (N). Media sau frecvenţa pentru N este estimată şi nu stabilită cu certitudine, ci cu un grad ridicat de probabilitate.
TEORIA EŞANTIONAJULUI Eşantion - mostră - colectivitate de selecţie - colectivitate parţială extrasă aleator dintr-o populaţie N - colectivitatea generală - colectivitatea de bază - colectivitatea de referinţă - bază de sondaj - populaţia ţintă
În statistică Selecţie reprezintă o colectivitate constituită absolut întâmplător În vorbirea curentă Selecţie înseamnă o alegere dirijată după un criteriu bine stabilit Eşantionul trebuie să fie reprezentativ pentru colectivitatea generală (N), de unde a fost extras. Reprezentativitatea este determinată de alegerea aleatoare a unităţilor statistice care vor alcătui eşantionul şi nu de volumul acestuia. Precizia eşantionului este determinată de volumul acestuia, adică, de numărul de unităţi statistice, care vor alcătui eşantionul
Tipuri de eşantionaj Schema de constituire a unui eşantion dă şi denumirea tipului de eşantionaj A eşantion probabilistic (aleator) B eşantion neprobabilistic, nealeator, empiric A eşantion probabilistic (aleator) a) eşantion aleatoriu simplu sau elementar Realizarea sa cuprinde 3 etape: 1. Realizarea bazei de sondaj 2. Mărimea sau dimensiunea eşantionului, adică cât de mare trebuie să fie n din N; acest lucru se realizează pe baza determinării fracţiunii de eşantionaj 3. Nominalizarea unităţilor statistice, ce vor face parte din eşantion: - Pas de numărare - Selectare tip LOTO - Tabele cu numere aleatoare - EŞ trebuie să fie validat - Generalizarea datelor pe baza IC
Tipuri de eşantionaj A eşantion probabilistic (aleator) b) Eşantionul stratificat - Se foloseşte atunci când datele nu sunt dispuse aleatoriu, ci sunt clasate după anumite caracteristici. - Astfel în interiorul populaţiei de referinţă apar mai multe subpopulaţii, subpopulaţii care se numesc straturi. - - Caracteristic pentru un strat este omogenitatea internă şi neomogenitatea faţă de celelalte straturi din punctul de vedere al caracteristicii studiate. - - Alegerea criteriului de stratificare este foarte importantă
Tipuri de eşantionaj A eşantion probabilistic (aleator) c) Eşantionul în cuiburi (ciorchine) - Se foloseşte atunci când nu există bază de sondaj, sau atunci când întocmirea ei este greoaie sau costisitoare - Principiu: populaţia de investigat poate fi imaginată ca fiind alcătuită din unităţi de selecţie, agregate şi ierarhizate (gravidele familie colectivitate definită cartier comună judeţ ţară)
Tipuri de eşantionaj A eşantion probabilistic (aleator) - Etape de alcătuire a eşantionului în cuiburi (cuprinde 3 etape): 1. Baza de sondaj lista cuiburilor (comune, familie) 2. Se extrag aleatoriu cuiburile care vor face parte din EŞ 3. Se investighează toate unităţile de observare din cuiburile extrase. Reprezentativitatea EŞ este de preferat să fie studiate mai multe cuiburi de dimensiuni mici, decât puţine cuiburi de dimensiuni mari
Tipuri de eşantionaj A eşantion probabilistic (aleator) d) Eşantionul multistadial - se realizează mai multe extrageri - este utilizat pentru acele procese care implică teste chimice, fizice sau biologice, care pot fi efectuate întro cantitate mai mică de produs, prin extragerea de subeşantioane dintr-o cantitate mai mare care este ea însăşi un eşantion. - Exemplu: ţară judeţe comune familie gravide sunt posibile următoarele extrageri Sondajul grad I judeţele din judeţele selecţionate Sondajul grad II comunele, din comunele selecţionate Sondajul grad III familiile, din familiile selecţionate
Tipuri de eşantionaj d) Eşantionul multistadial Baza de eşantionaj cuprinde toate gravidele din care se va face un nou sondaj Sondajul grad IV care va genera eşantionul ce va fi efectiv investigat. - De obicei se foloseşte eşantionul bistadial sau tristadial.
Tipuri de eşantionaj B Eşantion neprobabilistic, nealeator, empiric - Reprezentativitatea poate fi asigurată prin alegerea raţională a eşantionului de către cercetător - EŞ neprobabilistic nu implică selecţia aleatoare, deci el nu se bazează pe teoria probabilităţilor, adică se poate ca populaţia să fie sau să nu fie bine reprezentată, dar acest lucru este greu de demonstrat. - În general se folosesc EŞ probabilistice Eşantion neprobabilistic clasificare 1. Bazat pe convenţie eşantionajul convenţional - unitatea de observaţie este omul de pe stradă - este folosit pentru a obţine în scurt timp opinia populaţiei (deşi nereprezentativă) - în practica clinică se pot utiliza ca EŞ pacienţii care ne sunt disponibili
Tipuri de eşantionaj 2. Eşantionajul bazat pe atingerea unui scop - Selecţia se face având un scop a) EŞ tipice (metoda unităţilor tip) Ex. o localitate este reprezentativă pentru situaţia unei zone b) EŞ experţilor c) Metoda cotelor - Este modalitatea cea mai utilizată în cadrul EŞ empiric - Reprezentativitatea constă în realizarea unui EŞ care să aibă o structură asemănătoare cu cea a populaţiei - Alegerea unităţilor statistice se realizează cum doreşte cercetătorul. Ex. I se dau fiecărui cercetător nr. şi caracteristicile persoanelor care trebuie investigate 60 femei din care: 20 grupa de vârstă 15 19 ani 20 grupa de vârstă 20 29 ani 20 grupa de vârstă 30 39 ani lăsându-i libertatea de a le găsi (stradă, vecini) este o metodă care nu necesită prezenţa bazei de sondaj
Tipuri de eşantionaj d) Eşantionul în bulgăre de zăpadă - Se identifică unităţile statistice (persoane) care îndeplinesc criteriile pentru a fi incluse în studiu. - Aceste persoane sunt apoi rugate să recomande alte persoane care îndeplinesc aceleaşi criterii - Câteodată este singura modalitate disponibilă (studiu persoanelor fără adăpost). - Această metodă asigură greu reprezentativitatea.
Surse de erori în studiile pe eşantion Există 3 surse de erori: 1. Neinvestigarea unor unităţi statistice selecţionate în eşantion (non-răspuns) 2. Erori din cauza aparaturii de măsură 3. Erori introduse în procesele de editare, codificare, tabelare a rezultatelor
Surse de erori în studiile pe eşantion Soluţii de rezolvare a erorilor: 1. Scăderea procentajului de non-răspunsuri, printr-o pregătire a populaţiei şi a operatorilor de interviu. 2. Cunoaşterea unor caracteristici ale populaţiei refractare cu scopul de a le putea compara cu cele ale populaţiei care răspunde, urmărind să testăm dacă diferenţa dintre răspunsuri este semnificativă statistic. EŞ cu persoanele care nu au răspuns de precizat cauzele 3. O soluţie recomandată - De a găsi un înlocuitor pentru fiecare non-răspuns - Listă de rezervă realizată tot prin extragere la sorţi chiar din momentul începerii selecţiei Înlocuirile duc la realizarea volumului stabilit iniţial al EŞ, dar nu garantează precizia calculată, deoarece nonrespondenţii nu vor fi niciodată asemănători cu înlocuitorii lor care au acceptat să participe la studiu.
Surse de erori în studiile pe eşantion Volumul EŞ furnizează numărul de subiecţi de la care trebuie obţinută informaţia, şi nu numărul de subiecţi care trebuie selectaţi pentru studiu.
Realizarea unui eşantion probabilistic (aleator) Cuprinde 3 etape: 1. Baza de sondaj Reprezintă lista cu întreaga populaţie 2. Mărimea sau dimensiunea EŞ pe baza fracţiunii de eşantionaj 3. Se nominalizează unităţile statistice ce vor face parte din EŞ: - pas de numărare - selectare tip LOTO - tabel cu numere aleatorii - EŞ trebuie validat. Generalizarea datelor - IC
Avantajele unui eşantion probabilistic (aleator) 1. Mai operativ, mai economic 2. Se realizează într-un timp mai scurt 3. Intervin erori de înregistrare mai puţin numeroase 4. Este indispensabil când studiile totale nu se pot efectua 5. Asigurarea unei reprezentativităţi a eşantionului şi a unei precizii Reprezentativitate selecţie aleatoare Precizia EŞ volumul EŞ
Realizarea unui eşantion probabilistic (aleator) FRACŢIUNE DE EŞANTIONAJ n N Δ t 2 2 σ 2 t σ N n 2 2 Prevalenţa HTA = 15 % q = 0,05 t = 1,96 N = 75.000 locuitori p = 0,15; q = 0,85 = 0,02 2 (1,96) (0,15 0,85) 2 (0,15 0,85) (1,96) (0,02) 75.000 n 2 1.219 1219 75.000 x100 1,6%
BAZĂ DE SONDAJ Grupa de vârstă N n 0 9 10 19 20 29 30 39 40 49 50 59 60 69 70 79 80 + 10.725 12.434 10.884 10.754 8.913 8.952 7.460 3.408 1.470 174 202 177 175 145 146 121 55 24 TOTAL 75.000 1.219 10.725 : 62 = 174 12.434 : 62 = 202 10.884 : 62 = 177 1.470 : 62 = 24 Pas de numărare: K = N n 75.000 1.219 62 P Q 2 = eroarea limită sau eroarea maximă admisă σ 2 (varianţa) = P x Q P = 50 % Dacă nu mai avem nici o cercetare, adică nu-l cunoaştem pe P, Q = 50 % atunci se iau aşa zisele probabilităţi arbitrare.