INTRODUCERE ÎN STATISTICĂ

Σχετικά έγγραφα
INTRODUCERE ÎN STATISTICA MEDICALĂ

Curs 10 Funcţii reale de mai multe variabile reale. Limite şi continuitate.

Curs 1 Şiruri de numere reale

(a) se numeşte derivata parţială a funcţiei f în raport cu variabila x i în punctul a.

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor X) functia f 1

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor

Metode iterative pentru probleme neliniare - contractii

Curs 4 Serii de numere reale

Integrala nedefinită (primitive)

a n (ζ z 0 ) n. n=1 se numeste partea principala iar seria a n (z z 0 ) n se numeste partea

Planul determinat de normală şi un punct Ecuaţia generală Plane paralele Unghi diedru Planul determinat de 3 puncte necoliniare

MARCAREA REZISTOARELOR

Aplicaţii ale principiului I al termodinamicii la gazul ideal

III. Serii absolut convergente. Serii semiconvergente. ii) semiconvergentă dacă este convergentă iar seria modulelor divergentă.

Curs 14 Funcţii implicite. Facultatea de Hidrotehnică Universitatea Tehnică "Gh. Asachi"

Erori si incertitudini de măsurare. Modele matematice Instrument: proiectare, fabricaţie, Interacţiune măsurand instrument:

ESTIMAREA PARAMETRILOR STATISTICI. Călinici Tudor

Subiecte Clasa a VIII-a

R R, f ( x) = x 7x+ 6. Determinați distanța dintre punctele de. B=, unde x și y sunt numere reale.

Subiecte Clasa a VII-a

Analiza în curent continuu a schemelor electronice Eugenie Posdărăscu - DCE SEM 1 electronica.geniu.ro


8 Intervale de încredere

V.7. Condiţii necesare de optimalitate cazul funcţiilor diferenţiabile

DISTANŢA DINTRE DOUĂ DREPTE NECOPLANARE

Fig Impedanţa condensatoarelor electrolitice SMD cu Al cu electrolit semiuscat în funcţie de frecvenţă [36].

SERII NUMERICE. Definiţia 3.1. Fie (a n ) n n0 (n 0 IN) un şir de numere reale şi (s n ) n n0

V O. = v I v stabilizator

Variabile statistice. (clasificare, indicatori)

5.4. MULTIPLEXOARE A 0 A 1 A 2

Seminar 5 Analiza stabilității sistemelor liniare

Definiţia generală Cazul 1. Elipsa şi hiperbola Cercul Cazul 2. Parabola Reprezentari parametrice ale conicelor Tangente la conice

4. Măsurarea tensiunilor şi a curenţilor electrici. Voltmetre electronice analogice

SEMINAR 14. Funcţii de mai multe variabile (continuare) ( = 1 z(x,y) x = 0. x = f. x + f. y = f. = x. = 1 y. y = x ( y = = 0

Metode de interpolare bazate pe diferenţe divizate

Sisteme diferenţiale liniare de ordinul 1

Scoruri standard Curba normală (Gauss) M. Popa

Valori limită privind SO2, NOx şi emisiile de praf rezultate din operarea LPC în funcţie de diferite tipuri de combustibili

NOTIUNI DE BAZA IN STATISTICA

Seminariile Capitolul X. Integrale Curbilinii: Serii Laurent şi Teorema Reziduurilor

Laborator 11. Mulţimi Julia. Temă

COLEGIUL NATIONAL CONSTANTIN CARABELLA TARGOVISTE. CONCURSUL JUDETEAN DE MATEMATICA CEZAR IVANESCU Editia a VI-a 26 februarie 2005.

riptografie şi Securitate

5. FUNCŢII IMPLICITE. EXTREME CONDIŢIONATE.

Capitolul 4 PROPRIETĂŢI TOPOLOGICE ŞI DE NUMĂRARE ALE LUI R. 4.1 Proprietăţi topologice ale lui R Puncte de acumulare

Capitolul 4. Integrale improprii Integrale cu limite de integrare infinite

Curs 2 Şiruri de numere reale

Conice. Lect. dr. Constantin-Cosmin Todea. U.T. Cluj-Napoca

Recapitulare - Tipuri de date

5.5. REZOLVAREA CIRCUITELOR CU TRANZISTOARE BIPOLARE

Prelucrarea caracteristicilor calitative

Esalonul Redus pe Linii (ERL). Subspatii.

a. 11 % b. 12 % c. 13 % d. 14 %

EDITURA PARALELA 45 MATEMATICĂ DE EXCELENŢĂ. Clasa a X-a Ediţia a II-a, revizuită. pentru concursuri, olimpiade şi centre de excelenţă

Profesor Blaga Mirela-Gabriela DREAPTA

Lectia VI Structura de spatiu an E 3. Dreapta si planul ca subspatii ane

z a + c 0 + c 1 (z a)

Ecuaţia generală Probleme de tangenţă Sfera prin 4 puncte necoplanare. Elipsoidul Hiperboloizi Paraboloizi Conul Cilindrul. 1 Sfera.

9 Testarea ipotezelor statistice

Statistică descriptivă Distribuția normală Estimare. Călinici Tudor 2015

Asupra unei inegalităţi date la barajul OBMJ 2006

III. Reprezentarea informaţiei în sistemele de calcul

Foarte formal, destinatarul ocupă o funcţie care trebuie folosită în locul numelui


Problema a II - a (10 puncte) Diferite circuite electrice

Statisticǎ - curs 3. 1 Seria de distribuţie a statisticilor de eşantioane 2. 2 Teorema limitǎ centralǎ 5. 3 O aplicaţie a teoremei limitǎ centralǎ 7

Distribuţia multinomială Testul chi-pătrat. M. Popa

Criptosisteme cu cheie publică III

Spatii liniare. Exemple Subspaţiu liniar Acoperire (înfăşurătoare) liniară. Mulţime infinită liniar independentă

* K. toate K. circuitului. portile. Considerând această sumă pentru toate rezistoarele 2. = sl I K I K. toate rez. Pentru o bobină: U * toate I K K 1

Să se arate că n este număr par. Dan Nedeianu

RĂSPUNS Modulul de rezistenţă este o caracteristică geometrică a secţiunii transversale, scrisă faţă de una dintre axele de inerţie principale:,

TESTE STATISTICE PENTRU DATE ORDINALE. M. Popa

CONCURSUL DE MATEMATICĂ APLICATĂ ADOLF HAIMOVICI, 2017 ETAPA LOCALĂ, HUNEDOARA Clasa a IX-a profil științe ale naturii, tehnologic, servicii

POPULAŢIE NDIVID DATE ORDINALE EŞANTION DATE NOMINALE

Cursul 6. Tabele de incidenţă Sensibilitate, specificitate Riscul relativ Odds Ratio Testul CHI PĂTRAT

Câmp de probabilitate II

Distribuţia binomială Teste statistice neparametrice nominale. M. Popa

CIRCUITE INTEGRATE MONOLITICE DE MICROUNDE. MMIC Monolithic Microwave Integrated Circuit

Orice izometrie f : (X, d 1 ) (Y, d 2 ) este un homeomorfism. (Y = f(x)).

Masurarea variabilitatii Indicatorii variaţiei(împrăştierii) lectia 5 16 martie 2 011

Stabilizator cu diodă Zener

T R A I A N ( ) Trigonometrie. \ kπ; k. este periodică (perioada principală T * =π ), impară, nemărginită.

Componente şi Circuite Electronice Pasive. Laborator 3. Divizorul de tensiune. Divizorul de curent

2. Circuite logice 2.4. Decodoare. Multiplexoare. Copyright Paul GASNER

Coeficientul de corelaţie Pearson(r) M. Popa

Geometrie computationala 2. Preliminarii geometrice

2.1 Sfera. (EGS) ecuaţie care poartă denumirea de ecuaţia generală asferei. (EGS) reprezintă osferă cu centrul în punctul. 2 + p 2

Examen AG. Student:... Grupa:... ianuarie 2011

7 Distribuţia normală

BARAJ DE JUNIORI,,Euclid Cipru, 28 mai 2012 (barajul 3)

1. Distribuţiile teoretice 2. Intervalul de încredere pentru caracteristicile cantitative (medii) Histograma Nr. valori Nr. de clase de valori

TEMA 9: FUNCȚII DE MAI MULTE VARIABILE. Obiective:

Cursul Măsuri reale. D.Rusu, Teoria măsurii şi integrala Lebesgue 15

STATISTICĂ DESCRIPTIVĂ

a. 0,1; 0,1; 0,1; b. 1, ; 5, ; 8, ; c. 4,87; 6,15; 8,04; d. 7; 7; 7; e. 9,74; 12,30;1 6,08.

Aparate de măsurat. Măsurări electronice Rezumatul cursului 2. MEE - prof. dr. ing. Ioan D. Oltean 1

2. Sisteme de forţe concurente...1 Cuprins...1 Introducere Aspecte teoretice Aplicaţii rezolvate...3

Principiul incluziunii si excluziunii. Generarea şi ordonarea permutărilor. Principiul porumbeilor. Pri

Capitolul 2 - HIDROCARBURI 2.3.ALCHINE

Transcript:

INTRODUCERE ÎN STATISTICĂ 1

» Populaţie statistică» Eşantioanul, metode de eşantionare» Observații & Variabile» Tipuri de variabile» Relații dintre variabile Cuprins 2

» mulţime de elemente (obiecte sau subiecţi) care au anumite însuşiri (atribute sau caractere) comune, care formează obiectul unei analize statistice» numărul elementelor populaţiei se numeşte volumul sau talia populaţiei» Exemple: un grup de pacienţi o mulţime de obiecte un grup de fenomene sau evenimente 3

» Reprezentativ pentru populaţie: Talie Caracteristici» Calculul taliei eşantionului: Riscul de a respinge ipoteza nulă dacă ea e adevărată (alfa, α = 5% = 0,05) Puterea studiului (probabilitatea de a respinge ipoteza nulă când nu este adevărată) 4

» Acurateţe: valoarea reală + eroarea (cu cât volumul eşantionului e mai mare cu atât probabilitatea de eroare e mai mică)» Cost (cu cât volumul eşantionului e mai mare cu atât costul cercetări e mai mare)» Omogenitatea populaţiei (membrii populaţiei sunt similari în ceea ce priveşte caracteristica de studiat): cu cât variabilitatea în populaţie e mai mare cu atât volumul eşantionului trebuie să fie mai mare» Alţi factori care pot influenţa: (a) există variabile pe care nu le putem controla; (b) se doreşte împărţirea eşantionului în subgrupe; (c) se prevede un număr mare de pierduţi din vedere; (d) se doreşte o putere statistică înaltă. 5

Volumul/talia populaţiei Volumul/talia eşantionului (%) 0 100 100 101 1000 10 1001 5000 5 5001 10000 3 > 10000 1 6

» Eşantionare: Simplu randomizată Sistematică Stratificată Cluster 7

» Subiecţi extraşi la întâmplare din populaţia statistică» Fiecare subiect are aceiaşi şansă de a fi inclus în eşantion Tabele cu numere randomizate Folosirea funcţiilor Excel pentru generarea numerelor randomizate (RANDBETWEEN) 8

» Este selectat pentru a fi inclus în eşantion fiecare al k-lea element din structura de eşantionare» Numărul k se obţine împărţind talia populaţiei la talia dorită a eşantionului populaţie de 10000 eşantion de 1000: k = 10 Se selectează prin randomizare punctul de start (0-9)» Nu este indicat să fie folosită atunci când în structura de eşantionare ar putea apare o periodicitate 9

» Se împarte populaţia în mai multe subgrupe relevante numite straturi» Se constituie eşantionul prin extrageri aleatoare din straturi» Fiecare strat trebuie să fi reprezentat în eşantion în funcţie de importanţa sa în populaţie 10

» Procedeu în două etape se împarte populaţia în clusteri se selectează aleator o submulţime de clusteri se selectează prin metoda simplu randomizată un număr de itemi din fiecare cluster selectat anterior» În mod obişnuit alegerea clusterilor se bazează pe criterii geografice, iar acest procedeu este aplicat în special în studiile epidemiologice. 11

» Eșantionare randomizată generalizabilitate Populație Eșantion» Asignare randomizată cauzalitate Tratament Eșantion Control 12

variabila Valoarea mare indică estindere mai mare ID Gen (F/M) Fumat (Da/Nu) Greutat e (kg)... Domiciliu Stadiul patologiei maligne 001 F Da 56... Cluj 1 002 M Da 85... Cluj 0 003 M Da 120... Sălaj 4............... 199 M Nu 75... Maramureș 2 Observație / Caz 13

Cantitative» Cantitative (numerice): valori numerice care se pretează la adunare, scădere, medie, etc. Discrete: numărabile iau valori numere întregi nu pot lua valori negative Continue: măsurabile pot lua orice valoare» Calitative (categorice): iau un număr limitat de valori Calitative Ordinale: ordonarea are sens (starea la externare: vindecat, ameliorat, agravat, stationar, decedat) Nominale: ordonarea nu are sens. Categorie aparte: dicotomiale (2 valori: adevărat/fals sau pozitiv/negativ) 14

variabila Valoarea mare indică estindere mai mare ID Gen (F/M) Fumat (Da/Nu) Greutat e (kg)... Domiciliu Stadiul patologiei maligne 001 F Da 56... Cluj 1 002 M Da 85... Cluj 0 003 M Da 120... Sălaj 4............... 199 M Nu 75... Maramureș 2 Observație / Caz 15

» Materiale dentare: provizorii, definitive, speciale» Originea materialelor dentare: minerală, organică, mixtă» Proteză parțială superioară specii anaerobe izolate: S. Plurianimalium, Proteus mirabilis, Candida spp» Tip edentație: parțială / totală» Agenți de igienizare a mâinilor: AGENT BACT. GRAM + BACT. GRAM - MYCOBACT. FUNGI VIRUSURI VITEZA DEACŢIUNE Alcooli +++ +++ +++ +++ +++ Rapidă Compuşi de iod +++ +++ +++ ++ +++ Intermediară Iodofori +++ +++ + ++ ++ Intermediară Triclosan +++ ++ + _ +++ Intermediară +++ =acţiune excelentă; ++ = bună dar nu include întreg spectrul bacterian; + = satisfăcătoare ; - = fără acţiune sau acţiune insuficientă 16

» Constanta = un număr specific care rămâne acelaşi indiferent de condiţii Punctul de îngheţare al apei: în orice condiţii va fi 0ºC.» Variabila = o entitate care poate lua diferite valori Greutatea: dacă măsurăm greutatea fiecărui student din încăpere vom avea o serie de numere care vor varia de la un student la altul» Variabila = caracteristică care poate prezenta variaţie de la un element la altul al unei colectivităţi» Data = lucruri cunoscute, date, care stau la baza unui raţionament, a unei cercetări etc. Se mai numeşte şi UNITATE STATISTICĂ Valoarea pe care o ia variabila pentru un subiect dat 17

» Care este procentul de studenţi fumători în cadrul Facultăţii de Ştiinţe pentru Sănătate? Variabila: FUMATOR Data: răspunsul de tip DA/NU (sau numărul de ţigări) dat de fiecare student în parte» Studiile de cercetare şi analizele statistice: studiul variabilelor. 18

Scala de măsură Nominal Variabile clasificate în grupuri discrete pe baza unor caracteristici particulare Grupurile nu pot fi ordonate Interval Intervalul (sau distanţa) între două puncte pe scală are semnificaţie precisă Ordinal Clasificare ordonată după ranguri (de la mare la mic...) Nu se specifică care este distanţa dintre ranguri Raţie Diferă faţă de scala de tip interval doar prin existenţa punctului de zero cu semnificaţie 19

Scala de măsură: proprietăţi Nominal Identitatea (exprimă apartenenţa elementelor la o categorie) Presupune o clasificare a variabilei fără a indica o anumită ordine ori cantitate Pot fi notate cu cifre (0- feminin; 1-masculin) însă nu pot fi procesate în termeni de cantitate sau ordine. Ordinal» Elementele sunt clasate conform unei ordini, preferinţe» Entităţile pot fi comparate între ele în termeni de mai mult, mai puţin sau egal. 20

Scala de măsură: proprietăţi Interval Pentru variabile cantitative Identitate şi ordine Intervalul între numere are un sens (permite compararea diferenţele între numere). Punctul 0 (zero) este ales arbitrar. Ex: temperatura 0 nu e lipsa temperaturii, e doar punctul de îngheţ al apei. Raţie» Folosită pentru variabile cantitative» Are un 0 absolut care înseamnă lipsa caracteristicii sau proprietăţii respective» Ex:. De exemplu un venit de 0 lei înseamnă inexistenţa unui venit 21

Scala de măsură Nominal Culoarea părului; Educaţia; Starea civila (căsătorit, divorţat, văduv, necăsătorit)... Variabile dihotomiale: Gen Interval Temperatura (diferenţa dintre 50 ºC şi 60ºC este aceeaşi ca şi diferenţa dintre 100 ºC şi 110 ºC); Ordinal Locul ocupat de un concurenct la o competiţie (primul, al doilea,, ultimul). Raţie Bani (venit); Masa (greutate); Lungimea (cm); Volumul; Timpul de reacţie (sec)... 22

Variabile cantitative vs variabile atribut (calitative) Cantitative (măsurabile) Continue Exisă un număr infinit de valori posibile care se găsesc în intervalul a două valori observate Discrete Valori numere întregi Atribut (calitative) Nemăsurabile Pot lua un număr finit de valori Calculul mediei nu are sens Statistica descriptivă: frecvenţe absolute şi relative 23

Variabile cantitative vs variabile atribut (calitative) Cantitative (măsurabile) Mărimea este măsurabilă; Poate lua o infinitate de valori (cele continue) Calculul mediei are semnificaţie (continue) Calculul medianei are semnificaţie (discrete) Este necesară specificarea unităţii de măsură Acurateţea unei măsurători!!! 24

» Este posibilă transformarea scalelor de măsură tip interval şi raţie în scale de tip ordinal sau nominal dar întotdeauna se face cu pierdere de informaţie transformarea scalei asociată variabilei vârstă în scală ordinală clase de vârstă» Nu este posibilă transformarea scalei de tip nominal sau ordinal în scală de tip interval sau raţie chiar dacă atribuim valori diferitelor clase Sex: M = 1, F = 0 25

» Când două variabile au o legătură una cu cealaltă, ele se numesc variabile asociate sau dependente Asocierea poate să fie pozitivă sau negativă» Dacă două variabile nu sunt asociate ele se numesc independente. 26

» Care este tipul variabilei număr de bacterii identificate pe frotiu?» Care este tipul variabilei nivelul educațional (gimnazial, liceal, postliceal, studii de licență, studii de master, studii de doctorat, studii postdoctorale)? A. Numeric, continuu B. Numeric, discret C. Dicotomial D. Calitative, ordonat E. Calitativ, discret 27

» Observaţia de câteva secole... Persoanele care sunt sănătoase au păduchi Persoanele care sunt bolnave nu au păduchi Concluzia: Păduchii fac persoanele mai sănătoase!» Toţi care vor lua acest remediu se vor vindeca... cu excepţia celor care vor deceda. Deci este clar că acest remediu este bun şi dă greş numai pentru cazurile incurabile. Galen 28

» Descriptiv (statistica descriptivă): Modalităţi de sumarizare a caracteristicilor importante ale unui set de date medicale» Inferenţial (statistica inferenţială): Cum (şi când) generalizăm rezultatele obţinute pe un eşantion la populaţia generală 29

» Statistica descriptivă: descrierea unui fenomen de sănătate» Statistica inferenţială: explicarea fenomenului, compararea cu alte rezultate.» Nu ne putem baza întotdeauna pe intuiţie: Învaţă posibilele erori ale deciziei bazate pe intuiţie» Nu ne putem baza întotdeauna pe rezultatele şi rapoartele statistice Învaţă cum să evaluezi rezultatele şi rapoartele statistice rezultate din cercetarea medicală 30