ESTIMAREA PARAMETRILOR STATISTICI. Călinici Tudor

Σχετικά έγγραφα
Statistică descriptivă Distribuția normală Estimare. Călinici Tudor 2015

NOTIUNI DE BAZA IN STATISTICA

8 Intervale de încredere

Statisticǎ - curs 3. 1 Seria de distribuţie a statisticilor de eşantioane 2. 2 Teorema limitǎ centralǎ 5. 3 O aplicaţie a teoremei limitǎ centralǎ 7

Curs 10 Funcţii reale de mai multe variabile reale. Limite şi continuitate.

9 Testarea ipotezelor statistice

(a) se numeşte derivata parţială a funcţiei f în raport cu variabila x i în punctul a.

Scoruri standard Curba normală (Gauss) M. Popa

1. Distribuţiile teoretice 2. Intervalul de încredere pentru caracteristicile cantitative (medii) Histograma Nr. valori Nr. de clase de valori

Fig Impedanţa condensatoarelor electrolitice SMD cu Al cu electrolit semiuscat în funcţie de frecvenţă [36].

Planul determinat de normală şi un punct Ecuaţia generală Plane paralele Unghi diedru Planul determinat de 3 puncte necoliniare

DistributiiContinue de Probabilitate Distributia Normala

Curs 4 Serii de numere reale

Integrala nedefinită (primitive)

Sisteme diferenţiale liniare de ordinul 1

Statisticǎ - curs 4. 1 Generalitǎţi privind ipotezele statistice şi problema verificǎrii ipotezelor statistice 2

POPULAŢIE NDIVID DATE ORDINALE EŞANTION DATE NOMINALE

Analiza în curent continuu a schemelor electronice Eugenie Posdărăscu - DCE SEM 1 electronica.geniu.ro

III. Serii absolut convergente. Serii semiconvergente. ii) semiconvergentă dacă este convergentă iar seria modulelor divergentă.

Aplicaţii ale principiului I al termodinamicii la gazul ideal

Metode de interpolare bazate pe diferenţe divizate

INTRODUCERE ÎN STATISTICA MEDICALĂ

Erori si incertitudini de măsurare. Modele matematice Instrument: proiectare, fabricaţie, Interacţiune măsurand instrument:

7 Distribuţia normală

Elemente de bază în evaluarea incertitudinii de măsurare. Sonia Gaiţă Institutul Naţional de Metrologie Laboratorul Termometrie


prin egalizarea histogramei

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor X) functia f 1

Subiecte Clasa a VII-a

a. 11 % b. 12 % c. 13 % d. 14 %

SERII NUMERICE. Definiţia 3.1. Fie (a n ) n n0 (n 0 IN) un şir de numere reale şi (s n ) n n0

DISTANŢA DINTRE DOUĂ DREPTE NECOPLANARE

5.5. REZOLVAREA CIRCUITELOR CU TRANZISTOARE BIPOLARE

Metode iterative pentru probleme neliniare - contractii

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor

Curs 14 Funcţii implicite. Facultatea de Hidrotehnică Universitatea Tehnică "Gh. Asachi"

Statisticǎ - notiţe de curs

5 Statistica matematică

Aparate de măsurat. Măsurări electronice Rezumatul cursului 2. MEE - prof. dr. ing. Ioan D. Oltean 1

V.7. Condiţii necesare de optimalitate cazul funcţiilor diferenţiabile

MARCAREA REZISTOARELOR

5.4. MULTIPLEXOARE A 0 A 1 A 2

riptografie şi Securitate

5. FUNCŢII IMPLICITE. EXTREME CONDIŢIONATE.

Definiţia generală Cazul 1. Elipsa şi hiperbola Cercul Cazul 2. Parabola Reprezentari parametrice ale conicelor Tangente la conice

R R, f ( x) = x 7x+ 6. Determinați distanța dintre punctele de. B=, unde x și y sunt numere reale.

Variabile statistice. (clasificare, indicatori)

CONCURSUL DE MATEMATICĂ APLICATĂ ADOLF HAIMOVICI, 2016 ETAPA LOCALĂ, HUNEDOARA Clasa a IX-a profil științe ale naturii, tehnologic, servicii

a n (ζ z 0 ) n. n=1 se numeste partea principala iar seria a n (z z 0 ) n se numeste partea

Curs 1 Şiruri de numere reale

Curs 2 Şiruri de numere reale

Masurarea variabilitatii Indicatorii variaţiei(împrăştierii) lectia 5 16 martie 2 011

RĂSPUNS Modulul de rezistenţă este o caracteristică geometrică a secţiunii transversale, scrisă faţă de una dintre axele de inerţie principale:,

Seminariile Capitolul X. Integrale Curbilinii: Serii Laurent şi Teorema Reziduurilor

Prelucrarea caracteristicilor calitative

Modul de calcul al prețului polițelor RCA

3 Distribuţii discrete clasice

Componente şi Circuite Electronice Pasive. Laborator 3. Divizorul de tensiune. Divizorul de curent

CURS: METODE EXPERIMENTALE ÎN FCS

TESTAREA IPOTEZELOR STATISTICE

Capitolul 4 PROPRIETĂŢI TOPOLOGICE ŞI DE NUMĂRARE ALE LUI R. 4.1 Proprietăţi topologice ale lui R Puncte de acumulare

STATISTICĂ DESCRIPTIVĂ

2.1 Sfera. (EGS) ecuaţie care poartă denumirea de ecuaţia generală asferei. (EGS) reprezintă osferă cu centrul în punctul. 2 + p 2

Esalonul Redus pe Linii (ERL). Subspatii.

Câmp de probabilitate II

GEOMETRIE PLANĂ TEOREME IMPORTANTE ARII. bh lh 2. abc. abc. formula înălţimii

1. PROPRIETĂȚILE FLUIDELOR

1.7. AMPLIFICATOARE DE PUTERE ÎN CLASA A ŞI AB

Statistica descriptivă (continuare) Şef de Lucrări Dr. Mădălina Văleanu

Seminar 5 Analiza stabilității sistemelor liniare

Subiecte Clasa a VIII-a

T R A I A N ( ) Trigonometrie. \ kπ; k. este periodică (perioada principală T * =π ), impară, nemărginită.

Componente şi Circuite Electronice Pasive. Laborator 4. Măsurarea parametrilor mărimilor electrice

Profesor Blaga Mirela-Gabriela DREAPTA

TEMA 9: FUNCȚII DE MAI MULTE VARIABILE. Obiective:

Modelarea şi Simularea Sistemelor de Calcul Distribuţii ( lab. 4)

Măsurări în Electronică şi Telecomunicaţii 4. Măsurarea impedanţelor

Valori limită privind SO2, NOx şi emisiile de praf rezultate din operarea LPC în funcţie de diferite tipuri de combustibili

Functii Breviar teoretic 8 ianuarie ianuarie 2011

APLICAȚIILE MEDICALE ALE CALCULULUI PROBABILITĂŢILOR. Călinici Tudor 2016


Distribuţia binomială Teste statistice neparametrice nominale. M. Popa

Statisticǎ - curs 2. 1 Parametrii şi statistici ai tendinţei centrale 2. 2 Parametrii şi statistici ai dispersiei 5

Criptosisteme cu cheie publică III

Mihai Orzan joi, 19:30, sala 1406

Examen AG. Student:... Grupa:... ianuarie 2011

ANALIZA DATELOR EXPERIMENTALE

Indicatori sintetici ai distribuțiilor statistice

LUCRAREA DE LABORATOR Nr. 9 DETERMINAREA EXPERIMENTALÃ A DISTIBUŢIEI DIMENSIUNILOR EFECTIVE ÎN INTERIORUL CÂMPULUI DE ÎMPRÃŞTIERE

Asupra unei inegalităţi date la barajul OBMJ 2006

ECO-STATISTICA-NOTITZZE DE LABORATOR

PROIECT ECONOMETRIE. Profesori coordinatori: Liviu-Stelian Begu și Smaranda Cimpoeru

Zgomotul se poate suprapune informaţiei utile în două moduri: g(x, y) = f(x, y) n(x, y) (6.2)

Laborator 11. Mulţimi Julia. Temă

Problema a II - a (10 puncte) Diferite circuite electrice

Εμπορική αλληλογραφία Ηλεκτρονική Αλληλογραφία

Recapitulare - Tipuri de date

Conice. Lect. dr. Constantin-Cosmin Todea. U.T. Cluj-Napoca

z a + c 0 + c 1 (z a)

Terminologia de procesării digitale a semnalelor

Transcript:

ESTIMAREA PARAMETRILOR STATISTICI Călinici Tudor 1

Obiective educaţionale Înţelegerea procesului de estimare Însuşirea limbajului specific pentru inferenţa statistică Enumerarea estimatorilor fără bias Determinarea intervalului de încredere de o precizie dată Calculul taliei unui eşantion reprezentativ în diferite condiţii 2

Probabilităţi = şansa ca un eveniment să aibă loc considerând toate rezultatele posibile Valoarea predictivă a probabilităţii: Reflectă ce ar trebui să se întâmple şi nu ce o să se întâmple efectiv Pentru un pacient supus unei operaţii cu o rată de succes de 75% rezultatul nu poate fi 75% succes Probabilitatea poate fi privită ca o măsură a capacităţii eşantionului analizat de a estima caracteristica unei populaţii 3

Exemplu: distribuţia greutăţii Media = 69, s = 3 68,26% = 66-72 p=0,68 Mai mare de 78 P=0,0013 4

Principii generale În studiul într-o populaţie P a parametrilor a unei caracteristici oarecare (cantitative sau calitative) adesea este necesar să se urmeze procedeul: 1. Se extrage un eşantion reprezentativ al acestei populaţii. 2. Prin mijloacele statisticii descriptive se descrie distribuţia caracteristicii pe eşantionul extras la etapa 1, fiindcă talia acestuia permite o investigare exhaustivă a sa. Astfel se poate determina frecvenţa observată, dacă este vorba de o caracteristică calitativă, sau se calculează media şi variaţia, în cazul unei caracteristici cantitative. 3. Prin mijloacele statisticii inferenţiale sau inductive se extind la întreaga populaţie rezultatele observate pe eşantion. Adica, pornind de la parametrii observaţi (frecvenţa, media, variaţia, etc) pe eşantion se încearcă să se estimeze parametrii teoretici ai întregii populaţii. 5

Principii generale Eşantionare Calculul caracteristicii Inferenţă 6

Principii generale Cazul unei variabile X calitative Frecvenţa teoretică p a variabilei X în populaţia P este necunoscută. Din populaţia P se extrage la întâmplare eşantionul E reprezentativ. In eşantionul E pentru variabila X se observă o frecvenţă f. Se încearcă să se estimeze valoarea necunoscută a lui p cu ajutorul lui f observat. 7

8

Principii generale Cazul unei variabile X cantitative Media teoretică a variabilei X ca şi variaţia sa teoretică 2 în populaţia P sunt necunoscute. Din populaţia P se extrage la întâmplare eşantionul E reprezentativ. In eşantionul E pentru variabila X se observă o medie m şi o variaţie s 2. Se încearcă să se estimeze valorile necunoscute ale lui şi 2 cu ajutorul lui m şi s 2 observate. 9

10

Principii generale Eşantionare Variabile calitative FRECVENŢA Calculul caracteristicii Variabile cantitative MEDIA MEDIANA MODULUL Inferenţă 11

Definiţia unui estimator Estimatorul unui parametru este o funcţie depinzând de observaţiile efectuate pe un eşantion extras la întâmplare care furnizează o valoare aleatoare numită estimarea punctuală a parametrului. Exemplu: Dacă eşantionul E are valorile x 1,...,x n pentru caracteristica studiată, estimatorul mediei aritmetice a unei populaţii P este m = (x 1 +x 2 +...+x n )/n 12

Principii generale Eşantionare Variabile calitative FRECVENŢA Calculul caracteristicii Variabile cantitative ESTIMATOR MEDIA MEDIANA MODULUL Inferenţă 13

ESTIMAREA PUNCTUALĂ Calităţile unui estimator: corectitudinea estimării obţinute, precizia acesteia. 14

Estimator fără bias Fie T estimarea punctuală a unui parametru teoretic al unei populaţii. T este o variabila aleatoare, valorile fiind tributare eşantionului pe baza căruia se calculează. Estimatorul T se spune că este fără bias dacă speranţa matematică a lui T este egală cu valoarea adevărată (teoretică) a parametrului estimat adică M(T) =. Se spune în acest caz că estimarea dată de T este corectă. 15

ESTIMAREA PUNCTUALĂ Proprietăţi ale estimatorilor medie si frecventa: P1. Speranţa matematică a mediilor observate, m, pe eşantioane extrase aleator este egală cu media teoretică a populaţiei din care sau extras eşantioanele, medie considerată pentru valorile unei variabile cantitative luată în studiu: M(m) =. P2. Speranţa matematică a frecvenţelor observate, f, pe eşantioane extrase aleator este egală cu frecvenţa teoretică p a populaţiei din care sau extras eşantioanele, frecvenţă considerată pentru valorile unei variabile calitative luată în studiu: M(f) = p. Din P1 şi P2 rezultă că m şi f sunt estimatori fără bias şi că 16 estimările realizate cu ajutorul lor sunt corecte.

ESTIMAREA PUNCTUALĂ P3. Speranţa matematică a variaţiilor descriptive observate s 2 pe eşantioane de talie n, extrase aleator este diferită de variaţia teoretică 2 a populaţiei din care sau extras eşantioanele, variaţie considerată pentru valorile unei variabile cantitative luată în studiu: M( s 2 ) n 1 2 n P4. Variaţia punctuală de eşantionare este un estimator fără bias pentru 2 : S 2 n n 1 s 2 17

18

Concluzie Media, frecvenţa şi variaţia de eşantionare observate pe eşantioane corect extrase (reprezentative) dintr-o populaţie P sunt estimatori fără bias ale mediei, frecvenţei şi respectiv variaţiei teoretice ale populaţiei P 19

ESTIMAREA CU INTERVALE DE INCREDERE Un estimator că este cu atât mai eficace cu cât variaţia sa este mai mică, sau precizia sa depinde de mărimea variaţiei sale. Estimarea punctuală a unui parametru teoretic furnizează o valoare pentru parametrul teoretic estimat. Valoarea sa este tributară fluctuaţiilor de eşantionare şi poate fi la o mare distanţă de valoarea reală a parametrului estimat. Este recomandabil să se estimeze un parametru teoretic nu printr-o singură valoare ci printr-un interval, numit interval de încredere, în care să se poată afirma că parametrul estimat se găseşte cu o 20 probabilitate ridicată.

ESTIMAREA CU AJUTORUL INTERVALULUI DE INCREDERE Intervalul de încredere este un interval mărginit de valori (limitele poartă numele de limite de încredere) care include media caracteristicii studiate. Cu cât intervalul este mai larg cu atât suntem mai siguri că media caracteristicii studiate se va regăsi în acel interval. Mărimea încrederii, confidenţa, este dată de probabilitatea ca valoarea (valorile) studiate să se găsească în acel interval. 21

ESTIMAREA UNEI MEDII Fie P o populaţie în care variabila X are o media teoretică necunoscută. Din populaţia P se extrage la întâmplare eşantionul E reprezentativ. In eşantionul E pentru variabila X se observă o medie m şi se calculează o variaţie punctuală estimată Se încearcă să se determine pentru valoarea necunoscută a mediei teoretice un interval de încredere cu pragul, (cu ajutorul lui m şi S 2 observate), adică să se determine un interval [a,b] în care probabilitatea ca media teoretică să se afle este 1-: Pr(a b) = 1 -. n ( xi m) 2 n S s2 i1 n1 n1 2 22

ESTIMAREA UNEI MEDII: EŞANTIOANE MARI N>=30 Intervalul de încredere pentru media cu pragul de semnificaţie este m Z, m Z n n Atunci când nu se cunoaşte, ea poate fi estimata corect prin s şi în acest caz intervalul de încredere cu pragul de semnificaţie pentru media este s, s m Z m Z n1 n1 25

ESTIMAREA UNEI MEDII: EŞANTIOANE MARI Cel mai frecvent se utilizează un prag de semnificaţie = 0.05. Atunci Z=1.96 şi deci intervalul de încredere cel mai utilizat în cazul eşantioanelor mari este m 1,96 s, m 1,96 s n1 n1 26

Întrebare Într-un eşantion de 101 de nou născuţi, cunoaştem media greutăţii la naştere: 3400g şi abaterea standard: 142 Se ştie din literatură faptul că greutatea medie la naştere la nou născuţi este de 3300g. Este eşantionul din acest exemplu caracteristic pentru o populaţia la care se face referirea din literatură? 3400 +/-1,96*142/10= 3400+/-27.83 27

Eroarea de eşantionare a mediei Sx= diferenţa dintre media valorilor eşantionului şi media caracteristici populaţiei din care a fost extras eşantionul Creşterea erorii de eşantionare => Scăderea acurateţii mediei eşantionului de a estima caracteristica unei populaţii Scăderea erorii de eşantionare => Creşterea acurateţii mediei eşantionului de a estima caracteristica unei populaţii 28

Intervale de încredere cu eşantioane mici n<30 Cu cât eşantioanele sunt mai mici cu atât distribuţia de eşantionare este mai dispersată faţă de distribuţia normală Se foloseşte o altă distribuţie: distribuţia t sau Student Diferenţa majoră dintre distribuţia t şi cea normală constă în faptul că prima îşi schimbă forma odată cu schimbarea dimensiunii eşantionului 30

df Grade de libertate Direcţiile disponibile pentru mişcare într-un spaţiu dat Numărul de componente care pot varia într-un set de date n-1 s, s m t m t n1 n1 31

Calculul intervalului de încredere s, s m t m t n1 n1 n=6 df = 5 II95% t= ±2,571 n=10 df = 9 II95% t= ±2,262 n=30 II95% t= ±2,042 Creşterea lui n determină ca valoarea lui t să se apropie de 1,96 curba tinde spre distribuţia normală 32

ESTIMAREA UNEI FRECVENTE Esantioane mari np, nq>=10 f(1-f) f Z, f Z n f(1-f) n f este frecventa observata 33

Talia eşantionului reprezentativ Prevalenţa maladiei în populaţie este cunoscută f (exprimată în procente) Se stabileşte marja de eroare k în procente Se stabileşte riscul asumat Talia esantionului este N = z α 2 f (1 f) k 2 34

Exemplu Se cunoaşte din literatură faptul că o maladie are în populaţie o prevalenţă de 25% Să se calculeze talia unui eşantion reprezentativ legat de respectiva maladie, cu o marjă de eroare de 3%, asumându-se un risc de 5% N = 1,962 0,25 0,75 0,03 2 800 35

Talia eşantionului reprezentativ Se doreşte evaluarea unei variabile cantitative, cu o anumită precizie E cu asumarea unui risc 1-α. Se cunoaşte din studii anterioare varianţa respectivului parametru ca având valoarea σ. Talia eşantionului reprezentativ va fi N = Z α σ E 2 36

Exemplu Se doreşte estimarea timpului mediu de consultaţie pentru medicii de familie. Ştiindu-se din studii anterioare că durata unei consultaţii poate varia cu aproximativ 5 minute de la caz la caz şi că studiul doreşte estimarea cu precizia de 1 minut, asumându-şi un risc de 5% de eroare, să se calculeze talia eşantionului necesar în acest caz N = 1,96 5 1 2 96 37

SAU http://www.gpower.hhu.de/en.html 38

Vă mulţumesc pentru atenţie 39