1. Distribuţiile teoretice 2. Intervalul de încredere pentru caracteristicile cantitative (medii) Histograma Nr. valori Nr. de clase de valori

Σχετικά έγγραφα
Curs 10 Funcţii reale de mai multe variabile reale. Limite şi continuitate.

8 Intervale de încredere

III. Serii absolut convergente. Serii semiconvergente. ii) semiconvergentă dacă este convergentă iar seria modulelor divergentă.

NOTIUNI DE BAZA IN STATISTICA

Curs 4 Serii de numere reale

(a) se numeşte derivata parţială a funcţiei f în raport cu variabila x i în punctul a.

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor X) functia f 1

Statisticǎ - curs 3. 1 Seria de distribuţie a statisticilor de eşantioane 2. 2 Teorema limitǎ centralǎ 5. 3 O aplicaţie a teoremei limitǎ centralǎ 7

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor

Integrala nedefinită (primitive)

a n (ζ z 0 ) n. n=1 se numeste partea principala iar seria a n (z z 0 ) n se numeste partea

Scoruri standard Curba normală (Gauss) M. Popa

5.5. REZOLVAREA CIRCUITELOR CU TRANZISTOARE BIPOLARE

ESTIMAREA PARAMETRILOR STATISTICI. Călinici Tudor

Subiecte Clasa a VII-a

9 Testarea ipotezelor statistice

Metode iterative pentru probleme neliniare - contractii

V.7. Condiţii necesare de optimalitate cazul funcţiilor diferenţiabile

Subiecte Clasa a VIII-a

Curs 14 Funcţii implicite. Facultatea de Hidrotehnică Universitatea Tehnică "Gh. Asachi"

5. FUNCŢII IMPLICITE. EXTREME CONDIŢIONATE.

Analiza în curent continuu a schemelor electronice Eugenie Posdărăscu - DCE SEM 1 electronica.geniu.ro

DistributiiContinue de Probabilitate Distributia Normala

RĂSPUNS Modulul de rezistenţă este o caracteristică geometrică a secţiunii transversale, scrisă faţă de una dintre axele de inerţie principale:,

DISTANŢA DINTRE DOUĂ DREPTE NECOPLANARE

Metode de interpolare bazate pe diferenţe divizate

Curs 1 Şiruri de numere reale

Planul determinat de normală şi un punct Ecuaţia generală Plane paralele Unghi diedru Planul determinat de 3 puncte necoliniare

MARCAREA REZISTOARELOR

SERII NUMERICE. Definiţia 3.1. Fie (a n ) n n0 (n 0 IN) un şir de numere reale şi (s n ) n n0

POPULAŢIE NDIVID DATE ORDINALE EŞANTION DATE NOMINALE

7 Distribuţia normală

Sisteme diferenţiale liniare de ordinul 1

Aplicaţii ale principiului I al termodinamicii la gazul ideal

V O. = v I v stabilizator

Masurarea variabilitatii Indicatorii variaţiei(împrăştierii) lectia 5 16 martie 2 011

Fig Impedanţa condensatoarelor electrolitice SMD cu Al cu electrolit semiuscat în funcţie de frecvenţă [36].

SEMINAR 14. Funcţii de mai multe variabile (continuare) ( = 1 z(x,y) x = 0. x = f. x + f. y = f. = x. = 1 y. y = x ( y = = 0

Aparate de măsurat. Măsurări electronice Rezumatul cursului 2. MEE - prof. dr. ing. Ioan D. Oltean 1

5.4. MULTIPLEXOARE A 0 A 1 A 2

4. Măsurarea tensiunilor şi a curenţilor electrici. Voltmetre electronice analogice

1.7. AMPLIFICATOARE DE PUTERE ÎN CLASA A ŞI AB

Conice. Lect. dr. Constantin-Cosmin Todea. U.T. Cluj-Napoca

Laborator biofizică. Noţiuni introductive

5 Statistica matematică


R R, f ( x) = x 7x+ 6. Determinați distanța dintre punctele de. B=, unde x și y sunt numere reale.

Componente şi Circuite Electronice Pasive. Laborator 3. Divizorul de tensiune. Divizorul de curent

Problema a II - a (10 puncte) Diferite circuite electrice

Stabilizator cu diodă Zener

Erori si incertitudini de măsurare. Modele matematice Instrument: proiectare, fabricaţie, Interacţiune măsurand instrument:

Seminariile Capitolul X. Integrale Curbilinii: Serii Laurent şi Teorema Reziduurilor

Definiţia generală Cazul 1. Elipsa şi hiperbola Cercul Cazul 2. Parabola Reprezentari parametrice ale conicelor Tangente la conice

Recapitulare - Tipuri de date

STATISTICĂ DESCRIPTIVĂ

Curs 2 Şiruri de numere reale

Seminar 5 Analiza stabilității sistemelor liniare

prin egalizarea histogramei

Elemente de bază în evaluarea incertitudinii de măsurare. Sonia Gaiţă Institutul Naţional de Metrologie Laboratorul Termometrie

CURS: METODE EXPERIMENTALE ÎN FCS

LUCRAREA DE LABORATOR Nr. 9 DETERMINAREA EXPERIMENTALÃ A DISTIBUŢIEI DIMENSIUNILOR EFECTIVE ÎN INTERIORUL CÂMPULUI DE ÎMPRÃŞTIERE

2.1 Sfera. (EGS) ecuaţie care poartă denumirea de ecuaţia generală asferei. (EGS) reprezintă osferă cu centrul în punctul. 2 + p 2

Capitolul 4 PROPRIETĂŢI TOPOLOGICE ŞI DE NUMĂRARE ALE LUI R. 4.1 Proprietăţi topologice ale lui R Puncte de acumulare

Statistică descriptivă Distribuția normală Estimare. Călinici Tudor 2015

Indicatori sintetici ai distribuțiilor statistice

CONCURSUL DE MATEMATICĂ APLICATĂ ADOLF HAIMOVICI, 2017 ETAPA LOCALĂ, HUNEDOARA Clasa a IX-a profil științe ale naturii, tehnologic, servicii

Esalonul Redus pe Linii (ERL). Subspatii.

CURSUL AL IV-LEA. Tabelul 1 Greutatea corporală a 1014 pacienţi cu diferite afecţiuni, pe clase din 5kg în 5kg

EDITURA PARALELA 45 MATEMATICĂ DE EXCELENŢĂ. Clasa a X-a Ediţia a II-a, revizuită. pentru concursuri, olimpiade şi centre de excelenţă

z a + c 0 + c 1 (z a)

CONCURSUL DE MATEMATICĂ APLICATĂ ADOLF HAIMOVICI, 2016 ETAPA LOCALĂ, HUNEDOARA Clasa a IX-a profil științe ale naturii, tehnologic, servicii

COLEGIUL NATIONAL CONSTANTIN CARABELLA TARGOVISTE. CONCURSUL JUDETEAN DE MATEMATICA CEZAR IVANESCU Editia a VI-a 26 februarie 2005.

3. I. Mihoc, C. Fătu, Calculul probabilităţilor şi statistică matematică, Transilvania Press, Cluj-Napoca, 2003

Modelarea şi Simularea Sistemelor de Calcul Distribuţii ( lab. 4)

Laborator 11. Mulţimi Julia. Temă


riptografie şi Securitate

TEMA 9: FUNCȚII DE MAI MULTE VARIABILE. Obiective:

Variabile statistice. (clasificare, indicatori)

1. PROPRIETĂȚILE FLUIDELOR

Criptosisteme cu cheie publică III

L.2. Verificarea metrologică a aparatelor de măsurare analogice

Cursul 6. Tabele de incidenţă Sensibilitate, specificitate Riscul relativ Odds Ratio Testul CHI PĂTRAT

Asupra unei inegalităţi date la barajul OBMJ 2006

Al cincilea baraj de selecţie pentru OBMJ Bucureşti, 28 mai 2015

Valori limită privind SO2, NOx şi emisiile de praf rezultate din operarea LPC în funcţie de diferite tipuri de combustibili

Statisticǎ - curs 2. 1 Parametrii şi statistici ai tendinţei centrale 2. 2 Parametrii şi statistici ai dispersiei 5

a. 11 % b. 12 % c. 13 % d. 14 %

Capitolul 4. Integrale improprii Integrale cu limite de integrare infinite

Capitolul 2 - HIDROCARBURI 2.3.ALCHINE

a. Caracteristicile mecanice a motorului de c.c. cu excitaţie independentă (sau derivaţie)

STUDIUL DISTRIBUŢIEI STATISTICE POISSON

Prelucrarea caracteristicilor calitative

6 n=1. cos 2n. 6 n=1. n=1. este CONV (fiind seria armonică pentru α = 6 > 1), rezultă

Mihai Orzan joi, 19:30, sala 1406

Capitolul 14. Asamblari prin pene

SEMINARUL 3. Cap. II Serii de numere reale. asociat seriei. (3n 5)(3n 2) + 1. (3n 2)(3n+1) (3n 2) (3n + 1) = a

Εμπορική αλληλογραφία Ηλεκτρονική Αλληλογραφία

Laborator 6. Integrarea ecuaţiilor diferenţiale

Componente şi Circuite Electronice Pasive. Laborator 4. Măsurarea parametrilor mărimilor electrice

Transcript:

1. Distribuţiile teoretice (diagramă de distribuţie, distribuţia normală sau gaussiană) 2. Intervalul de încredere pentru caracteristicile cantitative (medii) 1. Distribuţia constituie ansamblul tuturor valorilor posibile şi respectiv, al probabilităţilor acestora de apariţie pentru o anumită variabilă/caracteristică dintr-un eşantion sau populaţie (5). Distribuţia poate fi reprezentată sub formă de tabel de distribuţie şi de grafic/ diagramă de distribuţie sau histogramă (6,7). Histograma este o diagramă de distribuţie. Cel mai des, coloanele sunt figurate vertical, cu baza pe abscisă, iar frecvenţa fiecărei categorii de valori este precizată pe ordonată (12,13). Când dorim să întocmim un grafic de distribuţie pentru un număr mare de valori (de exemplu, greutăţile a 150 de copii în vârstă de 6 7 ani la începutul anului şcolar) şi unele valori se repetă, este necesară o grupare a acestora în intervale de clasă. Seria simplă şi ordonată a datelor va fi transformată într-o serie grupată aşa cum reiese din exemplul următor (11). Să presupunem că avem valorile tensiunii arteriale sistolice (TAS) din 208 fişe medicale ale băieţilor de clasa a XII-a dintr-un liceu. Aceşti subiecţi au în comun variabilele vârstă şi sex. Dacă dorim să evaluăm situaţia TAS pe baza unei reprezentări grafice, trebuie să luăm în considerare fiecare din cele 208 valori. Etapele parcurse sunt următoarele (14,15): 1. Se determină rangul (amplitudinea) datelor; în cazul de faţă 140-91 = 49. 2. În funcţie de numărul total de valori/ subiecţi se stabileşte şi numărul de clase de valori sau intervale de clasă. Se poate utiliza următorul tabel drept ghid. Nr. valori Nr. de clase de valori <50 5-7 50-100 6-10 100-250 7-12 >250 10-20 În cazul nostru avem 208 subiecţi şi alegem 10 intervale de clasă. 3. Se determină intervalul constant al clasei împărţind amplitudinea la numărul de clase şi se rotunjeşte corespunzător (49/10 5). 4. Se stabilesc clasele de valori (91-95, 96-100, 101-105,. 136-140 mmhg). Niciodată nu vom alege intervale de genul 90-95, 95-100, 100-105, etc., deoarece acestea pot cuprinde valori care se încadrează în două intervale. 5. Se alcătuieşte un tabel cu frecvenţele de apariţie ale subiecţilor ce aparţin fiecărui interval de clasă. În acest moment seria simplă de date a devenit o serie grupată. 6. Se construieşte graficul, unde lăţimea coloanei reprezintă intervalul de clasă, iar înălţimea este dată de frecvenţa de apariţie (fig. 1). Distribuţiile teoretice reprezintă modele de distribuţie statistică şi exprimă posibilitatea teoretică de evoluţie a fenomenelor studiate. Distribuţiile teoretice sunt descrise cu ajutorul unor formule matematice cunoscute sub numele de legile distribuţiei. Principalele tipuri de distribuţie sunt: 1. Distribuţia normală sau gaussiană; 2. Distribuţia normală standard sau distribuţia z; 3. Distribuţia binomială;

4. Distribuţia Poisson. Distribuţia normală Dispersia de la medie se poate reprezenta sugestiv prin curba ideală de variaţie, corespunzând unei distribuţii simetrice şi continue (curba normală a lui Laplace Gauss). O astfel de repartiţie normală, ideală, cunoscută şi ca cea de a doua lege a lui Laplace, se întâlneşte rar, în special în biometrie şi în domeniul erorilor întâmplătoare, de aceea se mai numeşte şi legea erorilor. Această repartiţie ocupă un loc deosebit printre distribuţiile teoretice, fiind adeseori luată drept reper pentru comparaţia cu alte distribuţii. Repartiţia normală constituie, de altfel, o lege limită către care tind unele distribuţii (binomială, Poisson) în anumite condiţii tipice. Distribuţia normală este reprezentată de o familie de curbe definite prin doi parametri: media aritmetică şi deviaţia standard a seriei de valori. Curbele au întotdeauna formă de clopot simetric, iar gradul de alungire sau de aplatizare al clopotului depinde de valoarea deviaţiei standard a eşantionului (fig. 3.1). Faptul că o curbă are formă de clopot, nu înseamnă că reprezintă o distribuţie normală, deoarece şi alte distribuţii pot avea forme similare. 1. M=1, σ=2; 2. M=4, σ=1; 3. M=6, σ=0,5 Fig. 3.1 Curbe normale cu diferite grade de alungire şi aplatizare Curba ideală de variaţie este simetrică faţă de ordonata maximă, notată cu M, corespunzând mediei aritmetice (fig. 3.2).

M-3σ M-2σ M-σ M M+σ M+2σ M+3σ Fig. 3.2 Curba normală Laplace Gauss Prin calcul s-a stabilit că, în cazul curbei ideale sau normale de variaţie, în partea ariei totale cuprinse între medie, adică ordonata maximă şi ordonata a cărei abcisă este egală cu σ sunt cuprinse 68,26 % din totalul valorilor unei serii de variaţie. Între medie şi 2σ sunt cuprinse 95,45 % din totalul valorilor seriei, iar între medie şi 3σ se găsesc 99,73 % din valorile serie statistice. În calculele obişnuite, nu este nevoie de o exactitate mai mare în măsurarea abaterii decât de 3σ, căreia îi corespunde, într-o repartiţie normală, aproape totalitatea cazurilor, cu excepţia a 0,27 % dintre acestea, ceea ce este neglijabil. Chiar dacă am calcula abaterea de la medie cu 4σ, nu am obţine o exactitate cu mult mai mare: 4σ = 99,9936 %, iar 5σ = 99,99994 %. În cercetările experimentale, care necesită o exactitate ridicată, se calculează deviaţia dublă sau triplă. În cercetările clinice este suficientă calcularea deviaţiei duble, care cuprinde, cum s-a arătat, 95,45 % din totalul valorilor seriei statistice. Deviaţia standard caracterizează cel mai corect gradul de dispersie faţă de media aritmetică, deoarece ţine seama de toate observaţiile repartiţiei de frecvenţe şi, totodată, este afectată mult mai puţin de fluctuaţiile de selecţie, comparativ cu celelalte măsurători ale gradului de dispersie. Un aspect practic ce trebuie luat în considerare este faptul că, atunci când populaţia din care a fost extras eşantionul are o distribuţie aproximativ normală (gaussiană), atunci deviaţia standard oferă o interpretare utilă a datelor din punctul de vedere al probabilităţilor. Este de remarcat faptul că, într-o populaţie cu o distribuţie normală, media, mediana şi modulul sunt egale. Totodată, distribuţia normală constituie punctul de pornire pentru o serie de teste analitice, cum ar fi testul χ 2. Numeroase caracteristici biologice prezintă o distribuţie normală, astfel încât pot fi utilizate ca exemple: înălţimea persoanelor adulte, tensiunea arterială într-o populaţie sănătoasă, erorile aleatoare survenite în urma măsurătorilor de laborator, parametrii biochimici.

Verificarea normalităţii unei distribuţii MEDIA, MEDIANA, MODUL au valori apropiate Rangul (amplitudinea) = x max. - x min. 6 DS. O posibilitate de transformare a unei distribuţii negaussiene într-una gaussiană este mărirea efectivului studiat. 2. Intervalul de încredere INTERVALUL DE ÎNCREDERE = este intervalul în care pornind de la frecvenţa (media) pe un eşantion, putem estima că se găseşte cu un grad ridicat de probabilitate, frecvenţa adevărată (media adevărată), adică cea a colectivităţii generale, de unde a fost extras acel eşantion. Intervalul de încredere pentru caracteristicile cantitative IC = x t în care x = media eşantionului =ES eroarea standard câte determinări trebuie să facem pentru a afla o medie reală (pentru caracteristicile cantitative) şi o frecvenţă reală (pentru caracteristicile calitative)? pentru medii (40 de cazuri): de exemplu să presupunem că am luat în studiu x, caracteristica cantitativă, greutatea exprimată în grame pentru un număr de nou născuţi vii. Atunci când generalizez datele prin calcularea intervalului de încredere niciodată cele două limite, inferioară şi superioară a intervalului nu vor varia, atât de mult, încât să am un nou născut de 1 gr. de exemplu, iar altul de 3000 gr. De aceea este suficient să luăm în studiu mai puţine unităţi statistice (40 cazuri). 1. Este doar estimat cu o probabilitate mare (estimează x pentru toată colectivitatea, în funcţie de caracteristica studiată). IC 2. IC stabileşte limitele fenomenului studiat (cantitativ x (media) 3. IC = este intervalul în care se găseşte media sau frecvenţa adevărată pentru întreg fenomenul (pentru întreaga colectivitate). ex.: talia la naştere (media) este de 52 cm la băieţi; oricât de puţine cazuri am cerceta, nu găsim cazuri extreme (un copil de 1 cm sau un copil cu 52 cm); obţinem un rezultat mai apropiat de realitate; Intervalul de încredere este numai estimat cu o anumită probabilitate deci nu precizat cu certitudine. IC = x ± t µ în care x = media eşantionului =ES eroarea standard Exemplu: n = 9 x = 62,6 kg µ = 2,0 kg prag de semnificaţie = 0,05 /sau 5%...precizie 95% prag de semnificaţie = 0,01 /sau 1%... precizie 99% prag de semnificaţie = 0,001/sau 0,1%... precizie 99,9%.

GL (grade de libertate) = n 1 IC pentru p (prag de semnificaţie) = 0,05 GL = n 1 GL = 9 1 = 8 t = 2,31 IC = 62,6 ± 2,31 x 2,0 IC = 62,6 ± 4,6 IC = 58,0 67,2 kg Deci, măsurând un eşantion de 9 persoane, putem afirma că media adevărată, deci media tuturor tinerilor recruţi în ceea ce priveşte greutatea corporală, se găseşte undeva între 58,0 şi 67,2 kg şi aceasta nu cu certitudine ci cu o probabilitate de 95%. Intervalul este foarte mare, deci informaţia privind media adevărată este destul de vagă, mai ales din cauza numărului mic de observaţii (n = 9). IC pentru p = 0,01 P = 99 % GL = 8 t = 3,36 IC = 62,6 ± 3,36 x 2,0 IC = 62,6 ± 6,7 IC = 55,9 69,3 kg Deci, cu o probabilitate mai mare (P = 99 %), se poate afirma că media adevărată se găseşte între 55,9 şi 69,3 kg (în acest interval).