3.6. Formule de calcul pentru medie şi dispersie



Σχετικά έγγραφα
Metode iterative pentru probleme neliniare - contractii

Curs 10 Funcţii reale de mai multe variabile reale. Limite şi continuitate.

Metode de interpolare bazate pe diferenţe divizate

5. FUNCŢII IMPLICITE. EXTREME CONDIŢIONATE.

MARCAREA REZISTOARELOR

V.7. Condiţii necesare de optimalitate cazul funcţiilor diferenţiabile

Analiza în curent continuu a schemelor electronice Eugenie Posdărăscu - DCE SEM 1 electronica.geniu.ro

Curs 4 Serii de numere reale

DISTANŢA DINTRE DOUĂ DREPTE NECOPLANARE

Subiecte Clasa a VIII-a

3.5. Indicatori de împrăştiere

(a) se numeşte derivata parţială a funcţiei f în raport cu variabila x i în punctul a.

Curs 1 Şiruri de numere reale

SERII NUMERICE. Definiţia 3.1. Fie (a n ) n n0 (n 0 IN) un şir de numere reale şi (s n ) n n0

III. Serii absolut convergente. Serii semiconvergente. ii) semiconvergentă dacă este convergentă iar seria modulelor divergentă.

a n (ζ z 0 ) n. n=1 se numeste partea principala iar seria a n (z z 0 ) n se numeste partea

Subiecte Clasa a VII-a

Seminariile Capitolul X. Integrale Curbilinii: Serii Laurent şi Teorema Reziduurilor

SEMINARUL 3. Cap. II Serii de numere reale. asociat seriei. (3n 5)(3n 2) + 1. (3n 2)(3n+1) (3n 2) (3n + 1) = a

Circuite cu diode în conducţie permanentă

riptografie şi Securitate

MATRICE. DETERMINAN I.

Componente şi Circuite Electronice Pasive. Laborator 3. Divizorul de tensiune. Divizorul de curent

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor X) functia f 1

Asupra unei inegalităţi date la barajul OBMJ 2006

6 n=1. cos 2n. 6 n=1. n=1. este CONV (fiind seria armonică pentru α = 6 > 1), rezultă

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor

Sisteme diferenţiale liniare de ordinul 1

5.5. REZOLVAREA CIRCUITELOR CU TRANZISTOARE BIPOLARE

5.4. MULTIPLEXOARE A 0 A 1 A 2

Curs 14 Funcţii implicite. Facultatea de Hidrotehnică Universitatea Tehnică "Gh. Asachi"

COLEGIUL NATIONAL CONSTANTIN CARABELLA TARGOVISTE. CONCURSUL JUDETEAN DE MATEMATICA CEZAR IVANESCU Editia a VI-a 26 februarie 2005.

Aplicaţii ale principiului I al termodinamicii la gazul ideal

Integrala nedefinită (primitive)

RĂSPUNS Modulul de rezistenţă este o caracteristică geometrică a secţiunii transversale, scrisă faţă de una dintre axele de inerţie principale:,

Esalonul Redus pe Linii (ERL). Subspatii.

8 Intervale de încredere

7 Distribuţia normală

Laborator 11. Mulţimi Julia. Temă

POPULAŢIE NDIVID DATE ORDINALE EŞANTION DATE NOMINALE

BARAJ DE JUNIORI,,Euclid Cipru, 28 mai 2012 (barajul 3)

Exemple de probleme rezolvate pentru cursurile DEEA Tranzistoare bipolare cu joncţiuni

Planul determinat de normală şi un punct Ecuaţia generală Plane paralele Unghi diedru Planul determinat de 3 puncte necoliniare

Masurarea variabilitatii Indicatorii variaţiei(împrăştierii) lectia 5 16 martie 2 011

Definiţia generală Cazul 1. Elipsa şi hiperbola Cercul Cazul 2. Parabola Reprezentari parametrice ale conicelor Tangente la conice

PROBLEME - CIRCUITE ELECTRICE

Proiectarea filtrelor prin metoda pierderilor de inserţie

Seminar 5 Analiza stabilității sistemelor liniare


Fig Impedanţa condensatoarelor electrolitice SMD cu Al cu electrolit semiuscat în funcţie de frecvenţă [36].


Componente şi Circuite Electronice Pasive. Laborator 4. Măsurarea parametrilor mărimilor electrice

Statisticǎ - curs 3. 1 Seria de distribuţie a statisticilor de eşantioane 2. 2 Teorema limitǎ centralǎ 5. 3 O aplicaţie a teoremei limitǎ centralǎ 7

prin egalizarea histogramei

I. Noţiuni introductive

Noţiuni introductive

Laborator 1: INTRODUCERE ÎN ALGORITMI. Întocmit de: Claudia Pârloagă. Îndrumător: Asist. Drd. Gabriel Danciu

Conice. Lect. dr. Constantin-Cosmin Todea. U.T. Cluj-Napoca

9 Testarea ipotezelor statistice

R R, f ( x) = x 7x+ 6. Determinați distanța dintre punctele de. B=, unde x și y sunt numere reale.

Ecuatii trigonometrice

CONCURSUL DE MATEMATICĂ APLICATĂ ADOLF HAIMOVICI, 2017 ETAPA LOCALĂ, HUNEDOARA Clasa a IX-a profil științe ale naturii, tehnologic, servicii

SEMINAR 14. Funcţii de mai multe variabile (continuare) ( = 1 z(x,y) x = 0. x = f. x + f. y = f. = x. = 1 y. y = x ( y = = 0

Foarte formal, destinatarul ocupă o funcţie care trebuie folosită în locul numelui

a. 11 % b. 12 % c. 13 % d. 14 %

Ovidiu Gabriel Avădănei, Florin Mihai Tufescu,

SEMINAR TRANSFORMAREA FOURIER. 1. Probleme

Stabilizator cu diodă Zener

O generalizare a unei probleme de algebră dată la Olimpiada de Matematică, faza judeţeană, 2013

T R A I A N ( ) Trigonometrie. \ kπ; k. este periodică (perioada principală T * =π ), impară, nemărginită.

Ecuatii exponentiale. Ecuatia ce contine variabila necunoscuta la exponentul puterii se numeste ecuatie exponentiala. a x = b, (1)

MULTIMEA NUMERELOR REALE

a) (3p) Sa se calculeze XY A. b) (4p) Sa se calculeze determinantul si rangul matricei A. c) (3p) Sa se calculeze A.

Curs 2 Şiruri de numere reale

z a + c 0 + c 1 (z a)

Profesor Blaga Mirela-Gabriela DREAPTA

Μπορώ να κάνω ανάληψη στην [χώρα] χωρίς να πληρώσω προμήθεια; Informează dacă există comisioane bancare la retragere numerar într-o anumită țară

V O. = v I v stabilizator

2.1 Sfera. (EGS) ecuaţie care poartă denumirea de ecuaţia generală asferei. (EGS) reprezintă osferă cu centrul în punctul. 2 + p 2

Principiul Inductiei Matematice.

Criterii de comutativitate a grupurilor

Tranzistoare bipolare şi cu efect de câmp

Statisticǎ - curs 2. 1 Parametrii şi statistici ai tendinţei centrale 2. 2 Parametrii şi statistici ai dispersiei 5

Problema a II - a (10 puncte) Diferite circuite electrice

2. Sisteme de forţe concurente...1 Cuprins...1 Introducere Aspecte teoretice Aplicaţii rezolvate...3

1.3 Baza a unui spaţiu vectorial. Dimensiune

II. 5. Probleme. 20 c 100 c = 10,52 % Câte grame sodă caustică se găsesc în 300 g soluţie de concentraţie 10%? Rezolvare m g.

CONCURSUL DE MATEMATICĂ APLICATĂ ADOLF HAIMOVICI, 2016 ETAPA LOCALĂ, HUNEDOARA Clasa a IX-a profil științe ale naturii, tehnologic, servicii

Capitolul 4 PROPRIETĂŢI TOPOLOGICE ŞI DE NUMĂRARE ALE LUI R. 4.1 Proprietăţi topologice ale lui R Puncte de acumulare

Valori limită privind SO2, NOx şi emisiile de praf rezultate din operarea LPC în funcţie de diferite tipuri de combustibili

CURS: METODE EXPERIMENTALE ÎN FCS

Laborator 6. Integrarea ecuaţiilor diferenţiale

Criptosisteme cu cheie publică III

1.3. Erori în calculele numerice

Lucian Maticiuc SEMINAR Conf. dr. Lucian Maticiuc. Capitolul VI. Integrala triplă. Teoria:

Capitolul 4. Integrale improprii Integrale cu limite de integrare infinite

IV. CUADRIPOLI SI FILTRE ELECTRICE CAP. 13. CUADRIPOLI ELECTRICI

1. Distribuţiile teoretice 2. Intervalul de încredere pentru caracteristicile cantitative (medii) Histograma Nr. valori Nr. de clase de valori

3. Momentul forţei în raport cu un punct...1 Cuprins...1 Introducere Aspecte teoretice Aplicaţii rezolvate...4

Aparate de măsurat. Măsurări electronice Rezumatul cursului 2. MEE - prof. dr. ing. Ioan D. Oltean 1

Transcript:

Dragomirescu L., Drane J. W.,, Biostatisticã pentru începãtori. Vol I. Biostatisticã descriptivã. Editia a 6 revãzutã, Editura CREDIS, Bucureşti, 7p. ISB 78-7-74-46-8..6. Formule de calcul pentru medie şi dispersie Deşi pentru obţinerea unui anumit rezultat numeric putem folosi mai multe formule echivalente algebric, vom prefera întotdeauna acele formule care presupun cât mai puţine operaţii sunt cât mai rapide - sau care, în cazul operării cu valori aproximative, amplifică erorile de aproximare cât mai puţin sunt cât mai precise. Pentru ultima proprietate va trebui ca operaţiile care introduc aproximări - împărţirile şi extragerile de radicali - să fie plasate cât mai târziu. Aceste formule se numesc, în literatura statistică, formule de calcul sau, mai explicit, formule de calcul rapid şi / sau precis..6.. Metodă de calcul rapid al mediei şi dispersiei (a) În cazul unei serii statistice x,x,...,x i,...,x, respectiv, (b) în cazul unei serii statistice grupată în distribuţia de frecvenţe absolute (x, j ) j cu = Σ j, notând cu = Σ x i şi = Σ x i, respectiv = Σ j x j şi = Σ j x j, media va fi: =, iar M dispersia se va putea obţine, după calcularea mediei, prin formula: S M =. Aceasta o vom denumi formula de calcul rapid a dispersiei deoarece presupune mai puţine operaţii decât formula teoretică de definiţie. Ţinând cont că = Σ x i rezultă că: dispersia este media pătratelor minus pătratul mediei valorilor seriei. Formularea se reţine uşor deoarece conţine un joc de cuvinte. Exemplul.6.. Să se calculeze media şi dispersia pentru următoarea serie de 6 valori:,,, 4,,. Rezultatele finale vor fi rotunjite la două zecimale. Rezolvări rapide (AŞA DA!) (a) Plasăm seria în coloana x, calculăm pătratele valorilor în coloana x şi calculăm şi sumând valorile din fiecare coloană: x x 4 4 4 6 = 7 = 5 Apoi, conform formulelor de calcul: 7 M = = 8, şi 6 S M 5 = 8, 8 5, 8 6, = 474, 47,. 6 Răspuns: M,8 şi S,47. 7

Dragomirescu L., Drane J. W.,, Biostatisticã pentru începãtori. Vol I. Biostatisticã descriptivã. Editia a 6 revãzutã, Editura CREDIS, Bucureşti, 7p. ISB 78-7-74-46-8. Observaţii: Deoarece în calcul trebuie să avem o zecimală în plus faţă de rezultatul final, iar media este un rezultat intermediar în calculul dispersiei, am calculat media cu trei zecimale. În final, am rotunjit-o la două zecimale, aşa cum se cere în enunţ. În total s-au executat operaţii algebrice. (a) Dacă seria este grupată în distribuţia de frecvenţe absolute din primele două coloane ale tabelei următoare, calculăm mai întâi coloanele cu valorile x j şi cu produsele j x j, respectiv, j x j şi calculăm şi sumând valorile din ultimele două coloane: j x j x j 4 4 6 j x j j x j 4 8 7 4 6 = 6 = 7 = 5 Apoi, conform formulelor de calcul: 7 M = = 8, şi 6 5 S = M 8, 47,. 6 + Rezolvare greoaie (AŞA U!! - folosind formula teoretică a dispersiei) (a ) Din suma elementelor primei coloane de mai jos determinăm mai întâi media M = 7 / 6,8. Apoi calculăm coloanele doi şi trei şi suma celei de-a treia coloane: x x-m (x-m) 4 -,8,67 -,8,66,67,67,64,8,64,4,8,8 = Σx = 7 Σ(x-M) =,8 În final ( x M) S = =,8,47. 6 Răspuns: M,8 şi S,47. În calculul dispersiei, media şi celelalte rezultate intermediare au fost rotunjite la trei zecimale, pentru a avea, aşa cum se cere, o zecimală în plus faţă de rezultatul final. În total s-au executat operaţii algebrice, cu trei mai multe decât la punctul (a). În mod evident, operaţiile executate au fost mai dificile decât în varianta (a) de mai sus. +.6.. Formule de calcul rapid şi precis pentru dispersie precizie < > M umăr operaţii: 5 4 rapiditate 7

Dragomirescu L., Drane J. W.,, Biostatisticã pentru începãtori. Vol I. Biostatisticã descriptivã. Editia a 6 revãzutã, Editura CREDIS, Bucureşti, 7p. ISB 78-7-74-46-8. Deoarece variabilitatea biologică este mult mai mare decât variabilitatea produsă de erorile de măsurare şi de rotunjire prin calcul, în biostatistică ne va interesa mai mult rapiditatea decât precizia. De aceea, cel puţin în calculul manual, vom prefera formula din chenarul dublu care presupune calculul prealabil al mediei. În programele de calculator va fi de preferat formula din chenarul simplu. Aceasta este utilizată în ştiinţele exacte şi inginerie, adică oriunde este nevoie de o precizie cât mai bună. +.6.. Metode de calcul manual simplificat prin artificii Acest subparagraf este introdus nu atât pentru înarmarea cititorului cu metode de calcul manual ci, mai degrabă, pentru a-l familiariza cu un mod de gândire fundamental în matematică şi statistică, mod ce va fi necesar pentru înţelegerea paragrafului dedicat distribuţiei normale. Pentru aceasta să considerăm următorul exemplu pe care îl vom soluţiona, mai întâi direct, după modelul prezentat la punctul.6..(a). Exemplul.6.. Să se calculeze media şi dispersia pentru următoarea serie de 5 valori:, 7,, 6,. Rezolvare: Plasăm seria în coloana x, calculăm pătratele valorilor în coloana x şi calculăm şi sumând valorile din fiecare coloană: x x 7 6 4 56 6 = 5 = 767 Apoi, conform formulelor de calcul: 5 M = = =, 6 şi 5 767 S = M =, 6 = 5, 4, 6 = 4, 4. 5 ranslatarea datelor (sau introducerea unei medii provizorii, x ) Observăm că numerele cu care s-a lucrat în seria de 5 valori de mai sus sunt relativ mari şi, deci, calculul a decurs relativ greoi. Datele sunt reprezentate prin cercuri pline în desenul următor. Pentru micşorarea numerelor introduse în calcul putem face o translaţie convenabilă de lungime x, adică vom calcula x' = x x. De exemplu, dacă vom lua x =, noul şir va avea valorile reprezentate mai sus prin cerculeţe goale şi enumerate în coloana a II-a a tabelului următor: 7

Dragomirescu L., Drane J. W.,, Biostatisticã pentru începãtori. Vol I. Biostatisticã descriptivã. Editia a 6 revãzutã, Editura CREDIS, Bucureşti, 7p. ISB 78-7-74-46-8. x x' = x x (x ) 7 6 - - 6 8 6 8 ' = ' = 7 De regulă vom alege un x cât mai aproape de tendinţa centrală a şirului, aşa cum o sesizăm intuitiv. De aceea metoda se numeşte şi introducerea unei medii provizorii, x. Dacă este posibil, este convenabil ca x să fie chiar o valoare a şirului pentru că aceasta va deveni uşurând calculele ulterioare. Calculăm noua medie şi noua dispersie: ' M = = 5 =,6 ' 7 ( S ' ) = ( M ') =,6 = 4,4,6 = 4,4. 5 Deoarece datele au fost translatate la stânga cu x = unităţi, atunci şi noua medie M' va fi cu x = unităţi mai mică decât media iniţială, M. Adică M' = M x. Observaţia : (importantă pentru paragraful dedicat distribuţiei normale) Dacă x ar fi chiar media seriei iniţiale M, noua medie va fi M' = M - M =, ca în desenul următor. Observaţia : Media căutată, M se poate obţine din noua medie, M' astfel: = =,6 + =,6. M M ' + x Împrăştierea, în particular dispersia, nu s-a modificat în nici un fel, deci 74

Dragomirescu L., Drane J. W.,, Biostatisticã pentru începãtori. Vol I. Biostatisticã descriptivã. Editia a 6 revãzutã, Editura CREDIS, Bucureşti, 7p. ISB 78-7-74-46-8. ( ' ) S = S = 4,4. Dilatarea ori contractarea datelor (sau introducerea unui factor de scară h, sau schimbarea unităţii de măsură) Să considerăm acum şirul valorilor x' din exemplul anterior. Observăm că aceste valori pot deveni şi mai mici (deci şi mai uşor de manevrat în calculul manual) dacă le divizăm cu h =, obţinând valorile x" = x' / h din tabelul următor: x x = x / h (x ) - - 6 - - 4 = = Am executat o contractare a axei cu factorul de scară h =, noile valori fiind pătratele goale din desenul următor. Altfel spus am schimbat unitatea de măsură iniţială cu o nouă unitate de măsură care este de ori mai mică. Media şi dispersia pentru noul şir x" vor fi: '' M' ' = = =, 5 ' ' ( S' ' ) = ( M' ') =, = 4,6,4 = 4,56. 5 Deoarece datele au fost micşorate de h = ori, şi noua medie M, respectiv noua abatere standard S'' vor fi de acelaşi număr de ori mai mici decât M', respectiv S'. Adică M'' = M' / h şi S'' = S' / h, iar (S'') =(S') / h. Observaţia : (importantă pentru paragraful dedicat distribuţiei normale) Dacă h ar fi chiar abaterea standard a şirului x', şi anume S', noua abatere standard va fi S'' = S' / S' =. Dacă valorile şirului ar fi fost fracţionare este posibil să fi fost avantajoasă o dilatare care să le transforme în numere întregi mai uşor de manevrat în calcul. 75

Dragomirescu L., Drane J. W.,, Biostatisticã pentru începãtori. Vol I. Biostatisticã descriptivã. Editia a 6 revãzutã, Editura CREDIS, Bucureşti, 7p. ISB 78-7-74-46-8. Observaţia 4: Media şi dispersia şirului x' vor fi date de formulele: M' = M'' h =, =,6 ( S') = (S'') h = 4,56 = 4,56 = 4,4. Observaţia 5: Dacă dorim să aflăm media şi dispersia şirului originar x, atunci vom ţine cont că am efectuat atât: o translaţie de lungime x, cât şi o comprimare / dilatare de factor de scară h: x' ' = x' / h= x- x ) / h ( şi formulele de revenire la media M şi dispersia S ale şirului iniţial se vor obţine combinând formulele de mai sus: M = M' + x = M'' h+ x. S = ( S' ) = ( S'' ) h.6.4. Probleme. a. Să se calculeze prin formulele de calcul simultan rapid şi precis mediile şi dispersiile, precum şi abaterile standard şi coeficienţii de variaţie pentru seriile S4'', S, S4' şi S5 din subparagraful... b. Să se compare rezultatele numerice obţinute cu rezolvarea prin sinteză grafică prezentată în finalul problemei rezolvate la punctul 5 de la... Rezolvare: a. Seria S4'' S S4' S5 Media (în mm) M,, 8,5 7, Dispersia (în mm ) S,,67,4 65, Abaterea standard (în mm) S,,8,85 8, Coeficientul de variaţie CV%,%,4%,8% 4,7%. a. Să se execute aceleaşi calcule şi pentru distribuţia grupată S5' luând ca valori centrele claselor. Să se observe diferenţele între valorile indicatorilor pentru această serie şi cea negrupată corespunzătoare (S5). La distribuţia grupată faţă de cea negrupată corespunzătoare: b. media va fi întotdeauna mai mare? c. dispersia va fi întotdeauna mai mică? Rezolvare: a. Seria M S S CV% S5 7,5 48,6 6,7 4,4% b. u. Media la distribuţia grupată poate fi mai mare sau mai mică în funcţie de modul de plasare a valorilor seriei negrupate faţă de centrele claselor. c. Da. Dispersia distribuţiei grupate va fi întotdeauna mai mică sau egală cu dispersia distribuţiei negrupate, căci prin grupare valorile împrăştiate în cadrul unei clase vor fi concentrate în centrul clasei respective. Un răspuns mai elaborat se poate baza pe proprietatea de aditivitate a dispersiei. Seria negrupată are dispersia egală cu dispersia totală (variaţia totală / volumul seriei), iar seria grupată are dispersia egală cu dispersia intergrupări (variaţia intergrupări / acelaşi volum), grupările fiind dictate de intervalele de grupare. Practic, prin grupare s-a pierdut variaţia intragrupări, ceea ce intuitiv a constituit explicaţia de mai sus. 76