CURSUL AL II-LEA. 2. Indicatori statistici

Σχετικά έγγραφα
Statisticǎ - curs 2. 1 Parametrii şi statistici ai tendinţei centrale 2. 2 Parametrii şi statistici ai dispersiei 5

SEMINARUL 3. Cap. II Serii de numere reale. asociat seriei. (3n 5)(3n 2) + 1. (3n 2)(3n+1) (3n 2) (3n + 1) = a

POPULAŢIE NDIVID DATE ORDINALE EŞANTION DATE NOMINALE

TEMA 9: FUNCȚII DE MAI MULTE VARIABILE. Obiective:

6 n=1. cos 2n. 6 n=1. n=1. este CONV (fiind seria armonică pentru α = 6 > 1), rezultă

Curs 4 Serii de numere reale

CURS III, IV. Capitolul II: Serii de numere reale. a n sau cu a n. Deci lungimea segmentului este suma lungimilor sub-segmentelor obţinute, adică

Curs 10 Funcţii reale de mai multe variabile reale. Limite şi continuitate.

Capitole fundamentale de algebra si analiza matematica 2012 Analiza matematica

Formula lui Taylor. 25 februarie 2017

Masurarea variabilitatii Indicatorii variaţiei(împrăştierii) lectia 5 16 martie 2 011

Ministerul Educaţiei Naționale Centrul Naţional de Evaluare şi Examinare

Analiza bivariata a datelor

CURSUL AL VII-LEA. 1. Eşantion. 2. Eşantionare

CURS I ELEMENTE DE BAZĂ

Olimpiada Naţională de Matematică Etapa locală Clasa a IX-a M 1

a) (3p) Sa se calculeze XY A. b) (4p) Sa se calculeze determinantul si rangul matricei A. c) (3p) Sa se calculeze A.

Inegalitati. I. Monotonia functiilor

COMBINATORICĂ. Mulţimile ordonate care se formează cu n elemente din n elemente date se numesc permutări. Pn Proprietăţi

STATISTICĂ DESCRIPTIVĂ

Analiza matematica Specializarea Matematica vara 2010/ iarna 2011

Analiza în curent continuu a schemelor electronice Eugenie Posdărăscu - DCE SEM 1 electronica.geniu.ro

Metode iterative pentru probleme neliniare - contractii

Indicatori sintetici ai distribuțiilor statistice

Curs 12. Intervale de încredere Intervale de încredere pentru medie în cazul σ cunoscut

SERII NUMERICE. Definiţia 3.1. Fie (a n ) n n0 (n 0 IN) un şir de numere reale şi (s n ) n n0

TEMA 10 TESTE DE CONCORDANŢĂ

5.1. ŞIRURI DE FUNCŢII

7. ECUAŢII ŞI SISTEME DE ECUAŢII DIFERENŢIALE

Aplicatii ale marimilor medii in practica

ŞIRURI ŞI SERII DE FUNCŢII

III. Serii absolut convergente. Serii semiconvergente. ii) semiconvergentă dacă este convergentă iar seria modulelor divergentă.

3.1. DEFINIŢII. PROPRIETĂŢI

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor X) functia f 1

Curs 1 Şiruri de numere reale

în care suma termenilor din fiecare grup este 0, poate conduce la ideea că valoarea acestei sume este 0. De asemenea, gruparea în modul

Laborator 4 Interpolare numerica. Polinoame ortogonale

(a) se numeşte derivata parţială a funcţiei f în raport cu variabila x i în punctul a.

1. ŞIRURI ŞI SERII DE NUMERE REALE

MARCAREA REZISTOARELOR

SUBGRUPURI CLASICE. 1. SUBGRUPURI recapitulare

Metode de interpolare bazate pe diferenţe divizate

Sunt variabile aleatoare care iau o infinitate numărabilă de valori. Diagrama unei variabile aleatoare discrete are forma... f. ,... pn.

4. Ecuaţii diferenţiale de ordin superior

PENTRU CERCURILE DE ELEVI

3. Serii de puteri. Serii Taylor. Aplicaţii.

BAREM DE CORECTARE CLASA A IX A

PROBLEME CU PARTEA ÎNTREAGĂ ŞI

1. ŞIRURI ŞI SERII DE NUMERE REALE

Seminar 3. Serii. Probleme rezolvate. 1 n . 7. Problema 3.2. Să se studieze natura seriei n 1. Soluţie 3.1. Avem inegalitatea. u n = 1 n 7. = v n.

Curs 14 Funcţii implicite. Facultatea de Hidrotehnică Universitatea Tehnică "Gh. Asachi"

5. FUNCŢII IMPLICITE. EXTREME CONDIŢIONATE.

ŞIRURI DE VARIABILE ALEATOARE. PROBLEME ASIMPTOTICE

Concursul Naţional Al. Myller Ediţia a VI - a Iaşi, 2008

8 Intervale de încredere

DISTANŢA DINTRE DOUĂ DREPTE NECOPLANARE

9. SONDAJUL STATISTIC

CLASA a V-a CONCURSUL INTERJUDEŢEAN DE MATEMATICĂ ŞI INFORMATICĂ MARIAN ŢARINĂ EDIŢIA A IV-A MAI I. Să se determine abcd cu proprietatea

Student: Specializarea: STATISTICĂ ECONOMICĂ PRELUCRAREA BAZELOR DE DATE

3.5. Indicatori de împrăştiere

Capitolul 2 ŞIRURI DE NUMERE REALE. 2.1 Proprietăţi generale Moduri de definire a unui şir. (x n ) n 0 : x n =


Partea întreagă, partea fracţionară a unui număr real

CURSUL AL IV-LEA. Tabelul 1 Greutatea corporală a 1014 pacienţi cu diferite afecţiuni, pe clase din 5kg în 5kg

lim = dacă se aplică teorema lui 3. Derivate de ordin superior. Aplicaţii.

Polinoame Fibonacci, polinoame ciclotomice

Statisticǎ - curs 3. 1 Seria de distribuţie a statisticilor de eşantioane 2. 2 Teorema limitǎ centralǎ 5. 3 O aplicaţie a teoremei limitǎ centralǎ 7

CAP VII ELEMENTE DE TEORIA PROBABILITĂŢILOR ŞI STATISTICĂ MATEMATICĂ

Scoruri standard Curba normală (Gauss) M. Popa

6.1. DERIVATE ŞI DIFERENŢIALE PENTRU FUNCŢII REALE DE O VARIABILĂ REALĂ. APLICAŢII

Asupra unei inegalităţi date la barajul OBMJ 2006

Tema: şiruri de funcţii

CONCURSUL DE MATEMATICĂ APLICATĂ ADOLF HAIMOVICI, 2017 ETAPA LOCALĂ, HUNEDOARA Clasa a IX-a profil științe ale naturii, tehnologic, servicii

Subiecte Clasa a VII-a

7 Distribuţia normală

V.7. Condiţii necesare de optimalitate cazul funcţiilor diferenţiabile

Seminariile Capitolul X. Integrale Curbilinii: Serii Laurent şi Teorema Reziduurilor

Planul determinat de normală şi un punct Ecuaţia generală Plane paralele Unghi diedru Planul determinat de 3 puncte necoliniare

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

Subiecte Clasa a VIII-a

a n (ζ z 0 ) n. n=1 se numeste partea principala iar seria a n (z z 0 ) n se numeste partea

OLIMPIADA DE MATEMATICĂ FAZA LOCALĂ CLASA a V-a

R R, f ( x) = x 7x+ 6. Determinați distanța dintre punctele de. B=, unde x și y sunt numere reale.

Componente şi Circuite Electronice Pasive. Laborator 4. Măsurarea parametrilor mărimilor electrice

1.7. AMPLIFICATOARE DE PUTERE ÎN CLASA A ŞI AB

PRELEGEREA VI STATISTICĂ MATEMATICĂ

Cursul 7. Spaţii euclidiene. Produs scalar. Procedeul de ortogonalizare Gram-Schmidt. Baze ortonormate

Variabile statistice. (clasificare, indicatori)

Integrala nedefinită (primitive)


T R A I A N. Numere complexe în formă algebrică z a. Fie z, z a bi, Se numeşte partea reală a numărului complex z :

Componente şi Circuite Electronice Pasive. Laborator 3. Divizorul de tensiune. Divizorul de curent

Curs 2 Şiruri de numere reale

Sala: 2103 Decembrie 2014 CURS 10: ALGEBRĂ

CAPITOLUL IV CALCULUL DIFERENŢIAL PENTRU FUNCŢII REALE DE O VARIABILA REALĂ

Seria MATEMATICĂ ANALIZĂ MATEMATICĂ Calcul diferenţial

riptografie şi Securitate

Aparate de măsurat. Măsurări electronice Rezumatul cursului 2. MEE - prof. dr. ing. Ioan D. Oltean 1

CAPITOLUL III FUNCŢII CONTINUE

Transcript:

. Idicatori statistici CURSUL AL II-LEA.. Serii de valori. Aşa cum s-a văzut î cursul aterior, ueori este ecesar să urmărim mai îtâi o sigură variabilă umerică di multitudiea de variabile îregistrate îtr-u tabel de date. Î acest caz, datele umerice pe care le avem la dispoziţie sut u simplu şir de umere asociate, fiecare di ele, uui idivid. Aceste şiruri de umere rezultate di datele culese le vom umi serii statistice sau serii de date sau serii de valori. Ceea ce trebuie urmărit î primul râd la o serie de valori este modul î care valorile di serie sut distribuite î plaja de valori ître u miim şi u maxim, cum se distribuie î jurul mediei, care este tediţa cetrală a seriei, care sut valorile cel mai des îtâlite, etc. Caracterizarea sitetică a uei serii de valori este dată de aşa umiţii idicatori statistici, ître care media, deviaţia stadard, mediaa, etc, idicatori pe care îi vom descrie î cotiuare. Defiiţie: Idicatorii statistici sut umere reale, care sitetizează o parte di iformaţia coţiută de o serie de valori, dâd posibilitata aprecierii globale a îtregii serii, î loc să ţiem cot de fiecare valoare di şir. Aşa cum se va vedea î acest curs, fiecare idicator urmăreşte să scoată î evideţă proprietăţi diferite ale şirului de valori. Astfel, pri combiarea mai multor idicatori, obţiem iformaţii relevate şi sitetice despre valorile şirului. Dacă î locul şirului propriu-zis, folosim o serie de idicatori statistici, o parte di iformaţie se pierde. Totuşi, de obicei se pierde ceea ce este esemificativ, accidetal, idicatorii statistici reţiâd doar eseţailul. De aici şi utilitatea şi importaţa lor î statistică. Î cele ce urmează, valorile di şirul de umere ce costituie o serie de valori le vom ota cu X: x, x,... x, sau Y: y,y,..y sau otaţii asemăătoare folosid alte litere ale alfabetului. De exemplu, î loc să spuem că cele 0 valori ale glicemei la cei zece pacieţi ditr-u lot sut: 88, 97, 0, 89, 9, 05, 98, 05, 88, 0, vom scrie î loc de Glicemie litera X, şi î locul fiecărui umăr di cele zece, simbolurile x, x,.x 0. Deci, x ţie locul lui 88, x pe cel al lui 97, etc. Aceste otaţii le folosim petru a uşura îţelegerea formulelor de calcul petru uii idicatori. Valori extreme, amplitudie Cel mai uşor de căutat şi de îţeles ca semificaţie sut idicatorii Miim şi Maxim care sut cei ce e idică plaja de valori pe care se îtide seria de valori. Miim este cea mai mică valoare di serie, iar Maxim este cea mai mare. Amplitudiea absolută, este difereţa ditre maximul şi miimul uei serii de valori şi e dă iformaţii despre lărgimea plajei de valori pe care se îtid datele di serie (vezi figura.). O serie de valori cu o amplitudie mare idică o plajă de valori îtisă datorată fie uei dispersii sau împrăştieri mari a datelor, fie simplului fapt că sut multe valori. Dacă două serii de valori au acelaşi umăr de valori, dar ua are o amplitudie mai mare, atuci valorile ei sut mai împrăştiate. Figura.. Idicatorii medie, miim, maxim, amplitudie absolută şi amplitudie relativă.

De cele mai multe ori, valorile miimă şi maximă ditr-o serie u se îscriu î limitele de ormalitate, ceea ce u îseamă eapărat că seria coţie valori aormale. Totuşi, de obicei, cele mai îdepărtate câteva valori, atât cele mai mici cât şi cele mai mari trebuie verificate petru a e asigura că u este vorba de date eroate. De exemplu, deşi se cosideră că valorile ormale petru lateţa semalului ervos pe ervul optic ître stimularea retiei şi răspusul cortical sut situate aproximativ ître 90 ms şi 5 ms, u eşatio de idivizi săătoşi poate să producă o serie de valori care are şi ua sau câteva excepţii. De aceea, di 0 sau 0 de valori, ua poate fi 88 ms iar alta 7 ms, majoritatea fiid îsă ître 90 şi 5 ms... Valori medii. Media aritmetică a uei serii de valori. Este u idicator simplu şi î acelaşi timp foarte sitetic, fiid u foarte bu idiciu al valorii î jurul căreia se grupează datele. Se otează cu litera m sau, dacă seria de valori este otată cu o majusculă ca X sau Y, media se otează cu X sau Y. Formula este cea cuoscută: Defiiţie: X x + x +... x m Media aritmetică uei serii de valori este raportul ditre suma valorilor seriei şi umărul lor. (.) Media este idicatorul care arată tediţa cetrală a seriei de valori, şi de obicei arată ude tid datele să se aglomereze. De cele mai multe ori, valorile di serie sut situate î majoritate î apropierea mediei, iar o mai mică parte di ele sut situate mult î stâga sau î dreapta mediei. O situare a valorilor di serie faţă de medie se poate observa di aşa-umitul grafic puctual de dispersie, di care este dat u exemplu î figura. Figura.. Cele mai multe valori sut de obicei mai apropiate de medie. Dar u totdeaua datele di seria de valori se situează prepoderet î apropierea mediei. Mai rar, şi oarecum mai forţat, e putem îtâli şi cu situaţii î care datele di serie se situează prepoderet î stâga şi dreapta, departe de medie şi doar o mică parte ditre ele se situează aproape de medie, aşa cum se observă î figura.. Figura.. Ueori, cele mai multe valori sut sub medie şi peste medie, destul de departe de aceasta. Î seriile de mai sus, avem aceeaşi medie, dar este evidet că u avem aceeaşi situaţie. Valorile di seria de jos sut mai împrăştiate. Astfel, dacă î acelaşi lot sut cuprişi idivizi hipertiroidiei şi hipotiroidiei, şi se măsoară la fiecare cocetraţia hormoului tiroidia T 4, vom observa că hipotiroidieii au prepoderet valori î stâga mediei, cei mai mulţi destul de departe de medie, iar hipertiroidieii au prepoderet valori î dreapta, tot departe de medie. De fapt îtr-u asemeea caz, î zoa cetrală lipsesc exact ceea ce am spue că sut ormalii, adică idivizi care au valori petru T 4 uşor peste medie şi uşor sub medie, şi care u au fost icluşi îtr-u astfel de lot.

Evidet că u eşatio aşa de eteroge u este folosit prea des î statistică petru că, aşa cum vom vedea, î acest caz este foarte idicat să se costituie două eşatioae disticte petru cele două categorii de pacieţi. Totuşi, asemeea situaţii, chiar dacă de obicei u sut idicate şi sut puţi artificiale, există. Situaţia de mai sus este ilustrată î figura.. O formulă simplificată petru media aritmetică este dată de: X x F + x F +... + x F F + F +... + F ude cu am otat umărul de valori diferite di seria de valori, iar F, F,...,F sut frecveţele de apariţie î serie ale valorilor x, x,...,x. Această formulă se spue că este formula petru media poderată. Nu trebuie să credem că media poderată calculată cu formula de mai sus şi media aritmetică calculată cu formula (.), sut idicatori diferiţi. Ambele medii sut î realitate idetice. Media poderată se calculează de obicei mai simplu şi deci u reprezită decât o formă mai simplă de calcul al mediei aritmetice. Pri faptul că este u idicator extrem de fidel al tediţei cetrale al uei serii statistice, media este u idicator extrem de mult utilizat î statistică. Media aritmetică are dezavatajul că este sesibilă la valori extreme fie foarte mici, fie foarte mari. Adăugarea uei sigure valori (sau a câtorva) mult mai mari decât celelalte, modifică sesibil media aritmetică. De asemeea, dacă datele sut distribuite î jurul mediei puteric asimetric, media îşi pierde di puterea de a evoca tediţa cetrală, î aceste cazuri fiid mult mai utilă mediaa (vezi mai jos)... Împrăştiere. Valorile ditr-o serie de valori pot fi mai aglomerate î jurul mediei sau mai dispersate, adică la distaţe mari de medie. U mod de a măsura aceste abateri de la medie este să se facă difereţa ître toate aceste valori şi media lor. Uele abateri vor fi pozitive, altele egative. Ele u pot fi aduate, deoarece, pri aduare dau suma 0. Dispersia. U mod de a ocoli faptul că suma abaterilor absolute este 0, este ridicarea la pătrat a acestora îaite de a fi aduate, petru a face să dispară semele egative la uele şi pozitive la altele. Suma obţiută, ar trebui împărţită la umărul de abateri petru a se obţie o medie. Î realitate, di motive teoretice foarte bie îtemeiate, dar mai greu de explicat î cuvite simple, împărţirea se face la - şi u la. Motivul petru care se face acest lucru va fi îţeles mai bie î cotextul uor oţiui euţate la cursul despre teoria estimaţiei. Valoarea care se obţie astfel se umeşte dispersie şi este u idicator al gradului de împrăştiere al seriei. Dispersia se otează cu D şi are formula: ( x + ( x +... + ( x D După cum se observă, umărătorul fracţiei di defiiţia dispersiei este cu atât mai mare cu cât abaterile idividuale de la medie sut mai mari şi deci este atural să cosiderăm că o valoare mare a dispersiei arată o împrăştiere mare a valorilor di serie. De fapt, este bie de reţiut că: La medii aproximativ egale, este mai împrăştiată seria cu dispersia mai mare. La dispersii aproximativ egale, este mai împrăştiată seria cu media mai mică. Dispersia are dezavatajul că se exprimă cu uităţile de măsură ale valorilor di serie, ridicate la pătrat, şi are î geeral valori foarte mari comparativ cu abaterea medie. De exemplu, dacă valorile di serie se măsoară î mg/l, atuci dispersia se măsoară î mg /l, ceea ce este î mod evidet extrem de eatural. Î plus, dacă abaterile absolute au o medie, de exemplu î jurul lui 0, dispersia va avea o valoare î jurul lui 00, adică exagerat de mare î comparaţie cu abaterile absolute. De aceea se mai foloseşte u alt idicator, umit abatere stadard care este radicalul dispersiei. Abaterea stadard. Se otează cu σ şi are formula: σ D sauσ ( x + ( x +... + ( x

Acest idicator se exprimă cu aceeaşi uitate de măsură ca şi valorile di seria cosiderată şi este u idicator foarte fidel al împrăştierii seriei. Abaterea stadard, u are dezavatajele dispersiei, adică uitatea de măsură este aceeaşi cu a valorilor di serie, şi, are o valoare comparabilă cu abaterile idividuale de la medie. Exemplu de calcul: Să presupuem că am măsurat zilic tesiuea arterială sistolică la doi pacieţi timp de 0 zile, obţiâd petru fiecare următoarele valori: 70, 80, 60, 80, 90, 90, 80, 90, 70, 90, petru primul paciet şi 60, 70, 90, 60, 90, 90, 00, 80, 80, 80, petru al doilea. Lăsâd la o parte studiul modului cum evoluează de la zi la zi tesiuea pacieţilor, care este bieîţeles importată, să e propuem să determiăm care are tesiuea cu valori mai împrăştiate, idiferet de evoluţia î timp. Notâd prima serie cu X iar pe a doua cu Y se costată uşor că ambele au media 80 (datele u sut reale, au fost deliberat alese ca să simplifice calculele). Atuci, vom avea petru abaterile de la medie şi petru pătratele lor următoarele valori: x i - X : -0, 0, -0, 0, 0, 0, 0, 0, -0, 0. X 80. y i - Y : -0, -0, 0, -0, 0, 0, 0, 0, 0, 0. Y 80. (x i - X ) : 00, 0, 400, 0, 00, 00, 0, 00, 00, 00. (y i - Y ) : 400, 00, 00, 400, 00, 00, 400, 0, 0, 0. Deci vom avea petru D x : ( x + ( x +... + ( x0 400 + 6 00 000 Dx, 0 9 9 şi cu u calcul absolut aalog, D y 600 / 9 77,7. Se observă că, î timp ce abaterile de la medie sut de ordiul zecilor, dispersiile sut de ordiul sutelor, ceea ce este destul de eatural, şi î plus, după cum am mai spus, uitatea de măsură este cu totul alta. Petru abaterile stadard, vom avea: σ σ x y D, 0, 5 x D 77, 7, y calculele fiid făcute cu aproximaţie. Deci, este ceva mai împrăştiată seria Y. De fapt, este bie de reţiut că: La medii aproximativ egale, este mai împrăştiată seria cu deviaţia stadard mai mare. La deviaţii stadard aproximativ egale, este mai împrăştiată seria cu media mai mică. Ce se îtămplă îsă dacă mediile şi deviaţiile sut foarte diferite? Atuci o buă apreciere se obţie dacă se foloseşte raportul deviaţiei stadard faţă de medie, exprimat î procete, acest raport fiid u alt idicator al împrăştierii valorilor ditr-o serie. Acest idicator se umeşte coeficiet de variaţie. Coeficietul de variaţie. Este raportul ditre deviaţia stadard şi medie, atuci câd media este diferită de 0 şi se exprimă î procete: C. V. Petru seriile de mai sus, coeficietul de variaţie este mai mare petru cea mai împrăştiată, adică petru cea cu deviaţia stadard mai mare: C.V. x 0,5 / 80 0,058 5,8 %. C.V. y, / 80 0,07 7,%. σ X 4

Totuşi, seriile de mai sus sut comparabile cu ajutorul abaterilor stadard, deoarece au aceeaşi medie, şi, aşa cum s-a văzut, la medii egale sau aproximativ egale, are valorile mai împrăştiate seria cu abaterea stadard mai mare. Aprecierea cu ajutorul coeficietului de variaţie se face mai ales atuci câd două serii de valori au medii mult diferite şi deviaţiile stadard pot să u e dea o idicaţie suficiet de utilă. De exemplu, măsurâd lateţa şi amplitudiea semalului electric pe ervul optic la 0 de pacieţi cu scleroză multiplă, s-au obţiut următoarele rezultate: Lateţa medie:,6 Abaterea stadard a lateţei: 4,7 Amplitudiea medie:,68 Abaterea stadard a amplitudiii:,0 Dacă dorim să apreciem împrăştierea valorilor di cele două serii, abaterile stadard u e sut de ajutor. Îtr-adevăr, lateţa are o abatere stadard mult mai mare decât amplitudiea, dar şi media lateţei este cu mult mai mare decât aceea a amplitudiii. De aceea, î acest caz, doar coeficietul de variaţie e permite o apreciere corectă a împrăştierilor, î vederea comparării lor: 4,7 Petru lateţă: C. V. lateţa 0,9,9%,6,0 Petru amplitudie: C. V. amplitudie 0,757 75,7%,68 Se observă că valorile amplitudiii sut cu mult mai împrăştiate decât cele ale lateţei. Acest fapt se datorează atât uei variabilităţi biologice mai mari la amplitudie decât la lateţă, cât şi uei variabilităţi datorate aparatelor de măsură, care măsoară lateţa cu mai multă precizie, î timp ce la măsurarea amplitudiii, erorile de măsurare sut mai mari. Coeficietul de variaţie este cel mai fidel idicator al împrăştierii uei serii statistice, dar are şi el u icoveiet, este cu atât mai fidel cu cât mediile sut mai depărtate de 0. La medii foarte apropiate de 0 îşi pierde di fidelitate şi u este idicat să fie folosit. Acest lucru se îtâmplă mai ales atuci câd valorile di serie sut şi egative şi pozitive, şi câd, di acest motiv, media poate fi aproape de 0..4. Idicatori de asimetrie. Atuci câd valorile uei serii sut distribuite esimetric î jurul mediei, acest fapt este imposibil de surpris cu ajutorul idicatorilor de dispersie. De aceea, s-au itrodus idicatori care să puă î evideţă şi acest aspect al seriilor de valori: excetricitatea, sau asimetria. Va trebui să ţiem cot atât de umărul de valori care sut î stâga şi î dreapta mediei, cât şi depărtarea lor faţă de medie. Mediaa. Este u idicator al tediţei cetrale, şi aume este valoarea de mijloc, îtr-o serie de valori. Defiiţie: Mediaa este acea valoare ditr-o serie de valori, petru care exact jumătate di ele sut mai mici decât ea, iar jumătate mai mari. Altfel spus, este valoarea măsurată petru idividul di mijloc, dacă idivizii pe care s-au făcut măsurătorile ar fi ordoaţi creascător. Petru o îţelegere mai uşoară, să luăm u exemplu cu umai 0 îregistrări: tesiuea arterială maximă la u bolav î 0 zile: 50, 60, 60, 70, 60, 70, 50, 60, 70,60. Dacă se aşază aceste valori îtr-u şir crescător, obţiem: 50, 50, 60, 60, 60, 60, 60, 70,70,70. Î acest caz, mediaa se ia ître a cicia şi a şasea valoare di acest şir ordoat, adică 60. Dacă aceste două valori de mijloc diferă, se ia media lor aritmetică. Dacă umărul de măsurători este impar atuci madiaa este chiar valoarea de mijloc, care î acest caz este uică. De fapt, mediaa este importată î primul râd la serii de valori cu foarte multe îregistrări, caz î care se poate lucra direct pe tabelul de frecveţă, sau chiar pe tabelul pe clase. 5

Petru a exemplifica modul cum se caută mediaa pe tabelul de frecveţă, vom lua tabelul., î care sut cetralizate vârstele a 4 de pacieţi, fiecare valoare a vârstei avâd o aumită frecveţă absolută F i, o frecveţă relativă f i şi o frecveţă relativă cumulată crescător, f icc (vezi mai sus, petru amăute). Valoarea mediaei se culege di coloaa îtâi, a vârstelor, dar petru a şti care valoare trebuie aleasă, trebuie să privim pe ultima coloaă, a frecveţelor cumulate, f icc, î dreptul frecveţei cumulate de 50%. Se observă că, pe coloaa frecveţelor cumulate, u există frecveţa de 50%, dar, există frecveţa de 47,9%, care este prea mică, şi frecveţa de 5,8%, care este prea mare. Î acest caz, mediaa se citeşte di dreptul primei frecveţe cumulate crescător care depăşeşte 50%, î cazul ostru, î dreptul frecveţei de 5,8%, şi pe coloaa Vârsta citim 55 ai. Deci, vârsta mediaă este 55 ai. Tabelul.. Vârstele a 4 de pacieţi cetralizate îtr-u tabel de frecveţă Deci, vom spue că jumătate ditre pacieţi au vârstele cuprise ître 6 şi 55 ai şi jumătate au vârstele mai mari decât 55 ai. Această alegere este permisă î cazul acesta al vârstelor care se îregistrează cu valori îtregi. Mediaa este u idicator al tediţei cetrale, ca şi media, dar oferă mai puţiă iformaţie decât aceasta di urmă. La distribuţiile echilibrate, la care valorile di serie se dispu aproximativ simetric î stâga şi î dreapta mediei, media şi mediaa sut foarte apropiate, deci folosirea mediaei este superfluă. Dacă îsă mediaa este mult î stâga sau î dreapta mediei, distribuţia se zice că este excetrică. De exemplu, veitul media este mai iformativ decât veitul mediu deoarece distribuţia veiturilor îtr-o populaţie este foarte excetrică, fiid foarte mulţi idivzi cu salarii foarte mici şi foarte puţii idivizi cu salarii foarte mari. Cuartilele. Î mod asemăător cu căutarea mediaei, se poate pue problema căutării uor valori petru care să avem u sfert di valorile seriei mai mici şi respectiv, mai mari. Defiiţie: Cuartila Q este acea valoare ditr-o serie de valori, petru care 5% di valorile seriei sut sub Q şi 75%, peste. Petru tabelul de frecveţe., cuartila Q se caută î dreptul frecveţei relative cumulate crescător de 5%. Î tabel găsim procetul de 4,4% şi î dreptul lui vârsta de 47 de ai, precum şi frecveţa de 9,9 şi î dreptul ei vârsta de 48 de ai. Vom lua tot vârsta care corespude primului procet peste 5%, adică 48 de ai. Defiiţie: Cuartila Q este acea valoare ditr-o serie de valori, petru care 75% di valorile seriei sut sub Q şi 5%, peste. Petru tabelul., cuartila Q se ia di dreptul frecveţei relative cumulate crescător de 75%. Poate fi luată cu aproximaţie, 60 ai. 6

Care este utilitatea mediaei şi cuartilelor î aprecierea simetriei distribuţiei? Petru a subliia utilitatea idicatorilor Q şi Q, să cosiderăm şirul vârstelor: cel mai tâăr paciet, Q, Vârsta mediaă, Q, cel mai î vârstă paciet. Petru tabelul., obţiem şirul: 6 ai, 48 ai, 55 ai, 60 ai, 69 ai. Se observă că sfertul (5%) pacieţilor cei mai tieri este situat î zoa 6-48 de ai adică îtr-o plajă de de ai. Sfertul următor, este itre 48 şi 55 de ai, adică pe u iterval de doar 7 ai. Al treilea sfert este situat ître 55 şi 60 de ai, adică pe 5 ai, Cei mai î vărstă 5 % di pacieţi sut ître 60 şi 69 de ai, pe u iterval de 9 ai. Putem să spuem că vârstele pacieţilor se distribuie uşor asimetric, deoarece:. Sfertul cel mai tâăr se distribuie pe o plaja de de ai, iar cel mai î vârstă pe o plajă de doar 9 ai.. Sfertul al doilea se distribuie pe 7 ai, iar al treilea doar pe 5 ai. Î cadrul laboratorului, alte exemple vor arăta utilitatea acestor idicatori. Să mai observăm că mediaa este îtr-u fel cuartila de 50%, adică Q. Se spue că există trei cuartile: Q, mediaa, Q. Decile Ueori, loturi mai mari de multe sute de idivizi trebuie urmărite foarte atet î ceea ce priveşte modul cum sut distribuite valorile şi de aceea s-au itrodus idicatorii decile, care sut de o acurateţe mai buă decât cuartilele. Sut 9 decile, fiecare corespuzâd uui procet de 0%, 0%,... 90% di lot, asemăător cu cuartilele. Decila 5, sau de 50%, este de fapt mediaa. Cetilele (percetilele) sut mai rar folosite, î studii pe mii de cazuri, de obicei de u iteres mai larg, aţioal, iteraţioal, î studii epidemiologice, şi sut corespuzătoare procetelor de %, %,...99% di lot. Cetila de 5% este cuartila Q, cea de 50% este mediaa, iar cea de 75% este cuartila Q. Cetilele de 0%, 0%,.90%, sut cele ouă decile. Cetilele dau o imagie destul de exactă a distribuţiei valorilor ditr-o serie de valori foarte mare. Nu are rost să calculăm cetile petru serii cu câteva sute de valori, petru că erorile sut prea mari şi imagiea obţiută este deformată. Modul. Ditre frecveţele absolute apărute îtr-u tabel de frecveţe, ua este maximă. Clasa sau valoarea corespuzătoare acestei frecveţe maxime se umeşte mod. Modul este de obicei u idicator al tediţei cetrale. Î tabelul.. modul este clasa de la 55 la 60 de ai, cu frecveţa absolută 5. De obicei, frecveţele absolute au tediţa de a creşte către mod, după care urmează o descreştere cotiuă. Modul este deci o idicaţie relativă la maximul frecveţelor absolute. Sut îsă distribuţii la care se îregistrează creşteri şi descreşteri astfel îcât pot apare două moduri sau chiar mai multe. Aceste distribuţii sut mai rare şi au u caracter cu totul special. Ele se umesc distribuţii bimodale sau multimodale, după caz. Este u idicator care poartă î el puţiă iformaţie despre datele seriei. Modul este mult iflueţat de fluctuaţii aleatoare şi u este prea recomadat petru a aprecia tediţa cetrală a valorilor ditr-o serie. Mai mult, uele distribuţii pot fi multimodale, caz î care modul u mai idică prea mult despre tediţa cetrală. Excetricitate. (Egl. Skew, Skweess). Este u idicator al asimetriei şi este luat de diverşi autori cu diverse formule. Distribuţiile cu excetricitate pozitivă sut mai des îtâlite decât cele cu excetricitate egativă. Î mediciă, parametrii fiziologici sut î majoritate modificaţi î diverse afecţiui î sesul că au valori peste ormal. Astfel, tesiuea arterială o vom îtâli la valori ormale, crescute sau scăzute. Cum idivizi cu valori foarte mari, vom îtâli cu atât mai rar cu cât valoarea este mai mare, distribuţia va avea o coadă spre dreapta. La fel la mulţi alţi parametric cum ar fi bilirubia, trasamiazele, colesterolul, lipemia, etc. 7

Totuşi, vom îtâli şi parametri care se distribuie cu asimetrie stâga î patologii: hemoglobia, calcemia, sodiul ioic, etc. Hemoglobia, de exemplu, se poate distribui cu frecveţă mai mare la valori relativ ormale şi cu frecveţe di ce î ce mai mici pe măsură ce coborâm la valori mai mici. Chiar dacă avem o patologie de tip aemie, e aşteptăm ca frecveţa î jurul a 9-0 să fie mai mare decât frecveţa î jurul a 7-8, frecveţă care e aşteptăm să fie foarte mică. Excetricitatea uei serii de valori x, x,..x, se calculează cu formula: sk i ( x i σ Cu cât o distribuţie este mai simetrică cu atât sk tide la 0. Ca o regulă geerală, la distribuţiile cu excetricitate pozitivă, media este mai mare decât mediaa. Evidet, media este mai mică decât mediaa la distribuţiile cu excetricitate egativă. Există cazuri rare î care regula de mai sus u este valabilă. Sut multe alte formule petru alţi coeficieţi de excetricitate şi câd vorbim despre excetriciatte, trebuie să meţioăm la ce coeficiet de excetricitate e referim. Ueori se foloseşte u coeficiet de asimetrie care măsoară difereţa ditre medie şi mediaă, evetual raportată la abaterea stadard sau la itervale itercuartilice( Q - Q ). Idiferet ce formulă se foloseşte, o excetricitate egală cu zero, sau foarte apropiată de zero, este u idiciu al simetriei repartiţiei valorilor di serie. Di cotră, excetricităţi mult diferite de 0, peste 0,5-0,0, sau mai jos de -0,5-0,0 sut idicii ale asimetriei. Dăm mai jos, cu titlu facultativ, câteva formule petru coeficieţi de excetricitate. X Mo sk sk σ ( X Me) σ sk ( Q + Q Me) Q Q sk 4 ( Q Me) ( Me Q ) ( Q Me) + ( Me Q ) Boltirea (facultativ). Boltirea este u idicator care se bazează pe lugimea cozilor uei distribuţii. Cele cu cozi relativ mari se umesc leptocurtice iar cele cu cozi relativ mici se umesc platicurtice (vezi figura.4). Formula de calcul a boltirii este: k i ( x i 4 σ Aşa cum se va vedea î capitolul despre repartiţii, boltirea este u idicator util î aprecierea apropierii repartiţiei de repartiţia ormală. Distribuţiile di figura.4 au aceeaşi medie, aceeaşi dispersie, aproximativ aceeaşi excetricitate dar diferă mult ca boltire. 4 Figura.4. Distibuţie leptocurtică şi distribuţie platicurtică..5. Clasificarea idicatorilor Idicatorii statistici poartă î ei, fiecare, o aumită catitate de iformaţie, di seria de valori petru care au fost calculaţi. Aşa cum s-a văzut î paragrafele precedete, uii idicatori e dau iformaţii despre tediţa cetrală a valorilor di serie, alţii e dau iformaţii despre împrăştierea valorilor, alţii e dau idicaţii despre simetria valorilor di serie, boltirea e dă idicaţii despre lugimea cozilor distribuţiei, etc. Iformaţia oferită de idicatorii statistici este redudată, î sesul că, de exemplu, împrăştierea valorilor di serie este idicată şi de dispersie şi de abaterea stadard şi de amplitudiea absolută şi de coeficietul de variaţie, etc. Totuşi, fiecare di ei aduce o mică iformaţie specifică, deci, u e putem lipsi de uul sau altul 8

ditre idicatorii statistici. Ueori trebuie folosiţi uii ditre idicatori, fiid cei mai eficieţi, alteori trebuie folosiţi alţii. Petru a avea o ideie despre modul cum trebuie folosiţi idicatorii statistici, ei sut clasificaţi î câteva categorii mai importate, categorii care vor fi exemplificate mai jos, isistâd pe aceia care sut cei mai importaţi, restul fiid idicatori mai rar folosiţi, umai î cazuri speciale. Idicatori ai tediţei cetrale. Cei mai importaţi idicatori ai tediţei cetrale sut media, mediaa şi modul. Media idică tediţa cetrală atuci câd seria de valori este repartizată simetric î jurul ei şi câd valorile u au o dispersie exagerat de mare. Î cazul seriilor de valori distribuite foarte asimetric, tediţa cetrală u mai este idicată de către medie, ci de către mediaă. Modul, este u idicator al tediţei cetrale, la seriile uimodale, adică atuci câd î tabelul de frecveţe există u sigur maxim. Dacă avem o serie multimodală, modul îşi pierde calitatea de idicator al tediţei cetrale. Idicatori ai împrăştierii. Folosiţi mai des î practică, şi deci mai importaţi, sut dispersia, abaterea stadard şi coeficietul de variaţie. Abaterea stadard este idicatorul folosit cel mai des petru aprecierea împrăştierii, dar atuci câd mediile diferă mult, este mai util coeficietul de variaţie. Dispersia este folosită ca măsură a împrăştierii î testele statistice (vezi capitolul dedicat testelor statistice). Idicatori ai asimetriei. Mediaa şi cuartilele sut cel mai mult folosite petru aprecierea asimetriei valorilor ditr-o serie. De fapt, mediaa se foloseşte î combiaţie cu media petru aprecierea asimetriei. O mediaă mult diferită de medie idică asimetrie puterică, iar o mediaă foarte apropiată de medie idică o tediţă spre simetrie. Cuartilele, se folosesc î combiaţie cu mediaa şi idicatorii miim şi maxim, petru aprecierea simetriei. Idicatorii statistici fudametali. Sut idicatorii care poartă î ei cea mai mare catitate de iformaţie di iformaţia coţiută de seria de valori. La seriile de valori distribuite relativ simetric, idicatorii statistici fudametali sut media şi deviaţia stadard. Î capitolul dedicat repartiţiilor, se va vedea că, dacă o serie de valori are o repartiţie ormală şi are suficiet de multe valori, cei doi idicatori, poartă î ei aproape toată iformaţia. Astfel, dacă o serie de valori de acest tip are media X şi deviaţia stadard σ, scrierea îcetăţeită este X ± σ La seriile distribuite asimetric, deşi se cosideră ca idicatori fudametali tot media şi deviaţia stadard, sut mai utile mediaa şi cuartilele. Î acest caz, este îcetăţeită scrierea mediaei M şi a cuartilelor Q şi Q î forma M [Q ; Q ]. De exemplu, dacă o serie puteric asimetrică are mediaa,45, iar cuartilele sut Q,54 şi Q 6,, acest fapt se precizează astfel:,45 [,54; 6,].. Chestiui de exame:. Defiiţia si formula mediei. Formula deviaţiei stadard si a coeficietului de variaţie. Defiiţia mediaei si a cuartilelor Q, Q 4. Media uei serii de valori umerice este: A. Suma valorilor împărţită la umărul lor B. Mai mare decât valoarea miimă di serie C. Mai mică decât valoarea maximă di serie D. U idicator al tediţei cetrale a valorilor seriei 5. Media uei serii de valori umerice are următoarele proprietăţi: A. Este egală cu cea mai mică valoare di serie B. Dacă schimbăm o valoare di serie, mărid-o, media se schimbă, măridu-se C. Dacă schimbăm o valoare di serie, mărid-o, media se schimbă, micşorâdu-se D. Dacă ştergem o valoare di serie, media râmîe emodificată 9

6. Media uei serii de valori umerice este u idicator al: A. Tediţei cetrale a valorilor seriei B. Împrăştierii valorilor seriei C. Plaja de valori ître care sut cuprise valorile seriei D. Media u este idicator statistic 7. Dispersia uei serii de valori umerice este u idicator al: A. Tediţei cetrale a valorilor seriei B. Împrăştierii valorilor seriei C. Plaja de valori ître care sut cuprise valorile seriei D. Simetriei distribuţiei valorilor seriei î jurul mediei 8. Dispersia uei serii de valori umerice are pritre dezavataje: A. Se măsoară cu uitatea de măsură a valorilor seriei, ridicată la pătrat B. Are valori prea mari, comparativ cu abaterile idividuale de la medie C. Idică şi tediţa cetrală a valorilor seriei D. Nu se poate calcula cu exactitate 9. Abaterea stadard uei serii de valori umerice are pritre avataje: A. Se măsoară cu uitatea de măsură a valorilor seriei B. Are valori comparabile cu abaterile idividuale de la medie C. Idică şi tediţa cetrală a valorilor seriei D. Nu se poate calcula dacă dispersia este egativă 0. Dacă două serii de valori au aproximativ aceeaşi medie, atuci: A. Este mai împrăştiată cea cu dispersia mai mare B. Este mai împrăştiată cea cu abaterea stadard mai mică C. Sut la fel de împrăştiate D. Nu se pot compara împrăştierile cu ajutorul dispersiei î acest caz. Dacă două serii de valori au medii foarte diferite, atuci: A. Este mai împrăştiată cea cu dispersia mai mare B. Este mai împrăştiată cea cu abaterea stadard mai mare C. Nu se pot compara ici cu ajutorul dispersiei şi ici cu ajutorul abaterii stadard D. Au aceeaşi împrăştiere. Dacă media uei serii de valori este 0 şi dispersia 4, atuci coeficietul de variaţie este: A. 40% B. 0% C. 80% D. 0%. Dacă mediile a două serii de valori sut foarte diferite, iar abaterile stadard sut tot foarte diferite, atuci este mai împrăştiată : A. Cea cu coeficietul de variaţie mai mare B. Cea cu raportul ditre abaterea stadard şi medie mai mare C. Cea cu coeficietul de variaţie mai mic D. Împrăştierile celor două serii de valori u se pot compara 4. Mediaa uei serii de valori umerice este: A. Egală cu media B. U grafic C. U umăr D. U tabel de frecveţă 5. Mediaa uei serii de valori umerice este: A. Valoarea petru care jumătate di valorile seriei sut mai mari şi jumătate mai mici B. Valoarea situată la mijloc, ître miimul seriei şi maximul seriei 0

C. Valoarea cea mai frecvet îtâlită pritre valorile seriei D. U idicator al excetricităţii valorilor seriei 6. Dacă o serie de valori are î compoeţă de umere, atuci, petru aflarea mediaei, se ordoează valorile crescător şi se ia: A. Valoarea a -a di şirul ordoat B. Media ître valorile a 0 şi a -a C. Media ître valorile a şi a -a D. Valoarea a 0-a di şirul ordoat 7. Dacă o serie de valori are î compoeţă 4 de umere, atuci, petru aflarea mediaei, se ordoează valorile crescător şi se ia: A. Valoarea a -a di şirul ordoat B. Media ître valorile a -a şi a -a C. Media ître valorile a -a şi a -a D. Valoarea a -a di şirul ordoat 8. Cuartila îtâi a uei serii de valori este: A. Valoarea di seria ordoată situată la 5% di umărul de valori al seriei B. Valoarea di seria ordoată situată la 75% di umărul de valori al seriei C. Valoarea umerică petru care u sfert di valorile seriei ordoate sut mai mici D. Valoarea umerică petru care u sfert di valorile seriei sut mai mici 9. Cuartila a treia a uei serii de valori este: A. Valoarea di seria ordoată situată la 5% di umărul de valori al seriei B. Valoarea di seria ordoată situată la 75% di umărul de valori al seriei C. Valoarea umerică petru care u sfert di valorile seriei ordoate sut mai mici D. Valoarea umerică petru care trei sferturi di valorile seriei ordoate sut mai mari 0. Referitor la idicatorii decile, este adevărat: A. Avem exact ouă decile B. Avem exact 99 de decile C. Decila 50 este mediaa D. Decila a treia este mediaa. Idicatorii statistici fudametali sut: A. Dispersia şi media B. Media şi abaterea stadard C. Abaterea stadard şi mediaa D. Mediaa şi cuartilele. Idicatorii de dispersie (sau de împrăştiere) sut: A. Amplitudiea, media, dispersia şi mediaa B. Abaterea stadard, media, dispersia şi mediaa C. Amplitudiea, media, dispersia şi abaterea stadard D. Abaterea stadard, dispersia şi coeficietul de variaţie. Care di următorii idicatori statistici ajută la aprecierea asimetriei: A. Mediaa, media şi excetricitatea B. Mediaa, cuartilele şi excetricitatea C. Mediaa, cuartilele şi media D. Mediaa, dispersia şi excetricitatea 4. Idicatorii statistici petru tediţa cetrală a valorilor uei serii de valori sut: A. Media, dispersia şi mediaa B. Media, abaterea stadard şi modul C. Media, dispersia şi excetricitatea D. Media, mediaa şi modul