TEMA 3 - METODE NUMERICE PENTRU DESCRIEREA DATELOR STATISTICE Obectve Cuoaşterea metodelor umerce de descrere a datelor statstce Aalza rcalelor metode umerce etru descrerea datelor cattatve egruate Aalza rcalelor metode umerce etru descrerea datelor cattatve gruate Curs 3. Metode umerce etru descrerea datelor cattatve egruate 3. 3.. Măsurle tedţe cetrale 3. 3.. Măsurle varaţe 3.4 3..3 Măsurle ozţe relatve 3.7 3. Metode umerce etru descrerea datelor cattatve gruate 3.9 3.. Măsurle tedţe cetrale 3.9 3.. Măsurle varaţe 3. 3..3 Măsurle ozţe relatve 3. 3.3 Cocete chee 3.3
3. MODULUL - CONCEPTE DE BAZĂ ÎN STATISTICA ECONOMICĂ 3. METODE NUMERICE PENTRU DESCRIEREA DATELOR STATISTICE 3. Metode umerce etru descrerea datelor cattatve egruate Măsurle umerce descrtve sut valor umerce calculate dtr-o mulţme de date, care e ermt să e facem o mage metală asura dstrbuţe frecveţe relatve. Ateror, metodele grafce etru descrerea datelor e-au furzat o rerezetare vzuală asura dstrbuţe frecveţe relatve. Aceste măsur, e care le vom aalza î cotuare, se îmart î următoarele categor: cele care localzează cetrul dstrbuţe frecveţe relatve, deumte măsur ale tedţe cetrale; cele care determă îmrăşterea acestea, deumte măsur ale varaţe. cele care determă ozţle ude se stuează aumte valor artculare î raort cu îtreaga mulţme de date, deumte măsur ale ozţe relatve. 3.. Măsurle tedţe cetrale Cele ma frecvet utlzate măsur ale tedţe cetrale sut: meda artmetcă medaa moda. Î defţle ş relaţle ce urmează, vom ota cele valor ale eşatoulu de date egruate cu:,, K,. Valorle ordoate ale eşatoulu le vom ota cu: () ( ) K ( ) sau (), ( ), K, ( ). Defţa 3. Meda artmetcă a uu eşato cu u efectv de valor r defţe:,,, K este = =. (3.) E: average, arthmetc mea Defţa 3. Meda artmetcă a ue oulaţ statstce cu u efectv de N valor,, K, N este r defţe: μ = = N. (3.)
TEMA 3 - METODE NUMERICE PENTRU DESCRIEREA DATELOR STATISTICE 3.3 Meda artmetcă a ue oulaţ statstce se otează r smbolul μ. Meda artmetcă este cea ma uzuală măsură a tedţe cetrale, utlzată etru localzarea cetrulu ue dstrbuţ statstce Meda artmetcă este flueţată de rezeta valorlor etreme (deumte ş valor aberate d ucte de vedere statstc) Defţa 3.3 Medaa uu eşato ordoat crescător cu u efectv de valor K este r defţe: () ( ) ( ) E: meda med = +, mar + ( ) ( ) +. (3.3), ar Duă cum se observă d relaţa dată, medaa uu eşato ordoat cu u umăr mar de valor este dată de valoarea d mloc a eşatoulu. Medaa uu eşato ordoat cu u umăr ar de valor este dată de meda celor două valor d mloc ale eşatoulu. Medaa este valoarea care îmarte eşatoul de valor î două ărţ egale Defţa 3.4 Moda (sau domata) uu eşato ordoat crescător cu u efectv de valor () ( ) K ( ) este r defţe valoarea sau valorle cu cea ma mare frecveţă de aarţe, adcă: mod = { + + = K = + l }, l = ma, l 0. (3.4) E: mode ( ) ( ) ( ) Moda (sau módul sau domata) este dată de valoarea eşatoulu care se reetă de cel ma mare umăr de or. Dacă u estă o asemeea valoare, îseamă că eşatoul u are modă (adcă o valoare care aare cel ma frecvet), ar dacă avem două ma multe mode, atuc suem că dstrbuţa d care rove eşatoul este bmodală sau multmodală. Dacă dstrbuţa frecveţe relatve este smetrcă, atuc avem următoarea relaţe: Meda = Medaa = Moda Egaltatea măsurlor tedţe cetrale etru dstrbuţ smetrce este rerezetată î Fgura 3.. Meda = Medaa = Moda Fgura 3. Măsurle tedţe cetrale etru dstrbuţ smetrce
3.4 MODULUL - CONCEPTE DE BAZĂ ÎN STATISTICA ECONOMICĂ Dacă dstrbuţa frecveţe relatve este asmetrcă la stâga, atuc relaţa ître măsurle tedţe cetrale este (Fgura 3.): Meda < Medaa < Moda Meda < Medaa < Moda Fgura 3. Măsurle tedţe cetrale etru dstrbuţ asmetrce la stâga Dacă dstrbuţa frecveţe relatve este asmetrcă la dreata, atuc relaţa ître măsurle tedţe cetrale este (Fgura 3.3): Meda > Medaa > Moda Meda > Medaa > Moda Fgura 3.3 Măsurle tedţe cetrale etru dstrbuţ asmetrce la dreata 3.. Măsurle varaţe Cele ma frecvet utlzate măsur ale varaţe sut: amltudea dsersa abaterea stadard coefcetul de varaţe
TEMA 3 - METODE NUMERICE PENTRU DESCRIEREA DATELOR STATISTICE 3.5 Defţa 3.5 Amltudea uu eşato cu u efectv de valor,, K, este r defţe dfereţa dtre cea ma mare ş cea ma mcă valoare a eşatoulu, adcă: r = ma m, (3.5) ude = { } ma = ma. m m ş { } E: rage Avataul amltud este rerezetat de smltatea calcululu acestea. Smltatea este îsă ş u dezavata, deoarece amltudea se determă uma d două valor ale eşatoulu (mamă ş mmă), fără a ţe seama de celelalte valor ale eşatoulu. Amltudea este o măsură relatv sesblă la varaţa datelor uu eşato, ea fd utlzată î ractcă etru eşatoae cu efectve reduse Defţa 3.6 Dsersa uu eşato cu u efectv de valor este r defţe: ( ) = s = ude este meda artmetcă a eşatoulu. E: varace Petru o oulaţe statstcă defţa dserse este:,,, K, (3.6) Defţa 3.7 Dsersa ue oulaţ cu u efectv de N valor este r defţe: = ( μ),,, K = σ, (3.7) N ude μ este meda artmetcă a eşatoulu. Dsersa sau varaţa ue oulaţ statstce se otează cu σ ( sgma ătrat ). Dsersa este ua d cele ma mortate măsur umerce ale varaţe datelor uu eşato. Dsersa e oferă o mage asura varaţe valorlor. Ţâd cot că are loc relaţa: = ( ) = 0, î eresa dserse se cosderă ătratul acestor valor. Petru calculul dserse se oate utlza ş formula smlfcată: s = = =. (3.8) N
3.6 MODULUL - CONCEPTE DE BAZĂ ÎN STATISTICA ECONOMICĂ Această relaţe se oate alca orgazâd datele ca î tabelul de dserse următor, î care se îsumează e coloaă valorle eşatoulu ş ătratul acestora: Defţa 3.8 Abaterea stadard a uu eşato cu u efectv de valor este r defţe rădăca ătrată a dserse, resectv: s = ude este meda artmetcă a eşatoulu. s = = ( ),,, K, (3.9) E: stadard devato. Abaterea stadard se ma umeşte ş abaterea mede ătratcă. Defţa 3.9 Abaterea stadard a ue oulaţ cu u efectv de N valor este r defţe rădăca ătrată a dserse, resectv: ( μ),,, K = σ = σ =, (3.0) N ude μ este meda artmetcă a eşatoulu. Defţa 3.0 Coefcetul de varaţe al uu eşato cu u efectv de valor,, K, este r defţe raortul dtre abaterea stadard ş meda eşatoulu, resectv: s cv =, (3.) ude este meda artmetcă, ar s este abaterea stadard a eşatoulu. E: coeffcet of varato Defţa 3. Coefcetul de varaţe al ue oulaţ cu u efectv de N valor,, K, N este r defţe raortul dtre abaterea stadard ş meda eşatoulu, resectv: σ CV =, (3.) μ ude μ este meda artmetcă, ar σ este abaterea stadard a eşatoulu. Coefcetul de varaţe oate f ermat ş rocetual. N
TEMA 3 - METODE NUMERICE PENTRU DESCRIEREA DATELOR STATISTICE 3.7 Legătura dtre meda artmetcă măsură a tedţe cetrale ş abaterea stadard măsură a varaţe oate f terretată cu autorul a două roretăţ, ş aume: Regula lu Cebîşev; Regula emrcă. Regula lu Cebîşev: Petru, cel uţ valor ale uu eşato cu u efectv de valor,, K, aarţ tervalulu ( s, + s), ude este meda artmetcă, ar s este abaterea stadard a eşatoulu. Regula lu Cebîşev furzează o legătură de atură algebrcă ître meda artmetcă ş abaterea stadard ale uu eşato de date. Petru dferte valor ale lu, rezultă lmta feroară a roorţe valorlor care aarţ tervalulu ( s, + s), duă rezultă ş d tabelul următor: Regula emrcă u este roru-zs o roretate matematcă, ea fd rezultatul eereţe ractce a statstcelor, ca urmare a alcăr dstrbuţe ormale. Regula emrcă: Dacă mulţmea de date are dstrbuţa frecveţe relatve sub formă de "cloot", atuc următoarele regul emrce ot f utlzate etru a descre mulţmea de date: [] Aromatv 68% d valor vor aarţe tervalulu ( s, + s), ude este meda artmetcă, ar s abaterea stadard; [] Aromatv 95% d valor vor aarţe tervalulu ( s, + s) ; 3 s, + 3s. [3] Aroae toate valorle (99,7% d valor) vor aarţe tervalulu ( ) 3..3 Măsurle ozţe relatve Măsurle ozţe relatve e furzează formaţ asura loculu ude se stuează aumte valor artculare î raort cu îtreaga mulţme de date. Petru a evalua măsurle ozţe relatve se utlzează: cuatle; rerezetarea bo lot. Cuatlele sut măsur umerce care îmart eşatoul de valor ordoat î ărţ egale, astfel: cuartlele î 4 ărţ (sfertur); declele î 0 ărţ; cetlele î 00 ărţ.
3.8 MODULUL - CONCEPTE DE BAZĂ ÎN STATISTICA ECONOMICĂ Cuartlele sut măsur umerce care îmart eşatoul de valor ordoat î 4 ărţ egale. Prma cuartlă, otată Q, este valoarea etru care 5% d observaţ sut ma mc, ar 75% d observaţ sut ma mar decât Q. A doua cuartlă, otată Q, este medaa, resectv valoarea etru care 50% d observaţ sut ma mc, ar 50% d d observaţ sut ma mar decât Q. A trea cuartlă, otată Q 3, este valoarea etru care 75% d observaţ sut ma mc, ar 5% d observaţ sut ma mar decât Q 3. Petru a calcula cuartlele dtr-u eşato ordoat cu valor, avem relaţle de ozţoare: Q =. + 4 Q = = med. + ( ) 3 3 + 4 (3.3) (3.4) Q =. (3.5) Petru determarea valorlor cuartlce se alcă următoarele regul: dacă dcele rezultat este îtreg, atuc se alege valoarea coresuzătoare acelu dce; dacă dcele rezultat este la umătatea a do dc cosecutv, atuc se alege meda valorlor coresuzătoare dclor cosecutv; dacă dcele rezultat u este î cua d stuaţle de ma sus, atuc se alege, r terolare, ître dc ce ma aroaţ. Î geeral, etru localzarea cetle de ord se foloseşte relaţa: C =, (3.6) 00 ( + ) ar valorle coresuzătoare se obţ r terolare. O măsură etru ozţa relatvă dar ş etru varaţa datelor o costtue amltudea tercuartlcă (e: terquartle rage), care este dată de relaţa: IQ r = Q 3 Q. (3.7) Rerezetarea bo lot este o metodă umercă ş grafcă etru ozţa relatvă a valorlor uu eşato Metoda costă î calcularea ş rerezetarea grafcă a 5 valor:. Lmta feroară: LQI = Q,5IQr. Q 3. Q 4. Q 3 5. Lmta sueroară: LQS = Q3 +,5IQr Rerezetarea grafcă etru bo lot este redată î Fgura 3.4. Fgura 3.4 Rerezetarea bo lot
TEMA 3 - METODE NUMERICE PENTRU DESCRIEREA DATELOR STATISTICE 3.9 Rerezetarea bo lot oate să uă î evdeţă rezeţa valorlor etreme sau a valorlor aberate (e: outlers), resectv acele valor care se îdeărtează sesbl de restul valorlor eşatoulu ş care, d uct de vedere statstc, u caracterzează oulaţa statstcă resectvă. De asemeea, rerezetarea bo lot oate să uă î evdeţă smetra sau asmetra dstrbuţe frecveţe relatve. 3. Metode umerce etru descrerea datelor cattatve gruate Duă cum am văzut ateror, lecâd de la u eşato de date egruate ş costrud hstograma frecveţe relatve, obţem o mulţme de date gruate, costâd d tervalele de clasă, frecveţele absolute ş frecveţele relatve. Petru aceste date gruate vom studa măsurle tedţe cetrale, măsurle varaţe ş măsurle ozţe. Î defţle ş relaţle ce urmează, vom cosdera:,, K, eşatoul de date egruate, cu u efectv de valor c - umărul de clase; lc - lugmea tervalulu de clasă; lc - lmtele tervalelor de clasă, etru =,,,c; fa - frecveţa absolută; fr - frecveţa relatvă; frcum - frecveţa relatvă cumulată. Calculăm, de asemeea, mloacele tervalelor de clasă - m, cu formula: lc + lc + m =, =,,..., c. (3.8) 3.. Măsurle tedţe cetrale Vom determa - etru o mulţme de date gruate - măsurle tedţe cetrale, resectv: meda artmetcă medaa moda Defţa 3. Meda artmetcă a ue mulţm de date gruate este, r defţe: c ( m fa ) = =, (3.9) ude m sut mloacele tervalelor de clasă, fa sut frecveţele absolute, c este umărul de clase, ar este efectvul eşatoulu d care s-au obţut datele gruate.
3.0 MODULUL - CONCEPTE DE BAZĂ ÎN STATISTICA ECONOMICĂ Defţa 3.3 Medaa a ue mulţm de date gruate este, r defţe: fa lc lc = = med +, (3.0) fa ude = ( c +), lc este lugmea tervalulu de clasă, fa sut frecveţele absolute, c este umărul de clase, ar este efectvul eşatoulu d care s-au obţut datele gruate. Medaa etru date gruate oate f calculată ş cu autorul tabelulu frecveţe relatve cumulate, resectv cu autorul ogve. Ţâd cot că medaa este de fat cetla 0,50, etru determarea medae datelor gruate utlzâd o metodă de terolare, alcâd următorul algortm: Algortmul etru medaă Pasul : Determăm clasele ş +, clase ître care aare valoarea de 50% a frecveţe relatve cumulate, astfel îcât: frcum 0,50 frcum +. Pasul : Determăm medaa r terolare, cu relaţa: med = lc + + ( lc lc ) + 0,50 frcum. frcum frcum + (3.) Medaa se oate aroma grafc cu autorul ogve, coborâd o eredculară e abscsă, d uctul î care valoarea de 0,50 tersectează grafcul ogve, aşa cum se oate vedea î Fgura 3.5.,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,0 0,0 0,00 0,0 4,0 8,0,0 6,0 0,0 Fgura 3.5 Determarea grafcă a medae
TEMA 3 - METODE NUMERICE PENTRU DESCRIEREA DATELOR STATISTICE 3. Defţa 3.4 Moda a ue mulţm de date gruate este, r defţe: fr fr mod = lc + ( lc + lc ), (3.) fr ( fr + fr + ) ude este clasa cu frecveţa relatvă mamă, lc ş lc + sut lmtele clase, ar fr -,fr ş fr + sut, resectv, frecveţele relatve ale claselor -, ş +. Moda se oate aroma grafc cu autorul hstograme frecveţe relatve, coborâd o eredculară e abscsă, d uctul î care se tersectează dretele trasate î Fgura 3.6. 0,35 0,30 0,5 0,0 0,5 0,0 0,05 0,00 0 4,0 8,0,0 6,0 0,0 Fgura 3.6 Determarea grafcă a mode 3.. Măsurle varaţe Vom determa - etru o mulţme de date gruate - măsurle varaţe, resectv: amltudea dsersa abaterea stadard Defţa 3.5 Amltudea ue mulţm de date gruate este r defţe dfereţa dtre mlocul ultmulu ş mlocul rmulu terval de clasă, adcă: r = mc m, (3.3) ude c este umărul de clase, ar m ş m c sut resectv mloacele tervalelor claselor ş c. Defţa 3.6 Dsersa ue mulţm de date gruate este r defţe: c [ ( m ) fa ] = s =, (3.4) ude c este umărul de clase, m sut mloacele tervalelor de clasă, este meda artmetcă, ar este efectvul eşatoulu d care s-au obţut datele gruate.
3. MODULUL - CONCEPTE DE BAZĂ ÎN STATISTICA ECONOMICĂ Defţa 3.7 Abaterea stadard a ue mulţm de date gruate este r defţe rădăca ătrată a dserse, resectv: c [ ( m ) fa ] = s = s =, (3.4) ude c este umărul de clase, m sut mloacele tervalelor de clasă, este meda artmetcă, ar este efectvul eşatoulu d care s-au obţut datele gruate. Atuc câd eşatoul de date e care îl aalzăm are u efectv deosebt de mare sau atuc câd dsuem uma de date gruate, măsurle tedţe cetrale ş măsurle varaţe calculate etru date gruate e oferă rezultate sufcet de recse etru fereţa statstcă. 3..3 Măsurle ozţe relatve Vom aalza modul de calcul al cuatlelor etru datele gruate, rezultate d costrucţa hstograme frecveţe relatve. Î acest sco vom folos următorul algortm geeral: Algortmul etru determarea cetle C de ord Pasul : Determăm clasele ş +, clase ître care aare valoarea de C /00 a frecveţe relatve cumulate, astfel îcât: frcum C 00 frcum +. Pasul : Determăm medaa r terolare, cu relaţa: med = lc + + ( lc lc ) + C frcum 00 + frcum frcum. (3.5) Să remarcăm fatul că etru C = 5 obţem cuartla Q, etru C = 50 obţem medaa ş cuartla Q, ar etru C = 75 obţem cuartla Q. De asemeea, etru valorle C = 0,0,...,90 obţem resectv declele D, D,..., D 9. Cuatlele se ot aroma ş grafc utlzâd ogva. D Fgura 3.7, se observă, de eemlu, că declele se obţ d tersecţa dstrbuţe frecveţe relatve cumulate cu caroaul î care am rerezetat ogva. Astfel decla D 60 este,0.,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,0 0,0 0,00 0,0 4,0 8,0,0 6,0 0,0 Fgura 3.7 Determarea grafcă a declelor
3.3 Cocete chee TEMA 3 - METODE NUMERICE PENTRU DESCRIEREA DATELOR STATISTICE 3.3 Măsură umercă Măsurle tedţe cetrale Măsurle varaţe Măsurle ozţe relatve Meda artmetcă Medaa Moda Amltudea Dsersa Abaterea stadard Coefcet de varaţe Regula lu Cebîşev Regula emrcă Cuatle Cuartle Decle Cetle Amltude tercuartlcă Bo lot Mlocul tervalulu de clasă Date egruate Date gruate
3.4 MODULUL - CONCEPTE DE BAZĂ ÎN STATISTICA ECONOMICĂ