STATISTICĂ DESCRIPTIVĂ

Σχετικά έγγραφα
Masurarea variabilitatii Indicatorii variaţiei(împrăştierii) lectia 5 16 martie 2 011

POPULAŢIE NDIVID DATE ORDINALE EŞANTION DATE NOMINALE

Statistica descriptivă (continuare) Şef de Lucrări Dr. Mădălina Văleanu

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor X) functia f 1

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor

NOTIUNI DE BAZA IN STATISTICA

8 Intervale de încredere

Curs 4 Serii de numere reale

Curs 10 Funcţii reale de mai multe variabile reale. Limite şi continuitate.

Curs 1 Şiruri de numere reale

(a) se numeşte derivata parţială a funcţiei f în raport cu variabila x i în punctul a.

Statisticǎ - curs 3. 1 Seria de distribuţie a statisticilor de eşantioane 2. 2 Teorema limitǎ centralǎ 5. 3 O aplicaţie a teoremei limitǎ centralǎ 7

Indicatori sintetici ai distribuțiilor statistice

III. Serii absolut convergente. Serii semiconvergente. ii) semiconvergentă dacă este convergentă iar seria modulelor divergentă.

Scoruri standard Curba normală (Gauss) M. Popa

SERII NUMERICE. Definiţia 3.1. Fie (a n ) n n0 (n 0 IN) un şir de numere reale şi (s n ) n n0

Metode iterative pentru probleme neliniare - contractii

Statistica descriptivă

Planul determinat de normală şi un punct Ecuaţia generală Plane paralele Unghi diedru Planul determinat de 3 puncte necoliniare

a n (ζ z 0 ) n. n=1 se numeste partea principala iar seria a n (z z 0 ) n se numeste partea

ESTIMAREA PARAMETRILOR STATISTICI. Călinici Tudor

Variabile statistice. (clasificare, indicatori)

R R, f ( x) = x 7x+ 6. Determinați distanța dintre punctele de. B=, unde x și y sunt numere reale.

Integrala nedefinită (primitive)

Statisticǎ - curs 2. 1 Parametrii şi statistici ai tendinţei centrale 2. 2 Parametrii şi statistici ai dispersiei 5

5. FUNCŢII IMPLICITE. EXTREME CONDIŢIONATE.

3.5. Indicatori de împrăştiere

Subiecte Clasa a VII-a

Subiecte Clasa a VIII-a

Fig Impedanţa condensatoarelor electrolitice SMD cu Al cu electrolit semiuscat în funcţie de frecvenţă [36].

Aplicaţii ale principiului I al termodinamicii la gazul ideal

Esalonul Redus pe Linii (ERL). Subspatii.

5.5. REZOLVAREA CIRCUITELOR CU TRANZISTOARE BIPOLARE

Recapitulare - Tipuri de date

Statistică descriptivă Distribuția normală Estimare. Călinici Tudor 2015

RĂSPUNS Modulul de rezistenţă este o caracteristică geometrică a secţiunii transversale, scrisă faţă de una dintre axele de inerţie principale:,


7 Distribuţia normală

Curs 14 Funcţii implicite. Facultatea de Hidrotehnică Universitatea Tehnică "Gh. Asachi"

5.4. MULTIPLEXOARE A 0 A 1 A 2

Metode de interpolare bazate pe diferenţe divizate

Definiţia generală Cazul 1. Elipsa şi hiperbola Cercul Cazul 2. Parabola Reprezentari parametrice ale conicelor Tangente la conice

MARCAREA REZISTOARELOR

Aparate de măsurat. Măsurări electronice Rezumatul cursului 2. MEE - prof. dr. ing. Ioan D. Oltean 1

Seminariile Capitolul X. Integrale Curbilinii: Serii Laurent şi Teorema Reziduurilor

9 Testarea ipotezelor statistice

COLEGIUL NATIONAL CONSTANTIN CARABELLA TARGOVISTE. CONCURSUL JUDETEAN DE MATEMATICA CEZAR IVANESCU Editia a VI-a 26 februarie 2005.

Mihai Orzan joi, 19:30, sala 1406

DISTANŢA DINTRE DOUĂ DREPTE NECOPLANARE

ECO-STATISTICA-NOTITZZE DE LABORATOR

LUCRAREA DE LABORATOR Nr. 9 DETERMINAREA EXPERIMENTALÃ A DISTIBUŢIEI DIMENSIUNILOR EFECTIVE ÎN INTERIORUL CÂMPULUI DE ÎMPRÃŞTIERE

Sisteme diferenţiale liniare de ordinul 1

Elemente de bază în evaluarea incertitudinii de măsurare. Sonia Gaiţă Institutul Naţional de Metrologie Laboratorul Termometrie

1. Distribuţiile teoretice 2. Intervalul de încredere pentru caracteristicile cantitative (medii) Histograma Nr. valori Nr. de clase de valori

5 Statistica matematică

V.7. Condiţii necesare de optimalitate cazul funcţiilor diferenţiabile

Analiza în curent continuu a schemelor electronice Eugenie Posdărăscu - DCE SEM 1 electronica.geniu.ro

Erori si incertitudini de măsurare. Modele matematice Instrument: proiectare, fabricaţie, Interacţiune măsurand instrument:

a. 11 % b. 12 % c. 13 % d. 14 %

6 n=1. cos 2n. 6 n=1. n=1. este CONV (fiind seria armonică pentru α = 6 > 1), rezultă

CONCURSUL DE MATEMATICĂ APLICATĂ ADOLF HAIMOVICI, 2017 ETAPA LOCALĂ, HUNEDOARA Clasa a IX-a profil științe ale naturii, tehnologic, servicii

TEMA 9: FUNCȚII DE MAI MULTE VARIABILE. Obiective:

2.1 Sfera. (EGS) ecuaţie care poartă denumirea de ecuaţia generală asferei. (EGS) reprezintă osferă cu centrul în punctul. 2 + p 2

GEOMETRIE PLANĂ TEOREME IMPORTANTE ARII. bh lh 2. abc. abc. formula înălţimii

T R A I A N ( ) Trigonometrie. \ kπ; k. este periodică (perioada principală T * =π ), impară, nemărginită.

riptografie şi Securitate

III. Reprezentarea informaţiei în sistemele de calcul

Seminar 5 Analiza stabilității sistemelor liniare

Ecuaţia generală Probleme de tangenţă Sfera prin 4 puncte necoplanare. Elipsoidul Hiperboloizi Paraboloizi Conul Cilindrul. 1 Sfera.

4. Măsurarea tensiunilor şi a curenţilor electrici. Voltmetre electronice analogice

1.7. AMPLIFICATOARE DE PUTERE ÎN CLASA A ŞI AB

Proiectarea filtrelor prin metoda pierderilor de inserţie

Laborator biofizică. Noţiuni introductive

V O. = v I v stabilizator

Functii Breviar teoretic 8 ianuarie ianuarie 2011

Asupra unei inegalităţi date la barajul OBMJ 2006

Profesor Blaga Mirela-Gabriela DREAPTA

Zgomotul se poate suprapune informaţiei utile în două moduri: g(x, y) = f(x, y) n(x, y) (6.2)

7. RETELE ELECTRICE TRIFAZATE 7.1. RETELE ELECTRICE TRIFAZATE IN REGIM PERMANENT SINUSOIDAL


Laborator 11. Mulţimi Julia. Temă

Să se arate că n este număr par. Dan Nedeianu

DistributiiContinue de Probabilitate Distributia Normala

Statisticǎ - notiţe de curs

Stabilizator cu diodă Zener

Componente şi Circuite Electronice Pasive. Laborator 4. Măsurarea parametrilor mărimilor electrice

Conice. Lect. dr. Constantin-Cosmin Todea. U.T. Cluj-Napoca

SEMINARUL 3. Cap. II Serii de numere reale. asociat seriei. (3n 5)(3n 2) + 1. (3n 2)(3n+1) (3n 2) (3n + 1) = a

PRELEGEREA XII STATISTICĂ MATEMATICĂ

Curs 2 Şiruri de numere reale

5.1. Noţiuni introductive

Coeficientul de corelaţie Pearson(r) M. Popa

Capitolul 4. Integrale improprii Integrale cu limite de integrare infinite

SEMINAR 14. Funcţii de mai multe variabile (continuare) ( = 1 z(x,y) x = 0. x = f. x + f. y = f. = x. = 1 y. y = x ( y = = 0

Subiecte Clasa a V-a

a. 0,1; 0,1; 0,1; b. 1, ; 5, ; 8, ; c. 4,87; 6,15; 8,04; d. 7; 7; 7; e. 9,74; 12,30;1 6,08.

REDRESOARE MONOFAZATE CU FILTRU CAPACITIV

Analiza bivariata a datelor

1. PROPRIETĂȚILE FLUIDELOR

IV. CUADRIPOLI SI FILTRE ELECTRICE CAP. 13. CUADRIPOLI ELECTRICI

Transcript:

STATISTICĂ DESCRIPTIVĂ

» Reprezentarea şi sumarizarea datelor» Parametrii statistici descriptivi Centralitate Dispersie Asimetrie Localizare Cuprins

Măsuri de centralitate Măsuri de împrăştiere Media Amplitudine Mediana Variația Modulul Deviația standard Coeficientul de variație Eroarea standard Asimetria Boltirea Măsuri de simetriei Parametrii în statistica Măsuri de localizare Cvartiel (decile; percentile) descriptivă Parametrii statistici descriptivi 3

Frecvenţa absolută 9 8 7 6 5 4 3 0 3.5 4.5 5.5 6.5 7.5 8.5 9.5 0.5.5 nr ore dormite pe noapte femei Măsuri de centralitate 4

Frecvenţa absolută 9 8 7 6 5 4 3 0 bărbaţi 3.5 4.5 5.5 6.5 7.5 8.5 9.5 0.5.5 nr ore dormite pe noapte Măsuri de centralitate 5

40 35 30 Frecvenţa absolută 5 0 5 0 5 0 0 0 40 60 80 00 0 40 60 80 00 0 40 Venit (00 RON) Măsuri de centralitate 6

» Denumit şi valoarea modală: este o valoare care are cea mai mare frecvență din serie» Nu există formulă matematică de calcul» Corespunde punctului cel mai înalt pe distribuția grafică de frecvențe. Care este valoare modală pentru cele trei reprezentări grafice anterioare?» Nu este influențat de valorile extreme 7 6 frecvenţa absolută 5 4 3 Măsuri de centralitate: Modulul 0 3 4 5 6 7 8 9 0 Nota 7

» Serie unimodală: Vârsta pacienților internați în Clinica Pediatrie I cu sindrom diareic în perioada. 8..008» Serie bimodală: 3 3» Serie multimodală: 3 3 3 4 Măsuri de centralitate: Modulul 8

» Distribuție bi modală 7 6 frecvenţa absolută 5 4 3 0 3 4 5 6 7 8 9 0 Nota Măsuri de centralitate: Modulul 9

» Valoarea care împarte distribuția în jumătate» Paşi în calculul medianei: Se ordonează datele seriei în ordine crescătoare. Se localizează poziția medianei în acest şir şi se determină valoarea ei. Valoarea este egala cu valoarea percentilei50» Dacă volumul n al seriei este impar, atunci mediana este dată prin formula: Me = X n +» Dacă n este par, atunci mediana este dată prin formula: Me = X + n n + X Măsuri de centralitate: Mediana 0

. Mediana nu este afectată de valorile extreme ale seriei de date.. Valoarea obținută pentru mediană poate fi nereprezentativă pentru distribuția datelor seriei dacă valorile individuale nu se grupează înspre valoarea centrală (mediana). 3. Mediana este o măsură de tendință centrală care minimizează suma valorilor absolute ale abaterilor de la o valoare X de pe dreapta numerelor reale» 3, 4, 9, 5, 4, 6, 7, 7, 8, 5, 9, 7, 9, 5, 7, 6, 9, 0, 6, 7, 7, 8, 9, 8, 9, 6 Ordonarea crescător» n = 6 (numărpar)» Me = (X 3 +X 4 )/ = (7+7)/ = 7» Excel: = MEDIAN(număr,număr,...,număr6) Măsuri de centralitate: Mediana

» Suma tuturor datelor seriei împărțită la numărul de date din serie» Modificarea unei singure date din serie nu afectează valoare modală sau mediana dar va afecta media aritmetică» Populație (media populației în problemele de statistică e cunoscută):» Eşantion (se calculează): X μ= = n i= n i= n n X X i i Măsuri de centralitate: Media aritmetică

» Media aritmetică:» = (3+4+...+9+0)/6» = 6,9» Excel:» =AVERAGE (număr,..., număr6) frecvenţa absolută 7 6 5 4 3 0 3 4 5 6 7 8 9 0 Nota Măsuri de centralitate: Media aritmetică 3

» Este parametrul cel mai preferat ca măsură de centralitate atât ca şi parametru de descriere a datelor cât şi ca estimator» Dar, pentru ca media să aibă semnificație variabila de interes trebuie să fie de tip 6 5 4 3 interval. 0 protestant greco catolic ortodox baptist Măsuri de centralitate: Media aritmetică 4

Proprietăți:. Orice valoare a seriei este luată în considerare în calculul mediei.. Valorile extreme pot influența media aritmetică distrugându i reprezentativitatea. 3. Media aritmetică se situează printre valorile seriei de date. 4. Suma diferențelor dintre valorile individuale din serie şi medie este zero: (X X) = 0 n i= i 5. Schimbarea originii scalei de măsură a variabilei X din care provine seria de date are influență asupra mediei. Fie X =X+C (unde C este o constantă) 6. Transformarea scalei de măsură a variabilei X, de asemenea, influențează media aritmetică. Dacă se ia X = h X, h fiind o constantă reală. 7. Suma pătratelor abaterilor valorilor seriei de la media aritmetică este minimul sumei pătratelor abaterilor valorilor seriei de la o valoare X n n (Xi X) = min (Xi X) i= XR i= Măsuri de centralitate: Media aritmetică 5

» fiecare valoare X i este înmulțită cu o pondere W i nenegativă, care indică importanța valorii respective în raport cu celelalte valori: m X = n i= n i= WX» Dacă ponderile W i sunt alese egale şi pozitive atunci se obține media aritmetică obişnuită i W i i Măsuri de centralitate: Media aritmetică ponderată 6

MODUL MEDINANA MEDIA +++ uşor de calculat utilă pentru datele nominale nu e afectată de valorile extreme stabilitate de eşantionare în legătură cu varianţa --- slabă stabilitatea de eşantionare Într-o oarecare măsură slabă stabilitate de eşantionare Nu este utilă pentru datele discrete E afectată de distribuţia asimetrică a datelor De reținut! Măsuri de centralitate 7

» Împrăştierea față de valoarea centrală» Distribuția datelor unei variabile e cu atât mai mare cu cât valorile diferă mai mult unele față de celelalte Parametrii:. Amplitudinea. Variația 3. Deviația standard 4. Coeficientul de variație 5. Eroarea standard Măsuri de împrăştiere/dispersie 8

» A = X max X min» Nu ne spune nimic despre modalitatea în care datele variază în jurul valori centrale» Valorile extreme afectează semnificativ valoarea amplitudinii» Excel: RANGE (Descriptive Statistics)» A M = 90 0 = 80» A F = 90 0 = 80 Împrăştierea lor arată diferit Frecvenţa absolută 6 4 0 8 6 4 0 M 0 0 0 30 40 50 60 70 80 90 00 Scor F Măsuri de împrăştiere: Amplitudinea 9

» Media sumei pătratelor abaterilor de la medie se numeşte VARIAȚIA (se exprimă în pătratul unităților de măsură al valorilor observate)» Variația populației: n ( X ) i X SS i= σ = = n n» Variația eşantionului (pentru a corecta faptul că variația eşantionului tinde să subestimeze variația populației): s i= ( X ) i X SS = = n n n Măsuri de împrăştiere: Variația 0

Deviația standard = abaterea standard = ecartul tip» Are aceeaşi unitate de măsură ca şi media şi datele seriei» Variația se foloseşte în statistica inferențială» Deviația standard se foloseşte în statistica descriptivă s Interval X± s X± s X± 3 s ( Xi X) n SS i= = s = = n n Procent observații conținute 68,3 95,5 99,7 Măsuri de împrăştiere: Deviația Standard

» Măsură relativă a dispersiei datelor» Formula de calcul: CV = s X» Evaluare a abaterii standard în raport cu valoarea medie» Are avantajul de a fi un indicator independent de unitățile de măsură Măsuri de împrăştiere: Coeficientul de variație

» Interpretarea omogenității: Coeficient de variație (CV) Interpretare: populația poate fi considerată CV < 0,0 0,0 CV < 0,0 0,0 CV < 0,30 > 0,30 omogenă relativ omogenă relativ eterogenă/relativ heterogenă eterogenă/heterogenă Măsuri de împrăştiere: Coeficientul de variație 3

» intervine în estimarea statistică în determinarea intervalelor de încredere ES = s n Măsuri de împrăştiere: Eroarea standard 4

» Cvartile» Percentile» Decile» Funcția Excel pentru cvartile:» QUARTILE Măsuri de localizare 5

» Cvartile: Împarte seria de date în patru părți egale: 0% 0% 0% 0% 0% 0% 0% 0% 0% 0%» Decile: Împarte seria de date în 0 părți egale: 5% 5% 5% 5% (minimum) (mediana) (maximum) Măsuri de localizare: Cvartile Decile 6

» Simetria unei distribuții analizată cu ajutorul cvartilelor: Fie Q, Q, Q 3 prima (/3), a doua (/) şi a treia (3/4) cvartilă: Q Q Q 3 Q ( înseamnă aproximativ egal cu) distribuţia este aproximativ simetrică Q Q e diferită de Q 3 Q distribuţia este asimetrică (spre stânga sau spre dreapta) Măsuri de localizare 7

» Q = 3,03» Q = 3,43» Q 3 = 4,5 Q Q = 3,43 3,03 = 0,40 Q 3 Q = 4,5 3,43 = 0,7 Interpretare??? Măsuri de localizare: cvartile 8

» Într o distribuție simetrică media aritmetică = mediana = valoarea modală Asimetria este destinată să indice pentru o serie sau o distribuție de date: extinderea asimetriei (abaterea de la aspectul simetric) direcția asimetriei (pozitivă sau negativă) Frecvenţa absolută 9 8 7 6 5 4 3 0 3.5 4.5 5.5 6.5 7.5 8.5 9.5 0.5.5 nr ore dormite pe noapte femei Măsuri de simetrie 9

40» Asimetrie la stânga / pozitivă: Modulul = 7000 Ron Mediana = 8870 Ron Media = 9360 Ron» Modulul < Mediana < Media aritmetică mediana» Asimetrie la dreapta / negativă: Modulul > Mediana > Media aritmetică» Excel:» = SKEW(număr,..., numărn) mediana 35 Frecvenţa absolută 30 5 0 5 0 5 0 Măsuri de 6 simetrie: Asimetria 0 0 40 60 80 00 0 40 60 80 00 0 40 modulul Venit (00 Ron) media Frecvenţa absolută 7 5 4 3 0 0 0 40 60 80 00 Scorul testului 30 media

» Asimetria Indică pentru o serie de date deviația de la simetrie şi respectiv direcția deviației (pozitivă / negativă) Funcția predefinită Excel = SKEWW» Interpretare [Bulmer MG. Principles of Statistics. Dover, 979.] Asimetria < or / >+ distribuția este foarte asimetrică Dacă asimetria are valoare între şi ½sau între +½ şi +distribuția este moderat asimetrică Dacă asimetria are valoare între ½ şi +½, distribuția este aproximativ simetrică M 3 = n 3 (Xi X) i= n Măsuri de simetrie: Asimetria 3

» o măsură a formei unei serii sau distribuții de date, care măsoară înălțimea aplatizării/boltirii unei distribuții în comparație cu o distribuție normală n 4 (Xi X) n i= 4 4 α = S 3» Funcția Excel: = KURT(număr,..., numărn) Excesul de boltire = KURT 3 Măsuri de simetrie: Boltirea 3

» O distribuție normală are o valoare a boltirii aproximativ egală cu 3» Interpretare: Distribuția cu boltirea 3 (excesul de boltire 0) se numeşte mezocurtică. Boltirea <3 (excesul de boltire <0) distribuție platocurtică. Boltirea >3 (excesul de boltire >0) distribuție leptocurtică. Măsuri de simetrie: Boltirea 33

» Dacă la fiecare din datele seriei adunăm sau scădem o constantă atunci: Media va creşte respectiv scădea cu valoarea constantei adăugate Deviația standard nu se va modifica» Dacă înmulțim sau împărțim fiecare din datele seriei cu o constantă: Media se va înmulți sau se va împărți cu valoarea constantei Deviația standard se va înmulți sau împărți cu valoarea constantei Importanța unităților de măsură 34

» Unitățile de măsură influențează statisticile descriptive.» Statisticile descriptive trebuie aplicate diferențiat în funcție de scala de măsură a variabilei.» Este utilă cunoaşterea parametrilor descriptivi. Important! 35