Statisticǎ - exerciţii

Σχετικά έγγραφα
Statisticǎ - curs 3. 1 Seria de distribuţie a statisticilor de eşantioane 2. 2 Teorema limitǎ centralǎ 5. 3 O aplicaţie a teoremei limitǎ centralǎ 7

8 Intervale de încredere

Metode iterative pentru probleme neliniare - contractii

Curs 10 Funcţii reale de mai multe variabile reale. Limite şi continuitate.

NOTIUNI DE BAZA IN STATISTICA

CONCURSUL DE MATEMATICĂ APLICATĂ ADOLF HAIMOVICI, 2017 ETAPA LOCALĂ, HUNEDOARA Clasa a IX-a profil științe ale naturii, tehnologic, servicii

R R, f ( x) = x 7x+ 6. Determinați distanța dintre punctele de. B=, unde x și y sunt numere reale.

Planul determinat de normală şi un punct Ecuaţia generală Plane paralele Unghi diedru Planul determinat de 3 puncte necoliniare

(a) se numeşte derivata parţială a funcţiei f în raport cu variabila x i în punctul a.

Curs 4 Serii de numere reale

Curs 14 Funcţii implicite. Facultatea de Hidrotehnică Universitatea Tehnică "Gh. Asachi"

Sisteme diferenţiale liniare de ordinul 1

Subiecte Clasa a VIII-a

9 Testarea ipotezelor statistice

Aplicaţii ale principiului I al termodinamicii la gazul ideal

CONCURSUL DE MATEMATICĂ APLICATĂ ADOLF HAIMOVICI, 2016 ETAPA LOCALĂ, HUNEDOARA Clasa a IX-a profil științe ale naturii, tehnologic, servicii

III. Serii absolut convergente. Serii semiconvergente. ii) semiconvergentă dacă este convergentă iar seria modulelor divergentă.

a n (ζ z 0 ) n. n=1 se numeste partea principala iar seria a n (z z 0 ) n se numeste partea

Integrala nedefinită (primitive)

Statisticǎ - notiţe de curs

Asupra unei inegalităţi date la barajul OBMJ 2006

DISTANŢA DINTRE DOUĂ DREPTE NECOPLANARE

a. 11 % b. 12 % c. 13 % d. 14 %

5. FUNCŢII IMPLICITE. EXTREME CONDIŢIONATE.

Componente şi Circuite Electronice Pasive. Laborator 4. Măsurarea parametrilor mărimilor electrice

5.5. REZOLVAREA CIRCUITELOR CU TRANZISTOARE BIPOLARE

Statisticǎ - curs 4. 1 Generalitǎţi privind ipotezele statistice şi problema verificǎrii ipotezelor statistice 2

Analiza în curent continuu a schemelor electronice Eugenie Posdărăscu - DCE SEM 1 electronica.geniu.ro

COLEGIUL NATIONAL CONSTANTIN CARABELLA TARGOVISTE. CONCURSUL JUDETEAN DE MATEMATICA CEZAR IVANESCU Editia a VI-a 26 februarie 2005.

MARCAREA REZISTOARELOR

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor X) functia f 1

POPULAŢIE NDIVID DATE ORDINALE EŞANTION DATE NOMINALE

Curs 1 Şiruri de numere reale

Subiecte Clasa a VII-a

7 Distribuţia normală

Laborator 11. Mulţimi Julia. Temă

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor

Recapitulare - Tipuri de date

ESTIMAREA PARAMETRILOR STATISTICI. Călinici Tudor

Metode de interpolare bazate pe diferenţe divizate

RĂSPUNS Modulul de rezistenţă este o caracteristică geometrică a secţiunii transversale, scrisă faţă de una dintre axele de inerţie principale:,

Seminariile Capitolul X. Integrale Curbilinii: Serii Laurent şi Teorema Reziduurilor

Profesor Blaga Mirela-Gabriela DREAPTA

V.7. Condiţii necesare de optimalitate cazul funcţiilor diferenţiabile

SERII NUMERICE. Definiţia 3.1. Fie (a n ) n n0 (n 0 IN) un şir de numere reale şi (s n ) n n0

Componente şi Circuite Electronice Pasive. Laborator 3. Divizorul de tensiune. Divizorul de curent

2.1 Sfera. (EGS) ecuaţie care poartă denumirea de ecuaţia generală asferei. (EGS) reprezintă osferă cu centrul în punctul. 2 + p 2

Definiţia generală Cazul 1. Elipsa şi hiperbola Cercul Cazul 2. Parabola Reprezentari parametrice ale conicelor Tangente la conice

Algebra si Geometrie Seminar 9

1. Completati caseta, astfel incat propozitia obtinuta sa fie adevarata lg 4 =.

1. Distribuţiile teoretice 2. Intervalul de încredere pentru caracteristicile cantitative (medii) Histograma Nr. valori Nr. de clase de valori

Seminar 5 Analiza stabilității sistemelor liniare

Curs 2 Şiruri de numere reale

Statisticǎ - curs 2. 1 Parametrii şi statistici ai tendinţei centrale 2. 2 Parametrii şi statistici ai dispersiei 5

STATISTICĂ DESCRIPTIVĂ

riptografie şi Securitate

Statistică descriptivă Distribuția normală Estimare. Călinici Tudor 2015

Masurarea variabilitatii Indicatorii variaţiei(împrăştierii) lectia 5 16 martie 2 011

5 Statistica matematică

5.4. MULTIPLEXOARE A 0 A 1 A 2

Toate subiectele sunt obligatorii. Timpul de lucru efectiv este de 3 ore. Se acordă din oficiu 10 puncte. SUBIECTUL I.

SEMINAR 14. Funcţii de mai multe variabile (continuare) ( = 1 z(x,y) x = 0. x = f. x + f. y = f. = x. = 1 y. y = x ( y = = 0

Scoruri standard Curba normală (Gauss) M. Popa

Variabile statistice. (clasificare, indicatori)

Subiecte Clasa a V-a

Esalonul Redus pe Linii (ERL). Subspatii.

Capitolul 4 PROPRIETĂŢI TOPOLOGICE ŞI DE NUMĂRARE ALE LUI R. 4.1 Proprietăţi topologice ale lui R Puncte de acumulare

Curs 2 DIODE. CIRCUITE DR

1. PROPRIETĂȚILE FLUIDELOR

Fig Impedanţa condensatoarelor electrolitice SMD cu Al cu electrolit semiuscat în funcţie de frecvenţă [36].

GEOMETRIE PLANĂ TEOREME IMPORTANTE ARII. bh lh 2. abc. abc. formula înălţimii

Să se arate că n este număr par. Dan Nedeianu

DistributiiContinue de Probabilitate Distributia Normala

4. Măsurarea tensiunilor şi a curenţilor electrici. Voltmetre electronice analogice

TESTAREA IPOTEZELOR STATISTICE

T R A I A N ( ) Trigonometrie. \ kπ; k. este periodică (perioada principală T * =π ), impară, nemărginită.

Ecuaţia generală Probleme de tangenţă Sfera prin 4 puncte necoplanare. Elipsoidul Hiperboloizi Paraboloizi Conul Cilindrul. 1 Sfera.

Laborator 1: INTRODUCERE ÎN ALGORITMI. Întocmit de: Claudia Pârloagă. Îndrumător: Asist. Drd. Gabriel Danciu

Indicatori sintetici ai distribuțiilor statistice

Reactia de amfoterizare a aluminiului

prin egalizarea histogramei

Criptosisteme cu cheie publică III

Coeficientul de corelaţie Pearson(r) M. Popa

Concurs MATE-INFO UBB, 1 aprilie 2017 Proba scrisă la MATEMATICĂ

Functii Breviar teoretic 8 ianuarie ianuarie 2011

Exemple de probleme rezolvate pentru cursurile DEEA Tranzistoare bipolare cu joncţiuni

3. I. Mihoc, C. Fătu, Calculul probabilităţilor şi statistică matematică, Transilvania Press, Cluj-Napoca, 2003

Statistica descriptivă (continuare) Şef de Lucrări Dr. Mădălina Văleanu

Capitolul 4. Integrale improprii Integrale cu limite de integrare infinite

1.7. AMPLIFICATOARE DE PUTERE ÎN CLASA A ŞI AB

Conice - Câteva proprietǎţi elementare

PRELEGEREA XII STATISTICĂ MATEMATICĂ

Elemente de bază în evaluarea incertitudinii de măsurare. Sonia Gaiţă Institutul Naţional de Metrologie Laboratorul Termometrie

Valori limită privind SO2, NOx şi emisiile de praf rezultate din operarea LPC în funcţie de diferite tipuri de combustibili

Conice. Lect. dr. Constantin-Cosmin Todea. U.T. Cluj-Napoca

Ministerul Educaţiei Naționale Centrul Naţional de Evaluare şi Examinare

Cursul 6. Tabele de incidenţă Sensibilitate, specificitate Riscul relativ Odds Ratio Testul CHI PĂTRAT

6 n=1. cos 2n. 6 n=1. n=1. este CONV (fiind seria armonică pentru α = 6 > 1), rezultă

2. Sisteme de forţe concurente...1 Cuprins...1 Introducere Aspecte teoretice Aplicaţii rezolvate...3

Tranzistoare bipolare şi cu efect de câmp

Transcript:

Statisticǎ - exerciţii Ştefan Balint, Tǎnasie Loredana 1 Noţiuni de bazǎ Exerciţiu 1.1. Presupuneţi cǎ lucraţi pentru o firmǎ de sondare a opiniei publice şi doriţi sǎ estimaţi proporţia cetǎţenilor care, în eventualitatea organizǎrii de alegeri astǎzi, ar vota cu partidul de guvernǎmânt. definiţi populaţia statisticǎ pe care o eşantionaţi. Dar dacǎ v-ar interesa sǎ estimaţi proporţia cetǎţenilor care, la viitoarele alegeri ar vota cu partidul de guvernǎmânt, care ar fi populaţia statisticǎ? Exerciţiu 1.2. O companie de asigurǎri doreşte sǎ determine proporţia medicilor care au fost implicaţi în ultimul an în una sau mai multe acţiuni judiciare de rele practici. Compania selecteazǎ întâmplǎtor în ultimul an una sau mai multe acţiuni judiciare de rele practici. Compania selecteazǎ întâmplǎtor 500 de medici care au practicat în ultimul an şi determinǎ proporţia. Identificaţi populaţia de interes. Exerciţiu 1.3. Un cercetǎtor este interesat sǎ compare salariul de încadrare pentru bǎrbaţii şi femeile care au un loc de muncǎ imediat dupǎ absolvirea facultǎţii. Sunt cercetaţi 100 de bǎrbaţi şi 100 de femei. Exerciţiu 1.4. Identificaţi trei tipuri diferite de variabile statistice ce pot fi colectate pentru a reflecta popularitatea a cinci publicaţii periodice similare. Exerciţiu 1.5. Pentru urmǎtoarele cazuri, precizaţi populaţia statisticǎ şi identificaţi variabila studiatǎ: a) timpiii de execuţie, în secunde a 400 de programe în Java; b) absenteismul (în zile al angajaţilor); b) profesia a 200 de salariaţi; d) numǎrul copiilor a 2000 de familii; Exerciţiu 1.6. Clasificaţi urmǎtoarele grupuri ca populaţie sau eşantion: - toate persoanele de peste 18 ani din România; - un grup de persoane din judeţul Alba; - toate persoanele din judeţul Cǎlǎraşi; 1

- 2 kg de mere; - toate merele din recolta acestui an; - câteva primǎrii din judeţul Timiş; - 500 de gospodǎrii din România; - o gǎleatǎ de apǎ dintr-o fântˆnǎ. Pentru fiecare populaţie definitǎ anterior daţi un exemplu de eşantion. Exerciţiu 1.7. Clasificaţi urmǎtoarele variabile în variabile calitative şi cantitative: - Numǎrul de persoane dintr-o gospodǎrie; - Statutul marital al unei persoane; - Numǎrul de studenţi dintr-o grupǎ care vin la seminar; - Culoarea maşinilor; - Lungimea sǎriturii unei broaşte; - Culoarea ochilor; - Chiria plǎtitǎ de chiriaşi; - Suprafaţa locuibilǎ într-un apartament; - Veniturile pensionarilor din Bucureşti; - Coeficienţii de inteligenţǎ a copiilor din Şcoala Generala Nr. 30, Timişoara; - Durata unei greve; - Orientarea politicǎ a persoanelor adulte. 2

2 Determinarea frecvenţei şi gruparea datelor. Prezentarea datelor. Parametrii şi statistici ai tendinţei centrale Exerciţiu 2.1. O firmǎ este interesatǎ de timpul mediu al convorbirilor telefonice şi de distribuţia acestor timpi faţǎ de timpul mediu (dispersia) pe durata a 40 convorbiri telefonice consecutive. Timpii s-au rotunjit n minute s-a obţinut urmǎtorul set de date: 4, 6, 4, 4, 7, 2, 3, 1, 2, 1, 1, 4, 9, 8, 11, 12, 3, 2, 1, 1, 3, 9, 4, 5, 7, 7, 9, 10, 10, 1, 2, 2, 3, 11, 12, 10, 1, 1, 3, 4. Care este seria de distribuţie? Sǎ se realizeze diagrama cerc? Care sunt parametrii tendinţei centrale? Exerciţiu 2.2. Considerǎm urmǎtoarea serie de distribuţie cu date grupate: f x x 3-5 2 6-8 10 9-11 12 12-14 9 15-17 7 a) Sǎ se realizeze histograma; b) Calculaţi media, intervalul median şi intervalul modal. Exerciţiu 2.3. Notele obţinute de 40 de studenţi sunt urmǎtoarele: 8; 10; 4; 9; 6; 8; 10; 7; 8; 3; 9; 6; 5; 4; 8; 7; 10; 9; 6; 5; 4; 3; 6; 9; 10; 8; 7; 7; 7; 6; 5; 5; 6; 7; 9; 10; 7; 6; 3; 4; 1) Sǎ se prezinte datele sub forma unui tabel statistic; 2) Sǎ se reprezinte grafic datele; 3) Sǎ se grupeze datele pe 4 intervale; 4) Sǎ se calculeze frecvenţele cumulate crescǎtor; 5) Sǎ se reprezinte seria de date. Exerciţiu 2.4. Se dau numǎrul de ani de pensie pentru 15 pensionari: 5 6 3 6 11 7 9 10 2 4 10 6 2 1 5 Sǎ se calculeze modul şi mediana pentru aceste date. Sǎ se com pare aceste valori şi sǎ se precizeze care este cea mai potrivitǎ pentru a mǎsura tendinţa centralǎ a datelor. 3

Exerciţiu 2.5. Un analist financiar al unei firme este interesat în a determina salariul mediu acordat angajaţilor a 4 filiale ale firmei. Pentru aceasta el culege datele privind salariul mediu pe fiecare filialǎ şi fondurile de salarizare. Filiala Salariul mediu în filialǎ Fondul de salarizare (mii U.M.) (milioane U.M.) 1 540 45,90 2 620 33,48 3 480 16,80 4 700 19,60 Care este salariul mediu al unui salariat? Exerciţiu 2.6. Au fost înregistrate numǎrul de ore petrecute de studenţi cu învǎţatul: Numǎr ore Numǎr studenţi 0-3 17 4-7 23 8-11 15 12-15 11 16-19 8 20-23 6 Sǎ se calculeze numǎrul mediu de ore petrecut de un student cu învǎţatul. Exerciţiu 2.7. Într-o şcoalǎ promovabilitatea elevilor a crescut astfel în perioada 1995-2006: în perioada 1995-1998 a crescut de 1.05 ori, în perioada 1999-2002 a crescut de 1.078 ori, iar în perioada 2003-2006 a crescut de 1.098 ori. Care este valoarea medie a creşterii promovabilitǎţii? 4

3 Parametrii si statistici ai dispersiei. Parametrii si statistici factoriali ai variantei Exerciţiu 3.1. Considerǎm urmǎtorul set de date: 5,-7,2,0,-9,16,10,7. sǎ se calculeze: a) media aritmeticǎ şi pǎtraticǎ, mediana, modul; b) deviaţia medie absolutǎ a setului de date; c) Varianţa şi abaterea standard a setului de date; item[d)] Coeficientul de variaţie. Exerciţiu 3.2. Considerǎm urmǎtoarea serie de distribuţie cu frecvenţe: x f 0 1 1 3 2 8 3 5 4 3 a) Calculaţi 3 parametrii ai tendinţei centrale; b) Determinaţi varianţa şi abaterea standard a setului de date; item[d)] Care este coeficientul de variaţie? Exerciţiu 3.3. Considerǎm urmǎtoarele valori: 19, 13, 20, 22, 19, 17 9, 10, 19, 13, 23, 15 22, 14, 18, 21, 20, 18 9, 15, 13, 10, 17, 19 Grupaţi datele, iar apoi calculaţi coeficientul de variaţie. Exerciţiu 3.4. Au fost înregistrate numǎrul de ore petrecute de studenţi cu învǎţatul: Sǎ se calculeze Numǎr ore Numǎr studenţi 0-3 17 4-7 23 8-11 15 12-15 11 16-19 8 20-23 6 a) media aritmeticǎ şi pǎtraticǎ, mediana, modul; 5

b) deviaţia medie absolutǎ a setului de date; c) Varianţa şi abaterea standard a setului de date; item[d)] Coeficientul de variaţie. Exerciţiu 3.5. Persoanele unei firme sunt împǎrţite în trei grupe în funcţie de înǎlţime. Se cunosc urmǎtoarele date Grupa A Grupa B Grupa C Înǎlţimea medie a grupei (cm) 175 171 180 Numǎrul de persoane 45 40 30 Care este varianţa mediilor de grupǎ faţǎ de media generalǎ? Exerciţiu 3.6. Se dǎ o selectie de 150 de numere x 1 ; x 2 ;... ; x 150 cu Aceste numere se grupeazǎ în 8 intervale [80; 86]; [87; 93];... ; de lungime 6 unitǎţi. Ele se repartizeazǎ în aceste intervale dupǎ cum urmeazǎ: în primul interval avem 2 numere (n 1 = 2), în al doilea 23 de numere (n 2 = 23), n 3 = 22, n 4 = 65, n 5 = 20, n 6 = 10, n 7 = 0, n 8 = 8. Sǎ se calculeze varianţa fiecǎrei grupe, media varianţelor de grupǎ, varianţa mediilor de grupǎ faţǎ de media generalǎ şi varianţǎ totalǎ. 6

4 Parametrii si statistici ai pozitiei Exerciţiu 4.1. Se considerǎ urmǎtoarea serie statisticǎ ce prezintǎ nivelul de hemoglobinǎ în sânge pentru 60 de persoane presupuse sǎnǎtoase. Valorile sunt date atât pentru bǎrbaţi cât şi pentru femei (valorile pentru femei sunt marcate cu un asterisc în dreapta). 105* 110* 112* 112* 118* 119* 120* 120* 125* 126* 127* 128* 130* 132* 133* 134* 135* 138* 138* 138* 138* 141 142* 144 145* 146 148* 148* 148 149 150* 150 151* 151 153 153 153 154* 154* 154 155 156 156 158* 160 160 160 160 163 164 164 165 166 168 168 170 172 172 176 179 141 a) Scrieţi serile de distribuţie cu frecvenţe pentru femei şi pentru bǎrbaţi; b) Determinaţi pentru fiacre dintre serii media aritmedticǎ şi varianţa; c) Calculaţi quantilele. d) Care este scorul standard? Exerciţiu 4.2. Se considerǎ urmǎtoarea serie de distribuţie cu grupare: Determinaţi quantilele şi scorul standard. Vechimea muncitoriloe Numǎr muncitori 4,5 3 10,5 4 16,5 6 22,5 5 28,5 2 Exerciţiu 4.3. Determinaţi quantilele centilele C 2 0 şi C 5 0 pentryu urmǎtoarea serie de distribuţie cu grupare. 10-15 15 16-20 30 22-27 40 28-33 50 34-39 20 40-45 5 Exerciţiu 4.4. Se considerǎ populaţia de la care se pot obţine urmǎtoarele date statistice distincte: {0, 3, 6, 9}. a) Câte eşantioane de 2 elemente se pot forma? b) Care este seria de distribuţie a mediei acestor eşantioane? c) Reprezentatţi grafic diagrama coloanǎ. 7

5 Teorema de limita centrala Exerciţiu 5.1. Se considerǎ populaţia de la care se pot obţine urmǎtoarele date statistice distincte: {4, 8, 12}. a) Câte eşantioane de 2 elemente se pot forma? b) Care este seria de distribuţie a mediei acestor eşantioane? c) Reprezentatţi grafic diagrama coloanǎ. d) Verificaţi validitatea Teoremei limitǎ centralǎ. Exerciţiu 5.2. Înǎlţimea copiilor dintr-o grǎdiniţǎ considerǎm cǎ este o variabilǎ distribuitǎ aproximativ normal de medie: µ = 39 şi abatere standard 2. a) Dacǎ se ia un copil la întâmplare care este probabilitatea ca înǎlţimea lui sǎ fie între 38 şi 40 de inch? b) Care este probabilitatea ca media înǎlţimii unei clase de 30 de copii sǎ fie între 30 şi 40 inch? c) Dacǎ se ia un copil la înt ˆmplare care este probabilitatea ca înǎlţimea copilului sǎ fie mai mare decât 40? d) Dar probabilitatea ca media înǎlţimilor copiilor dintr-o clasǎ de 30 de copii sǎ fie mai mare decât 40? Exerciţiu 5.3. Pentru o populaţie se cunoaşte media µ = 500 şi deviaţia standard σ = 30. Se extrag aleator mai multe eşantioane de dimensiune 36. a) Ce valoare are media tuturor eşantioanelor extrase? b) Calculaţi deviaţia standard a tuturor eşantioanelor extrase. c) Ce distribuţie urmeazǎ media acestor eşantioane? Exerciţiu 5.4. Considerǎm 36 de date selectate dintr-o populaţie distribuitǎ normal de medie 50 şi deviaţie standard 10. a) Care este probabilitatea ca media datelor sǎ fie în intervalul 45 şi 55? b) Care este probabilitatea ca media sǎ fie mai mare decât 48? 8

6 Verificarea ipotezelor statistice: varianta clasicǎ Exerciţiu 6.1. O uzinǎ a cumpǎrat un lot de cabluri metalice destinate sǎ susţinǎ încǎrcǎturi grele. Fabricantul de cabluri a afirmat cǎ încǎrcǎtura medie ce provoacǎ ruperea acestor cabluri este de 8000 kg. Uzina a efectuat un test pe 6 cabluri şi a constatat o încǎrcǎturǎ medie de rupere egalǎ cu 7750 de kg şi o abatere standard de 145 kg. Uzina doreşte sǎ ştie dacǎ depune plângere contra fabricantului, poate câştiga procesul cu o probabilitate de 99%? Exerciţiu 6.2. Pentru a determina nivelul mediu de plumb din apa potabilǎ a unei zone puternic industrializate se fac determinǎri în 144 de zile alese aleator. În urma testelor s-a obţinut o medie de x = 36 de unitǎţi de plumb/100 ml apǎ, iar abaterea medie pǎtraticǎ s = 15 unitǎţi plumb/100 ml apǎ. Sǎ se determine un interval de încredere de 95% pentru valoarea medie a nivelului de plumb/100 ml apǎ. Exerciţiu 6.3. O maşinǎ produce fiole de sticlǎ. Pentru 53 de fiole s-a observat o duratǎ medie de viaţǎ de x = 830 de ore. Presupunem cǎ durata de viaţǎ a unei fiole urmeazǎ o lege normalǎ, iar varianţa este σ = 415. Directorul firmei afirmǎ cǎ durata de viaţǎ a fiolelor este x = 850 de ore. Are el dreptate la nivelul de semnificaţie α = 0, 05? Exerciţiu 6.4. Nivelul de glicemie al unei populaţii adulte este presupusǎ distribuitǎ dupǎ o lege normalǎ de dispersie σ = 0, 80 g/l de sânge.se considerǎ un eşantion de 12 persoane ale acestei populaţii şi se mǎsoarǎ nivelul de glicemie la fiecare. Se gǎsesc urmǎtoarele rezultate: 0, 6 0, 9 0, 74 0, 96 0, 85 1, 05 0, 8 0, 93 1, 17 0, 70 0, 84 0, 75 La un nivel de semnificaţie de α = 0, 05 nivelul mediu al glicemiei x este compatibil cu nivelul mediu al glicemiei µ? Exerciţiu 6.5. Se presupune cǎ încǎrcǎtura suportatǎ de plǎcile de tablǎ este o variabilǎ aleatoare de medie µ şi abatere medie pǎtraticǎ σ. În condiţiile date, s-au testat 50 de plǎci de tablǎ, media şi abaterea observate sunt x = 320, iar abaterea medie pǎtraticǎ este s = 35. Câte plǎci de tablǎ trebuie testate pentru ca intervalul de încredere al încǎrcǎturii medii sǎ fie determinat cu o amplitudine de 10 kg la nivelul de semnificaţie α = 0, 005? Exerciţiu 6.6. În exemplele urmǎtoare verificaţi dacǎ se poate accepta ipoteza nulǎ, la 9

nivelul de semnificaţie α = 0, 05 a) H 0 : µ = 100 n = 64, x = 105, σ 2 = 40 H a : µ > 100 b) H 0 : µ = 100 n = 60, x = 110, σ 2 = 20 H a : µ > 100 c) H 0 : µ = 90 n = 25, x = 84, σ 2 = 30 H a : µ < 90 d) H 0 : µ = 90 n = 36, x = 80, σ 2 = 40 H a : µ < 90 e) H 0 : µ = 100 n = 25, x = 95, σ 2 = 20 H a : µ 100 f) H 0 : µ = 100 n = 36, x = 105, σ 2 = 30 H a : µ 100 10

7 Verificarea ipotezelor statistice: varianta probabilistǎ Exerciţiu 7.1. Calculaţi p-valorile în urmǎtoarele cazuri: a) H 0 : µ = 10 z = 1, 48 H a : µ > 10 b) H 0 : µ = 105 z = 0, 85 H a : µ < 105 c) H 0 : µ = 13, 4 z = 1, 17 H a : µ 13, 4 d) H 0 : µ = 8, 56 z = 2, 11 H a : µ < 8, 56 e) H 0 : µ = 110 z = 0, 93 H a : µ 110 f) H 0 : µ = 54, 2 z = 0, 46 H a : µ > 54, 2 Exerciţiu 7.2. P-valoarea calculatǎ a unei statistici observate este P = 0, 084. Care este decizia privind ipoteza nulǎ? a) dacǎ nivelul de semnificaţie fixat este α = 0, 05; b) dacǎ nivelul de semnificaţie fixat este α = 0, 10. Exerciţiu 7.3. Un economist pretinde cǎ atunci când media Dow-Jones creşte, volumul acţiunilor vândute la bursa din New-York tinde sǎ creascǎ. În ultimii doi ani media volumului zilnic de acţiuni vândute este de 21, 5 milioane şi are o deviaţie standard de 2, 5 milioane. Un eşantion aleator de 64 zile în care media Dow-Jones a crescut a fost selectat şi s-a calculat media volumului zilnic. Media eşantionului a fost de 22 milioane. Calculaţi p valoarea pentru verificarea acestei ipoteze statistice. 11

8 Inferenţǎ statisticǎ privind media populaţiei Exerciţiu 8.1. Limita legalǎ a nivelului de poluant X în deşeurile unei uzine este 5 mg/kg. Se efectueazǎ o verificare pe 10 probe de 1 kg şi se obţin urmǎtoarele valori x i pentru nivelul de poluant: 8 9 1 3 5 10 2 6 3 9 Admitem cǎ X urmeazǎ o lege normalǎ. Verificaţi dacǎ uzina respectǎ condiţiile legale la nivelul de încredere de 95%. Exerciţiu 8.2. 16 determinǎri ale procentului de apǎ dintr-o soluţie au condus la x = 0, 822% şi s = 0, 02%. Sǎ se verifice ipoteza H 0 : µ = 0, 9&, faţǎ de ipoteza H a := µ < 0, 9% la un prag de semnificaţie de 0, 05. Exerciţiu 8.3. O companie are un sistem de computere care proceseazǎ 1200 de facturi pe orǎ. S-a testat un nou sistem care în 40 de ore a procesat în medie 1260 de facturi/orǎ cu o deviaţie standard de 215. Verificaţi dacǎ noul sistem este mai bun. ( la un prag de semnificaţie α = 0, 01). Exerciţiu 8.4. S-a fǎcut un studiu pentru a verifica dacǎ se poate accepta ipoteza cǎ o scrisoare trimisǎ dintr-o localitate în alta face în medie 3 zile. Pentru un eşantion de 54 de scrisori s-au obţinut urmǎtoarele date: zile 1 2 3 4 5 6 8 9 frecvenţe 2 6 19 15 6 4 1 1 Se poate accepta ipoteza cǎ media este 3 zile la un prag de semnificaţie α = 0, 05? (Rezolvaţi problema folosind metoda clasicǎ şi metoda probabilistǎ) Exerciţiu 8.5. În exemplele urmǎtoare verificaţi dacǎ se poate accepta ipoteza nulǎ, la nivelul de semnificaţie α = 0, 05, calculând în fiecare caz şi p-valoarea: a) H 0 : µ = 100 n = 64, x = 105, s 2 = 40 H a : µ > 100 b) H 0 : µ = 100 n = 60, x = 110, s 2 = 20 H a : µ > 100 c) H 0 : µ = 90 n = 25, x = 84, s 2 = 30 H a : µ < 90 d) H 0 : µ = 90 n = 36, x = 80, s 2 = 40 H a : µ < 90 e) H 0 : µ = 100 n = 25, x = 95, s 2 = 20 H a : µ 100 f) H 0 : µ = 100 n = 36, x = 105, s 2 = 30 H a : µ 100 12

9 Inferenţǎ statisticǎ asupra varianţei şi estimarea varianţei Exerciţiu 9.1. Un vânzǎtor de vin se intereseazǎ de cantitatea de vin dintr-o sticlǎ. El se întreabǎ dacǎ conţinutul mediu nu este inferior conţinutului legal de 75cl. În acest scop mǎsoarǎ conţinutul a 10 sticle luate la înt ˆmplare şi obţine valorile urmǎtoare: 73, 2 72, 6 74, 5 75, 0 75, 0 73, 7, 74, 1, 75, 1 74, 8 74, 0 a) Presupunând normalitatea distribuţiei conţinutului sticlelor, se pune întrebarea dacǎ conţinutul mediu este mai mic decât 75 cl, la nivelul de semnificaţie de 0, 05? b) Dacǎ σ 2 este varianţa distribuţiei conţinutului sticlelor, testaţi ipoteza H 0 : σ 2 = 1. Exerciţiu 9.2. Un cercetǎtor vrea sǎ studieze valoarea cheltuielilor sǎptǎmânale ale studenţilor de la Universitatea din Geneva. La un eşantion aleator de 20 de studenţi obţine rǎspunsurile: 120 150 180 200 130 150 170 160 190 100 125 145 175 200 120 130 135 165 150 180 Poate sǎ tragǎ concluzia cǎ abaterea standard e superioarǎ lui 25? 13

10 Generalitǎţi despre corelaţie Exerciţiu 10.1. Considerǎm urmǎtorul tabel de date: x y 1 y 2 y 3 2 4 8 2 3 5 7 4 3 5 7 5 4 5 8 7 4 7 7 4 5 7 5 3 5 8 4 2 6 8 4 1 6 8 5 1 6 8 4.5 3 7 9 4 4 7 9 3 7 7 10 3 8 8 9 2 9 8 10 3 9 a) Calculaţi coeficientul de corelaţie folosind definiţia şi formula alternativǎ de calcul pentru seriile x şi y 1, x şi y 2, x şi y 3. b) Desenaţi diagrama de împrǎştiere şi precizaţi tipurile de corelaţii existente în cele trei cazuri prezentate la punctul a). Exerciţiu 10.2. Pentru seturile de date care urmeazǎ: 1) calculaţi coeficientul de regresie liniarǎ (pentru seriile x şi y 1, x şi y 2, x şi y 3 în fiecare din cele douǎ cazuri); 2) precizaţi dacǎ existǎ sau nu corelaţie liniarǎ (pentru fiecare din cazurile prezentate anterior). 14

Cazul 1. Cazul 2. C x y 1 y 2 y 3 2 5 5 2 3 5 5 4 3 5 7 5 4 5 5 7 4 7 7 4 5 7 7 3 5 8 4 2 6 8 6 1 6 8 9 1 6 8 8 3 7 9 7 4 7 9 9 7 7 10 10 8 8 8 8 9 8 11 9 9 x y 1 y 2 y 3 2 5 5 2 3 5 5 4 3 5 7 5 4 5 5 7 4 7 7 4 5 7 7 3 5 8 4 2 6 8 6 1 6 8 9 1 6 8 8 3 7 9 7 4 7 9 9 7 7 10 10 8 8 8 8 9 8 11 9 9 8 9 9 2 9 10 7 4 10 10 10 8 10 10 9 7 9 10 8 8 15

11 Analiza de corelaţie liniarǎ Exerciţiu 11.1. Explicaţi de ce (x x) = 0 şi (y y) = 0. Exerciţiu 11.2. a) Construţi diagrama de împrǎştiere pentru datele din urmǎtorul tabel: b) Calculaţi covarianţa. c) Calculaţi s x şi s y. d) Calculaţi r folosind definiţia. x 1 1 3 3 5 5 7 7 9 9 y 1 2 2 3 3 4 4 5 5 6 e) Calculaţi r folosind formula de calcul practic. f) Dacǎ existǎ o depedenţǎ liniarǎ între x şi y determinaţi ecuaţia dreptei de regresie. Exerciţiu 11.3. a) Calculaţi covarianţa în cazul setului de date: x 20 30 60 80 110 120 y 10 50 30 20 60 10 b) Calculaţi deviaţiile standard ale celor şase valori ale lui x şi ale celor şase valori ale lui y. c) Calculaţi coeficientul de corelaţie liniar r pentru tabelul de date considerat. d) Comparaţi acest rezultat cu cel gǎsit în cazul tabelului de date considerat la început. e) Dacǎ existǎ o depedenţǎ liniarǎ între x şi y determinaţi ecuaţia dreptei de regresie. Exerciţiu 11.4. Se considerǎ urmǎtorul tabel de date bidimensionale: x 0 1 1 2 3 4 5 6 6 6 7 y 6 6 7 4 5 2 3 0 1 1 a) Determinaţi diagrama de împrǎştiere. b) Calculaţi covarianţa. c) Calculaţi s x şi s y. d) Calculaţi r folosind definiţia. e) Calculaţi r folosind formula de calcul practic. f) Dacǎ existǎ o depedenţǎ liniarǎ între x şi y determinaţi ecuaţia dreptei de regresie. 16

12 Inferenţǎ privind coeficientul de corelaţie liniarǎ Exerciţiu 12.1. a) Un eşantion de 20 de date bidimensionale are un coeficient de corelaţie liniar r = 0, 43. Este acesta suficient pentru a respinge ipoteza nulǎ H 0 : ρ = 0 în favoarea unei alternative bilaterale la nivel de semnificaţie α = 0, 10? b) Un eşantion de 18 date bidimensionale are un coeficient de corelaţie liniar r = 0, 50. Este acesta suficient pentru a susţine cǎ la nivelul de semnificaţie α = 0, 10 coeficientul de corelaţie a populaţiei este negativ? c) Un eşantion de 10 date bidimensionale are un coeficient de corelaţie liniar r =, 067. Este aceasta suficient pentru a susţine cǎ la nivelul de semnificaţie α = 0, 05? (ρ este nenul) d) Valoarea r = 0, 24 este ea semnificativǎ pentru a arǎta cǎ ρ > 0 la nivelul de semnificaţie α = 0, 05 în cazul unui eşantion de mǎrime 62. 17

13 Regresie liniarǎ Exerciţiu 13.1. Pentru doi hamali ce îşi desfǎşoarǎ activitatea în Gara de Nord, se cunosc datele de mai jos cu privire la numǎrul de bagaje transportate pe parcursul a cinci zile de lucru: Se cere: Ziua Numǎr bagaje transportate Numǎr bagaje transportate de primul hamal de al doilea hamal 1 30 35 2 32 32 3 31 29 4 35 28 5 40 26 1) Sǎ se reprezinte diagrama de împrǎştiere pentru cele douǎ seturi de date. 2) Sǎ se mǎsoare coeficientul de variaţie pentru fiecare variabilǎ. 3) În ipoteza legǎturii liniare determinaţi parametrii dreptei de regresie. 4) Sǎ se calculeze coeficientul de corelaţie liniarǎ între cele douǎ variabile. Exerciţiu 13.2. Se dau datele privind pulsul şi temperatura pentru zece pacienţi: Pacienti Pulsul Temperatura 1 75 38,2 2 80 37,5 3 70 36,5 4 90 38,3 5 75 37,1 6 85 38 7 80 37,6 8 90 38,5 9 100 39,4 10 95 38,9 a) Calculaţi coeficientul de corelaţie liniarǎ. b) Determinaţi parametrii dreptei de regresie. 18

14 Analiza de regresie liniarǎ Exerciţiu 14.1. a) Sǎ se determine diagrama de împrǎştiere şi dreapta de regresie ŷ = b 0 + b 1 x în cazul tabelului de date: x 1 1 3 3 5 5 7 7 9 9 y 1 2 2 3 3 4 4 5 5 6 b) Sǎ se determine ordonatele ŷ ale punctelor de pe linia de regresie având abscisele: x = 1, 3, 5, 7 şi 9. c) Sǎ se determine e = y ŷ pentru fiecare punct din tabel. d) Sǎ se determine s 2 e. Exerciţiu 14.2. Aceleaşi întrebǎri în cazul tabelului de date: x 0 1 1 2 3 4 5 6 6 6 7 y 6 6 7 4 5 2 3 0 1 1 Exerciţiu 14.3. Datele din tabelul urmǎtor aratǎ numǎrul orelor de studiu x pentru un examen şi nota y primitǎ la acel examen: x 2 3 3 4 4 5 5 6 6 6 7 7 7 8 8 y 5 5 7 5 7 7 8 6 9 8 7 9 10 8 9 a) Sǎ se determine diagrama de împrǎştiere. b) Sǎ se gǎseascǎ linia de regresie. c) Sǎ se gǎseascǎ ŷ pentru x = 2, 3, 4, 5, 6, 7 şi 8. d) Determinaţi valorile lui e pentru x = 3 şi x = 6. 19

15 Inferenţǎ referitoare la panta unei drepte de regresie liniarǎ Exerciţiu 15.1. Un eşantion de 10 studenţi a fost întrebat referitor la distanţa parcursǎ şi la timpul necesar pentru a ajunge la facultate astǎzi. Rǎspunsurile date sunt cuprinse în tabelul urmǎtor: x 1 3 5 5 7 7 8 10 10 12 y 5 10 15 20 15 25 20 25 35 35 a) Determinaţi diagrama de împrǎştiere. b) Determinaţi ecuaţia dreptei de regresie în acest caz. c) Valoarea obţinutǎ pentru b 1 este probǎ suficientǎ pentru a concluziona cǎ β 1 > 0 la nivelul de semnificaţie α = 0, 05. d) Determinaţi intervalul de încredere de 98% pentru estimarea lui β 1. Exerciţiu 15.2. Rata dobânzii este aleasǎ astfel încât sǎ aibe un efect asupra şomajului. Urmǎtorul tabel de date reprezintǎ rata dobânzii pe perioade de 3 luni pentru împrumuturi pe termen scurt (x) şi rata şomajului (y). x 12,27 12,34 12,31 15,81 15,67 17,75 11,56 15,71 19,91 19,99 21,11 y 5,9 5,6 5,9 5,9 6,2 7,6 7,5 7,3 7,6 7,2 8,3 a) Sǎ se determine dreapta de cea mai bunǎ aproximare. b) Este acest eşantion o dovadǎ suficientǎ pentru a respinge ipoteza nulǎ (pantǎ zero) în favoarea unei ipoteze alternative cǎ panta este pozitivǎ la nivelul de semnificaţie 0.05? 20