Folosirea pachetului MathCad în analiza statistică

Σχετικά έγγραφα
Curs 10 Funcţii reale de mai multe variabile reale. Limite şi continuitate.

5. FUNCŢII IMPLICITE. EXTREME CONDIŢIONATE.

Curs 14 Funcţii implicite. Facultatea de Hidrotehnică Universitatea Tehnică "Gh. Asachi"

(a) se numeşte derivata parţială a funcţiei f în raport cu variabila x i în punctul a.

Sisteme diferenţiale liniare de ordinul 1

V.7. Condiţii necesare de optimalitate cazul funcţiilor diferenţiabile

Metode iterative pentru probleme neliniare - contractii

8 Intervale de încredere

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor X) functia f 1

Planul determinat de normală şi un punct Ecuaţia generală Plane paralele Unghi diedru Planul determinat de 3 puncte necoliniare

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor

III. Serii absolut convergente. Serii semiconvergente. ii) semiconvergentă dacă este convergentă iar seria modulelor divergentă.

Seminariile Capitolul X. Integrale Curbilinii: Serii Laurent şi Teorema Reziduurilor

a n (ζ z 0 ) n. n=1 se numeste partea principala iar seria a n (z z 0 ) n se numeste partea

Metode de interpolare bazate pe diferenţe divizate

Curs 4 Serii de numere reale

Curs 1 Şiruri de numere reale

Integrala nedefinită (primitive)

9 Testarea ipotezelor statistice

SEMINAR 14. Funcţii de mai multe variabile (continuare) ( = 1 z(x,y) x = 0. x = f. x + f. y = f. = x. = 1 y. y = x ( y = = 0

Definiţia generală Cazul 1. Elipsa şi hiperbola Cercul Cazul 2. Parabola Reprezentari parametrice ale conicelor Tangente la conice

Analiza în curent continuu a schemelor electronice Eugenie Posdărăscu - DCE SEM 1 electronica.geniu.ro

DISTANŢA DINTRE DOUĂ DREPTE NECOPLANARE

Seminar 5 Analiza stabilității sistemelor liniare

MARCAREA REZISTOARELOR

SERII NUMERICE. Definiţia 3.1. Fie (a n ) n n0 (n 0 IN) un şir de numere reale şi (s n ) n n0

Aplicaţii ale principiului I al termodinamicii la gazul ideal

7 Distribuţia normală

Asupra unei inegalităţi date la barajul OBMJ 2006

Functii Breviar teoretic 8 ianuarie ianuarie 2011

Toate subiectele sunt obligatorii. Timpul de lucru efectiv este de 3 ore. Se acordă din oficiu 10 puncte. SUBIECTUL I.

Esalonul Redus pe Linii (ERL). Subspatii.

Conice. Lect. dr. Constantin-Cosmin Todea. U.T. Cluj-Napoca

5.4. MULTIPLEXOARE A 0 A 1 A 2

Capitolul 4. Integrale improprii Integrale cu limite de integrare infinite

Statisticǎ - curs 3. 1 Seria de distribuţie a statisticilor de eşantioane 2. 2 Teorema limitǎ centralǎ 5. 3 O aplicaţie a teoremei limitǎ centralǎ 7

Subiecte Clasa a VII-a

R R, f ( x) = x 7x+ 6. Determinați distanța dintre punctele de. B=, unde x și y sunt numere reale.

RĂSPUNS Modulul de rezistenţă este o caracteristică geometrică a secţiunii transversale, scrisă faţă de una dintre axele de inerţie principale:,

Erori si incertitudini de măsurare. Modele matematice Instrument: proiectare, fabricaţie, Interacţiune măsurand instrument:

5.5. REZOLVAREA CIRCUITELOR CU TRANZISTOARE BIPOLARE

Subiecte Clasa a VIII-a

Concurs MATE-INFO UBB, 1 aprilie 2017 Proba scrisă la MATEMATICĂ

CONCURSUL DE MATEMATICĂ APLICATĂ ADOLF HAIMOVICI, 2017 ETAPA LOCALĂ, HUNEDOARA Clasa a IX-a profil științe ale naturii, tehnologic, servicii

riptografie şi Securitate

Elemente de bază în evaluarea incertitudinii de măsurare. Sonia Gaiţă Institutul Naţional de Metrologie Laboratorul Termometrie

PROIECT ECONOMETRIE. Profesori coordinatori: Liviu-Stelian Begu și Smaranda Cimpoeru

Ecuatii exponentiale. Ecuatia ce contine variabila necunoscuta la exponentul puterii se numeste ecuatie exponentiala. a x = b, (1)

Laborator 11. Mulţimi Julia. Temă

Componente şi Circuite Electronice Pasive. Laborator 4. Măsurarea parametrilor mărimilor electrice

Regresie si corelatie

Recapitulare - Tipuri de date


ESTIMAREA PARAMETRILOR STATISTICI. Călinici Tudor

Masurarea variabilitatii Indicatorii variaţiei(împrăştierii) lectia 5 16 martie 2 011

Profesor Blaga Mirela-Gabriela DREAPTA

Seminar Algebra. det(a λi 3 ) = 0

Spatii liniare. Exemple Subspaţiu liniar Acoperire (înfăşurătoare) liniară. Mulţime infinită liniar independentă

Curs 2 DIODE. CIRCUITE DR

* K. toate K. circuitului. portile. Considerând această sumă pentru toate rezistoarele 2. = sl I K I K. toate rez. Pentru o bobină: U * toate I K K 1

2.1 Sfera. (EGS) ecuaţie care poartă denumirea de ecuaţia generală asferei. (EGS) reprezintă osferă cu centrul în punctul. 2 + p 2

DistributiiContinue de Probabilitate Distributia Normala

SEMINAR TRANSFORMAREA FOURIER. 1. Probleme

Componente şi Circuite Electronice Pasive. Laborator 3. Divizorul de tensiune. Divizorul de curent

COLEGIUL NATIONAL CONSTANTIN CARABELLA TARGOVISTE. CONCURSUL JUDETEAN DE MATEMATICA CEZAR IVANESCU Editia a VI-a 26 februarie 2005.

Ecuatii trigonometrice

Noţiuni introductive

V O. = v I v stabilizator

PRELEGEREA XII STATISTICĂ MATEMATICĂ

Algebra si Geometrie Seminar 9

z a + c 0 + c 1 (z a)

SEMINARUL 3. Cap. II Serii de numere reale. asociat seriei. (3n 5)(3n 2) + 1. (3n 2)(3n+1) (3n 2) (3n + 1) = a

TEMA 9: FUNCȚII DE MAI MULTE VARIABILE. Obiective:

Curs 2 Şiruri de numere reale

5 Statistica matematică

POPULAŢIE NDIVID DATE ORDINALE EŞANTION DATE NOMINALE

a. 11 % b. 12 % c. 13 % d. 14 %

1. Sisteme de ecuaţii liniare Definiţia 1.1. Fie K un corp comutativ. 1) Prin sistem de m ecuaţii liniare cu n necunoscute X 1,...

EDITURA PARALELA 45 MATEMATICĂ DE EXCELENŢĂ. Clasa a X-a Ediţia a II-a, revizuită. pentru concursuri, olimpiade şi centre de excelenţă

Ecuaţia generală Probleme de tangenţă Sfera prin 4 puncte necoplanare. Elipsoidul Hiperboloizi Paraboloizi Conul Cilindrul. 1 Sfera.

1. Scrieti in casetele numerele log 7 8 si ln 8 astfel incat inegalitatea obtinuta sa fie adevarata. <

a. Caracteristicile mecanice a motorului de c.c. cu excitaţie independentă (sau derivaţie)

2 Transformări liniare între spaţii finit dimensionale

Statistică descriptivă Distribuția normală Estimare. Călinici Tudor 2015

1. Completati caseta, astfel incat propozitia obtinuta sa fie adevarata lg 4 =.

Sisteme de ecuaţii diferenţiale

CURS: METODE EXPERIMENTALE ÎN FCS

Activitatea A5. Introducerea unor module specifice de pregătire a studenţilor în vederea asigurării de şanse egale

I. Noţiuni introductive

VII.2. PROBLEME REZOLVATE

STATISTICĂ DESCRIPTIVĂ

Capitolul 4 PROPRIETĂŢI TOPOLOGICE ŞI DE NUMĂRARE ALE LUI R. 4.1 Proprietăţi topologice ale lui R Puncte de acumulare

III. Reprezentarea informaţiei în sistemele de calcul

Cursul Măsuri reale. D.Rusu, Teoria măsurii şi integrala Lebesgue 15

Principiul Inductiei Matematice.

Laborator 6. Integrarea ecuaţiilor diferenţiale

Analiza bivariata a datelor

Capitolul 3. Serii Fourier. a unei funcţii periodice de perioadă Dezvoltarea în serie Fourier

prin egalizarea histogramei

Laborator biofizică. Noţiuni introductive

Transcript:

Folosirea pachetului MathCad în analiza statistică George Daniel Mateescu * Corina Saman * Mihai Buneci * Rezumat MathCad-ul ne oferă posibilitatea de a face o analiză a datelor şi de a testa modele posibile într-un mod simplu şi uşor de folosit dacă cunoastem matematica care se afla în spatele modelului. Putem verifica ipotezele modelului regresiei cum ar fi dispersia constantă a erorilor, testarea ipotezelor statistice faţă de coeficienţi, corelaţia erorilor, normalitatea erorilor ca variabile aleatoare. Cuvinte cheie: regresie, ipoteze statistice JEL: C(Time-Series Models), C5(Model Construction and Estimation) Pachetul Mathcad intră în categoria mediilor soft care asistă utilizatorul specialist într-un anumit domeniu. Permite realizarea de calcule matematice foarte complexe precum şi activităţi conexe cum ar fi reprezentări grafice, realizarea unei documentaţii, precum şi posibilitatea de export spre alte medii Windows. Comenzile principale: File: operaţii uzuale privind fişierul ca entitate, deschidere, salvare, tiparire, transmitere prin fax sau poştă electronică Edit: comenzi de dactilografiere inteligentă : ştergere, copiere, etc. View: se referă în special la subseturile de comenzi dedicate pentru diferite operaţii matematice şi care sunt grupate în seturi (palete) ce pot fi activate prin paleta matematică Insert: se referă la obiecte matematice complexe cum sunt grafice de funcţii, tabele (matrici) funcţii (sistemul conţine în formă predefinită cele mai cunoscute funcţii matematice) Format: se referă atât la indicaţii de înfăţişare a lucrării cât şi la formate specifice calculelor matematice (cum este de exmplu numărul de zecimale care se afişează) Math: priveşte comanda de începere a calculelor dar şi indicaţii referitoare la unităţile de măsură Symbolics: reprezintă un element de noutate în raport cu calculele numerice şi conţine elemente de inteligenţă artificială care permit evaluări simbolice (primitive sau derivare simbolică) * Institutul de Prognoză Economică, Academia Romană

Window: permite gestiunea mai multor lucrări Help: mediu complex care conţine indicaţii de utilizare Detalierea comenzilor. Tot ceea ce ţine de tratarea fişierului ca entitate, vizualizare, tipărite editare, ferestre, help, sunt foarte asemănătoare cu alte pachete din mediul Windows (Word, Excel, etc.) Paleta matematică, conţine cele mai semnificative comenzi pe următoarele grupe artimetică logică reprezentări grafice matrici şi vectori calcul diferenţial şi integral elemente de programare alfabetul grec evaluarea simbolică Principiul de utilizare este al unei foi de hârtie inteligente în care utilizatorul scrie expresiile matematice în mod obişnuit iar foaia efectuează calculele şi pune rezultatele exact în continurea expresiei. Utilizatorul completează liniile şi coloanele matricii a iar apoi scrie pur şi simplu a - iar foaia de calcul pune rezultatul. Se pot face calcule oricât de complicate aşa cum se vede alăturat. Modul de introducere al expresiilor este free hand a a 3 4. b a T. b 93.58 4.36 86.56 b 4 8 5 47.4.368 45.84 45.737 4.737.5 Calcule simbolice d sin( x) dx x 3 cos x cos ( x) x 3 cos x sin( x) x 3 cos x. 3x.. sin x x

Reprezentări grafice Se plasează: pe orizontală, jos: variabila şi intervalul (domeniul e definiţie) pe verticală, în stânga, legea de coespondenţă şi codomeniul Mediul Windows este atât de puternic integrat încât permite, de exemplu în Word, editarea direct în pagină prin lansarea implicită în background a pachetului Mathcad! x cos(. x) x Calcule numerice Integrala definită a unei funcţii a cărei primitivă nu este exprimabilă prin funcţii elementare. În cazul funcţiilor ale căror primitive se exprimă prin funcţii elementare se poate apela şi la calculul simbolic e x dx.35 Sisteme de ecuaţii Sistemele de ecuaţii liniare se rezolvă direct prin calcule cu matrici dar se pot rezolva şi ecuaţii sau sisteme de ecuaţii neliniare. Este necesară introducerea unor valori iniţiale pentru x şi y (semnificaţia acestei introduceri poate fi explicată numai după ce vor fi însuşite cunoştinţe de analiză numerică). Este posibil ca, uneori, să nu fie obţinută soluţia sistemului daca valorile de start nu satisfac anumite condiţii. În exemlul alăturat semnul se obţine prin selectare din tabelul de operatori de tip logic. Soluţia se obţine prin apelul funcţiei find care are exact acest rol. x 4 y given x 3y x 5 xy. 3 find( x, y) Analiză statistică MathCad-ul ne oferă posibilitatea de a face o analiză a datelor şi de a testa modele posibile într-un mod simplu şi usor de folosit dacă cunoaştem matematica care se afla în spatele modelului. Estimarea, deducţia şi predicţia sunt posibile pentru orice model simulat. Cînd experimentăm modele posibile asociate fenomenelor economice trebuie luate decizii în funcţie de rezultatele obţinute în testarea ipotezelor statistice. In MathCad este suficient să formulăm ipoteza statistică, apoi măsurarea coincidenţei dintre valorile observate şi cele pe care ipoteza statistică le validează ca adevărate se face simplu calculînd statistica asociată ipotezei. Este necesar numai să traducem în formula potrivită ipoteza statistică. Avem un test statistic care este o funcţie a datelor observate. Tinînd cont că ipoteza nulă determină distribuţia de probabilitate a acelui test statistic care apoi determină probabilitate este simplu de construit orice test satistic. In cele ce urmează vom explora posibilităţile de analiză a validităţii unui model de regresie liniară pe care ni le ofera MathCad-ul. Si acestea sunt: estimatori după metoda celor mai mici pătrate, verificare ipotezelor modelului liniar, deducţii asupra parametrilor funcţiei liniare, măsura potrivirii modelului pentru datele observate, analiza tabelei varianţei pentru regresie. Datele folosite în exemplele de mai jos sunt: producţia industrială pi (variatie lunară,%), somajul somaj (rată lunară,%) si inflaţia inf (rată lunară,%) pentru perioada ianuarie - ianuarie.

Conditiile impuse de Modelul regresiei Liniare. Variabila dependenta Y este o functie liniara de X.. Variabila eroare ε este componenta aleatoarea a modelului linear. Valorile lui X sunt presupuse fixe. 3. Termenii eroare corespunzatori obsevatiilor sunt necorelati. In plus, pentru orice valori date pentru X, erorile sunt variabile aleatoare normal distribuite cu media zero si dispersie constanta Cautam cei mai buni estimatori pentruintersectia cu axa Ox (β) si panta dreptei (β), in cazul modelului regresiei liniare simple dat prin ecuatia: Y i β β. X i ε i Termenul εi pentru observatia, i, este diferenta masurata pe verticala, dintre punctele observate (X i, Y i ) si linia de regressie. Valuarea lui ε va fi positiva cind valorile observate se gasesc deasupra liniei de regresie si negativa cind se gasesc sub linie. Un exemplu: regresia inflatiei(inf) fata de productia industriala(pi) Reprezentarea grafica: y inf x pi n rows ( pi ) i.. n 4 y i x i Cum gasim aceasta dreapta? Prin metoda celor mai mici patrate. Suma patratelor Residualelor, SSE Vom folosi suma patratelor rezidualelor SSE b, b y i b b. x i i Putem obtine o solutia folosin metoda de rezolvare a sistemelor de ecuatii in Mathcad

Valori initiale: b b Blocul ecuatiilor Given nb. b. ( x ) y b. ( x ) b. x xy. b Find b, b b produce estimatorii pentru β si β b.55 b.4 pentru cele mai mici posibile sume de patrate, SSE b, b 8.58 SSE b., b. 8.77 Metoda celor mai mici patrate produce estimatorii cei mai buni - the best linear unbiased estimators (BLUE) - pentru coeficienti. Asta inseamna ca au dispersia minima. In Mathcad sunt dati de functiile: intercept x, y intercept ( ) slope ( x, y ) ( x, y ).55 slope ( x, y ).4 unde primul argument reprezinta variabilaindependenta. Spre deosebire de functia de corelatie ordinea argumentelor este esentiala! intercept ( x, y ) intercept ( y, x ) slope ( x, y ) slope ( y, x ) Linia de regresie pentru exemplu dat are ecuatia y lin ( x ) b b. x se vede pe grafic si de asemenea punctele observate si rezidualele. Punctul dat de valorile medii ale variabilelor aleatore: ( mean ( x ), mean ( y )) (indicat de un patrat) este de asemenea pe linia de regresie.

5 4 3 5 5 5 5 Valorile observate Linia de regresie Erorile Residuale (mean(x), mean(y)) Estimatori pentru Dispersia Erorilor Suma patratelor rezidualelor SSE poate fi folosita in estimarea dispersiei erorilor σ. Aceasta dispersie masoara imprastierea datelor observate fata de linia de regresie. Un estimator pentru σ in cazul unui esantion de lungime n este mean square error (MSE ), care se calculeaza impartind valuarea lui SSE prin (n - ) MSE SSE b, b n MSE.774 Aceasta definitie urmareste ideea ca dispersia este media sumei patratelor deviatiei fata de linie. Impartim prin (n - ) deoarece am estimat deja cei doi parametrii β si β. Un estimator pentru abaterea standard a erorilor σ este standard error of estimate se_e MSE se_e.88 x pi y inf Erorile reziduale, e, sunt date de: y lin ( x, y ) intercept ( x, y ) slope ( x, y ). x e y y lin ( x, y ) Si estimatorul pentru abaterea standard este deci se_e ( e ) e rows ( e ) se_e ( e ).88

Reziduale Standardizate standard_e ( e ) e se_e ( e ) standard_e ( e ).9 Reziduale Studentizate Un alt estimator pentru abaterea standard s a unei variabile X este: x i mean( x ) i.. n leverage. i leverage rows( x ) Var( x ).55 Ajustind rezidualele standardizate obtinem reziduale studentizate e i student_e i se_e ( e ) rows( x ) leverage i unde membrul drept este un estimator pentru abaterea standard a rezidualelor e i. Rezidualele studentizate sunt mai precise in sensul ca indica mai exact diferentele in dispersia erorilor. standard_e ( e ).9 student_e.7 Graficul Rezidualelor Daca datele urmeaza o relatie liniara atunci graficul rezidualelor standardizate (sau studentizate axa (y-axis) fata de valorile X sau fata de valorile previzionate de model nu vor prezenta nici un model evident ci vor fi repartizate aleator. 4 4 standard_e ( e ) i student_e i x i x i 4 standard_e ( e ) i.5.5 3 3.5 y lin ( x, y) i

Daca datele nu respecta modelul liniar reziduale vor prezenta grafic un model(pattern). De exemplu daca generam aleator un esantion de valori dintr-o o serie de date care urmeaza o functie exponentiala: n_esantion nr k.. n_esantion x exp rnd ( nr ) k Si de asemenea erori normale cu dispersia σ: σ ε rnorm ( n_esantion,, σ) y exp exp x exp ε e exp y exp y lin x exp, y exp obtinem urmatorul grafic 6 8 4 8 y exp k 8 8 5 5 x exp k si rezidualele 5 standard_e e exp k 5 5 5 x exp k Dispersia Erorilor Constanta Daca dispersia erorilor nu este constanta de la o valoare a lui X la alta, graficul rezidualelor va arata o repartizare crescatoare sau descrescatoare de la stinga la dreapta. Sa vedem un exemplu de care urmeaza o relatie liniara asa cum arata graficul lui Y fata de X si cum arata si coeficientul de corelatie: n_esantion nr k.. n_esantion x link rnd ( nr )

σ x lin ε k rnorm n_esantion,, σ k m 8 b y lin m. x lin b ε e lin y lin y lin x lin, y lin k y lin k 5 5 x lin k corr x lin, y lin.966 dispersia erorilor prezinta o tendinta de crestere de la stinga la dreapta. 5 standard_e e lin k 5 5 5 x lin k Corelatia Erorilor Putem verifica daca exista corelatie intre termenii alaturati in seria erorilor folosind statistica Durbin-Watson (DW ). e y y lin ( x, y ) rows ( e ) e d e d DW ( e ) d rows ( e ) e d d DW ( e ).867 Valori pentru statistica Durbin-Watson mai mici decit indica corelatie positiva pentru erori si valori mai mari decit o corelatie negativa. Totusi aceasta statistica nu poate da un raspuns decit pentru corelatia termenilor alaturati.

R masura pentru dependenta cauzala intre variabila independenta si cea dependenta Dependenta dintre variabile se poate exprima prin covarianta E X µ. x Y µ y care de obicei se calculeaza normalizat prin coeficientul de corelatie ρ, ρ E X µ. x Y µ y σ. x σ y rows ( pi ) i ρ pi.inf pi i µ. pi inf i µ inf σ. pi σ inf. n ρ pi.inf.38 corr ( pi, inf ).38 rows ( pi ) 6 y inf x pi Erorile reziduale, e, sunt date de: y lin ( x, y) intercept ( x, y ) slope ( x, y ). x e y y lin ( x, y) Si estimatorul pentru abaterea standard este deci se_e ( e ) e rows ( e ) se_e ( e ).88 R pi.inf ( e ) R pi.inf. ( y mean ( y )) Ipoteza statistica H : β se poate testa folosind statistica t t b se_b ( x, y ) urmeaza o distributie t student cu(n - ) grade de libertate. Valuarea se_b(x,y) este abaterea standard a erorii pentru parametrul b se_b ( x, y ) se_e ( e ) se_b ( x, y ).4 ( x mean ( x )) t x, y, β slope ( x, y ) β se_b ( x, y ) t( x, y, ).643 Să incercăm şi o regresie multiplă. Datele folosite sunt producţia industrială pi (variaţie lunară,%), şomajul şomaj (rată lunară,%) şi inflaţia inf (rată lunară,%) pentru perioada ianuarie - ianuarie. In ordinea dată ele se regăsesc şi in matricea DATE.

Variabila dependenta inflatia, adica : y DATE < > marimea esantionului: n rows ( DATE ) Numarul coloanelor ce reprezinta variabilele indepedente(productia industriala si somajul): x_col p rows ( x_col ) p Matricea X a variabilelor indepedente: X for for X i.. n X i, j x_col X < j > DATE < j > Vectorul parametrilor estimati: b X T X.. X T. y Ecuatia regresiei si erorile reziduale ylin X. b e y ylin Suma patratelor erorilor si abaterilor: SSE e T. e suma patratelor erorilor suma patratelor abaterii date de regresie: SSR ( ylin mean ( y ) ) T. ( ylin mean ( y ) ) suma patratelor abaterii/deviatiei totale SST SSE SSR Gradele de libertate Cum avem (p + ) parametrii de estimat avem grl_erori n ( p ) grl_erori 3 grade de libertate asociate cu suma patratelor erorilor. Suma patratelor abaterii/deviatiei date de regresie are grl_regresie p grl_regresie grade de libertate deoarece in formula sunt p variabile independente.

Suma patratelor abaterii/deviatiei totale are grl_total n grl_total 5 grade de libertate si grl_erori grl_regresie grl_total Pentru a estima dispersia impartim suma patratelor la nr. de grade de libertate. Media abaterilor patratice pentru erorile reziduale MSE SSE grl_erori este o estimatie pentru dispersia erorilori σ, sau abaterea neexplicata de regresie. (Vom identifica SSE ca fiind primul element din vector.) Alti doi estimatori pentru dispersia care este explicata de modelul regresiei respectiv dispersia totala sunt: MSR SSR grl_regresie MST SST grl_total Testul F In cazul ipotezei nule H : nu avem model de tip regresie multipla MSR statistica F MSE grade de libertate. are o distributiie F cu n grl_regresie si n grl_erori Valuarea p-value a testului este data de : p_val pf ( F, n, n ) p_val.63 R SSR SST si R_ajustat MSE MST dau masura potrivirii modelului de regresie liniara. Analiza Abaterilor GradeLibertate SS MS F R grl_regresie SSR 4.48 MSR.4 F 3.7 R.3 grl_erori 3 SSE 6.6 MSE.77 p-value R_ajustat.45 grl_total 5 SST.67 MST.87 p_val.63 Abaterea explicata de regresia liniara ( MSR) este mai mare decit cea datorata erorilor reziduale (MSE). Diferenta este destul de mare (valoarea p-value este suficient de mica) pentru a respinge ipoteza nula.

Corelatia dintre variabilele modelului este data in matricea CORR j.. p k.. p CORR jk, corr DATE <> j, DATE < k > CORR x x x3.68.38.68.37.38.37 x x x3 Cea mai mare valoare a corelatiei dintre variabilele independente este cea intre variabilele (x and x ) Teste T CORR.68, b.5.5 unde b.96 b b b Forma statisticii t este aceeasi ca si in cazul regresiei simple. In ipoteza nula, urmeaza o distributie t student cu (n - ) grade de libertate. Valuarea se_b este abaterea standard a erorii pentru parametrul b t b se_b Matricea Varianta-Covarianta pentru Parametrii Estimati Fiecare estimatie are o dispersie/varianta dar si o covarianta cu fiecare dintre celelalte estimatii. Acestea se pot reprezenta intr-o matrice Var_Covar_b data de σ. X T X Putem estima varianta necunoscuta σ prin abaterea medie patratica "mean square error: ( MSE),. Var_Covar_b X T. X. MSE b b b Var_Covar_b.554.685.685.589.95.73.95.73.67 Var_Covar_b 6.85 3, este covarianta dintre b si b. Pe diagonala matricii este varianta/dispersia estimata a coeficientilor. Var_Covar_b 5.89 4, este o estimatie a variantei/dispersiei lui b.

Erorile Standard ale Parametrilor Estimati Prin definitie vectorul cu erorilor standard ale parametrilor estimati poate fi obtinuta astfel: k.. p.9 se_b k Var_Covar_b k, k se_b.4.8 Statistica T t b se_b t.467.4.8 Considerind ipoteza nula, H : β k k,,,..., p, fiecare test statistic urmeaza o distributie t student cu n ( p ) 3 grade de libertate, egal cu nr. de grade de libertateal rezidualelor grl_erori 3 Valuarea corespunzatoare p-value poate fi calculata astfel:. t k > p_t k pt t k, grl_erori. pt t k, grl_erori otherwise if Tabelul Coeficientilor Regresiei b.5.9.467.645 b b.5 se_b.4 t.4 p_t.43 b.96.8.8.83 Pentru un nivel de semnificatie α j.5 vom respinge ipoteza nula privind neimportanta pentru model a variabilei pentru care conditia este intercept cond j ( α j p_t j ) cond Daca conditiile impuse de model sunt indeplinite si nu avem multicoliniaritate, cu un nivel de semnificatie α.5 vom pastra in model variabila x si vom exclude x. x x

Daca incercam un model de tip inf β β. pi β. somaj ε x DATE < > n rows ( DATE < > ) x DATE < > i.. n y DATE < > Modelul este y β β. x β. x ε este intrinsec nelinear deoarece parametrii apar ca puteri, deci neliniar. In aceste cazuri intrinsec neliniare putem aplica metoda celor mai mici patrate. b b Given i i. y i. b. b. x i. b. x i. y i b b. x i b. x. i x i. b. x i b Find b, b b b.58 b.4 si calculam SSY y SSY 8.67 cu n grade de libertate grl_total n SSE y b b. x b. x SSE 8.54 cu n-p grade de libertate grl_erori n p Pentru variatia explicata de model avem SSR, SSR SSY SSE SSR 64.3 cu p grade de libertate grl_regresie p MSE SSE grl_erori MSR SSR grl_regresie Analiza tabelului variatiilor Grade Libertate SS MS grl_regresie SSR 64.3 MSR 8.65 grl_erori 4 SSE 8.54 MSE.773 grl_total 6 SSY 8.67

Matricea Varianta-Covarianta Jacobianul: d, b b. x i b. x i d b J i d, b b. x i b. x i d b J i si inmultind cu media patratelor erorilor obtinem matricea Var_Covar MSE J T.. J Var_Covar.6.869 4.869 4 5.633 4 Luam apoi radacina patratica din elementele de pe diagonala pentru a obtine erorile standard pentru parametrii estimati j.. p se j Var_Covar j, j se.6.4 ca apoi sa formam intervalele de confidenta pentru b, α t.5 t qt α t, grl_erori int_stinga b b tse. int_dreapta b b tse. si apoi pentru b, int_stinga b b tse. int_dreapta b b tse. Avem α t 95 % siguranta, ca valuarea lui β se afla intre valorile int_stinga b.76 si int_dreapta b.84 si ca valuarea lui β se afla intre valorile Parametrii Estimati int_stinga b.9 si int_dreapta b 7.99 3 Erorile Standard Intervalele de incredere b.58 se.6 int_stinga b.76 int_dreapta b.84 b.4 se.4 int_stinga b.9 int_dreapta b 7.99 3 Cum intervalul prntru b contine valoarea concluzionam ca acest parametru nu este semnificativ pentru model. Deci modelul nu este potrivit.

Bibliografie *** MathCad Resource Center Robert S Pindyck, Daniel L. Rubinfield Econometric Models and Econometric Forecasts, McGraw-Hill,Inc., International Edition 99 Edmond Malinvaud Methodes statistiques de l econometrie, editura Dunod, 964 George Daniel Mateescu Bazele utilizarii calculatoarelor, Editura Donaris 4