ANALIZA DATELOR EXPERIMENTALE

Σχετικά έγγραφα
(a) se numeşte derivata parţială a funcţiei f în raport cu variabila x i în punctul a.

Curs 10 Funcţii reale de mai multe variabile reale. Limite şi continuitate.

Curs 14 Funcţii implicite. Facultatea de Hidrotehnică Universitatea Tehnică "Gh. Asachi"

5. FUNCŢII IMPLICITE. EXTREME CONDIŢIONATE.

Metode iterative pentru probleme neliniare - contractii

Integrala nedefinită (primitive)

SEMINAR 14. Funcţii de mai multe variabile (continuare) ( = 1 z(x,y) x = 0. x = f. x + f. y = f. = x. = 1 y. y = x ( y = = 0

NOTIUNI DE BAZA IN STATISTICA

III. Serii absolut convergente. Serii semiconvergente. ii) semiconvergentă dacă este convergentă iar seria modulelor divergentă.

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor X) functia f 1

V.7. Condiţii necesare de optimalitate cazul funcţiilor diferenţiabile

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor

Planul determinat de normală şi un punct Ecuaţia generală Plane paralele Unghi diedru Planul determinat de 3 puncte necoliniare

a n (ζ z 0 ) n. n=1 se numeste partea principala iar seria a n (z z 0 ) n se numeste partea

9 Testarea ipotezelor statistice

DISTANŢA DINTRE DOUĂ DREPTE NECOPLANARE

8 Intervale de încredere

prin egalizarea histogramei

MARCAREA REZISTOARELOR

Curs 1 Şiruri de numere reale

Analiza în curent continuu a schemelor electronice Eugenie Posdărăscu - DCE SEM 1 electronica.geniu.ro

Modelarea şi Simularea Sistemelor de Calcul Distribuţii ( lab. 4)

Aplicaţii ale principiului I al termodinamicii la gazul ideal

Seminariile Capitolul X. Integrale Curbilinii: Serii Laurent şi Teorema Reziduurilor

7 Distribuţia normală

Metode de interpolare bazate pe diferenţe divizate

Subiecte Clasa a VIII-a

Curs 4 Serii de numere reale

Scoruri standard Curba normală (Gauss) M. Popa

Subiecte Clasa a VII-a

Componente şi Circuite Electronice Pasive. Laborator 4. Măsurarea parametrilor mărimilor electrice

Zgomotul se poate suprapune informaţiei utile în două moduri: g(x, y) = f(x, y) n(x, y) (6.2)

Statisticǎ - curs 3. 1 Seria de distribuţie a statisticilor de eşantioane 2. 2 Teorema limitǎ centralǎ 5. 3 O aplicaţie a teoremei limitǎ centralǎ 7

Sisteme diferenţiale liniare de ordinul 1

Laborator 11. Mulţimi Julia. Temă

5.5. REZOLVAREA CIRCUITELOR CU TRANZISTOARE BIPOLARE


R R, f ( x) = x 7x+ 6. Determinați distanța dintre punctele de. B=, unde x și y sunt numere reale.

Câmp de probabilitate II

Problema a II - a (10 puncte) Diferite circuite electrice

a. 11 % b. 12 % c. 13 % d. 14 %

I3: PROBABILITǍŢI - notiţe de curs

Orice izometrie f : (X, d 1 ) (Y, d 2 ) este un homeomorfism. (Y = f(x)).

RĂSPUNS Modulul de rezistenţă este o caracteristică geometrică a secţiunii transversale, scrisă faţă de una dintre axele de inerţie principale:,

Erori si incertitudini de măsurare. Modele matematice Instrument: proiectare, fabricaţie, Interacţiune măsurand instrument:

I3: PROBABILITǍŢI - notiţe de curs


CONCURSUL DE MATEMATICĂ APLICATĂ ADOLF HAIMOVICI, 2017 ETAPA LOCALĂ, HUNEDOARA Clasa a IX-a profil științe ale naturii, tehnologic, servicii

Definiţia generală Cazul 1. Elipsa şi hiperbola Cercul Cazul 2. Parabola Reprezentari parametrice ale conicelor Tangente la conice

Elemente de bază în evaluarea incertitudinii de măsurare. Sonia Gaiţă Institutul Naţional de Metrologie Laboratorul Termometrie

Conice. Lect. dr. Constantin-Cosmin Todea. U.T. Cluj-Napoca

COLEGIUL NATIONAL CONSTANTIN CARABELLA TARGOVISTE. CONCURSUL JUDETEAN DE MATEMATICA CEZAR IVANESCU Editia a VI-a 26 februarie 2005.

3. Momentul forţei în raport cu un punct...1 Cuprins...1 Introducere Aspecte teoretice Aplicaţii rezolvate...4

Masurarea variabilitatii Indicatorii variaţiei(împrăştierii) lectia 5 16 martie 2 011

5.4. MULTIPLEXOARE A 0 A 1 A 2

Cursul Măsuri reale. D.Rusu, Teoria măsurii şi integrala Lebesgue 15

Stabilizator cu diodă Zener

Functii Breviar teoretic 8 ianuarie ianuarie 2011

Componente şi Circuite Electronice Pasive. Laborator 3. Divizorul de tensiune. Divizorul de curent

V O. = v I v stabilizator

TEMA 9: FUNCȚII DE MAI MULTE VARIABILE. Obiective:

Capitolul 4. Integrale improprii Integrale cu limite de integrare infinite

Seminar 5 Analiza stabilității sistemelor liniare

SERII NUMERICE. Definiţia 3.1. Fie (a n ) n n0 (n 0 IN) un şir de numere reale şi (s n ) n n0

riptografie şi Securitate

2.1 Sfera. (EGS) ecuaţie care poartă denumirea de ecuaţia generală asferei. (EGS) reprezintă osferă cu centrul în punctul. 2 + p 2

f(x) = l 0. Atunci f are local semnul lui l, adică, U 0 V(x 0 ) astfel încât sgnf(x) = sgnl, x U 0 D\{x 0 }. < f(x) < l +

VII.2. PROBLEME REZOLVATE

2. Sisteme de forţe concurente...1 Cuprins...1 Introducere Aspecte teoretice Aplicaţii rezolvate...3

Asupra unei inegalităţi date la barajul OBMJ 2006

DistributiiContinue de Probabilitate Distributia Normala

PRELEGEREA XII STATISTICĂ MATEMATICĂ

Recapitulare - Tipuri de date

1. PROPRIETĂȚILE FLUIDELOR

3 Distribuţii discrete clasice

Ovidiu Gabriel Avădănei, Florin Mihai Tufescu,

Curs 2 DIODE. CIRCUITE DR

* K. toate K. circuitului. portile. Considerând această sumă pentru toate rezistoarele 2. = sl I K I K. toate rez. Pentru o bobină: U * toate I K K 1

CURS XI XII SINTEZĂ. 1 Algebra vectorială a vectorilor liberi

z a + c 0 + c 1 (z a)

Transformata Laplace

Valori limită privind SO2, NOx şi emisiile de praf rezultate din operarea LPC în funcţie de diferite tipuri de combustibili

REDRESOARE MONOFAZATE CU FILTRU CAPACITIV

a. Caracteristicile mecanice a motorului de c.c. cu excitaţie independentă (sau derivaţie)

Teme de implementare in Matlab pentru Laboratorul de Metode Numerice

POPULAŢIE NDIVID DATE ORDINALE EŞANTION DATE NOMINALE

Laborator 6. Integrarea ecuaţiilor diferenţiale

Exemple de probleme rezolvate pentru cursurile DEEA Tranzistoare bipolare cu joncţiuni

Lucrul mecanic. Puterea mecanică.

Criptosisteme cu cheie publică III

EDITURA PARALELA 45 MATEMATICĂ DE EXCELENŢĂ. Clasa a X-a Ediţia a II-a, revizuită. pentru concursuri, olimpiade şi centre de excelenţă

Laborator biofizică. Noţiuni introductive

Toate subiectele sunt obligatorii. Timpul de lucru efectiv este de 3 ore. Se acordă din oficiu 10 puncte. SUBIECTUL I.

Capitolul 4 PROPRIETĂŢI TOPOLOGICE ŞI DE NUMĂRARE ALE LUI R. 4.1 Proprietăţi topologice ale lui R Puncte de acumulare

Esalonul Redus pe Linii (ERL). Subspatii.

Analiza bivariata a datelor

3. I. Mihoc, C. Fătu, Calculul probabilităţilor şi statistică matematică, Transilvania Press, Cluj-Napoca, 2003

ESTIMAREA PARAMETRILOR STATISTICI. Călinici Tudor

4. Măsurarea tensiunilor şi a curenţilor electrici. Voltmetre electronice analogice

Vectori liberi Produs scalar Produs vectorial Produsul mixt. 1 Vectori liberi. 2 Produs scalar. 3 Produs vectorial. 4 Produsul mixt.

Transcript:

INGINERIA TRAFICULUI 1-1 Lucrarea IT-1 ANALIZA DATELOR EXPERIMENTALE - Testul Kolmogorov-Smirnov - Un eperiment (fenomen) a cărui realizare diferă semnificativ atunci când este repetat în aceleaşi condiţii se numeşte eperiment aleatoriu. El poate fi modelat dacă realizările sale se caracterizează prin regularitate statistică (de eemplu, dacă mediile rezultatelor obţinute în secvenţe lungi de repetări ale eperimentului au, aproimativ, aceeaşi valoare). Un model este o reprezentare aproimativă care descrie şi eplică, cu ajutorul unui set de reguli simple şi intuitive, principalele aspecte ce caracterizează un fenomen real, aflat sub observaţie. Un model matematic este probabilistic atunci când condiţiile de efectuare a eperimentului vizat determină eact caracteristicile acestuia. Un eperiment aleatoriu, care poate fi eprimat prin intermediul unei variabile aleatorii, este caracterizat complet prin intermediul funcţiei de distribuţie sau funcţiei densitate de probabilitate, dacă variabilele aleatorii sunt continue, sau prin intermediul probabilităţilor elementare, în cazul variabilelor aleatorii discrete. 1.1. Variabile aleatorii, funcţii şi mărimi matematice asociate În teoria probabilităţilor şi statistică, funcţie de distribuţie, FX ( ), cdf (cumulative distribution function) în terminologie anglo-saonă, descrie complet probabilităţii unei variabile aleatorii X. Epresia de definiţie este referitoare la apariţia unui eveniment { X }, şi anume: FX ( ) = P { X } R, (1.1) în care, partea dreaptă reprezintă probabilitatea ca variabila aleatorie X să ia o valoare mai mică sau cel mult egală cu o valoare de referinţă. O variabilă aleatoare X este variabilă aleatorie continuă dacă cdf este continuă peste tot şi poate fi definită ca o integrală dintr-o funcţie pozitivă f : F X ( ) = f ( t) dt (1.) O variabilă aleatorie X este variabilă aleatorie discretă dacă F X este sub formă de scară, continuă la dreapta, având o mulţime măsurabilă (finită sau infinită) de puncte de salt, 1,,. Aceste puncte reprezintă spaţiul de eşantionare S X. În acest caz funcţia de distribuţie se poate eprima ca o sumă ponderată de funcţii treaptă unitate: FX( ) = px ( ) u( ) (1.3) unde p X ) = P[ X = ] elementar { X = }. ( este probabilitatea elementară de apariţie a unui eveniment O variabilă aleatorie X este variabilă aleatorie mită dacă funcţia sa de distribuţie F X are, pe lângă o mulţime de salturi în punctele, 1,,, cel puţin un interval pe care evoluează continuu. Pentru caracterizarea unei variabile aleatorii se mai poate folosi şi funcţia de densitate a probabilităţilor, pdf (probability density function), notată prin f X şi care este derivata funcţiei de distribuţie F X, adică: f X ( ) = d F X ( ) d (1.4) Funcţia f X reprezintă o densitate de probabilitate întrucât probabilitatea ca variabila aleatorie X să apară în vecinătatea (, + d) a unui punct. Pentru o caracterizare parţială a variabilelor aleatorii se utilizează momentele de

INGINERIA TRAFICULUI 1- ordinul n, dintre care cele mai importante sunt precizate în continuare. Valoarea aşteptată, E [ X ], sau media, m, a unei variabile aleatorie X, notată şi prin simbolul X, este dată de relaţile: + - în cazul continuu: E [ X ] = t f X ( t)dt (1.5) - în cazul discret: E [ X ] = p ( ) X (1.6) Deviaţia, D, a variabilei aleatorie X faţă de medie este: Varianţa (dispersia), D = X E[ X] (1.7) σ, a variabilei aleatorie X, notată şi VAR [ X ] [ X] D ( X [ X] ), este: σ = VAR = E = E E Deviaţia standard (abaterea medie pătratică) a variabilei aleatorie X este: not STD [ X ] VAR [ X ] Coeficientul de variaţie a variabilei aleatorie X este: (1.8) σ= = (1.9) CX =STD [ X] E [ X ] (1.1) 1.. Distribuţii uzuale folosite în ingineria traficului Căutarea unor modele probabilistice care să aproimeze satisfăcător diverse fenomene cu caracter aleatoriu a condus la identificarea de diverse distribuţii. Cele mai uzuale distribuţii folosite în domeniul telecomunicaţiilor sunt: Bernoulli, binomială, geometrică, Poisson, gaussiană (normală), eponenţială, gama, Pareto, χ, m-erlang etc. descrierea lor completă, cu specificarea elementelor caracteristice (condiţii de valabilitate, spaţiu de eşantionare, cdf / pdf, valori aşteptate etc.), fiind prezentată în capitolul din [MEP]. Pentru rezolvarea cerinţelor impuse de conţinutul lucrărilor de laborator, în tabelul 1.1 sunt concentrate elementele de interes doar pentru câteva dintre ele. eponenţială gama gaussiană (normală) Poisson geometrică parametri medie E[ X ] Tabelul 1.1 varianţă VAR[ X ] λ> 1 λ 1 λ α > şi λ> α λ α λ µ şi σ µ σ pdf / probabilităţi elementare λ f X ( ) = λ e α 1 λ λ ( λ ) e f X ( ) = Γ( α) 1 ( µ ) fx ( ) = ep, σ> π σ σ α> α α px ( ) =α e! N p( p 1) (1 p) p 1.3. Testul Kolmogorov-Smirnov α p ( ) X = p ( 1 p) (1 p) p N Pentru identificarea modelului matematic care aproimează cel mai bine un anumit eperiment se recurge totdeauna la analiza şi interpretarea rezultatelor eperimentale, folosind diverse metode, care sunt fie de natură calitativă, cum este metoda histogramei, fie de natură cantitativă, cum sunt testele χ şi Kolmogorov-Smirnov ([MEP] 5.3-5). Testul Kolmogorov-Smirnov, notat prin K-S, operează asupra diferenţelor ce apar

INGINERIA TRAFICULUI 1-3 între funcţia empirică, de distribuţie, obţinută pe baza unui eşantion de rezultate şi funcţia analitică luată în considerare. Din acest motiv, testul K-S se pretează doar situaţiilor în care funcţia analitică de distribuţie este continuă. Fie o variabilă aleatorie continuă cu o distribuţie necunoscută F ( ) şi o funcţie de distribuţie ipotetică CDF ce pare a fi asemănătoare cu variabilei de analizat. Se doreşte testarea ipotezelor: - H : variabila X are CDF, adică F( ) = CDF( ) pentru orice - H 1: variabila X nu are CDF, adică F( ) CDF( ) cel puţin pentru un Testarea ipotezei se face prin intermediul unei "statistici", anume o valoare d rezultată în urma unui calcul ce ia în considerare un anumit eşantion de rezultate. Relaţia de calcul este: D = sup < < S( ) CDF( ) (1.11) în care: S ( ) reprezintă empirică a unui eşantion oarecare calculat cu epresia număr de valori S ( ) = (1.1) n D este o variabilă aleatorie care reprezintă diferenţa maimă dintre empirică S ( ) şi cea ipotetică CDF( ). Figura 1.1 prezintă o distribuţie empirică S ( ), corespunzătoare unui eşantion de rezultate, o distribuţie ipotetică, CDF( ) şi o valoare particulară, d, a variabilei aleatorii D. 1.9.8.7.6 Empirică Normală Ipotetică d CDF.5.4.3..1 - -1 1 3 Figura 1.1: Eemplu de funcţii de distribuţie folosite în testul K-S pentru o anumită funcţie empirică de distribuţie şi distribuţie ipotetică asociată Luând în considerare valoarea d şi ipoteza H se poate calcula o valoare, numită valoare p" (p value), care eprimă gradul de credibilitate a ipotezei. Concret, valoarea p este probabilitatea ca, în condiţiile considerării ipotezei H adevărate, statistica unui eşantion oarecare de rezultate, D, să fie cel puţin egală cu statistica eşantionului curent de rezultate, adică: valoarea p = P [ D d] (1.13) Putem considera că valorile mari ale "valorii p" presupun că abaterea rezultată se datorează aleatoriului, iar valorile mici au drept cauză considerarea unei ipoteze H falsă. Prin urmare, având în vedere un nivel probabilistic semnificativ, α (uzual de valoare,5): se respinge dacă: valoarea p α, pentru teste de o singură parte (one-sided test) valoarea p α, pentru teste de ambele părţi (two-sided test) se acceptă în caz contrar.

INGINERIA TRAFICULUI 1-4 fd () valoarea p α α fd () valoarea p α d t α t α t α d One-sided test Two-sided test Conform figurii 1., testul K-S de o singură parte vizează statistici de genul: ma S( ) CDF( ) ma CDF( ) S( ) (1.14) [ ] sau [ ] iar testul K-S de ambele părţi ia în considerare statistica: ma CDF( ) S( ) (1.15) Mărimea t α reprezintă deviaţia critică a cărei valoare depinde de nivelul probabilistic semnificativ şi de dimensiunea eşantionului de rezultate [MEP]. Luând în considerare această mărime: se respinge dacă d t α se acceptă în caz contrar. Pentru ca testul K-S să fie edificator trebuie ca numărul de observaţii, n, să se aleagă suficient de mare, uzual 1, astfel încât funcţiile empirice să fie cât mai "fine", cu cât mai multe trepte, ceea ce asigură o cantitate suficientă de valori ale diferenţelor, ce pot fi comparate. 1.4. Aplicaţii practice Figura 1.: Cazuri de acceptare a ipotezei H Aplicaţia 1.1 Scrieţi un program Matlab care să permită compararea grafică a funcţiilor de distribuţie, cdf, şi densitate a probabilităţilor, pdf, în cazul distribuţiilor gaussiene, gama şi eponenţiale, folosind acelaşi valori pentru parametrii specifici acestor distribuţii. Compararea se va face ilustrând în aceeaşi figură curbele cdf, respectiv pdf, ce corespund celor 3 distribuţii analizate. Analizaţi influenţa mărimilor alese pentru parametri asupra valorilor probabilităţilor din fiecare distribuţie. Indicaţii: - se defineşte spaţiul realizărilor: =...; - se calculează valorile funcţiilor de distribuţie şi de densitate de probabilitate pentru variabile de tipul Gauss, gama şi eponenţial având aceeaşi medie, m = 4, şi următorii coeficienţi de variaţie: 1,, 4 (vezi help cdf şi help pdf). - se trasează pe acelaşi grafic (vezi help plot şi help hold) curbele privind funcţiile de distribuţie, respectiv de densitate de probabilitate, considerate. Aplicaţia 1. Considerând eperimentul "aruncarea cu moneda de de ori" să se verifice ipoteza "feţele monedei sunt echiprobabile" dacă: - nivelul probabilistic semnificativ considerat este α =,5, - s-a obţinut de 14 ori aceeaşi faţă, - statistica avută în vedere este D = ma ( H_no, T_no) 1, unde H _no este numărul de feţe "Head", iar T _no este numărul de feţe "Tail". Reluaţi aplicaţia dacă aceeaşi faţă apare de 15 ori. Indicaţie: - Se calculează "valoarea p ", notată în program p_val, ţinând cont că o aruncare individuală cu banul este caracterizată, din punct de vedere probabilistic, de o distribuţie Bernoulli de parametru p, care reprezintă şansa apariţiei unei anumite feţe, iar aruncarea

INGINERIA TRAFICULUI 1-5 repetată cu banul are ca model probabilistic binomială, de parametri: n numărul de repetări şi p cu aceeaşi semnificaţie ca mai sus [MEP]. - Se compară p_val obţinută cu nivelul probabilistic semnificativ considerat şi se ia decizia corespunzătoare privind credibilitatea ipotezei. Aplicaţia 1.3 Stabiliţi funcţia de distribuţie a probabilităţilor pentru durata de ocupare a unui canalul de transmisiuni. Rezultatele observaţilor efectuate asupra canalului sunt conţinute în fişierul data1.tt. Realizaţi analiza datelor eperimentale cu ajutorul testului Kolmogorov-Smirnov, considerând ca funcţii etalon distribuţiile Gauss-normală, eponenţială şi gama. Reprezentaţi grafic curbele corespunzătoare distribuţiei empirice şi distribuţiilor etalon pentru o apreciere calitativă, prin vizualizarea "potrivirilor". Pentru decizia cantitativă şi decisivă se va utiliza funcţia Matlab stest pentru diferite niveluri semnificative de decizie. Comentaţi rezultatele obţinute. Indicaţii: Se încărcă datele eperimentale, folosind instrucţiunea r = load ('data1.tt'), unde r reprezintă vectorul valorilor înscrise în fişierul data1.tt. Se desenează empirică corespunzătoare vectorului r (vezi cdfplot, grid) Se calculează valorile caracteristice ale eşantionului de valori cu ajutorul următoarelor funcţii: mean şi std. Aceste valori se atribuie parametrilor distribuţiilor etalon considerate (vezi şi tabelul 1.1 sau [MEP]). Pentru ca testul K-S să fie corect realizat, compararea valorilor eperimentale cu cele teoretice trebuie să se facă pentru acelaşi valori cuprinse în vectorul r, care suplimentar trebuie (vezi help stest) să fie ordonate în sens crescător (vezi help sort). Se obţine astfel vectorul Se construiesc vectorii care conţin valorile funcţiilor teoretice de distribuţie (CDF) în punctele cuprinse în (vezi cdf) Se trasează suprapus peste curba anterioară cele trei funcţii teoretice de distribuţie pentru analiza comparativă Se eecută testul K-S, pentru fiecare CDF etalon, considerând implicit nivelul semnificativ ( α=,5 ), folosind instrucţiunea : [h,p,d,ta] = stest(,[ y]) în care: reprezintă vectorul valorilor ordonate ale eşantionului, iar în care: y conţine valorile funcţiei CDF în punctele conţinute în vectorul. Bibliografie [MEP] L. Ioan, G. Niculescu, Modelare şi evaluări de performanţă în telecomunicaţii, Ed. MatriRom, Bucureşti, 8