Matematici speciale Seminar 0 Mai 07
ii
Ştiinţa se clădeşte cu fapte, aşa cum o casă se construieşte cu pietre. Dar o colecţie de fapte nu e ştiinţă, la fel cum un morman de pietre nu e o casă. Henri Poincaré 0 Variabile aleatoare continue In secolul al XVIII-lea teoria jocurilor de noroc era la inceputurile sale. Matematicianul Abraham de Moivre era printre altele si un consultant al unor jucatori de jocuri de noroc, fiind deseori pus sa calculeze probabilitati de tipul: care sunt sansele sa obtinem intre 50 si 80 de ori stema cand aruncam o moneda de 00 de ori?. La o reprezentare grafica a numarului de aruncari N si probabilitatile aferente a obtinut urmatoarele situatii:
iar pentru N = aruncari un fenomen incepe sa se contureze... Aparent probabilitatile de obtinere a stemei par a se situa pe o curba simetrica si de Moivre spunea ca daca am sti functia care da aceasta curba am putea sa estimam usor probabilitatile cerute. De fapt el a observat ceea ce numim astazi aproximarea normala a variabilelor aleatoare binomiale:
iar functia care genereaza acesta curba numita clopotul lui Gauss este: f N (x) = e (x N) N. N Avand aceste informatii putem calcula: P (50 X 80) = 80 50 f N (x)dx dar aceasta integrala nu poate fi calculata prin metode elementare caci o primitiva a integrandului nu este o combinatie de functii elementare... 3
Notiuni teoretice: O variabila aleatoare continua poate avea ca valori orice numar dintr-un interval dat, de exemplu: variabila aleatoare X care masoara timpul necesar pentru a realiza ceva. X este o variabila aleatoare continua daca exista o functie f(x) (numita densitatea de repartitie) astfel ca a b : P (a X b) = b a f(x)dx densitatea de repartitie satisface proprietatile definitorii f(x)dx = si f(x) 0 Functia de repartitie definita ca F (x) := P (X < x) are urmatoarele proprietati: iar daca F este continua: P (a X < b) = F (b) F (a) P (a X < b) = P (a X b) = P (a < X < b) = P (a < X b) = F (b) F (a) F (x) = f(x) x F (x) = f(t)dt F (x ) F (x ) daca x < x lim F (x) = si lim F (x) = 0 x x Valoarea medie M(X) si dispersia D (X) unei variabile aleatoare continue cu densitatea de repartitie f(x) se calculeaza prin: D (X) = M(X) = xf(x)dx, (x M(X)) f(x)dx Momentele de ordin k notate prin M k sunt: M k (X) = si momentele centrate de ordin k: m k (X) = daca X are densitatea de repartitie: f(x) = { b a, x k f(x)dx (x M(X)) k f(x)dx 0, in rest 4 daca x [a, b]
atunci spunem ca X are distributia uniform continua si scriem X U(a, b). daca X are densitatea de repartitie: f(x) = (x m) e atunci spunem ca X are distributia normala si scriem X N(m, ). pentru o astfel de variabila avem M(X) = m si D (X) =. O variabila cu distributia normala standard Z este o variabila normal distribuita corespunzatoare valorilor m = 0 si =, Z N(0, ). functia ei de repartitie este: Φ(x) = si are valorile intr-un tabel al scorurilor z. e t dt Argumentul de standardizare pentru o variabila X N(m, ) au loc relatiile: x m P (x X x ) = P Z x ) ) ) m x m x m = Φ Φ X m unde Z := este o variabila aleatoare cu distributia normala standard ) ) x m x m iar valorile Φ, Φ se citesc din tabelul scorurilor z. de fapt, identitatile de mai sus afirma ca valorile functiei de repartitie a unei variabile aleatoare normal distribuita se calculeaza prin: X N(m, ) ) x m F X (x) = Φ Aproximari normale ale unor variabile aleatoare discrete daca X este o variabila aleatoare cu distributie binomiala X Bi(n, p) si n este suficient de mare, atunci X poate fi aproximata printr-o variabila aleatoare normal distribuita Y N(np, np( p)) si se aplica si corectiile de continuitate: P (X = k) P k < Y < k + ) P (X < k) P Y < k + ) P (X k) P Y < k + ) P (X > k) P Y > k ) daca X este o variabila aleatoare cu distributie Poisson de parametru λ si λ este mare, atunci X poate fi aproximata printr-o variabila aleatoare normal distribuita Y N(λ, λ) se aplica aceleasi corectii de continuitate 5
Vectori aleatori pentru a modela matematic unele experimente este nevoie de mai mult decat o variabila aleatoare vom prezenta mai jos situatia in care avem nevoie de doua variabile, despre care spunem ca formeaza un vector aleator (X, Y ) functia de probabilitate a unui vector aleator (X, Y ) este o functie f X,Y (x, y) cu proprietatea: si: P (a X b, F X,Y (x, y) = y f X,Y (u, v)dudv c Y d) = F X.Y (b, d) F X.Y (b, c) F X.Y (a, d) + F X.Y (a, c) = b d a c f X,Y (x, y)dydx pentru variabile aleatoare independente: f X,Y (x, y) = f X (x) f Y (y) probabilitatea unui eveniment A este: P (A) = f X,Y (x, y)dxdy functiile de probabilitate marginale sunt: f X (x) = A f X,Y (x, y)dy, f Y (y) = f X,Y (x, y)dx 6
Probleme rezolvate Problema. Variabila aleatoare X are densitatea de repartiţie 0, dacă x sau x f (x) =., dacă < x < a) Să se afle funcţia de repartiţie corespunzatoare. b) Să se determine densităţile de repartiţie ale variabilelor aleatoare Y = e X, Z = X +. Solutie: a) Se observă că f este densitate de repartiţie, deoarece f (x) dx = dx = x =. Funcţia de repartiţie corespunzătoare este 0, x F (x) = f (t) dt = x+, < x, < x, deoarece x F (x) = 0dt = 0, x [, ] F (x) = < x F (x) = 0dt + 0dt + dt = x + = x +, dt + 0dt =. b) Determinăm funcţia de repartiţie G (x) a variabilei aleatoare Y. Intrucat Y > 0 pentru orice x 0 avem G (x) = P (Y < x) = 0. Dacă x > 0 atunci G (x) = P (Y < x) = P ( e X < x ) = P (X < ln x) = F (ln x) 0, ln x G (x) = +ln x, < ln x, < ln x 7 0, x ( ] 0, e = +ln x, x ( e, e]., x (e, )
Densitatea de repartiţie corespunzătoare este g (x) = G 0, în rest (x) = x, x (. e, e) Întrucât X ia valori în intervalul (, ), Z = X + ia valori numai în intervalul (, 3). Pentru x (, 3), funcţia de repartiţie H (x) a variabilei aleatoare Z va fi H (x) = P (Z < x) = P ( X + < x ) =P X < x ) = [ ] [ ] [ ] x x x x = P < X < = F F = [ = ] [ x + ] x x =. Densitatea de repartiţie corespunzatoare h (x) = H (x) este 0, în rest h (x) =. 4, x (, 3) x Problema. Densitatea de repartiţie a variabilei aleatoare X este dată prin funcţia ( f (x) = cos x, x, ). 0, în rest a) Calculaţi valoarea medie şi dispersia variabilei aleatoare ( X. b) Determinaţi funcţia de repartiţie şi calculaţi P 4 < X < ). 3 Solutie: a) Valoarea medie este iar dispersia M (X) = D (X) = + + = x f (x) dx = [x M (X)] f (x) dx = x cos x f. pară dx interval = simetric 8 x cos x dx interval = f. impară 0 simetric 0, (x 0) f (x) dx = x cos xdx,
de unde rezultă D (X) = 4. b) Funcţia de repartiţie este în general F (x) = Atunci pentru x x avem F (x) = ( Pentru x, ) rezultă F (x) = Pentru x avem F (x) = f (t) dt = f (t) dt = 0dt + 0dt + f (t) dt. 0dt = 0. cos tdt = + sin x. cos tdt + 0dt =. În concluzie funcţia de repartiţie este 0, x F (x) = + ( sin x, x, ), x. Probabilitatea cerută este ( P 4 < X < ) = 3 3 4 f (x) dx = 3 4 3 cos xdx =. 4 Problema 3. Supra-vanzarea locurilor pentru zborurile intercontinentale este o practica comuna in cadrul companiilor aeriene, vezi cazul United Airlines. Aeronave care sunt capabile sa transporte 300 de pasageri accepta pana la 30 de rezervari. Daca 0% dintre pasagerii care au o rezervare nu se imbarca in cele din urma in avion, care este probabilitatea ca cel putin un pasager, care are bilet de avion, sa sfarseasca fara un loc in avion? Care este probabilitatea ca intre 5 si 45 de pasageri cu loc rezervat sa nu se prezinte la poarta de imbarcare? 9
Solutie: Inainte de toate trebuie sa recunoastem ca este vorba de un experiment binomial. Sunt n = 30 de repetari ale aceluiasi experiment: un pasager cu o rezervare facuta incearca sa se imbarce in avion. Numim success situatia in care un pasager care are o rezervare nu reuseste sa se imbarcheze pentru zborul sau. Probabilitatea unui succes este p = 0.0 Notam asadar cu X variabila aleatoare care numara pasagerii cu rezervare care nu reusesc sa se imbarcheze in avion. X este o variabila aleatoare cu distributie binomiala X Bi(30, 0.0) si va trebui sa calculam P (X 9) si P (5 X 45). aproximam X printr-o variabila aleatoare normal distribuita: Y N(np, np( p)) = N(3, 8.8) folosim corectiile de continuitate: P (k X k ) P k < Y < k + ) si: Deci: si: P (X k) P P (5 X 45) P P (X 9) P Y < k + ) 5 < Y < 45 + ) Y < 9 + ) avem nevoie si de o reducere a lui Y la o variabila aleatoare cu distributia Y m standard normala prin tranformarea = Z. Au loc relatiile : x m P (x X x ) = P Z x ) ) ) m x m x m = Φ Φ pentru Z N(0, ). 4.5 3 P (4.5 < Y < 45.5) = P Z 5.36 si: P = 0.9940 0.083 = 0.9 = 9% Y < 9 + ) = P Z ) 45.5 3 = Φ (.5) Φ (.39) 5.36 ) 9.5 3 = Φ (.33) = 0.00 = % 5.36 mai sus am citit scorurile z din tablelul scorurilor z. Problema 4. (Problema intalnirii revizitata) Un barbat si o femeie decid sa se intalneasca intr-un restaurant dupa ora. Restaurantul se inchide la ora 4. Din cauza programului incarcat al fiecaruia ei decid ca in cazul in care unul dintre ei va intarzia fiecare sa astepte dupa celalalt un anumit timp. Barbatul este dispus sa astepte o ora iar femeia doar 5 minute! Care este probabilitatea ca cei doi sa se intalneasca la acel restaurant? 0
Solutie: Notam cu X variabila aleatoare continua care masoara timpul la care soseste femeia (fara vreo aluzie cromozomiala ) si cu Y variabila aleatoare care masoara timpul la care soseste barbatul. Fiecare poate ajunge la restaurant in orice moment de timp intre ora si 4 cu aceeasi probabilitate, deci X si Y au distributia uniform continua. Mai mult, cele doua variabile sunt independente si putem sa consideram ca ambele iau valori in intervalul [0, 3] unde 0 inseamna ora si 3 inseamna ora 4. Avem asadar un vector aleator (X, Y ) care modeleaza matematic problema si masoara timpii la care sosesc cei doi. Notam cu A evenimentul: cei doi se intalnesc in restaurant. Probabilitatea lui A se calculeaza conform formulei: P (A) = f X,Y (x, y) dxdy unde A este regiunea gri din desenul de mai jos A Deoarece X si Y sunt independente avem: unde: si: f X,Y (x, y) = f X (x) f Y (y) f X (x) = { 3 0, x [0, 3] 0, altfel f Y (y) = { 3 0, y [0, 3] 0, altfel sunt functiile de probabilitate ale celor doua variabile aleatoare continue uniform distribuite. Asadar: P (A) = 9 dxdy A Pentru a calcula aceasta integrala dubla notam cu si cele doua trinughiuri albe din desenul de mai sus. Se observa ca: A = [0, 3] [0, 3]
Prin urmare: [0,3] [0,3] 9 dxdy = Δ 9 dxdy + A 9 dxdy + Δ 9 dxdy Aplicam teorema lui Fubini si scriem cele doua triunghiuri ca domenii simple in raport cu axa OY : 3 3 0 0 9 dxdy = 4 3 0 x+ 4 9 dydx + = 88 + = P (A) = A A 9 A 9 dxdy + 9 dxdy + 4 8 dxdy = 0.35 = 35% Compara cu abordarea din introducerea seminarului 8 3 0 9 dydx
Probleme propuse Problema. Consideram functia: { a cos θ, daca θ ( f(θ) =, ) 0, in rest i) Aflati a astfel ca f sa fie densitatea de repartitie a unei variabile aleatoare continue X ii) Determinati valoarea medie M(X) si dispersia D (X) acestei variabile aleatoare iii) Aflati functia de repartitie F (x) si calculati probabilitatea P ( < X < ) Problema. Densitatea de repartitie pentru amplitudinea ruliului unei nave are urmatoarea forma, conform legii lui Rayleigh: f(x) = x x e a a, x 0 Aflati probabilitatea ca amplitudinea miscarii sa depaseasca o valoarea critica c 0. Determinati valoarea asteptata a amplitudinii E(X), deviatia standard (X) si momentul centrat m 3. Problema 3. Un radar masoara vitezele masinilor pe o autostrada. Vitezele sunt normal distribuite cu media de 90 km/ora si deviatia standard 0 km/ora. Care este probabilitatea ca o masina aleasa aleator sa circule cu o viteza mai mare de 00 km/ora? Problema 4. Intrarea la Universitatea Politehnica University se realizeaza in urma unui test de selectie. Punctajele sunt normal distribuite cu o medie de 500 si o deviatia standard de 00. Popescu vrea sa fie admis la aceasta universitate si el stie sa trebuie sa obtina un punctal mai bun decat cel putin 70% dintre contracandidatii sai. Popescu da testul si obtine 585 puncte. Va fi admis la universitate cu acest punctaj? Problema 5. O persoana arunca de 000 ori o moneda. Aflati probabilitatea ca numarul de steme obtinute sa fie intre 475 si 55, inclusiv. Problema 6. Biletele pentru festivalul Untold sunt vandute online potrivit unei distributii Poisson cu o medie de 5 pe zi. Care este probabilitatea ca: a) mai mult de 0 de bilete sa fie vandute intr-o zi? b) intre 0 si 30 de bilete sa fie vandute intr-o zi? 3
Problema 7. Un club de fotbal asigura transportul cu autobuzul al fanilor sai. Un autobuz soseste intr-o anumita statie la fiecare 5 minute intre ora 4 si p.m. in ziua meciului. Fanii sosesc in statie in momente de timp aleatoare. Timpul petrecut de catre un fan in asteptarea autobuzului este o variabila aleatoare uniform distribuita cu valori de la 0 la 5 minute. Care este timpul mediu de asteptare? Care este probabilitatea ca un fan sa astepte mai mult de minute? Care este probabilitatea ca un fan sa fie nevoit sa astepte intre 5 si 0 minute? 4