Introducere în Calculul Probabilităţilor (modele elementare şi o invitaţie la teoria. L.Stoica

Σχετικά έγγραφα
Metode iterative pentru probleme neliniare - contractii

Curs 14 Funcţii implicite. Facultatea de Hidrotehnică Universitatea Tehnică "Gh. Asachi"

5. FUNCŢII IMPLICITE. EXTREME CONDIŢIONATE.

Curs 10 Funcţii reale de mai multe variabile reale. Limite şi continuitate.

Curs 1 Şiruri de numere reale

Curs 4 Serii de numere reale

III. Serii absolut convergente. Serii semiconvergente. ii) semiconvergentă dacă este convergentă iar seria modulelor divergentă.

Câmp de probabilitate II

DISTANŢA DINTRE DOUĂ DREPTE NECOPLANARE

(a) se numeşte derivata parţială a funcţiei f în raport cu variabila x i în punctul a.

Planul determinat de normală şi un punct Ecuaţia generală Plane paralele Unghi diedru Planul determinat de 3 puncte necoliniare

V.7. Condiţii necesare de optimalitate cazul funcţiilor diferenţiabile

I3: PROBABILITǍŢI - notiţe de curs

Capitolul 4 PROPRIETĂŢI TOPOLOGICE ŞI DE NUMĂRARE ALE LUI R. 4.1 Proprietăţi topologice ale lui R Puncte de acumulare

Asupra unei inegalităţi date la barajul OBMJ 2006

I3: PROBABILITǍŢI - notiţe de curs

SERII NUMERICE. Definiţia 3.1. Fie (a n ) n n0 (n 0 IN) un şir de numere reale şi (s n ) n n0

MARCAREA REZISTOARELOR

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor X) functia f 1

a n (ζ z 0 ) n. n=1 se numeste partea principala iar seria a n (z z 0 ) n se numeste partea

Curs 2 Şiruri de numere reale

Functii definitie, proprietati, grafic, functii elementare A. Definitii, proprietatile functiilor

riptografie şi Securitate

Cursul Măsuri reale. D.Rusu, Teoria măsurii şi integrala Lebesgue 15

Subiecte Clasa a VII-a

Subiecte Clasa a VIII-a

Sisteme diferenţiale liniare de ordinul 1

SEMINAR 14. Funcţii de mai multe variabile (continuare) ( = 1 z(x,y) x = 0. x = f. x + f. y = f. = x. = 1 y. y = x ( y = = 0

Definiţia generală Cazul 1. Elipsa şi hiperbola Cercul Cazul 2. Parabola Reprezentari parametrice ale conicelor Tangente la conice

Analiza în curent continuu a schemelor electronice Eugenie Posdărăscu - DCE SEM 1 electronica.geniu.ro

Orice izometrie f : (X, d 1 ) (Y, d 2 ) este un homeomorfism. (Y = f(x)).

Criptosisteme cu cheie publică III

Laborator 11. Mulţimi Julia. Temă

R R, f ( x) = x 7x+ 6. Determinați distanța dintre punctele de. B=, unde x și y sunt numere reale.

Lectia VI Structura de spatiu an E 3. Dreapta si planul ca subspatii ane

Al cincilea baraj de selecţie pentru OBMJ Bucureşti, 28 mai 2015

Metode de interpolare bazate pe diferenţe divizate

2.1 Sfera. (EGS) ecuaţie care poartă denumirea de ecuaţia generală asferei. (EGS) reprezintă osferă cu centrul în punctul. 2 + p 2

Integrala nedefinită (primitive)

Capitolul 4. Integrale improprii Integrale cu limite de integrare infinite

1.3 Baza a unui spaţiu vectorial. Dimensiune

TEORIA PROBABILITĂŢILOR UNIVERSITATEA TEHNICĂ GH. ASACHI,

CURS 11: ALGEBRĂ Spaţii liniare euclidiene. Produs scalar real. Spaţiu euclidian. Produs scalar complex. Spaţiu unitar. Noţiunea de normă.

Statisticǎ - curs 3. 1 Seria de distribuţie a statisticilor de eşantioane 2. 2 Teorema limitǎ centralǎ 5. 3 O aplicaţie a teoremei limitǎ centralǎ 7

7 Distribuţia normală

Esalonul Redus pe Linii (ERL). Subspatii.

Seminariile Capitolul X. Integrale Curbilinii: Serii Laurent şi Teorema Reziduurilor

Seminar 5 Analiza stabilității sistemelor liniare

Elemente de teoria probabilităţilor

Elemente de Teoria. Chapter Spaţiu de probabilitate

Cum folosim cazuri particulare în rezolvarea unor probleme

Lucrare. Varianta aprilie I 1 Definiţi noţiunile de număr prim şi număr ireductibil. Soluţie. Vezi Curs 6 Definiţiile 1 şi 2. sau p b.

Geometrie computationala 2. Preliminarii geometrice

8 Intervale de încredere

Aplicaţii ale principiului I al termodinamicii la gazul ideal

COLEGIUL NATIONAL CONSTANTIN CARABELLA TARGOVISTE. CONCURSUL JUDETEAN DE MATEMATICA CEZAR IVANESCU Editia a VI-a 26 februarie 2005.

O generalizare a unei probleme de algebră dată la Olimpiada de Matematică, faza judeţeană, 2013

Principiul Inductiei Matematice.

f(x) = l 0. Atunci f are local semnul lui l, adică, U 0 V(x 0 ) astfel încât sgnf(x) = sgnl, x U 0 D\{x 0 }. < f(x) < l +

1. Scrieti in casetele numerele log 7 8 si ln 8 astfel incat inegalitatea obtinuta sa fie adevarata. <

Conice - Câteva proprietǎţi elementare

Problema a II - a (10 puncte) Diferite circuite electrice

5.4. MULTIPLEXOARE A 0 A 1 A 2

Spatii liniare. Exemple Subspaţiu liniar Acoperire (înfăşurătoare) liniară. Mulţime infinită liniar independentă

Funcţii Ciudate. Beniamin Bogoşel

EDITURA PARALELA 45 MATEMATICĂ DE EXCELENŢĂ. Clasa a X-a Ediţia a II-a, revizuită. pentru concursuri, olimpiade şi centre de excelenţă

Vectori liberi Produs scalar Produs vectorial Produsul mixt. 1 Vectori liberi. 2 Produs scalar. 3 Produs vectorial. 4 Produsul mixt.

Să se arate că n este număr par. Dan Nedeianu

Subiecte Clasa a V-a

2 Transformări liniare între spaţii finit dimensionale

prin egalizarea histogramei

Conice. Lect. dr. Constantin-Cosmin Todea. U.T. Cluj-Napoca

BARAJ DE JUNIORI,,Euclid Cipru, 28 mai 2012 (barajul 3)

Concurs MATE-INFO UBB, 1 aprilie 2017 Proba scrisă la MATEMATICĂ

Functii Breviar teoretic 8 ianuarie ianuarie 2011


5.5. REZOLVAREA CIRCUITELOR CU TRANZISTOARE BIPOLARE

3 Distribuţii discrete clasice

Principiul incluziunii si excluziunii. Generarea şi ordonarea permutărilor. Principiul porumbeilor. Pri

RĂSPUNS Modulul de rezistenţă este o caracteristică geometrică a secţiunii transversale, scrisă faţă de una dintre axele de inerţie principale:,

Capitolul 2. Integrala stochastică

z a + c 0 + c 1 (z a)

Criterii de comutativitate a grupurilor

Subiecte Clasa a VIII-a

2. Sisteme de forţe concurente...1 Cuprins...1 Introducere Aspecte teoretice Aplicaţii rezolvate...3

III. Reprezentarea informaţiei în sistemele de calcul

CURS XI XII SINTEZĂ. 1 Algebra vectorială a vectorilor liberi

Modulul 1 MULŢIMI, RELAŢII, FUNCŢII

Toate subiectele sunt obligatorii. Timpul de lucru efectiv este de 3 ore. Se acordă din oficiu 10 puncte. SUBIECTUL I.

a. 11 % b. 12 % c. 13 % d. 14 %

CURS VII-IX. Capitolul IV: Funcţii derivabile. Derivate şi diferenţiale. 1 Derivata unei funcţii. Interpretarea geometrică.

Componente şi Circuite Electronice Pasive. Laborator 3. Divizorul de tensiune. Divizorul de curent

Examen AG. Student:... Grupa: ianuarie 2016

1.7 Mişcarea Browniană

Algebra si Geometrie Seminar 9

CONCURS DE ADMITERE, 17 iulie 2017 Proba scrisă la MATEMATICĂ

CONCURSUL DE MATEMATICĂ APLICATĂ ADOLF HAIMOVICI, 2017 ETAPA LOCALĂ, HUNEDOARA Clasa a IX-a profil științe ale naturii, tehnologic, servicii

Ecuaţia generală Probleme de tangenţă Sfera prin 4 puncte necoplanare. Elipsoidul Hiperboloizi Paraboloizi Conul Cilindrul. 1 Sfera.

GEOMETRIE PLANĂ TEOREME IMPORTANTE ARII. bh lh 2. abc. abc. formula înălţimii

Timp alocat: 180 minute. In itemii 1-4 completati casetele libere, astfel incat propozitiile obtinute sa fie adevarate.

Transcript:

Introducere în Calculul Probabilităţilor (modele elementare şi o invitaţie la teoria măsurii) L.Stoica

2

Cuprins 1 Introducere 9 1.1 Modelul probabilist........................ 11 1.2 Câteva exemple.......................... 15 1.2.1 Zarul turtit........................ 15 1.2.2 Repartiţii uniforme.................... 17 1.3 Exerciţii.............................. 18 2 Modele cu şanse egale 21 2.1 Aruncarea cu banul........................ 21 2.2 Metode de numărare a posibilităţilor.............. 24 2.2.1 Permutări cu repetiţii................... 24 2.3 Extrageri repetate din urnă................... 27 2.3.1 Schema bilei întoarse................... 27 2.3.2 Schema bilei neîntoarse................. 28 2.4 Exemple.............................. 30 2.4.1 Controlul calităţii..................... 30 2.4.2 Numărarea tuturor posibilităţilor............ 32 2.4.3 Problema potrivirilor................... 33 2.4.4 Problema cu zilele de naştere.............. 38 2.4.5 Produsul mai multor numere apropiate de unitate... 39 2.5 Exerciţii.............................. 41 3 Câteva noţiuni de bază 43 3.1 Probabilităţi condiţionate.................... 43 3.1.1 Noţiunea de probabilitate condiţionată......... 43 3.1.2 Formula lui Bayes..................... 46 3.2 Independenţă........................... 51 3.2.1 Independenţa a două evenimente............ 51 3

4 CUPRINS 3.2.2 Independenţa mai multor evenimente.......... 54 3.2.3 Independenţa a trei evenimente............. 57 3.2.4 Regula jucătorului.................... 58 3.3 Exerciţii.............................. 60 4 Partiţii finite sau numărabile 63 4.1 Partiţii şi σ algebre generate.................. 65 4.2 Partiţii şi σ algebre independente................ 75 4.3 Asocierea şi disocierea independenţei.............. 80 4.4 Exerciţii.............................. 82 5 Spaţiul probabilizat numărabil 83 5.1 Mulţimi numărabile........................ 83 5.1.1 Sumabilitate........................ 83 5.1.2 Măsuri pe o mulţime cel mult numărabilă........ 86 5.2 Produsul de măsuridiscrete................... 88 5.3 Variabile aleatoare cu valori numărabile............. 91 5.3.1 σ algebra generată de o variabilă............ 91 5.3.2 Repartiţia unei variabile................. 93 5.3.3 Medie şi dispersie..................... 99 5.4 Exerciţii.............................. 104 6 Câteva repartiţii pe N 109 6.1 Repartiţia geometrică....................... 109 6.2 Repartiţia binomială şischemaluibernoulli.......... 111 6.3 Repartiţia Poisson........................ 114 6.3.1 Generalităţi........................ 114 6.3.2 Estimarea erorilor..................... 117 6.4 Histograme............................ 119 6.5 Împrăştierea aleatoare...................... 125 6.6 Exerciţii.............................. 131 7 Teorema De Moivre-Laplace 135 7.1 Aproximarea repartiţiei binomiale................ 135 7.1.1 Repartiţia normală.................... 140 7.2 Teorema limită centrală..................... 151 7.3 Noţiuni de estimarea statistică.................. 163 7.3.1 Intervale de încredere................... 163

CUPRINS 5 7.3.2 Evaluarea coeficientului de încredere.......... 165 7.4 Exerciţii.............................. 168 8 Măsuri pe spaţii produs în cazul discret 169 8.1 Complemente de teoria măsurii................. 169 8.2 Spaţiul produs numărabil..................... 173 8.3 Construcţia măsurilor....................... 176 9 Lanţuri Markov 183 9.1 Calcule de bază.......................... 183 9.2 Construcţia lanţuluimarkov................... 189 9.3 Alte forme ale proprietăţii Markov............... 193 9.3.1 Exprimarea cu media condiţionată........... 193 9.3.2 Lanţuri omogene în timp................. 196 9.3.3 Proprietatea tare Markov................ 203 9.4 Reducerea la reprezentarea canonică.............. 206 10 Comunicarea între stări 211 10.1 Stări recurente sau tranziente.................. 212 10.2 Clase recurente.......................... 217 11 Comportament asimptotic 223 11.1 Teoreme limită.......................... 223 11.2 Măsuri invariante......................... 230

6 CUPRINS

Prefaţă Primele şapte capitole ale cărţii de faţă conţin cursul introductiv de teoria probabilităţilor pe care l-am ţinut studenţilor din anul al III-lea. Ultimele patru capitole conţin cursul de lanţuri Markov pe care l-am ţinut studenţilor de la master. În privinţa materiei din prima parte, am de făcut mai întâi menţiunea că diferă de ceea ce se face de obicei la facultatea de matematică, diferă chiar şi de ceea ce am predat cu un an înainte, prin faptul că prezentarea este mult mai elementară. Am renunţat la a pune la baza cursului de teoria probabilităţilor cunştinţele de teoria măsurii pe care ar trebui să leaibă studenţii dintr-un curs separat. În urma contactului direct cu studenţii, am ajuns la concluzia că este necesară o discuţie în amănunt a noţiunilor de bază din teoria măsurii în paralel cu introducerea conceptelor de teoria probabilităţilor. Trebuie spus, pe de altă parte, că teoria probabilităţilor reprezintă astăzi un domeniu cu largi aplicaţii în societatea contemporanăşi este absolut necesară o mai mare popularizare a cunoştinţelor de bazăîn acest domeniu. Având în vedere acest lucru, am schimbat conţinutul, concentrându-mă asupra a două obiective: 1) explicarea modelării problemelor prin prezentarea cu detalii a mai multor modele pentru exemple concrete, cât şi a unor construcţii de modele mai generale; 2) prezentarea noţiunii de independenţă bazatăpeteoriamăsurii discretă. Noţiunea de independenţăestefără îndoială cel mai important concept care stă labazamodelării proabiliste şi ea poate fi explicată, fără a se pierde esenţialul, la nivelul unui spaţiu probabilizat finit. De exemplu, noţiunile de estimare statistică din capitolul 7 nu utilizează nimic mai mult din teoria măsurii. Pentru cea mai mare parte a cursului, chiar am fi putut să rămânem la nivelul spaţiului probabilizat finit, totuşi pentru a putea cuprinde şi fenomenele legate de repartiţia Poisson, am ales spaţiul discret cel mult 7

8 CUPRINS numărabil drept cadru de dezvoltare a teoriei măsurii ce ne este necesară. Desigur că adoptarea punctului de vedere elementar m-a condus la epuizarea timpului fărăaajungesă vorbesc despre unele subiecte centrale în teoria probabilităţilor, cum ar fi legea numerelor mari. De asemenea, teorema limită centrală este prezentată doar în cazul variabilelor bernoulliene. Prin urmare, conţinutul acestui curs constituie doar o primă introducere în domeniu. Partea a doua a cărţii, cursul de lanţuri Markov, este de asemenea destul de elementară ca abordare. Am evitat noţiunile mai avansate de teoria măsurii, pentru a fi accesibilă unui public cât mai larg. Dar fără îndoială că un student cu o mai mare experienţă în acestă teorieşi în teoria probabilităţilor va înţelege mai bine conţinutul cursului nostru. Din punct de vedere tehnic, trebuie spus că am pus accentul pe proprietatea Markov. Am făcut un efort de a o explica şi apoi am utilizat-o sistematic. Am evitat tehnicile de algebră sau analiză a matricilor, cât şi tehnicile de teoria potenţialului sau cele de teoria martingalelor. Proprietatea tare Markov este cea care a rezolvat toate punctele delicate. Cursul constituie, în intenţia autorului, o introducere cât se poate de elementară în teoria proceselor stochastice generale. Cu regretul că nu am gata un text privitor la exemplele de lanţuri Markov, mă grăbesc să adaugparteaadoualaprimaşi să public această carte aşa. În viitorul apropiat îmi propun să scot o nouă ediţie mai completă. Bibliografia de la sfârşit conţine cărţile consultate de autor, cărţi ce sunt recomandate şi cititorului pentru completarea informaţiei. Nu toate lucrările sunt citate explicit în text. Bucureşti, aprilie, 2004.

Capitolul 1 Introducere Teoria probabilităţilor reprezintă un domeniu aparte al matematicii, ce are relaţiile sale specifice cu realitatea înconjurătoare şi care se raporteazăla ea prin experienţă,ca oadevărată ştiinţă a naturii. Din punct de vedere filozofic, conceptul de probabilitate, care este conceptul central al teoriei, este caracterizat în doua ipostaze. Oprimăipostazăesteapariţia sa în exprimarea frecvenţei unui eveniment în timpul desfăşurării unui proces uniform. De exemplu, să presupunem că facem experienţa aruncării cu banul de un număr mare de ori. Urmărim fiecare aruncare, notând de fiecare dată rezultatul: stema sau cifra. Chiar înainte de a începe experienţa putem gândi logic că nuexisă nici un motiv să fie preferată vreuna din feţele monedei. Deci a priori spunem căşansele de acădea stema sau cifra sunt egale. Faptul neaşteptat, care apare în timpul experienţei, este că după unnumăr nu pre mare de aruncări (de exemplu 100 de aruncări) se şi verifică aceasta. Notăm cu N n numărul de experienţe la care rezultatul a fost cifra după ces-aufăcut n aruncări. Atunci graficul funcţiei f (n) = Nn,n N, arată camaşa cum se vede în figura 1.1. Graficul n din figură a fost realizat pe baza datelor unui experiment ce a constat din 200 de aruncări cu o monedă. După cum se vede, prima porţiune a graficului este lipită de axa orizontală. Aceasta reflectă faptulcăîn experiment s-a obţinut la început de zece ori la rând faţa cu stema. Putem spune că aşa ceva este neobişnuit. A preciza, însă, noţiunea de,,obişnuit sau,,frecvent în legătură cu un fenomen aleator este tocmai obiectul teoriei probabilităţilor. Graficul evoluează apoi apropiindu-se de valoarea constantă 0, 5. Acest fapt este foarte obişnuit la un număr mai mare de 100 de aruncări. Oricine poate verifica acest lucru experimentând aruncarea cu banul! Deci probabilitatea 9

10 CAPITOLUL 1. INTRODUCERE 0.6 0.5 0.4 0.3 0.2 0.1 0 1 16 31 46 61 76 91 106 121 136 151 166 181 196 Figura 1.1: Graficul frecvenţei cu care a ieşit o faţă a monedei. egală pentru obţinerea unei feţe sau a alteia este reflectată în practică prin frecvenţa egală de realizare a celor două rezultate atunci când experimentul este repetat de un număr relativ mare de ori. Cea de a doua ipostază a conceptului de probabilitate este cea în care exprimă o cuantificare a unui fenomen subiectiv, în care intervine necunoaşterea unor aspecte ale unui experiment. De exemplu, un medic se poate exprima cu privire la şansele de reuşită ale unui tratament sau ale unei operaţii şi atunci când pacientul are o stare diferită de cazurile ce le cunoscuse anterior. Medicul face deci aprecieri subiective ale unor aspecte necunoscute şi spune spre exemplu şansele de însănătoşire sunt de 80%. Acelaşi lucru se întâmplă cu un economist care trebuie să facă prognoze. Economia fiecărui an este în mare măsură unică, nu se poate vorbi de repetarea unor fenomene decât parţial, şi deci un important aspect al prognozei este caracterul său subiectiv. Apare astfel o evaluare probabilistă a şanselor de desfăşurare a unor scenarii, necunoscându-se care vor fi condiţiile reale. Deşi din punct de vedere filozofic bazele teoriei probabilităţilor au implicaţii foarte interesante, pentru studiul matematic, cât şi pentru aplicaţiile practice obişnuite, aspectele filozofice sunt aproape irelevante. De aceea nu ne vom ocupa deloc în cele ce urmează de fundamentele teoriei probabilităţilor, ci vom trece direct la definirea obiectelor matematice şi la explicarea procesului de modelare prin exemple. Eficienţa practică amodelării o socotim suficientă pentru a înlocui orice discurs filozofic.

1.1. MODELUL PROBABILIST 11 Din punctul de vedere al matematicianului, teoria probabilităţilor are două părţi: modelarea unor fenomene reale (în legătură cu modelarea apare şi problema verificării modelului prin metodele statisticii, care validează sau invalidează modelul)şi studiul obiectelor matematice create prin modelare. Studiul acesta conduce la noi concepte şi legături cu celelalte ramuri ale matematicii, ceea ce permite ulterior crearea altor modele, de un nivel superior. Modelarea se face în primul rând prin construirea unui spaţiu probabilizat, prin intermediul căruia se asociază evenimentelor posibile numere din intervalul [0, 1]. Unui eveniment mai probabil decât un altul trebuie să-i corespundă un număr mai mare decât celuilalt. Evenimentele cele mai probabile vor avea asociate numere apropiate de 1, de exemplu 0, 95 sau 0, 99 în timp ce evenimentele cele mai puţin probabile vor avea asociate numere mici de genul 0, 02 sau 0, 001. 1.1 Modelul probabilist În prima parte a acestui curs vom analiza mai ales teoria finită, în care există doar o familie finită de evenimente posibile legate de fenomenul studiat. Vom introduce mai întâi noţiunea de spaţiu probabilizat finit. Definiţia 1.1 Fie Ω omulţime şi F o familie de părţi, deci F P(Ω). Spunem că F este o algebră depărţi, sau pe scurt o algebră, dacă sunt îndeplinite condiţiile următoare: (i) mulţimea vidăşi spaţiul total aparţin lui F, adică, Ω F; (ii) familia este închisă lacomplementară, în sensul că A c F, dacă A F; (iii) familia este închisă la reuniune, adică A B F, dacă A, B F. Dacă, în plus, familia F este finită spunem că eaesteoalgebră finită. În acest caz, perechea (Ω, F) estenumită spaţiu măsurabil finit. Exemplul cel mai simplu de algebră este algebra trivială {Ω, }, care conţine numai spaţiul total şi mulţimea vidă. Alt exemplu simplu este constituit de P (Ω), mulţimea tuturor părţilor spaţiului Ω. În cazul în care Ω este o mulţime finită, cel mai adesea ea este considerată caspaţiu măsurabil fiind înzestrată cualgebrap (Ω).

12 CAPITOLUL 1. INTRODUCERE Dacă avemdatăoalgebră F P(Ω) şi Λ Ω este o submulţime arbitrară, familia de părţi ale lui Λ, care este descrisă prin{a Λ/A F}, este tot o algebră. Ea este numită urmaluif pe Λ. Un exemplu important de algebră este cel al părţilor măsurabile Jordan dintr-un spaţiu euclidian. O mulţime din spaţiul euclidian se numeşte măsurabilă Jordan, dacă frontiera sa este neglijabilă. Se verifică uşor că aceste mulţimi alcătuiesc o algebrădepărţi. Se observă că o algebră F are proprietatea că esteînchisă la intersecţie şi diferenţă: dacă A, B F, atunci A B,A\B F. De asemenea, prin inducţie se constată că reuniunea şi intersecţia unui număr finit arbitrar de mulţimi din F sunt tot în F. Definiţia 1.2 Fie (Ω, F) un spaţiu măsurabil finit. Spunem că o aplicaţie P : F [0, 1], este o măsură de probabilitate dacă satisface relaţiile (i) P (Ω) = 1, (ii) P (A B) =P (A) +P (B), pentru orice două mulţimi disjuncte, A, B F. În acest caz, tripletul (Ω, F, P) va fi numit spaţiu probabilizat finit. Din definiţia dată rezultă imediat următoarele proprietăţi: 1. P (A c )=1 P(A), pentru orice A F. În particular, se deduce de aici că arelocrelaţia P ( ) = 0. Mai observăm că relaţia P (A) = 1 este echivalentă curelaţia P (A c )=0. În acest caz, se spune că mulţimea A suportă măsura P şi că măsura P nu încarcă A c. 2. P (A\B) =P (A) P (B) şi P (B) P (A) oridecâte ori A, B F satisfac relaţia B A. 3. P (A 1... A n )=P (A 1 )+... + P (A n ), pentru orice număr finit de mulţimi disjuncte A 1,..., A n F,n N. 4. P (A 1... A n ) P (A 1 )+... + P (A n ), în general, cu mulţimile arbitrare A 1,..., A n F,n N. 5. Dacămulţimea Ω este finită, rezultă căomăsură de probabilitate P pe P (Ω) este complet determinată de valorile pe care le ia pe mulţimile cu un singur punct. Mai precis, să presupunem că Ω={x 1,..., x n } şi să notăm P (x i )=P({x i }),i =1,..., n. Ţinând cont de punctul 3., aceste numere trebuie să satisfacărelaţia P (x 1 )+...+P (x n )=1, pentru că n i=1 {x i} =Ω. Pentru o mulţime arbitrară A Ω are loc formula P (A) = P (x i ). i,x i A

1.1. MODELUL PROBABILIST 13 Reciproc, fiind date numerele a 1,..., a n [0, 1], astfel încât a 1 +...+a n =1, se poate defini o măsură de probabilitate punând P (x i )=a i, pentru orice i = 1,..., n şi definind apoi probabilitatea unei mulţimi arbitrare după formula anterioară. De multe ori un spaţiu probabilizat finit este construit prin definirea mulţimii Ω şi a unei partiţii finite a acesteia, (A k ) 1 k n. Deci mulţimile A k sunt astfel definite încât au loc relaţiile: a) A l A k =, dacă l k şi b) Ω = 1 k n A k. Algebra generată de această partiţie, pe care o notăm F, constă din toate mulţimile de forma A k1... A km, cu indicii satisfacând relaţia 1 k 1 <... < k m n, la care se mai adaugă mulţimea vidă. (Lăsăm cititorului verificarea faptului că aceasta este o algebră de părţi.) Probabilitatea P este apoi definită prin fixarea valorilor pe elementele partiţiei p k = P (A k ),k = 1,..., n. Desigur, numerele p k,k =1,..., n trebuie să fie pozitive şi să aibă suma p 1 +... + p n =1. Pentru o mulţime arbitrară dinf se defineşte apoi P (A k1... A km )=P (A k1 )+... + P (A km ), pentru k 1 <... < k m. Cititorul poate uşor verifica faptul căîn acest fel este definită omăsură de probabilitate pe F. O metodă convenabilă de construcţie a unui spaţiu probabilizat finit (Ω, F,P)constăîn alegera mulţimii Ω ca o parte dintr-un spaţiu euclidian, de exemplu din plan. Mulţimile din F sunt alese sugestiv după aspectul grafic. De exemplu cercuri, pătrate, dreptunghiuri, ovale, etc. În plan se poate uşor construi un spaţiu probabilizat desenând o diagramă Vennşi punând ca probabilitate a unei mulţimi figurate A, valoarea P (A) = ariaa. ariaω Cel mai adesea în astfel de cazuri, pentru a nu complica exprimarea analitică a diverselor mulţimi, liniile desenate, care separă regiunile, sunt excluse din Ω. De exemplu, a se vedea modelul zarului turtit din paragraful următor sau modelul celor trei urne din paragraful despre formula lui Bayes. În primele capitole ale acestei cărţi nu vom utiliza decât spaţii probabilizate finite. Totuşi, anumite noţiuni generale le vom da în contextul unui spaţiu probabilizat general, pentru a evita repetarea definiţiilor mai târziu. De aceea introducem acum şi definiţia unui spaţiu probabilizat general. Definiţia 1.3 O algebră F, de părţi ale lui Ω, este numită σ algebră dacă are proprietatea de a fi închisă lareuniuninumărabile: dacă (A n ) n N este un şirdeelementedinf, atunci n N A n F. Perechea (Ω, F) se numeşte spaţiu măsurabil.

14 CAPITOLUL 1. INTRODUCERE Bineînţeles că orice algebră finită esteoσ algebră. Familia P (Ω), a tuturor părţilor mulţimii Ω, este o σ algebră. Dacă avemdatăoσ algebră F P(Ω) şi Λ Ω este o submulţime arbitrară, urma lui F pe Λ este o tot o σ algebră. Dar cel mai important exemplu de σ algebră este cea constituită din mulţimile măsurabile Borel dintr-un spaţiu euclidian E (de o anumită dimensiune), care este notată cub (E). Această σ algebră este prin definiţie σ algebra generată de familia mulţimilor deschise din spaţiul euclidian E. Pe de altă parte, este de reţinut că mulţimile măsurabile Jordan nu formează oσ algebră. De exemplu mulţimea lui Cantor de pe dreaptă nu este măsurabilă Jordan, dar complementara sa este obţinută ca o reuniune numărabilă de intervale deschise. Deci complementara mulţimii lui Cantor se obţine ca o reuniune de mulţimi măsurabile Jordan, dar ea nu este măsurabilă Jordan. O σ algebră esteînchisă la intersecţii numărabile. Într-adevăr, dacă (A n ) n N este un şir de elemente din σ algebra dată putem scrie n A n =( n A c n )c, relaţie ce are în membrul drept numai operaţii permise în interiorul unei σ algebre. Definiţia 1.4 Fie (Ω, F) un spaţiu măsurabil. O aplicaţie P : F [0, 1] se numeşte măsură de probabilitate dacă satisface condiţiile: (i) P (Ω) = 1, (ii) P ( n N A ) n = n P (A n), pentru orice şir de mulţimi disjuncte, A n F, n N. În acest caz tripletul (Ω, F, P) se numeşte spaţiu probabilizat. Relaţia (ii) din această definiţie este numită relaţia de σ aditivitate. Câteva proprietăţi legate de σ aditivitate vor fi demonstrate mai târziu în secţiunea despre partiţii finite sau numărabile. Studiile despre fundamentele logice ale noţiunii de probabilitate au o lungă istorie. Modelarea probabilistă pe un spaţiu probabilizat (Ω, F, P) a fost pentru prima oară examinată printr-o metodă axiomatică decătre A. N. Kolmogorov într-o lucrare rămasă de referinţă (Grundbegriffe der Wahrscheinlichkeitsrechnung, Berlin, 1933). De atunci acesta a devenit cadrul familiar pentru discutarea problemelor de teoria probabilităţilor. Azi acest

1.2. CÂTEVA EXEMPLE 15 obiect este definit şi studiat în cadrul teoriei măsurii. În teoria probabilităţilor el este preluat şi există obiceiul să se utilizeze, pe lângă terminologiadeteoriamăsurii, o terminologie proprie, colorată de sensuri apropriate modelelor probabiliste. Astfel o mulţime A Fse numeşte eveniment iar un punct ω Ωsenumeşte eveniment elementar. Dacă P (A c ) = 0, se spune că evenimentul A are loc aproape sigur. Prescurtat scriem a. s. pentru,,aproape sigur. 1.2 Câteva exemple Modelarea propriu-zisă este ceea ce se numeşte o artă. Nu există reguli şi cu greu se pot da reţete. Vom ilustra ideea de modelare prin exemple dea lungul întregii cărţi. Începem cu următoarea secţiune în care prezentăm câteva din modelele tipice. 1.2.1 Zarul turtit Un zar obişnuit este un cub, pe ale cărui feţe sunt marcate cu puncte numerele de la unu la şase. Să presupunem că avem un zar cu latura de 1 cm. El este modificat micşorându-i-se înălţimea, astfel că devine un paralelipiped dreptunghic cu baza un pătrat cu latura de 1 cm iar înălţimea de h (0, 1). h 0 Figura 1.2: Un zar turtit. Să presupunem că baza zarului este marcată cu şase puncte, iar faţa superioară cu unul. Când înălţimea h este foarte mică, feţele laterale devin înguste şi zarul nu poate sta decât cu greu pe ele; şi de aceea este natural să neaşteptăm ca zarul, prin aruncare, să cadă mai ales cu feţele de sus şi

16 CAPITOLUL 1. INTRODUCERE 1 2 3 4 5 6 Figura 1.3: Un model pentru zarul turtit. jos: 1 şi 6. Atunci şansele de a cădea una din aceste feţe, se apropie pentru fiecare de 1. Când h = 1 aceste feţe au şanse egale cu celelalte, deci egale 2 cu 1 pentru fiecare. Există oanumită valoare h 6 0 pentru care feţele cu un punct şi şase puncte au şansele 1 fiecare. În acest caz, şansele feţelor cu 2,3,4 4 şi 5 puncte sunt egale cu 1 fiecare. Experimentul de aruncare a zarului cu 8 înălţimea h 0 poate fi descris de mulţimea Ω, desenatăîn figura 1.3. Ea constă dinşase dreptunghiuri (mulţimi deschise, fără laturile ce le mărginesc). Primul dreptunghi şi ultimul sunt duble faţă de celelalte şi corespund la feţele cu 1 şi 6 puncte. Aria fiecărui dreptunghi este proporţională cu şansele de a cădea numărul de puncte pe care-l reprezintă. Dreptunghiurile ce formează mulţimea Ω sunt numerotate conform punctelor pe care le reprezintă, ca în figură: D 1,D 2,D 3,D 4,D 5,D 6. În acest caz F este algebra de părţi generată de aceste mulţimi. Mulţimea D i corespunde evenimentului,,în urma aruncării zarului a ieşit faţa cu i puncte. Probabilitatea este definită prin P (A) = ariaa ariaω, pentru orice A F. De exemplu, evenimentul,,la aruncarea zarului iese un număr de puncte mai mare sau egal cu 4 este reprezentat de mulţimea D 4 D 5 D 6 şi are probabilitatea P (D 4 D 5 D 6 )= ariad 4 + ariad 5 + ariad 6 = 1 ariaω 8 + 1 8 + 2 8 = 1 2. Pentru aceeaşi problemă se poate utiliza un model bazat pe mulţimea finită Ω = {1, 2, 3, 4, 5, 6}, cu F = P (Ω )şi punând P ({1}) =P ({6}) = 1 4, P ({2}) =P ({3}) =P ({4}) =P ({5}) = 1 8.

1.2. CÂTEVA EXEMPLE 17 1.2.2 Repartiţii uniforme 1. Să presupunem că cinevaaruncălaîntâmplare o piatră într-o curte. Dacă nu am asistat la aruncare şi ne punem problema să găsim piatra, putem mai întâi să estimăm probabilitatea ca piatra să seafleîntr-o anumită regiune după aria regiunii. Să zicem că dreptunghiul Ω reprezintă curtea. Pentru o regiune A Ω, definim P (A) = ariaa. În acest fel, am definit o măsură ariaω de probabilitate pe B (Ω), care modelează şansele de a găsi piatra în diverse regiuni din interiorul curţii. Această măsură de probabilitate spunem că este repartizată uniform pe Ω, deoarece este proporţională cu aria. (Modelul se deosebeşte de cel de la zarul turtit prin aceea că, de data aceasta, măsura este definită pentru toate mulţimile boreliene. Clasa mulţimilor boreliene este infinită.) 2. Să presupunem că după oploaievremsăestimăm numărul de picături care au cazut în diverse regiuni din grădină. Să presupunem că s-a determinat numărul n 0 de picături ce au căzut într-un metru pătrat. Dacă grădina este un dreptunghi Ω, numărul de picături care au căzut în toată curtea este aproximativ n 0 ariaω. Pentru o regiune A Ω, numărul de picături va fi aproximativ n 0 ariaa. Dacăvremsăştim ce proporţiedintoatepicăturile au căzut în regiunea A, aceasta este dată de P (A) = ariaa ariaω. Din nou este o măsură de probabilitate pe B (Ω), uniform distribuită peω. 3. O roată deruletăesteînvârtită şi apoi se aşteaptă oprirea ei. Care va fi probabilitatea ca indicatorul de la marginea roţii să se oprescă întrun anumit sector al cercului exterior? Răspunsul este dictat de o logică elementară: această probabilitate este proporţională cu lungimea curbilinie a sectorlui. Pentru a modela acest fenomen probabilist se notează cu Ω cercul exterior roţii de ruletă şi pentru o mulţime A B(Ω) se pune P (A) = L (A) 2πR, unde L (A) este lungimea mulţimii A (sau măsura Lebesgue), iar R este raza cercului. Din nou P este o măsură de probabilitate pe B (Ω), uniform repartizată pe cercul Ω. Se ştie că un cerc de rază R este pus în corespondenţă bijectivă cuintervalul [0, 2πR) prin desfăşurarea cercului. Lungimile măsurate pe cerc, după

18 CAPITOLUL 1. INTRODUCERE desfăşurare, corespund lungimilor măsurate pe segmentul [0, 2πR). Atunci, un model echivalent se obţine punând Ω =[0, 2πR), iar pentru o mulţime A B ( ) Ω se pune P (A) = L (A) 2πR, unde de data aceasta L (A) estemăsura Lebesgue de pe segmentul [0, 2πR). Măsura de probabilitate P este uniform răspândită peintervalul[0, 2πR). Deoarece punctul din capătul intervalului are măsura nulă, din punct de vedere practic, acest model este echivalent cu cel obţinut pe intervalul [0, 2πR] cu aceeaşi măsură P. 4. La o fabrică de confecţii se utilizează şireturi. Şiretul este adus la fabrică în ghemuri şi resturile mai mici de 40 cm sunt inutilizabile. Prin urmare rămân deşeuri de şiret de toate mărimile mai mici de 40 de cm. Pentru a modela distribuirea resturilor de şiret este natural să considerăm Ω=[0, 40], F = B (Ω) şi pentru A B(Ω) P (A) = L (A) 40. Dacă A =(a, b), numărul P ((a, b)) reprezintă proporţia acelor resturi de şiret care au lungimea mai mare decât a cm şi mai mică decât b cm, printre toate resturile de şiret. Suntem conduşi astfel la probabilitatea distribuită uniform pe intervalul [0, 40]. 1.3 Exerciţii Exerciţiul 1.1 Biletele de la o tombolă sunt numerotate de la 1 la 10.000. Ce proporţiedintreelesetermină cu cifra 1, dar cu 2,..., dar cu 9? Ce proporţie dintre ele încep cu cifra 1, dar cu 2,..., dar cu 9? Exerciţiul 1.2 Se consideră zilele de 13 din lunile anului 2004. Ce proporţie dintre ele sunt luni, dar marţi,..., dar duminică? Aceeaşi problemă pentru zilele de 13 din anii 2004 şi 2005. Exerciţiul 1.3 Fie Ω omulţime şi A, B Ω. Scrieţi A B caoreuniunede mulţimi care sunt total incluse sau în A sau în B. Aceeaşi problemă pentru reuniunea a trei mulţimi A B C.

1.3. EXERCIŢII 19 Exerciţiul 1.4 Fiind dat un spaţiu probabilizat (Ω, F,P) şi A, B, C F să se arate că arelocrelaţia P (A B C) =P (A)+P (B)+P (C) P (A B) P (A C) P (B C)+P (A B C) Exerciţiul 1.5 Într-o pălărie se află trei cartoane: unul are ambele feţe albe, altul are ambele feţe negre şialtreileaareofaţăalbăşi una neagră. Se ia unul şi se pune pe masă. Constatând căfaţade deasupra cartonului este neagră sepuneproblemadeadeterminaprobabilitateacedosulsăfiealb.

20 CAPITOLUL 1. INTRODUCERE

Capitolul 2 Modele cu şanse egale Cele mai vechi modele probabiliste consideră omulţime Ω = {ω 1,..., ω n }, finită, ca mulţime a posibilităţilor şi evaluează cuşanse egale fiecare posibilitate, ceea ce conduce la P ({ω i })= 1, pentru orice i. Exemplele la care n se potrivesc modele de acest fel sunt cele mai uzuale: aruncarea monedei, unde şansele de a cădea în sus o faţă sau alta sunt evident egale (modelul are doar două posibilităţi şi deci n = 2), aruncarea cu zarul, unde fiecare din cele şase feţe are tot şanse egale de a ieşi (model cu n = 6), extragerea unei bile dintr-o urnă (n este numărul de bile din urnă) şi multe altele legate de diverse jocuri în care intervine norocul. Dacă A P(Ω) este un eveniment arbitrar, probabilitatea sa este P (A) = carda cardω. Această formulă spune că,,probabilitatea evenimentului A este egală cu numărul cazurilor favorabile supra numărul cazurilor posibile, care este definiţia clasică a probabilităţii. Pentru a decide că un fenomen probabilist este de tipul şanselor egale pentru fiecare posibilă evoluţie este însă necesară întotdeauna o analiză. 2.1 Aruncarea cu banul Este cunoscut modelul dat de d Alembert pentru aruncarea cu două monezi. El spunea că rezultatele posibile pentru un astfel de experiment sunt trei: ambele monezi cad cu cifra în sus, ambele monezi cad cu stema în sus, şi 21

22 CAPITOLUL 2. MODELE CU ŞANSE EGALE cea de a treia posibilitate, o monedă cadecucifraîn sus iar cealaltă cadecu stema în sus. Afăcut apoi greşeala să presupună că fiecare din aceste trei posibilităţi este la fel de probabilă. Dacă arfifăcut experienţa, şi-arfidatseamafoarte repede cănuesteadevărată egalitatea şanselor pentru modelul ales. Dar nu numai experienţa, ci şi o analiză logică mai atentă relevă modelul corect. Pentru aceasta se consideră că cele două monezi sunt însemnate A şi B iar posibilitatea a treia din enumerarea dată mai sus este înlocuită cudouă alte posibilităţi: A cade cu cifra şi B cade cu stema, respectiv A cade cu stema şi B cade cu cifra. Se poate uşor raţiona că dacă A cade cu cifra sunt şanse egale ca B să cadăcucifrasaucustemaşi la fel, prin comparare, se ajunge imediat la concluzia că fiecare din cele patru posibilităţi descrise acum are şanse egale. Se vede atunci că, pentru a reflecta experimentul aruncării cu două monezi, modelul cu trei posibilităţi propus de d Alembert nu poate da şanse egale fiecăreia. Pentru a corespunde realităţii, trebuiesc acordate şanse egale numai primelor posibilităţi şi anume 1,în timp ce a treia 4 posibilitate enumerată de d Alembert ar trebui să aibăşanse duble faţă de fiecare din primele, deci 1. Desigur că marele enciclopedist şi matematician 2 francez (Jean le Rond d Alembert: 1717-1783), a ramas în istorie pentru alte descoperiri importante, cazul descris mai sus nefiind decât un episod anecdotic. În lumina discuţiei anterioare, este clar că, în cazul în care considerăm oserieden aruncări cu banul, modelul ce se impune este următorul: dacă 1 corespunde cifrei şi 0 corespunde stemei, mulţimea tuturor posibilităţilor este Ω={0, 1} n = {(x 1,..., x n ) x i {0, 1},i=1,..., n}, constituită din toate sistemele (x 1,..., x n ) de n cifre de 0 şi 1. Fiecare posibilitate are aceleaşi şanse de a ieşi. Numărul tuturor posibilităţilor este 2 n,adică cardω =2 n. Probabilitatea corespunzătoare se defineşte prin P ({(x 1,..., x n )}) = 1, pentru fiecare sistem (x 2 n 1,..., x n ) Ω. Exemplu. Doi jucători joacă aruncarea cu banul după următoarea regulă. La fiecare aruncare a monedei este pus în joc un punct. Dacă moneda cade cu stema în sus, câştigă jucătorul J 1,iarcând cade faţa cu cifra, câştigă jucătorul J 2. Se aruncă monedademaimulteorilarând până când unul din jucători totalizează 10 puncte. În această situaţie respectivul jucător este considerat învingător şi câştigă osumă. În cazul în care jocul este

2.1. ARUNCAREA CU BANUL 23 întrerupt înainte ca vreunul din jucători să iasă câştigător, se convine ca suma în joc să fie împărţită între cei doi, proporţional cu şansele pe care le-ar fi avut dacă jocul ar fi continuat. Ne propunem să calculăm cum va fi împărţită miza jocului dacă jocul este întrerupt în situaţia în care jucătorul J 1 are 7 puncte iar jucătorul J 2 are 8 puncte? (Soluţia acestei probleme o dă Blaise Pascal(1623-1662) într-o scrisoare datată 24 august 1654 către Pierre de Fermat(1601-1665).) Soluţie. Jocul se terminăîn cel mult 4 aruncări pentru că după 4 aruncări neapărat se întâmplă unuldinurmătoarele evenimente: sau J 2 acâştigat cel puţin două puncte, sau J 1 acâştigat cel puţin trei. Cu convenţia că 0 reprezintă stema şi 1 cifra, putem reprezenta toate rezultatele posibile la o serie de 4 aruncări în felul următor: (0, 0, 0, 0) (0, 0, 0, 1) (0, 0, 1, 1) (0, 1, 1, 1) (1, 1, 1, 1) (0, 0, 1, 0) (0, 1, 0, 1) (1, 0, 1, 1) (0, 1, 0, 0) (0, 1, 1, 0) (1, 1, 0, 1) (1, 0, 0, 0) (1, 0, 0, 1) (1, 1, 1, 0) (1, 0, 1, 0) (1, 1, 0, 0) Am listat aici 16 posibilităţi şi fiecare are şanse egale. Primele 5 posibilităţi îl dau câştigător pe J 1 iar celelalte 11 pe J 2. Rezultă căşansele de a câştiga J 1 sunt 5 şi şanseledeacâştiga J 16 2 sunt 11. Suma pusăînjocsevaîmpărţi 16 între cei doi jucători proporţional cu aceste valori. Un învăţat al timpului i-a reproşat lui Pascal că defaptjoculnuse termină neapărat cu încă 4 aruncări, ci el poate să seîncheie după 2sau3 aruncări şi atunci posibilităţile ce se iau în considerare sunt de fapt următoarele: (0, 0, 0) (0, 0, 1, 0) (0, 0, 1, 1) (0, 1, 1) (1, 1) (0, 1, 0, 0) (0, 1, 0, 1) (1, 0, 1) (1, 0, 0, 0) (1, 0, 0, 1) Observaţia este corectă, însă în cazul acesta tebuie să acordăm altă pondere fiecărei posibilităţi: P ({(1, 1)}) = 1 4,P({(0, 0, 0)}) =P ({(0, 1, 1)}) =P ({(1, 0, 1)}) =1 8, P ({(0, 0, 1, 0)}) =P ({(0, 1, 0, 0)}) =P ({(1, 0, 0, 0)}) =P ({(0, 0, 1, 1)})

24 CAPITOLUL 2. MODELE CU ŞANSE EGALE = P ({(0, 1, 0, 1)}) =P ({(1, 0, 0, 1)}) = 1 16. Justificarea acestei ponderări se face pornind de la evaluarea şanselor pentru rezultatele a două aruncări: P ({(1, 1)}) =P ({(1, 0)}) =P ({(0, 1)}) =P ({(0, 0)}) = 1 4. Rezultatul (1, 1) ar pune capăt jocului dar celelalte posibilităţi duc la continuarea jocului. Şansele pe care le are rezultatul(1, 0) se împart în mod egal pentru posibilităţile următoare: (1, 0, 1), (1, 0, 0). Deci P ({(1, 0, 1)}) =P ({(1, 0, 0)}) = 1 8. Rezultatul (1, 0, 0) conduce la continuarea jocului cu încă o aruncareşi obţinerea posibilităţilor (1, 0, 0, 1) şi (1, 0, 0, 0), ce vor fi evaluate fiecare cu probabilitatea 1 16.etc. 2.2 Metodedenumărare a posibilităţilor 2.2.1 Permutări cu repetiţii Vom presupune că mulţimea M constă dinn bile colorate, din care n 1 au culoarea c 1,n 2 au culoarea c 2 şi aşa mai departe, n k bile au culoarea c k. Are loc relaţia n = n 1 +... + n k. Ne interesează mulţimea succesiunilor de culori ce pot fi obţinute aranjând în şir, în diverse feluri, cele n bile. Când spunem succesiune de culori înţelegem aspectul grafic pe care îl dă înşiruirea celor n bile într-o anumită ordine. Cu alte cuvinte, o succesiune de culori este individualizată prin secvenţele de bile de aceeaşi culoare care se succed în şirul celor n bile, distingând lungimea fiecărei secvenţe dar şi ordinea în care se succed secvenţele. De exemplu, mai jos considerăm că semnul reprezintă culoarea roşie, 0 reprezintă culoarea albă, iar reprezintă culoarea negru. 0 0 0 0 0 0 Avem reprezentate două succesiuni de câte 7 bile din care 3 sunt roşii, 3 sunt albe şi una este neagră. Deşi ordinea de înşiruire a culorilor este aceeaşi (roşu,

2.2. METODE DE NUMĂRARE A POSIBILITĂŢILOR 25 alb, negru, roşu, alb), cele două succesiuni de culori sunt diferite pentru că secvenţele bilelor de aceeaşi culoare au lungimi diferite. În continuare vom demonstra că numărul succesiunilor de culori distincte în înţelesul de mai sus este n! n 1!... n k!. Pentru a descrie precis mulţimea tuturor acestor succesiuni de culori vom proceda în felul următor. Considerămoadouamulţime cu n elemente ce o notăm L, pe care o identificăm cu mulţimea primelor n numere naturale {1,..., n}, şi care reprezintă poziţiile ocupate în şir de cele n bile. Pentru a determina o succesiune de culori dată de cele n bile puse în şir este suficient să cunoaştem mulţimile de poziţii din L care corepund fiecărei culori. Fie A i mulţimea poziţiilor ocupate de bilele de culoare c i,i =1,..., k. Este clar că aceste mulţimi verifică următoarele două proprietăţi: 1) A i are n i elemente şi 2) (A 1,..., A k ) formează o partiţie a mulţimii L. Problema revine atunci la numărarea familiilor de mulţimi A 1,..., A k, care verifică cele două condiţii. Vom considera de asemenea că fiecare bilă este individualizată (de exemplu purtând un semn sau un număr distinct). Notăm cu H mulţimea tuturor sistemelor de aşezare a celor n bile în cele n poziţii din L. Ştim că numărul acestor sisteme este n!. Să introducem pe H relaţia de echivalenţă care face echivalente două sisteme de aşezare a celor n bile atunci când ele corespund aceleiaşi succesiuni de culori. Vom arăta acum că fiecare clasă de echivalenţă are acelaşi număr de elemente şi anume n 1!... n k!. Să zicem că avemfixatunastfeldesistemdeaşezare a celor n bile în poziţiile din L. Pentru fiecare i =1,..., k, notăm cu A i mulţimea de poziţii pe care le ocupă bilele de culoare c i. Este evident că vor fi satisfăcute condiţiile 1) şi 2) de mai sus. Dacă permutăm între ele bilele de culoare c i obţinem un alt sistem din H, dar mulţimea A i rămâne neschimbată, deci succesiunea de culori rămâne neschimbată. Mai mult, dacă considerăm un alt sistem de aranjare a bilelor care este echivalent cu cel fixat, rezultă că, pentru fiecare i =1,..., k, bilele sale de culoare c i vor ocupa tot poziţiile din mulţimea A i. Deci, aceste bile vor forma o permutare a bilelor de culoare c i din primul sistem. Bilele de culoare c i pot fi permutate în n i! moduri. Făcând permutări între bilele de aceeaşi culoare, pentru fiecare culoare, obţinem în total n 1!... n k! sisteme care corespund aceleiaşi succesiuni de culori, sau altfel spus, care sunt în aceeaşi clasă de echivalenţă cu sistemul fixat. Acum putem calcula numărul claselor de echivalenţă în care este împărţită mulţimea H. Dacă notăm cu x numărul claselor de echivalenţă vom exprima

26 CAPITOLUL 2. MODELE CU ŞANSE EGALE numărul elementelor din H sub forma xn 1!...n k!. Cum pe de altă parte, ştim că H are n! elemente, rezultă x = n! n 1!...n k. Deoarece evident, avem o! corespondenţă bijectivă între mulţimea succesiunilor de culori şi mulţimea claselor de echivalenţă, putem trage concluzia că mulţimea succesiunilor de n! culori are n 1!... n k elemente.! Pentru termenul de succesiune de culori am putea utiliza şi denumirea de,,permutare de culori cu repetiţie, pentru că opoziţie ocupată de o culoare este constituită eventual din mai multe bile ce repetă aceeaşi culoare. De aici denumirea de numărul permutărilor cu repetiţie pe care îl are expresia n! n 1!... n k. Această expresie este denumităşi coeficient multinomial. Pentru k =! 2 expresia devine cunoscutul coeficient binomial C n 1 n!. n 2!(n n 2 )! n = Cn 2 n! n = n 1!(n n 1 = )! Oproblemădealocaţie. Examinăm acum mulţimea din secţiunea anterioară, dar văzutăîn altăînfăţişare. În combinatorică seîntâmplă demulte ori ca dificultatea unei probleme să provină din dificultatea de a recunoaşte obiectele în forma în care sunt mai simple, sau în forma în care pot fi legate de alte fapte cunoscute. Vom vedea acum un exemplu în care acelaşi obiect îmbracă douăînfăţişări distincte. Vom presupune că M este o mulţime formată dinn bile numerotate de la 1lan. Avem k cutii şi numerele n 1,..., n k date. Se pune problema să sedetermine în câte feluri se pot aloca cele n bile în cutii astfel încât întâia cutie să conţină n 1 bile, a doua să conţină n 2 bile, etc. Formulată altfel, problema revine la a determina numărul partiţiilor mulţimii {1,..., n} în forma (A i ) i=1,...,k, cu carda i = n i. Vom arăta că există o bijecţie între mulţimea alocaţiilor de tipul descris şi mulţimea succesiunilor de culori considerate anterior. Bijecţia se realizează în felul următor: ne imaginăm că fiecare cutie vopseşte bilele repartizate în ea într-o culoare distinctă. Cutia i vopseşte bilele din ea în culoarea c i. Dacă avem bilele alocate, considerăm căeleaucăpătat o culoare, le scoatem din cutii şi le înşirăm în ordinea numerelor. Obţinem în acest fel o succesiune de culori. Nu este greu de văzut că această corespondenţă este o bijecţie şi atunci se pote obţine numărul alocaţiilor ce satisfac condiţiile impuse: n!. n 1!... n k! Am văzut că atât în versiunea cu bilele colorate, cât şi în versiunea cu alocarea de bile în cutii, problema se formulează natural şi cu o partiţie numerotată, (A i ) i=1,...,k, amulţimii {1,..., n}, astfel ca mulţimea A i săaibă

2.3. EXTRAGERI REPETATE DIN URNĂ 27 exact n i elemente. Aceasta ar fi o a treia categorie de obiecte ce sunt în n! număr de n 1!... n k. Atragem atenţiaasuprafaptuluică este vorba de partiţii! numerotate, pentru căîn general prin partiţie se înţelege o famile de părţi disjuncte care acoperă spaţiul. De exemplu, pentru n =4,n 1 =2,n 2 =2, următoarele,,partiţii numerotate sunt distincte: A 1 = {1, 3},A 2 = {2, 4} şi A 1 = {2, 4},A 2 = {1, 3} ;pedealtăparte, în înţelesul general, avem de a face cu aceeaşi partiţie. 2.3 Extrageri repetate din urnă Din punct de vedere al teoriei probabilităţilor urna permite realizarea modelului tipic de experiment în care avem un număr finit de evenimente elementare cu şanse egale. Prin urnă înţelegem o cutie în care se află nişte obiecte asemănătoare, cum ar fi bile, sau bilete, etc. Când se fac extrageri din urnă întotdeauna se presupune că cel ce extrage nu poate alege şi că fiecare obiect din urnă are aceleaşi şanse de a fi extras. 2.3.1 Schema bilei întoarse Într-o urnă seaflă n bile numerotate de la 1 la n. Se extrage din urnă o bilă, se notează numărul ei, după care se pune la loc bila în urnă. (O extragere de acest fel se numeşte extragere cu întoarcere sau cu revenire.) Repetând experienţa de k ori se obţine o secvenţă (x 1,..., x k )formatădink numere. Dorim să modelăm probabilist experimentul global al extragerilor succesive de acest tip. Notăm M = {1,..., n} mulţimea ce reprezintă bilele. Mulţimea posibilităţilor este clar descrisă de produsul Să considerăm două secvenţe Ω=M k = {(x 1,..., x k ) x i M, i =1,..., k}. (x 1,..., x i 1,x i,x i+1,..., x k ), (x 1,..., x i 1,x i,x i+1,..., x k ) care au aceleaşi elemente, cu excepţia celor de pe poziţia i. Deci presupunem x i x i. Cele două secvenţe diferă doar prin rezultatul de la extracţia i. Dar la fiecare extracţie şansele de a extrage una sau alta din bile sunt egale. Concluzia este că cele două secvenţe au şanse egale de a se produce. Din

28 CAPITOLUL 2. MODELE CU ŞANSE EGALE aproape în aproape se deduce că toate secvenţele au aceeaşi şansă de a se produce. Numărul elementelor din Ω este n k şi se impune P ({(x 1,..., x k )}) = 1 n k, pentru orice secvenţă. 2.3.2 Schema bilei neîntoarse Aceeaşi urnă ca mai înainte este supusă unor k extrageri succesive, dar de data asta după fiecare extragere bila extrasă rămâne în afara urnei. (O astfel de extragere se numeşte fără întoarcere sau fără revenire.) Implicit trebuie să avem k n. Mai remarcăm că secvenţa rezultatelor are toate componentele diferite. Mulţimea care modelează fenomenul este Ω={(x 1,..., x k ) /x i M, x i x j, i j}. Se observă că această mulţime constă din toate submulţimile de cardinal k din M ordonate în toate felurile posibile. Deci cardω =A k n. Vom arăta că, şi de această dată, trebuie să acceptăm ideea că fiecare posibilitate de desfăşurare a k extrageri succesive are aceleaşi şanse de apariţie. Pentru aceasta vom face o inducţie după k. Notăm Ω k şi respectiv Ω k+1 spaţiile tuturor posibilităţilor pentru experimentele corespunzătoare seriilor de k, respectiv k + 1 extrageri. Presupunem că am stabilit că şansele tuturor secvenţelor de k extrageri sunt egale şi deci probabilitatea asociată unei astfel de secvenţe este egală cu 1 1 =. Fie (x A k n n(n 1)...(n k+1) 1,..., x k ) Ω k. Această secvenţă poate fi continuată cu o nouă extragere din mulţimea M \{x 1,..., x k }. Este o mulţime cu n k bile şi fiecare din ele are aceleaşi şanse de a fi extrasă. Notăm cu A (x 1,..., x k )={(x 1,..., x k,x) /x M \{x 1,..., x k }}, mulţimea secvenţelor ce continuă secvenţa dată. Această mulţime are n k secvenţe şi trebuie să admitem că auşanse de a se produce egale între ele. Pe de altă parte, când secvenţa (x 1,..., x k )parcurgeω k, mulţimile A (x 1,..., x k ) acoperă Ω k+1, adică are loc egalitatea Ω k+1 = A (x 1,..., x k ). (x 1,...,x k ) Ω k Aceste mulţimi sunt disjuncte şi deci formează opartiţie a lui Ω k+1. Este de asemenea natural să măsurăm producerea evenimentului A (x 1,..., x k )în

2.3. EXTRAGERI REPETATE DIN URNĂ 29 modelul cu secvenţe de lungime k +1, prin probabilitatea pe care o are evenimentul elementar (x 1,..., x k )în modelul secvenţelor de lungime k : P k+1 (A (x 1,..., x k )) = P k ({(x 1,..., x k )}) = 1. A k n Aceasta implică să punem aceeaşi valoare pentru probabilitatea fiecăruia din evenimentele A (x 1,..., x k ). Cum fiecare din aceste evenimente este compus din acelaşi număr de evenimente elementare ce au şanse egale între ele, rezultă că toate evenimentele elementare din Ω k+1 au aceleaşi şanse de a se produce: P k+1 ({(x 1,..., x k+1 )}) = 1 A k+1 n Extrageri fără ordine. = 1 n (n 1)... (n k). Un caz particular de extrageri repetate fără întoarcere sunt extragerile în care ceea ce contează lasfârşit este numai mulţimea bilelor extrase. Deci nu mai reţinem ordinea în care s-au făcut extragerile şi privim drept rezultat al extragerii numai mulţimea bilelor extrase. Ţinând cont de simetria experimentului a k extrageri succesive fără întoarcere este normal săneaşteptăm ca fiecare mulţime de k elemente să apară cu aceeaşi probabilitate. Vom demonstra acest lucru bazându-ne pe modelul deja construit. Propoziţia 2.1 Fie M mulţimea cu n elemente care reprezintă bilele din urnă şi k n. Notăm cu Ω mulţimea ce modelează seriile de k extrageri fără întoarcere, ca mai sus. Pentru fiecare submulţime A M având cardinalul k are loc formula P ({(x 1,..., x k ) Ω/ {x 1,..., x k } = A}) = 1. Cn k Demonstraţie. Mulţimea {(x 1,..., x k ) Ω/ {x 1,..., x k } = A} constădin toate permutările posibile cu elementele din A. Cardinalul acestei mulţimi este k!, şi cum probabilitatea unei secvenţe din Ω este 1, rezultă că A k n P ({(x 1,..., x k ) Ω/ {x 1,..., x k } = A}) = k! A k n = 1. Cn k Să examinăm acum experimentul extragerii din urna cu n bile a k bile deodată. Pentru acest experiment mulţimea tuturor posibilităţilor este mulţimea

30 CAPITOLUL 2. MODELE CU ŞANSE EGALE ce o notăm cu Γ, şi care se compune din părţile lui M cu k elemente. Din motive de simetrie este natural să considerăm că fiecare parte a lui M cu k elemente are aceleaşi şanse de a fi extrasă. Rezultă canaturalăalegerea probabilităţii P pe Γ care dă aceeaşi valoare fiecărui eveniment elementar. Cardinalul lui Γ fiind Cn, k deducem că probabilitatea fiecărui eveniment elementar din Γ este 1. Cn k Să comparăm acum modelul nou construit (Γ,P ) cu cel anterior (Ω,P). Pentru un eveniment elementar A Γconsiderăm mulţimea tuturor secvenţelor (x 1,..., x k ) Ω care sunt formate cu elementele mulţimii A (adică {x 1,..., x k } = A). Notăm Λ A această mulţime: Λ A = {(x 1,..., x k ) Ω / {x 1,..., x k } = A}. Ea constituie un eveniment neelementar din Ω. Ansamblul acestor mulţimi {Λ A /A Γ} formează o partiţie a lui Ω care evident este în bijecţie cu Γ. Din propoziţia anterioară rezultă că P (Λ A )=P ({A}). În concluzie, putem spune că experimentul extragerii din urnă a k bile deodată este echivalent cu experimentul a k extrageri succesive fără revenire, în care se uită ordinea extragerilor şi se ia în considerare numai mulţimea rezultată din extragere. Modelarea se poate face fie pe (Ω,P)considerând evenimentele Λ A, fie pe (Γ,P ). 2.4 Exemple 2.4.1 Controlul calităţii Exemplu. Într-o ladă seaflă 550 de mere, din care un anumit procent sunt putrede. Fără aşti acest procent, se ia un eşantion de 25 de mere şi se taie pentru a se constata starea lor şi a evalua care ar fi procentul de mere putrede în toată lada. Este o problemă tipică de controlul calităţii. Aici nu ne vom propune să tratăm propriu-zis această problemăcisă rezolvăm o problemă mai simplă. Anume, ne propunem să determinăm care ar fi probabilitatea ca eşantionul să conţină 2 mere putrede dacă amşti că 2%dinnumărul total de mere sunt putrede. Soluţie. Presupunerea făcută implică faptulcă 11 mere sunt putrede. În ce priveşte extragerea celor 25 de mere, ea nu contează decât ca mulţime. Suntem în cazul extragerilor fără ordine. Pentru soluţionarea problemei particulare ce o avem, vom înlocui cifrele cu litere deoarece calculele numerice nu

2.4. EXEMPLE 31 simplifică cu nimic problema. Presupunem că mulţimea tuturor merelor ar avea n elemente, din care m sunt putrede. Fie M mulţimea tuturor merelor şi D mulţimea tuturor merelor putrede. (Bineînţeles că avemm n şi D M.) Seiauneşantion de k mere pentru a fi testate şi printre ele se găsesc l care sunt putrede. Vrem să determinăm care este probabilitatea acestui eveniment. Înseamnă căspaţiul posibilităţilor pe care modelăm problema este Ω={A P(M) /carda = k}, iar evenimentul a cărui probabilitate o căutăm va avea expresia Λ l = {A Ω /card(a D) =l}. Este clar că mulţimea Ω are cardinalul Cn k. Pentru a determina cardinalul mulţimii Λ l vom raţiona astfel: mulţimea A = A 1 A 2 se împarte în mod natural în două părţi, A 1 = A D de cardinal carda 1 = l şi A 2 = A D c cu carda 2 = k l. Pentru A 1 există Cm l posibilităţi de formare, iar pentru A 2 există Cn m k l posibilităţi de alcătuire. Deci, mulţimea ce ne interesează, Λ l, are Cm l Cn m k l elemente. Obţinem formula n m P (Λ l )= Cl m Ck l Cu datele numerice din problemă avem că: probabilitatea ca din 25 de mere testate 2 să fie putrede este C11 2 C23 539 0, 07. C550 25 Dar putem să facem şi o listă cu celelalte probabilităţi de interes pentru cazul numeric de la care am plecat. Notând cu p l probabilitatea evenimentului ca să existe exact l mere putrede în condiţiile în care celelalte date rămân aceleaşi avem p l = Cl 11 C25 l 539,l =0, 1,..., 11. Valorile numerice ce se obţin sunt listate C550 25 în tabelul următor: C m n p 0 p 1 p 2 p 3 p 4 0, 5965 0, 3185 0, 0740 0, 0098 0, 0008 Adunând probabilităţile din tabel avem p 0 +p 1 +p 2 +p 3 +p 4 =0, 9996, ceea ce arată că restul probabilităţilor sunt neglijabile (bineînţeles că are loc relaţia.