3 Populacija i uzorak

Σχετικά έγγραφα
Funkcija gustoće neprekidne slučajne varijable ima dva bitna svojstva: 1. Nenegativnost: f(x) 0, x R, 2. Normiranost: f(x)dx = 1.

VJEROJATNOST I STATISTIKA Popravni kolokvij - 1. rujna 2016.

VJEROJATNOST popravni kolokvij veljače 2017.

Slučajne varijable Materijali za nastavu iz Statistike

(Hi-kvadrat test) r (f i f ti ) 2 H = f ti. i=1

PISMENI ISPIT IZ STATISTIKE

Sadrˇzaj. Sadrˇzaj 1 9 DVODIMENZIONALNI SLUČAJNI VEKTOR DISKRETNI DVODIMENZIONALNI

Slučajne varijable. Diskretna slučajna varijabla X je promjenjiva veličina koja poprima vrijednosti iz skupa

ELEKTROTEHNIČKI ODJEL

5. Karakteristične funkcije

Verovatnoća i Statistika I deo Teorija verovatnoće (zadaci) Beleške dr Bobana Marinkovića

VJEROJATNOST I STATISTIKA 2. kolokvij lipnja 2016.

2.2 Srednje vrijednosti. aritmetička sredina, medijan, mod. Podaci (realizacije varijable X): x 1,x 2,...,x n (1)

M086 LA 1 M106 GRP. Tema: Baza vektorskog prostora. Koordinatni sustav. Norma. CSB nejednakost

a M a A. Može se pokazati da je supremum (ako postoji) jedinstven pa uvodimo oznaku sup A.

INTEGRALNI RAČUN. Teorije, metodike i povijest infinitezimalnih računa. Lucija Mijić 17. veljače 2011.

numeričkih deskriptivnih mera.

7 Algebarske jednadžbe

Vjerojatnost i matematička statistika

18. listopada listopada / 13

Slučajni vektor. Poglavlje 3

Slučajni procesi Prvi kolokvij travnja 2015.

DISKRETNA MATEMATIKA - PREDAVANJE 7 - Jovanka Pantović

Funkcije dviju varjabli (zadaci za vježbu)

4 Testiranje statističkih hipoteza

Uvod u vjerojatnost i matematičku statistiku

Apsolutno neprekidne raspodele Raspodele apsolutno neprekidnih sluqajnih promenljivih nazivaju se apsolutno neprekidnim raspodelama.

(P.I.) PRETPOSTAVKA INDUKCIJE - pretpostavimo da tvrdnja vrijedi za n = k.

Sadrˇzaj Sadrˇzaj 12 TEORIJA PROCJENA

Diskretan slučajni vektor

Ako između tri slučajne varijable postoji veza ζ = f (ξ, η) i ako su poznate sve relevantne gustoće vjerojatnosti, tada je

PRIMJER 3. MATLAB filtdemo

1.4 Tangenta i normala

radni nerecenzirani materijal za predavanja R(f) = {f(x) x D}

Testiranje statističkih hipoteza Materijali za nastavu iz Statistike

Operacije s matricama

Zadaci sa prethodnih prijemnih ispita iz matematike na Beogradskom univerzitetu

(BIO)STATISTIKA. seminari. smjer: Prehrambena tehnologija i Biotehnologija. pripremila: dr.sc. Iva Franjić

TRIGONOMETRIJSKE FUNKCIJE I I.1.

Parametarski zadane neprekidne distribucije

Procjena parametara. Zadatak 4.1 Neka je X 1, X 2,..., X n slučajni uzorak iz populacije s konačnim očekivanjem µ i varijancom σ 2.

Optimalnost u procjeni Nepristran procjenitelj minimalne varijance Cramer-Rao donja granica - ekasnost Konzistentnost. Vjeºbe - Statistika II.

radni nerecenzirani materijal za predavanja

π π ELEKTROTEHNIČKI ODJEL i) f (x) = x 3 x 2 x + 1, a = 1, b = 1;

VEROVATNO A I STATISTIKA A - TEST 1 9. NOVEMBAR 2013.

STATISTIKA S M E I M N I AR R 7 : METODE UZORKA

( , 2. kolokvij)

Veleučilište u Rijeci Stručni studij sigurnosti na radu Akad. god. 2011/2012. Matematika. Monotonost i ekstremi. Katica Jurasić. Rijeka, 2011.

Statističko zaključivanje jedna varijabla

Iskazna logika 3. Matematička logika u računarstvu. novembar 2012

1 Promjena baze vektora

2 tg x ctg x 1 = =, cos 2x Zbog četvrtog kvadranta rješenje je: 2 ctg x

3.1 Granična vrednost funkcije u tački

9. GRANIČNA VRIJEDNOST I NEPREKIDNOST FUNKCIJE GRANIČNA VRIJEDNOST ILI LIMES FUNKCIJE

Osnovni pojmovi iz kombinatorike, vjerojatnosti i statistike I. Kombinatorika

KONTINUIRANE SLUČAJNE VARIJABLE

Monte Carlo metode Bojan Basrak, PMF MO Zagreb. Financijski praktikum 29. veljače 2016.

Jednodimenzionalne slučajne promenljive

Osnove teorije uzoraka

U teoriji vjerojatnosti razmatraju se događaji koji se mogu, ali ne moraju dogoditi. Takvi se događaji zovu slučajnim događajima.

Klasifikacija blizu Kelerovih mnogostrukosti. konstantne holomorfne sekcione krivine. Kelerove. mnogostrukosti. blizu Kelerove.

(BIO)STATISTIKA. skripta. studij: Prehrambena tehnologija i Biotehnologija. doc. dr. sc. Iva Franjić 2012.

Matematička analiza 1 dodatni zadaci

Zadaci iz Osnova matematike

Matematika 1 - vježbe. 11. prosinca 2015.

BILJEŠKE ZA PREDAVANJA (za internu uporabu)

2. Ako je funkcija f(x) parna onda se Fourierov red funkcije f(x) reducira na Fourierov kosinusni red. f(x) cos

Statistika. primjeri i zadaci. Ante Mimica, Marina Ninčević. 30. kolovoza 2010.

2. OSNOVNI POJMOVI TEORIJE VJEROJATNOSTI

RIJEŠENI ZADACI I TEORIJA IZ

Statističke metode. doc. dr Dijana Karuović

Sadrˇzaj. Sadrˇzaj MATEMATIČKA STATISTIKA DESKRIPTIVNA STATISTIKA Ponovimo... 15

SADR\AJ. Predgovor. POGLAVLJE 2 Grafičko opisivanje podataka Klasifikacija varijabli 10 Kvalitativne ili numeričke 10 Mjerne skale 11

Metode procjene parametara

MATRICE I DETERMINANTE - formule i zadaci - (Matrice i determinante) 1 / 15

Kaskadna kompenzacija SAU

Ĉetverokut - DOMAĆA ZADAĆA. Nakon odgledanih videa trebali biste biti u stanju samostalno riješiti sljedeće zadatke.

Dijagonalizacija operatora

STATISTIKA. KONCEPTI : POPULACIJA i UZORAK. Primjer: svi glasači, samo neki glasači

STATISTIKA I OSNOVE FIZIKALNIH MJERENJA

Cauchyjev teorem. Postoji više dokaza ovog teorema, a najjednostvniji je uz pomoć Greenove formule: dxdy. int C i Cauchy Riemannovih uvjeta.

6 Polinomi Funkcija p : R R zadana formulom

Neka je a 3 x 3 + a 2 x 2 + a 1 x + a 0 = 0 algebarska jednadžba trećeg stupnja. Rješavanje ove jednadžbe sastoji se od nekoliko koraka.

IspitivaƬe funkcija: 1. Oblast definisanosti funkcije (ili domen funkcije) D f

DRUGI KOLOKVIJUM IZ MATEMATIKE 9x + 6y + z = 1 4x 2y + z = 1 x + 2y + 3z = 2. je neprekidna za a =

Elementi spektralne teorije matrica

1 Osnovni pojmovi Tipovi varijabli Skale mjerenja... 3

5. lekcija. Kontinuirane slučajne varijable.

Karakteristične funkcije

Riješeni zadaci: Limes funkcije. Neprekidnost

Edukacijsko-rehabilitacijski fakultet Sveučilišta u Zagreb S T A T I S T I K A. Skripta. Pripremio: Branko Nikolić. Zagreb 2015./2016.

Uvod u teoriju brojeva

GRAĐEVINSKI FAKULTET SVEUČILIŠTE U RIJECI. Specijalistički diplomski stručni studij građevinarstva NORMALNA RAZDIOBA.

Izbor statističkih testova Ana-Maria Šimundić

Eliminacijski zadatak iz Matematike 1 za kemičare

Populacija Ciljna/uzoračka populacija

10. domaća zadaća. 3. Neka je X neprekidna slučajna varijabla takva da je X N(0, 1). S točnošću od odredite:

Zadaci iz trigonometrije za seminar

Neka su A i B skupovi. Kažemo da je A podskup od B i pišemo A B ako je svaki element skupa A ujedno i element skupa B. Simbolima to zapisujemo:

16 Lokalni ekstremi. Definicija 16.1 Neka je A R n otvoren, f : A R i c A. Ako postoji okolina U(c) od c na kojoj je f(c) minimum

Transcript:

3 Populacija i uzorak 1

3.1 Slučajni uzorak X varijabla/stat. obilježje koje izučavamo Cilj statističke analize na osnovi uzorka izvesti odredene zaključke o (populacijskoj) razdiobi od X 2

Primjer 3.1. (Primjer 1.2) U nekom gradu u SADu, u glasačke liste upisano je 25 000 glasača. Ispitivanjem slučajnog uzorka od 1 600 osoba želimo procijeniti postotak glasača za Demokratsku stranku (DS). Nakon ispitivanja pokazuje se da u uzorku ima 917 glasača za DS. 3

Kako biramo osobe u uzorak? jednostavni slučajni uzorak bez ponavljanja jednostavni slučajni uzorak s ponavljanjem Varijabla čija nas razdioba zanima: X = 1 ukoliko je osoba glasač za DS, inače je 0 X je indikator glasača za DS 4

Neka je: N = 25000 veličina populacije M = (nepoznata) veličina glasača za DS u populaciji p = M N = proporcija glasača za DS u populaciji Želimo procijeniti parametar p iz uzorka duljine n. 5

n = 1600 = veličina uzorka Neka su: X 1 = indikator je li 1. osoba na sl. način izabrana u uzorak glasač za DS X 2 = indikator je li 2. osoba na sl. način izabrana u uzorak glasač za DS X n = indikator je li n-ta osb. na sl. način izabrana u uzorak glasač za DS Y := X 1 + X 2 + + X n = ukupan broj (frekvencija) glasača za DS u slučajnom uzorku 6

Slučaj jednostavnog sl. uzorka s ponavljanjem Slučajne su varijable X 1, X 2,..., X n jednako distribuirane Bernoullijeve ( ) 0 1 X i, i = 1, 2,..., n 1 p p nezavisne Y B(n, p) 7

Slučaj jednostavnog sl. uzorka bez ponavljanja Slučajne su varijable X 1, X 2,..., X n Bernoullijeve (jednako distribuirane?) zavisne su. Y hipergeometrijska (N, M, n) 8

U oba slučaja je procjenitelj parametra p statistika Vrijedi: ˆp = Y n ˆp = 917 1600 = 57.3% Ako je Y B(n, p), tada: p(1 p) E[ˆp] = p, Var[ˆp] =. n Ako je Y hipergeometrijska (M, N, n), tada: E[ˆp] = p, Var[ˆp] = p(1 p) n 1 N n 1 N 1. 9

Zadatak 1. Dokažite izraze za matematičko očekivanje i varijancu hipergeometrijske razdiobe, te za pripadni procjenitelj parametra proporcije. 10

Teorem 3.1. Neka je (X N ) niz hipergeometrijskih s.v. s parametrima (N, M N, n). Ako je n konstantno i lim N M N N = p, tada lim P(X N = k) = ( n N k ) p k q n k, k {0, 1,..., n}. Interpretacija: P(X = k) ( n) p k q n k, k {0, 1,..., n}, k za velike N i M i p = M/N. 11

Zadatak 2. Dokažite teorem 3.1. 12

Primjer 3.2. Moguće je da je novčić nesimetričan. Želimo procijeniti vjerojatnost da će pasti pismo. Uzimamo uzorak duljine n na sljedeći način. Označimo sa X 1 ishod 1. bacanja novčića, sa X 2 ishod 2. bacanja, itd., sa X n ishod n-tog bacanja. Sva bacanja su bila neovisna od drugih i izvedena pod istim uvjetima. X 1, X 2,..., X n su n.j.d. s.v. 13

Bitna razlika izmedu primjera 3.1 i 3.2: U primjeru 3.1 populacija je bila konačna, a u primjeru 3.2 beskonačna. U danom kontekstu, ukoliko je populacija konačna i velika, slučajni uzorci s i bez ponavljanja su po distribuciji približno jednaki (Teorem 3.1!). 14

Definicija. Slučajni uzorak duljine n za X je niz od n nezavisnih, jednako distribuiranih slučajnih varijabli X 1, X 2,..., X n kojima je distribucija jednaka (populacijskoj) razdiobi varijable X. Realizaciju slučajnog uzorka (= opažene vrijednosti x i od X i, i = 1,..., n) zovemo uzorkom. 15

3.2 Parametar i statistika Neka je X statistička varijabla čiju populacijsku distribuciju izučavamo, te neka je X 1, X 2,..., X n slučajni uzorak za X iz te populacije. 16

Parametrom razdiobe od X nazivamo onu vrijednost (broj, vektor, graf,...) koja je funkcija populacijske razdiobe od X. Statistika je funkcija slučajnog uzorka. 17

Statistike su slučajne varijable. Njihova razdioba se zove uzoračka razdioba. Primjer 3.3. Uzoračka razdioba statistike Y iz primjera 3.1 je binomna ako se radi o jednostavnom sl. uzorku s ponavljanjem, a ako je uzorak bez ponavljanja, onda je uzoračka razdioba te iste statistike hipergeometrijska. 18

Primjer 3.4. Neka X ima normalnu populacijsku razdiobu N(µ, σ 2 ), te neka je X 1, X 2,... X n pripadni slučajni uzorak. Aritmetička sredina X := 1 n (X 1 + X 2 + + X n ) je statistika. Njena uzoračka razdioba je X N ( µ, σ2 n ). 19

3.3 Empirijska funkcija distribucije Neka je F funkcija distribucije populacijske razdiobe varijable X. Slučajni uzorak za X: X 1, X 2,..., X n Empirijska funkcija distribucije (e.f.d.) je slučajna funkcija: ˆF n ( )(ω) : R R, ω Ω t.d. je ˆF n (x) := 1 n n i=1 1 {Xi x} = #{i : X i x}, x R. n 20

Svojstva e.f.d.: 1. Za svaki fiksni x R je n ˆF n (x) B(n, F (x)) E[ ˆF n (x)] = F (x), Var[ ˆF n (x)] = 1 F (x)(1 F (x)). n 21

2. Za svaki fiksni ω Ω je x ˆF n (x)(ω) funkcija distribucije neke diskretne razdiobe. Neka je x (1) x (2) x (n) jedna uredena realizacija slučajnog uzorka. Graf... ˆF n (x) = #{i : x (i) x}. n 22

1.25 1 0.75 0.5 0.25 0 0.25 3 2 1 0 1 2 3 x (2) x (1) x (3) x (4) 23

3. Iz prethodnog grafa slijedi: sup ˆF n (x) F (x) = x R = max max{ F (x 1 i n (i) ) i 1 n, F (x (i) ) i n }. Teorem 3.2 (Glivenko-Cantelli) P (Dokaz.) ( lim n sup ˆF n (x) F (x) = 0 x R ) = 1 24

U dokazu se koristi: Borelov jaki zakon velikih brojeva Ako je X n B(n, p), n N, niz binomnih s.v., tada P ( lim n X n n = p ) = 1. 25