16. UVOD U STATISTIKU Statistika je nauka o sakupljanju i analizi sakupljenih podatka u cilju donosenja zakljucaka o mogucem toku ili obliku neizvjesnosti koja se obradjuje. Frekventna distribucija - je broj pojava neke vrijednosti unutar promatrane cjeline ili skupa podataka. Histogram i Poligon frekvencija - su grficki prikazi frekventne distribucije. Na osi se nanose ocitanja pojave a na osi broj ili frekvencija pojave. Prikaz moze biti u obliku stupaca (histogram) ili krivulje (poligon frekvencije) Mjera sredisnje tendencije - je vrijednost koja definira sredisnju vrijednost skupa podataka. U praksi ima vise takvih mjera. Ovdje ce biti rijeci o: a) Median - srednja vrijednost skupa promatranih podataka, svrstanih po velicini. Median je vrijednost na pola puta izmedju naj vece i naj manje vrijednosti. b) Srednja aritmeticka vrijednost - je vrijednost koja se dobije kada se podijeli zbroj vrijednosti svih podataka i podijeli sa brojem podataka. c) Standardna devijacija - je mjera koja prikazuje raspodjelu oko srednje vrijednosti i = ( ) dana je izrazom s ; s oznacava standardnu devijaciju, srednju aritmeticku vrijednost, n n 1 broj podataka. Prikladni pravac - je metoda prikazivanja podataka sa pravcem koji naj bolje prikazuje podatke koji se obradjuju. U praksi ima vise metoda a ovdje ce biti rijeci o metodi "najmanjih kvadrata". Ova metoda ima za cilj pronaci jednadzbu pravca koja bi predstavljala podatke tako, da udaljenost ordinate pravca, koji predstavlja podatak i originalne vrijednosti podatka, bude minimalna. Prikaz nelinearnih podataka - je metoda u kojoj se podaci prikazuju graficki, koristenjem krivulja drugog reda, uglavnom parabole. 1. Za predmet Matematika 1, na fakultetu je bilo prijavljeno ukupno 80 studenata. Nakon ispita, rezultati ispita su prikazani u tabeli. Svaki broj predstavlja uspjeh na testu u postocima i broj studenata koji su taj postotak postigli: 1 61 1 74 5 86 3 37 1 63 4 75 4 87 40 77 7 88 1 44 1 66 1 78 4 90 47 1 67 5 65 79 1 9 1 53 1 68 81 93 55 3 70 8 4 95 1 97 1 84 1 71 4 56 1 60 3 7 3 85 1 Statistika 1
Podaci su svrstani u intervale i broj studenata koji su imali odgovarajuci postotak uspjeha, prikazan je u tabeli: Interval uspjeha % 0 4 5 9 30 34 35 39 40 44 45 49 50 54 55 59 Broj studenata 1 0 0 1 3 1 1 1 Interval uspjeha % 60-64 65-69 70-74 75-79 80-84 85-89 90-94 95 99 Broj studenata 8 10 14 16 7 7 5 Broj studenata i ocjenu koju su zasluzili prikazani su u narednoj tabeli: Ocjena 1 3 4 5 Broj studenata 7 14 30 18 11 Histogram frekvencije studenata i ocjena, dani su u donjem prikazu: Poligon frekvencija broja studenata i postotka rijesenih testova Statistika
. Izracunaj median dva igraca na osnovu podataka koji predstavljaju rezultate u pogadjanju mete: Igrac 1., 5,34,35, 41, 41, 46, 46, 46, 47, 49,54,54,59, 60 Igrac. 8,13,14,16,3,6,8,33,39,61 Median je broj koji je na sredini slijeda brojeva koji cine promatrani skup: n + 1 15+ 1 Igrac 1. ima 15 podataka i srednji broj je 46, tj. = = 8 osmi broj brojeci sa lijeva na desno:, 5,34,35, 41, 41, 46, 46, 46, 47, 49,54,54,59, 60 M = 46 Igrac. ima 10 podataka i nema srednjeg broja, vec tu vrijednost treba izracunati: n + 1 11 = = 5.5, median je aritmeticka sredina brojeva na polozaju 5 i 6: 3 + 6 8,13,14,16, 3, 6,, 8 33,39,61 median isnosi M = = 4.5 3. Izracunaj srednju vrijednost pogodaka svakog od igraca u gormnjem zadatku: Igrac 1., 5,34,35, 41, 41, 46, 46, 46, 47, 49,54,54,59, 60 Igrac. 8,13,14,16,3,6,8,33,39,61 Srednja aritmeticka vrijednost iznosi: Igrac 1. 15 1 n = = n 15 ( + 5 + 34 + 35 + 41+ 41+ 46 + 46 + 46 + 47 + 49 + 54 + 15 + 54 + 59 + 60) 659 = = 43.9 15 15 ( + + + + + + + + + ) 8 13 14 16 3 6 8 33 39 61 61 = = = = n 10 10 = 6.1 1 n Igrac. 6.1 4. Izracunaj srednju aritmeticku vrijednost postotka kojim je rjesen ispit iz zadatka 1. U ovom slucaju, posto su podaci dani u intervalima, za proracun treba uzeti sredinu intervala a za broj podataka n, vrijednosti propadajucih frekvencija: () + () + + + () + + + () f 1 61 1 74 5 86 3 37 1 63 4... 97 1 5733 = = = = 71.7 f 80 80 5. Izracunaj standardnu devijaciju iz zadatka 1. Statistika 3
Interval 0 4 5 9 30 34 35 39 40 44 45 49 50 54 55 59 60 64 65 69 70 74 75 79 80 84 f f f 7 3 37 4 47 5 57 6 67 7 77 8 1 0 0 1 3 1 1 4 8 10 14 16 7 0 0 37 16 47 5 8 496 670 1008 13 574 484 0 0 1369 59 09 704 1996 3075 44890 7576 94864 47068 Interval 85 89 90 94 95 99 87 9 97 f 7 5 f 609 460 194 f 5980 430 18818 ( ) f = f = f = 80 5755 4935 f 5755 f 4935 = = = 71.9375 ( ) = = = 5366.565 f 80 f 80 = 5175.0039 s = = 5366.565 5175.0039 = 191.5586 s = 191.5586 = 13.84 Zakljucak: Studenti su rjesili ispit prosjecno sa 71.9375% i standardnom devijacijom od 13.84%. 6. Standardna krivulja normalne distribucije je krivulja predstavljena jednadzbom 1 = e. Ova krivulja je "pravilna i simetricna" i koristi se za odredjivanje π postotka raspodjele podataka unutar intervala. Tako je za primjer 1 : 68% podataka je unutar intervala s s = 71.9375 13.84 = 58.097 95.4% podataka je unutar intervala s s = 71.9375 13.84 = 44.575 99.7% podataka je unutar intervala 3s 3s = 71.9375 3 13.84 = 30.4175 Graficki prikaz krivulje izgleda ovako: 1 1 71.9375 s 13.84 1 1 = e = e s π 13.84 π Statistika 4
7. Metoda pronalazenja "prikladnog pravca po metodi minimalnih kvadrata" Odredi pravac po metodi minimalnih kvadrata, koji ce predstavljati podatke sa ispita. Rezultati rjesenosti testa oznaceni su sa %, a broj studenata koji je postigao taj uspjeh, oznacen je sa. Broj mjerenja n = 10 : 63 88 77 67 70 93 7 81 47 74 9 33 17 6 37 30 3 3 30 187 904 1694 1139 180 3441 160 59 1081 0 3969 7744 599 4489 4900 8649 5184 6561 09 5476 73 79 0878 55110 Jednadzba trazenog pravca je: = k+ l a vrijednosti za k i l imaju oblik: ( )( ) ( )( ) ( ) l n n n k = = Jednadzba trazenog pravca ima oblik: n ( ) = k+ l = + n n ( ) ( ) 10( 5 ) 73 10 0878 73 79 55110 79 0878 73 = + 5110 73 10 55110 = 0.98+ 6.09 8. Podaci koji imaju takvu raspodjelu da se ne mogu prikazati metodom "prikladnog pravca", mogu se prikazati koristenjem prikladnih funkcija, kao na primjer 1 kvadratne funkcije ili hiperbole. U jednadzbu pravca, umjesto velicine, staviti cemo funkciju f = i sada nasa jednadzba ima oblik: = k f + l k + l Promotrimo slijedeci primjer: Statistika 5
Odredi prikladni graficki prikaz za podatke u tabeli, koristenjem kvadratne jednadzbe: f = ( ) 0 1 3 4 5 n = 6 1 5 1 4 53 76 171 0 1 4 9 16 5 55 0 5 48 16 484 1900 3017 0 1 16 81 56 65 979 Jednadzba trazenog "pravca" je: = k ( )( ) ( )( ) ( ) n n n = k + l = 6( 979) 55 = + 3.05 0.5 6( 979) 55 6 3017 55 171 979 171 3017 55 = + + l a vrijednosti za k i l imaju oblik: + = Statistika 6