Katara Košmelj UPORABNA STATISTIKA Druga dopoljea zdaja Ljubljaa, 7
Recezeta: prof. dr. Jaez Stare prof. dr. Auška Ferlgoj Lektorca: prof. Mja Kop Oblkovaje besedla slk: mag. Matjaž Jera CIP - Katalož zaps o publkacj Naroda uverzteta kjžca, Ljubljaa 3(75.8) KOŠMELJ, Katara Uporaba statstka [Elektrosk vr] / Katara Košmelj. -. dopoljea zd. Ljubljaa: Botehška fakulteta, 7 Nač dostopa (URL): http://www.bf.u-lj.s/agroomja/o-oddelku/katedre--drugeorg-eote/za-statstko/studjske-zadeve/uporaba_statstka.pdf ISBN 978-96-675-6- 357774 Vse pravce prdržae, reproducraje razmoževaje dela po zakou o avtorsk pravc dovoljeo. Copyrght Katara Košmelj, 7
Katara Košmelj: Uporaba statstka 7 Predgovor PREDGOVOR Make t as smple as possble but ot smpler. (Albert Este) Delo je amejeo začetkom a področju uporabe statstke, k majo vsaj sredješolsko zaje matematke. Nastalo je a osov mojh predavaj a Botehšk fakultet a dodplomskem študju. Kjga ma dve rav, osovo rave adgradjo, k je ozačea z zvezdcam. Delo ma sedem poglavj: Uvod, Opsa statstka, Osove verjetostega račua, Osove statstčega sklepaja, Prmerjava dveh populacj, Regresja korelacja ter H-kvadrat prezkus. Struktura poglavj je prkazaa z mselm vzorc, k so v prlog. Vsako poglavje ma aloge, s katerm študet prever aučeo sov, reštve so v prlog. Pobudo za astaek statstke so dale razlče stroke, matematka pa je dala orodje za jeo delovaje. Zato je statstka v bstvu matematča dscpla. Vedar to delo psao s stalšča matematče teorje, k je podpora statstk. Namero je apsao tako, da je matematka podaa v ajmajš mož mer. Matematčo teorjo sem skušala adomestt z grafčm prkaz, lustracjam z velkm števlom prmerov. Vem, da za večo ljud velja, da ustreza slka adomest mogo razlag ter da se ajveč aučmo z prmerov. Zato je v kjg velko prmerov, veča z realega sveta, čeprav so zarad razumljvh omejtev poeostavlje. Reštve prmerov so podae v tolkš mer, da je sov ustrezo lustrraa. Izdelava dela je bla tehčo zahteva, pr zdelav slk pr kočem oblkovaju besedla m je pomagal mag. Matjaž Jera. Moge strokove zboljšave sta predlagala recezeta ter mag. Damjaa Kastelec mag. Matjaž Jera. Lektorca prof. Mja Kop je zboljšala kakovost besedla. Vsem avedem se za jhove predloge, trud potrpežljvost ajlepše zahvaljujem. Moja zahvala tud vsem, k so m posredoval podatke. Statstčemu uradu R Sloveje pa se zahvaljujem za tskaje učbeka. Pr psaju učbeka sem skušala sledt zgoraj avedeemu asvetu Alberta Estea. Trudla sem se ajt komproms med teorjo prakso, k je prmere za začetke, ter delo apsat tako, da b se študet v čm krajšem času čm več aučl ter da b mu blo učeje v veselje. Krtčm bralcem bom hvaleža za oceo, kolko sem pr teh cljh uspela. Prav tako bodo dobrodošl vs predlog, popravk zboljšave. Katara Košmelj Ljubljaa, jauar Druga zdaja je dopoljea zdaa v elektrosk oblk. Ljubljaa, oktober 7 3
Kazalo vsebe UVOD...9. KAJ JE STATISTIKA...9. OSNOVNI POJMI..... Populacja, vzorec..... Spremeljvke....3 NAČINI PROUČEVANJA MNOŽIČNIH POJAVOV...3.3. Opazovaje...4.3. Načrtova poskus...7 OPISNA STATISTIKA.... RELATIVNA ŠTEVILA..... Strukture..... Koefcet...5..3 Ideks...6. FREKVENČNA PORAZDELITEV...35.. Frekveča porazdeltev za opso spremeljvko...36.. Frekveča porazdeltev za števlsko spremeljvko...36.3 KVANTILI...43.3. Okvr z ročaj...48.4 MERE SREDINE: SREDNJE VREDNOSTI...53.4. Modus...53.4. Medaa...55.4.3 Povprečje...56.5 MERE VARIABILNOSTI...64.5. Absolute mere varablost...64.5. Relatve mere varablost...68 3 OSNOVE VERJETNOSTNEGA RAČUNA...7 3. VERJETNOSTNI RAČUN IN STATISTIKA...7 3.. Slučaja spremeljvka...7 3.. Statstča spremeljvka slučaja spremeljvka...74 3. VERJETNOSTNE PORAZDELITVE...78 3.. Normala porazdeltev...78 3.. *Bomska porazdeltev...83 3.3 PORAZDELITVE VZORČNIH STATISTIK...87 3.3. Porazdeltev vzorčh artmetčh sred...88 3.3. *Porazdeltev vzorčh deležev...9 3.3.3 Porazdeltev t-statstk...9 3.3.4 *Porazdeltev vzorčh varac...93 4 OSNOVE STATISTIČNEGA SKLEPANJA...97 4. *OCENJEVANJE PARAMETROV...97 5
4.. *Točkova ocea parametra...97 4.. *Itervala ocea parametra...98 4. PREIZKUŠANJE STATISTIČNIH DOMNEV...9 4.. Prcp prezkušaja statstčh domev...9 4.. Postopek pr prezkušaju statstčh domev... 4..3 Napake pr prezkušaju statstčh domev...3 4..4 *Dvostraske eostraske alteratve domeve...6 4..5 p-vredost...8 4..6 Pregled prezkusov o povprečju o Beroulljev verjetost... 5 PRIMERJAVA DVEH POPULACIJ...3 5. DVA NEODVISNA VZORCA...3 5.. Razlka povprečj...3 5.. *Razlka Beroulljevh verjetost...3 5. DVA ODVISNA VZORCA...34 5.. Razlka povprečj...34 5.. *Razlka Beroulljevh verjetost...4 5.3 PREGLED PREIZKUSOV ZA NEODVISNA IN ZA ODVISNA VZORCA...43 6 REGRESIJA IN KORELACIJA...45 6. UVOD...45 6. ENOSTAVNA LINEARNA REGRESIJA...45 6.. Izraču oce apoved...45 6.. Koefcet determacje...5 6..3 *Statstčo sklepaje pr eostav lear regresj...5 6.3 KORELACIJA...6 6.3. Pearsoov koefcet korelacje...6 6.3. *Spearmaov koefcet korelacje...7 7 χ -PREIZKUSI...77 7. PREIZKUŠANJE DOMNEVE O PORAZDELITVI SPREMENLJIVKE 77 7. ANALIZA KONTINGENČNIH TABEL...87 7.. Uvod...87 7.. Povezaost dveh opsh spremeljvk...89 7..3 Homogeost struktur...94 7..4 *Podatk v parh...98 8 PRILOGA: STATISTIČNE TABELE...5 8. SLUČAJNE ŠTEVKE...5 8. STANDARDIZIRANA NORMALNA PORAZDELITEV...6 8.3 STUDENTOVA PORAZDELITEV...7 8.4 χ -PORAZDELITEV...8 8.5 F-PORAZDELITEV, α =,5...9 6
8.6 F-PORAZDELITEV, α =,5... 8.7 F-PORAZDELITEV, α =,... 8.8 F-PORAZDELITEV, α =,... 8.9 PEARSONOV KOEFICIENT KORELACIJE, α =,5 IN,...3 8. SPEARMANOV KOEFICIENT KORELACIJE, α =,5 IN,...4 9 REŠITVE NALOG...5 9. Uvod...5 9. Opsa statstka...6 9.3 Osove verjetostega račua...9 9.4 Osove statstčega sklepaja... 9.5 Prmerjava dveh populacj... 9.6 Regresja korelacja...3 9.7 χ -prezkus...4 LITERATURA...7 STVARNO KAZALO...9 KAZALO TABEL...33 3 KAZALO SLIK...37 7
Katara Košmelj: Uporaba statstka 7. Uvod UVOD. KAJ JE STATISTIKA Začmo to kjgo z opredeltvjo pojma statstka. Kratko jedrato b povedal takole: statstka je veda, k proučuje pojave, k se kažejo v velkem števlu v določeem času prostoru. Takm pojavom rečemo možč pojav. Name statstčega proučevaja je globlje razumevaje možčega pojava, odkrvaje jegovh zakotost apovedovaje. Statstčo proučevaje posredo pomaga drugm strokam pr upravljaju, vodeju ačrtovaju razlčh procesov. Pomembe poudarek v zgorj opredeltv je a besed možče. Že a začetku jaso povejmo, da se statstka ukvarja z zakotostm, k veljajo pr proučevaem možčem pojavu, e s posamezm eotam, k sestavljajo ta pojav. Prmer možčega pojava je pr. študj a Uverz v Ljublja. Statstčo proučevaje b blo lahko usmerjeo v proučevaje uspešost brucev v določeem obdobju. Poskušal b ugotavljat zakotost, k vplvajo a uspešost brucev a Uverz v Ljublja. Te zakotost se aašajo a vse obravavae bruce, o posamezku zvemo zelo malo. Statstka proučuje zakotost možčh pojavov a posebe ač. Njeo delo sestavljajo tr faze, k s sledjo druga za drugo: zbraje urejaje podatkov, k opsujejo proučeva možč proces; aalza zbrah podatkov. Pr tem uporabljamo posebo statstk lasto metodologjo, to so t.. statstče metode. Nabor statstčh metod je velk, zbra metode je odvsa od amea aalze ter od vrste podatkov. Aalzo podatkov s lahko predstavljamo kot mlček, v katerega damo podatke, zberemo ustrezo rezlo (statstče metode), z mlčka pa dobmo rezultate; razlaga rezultatov. Pr razlag mora veljat poudarek vsebsk terpretacj rezultatov, torej razlag v smslu, kaj smo o proučevaem možčem procesu zvedel ovega. Vsaka zmed opsah faz je ključa za uspešost statstčega proučevaja mora bt opravljea premšljeo, korekto celovto. V vsakdajem žvljeju ma beseda statstka ožj pome. Govormo pr. o statstk vpsa študetov, o statstk prometh esreč, o statstk brezposelh pd. V tem prmeru ta beseda pome: zbraje urejaje podatkov, prkazovaje podatkov zraču eostavh kazalcev o pojavu. V okvru statstče metodologje uporabljamo besedo statstka še v tretjem pomeu. Statstka predstavlja fukcjo, k jo a določe ač zračuamo z podatkov, pr. z-statstka, t-statstka pd. Te fukcje bomo spozal kaseje. S statstko so se ukvarjale že zelo stare cvlzacje. Ohraje so grafč prkaz števla oseb, žve, prdelka (pr. babloska glea plošča, 38 pr.. š.). Egpča, Ktajc, Grk, Rmlja so zvajal popse prebvalstva. Rmlja so sstematčo zbral tud druge podatke o osvojeh ozemljh. V sredjem veku so zvajal popse cerkveh zemljšč (Pp Mal, Karel Velk, 8. stol.), astala je prva zemljška kjga (Vljem Osvajalec,. stol.). Zače se sstematčo proučevaje ekoomskh demografskh pojavov. Pojav se beseda statstka, k zvra z latske besede status (staje, prav, držav položaj). 7. 8. stoletje preseta razvoj verjetostega račua, k je temelj statstke (Blase Pascal, Jacques Beroull, Sméo- Des Posso, Albert de Movre, Carl Fredrch Gauss, Perre Smo Laplace). Začetek. stoletja prese razvoj regresjske korelacjske aalze (Fracs Galto, Karl Pearso), okol 9 je začetek statstčega sklepaja (Roald Fsher, Ego Pearso, Jerzy Neyma). Po letu 96 račualška tehologja razšr dejavost statstke pospeš je razvoj. Okol 9
Katara Košmelj: Uporaba statstka 7. Uvod 98 se pojavjo ov ač metode za aalzo podatkov, pr. metode za razskovaje podatkov (Joh Tukey). Daes je statstka je terdscplara veda. Je del mogh aravoslovh družboslovh ved. Npr. del bološkh medcskh ved je bostatstka bometrka, del demografje je demografska statstka, del ekoomje je ekoomska statstka ekoometrka td. Pomemba veja statstke je država statstka, to je statstka za potrebe države. Vsaka država ma pooblaščeo sttucjo, k zbra obdeluje za državo pomembe podatke. Za Slovejo je pooblaščea sttucja Statstč urad R Sloveje (SURS). Izdaja razlče publkacje, ajpomembejša je Statstč letops (SL), k zhaja vsako leto. Šroka uporabost statstčh metod zhaja z dejstva, da majo statstče metode matematče temelje. Z razvojem statstčh metod, k so eodvse od področja uporabe, se ukvarja poseba matematča dscpla, to je matematča statstka. Opra se a verjetost raču. V tem delu se z matematčo statstko e bomo ukvarjal, bomo pa uporabljal jee rezultate.. OSNOVNI POJMI.. Populacja, vzorec Pr statstčem proučevaju možčega pojava moramo ajprej opredelt statstčo populacjo. Statstča populacja, krajše populacja, je podaa s trem opredeltvam: stvara opredeltev: koga oz. kaj proučujemo? krajeva opredeltev: kje? časova opredeltev: kdaj? Prmer populacje: študet, vpsa v. letk Botehške fakultete v šolskem letu 998/99. Populacje so stvare hpotetče. Stvare populacje obstajajo v realem svetu, hpotetče populacje s lahko le zamslmo. Populacjo sestavljajo eote. Ozaka N ozačuje števlo eot v populacj. Ker proučujemo možče pojave, je N avado velko števlo. Del populacje meujemo vzorec. Za statstko je vzorec del populacje, katerega eote zbramo z ameom, da ocemo staje v populacj. Vzorec, k dobro posreduje lastost celote populacje, meujemo reprezetatve vzorec. Ozaka ozačuje števlo eot v vzorcu, < N. Imamo osovo populacjo velkost N. To populacjo vzorčmo, da dobmo vzorec zbrae velkost. Števlo vzorcev, k jh lahko dobmo z osove populacje, je pravloma ogromo. Poglejmo bolj atačo to možco. Vs vzorc velkost, k jh lahko dobmo z osove populacje velkost N, tvorjo populacjo vzorcev velkost. To je hpotetča populacja, k je zjemo pomemba za matematčo statstko. Eota populacje vzorcev velkost je e vzorec velkost. Populacja vzorcev določee velkost ma zelo velko eot že pr majhh osovh populacjah. Števlo vzorcev velkost, k jh lahko dobmo z osove populacje velkost N, je odvso od ača zbre eot: zbrao eoto vremo v populacjo, zbrae eote e vremo v populacjo. Števlo vzorcev zračuamo z varacjam s poavljajem oz. brez poavljaja takole: zbrao eoto vremo v populacjo: ( p) števlo vzorcev = V = N N... N = N zbrae eote e vremo v populacjo: N
Katara Košmelj: Uporaba statstka 7. Uvod števlo vzorcev = V N = N ( N ) ( N )... ( N + ) Pr zračuu števla vzorcev smo upošteval, da se vzorc, k vsebujejo ste eote v razlčem vrstem redu, vsebsko razlkujejo. V praks avado ta predpostavka utemeljea. Če je tako, je števlo vzorcev majše se zračua s kombacjam s poavljajem oz. brez poavljaja takole: zbrao eoto vremo v populacjo: N + števlo vzorcev = C ( p ) N = zbrae eote e vremo v populacjo: N števlo vzorcev = C N = Prmer Osova populacja so gospodjstva v obč Dol a da.. 998. Teh je 5. Za aketo potrebujemo 6 gospodjstev. Vs vzorc s po 6 gospodjstv z obče Dol tvorjo populacjo vzorcev velkost 6. Eota te populacje je e vzorec s 6 gospodjstv. V vzorcu se gospodjstva lahko poavljajo, vzorc z stm gospodjstv v razlčem vrstem redu se vsebsko razlkujejo. Števlo vzorcev velkost 6 zbrah z osove populacje velkost 5 je 6 85 5 = 6,5 V vzorcu aj bodo razlča gospodjstva. Števlo vzorcev velkost 6 zbrah z osove populacje velkost 5 je: 85 5 49... 9 =,5 Če upoštevamo še, da so vzorc z stm gospodjstv v razlčem vrstem redu ekvvalet, je števlo vzorcev majše: 5 3 =,86 6 Prmer Osovo populacjo predstavljajo voll upravčec v Slovej a da... Teh je prblžo,5 mljoa. Razskovalc so pred voltvam zvedl predvollo aketo, v katero so vključl 3 vollh upravčecev. V vzorcu se aketrac e poavljajo, vzorc z stm aketrac v razlčem vrstem redu so ekvvalet. Izračuajmo števlo možh vzorcev: 5 38 =,3 3 Izračuao števlo je epredstavljvo velko. Za jegov zraču smo uporabl dovolj zmogljv račualk... Spremeljvke Zamajo as lastost eot. Npr. pr proučevaju uspešost brucev as zamajo asledje lastost brucev: leto rojstva, kraj rojstva, spol, opravljea sredja šola, smer študja td. V
Katara Košmelj: Uporaba statstka 7. Uvod statstk opsuje posamezo lastost eote statstča spremeljvka, krajše jo bomo meoval kar spremeljvka. Vsaka spremeljvka ma določee vredost. Npr. vredost spremeljvke spol sta: mošk, žesk; vredost spremeljvke leto rojstva so 975, 976, 977 td. Spremeljvke ozačujemo z velkm črkam s koca abecede, jhove vredost pa s prpadajočm malm črkam. Npr. spremeljvka X ma vredost x, x td. Glede a to, kako se vredost spremeljvke zražajo, ločmo: opse (atrbutve, kvaltatve) spremeljvke: vredost se zražajo z ops (besede, zak, števlke); števlske (umerče, kvattatve) spremeljvke: vredost se zražajo s števl, s katerm lahko račuamo. Prmer Opse spremeljvke so: spol, kraj rojstva, zobrazba očeta, smer študja; števlske spremeljvke so: leto rojstva, števlo otrok v druž. Števlske spremeljvke delmo v več skup: dskrete spremeljvke. Za dskreto spremeljvko velja, da lahko zavzame le določee vredost. Njee vredost so avado cela števla, pogosto jh dobmo s štetjem. Npr.: števlo otrok v druž, števlo opravljeh zptov; zveze spremeljvke. Spremeljvka je zveza, če med poljubma dvema vredostma a jeem defcjskem območju vedo obstaja tretja vredost. Vredost zveze spremeljvke avado dobmo z merjejem al zračuavajem. Npr.: starost, vša, stopja flacje. Omet velja, da so doblje podatk za zveze spremeljvke bolj al maj dskretzra zarad omejee atačost merlh aprav zarad zaokrožaja vredost. Tako pr. všo oseb mermo občajo v cetmetrh, štejemo pa jo za zvezo spremeljvko. ostale, s katerm se e bomo ukvarjal. Za statstčo spremeljvko določmo jeo mersko lestvco. Le-ta je opredeljea glede a urejeost vredost spremeljvke: v vredosth obee urejeost (pr. smer študja: ekoomja, bologja, zgodova), vredost lahko uredmo v smsel vrst red (pr. zobrazba: osova, sredja, všja, vsoka), vredost lahko odštevamo (pr. temperatura zraka: C, -5 C), vredost lahko delmo (pr. masa: kg, kg). Glede a to, kolkša je ta urejeost, ločmo štr vrste spremeljvk: meska (ommala) spremeljvka: v vredosth spremeljvke obee urejeost. Npr.: kraj rojstva, smer študja, barva oč. Posebe vrste meskh spremeljvk so dvojške (bare) spremeljvke, k majo samo po dve vredost. Npr.: spol (mošk, žesk), štpedst (da, e). urejeosta (ordala) spremeljvka: vredost lahko uredmo glede a ekakše arav vrst red. Npr.: zobrazba, šolska ocea. razmča (tervala) spremeljvka se zraža števlsko. Poljub dve vredost spremeljvke lahko odštevamo, e pa delmo. Npr.: temperatura zraka, leto rojstva. razmerosta spremeljvka je števlska spremeljvka, pr kater je razmerje poljubh dveh jeh vredost smselo. Npr.: starost, vša štpedje, leta kolča padav. Urejeost arašča od meske do razmeroste spremeljvke. Opse spremeljvke majo mesko al urejeosto mersko lestvco, števlske pa razmčo al razmerosto. Izbra
Katara Košmelj: Uporaba statstka 7. Uvod ustreze statstče metode temelj tud a mersk lestvc spremeljvke. Čm všja je merska lestvca spremeljvke, tem več je prmerh statstčh metod. NALOGE. Bruc Populacja je opredeljea takole: vpsa v prv letk vsokošolskega študja Uverze v Ljublja v šolskem letu 997/98. Ob vpsu študet zpoljujejo vprašalk, a katerem so vprašaja, k se aašajo tud a asledje spremeljvke: prmek, spol, pošta števlka kraja stalega bvalšča, zobrazba očeta, zobrazba matere, števlo otrok v druž, oddaljeost stalega bvalšča od fakultete (km), štpedst (Da/Ne), vša štpedje (SIT). a) Kaj je stvara, časova krajeva opredeltev populacje? b) Kaj je eota te populacje? c) Za vsako od spremeljvk avedte vsaj eo smselo vredost. d) Ugotovte vrsto spremeljvke. Za števlske spremeljvke ugotovte še vrsto števlske spremeljvke. e) Kakša je spremeljvka glede a mersko lestvco? f) Al je katera od avedeh spremeljvk dvojška?. Prometo dovoljeje V Republk Slovej vpšejo ob prv regstracj v prometo dovoljeje za regstrrao vozlo tud asledje podatke: podatk o prv regstracj: datum, kraj, regstrska ozačba; podatk o lastku: prmek, me, stalo prebvalšče; podatk o vozlu: vrsta, zamka, tp, števlka šasje, števlka motorja, leto zdelave, moč motorja (kw), delova prostora (cm 3 ), masa prazega vozla (kg), števlo potškh mest. Odgovorte a sta vprašaja kot pr alog Bruc. 3. Populacja vseh vzorcev V amšlje populacj so tr eote, ozačmo jh A, B, C. Zapšte vse vzorce velkost. Izračuajte, kolko jh je. Pogoj: a) zbrae eote vračamo, vzorc z stm elemet v razlčem vrstem redu se razlkujejo; b) zbrah eot e vračamo, vzorc z stm elemet v razlčem vrstem redu se razlkujejo; c) zbrae eote vračamo, vzorc z stm elemet v razlčem vrstem redu so ekvvalet; d) zbrah eot e vračamo, vzorc z stm elemet v razlčem vrstem redu so ekvvalet. 4. Gorj Dol V kraju Gorj Dol je blo de.. 998 6 gospodjstev. Za aketo potrebujemo vzorec, v katerem je 5 razlčh gospodjstev, vzorc z stm elemet v razlčem vrstem redu so ekvvalet. Kolkšo je števlo vseh vzorcev?.3 NAČINI PROUČEVANJA MNOŽIČNIH POJAVOV Najpomembejša ača proučevaja možčh pojavov sta opazovaje ačrtova poskus. 3
Katara Košmelj: Uporaba statstka 7. Uvod.3. Opazovaje Razskovalec opazuje oz. pregleduje eote ugotavlja vredost zaj zamvh spremeljvk pr teh eotah. Iz dobljeh vredost zračua določee karakterstke spremeljvk. Npr.: kolkše odstotek študetov Uverze v Ljublja 998/99 ma štpedjo kolkša je povpreča štpedja? Glede a števlo proučevah eot ločmo popolo delo opazovaje. Pr popolem opazovaju proučujemo vse eote v populacj. To zahteva velko dearja, časa, dobro orgazacjo. Dva ajpomembejša ača popolega opazovaja sta: pops: proučujemo vse eote populacje v določeem treutku. Pops se poavljajo v fksh razmkh, da se ugotavlja damka pojava. Npr. pops prebvalstva so v desetleth razmkh; tekoča regstracja: sproto beležmo določee dogodke v populacj, pr. regstracja rojstev, smrt, opravljeh zptov. Tekočo regstracjo zvajajo pooblaščee službe. Zelo pogosto popolo opazovaje zvedljvo zarad pomajkaja dearja, časa, osebja, včash vseh podatkov mogoče dobt. Zato opazujemo le določee eote z celote populacje. Takemu opazovaju rečemo delo opazovaje. Iz populacje zberemo vzorec, k ga proučujemo, amesto da b proučeval celoto populacjo. Ker sklepaje temelj a epopol formacj, so statstč sklep bolj al maj verjet. Glede a ač zbre eot ločmo dve vrst vzorcev: eslučaj vzorc: zbra eot temelj a eslučaj zbr eot, pr. a zbr tpčh eot, a zbr ajlažje dosegljvh eot; slučaj vzorc: zbra eot temelj a določeem verjetostem zakou. Prede začemo z vzorčejem, moramo razmslt, kako aj zbramo eote z populacje, kolko eot aj bo v vzorcu pd. Odgovore a ta vprašaja posreduje matematča statstka, vedar samo za slučaje vzorce. Zato se, če se le da, odločamo za slučajo vzorčeje. Za zvedbo slučajega vzorčeja potrebujemo okvr vzorčeja, to je sezam (skca) vseh eot populacje. V tem sezamu prredmo vsak eot jeo ozako: eote v okvru oštevlčmo s celm števl od do N. Ločmo dve vrst slučajega vzorčeja: slučajo vzorčeje brez omejtev, slučajo vzorčeje z omejtvam. Če je populacja homogea, uporabmo slučajo vzorčeje brez omejtev, scer so bolj prmere zvedeke slučajega vzorčeja, k upoštevajo razlče omejtve..3.. Slučajo vzorčeje brez omejtev Slučajo vzorčeje brez omejtev je eostavo slučajo vzorčeje sstematčo vzorčeje (pogojo)..3... Eostavo slučajo vzorčeje Pr eostavem slučajem vzorčeju velja, da ma vsaka za vzorčeje razpoložljva eota populacje a vsakem koraku vzorčeja eako verjetost, da je zbraa v vzorec. Izbra eot za eostav slučaj vzorec temelj a uporab geeratorja slučajh števl, zvedbe pa so razlče: loterja, tabele slučajh števk, račualk. Loterjsk ač: oštevlčee lstke z ozakam od do N damo v bobe jh slepo vlečemo; Tabela slučajh števk: v Prlog v Tabel je z slučajh števk. Zarad lažje berljvost so števke predstavljee v skupcah. Ker so števke slučaje, jh lahko začemo odčtavat kjerkol v tabel. Recmo, da je števlo eot v populacj k-mesto števlo. Potem z tabele slučajh števk beremo po k slučajh števk skupaj. Prebra z števk se aaša a 4
Katara Košmelj: Uporaba statstka 7. Uvod ozako eote v okvru vzorčeja. Če te ozake eote v okvru, z zpustmo. Postopek adaljujemo tolko časa, da mamo zbrah potrebo števlo eot za vzorec. Prmer V populacj je 855 eot. Za eostav slučaj vzorec potrebujemo razlčh eot. Števlo N = 855 je trmesto, torej je k = 3. V tabel slučajh števk pr. začemo v prv vrstc prvem stolpcu. Beremo po 3 števke skupaj. Upoštevamo le tsta števla, k so a tervalu do 855; ostale zpustmo: 34, 743, 738, 636, 964, 736,... Prečrtaa števla zpustmo. Izbro adaljujemo tako dolgo, da zberemo razlčh eot. Fukcja RANDOM a kalkulatorju geerra slučaja števla a tervalu [, ), števla majo tr decmala mesta. Naj s ozačuje slučajo števlo a kalkulatorju, S pa slučajo števlo a tervalu [, N], k ustreza celoštevlsk ozak eote v okvru vzorčeja. Trasformacja slučajega števla s v slučajo števlo S je: S = INT ( N s +) Fukcja INT (agl. teger) decmalemu števlu odreže vse decmalke. Izbra s kalkulatorjem je bstveo htrejša kot s tabelo slučajh števk, vedar je postopek s kalkulatorjem prmere le za populacje, k majo ajveč eot. Prmer N = 855, a kalkulatorju dobljeo slučajo števlo je s =, 876. Potem je: S = INT ( 855,876) + = 749 Izbraa je eota z ozako 749. Geeratorj psevdo-slučajh števl v programsk oprem. Za večje prmere je smselo uporabt geeratorje psevdo-slučajh števl v ustrez programsk oprem..3... Sstematčo vzorčeje Izvedba eostavega slučajega vzorčeja a tereu je pogosto težka. Npr. eostava slučaja zbra dreves v velkem sadovjaku je tehčo zahtevo zamudo delo. Zato pogosto eostavo slučajo vzorčeje adomestmo s sstematčm vzorčejem, k je v praks lažje zvedljvo. Najprej zračuamo korak K od ee zbrae eote do druge: N K = ROUND Fukcja ROUND zaokrož rezultat a celo števlo. Iz okvra vzorčeja sstematčo zberemo vsako K- to eoto. Elemet slučajost vpeljemo s slučajo zbro prve zbrae eote. Izbramo med eotam a začetku okvra, jhove ozake so,,, K. Pr tem uporabmo eostavo slučajo vzorčeje. Sstematčo vzorčeje lahko povzroč, da dobmo v vzorec ekaj eot preveč oz. ekaj eot premalo, odvso od zaokrožaja pr zračuu koraka. V obeh prmerh sstematčo vzorčeje poovmo: če smo dobl ekaj eot preveč, presežek eot zločmo, tako da poovmo sstematčo vzorčeje a zbrah eotah; če smo dobl ekaj eot premalo, zberemo majkajoče eote s sstematčm vzorčejem a ezbrah eotah. 5
Katara Košmelj: Uporaba statstka 7. Uvod Sstematčo vzorčeje slučajo vzorčeje, saj zbra temelj a sstemu. Izkaže pa se, da je avado dober prblžek eostavemu slučajemu vzorčeju. Pogosto se uporablja v kmetjstvu v gozdarstvu. Prmer V okvru vzorčeja je 5 eot, k majo ozake od do 5. Za vzorec potrebujemo 6 eot. Za zbro bomo uporabl sstematčo vzorčeje. Korak je: 5 K = ROUND = 8 6 Izbral bomo vsako osmo eoto z okvra vzorčeja. S slučajo zbro eot z ozakam,, 3, 4, 5, 6, 7, 8 določmo, kje začemo. Recmo, da je slučaja zbra dala. Izbrae so eote z ozako:,, 8, 6,..., torej eote: + 8 k, k =,,,..., 5/8 = 6. V vzorec smo dobl 63 eot, torej 3 preveč. Naredmo ov okvr vzorčeja. Izbrae eote ozačmo do 63 poovmo sstematčo vzorčeje, s katerm bomo zmed 63 zločl 3 eote. Izračuamo korak: 63 K = ROUND = 3 Slučaja zbra eot z ozakam do je dala 4. Torej z okvra zločmo eote z ozakam 4, 5, 46. Preostalh 6 eot je amejeh za vzorec..3.. Slučajo vzorčeje z omejtvam Na kratko bomo predstavl dve vrst slučajega vzorčeja z omejtvam: stratfcrao vzorčeje večstopejsko vzorčeje..3... Stratfcrao vzorčeje V določeh prmerh eostavo slučajo vzorčeje ajbolj prmero. Recmo, da pr pololeth osebah proučujemo prljubljeost modere glasbe. Prčakujemo lahko, da majo mlajš drugače odos do modere glasbe kot starejš, saj starost osebe vplva a odos do modere glasbe; starost je moteč dejavk pr proučevaju prljubljeost modere glasbe. Lahko b se zgodlo, da b s slučajo zbro dobl vzorec, v katerem b bl delež starejšh bstveo večj kot v prpadajoč populacj. Vzorec e b bl reprezetatve.v tem prmeru je smselo populacjo razdelt a dva dela, a mlajše a starejše, z vsakega dela zbrat eostav slučaj vzorec ustreze velkost. Če je populacja heterogea, jo poskusmo razdelt a homogee dele populacje, k jh meujemo stratum. Za stratume velja, da so zotraj stratumov podobe eote, med stratum pa so razlke lahko zelo velke. Stratume je potrebo opredelt a vsebsk osov, torej a osov pozavaja motečh dejavkov, za kar je potrebo dobro pozavaje populacje. Npr. smsel stratum pr aalzah javega meja so staroste skupe, spol, včash območje stalega bvalšča pd. Za vsak stratum potrebujemo okvr vzorčeja. Z eostavm slučajm vzorčejem zberemo z vsakega stratuma del vzorec. Števlo eot, k jh zberemo z posamezega stratuma, je lahko določeo a razlče ače; ajpogosteje je proporcoalo velkost stratuma. Prmer: Televzjska hša je proučevala gledaost določeh televzjskh oddaj. Populacja gospodjstev s TV sprejemkom je štela 7 89 gospodjstev. Razdeljea je bla a tr 6
Katara Košmelj: Uporaba statstka 7. Uvod geografske stratume, prv je štel 473 eot, drug 35 4 tretj 3 78. Spsek TV aročkov po regjah je predstavljal okvr vzorčeja. Odločl so se, da v vzorec vključjo % celote populacje, torej 79 gospodjstev, da z vsakega geografskega stratuma vzorčjo proporcoal del. Z eostavm slučajm vzorčejem je blo z prvega stratuma zbrah 5, z drugega 35 z tretjega 3 gospodjstev. Neslučaja alteratva stratfcraemu vzorčeju s proporcoalo zbro eot je kvoto vzorčeje. Uporabljamo ga takrat, kadar okvra vzorčeja za stratume mamo, mamo pa zae t.. kvote po stratumh, to je števlo eot po stratumh. Razskovalec zavesto zbra eote v vzorec tako, da so zpoljee kvote. Npr. če proučujemo populacjo pololeth oseb, k je stratfcraa po spolu, aketar a tereu zbra eote tako, da je odstotek žesk moškh v vzorcu eak kot v populacj..3... Večstopejsko vzorčeje Pr slučajem vzorčeju je bstveo, da mamo ustreze okvr vzorčeja. Le-ta pa pogosto e obstaja oz. dosegljv. Problem edosegljvost okvra vzorčeja lahko včash rešmo z vzorčejem v več stopjah. Recmo, da proučujemo populacjo gmazjcev v določeem šolskem letu. Spsek vseh gmazjcev dostope, dostope pa je spsek gmazj. Le-ta predstavlja okvr vzorčeja v prv stopj. Z eostavm slučajm vzorčejem z vseh gmazj zberemo določeo števlo gmazj. Za vsako zbrao gmazjo dobmo spsek djakov; ta služ za okvr vzorčeja v drug stopj. S slučajo zbro zberemo določeo števlo djakov v gmazjah, k so ble zbrae v prv stopj. Pr opsaem prmeru je blo uporabljeo dvostopejsko vzorčeje, stopej je lahko tud več..3. Načrtova poskus Pr ačrtovaem poskusu razskovalec aktvo posega v proučeva pojav. Eote, k so vključee v ačrtova poskus, meujemo poskuse eote. Razskovalec glede a ame razskave poskusm eotam prred obravavaja. V poskusu ugotavlja zd poskusa, to so vredost proučevae spremeljvke a poskush eotah. Nač dodeltve obravavaj ekspermetalm eotam sled stemu koceptu kot pr opazovaju: zadoščeo mora bt prcpu slučajost. Načrt poskusa je skca, k kaže, kako obravavaja dodelmo poskusm eotam. Pr ačrtovah poskush je zelo pomemba zasova poskusa. Ta mora poleg proučevah dejavkov upoštevat tud moteče dejavke. Le-t vplvajo a zd poskusa, vedar so predmet proučevaja. Če poskuse zvajamo v laboratorjskh pogojh, lahko moteče dejavke evtralzramo v bstveo večj mer kot pr poskush, k se zvajajo tereu. Prmer V sadovjaku je 3 jabla ste sorte starost, vse rastejo v eakh rasth pogojh. Drevesa slabo rodjo, sadjarj domevajo, da je vzrok temu pomajkaje bora v zemlj. Odločl so se, da bodo zvedl poskus tako, da bodo polovc jabla dodal bor, polovc pa e: poskuse eote: jablae v sadovjaku; obravavaja: kotrola, doda bor; zd poskusa: prdelek a drevo. Izdelajmo zasovo poskusa. Drevesa oštevlčmo od do 3 z eostavm slučajm vzorčejem zberemo 5 dreves. Tem bo doda bor, preostalm pa e. Slučajo zbro smo zvedl s kalkulatorjem. 7
Katara Košmelj: Uporaba statstka 7. Uvod Tabela -: Izbra dreves z eostavm slučajm vzorčejem Zaporeda zbra s S,74 3,8 9 3,778 4 4,564 7 5,5 6 6,967 3 7,59 8 8,4 9,84 5, 4,68 9,93 8 3,83 5 4,386 5,66 8 6,54 7 7,98 3 Izbraa so bla drevesa z ozakam:, 3, 4, 8, 9,, 6, 7, 8, 9, 3, 4, 5, 8, 3. NALOGE. Vaje V razredu je 49 študetov, pr vajah bo pred tablo sodelovalo 5 študetov, vsak po ekrat. Izberte študete za vaje: a) z eostavm slučajm vzorčejem; b) s sstematčm vzorčejem. Uporabte tabelo slučajh števk. Natačo opšte (vrstca, stolpec), kje ste odčtaval slučaje števke.. Aketa v Spodjem Dolu Imamo sezam gospodjstev v kraju Spodj Dol v letu 998. Le-teh je 3. Za aketo potrebujemo razlčh gospodjstev. Izberte gospodjstva za aketo: a) z eostavm slučajm vzorčejem; b) s sstematčm vzorčejem. 3. Cvetlčare Da b ugotovl, al je v mestu dovolj cvetlčar, so se razskovalc odločl zvest telefosko aketo, v katero b vključl 5 telefoskh aročkov. V mestu je 955 telefoskh aročkov, jhove telefoske števlke so v telefoskem meku. a) Kaj je proučevaa populacja? b) Kaj predstavlja telefosk mek? c) Izvedte sstematčo vzorčeje. 8
Katara Košmelj: Uporaba statstka 7. Uvod 4. Gledaje TV Razskovalce zama, kolko ur tedesko gleda študet Uverze v Ljublja televzjo. V razskav bodo upošteval le redo vpsae študete v tekočem šolskem letu. Razskovalc so a osov predhodh študj predpostavljal, da a gledaje TV vplva ač bvaja študetov: bvaje pr staršh oz. sorodkh, bvaje v študetskh domovh ter ostalo (ajemk, lasto gospodjstvo). Razmslte: a) Kaj v tej razskav predstavlja spremeljvka ač bvaja? Kaj določa? b) Kakše ač vzorčeja je prmere, če je okvr vzorčeja po stratumh razskovalcem dosegljv? c) Kakše ač vzorčeja je prmere, če okvr vzorčeja po stratumh razskovalcem dosegljv? Iz predhodh razskav je zao, da prblžo tretja študetov bva pr staršh al sorodkh, tretja v študetskh domovh tretja drugje. d) Al b bl rezultat reprezetatv za vse redo vpsae študete Uverze v Ljublja v tekočem šolskem letu al za vse študete Uverze v Ljublja? 5. Travk Na travku pravokote oblke z meram 6 m 4 m so želel ugotovt sestavo trave ruše. Na skc travka so aredl mrežo m m. Z eostavm slučajm vzorčejem bodo zbral parcelc velkost m, k e smejo ležat a robu travka. Izvedte postopek zbre. Namg: vsaka parcelca aj bo opsaa s koordato v smer os x v smer os y. 9
Katara Košmelj: Uporaba statstka 7. Opsa statstka OPISNA STATISTIKA. RELATIVNA ŠTEVILA Podatk postaejo zamv tedaj, ko jh med seboj prmerjamo. Števla lahko prmerjamo absoluto, pr. z razlko, al pa relatvo, pr. z razmerjem. Relatva števla prmerjajo dva podatka z jum razmerjem. Glede a to, v kakš vsebsk povezav sta podatka, k ju prmerjamo, mamo tr vrste relatvh števl: strukture, koefcete dekse. Pogledal s bomo jhov zraču prpadajoče grafče prkaze... Strukture Celota je razdeljea v K skup. Naj f določa števlo eot v -t skup, =,, K, to števlo meujemo frekveca. Pr zračuu strukture prmerjamo števlo eot, k jh ma posamč del celote, s števlom eot, k jh ma celota. Strukture zražamo v deležh al odstotkh. Delež eot v -t skup f f = K = f f je: Delež so med. Vsota deležev je. Odstotek eot v -t skup f % je: f % = K f = f Odstotk so med. Vsota odstotkov je. Izraču odstotkov je smsel, če ma celota vsaj eot, torej predstavlja eota ajveč %. V rezultath avado avajamo odstotke zaokrožee a eo decmalo mesto. Frekvece, zražee v deležh al odstotkh meujemo relatve frekvece. Da pojasmo, kaj določa skupe pr zračuu strukture, govormo o struktur po ; pr. struktura po spolu, struktura po smer študja td. Za grafč prkaz strukture uporabljamo struktur stolpec struktur krog. Prmer V tabel so podatk za števlo študetov po smer študja po spolu za. letk Botehške fakultete v 997/98. Ogledal s bomo zraču razlčh struktur prpadajoče grafče prkaze.
Katara Košmelj: Uporaba statstka 7. Opsa statstka Tabela -: Števlo študetov. letka BF v 997/98 po smer študja po spolu (Vr: Arhv Botehške fakultete) Smer študja Mošk Žeske Skupaj Agroomja (AG) 3 7 Bologja (BI) 6 6 88 Gozdarstvo (GO) 98 4 Krajska arhtektura (KA) 5 36 Lesarstvo (LE) 88 9 Mkrobologja (MI) 9 47 66 Zootehka (ZO) 63 63 6 Žvlska tehologja (ŽT) 34 46 8 Skupaj 54 45 947 Grafč prkaz strukture po spolu s strukturm stolpcem: % 8% Odstotek 6% 4% Žeske Mošk % % Slka -: Struktura po spolu za študete. letka Botehške fakultete 997/98 Grafč prkaz strukture po smer študja z razrezam strukturm stolpcem. Ker je smer študja osem, je bolj pregledo, če aršemo struktur stolpec razreza po delh, k tvorjo %.
Katara Košmelj: Uporaba statstka 7. Opsa statstka 5% % Odstotek 5% % 5% % AG BI GO KA LE MI ZO ŽT Smer študja Slka -: Struktura po smer študja za študete. letka Botehške fakultete 997/98 prkazaa z razrezam strukturm stolpcem Alteratv grafč prkaz strukture po smer študja je s strukturm krogom. ZO 3,3% ŽT 8,4% AG 3,% MI 7,% BI 9,3% LE,% KA 3,8% GO,9% Slka -3: Struktura po smer študja za študete. letka Botehške fakultete 997/98 prkazaa s strukturm krogom Vzuala prmerjava dveh krožh zsekov je težja kot vzuala prmerjava dveh stolpcev. Kadar je skup velko, postae krož prkaz še posebej epreglede. Zato je za grafče prkaz strukture poavad bolje uporabt struktur stolpec kot struktur krog. Krož prkaz v treh razsežosth za bt še posebo zavajajoč, zato jegovo uporabo odsvetujemo. 3
Katara Košmelj: Uporaba statstka 7. Opsa statstka Izraču strukture po spolu za vsako smer študja je v tabel. Najbolj ustreze grafče prkaz je prkaz s stolpc, kakor kaže slka. Tabela -: Struktura po spolu (%) za vsako smer študja v. letku Botehške fakultete 997/98 Smer študja Mošk Žeske Skupaj AG 46,8 53,, BI 9,5 7,5, GO 8,3 9,7, KA 3,6 69,4, LE 9,,, MI 8,8 7,, ZO 5, 5,, ŽT 4,5 57,5, Mošk Žeske 88 36 9 66 6 8 8 Odstotek 6 4 AG BI GO KA LE MI ZO ŽT Smer študja Slka -4: Struktura po spolu za vsako smer študja v. letku BF v 997/98. Nad stolpc je avedeo števlo študetov. Slka kaže, da a študju gozdarstva lesarstva prevladujejo študet, a študju bologje, krajske arhtekture mkrobologje pa študetke. Na ostalh treh smereh študja (agroomja, zootehka žvlska tehologja) je prblžo polovca študetov polovca študetk. Iz prkaza strukture razvdo števlo študetov a vsak smer. Npr. a agroomj, a krajsk arhtektur 36. To formacjo apšemo a vrh prpadajočega stolpca. Opomba: določee lastost zražamo v odstotkh, pr. relatva vlaga, obresta mera, zasedeost turstčh ležšč. Odstota točka zraža absoluto razlko dveh vredost spremeljvke, k je zražea v odstotkh. Npr.: lahko mleko ma,5% maščob, avado mleko 3,%. Navado mleko ma za,7 odstote točke več maščob kot lahko mleko. 4
Katara Košmelj: Uporaba statstka 7. Opsa statstka.. Koefcet Koefcet je razmerje dveh podatkov, k sta vsebsko povezaa. Pogosto uporablje koefcet so: gostota prebvalstva, števlo bolkov a zdravka, htrost, poraba gorva a km td. Opozarjamo, da moramo poleg vredost koefceta avest tud ustreze merske eote. Včash je vsebsko smselo zračuat tud ustreze recproč koefcet. Npr. za Slovejo mamo za leto 99 podatke za števlo avtomoblov za števlo prebvalcev: števlo avtomoblov = 594 89, števlo prebvalcev = 965 986. Smselo je zračuat števlo prebvalcev a e avtomobl števlo avtomoblov a prebvalcev: 3,3 prebvalc/avto; 3, avta/ prebvalcev. Grafčo prkažemo zračuae koefcete s stolpc. Lahko jh uredmo po velkost prkažemo avpčo al vodoravo. Prmer Izračual bomo gostoto prebvalstva za Slovejo za sosedje države ter za regjo, k jo te države sestavljajo. Rezultate bomo grafčo predstavl. Tabela -3: Površa (km ), števlo prebvalcev () za Slovejo jee sosede v letu 995 zračuaa gostota prebvalstva (Vr: Ecarta Atlas, Mcrosoft, 998) Država Površa (km ) Št. preb. () Gostota (preb./km ) Sloveja (SI) 5 946 96, Avstrja (AT) 8385 7968 95, Italja (IT) 37 5787 89,8 Madžarska (HU) 933 5 8,7 Hrvaška (HR) 5654 4498 79,6 Regja 55494 874 47, Gostota (preb./km ) 5 5 IT 9 HU 9 Država SI 96 Regja AT 95 HR 8 Slka -5: Gostota prebvalstva za Slovejo jee sosede v letu 995. S poltrakom je predstavljea gostota prebvalstva za regjo, k jo te države sestavljajo. 5
Katara Košmelj: Uporaba statstka 7. Opsa statstka Posebe vrste koefcet so stopje, pogosto se uporabljajo v demografj medc. Npr. leta stopja rodost se zračua z razmerjem: števlo žvorojeh v vsem letu / števlo prebvalcev (v ). Ker se števlo prebvalcev spremja, občajo uporabmo oceo za števlo prebvalcev, k se aaša a sredo leta. Podobo račuamo stopjo smrtost, stopjo aravega prrasta. Prmer Izračual bomo stopjo rodost stopjo smrtost po leth v obdobju 98-995 za Slovejo. Tabela -4: Števlo prebvalcev ocejeo a da 3. 6., števlo žvorojeh števlo umrlh po leth v obdobju 98- (Vr: SL-97, str. 85, SL-) ter zračuaa stopja rodost stopja smrtost Leto Števlo prebvalcev Števlo žvorojeh Števlo umrlh Stopja rodost (števlo žvorojeh a prebvalcev) Stopja smrtost (števlo umrlh a prebvalcev) 98 98 99 88 5,7 9,9 985 9735 5933 9854 3,, 99 9989 368 8555, 9,3 995 98755 898 8968 9,5 9,5 997 88 8588 9, 9,3 V poglavju o veržh deksh bomo spozal še stopjo rast. V statstč teorj je več pomembh mer, k se zražajo s koefcetom, pr. koefcet varacje, koefcet korelacje, koefcet determacje. Spozal jh bomo kaseje...3 Ideks Števlo x je vredost števlske spremeljvke X v -t skup, =,, K. Zaporedje vredost x, x, x K meujemo statstča vrsta. Prmer statstčh vrst: vredost potrošške košarce (SIT) po krajh (krajeva vrsta); povpreča plača (SIT) po poklch (stvara vrsta); števlo brezposelh po leth (časova vrsta). Izberemo e podatek v vrst. Ozačmo ga x, meujemo ga osova. Ideks prmerjajo vsak podatek v vrst z osovo: x I / =, =,,... K x Ideks,5 pome, da je podatek za,5% večj od osove; deks 85, pome, da je podatek za 5,% majš od osove. Idekse avado predstavljamo a eo decmalo mesto. Izbra osove je odvsa od tega, a katero skupo želmo prmerjat druge skupe, torej je vsebsk problem. Za zraču deksov mora bt merska lestvca spremeljvke razmerosta, vredost poztve. Za grafč prkaz deksov uporabljamo stolpce. 6
Katara Košmelj: Uporaba statstka 7. Opsa statstka Prmer V tabel avajamo povpreč meseč prejemek za staroste, valdske, družske kmečke pokoje za leto 996 v Slovej. Za osovo bomo vzel družske pokoje zračual dekse ter rezultate grafčo prkazal. Tabela -5: Povpreč meseč prejemek (SIT) v letu 996 za raze vrste pokoj (Vr: Sloveja v števlkah 997) zračua deks z osovo Družska Vrsta pokoje Meseč prejemek (SIT) Družska = Starosta 6586 4,4 Ivaldska 578 6,3 Družska 434, Kmečka 44 49,6 6 4 Ideks (Družska = ) 8 6 4 Starosta Ivaldska Družska Kmečka Vrsta pokoje Slka -6: Ideks z osovo Družska za povpreče meseče prejemke po vrstah pokoje za leto 996 za Slovejo..3. Časov deks Časov deks so osovo orodje za aalzo časove vrste. Poglejmo ajprej opredeltev časove vrste. Števlsko spremeljvko Y opazujemo v času, torej je Y = Y(t). Podatk se aašajo a zaporeda časova obdobja: t, t,, t T. Statstčo vrsto y, y, y T meujemo časova vrsta, T je dolža časove vrste. 7
Katara Košmelj: Uporaba statstka 7. Opsa statstka Grafč prkaz časove vrste je ljsk grafko, a abscs os je časova skala. Pr grafčem prkazu moramo ustrezo prkazat časovo zaporedje vredost. Če časova vrsta ekvdstata (med opazovaj eak časov razmk), moramo a slk to upoštevat. Prmer V tabel so avede podatk o števlu žvorojeh o števlu umrlh po leth v Slovej v obdobju 98-5. Tabela -6: Števlo žvorojeh števlo umrlh v Slovej po leth v obdobju 98 5 (Vr: SL - 94, str. 74, SL 99, str. 84, SL-6) Leto Žvoroje Umrl 98 9 8733 98 8894 9647 983 7 73 984 674 4 985 5933 9854 986 557 9499 987 559 9837 988 59 96 989 3447 8669 99 368 8555 99 583 934 99 998 9333 993 9793 994 9463 9359 995 898 8968 996 8788 86 997 865 898 998 7856 939 999 7533 8885 88 8588 7477 858 75 87 3 73 945 4 796 853 5 857 885 Grafčo prkažmo podatke za števlo žvorojeh za števlo umrlh. 8
Katara Košmelj: Uporaba statstka 7. Opsa statstka 35 3 5 Žvoroje Umrl Števlo () 5 5 98 985 99 995 5 Leto Slka -7: Števlo žvorojeh števlo umrlh v Slovej po leth v obdobju 98-5 Števlo žvorojeh v opazovaem obdobju pada, rečemo, da ma časova vrsta egatve tred. Števlo umrlh je skoraj kostato. Narav prrast, to je razlka med števlom žvorojeh števlom umrlh, je od leta 993 zelo majhe al celo egatve. Prmer Pops prebvalstva po državah se pravloma zvajajo v desetleth tervalh. Na ozemlju Sloveje je bl pops prebvalstva leta 9, leta 94 popsa prebvalstva zarad voje blo. Po II. svetov voj je bl pops leta 948 953. Podatk o števlu prebvalcev v tsočh so v tabel. Tabela -7: Števlo prebvalcev po zaporedh popsh prebvalstva v Slovej v obdobju 9 - (Vr: SL - 9, str. 7, Pops atlas Sloveje ) Leto popsa Števlo prebvalcev () 9 35 93 398 948 44 953 54 96 59 97 77 98 89 99 975 964 Grafčo prkažmo podatke. 9
Katara Košmelj: Uporaba statstka 7. Opsa statstka 5 Števlo prebvalcev () 5 5 9 93 948 953 96 97 98 99 Leto popsa Slka -8: Števlo prebvalcev po zaporedh popsh prebvalstva v Slovej Točk za let 93 948 smo povezal, ker je bla vmes voja, k je bstveo vplvala a števlo prebvalcev. Osovo orodje za aalzo časovh vrst so deks scer: deks s stalo osovo, deks s premčo osovo...3.. Ideks s stalo osovo Nek podatek v časov vrst zberemo za osovo, ozačmo ga y. Vse podatke prmerjamo a ta podatek, osova je stala: yt It / =, t =,,... T y Rezultat je ova časova vrsta, vse vredost osove časove vrste so deljee z vredostjo y. Za osovo e zbramo eobčajh obdobj, pr. obdobj s sušo, vojo, epdemjo. Grafč prkaz deksov s stalo osovo je eak kot prkaz zhodšče časove vrste. Prmer Podajamo podatke za števlo štpedstov v Slovej po leth v obdobju 99 996. Izračual bomo dekse z osovo 99 jh grafčo prkazal. 3
Katara Košmelj: Uporaba statstka 7. Opsa statstka Tabela -8: Števlo štpedstov (v ) v Slovej v obdobju 99-996 (Vr: SL-97, str. 3) zračua deks s stalo osovo 99 Leto Št. štpedstov () 99= 99 65,6, 99 6,4 9, 99 66,9, 993 65,7, 994 6,3 93,4 995 6, 93, 996 63,4 96,6 Ideks (99=) 9 8 989 99 99 99 993 994 995 996 Leto Slka -9: Ideks z osovo 99 za števlo štpedstov v Slovej po leth v obdobju 99-996..3.. Ideks s premčo osovo Osova stala, ampak se spremja. Če za osovo vedo vzamemo predhod podatek v časov vrst, dobmo verže dekse: yt It / t =, t =, 3,... T yt Verž deks so smsel samo, če je časova vrsta ekvdstata. Prv verž deks e obstaja; stadard zak za eobstoječo vredost je. Pr terpretacj uporabljamo stopjo rast. Dobmo jo tako, da od veržega deksa odštejemo : St / t = It / t, t =, 3,... T. 3
Katara Košmelj: Uporaba statstka 7. Opsa statstka Stopja rast je relatva sprememba, k v odstotkh zraža spremembo pojava: S y y t t t / t = yt Stopja rast je lahko poztva, egatva al čela. Za grafče prkaz veržh deksov stopej rast uporabljamo prkaz s stolpc. Prmer Izračuajmo verže dekse stopje rast za števlo štpedstov rezultate grafčo prkažmo. Tabela -9: Števlo štpedstov (v ) v Slovej v obdobju 99-996 (Vr: SL-97, str. 3) zračua verž deks stopje rast Leto Št. štpedstov () Verž deks Stopja rast 99 65,6 99 6,4 9, -7,9 99 66,9,8,8 993 65,7 98, -,8 994 6,3 93,3-6,7 995 6, 99,5 -,5 996 63,4 3,4 3,9 5 5 Verž deks 5 95 99 99 994 996 5-5 Stopja rast 9-85 -5 Slka -: Verž deks stopje rast za števlo štpedstov po leth v obdobju 99-996 NALOGE. Zemljšča v Slovej Skupa površa zemljšč se del a erodovta zemljšča, a gozda zemljšča ter a kmetjska zemljšča. Kmetjska zemljšča se deljo a travje, to so travk pašk, a jve vrtove, a sadovjake vograde. V tabel so podatk za Slovejo za leto 99. 3
Katara Košmelj: Uporaba statstka 7. Opsa statstka Tabela -: Površa zemljšč (ha) po vrst zemljšč v Slovej leta 99 (Vr: SL - 9, str. 4) Vrsta zemljšč Površa zemljšč (ha) Površa kmet. zemljšč (ha) Nerodovta 36754 Gozda 4535 Kmetjska 86484 -travje 55964 -jve, vrtov 4783 -sadov., vog. 57837 Skupaj 5473 86484 Izračuajte strukturo površ strukturo kmetjskh površ.. Rado V tabel je poda čas predvajaja glasbeega programa po programh Rada Sloveja ter po vrst glasbe za leto 99. Tabela -: Čas (ure) predvajaja glasbeega programa po programh Rada Sloveja po vrstah glasbe Vrsta glasbe Prv program Drug program Tretj program Resa 6 373 Zabava populara 43 349 3 Naroda glasba 45 36 Glasba za otroke 6 45 Druga glasba 7 77 9 a) Izračuajte strukturo po vrst glasbe za vsak program. b) Rezultate grafčo prkažte obrazložte. 3. Zasedeost ležšč V tabel so podatk o števlu ležšč o števlu očtev gostov po vrstah krajev v Slovej v letu 993. Tabela -: Števlo ležšč po vrstah krajev, staje 3. 8. 993 v Slovej števlo očtev gostov v letu 993 po vrstah krajev v Slovej (Vr: SL - 94, str. 388 str. 397) Vrste krajev Ležšča Nočtve gostov Ljubljaa 385 3883 Zdravlšk kraj 89398 Obmorsk kraj 867 4545 Gorsk kraj 7475 5975 Drug turstč kraj 8998 49356 Drug kraj 89 34534 Skupaj 7485 538466 a) Izračuajte zasedeost ležšč (%) v letu 993 po vrstah krajev za Slovejo. b) Rezultate grafčo predstavte obrazložte. c) Prmerjajte zasedeost v Ljublja z zasedeostjo v obmorskh krajh. 4. Queteletovo razmerje Za sebe zračuajte Queteletovo razmerje: Q = telesa masa (kg) / (telesa vša (m)) 33
Katara Košmelj: Uporaba statstka 7. Opsa statstka ugotovte, v katero skupo ste uvršče: do pod 8: shujšaost, 8 do pod : premajha teža, do pod 7: ormala teža, 7 do pod 3: prekomera teža, 3 več: debelost. 5. Gostota prebvalstva v Fracj Moaku Tabela -3: Površa (km ) števlo prebvalcev () za Fracjo Moako za leto 995 (Vr: Ecarta Atlas, Mcrosoft, 998) Država Površa (km ) Štev. preb. () Fracja 55 5 57 98 Moaco 3 a) Izračuajte gostoto prebvalstva za Fracjo za Moako. b) Izračuajte gostoto prebvalstva za regjo Fracja Moako. Prmerjajte dobljeo gostoto z gostotama, zračuama pod a). Kaj ugotovte? 6. Promete esreče V tabel je avedeo števlo prometh esreč s smrtm zdom al s teleso poškodbo a cestah v Slovej števlo smrto poesrečeh v teh esrečah. Tabela -4: Števlo prometh esreč števlo smrto poesrečeh po leth v obdobju 988-998 (Vr: SL - 93, str. 74, SL - 99, str. 364) Leto Promete esreče Števlo smrto poesrečeh 988 685 55 989 585 554 99 577 57 99 5479 46 99 588 49 993 69 493 994 6586 55 995 654 45 996 6348 389 997 695 358 998 5864 39 a) Za števlo prometh esreč zračuajte: dekse z osovo 988, verže dekse stopje rast. Rezultate grafčo prkažte obrazložte. b) Za števlo smrto poesrečeh zračuajte: dekse z osovo 99, verže dekse stopje rast. Rezultate grafčo prkažte obrazložte. 7. Brezposel v Slovej V tabel prkazujemo števlo brezposelh v Slovej po leth v obdobju 986-998. 34
Katara Košmelj: Uporaba statstka 7. Opsa statstka Tabela -5: Števlo regstrrah brezposelh oseb a da 3.. po leth v Slovej v obdobju 986-998 (Vr: SL 97, str. 7, SL - 99, str. 34) Leto Števlo brezposelh () 986 4, 987 7,8 988 5,4 989 33,8 99 55,4 99 9, 99 8, 993 37, 994 3,5 995 6,8 996 4,5 997 8,6 998 6,6 a) Izračuajte grafčo prkažte dekse z osovo 986 za števlo brezposelh. Obrazložte vredost deksov I 9/86 I 93/86. b) Izračuajte grafčo prkažte verže dekse stopje rast. Obrazložte jhove vredost. V katerem letu je bla stopja rast ajvečja?. FREKVENČNA PORAZDELITEV Frekveča porazdeltev je tabela, k jo določajo vredost spremeljvke prpadajoče frekvece. Spremeljvka X, k določa frekvečo porazdeltev, je opsa al števlska. Njee vredost v frekveč porazdeltv meujemo: skupe (kategorje), če je X opsa razred, če je X števlska. a) frekveča porazdeltev po spolu, skup vredost Tabela -6: Študet po spolu Spol Števlo študetov Mošk 54 Žeske 45 Skupaj 947 35
Katara Košmelj: Uporaba statstka 7. Opsa statstka b) frekveča porazdeltev po tež, 5 razredov vredost Tabela -7: Otroc po tež (kg) Teža (kg) Števlo otrok do pod do pod 3 3 do pod 4 54 4 do pod 5 4 5 več Skupaj 84 Frekveče porazdeltve delamo zato, da prdobmo pregledost ad podatk, pr. podatk za težo 84 otrok b bl popoloma epregled. Frekvečo porazdeltev dobmo takole:. Določmo skupe oz. razrede, tako da je vsak podatek uvršče v atako eo skupo oz. razred. Pr b) b bl razred za težo lahko oblkova takole: do, ad do 3, ad 3 do 4, td.; arobe pa b blo določt razrede takole: do, do 3, 3 do 4 td, saj e b blo jaso, v kater razred je uvršče podatek, 3 td.. Izvedemo postopek uvrščaja podatkov v skupe oz. razrede. 3. Izps frekveče tabele: zps skup oz. razredov prpadajočh frekvec. V adaljevaju bomo pogledal, kako dopolmo grafčo prkažemo frekvečo porazdeltev za opso za števlsko spremeljvko... Frekveča porazdeltev za opso spremeljvko Za grafčo predstavtev frekveče porazdeltve za opso spremeljvko uporabljamo prkaz s stolpc al s krogom. Frekvečo porazdeltev za opso spremeljvko dopolmo z zračuom strukture. Za grafčo predstavtev relatvh frekvec uporabljamo struktur stolpec al struktur krog (glej Relatva števla)... Frekveča porazdeltev za števlsko spremeljvko Ko podatke uvrstmo v razrede, zgubmo ekaj formacje, prdobmo pa pr pregledost. Več kot je razredov, maj formacje zgubmo, pregledost pa je slabša. Pr dovolj velkem števlu podatkov (ad ) je smselo števlo razredov med 6. Frekvečo porazdeltev za števlsko spremeljvko dopolmo s karakterstkam razredov: spodja/zgorja meja razreda, šra razreda, sreda razreda. Recmo, da mamo K razredov. Vsakemu razredu določmo spodjo mejo razreda x, m zgorjo mejo razreda, tako da velja: x, max x, max = x +,m, =,, 3, K- Zgorja meja razreda se ujema s spodjo mejo asledjega razreda. Izračuamo šro razreda d sredo razreda x : d = x x, max,m x = x + x (, max, m ) / Razred, k ma spodje oz. zgorje meje, meujemo odprt razred. Tak razred ma šre srede. 36
Katara Košmelj: Uporaba statstka 7. Opsa statstka Karakterstke razredov so pomože kolče, k jh uporabljamo pr grafč predstavtv frekveče porazdeltve pr je aalz. Najpomembejša karakterstka razreda je jegova sreda, k je predstavk vseh vredost v razredu. Da dobmo sredo, potrebujemo spodjo zgorjo mejo. Za juo določaje je ajbolj pogosto prmero pravlo polovc : spodjo mejo razreda določmo tako, da od ajmajše vredost v razredu odštejemo polovco; zgorjo mejo razreda pa tako, da ajvečj vredost v razredu prštejemo polovco. Poglejmo prmer. Tabela -8: Karakterstke razredov za težo otrok Teža (kg) x, m x, max d do pod 9,5 do pod 3 9,5 9,5 4,5 3 do pod 4 9,5 39,5 34,5 4 do pod 5 39,5 49,5 44,5 5 več 49,5 x Pravlo polovc prmero uporabljat pr starosth razredh, če je starost zražea v t.. dopoljeh leth. V razredu od do 9 dopoljeh let so osebe, k do deva zbraja podatkov so dopolle let. Za ta razred je spodja meja zgorja meja sreda razreda 5. Tabela -9: Karakterstke razredov za starost oseb Starost (dopoljea leta) x, m x, max do 9 5 do 9 5 do 9 3 5 Frekvečo tabelo dopolmo z asledjm zraču: relatva frekveca f %, gostota frekvece g (pogojo), kumulatva frekvec F, kumulatva relatvh frekvec F %. Če so razred razlčo šrok, frekvece po razredh so prmerljve. Tedaj za vsak razred zračuamo še gostoto frekvece: f g = d Gostote frekvec so po razredh prmerljve. Za vsak razred zračuamo kumulatvo frekvec F. To je števlo podatkov, uvrščeh do zgorje meje -tega razreda. Račuamo jo po rekurzv formul: F F = + = F + f + Če kumulatvo frekvec F zrazmo relatvo, dobmo kumulatvo relatvh frekvec F %. Ta predstavlja odstotek podatkov uvrščeh do zgorje meje -tega razreda. Prmer V vzorcu je 3 učecev, za vsakega učeca mamo podatek za števlo ur odsotost v preteklem šolskem letu. Podatk so: d x 37
Katara Košmelj: Uporaba statstka 7. Opsa statstka 7 54 9 73 7 47 4 43 59 97 43 5 67 4 73 84 74 6 8 7 4 69 37 64 78 63 59 7 7 69 Podatke bomo uvrstl v frekvečo porazdeltev jh grafčo prkazal. Učkovt prpomoček za oblkovaje prkaz frekveče porazdeltve je prkaz stebla z lst. Vsako vredost razdelmo a t.. steblo lst. Steblu prpšemo 'vsebsko pomemb del' vredost, lstu pa ostaek. Poglejmo to a ašh podatkh. Vredost so od 9 do 97. Vsebsko pomemba formacja je v desetcah. Zato pr. vredost 9 razdelmo a (steblo) 9 (lst). Najprej oblkujemo steblo, k ga zapšemo avpčo; v ašem prmeru, 3,... 9. Za vsako vredost steblu a ustrezem mestu dodamo lst. Vredost, k majo eako steblo razlče lste, zapšemo v sto vrsto jh sprot urejamo po velkost. Tabela -: Prkaz stebla z lst Steblo Lst 9 3 7 4 337 5 499 6 34799 7 3348 8 4 9 7 Ker je vzorec majhe, bomo podatke uvrstl v štr razrede. V tabel je frekveča porazdeltev dopoljea s karakterstkam razredov. Tabela -: Učec glede a števlo ur odsotost Št. ur odsotost x, m x, max d x f f % F F % -39 9,5 39,5 9,5 6,7 6,7 4-59 39,5 59,5 49,5 33,3 4, 6-79 59,5 79,5 69,5 5 5, 7 9, 8-99 79,5 99,5 89,5 3, 3, Skupaj 3, Frekvečo porazdeltev grafčo prkažemo s hstogramom. Hstogram je prkaz s stolpc, k se držjo skupaj. Za vsak razred aršemo stolpec s šro d všo f. Če razred so eako šrok, je vša stolpca g. Na abscs os aj bodo ops razredov, e spodje/zgorje meje. 38
Katara Košmelj: Uporaba statstka 7. Opsa statstka 6 Števlo učecev 8 4 do -39 4-59 6-79 8-99 Števlo ur odsotost Slka -: Hstogram za števla ur odsotost za 3 učecev Tud prkaz stebla z lst je posebe vrste hstogram. Hstogram prebvalcev po starost, arsa vertkalo posebej za žeske posebej za moške, meujemo starosta pramda. Prkazujemo starosto pramdo, k se avezuje a podatke popsa prebvalstva v Slovej 99. Podatke povzemamo v asledj tabel. Tabela -: Prebvalc po spolu po starost ob popsu 99 v Slovej (Vr: SL - 93, str. 49) Starost (dop. leta) Števlo moškh Števlo žesk - 9 3437 39-9 595 4365-9 48448 4856 3-39 6375 55786 4-49 33 666 5-59 9785 6486 6-69 74983 9343 7-79 357 5734 8 več 347 378 ezao 34 35 Skupaj 956 3375 39
Katara Košmelj: Uporaba statstka 7. Opsa statstka Starost (dopoljea leta) Mošk 8 7 6 5 4 3 Žeske Števlo moškh () Števlo žesk () Slka -: Starosta pramda za Slovejo ob popsu 99 Opomba: razred a 8 let je odprt, to smo akazal s puščco. Alteratv prkaz hstograma je polgo. To je ljsk grafko, k povezuje točke x, f ). Dodamo dve točk: ( x, ) ( x, ). K + ( 6 Števlo učecev 8 4 4 6 8 Števlo ur odsotost Slka -3: Polgo za števlo ur odsotost za 3 učecev 4
Katara Košmelj: Uporaba statstka 7. Opsa statstka Za grafč prkaz kumulatve frekvec uporabljamo ogvo. Na abscso os aršemo zgorje meje razredov, a ordato os pa prpadajoče kumulatve frekvec. Za vsak razred aršemo točko ( x max, F ). Dodamo točko a začetku ( x m, ). Točke povežemo z daljcam.,, 3 F 5 8 6 F % 5 4 5 9,5 39,5 59,5 79,5 99,5 Števlo ur odsotost Slka -4: Kumulatva za števlo ur odsotost za 3 učecev NALOGE. Razred V razredu je učtelj za vsakega od 4 učecev ugotavljal zobrazbo očeta matere. Vredost za zobrazbo so: osovošolska (O), sredješolska (S), všješolska al več (V), ezao (N). Podatk so v tabel. 4
Katara Košmelj: Uporaba statstka 7. Opsa statstka Tabela -3: Izobrazba očeta matere za 4 učecev Učeec (zap. št.) Izobrazba očeta Izobrazba matere Učeec (zap. št.) Izobrazba očeta Izobrazba matere S S 3 S S O O 4 S V 3 S S 5 O O 4 S O 6 S S 5 S O 7 O S 6 S S 8 N S 7 S S 9 S S 8 S V S S 9 V V S O S S V S O O 3 O O S S 4 V V a) Kakšo mersko lestvco ma spremeljvka zobrazba? b) Za vsako spremeljvko uredte vredost v frekvečo porazdeltev. c) Grafčo prkažte frekveč porazdeltv.. Starost ob dplom V vzorcu je blo 35 študetov, k so dplomral v šolskem letu 993/94 a Uverz v Ljublja. Navajamo jhovo starost ob dplom (dopoljea leta): 7 5 3 4 5 5 6 9 5 6 5 4 6 3 5 4 6 7 5 6 5 4 8 8 3 53 4 9 4 7 8 5 7 4 a) Določte, kaj je eota, spremeljvka kakša je jea merska lestvca. b) Podatke uredte v frekvečo porazdeltev jo grafčo predstavte. 3. Kolča padav V Slovej je 67 meteorološkh postaj. Navajamo frekvečo porazdeltev za kolčo padav zmerjeo a teh postajah v letu 99. Tabela -4: Meteorološke postaje po kolč padav (Vr: Arhv Hdrometeorološk zavod Sloveje) Kolča padav (mm) Št. postaj 8 do pod do pod 6 7 6 do pod 6 do pod 4 7 4 do pod 8 4 8 do pod 3 3 do pod 36 a) Dopolte frekvečo porazdeltev: za vsak razred določte spodjo zgorjo mejo, sredo šro. 4
Katara Košmelj: Uporaba statstka 7. Opsa statstka b) Grafčo predstavte frekvečo porazdeltev s hstogramom s polgoom. c) Izračuajte relatvo frekveco jo grafčo prkažte. d) Izračuajte kumulatvo frekvec kumulatvo relatvh frekvec. Izračue grafčo predstavte. e) Grafčo določte tsto kolčo padav, k je bla presežea pr polovc meteorološkh postaj. 4. Delova doba brezposelh V SL - 93 so podatk o delov dob tsth, k so bl v 99 99 v Slovej brezposel. Števlo brezposelh se aaša a 3.. Tabela -5: Števlo brezposelh v Slovej v leth 99 99 po dolž delove dobe (Vr: SL - 93, str. 48) Dolža delove dobe 99 99 Brez delove dobe 475 3846 Z delovo dobo - do leta 35 69 - ad do let 3563 666 - ad do 3 leta 654 4533 - ad 3 do 5 let 488 767 - ad 5do let 789 658 - ad do let 869 397 - ad do 3 let 399 397 - ad 3 let 648 479 Skupaj 5544 84 a) Aalzrajte grafčo prkažte števlo brezposelh brez delove dobe z delovo dobo za let 99 99. b) Aalzrajte brezposele z delovo dobo a da 3.. 99. Dopolte frekvečo porazdeltev: za vsak razred določte spodjo mejo, zgorjo mejo, sredo razreda šro razreda. Al so frekvece po razredh prmerljve? c) Naršte hstogram za leto 99 za brezposele z delovo dobo..3 KVANTILI Spremeljvka X je števlska spremeljvka, jee vredost so: x, x,... x. Vredost uredmo po velkost od ajmajše do ajvečje. Tako urejeo zaporedje meujemo ražra vrsta. Rag R je zaporedo mesto vredost v ražr vrst, R =,,. Vsak vredost v ražr vrst prredmo je rag. Rag zrazmo tud relatvo, avado ga zrazmo v deležh. Relatv rag ozačmo P. Načov zračuavaja relatvega raga je več. Občajo se uporablja formula: R,5 P = Torej je R = P +,5. Za tako zračua relatv rag velja < P <. Popravek,5 se uporablja, ker je rag dskreta kolča, relatv rag pa e. Če je števlo eot dovolj velko, je popravek,5 zaemarljv velja 43
Katara Košmelj: Uporaba statstka 7. Opsa statstka R P R P Opomba: ekater račuajo relatv rag po formul: R P =, k zagotavlja, da je P. M bomo za zraču relatvega raga uporabljal prv ač. Prmer Podatk:, 8,,, 6,, 7 Ražra vrsta 7 6 8 Rag 3 4 5 6 7 Relatv rag 3 5 4 4 4 9 4 4 3 4 Kvatl je vredost, k razdel ražro vrsto a dva dela. Glede a to, a kolkše dele razdel kvatl ražro vrsto, ločmo medao, kvartle, decle, cetle. Medaa Me razdel ražro vrsto a dva eaka dela. Polovca vredost je majšh od medae al jej eakh, polovca pa večjh od medae al jej eakh. Relatv rag za medao je,5. P ( Me) =,5 R( Me) =,5 +,5 Če je zračua rag celo števlo, dobmo medao drekto z ražre vrste; če zračua rag celo števlo, je medaa povprečje dveh vredost a sred ražre vrste. Prmer a),,,, 6,, 9 R ( Me) = 4 Me = b),,,, 6,, 9, 5 R ( Me) = 4, 5 Me =,5 ( + 6) = 4 Kvartl Q, Q, Q3 razdeljo ražro vrsto a štr eake dele. P ( Q ) =,5 R ( Q ) =,5 +, 5 P ( Q ) =,5 R ( Q ) =,5 +, 5 P ( Q3 ) =,75 R ( Q3 ) =,75 +, 5 Drug kvartl je medaa. Kvartl razmk Q je razlka med tretjm prvm kvartlom: Q = Q 3 Q. Iterval od Q do Q 3 vsebuje 5% vredost. Decl D, D,..., D9 razdeljo ražro vrsto a deset eakh delov, cetl C, C,..., C99 razdeljo ražro vrsto a sto eakh delov. Izračuavaje kateregakol kvatla se da prevest a zračuavaje prpadajočega cetla, pr. Me = C5, D = C. P( C ) = R( C ) = +, 5 44
Katara Košmelj: Uporaba statstka 7. Opsa statstka Pr zračuavaju se uporablja leara terpolacja. Poglejmo s ta prcp. Rad b zračual C. Ugotovl smo, da je C med zaporedma vredostma a b v ražr vrst. Prpadajoč rag so R( a), R( C ), R( b). Vredost a C Rag R (a) R C ) R (b) ( Grafčo prkažemo stuacjo takole: b R(b) R(C ) R(a) a C b Slka -5: Prcp leare terpolacje Leara terpolacja zhaja asledjega razmerja C a R( C ) R( a) = b a R( b) R( a) Ker je R ( b) R( a) =, zračuamo C takole: C = a + ( R( C ) R( a)) ( b a) Za grafč prkaz kvatlov uporabljamo ljsk grafko. Naršemo točke, k majo za abscse vredost ražre vrste, za ordate pa prpadajoče rage. Točke povežemo z daljcam. Za ska kvatl zračuamo rag R. Naršemo vzporedco abscs os pr R. Abscsa sečšča vzporedce polgoa je grafčo določea vredost kvatla. Prmer Podatk so: 8, 4,,, 3, 4, 6, 8. Izračuajmo drug šest decl. Ražra vrsta 4 3 4 6 8 8 Rag 3 4 5 6 7 8 R( D ) = R( C ) =, 8 +,5 =, D = +, ( ) =, 45
Katara Košmelj: Uporaba statstka 7. Opsa statstka R( D ) = R( C 6 6 ) =,6 8 +,5 = 5,3 D6 = 4 +,3 (6 4) = 48 Za grafče prkaz kvatlov aršemo točke: (4, ), (, ), (, 3), (3, 4), (4, 5), (6, 6), (8, 7), (8, 8) jh povežemo z daljcam. Grafčo določmo D 6. Upoštevamo, da je rag za D 6 eak 5,3. Iz slke razberemo, da je vredost blzu 5. 8 7 6 Rag števla 5 4 3 D 6 5 5 Števlo Slka -6: Grafča določtev D 6 Če so podatk v frekveč porazdeltv osovh podatkov mamo, uporabmo podobe postopek. Vlogo raga ma kumulatva frekvec F. Najprej ugotovmo, v katerem razredu je C. Spodjo mejo tega razreda ozačmo x,m, zgorjo mejo pa x,max. Šra razreda je d, frekveca pa f. Prblžek za cetl C dobmo z learo terpolacjo: C x,m F( C ) F( x,m ) = x,max x,m F( x,max ) F( x,m ) Ker velja: F ( x,max ) F( x,m ) = f x,max x,m = d, zračuamo prblžek C takole: C = x,m F( C ) F( x + f,m ) d V tem prmeru za grafčo določaje kvatlov potrebujemo grafče prkaz kumulatve frekvec, torej ogvo. Prcp grafčega določaja je eak kot v predhodem prmeru. Prmer V tabel mamo frekvečo porazdeltev študetov po oceah pr zptu z statstke. Izračual bomo kvartle. 46
Katara Košmelj: Uporaba statstka 7. Opsa statstka Tabela -6: Študet po števlu točk pr zptu Števlo točk Števlo študetov Kumulatva frekvec Kumulatva relatvh frekvec % Spodja meja Zgorja meja Sreda Šra 5-6 34 34 7, 5,5 6,5 55,5 6-7 5 39 69,5 6,5 7,5 65,5 7-8 35 74 87, 7,5 8,5 75,5 8-9 5 99 99,5 8,5 9,5 85,5 9-, 9,5,5 95,5 Skupaj 5,5 34 Q = 6,5 + = 6, 5,5 34 Q = Me = 6,5 + = 66,8 5 5,5 39 Q 3 = 7,5 + = 73,8 35 Četrta študetov je dosegla maj kot 6 točk, četrta je dosegla 74 al več točk. Medaa je 67 točk, polovca je mela slabš, polovca pa boljš uspeh. Za grafčo določaje kvartlov aršemo kumulatvo frekvec oz. kumulatvo relatvh frekvec. 5 75 F F % 5 5 5 Me 5,5 6,5 7,5 8,5 9,5,5 Števlo točk pr zptu Slka -7: Kumulatva frekvec kumulatva relatvh frekvec za porazdeltev študetov po uspehu pr zptu ter grafča določtev medae 47
Katara Košmelj: Uporaba statstka 7. Opsa statstka.3. Okvr z ročaj Zelo lustratve grafč prkaz podatkov števlske spremeljvke je okvr z ročaj (agl. box ad whskers plot). Ta slka prkazuje pogoj mmum pogoj maksmum, kvartle ter osamelce. Poglejmo ajprej defcje. Osamelec je vredost, k bstveo odstopa od veče ostalh vredost. Kot osamelca opredelmo vredost, k je zve tervala ( Q,5 Q, Q3 +,5 Q), pr čemer je Q kvartl razmk. Ekstrem osamelec je osamelec, k je zve tervala ( Q 3 Q, Q3 + 3 Q). Pogoj mmum m * je ajmajša vredost, k spodj osamelec. Pogoj maksmum max * je ajvečja vredost, k zgorj osamelec. Če v podatkh osamelcev, je pogoj mmum oz. pogoj maksmum ajmajša oz. ajvečja vredost. Okvr z ročaj določa 5 točk: m *, Q, Q, Q 3 ter max *. Spodj ročaj določata vredost m * Q, zgorj ročaj vredost Q 3 max *. Okvr določata kvartla Q ter Q 3, jegovo prečko pa Q. Dolža okvra je eaka kvartlemu razmku, šra okvra ma pomea. Na slk dodamo zgorje spodje osamelce ter zgorje spodje ekstreme osamelce, k jh predstavmo s posebm zak. Občajo osamelca prkažemo s krožcem ( ), ekstremega osamelca pa z zvezdco (*). Slko lahko aršemo vodoravo al avpčo. Prmer V vzorcu je blo 35 študetov, k so dplomral v šolskem letu 993/94 a Uverz v Ljublja. Navajamo jhovo starost ob dplom (dopoljea leta): 7 5 3 4 5 5 6 9 5 6 5 4 6 3 5 4 6 7 5 6 5 4 8 8 3 53 4 9 4 7 8 5 7 4 Vredost, k jh potrebujemo za okvr z ročaj, so: m = Q = 4 Q = 5 7 Q 3 = max * = 9 max = 53 Predstavljamo okvr z ročaj za starost dplomatov. * 4 6 8 3 3 34 36 38 4 4 44 46 48 5 5 54 Starost ob dplom (dopoljea leta) Slka -8: Okvr z ročaj za starost dplomatov Iz slke lahko bralec razbere, da je bl ajmlajš dplomat star let, da je bla četrta dplomatov mlajša od 4 let, četrta pa starejša od 7 let. Polovca dplomatov je bla mlajša od 5 let, polovca pa starejša od 5 let. Starost varra od do 9 let, e študet je bl ob dplom star 53 let. Ta vredost je zgorj osamelec. 48
Katara Košmelj: Uporaba statstka 7. Opsa statstka Okvr z ročaj je zelo lustratve grafč prkaz, jegovo uporabo prporočamo. Še posebej korste je v prmeru, ko grafčo predstavmo porazdeltev ste spremeljvke v razlčh skupah, torej ko prmerjamo več okvrov a st slk. Tedaj vzuala prmerjava omogoča, da dobmo globalo slko o vplvu skupe a porazdeltev spremeljvke. Prmer Na splet stra Bostatstcs Teachg Materals Uverze v Vrg (http://hesweb.med.vrga.edu/bostat/s/data/ttac3.txt) so podatk za 39 potkov a ladj Ttac, k je aprla 9 potola a svoj prv vožj v blž obale Nove Fudladje. Aalzral bomo 3 spremeljvke, k opsujejo potke: spol, potšk razred starost. Spol potšk razred sta ops spremeljvk, spol ma mesko mersko lestvco, potšk razred pa urejeosto mersko lestvco. Na krovu ladje je blo 466 žesk 843 moškh. V prvem, ajdražjem potškem razredu, je potovalo 33 potkov, v drugem 77 ter v tretjem, ajceejšem, 79 potkov. Starost je števlska spremeljvka. Zama as porazdeltev starost po spolu ter po potškem razredu. Vs podatk za starost so bl zbra, prblžo % je majkajočh. Poglejmo ajprej porazdeltev potkov po starost, posebej za žeske za moške. Starost (leta) 9 8 7 6 5 4 3 žeske Spol mošk Slka -9: Okvr z ročaj za starost glede a spol. Podatk so za 388 žesk ter za 658 moškh. Slka kaže, da bstveh razlk v porazdeltv starost glede a spol. Na krovu so bl tud doječk. Četrta potkov potc je bla mlajša od prblžo let, medaa za starost je 8 let, le četrta potkov potc je bla starejša od 38 let. Če zvzamemo osamelce, je ajvečja starost za žeske 64 let 68 let za moške. Pr žeskah je ea potca, k glede a starost odstopa od ostalh, jea starost je 76 let, pr moškh pa je takh več, jhove starost so od 76 do 8 let. Poglejmo še porazdeltev starost potkov glede a potšk razred. 49
Katara Košmelj: Uporaba statstka 7. Opsa statstka 9 8 7 Starost (leta) 6 5 4 3 3 Razred Slka -: Okvr z ročaj za starost glede a potšk razred. Podatk so za 84 potkov z prvega razreda, 6 z drugega razreda ter 5 z tretjega razreda. Slka kaže bstveo razlko v porazdeltv starost glede a potšk razred. Iz slke odčtamo, da je medaa v prvem razredu 4 let, v drugem 3 v tretjem 5 let. 75% potkov v prvem razredu je blo mlajšh od 5 let, v drugem razredu je blo mlajšh od 36 let v tretjem razredu mlajšh od 3 let. Vredost za prv kvartl je 3 let za potke v prvem razredu, let za potke v drugem razredu ter 8 let za potke v tretjem razredu. Mmala starost je v vseh treh razredh let, pogoj maksmum pa se močo ločjo: 8 v prvem razredu (v prvem razredu ta vredost osamelec), okol 57 let v drugem razredu 5 let v tretjem. V drugem tretjem razredu je ekaj zgorjh osamelcev. Skleemo lahko, da je bla a ladj Ttac porazdeltev starost potkov odvsa od potškega razreda: čm ceejš je razred, tem mlajša je bla prpadajoča populacja. Okvr z ročaj uporabljamo za grafč prkaz porazdeltve števlske spremeljvke je alteratv prkaz hstogramu. Vedar pa je med jma bstvea razlka. Hstogram je odvse od tega, kako oblkujemo razrede, zato lahko za ste podatke dobmo razlče hstograme. Okvr z ročaj določajo eolčo opredeljee vredost, jegov grafč prkaz je eodvse od aaltka. NALOGE. Stol V trž razskav kvaltete stolov so v vzorec zbral 9 stolov. Navajamo jhove prodaje cee (SIT): 786 3 34 958 398 68 7 5734 474 68 446 47 7 578 33 63 3 375 367 a) Izračuajte obrazložte kvartle. b) Al so v podatkh osamelc? 5
Katara Košmelj: Uporaba statstka 7. Opsa statstka c) Naršte okvr z ročaj. d) Kateremu cetlu prpada vredost SIT?. Števlo točk pr matur Za 8 maturatov podajamo števlo točk, k so jh dosegl pr matur. 4 9 5 8 5 6 3 6 8 8 7 8 5 8 4 8 3 8 8 8 4 a) Izračuajte kvartle za števlo točk pr matur. Obrazložte zračuae vredost. b) Naršte okvr z ročaj. 3. Štpedje Za vzorec študetov so zbral podatke o zesku štpedje, k so jo prejel v februarju 996. Tabela -7: Študet po vš štpedje v februarju 996 Vša štpedje (v tsoč SIT) Števlo študetov ad 4 do 6 9 ad 6 do 8 5 ad 8 do ad do 34 ad do 4 4 ad 4 do 6 ad 6 do 8 5 Skupaj a) Izračuajte grafčo prkažte kvartle za všo štpedje. b) Izračuajte grafčo določte odstotek študetov, k so prejel več kot 9 SIT. c) Kolkša je vša štpedje, k je bla presežea pr % študetov? To vredost določte tud grafčo. Kako meujemo to vredost? 4. Nadmorska vša meteorološkh postaj Na slk je okvr z ročaj za admorsko všo 67 meteorološkh postaj v Slovej v letu 99. 5
Katara Košmelj: Uporaba statstka 7. Opsa statstka Nadmorska vša (m) 8 4 6 8 4 Kredarca Koma Slka -: Okvr z ročaj za admorsko všo 67 meteorološkh postaj v Slovej leta 99 Obrazložte slko. 5. Ttac Predstavljamo grafč prkaz porazdeltev starost po spolu potškem razredu. Na slk je 6 okvrov z ročaj. 9 8 7 6 Starost 5 4 3 Razred Razred Razred 3 Žeske Razred Razred Razred 3 Mošk Slka -: Okvr z ročaj za starost glede a spol potšk razred Obrazložte slko. 5
Katara Košmelj: Uporaba statstka 7. Opsa statstka.4 MERE SREDINE: SREDNJE VREDNOSTI Vredost spremeljvke želmo predstavt z jem predstavk, da b dobl bolj jedrato pregledo predstavo o spremeljvk. Najpogosteje uporablje predstavk spremeljvke so jee sredje vredost, k so mere srede spremeljvke. Ker lahko sredo spremeljvke vredotmo a razlče ače, je sredjh vredost več. Sredje vredost so: modus, medaa povprečje. Katera sredja vredost je za določeo spremeljvko prmera, je odvso od jee merske lestvce..4. Modus Modus Mo je ajpogostejša vredost spremeljvke, torej vredost z ajvečjo frekveco. Modusov je lahko več. Če se vse vredost eako mogokrat poovjo, modusa e določmo. Prmer Za druž mamo podatke o števlu otrok v druž. Podatk so:,,,,, 3,,,, 5, otrok. Da dobmo modus, vredost uvrstmo v frekvečo porazdeltev poščemo vredost, k astopa ajvečkrat. Ker je števlo v podatkh ajvečkrat, je Mo = otroka. Največ opazovah druž ma po dva otroka. Modus je prmera sredja vredost za vsako spremeljvko, e glede a mersko lestvco. Npr. modus določmo za kraj rojstva (meska spremeljvka), za zobrazbo (urejeosta spremeljvka), za temperaturo (razmča spremeljvka), za dolžo delove dobe (razmerosta spremeljvka). Poudart pa velja, da je modus eda sredja vredost, k je prmera za meske spremeljvke. Če mamo vredost spremeljvke uvrščee v frekvečo porazdeltev z eako šrokm razred, osovh podatkov pa mamo, določmo modus razred. Modus razred je razred z ajvečjo frekveco. Modush razredov je lahko več. Če je modus razred e sam, a hstogramu grafčo določmo točkov prblžek za modus. Za grafč prblžek potrebujemo modus razred jegovega levega desega soseda. Naršemo dve daljc, tako kakor je razvdo z slke. Abscsa sečšča daljc je grafč prblžek za modus. 53
Katara Košmelj: Uporaba statstka 7. Opsa statstka 6 Števlo učecev 8 4 do -39 4-59 6-79 8-99 Števlo ur odsotost Mo Slka -3: Hstogram za učece glede a števlo ur odsotost ter grafča določtev modusa Prblžek za modus lahko tud zračuamo. Najprej določmo modus razred, jegove karakterstke ozačmo z deksom. Uporabl bomo asledje ozake: f frekveca modusega razreda f frekveca jegovega levega soseda f + frekveca jegovega desega soseda d šra razredov x,m spodja meja modusega razreda Točkov prblžek za modus zračuamo po formul: Mo = x,m + f f f f f + d Prmer V tabel mamo frekvečo porazdeltev študetov po oceah pr zptu z statstke. Rad b določl števlo točk, k je blo pr zptu ajpogostejše. 54
Katara Košmelj: Uporaba statstka 7. Opsa statstka Tabela -8: Študet po števlu točk pr zptu Števlo točk Števlo študetov Sp. meja Zg. meja Sreda Šra 5-6 34 5,5 6,5 55,5 6-7 5 6,5 7,5 65,5 7-8 35 7,5 8,5 75,5 8-9 5 8,5 9,5 85,5 9-9,5,5 95,5 Skupaj 5 34 Mo = 6,5 + = 65,5 5 34 35 Najpogostejša ocea pr zptu je 66 točk. Grafčo določmo prblžek za modus takole: Števlo študetov 8 6 4 Mo 5-6 6-7 7-8 8-9 9- Števlo točk Slka -4: Hstogram za študete glede a števlo točk pr zptu grafča določtev modusa.4. Medaa Medaa Me del ražro vrsto a polovco. Izraču grafčo določaje medae smo spozal v poglavju Kvatl. Na vredost medae vplvajo samo vredost v sred ražre vrste. Medaa je prmera sredja vredost za spremeljvke, k majo vsaj urejeosto mersko lestvco. Npr. zobrazba, števlo otrok v druž, dolža delove dobe. Izraču medae z frekveče porazdeltve smo obravaval v poglavju Kvatl. 55
Katara Košmelj: Uporaba statstka 7. Opsa statstka.4.3 Povprečje Povprečje se račua samo za števlske spremeljvke. Povprečje je vredost, za katero velja: če b bl vs podatk eak, b bl eak povprečju. Pome povprečja bomo lustrral a prmeru povpreče plače: povpreča plača je plača, k b jo prejel zaposle v prmeru, če b dear za plače razdell eakomero med zaposlee, torej b vs mel eako plačo. Povprečje ma predvsem aaltč pome. Uporabljamo ga pr prmerjavah, pr študju damke pojava: pr. povpreča plača po državah, povprečo leto števlo brezposelh p. Za zraču povprečja uporabljamo tr ače zračuavaja: artmetčo sredo, geometrjsko sredo, harmočo sredo. Nač zračuavaja povprečja je odvse od vrste podatkov. Povpreča plača, povpreč verž deks, povpreča htrost se zračuajo a razlče ače..4.3. Artmetča sreda Stadarda ozaka za artmetčo sredo podatkov x, x, x je x. Artmetča sreda lež med vredostm x, x, x. Vsaka posameza vredost x se od x odklaja avzgor al avzdol: odklo x x je poztve al egatve. Artmetča sreda je postavljea tako, da je vsota odkloov eaka : = ( x x) = Iz tega zraza dobmo zraz za artmetčo sredo: x = x = Artmetčo sredo zračuamo tako, da seštejemo vse vredost spremeljvke vsoto delmo s števlom podatkov. Izračuaa artmetča sreda avado v zalog vredost spremeljvke. Še posebej to velja za dskrete spremeljvke. Npr. povprečo števlo otrok za že omeje prmer eajsth druž je, otroka. Artmetča sreda je ajpogosteje uporabljea sredja vredost. Na vredost artmetče srede vplvajo vse vredost, kar za medao za modus e drž. Izjemo velke oz. majhe vredost, torej osamelc, močo vplvajo a vredost artmetče srede. Če so v podatkh osamelc, prporočamo, da se artmetča sreda zračua z osamelc brez jh. Prmer Navajamo starost 35 dplomatov 7 5 3 4 5 5 6 9 5 6 5 4 6 3 5 4 6 7 5 6 5 4 8 8 3 53 4 9 4 7 8 5 7 4 Vredost 53 je osamelec. a) če upoštevamo vse podatke, je povpreča starost 6, leta; b) če zločmo podatek za študeta, k je mel ob dplom 53 let, je povpreča starost 5,4 leta. 56
Katara Košmelj: Uporaba statstka 7. Opsa statstka Včash je smselo, da majo vredost x, x, x razlče vplv pr zračuu povprečja. Vsaka vredost ma svojo utež p, =,,,. Če upoštevamo utež, se artmetča sreda zračua takole: x = p x p = = To sredo meujemo tehtaa artmetča sreda. Če majo vse vredost eake utež, je tehtaa artmetča sreda eaka avad artmetč sred. Poglejmo prmer uporabe tehtae artmetče srede. Prmer Potk je od kraja A do B potoval eo uro s htrostjo 8 km/h, od kraja B do C pa dve ur s htrostjo 9 km/h. Kolkša je povpreča htrost a celot pot? Povpreča htrost je razmerje celote pot s celotega časa t: s 8 + 9 km v = = = 86,7 km/h t + h Povprečo htrost smo zračual kot tehtao artmetčo sredo htrost, utež so čas. Tehtao artmetčo sredo uporabljamo za zraču artmetče srede vredost, k so uvrščee v frekvečo porazdeltev. Za vsak razred določmo jegovega predstavka, spozal smo že, da je to prpadajoča sreda razreda x. Ker e pozamo posamčh vredost v razredu, predpostavmo, da so vse vredost v razredu eake sred razreda; le-to v vsakem razredu upoštevamo f - krat. Torej je prspevek posamčega razreda k vsot vredost f x, te prspevke seštejemo po vseh razredh. Artmetčo sredo zračuamo takole: x = K = f x = K = f K = f x Artmetčo sredo z frekveče porazdeltve zračuamo kot tehtao artmetčo sredo sred razredov, prpadajoče utež so frekvece razredov. Prmer Izračuajmo povprečo števlo točk pr zptu z statstke za prmer študetov: Tabela -9: Študet po števlu točk pr zptu Števlo točk Števlo študetov Sp. meja Zg. meja Sreda Šra 5-6 34 5,5 6,5 55,5 6-7 5 6,5 7,5 65,5 7-8 35 7,5 8,5 75,5 8-9 5 8,5 9,5 85,5 9-9,5,5 95,5 Skupaj x = (34 55,5 + 5 65,5 +... + 95,5) = 68, 57
Katara Košmelj: Uporaba statstka 7. Opsa statstka Povpreče uspeh pr zptu je 68 točk. Če b mel vs študet eak uspeh pr zptu, b le-ta bl 68 točk. Pr zračuu artmetče srede z frekveče porazdeltve delajo probleme odprt razred, saj majo srede. Eda moža pot za zraču prblžka artmetče srede je, da za odprte razrede sam določmo vsebsko smselo sredo razreda. Npr. v frekveč porazdeltv oseb po starost je pogosto zadj razred odprt, pr. več let. Sam moramo presodt, kaj je ustreza sreda takega razreda. Frekveče porazdeltve delmo glede a oblko a smetrče asmetrče. Oblka odraža odos med medao, modusom artmetčo sredo: smetrča porazdeltev z em modusm razredom: x Me Mo Slka -5: Smetrča frekveča porazdeltev 58
Katara Košmelj: Uporaba statstka 7. Opsa statstka porazdeltev je asmetrča v deso: Mo < Me < x Slka -6: Frekveča porazdeltev asmetrča v deso porazdeltev je asmetrča v levo: x < Me < Mo Slka -7: Frekveča porazdeltev asmetrča v levo 59
Katara Košmelj: Uporaba statstka 7. Opsa statstka.4.3. Harmoča sreda Posebe vrste sreda je harmoča sreda. Opredeljea je takole: harmoča sreda vredost x, x, x je recproča vredost artmetče srede vredost,,...,. H = ( ) = = x = x Veljat mora x, =,,...,. Podobo kot pr artmetč sred mamo tud pr harmoč sred tehtao harmočo sredo: H = = ( ) = = x p = = p p p x Najpogosteje jo uporabljamo za zraču povprečja koefcetov, jeo uporabo arekuje osova opredeltev koefceta. Poglejmo prmere uporabe harmoče srede a prmeru povpreče htrost. Prmer Od kraja A do kraja B je km, od B do C pa 4 km. Potk je potoval od A do B s htrostjo 8 km/h, od B do C pa s htrostjo 9 km/h. Kolkša je povpreča htrost a celot pot? s + 4 km v = = = 86,8 km/h t 4 + h 8 9 Povprečo htrost smo zračual kot tehtao harmočo sredo htrost, utež so pot. x x x.4.3.3 Geometrjska sreda Geometrjska sreda vredost x, x, x je -t kore z produkta teh vredost: G = x x... x Za zraču geometrjske srede mora veljat: x >, =,,...,. Tud geometrjska sreda je v sorodu z artmetčo sredo, saj lahko formulo za geometrjsko sredo zapšemo takole: log G = = log x Logartem geometrjske srede je eak artmetč sred logartmrah vredost. Geometrjsko sredo uporabljamo za zraču povprečega koefceta rast, povprečega veržega deksa ter povpreče stopje rast. Poglejmo, zakaj. Časova vrsta y, y,, y T je ekvdstata, dolža časove vrste je T. Pr aalz časovh vrst prde prav t.. koefcet rast, k je razmerje dveh zaporedh podatkov v časov vrst: yt Kt / t =, t =, 3,..., T yt Če koefcet rast možmo s, dobmo prpadajoč verž deks. Izračuajmo povpreč koefcet rast. Izhajamo z asledje zveze: 6
Katara Košmelj: Uporaba statstka 7. Opsa statstka y T = y K / K3 /... K T / T Če b bl vs koefcet rast eak, b bl eak povprečemu koefcetu rast K, torej velja: T y T = y K / K3/... KT / T = y K Iz tega zraza dobmo dva ača zračuavaja povprečega koefceta rast: K = T K / K 3 / KT / T = T... y y T Iz zgorjega sled, da je povpreč verž deks I geometrjska sreda prpadajočh veržh deksov. Če mamo podatke o časov vrst, je boljša pot za zraču povprečega veržega deksa formula, k upošteva prv zadj podatek časove vrste ter jeo dolžo: I yt I / I3 /... IT / T = T y = T Povpreča stopja rast S se zračua z povprečega veržega deksa: S = I Prmer V tabel so verž deks za prdelavo jabolk v EGS po leth v obdobju 98-984, osovh podatkov o prdelav jabolk mamo. Želmo zračuat povprečo stopjo rast za prdelavo jabolk v tem obdobju. Tabela -3: Verž deks za prdelavo jabolk v EGS Leto Verž deks 98 98 7 98 7 983 76 984 8 I = 4 7 7 76 8 = 99,4 S =,6 Povpreča stopja rast je,6%. V obdobju 98-984 se prdelava jabolk v povprečju spremjala. Prmer V tabel je podao števlo brezposelh v Slovej v leth od 99 do 994 (Vr: SL-95, str. 86) zračua verž deks ter stopje rast. 6
Katara Košmelj: Uporaba statstka 7. Opsa statstka Tabela -3: Števlo brezposelh v Slovej v leth od 99 do 994 (Vr: SL-95, str. 86) zračua verž deks ter stopje rast Leto Števlo brezposelh (v tsoč) Verž deks Stopja rast 99 44, 99 75, 69,7 69,7 99,6 36,8 36,8 993 9, 5,8 5,8 994 8, 99, -,8 Izračual bomo povprečo stopjo rast a dva ača: a) z veržh deksov S = 4 69,7 36,8 5,8 99, = 3, 5 8, b) z podatkov časove vrste S = 4 3, 5 44, = V opsaem obdobju je stopja rast v povprečju araščala za 3,5% leto. Če b blo v obravavaem obdobju araščaje eakomero, b števlo brezposelh araščalo za 3,5% leto. Pr zračuu povprečja spremeljvke moramo upoštevat ustrezo sredo. Izrek opsuje odos med artmetčo, harmočo geometrjsko sredo. Navajamo ga brez dokaza. Izrek: H G x Premslte, kdaj so vse tr srede eake. NALOGE. Katere sredje vredost? Za spodaj avedee spremeljvke apšte v tabelo mersko lestvco sredje vredost (modus, medaa, povprečje), k so zaje prmere. Spremeljvka Merska lestvca Sredje vredost Spol Datum rojstva Temperatura zraka ( C) Plača (SIT) Dolža delove dobe (števlo d) Gostota (kg/m 3 ). Tr srede Za podatke 4, 5,, 6, 3,, 8 zračuajte artmetčo, harmočo geometrjsko sredo. 3. Števlo točk pr matur Izračuajte obrazložte sredje vredost za števlo točk pr matur. Podatk so: 4 9 5 8 5 6 3 6 8 8 7 8 5 8 4 8 3 8 8 8 4 6
Katara Košmelj: Uporaba statstka 7. Opsa statstka 4. Starost delavcev V ek orgazacj je blo jauarja 995 aketrah 3 delavcev. Njhove starost (v dopoljeh leth) so: 39 33 45 56 63 3 5 8 66 45 54 59 43 5 43 6 45 45 6 56 9 58 33 7 a) Izračuajte povprečje medao za starost aketrah. Obrazložte zračua vredost. b) Podatke uredte v frekvečo porazdeltev. c) Izračuajte povprečje medao z frekveče porazdeltve. d) Prmerjajte vredost, dobljee pod a) c). e) Grafčo določte modus z frekveče porazdeltve. f) Grafčo določte medao z frekveče porazdeltve. 5. Vps študetov v Slovej Tabela -3: Števlo študetov, vpsah a vsokh šolah, fakultetah umetškh akademjah v Slovej v šolskh leth 986/87 do 995/96 (Vr: SL-97, str. 8) Šolsko leto Števlo vpsah (v tsoč) 986/87 6,5 987/88 7,8 988/89 7,6 989/9 3,6 99/9 3,3 99/9 33,7 99/93 35, 993/94 38,4 994/95 4,6 995/96 46, Izračuajte povprečo stopjo rast za števlo vpsah študetov a dva ača. 6. Poroke V tabel je števlo porok v Slovej po leth v obdobju 99 998. Tabela -33: Števlo porok v Slovej po leth 99 do 998 (Vr SL-99, stra 95) Leto Števlo porok 99 873 99 99 993 9 994 834 995 845 996 7555 997 75 998 758 a) Izračuajte verže dekse stopje rast. Rezultate grafčo prkažte. b) Izračuajte povprečo stopjo rast za števlo porok jo obrazložte 63
Katara Košmelj: Uporaba statstka 7. Opsa statstka 7. Rast bakterj Na začetku poskusa je blo bakterj, ob kocu tretjega de poskusa pa 4 bakterj. Kolkša je bla povpreča deva stopja rast za števlo bakterj v tem poskusu?.5 MERE VARIABILNOSTI Sredja vredost je predstavk vseh vredost spremeljvke, vedar je jea formatvost sorazmero majha. Npr. podatek, da je bla v avgustu 998 povpreča eto plača v Slovej 99 488 SIT, pove ekaj o sredj vredost plač, č pa o tem, kako so plače varrale. Zamvo b blo vedet, za kolko ajvečja plača presega ajmajšo plačo, je varraje plač v avgustu eako kot mesec prej pd. Take podobe kolče opsujejo mere varablost, k dopoljujejo mere srede. Tako kot sredo spremeljvke vredotmo a razlče ače, tud varablost spremeljvke vredotmo z razlčh zhodšč. Predstavljamo mere varablost samo za števlske spremeljvke. Ločmo absolute relatve mere varablost..5. Absolute mere varablost Absolute mere varablost razdelmo v dve skup glede a to, kako vredotjo varablost spremeljvke. razmk: varacjsk razmk, kvartl razmk; odklo: povpreč absolut odklo, povpreč kvadrra odklo..5.. Razmk Najpreprostejša mera varablost je varacjsk razmk VR, k je razlka med maksmalo mmalo vredostjo: VR = x max x m Varacjsk razmk pove, za kolko je ajvečja vredost večja od ajmajše vredost. Na jegovo vredost vplvajo osamelc. Kvartl razmk Q je razlka med tretjm prvm kvartlom: Q = Q 3 Q V tervalu od Q do Q 3 je 5% vseh vredost, četrta vredost je majšh od Q, četrta večjh od Q 3. Na Q e vplvajo osamelc. Razmka sta grafčo prkazaa v okvru z ročaj. Prmer Izračuajmo oba razmka za starost dplomatov VR = 53 - = 3 Q = 7-4 = 3 Starost dplomatov je od do 53 let. Najstarejš dplomat je 3 let starejš od ajmlajšega. Polovca dplomatov je stara od 4 do 7 let, četrta je mlajšh od 4 let, četrta starejšh od 7 let. Če z podatkov zločmo vredost 53, k je osamelec, se varacjsk razmk bstveo spreme, kvartl pa e: VR = 9 - = 7 Q = 6,75-4 =,75 64
Katara Košmelj: Uporaba statstka 7. Opsa statstka.5.. Odklo Pr zračuu razmkov določata mero varablost le dve vredost: ajmajša ajvečja oz. prv tretj kvartl. Za zhodšče vredoteja varablost, kjer upoštevamo vse vredost spremeljvke, se uporablja odkloe vredost od artmetče srede ( x x), =,,...,. Nekater odklo so poztv, drug egatv. Kot že vemo, je vsota odkloov eaka č: = ( x x) = Zato vsota odkloov od artmetče srede dobro zhodšče za mero varablost. Nadomestmo jo z vsoto absoluth odkloov: = x x al z vsoto kvadrrah odkloov: ( x = x) Izvedee mere varablost z vsote absoluth odkloov se v praks maj uporabljajo jh tu e avajamo. Najpomembejš mer varablost sta varaca stadard odklo. Opredelje a osov vsote kvadrrah odkloov od artmetče srede, k jo krajše ozačmo VKO: VKO = ( x x) = Varaca σ je povpreč kvadrra odklo od artmetče srede: σ = ( x = x) = VKO Če mamo podatke z vzorca e z celote populacje, zračuamo t.. vzorčo varaco s takole: s = = ( x x) Opomba: dokaz, da je pr zračuu vzorče varace bolj prmero VKO delt z - kot z, posreduje matematča statstka. Kot bomo vdel kaseje, je tako zračuaa vzorča varaca eprstraska ocea populacjske varace. Varaca je zražea v kvadrrah merskh eotah obravavae spremeljvke (pr. kg, SIT,...) je vsebsko težje obrazložljva mera. Če varaco koremo, dobmo stadard odklo σ : σ = σ oz. vzorč stadard odklo s: s = s. Stadard odklo ma ste merske eote kot spremeljvka. Tud vsebsk pome ma. Izrek pove, da za spremeljvko, k ma prblžo smetrčo frekvečo porazdeltev z em modusm razredom, prčakujemo v tervalu x m s prblžo /3 vredost spremeljvke; x m s prblžo 95% vredost spremeljvke; 65
Katara Košmelj: Uporaba statstka 7. Opsa statstka x m 3s skoraj vse vredost spremeljvke. Za poljubo frekvečo porazdeltev obstaja bolj ohlapa ocea. V poglavju Verjetost raču statstka bomo spozal, od kje zhajajo te ocee. Na osov zreka (glej Cedlk: Uvod v verjetost raču, str. 99) ugotovmo, da velja VR s Stadard odklo je majš al eak polovc varacjskega razmka. Ta ugotovtev je korsta pr ugotavljaju prčakovae vredost za stadard odklo. Opomba: veča žeph kalkulatorjev ma statstče fukcje za zračuat artmetčo sredo, stadard odklo vzorč stadard odklo. Opozarjamo, da so ozake za stadard odklo vzorč stadard odklo a razlčh kalkulatorjh razlče. Prmer V vzorcu je 7 učecev. Njhova oddaljeost od šole (km) je:, 8, 9, 7, 9, 3, 4. Izračuajmo vzorčo varaco vzorč stadard odklo za oddaljeost od šole. 7 Pomož raču: x = 7 x = VKO = 4 s = = 4 = 6,667 6 s = 6,667,6 Izračuajte to vredost s svojm kalkulatorjem. Pr terpretacj zračuaega stadardega odkloa smo v zadreg, saj č e vemo o oblk porazdeltve oddaljeost od šole. Na osov sedmh podatkov je emogoče karkol reč o tem. Če b smel prvzet, da je ta porazdeltev smetrča z em modusm razredom, b veljala ocea: prblžo dve tretj učecev mata do šole med 7,4 km,6 km; prblžo 95% učecev med 4,8 km 5, km, skoraj vs med, km 7,8 km. Če so podatk uvršče v frekvečo porazdeltev s K razred; x, =,,, K so srede razredov, VKO dobmo tako, da za vsak razred zračuamo kvadrat razlke med sredo razreda artmetčo sredo ter le-to upoštevamo f -krat. Prspevke po razredh seštejemo: VKO = K = f ( x x) Če je razredov več, je za»peš«račustvo bolj prmera zpeljaa formula, k je e avajamo. Prmer Izračuajmo povprečje stadard odklo za starost ob popsu, posebej za moške za žeske. 66
Katara Košmelj: Uporaba statstka 7. Opsa statstka Tabela -34: Prebvalc po spolu po starost (v dopoljeh leth) ob popsu 99 v Slovej (Vr: SL - 93, str. 49) Starost (dop. leta) Števlo moškh (v tsoč) Števlo žesk (v tsoč) Sp. meja Zg. meja Sreda - 9 3,4 3,9 5 9 5,3 43,6 5 9 48,4 48,5 3 5 3 39 6,4 55,8 3 4 35 4 49 3,3 6,6 4 5 45 5 59 9,8 6,5 5 6 55 6 69 75, 9,3 6 7 65 7 79 3, 57, 7 8 75 8 več 3,5 3,7 8 Skupaj 95,3 3, Za sredo zadjega razreda bomo upošteval starost 85 let za oba spola. Mošk: Pomož raču: 9 = f x = (3,4 5 + 5,3 5 +... + 3,5 85) = 359,5 359,5 x = 95,3 34, K VKO = f = ( x x) = 4365 4365 s =,5 95,3 Žeske: Pomož raču: 9 = f x = (3,9 5 + 43,6 5 +... + 3,7 85) = 387,5 387,5 x = 3, 37,6 K VKO = f = ( x x) = 54863 s = 54863 3,,3 Povpreča starost moškh ob popsu leta 99 je bla 34, leta, žesk pa 37,6 leta. Prpadajoča stadarda odkloa sta,5 leta za moške,3 leta za žeske. 67
Katara Košmelj: Uporaba statstka 7. Opsa statstka.5. Relatve mere varablost Relatve mere varablost omogočajo prmerjavo varablost razlčh spremeljvk. Najpomembejša relatva mera varablost je koefcet varacje s KV % = x Koefcet varacje mer, kolkše odstotek artmetče srede predstavlja stadard odklo. Koefcet varacje je relatva mera varablost omogoča prmerjavo varablost razlčh spremeljvk. Prmer Tabela -35: Statstke za starost ob popsu za moške za žeske Statstke Mošk Žeske Artmetča sreda (dop. leta) 34, 37,6 Stadard odklo (dop. leta),5,3 Koefcet varacje (%) 59,9 59,3 Relatva varablost starost moškh žesk je prblžo eaka. NALOGE. Števlo točk pr matur Izračuajte obrazložte mere varablost za števlo točk pr matur. Podatk so: 4 9 5 8 5 6 3 6 8 8 7 8 5 8 4 8 3 8 8 8 4. Meteorološke postaje V vzorcu je 67 meteorološkh postaj. Navajamo frekvečo porazdeltev za kolčo padav, zmerjeo a teh postajah v letu 99. Tabela -36: Meteorološke postaje po kolč padav (Vr: Arhv HMZ) Kolča padav (mm) Št. postaj 8 do pod do pod 6 7 6 do pod 6 do pod 4 7 4 do pod 8 4 8 do pod 3 3 do pod 36 Izračuajte: a) Povprečo vredost, modus medao ter vredost obrazložte. b) Izračuajte koefcet varacje za kolčo padav. 3. Poraba beca V slučajo zbrah 4-člaskh gospodjstvh v kraju Gorj Dol so opazoval porabo beca marca 995 septembra 995. 68
Katara Košmelj: Uporaba statstka 7. Opsa statstka Tabela -37: Poraba beca (l) za zbrah gospodjstev v kraju Gorj Dol Gospodjstvo 3 4 5 6 7 8 9 Marec 5 5 34 33 5 34 5 September 9 6 34 35 3 4 Prmerjajte varablost porabe beca v marcu 995 v septembru 995 4. Smreke V vzorcu je 9 smrek, k so razvrščee v razrede po debel debla. Podatk so v frekveč tabel. Tabela -38: Smreke po debel debla Debela debla (cm) Števlo smrek 9 do pod 3 6 3 do pod 7 7 do pod 4 do pod 5 34 5 do pod 9 45 9 do pod 33 33 do pod 37 8 37 do pod 4 4 Skupaj 9 a) Grafčo določte modus. Vredost obrazložte. b) Grafčo določte medao. Vredost obrazložte. c) Izračuajte povprečo debelo debla. d) Izračuajte koefcet varacje za debelo debla. 69
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua 3 OSNOVE VERJETNOSTNEGA RAČUNA 3. VERJETNOSTNI RAČUN IN STATISTIKA Statstka proučuje lastost populacje tako, da aalzra spremeljvke, k opsujejo to populacjo. Statstko zamajo porazdeltev spremeljvke določee karakterstke te porazdeltve, kot pr. povprečje, stadard odklo. Poglejmo s prmer. Proučujemo aktvost študetov Botehške fakultete v šolskem letu 998/99. Zama as, kolko časa a tede študet v povprečju ame študju, kolko šport dejavost,, al sta t dve kolč poveza. V tem prmeru proučujemo tr karakterstke: povprečje dveh spremeljvk ter mero povezaost teh dveh spremeljvk. Če b mel možost prdobt formacjo od vseh študetov fakultete, b te kolče zračual. Praktč problem (dosegljvost študetov, zavračaje aketraja, prevelk strošk, td.) arekujejo, da zberemo določeo števlo študetov v vzorec jh aketramo. Na osov dobljeh vredost zračuamo vzorče ocee. Iz vzorčh oce sklepamo o tem, kaj velja za celoto populacjo. Nasledja shema poazarja stuacjo akazuje ašo dejavost pr vredoteju lastost populacje. V prmeru, da je formacja o vseh eotah populacje razpoložljva, z le-te vredotmo proučevao lastost populacje. Če pa celovte formacje o populacj mamo, z populacje zberemo vzorec z jega zračuamo vzorčo oceo. Le-ta služ kot zhodšče za vredoteje lastost populacje. Je formacja za vse eote populacje razpoložljva? NE Izbra eot v vzorec DA Vredoteje lastost populacje Izraču vzorče ocee za lastost populacje Slka 3-: Vredoteje lastost populacje Verjetost raču je matematča dscpla, k predstavlja osovo orodje statstke pr delu z epopolo formacjo. Njegova vloga je razvda z asledje sheme: metode za ačrtovaje poskusov oz. opazovaj, metode za zraču vzorčh oce metode za sklepaje z vzorčh vredost a populacjske vredost temeljjo a verjetosth predpostavkah. 7
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua Populacja Načrtova poskus al opazovaje Vzorec VERJETNOSTNI RAČUN Aalza vzorčh podatkov Lastost populacje Statstčo sklepaje Vzorča ocea lastost populacje Slka 3-: Vloga verjetostega račua v statstk Ker spada verjetost raču med težja poglavja matematke, podajamo ekaj osov z verjetostega račua, k jh bomo potreboval pr statstčem sklepaju. Bralcu, k se z verjetostm račuom še srečal, svetujemo, da bolj podrobe razlage pošče v lteratur (Čbej, Vadal, Jamk). 3.. Slučaja spremeljvka Verjetost raču proučuje t.. verjetoste poskuse jhove zde. Take poskuse opsujejo slučaje spremeljvke. Slučaja spremeljvka je kolča, k dob v vsakem poskusu eko vredost, ta pa je odvsa od slučaja. Slučaja spremeljvka je določea z dvema podatkoma: z zalogo vredost, s porazdeltvem zakoom. Zaloga vredost slučaje spremeljvke X so vredost, k jh X more zavzet. Glede a zalogo vredost delmo slučaje spremeljvke v: dskrete: te majo kočo al števo eskočo zalogo vredost, edskrete; te majo eštevo zalogo vredost. Med jm so ajpomembejše zveze slučaje spremeljvke. Porazdeltve zako pove, kako je verjetost porazdeljea po zalog vredost. Najbolj sploša oblka porazdeltveega zakoa je porazdeltvea fukcja (kumulatva verjetost) F, k je defraa takole: F ( x) = P ( X x) Pr daem x je vredost fukcje F(x) eaka verjetost P, da slučaja spremeljvka X zavzame vredost, k so majše al eake x. Porazdeltvea fukcja ma asledje lastost: F ( ) = F ( + ) = F je araščajoča fukcja 7
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua P( X > x) = F( x) Za zaps dskrete slučaje spremeljvke uporabljamo porazdeltveo shemo: x, x, x3,... X : p, p, p3,... pr čemer velja: P ( X = x ) = p p p = Prmer Mečemo kocko, zd X je števlo pk a kock. Izd meta je lahko,, 3, 4, 5, 6, prpadajoče verjetost so eake /6. Porazdeltvea shema slučaje spremeljvke X je:, X :, 6,, 6 3,, 6 4,, 6 5,, 6 6 6 Porazdeltev s porazdeltveo fukcjo F(x) je zveza, če obstaja taka fukcja p(x), da je x F ( x) = P( X x) = p( t) dt Fukcjo p(x) meujemo gostota verjetost. Ima asledje lastost: p ( x) p ( x) dx = Graf fukcje p(x) je ad abscso osjo, plošča pod jm pa je eaka. Velja še: P ( a < X < b) = p( t) dt b a Plošča lka, k ga omejujeta abscs a b ter gostota verjetost p(x), geometrjsko upodablja skao verjetost. 73
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua p(x) a b Slka 3-3: Izraču verjetost z gostote verjetost Najpomembejš karakterstk slučaje spremeljvke sta jea povpreča vredost varaca. Povprečo vredost slučaje spremeljvke ozačmo E (X ), včash jo meujemo prčakovaa vredost slučaje spremeljvke.varaca slučaje spremeljvke ozačmo Var (X), ekater jo meujejo tud dsperzja slučaje spremeljvke. Poglejmo ju defcj. Povpreča vredost slučaje spremeljvke E (X ) je artmetča sreda vredost spremeljvke X v velkem števlu poskusov. Izraču povpreče vredost E (X ) : E ( X ) = x p za dskrete slučaje spremeljvke, E ( X ) = x p( x) dx za zveze slučaje spremeljvke Velja: E ( cx ) = ce ( X ), c R E ( X + Y) = E ( X ) + E ( Y ) Varaca slučaje spremeljvke Var (X ) je artmetča sreda kvadratov odkloov od E (X ) v velkem števlu poskusov. Izraču varace Var (X ) : Var ( X ) = ( x E ( X )) p za dskrete slučaje spremeljvke ( Var ( X ) = x E ( X )) p ( x) dx Velja: Var ( cx ) = c Var ( X ), c R za zveze slučaje spremeljvke Var ( X ± Y ) = Var ( X ) + Var ( Y ) ± Cov ( X, Y ) pr čemer je Cov ( X, Y ) kovaraca med spremeljvkama X Y. Stadard odklo slučaje spremeljvke X je Var (X ). 3.. Statstča spremeljvka slučaja spremeljvka Za razumevaje statstke je pomembe odos med statstčo spremeljvko slučajo spremeljvko. Če je bla zbra eot v vzorec slučaja, je vredost, k jo statstča spremeljvka dob pr ek eot, odvsa od slučaja. Navado ekaj vemo o zalog vredost 74
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua spremeljvke. Če lahko prvzamemo še ustrez porazdeltve zako, torej porazdeltev verjetost po zalog vredost, mamo slučajo spremeljvko. Povedao drugače: slučaja spremeljvka je verjetost model za statstčo spremeljvko. Ilustrrajmo to a prmeru. Proučujemo dolžo lstov ekega drevesa. Dolžo zmermo a lsth. Podatke za statstčo spremeljvko uredmo v frekvečo porazdeltev jh grafčo prkažemo s hstogramom. 6 Števlo lstov 8 4 -,5 -,5 -,5 3-3,5 4-4,5 5-5,5 Dolža lsta (cm) Slka 3-4: Hstogram za lstov Slka kaže, da je porazdeltev smetrča ma e modus razred. Če števlo lstov v vzorcu povečujemo, se stopčke v hstogramu zmajšujejo. 75
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua Števlo lstov 8 6 4 3 4 5 6 Dolža lstov (cm) Slka 3-5: Hstogram za lstov 5 4 Števlo lstov 3,5,5,5 3 3,5 4 4,5 5 5,5 6 6,5 Dolža lsta (cm) Slka 3-6: Hstogram za lstov Grafč prkaz frekveče porazdeltve a velkem vzorcu akazuje, da lahko hstogramu prredmo gladko krvuljo, k se mu dovolj dobro prlega. Rečemo, da frekvečo porazdeltev modelramo z ustrezo matematčo fukcjo. 76
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua 5 4 Števlo lstov 3,5,5,5 3 3,5 4 4,5 5 5,5 6 6,5 Dolža lsta (cm) Slka 3-7: Hstogram za lstov matematče model zaj To fukcjo aršemo v verjetost skal: s tem smo statstč spremeljvk prredl slučajo spremeljvko. V tem prmeru smo dolžo lsta modelral s slučajo spremeljvko, k ma ormalo porazdeltev N(3,).,5 Gostota verjetost,4,3,, 68,3% 3 4 5 6 7 Dolža lsta (cm) Slka 3-8: Verjetost dolže lstov med cm 4 cm Dejstvo, da mamo ustrezo verjetosto porazdeltev za dolžo lstov, omogoča, da lahko o dolž lstov povemo še kaj. Npr. zračuamo lahko, kolkše odstotek lstov v celot populacj tega drevesa prčakujemo, da ma dolžo med cm 4 cm. Iskao verjetost zračuamo takole: 4 p ( x) dx 77
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua pr čmer je p(x) gostota verjetost ormale porazdeltve N(3, ). Kot bomo vdel v asledjem poglavju, je vredost tega tegrala,683. Povedao drugače: v proučeva populacj lstov prčakujemo 68,3% lstov z dolžo med cm 4 cm. 3. VERJETNOSTNE PORAZDELITVE Največkrat uporabljee zveze verjetoste porazdeltve so: ormala (Gaussova) porazdeltev, Studetova oz. t-porazdeltev, χ -porazdeltev (h-kvadrat porazdeltev), F-porazdeltev; ajvečkrat uporabljee dskrete verjetoste porazdeltve so: eakomera dskreta porazdeltev, bomska porazdeltev, Possoova porazdeltev. Pr ašem delu bomo obravaval ajprej ormalo porazdeltev, ato pa še bomsko porazdeltev. V poglavju o porazdeltv vzorčh oce bomo spozal Studetovo porazdeltev χ -porazdeltev. 3.. Normala porazdeltev Najpomembejša zmed vseh verjetosth porazdeltev je ormala porazdeltev. Gostoto verjetost za ormalo porazdeltev je prv zapsal fracosk matematk Albert de Movre (733); zpeljal jo je kot aproksmacjo bomske porazdeltve. Leta 89 je Carl Fredrch Gauss proučeval porazdeltev zmerkov eke kolče, če a zmerke vplvajo le slučaj vplv. Mertve aj b ble zvedee pod t.. ormalm pogoj, torej brez sstematčh apak. Verjetosta porazdeltev zmerkov je zaa pod meom ormala al Gaussova porazdeltev. Leta 8 je Laplace zpeljal Laplaceovo lokalo formulo, k je prva verzja t.. cetralega lmtega zreka. Gostota verjetost za ormalo porazdeljeo slučajo spremeljvko X je: x μ p( x) = exp, - < x < σ π σ Gostota je defraa a celot real os, je zvoaste oblke, je smetrča okol x = μ, ma maksmum v točk x = μ se asmptotčo blža abscs os, ko x x. 78
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua μ 3σ μ σ μ σ μ μ+σ μ+σ μ+3σ Slka 3-9: Gostota verjetost za ormalo porazdeltev Normala porazdeltev ma dva parametra μ σ. Dejstvo, da je slučaja spremeljvka X porazdeljea po ormal porazdeltv s parametroma μ σ, krajše zapšemo X N ( μ, σ ). Izraču pokaže, da velja: E (X ) = μ Var ( X ) = σ Parametra ormale porazdeltve sta povpreča vredost μ R stadard odklo σ >. Parameter μ vplva a lego krvulje; parameter σ vplva a oblko krvulje. Večj σ pome večjo raztegjeost v smer abscse os. Predstavljamo gostoto porazdeltve za tr ormale porazdeltve: N (, 5), N (, ), N (, 5). Prmerjajte jhove grafe. p(x) N(,5) N(,5) N(,) -3 - - 3 4 5 6 x Slka 3-: Gostota verjetost za tr ormale porazdeltve 79
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua Izmed vseh ormalh porazdeltev je ajbolj eostava stadardzraa ormala porazdeltev, to je porazdeltev N (, ).,4 p(x), -4-3 - - 3 4 Slka 3-: Gostota verjetost za stadardzrao ormalo porazdeltev x Zelo uporabo zvezo med ormalm porazdeltvam posreduje asledj zrek. Izrek Vsako ormalo porazdeltev lahko prevedemo v stadardzrao ormalo porazdeltev. Če je X N ( μ, σ ), je slučaja spremeljvka Z, μ Z = X σ porazdeljea po stadardzra ormal porazdeltv, torej je Z N (,). Gorj zrek pove, da za pozavaje vseh ormalh porazdeltev zadošča pozavaje N(, ). Izračuavaje verjetost za N(, ) z določem tegralom adomeščajo statstče tabele, k so podae a razlče ače. V prlog v Tabel je za N(, ) za zbrao vredost z, z >, podaa verjetost p v 'desem repu' porazdeltve: p = P( Z > z) = p( t) dt = e dt π z z t 8
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua p z Slka 3-: Uporaba tabele stadardzrae ormale porazdeltve Vredost z so tabelrae a tervalu [, 4] v koraku,. Če potrebujemo večjo atačost, uporabmo learo terpolacjo. Zapšmo še pomembe tabelarče vredost stadardzrae ormale porazdeltve, k jh bomo potreboval kaseje. Uporabl bomo asledj zaps: za vredost z α velja: P ( Z > zα ) = α. Za verjetost α zberemo vredost,5,,, ter jhove polovce, razlog za tako zbro bomo spozal kaseje. z, = 645 z, =,96 5, 5 z, =,36 z, = 576 5, z, = 3,9 z, = 3,9 5 Prmer Psholog trdjo, da je v populacj oseb telgeč kvocet IQ ormalo porazdeljea slučaja spremeljvka s povprečo vredostjo stadardm odkloom 5. Demo, da je jhova trdtev pravla. Kolkša je verjetost, da je IQ ad?,3 p(x),,,9 4 6 8 4 6 x Slka 3-3: Porazdeltev telgečega kvoceta P ( IQ > ) = P( Z > =,333) =,9 5 8
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua Verjetost, da je IQ ad, je,9. Povedao drugače: v populacj ma 9,% oseb IQ ad. Za poljubo ormalo porazdeltev velja: P ( μ σ < X < μ + σ ) = P ( < Z < + ) =,687 3 P ( μ σ < X < μ + σ ) = P ( < Z < + ) =,9545 P ( μ 3σ < X < μ + 3σ ) = P ( 3 < Z < + 3) =,9973 Preverte te zveze s pomočjo tabele. Zapommo s, da sta pr ormal porazdeltv prblžo dve tretj vredost v tervalu ( μ σ, μ + σ ), prblžo 95% vredost v tervalu ( μ σ, μ + σ ) skoraj vse vredost v tervalu ( μ 3σ, μ + 3σ ). NALOGE Rezultat aj bodo a vsaj 3 mesta pravl. Uporabte learo terpolacjo, če je potrebo.. Ocee verjetost Za X N (35, 5) aršte skco ocete verjetost: P ( X > 35), P ( X 35), P ( 3 < X < 4), P ( X > 4), P ( X < 5), P ( < X < 4). Stadardzraa ormala porazdeltev Izračuajte verjetost: P ( Z >,5) P ( Z,5) P ( Z,5) P ( Z >,5) P ( Z >,56) P ( Z < 3,) P ( Z >,5) P (,5 < Z < ) 3. Itelgeč kvocet Itelgeč kvocet IQ je ormalo porazdeljea slučaja spremeljvka s povprečo vredostjo stadardm odkloom 5. a) Kolkša je verjetost, da je IQ ad 3? b) Kolkša je verjetost, da je IQ ad? c) Kolkša je verjetost, da je IQ med 7 3? d) Kolkša je verjetost, da je IQ vsaj? e) Kolkša je verjetost, da je IQ med 95 5? f) Za kolko zmed mljoa ljud (pr. Sloveja) prčakujemo, da bodo mel IQ ad 5? 4. Stroj Da b dosegl pravlo delovaje stroja, vsak tede prekejo jegovo delovaje ga v času prektve ustrezo umerjo. Prvzet smemo, da je čas prektve porazdelje N ( m, m). Kolkša je verjetost, da bo delovaje stroja prekjeo za ajveč mut? 5. Starost ob prv zaposltv Predpostavmo, da za starost oseb ob prv zaposltv lahko prvzamemo ormalo porazdeltev s povprečo vredostjo let stadardm odkloom let. Kolkša je verjetost, da bo starost osebe ob prv zaposltv,95 8
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua a) majša od 8 let b) majša od 5 let c) večja od 9 let d) med 4 let? 3.. *Bomska porazdeltev Najprej poglejmo, kaj je Beroulljevo zaporedje poskusov. Zaporedje verjetosth poskusov meujemo Beroulljevo zaporedje, če velja asledje: v vsakem poskusu se lahko zgod dogodek A al jegova egacja A ; P ( A) = p, P ( A) = p = q. Verjetost p meujemo Beroulljeva verjetost; zd v posamezem poskusu je eodvse od zdov v ostalh poskush. Zamslmo s Beroulljevo zaporedje -th poskusov. Naj slučaja spremeljvka X šteje, kolkokrat se v Beroulljevem zaporedju poskusov zgod dogodek A, torej je frekveca dogodka A. Ta se lahko zgod -krat, -krat, -krat,, -krat; prpadajoče verjetost ozačmo p p..., p. Porazdeltvea shema slučaje spremeljvke X je:,,,,..., X = p p..., p pr čemer verjetost p k zračuamo po Beroulljev formul: k k pk = p q k Frekveca dogodka A v Beroulljevem zaporedju -th poskusov, torej X, je porazdeljea po bomsk porazdeltv s parametroma p, kar krajše zapšemo: X b (, p). Pome parametrov: ozačuje števlo poskusov, p je Beroulljeva verjetost, torej verjetost za zd A v posamezem poskusu. Bomska porazdeltev je ajpomembejša dskreta porazdeltev. Ima kočo zalogo vredost. Za bomsko porazdeltev velja: E ( X ) = p Var ( X ) = pq Predstavljamo bomsko porazdeltev za = za razlče vredost parametra p, X b (, p). 83
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua,4 P(x),3, b (;,), 3 4 5 6 7 8 9 x,4 P(x),3 b (;,5),, 3 4 5 6 7 8 9 x,4 P(x) b (;,8),3,, 3 4 5 6 7 8 9 x Slka 3-4: Bomske porazdeltve b(, p) Pr p = slka akazuje podobost oblke bomske porazdeltve z oblko ormale porazdeltve. Če je X b (, p) je p =, postaja bomska porazdeltev z araščajočm 84
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua čedalje bolj podoba ormal porazdeltv. Pr p se podobost oblke bomske porazdeltve z oblko ormale porazdeltve akazuje pr večjh, kar lustrra spodja slka.,5,,5 b (;,8),,5 4 8 6,5, b (3;,8),5,,5 5 5 5 3 Slka 3-5: Nekatere bomske porazdeltve za p=,8 Več o tem pove asledj zrek. Izrek Z araščajem števla poskusov preko vsake meje postaja bomska porazdeltev b (, p) čedalje bolj podoba ormal porazdeltv z eako povprečo vredostjo eakm stadardm odkloom; torej b (, p) N ( p, pq) Dokaz temelj a t.. Laplaceov lokal formul: 85
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua P ( X = k) e πpq ( k p) pq k pove, da pr dovolj velkem bomsko porazdeltev lokalo (v točk) aproksmra ormala porazdeltev. Ilustracjo Laplaceove lokale formule kaže slka, a kater je grafčo predstavljea bomska porazdeltev b(;,5) jej prlegajoča se ormala porazdeltev N (,5;,5,5).,3 b (;,5) Verjetost,, N (5;,58) 3 4 5 6 7 8 9 x Slka 3-6: Ilustracja Laplaceove lokale formule Bomska porazdeltev je dskreta, ormala pa je zveza. V praks smemo bomsko porazdeltev aproksmrat z ormalo, če sta hkrat zpoljea dva pogoja: p 5 q 5 Opomba: v lteratur ajdemo tud druge pogoje za aproksmacjo, k so strožj. Prmer Verjetost, da dobmo pr kržaju pšece sort A B sorto A, je,5. Kolkša je verjetost, da dobmo pr 48 kržajh maj kot -krat sorto A? Naj X šteje kržaja, pr katerh dobmo sorto A. Velja: X ~ b(48;,5), skaa verjetost pa je: 999 k 48 k 48 3 P( X < ) = k= k 4 4 Temu aporemu račustvu se bomo zogl, saj smemo bomsko porazdeltev aproksmrat z ormalo: p 5 q 5. Torej: 86
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua b( 48;,5) N(, 3) P ( X < ) = P( Z < 6,6) =, Verjetost, da dobmo pr 48 kržajh maj kot -krat sorto A, je,. Poglejmo uporabost bomske porazdeltve v statstk. Beroulljevo zaporedje -th eodvsh poskusov je ustreze verjetost model, kadar proučujemo dvojško spremeljvko a slučajem vzorcu velkost. Vsaka eota ma eo od dveh možost (dogodek A al dogodek A ), vse eote majo sto verjetost dogodka A (to je verjetost p), slučaja zbra eot v vzorec pa omogoča, da prvzamemo, da sta vredost pr dveh razlčh eotah eodvs. Slučaja spremeljvka X, k je porazdeljea po bomsk porazdeltv b(, p), šteje eote v slučajem vzorcu velkost, k majo zd A. Npr. za slučaj vzorec oseb velkost proučujemo, al oseba kad al e kad. Slučaja spremeljvka X, k je porazdeljea po b(, p), šteje števlo kadlcev v tem vzorcu, pr čemer je p verjetost, da oseba kad. NALOGE. Druža Verjetost, da je posamez otrok deček, je,5. V druž je 6 otrok. Izračuajte verjetost, da so: a) 3 dečk 3 deklce b) da je maj deklc kot dečkov.. Škart Verjetost, da je v možč prozvodj zdelek slab, je,. V pošljkah je po zdelkov. a) Zapšte porazdeltev za števlo slabh zdelkov v pošljk. b) Kolkšo je prčakovao števlo slabh zdelkov v pošljk? c) Ocete verjetost, da je v pošljk slabh zdelkov. d) Al lahko to porazdeltev aproksmramo z ormalo porazdeltvjo? 3. Fracoska ruleta Kolo pr fracosk rulet ma 37 krožh zsekov, 8 črh, 8 rdečh zeleega. Izbermo stavo, pr kater stavmo tolar a rdeče. Če kroglca pade a rdeč zsek, dobmo azaj ašo stavo še tolar zrave, scer (če kroglca pade a čro al a zeleo) pa zgubmo ašo stavo. a) Zapšte slučajo spremeljvko, k opsuje zd posameze stave. Njee vredost sta dve: v posamez gr lahko prgramo tolar al pa zgubmo e tolar. b) Izračuajte prčakovao vredost te slučaje spremeljvke. c) Kolkšo fačo staje lahko prčakujemo po 5 zaporedh stavah a rdeče? 4. Drevesca V drevesc cepjo jablae. Sadjarj avajajo, da je verjetost, da se cepč posuš, eaka,. a) Za kolko % cepčev prčakujemo, da se bodo posušl? b) Kolkša je verjetost, da se bo pr cepljeh posušlo atako cepčev? 3.3 PORAZDELITVE VZORČNIH STATISTIK Razložmo ajprej aslov. Imamo vzorec velkost. Na tem vzorcu ma spremeljvka X vredost: x, x,..., x. Vzorča statstka u je poljuba fukcja vzorčh vredost: 87
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua u = f ( x, x,..., x ). Pozamo že precej vzorčh statstk, pr. kvatl, mere srede, mere varablost. Nekatere vzorče statstke so še posebej pomembe, saj so ocee parametrov prpadajoče verjetoste porazdeltve. Poglejmo ekaj prmerov. X je števlska statstča spremeljvka, za katero sta ajpomembejš vzorč statstk vzorča artmetča sreda x x = x = vzorč stadard odklo s s = ( x x) = Če za X prvzamemo ormalo porazdeltev N ( μ, σ ), je x ocea za μ, s pa ocea za σ. To spozaje posreduje matematča statstka. Posebo vlogo pr statstčem sklepaju mata z-statstka x μ z = σ / t-statstka, k je zaa tud pod meom Studetova statstka x μ t = s / Natačeje ju bomo spozal kaseje. Spommo se populacje vseh vzorcev velkost, k smo jo spozal v uvodu. Na vsakem od teh vzorcev ma vzorča statstka u svojo vredost. Njeh vredost je tolko, kolkor je vseh možh vzorcev velkost. Da je to števlo ogromo že pr skrom velkost osove populacje, smo spozal v uvodu. Vzorč statstk u prredmo slučajo spremeljvko U. Zama as verjetosta porazdeltev slučaje spremeljvke U, jeo pozavaje am bo potrebo za statstčo sklepaje z vzorca a populacjo. Pogledal bomo verjetosto porazdeltev za ekaj ajpomembejšh vzorčh statstk. Za prve korake v uporabo statstko zadošča pozavaje porazdeltve vzorčh artmetčh sred porazdeltve t-statstk. 3.3. Porazdeltev vzorčh artmetčh sred Na populacj proučujemo števlsko spremeljvko X. Izbraa velkost vzorca je. Zamslmo s, da a vsakem vzorcu velkost z podatkov zračuamo vzorčo artmetčo sredo x. Vsak vzorec geerra svojo vredost x. Prpadajočo slučajo spremeljvko ozačmo X, jee vredost so vse vzorče artmetče srede x, k jh dobmo a populacj vzorcev velkost. Verjetosto porazdeltev vzorčh artmetčh sred podajata asledja dva zreka. Izrek Če je slučaja spremeljvka X a osov populacj porazdeljea N ( μ, σ ), potem je σ slučaja spremeljvka X a populacj vseh vzorcev velkost porazdeljea N ( μ, ). 88
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua Izrek pove, da vzorče artmetče srede podedujejo ormalo porazdeltev prv parameter zhodšče spremeljvke X; povpreča vredost vzorčh artmetčh sred je eaka povpreč vredost zhodšče spremeljvke. Varaca vzorčh artmetčh sred je -krat majša od varace zhodšče spremeljvke X. Če zbramo večje vzorce, se varaca vzorčh artmetčh sred zmajšuje, prpadajoča porazdeltev je bolj zgoščea okol povpreče vredost. Opomba: ta zrek velja, kadar gre za vzorčeje z vračajem eot. Če eot po vzorčeju e vračamo, teorja pokaže, da se varaca vzorčh artmetčh sred zraz takole: N σ Var( X ) = N Ker je čle N N < je varaca v prmeru, ko eote e vračamo, majša kot v prmeru, da eote vračamo. Pokažemo lahko, da je razlka med formulama zaemarljvo majha, če je osova populacja velka je vzorec majhe del populacje: N σ N σ σ σ = N N N Ker je v praks občajo tako, v adaljevaju e bomo ločl med vzorc z vračajem vzorc brez vračaja eot. Prmer Naj velja: X N (,). Porazdeltev vzorčh artmetčh sred v vzorch velkost 4 je: X N (, 5), v vzorch velkost 6 je X N (;,5), v vzorch velkost pa je: X N (,). p(x),4,3 =4: N(, 5) =6: N(;,5) =: N(, ),, 5 5 5 3 35 4 x Slka 3-7: Porazdeltev vzorčh artmetčh sred pr razlčh velkosth vzorcev 89
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua Cetral lmt zrek X se pr velkh vzorch porazdeljuje prblžo ormalo tud tedaj, ko verjetosta porazdeltev slučaje spremeljvke X a osov populacj ormala. Velja: X N ( E ( X ), Var ( X ) / ) Izrek pove, da pr velkh vzorch treba pozat porazdeltve zhodšče spremeljvke X, zadošča pozavaje jee povpreče vredost E (X ) varace Var (X ). Velja sto kot prej: porazdeltev vzorčh artmetčh sred je (prblžo) ormala, povprečje se podeduje od zhodšče spremeljvke, varaca pa je -krat majša. Cetral lmt zrek lahko uporabmo v praks, če je velkost vzorca večja od 3. Kot bomo vdel kaseje, je cetral lmt zrek zjemo pomembe za statstko. Prmer Psholog trdjo, da je v populacj telgeč kvocet IQ ~ N (,5). Predpostavmo, da je jhova trdtev pravla. Izračuajmo asledje verjetost obrazložmo jhov pome. 5 a) P ( IQ > 5) = P ( Z > ) = P ( Z > ) =, 587 5 V populacj ma 5,9% oseb IQ ad 5. b) Tvormo vzorce velkost 4. Potem velja: IQ N (, 7,5). 5 P ( IQ > 5) = P ( Z > ) = P ( Z > ) =,8 7,5,3% vzorcev velkost 4 ma vzorčo artmetčo sredo ad 5. c) Tvormo vzorce velkost 5. Potem velja: IQ N (, 3). P ( IQ > 5) = P( Z > 5) =, Obstaja zjemo majha verjetost tega dogodka.,% vzorcev velkost 5 ma vzorčo artmetčo sredo ad 5. Bolj atačo: z Tabele v prlog (zadja vrstca spodaj) je razvdo, da a deset mljoov vzorcev velkost 5 prčakujemo 3 vzorce, katerh vzorča artmetča sreda presega 5. 3.3. *Porazdeltev vzorčh deležev X je dvojška statstča spremeljvka, k jo proučujemo v slučajem vzorcu velkost. Njea ajpomembejša vzorča statstka je vzorč delež: x p ˆ = pr čemer ozačuje x števlo eot, k majo lastost A. Vsak vzorec velkost geerra svojo vredost pˆ. Zama as verjetosta porazdeltev prpadajoče slučaje spremeljvke X. V razdelku o bomsk porazdeltv smo spozal, da je Beroulljevo zaporedje -th eodvsh poskusov ustrez verjetost model, kadar proučujemo dvojško spremeljvko a slučajem vzorcu velkost. Naj bo X frekveca dogodka A v Beroulljevem zaporedju -th poskusov, torej velja: X b (, p). Če lahko bomsko porazdeltev b (, p) 9
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua X aproksmramo z ormalo N ( p, pq), je porazdeltev slučaje spremeljvke prblžo ormala: X pq N p, Njea povpreča vredost je eaka Beroulljev verjetost p, a jeo varaco pa vplva tud velkost vzorca. Prmer Verjetost, da je zdelek slab, je,5. V kotrolh vzorch je po 5 zdelkov. Kolko odstotkov kotrolh vzorcev velkost 5 vsebuje več kot % slabh zdelkov? Naj bo X frekveca slabh zdelkov v kotrolh vzorch velkost 5. Velja: X b (5;,5). Ker je: p =,5 > 5 q = 37,5 > 5, je aproksmacja bomske porazdeltve z ormalo sprejemljva. Velja: X,5,95 N,5; = N(,5; 5 skaa verjetost pa: P X >,,,38) Prblžo,% vzorcev velkost 5 vsebuje več kot % slabh zdelkov. Povedao drugače: a vzorcev velkost 5 prčakujemo e vzorec, k vsebuje več kot % slabh zdelkov. 3.3.3 Porazdeltev t-statstk σ Spozal smo že asledje dejstvo: če je X N( μ, σ ), je X N ( μ, ) posledčo je spremeljvka X μ Z = N(,). σ / Če pozamo oba parametra ormale porazdeltve μ σ, z vzorca velkost zračuamo x ato vredost z-statstke: z = x μ σ / Aglešk statstk Wllam Gosset, za pod psevdomom Studet, je v zrazu za z adomestl parameter σ z jegovo vzorčo oceo s tako opredell t-statstko: x μ t = s / Za je zraču potrebujemo parameter μ vzorč oce x s. Gosset je ugotovl, da se pr majhh vzorch verjetosta porazdeltev t-statstke bstveo loč od stadardzrae ormale porazdeltve, pr velkh vzorch pa je ta porazdeltev zelo blzu stadardzrae 9
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua ormale porazdeltve. Izpeljal je verjetosto porazdeltev t-statstk jo meoval Studetova oz. t-porazdeltev. Navajamo asledj zrek. Izrek Na populacj vzorcev velkost je slučaja spremeljvka X μ T = S / porazdeljea po Studetov porazdeltv z - stopjam prostost. To krajše zapšemo takole: T t ( SP = ). Lastost Studetove porazdeltve so: gostota verjetost za t-porazdeltev je po oblk podoba gostot verjetost za N(, ). Fukcja je zveza, defraa a celot real os, je smetrča okol. Formule za gostoto verjetost e avajamo; parameter Studetove porazdeltve meujemo stopje prostost, SP =,,..., ; stopje prostost določajo oblko porazdeltve; če je SP majho števlo, je t-porazdeltev bolj raztegjea v levo deso kot N (, ), ko se SP povečuje, postaja t-porazdeltev čedalje bolj podoba N (, ) ; v lmt je Studetova porazdeltev eaka stadardzra ormal porazdeltv: t ( SP = ) = N (,).,4 SP= SP=,3 N(,),, - -8-6 -4-4 6 8 x Slka 3-8: Studetova porazdeltev z razlčm stopjam prostost 9
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua Vredost t-porazdeltve so tabelrae. Tabele so drugače kot pr ormal porazdeltv. V Tabel 3 v prlog je Studetova porazdeltev. Ozaka α predstavlja verjetost v desem repu porazdeltve. Za zbrae verjetost α (,,,5,,5,, td.) za zbrae stopje prostost SP je v tabel avedea vredost t, za katero velja P ( T t) = α. Zadja vrstca tabele pr SP = se ujema s tabelo za N (, ). Iz je ajlažje odčtamo pomembe vredost stadardzrae ormale porazdeltve, k smo jh avedl v poglavju o ormal porazdeltv. 3.3.4 *Porazdeltev vzorčh varac Naj bo X N( μ, σ ). Zamslmo s, da a vsakem vzorcu velkost zračuamo vzorčo varaco s : s = ( x x) = Vsak vzorec velkost geerra svojo vredost s. Tem vredostm prredmo slučajo spremeljvko S. Zama as jea verjetosta porazdeltev. Iformacjo o tem podaja asledj zrek. Izrek Slučaja spremeljvka X je porazdeljea ormalo s povprečo vredostjo μ stadardm odkloom σ. Na populacj vzorcev velkost je porazdeltev za S podaa s χ -porazdeltvjo z - stopjam prostost takole: S χ ( SP = ) σ Lastost χ -porazdeltve so: je zveza porazdeltev, defraa a poztvem delu reale os; parameter χ -porazdeltve meujemo stopje prostost, SP =,,...,. Le-te določajo oblko porazdeltve. Pr SP = SP = ma porazdeltev posebo oblko; ko je SP majho števlo, je porazdeltev asmetrča v deso; ko se števlo SP povečuje, se asmetrja zmajšuje; 93
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua p(x),5,4,3, SP= SP=3 SP=4 SP=6, 4 6 8 x Slka 3-9: χ -porazdeltve s stopjam prostost, 3, 4 6 s povečevajem SP, postaja porazdeltv N ( SP, SP). Slka kaže ta proces., χ -porazdeltev čedalje bolj podoba ormal SP= SP= p(x), SP=4 3 4 5 6 7 x Slka 3-: χ -porazdeltve s stopjam prostost, 4 Vredost χ -porazdeltve so tabelrae, v prlog je Tabela 4. Orgazraa je tako kot tabela za Studetovo porazdeltev. 94
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua NALOGE. Porazdeltev vzorčh artmetčh sred Slučaja spremeljvka X je porazdeljea po N(, ). a) Kako meujemo to porazdeltev? Napšte aršte gostoto verjetost za to porazdeltev. b) Kakša je prpadajoča porazdeltev vzorčh artmetčh sred v vzorch velkost 6? c) Kakša je prpadajoča porazdeltev vzorčh artmetčh sred v vzorch velkost 36?. Maslo Mlekara pakra zavtke masla, za katere velja predps, da je masa ormalo porazdeljea s parametroma μ = 5 g σ = g. Prvzemmo, da se prozvodja sklada s predpsom. a) Kolkše odstotek zavtkov bo mel maso vsaj 4 g? b) Mlekara devo kotrolra zavtke tako, da s slučajo zbro vzame kotrol vzorec s 5 zavtk, vsak zavtek stehta, z podatkov pa zračua vzorčo artmetčo sredo. Kolkše odstotek kotrolh vzorcev bo mel vzorčo artmetčo sredo med 48 g 5,5 g? 3. Avtomat V tovar majo avtomat, k razdeljuje eko sov v steklečke, scer je orma mg a steklečko. V resc odmerk so vs eak, temveč se zarad slučajh vplvov razlkujejo. Predpostavt smemo, da je odmerek ormalo porazdeljea slučaja spremeljvka. V tovar majo delovaje stroja za zadovoljvo, če ma ta slučaja spremeljvka povprečo vredost mg stadard odklo e večj od mg. a) Če velja μ = mg σ = mg, za kolko odstotkov steklečk lahko prčakujemo, da bodo vsebovale več kot 3 mg sov? b) V tovar preverjajo delovaje stroja tako, da s slučajo zbro vsak da vzamejo kotrol vzorec, k vsebuje 6 steklečk. Stehtajo vsebo v vsak steklečk, ato pa z teh vredost zračuajo vzorčo artmetčo sredo. Če velja μ = mg σ = mg, za kolko odstotkov vzorcev velkost 6 lahko prčakujemo, da bo melo vzorčo artmetčo sredo več kot 3 mg? c) Nekega de so dobl v vzorcu asledje vredost (v mg): 99, 95,8 99,,3,,3 98,4 97,6 3,,9,5 99,5, 4,,4 99,4 Za ta vzorec zračuajte artmetčo sredo stadard odklo ju prmerjajte s parametroma ormale porazdeltve. 4. Mlekara Predpostavmo, da je vsebost beljakov v mleku, k ga mlekara odkupuje od svojh prozvajalcev, ormalo porazdeljea s povprečo vredostjo 3,5% stadardm odkloom,3%. V kotrol kakovost mleka mlekara od vsakega prozvajalca vzame po 4 steklečke mleka za vsako steklečko ugotov vsebost beljakov. Iz teh štrh števl zračua vzorčo artmetčo sredo. Mlekara od prozvajalcev mleka, pr katerh je vzorča artmetča sreda: majša od 3,%, odkupuje mleko po zža ce; med 3,% 3,%, odkupuje mleko po ormal ce; večja od 3,%, odkupuje mleko po zvša ce. 95
Katara Košmelj: Uporaba statstka 7. Osove verjetostega račua Izračuajte, od kolko % prozvajalcev bo mlekara odkupovala mleko po zža, ormal oz. zvša ce. 5. Pestcd Kocetracja določee sov v tekočem pestcdu e sme preseč ppm, ad tem pragom postae pestcd toksče. Uček pestcda pa je zgublje, če je kocetracja te sov majša od 3 ppm. Predpostavmo, da prozvajalec pošlja pestcd v posodah, v katerh je kocetracja te sov ormalo porazdeljea s povprečo vredostjo 8 ppm stadardm odkloom,5 ppm. a) Kolkše % pošljk presega dovolje maksmum? b) Kolkše % pošljk ma kocetracjo pod sprejemljvm pragom? 6. *Voltve V populacj vollh upravčecev je 3% eopredeljeh. Kolkša je verjetost, da bo v vzorch velkost maj kot 4 eopredeljeh? 7. *Kržaja Verjetost, da pr kržaju sort A B dobmo sorto A, je,5. Kolkša je verjetost, da dobmo sorto A pr več kot 6% kržaj, če: a) zvedemo kržaj? b) zvedemo kržaj? 96
Katara Košmelj: Uporaba statstka 7 3. Osove statstčega sklepaja 4 OSNOVE STATISTIČNEGA SKLEPANJA V okvru tega poglavja s bomo ogledal dve tem: ocejevaje parametrov prezkušaje statstčh domev. Kot parameter bomo pojmoval lastost verjetoste porazdeltve. Npr. ormala porazdeltev N ( μ, σ ) ma dva parametra, μ σ, k atačo določata jeo oblko. Ta dva parametra sta vsebsko zamva, parameter μ je povprečje prpadajoče slučaje spremeljvke, parameter σ pa je stadard odklo. 4. *OCENJEVANJE PARAMETROV V splošem obstajata dva ača ocejevaja ezah kolč: - točkovo ocejevaje: ea vredost ocejuje ezao kolčo; - tervalo ocejevaje: dve vredost določata terval, k ocejuje ezao kolčo. Prmer: merjeje htrost zmerjea htrost je 5,4 m/s. To je točkova ocea htrost; zmerjea htrost je 5,4 m, 5 m/s. To je tervala ocea htrost. Itervala ocea podaja tud eke vrste mero za apako mertve. Tud v statstk pozamo točkovo tervalo ocejevaje parametrov, le da se tervalo ocejevaje po vseb bstveo razlkuje od pr. fzkalega ocejevaja. 4.. *Točkova ocea parametra Za točkovo oceo parametra so zaželee določee matematče lastost. Ea ajpomembejšh je eprstraskost. Ocea je eprstraska, če je povprečje vseh vzorčh oce v vzorch določee velkost eako ocejevaemu parametru. Spozal smo že ekaj eprstraskh oce. Če X ~ N( μ, σ ), potem je vzorča artmetča sreda x x = x = eprstraska ocea za μ, saj velja E (X ) = μ. Teorja pokaže, da je vzorča varaca s = ( x x) = eprstraska ocea za σ, saj velja E ( S ) = σ. Prav zahteva po eprstraskost je arekovala, da se vzorča varaca zračua tako, da je v meovalcu ( ) e. Vzorč stadard odklo s pa je prstraska ocea parametra σ, saj teorja pokaže, da E (S) σ. Prmer Stroj pol steklečke z zdravlom. Predpostavljat smemo, da je masa zdravla v steklečkah ormalo porazdeljea, X ~ N( μ, σ ). V vzorcu je 9 steklečk. V jh so ugotovl asledje mase zdravla (mg):,8 9,,,9,, 9,8,6, Iz podatkov zračuamo: x =,5 mg je točkova ocea za povprečo maso zdravla μ. Ta ocea je eprstraska. s =,6575 mg je točkova ocea za varaco mase σ. Ta ocea je eprstraska. s 97
Katara Košmelj: Uporaba statstka 7 3. Osove statstčega sklepaja s =,8mg je točkova ocea za stadard odklo mase σ. Ta ocea je prstraska. Če X ~ b(, p), potem je vzorč delež pˆ x p ˆ = eprstraska ocea za Beroulljev p, saj velja: X E = p Prmer V slučajem vzorcu je seme sorte A, od teh je kallo seme. Vzorč delež p ˆ = =,6 je točkova ocea za verjetost p, da seme kal. Ta ocea je eprstraska. Poleg eprstraskost obstajajo še druge pomembe lastost točkovh oce, k jh e bomo obravaval. Slabost točkove ocee je jea ezaesljvost, saj e vemo, a katerega od možh vzorcev smo aletel oz. kje v porazdeltv vzorčh oce lež dobljea točkova ocea. Zato pogosto točkovo oceo parametra dopolmo z tervalo oceo. Ta se zraža z tervalom, k z vaprej predpsao verjetostjo pokrva vredost parametra. Poglejmo bolj atačo jegovo opredeltev. 4.. *Itervala ocea parametra Itervala ocea parametra je t.. terval zaupaja. To je slučaj terval, veza a prpadajoč slučaj vzorec. Poglejmo defcjo tervala zaupaja: Naj θ ozačuje parameter, k ga ocejujemo, vredost α je vaprej predpsaa verjetost, < α <. Iterval L, ) meujemo terval zaupaja za parameter θ, če velja: P ( L < θ < ) L = α Kometar ( L Stadarde vredost, k jh uporabljamo za verjetost α, so:,5;, al,. Verjetost α meujemo zaupaje. Stadarde vredost za zaupaje torej so:,95;,99 oz.,999. Občajo zražamo zaupaje v odstotkh, govormo pr. o 95-odstotem (95%) tervalu zaupaja. L oz. L je spodja oz. zgorja meja tervala zaupaja. L L sta slučaj spremeljvk: pr vsakem vzorcu mata drugo vredost. Drugače povedao: vsak slučaj vzorec velkost geerra svoj terval zaupaja ( l, l ). V populacj vseh vzorcev velkost je odstotek tervalov zaupaja, k vsebujejo parameter θ, eak ( α). Za posamez terval zaupaja e vemo, al je θ vsebova v tem tervalu al e. Trdmo lahko le, da je ta terval z verjetostjo ( α) ede tsth, k vsebujejo parameter θ. Prmer Ocejujemo parameter μ z N ( μ, σ ). Naredmo vzorcev določee velkost. Iz podatkov vsakega vzorca zračuamo terval zaupaja za μ pr verjetost α =, 5. 98
Katara Košmelj: Uporaba statstka 7 3. Osove statstčega sklepaja Prčakujemo, da bo zmed tervalov zaupaja 95 takh, k pokrjejo eza parameter μ, 5 takh, k ga e pokrjejo. Za posamez terval zaupaja e vemo, al vsebuje μ al e. Slka lustrra to dogajaje a kokreth podatkh. Števlo vzorcev je, podatk (vodorave črtce) so geerra z N(,). Ocejujemo povprečje, k je. Izmed tervalov zaupaja (avpče črte) pr stopj zaupaja,95 je 9 takh, k pokrvajo vredost. E terval (ozače s puščco) povprečja e pokrva. Slka 4-: Iterval zaupaja za povprečje ormale porazdeltve Itervalo ocejevaje v statstk je verjetosto ocejevaje, zato moramo bt pr terpretacj tervalov zaupaja dovolj pazljv. Izraču tervala zaupaja za posamez parameter temelj a verjetost porazdeltv jegovh vzorčh oce. Poglejmo zpeljave tervalov zaupaja za ekaj parametrov. 4... *Iterval zaupaja za povprečo vredost Izraču tervala zaupaja za povprečo vredost E(X) temelj a porazdeltv vzorčh artmetčh sred x v populacj vzorcev velkost. Poovmo teorjo. X μ a) Če X ~ N( μ, σ ) je σ zaa, je Z = ~ N(,). σ X μ b) Če X ~ N( μ, σ ) σ zaa, je T = ~ t( SP = ) S Var( X ) c) Če so vzorc dovolj velk, je X ~ N( E( X ), ) e glede a porazdeltev zhodšče spremeljvke X. Nakazal bomo zpeljavo tervala zaupaja za a). Ta stuacja v praks zelo redko astopa, vedar je za razumevaje kostrukcje tervala zaupaja ajlažja. a) X ~ N( μ, σ ) je σ zaa S pomočjo tabel za stadardzrao ormalo porazdeltev N(, ) določmo vredost m, da velja: z α P ( z < Z < z ) = α α α 99