Matematcká štatstka Trochu hstóre: Starovek sčítae ľudu a majetku (vojeské a daňové účely) Egypt, Čía, Mezopotáma Stredovek vzk a kosoldáca ových štátov zsťovae geografckých údajov, hospodársky a poltcký pops štátu. status = stav štátu. Novovek 7. stor. poltcká artmetka v aglosaských krajách Petty, Grad. Vzk zárodkov posťovíctva a z toho vyplývajúca tvorba úmrtostých tabulek Huyges). Do 20. storoča tzv. popsá štatstka, hlavý prcíp je vyčerpávajúce zsťovae (čím vac údajov, tým lepše výsledky). 20. stor. využívae aparátu pravdepodobost (v jadre). Vzk matematckej (duktívej) štatstky prcíp spočívajúc v áhodom výbere Pojem štatstka je veľm obšíry. V prax sa eraz streteme so slovým spojeam: štatstcky bolo zsteé, že... alebo štatstka hovorí, že.. prčom je podaá formáca o stej skutočost (apr. premerý zárobok alebo hmotosť, sledovaosť stej televízej stace, žvotosť výrobkov, spotreba bezíu, volebé preferece atď.). Takáto formáca je stopercete pravdvá le vtedy, ak sa zstl skúmaý štatstcký zak (zárobok, hmotosť, sleduje - esleduje atď.) pre každú štatstckú jedotku, t. j. pre každý objekt skúmaa. To sa však dá le zredkavo realzovať, mohlo by to byť fače áročé alebo by to stratlo zmysel (apr. pr zsťovaí žvotost výrobkov by sme zlkvdoval celú výrobu). Preto sa zstí skúmaý zak a áhodom výbere - vybraej vzorke a zo získaých údajov sa urobí zovšeobecee vo forme štatstckého záveru o celom základom súbore, t. j. o celej može štatstckých jedotek, ktorá je predmetom skúmaa. Základé pojmy a metódy Štatstcký súbor skupa prvkov, ktoré sú predmetom štatstckého skúmaa a ktoré majú spoločú vlastosť. Rozsah štatstckého súboru počet prvkov štatstckého súboru. Ozačujeme. Štatstcký zak sledovaá vlastosť prvkov. Ozačujeme x. Delee štatstckých zakov: kvattatíve dajú sa jedozače čísele vyjadrť: vek, výška, hmotosť kvaltatíve edajú sa vyjadrť jedozače číslom; saha je ch kvatfkovať: farba očí, pohlave, árodosť Štatstcké dáta ameraé hodoty štatstckého zaku. Ozačujeme x, x 2,..., x.
Absolúta početosť číslo, ktoré udáva, koľkokrát sa v súbore M vyskytuje hodota zaku x. Ozačujeme. Relatíva početosť podel, kde je absolúta početosť hodoty zaku x a je rozsah súboru M. Etapy štatstckej práce:. štatstcké zsťovae (hromadee) dát 2. spracovae štatstckých dát 3. vyhodocovae výsledkov; záver pre prax Štatstcké zsťovae (hromadee) dát. Pre štatstcky zsťovaé dáta je potrebá dôkladá evdeca. Získame východze dáta x, x 2,..., x. Spracovae štatstckých dát:. tabuľkové 2. grafcké 3. výpočtové Tabuľkové spracovae dát. Dáta usporadame do eklesajúcej postupost x x 2... x Ak sa údaje opakujú, vzká tabuľka početostí, obsahuje absolúte a relatíve početost, kumulatíve početost a kumulatíve relatíve početost. Grafcké metódy. Polygó početost je spojcový dagram spájajúc (ajčastejše) body [x, m ]. Hstogram je stĺpcový dagram. Používa sa v prípade veľkého možstva hodôt (do 20) v tomto prípade zadelíme hodoty do tervalov. 2
Kruhový dagram vyjadruje početosť pomocou kruhových výsekov. Výpočtové metódy. Štatstcké charakterstky - číselé hodoty reprezetujúce celý štatstcký súbor: A) Charakterstky polohy charakterzujú úroveň hodôt zaku v štatstckom súbore. Medz ajpoužívaejše charakterstky polohy patra premery (artmetcký - x, geometrcký - x g, harmocký - x h ), medá - med(x), modus - mod(x). B) Charakterstky varablty charakterzujú meru rozptýlea hodôt zaku. Na merae varablty sa používa varačé rozpäte - R = x max x m, premerá odchýlka - e, smerodajá odchýlka - σ, rozptyl - σ 2 a ďalše, apr. varačý koefcet zaku x V(x) Ak V(x) < 30%, hovoríme o dobrej charakterstke. V prípade, že V(x) > 50%, je potrebé použť é charakterstky polohy. 3
Charakterstky závslost 2 zakov: korelačý koefcet r Výpočty charakterstík: Artmetcký premer ozačujeme x x + x2 +... + x artmetcký premer hodôt x, x 2,..., x x = = x = ak majú hodoty x početosť, hovoríme o vážeom artmetckom premere: x. + x2. 2 +... + xk. k x = + +... + Geometrcký premer ozačujeme x g geometrcký premer hodôt x, x 2,..., x x g = 2 x. x2... x v prax sa využíva apr. pr určovaí premerého tempa výroby = k = x Harmocký premer ozačujeme x h harmocký premer hodôt x, x 2,..., x xh = = + +... + x x x 2 = x v prax sa využíva apr. pr určovaí premerého času výroby súčastky Medá Modus ozačujeme med(x) je to prostredý čle spomedz hodôt x, ak sú usporadaé podľa veľkost ak je rozsahom súboru páre číslo, med(x) určíme: x + x med(x) = + ; =... artmetcký premer prostredých dvoch čleov 2 2 ozačujeme mod(x) je to ajčastejše sa vyskytujúca hodota v súbore Varačé rozpäte ozačujeme R... R = x max x m varačé rozpäte je rozdel medz maxmálou a mmálou hodotou. Varačé rozpäte skúmaého zaku poskytuje základý pohľad a melvosť hodôt zaku v štatstckom súbore. Jeho veľkosť závsí ba od krajých hodôt, prčom jeda z ch alebo obe môžu byť extréme hodoty pre daý súbor etypcké, a preto môžu predstavu o varablte zače skresľovať. 4
Premerá odchýlka ozačujeme e... e =. = x x Premerá odchýlka je lepšou charakterstkou varablty ako varačé rozpäte, akoľko jej veľkosť závsí od každej ameraej hodoty štatstckého súboru. Smerodajá odchýlka. 2 ozačujeme σ... σ = ( x x) ozačujeme s... s =. ( x x) 2 Rozptyl. 2 výberový - ozačujeme s 2... s 2 2 =. ( x x) smerodajá odchýlka a rozptyl ctlvejše charakterzujú varabltu hodôt súboru, zvýrazňujú váhu odchýlok hodôt od x, dávajú formácu o rozptýleí hodôt okolo x populačý - ozačujeme σ 2... σ 2 = ( x x) Varačý koefcet ozačujeme V(x)... V(x) = x σ. 00% vyjadruje meru varablty v percetách artmetckého premeru. Koefcet koreláce ozačujeme r vyjadruje stupeň súvslost medz dvoma zakm x a y k r = σ.σ x y k =. ( x x)(. y y) = σ x = ( x x). 2. 2 σ y = ( y y) 5
Korelačý koefcet adobúda hodoty z tervalu -;. Ak 0 r < 0,3 medz zakm X a Y je ulový stupeň väzby. Ak 0,3 r < 0,5 medz zakm X a Y je mery stupeň väzby. Ak 0,5 r < 0,7 medz zakm X a Y je výzačý stupeň väzby. Ak 0,7 r < 0,9 hovoríme o vysokom stup väzby medz zakm X, Y. Ak 0,8 r medz zakm X a Y je veľm tesá väzba. Príklad : Vyhodoťte štatstcky písomú prácu žakov, v ktorej získal asledové zámky: 3, 2,,, 2, 2, 3, 4, 4,, 2, 3, 3, 3, 5, 4, 2, 2, 2, 3, 3, 3, 3,, 3. Zostrojte tabuľku rozdelea početostí. Rešee: Štatstcký súbor tvora žac, ktorí písal písomú prácu. Každý žak je štatstckou jedotkou. Pozorovaým zakom x je získaá zámka, ktorá adobúda päť hodôt, 2, 3, 4, 5. Rozsah súboru je = 25. Hodoty usporadame do eklesajúcej postupost, čím dostaeme postuposť:,,,, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 5. Prostredý zak tejto postupost má hodotu 3, t.j. mod(x) = 3. Najčastejše sa vyskytujúc zak má hodotu 3, t.j. med(x) = 3. Tabuľka rozdelea početostí získaých zámok má asledujúc tvar: Premerá zámka z daej písomej práce je x = 3. Tabuľka rozdelea početostí umožňuje získať ektoré formáce rýchlo a v prehľadej forme. Napríklad zo stĺpca absolúta početosť môžeme zstť, koľko žakov z tredy apísalo písomku a 3, je ch 0. Koľko žakov apísalo písomku lepše ako a štvorku zstíme zo stĺpca kumulatíva početosť, vdíme, že ch je 2. V prípade, že by sme chcel vyjadrť početosť žakov, ktorí apísal písomku lepše ako a štvorku v percetách, príslušú hodotu 0,84 v stĺpc kumulatíva relatíva početosť vyásobíme 00. Dostávame, že 84 % žakov dostalo z písomky lepšu zámku ako 4. 6
Varačé rozpäte: R = 5 = 4 Premerá odchýlka: e = Smerodajá odchýlka:. = x x =.2,2 = 0,848 25 x - σ = 2 a x + σ = 4... ťažsko výsledkov písomky v okolí jej premeru tvora zámky od 2 po 4, t.j. určtým spôsobom sa tam vymykajú zámky a 5. Varačý koefcet: V(x) =,09.00% = 39,2 % 2,6 Polygó je spojcový graf. Vzke spojeím bodov [x ; f ], =, 2,..., k. Polygó môžeme dostať aj z hstogramu, a to tak, že spojíme lomeou čarou stredy horých strá všetkých stĺpcov hstogramu. 7
2 3 4 5 Kruhový dagram rozdelea početostí zámok Príklad 2: Zstte premerý ročý koefcet rastu výroby podku, ak jeho výroba je zazameaá v asledujúcej tabuľke: 8
Rešee: 6500 66402 99603 Ročé koefcety rastu výroby sú: k = =,05; k2 = =,02; k3 = =,5. 62000 6500 66402 Platí: 99 603 = 66 402 k 3 = 65 00 k 2 k 3 = 62 000 k k 2 k 3. Predpokladajme, že rast výroby je rovomerý s ročým koefcetom rastu k. Potom platí : 99 603 = 66 402 k = 65 00 k. k = 62 000 k. k. k...... 62 000 k k 2 k 3 = 62 000 k. k. k, t. j. ( k ) 3 3 = k k 2 k 3 k = 3 k. k. k =,05.,02.,,7 2 3 5 Premerý ročý koefcet rastu výroby v podku je,7. Počítal sa geometrcký premer. Príklad 3: Určte premerý čas, ktorý potrebuje jede robotík a výrobu jedého výrobku z údajov v asledujúcej tabuľke: x ozačuje čas (v mútach) potrebý a výrobu jedého výrobku. Rešee: Pozorovaým zakom x je čas potrebý a výrobu jedého výrobku. Údaje zapíšeme do tabuľky rozdelea početostí: Rozsah výberového súboru je = 5 = f = 0. Uvažujme o počte výrobkov, ktorý vyroba títo desat robotíc za jedu hodu (t.j. za 60 mút). 60 60 60 60 60 Teto počet je: +.2 +.2 +.3 +. 2 výrobkov. 4 5 6 8 6 9
Ak ozačíme x h premerý čas jedého robotíka potrebý a výrobu jedého výrobku, tak platí: 60 60 60 60 60 60 2 2 3 2 +.2 +.2 +.3 +.2 =. 0, t. j. x h. + + + + = 0 4 5 6 8 6 4 5 6 8 6 x h 0 x h = 6,743. 2 2 3 2 + + + + 4 5 6 8 6 Premerý čas potrebý a výrobu jedého výrobku je prblže 6,7 múty. V tomto prípade bol pr výpočte použtý harmocký premer. Harmocký premer charakterzuje charakterstku polohy súboru hodôt, ak teto hodoty predstavujú výkoové lmty. Príklad 4: Auto prešlo 50 km. Prvých 0 km šlo rýchlosťou 50 km/h, ďalších 0 km rýchlosťou 80 km/h, potom 0 km rýchlosťou 90 km/h, ďalších 0 km rýchlosťou 60 km/h a posledých 0 km rýchlosťou 80 km/h. Akou premerou rýchlosťou šlo auto? Rešee: Premerú rýchlosť počítame podľa vzťahu v = s/t, kde v ozačuje premerú rýchlosť, s dráhu a t ozačuje čas. Platí: t = t + t 2 + t 3 + t 4 + t 5 = s /v + s 2 /v 2 + s 3 /v 3 + s 4 /v 4 + s 5 /v 5 = 0/50 + 0/80 + 0/90 + 0/60 + 0/80 v = s/t = 0. 50 + 80 50 + + 90 60 + 80 = 68,7 Auto šlo premerou rýchlosťou 68,7 km/h. Aj v tomto prípade bol pr výpočte použtý harmocký premer. Pozámka: V štatstckej prax sa ajčastejše ako charakterstka polohy používa artmetcký premer, lebo závsí od všetkých pozorovaých hodôt. Je však veľm ctlvý a to, ak sú ektoré hodoty zaku extréme veľké alebo malé. Extréme hodoty môžu spôsobť, že premer e je ajlepšou charakterstkou polohy. V takýchto prípadoch treba použť ú charakterstku polohy. 0
Príklad 5: U žakov bol zazameaý asledujúc počet hodí vymeškaých z vyučovaa: 5, 2, 6, 8, 0, 7, 5, 0, 2, 5, 6. Premerý počet vymeškaých vyučovacích hodí je: 76 x =.(5 + 2 + 6 + 8 + 0 + 7 + 5 + 0 + 2 + 5 + 6) = = 6 hodí. Vdíme, že v dôsledku jedej extrémej hodoty je premerý počet vymeškaých hodí zače skresleý a evysthuje počet absecí v sledovaej skupe 0 žakov. V takýchto prípadoch použjeme ektorú z ďalších charakterstík polohy, apríklad medá - prostredá hodota, ktorú ozačujeme med(x). Je to hodota, ktorá sa achádza v strede súboru hodôt usporadaého do eklesajúcej postupost: 2, 5, 5, 5, 6, 6, 6, 7, 8, 0, 0. Med(x) = 6 vymeškaých vyučovacích hodí. Príklad 6: Pr štatstckom zsťovaí bol ameraé hodoty:, 2, 2, 3, 4, 5, 6, 7, 8, 8, 9. Rozsah súboru = ; artmetcký premer x = 5,8; med(x) = 5. Príklad 7: Pr štatstckom zsťovaí bolo ameraých týchto 2 hodôt:, 2, 2, 3, 4, 5, 6, 7, 8, 8, 9, 0. Med(x) = (5 + 6)/2 = 5,5. Modus je hodota zaku x, ktorá má v štatstckom súbore ajväčšu početosť. Rovako ako medá aj modus je charakterstka polohy, pre výpočet ktorej epotrebujeme všetky ameraé hodoty a rozdel od artmetckého premeru. Modus môžeme určť ba vtedy, keď sa početost f hodôt x zaku x odlšujú. Ak sú početost rovaké, emôžeme určť modus. Príklad 8: Pr pozorovaí dskréteho štatstckého zaku bol zsteé teto hodoty: 3, 3, 3, 4, 4, 4, 6, 6, 6, 8, 8, 8. V tomto prípade e je možé určť modus, pretože všetky pozorovaé hodoty majú rovakú početosť. Príklad 9: V súbore hodôt 3, 4, 4, 5, 5, 5, 6, 7, 7, 7, 7, 8 má ajväčšu početosť hodota 7, preto mod(x) = 7. Pozámka: Ak v súbore vystupujú dve alebo vac avzájom susedacch hodôt rovako často a ch početosť je väčša ako početosť ostatých hodôt, tak modus vypočítame ako artmetcký premer ajfrekvetovaejších hodôt.
Príklad 0: Pr pozorovaí dskréteho štatstckého zaku bol zsteé teto hodoty: 3, 4, 4, 5, 5, 5, 6, 6, 6, 7, 8. Hodoty 5 a 6 sa v tomto súbore vyskytujú s rovakou frekvecou (po tr razy), teda mod(x) = (5 + 6)/2 = 5,5. Pozámka: Ak exstujú dve avzájom esusedace hodoty s relatíve ajväčším početosťam, tak obe teto hodoty uvádzame ako modus. V takomto prípade hovoríme, že rozdelee je bmodále (dvojvrcholové). Pr grafckom zázoreí je modus hodota a x-ovej súradc, v ktorej polygó početostí dosahuje maxmum. Vo väčše prípadov je artmetcký premer ajlepšou charakterstkou polohy, pretože sa počíta zo všetkých ameraých hodôt. Artmetcký premer by sa však emal počítať v ektorých prípadoch, apríklad vtedy, ak je rozdelee vacvrcholové (apr. bmodále). Vtedy treba upredostť modus. Rovako pre kvaltatíve údaje sa ako charakterstka polohy používa modus. Pr asymetrckom rozdeleí treba upredostť medá. Príklad : U 0 žakov bol zsteé ch výšky (zak X) a hmotosť (zak Y). Aký je stupeň väzby medz výškou a hmotosťou týchto žakov. Nameraé hodoty a príslušé výpočty sú uvedeé v asledujúcej tabuľke: 57 x = = 57, cm a 0 484 y = = 48,4 kg 0 2
r = = = ( x x)(. y y) 65,6 2 2 546,8. 374, 4 ( x x). ( y y) = = 0,856 Vypočítaá hodota koefceta koreláce vyjadruje, že medz výškou a hmotosťou desatch žakov je vysoký stupeň väzby. Príklad 2: Určte medá, modus, artmetcký premer a varačé rozpäte pre štatstcký súbor: 25, 42, 45, 36, 38, 3, 29, 35, 40, 42, 39, 37, 33, 4, 45. Rešee: Usporadaý súbor: 25, 29, 3, 33, 35, 36, 37, 38, 39, 40, 4, 42, 42, 45, 45 med(x) = 38 ; mod(x) = 42 + 45 2 = 43,5 ; 5 x = 588 x = = = 37,2 ; R = 45 25 = 20 5 5 Príklad 3: Dvaja strelc streľajú do terča a zásahy s zapsujú. Prvý strelec zasahol 7, 8 a 9, druhý strelec, 0 a 3. Vypočítajte premeré odchýlky, rozptyl a smerodajé odchýlky počtu astreľaých bodov oboch strelcov. Rešee: Ozačme x počet astreľaých bodov. strelca a x počet astreľaých bodov 2. strelca. Vypočítame artmetcké premery počtu astreľaých bodov u oboch strelcov: To zameá, že obaja strelc premere astreľal 8 bodov. Naprek tomu, že premeré výkoy oboch strelcov sú rovaké, ch výkoy sú rozdele. Túto odlšosť vyjadríme pomocou premerej odchýlky, ktorej hodotu vypočítame pomocou asledujúcch tabulek: 3
. strelec: 2. strelec: Pozámka: Pretože súčet odchýlok hodôt zaku od ch artmetckého premeru je rový ule, pr výpočte premerej odchýlky sa počítal súčet absolútych hodôt uvedeých odchýlok. Ďalšou možosťou ako odstráť vplyv zameka je umocť odchýlky a druhú. Ak odchýlky umocíme a druhú, eleže odstráme vplyv zameka, ale zároveň zvýrazíme extréme hodoty v súbore - malé odchýlky (meše v absolútej hodote ako ) budú po umoceí ešte meše a veľké odchýlky sa umoceím ešte vac zväčša. Tým je motvovaá defíca rozptylu a smerodajej odchýlky. Rozptyl a smerodajá odchýlka. strelca je: Rozptyl a smerodajá odchýlka 2. strelca je: Z vypočítaých hodôt smerodajých odchýlok vdíme, že kým zásahy prvého strelca sa od artmetckého premeru odchyľujú o meej ako v oboch smeroch (leža teda medz 7 a 9), zásahy druhého strelca sa odlšujú od premeru vac ako o 5 (leža medz 3 a 3). Presejše preto streľal. strelec. 4
Úlohy. Určte medá, modus, artmetcký premer, rozptyl, smerodajú odchýlku, varačé rozpäte a varačý koefcet zaku x v štatstckom súbore: 2x 9, 7x 0, 9x, x 5, 5x 7, 6x 9, 3x 2, 0x 25, 9x 29, 4x 32 2. Meraím v laboratóru bol zsteé asledujúce dĺžky súčastky (v mm): {302;30;32;30;33;38;305;309;30;309} Vypočítajte artmetcký, geometrcký premer, modus a medá. 3. Auto šlo prvú polovcu cesty premerou rýchlosťou v = 20 km/hod a druhú polovcu cesty premerou rýchlosťou v 2 = 80 km/hod. Akou premerou rýchlosťou auto šlo? 4. Dvaja poľovíc, poľovík A a poľovík B súťažl v streľbe a terč. Ktorý z ch streľal presejše a súťaž vyhral, ak získal asledujúce zásahy: A = {9;8;8;8;7} a B = {0;0;8;7;5}? 5