TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ. Zdroje: Kompendium statistického zpracování dat, VPS s r. o.

Σχετικά έγγραφα
Jednotkový koreň (unit root), diferencovanie časového radu, unit root testy

Chí kvadrát test dobrej zhody. Metódy riešenia úloh z pravdepodobnosti a štatistiky

KATEDRA DOPRAVNEJ A MANIPULAČNEJ TECHNIKY Strojnícka fakulta, Žilinská Univerzita

Štatistické riadenie procesov Regulačné diagramy 3-1

1. Limita, spojitost a diferenciálny počet funkcie jednej premennej

Jednotkový koreň (unit root), diferencovanie časového radu, unit root testy

Matematika Funkcia viac premenných, Parciálne derivácie

Ekvačná a kvantifikačná logika

Testy hypotéz o parametroch normálneho rozdelenia.

Základy metodológie vedy I. 9. prednáška

Spojité rozdelenia pravdepodobnosti. Pomôcka k predmetu PaŠ. RNDr. Aleš Kozubík, PhD. 26. marca Domovská stránka. Titulná strana.

Cvičenia zo ŠTATISTIKY v Exceli Kurz IPA-Slovakia, september 2008, VYHNE

Základy matematickej štatistiky

Testy dobrej zhody. H 0 : f(x) = g(x) ; H 1 : f(x) g(x)

Obvod a obsah štvoruholníka

7. FUNKCIE POJEM FUNKCIE

Rozdiely vo vnútornej štruktúre údajov = tvarové charakteristiky

ARMA modely čast 2: moving average modely (MA)

Start. Vstup r. O = 2*π*r S = π*r*r. Vystup O, S. Stop. Start. Vstup P, C V = P*C*1,19. Vystup V. Stop

3. Striedavé prúdy. Sínusoida

Reprezentácia dát. Ing. Martin Mariš, Katedra regionalistiky a rozvoja vidieka, SPU, NITRA

2 Chyby a neistoty merania, zápis výsledku merania

Motivácia Denícia determinantu Výpo et determinantov Determinant sú inu matíc Vyuºitie determinantov. Determinanty. 14. decembra 2010.

Cvičenie č. 4,5 Limita funkcie

ARMA modely čast 2: moving average modely (MA)

Hľadanie, skúmanie a hodnotenie súvislosti medzi znakmi

Príručka ku kurzu SPÔSOBILOSŤ PROCESU

Univerzita Karlova v Praze Matematicko-fyzikální fakulta

Určite vybrané antropometrické parametre vašej skupiny so základným (*úplným) štatistickým vyhodnotením.

Matematika prednáška 4 Postupnosti a rady 4.5 Funkcionálne rady - mocninové rady - Taylorov rad, MacLaurinov rad

HANA LAURINCOVÁ KLASICKÝ VS. NEPARAMETRICKÝ PRÍSTUP Štatistika Poistná matematika

ANALÝZA VÝKONNOSTI CALL CENTRA POMOCÍ STATISTICKÝCH METOD

Goniometrické rovnice a nerovnice. Základné goniometrické rovnice

Motivácia pojmu derivácia

ŠTATISTICKÉ METÓDY VPRAXI

1. písomná práca z matematiky Skupina A

ŠTATISTIKA. Obsah. Predmet štatistiky Popisná štatistika Štatistické charakteristiky jednorozmerných rozdelení.. 17

Ing. Andrej Trnka, PhD. Základné štatistické metódy marketingového výskumu

6 Limita funkcie. 6.1 Myšlienka limity, interval bez bodu

4. domáca úloha. distribučnú funkciu náhodnej premennej X.

Kontrolné otázky na kvíz z jednotiek fyzikálnych veličín. Upozornenie: Umiestnenie správnej a nesprávnych odpovedí sa môže v teste meniť.

UČEBNÉ TEXTY. Pracovný zošit č.2. Moderné vzdelávanie pre vedomostnú spoločnosť Elektrotechnické merania. Ing. Alžbeta Kršňáková

,Zohrievanie vody indukčným varičom bez pokrievky,

Tomáš Madaras Prvočísla

Návrh vzduchotesnosti pre detaily napojení

množiny F G = {t1, t2,, tn} T a pre ľubovoľný valec C so základňou B1, B2,, Bn v bodoch t1, t2,, tn, takou, že pre t G - F je Bt = E, platí PF(C) = PG

Komplexné čísla, Diskrétna Fourierova transformácia 1

Základy práce s ekonometrickým programom GRETL

11 Štatistická prebierka

Názov prednášky: Teória chýb; Osnova prednášky: Základné pojmy Chyby merania Zdroje chýb Rozdelenie chyba merania

Prechod z 2D do 3D. Martin Florek 3. marca 2009

HASLIM112V, HASLIM123V, HASLIM136V HASLIM112Z, HASLIM123Z, HASLIM136Z HASLIM112S, HASLIM123S, HASLIM136S

4. Výrokové funkcie (formy), ich definičný obor a obor pravdivosti

Odporníky. 1. Príklad1. TESLA TR

M6: Model Hydraulický systém dvoch zásobníkov kvapaliny s interakciou

Život vedca krajší od vysnívaného... s prírodou na hladine α R-P-R

Teória pravdepodobnosti

Hypotézy a intervaly spoľahlivosti stručná teória a vzorce

PRIEMER DROTU d = 0,4-6,3 mm

Rozsah hodnotenia a spôsob výpočtu energetickej účinnosti rozvodu tepla

PREHĽAD ÚDAJOV. 1. Početnosť

Moderné vzdelávanie pre vedomostnú spoločnosť Projekt je spolufinancovaný zo zdrojov EÚ M A T E M A T I K A

Modul pružnosti betónu

SLOVENSKO maloobchodný cenník (bez DPH)

Rozsah akreditácie 1/5. Príloha zo dňa k osvedčeniu o akreditácii č. K-003

ÚLOHA Č.8 ODCHÝLKY TVARU A POLOHY MERANIE PRIAMOSTI A KOLMOSTI

Gramatická indukcia a jej využitie

Podnikateľ 90 Mobilný telefón Cena 95 % 50 % 25 %

Základné poznatky molekulovej fyziky a termodynamiky


ZADANIE 1_ ÚLOHA 3_Všeobecná rovinná silová sústava ZADANIE 1 _ ÚLOHA 3

Úvod do testovania hypotéz

Priamkové plochy. Ak každým bodom plochy Φ prechádza aspoň jedna priamka, ktorá (celá) na nej leží potom plocha Φ je priamková. Santiago Calatrava

u R Pasívne prvky R, L, C v obvode striedavého prúdu Činný odpor R Napätie zdroja sa rovná úbytku napätia na činnom odpore.

Obsah. Motivácia a definícia. Metódy výpočtu. Problémy a kritika. Spätné testovanie. Prípadová štúdia využitie v NBS. pre 1 aktívum pre portfólio

Deliteľnosť a znaky deliteľnosti

UČEBNÉ TEXTY. Pracovný zošit č.5. Moderné vzdelávanie pre vedomostnú spoločnosť Elektrotechnické merania. Ing. Alžbeta Kršňáková

Kompilátory. Cvičenie 6: LLVM. Peter Kostolányi. 21. novembra 2017

Zrýchľovanie vesmíru. Zrýchľovanie vesmíru. o výprave na kraj vesmíru a čo tam astronómovia objavili

C. Kontaktný fasádny zatepľovací systém

Metódy vol nej optimalizácie

Numerické metódy Učebný text pre bakalárske štúdium

APPENDICES APPENDIX A. STATISTICAL TABLES AND CHARTS 651 APPENDIX B. BIBLIOGRAPHY 677 APPENDIX C. ANSWERS TO SELECTED EXERCISES 679

Pravdepodobnostné modelovanie inverznými distribučnými funkciami : Kvantilová deskriptívna analýza ako východisko ku kvantilovému modelovaniu

AerobTec Altis Micro

MIDTERM (A) riešenia a bodovanie

Funkcie - základné pojmy

Analýza údajov. W bozóny.

Pevné ložiská. Voľné ložiská

METODICKÁ SMERNICA NA AKREDITÁCIU METHODICAL GUIDELINE FOR ACCREDITATION VYJADROVANIE NEISTÔT MERANIA PRI KALIBRÁCII (EA-4/02)

Harmonizované technické špecifikácie Trieda GP - CS lv EN Pevnosť v tlaku 6 N/mm² EN Prídržnosť

Štatistické spracovanie experimentálnych dát

Úvod do lineárnej algebry. Monika Molnárová Prednášky

ZNAKY. Ordinálne znaky = možno usporiadať, ale nie je podstatná veľkosť rozdielu!

Definícia parciálna derivácia funkcie podľa premennej x. Definícia parciálna derivácia funkcie podľa premennej y. Ak existuje limita.

Obsah. 1.1 Reálne čísla a ich základné vlastnosti Komplexné čísla... 8

Univerzita Karlova v Praze Matematicko-fyzikální fakulta. Viktor Szabados. jednoduchou regresi. Katedra pravděpodobnosti a matematické statistiky

ROZSAH ANALÝZ A POČETNOSŤ ODBEROV VZORIEK PITNEJ VODY

Základy matematickej štatistiky a jej aplikácie použitím programovacích jazykov R a S

Vyhlásenie o parametroch stavebného výrobku StoPox GH 205 S

Transcript:

TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ Zdroje: Kompendium statistického zpracování dat, VPS s r. o.

Témy prednášky ŠTATISTIKA, HYPOTÉZA TESTY ŠTATISTICKÝCH HYPOTÉZ (Testy štatistickej významnosti) t-test (STUDENTOV) F-TEST (FISCHEROV) ANOVA - ANALÝZA ROZPTYLU

Testy štatistických hypotéz sú typickým štatistickým nástrojom na analýzu vybraných súborov a ich údajov. Pomocou nich sa môžu získať objektívne dôkazy, napr.: či výbery pochádzajú z populácie s normálnym rozdelením či proces dosiahol po opatreniach svoj cieľ či došlo k zlepšeniu procesu po realizácii opatrenia a iné µ µ µ µ = µ = µ X X X X X X

Prečo štatistika?

Firma vyrába monočlánky N(X, µ, σ 2 ) µ =? σ 2 =? µ 1 = µ 2? σ 1 2 = σ 22? Počet monočlánkov NORMÁLNE ROZDELENIE Počet monočlánkov X - hodnota závislej charakteristiky (výrobku) 2.6 2.8 3.0 3.2 3.4 3.6 X (U [V]) Priemerná hodnota výberu µ=x n Xi i = = 1 n 2 σ =s 2 = Rozptyl výberu i= 1 ( X X) n i 1 2 Aká je priemerná hodnota a rozptyl napätia všetkých vyrobených monočlánkov? Pochádzajú rôzne výbery z tej istej alebo rôznych populácií? Počet stupňov voľnosti DF (Degrees of Freedom) X

Základné pojmy Označenie: parametre základného súboru: µ, σ 2, σ, N všeobecne G charakteristiky výberového 2 súboru: x, s, s, n Výberový súbor, rozsah n Základný súbor, rozsah N, resp. všeobecne u n 6

Charakteristika Základný súbor Výberový súbor Rozsah N n Stredná hodnota µ x 2 Rozptyl s 2 σ Smerodajná odchýlka σ s

VZORKOVANIE Pretože vzorka odobratá z populácie by mala reprezentovať populáciu, teda rozloženie hodnôt vo vzorke by malo byť podobné ako v populácii, hovoríme, že vzorka musí byť reprezentatívna (representative sample). V štatistike sa za reprezentatívnu vzorku považuje náhodný výber (random sample). Náhodný výber dostaneme takou organizáciou odoberania vzorky, že každý prvok populácie má rovnakú pravdepodobnosť dostať sa do výberu. Náhodný výber je taký výber štatistických jednotiek zo základného súboru, kedy o tom, či bude jednotka zaradená do výberu rozhoduje len náhoda. Náhodný výber je veľmi dobre realizovaný, napríklad ťahaním z osudia.

V priemyselnej praxi je pomerne zložité uskutočniť náhodný výber, preto sa používajú aj iné metódy, aby bola čo najviac zabezpečená reprezentatívnosť vzorky. 1. Náhodné vzorkovanie (random sampling) je založené na predpoklade, že každý prvok populácie má rovnakú pravdepodobnosť dostať sa do výberu. Pokiaľ nemožno priamo napodobniť ťahanie z osudia, používa sa na určenie vybraných prvkov generátor náhodných čísel alebo tabuľka náhodných čísel. 2. Sekvenčné vzorkovanie (sequential sampling) je založené na tom, že je definovaná istá postupnosť náhodných výberov, kde nasledujúci výber sa realizuje / nerealizuje na základe informácií získaných z predchádzajúceho výberu.

3. Stratifikované vzorkovanie (stratified sampling) tento spôsob vzorkovania sa používa, ak hodnoty nie sú rozložené v procese homogénne. Proces sa rozdelí do skupín, v ktorých očakávame podobné vlastnosti. Napríklad zoberieme náhodnú vzorku zvlášť z každej smeny z rôznych strojov a podobne. Pritom musí byť zabezpečené, aby neboli preferované dáta z niektorej skupiny.

Prečo hypotéza?

(Z Wikipédie) Hypotéza alebo domnienka, dohad, predpoklad (z gréckeho hypo - pod, nižšie, znížený + thesis - tvrdenie) je veta, tvrdenie, ktoré vedci formulujú vtedy, keď na danom stupni poznania nevedia vysvetliť určité skupiny javov alebo udalostí a hypotéza sa ich pokúša vysvetliť. Hypotéza je tvrdenie alebo systém tvrdení, o ktorom v čase jeho formulovania nemožno rozhodnúť, či je pravdivé alebo nepravdivé. Tvorenie vedeckých hypotéz nie je náhodný akt. Poznávanie stavia pred vedcov potrebu tvoriť vždy nové hypotézy.

Hypotézou rozumieme aj tvrdenie o rozdelení pozorovanej náhodnej veličiny (napr. o rozdelení náhodného výberu).

Testovanie hypotéz (Z Wikipédie) Testovanie hypotéz alebo aj overovanie hypotéz je proces, v ktorom sa overuje, či hypotéza je pravdivá alebo nie. V spoločenských, ale i v biologických vedách môže byť hypotéza niekedy overená iba s určitou mierou pravdepodobnosti.

Nehovor: Objavil som pravdu!, ale radšej: Objavil som jednu z právd Kahlin Gibran Prorok

Testovanie hypotéz Súd musí rozhodnúť či: Obžalovaný je nevinný alebo Obžalovaný je vinný Obžalovaný zostáva nevinným, pokiaľ súd nemá evidentné dôkazy o jeho vine. PRINCÍP PREZUMPCIE NEVINY Súd nepozná skutočnosť absolútne presne POSTUP SÚDU: 1. Vychádzať z prezumpcie neviny ROZHODNUTIE SÚDU OSLOBODIŤ ODSÚDIŤ NEVINNÝ správne Chyba I. druhu (α) SKUTOČNOSŤ VINNÝ Chyba II. druhu (β) správne 2. Zvoliť prijateľnú úroveň rizika omylu, že odsúdi nevinného (chyba I. druhu) 3. Nájsť správny zákon a interpretovať ho 4.Porovnať dôkazy zo zákonom 5. Ak dôkazy postačujú odsúdiť, ak nie oslobodiť Ak súd neodsúdi obžalovaného to nemusí znamenať, že je nevinný. Súd môže mať iba málo dôkazov(chyba II.druhu)

Testy štatistických hypotéz Parametre základného súboru (populácie) nepoznáme. Môžeme však o nich vysloviť určité predpoklady, ktoré formulujeme ako hypotézy a overujeme štatistickými postupmi - testovanie štatistických hypotéz (TH). Overovať možno nielen predpoklady o parametroch (napríklad strednej hodnote), ale aj o tvare rozdelenia štatistického znaku (napr. testovanie zhody empirického rozdelenia početností s normálnym rozdelením).

Testy štatistických hypotéz Máme rozhodnúť či platí hypotéza: H 0 : Výbery monočlánkov pochádzajú z tej istej populácie alebo H 1 : Výbery monočlánkov nepochádzajú z tej istej populácie H O??? H 1 POSTUP TESTU: 1.Formulovať nulovú (H 0 ) a alternatívnu (H 1 ) hypotézu H 0 : µ 1 = µ 2 H 1 : µ 1 µ 2 2. Zvoliť hladinu významnosti α 3. Nájsť vhodnú testovú charakteristiku (napr. t-test) a vypočítať jej hodnotu 4. Porovnať vypočítanú hodnotu testovej charakteristiky (t) s kritickou hodnotou (t α/2 ) 5. Ak I t I > t α/2 zamietnuť H 0 µ 1 = µ 2 µ 1 µ 2 t α/2 dvojstranný test (H 1 : µ 1 µ 2 ) t jednostranný test (H α 1 : µ 1 >µ 2 alebo µ 1 <µ 2 ) Ak nemôžeme zamietnuť H 0,(a teda ju príjmeme), ešte to nemusí znamenať, že platí. Môžeme mať iba málo dôkazov.

Formulujeme východiskovú - nulovú hypotézu H 0, ktorá vždy tvrdí zhodu toho čo porovnávame - testujeme, napr. hypotézu o zhode stredných hodnôt µ 1 a µ 2, H 0 : µ 1 = µ 2, alebo o zhode sigiem (smerodajná odchýlka, rozptyl -σ 2 ) H 0 : σ 1 = σ 2

Oproti nulovej hypotéze formulujeme alternatívnu hypotézu H 1, H 1 : µ 1 µ 2, obojstranný test (kritická hodnota testovej štatistiky, 2,5% kvantil, je na obidvoch stranách rozdelenia) 0,45 0,40 Studentovo rozdelenie (DF=28) t α/2 dvojstranný test (H 1 : µ 1 µ 2 ) hustota pravdepodobnosti 0,35 0,30 0,25 0,20 0,15 0,10 α/2 t α/2 0,05 0,00-5 -4-3 -2-1 0 1 2 3 4 5 t t t < t α/2 t > t α/2

Dvojstranný test Oblasť prijatia H 0 musíme konštruovať tak, že oblasť zamietnutia H 0 bude (z hľadiska pravdepodobnosti) rovnomerne rozložená zľava aj sprava. Oblasť prijatia H 0 bude zodpovedať pravdepodobnosti 1 α, oblasť zamietnutia zľava bude zodpovedať pravdepodobnosti α/2 a oblasť zamietnutia sprava tiež α/2. Nulovú hypotézu zamietame, ak testová štatistika padne do oblasti zamietnutia vľavo alebo vpravo. Takémuto testu hovoríme dvojstranný test (two-sided test, twotail test).

Alebo H 1 : µ 1 < µ 2 H 1 : µ 1 > µ 2 jednostranné testy (kritická hodnota testovej štatistiky, 5% kvantil, je len na jednej strane rozdelenia) 0,90 0,80 Fisherovo rozdelenie (DF1=17, DF2=8) t α jednostranný test (H 1 : µ 1 >µ 2 alebo µ 1 <µ 2 ) hustota pravdepodobnosti 0,70 0,60 0,50 0,40 α 0,30 0,20 F α 0,10 0,00 0 1 2 3 4 5 6 F F

Jednostranný test Oblasť prijatia H 0 musíme konštruovať tak, že oblasť zamietnutia H 0 bude (z hľadiska pravdepodobnosti) rozložená len z jednej strany a bude zodpovedať pravdepodobnosti α. Takémuto testu hovoríme jednostranný test (one-sided test, one-tail test).

Nulová a alternatívna hypotéza sa musia vzájomne vylučovať!!!!

Za predpokladu, že platí nulová hypotéza H 0, rovná sa parameter populácie µ predpokladanej veličine vzorky µ 0 µ=µ 0 Keďže est. µ = u n, kde u n je výberová charakteristika (priemer,rozptyl), potom rozdiel = u n - µ 0 je iba náhodnou chybou, spôsobenou náhodným výberom. Ak však H 0 neplatí, t.j. µ µ 0, potom sa rozdiel môže skladať z náhodnej chyby aj systematickej chyby, ktorá odráža skutočný rozdiel medzi parametrom základného súboru µ a jeho predpokladanou veľkosťou µ 0 = u n - µ 0 = (u n - µ) + (µ - µ 0 ) Náhodná chyba Systematická chyba - rozdiel

SKUTOČNOSŤ Pri testovaní štatistickej hypotézy môže dôjsť k dvom NEVINNÝ VINNÝ typom chýb: Chyba II. OSLOBODIŤ správne Chyba I. druhu: keď sa zamietne druhu (β) pravdivá H 0 hypotéza. Chyba I. Chyba ODSÚDIŤ II. druhu: keď sa správne nezamietne nepravdivá H druhu (α) 0 hypotéza. ROZHODNUTIE SÚDU ROZHODNUTIE SKUTOČNOSŤ H 0 Nezamietnutá H 0 Zamietnutá H 0 Pravdivá Správne p=1-α (spoľahlivosť) Chyba I. druhu p=α H 0 Nepravdivá Chyba II. druhu p=β správne p=1-β (sila testu)

Chyba prvého druhu α chyba druhého druhu β 1 - α pravdepodobnosť prijatia správnej hypotézy 1 - β sila testu f(h 0 ) f(h 1 ) 1 - α 1 - β β= P(H 0 /H 1 ) α = P(H 1 /H 0 ) β-pravdepodobnosť prijatia H 0 keď platí H 1 α -pravdepodobnosť prijatia H 1 keď platí H 0

α je hladina významnosti (significance level) Hovoríme jej aj úroveň rizika v rozhodovaní o zamietnutí pravdivej H 0 štatistickej hypotézy. Je žiadúce, aby test mal nízku hladinu významnosti. Obvyklé hodnoty pre hladinu α bývajú 0,05, 0,01, 0,001. Testom na hladine významnosti α (αtestom), α (0,1), rozumieme test, pri ktorom pravdepodobnosť chyby 1. druhu neprekračuje hodnotu α. hustota pravdepodobnosti Fisherovo rozdelenie (DF1=17, DF2=8) 0,90 0,80 0,70 0,60 0,50 p 0,40 α 0,30 0,20 F α 0,10 0,00 0 1 2 3 4 5 6 F F

p -pravdepodobnostná úroveň (probability level) p - je pravdepodobnosť s akou testovacia štatistika nadobúda hodnôt horších ako je počítaná hodnota štatistiky nastania danej situácie. p - hodnota je výstupom počítačových programov na testovanie hypotéz. Fisherovo rozdelenie (DF1=17, DF2=8) Udáva medznú hladinu významnosti α, na ktorej by sme hypotézu H 0 ešte zamietali H 0 zamietame ak p<α, H 0 nezamietame ak p α hustota pravdepodobnosti 0,90 0,80 0,70 0,60 0,50 0,40 p α 0,30 0,20 0,10 F α 0,00 0 1 2 3 4 5 6 F F

ŠTATISTICKÁ VÝZNAMNOSŤ - SIGNIFIKANTNOSŤ Pre správnu interpretáciu treba zdôrazniť, že : Nezamietnutie (prijatie) nulovej hypotézy ešte neznamená, že je správna. Je to len výrok, opierajúci sa o informácie získané výberovým šetrením a tieto informácie v danom prípade nám nedovolili nulovú hypotézu zamietnuť. Inými slovami: Správny výrok by mal znieť: "Nepodarilo sa dokázať (za daných podmienok), že rozdiel je štatisticky signifikantný". Je to tým, že ak by sme napríklad zväčšili početnosť výberu, tak nový test by mohol ukázať, že rozdiel je (!!) štatisticky signifikantný. Opačne to neplatí, ak už potvrdíme signifikantnosť, tak zväčšenie počtu prvkov vo výbere nevedie k opačnému výsledku.

t-test (rovnosť stredných hodnôt) Máme dva meracie prístroje. Merajú rovnako? meranie (n) prístroj A prístroj B 1 15,7 15,6 2 14,9 15,2 3 14,5 16,0 4 14,5 15,7 5 14,8 15,0 6 14,9 15,5 7 15,1 15,2 8 14,7 16,2 9 15,0 15,6 10 15,0 15,4 11 14,6 16,1 12 15,3 15,1 13 15,8 15,5 14 14,6 15,4 15 15,5 15,1 priemer 14,993 15,507 X A X B Testová charakteristika: t = = -3,555 2 2 1 1 ( n1 1) s1 + ( n2 1) s2 s p + sp = n n DF = n 1 + n 2-2 n 1 + n t 1-α/2 = f(α/ α/2, DF) hustota pravdepodobnosti 2 0,45 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 2 Studentovo rozdelenie (DF=28) α/2 A B t 1-α/2 (0,025, 28)=2,048 p t α/2 Musíme sa rozhodnúť, či zamietnuť nulovú hypotézu: H 0 : µ A = µ B a tým prijať hypotézu alternatívnu: H 1 : µ A µ B α = 0,05 ROZHODNUTIE: Zamietneme H 0? 0,00-5 -4-3 -2-1 0 1 2 3 4 5 t Ak ItI>t c : ÁNO. Pravdepodobnosť, že sa mýlime je menšia ako 5% (p<0,05) Ak ItI<t c : NIE. Pravdepodobnosť, že sa mýlime, ak by sme zamietli, by bola väčšia ako 5% (p>0,05) t

F-test (rovnosť rozptylov) Na stroji B sme použili iný typ nástroja. Zmenšil sa rozptyl? výrobok (n) stroj A stroj B 1 14,5 14,8 2 14,5 14,8 3 14,9 14,4 4 14,7 15,9 5 14,8 15,5 6 15,2 15,1 7 13,5 13,6 8 14,3 14,9 9 13,9 14,3 10 15,4 11 13,3 12 15,1 13 16,2 14 15,6 15 14,6 16 16,6 17 14,3 18 15,9 smer. odch. 0,878 0,675 Máme rozhodnúť, či zamietnuť nulovú hypotézu: H 0 : σ A < σ B a tým prijať hypotézu alternatívnu: H 1 : σ A > σ B α = 0,05 DF 1 = n 1-1 DF 2 = n 2-1 s 2 A Testová charakteristika: F = = 2,512 s 2 B hustota pravdepodobnosti ROZHODNUTIE: Zamietneme H 0? F α = f(α, DF 1, DF 2 ) F α (0,05,17,8) = 3,187 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 Fisherovo rozdelenie (DF1=17, DF2=8) p 0,00 0 1 2 3 4 5 6 AK F>F α F F F α α : ÁNO. Pravdepodobnosť, že sa mýlime je menšia ako 5% (p<0,05) AK F<F α : NIE. Pravdepodobnosť, že sa mýlime, ak by sme zamietli, by bola väčšia ako 5% (p>0,05)

Sir Ronald Aylmer Fisher * : 17 Feb 1890 in London, England + : 29 July 1962 in Adelaide, Australia Cambridge ukončil: 1909

Musíme rozhodnúť, či zamietnuť nulovú hypotézu: H 0 : µ 1 = µ 2 = µ 3 = µ 4 ANOVA (analýza rozptylu) Máme štyri stroje. Pracujú rovnako? výrobok (n) stroj 1 stroj 2 stroj 3 stroj 4 1 14,5 15,1 15,7 16,5 2 16,8 14,6 14,7 15,3 3 16,8 14,8 16,7 14,7 4 16,0 15,4 14,4 13,5 5 14,8 16,2 14,4 13,8 6 14,8 15,6 15,4 13,6 7 14,7 14,4 14,5 15,2 8 15,4 14,8 14,6 14,4 9 16,7 13,6 13,8 15,5 10 14,0 13,7 14,2 13,9 11 13,7 15,5 15,3 14,3 12 15,7 16,6 14,8 14,9 13 15,3 16,8 14,5 14,0 14 14,6 13,5 14,5 14,2 15 15,0 15,1 15,5 13,4 priemer 15,25 15,05 14,87 14,48 stroj (N) Testová charakteristika: F = = 1,97 µ µ µ µ = µ = µ F α = f(α, DF 1, DF 2 ) F α (0,05;3;56) = 2,77 DF 1 = N - 1 DF 2 = N(n 1) ns 2 X ANOVA (ANalysis 2 1 2 s = (Xi X) X Of VAriance) je metóda testovania hypotézy i2 X 2) o +... 2 rovnosti stredných hodnôt, ale rozhodnutie s o (ne-)zamietnutí sa robí na p základe Nanalýzy 1 rozptylu (stredných hodnôt a združeného rozptylu) s 2 p 2 (Xi1 X 1) + (X = N(n 1) ANOVA Zdroj variability SS DF MS F Hodnota P F krit medzi výbermi 4,849833 3 1,616611 1,970104 0,128921 2,769433 vo výberoch 45,952 56 0,820571 spolu 50,80183 59 2 a tým prijať hypotézu alternatívnu: H 1 : µ 1 µ 2 µ 3 µ 4 α = 0,05 alebo aj X X X ROZHODNUTIE: Zamietneme H 0? H 1 : µ 1 µ 2 = µ 3 = µ 4 X X X AK F>F α : ÁNO. Pravdepodobnosť, že sa mýlime je menšia ako 5% (p<0,05) AK F<F α : NIE. Pravdepodobnosť, že sa mýlime, ak by sme zamietli, by bola väčšia ako 5% (p>0,05)

Chi-kvadrát test dobrej zhody Pearsonov Chi-kvadrát test dobrej zhody vychádza z frekvenčnej tabuľky a testuje nulovú štatistickú hypotézu, ktorá tvrdí, že početnosti v jednotlivých kategóriách sa rovnajú očakávaným (teoretickým) početnostiam.

APLIKÁCIA TŠH NA SPC- REGULAČNÉ DIAGRAMY Podobnosť: Prezumpcia neviny-súd! Proces je nevinný (H 0 ), pokiaľ mu nedokážem, že je vinný(h 1 ) -TŠH 1. H 0 : s 1 = s 2 alebo H 0 : µ 1 = µ 2 2. H 1 : s 1 s 2 alebo H 1 : µ 1 µ 2 1. Proces nevinný-len pod vplyvom náhodných chýb, netreba zasiahnúť 2.Proces vinný- vplyv zvláštnych chýb, treba zasiahnúť Chyby: (α) - Zasiahneš a nemal by si! (Zamietneš pravdivú H 0 ) (β) - Nezasiahneš a mal by si! (Nezamietneš nepravdivú H 0 )