M A T E M A T I N Ė S T A T I S T I K A Laboratorinis darbas Nr. 2 Marijus Radavičius, Tomas Rekašius 2005 m. spalio 23 d. Reziumė Antras laboratorinis darbas skirtas išmokti generuoti tikimybinių skirstinių mišinius, braižyti dažnuminę histogramą, apskaičiuoti skaitines imties charakteristikas bei padaryti iš jų išvadas apie imtį. Optimalios kainos uždavinio sprendimas pritaikant tikimybinių skirstinių mišinių modeliavimą. 1
Matematinės statistikos laboratorinis darbas Nr. 2 2 Turinys 1 Studento ID ir užduoties variantų skaičiavimas 3 2 Pirma užduotis 3 2.1 Skirstinių variantai........................... 3 3 Antra užduotis 4 3.1 Skirstinių variantai........................... 4 4 Pastabos 4 5 Atsiskaitymas už darbą 6
Matematinės statistikos laboratorinis darbas Nr. 2 3 1 Studento ID ir užduoties variantų skaičiavimas Studento ID (identifikatorius) yra triženklis skaičius, kurio pirmas skaitmuo yra grupės numeris, o kiti du skaitmenys yra studento numeris grupės sąraše. Pvz., ID = 307 reiškia, kad studentas su šiuo ID yra 7-tas 3-iosios grupės sąraše. Laboratorinių darbų užduotys turės keletą variantų. Jeigu nenurodyta kitaip, studentas, kurio ID = id, iš m galimų variantų pasirenka k-ąjį variantą, kur k = (id 1)(mod m) + 1. MS Excel k randamas pagal formulę MOD(A1 1; B1) + 1. Čia celėje A1 įrašytas id, o celėje B1 įrašytas užduoties variantų skaičius m. Kad neiškiltų nesusipratimų, geriausia būtų, jog kiekvienam studentui jo variantą k pagal grupės sąrašą paskaičiuotų seniūnas. 2 Pirma užduotis Naudojant MS Excel sugeneruoti dviejų nurodytų tikimybinių skirstinių mišinį (imtis iš dviejų komponenčių). Rasti empirinį vidurkį, dispersiją, medianą, kvartilius ir modą, taip pat minimumą ir maksimumą. Nubraižyti dažnuminę histogramą. 2.1 Skirstinių variantai 1. normalinis su parametrais θ 1 ir θ 2, 2. gamma su parametrais θ 1 ir θ 2, 3. χ 2 su parametru θ 1, 4. eksponentinis su parametru θ 1, 5. lognormalinis su parametrais θ 1 ir θ 2, 6. Pareto su parametrais θ 1 ir θ 2. Parametrai θ kiekvienam studentui skaičiuojami pagal jo ID. Pirmos ir antros komponenčių parametrai: pirmasis parametras θ 1,1 := paskutinis ID skaitmuo+1, antrasis parametras θ 1,2 := pirmas ID skaitmuo. pirmasis parametras θ 2,1 := paskutinis ID skaitmuo+5+vidurinis ID skaitmuo, antrasis parametras θ 2,2 := pirmas ID skaitmuo.
Matematinės statistikos laboratorinis darbas Nr. 2 4 Pirmos mišinio komponentės pasirodymo tikimybė p parenkamą pagal varianto numerį k ir lygi p = k 10. 3 Antra užduotis Jūs pardavinejate, pvz., knygas. Pirkėjai skirstomi į dvi kategorijas. Pirmieji, pamatę gerą knygą, gali išleisti trečdalį visų turimų pinigų, o pastarųjų kiekis jų piniginėje pasiskirstęs pagal duotą skirstinį (žr. žemiau) su parametrais θ 1,1 ir θ 1,2. Antrieji niekada neišleidžia daugiau kaip septintadalio turimų pinigų net ir už gerą knygą, o pinigų kiekis jų piniginėje pasiskirstęs pagal tą patį skirstinį tik dabar su parametrais θ 2,1 ir θ 2,2. Antrieji pirkėjai pasitaiko 4 kartus dažniau negu pirmieji. Rasti knygos kainą, maksimizuojančią vidutinį pelną vienam pirkėjui. Nubraižykite grafiką (2 paveikslas), kuriame pavaizduotos gaunamo pelno reikšmės 4-7 kainų variantams artimiems optimaliai kainai. Parametrai θ 1,1, θ 1,2, θ 2,1 ir θ 2,2 parenkami taip pat, kaip ir ankstesnėje užduotyje. 3.1 Skirstinių variantai 1. gamma su parametrais θ 1 ir θ 2, 2. χ 2 su parametru θ 1, 3. beta su parametrais θ 1 ir θ 2, 4. eksponentinis su parametru θ 1, 5. lognormalinis su parametrais θ 1 ir θ 2, 6. Pareto su parametrais θ 1 ir θ 2. 4 Pastabos Pirma užduotis panaši į lab. darbą Nr1. Skirtumas tik toks, kad reikia sugeneruoti ne vieną skirstinį, bet dviejų skirstinių mišinį. Tai reiškia, kad gautoje atsitiktinių dydžių imtyje X bus atsitiktinių dydžių pasiskirsčiusių ir pagal vieną, ir pagal kitą pasiskirstymo dėsnį. Pirmojo skirstinio (pirmos mišinio komponentės) parametrai bus θ 1,1 ir θ 1,2, antrojo skirstinio parametrai (antros mišinio komponentės) θ 2,1 ir θ 2,2. Komponentė į imtį patenka ne bet kaip. Tam yra duota pirmos mišinio komponentės pasirodymo tikimybė p.
Matematinės statistikos laboratorinis darbas Nr. 2 5 Norint MS Excel sugeneruoti atsitiktinį įvykį, kurio tikimybė yra p, reikia laikyti, kad jis įvyko, jei RAND() < p, ir neįvyko priešingu atveju. Pvz., jei p = 0, 3 ir imties tūris n = 100, tai imtyje X bus n 1 30 dydžių pasiskirstę pagal pirmą, o likę n 2 = n n 1 pagal antrą pasiskirstymo dėsnį. Sudarius tikimybinių skirstinių mišinį, visi kiti skaičiavimai ir histogramos braižymas tokie pat kaip lab. darbe Nr.1. Imties tūris ir histogramos stulpelių skaičius parenkamas taip, kad kuo geriau pasimatytų imties struktūrą ir (jei įmanoma) atsiskirtų komponentės (1 paveikslas). 1 pav.: Tikimybinių skirstinių mišinio histogramos pavyzdys Antra užduotis optimalios kainos uždavinys sprendžiamas modeliuojant situaciją. Dvi pirkėjų kategorijos atitinka dvi mišinio komponentes su skirtingais parametrais ir skirtingomis pasirodymo tikimybėmis. Toliau reikia sudaryti modelį, kuris būtų priklausomas nuo kainos, ir kuris atsakytų į klausimą, kas tai yra gaunamas pelnas. 2 pav.: Pelno priklausomybės nuo kainos grafiko pavyzdys
Matematinės statistikos laboratorinis darbas Nr. 2 6 Pelnas gaunamas tada, kai pirkėjas nuperka knygą. Kadangi čia pirkėjų turimą pinigų kiekį atitinka atsitiktiniai dydžiai iš imties, aišku, kad knyga parduodama tada, kai ats. dydis didesnis nei knygos kaina, o pelnas nuo vieno pirkėjo lygus knygos kainai. Tokiu būdu, parinkus konkrečią kainą, galima apskaičiuoti vidutinį pelną prie tokios kainos. Optimalią kainą šiame uždavinyje atitinka didžiausias pelnas. Ją ir reikia rasti. Kai kuriems skirstiniams optimali kaina gali siekti dešimtis tūkstančių ir milijonus. Kaip tą paaiškinti ir kokią ekonominę interpretaciją galima pateikti tokiu atveju? 5 Atsiskaitymas už darbą Darbas ginamas prie kompiuterio. Pirmai užduočiai reikia paskaičiuoti tokias imties charakteristikas: minimumą min, maksimumą max, vidurkį m, medianą x med, modą x mod, dispersiją S 2, kvartilius q 1, q 2, q 3. Reikia mokėti paaiškinti, ką reiškia šitos imties charakteristikos, kaip jos keičiasi didinant arba mažinant pirmos ar antros komponentės dalį mišinyje. Reikia pademonstruoti kaip braižoma empirinė histograma ir suprasti gautą rezultatą. Antra užduotis taip pat ginama prie kompiuterio. Reikia mokėti paaiškinti sudarytą modelį, optimalios kainos prasmę, mokėti interpretuoti gautus rezultatus. Literatūra [1] Kruopis J. Matematinė statistika - Vilnius, Mokslas, 1993. [2] Čekanavičius V., Murauskas G. Statistika ir jos taikymai I - Vilnius, TEV, 2001.