M A T E M A T I N Ė S T A T I S T I K A Įvadas į laboratorinius darbus Marijus Radavičius, Tomas Rekašius 2005 m. rugsėjo 26 d. Reziumė Laboratorinis darbas skirtas susipažinti su MS Excel priemonėmis elementariai duomenų analizei aprašomąjai statistikai: atsitiktinių dydžių generavimas, histogramos braižymas, skaitinių charakteristikų skaičiavimas. Pagrindinis dėmesys skiriamas darbo su programa įgūdžiams lavinti. 1
Įvadas į matematinės statistikos laboratorinius darbus 2 Turinys 1 Užduotis 3 2 Atsitiktinių dydžių generavimas 3 2.1 Tolygaus intervale atsitiktinio dydžio generavimas......... 5 2.2 Normalinio atsitiktinio dydžio generavimas............. 5 3 Skaitinių charakteristikų skaičiavimas 6 4 Dažnių lentelės 7 4.1 Funkcija COUNTIF........................... 8 4.2 Funkcija SUMPRODUCT........................ 8 4.3 Funkcija FREQUENCY......................... 9 5 Histogramos braižymas 10 6 Programų automatizavimas 13 6.1 Vardų suteikimas masyvams...................... 13 6.2 Sąlygų tikrinimas............................ 15 6.2.1 Sąlyginis formatavimas.................... 15 6.3 Kitos naudingos formulės....................... 16
Įvadas į matematinės statistikos laboratorinius darbus 3 1 Užduotis Naudojant MS Excel funkcijas išmokti sugeneruoti atsitiktinių dydžių imtį. Sudaryti jos teorinę ir dažnuminę histogramą. Apskaičiuoti skaitines imties charakteristikas: minimumą ir maksimumą, empirinius vidurkį, dispersiją, medianą, kvartilius ir modą. Didžiausias dėmesys turėtų būti skiriamas darbo su MS Excel technikai ir laboratorinių darbų atlikimo principams įsisavinti. 2 Atsitiktinių dydžių generavimas Excel atsitiktiniams dydžiams generuoti turi tam skirtą priemonę Random Number Generation (1 paveikslas). Ji pasiekiama per meniu Tools/Data Analysis.../Random Number Generation. Nurodžius reikiamą atsitiktinių dydžių skaičių, skirstinio tipą (Distribution), jo parametrus ir sritį, į kurią bus išvedami sugeneruoti skaičiai (Output Range), gaunama atsitiktinė imtis. 1 pav.: Atsitiktinių dydžių generavimas Tačiau šis būdas nėra labai patogus. Visų pirma, skirstinių pasirinkimas labai mažas, kai kurių svarbių skirstinių laukelyje Distribution iš viso nėra. Antras svarbus trūkumas sugeneruojama imtis yra pasyvi, negalima stebėti kaip ji keičiasi. Laboratoriniuose darbuose atsitiktiniai dydžiai (toliau bus kalbama tik apie tolydžius ats. dydžius) bus generuojami kitokiu būdu. Tam pasinaudosime pasiskirstymo funkcijos atvirkštine.
Įvadas į matematinės statistikos laboratorinius darbus 4 Sintaksė: INV (p; θ 1 ; θ 2 ;...). Čia p tikimybė, θ 1, θ 2,... pasiskirstymo funkcijos parametrai. 2 pav.: Statistinės funkcijos, meniu Insert/Function... Visas šias funkcijas galima pasiekti per meniu Insert/Function... (2 paveikslas). Kalbant griežtai, funkcijos IN V negeneruoja atsitiktinių dydžių. Jos yra kažkokio pasiskirstymo funkcijos F (x) atvirkštinė F 1 (p), o jų rezultatas yra p- ojo lygio kvantilis x p. Tolydaus atsitiktinio dydžio X su pasiskirstymo funkcija yra F (x) p-ojo lygio kvantiliu vadinsime tokį skaičių x p, kad P (X x p ) = p. Tai reiškia, kad x p yra toks skaičius, už kurį ne didesnes reikšmes atsitiktinis dydis X įgyja su tikimybe p, arba kitaip tikimybė ats. dydžiui X pakliūti į intervalą (, x p ] lygi p. Žinoma, kad jei tikimybės p bus tolygiai pasiskirsčiusios intervale [0, 1), tai dydžiai x p bus pasiskirstę pagal funkciją F (x). Šituo faktu ir pasinaudojama generuojant įvairias pasiskirstymo funkcijas turinčius ats. dydžius. Sintaksė: INV (RAND(); θ 1 ; θ 2 ;...). Žvaigždutės funkcijos pradžioje ir parametrai θ pakeičiami pagal konkrečią pasiskirstymo funkciją. Pavyzdžiui: normaliam NORMINV (RAND(); m; σ), lognormaliniam LOGINV (RAND(); m; σ), χ 2 (chi-kvadrat) CHIINV (RAND(); n), beta BET AINV (RAND(); α; β).
Įvadas į matematinės statistikos laboratorinius darbus 5 Kai kurių skirstinių funkcijų ar jų atvirkštinių Excel iš viso neturi. Pvz., Pareto, eksponentinio ir kai kurių kitų retesnių. Tokiems skirstiniams atvirkštinę funkciją reikia sudaryti patiems arba pasinaudoti tuo faktu, kai vienas skirstinys yra kito skirstinio atskiras atvejis. Pvz., eksponentinis ir χ 2 yra gama skirstinio atskiri atvejai, belieka tinkamai parinkti parametrus. 2.1 Tolygaus intervale atsitiktinio dydžio generavimas MS Excel tolygiai pasiskirsčiusių atsitiktinių dydžių generavimui naudojama funkcija RAND. Sintaksė: RAN D(). Kaip matote, ši funkcija neturi jokių argumentų. Jos rezultatas vienas atsitiktinis dydis x iš intervalo [0, 1). Kiekvieną kartą perskaičiuojant puslapį (sheet), generuojamas naujas atsitiktinis dydis. Perskaičiuoti puslapį, o tuo pačiu ir generuoti naują ats. dydį galima ir dirbtinai. Pvz., tuščioje Excel celėje paspaudus klavišą Delete arba F9. Gali būti tokia situacija, kad nuolatinis atsitiktinių dydžių perskaičiavimas yra nepageidaujamas ir reikia gauti tik vieną konkretų ats. dytį ar imtį. Vienas variantas tai padaryti funkciją RAN D paversti į nebesikeičiantį atsitiktinį dydį. Tam reikia formulės įvedimo laukelyje (į jį greitai patenkama paspaudus klavišą F2) paspausti klavišą F9. Tas pats galioja ir kitų ats. dydžius generuojančių funkcijų atveju. Kada atsitiktinių dydžių yra daug, labiau tinka kitas variantas pasižymėti imtį ir perkopijuoti ją į kitą puslapio vietą ar kitą puslapį ne kaip funkcijas, bet vien tik jų reikšmes (Copy/Paste Special.../Values). Norint generuoti atsitiktinius dydžius tolygiai pasiskirsčiusius intervale [0, b), funkciją reikia perrašyti. Sintaksė: RAND() b. Klausimas, kaip generuoti atsitiktinį dydį tolygiai pasiskirsčiusį intervale [a, b)? 2.2 Normalinio atsitiktinio dydžio generavimas MS Excel normalini pasiskirstymą turinčių atsitiktinių dydžių generavimui naudojama funkcija N ORM IN V. Sintaksė: NORMINV (p; m; σ). Čia p tikimybė, m vidurkis, σ standartinis nuokrypis.
Įvadas į matematinės statistikos laboratorinius darbus 6 Kaip jau buvo rašyta anksčiau, funkcija N ORM IN V negeneruoja normalinio atsitiktinio dydžio, o yra normalinio pasiskirstymo funkcijos F (x) atvirkštinė F 1 (p) ir jos rezultatas yra p-ojo lygio kvantilis x p. Kad būtų galima pritaikyti normaliųjų atsitiktinių dydžių generavimui, šią funkciją reikia perrašyti taip, kad tikimybė p būtų tolygiai pasiskirsčiusi intervale [0, 1), todėl vietoj jos įrašome funkciją RAND. Sintaksė: NORMINV (RAND(); m; σ). Taip perrašyta funkcija bus pritaikyta normalinį pasiskirstymą turinčių atsitiktinių dydžių generavimui. 3 Skaitinių charakteristikų skaičiavimas Vidurkį, dispersiją, modą, medianą ir kitas imties charakteristikas MS Excel galima suskaičiuoti keliais būdais. Vienas iš jų žinoti, kaip skaičiuoti vieną ar kitą charakteristiką, t.y. žinoti jos formulę. Pvz., empirinis vidurkis randamas iš formulės m = 1 n x i. n Jam paskaičiuoti reikia žinoti imties dydį n ir ats. dydžių x i sumą. Jei n nėra tiksliai žinomas, imties elementų skaičių galima rasti su funkcija COUNT, o jų sumą skaičiuoja funkcija SU M. Imtį srityje A1:A100 pavadinkime duomenys. Empirinis vidurkis skaičiuojamas kaip šių dviejų funkcijų santykis: i=1 SUM(duomenys)/COUNT (duomenys). Kitas skaičiavimo būdas pasinaudoti tam skirtomis funkcijomis. Dažniausiai bus naudojamos šios funkcijos: vidurkis AV ERAGE, mediana MEDIAN, mode MODE, dispersija V AR, kvartiliai QU ART ILE. Visų šitų funkcijų sintaksė panaši, paprastai reikia nurodyti tik duomenis. Sintaksė: AV ERAGE(duomenys).
Įvadas į matematinės statistikos laboratorinius darbus 7 Kaip ir kitas, statistines funkcijas galima pasiekti per meniu Insert/Function... (2 paveikslas). Prieš naudojant bet kokią funkciją, visada pravartu paskaityti apie jos naudojimą, parametrus, nekorektiško naudojimo situacijas ir pan. Tai padeda išvengti klaidų ir neapibrėžtų situacijų. Kai kurios funkcijos turi kelias modifikacijas. Pvz., ir V AR, ir V ARP skaičiuoja dispersiją, tačiau viena iš jų skaičiuoja pataisytą dispersiją. Dėl to reikia žinoti kuom tokios funkcijos skiriasi ir kokiose situacijose jos naudojamos. 4 Dažnių lentelės Aprašomoji statistika skirta greitai duomenų analizei, jų atvaizdavimui ir dėsningumų juose išryškinimui. Kai turime didelę atsitiktinių dydžių imtį, dažniausiai ją sunku aprėpti ir tuo labiau interpretuoti. Kintamojo X reikšmės dažnis f i parodo, kaip dažnai šita reikšmė sutinkama imtyje. Aišku, kad visų dažnių f i suma lygi stebėjimų skaičiui n: n f i = n. i=1 Jei kintamasis X įgyja nedaug skirtingų reikšmų, jų dažnius galima surašyti į lentelę. Tačiau kada atsitiktinis dydis yra tolydus, tokių reikšmių yra labai daug ir, kad lentelė būtų informatyvi, duomenis tenka grupuoti į intervalus. Tam reikia pasirinkti intervalų skaičių, paskaičiuoti jų plotį ir rasti intervalų padalijimo taškus. Paprastai intervalų (arba histogramos stulpelių) skaičius k parenkamas nuo 8 iki 20. Šitas skaičius k priklauso ir nuo imties tūrio n. Kartais, kai skirstinys yra pakankamai simetriškas, intervalų skaičių galima parinkti pagal formulę k = 1 + 3, 222 log 10 n. Jei intervalų bus per mažai, histograma bus neinformatyvi, jei jų per daug - imties atsitiktinumai labai įtakos historamos formą. Apskritai, reikia stengtis parinkti tokį intervalų (stulpelių) skaičių, kad gauta histograma kiek galima geriau atvaizduotų tankio funkcijos formą. Intervalų pločiai turi būti visi vienodi, jie negali persikirsti (3 paveikslas). 3 pav.: Imties skaidymas į intervalus Visus turimus duomenis reikia suskirstyti į intervalus ir suskaičiuoti, kiek stebėjimų pakliuvo į kiekvieną intervalą. Gautas skaičius ir yra intervalo (c i 1, c i ] dažnis f i, o braižant histogramą stulpelio aukštis. Aišku, kad grupuojant dingsta
Įvadas į matematinės statistikos laboratorinius darbus 8 informacija apie konkretų stebėjimą, todėl į intervalą (c i 1, c i ] patekusius skaičius apibūdina to intervalo vidurys (c i 1 + c i )/2. Taip pat reikia stengtis, kad mažiausia ir didžiausia imties reikšmės (3 paveiksle jos pažymėtos min ir max) būtų atitinkamai pirmo ir paskutinio intervalų viduje, o ne ant jų krašto, todėl į lygias dalis dalinamas šiek tiek platesnis intervalas nei tarp imties minimumo ir maksimumo. Suprantama, kad net nedidelės imties elementus jau pakankamai sunku sugrupuoti į intervalus. MS Excel turi keletą funkcijų, kurios gali iš dalies automatizuoti šią užduotį. Ne visos jos yra skirtos būtent imties elementų dažniams skaičiuoti, tačiau kartais pavyksta pritaikyti tokiam uždaviniui spręsti. 4.1 Funkcija COUNTIF Kadangi skaičiavimas, kiek imties elementų patenką į intervalą yra skaičiavimas su sąlygos tikrinimu, tam tikslui galima naudoti funkciją COUNT IF. Sintaksė: COU N T IF (duomenys; salyga). Čia duomenys yra imtis, o salyga yra loginis reiškinys. Ją galima užrašyti keliais būdais. Pavyzdžiui, norint suskaičiuoti, kiek imties elementų yra mažesni už 12, funkciją su tokia sąlyga galima užrašyti COUNT IF (duomenys; "<12") arba COUNT IF (duomenys; "<"&B1), jei skaičius 12 būtų įrašytas celėje B1. Nors antrasis būdas yra lankstesnis ir universalesnis, tačiau taip negalima sukonstruoti sąlygos c i 1 < x c i, t.y. tokios, kad būtų galima iš karto patikrinti ar imties elementas x patenka į intervalą (c i 1, c i ]. Tenka iš pradžių suskaičiuoti, kiek elementų yra mažiau už c i, tada kiek mažiau už c i 1 ir suskaičiuoti gautų dažnių skirtumą: COUNT IF (duomenys; c i ) COUNT IF (duomenys; c i 1 ). Tokią funkciją tektų pakartoti kiekvieno intervalo dažniui rasti. 4.2 Funkcija SUMPRODUCT Kitas būdas skaičiuoti dažnius imties padalijimo intervaluose tam pritaikyti funkciją SU M P RODU CT. Tikroji jos paskirtis yra panariui sudauginti dviejų ar daugiau masyvų elementus ir susumuoti gautas sandaugas. Sintaksė: SUMP RODUCT (duomenys1; duomenys2;...). Čia duomenys1, duomenys2 ir t.t. yra duomenų masyvai.
Įvadas į matematinės statistikos laboratorinius darbus 9 Loginę sąlygą galima tikrinti ne tik vienam skaičiui, bet ir visai imčiai iš karto. Gaunamas binarinis masyvas. Kiekvienas jo elementas prilyginamas 0, jei sąlyga netenkinama ir 1 jei sąlyga tenkinama. Taip sudaromi masyvai duomenys1, duomenys2 ir t.t.. Kada atitinkami elementai masyvuose yra lygus 1, kas reiškia, kad tas elementas tenkina visas sąlygas, jų sandauga taip pat lygi 1, o tokių sandaugų suma duos skaičių atvejų, kada buvo išpildytos sąlygos dažnį. Tuom pasinaudojus tikrinama ar skaičius patenka į intervalą (4 paveikslas). Sintaksė: SUMP RODUCT ((duomenys > c i 1 ) (duomenys <= c i )). 4 pav.: Funkcijos SUMPRODUCT pritaikymas dažniams intervale skaičiuoti Kaip ir funkcijos COU N T IF atveju, kiekvienam intervalui dažnis skaičiuojamas atskirai. 4.3 Funkcija FREQUENCY Šita funkcija yra specialiai skirta dažnių skaičiavimui. Nurodžius imties padalinimo taškus c i, i = 1,..., k, dažniai f i intervaluose suskaičiuojami visi iš karto. Sintaksė: F REQU EN CY (duomenys; taskai). Čia duomenys yra imtis, o taskai yra imties sudalinimo į intervalus taškai. Funkcija F REQUENCY skiriasi nuo visų prieš tai aprašytų funkcijų jos rezultatas yra ne vienas skaičius, bet visas vektorius. Dėl tos priežasties jos naudojimas turi keletą ypatumų. Prieš rašant šią funkciją reikia pasižymėti tiek celių, kiek jų reikės rezultatui išvesti. Pvz., jei yra 9 padalinimo taškų, vadinasi iš viso yra 10 intervalų ir tiek pat reikės celių rezultatui išvesti (5 paveikslas). Tokios vektorinės funkcijos įvedamos klavišų Ctrl+Shift+Enter kombinacija. 3 paveiksle matyti, kad intervalų galai sunumeruoti nuo 0 iki k.
Įvadas į matematinės statistikos laboratorinius darbus 10 Funkcijai F REQUENCY padalinimo taškų aibė taskai nurodoma be pirmo c 0 ir paskutinio c k taško, nes intervale (, c 0 ] dažnis visada bus lygus vienetui (į jį pateks tik vienas minimumo taškas), o intervale (c k, ) nuliui (nes už maksimumą daugiau nėra). 5 pav.: Funkcijos FREQUENCY panaudojimas dažniams skaičiuoti 5 Histogramos braižymas Panašiai kaip atsitiktinių dydžių generavimui, dažniams skaičiuoti ir histogramai braižyti Excel taip pat turi tam tikras standartines priemones. Jos pasiekiamos per meniu Tools/Data Analysis.../Histogram (6 paveikslas). 6 pav.: Standartinė Excel histogramų braižymo priemonė Iš tikro šitas įrankis tik sudaro dažnių lentelę, o pačią histogramą reikia braižyti atskirai. Yra ir kitų svarbių trūkumų kaip ir ats. skaičių generatoriaus at-
Įvadas į matematinės statistikos laboratorinius darbus 11 veju, dažnių lentelė yra pasyvi, todėl kiekvieną kartą keičiant imtį, histogramą tektų perdaryti iš naujo. Dėl tos priežasties dažnių lentelę geriausia sudarinėti funkcijų F REQUENCY ar SUMP RODUCT pagalba. Kaip buvo minėta anksčiau, visus skaičius, patenkančius į intervalą (c i 1, c i ), atstovauja to intervalo vidurys x i. Prieš braižant histrogramą kiekvienam dažniui f i reikia surasti atitinkamo intervalo vidurį tašką x i (7 paveikslas). Turint šiuos duomenis jau galima nubraižyti histogramą. Pavadinkime dažnius f i dazniai, o vidurinius intervalų taškus x i vid_taskai. 7 pav.: Duomenys histogramai dažniai ir viduriniai intervalų taškai Grafikų braižymų skirtas Chart Wizard pasiekiamas per meniu Insert/Chart.... Histogramai braižyti iš pradžių parenkamas stulpelinės diagramos tipas (Chart type Column), sekantis žingsnis duomenų pateikimas. Laukelyje Values nurodomas histogramos stulpelių aukštis anksčiau suskaičiuoti dažniai, o laukelyje Category (X) axis labels reikšmės ant X ašies viduriniai intervalų taškai (8 paveikslas). Galima nurodyti adresus, tačiau patogiau (ypač kai masyvai yra besikeičiančio dydžio) nurodyti masyvų pavadinimus. Sintaksė: Lapas!vardas. Čia Lapas yra Excel lapo pavadinimas, standartiškai Sheet1, o vardas yra masyvo pavadinimas. Šiuo atveju pavadinimai bus Sheet1!dazniai ir Sheet1!vid_taskai. Per kitus žingsius duodami pavadinimai ašims, pačiai histogramai ir nustatomi kiti panašūs dalykai (Chart options). Tokiu būdų gauname dažnuminę (empirinę) imties histogramą. Paspaudus klavišą F9 galima stebėti kaip ji keičiasi. Kadangi atsitiktinių dydžių pasiskirstymo dėsnis išlieka tas pats, o imtis yra atsitiktinė, tai ir histogramos kas kartą braižomos nors ir panašios, tačiau skirtingos.
Įvadas į matematinės statistikos laboratorinius darbus 12 8 pav.: Duomenų histogramai pateikimas MS Excel priemonėmis galima nubraižyti ir teorinę histogramą. Tokios histogramos stulpelio aukštis f i yra proporcingas teorinei atsitiktinio dydžio tikimybei p i patektį į intervalą (c i 1, c i ]. Tiesiogiai gauti tokią tikimybę funkcijos nėra, tačiau tam tačiau galima pritaikyti tikimybių pasiskirstymo funkcijas. Sintaksė: DIST (x; θ 1 ; θ 2 ;... ; d). Čia x skaičius, θ 1, θ 2,... pasiskirstymo funkcijos parametrai, d loginis kintamasis, jei jis lygus 1, grąžinama tikimymių pasiskirstymo funkcijos reikšmė, jei 0 tankio funkcijos reikšmė. Žvaigždutės funkcijos pradžioje ir parametrai θ pakeičiami pagal konkrečią pasiskirstymo funkciją. Pavyzdžiui: normaliam NORMDIST (x; m; σ; 1), lognormaliniam LOGN ORM DIST (x; m; σ; 1), χ 2 (chi-kvadrat) CHIDIST (x; n; 1), beta BET ADIST (x; α; β; 1).
Įvadas į matematinės statistikos laboratorinius darbus 13 Visas jas galima pasiekti per meniu Insert/Function... (2 paveikslas). Tokių funkcijų rezultas yra tikimybė p(x) = P (X x), t.y. tikimybė atsitiktiniam dydžiui X pakliūti į intervalą (, x]. Tikimybių p(c i ) ir p(c i 1 ) skirtumas duos tikimybę pakliūti į intervalą (c i 1, c i ]. Normalinio skirstinio atveju gauname NORMDIST (c i ; m; σ; 1) NORMDIST (c i 1 ; m; σ; 1). Dažnuminėje histogramoje i-tojo stulpelio aukštis lygus dažniui f i, o kaip turint teorinę tikimybę pakliūti į intervalą (c i 1, c i ] gauti teorinį dažnį? 6 Programų automatizavimas Darant laboratorinius darbus reikia stengtis, kad jie būtų kuo labiau automatizuoti, pvz.: būtų galima laisvai keisti pasiskirstymo funkcijos parametrus, imties tūrį, histogramos stulpelių skaičių ir panašius dalykus. Dėl to į formules vietoj konkrečių kintamųjų reikšmių geriau rašyti celių, kuriuose yra tų kintamųjų ar funkcijų parametrų reikšmės, adresus. Pvz., ne NORMINV (RAND(); 0; 1), bet NORMINV (RAND(); $B$1; $B$2). Čia celėje B1 įrašyta reikšmė 0, o celėje B2 reikšmė 1. Norint greitai pakeisti funkcijos parametrus, užteks pakeisti tik celių B1 ir B2 reikšmes ir nereiks perrašinėti visų funkcijų (o jų gali būti labai daug, priklausomai nuo to, kiek atsitiktinių dydžių generuosite). 6.1 Vardų suteikimas masyvams Daugeliui statistinių funkcijų vienas iš parametrų yra duomenys; tai gali būti pvz. atsitiktinė imtis ar kažkurios kitos funkcijos rezultatai. Excel funkcijoms duomenys nurodomi užrašant jų adresą. Tegu A1:A100 yra imties adresas, šimtas stulpelio A eilučių. Tačiau kiekvieną kartą taip rašyti adresą nėra patogu. Kur kas patogiau yra duoti tokiam adresui vardą. Tam reikia pele pasižymėti norimas celes ir kairėje pusėje adreso laukelyje įrašyti pavadinimą (9 paveikslas). Taip galima suteikti pavadinimą net ir vienai celei, kas vėliau žymiai supaprastina formulių rašymą. Pvz., ne AV ERAGE(A1:A100), bet AV ERAGE(duomenys). Vardų suteikimą galima automatizuoti su funkcija OF F SET. Ji pažymi tam tikrą sritį lape ir suteikia jai vardą arba gali pastumti į kitą vietą anksčiau pažymėtą sritį (čia reikia pažymėti, kad perkeliamas tik pažymėjimas, bet ne pačios celių reikšmės).
Įvadas į matematinės statistikos laboratorinius darbus 14 9 pav.: Vardo duomenų masyvui priskyrimas Sintaksė: OF F SET (sritis; pe; ps; e; s). Čia sritis yra pradinis srities pažymėjimas (kartais užtenka vienos celės), pe ir ps yra eilučių ir stulpelių postumis nuo srities viršutinės kairiosios celės, o e ir s yra naujos srities eilučių ir stulpelių skaičius (nebūti parametrai, jei perstumiama anksčiau pažymėta sritis). 10 pav.: Vardo duomenų masyvui priskyrimas su funkcija OFFSET Vardų priskyrimo įrankis pasiekiamas per meniu Insert/Name/Define.... Ten laukelyje Names in workbook įrašomas vardas, o ties Refers to: srities adresas. Sritis A1:A100 su funkcija OF F SET gali būti apibrėžiama taip: OF F SET ($A$1; 0; 0; $B$1; 1).
Įvadas į matematinės statistikos laboratorinius darbus 15 Čia $A$1 reiškia, kad sritis prasideda nuo celės A1, ji niekur nepastumta, celėje $B$1 įrašyta kiek eilučių pažymėti (100) ir galiausiai nurodyta, kad sritis bus 1 stulpelio pločio (kaip parodyta 10 paveiksle). Sukurti naują sritį iš anksčiau pažymėtos galima taip: OF F SET (duomenys; 0; 2). Taip pažymėjimas duomenys perstumiamas per du stulpelius ir dabar turės kitą vardą ir adresą C1:C100. Kadangi parametrai pe, ps, e ir s yra skaičiai, vietoj jų galima įrašyti celių adresus ir vėliau jų reikšmes keisti neperrašant formulių. 6.2 Sąlygų tikrinimas Kartais skaičiavimus reikia atlikti priklausomai nuo to, ar tenkinama kokia nors sąlyga. Pvz., taip galima nustatyti kiek ats. dydžių generuoti, skaičiuoti imties intervalo padalijimo tašką, jei jo numeris dar neviršijo pasirinkto stulpelių skaičiaus ir neskaičiuoti, jei jau viršijo. Sąlygos tikrinimui skirta funkcija IF. Sintaksė: IF (salyga; reiksme1; reiksme2). Čia salyga yra loginis reiškinys sąlyga, kurią patikrinus, jei ji teisinga, išvedama reiksme1, jei klaidinga reiksme2. Be to, reiksme1 ir reiksme2 gali būti kitos funkcijos ir ištisi reiškiniai. Skirtingai nuo funkcijos COU N T IF čia sąlyga rašoma be kabučių. Pvz., konkretaus skaičiaus ats. dydžių generavimas gali būti užrašomas taip: IF ($B$1 >= ROW (); NORMINV (RAND(); $C$1; $C$2); Užteks generuoti ). Čia celėje B1 įrašytas imties tūris, funkcijos ROW rezultatas eilutės numeris, o celėse C1 ir C2 įrašyti skirstinio parametrai. 6.2.1 Sąlyginis formatavimas Panašiai kaip su funkcija IF, priklausomai nuo sąlygos galima keisti Excel celės fono, šrifto spalvą ar stilių, uždėti rėmelį ir kitaip keisti išvaizdą. Tas gali būti naudinga kada norima automatiškai išskirti kokią nors celę, pvz., nuspalvinti raudonai, jei jos reikšmė lygi imties maksimumui (11 paveikslas). Tai padaroma per meniu Format/Conditional Formating.... Galima tikrinti konkrečią celės reikšmę arba funkcijos toje celėje reikšmę. Excel turi grupę funkcijų (Information), kurių rezultatas yra tam tikra informacija apie celę (2 paveikslas). Pvz., su funkcija ISERROR galima patikrinti ar celėje įrašytas klaidos kodas, ISN U M BER parodo ar celėje įrašytas skaičius ir t.t. Galima tikrinti kelias sąlygas iš karto. Paprastai sąlyga užrašoma vienai celei (pvz., kada tikrinama celės ar funkcijos toje celėje reikšmė), todėl norint tą pačią sąlygą tikrinti grupei celių iš karto, sąlygą reiktų aprašyti kiekvienai celei atskirai. Šitą veiksmą galima automatizuoti
Įvadas į matematinės statistikos laboratorinius darbus 16 11 pav.: Sąlyginis formatavimas sąlygą nukopijuoti. Pasižymima celė su jau aprašyta sąlyga, meniu paspaudžiamas mygtukas Format Painter ir juo pažymimos likusios celės, kurioms bus taikomas toks pats sąlygos tikrinimas. Celes ar sritis, kurioms taikomas sąlyginis formatavimas, galima pažiūrėti per meniu Edit/Go To... paspaugus mygtuką Special... ir pasirinkus Conditional Formating. Lygiai taip pat parodomos ir pažymimos sritys, kurioms suteikti vardai. 6.3 Kitos naudingos formulės Kadangi statistikoje dažnai dirbama su duomenų masyvais, ir laboratoriniuose darbuose reikia stengtis dirbti ne su atskiromis ats. dydžių reikšmėmis ar funkcijų rezultatais, bet pvz. su visa imtimi iš karto, duomenų grupes apjungti į masyvus, suteikti jiems vardus ir operuoti tais vardais formulėse. MS Excel turi grupę funkcijų darbui su masyvais Lookup and Reference functions. Keletas iš jų jau buvo paminėta: OF F SET, ROW. Automatizuojant laboratorinius darbus dar gali būti naudingos funkcijos MAT CH, V LOOKUP, HLOOKUP.