TRÖÔØNG ÑAÏI HOÏC Y KHOA PHAÏM NGOÏC THAÏCH DÖÏ AÙN U-PNT-03 PHÖÔNG PHAÙP NGHIEÂN CÖÙU KHOA HOÏC (LÔÙP CÔ BAÛN 3) PHẦN THỐNG KÊ Y HỌC Thaùng 3/00
Baøi KHAÙI NIEÄM veà THOÁNG KEÂ Y HOÏC vaø CAÙCH SAÉP XEÁP & TOÅ CHÖÙC SOÁ LIEÄU ThS. BS. Nguyeãn Theá Duõng MUÏC TIEÂU: Sau khi hoïc ong baøi naøy, hoïc vieân coù theå: / Phaân bieät ñuùng caùc loaïi bieán soá thöôøng duøng trong thoáng keâ y hoïc / Phaân bieät ñöôïc caùc thang ño löôøng duøng trong thoáng keâ y hoïc 3/ Bieát caùch thieát laäp caùc baûng phaân phoái taàn soá, taàn soá töông ñoái, taàn soá doàn, taàn soá töông ñoái doàn 4/ Phaùt bieåu ñuùng yù nghóa cuûa soá lieäu trong caùc baûng phaân phoái taàn soá, taàn soá töông ñoái, taàn soá doàn, taàn soá töông ñoái doàn I. MOÄT SOÁ KHAÙI NIEÄM CÔ BAÛN : Thoáng keâ hoïc (Statistics): laø moân hoïc veà caùch : thu thaäp, toå chöùc, toùm taét vaø phaân tích soá lieäu ruùt ra nhöõng suy dieãn cho toaøn boä (soá lieäu) töø keát quaû khaûo saùt phaàn cuûa soá lieäu. Thoáng keâ sinh hoïc (Biostatistics): laø thoáng keâ hoïc coù soá lieäu phaân tích coù nguoàn goác sinh hoaëc y hoïc. Bieán soá (Variable): laø ñaëc tính coù theå mang nhieàu giaù trò khaùc nhau ôû ngöôøi, nôi choán, vaät khaùc nhau. Bieán soá ñònh löôïng (Quantitative variable): laø bieán soá coù theå ño ñaïc ñöôïc baèng caùc pheùp ño löôøng thoâng thöôøng. Soá ño thöïc hieän treân caùc bieán soá ñònh löôïng chuyeån taûi thoâng tin veà soá (khoái) löôïng. Bieán soá ñònh tính (Qualitative variable) : laø bieán soá khoâng theå ñöôïc ño baèng nhöõng pheùp ño löôøng thoâng thöôøng, maø chæ coù theå ñöôïc nhoùm loaïi (categorized). Soá ño thöïc hieän treân caùc bieán soá ñònh tính chuyeån taûi thoâng tin veà thuoäc tính. Bieán soá ngaãu nhieân (Random variable): laø bieán soá maø caùc giaù trò coù ñöôïc laø keát quaû cuûa caùc yeáu toá mang tính cô hoäi (chance factors) khoâng theå tieân ñoaùn chính aùc tröôùc ñöôïc. Caùc giaù trò coù ñöôïc qua caùc phöông phaùp ño löôøng ñöôïc goïi laø caùc quan saùt (observations) hoaëc soá ño easurements) Bieán soá ngaãu nhieân rôøi (Discrete random variable): laø bieán soá ñaëc tröng bôûi caùc khoaûng troáng giöõa caùc giaù trò. Bieán soá ngaãu nhieân lieân tuïc (Continous random variable): laø bieán soá khoâng coù caùc khoaûng troáng giöõa caùc giaù trò. DAÂN SOÁ (Quaàn theå Population): laø taäp hôïp lôùn nhaát caùc thöïc theå maø ta quan taâm ôû thôøi ñieåm aùc ñònh.
Neáu ño moät bieán soá treân töøng thöïc theå cuûa daân soá, chuùng ta seõ coù daân soá caùc giaù trò cuûa bieán soá ñoù. Daân soá caùc giaù trò laø taäp hôïp lôùn nhaát caùc giaù trò cuûa bieán soá ngaãu nhieân maø ta quan taâm ôû thôøi ñieåm aùc ñònh. MAÃU (Sample): laø phaàn (boä phaän) cuûa daân soá. II. SÖÏÏ ÑO LÖÔØNG vaø THANG ÑO LÖÔØNG (Measurement & Measurement Scale) Söï ño löôøng ñöôïc ñònh nghóa laø söï gaùn con soá cho caùc vaät theå hoaëc bieán coá theo heä thoáng qui taéc. Do vieäc ño löôøng ñöôïc thöïc hieän vôùi nhieàu heä thoáng qui taéc khaùc nhau neân phaûi coù nhieàu thang ño löôøng khaùc nhau.. Thang ñònh danh (Nominal Scale): laø thang ño löôøng (ôû möùc ñoä) thaáp nhaát vaø chæ bao goàm vieäc ñaët teân cho caùc quan saùt hoaëc phaân loaïi chuùng vaøo caùc nhoùm ñoäc laäp hoã töông (mutually eclusive). Thí duï: caùc chaån ñoaùn y khoa (beänh cao huyeát aùp, beänh noäi tieát, v.v.), caùc thöïc theå nhò phaân nhö nam-nöõ, beänh-khoûe, v..v. Thang thöù töï (Ordinal Scale): laø thang ño löôøng bao goàm khoâng chæ vieäc ñònh danh maø coøn phaân haïng (rank) caùc nhoùm loaïi theo soá tieâu chuaån naøo ñoù. Thí duï: beänh (raát naëng, naëng, vöøa, nheï), tình traïng kinh teá (cao, vöøa, keùm), v..v.. Löu yù laø möùc ñoä khaùc bieät giöõa caùc soá ño thuoäc nhoùm loaïi ñaõ phaân haïng khoâng ñöôïc bieát laø baèng bao nhieâu. 3. Thang khoaûng (Interval Scale): tinh vi hôn thang thöù töï ôû choã khoaûng caùch giöõa hai soá ño baát kyø ñöôïc bieát roõ. Thí duï: hieäu cuûa soá ño 0 vaø 30 baèng vôùi hieäu cuûa soá ño 30 vaø 40. Thang khoaûng duøng ñôn vò veà khoaûng caùch vaø moät ñieåm zero ñöôïc choïn tuøy yù. Tuy nhieân ñieåm zero trong tröôøng hôïp naøy khoâng phaûi laø zero thaät söï (chæ thò söï hoaøn toaøn khoâng coù khoái löôïng ñang ñöôïc ño). Thí duï roõ nhaát veà thang khoaûng laø caùch ño nhieät ñoä, trong ñoù 0 0 C khoâng ñoàng nghóa vôùi vieäc hoaøn toaøn khoâng coù nhieät löôïng naøo.thang khoaûng laø moät thang ñònh löôïng. 4. Thang Tæ soá (Ratio Scale): laø thang ño löôøng ôû möùc ñoä cao nhaát, ñaëc tröng bôûi söï baèng nhau cuûa caùc tæ soá cuõng nhö cuûa caùc khoaûng coù theå ñöôïc ñònh roõ. Ñieåm cô baûn cuûa thang tæ soá laø coù ñieåm zero thaät. Thí duï: chieàu cao, caân naëng, chieàu daøi,v.v. III. CHUOÃI THOÁNG KEÂ (Ordered array) : laø danh muïc caùc giaù trò cuûa taäp hôïp soá lieäu eáp theo thöù töï töø giaù trò nhoû ñeán giaù trò lôùn.
IV. PHAÂN PHOÁI TAÀN SOÁ (quency Distribution). Phaân nhoùm soá lieäu: soá lieäu coù theå ñöôïc toå chöùc, saép eáp baèng caùch phaân vaøo nhieàu nhoùm (Khoaûng caùch lôùp KCL). Caùch tính soá KCL Soá KCL cuûa taäp hôïp soá lieäu thöôøng khoâng neân nhoû hôn 6 vaø khoâng lôùn hôn 5. Ñeå chính aùc hôn, coù theå duøng coâng thöùc Sturges ñeå tính soá KCL : k = + 3,3 (log 0 n) vôùi k : soá KCL & n : soá giaù trò coù ñöôïc Thí du: coù taäp hôïp soá lieäu goàm 57 giaù trò, neân phaân vaøo bao nhieâu KCL thì vöøa? n = 57 log 0 57 =,7559 k = + 3,3 (,7559) 7 Caùch tính ñoä roäng cuûa KCL w = R k vôùi w : ñoä roäng cuûa KCL R : bieân ñoä cuûa chuoãi soá lieäu Thí duï: coù taäp hôïp soá lieäu goàm 57 giaù trò, giaù trò lôùn nhaát laø 79 vaø giaù trò nhoû nhaát laø. Tính ñoä roäng cuûa caùc KCL? w = 79 = 9,6 0 7 Taäp hôïp 57 giaù trò laø caân naëng tính baèng ounces cuûa 57 khoái u aùc tính laáy ra töø buïng cuûa 57 beänh nhaân : 68 63 4 7 30 36 8 3 79 7 3 4 5 44 65 43 5 74 5 36 4 8 3 8 5 45 57 5 3 49 38 4 7 3 50 38 6 4 69 47 3 43 7 49 8 3 9 46 30 43 49 3
. Laäp baûng phaân phoái taàn soá KCL Taàn soá 0 9 5 0 9 9 30 39 0 40 49 3 50 59 4 60 69 4 70 79 3. Laäp baûng phaân phoái taàn soá, taàn soá doàn, taàn soá töông ñoái, taàn soá töông ñoái doàn 57 KCL Taàn soá Taàn soá doàn Taàn soá Taàn soá töông ñoái töông ñoái doàn 0 9 5 5 0,0877 0,0877 0 9 9 4 0,3333 0,40 30 39 0 34 0,754 0,5964 40 49 3 47 0,8 0,845 50 59 4 5 0,070 0,8947 60 69 4 55 0,070 0,9649 70 79 57 0,035,0000 57,0000 Löu yù: Tuøy theo nhu caàu maø choïn coät (taàn soá, taàn soá töông ñoái, taàn soá doàn, taàn soá töông ñoái doàn) ñeå trình baøy. Thoâng thöôøng nhaát laø trình baøy taàn soá vaø taàn soá töông ñoái (tính baèng %) trong cuøng baûng. 4. Laäp bieåu ñoà Histogram Histogram laø bieåu ñoà phaân phoái taàn soá hình que (coät) ñaëc bieät cuûa caùc bieán soá lieân tuïc. Do laø bieåu ñoà laø cuûa bieán soá lieân tuïc neân khi trình baøy caàn phaûi duøng caùc giôùi haïn thaät cuûa caùc KCL. Tìm giôùi haïn thaät cuûa KCL baèng caùch tröø ñi ½ ñôn vò ñoái vôùi giôùi haïn döôùi vaø coäng theâm ½ ñôn vò ñoái vôùi giôùi haïn treân. 4
Baûng phaân phoái taàn soá duøng giôùi haïn thaät (ñeå veõ histogram) Giôùi haïn thaät cuûa KCL Taàn soá 9,5 9,5 5 9,5 9,5 9 9,5 39,5 0 39,5 49,5 3 49,5 59,5 4 59,5 69,5 4 69,5 79,5 Taàn soá 0 8 6 4 0 8 6 4 9,5 9,5 9,5 39,5 49,5 59,5 69,5 79,5 X 5. Laäp bieåu ñoà ña giaùc taàn soá Bieåu ñoà ña giaùc taàn soá ñöôïc thieát laäp döïa treân histogram. Baèng caùch noái trung ñieåm cuûa caùc maët treân cuûa töøng oâ chöõ nhaät töôïng tröng cho taàn soá cuûa caùc KCL, ta seõ coù ña giaùc taàn soá. Taàn oá 0 8 6 4 0 8 6 4 http://www.ebook.edu.vn 5 9,5 9,5 9,5 39,5 49,5 59,5 69,5 79,5 X
6. Laäp bieåu ñoà thaân vaø laù (Stem-and-leaf) Thaân Laù 6 9 3 3 3 4 4 5 5 5 7 7 7 7 8 8 8 8 3 0 0 6 6 8 8 4 3 3 3 4 5 6 7 9 9 9 5 0 7 6 3 5 8 9 7 4 9 ---------------------------------------------------------- 6
Baøi TOÙM TAÉT SOÁ LIEÄU MUÏC TIEÂU: Sau khi hoïc ong baøi naøy, hoïc vieân coù theå: / Bieát caùch tính caùc soá ño khuynh höôùng taäp trung vaø phaùt bieåu ñuùng yù nghóa cuûa caùc soá ño naøy / Bieát caùch tính caùc soá ño khuynh höôùng phaân taùn vaø phaùt bieåu ñuùng yù nghóa cuûa caùc soá ño naøy 3/ Bieát caùch thieát laäp caùc bieåu trình baøy caùc soá ño khuynh höôùng taäp trung vaø phaân taùn I. GIÔÙI THIEÄU : Soá ño moâ taû (descriptive measure) laø phöông tieän toùm taét soá lieäu (TTSL). Soá ño moâ taû tính ñöôïc töø soá lieäu cuûa maãu ñöôïc goïi laø soá thoáng keâ (statistic) Soá ño moâ taû tính ñöôïc töø soá lieäu cuûa daân soá ñöôïc goïi laø thoâng soá (parameter) II. SOÁ ÑO KHUYNH HÖÔÙNG TAÄP TRUNG (Measures of Central Tendency) : Soá ño khuynh höôùng taäp trung chuyeån taûi thoâng tin veà giaù trò trung bình (average value) cuûa moät taäp hôïp soá lieäu. Ba soá ño khuynh höôùng taäp trung thöôøng duøng nhaát laø: soá troäi soá trung vò, vaø soá trung bình.. Soá troäi (Mode) : Soá troäi cuûa moät taäp hôïp giaù trò laø giaù trò uaát hieän nhieàu laàn nhaát. Moät taäp hôïp giaù trò coù theå khoâng coù soá troäi naøo, hoaëc coù nhieàu hôn soá troäi. Ñaëc ñieåm cuûa soá troäi Soá troäi coù theå ñöôïc söû duïng ñeå moâ taû soá lieäu ñònh tính.. Soá trung vò (Median) Soá trung vò cuûa moät taäp hôïp soá lieäu laø giaù trò ñöùng giöõa phaàn baèng nhau cuûa taäp hôïp (soá giaù trò baèng hoaëc lôùn hôn soá trung vò baèng vôùi soá giaù trò baèng hoaëc nhoû hôn soá trung vò). Neáu soá giaù trò laø moät soá leû, soá trung vò seõ laø giaù trò ñöùng ngay giöõa chuoãi thoáng keâ. Neáu soá giaù trò laø moät soá chaün, soá trung vò seõ baèng soá trung bình cuûa giaù trò ñöùng ngay giöõa chuoãi thoáng keâ. Ñaëc ñieåm cuûa soá trung vò: Ñoäc nhaát (ñoái vôùi moãi taäp hôïp soá lieäu chæ coù soá trung vò) Ñôn giaûn (deã hieåu vaø deã tính toaùn) Giaù trò cöïc (etreme values) khoâng gaây aûnh höôûng nhieàu ñeán soá trung vò. 7
3. Soá trung bình toaùn hoïc (Arithmatic Mean) : Trung bình (cuûa) daân soá (Population Mean) : N N i i= μ = N: soá giaù trò cuûa daân soá Trung bình (cuûa) maãu (Sample Mean) : n n i i= = n: soá giaù trò cuûa maãu Ñaëc ñieåm cuûa soá trung bình: Ñoäc nhaát (ñoái vôùi moãi taäp hôïp soá lieäu chæ coù soá trung bình) Ñôn giaûn (deã hieåu vaø deã tính toaùn) Giaù trò cöïc (etreme values) gaây aûnh höôûng nhieàu ñeán soá trung bình. Soá trung bình gia troïng (Weighted mean) Laø soá trung bình ñöôïc tính khi phaân tích soá lieäu töø nhieàu maãu veà cuøng loaïi thoâng tin nhöng ñöôïc thu thaäp ôû nhöõng thôøi ñieåm khaùc nhau vaø coù côõ maãu khaùc nhau. Soá trung bình gia troïng ñöôïc tính nhö sau: n i I N Weighted = n i i/n soá giaù trò cuûa maãu i soá trung bình cuûa maãu i toång soá giaù trò cuûa caùc maãu Trimmed mean (soá trung bình goïn) vaø Winsorized mean (soá trung bình gaùn) Laø hai pheùp tính laïi soá trung bình nhaèm haïn cheá taùc ñoäng cuûa giaù trò cöïc. Trimmed mean: soá trung bình ñöôïc tính sau khi ñaõ goït boû giaù trò ñaàu vaø giaù trò cuoái cuûa chuoãi thoáng keâ. Winsorize mean: soá trung bình ñöôïc tính sau khi ñaõ gaùn 5% soá giaù trò ôû ñaàu chuoãi thoáng keâ (caùc giaù trò cöïc thaáp) baèng vôùi giaù trò thaáp keá tieáp (so vôùi 5% caùc giaù trò cöïc thaáp), vaø 5% soá giaù trò ôû cuoái chuoãi thoáng keâ (caùc giaù trò cöïc cao) baèng vôùi giaù trò cao keá tieáp (so vôùi 5% caùc giaù trò cöïc cao). 8
III. SOÁ ÑO KHUYNH HÖÔÙNG PHAÂN TAÙN (Measures of Dispersion) : Soá ño phaân taùn chuyeån taûi thoâng tin veà khoái löôïng (möùc ñoä) bieán thieân hieän dieän trong taäp hôïp soá lieäu.. Bieân ñoä(range) : R = L s Coâng duïng cuûa bieân ñoä raát giôùi haïn (vì chæ duøng coù giaù trò).. Phöông sai (Variance) : Phöông sai cuûa moät taäp hôïp soá lieäu laø soá ño ñoä phaân taùn töông ñoái cuûa caùc giaù trò (thuoäc taäp hôïp) ung quanh soá trung bình (cuûa taäp hôïp soá lieäu). + Phöông sai (cuûa) daân soá (Population Variance) N ( ) μ i i= σ = N: soá giaù trò cuûa daân soá + Phöông sai (cuûa) maãu (Sample Variance) Tröôøng hôïp maãu nhoû : Tröôøng hôïp maãu lôùn : S = n N n ( ) i i= S = n: soá giaù trò cuûa maãu ( n ) n n n i i i= i= n 3. Ñoä leäch chuaån (Standard Deviation) ÑLC laø soá ño ñoä phaân taùn gioáng nhö phöông sai, nhöng ñöôïc dieãn taû baèng ñôn vò ño ban ñaàu. ÑLC ñöôïc tính baèng caùch ruùt caên cuûa phöông sai. ÑLC cuûa daân soá coù kyù hieäu σ (sigma), ÑLC cuûa maãu coù kyù hieäu laø s IV. Baùch phaân vò vaø Töù phaân vò (Percentiles and Quartiles) Cho moät taäp hôïp coù n giaù trò,,.., n, baùch phaân vò thöù p (goïi laø P) laø giaù trò cuûa X maø theo ñoù coù p% soá giaù trò nhoû hôn P vaø (00 p)% soá giaù trò lôùn hôn P. P 0 chæ baùch phaân vò thöù 0, P 50 chæ baùch phaân vò thöù 50, v..v.. Thoâng thöôøng, baùch phaân vò ñöôïc tính trong caùc tröôøng hôïp taäp hôïp soá lieäu lôùn. 9
Vò trí cuûa baùch phaân vò thöù k (P k ) coù theå ñöôïc tính nhö sau: k P k = n 00 Baùch phaân vò thöù 5 thöôøng ñöôïc goïi laø Töù phaân vò thöù nhaát (Q ) Baùch phaân vò thöù 50 (soá trung vò) thöôøng ñöôïc goïi laø Töù phaân vò thöù hai (hoaëc Töù phaân vò giöõa Q ) Baùch phaân vò thöù 75 thöôøng ñöôïc goïi laø Töù phaân vò thöù ba (Q 3 ) 3. Hoäp vaø Daây keùo (Bo-and-Whisker Plots) Coâng cuï hình aûnh ñeå trình baøy caùc töù phaân vò. Naêm böôùc ñeå veõ: Ñaët bieán soá leân truïc ngang (hoaønh) Veõ moät bo vaøo khoaûng khoâng naèm treân truïc ngang vôùi caùc ñaëc ñieåm: ñaàu beân traùi cuûa bo öùng vôùi Q, vaø ñaàu beân phaûi cuûa bo öùng vôùi Q 3. Chia bo laøm phaàn baèng ñöôøng doïc öùng vôùi Q. Keû ñöôøng naèm ngang goïi laø whisker töø ñaàu traùi cuûa bo ñeán ñieåm öùng vôùi giaù trò nhoû nhaát cuûa chuoãi soá lieäu. Keû ñöôøng naèm ngang khaùc, cuõng goïi laø whisker töø ñaàu phaûi cuûa bo ñeán ñieåm öùng vôùi giaù trò lôùn nhaát cuûa chuoãi soá lieäu. 0
Baøi 3 PHAÂN PHOÁI XAÙC SUAÁT (Probability distributions) I. PHAÂN PHOÁI XAÙC SUAÁT (PPXS) CUÛA CAÙC BIEÁN SOÁ RÔØI Ñònh nghóa: PPXS cuûa moät bieán soá ngaãu nhieân rôøi laø moät baûng, bieåu, coâng thöùc, hoaëc coâng cuï khaùc ñöôïc söû duïng ñeå bieåu thò taát caû caùc giaù trò coù theå coù cuûa moät bieán soá rôøi cuøng vôùi aùc suaát töông öùng cuûa chuùng. Thí duï: Moät nhaân vieân Ban DS-KHHGÑ phuï traùch 50 hoä gia ñình. Haõy thieát laäp PPXS cuûa X, laø soá treû em cuûa töøng hoä, cho daân soá naøy. Phaân phoái aùc suaát cuûa soá treû em/hoä gia ñình trong daân soá coù 50 gia ñình Taàn soá uaát hieän P(X=) cuûa (Soá hoä gia ñình) 0 /50 4 4/50 6 6/50 3 4 4/50 4 9 9/50 5 0 0/50 6 7 7/50 7 4 4/50 8 /50 9 /50 0 /50 50 50/50 Xaùc suaát 0/50 9/50 8/50 7/50 6/50 5/50 4/50 3/50 /50 /50 0 0 3 4 5 6 7 8 9 0
Ñaëc ñieåm chung: () 0 P(X=) () Σ P (X=) = Dieãn giaûi: + Giaû söû nhaân vieân naøy choïn ngaãu nhieân moät hoä gia ñình ñeå ñi thaêm. Xaùc suaát ñeå thaêm truùng moät hoä gia ñình coù 3 treû laø bao nhieâu? Nhìn vaøo baûng PPXS: P(X=) = 4/50 = 0,08 + Xaùc suaát ñeå thaêm truùng moät gia ñình coù 3 hoaëc 4 treû laø bao nhieâu? P(X=3 hoaëc X=4) = P(X=3) + P(X=4) = 0,6.. PPXS doàn (Cummulative Distrubitions) Phaân phoái aùc suaát doàn cuûa soá treû em/hoä gia ñình trong daân soá coù 50 gia ñình Taàn soá uaát hieän P(X=) P(X ) cuûa (Soá hoä gia ñình) 0 /50 /50 4 4/50 5/50 6 6/50 /50 3 4 4/50 5/50 4 9 9/50 4/50 5 0 0/50 34/50 6 7 7/50 4/50 7 4 4/50 45/50 8 /50 47/50 9 /50 49/50 0 /50 50/50 50 50/50 Dieãn giaûi: + Tìm aùc suaát ñeå thaêm truùng moät hoä gia ñình ñöôïc choïn ngaãu nhieân coù töø 5 con trôû leân? P(X 5) = P(X < 5) = 0,48 = 0,5 + Tìm aùc suaát ñeå thaêm truùng moät hoä gia ñình ñöôïc choïn ngaãu nhieân coù töø 3 ñeán 6 con? P(3 X 6) = P(X 6) P(X < 3) = 4/50 /50 = 0,8 0, = 0,60.. Phaân Phoái Nhò Phaân (Binomial Distribution) Laø moät trong caùc PPXS raát thöôøng gaëp trong thoáng keâ öùng duïng. Tieán trình Bernoulli: bao goàm moät loaït caùc thöû nghieäm Bernoulli (Bernoulli trials) ñöôïc tieán haønh lieân tieáp nhau döôùi nhöõng ñieàu kieän sau:. Moãi thöû nghieäm chæ cho ra moät trong hai keát quaû ñoäc laäp hoã töông. Moät loaïi keát quaû ñöôïc ñaët laø thaønh coâng, vaø keát quaû coøn laïi ñöôïc ñaët laø thaát baïi.. Xaùc suaát cuûa moät laàn thaønh coâng, goïi laø p, khoâng ñoåi töø thöû nghieäm sang thöû nghieäm khaùc. Xaùc suaát cuûa laàn thaát baïi, p, goïi laø q.
3. Caùc thöû nghieäm ñoäc laäp vôùi nhau; nghóa laø keát quaû cuûa thöû nghieäm baát kyø khoâng bò aûnh höôûng bôûi keát quaû cuûa baát kyø laàn thöû nghieäm naøo khaùc. Thí duï: Taïi moät beänh vieän phuï saûn coù 5% soá saûn aùn ghi nhaän sinh con trai (aùc suaát ñeå choïn moät saûn aùn sinh con trai laø 0,5), neáu choïn ngaãu nhieân 5 saûn aùn töø daân soá saûn aùn cuûa BV naøy thì aùc suaát ñeå choïn ñöôïc ñuùng 3 saûn aùn sinh con trai laø bao nhieâu? Ñaët keát quaû choïn ñöôïc saûn aùn sinh con trai laø vaø keát quaû choïn ñöôïc saûn aùn sinh con gaùi laø 0 Ñaët aùc suaát cuûa laàn thaønh coâng laø p (choïn ñöôïc saûn aùn sinh con trai) aùc suaát cuûa laàn thaát baïi laø q (choïn ñöôïc saûn aùn sinh con gaùi) Giaû söû sau khi choïn ñôït, coù keát quaû nhö sau: 00 Theo pheùp nhaân aùc suaát, P (,0,,,0) = pqppq = p 3 q Neáu khoâng quan taâm ñeán thöù töï saûn aùn trong töøng ñôït ruùt maø chæ quan taâm ñeán vieäc ruùt ñöôïc 3 saûn aùn sinh con trai thoâi thì coù caùc caùch ruùt sau: Laàn ruùt Thöù töï ----------------------------------------------------------------------. 00 00 3 00 4 00 5 00 6 00 7 00 8 00 9 00 0 00 ----------------------------------------------------------------------- Xaùc suaát ñeå choïn ñöôïc saûn aùn sinh con trai cuûa moãi ñôït ruùt ñeàu baèng nhau (= p 3 q ). Theo luaät (pheùp) coäng aùc suaát, aùc suaát ñeå ruùt laàn ñöôïc 3 saûn aùn sinh con trai baèng: 0 (0,5) 3 (0,48) = 0 (0,40608) (0,304) = 0,3 Qui ra coâng thöùc, f(3) = 5 C 3 p 3 q 5 3 3
Coâng thöùc chung: f n ( )= nc p q vôùi = 0,,,....,n Phaân phoái nhò phaân II. PHAÂN PHOÁI XAÙC SUAÁT (PPXS) CUÛA CAÙC BIEÁN SOÁ LIEÂN TUÏC :. Giôùi thieäu : Taàn soá 0 8 6 4 0 8 6 4 9,5 9,5 9,5 39,5 49,5 59,5 69,5 79,5 X Histogram cuûa 57 giaù trò caân naëng (ounces) cuûa caùc khoái u aùc tính: Moãi hình chöõ nhaät (khoaûng caùch lôùp) coù ñaëc ñieåm + Chieàu roäng: khoaûng caùch giöõa ñieåm (giaù trò) ñònh tröôùc treân truïc + Beà cao: taàn soá cuûa caùc giaù trò naèm trong khoaûng ñieåm naøy. Taàn soá cuûa töøng KCL seõ ñöôïc tính baèng tæ leä töông öùng vôùi phaàn dieän tích giôùi haïn bôûi ñieåm treân truïc vaø beà cao cuûa hình chöõ nhaät. 4
Giaû söû tình huoáng bieán soá ngaãu nhieân lieân tuïc coù moät soá löôïng raát lôùn caùc giaù trò vaø KCL ñöôïc chia raát nhoû, histogram coù theå seõ troâng gioáng nhö bieàu ñoà döôùi ñaây: f Neáu noái caùc ñieåm giöõa cuûa caùc KCL laïi ñeå thieát laäp ña giaùc taàn soá, chaéc chaén seõ ñöôïc ñöôøng cong ít goùc caïnh hôn. Giaû söû soá löôïng caùc giaù trò, n, tieán ñeán voâ cöïc, vaø beà roäng cuûa caùc KCL tieán ñeán 0, ña giaùc taàn soá seõ coù daïng ñöôøng cong troøn tròa F() a b Caùc ñöôøng cong troøn tròa naøy thöôøng ñöôïc duøng ñeå bieåu thò phaân phoái cuûa caùc bieán soá lieân tuïc. Caùc ñöôøng cong naøy coù ñaëc ñieåm nhö sau: + Toång dieän tích naèm beân döôùi ñöôøng cong baèng (töông töï nhö cuûa histogram) + Taàn soá töông ñoái cuûa caùc giaù trò naèm giöõa ñieåm treân truïc baèng vôùi toång dieän tích giôùi haïn bôûi ñöôøng cong, truïc, vaø ñöôøng thaúng ñöùng döïng leân töø ñieåm naøy treân truïc. Xaùc suaát cuûa baát kyø giaù trò ñaëc hieäu naøo cuûa bieán soá naøy ñeàu baèng 0 (vì giaù trò chæ ñöôïc tieâu bieåu baèng ñieåm treân truïc, vaø vuøng dieän tích ôû phía treân ñieåm baèng 0). Ñònh nghóa: Moät haøm soá khoâng aâm f() ñöôïc goïi laø phaân phoái aùc suaát cuûa bieán soá ngaãu nhieân lieân tuïc X neáu toång dieän tích giôùi haïn bôûi ñöôøng cong vaø truïc cuûa noù baèng, vaø neáu phaàn dieän tích naèm döôùi ñöôøng cong giôùi haïn bôûi ñöôøng cong, truïc vaø caùc ñöôøng thaúng ñöùng döïng leân töø ñieåm a vaø b baát kyø cho bieát aùc suaát cuûa X giöõa ñieåm a vaø b. 5
. PHAÂN PHOÁI BÌNH THÖÔØNG (Normal distribution) Phaân phoái bình thöôøng (PPBT), coøn goïi laø phaân phoái Gauss (Gaussian distribution), coù coâng thöùc bieåu thò: f e ( μ ) / σ ( ) =, - < < + πσ Phaân phoái Bình thöôøng coù thoâng soá laø μ, soá trung bình, vaø σ, ñoä leäch chuaån. Ñöôøng bieåu dieãn laø ñöôøng cong hình chuoâng. Ñaëc ñieåm: / Ñoái öùng ung quanh soá trung bình cuûa noù. / Soá trung bình = soá trung vò = soá troäi 3/ Toång dieän tích döôùi ñöôøng cong baèng ñôn vò vuoâng. 4/ Neáu döïng caùc ñöôøng thaúng ñöùng ôû caùch soá trung bình ( khoaûng caùch baèng) ÑLC veà caû hai phía, phaàn dieän tích giôùi haïn bôûi ñöôøng thaúng naøy, truïc, vaø ñöôøng cong seõ gaàn baèng 68% cuûa toång dieän tích. Neáu nôùi roäng giôùi haïn beân moät khoaûng caùch baèng ÑLC veà caû hai phía, phaàn dieän tích giôùi haïn seõ gaàn baèng 95%, vaø con soá naøy seõ gaàn baèng 99,7% neáu khoaûng caùch laø 3 ÑLC. 5/ PPBT hoaøn toaøn ñöôïc aùc ñònh bôûi caùc thoâng soá μ vaø σ. Nghóa laø coù raát nhieàu PPBT ñöôïc aùc ñònh bôûi caùc giaù trò μ vaø/hoaëc σ khaùc nhau, vaø chuùng hôïp thaønh moät hoï (family) PPBT. μ 6
0,68 (a) σ σ μ σ μ μ + σ 6 0,95 (b) 0,05 σ σ 0,05 μ σ μ μ + σ 0,997 (c) 0,005 3σ 3σ 0,005 μ 3σ μ μ + 3σ μ μ μ 3 μ < μ < μ 3 σ σ σ 3 σ < σ < σ 3 7
Phaân phoái bình thöôøng chuaån (Standard Normal Distribution) Laø thaønh vieân quan troïng nhaát cuûa hoï PPBT, coøn goïi laø PPBT ñôn vò, vì coù μ = 0 vaø σ =. Bieán soá cuûa PPBT chuaån ñöôïc ñaët laø z vôùi z = ( μ)/σ. Coâng thöùc tính PPBT chuaån f ( z) = π e z /, - < < + Ñeå tìm aùc suaát cuûa giaù trò z naèm trong khoaûng aùc ñònh bôûi ñieåm baát kyø z 0 vaø z treân truïc z, phaûi tìm phaàn dieän tích giôùi haïn bôûi caùc ñöôøng thaúng ñöùng döïng leân töø z 0 vaø z, ñöôøng cong, vaø 3 truïc hoaønh. Phaàn dieän tích naøy ñöôïc tính baèng pheùp tính tích phaân z z ( z) = 0 π e z / Tuy nhieân, coù theå duøng baûng ñaõ tính saün ñeå tra ra caùc keát quaû tích phaân naøy. dz Thí duï: / Cho PPBT chuaån, tìm phaàn dieän tích döôùi ñöôøng cong, treân truïc z giöõa = vaø z =. Tra baûng thaáy z = töông öùng vôùi phaàn dieän tích laø 0,977. Dieãn giaûi: Xaùc suaát ñeå choïn ngaãu nhieân vaø tìm ñöôïc giaù trò z naèm trong khoaûng ( - ) laø 0,977; hoaëc Taàn soá töông ñoái cuûa caùc giaù trò cuûa z naèm trong khoaûng ( - ) laø 97,7%; 3 9,7% caùc giaù trò cuûa z naèm trong khoaûng ( - ). / Tính aùc suaát ñeå choïn ngaãu nhieân ñöôïc moät z coù giaù trò trong khoaûng,55 vaø +,55. P(,55 < z <,55) = P(z <,55) P(z <,55) = 0,9946 0,0054 = 0,989 3/ Tìm P(z,7). P(z,7) = P(z,7) = 0,9966 = 0,0034 ÖÙNG DUÏNG CUÛA PPBT Moâ hình PPBT raát höõu ích vaø tieän lôïi hôn caùc moâ hình phöùc taïp khaùc trong vieäc tính aùc suaát cuûa moät soá bieán soá (coù phaân phoái bình thöôøng hoaëc gaàn nhö bình thöôøng) Thí duï: / Trong nghieân cöùu veà beänh Alzheimer, veà troïng löôïng cuûa naõo beänh nhaân, ngöôøi ta tính ñöôïc μ = 076,80 grams vaø σ = 05,76 grams. Ñöôïc bieát (bieán soá) troïng löôïng naõo cuûa beänh nhaân bò Alzheimer phaân phoái gaàn nhö bình thöôøng, haõy tìm aùc suaát ñeå choïn ngaãu nhieân ñöôïc beänh nhaân coù naõo naëng < 800 grams. veõ hình phaân phoái chuyeån soá lieäu töø sang z (PPBT chuaån): 8
trình baøy z = μ 800 076,80 z = =, σ 05,76 6 800 076,80 P ( < 800) = P z < = P z = 05,76 ( <,6) 0, 0044 Xaùc suaát ñeå choïn ngaãu nhieân ñöôïc moät beänh nhaân coù naõo naëng < 800 grams laø 0,0044. / Bieát ñöôïc chieàu cao cuûa moät daân soá coù 0.000 ngöôøi phaân phoái gaàn nhö bình thöôøng vôùi trung bình baèng 70 inches vaø ÑLC baèng 3 inches. a/ Tính aùc suaát ñeå choïn ngaãu nhieân ñöôïc ngöôøi coù chieàu cao trong khoaûng 65 vaø 74 inches. 65 70 Vôùi = 65 z = =, 67 3 74 70 Vôùi = 74 z = =, 33 3 Xaùc suaát tìm ñöôïc laø 0,8607. 65 70 74 70 P( 65< < 74) = P z 3 3 = P(,67 z,33) = P( z,33) P( z,67) = 0,908 0,0475 = 0,8607 b/ Tính em coù bao nhieâu ngöôøi 77 inches. Xaùc suaát ñeå ngöôøi ñöôïc choïn ngaãu nhieân coù chieàu cao 77 inches, 77 70 P( > 77) = P z > = P(z >,33) = 0,990 = 0, 0099 3 Coù 0.000 (0,0099) = 99 ngöôøi coù chieàu cao > 77 inches. ----------------------------------------------------------------------------------------------------------------------------- 9
Baøi 4 PHAÂN PHOÁI MAÃU (Sampling Distributions) I. GIÔÙI THIEÄU Phaân phoái (PP) maãu laø chìa khoùa ñeå hieåu ñöôïc caùc suy luaän thoáng keâ. Vieäc hieåu bieát PPXS nhaèm hai muïc ñích: Tìm lôøi giaûi cho caùc caâu hoûi veà aùc suaát cuûa caùc soá thoáng keâ cuûa maãu Cung caáp neàn taûng lyù thuyeát caàn thieát cho vieäc ñöa ra nhöõng suy luaän thoáng keâ ñuùng ñaén. PP maãu nhaèm vaøo muïc ñích thöù nhaát. Ñònh nghóa PP. cuûa taát caû caùc giaù trò ñöôïc em laø caùc soá thoáng keâ (statistics) tính ñöôïc töø caùc maãu (samples) coù cuøng kích thöôùc maãu (sample size) ruùt ngaãu nhieân töø cuøng moät daân soá, ñöôïc goïi laø PP. maãu cuûa soá thoáng keâ ñoù. Caùc böôùc thieát laäp PP. maãu + Töø moät daân soá höõu haïn coù kích thöôùc N, ruùt ngaãu nhieân taát caû caùc maãu (coù theå ruùt ñöôïc) coù kích thöôùc n. + Tính soá thoáng keâ coù lieân quan cho töøng maãu + Laäp baûng phaân phoái taàn soá cho caùc soá thoáng keâ tính ñöôïc naøy. Ñaëc ñieåm quan troïng 03 ñieàu caàn ñöôïc bieát veà PP. maãu: soá trung bình, phöông sai, vaø daïng haøm soá. Vieäc thieát laäp PP. maãu theo 3 böôùc noùi treân seõ trôû neân raát khoù khaên vôùi daân soá coù kích thöôùc lôùn, vaø trôû neân baát khaû thi khi gaëp daân soá voâ haïn. Caùch toát nhaát ñeå giaûi quyeát vaán ñeà naøy laø duøng caùc lyù thuyeát toaùn hoïc ñeå tính gaàn ñuùng PP. maãu cuûa soá thoáng keâ. II. PP. (CUÛA SOÁ) TRUNG BÌNH MAÃU (Distribution of the Sample Mean) Thí duï daãn nhaäp Giaû söû coù daân soá coù kích thöôùc N = 5 (tuoåi cuûa 5 ñöùa treû ñieàu trò ngoaïi truù taïi PKSK Taâm Thaàn Quaän) vôùi = 6, = 8, 3 = 0, 4 =, 5 = 4. Soá trung bình (daân soá): 50 μ = i = = 0 Ν 5 Phöông sai (daân soá): ( μ) i σ = N = 40 = 8 5 0
Phöông sai: (tính caùch khaùc) S ( μ) = N i = 40 = 0 4 Thieát laäp PP. maãu cuûa soá trung bình maãu,, döïa treân kích thöôùc maãu n = ruùt ra töø daân soá naøy. Ruùt taát caû caùc maãu coù theå ruùt ñöôïc vôùi n = töø daân soá naøy theo caùch ñeå laïi (with replacement), nghóa laø ruùt ra em keát quaû ong thì traû laïi vaøo daân soá; toång soá maãu ruùt ñöôïc baèng N n = 5 RUÙT LAÀN 6 8 0 4 6 6, 6 8, 6 0, 6, 6 4, 6 RUÙT (6) (7) (8) (9) (0) 8 6, 8 8, 8 0, 8, 8 4, 8 LAÀN (7) (8) (9) (0) () 0 6, 0 8, 0 0, 0, 0 4, 0 (8) (9) (0) () () 6, 8, 0,, 4, (9) (0) () () (3) 4 6, 4 8, 4 0, 4, 4 4, 4 (Soá trong ngoaëc laø soá trung bình, ) (0) () () (3) (4) Laäp baûng phaân phoái taàn soá cuûa Taàn soá Taàn soá töông ñoái 6 7 8 9 0 3 4 3 4 5 4 3 /5 /5 3/5 4/5 5/5 4/5 3/5 /5 /5 Toång 5 5/5
Daïng haøm soá cuûa PP. daân soá: Phaân phoái ñôn ñeàu f ( ) 6 5 4 3 6 8 0 4 Daïng haøm soá cuûa PP. trung bình maãu: phaân phoái daïng bình thöôøng f ( ) 6 5 4 3 6 7 8 9 0 3 4 Tính thoâng soá cuûa PP. Trung bình maãu N i 6+ 7+ 8 +... + 4 50 n 0 μ = = = = 5 5 soá trung bình cuûa PP. trung bình maãu baèng soá trung bình cuûa daân soá goác σ ( i ) (6 0) + (7 0) +... + (4 0) μ n N = = 5 = 00 4 5 =
Phöông sai cuûa PP. maãu khoâng baèng phöông sai daân soá, maø baèng phöông sai daân soá chia cho kích thöôùc maãu σ 8 σ = = = 4 n σ Caên soá baäc cuûa phöông sai cuûa PP. maãu, σ =, ñöôïc goïi laø sai soá chuaån cuûa soá n trung bình, hoaëc goïi ñôn giaûn laø sai soá chuaån (standard error). Ñaëc ñieåm cuûa PP. Trung bình maãu Khi laáy maãu theo caùch ñeå laïi hoaëc laáy maãu töø daân soá voâ haïn. Töø moät daân soá phaân phoái bình thöôøng, PP. Trung bình maãu coù nhöõng ñaëc ñieåm sau: + PP. cuûa seõ bình thöôøng + Soá trung bình, μ, cuûa phaân phoái seõ baèng vôùi soá trung bình cuûa daân soá, μ, maø töø ñoù caùc maãu ñöôïc ruùt ra. + Phöông sai, thöôùc maãu. σ, cuûa phaân phoái seõ baèng phöông sai cuûa daân soá chia cho kích. Töø moät daân soá phaân phoái khoâng bình thöôøng Lyù thuyeát giôùi haïn trung taâm (Central Limit Theorem) Cho moät daân soá coù daïng haøm soá khoâng bình thöôøng vôùi soá trung bình laø μ vaø phöông sai höõu haïn σ, phaân phoái maãu cuûa (laø caùc soá trung bình tính ñöôïc töø caùc maãu coù kích thöôùc n töø daân soá naøy) seõ coù soá trung bình μ = μ vaø phöông sai σ = σ / n vaø seõ phaân phoái gaàn nhö bình thöôøng khi kích thöôùc maãu lôùn. Trong thöïc tieãn, kích thöôùc maãu baèng 30 ñöôïc em laø ñuû lôùn. Noùi chung, PP. Trung bình maãu caøng gaàn vôùi bình thöôøng hôn khi kích thöôùc maãu caøng lôùn. Laáy maãu Khoâng ñeå laïi (without replacement) Trong haàu heát caùc tình huoáng thöïc teá, vieäc laáy maãu nhaát thieát phaûi ñöôïc thöïc hieän vôùi daân soá höõu haïn vaø PP. Trung bình maãu trong nhöõng ñieàu kieän naøy cuõng coù phaàn naøo thay ñoåi. Vôùi thí duï daãn nhaäp, neáu vieäc laáy maãu ñöôïc tieán haønh theo caùch khoâng ñeå laïi vaø khoâng quan taâm ñeán thöù töï ñöôïc ruùt ra cuûa caùc giaù trò (trong caùc maãu), thì chæ coù 0 maãu ( 5 C ). Soá trung bình cuûa phaân phoái : μ N i 7 + 8 + 9 +... + 3 00 0 = = = = C 0 0 n Soá trung bình cuûa PP. maãu cuõng baèng vôùi soá trung bình daân soá. 3
Phöông sai cuûa PP. maãu σ ( i μ ) 30 = = = 3 NCn 0 Phöông sai cuûa PP. Trung bình maãu, σ, khoâng baèng σ 8 = = 4 maø baèng n σ n N n 8 5 = = 3 N 3 (Neáu kích thöôùc maãu lôùn, lyù thuyeát giôùi haïn trung taâm seõ ñöôïc aùp duïng vaø seõ phaân phoái gaàn nhö bình thöôøng) N n Yeáu toá ñöôïc goïi laø yeáu toá ñieàu chænh daân soá höõu haïn (finite population N correction) vaø coù theå ñöôïc boû qua khi kích thöôùc maãu töông ñoái nhoû so vôùi daân soá. (n/ N 0,05) TOÙM TAÉT PHAÂN PHOÁI TRUNG BÌNH MAÃU. Khi vieäc laáy maãu ñöôïc thöïc hieän treân daân soá phaân phoái bình thöôøng vôùi phöông sai bieát tröôùc: a. μ = μ b. σ =σ/ n c. Phaân phoái trung bình maãu laø phaân phoái bình thöôøng. Khi vieäc laáy maãu ñöôïc thöïc hieän treân daân soá phaân phoái khoâng bình thöôøng vôùi phöông sai bieát tröôùc: a. Soá trung bình μ = μ b. Sai soá chuaån σ =σ/ n khi n / N 0,05 σ = ( σ/ n) N n N c. Phaân phoái trung bình maãu laø phaân phoái gaàn nhö bình thöôøng 4
Thí duï aùp duïng Giaû söû ngöôøi ta bieát ñöôïc raèng chieàu daøi hoäp soï cuûa daân soá ngöôøi phaân phoái gaàn nhö bình thöôøng vôùi soá trung bình laø 85,6 mmm vaø ÑLC baèng,7 mmm. Xaùc suaát ñeå tìm thaáy maãu coù n = 0 (ruùt ra töø daân soá naøy) coù soá trung bình,, lôùn hôn 90 laø bao nhieâu? + Maãu khaûo saùt naøy (n = 0) chæ laø moät trong raát nhieàu maãu coù n = 0 ruùt ra töø daân soá, nhö vaäy soá trung bình cuûa noù seõ laø trong raát nhieàu caáu taïo neân phaân phoái trung bình maãu ((phaùt uaát töø daân soá naøy) + Daân soá khaûo saùt phaân phoái gaàn nhö bình thöôøng, nhö vaäy PP. Trung bình maãu cuõng phaân phoái gaàn nhö bình thöôøng vôùi μ = μ = 85,6 vaø σ =,7 / 0 = 4,0 (giaû ñònh laø daân soá töông ñoái lôùn so vôùi maãu neân coù theå boû qua heä soá ñieàu chænh daân soá höõu haïn) + AÙp duïng PP. bình thöôøng chuaån ñeå tính vôùi coâng thöùc tính z bieán ñoåi μ z = σ / n σ =,7 mm μ = 85,6 mm σ =,7/0= 4,0 0,379 μ = 85,6mm 90 χ σ = 0,379 0,09 z 90 85, 6 4, 4 z= = =,09 4,0 4,0 5
P(z >,09) = P(z,09) = 0,86 = 0,379 Xaùc suaát ñeå choïn ñöôïc moät maãu n = 0 coù > 90 laø 3,79%. III. PHAÂN PHOÁI HIEÄU CUÛA TRUNG BÌNH MAÃU (Distribution of the Difference Between Two Sample Means) Giôùi thieäu Vieäc khaûo saùt daân soá ñeå tìm hieåu em soá trung bình cuûa chuùng coù khaùc nhau khoâng, vaø ñoä lôùn cuûa söï khaùc bieät giöõa chuùng (hieäu soá) laø bao nhieâu raát thöôøng ñöôïc tieán haønh trong thöïc teá. Söï hieåu bieát veà PP. Hieäu cuûa trung bình maãu raát höõu ích trong tröôøng hôïp naøy. Thí duï chöùng minh: Giaû söû coù daân soá daân soá ñaõ töøng maéc moät soá beänh coù lieân quan vôùi chaäm phaùt trieån taâm thaàn (mental retardation), vaø daân soá chöa töøng maéc caùc beänh coù lieân quan naøy. Heä soá thoâng minh (HSTM) cuûa hai daân soá naøy ñöôïc em laø phaân phoái gaàn nhö bình thöôøng vôùi ÑLC baèng 0. Giaû söû töø moãi daân soá laáy maãu coù n = 5, tính trung bình HSTM vaø coù keát quaû = 9 vaø = 05. Neáu khoâng coù söï khaùc bieät giöõa daân soá, eùt veà maët soá trung bình thöïc söï cuûa HSTM, thì aùc suaát ñeå tìm ñöôïc hieäu lôùn baèng hoaëc lôùn hôn ( ). Thieát laäp PP. maãu cuûa ( ) + Ruùt taát caû caùc maãu (coù theå ruùt ñöôïc) coù n = 5 töø daân soá Ruùt taát caû caùc maãu (coù theå ruùt ñöôïc) coù n = 5 töø daân soá + Tính trung bình cho taát caû caùc maãu treân. + Laáy hieäu cuûa töøng caëp soá trung bình maãu ( töø daân soá, vaø töø daân soá ) + Laäp phaân phoái maãu cho caùc hieäu ñaõ tính ñöôïc naøy. Ñaëc ñieåm cuûa PP. hieäu trung bình maãu + Phaân phoái bình thöôøng + Soá trung bình μ = μ μ + Sai soá chuaån σ = σ + σ n n Thí duï treân cho thaáy phaân phoái hieäu trung bình maãu laø moät phaân phoái bình thöôøng vôùi Soá trung bình : Phöông sai : μ μ = 0 (μ vaø μ khoâng khaùc nhau), vaø σ = ( /n ) ( /n ) σ + σ = [(0) / 5 + (0) / 5] = 53,33 6
Chuyeån qua z : z = ( ) ( μ μ ) σ n σ + n Phaàn dieän tích döôùi ñöôøng cong cuûa ( ) dieän tích naèm beân traùi cuûa ( ) töông öùng vôùi aùc suaát ñang tìm laø phaàn = 9 05 = 3. Giaù trò cuûa z töông öùng vôùi 3 trong tröôøng hôïp khoâng coù söï khaùc bieät giöõa trung bình daân soá ñöôïc tính z = 3 0 53,3 = 3 53,3 =,78 Tra baûng tìm aùc suaát, dieän tích döôùi ñöôøng cong phaân phoái bình thöôøng chuaån ôû beân traùi cuûa,73 baèng 0,0375. Neáu khoâng coù söï khaùc nhau giöõa hai soá trung bình daân soá, aùc suaát ñeå tìm thaáy hieäu cuûa soá trung bình maãu lôùn baèng hoaëc lôùn hôn 3 laø 0,0375. Laáy maãu töø caùc daân soá PP. bình thöôøng Tieán trình tính toaùn noùi treân vaãn ñuùng khi maãu coù kích thöôùc khaùc nhau n n, vaø khi phöông sai daân soá khaùc nhau σ σ. Laáy maãu töø caùc daân soá phaân phoái khoâng bình thöôøng hoaëc khoâng bieát daïng phaân phoái: Laáy maãu lôùn ñeå aùp duïng lyù thuyeát giôùi haïn trung taâm. IV. PHAÂN PHOÁI TÆ LEÄ MAÃU (Distribution of the Sample Proportion) Thí duï chöùng minh: Giaû söû trong moät daân soá coù 8% soá ngöôøi bò muø maøu (p = 0,08). Neáu choïn ngaãu nhieân 50 ngöôøi töø daân soá naøy thì aùc suaát ñeå coù ñöôïc tæ leä muø maøu (cuûa maãu) lôùn baèng hoaëc lôùn hôn 0,5 laø bao nhieâu. Thieát laäp PP. maãu cuûa pˆ (Caùch tieán haønh gioáng heät nhö caùch tieán haønh thieát laäp PP. trung bình maãu). + Ruùt taát caû caùc maãu (coù theå ruùt ñöôïc) coù n = 50 töø daân soá + Tính tæ leä maãu (sample proportion) pˆ cho taát caû caùc maãu treân. + Laäp phaân phoái maãu cho caùc pˆ ñaõ tính ñöôïc naøy. Ñaëc ñieåm cuûa PP. Tæ leä maãu: khi côõ maãu lôùn, PP. Tæ leä maãu phaân phoái gaàn nhö bình thöôøng (theo lyù thuyeát giôùi haïn trung taâm). Soá trung bình cuûa phaân phoái, μ pˆ baèng trung bình coäng cuûa taát caû caùc tæ leä maãu), seõ baèng vôùi tæ leä daân soá p, vaø phöông sai cuûa phaân phoái ˆp seõ baèng p ( p) /n. σ 7
Ñeå traû lôøi caâu hoûi, duøng PP. bình thöôøng chuaån vôùi pˆ p 0,5 0,08 z = = = p( p) 0,00049 n 0,07 = 3,5 0,0 Tra baûng PP.bình thöôøng ñeå tìm ñöôïc p(z = 3,5) = 0,999 = 0,0008. Xaùc suaát ñeå tìm thaáy moät pˆ 0,5 cuûa moät maãu coù n = 50 töø moät daân soá coù p = 0,08 laø 0,08%. Vieäc ruùt ñöôïc moät maãu nhö theá naøy, trong thöïc teá, ñöôïc em laø hieám aûy ra. Vaán ñeà kích thöôùc maãu lôùn ñeå coù theå chuyeån töø PP. nhò phaân sang PP. bình thöôøng Tieâu chuaån thöôøng ñöôïc aùp duïng laø khi caû np vaø n( p) ñeàu > 5. (Vôùi n = 50 vaø p cuûa daân soá baèng 0,08: np (50 0,08) =, vaø nq (50 0,9) = 38 ñeàu lôùn hôn 5) V. PHAÂN PHOÁI HIEÄU TÆ LEÄ MAÃU (Distribution of the Difference between Two Sample Proportions) Ñaëc ñieåm cuûa phaân phoái hieäu tæ leä maãu: Neáu maãu ñoäc laäp coù kích thöôùc maãu n vaø n ñöôïc ruùt ngaãu nhieân töø daân soá coù caùc bieán soá nhò phaân vôùi tæ leä (ñaëc ñieåm ñöôïc quan taâm) laàn löôït laø p vaø p thì phaân phoái hieäu cuûa tæ leä maãu pˆ pˆ seõ phaân phoái gaàn nhö bình thöôøng vôùi : Soá trung bình : Sai soá chuaån: μ = ˆ pˆ p p p p ( p ) p ( p ) σ = + pˆ pˆ n n khi n vaø n lôùn. Thieát laäp phaân phoái maãu cuûa pˆ ˆ p + Ruùt taát caû caùc maãu (coù theå ruùt ñöôïc) coù kích thöôùc maãu laø n töø daân soá Ruùt taát caû caùc maãu (coù theå ruùt ñöôïc) coù kích thöôùc maãu laø n töø daân soá + Tính tæ leä maãu cho taát caû caùc maãu treân. + Laáy hieäu cuûa töøng caëp tæ leä maãu ( töø daân soá, vaø töø daân soá ). + Laäp phaân phoái maãu cho caùc hieäu ñaõ tính ñöôïc naøy. Xaùc suaát cuûa hieäu tæ leä maãu ñöôïc tính baèng z = ( pˆ pˆ ) ( p p ) p ( p ) p ( p ) n + n Thí duï chöùng minh : Giaû söû tæ leä cuûa ngöôøi nghieän ma tuùy vöøa vaø naëng trong daân soá thöù pˆ p lôùn baèng baèng 0,50 vaø trong daân soá thöù hai baèng 0,33. Tính aùc suaát tìm thaáy ( ) hoaëc lôùn hôn 0,30? 8 ˆ
Giaû ñònh laø phaân phoái maãu cuûa ( ˆ p ) μ σ p ˆ ˆ p ˆ p p ˆ = 0,50 0,33 = 0,7 p laø phaân phoái gaàn nhö bình thöôøng vôùi ˆ 0,33 0,67 0,50 0,50 = + = 0,0047 00 00 Phaàn dieän tích töông öùng vôùi aùc suaát caàn tìm laø dieän tích naèm döôùi ñöôøng cong pˆ p veà phía beân traùi cuûa 0,30. ( ) ˆ z = ( pˆ pˆ ) ( p p( p) + n p ) p ( p ) n = 0,30 0,7 0,0047 =,89 Tra baûng tìm thaáy dieän tích naèm döôùi ñöôøng cong phaân phoái bình thöôøng chuaån ôû phía beân phaûi cuûa,89 baèng - 0,9706 = 0,094. Xaùc suaát ñeå tìm thaáy moät hieäu lôùn hôn hoaëc lôùn baèng 0,30 laø,94%. ------------------------------------------------------------------------------------------------------------------------------------------------------------------------ 9
Baøi 5 (TKYH) PHEÙP ÖÔÙC LÖÔÏNG (Estimation) I. GIÔÙI THIEÄU Thoáng keâ suy luaän: laø tieán trình qua ñoù chuùng ta coù theå ñaït ñöôïc keát luaän veà daân soá treân cô sôû caùc thoâng tin chöùa trong maãu ruùt ra töø daân soá ñoù. Öôùc löôïng laø moät trong lónh vöïc chung cuûa thoáng keâ suy luaän. Tieán trình öôùc löôïng nhö vaäy seõ bao goàm vieäc tính toaùn, töø soá lieäu cuûa maãu, moät soá soá thoáng keâ ñöôïc em nhö ñaïi bieåu gaàn ñuùng cuûa thoâng soá töông öùng cuûa daân soá (maø töø ñoù maãu ñöôïc ruùt ra). Cô sôû lyù luaän cuûa pheùp öôùc löôïng trong lónh vöïc khoa hoïc söùc khoûe döïa treân giaû ñònh raèng ngöôøi laøm coâng taùc y teá quan taâm ñeán nhöõng thoâng soá, nhö soá trung bình vaø tæ leä, cuûa caùc daân soá khaùc nhau; vaø nhö vaäy, coù lyù do giaûi thích taïi sao caàn phaûi öôùc löôïng. Lyù do thöù nhaát: Haàu heát caùc daân soá, tuy laø höõu haïn, nhöng cuõng khoâng theå khaûo saùt toaøn boä (00%) ñöôïc do vaán ñeà chi phí. Lyù do thöù hai: khoâng coù khaû naêng khaûo saùt ñaày ñuû caùc daân soá voâ haïn. Ñoái vôùi moãi thoâng soá, coù theå tính ñöôïc loaïi soá öôùc löôïng: soá öôùc löôïng ñieåm (point estimate) vaø soá öôùc löôïng khoaûng (interval estimate). Ñònh nghóa: + Soá öôùc löôïng ñieåm laø moät giaù trò ñôn baèng soá ñöôïc duøng ñeå öôùc löôïng thoâng soá töông öùng cuûa daân soá. + Soá öôùc löôïng khoaûng goàm coù giaù trò baèng soá aùc ñònh khoaûng caùc giaù trò, vôùi ñoä tin caäy cho tröôùc, maø chuùng ta tin raèng seõ bao goàm thoâng soá ñang ñöôïc öôùc löôïng. Coâng Cuï Öôùc Löôïng (Estimator) thích hôïp Coâng cuï öôùc löôïng laø qui taéc tính caùc soá öôùc löôïng, thöôøng ñöôïc trình baøy döôùi daïng coâng thöùc. Thí duï: = i n laø moät coâng cuï öôùc löôïng cuûa soá trung bình daân soá μ. Giaù trò ñôn baèng soá laø keát quaû cuûa coâng thöùc naøy,, ñöôïc goïi laø soá öôùc löôïng cuûa thoâng soá μ. Daân soá choïn maãu (Sampled Population) vaø daân soá ñích (Target Population) + Daân soá choïn maãu laø daân soá maø töø ñoù ngöôøi ta thöïc söï ruùt maãu ra. + Daân soá ñích laø daân soá maø ngöôøi ta muoán tìm moät keát luaän cho noù. Hai daân soá naøy coù theå gioáng nhau hoaëc khaùc nhau. Caùc phöông phaùp suy luaän thoáng keâ chæ cho pheùp ruùt ra nhöõng keát luaän veà daân soá choïn maãu (vôùi ñieàu kieän phaûi aùp duïng phöông phaùp choïn maãu thích hôïp). Neáu: 30
Daân soá choïn maãu = daân soá ñích: keát luaän veà daân soá ñích mang tính suy luaän thoáng keâ. Daân soá choïn maãu daân soá ñích: keát luaän veà daân soá ñích chæ döïa treân caùc em eùt khoâng mang tính thoáng keâ. Maãu ngaãu nhieân (Random sample) vaø Maãu khoâng ngaãu nhieân (Nonrandom sample) Maãu ngaãu nhieân: Neáu maãu coù kích thöôùc n ñöôïc ruùt ra töø moät daân soá N theo caùch maø taát caû caùc maãu coù kích thöôùc n (coù theå ruùt ra ñöôïc töø N) ñeàu coù cô hoäi baèng nhau ñeå ñöôïc ruùt ra, thì maãu naøy ñöôïc goïi laø maãu ngaãu nhieân. Ñoä chính aùc cuûa caùc suy luaän thoáng keâ phuï thuoäc raát lôùn vaøo maãu ngaãu nhieân. Maãu khoâng ngaãu nhieân (Maãu thuaän tieän): laø maãu ñöôïc laáy khoâng theo caùch ngaãu nhieân. Vieäc toång quaùt hoùa keát quaû phaûi döïa nhieàu treân nhöõng em eùt khoâng coù tính thoáng keâ. II. KHOAÛNG TIN CAÄY CHO TRUNG BÌNH DAÂN SOÁ (Confidence Interval for a Population Mean) Ruùt moät maãu ngaãu nhieân coù kích thöôùc n töø daân soá phaân phoái bình thöôøng, tính. Tuy coù theåå duøng laøm soá öôùc löôïng ñieåm cho μ, nhöng khoâng theå kyø voïng laø baèng μ ñöôïc (vì tính khoâng nhaát quaùn cuûa caùch choïn maãu). Do vaäy, öôùc löôïng μ baèng khoaûng (interval) seõ phaàn naøo chuyeån taûi ñöôïc caùc thoâng tin veà ñoä lôùn coù theå coù cuûa μ hôn. Phaân phoái maãu vaø Pheùp öôùc löôïng Nhaéc laïi ñaëc ñieåm cuûa PP. Trung bình maãu Neáu vieäc laáy maãu ñöôïc tieán haønh treân daân soá PP. bình thöôøng thì PP. Trung bình maãu cuõng PP. Bình thöôøng vôùi μ = μ vaø && & σ = σ & &. Tính chaát PP. Bình thöôøng cuûa n giuùp bieát ñöôïc raèng coù khoaûng 95% caùc giaù trò cuûa (giuùp caáu taïo neân phaân phoái) naèm trong khoaûng ÑLC tính töø soá trung bình. Hai ñieåm caùch ñeàu soá trung bình khoaûng baèng ÑLC laø ( μ - σ ) vaøø ( μ + σ ), nhö vaäy khoaûng caùch μ ± σ seõ chöùa khoaûng 95% caùc giaù trò coù theå coù cuûa. Pheùp öôùc löôïng Vì khoâng bieát giaù trò cuûa μ neân bieåu thöùc μ ± σ seõ khoâng coù yù nghóa gì lôùn. Tuy nhieân, vôùi soá öôùc löôïng ñieåm cuûa μ laø, vaán ñeà coù theå giaûi quyeát ñöôïc. Giaû söû döïng ñöôïc caùc khoaûng caùch ñeàu beân cho taát caû caùc (tính ñöôïc töø taát caû caùc maãu coù kích thöôùc n ruùt ra töø daân soá coù lieân quan), chuùng ta seõ coù soá löôïng raát lôùn caùc khoaûng caùch coù daïng ± coù beà roäng baèng vôùi beà roäng cuûa khoaûng caùch ung quanh μ (maø ta khoâng bieát). σ && & Gaàn 95% cuûa caùc khoaûng naøy chaéc chaén seõ coù taâm ñieåm naèm trong khoaûng σ ung quanh μ. Moãi khoaûng coù taâm ñieåm naèm trong khoaûng σ ung quanh μ seõ chöùa μ. 3
Thí duï chöùng minh: Giaû söû moät nhaø nghieân cöùu quan taâm taâm ñeán vieäc tìm soá öôùc löôïng cuûa noàng ñoä trung bình cuûa soá enzymes cuûa daân soá ngöôøi. Laáy maãu 0 ngöôøi, ño noàng ñoä enzyme cho töøng ngöôøi roài tính trung bình maãu, ñöôïc =. Giaû söû bieát ñöôïc bieán soá naøy phaân phoái gaàn nhö bình thöôøng vôùi phöông sai baèng 45. Haõy öôùc löôïng μ. Khoaûng tin caäy 95% cho μ ñöôïc tính baèng: ± σ = Thaønh phaàn cuûa khoaûng öôùc löôïng ± σ 45 ± = ± (,3) 0 7,76, 6,4 CCÖL ± (Heä soá tin caäy) (Sai soá chuaån) Khi laáy maãu töø daân soá PP. Bình thöôøng vôùi phöông sai bieát tröôùc, khoaûng öôùc löôïng cho μ ñöôïc tính bôûi: z ( α/ ) ± σ () Dieãn giaûi Khoaûng Tin Caäy (KTC) Vôùi heä soá tin caäy (HSTC) baèng, trong tröôøng hôïp laáy maãu laäp laïi nhieàu laàn, gaàn 95% caùc khoaûng [ñöôïc thieát laäp theo bieåu thöùc ()] seõ chöùa trung bình daân soá. Coù theå toång quaùt hoùa dieãn giaûi naøy neáu ñaët toaøn boä phaàn dieän tích döôùi ñöôøng cong cuûa vaø naèm ngoaøi khoaûng μ ± σ laø α, vaø phaàn dieän tích naèm trong khoaûng μ ± σ laø ( α). Dieãn giaûi theo aùc suaát: Trong tröôøng hôïp laáy maãu laäp laïi nhieàu laàn, töø daân soá PP. Bình thöôøng vôùi ÑLC bieát tröôùc, 00( α)% cuûa taát caû caùc khoaûng coù daïng ± σ cuoái cuøng cuõng seõ chöùa trung bình daân soá, μ. z ( α/ ) Ñaïi löôïng α, trong tröôøng hôïp naøy baèng 0,95, ñöôïc goïi laø heä soá tin caäy (hoaëc möùc ñoä tin caäy), vaø khoaûng ± σ ñöôïc goïi laø khoaûng tin caäy 95% cho μ. z ( α/ ) Dieãn giaûi thöïc teá: Khi laáy maãu töø daân soá PP. Bình thöôøng vôùi ÑLC bieát tröôùc, chuùng ta 00( α)% tin caäy laø khoaûng tính ñôn leû, ± σ, coù chöùa trung bình daân soá, μ. z ( α/ ) HSTC trong thí duï treân, ñöôïc tính chính aùc hôn, seõ baèng,96 (thay vì ). Trong caùc ñieàu kieän khaùc coù theå duøng baát cöù HSTC naøo, nhöng caùc giaù trò thöôøng duøng nhaát laø 0,95 töông öùng vôùi z baèng,96 0,90 töông öùng vôùi z baèng,645 0,99 töông öùng vôùi z baèng,58. 3
Ñaïi löôïng coù ñöôïc do nhaân HSTC vôùi sai soá chuaån ñöôïc goïi laø ñoä tin cậy cuûa soá öôùc löôïng (coøn goïi laø bieân cuûa sai soá). III. PHAÂN PHOÁI t (Student s t distribution) Vieäc thieát laäp KTC 95% cho moät trung bình daân soá (tröôøng hôïp daân soá PP. Bình thöôøng hoaëc laáy maãu lôùn) seõ döôøng nhö khoâng thöïc hieän ñöôïc neáu khoâng bieát σ. Tuy nhieân, vaán ñeà ñöôïc giaûi quyeát khi laáy maãu lôùn (n 30) vì khi ñoù coù theå duøng s (ÑLC cuûa maãu) thay cho σ. Khi chæ coù maãu nhoû (n < 30), bieän phaùp thay theá ñeå thieát laäp caùc KTC laø duøng phaân phoái t (phaân phoái Student) Ñaïi löôïng μ t = coù phaân phoái naøy s / n Ñaëc ñieåm cuûa PP. t Coù soá trung bình baèng 0 Ñoái öùng ung quanh soá trung bình Coù phöông sai >, nhöng phöông sai seõ tieán ñeán khi côõ maãu lôùn daàn leân. Phöông sai cuûa PP. t ñöôïc tính theo ñoä töï do (degrees of freedom df) Bieán soá t bieán thieân trong khoaûng ñeán + PP. t laø moät hoï caùc PP., khaùc nhau ôû giaù trò (n ), maãu soá duøng ñeå tính s. Giaù trò (n ) ñöôïc em laø ñoä töï do. So saùnh vôùi PP. Bình thöôøng thì PP. t coù ñænh khoâng cao baèng, nhöng laïi coù ñuoâi naèm cao hôn PP. t tieán ñeán PP. Bình thöôøng khi n tieán ñeán voâ cöïc. PP. t (df=5) PPBT GT tới hạn của t: ±,57 (α=0,05, đuôi) 33
KTC duøng t CCÖL ± (HSTC) (Sai soá chuaån) Khi laáy maãu töø moät daân soá PP. Bình thöôøng coù ÑLC, σ, khoâng ñöôïc bieát, KTC 00( α)% cho trung bình daân soá ñöôïc cho bôûi s ± t( α / ) n Löu yù : ñeå duøng ñöôïc PP. t vieäc laáy maãu phaûi ñöôïc tieán haønh treân daân soá coù PP. Bình thöôøng hoaëc gaàn nhö bình thöôøng. Thí duï chöùng minh: moät maãu goàm 6 beù gaùi 0 tuoåi cho caân naëng trung bình laø 7,5 pounds vaø ÑLC laø pounds. Giaû ñònh laø tuoåi cuûa caùc beù gaùi naøy PP. Bình thöôøng, tìm KTC 95% cho μ. Duøng trung bình maãu, 7,5 laø soá öôùc löôïng ñieåm cuûa μ Sai soá chuaån baèng s/ n = / 6 = 3 Ñoä töï do, df = n =6 = 5 Tra baûng ñeå coù t ( α / ) = t0, 975 =,35 7,5 ± (,35) (3) 65, 77,9 IV. KTC CHO HIEÄU TRUNG BÌNH DAÂN SOÁ Khi laáy maãu töø hai daân soá PP. Bình thöôøng vôùi caùc phöông sai bieát tröôùc KTC 95% cho (μ μ ) ( z σ ) ± + ( α / ) n Thí duï chöùng minh: moät nhoùm nghieân cöùu quan taâm ñeán söï khaùc bieät veà noàng ñoä uric acid trong huyeát thanh ôû beänh nhaân khoâng coù vaø beänh nhaân coù H/C Down. Töø beänh vieän ñieàu trò treû chaäm phaùt trieån trí tueä: choïn treû coù H/C Down, cho keát quaû = 4,5/00 ml Töø beänh vieän ña khoa: choïn 5 treû coù cuøng tuoåi vaø phaùi (vôùi nhoùm treân), cho keát quaû = 3,4/00 ml Giaû ñònh raèng daân soá (caùc giaù trò noàng ñoä uric acid) treân PP. Bình thöôøng vôùi phöông sai laàn löôït laø vaø,5. Tìm KTC 95% cho (μ μ ). σ n Soá öôùc löôïng ñieåm cho (μ μ ) baèng: = 4,5 3,4 =, HSTC töông öùng vôùi 0,95 (tra baûng PP. Bình thöôøng) laø,96 Sai soá chuaån 34
σ KTC 95% baèng σ σ,5 = + = + = 0,48 & && && & n n 5, ±,96 (0,48) =, ± 0,84 0,6,94 Chuùng ta 95% tin caäy (tin töôûng) raèng hieäu cuûa daân soá, μ μ, naèm ñaâu ñoù giöõa 0,6 vaø,94 (vì khi laáy maãu laäp laïi nhieàu laàn, 95% caùc KTC döïng leân theo caùch naøy seõ chöùa hieäu cuûa daân soá). Khi laáy maãu töø hai daân soá PP. khoâng bình thöôøng: laáy maãu lôùn ñeå aùp duïng lyù thuyeát giôùi haïn trung taâm. Trong tröôøng hôïp naøy neáu phöông sai cuûa daân soá khoâng ñöôïc bieát, duøng phöông sai cuûa maãu laøm soá öôùc löôïng cuûa chuùng. Khi laáy maãu töø hai daân soá PP. B.thöôøng vôùi caùc phöông sai khoâng bieát tröôùc + n nhoû Tröôøng hôïp phöông sai daân soá baèng nhau (ñoàng phöông sai): Phaûi tính soá öôùc löôïng hôïp (pooled estimate) cuûa ñoàng phöông sai s p Sai soá chuaån ñöôïc cho bôûi ( n = s s s + ) s + ( n ) s n + n p p = & && && & n n vaø KTC 00( α) cho μ μ ñöôïc cho bôûi ( α / ) s n p ±t + Ñoä töï do ñeå aùc ñònh giaù trò cuûa t ñöôïc tính baèng (n + n ) s n p Thí duï chöùng minh: Moät nghieân cöùu nhaèm aùc ñònh hieäu quaû cuûa vieäc taäp theå duïc keùo daøi treân söùc beàn. Choïn hai nhoùm ngöôøi: nhoùm ñaõ tham gia chöông trình taäp theå löïc vaø duy trì taäp trung bình 3 naêm; nhoùm bao goàm nhöõng ngöôøi khoâng taäp bao giôø. Söùc beàn ñöôïc ñaùnh giaù qua soá laàn ngoài leân trong 30 giaây. Nhoùm : =, 0 s = 4,9 Nhoùm : =, s = 5,6 Giaû ñònh raèng daân soá caùc soá ño söùc beàn naøy PP. gaàn nhö bình thöôøng vaø phöông sai ñöôïc bieát laø baèng nhau. Thieát laäp KTC 95% cho hieäu cuûa daân soá treân. Tính soá öôùc löôïng hôïp cuûa ñoàng phöông sai (3 )(4,9) + (7 )(5,6) s = = 8, p 3 + 7 Tra baûng vôùi df = 3+7-= 8, HSTC = =,0484 ( α / ) 0, t t 975 35
KTC 95% baèng (,0,) ±,0484 8, 8, + 3 7 8,9 ± 4,0085 4,9,9 Chuùng ta 95% tin töôûng raèng hieäu cuûa trung bình daân soá naèm ñaâu ñoù trong khoaûng 4,9 vaø,9. Tröôøng hôïp phöông sai daân soá khoâng baèng nhau Giaûi phaùp ñeà ra (theo Cochran) laø tính HSTC t (-α/) t (-α/) = w t + w t w + w w = s /n w = s / n t = t (-α/) cho (n ) ñoä töï do t = t (-α/) cho (n ) ñoä töï do KTC 00(-α)% cuûa μ μ ( α / ) s n p ±t + s n p V. KTC CHO TÆ LEÄ DAÂN SOÁ Khi caû np vaø n( p) ñeàu 5, phaân phoái cuûa p ) seõ gaàn nhö bình thöôøng vôùi sai soá σ ) chuaån laø = p( p) / n. Duøng p) laøm soá öôùc löôïng cho p (daân soá), vaø nhö vaäy seõ öôùc p ) ) löôïng σ p ) baèng p ( p) / n. KTC 00(-α) cho p ñöôïc tính baèng ) ) ) p z p( p) / n ± ( α / ) Thí duï chöùng minh: Taïi BV. Taâm Thaàn, trong maãu 59 ngöôøi nhaäp vieän coù 04 ngöôøi ñaõ duøng caàn sa ít nhaát laàn trong ñôøi. Thieát laäp KTC 95% cho tæ leä ngöôøi duøng caàn sa cuûa daân soá choïn maãu naøy. Soá öôùc löôïng ñieåm cuûa tæ leä daân soá (p) laø p ) = 04/59 = 0,345. Kích thöôùc maãu vaø p ) ñuû lôùn ñeå coù theå duøng PP. Bình thöôøng chuaån khi thieát laäp KTC. HSTC töông öùng vôùi KTC 95% laø,96 Soá öôùc löôïng cuûa sai soá chuaån σ p = p p) / n ( 0,345)(0,6548) / 59 KTC 95% cho p 0,345 ±,96(0,0956) 0,345 ± 0,0383 0,3069 0,3835 36
VI. KTC CHO HIEÄU CUÛA TÆ LEÄ DAÂN SOÁ Khi n vaø n ñeàu lôùn vaø caùc tæ leä daân soá khoâng quaù gaàn 0 hoaëc, aùp duïng lyù thuyeát giôùi haïn trung taâm ñeå duøng PP. Bình thöôøng. Sai soá chuaån cuûa soá öôùc löôïng ñöôïc öôùc löôïng baèng ) ) ) ) ) p ( p) p ( p ) σ ) ) = + p p n n Vôùi tæ leä daân soá khoâng bieát, KTC 00(-α) cho (p p ) ñöôïc cho bôûi ) ) ) ) ) ) p( p) p ( p ( p p ) ± z + ( α / ) n n ----------------------------------------------------------------------------------------------------------------------------------------------------- ) 37