19/10/017 CHƯƠNG 5C HỒI QUI VÀ TƯƠNG QUAN Tươg qua Ha bế được ó là có tươg qua ếu chúg có qua hệ vớ hau, chíh xác hơ, sự tha đổ của bế à có ảh hưởg đế tha đổ của bế cò lạ. Ký hệu (x,) là cặp gá trị qua sát được của ha bế X,. Ta có thể vẽ đồ thị của các qua sát thôg qua bểu đồ phâ tá (scatter dagram) Một côg t ghê cứu ảh hưởg của quảg cáo tớ doah số bá hàg. Dữ lệu quảg cáo và doah thu từg thág được thu thập hư sau: Ch phí quảg cáo 1,3 0,9 1,8,1 1,5 Tổg doah số thág tớ 151,6 100,1 199,3 1, 170,0 Bế độc lập: ch phí quảg cáo Bế phụ thuộc: doah số bá hàg Bểu đồ phâ tá Hã vẽ bểu đồ phâ tá. Hệ số tươg qua Pearso Ký hệu: r ha r X, Côg thức: Trog đó là số lượg qua sát x x cov x, 1 rx, ; cov x,. 1 X X, x x ; 1 1 1 1 X r x x 1 x x. 1 1 r Hệ số tươg qua Pearso Ký hệu: r ha r X, Côg thức: X, Trog đó là số lượg qua sát X, r x x 1 x x. 1 1 x x. x x. x x. x x. 1
19/10/017 Trug bìh; phươg sa và hệp phươg sa Đố vớ qua sát mẫu x x1 x... x 1 1... 1 x ; x x1 x... x 1 1... 1 x ; x... x x 1 1 1 x Đáh gá hệ số tươg qua Mề gá trị: Nếu 1 r X, 0 thì tươg qua âm. r X càg gầ -1 thì mố lê hệ tuế tíh ghịch gữa X, càg mạh Nếu 0 r X thì tươg qua dươg. r X càg, 1 gầ -1 thì mố lê hệ tuế tíh thuậ gữa X, càg mạh r X càg gầ 0 thì qua hệ tuế tíh càg ếu. 1 1 r X, Đáh gá hệ số tươg qua Hã tíh hệ số tươg qua Pearso gữa ch phí quảg cáo và doah số trog ví dụ sau. Ch phí quảg cáo 1,3 0,9 1,8,1 1,5 Tổg doah số thág tớ 151,6 100,1 199,3 1, 170,0 X X X 1,3 151,6 1,69.98,56 197,08 0,9 100,1 0,81 10.00,01 90,09 1,8 199,3 3,4 39.70,49 358,74,1 1, 4,41 48.99,44 464,5 1,5 170,0,5 8.900,00 55,00 7,6 84, 1,40 150.55,50 1.365,43 Σ Σ Σ Σ Σ 5 5 5 x 7,6 84, 1 1 5 5 5 x x 1 1 1 1,40 150.55,50 1365,43 Hệ số tươg qua: r X Hoặc: x x 1,5,48 168,44 30110,5 x 73,086 73, 086 1,5.168, 44, 48 1,5 30110,5 168,44 0,993371434 5.1, 4 7,6 5.15055,5 84, 0,993371434
19/10/017 Các gá trị trug bìh 1, 4 15055,5 1365, 43 x, 48; 30110,5; x 73,086 5 5 5 Độ lệch chuẩ: 1, 4 15055,5 1365, 43 x, 48; 30110,5; x 73,086 5 5 5 0, 460435 46,61634 X Hệ số tươg qua r 0,993371 Số lệu về thờ ga quảg cáo trê truề hìh và lượg sả phẩm têu thụ ở một côg t sả xuất đồ chơ trẻ em hư sau: Thờ ga 8 37 44 36 47 35 6 9 33 3 31 8 Lượg têu thụ 41 3 49 4 38 33 7 4 35 30 34 5 Thờ ga: phút/tuầ Lượg têu thụ: 1000sp/tuầ Hã tíh hệ số tươg qua mẫu và cho kết luậ Đáp số: r=0,6388 Kết luậ: mố lê hệ tươg qua gữa thờ ga quảg cáo và số sả phẩm têu thụ được là tươg qua thuậ, ở mức trug bìh. Hệ số tươg qua Spearma Hệ số tươg qua hạg Ký hệu R Côg thức: 6 R 1 Trog đó là cỡ mẫu và d là hệu số của các hạg. d 1 Hệ số tươg qua Spearma Kh tuể dụg, một côg t đáh gá các ứg vê thôg qua phỏg vấ và bà kểm tra. Kh phỏg vấ, các ứg vê được đáh gá từ A (xuất sắc) đế E (khôg phù hợp) và bà kểm tra được tíh theo thag đểm 100. Kết quả của 5 ứg vê hư sau: Tíh hệ số tươg qua hạg Spearma và cho hậ xét Ứg vê 1 3 4 5 Đểm phỏg vấ A B A C D Đểm bà th 60 61 50 7 70 Ta lập bảg sau: Ứg vê Hạg phỏg vấ Hạg kểm tra Hệu số Hệu số bìh phươg 1 1,5 4 -,5 6,5 3 3 0 0 3 1,5 5-3,5 1,5 4 4 1 3 9 5 5 3 9 6 d 6 * 36, 50 1 5. 5 1 0 36,50 R 1 1 0, 85 3
19/10/017 Một chuê ga được Loạ rượu Hươg vị Gá tề êu cầu ếm thử 8 A 1,49 loạ rượu có gá dướ B,99 4 $. Hươg vị các loạ C 3 3,49 rượu được xếp hạg D 4,99 từ 1 (dở hất) đế 8 E 5 3,59 (go hất). Bảg F 6 3,99 tổg hợp xếp hạg và G 7 3,99 gá cả các loạ rượu H 8,99 hư sau: Hã tíh hệ số tươg qua hạg Spearma và cho kết luậ Ta lập bảg sau: Loạ rượu A B C D E F G H Hạg hươg vị Hạg gá tề Hệu số Hệu số bìh phươg 0 36,50 Phâ tích hồ qu Phâ tích hồ qu được sử dụg để xác địh mố lê hệ gữa: Một bế phụ thuộc (bế được gả thích) Một ha hều bế độc lập X1, X,,X (cò được gọ là bế gả thích) Bế phụ thuộc phả là bế lê tục Các bế độc lập X1, X,, X có thể là bế lê tục, rờ rạc ha phâ loạ. Lê hệ hàm số và lê hệ thốg kê Lê hệ hàm số: =ax+b Vớ một gá trị của X, có 1 gá trị du hất của Lê hệ thốg kê: =ax+b : X: thờ ga tự học; : đểm cuố kỳ Một gá trị của X có thể có hều gá trị của Dữ lệu X: dữ lệu mẫu Dữ lệu mẫu tìm đườg hồ qu mẫu dự đoá cho đườg hồ qu tổg thể. Một côg t muố ước lượg hàm ch phí cho một sả phẩm. Gá trị của hàm ch phí được xác địh tạ một và mức sả xuất hư sau. Mặc dù hữg đểm qua sát khôg cùg ằm trê một đườg thẳg hưg tươg qua tuế tíh rất mạh Côg t muố xấp xỉ hàm ch phí bằg một hàm tuế tíh: a. x b Ta cầ xác địh các hệ số a, b sao cho đườg thẳg trê xấp xỉ tốt hất cho hàm ch phí. 4
19/10/017 Thặg dư (resdual) Tổg bìh phươg thặg dư, 4 6 5 7 6 8 9 F a b a b a b a b a b F 304 9a 44b F 50 44a 8b a b A F 9 B F 44 C F 8 aa ab bb AC B 9 * 8 44 0 Ta cầ xác địh a, b sao cho tổg bìh phươg thặg dư hỏ hất. Đểm dừg: M(0,58; 3,06) Hàm số F(a,b) đạt cực tểu tạ M. Phươg trìh hồ qu Vậ phươg trìh cầ tìm là: 0, 58x 3, 06 Dự đoá: Ch phí kh sả xuất 000 sả phẩm? Hàm ch phí bê? Hàm ch phí trug bìh? Số lệu về doah số và số lượg hâ vê kh doah trog các khu vực của côg t X hư sau: Hã tìm mô hìh tuế tíh dự đoá doah số theo số hâ vê kh doah Khu vực Doah số Số hâ vê kh doah A 36 11 B 34 1 C 98 18 D 50 15 E 46 13 F 0 10 Tổg quát Gả sử có qua sát (x 1, 1 ), (x, ),,(x, ) Ta cầ xác địh đườg thẳg =a.x+b sao cho tổg bìh phươg của các thặg dư là hỏ hất. Ha cầ cực tểu hóa hàm số sau: F a, b a. x b Chú ý: a, b: là ha ẩ cầ tìm x k ; k là các gá trị đã bết. k k 1 Tổg quát F a 1 F b a. x b. x k k k a. x b. 1 k k 1 Tìm đểm dừg: a b. x F 0 a x k k x k k k 1 k 1 k 1 x x. F b 0 b x x x x k k k1 k 1 A F x aa B F x ab C F bb k k 1 1 1 5
19/10/017 Tổg quát a b. x k 1 x x k k k 1 b x x k x x Đườg hồ qu luô đ qua đểm ( ; ) x x. Số lệu về doah số và số lượg hâ vê kh doah trog các khu vực của côg t X hư sau: Khu vực Doah số Số hâ vê kh doah A 36 11 B 34 1 C 98 18 D 50 15 E 46 13 F 0 10 Hã tìm mô hìh tuế tíh dự đoá doah số theo số hâ vê kh doah Ý ghĩa các hệ số hồ qu Hệ số tươg qua Pearso: r=0,948 Gữa doah số và số hậ vê kh doah có tươg qua tuế tíh mạh; có thể gả sử doah số phụ thuộc tuế tíh theo số lượg hâ vê kh doah Chú ý Phươg pháp trê gọ là hồ qu tuế tíh Phươg pháp bìh phươg thặg dư hỏ hất có thể áp dụg đố vớ các dạg hàm khác hư: hàm bậc ; bậc 3; bậc 4; logart; hàm mũ và hàm lũ thừa Trog trườg hợp đó ta có các tê gọ hồ qu tươg ứg Ứg dụg kh tế Nhu cầu sử dụg dầu hê lệu để sưở ấm hà ở Hoa Kỳ đã gảm đều đặ trog hều thập kỷ. Bảg sau lệt kê tỷ lệ hộ ga đìh ở Hoa Kỳ sưở ấm bằg dầu hê lệu từ 1960 đế 009. Sử dụg hồ qu tuế tíh để ước lượg tỷ lệ hộ ga đìh sử dụg dầu hê lệu vào ăm 1995 Đáp số: 1,44% 6
19/10/017 Thực hàh Excel Hồ qu tuế tíh Vấ đề: có ha bế qua sát X và Ta cầ tìm phươg trìh thể hệ mố lê hệ gá trị gữa và X : bế phụ thuộc; X: bế độc lập Dùg mô hìh hồ qu đơ gả hất: hồ qu tuế tíh Có thể sử dụg các mô hìh khác: ph tuế; bậc ; bậc 3; mũ; logart Hồ qu tuế tíh X và có tươg qua tuế tíh mạh Ta gả sử X và có mố qua hệ tuế tíh vớ hau. Mô hìh hư sau: b b x u 1 β1 hệ số chặ (tercept) β: hệ số góc (slope) u: sa số gẫu hê (hễu gẫu hê, hễu trắg) Hồ qu tuế tíh Vớ gá trị qua sát được ta có: b b x u 1 : gá trị qua sát được của kh X hậ gá trị là x. x : gá trị qua sát thứ của X. u : sa số gẫu hê kh X hậ gá trị x. Gả địh về mô hìh Gả thết 1: Các gá trị X được xác địh trước và khôg phả là đạ lượg gẫu hê. Gả thết : Kỳ vọg hoặc trug bìh số học của các sa số là bằg 0 (zero codtoal mea), ghĩa là E = 0 Gả thết 3: Các sa số có phươg sa bằg hau (homoscedastct). V = σ Gả địh về mô hìh Mh họa gả địh 3 7
19/10/017 Gả địh về mô hìh Gả thết 4: Các sa số qua, ghĩa là khôg có sự tươg Cov(, ) = E( ) = 0, ếu j Gả thết 5: Các sa số độc lập vớ bế gả thích. Cov(, X ) = 0 Gả thết 6: Đạ lượg sa số gẫu hê có phâ phố chuẩ ~ N(0, σ ) Hàm hồ qu tổg thể Hàm hồ qu tổg thể 1 E X X X X 1 Đố vớ một qua sát cụ thể ta có: X u 1 Mô hìh chỉ có một bế phụ thuộc và một bế gả thích X. và gọ là hệ số chặ (tercept) và hệ số góc (slope) của đườg thẳg hồ qu. Hàm hồ qu mẫu SRF Ta ít kh có số lệu của cả tổg thể mà chỉ có số lệu của mẫu (số lệu qua sát được) Ta dùg số lệu mẫu để ước lượg tổg thể Hàm hồ qu mẫu: PRF và SRF bˆ b SRF PRF Đố vớ qua sát thứ : X 1 X u 1 b 1 bˆ 1 Hệ số hồ qu trog hàm hồ qu PRF và SRF X 46 Trog đó PRF và SRF là ước lượg cho b 1. là ước lượg cho b. là ước lượg cho ha E( X) Ta sử dụg phươg pháp bìh phươg hỏ hất thôg thườg (OLS) để tìm ; Hồ qu tổg thể và hồ qu mẫu Mô hìh hồ qu tổg thể Đườg hồ qu tổg thể Mô hìh hồ qu mẫu Đườg hồ qu mẫu Dạg tổg quát b b x u 1 b b x 1 b b x u 1 b b x 1 Đố vớ qua sát thứ 47 b b x u 1 b b x b b x 1 b b x u 1 1 8
19/10/017 Hệ số β1 Hệ số β Phươg sa sa số Hệ số Hệ số Phươg sa thặg dư mẫu Chú ý Tìh trạg Bệ pháp Tham số Ước lượg Khôg xác địh được Kểm địh chíh xác gá trị Bế gẫu hê Có thể tíh được gá trị trê mẫu đã chọ Dùg để ước lượg cho các tham số tổg thể Ước lượg OLS Tìm gá trị của β1; β sao cho: u x 1 1 1 Đạt gá trị hỏ hất (pp bìh phươg tố thểu) Dễ thấ: x. x. x ; x x. 1 x x x x x x 1 1 x x x 1 Hệ số hồ qu mẫu Là các ước lượg của β1; β Dạg bểu dễ khác: x x x x 1 c ; c 1 x x x x x 1 1 1 Một số tíh chất Gá trị trug bìh các hệ số hồ qu mẫu: E ; E 1 1 Phươg sa các hệ số hồ qu mẫu: 1 x V 1 V x x x x 1 1 Ta dùg các kết quả trê để ước lượg gá trị của các hệ số hồ qu tổg thể β1; β Nhưg gá trị của chưa xác địh. Một và tíh chất Một và tíh chất Kỳ vọg và phươg sa của gá trị hồ qu 1 E 0 x0 0 V 0 x0 1 x x 1 V 0 0 1 x x0 1 x x x u b b x 0 1 1 1 u 0 1 1 1 1 Chú ý số 1 9
19/10/017 Ký hệu Để thuậ tệ ta ký hệu hư sau: S x x S x x xx x 1 1 S??? S??? S??? xu u S x ; 1 x; E 1 ; E S xx 1 x V V 1 S S xx xx 1 Ký hệu 1 x0 x 1 x0 x V 0 ; V 0 0 1 S S xx xx Tách hóm bế thê: khá ệm TSS = tổg của các mức độ khác bệt bìh phươg gữa từg gá trị và trị số trug bìh của. ESS = tổg của các mức độ khác bệt bìh phươg gữa các gá trị qua sát và gá trị dự đoá của. RSS = tổg của các mức độ khác bệt bìh phươg gữa gá trị dự đoá của và trị số trug bìh của. Đo sự bế thê của dữ lệu Tổg bìh phươg toà phầ (Total Sum of Squares) 1 TSS Tổg bìh phươg hồ qu (Regresso Sum of Squares) RSS 1 Tổg bìh phươg sa số (Resdual Sum of Squares) 1 ESS Các tổg bìh phươg độ lệch RSS 1 RSS ESS SRF X X Ý ghĩa hìh học của TSS, RSS và ESS Tổg chêh lệch 1 TSS 1 ESS 59 Các tổg bìh phươg độ lệch Kh đểm qua sát càg gầ đườg thẳg ước lượg thì độ thích hợp càg cao, có ghĩa là ESS càg hỏ và RSS càg lớ. Tham số đo độ thích hợp: R càg lớ càg tốt = 0 R 1 ESS: bế thê khôg gả thích được RSS: bế thê gả thích được R hỏ ghĩa là hều bế thê của khôg gả thích được bằg X. Cầ phả thêm hều bế khác vào mô hìh. 10
19/10/017 Hệ số xác địh Coeffcet of determato Là tỷ lệ của tổg sự bế thê trog bế phụ thuộc gâ ra bở sự bế thê của các bế độc lập (bế gả thích) so vớ tổg sự bế thê toà phầ. Tê gọ: R_bìh phươg (R squared) Ký hệu: RSS R TSS Dễ thấ: 0 R 1 Hệ số xác địh Đáh gá mô hìh tìm được có gả thích tốt cho mố lê hệ gữa bế phụ thuộc và bế độc lập X ha khôg. Là bìh phươg của hệ số tươg qua mẫu R R RSS x x x x TSS r X Tíh chất của hệ số xác địh R 0 R 1 Cho bết % sự bế độg của được gả thích bở các bế số X trog mô hìh. R =1: đườg hồ qu phù hợp hoà hảo R =0: X và khôg có qua hệ R càg lớ càg tốt Đố vớ dữ lệu chuỗ thờ ga thì R thườg lớ hơ 0,9. Nếu thấp hơ 0,6 ha 0,7 thì xem là thấp Vớ dữ lệu chéo thì R khoảg 0,6 ha 0,7 cũg chưa hẳ thấp Ước lượg cho phươg sa sa số u 1 E Eu E 1 1 Đặt u 1 ˆ ESS Ta dùg đạ lượg à để xấp xỉ cho phươg sa sa số 63 Ước lượg và dự báo 1. Ước lượg hệ số góc. Ước lượg hệ số chặ 3. Ước lượg phươg sa sa số 4. Dự báo gá trị trug bìh 5. Dự báo đểm Côg thức ước lượg β1 Khoảg t cậ (1 ) của hệ số b 1 ; 1 1 1 1 Trog đó: 1 =.. + = 11
19/10/017 Côg thức ước lượg β Khoảg t cậ (1 ) của hệ số b ; Trog đó: = 1.. = Côg thức ước lượg Khoảg t cậ của phươg sa sa số tổg thể: ESS / 1 / ; ESS Dự báo Cho X hậ gá trị là x0. Ta tế hàh dự báo: Trug bìh của kh X = x0. Ký hệu: 0 Gá trị cụ thể của kh X = x0. Ký hệu: E(0 X0) Côg thức chug: Gá trị ước lượg ± Sa số Dự báo gá trị 0 Khoảg t cậ mức 1 cho gá trị thực của 0: ; 0 0 1 0 1 t. SE( ) 1 / 0 0 1 x0 x SE( 0 0 ) 1 S xx Dự báo gá trị E(/X0) Khoảg t cậ mức 1 cho gá trị thực của 0: Vớ: E( / X ) ( ; ) 0 0 0 t. SE( ) / 0 Bổ sug kế thức về phâ phố xác suất Phâ phố chuẩ Phâ phố Studet Phâ phố Kh bìh phươg 1 x x0 SE( ) 0 S xx 1
19/10/017 Phâ vị mức alpha và cách xác địh Vớ phâ phố chuẩ Vớ phâ phố Studet Vớ phâ phố Kh bìh phươg Gá trị tớ hạ (; α) Gá trị tớ hạ mức α (0 1) là số thực ký hệu (; ) sao cho vớ Z~ () thì: P Z ; ; 74 Bảg gá trị tớ hạ Kh bìh phươg 5 Cho Z Tìm các xác suất sau: 0 Z a) P Z a 0,95 ha 0;0,95 b) P Z 8,604? c) P 10,8508 31, 4104? 75 76 Gá trị tớ hạ (, ) Bảg gá trị tớ hạ Studet Gá trị tớ hạ mức α (0 1) là số thực ký hệu (, ) sao cho vớ Z~ () thì: P Z t t ; ;0 ;1 t 0 t t ;0,5 ;1 ; t; Z t 77 78 13
19/10/017 Cho Z t 6 Tìm các gá trị tớ hạ và xác suất sau: 15 15;0,05 15;0,975 a) P Z a 0, 05 ha t? b) P Z, 60? c) P,0343 Z,9467? d) P Z b 0,975 ha t? Qua sát sự bế độg của hu cầu gạo (tấ/thág) vào đơ gá X (gà đồg/kg) ta được các số lệu cho ở bảg. Hã lập mô hìh hô qu mẫu bễu dễ mố phụ thuộc về hu cầu vào đơ gá gạo X 1 4 5 5 7 10 6 9 5 4 79 Ta lập bảg sau: Stt X X X^ 1 1 10 10 1 4 6 4 16 3 9 18 4 4 5 5 5 5 5 5 4 0 5 6 7 14 49 sum 4 36 111 10 4 36 X 4 6 6 6 X. X. ˆ 111 6.4.6 b 1,375 1 10 6.(4) X.( X ) 1 ˆ b ˆ b X 6 ( 1,375).4 11,5 1 ˆ 11,5 1,375. X Nhậ xét ˆ 11,5 1,375. X và có qua hệ ghịch bế X = 11,5 ê hu cầu tố đa là 11,5 tấ/thág = 1,375 ê kh gá tăg 1000 đồg/kg thì hu cầu trug bìh sẽ gảm 1,375 tấ/thág vớ các ếu tố khác trê thị trườg khôg đổ. Gả hồ qu bằg má tíh 1. Bật tầ số: Shft+Mode+ +4+1 (Freq O. Chọ Mode Regresso: Mode+3+(chọ A+Bx) 3. Nhập dữ lệu theo cột 4. Kểm tra và hấ AC thoát 5. Xem kết quả: Shft +1+ 3,4,5 (tù theo Sum, Var ha Reg) 84 14
19/10/017 Bà tập 1 Thu thập số lệu về đểm học tập của học sh và mức thu hập hàg ăm của bố mẹ ta có bảg số lệu sau: X 45 60 30 90 75 45 105 60 8,75 7,5 6,5 8,75 7,5 5,0 9,5 6,5 Hã tìm hàm hồ qu mẫu và tíh các đặc trưg của ó X: thu hập (trệu/ăm) : đểm trug bìh 85 Bà tập 1 X 45 60 30 90 75 45 105 60 8,75 7,5 6,5 8,75 7,5 5,0 9,5 6,5 b) Vớ độ t cậ 95% hã ước lượg hệ số chặ, hệ số góc và phươg sa sa số. c) Vớ độ t cậ 90%, dự đoá đểm và đểm trug bìh kh thu hập là 80 86 Bà tập Số lệu về tỷ lệ lạm phát và lã suất trog ăm 011 của 6 quốc ga hư sau: Lã suất (%) 7 11 0 10 16 14 Lạm phát X (%) 3 8 17 8 1 1 a) Ước lượg và vết phươg trìh hồ qu tuế tíh = 1 + + b) Tìm hệ số xác địh và gả thích ý ghĩa c) Dự đoá lã suất trug bìh kh lạm phát là 10%. 87 15