Y i = β 1 + β 2 X 2i + + β k X ki + U i

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Y i = β 1 + β 2 X 2i + + β k X ki + U i"

Transcript

1 KHOA KINH TẾ VÀ KẾ TOÁN BỘ MÔN TOÁN KINH TẾ HOÀNG MẠNH HÙNG BÀI GIẢNG KINH TẾ LƯỢNG Y i = β 1 + β 2 X 2i + + β k X ki + U i Bình Định, tháng 9/2016

2 51 89/ Mã số HP: GD-05

3 Mục lục KHÁI QUÁT VỀ KINH TẾ LƯỢNG KINH TẾ LƯỢNG LÀ GÌ Một số quan điểm về kinh tế lượng Nền tảng của kinh tế lượng Mục đích của kinh tế lượng PHƯƠNG PHÁP LUẬN NGHIÊN CỨU CỦA KINH TẾ LƯỢNG Nêu vấn đề lý thuyết cần nghiên cứu và các giả thuyết Thiết lập mô hình Thu thập, xử lý số liệu Ước lượng các tham số của mô hình Phân tích, kiểm định mô hình Sử dụng mô hình: dự báo, ra quyết định SỐ LIỆU CHO NGHIÊN CỨU KINH TẾ LƯỢNG Nguồn số liệu Các loại số liệu Hạn chế của số liệu Chương 1. MÔ HÌNH HỒI QUY TUYẾN TÍNH HAI BIẾN MÔ HÌNH VÀ MỘT SỐ KHÁI NIỆM Mô hình hồi quy Hàm hồi quy tổng thể Hàm hồi quy mẫu Tính tuyến tính trong mô hình hồi quy PHƯƠNG PHÁP ƯỚC LƯỢNG OLS TÍNH KHÔNG CHỆCH VÀ ĐỘ CHÍNH XÁC CỦA ƯỚC LƯỢNG OLS Các giả thiết của phương pháp OLS Tính không chệch của các ước lượng OLS Độ chính xác của các ước lượng OLS Một số tính chất của hàm hồi quy mẫu ĐỘ PHÙ HỢP CỦA HÀM HỒI QUY MẪU - HỆ SỐ XÁC ĐỊNH R MÔ HÌNH HỒI QUY QUA GỐC TỌA ĐỘ MỘT SỐ VẤN ĐỀ BỔ SUNG Hồi quy và đơn vị đo của biến Hồi quy với phần mềm Eviews

4 ii Mục lục Chương 2. MÔ HÌNH HỒI QUY BỘI MÔ HÌNH HỒI QUY BỘI MÔ HÌNH HỒI QUY SỬ DỤNG NGÔN NGỮ MA TRẬN PHƯƠNG PHÁP ƯỚC LƯỢNG OLS ĐỘ PHÙ HỢP CỦA HÀM HỒI QUY TÍNH TỐT NHẤT CỦA ƯỚC LƯỢNG OLS MỘT SỐ DẠNG CỦA MÔ HÌNH HỒI QUY Mô hình logarit kép (log - log) Mô hình bán logarit Mô hình nghịch đảo Mô hình hồi quy đa thức Chương 3. SUY DIỄN THỐNG KÊ QUY LUẬT PHÂN PHỐI XÁC SUẤT CỦA MỘT SỐ THỐNG KÊ MẪU KHOẢNG TIN CẬY CHO CÁC HỆ SỐ HỒI QUY Khoảng tin cậy cho một hệ số hồi quy: đánh giá tác động khi một biến độc lập thay đổi Khoảng tin cậy cho biểu thức của hai hệ số hồi quy: đánh giá tác động khi hai biến độc lập cùng thay đổi Khoảng tin cậy của phương sai sai số ngẫu nhiên Ý nghĩa của khoảng tin cậy KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐ HỒI QUY Kiểm định giả thuyết về một hệ số hồi quy Kiểm định giả thuyết về một ràng buộc giữa các hệ số hồi quy Kiểm định giả thuyết về nhiều ràng buộc giữa các hệ số hồi quy Kiểm định sự phù hợp của hàm hồi quy So sánh kiểm định T và kiểm định F KIỂM ĐỊNH GIẢ THUYẾT VỀ PHƯƠNG SAI SAI SỐ NGẪU NHIÊN DỰ BÁO GIÁ TRỊ CỦA BIẾN PHỤ THUỘC VÀ SAI SỐ DỰ BÁO Dự báo giá trị của biến phụ thuộc Đánh giá sai số dự báo Chương 4. MÔ HÌNH VỚI BIẾN GIẢ VÀ ỨNG DỤNG BẢN CHẤT CỦA BIẾN GIẢ - MÔ HÌNH TRONG ĐÓ BIẾN ĐỘC LẬP ĐỀU LÀ BIẾN GIẢ MÔ HÌNH VỚI BIẾN ĐỘC LẬP BAO GỒM BIẾN ĐỊNH LƯỢNG VÀ BIẾN ĐỊNH TÍNH Mô hình với một biến định lượng và một biến định tính Hồi quy với một biến định lượng và hai biến định tính Kiểm định sự khác biệt giữa hàm hồi quy của hai nhóm

5 Mục lục iii 4.3 SỬ DỤNG BIẾN GIẢ TRONG PHÂN TÍCH MÙA HỒI QUY TUYẾN TÍNH TỪNG KHÚC HỒI QUY VỚI BIẾN GIẢ - MÔ HÌNH SEMI LOGARIT Mô hình Log - Lin Mô hình Lin - Log Chương 5. PHÂN TÍCH ĐẶC TRƯNG CÁC THUỘC TÍNH CỦA MÔ HÌNH TỐT CÁC TIÊU CHUẨN ĐỂ LỰA CHỌN MÔ HÌNH CÁC LOẠI SAI SỐ ĐẶC TRƯNG VÀ HẬU QUẢ Sai số đặc trưng mô hình do bỏ sót biến thích hợp Sai số đặc trưng mô hình do có biến không cần thiết Sai số đặc trưng mô hình do chấp nhận dạng hàm sai Sai số đặc trưng mô hình do có sai số trong đo lường CÁCH PHÁT HIỆN CÁC SAI SỐ ĐẶC TRƯNG MÔ HÌNH Kiểm định bỏ sót biến Kiểm định thừa biến Kiểm định dạng mô hình hồi quy phù hợp (MWD test) - Chọn lựa giữa mô hình tuyến tính và mô hình tuyến tính logarit MÔ HÌNH KHÔNG LỒNG NHAU Phương pháp tiếp cận so sánh Phương pháp tiếp cận loại trừ Chương 6. MÔ HÌNH VI PHẠM CÁC GIẢ THIẾT KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG Nguyên nhân Hậu quả của kỳ vọng sai số ngẫu nhiên khác không Cách phát hiện kỳ vọng sai số ngẫu nhiên khác không Một số biện pháp khắc phục SAI SỐ NGẪU NHIÊN KHÔNG TUÂN THEO QUY LUẬT CHUẨN Hậu quả khi sai số ngẫu nhiên không tuân theo quy luật chuẩn Cách phát hiện sai số ngẫu nhiên không tuân theo quy luật chuẩn ĐA CỘNG TUYẾN Bản chất và nguyên nhân của đa cộng tuyến Ước lượng các tham số khi có đa cộng tuyến Hậu quả của đa cộng tuyến Cách phát hiện đa cộng tuyến Cách khắc phục đa cộng tuyến PHƯƠNG SAI SAI SỐ THAY ĐỔI Bản chất và nguyên nhân của phương sai thay đổi

6 iv Mục lục Hậu quả của phương sai thay đổi Cách phát hiện phương sai thay đổi Cách khắc phục phương sai thay đổi TỰ TƯƠNG QUAN Bản chất và nguyên nhân của hiện tượng tự tương quan Hậu quả của tự tương quan Cách phát hiện tự tương quan Các biện pháp khắc phục tự tương quan Tài liệu tham khảo Phụ lục các bảng số thống kê

7 KHÁI QUÁT VỀ KINH TẾ LƯỢNG 0.1 KINH TẾ LƯỢNG LÀ GÌ Một số quan điểm về kinh tế lượng Kinh tế lượng được dịch từ chữ Econometrics có nghĩa là đo lường kinh tế. Thuật ngữ này do A.K Ragnar Frisch (giáo sư kinh tế học người Nay Uy, được giải thưởng Nobel về kinh tế năm 1969) sử dụng lần đầu tiên vào khoảng năm Năm 1936, Tinbergen, người Hà Lan trình bày trước hội đồng kinh tế Hà Lan một mô hình kinh tế lượng đầu tiên, mở đầu cho một phương pháp nghiên cứu mới về phân tích kinh tế. Năm 1937, ông xây dựng một số mô hình tương tự cho nước Mỹ. Năm 1950, nhà kinh tế được giải thưởng Nobel là Lawrance Klein đã đưa ra một số mô hình mới cho nước Mỹ và từ đó kinh tế lượng được phát triển trên phạm vi tồn thế giới. Tuy nhiên, phạm vi ứng dụng thì rộng hơn nhiều. Một số quan điểm về kinh tế lượng có thể được trình bày vắn tắt như sau: + Kinh tế lượng là khoa học nghiên cứu những vấn đề thực nghiệm của kinh tế. + Kinh tế lượng vận dụng thống kê toán kết hợp với số liệu kinh tế để tìm kết quả bằng số của các mô hình toán do những nhà kinh tế đề xuất. + Kinh tế lượng là một phương pháp phân tích định lượng các vấn đề kinh tế dựa vào việc vận dụng đồng thời lý thuyết và thực tế, kết hợp các phương pháp suy đốn thích hợp. + Kinh tế lượng là tập hợp các công cụ nhằm mục đích dự báo các biến kinh tế. Tóm lại, kinh tế lượng là một môn khoa học về đo lường các mối quan hệ kinh tế diễn ra trong thực tế. Kinh tế lượng ngày nay là sự kết hợp giữa các lý thuyết kinh tế hiện đại, thống kê toán học và máy vi tính nhằm định lượng các mối quan hệ kinh tế, dự báo khả năng phát triển hay diễn biến của các hiện tượng kinh tế và phân tích các chính sách kinh tế.

8 2 Khái quát về kinh tế lượng Nền tảng của kinh tế lượng + Lý thuyết kinh tế (kinh tế vi mô, kinh tế vĩ mô,...): lý thuyết kinh tế phát biểu hay nêu lên bản chất các mối quan hệ kinh tế dưới góc độ định tính. Thí dụ như lý thuyết kinh tế vi mô khẳng định rằng trong điều kiện các yếu tố khác không thay đổi, lượng cầu của một loại hàng hóa có quan hệ nghịch biến với giá của nó nhưng không xác định rõ về mặt định lượng. Với một sự thay đổi nhất định về giá, lượng cầu sẽ thay đổi với số lượng cụ thể bao nhiêu là công việc của kinh tế lượng. + Mô hình toán kinh tế: Các nhà toán học có thể mô hình hóa lý thuyết kinh tế dưới dạng mô hình toán, nhưng không quan tâm đến việc kiểm chứng những mô hình lý thuyết kinh tế đó bằng thực nghiệm. Các nhà kinh tế lượng có nhiệm vụ sử dụng các phương trình toán học này, kết hợp với việc kiểm chứng thực nghiệm. + Thống kê: Thống kê có một vai trò quan trọng trong việc thu thập, xử lý, trình bày số liệu, nhưng các nhà thống kê không quan tâm tới việc sử dụng các số liệu thu thập để kiểm định các lý thuyết kinh tế như thế nào. Tuy nhiên, những số liệu này trở thành số liệu thô rất cần thiết đối với nhà kinh tế lượng Mục đích của kinh tế lượng Thiết lập các mô hình toán học để mô tả các mối quan hệ kinh tế, tức là nêu ra các giả thuyết hay giả thiết về các mối quan hệ này giữa các biến số kinh tế; Ước lượng các tham số nhằm nhận được số đo về mức ảnh hưởng của các biến số; Kiểm định tính vững chắc của các giả thuyết đó; Sử dụng các mô hình đã được kiểm định để đưa ra các dự báo, dự đoán và mô phỏng các hiện tượng kinh tế; Đề xuất chính sách dựa trên các phân tích và báo cáo. 0.2 PHƯƠNG PHÁP LUẬN NGHIÊN CỨU CỦA KINH TẾ LƯỢNG Ta có thể minh họa quá trình xây dựng và áp dụng mô hình kinh tế lượng bằng sơ đồ trong hình Nêu vấn đề lý thuyết cần nghiên cứu và các giả thuyết Vấn đề nghiên cứu có thể xuất phát từ thực tế hoặc dựa trên cơ sở lý thuyết kinh tế. Các giả thuyết nghiên cứu cũng có thể được xây dựng từ kinh nghiệm thực tế hoặc từ kết quả của những nghiên cứu trước đó. Kết quả của bước này là ta phải xác định được các biến kinh tế và mối quan hệ giữa các biến đó. Thí dụ, khi nghiên cứu mối quan hệ giữa mức tiêu dùng và thu nhập của các

9 Khái quát về kinh tế lượng 3 Hình 0.1 Phương pháp luận nghiên cứu kinh tế lượng hộ gia đình, theo kinh tế học vi mô ta có thể nêu giả thuyết: mức tiêu dùng của các hộ gia đình có mối quan hệ phụ thuộc cùng chiều với thu nhập khả dụng của các hộ gia đình. Trên cơ sở lý thuyết này, chúng ta xác định được có hai biến số cần khảo sát, đó là thu nhập và tiêu dùng. Khi thu nhập thay đổi một đơn vị thì chúng ta muốn xác định (hay ước lượng) xem tiêu dùng sẽ thay đổi như thế nào (cụ thể là bao nhiêu đơn vị). Một người nghiên cứu cầu về tiền, anh ta nhận ra rằng: khi mức lãi suất thay đổi thì hai tháng sau đó lượng tiền về cầu mới thay đổi. Anh ta nêu ra giả thuyết: thay đổi lãi suất không tác động ngay đến cầu về tiền mà sau đó hai tháng chính sách này mới ảnh hưởng đến cầu về tiền. Để xem xét vấn đề này, ta cần có mô hình để ước lượng và kiểm định. Đầu ra của một ngành phụ thuộc vào hai nhân tố cơ bản là vốn và lao động. Người ta cần biết với tình hình hiện tại thì mở rộng quy mô có dẫn đến tăng hiệu quả sản xuất không và muốn dự tính đầu ra dựa trên các dự tính về vốn và lao động. Trong trường hợp này dùng mô hình kinh tế lượng để ước lượng một hàm sản xuất. Từ hàm này sẽ có câu trả lới xác đáng cho các câu hỏi được đặt ra Thiết lập mô hình Thiết lập mô hình toán học để mô tả quan hệ giữa các biến kinh tế. Lý thuyết kinh tế cho biết quy luật về mối quan hệ giữa các biến kinh tế nhưng không nêu

10 4 Khái quát về kinh tế lượng cụ thể dạng hàm. Kinh tế lượng phải dựa vào các học thuyết kinh tế để định dạng các mô hình cho các trường hợp cụ thể. Chẳng hạn, khi nghiên cứu mối quan hệ giữa thu nhập và tiêu dùng ta có thể dùng hàm tuyến tính để diễn tả mối quan hệ này như sau: Y = β 1 + β 2 X (1) trong đó: biến Y : tiêu dùng (Consumption); biến X : thu nhập (Income); β 1, β 2 : các tham số hồi quy (là những giá trị ta cần xác định). Tuy nhiên, mô hình toán nêu trên không phản ánh được tình huống trong thực tế, đó là cùng với một mức thu nhập thì chi tiêu cho tiêu dùng vẫn có thể khác nhau hay nói cách khác, với cùng giá trị của X, ta có thể có nhiều giá trị khác nhau của Y. Vì các mối quan hệ giữa các biến kinh tế nói chung là không chính xác nên mô hình toán học thuần túy như vậy còn bị hạn chế. Do đó, nhà kinh tế lượng đề xuất mô hình kinh tế lượng như sau: Y = β 1 + β 2 X + U (2) So với mô hình toán (1) thì trong mô hình kinh tế lượng (2) có sự xuất hiện của thành phần U và ta gọi là số hạng nhiễu (hay sai số ngẫu nhiên). U là một biến ngẫu nhiên, đại diện cho các yếu tố khác ngồi yếu tố thu nhập cũng tác động lên tiêu dùng mà ta chưa phát hiện hoặc vì để cho đơn giản ta đã không đưa vào mô hình. Thí dụ như hồn cảnh gia đình, sở thích, tập quán tiêu dùng,... cũng ảnh hưởng đến hành vi chi tiêu tiêu dùng nhưng không được xét tới trong mô hình. Xét một ví dụ khác, trong trường hợp hàm sản xuất nói trên, có thể định dạng mô hình kinh tế lượng như sau: Với Y là sản lượng của ngành; K là vốn và L là lao động. Khi đó, dựa trên hàm sản xuất Cobb-Douglas có thể đề xuất mô hình sau: Y = β 1 K β2 L β3 e U β 1, β 2, β 3 là các tham số; β j > 0, j = 1, 2, Thu thập, xử lý số liệu Để ước lượng mô hình kinh tế lượng, chúng ta cần tới số liệu. Trong thống kê toán và kinh tế lượng, người ta phân biệt số liệu của tổng thể và số liệu của mẫu. Số liệu của tổng thể là số liệu của tồn bộ các đối tượng ta nghiên cứu. Số liệu mẫu là số liệu về một tập hợp con của tổng thể. Thí dụ, để nghiên cứu về nhu cầu của một loại hàng hóa nào đó thì số liệu tổng thể là số liệu về lượng hàng hóa được mua của tất cả các khách hàng mua loại hàng này. Trong thực tế ta thường không có điều kiện để thu thập các số liệu của tổng thể mà chỉ thu thập các số liệu của mẫu.

11 Khái quát về kinh tế lượng Ước lượng các tham số của mô hình Các tham số của mô hình kinh tế lượng, xét về bản chất là những giá trị số cố định nhưng chưa biết của tổng thể. Ta có thể ước lượng chúng dựa trên số liệu mẫu đã được thu thập. Có nhiều phương pháp để ước lượng các tham số của mô hình, như là phương pháp bình phương nhỏ nhất thông thường (OLS - Ordinary Least Squares), phương pháp ước lượng hàm hợp lý tối đa, phương pháp ước lượng bình phương nhỏ nhất có trọng số, phương pháp bình phương nhỏ nhất hai giai đoạn,... Trong phạm vi ở đây ta sẽ đề cập đến phương pháp OLS. Ví dụ 1. Nghiên cứu mối quan hệ thu nhập - tiêu dùng ta có thể sử dụng số liệu về tổng sản phẩm quốc nội (GDP) để đại diện cho biến thu nhập, số liệu chi tiêu cho tiêu dùng đại diện cho biến tiêu dùng. Bảng 0.1 là số liệu GDP (X) và tiêu dùng cá nhân (Y ) cho Việt Nam giai đoạn từ Năm X Y Năm X Y Năm X Y Bảng 0.1 GDP và tiêu dùng cá nhân Với số liệu đã cho, sử dụng phương pháp OLS ta ước lượng các tham số, ta được kết quả ước lượng của mô hình (2) là: Ŷ i = 22090, , 6837X i (3) Trong (3) không có thành phần nhiễu, điều này mang ý nghĩa là nếu loại trừ yếu tố nhiễu ảnh hưởng đến tiêu dùng cá nhân thì tác động của thu nhập, xét về mặt giá trị trung bình, được đo lường theo biểu thức (3) Phân tích, kiểm định mô hình Phân tích, kiểm định mô hình nhắm tới hai vấn đề sau: + Xác định mức độ phù hợp về mặt lý thuyết của mô hình. + Xác định dạng mô hình và chẩn đoán dấu hiệu có thể vi phạm các giả thuyết cổ điển của kinh tế lượng. Trong ví dụ về thu nhập - tiêu dùng ở trên, để phản ánh quan hệ đồng biến giữa thu nhập và tiêu dùng đòi hỏi hệ số β 2 > 0. Mặt khác, gia tăng trong tiêu dùng không nhiều bằng sự gia tăng của thu nhập nên β 2 < 1. Việc đánh giá tham số β 2 có thực sự thỏa điều kiện nằm trong khoảng (0, 1) hay không đòi hỏi phải thông qua việc kiểm định giả thuyết.

12 6 Khái quát về kinh tế lượng Ngoài việc kiểm định mô hình đã được ước lượng ở trên là phù hợp với lý thuyết kinh tế, người ta còn quan tâm đến mức độ thích hợp cũng như các tính chất của một mô hình tốt. Kết quả ở bước này cho biết mô hình kinh tế lượng có tốt không. Nếu phát hiện mô hình không phù hợp thì ta cần quay lại một trong những bước đã nêu ở trên tùy theo sai sót của mô hình do bước nào. Nếu sau khi phân tích, kiểm định ta kết luận được mô hình là phù hợp thì ta có thể sử dụng mô hình để dự báo và đưa ra các quyết định Sử dụng mô hình: dự báo, ra quyết định Công việc dự báo chỉ có ý nghĩa một khi mô hình được đánh giá là tốt. Kết quả dự báo chính xác góp phần hoạch định chính sách một cách đúng đắn cho các nhà quản lý. Giả sử mô hình (3) được đánh giá là tốt. Nếu chúng ta ước tính GDP của Việt Nam năm 2011 là tỉ đồng thì chi tiêu tiêu dùng cá nhân của năm 2011 ước tính xấp xỉ bình quân đạt: Ŷ i = 22090, , = , 98 (tỉ đồng) Tóm lại, quá trình xây dựng và sử dụng mô hình kinh tế lượng đòi hỏi phải có sự hiểu biết trước hết là các lý thuyết kinh tế, sau đó là những kiến thức về toán học nói chung, lý thuyết xác suất và thống kê nói riêng, cuối cùng là các phần mềm chuyên dụng của kinh tế lượng. Các kết quả rút ra từ việc phân tích các mô hình kinh tế lượng cũng đòi hỏi phải được suy xét từ nhiều phía. Chẳng hạn các ước lượng cho thấy có mối quan hệ nhân quả giữa hai chỉ tiêu kinh tế, nhưng điều đó không chứng minh hay khẳng định là trong thực tế có mối quan hệ nhân quả như vậy. Điều khẳng định phải do người nghiên cứu kinh tế lượng suy xét. Từ khi ra đời đến nay, kinh tế lượng đã cung cấp cho các nhà kinh tế một công cụ sắc bén để đo lường mối quan hệ của các biến kinh tế. Ngày nay, phạm vi ứng dụng của kinh tế lượng đã vượt quá phạm vi kinh tế, lan sang các lĩnh vực khác như xã hội học, vũ trụ học, SỐ LIỆU CHO NGHIÊN CỨU KINH TẾ LƯỢNG Thành công của bất kỳ một sự phân tích kinh tế nào đều phụ thuộc vào việc sử dụng các số liệu thích hợp và phụ thuộc vào phương pháp xử lý số liệu đó. Do vậy, phần này sẽ trình bày đôi nét về bản chất, nguồn gốc và những hạn chế của số liệu mà chúng ta sẽ gặp phải trong phân tích kinh tế nói chung và phân tích hồi quy nói riêng.

13 Khái quát về kinh tế lượng Nguồn số liệu + Các cơ quan Nhà nước, đó là các cơ quan kinh tế tổng hợp như: Tổng cục thống kê, Bộ Kế hoạch và Đầu tư, một số bộ ngành khác. + Các cơ quan và tổ chức tư nhân. + Nguồn số liệu rất phong phú của các tổ chức quốc tế: Ngân hàng thế giới (WB), Quỹ tiền tệ quốc tế (IMF), UNESCO, FAO, UNICEF, UNDP, Các loại số liệu + Số liệu chuỗi thời gian (Time Series Data): là số liệu của một hay nhiều biến ở cùng một đơn vị (địa phương) ở những thời kỳ (ngày, tuần, tháng, quý, năm,...) khác nhau. Ví dụ 2. Số lượt khách quốc tế đến Bình Định trong giai đoạn (đơn vị: lượt khách): Năm Số lượt Bảng 0.2 Ví dụ 3. Doanh thu, chi phí quảng cáo, mức lương nhân viên, tốc độ đổi mới công nghệ,... ở một công ty trong khoảng thời gian 1990 đến Số liệu chéo (Cross Data): là các số liệu về một hoặc nhiều biến được thu thập tại một thời điểm ở nhiều địa phương, đơn vị khác nhau. Ví dụ 4. Bảng 0.3 là số dân sơ bộ năm 2011 tại một số tỉnh thành của Việt Nam (đơn vị: nghìn người). Tỉnh Quảng Nam Quảng Ngãi Bình Định Phú Yên Khánh Hòa Dân số 1435, , , 3 871, , 1 Tỉnh Ninh Thuận Bình Thuận Kon Tum Gia Lai Đắc Lắc Dân số 569, , 3 453, , , 8 Bảng Số liệu hỗn hợp (Panel Data hoặc Pooled Cross Data): là số liệu được thu thập ở nhiều địa phương, đơn vị khác nhau ở những thời điểm khác nhau. Ví dụ 5. Bảng 0.4 là giá trị sản xuất công nghiệp theo giá thực tế tại một số tỉnh thành trong 2 năm 2009, 2010 (đơn vị: tỉ đồng) Hạn chế của số liệu Chất lượng của số liệu thu được có thể không tốt, điều này do những nguyên nhân sau đây:

14 8 Khái quát về kinh tế lượng Tỉnh Tỉnh Quảng Nam 15816, , 5 Ninh Thuận 1836, , 1 Quảng Ngãi 25505, , 7 Bình Thuận 7422, , 2 Bình Định 13044, , 7 Kon Tum 1276, , 5 Phú Yên 7286, , 5 Gia Lai 5417, , 5 Khành Hòa 24812, , 6 Đắc Lắc 5133, , 7 Bảng Hầu hết các số liệu thu thập được trong khoa học xã hội đều là các số liệu phi thực nghiệm, do vậy có thể có sai số khi quan sát hoặc bỏ sót quan sát hoặc do cả hai. Ngay với các số liệu thu thập bằng thực nghiệm cũng có sai số của phép đo. + Trong các cuộc điều tra bằng câu hỏi, thường gặp tình trạng đối tượng cung cấp thông tin thiếu trung thực, không nhận được câu trả lời hoặc có trả lời nhưng không trả lời hết các câu hỏi. + Các mẫu điều tra có cỡ mẫu rất khác nhau nên rất khó khăn trong việc so sánh các kết quả giữa các đợt điều tra. + Các số liệu kinh tế thường ở mức tổng hợp cao, không cho phép đi sâu vào các đơn vị nhỏ. + Ngồi ra, còn có những số liệu thuộc bí mật quốc gia mà không phải ai cũng sử dụng được. Do những nhược điểm nói trên và nhiều vấn đề khác, nên các kết quả nghiên cứu thu được chỉ tốt khi chất lượng của số liệu được đảm bảo. Trong một trường hợp cụ thể, người nghiên cứu thấy rằng kết quả nghiên cứu không thỏa mãn thì nguyên nhân có thể không phải sử dụng mô hình sai mà nguyên nhân lại thuộc về chất lượng của số liệu.

15 Chương 1 MÔ HÌNH HỒI QUY TUYẾN TÍNH HAI BIẾN 1.1 MÔ HÌNH VÀ MỘT SỐ KHÁI NIỆM Mô hình hồi quy Mô hình hồi quy hai biến tuyến tính mô tả quan hệ phụ thuộc giữa biến Y và biến X có dạng như sau: Y = β 1 + β 2 X + U (1.1.1) Các thành phần của mô hình hồi quy tuyến tính hai biến: Các biến số: mô hình hồi quy gồm hai loại biến số: + Biến phụ thuộc: là biến số mà ta đang quan tâm đến giá trị của nó, thường được ký hiệu là Y và nằm ở vế trái của phương trình. Biến phụ thuộc còn được gọi là biến được giải thích (explained variable). + Biến độc lập: là biến số được cho là có tác động đến biến phụ thuộc, thường được ký hiệu là X và nằm ở vế phải của phương trình. Biến độc lập còn được gọi là biến giải thích (explanatory variable). Trong mối quan hệ giữa hai biến này, biến phụ thuộc chịu tác động của biến độc lập, biến độc lập là biến gây ảnh hưởng cho biến phụ thuộc. Biến độc lập nhận những giá trị xác định, biến phụ thuộc là những biến ngẫu nhiên. Chẳng hạn, ta xét mối quan hệ giữa giá bán sản phẩm A với mức cầu tương ứng của người tiêu dùng. Khi giá bán sản phẩm A tăng cao, người ta cân nhắc kỹ khi quyết định mua hàng, mức cầu giảm xuống. Ngược lại, khi giá bán sản phẩm A hạ thấp, đôi khi không có nhu cầu người ta vẫn muốn mua, nhu cầu tăng lên. Qua đó, có thể thấy rằng giá bán gây ảnh hưởng lên mức cầu. Vậy giá bán đóng vai trò là biến độc lập, mức cầu là biến phụ thuộc. Sai số ngẫu nhiên: thường được ký hiệu là U, là yếu tố đại diện cho các yếu tố có tác động đến Y ngồi X. Giả thiết được đưa ra là tại mỗi giá trị của X thì kỳ vọng của U bằng 0: E(U X) = 0. Các hệ số hồi quy: bao gồm β 1, β 2, thể hiện mối quan hệ giữa biến X và biến Y khi các yếu tố bao hàm trong U là không đổi Hàm hồi quy tổng thể Với giả thiết E(U X) = 0, ta có thể biểu diễn lại mô hình hồi quy (1.1.1) dưới dạng sau:

16 10 Chương 1: Mô hình hồi quy tuyến tính hai biến E(Y X) = β 1 + β 2 X (1.1.2) Phương trình (1.1.2) biểu diễn kỳ vọng của Y với điều kiện X như một hàm của biến X và do X và Y thể hiện cho tổng thể nên phương trình (1.1.2) còn được gọi là hàm hồi quy tổng thể (PRF: Population Regression Function), cụ thể hơn là hàm hồi quy tổng thể xác định. Ta cũng có thể viết hàm hồi quy tổng thể dưới dạng ngẫu nhiên như sau: Y = β 1 + β 2 X + U (1.1.3) Lúc này các hệ số hồi quy β 1, β 2 còn được gọi là các tham số của tổng thể, có ý nghĩa như sau: + β 1 được gọi là hệ số chặn, nó chính bằng giá trị trung bình của biến phụ thuộc Y khi biến độc lập X nhận giá trị bằng 0 (ý nghĩa này chỉ được giải thích khi biến độc lập có nhận giá trị 0). + β 2 được gọi là hệ số góc, nó thể hiện quan hệ giữa biến độc lập X và giá trị trung bình của biến phụ thuộc Y. β 2 > 0 thì khi biến độc lập X tăng (giảm) một đơn vị thì giá trị trung bình của biến phụ thuộc Y tăng (giảm) β 2 đơn vị. β 2 < 0 thì khi biến độc lập X tăng (giảm) một đơn vị thì giá trị trung bình của biến phụ thuộc Y giảm (tăng) β 2 đơn vị. Ví dụ Khảo sát chi tiêu (Y ) và thu nhập (X) của 60 hộ gia đình trong một khu vực (giả sử đây là một tổng thể) ta có số liệu trong bảng 1.1 (đơn vị $): X Y Trung bình trong nhóm Bảng 1.1 Chi tiêu và tiêu dùng của 60 hộ Từ bảng trên ta xác định được mối quan hệ giữa thu nhập (X) và chi tiêu (Y ) cho tổng thể có thể biểu diễn bởi hàm hồi quy tổng thể: E(Y X) = , 6X (1.1.4)

17 Chương 1: Mô hình hồi quy tuyến tính hai biến 11 Với các giá trị β 1, β 2 đã biết trong (1.1.4) ta có thể đưa ra các kết luận như sau: β 1 = 17 : khi thu nhập bằng 0 thì mức chi tiêu trung bình là 17$/tuần. Khi thu nhập là 150$/tuần thì mức chi tiêu trung bình là 107$/tuần. Đây chính là bài toán dự báo về giá trị trung bình của biến phụ thuộc. β 2 = 0, 6 : nếu thu nhập tăng lên 1$/tuần thì mức chi tiêu trung bình sẽ gia tăng 0, 6$/tuần. Khi thu nhập tăng thì chi tiêu trung bình cũng tăng. Mô hình này phù hợp với kỳ vọng về mối quan hệ giữa chi tiêu với thu nhập. Như vậy, nếu biết được các hệ số hồi quy tổng thể β 1, β 2 thì ta có thể đánh giá tác động của biến độc lập lên giá trị trung bình của biến phụ thuộc và thực hiện dự báo giá trị trung bình của biến phụ thuộc khi biết giá trị của biến độc lập. Để biết giá trị của các hệ số này thì cần số liệu của tồn bộ tổng thể. Tuy nhiên, thông thường thì không có được số liệu cho tồn bộ tổng thể, do đó chỉ có thể ước lượng được giá trị của các hệ số này thông qua số liệu mẫu. Điều này dẫn đến khái niệm hàm hồi quy mẫu được trình bày trong mục tiếp theo Hàm hồi quy mẫu Giả sử có mẫu ngẫu nhiên kích thước n bao gồm các quan sát của biến Y và biến X: (Y i, X i ), i = 1, 2,..., n. Từ mẫu ngẫu nhiên này ta sẽ xây dựng các ước lượng cho các hệ số hồi quy tổng thể β 1 và β 2, ký hiệu tương ứng là β1 và β2. Khi đó, ta gọi biểu diễn (1.1.5) dưới đây là hàm hồi quy mẫu (SRF: Sample Regression Function) cho hàm hồi quy tổng thể (1.1.2): Hay có thể viết cho từng quan sát như sau: Ŷ = β1 + β2 X (1.1.5) Ŷ i = β1 + β2 X i (1.1.5 ) Các dạng trên là dạng xác định của hàm hồi quy mẫu, ta cũng có thể viết hàm hồi quy mẫu dưới dạng ngẫu nhiên như sau: Hay có thể viết cho từng quan sát như sau: Y = β1 + β2 X + Û (1.1.6) Y i = β1 + β2 X i + Û i (1.1.6 ) β 1, β2 được gọi là các hệ số hồi quy mẫu hay hệ số ước lượng, là ước lượng của các hệ số hồi quy tổng thể β 1 và β 2 tương ứng. Ví dụ Giả sử xét mẫu sau được rút trong tổng thể gồm 60 hộ gia đình trong ví dụ

18 12 Chương 1: Mô hình hồi quy tuyến tính hai biến Thu nhập (X) Chi tiêu (Y ) Ta được hàm hồi quy mẫu từ mẫu trên là: Ŷ i = 3, , 68X i Khi đó, ước lượng của β 1 thu được từ mẫu này là 3, 19 và ước lượng của β 2 là 0, 68. Xét một mẫu khác cũng rút ra từ tổng thể 60 hộ gia đình như sau: Thu nhập (X) Chi tiêu (Y ) Ta được hàm hồi quy mẫu từ mẫu trên là: Ŷ i = 6, , 71X i Với mẫu thứ hai, ước lượng của β 1 là 6, 35 và ước lượng của β 2 là 0, 71. Đường hồi quy mẫu và hồi quy tổng thể xác định có thể được minh họa trong hình 1.1. Hình 1.1 PRF và SRF của hồi quy hai biến dạng tuyến tính Từ một tổng thể ta có thể rút ra nhiều mẫu khác nhau, do vậy ta cũng có nhiều giá trị ước lượng β1, β2 của β 1, β 2. Vấn đề là làm thế nào để ước lượng được β1, β2 sao cho gần bằng với giá trị thực của β 1, β 2 (thực tế thường không thể xác định các giá trị thực này). Điều này cũng có nghĩa là trong số nhiều hàm hồi quy mẫu, ta cần tìm ra hàm nào có các tham số hồi quy càng xấp xỉ với các tham số hồi quy của hàm hồi quy tổng thể nhất Tính tuyến tính trong mô hình hồi quy Hàm hồi quy tổng thể luôn được hiểu là hồi quy tuyến tính đối với tham số, nó có thể không phải tuyến tính đối với biến. Trong phạm vi của bài giảng, ta chỉ đề cập đến hồi quy tuyến tính mà thôi.

19 Chương 1: Mô hình hồi quy tuyến tính hai biến 13 Những hàm hồi quy sau là các hàm hồi quy tuyến tính: Y i = β 1 + β 2 1 X i + U i ln Y i = β 1 + β 2 ln X i + U i Y i = β 1 + β 2 ln X i + U i Y i = β 1 + β 2 X i + β 3 X 2 i + U i Các hàm hồi quy sau không được gọi là hàm hồi quy tuyến tính: Y i = 1 β 1 + β 2 X i + U i (1.1.7) Y i = e β1+β2xi + U i (1.1.8) Trong một số trường hợp, ta có thể biến đổi một hàm hồi quy không tuyến tính về dạng tuyến tính bằng các phép biến đổi thích hợp. Chẳng hạn, đối với hàm hồi quy (1.1.7), đặt β = 1 β 1. Đối với hàm hồi quy (1.1.8), lấy ln hai vế ta được ( 1 ) ln 1 = β 1 + β 2 X i + U i. Yi Với các mô hình hồi quy tuyến tính, phương pháp ước lượng thông dụng nhất là phương pháp ước lượng bình phương nhỏ nhất thông thường (OLS) được trình bày trong phần tiếp theo. 1.2 PHƯƠNG PHÁP ƯỚC LƯỢNG OLS Xét hàm hồi quy tổng thể tuyến tính Ta cần ước lượng các hệ số β 1, β 2. Y = β 1 + β 2 X + U (1.2.1) Giả sử có mẫu ngẫu nhiên kích thước n là {(Y i, X i ) (i = 1, 2,..., n)} được rút ra từ tổng thể. Khi đó, tại mỗi quan sát ta có Y i = β 1 + β 2 X i + U i Từ mẫu trên, ước lượng các giá trị của β 1, β 2 ta được hàm hồi quy mẫu như sau: Ŷ i = β1 + β2 X i (1.2.2) Đặt Û i = Y i Ŷ i và được gọi là phần dư (Residuals). Ta có có thể minh họa hàm hồi quy mẫu và phần dư như trong hình 1.2.

20 14 Chương 1: Mô hình hồi quy tuyến tính hai biến Hình 1.2 Đồ thị minh họa phần dư Ta muốn xác định các giá trị β1, β2 sao cho sai lệch tổng hợp giữa các giá trị thực tế Y i và giá trị ước lượng tương ứng từ hàm hồi quy mẫu (1.2.1) là nhỏ nhất. Vì Û i có thể âm hoặc dương nên ta xét n Ûi 2 = i=1 n (Y i Ŷ i ) 2 = i=1 n (Y i β1 β2 X i ) 2 = f( β1, β2 ) i=1 Phương pháp OLS chủ trương xác định β1, β2 thông qua việc giải bài toán cực trị sau đây: Tìm β1, β2 sao cho f( β1, β2 ) đạt giá trị nhỏ nhất. Như vậy, β1, β2 sẽ là nghiệm của hệ phương trình sau: f( β1, β2 ) = 0 β1 f( β1, β2 ) β2 = 0 Giải hệ phương trình ta tìm ra được β1 và β2 theo công thức sau: n x i y i i=1 Xi.Y i nx.y β 2 = = n X 2 i n.(x) 2 x 2 i i=1 β 1 = Y β2 X trong đó Y = 1 n Yi, X = 1 n Xi, x i = X i X, y i = Y i Y. Ví dụ Bảng sau đây cho số liệu về mức chi tiêu tiêu dùng (Y đôla/tuần) và thu nhập hàng tuần (X đôla/tuần) của một mẫu gồm 10 gia đình. Giả sử Y và X có mối quan hệ tuyến tính. Hãy ước lượng hàm hồi quy của Y theo X.

21 Chương 1: Mô hình hồi quy tuyến tính hai biến 15 X i Y i Từ các số liệu quan sát của X và Y cho ở bảng trên ta tính được: Y i = 1100; X i = 1700; X 2 i = ; X i Y i = ; Y = 111; X = β2 = = 0, ; β 1 = 111 0, = 24, Nếu sử dụng công thức độ lệch ta có: n n x i y i = X i Y i nx.y = = i=1 β2 = i=1 n x 2 i = i=1 n x i y i i=1 n x 2 i i=1 n Xi 2 n(x)2 = = i=1 = = 0, 5091; β1 = 111 0, = 24, 4545 Vậy hàm hồi quy mẫu của chi tiêu tiêu dùng theo thu nhập là: Ŷ i = 24, , 5091X i Giá trị β1 = 24, 4545 là tung độ gốc của đường hồi quy mẫu, chỉ mức chi tiêu tiêu dùng trung bình hàng tuần khi mà thu nhập hàng tuần bằng 0. Tuy nhiên, đây là sự giải thích máy móc số hạng tung độ gốc. Trong phân tích hồi quy, kiểu giải thích theo nghĩa đen của số hạng tung độ gốc như thế này không phải lúc nào cũng có ý nghĩa, mặc dù trong ví dụ ta đang xét, nó có thể được lập luận rằng một gia đình không có bất cứ thu nhập nào (do thất nghiệp, do bị sa thải,...) có thể duy trì mức chi tiêu tiêu dùng tối thiểu (hoặc là từ vay mượn, hoặc là từ tiết kiệm). Nhưng nói chung ta phải sử dụng độ nhạy cảm trong việc giải thích số hạng tung độ gốc đối với X nhận các giá trị trong một khoảng nào đó khi quan sát. Với ví dụ đang xét thì ta có thể coi số 0 là một trong các giá trị quan sát của X. Giá trị β2 = 0, 5091 chỉ ra rằng, xét các giá trị của X nằm trong khoảng (80; 260), khi thu nhập tăng 1 đô la/tuần thì chi tiêu tiêu dùng trung bình gia tăng khoảng 0, 51 đô la/tuần. Tiếp theo, chúng ta hãy xem xét sai lệch giữa giá trị ước lượng (fitted value) từ hàm hồi quy mẫu (hay còn gọi là giá trị dự báo) và giá trị thực tế từ mẫu của biến phụ thuộc được trình bày trong bảng sau:

22 16 Chương 1: Mô hình hồi quy tuyến tính hai biến TT X Y Ŷ Û , 18 4, , 36 10, , 55 4, , 73 0, , 91 4, , 09 1, , 27 6, , 45 3, , 64 8, , 82 6, 82 Nhìn chung các kết quả ước lượng khá phù hợp với thực tế, sai lệch giữa giá trị quan sát và giá trị ước lượng lớn nhất là ở quan sát thứ hai, Û 2 = 10, 36. Việc xem xét phần dư sẽ hữu ích trong việc xem xét sâu hơn hành vi của từng cá thể, chẳng hạn tại sao với cùng một mức thu nhập như nhau nhưng có hộ gia đình chi tiêu cao hơn hoặc thấp hơn hẳn mức chi tiêu trung bình của nhóm hộ. Ví dụ Sử dụng quan sát ở 35 tỉnh về cầu thịt gà trong một năm Y (tấn) và giá thịt gà X (nghìn đ/kg) để xem xét mối quan hệ giữa cầu và giá thịt gà. Kết quả tính toán như sau: x i y i = 24737, 08; x 2 i = 16534, 2628; X = 9, 4104; Y = 104, 21 Hãy viết hàm hồi quy tuyến tính mẫu và cho nhận xét về các hệ số hồi quy? 1.3 TÍNH KHÔNG CHỆCH VÀ ĐỘ CHÍNH XÁC CỦA ƯỚC LƯỢNG OLS Các giả thiết của phương pháp OLS Xét mô hình hồi quy tuyến tính (1.2.1) với các giả thiết sau đây: Y = β 1 + β 2 X + U Giả thiết 1: Mô hình được ước lượng trên cơ sở mẫu ngẫu nhiên kích thước n : {(X i, Y i ), i = 1, 2,..., n} Giả thiết 2: Kỳ vọng của sai số ngẫu nhiên với điều kiện X bằng 0, nghĩa là E(U X) = 0. Với giả thiết mẫu ngẫu nhiên, giả thiết 2 có thể viết lại như sau: E(U i X i ) = 0, i.

23 Chương 1: Mô hình hồi quy tuyến tính hai biến 17 Giả thiết 3: U i có phương sai là hằng số, nghĩa là var(u i X i ) = σ 2, i. Về mặt hình học, ta có thể minh họa trường hợp giả thiết 3 trong hình 1.3 và 1.4. Hình 1.3 Phương sai sai số ngẫu nhiên không đổi Hình 1.4 Phương sai sai số ngẫu nhiên thay đổi (xu hướng tăng dần) Tính không chệch của các ước lượng OLS Bằng phương pháp OLS, các ước lượng điểm của β 1, β 2 lần lượt là β1, β2 được xác định một cách duy nhất với mỗi mẫu kích thước n và β1, β2 là các đại lượng ngẫu nhiên. Với các mẫu khác nhau thì giá trị của chúng có thể khác nhau nhưng trung bình của chúng sẽ xấp xỉ giá trị cần tìm β 1, β 2. Ta có kết quả sau: Định lý Khi giả thiết 2 thỏa mãn thì các ước lượng β1, β2 là các ước lượng không chệch của β 1, β 2, nghĩa là E( β1 ) = β 1, E( β2 ) = β 2

24 18 Chương 1: Mô hình hồi quy tuyến tính hai biến Độ chính xác của các ước lượng OLS Tính không chệch là một tính chất tốt của ước lượng, nó cho biết trung bình của sai lệch của các giá trị βj thu được từ các mẫu khác nhau so với β j là bằng 0. Tuy nhiên, ta lại không biết sai lệch này có thể lớn thế nào. Nếu các sai lệch này nói chung là nhỏ thì khi lấy một mẫu bất kỳ, ta có thể hy vọng rằng giá trị βj thu được là không quá khác biệt so với giá trị β j chưa biết. Khi đó, ta nói rằng độ chính xác của βj là cao. Như vậy, độ chính xác của ước lượng có thể được đo bởi độ phân tán của βj xung quanh β j tương ứng, nghĩa là E[( βj β j ) 2 ]. Khi βj là ước lượng không chệch của β j, nghĩa là E( βj ) = β j, thì độ chính xác này chính là phương sai của các ước lượng: E[( βj β j ) 2 ] = E{[ βj E(β j )] 2 } = var( βj ). Vậy để xác định độ chính xác của ước lượng, ta tìm phương sai của chúng. Định lý Khi các giả thiết 1 3 được thỏa mãn thì phương sai của các hệ số ước lượng được xác định bởi: var( β1 ) = X 2 i n x 2 i σ 2 ; var( β2 ) = σ2 x 2 i (1.3.1) trong đó σ 2 = var(u i X i ) là phương sai của sai số ngẫu nhiên, mà trong thực tế ta thường không biết được giá trị thực của nó. Do đó, ta thường dùng ước lượng điểm của σ 2 là σ 2 : σ 2 = Û 2 i n 2 σ còn được gọi là sai số chuẩn của hàm hồi quy (Standard error of regression). Người ta chứng minh được rằng khi các giả thiết 1 3 được thỏa mãn thì σ 2 là ước lượng không chệch của σ 2. Trong quá trình phân tích hồi quy, chúng ta thường sử dụng sai số chuẩn ( Standard error) của các hệ số ước lượng được tính bởi công thức: X 2 i se( β1 ) = n x 2 σ 2 σ ; se( β2 ) = 2 i x 2 i Các sai số chuẩn này là căn bậc hai của các phương sai var( β1 ), var( β2 ) với σ 2 được thay bởi ước lượng không chệch của nó là σ Một số tính chất của hàm hồi quy mẫu (1) Hàm hồi quy mẫu đi qua trung bình mẫu (X, Y ), tức là Y = β1 + β2 X.

25 Chương 1: Mô hình hồi quy tuyến tính hai biến 19 (2) Giá trị trung bình của Ŷ i bằng giá trị trung bình của các quan sát Y i, nghĩa là Y = Ŷ. (3) Tổng của các phần dư bằng 0, nghĩa là n Û i = 0. (4) Û i và Ŷ i không tương quan với nhau. (5) Û i và X i không tương quan với nhau. i=1 1.4 ĐỘ PHÙ HỢP CỦA HÀM HỒI QUY MẪU - HỆ SỐ XÁC ĐỊNH R 2 Nói chung, giữa các giá trị mẫu của biến phụ thuộc Y i và các ước lượng của nó là Ŷ i sẽ có sai lệch. Nếu sai lệch là nhỏ, ta nói rằng hàm hồi quy mẫu khá phù hợp so với số liệu mẫu, còn nếu sai lệch là lớn thì hàm hồi quy mẫu kém phù hợp với số liệu mẫu. So sánh hai hàm hồi quy mẫu trong hình 1.5 ở trường hợp a) và trường hợp b) ta thấy hàm SRF1 phản ánh mối quan hệ giữa X và Y tốt hơn so với SRF2. Hình 1.5 So sánh độ phù hợp hai đường hồi quy mẫu Để đánh giá một cách định lượng sự phù hợp của hàm hồi quy mẫu đối với số liệu mẫu người ta đưa ra khái niệm hệ số xác định, ký hiệu là R 2. Để đưa ra định nghĩa cho đại lượng này, chúng ta đưa ra một số ký hiệu sau: T SS = n (Y i Y ) 2 = i=1 n i=1 Y 2 i n(y ) 2 Tổng bình phương các sai lệch giữa giá trị quan sát với giá trị trung bình của chúng (TSS - Total sum of squares) ESS = n n (Ŷ i Y ) 2 = ( β2 ) 2 i=1 i=1 x 2 i Tổng bình phương các sai lệch giữa giá trị ước lượng của Y tính theo hàm hồi quy

26 20 Chương 1: Mô hình hồi quy tuyến tính hai biến mẫu với giá trị trung bình của các giá trị quan sát của Y (ESS - Explained sum of squares) RSS = n Ûi 2 = i=1 n (Y i Ŷ i ) 2 Tổng bình phương các sai lệch giữa các giá trị quan sát của biến Y và giá trị ước lượng được của nó từ hàm hồi quy mẫu (tổng bình phương phần dư) (RSS - Residual sum of squares) Người ta chứng minh được rằng: i=1 T SS = ESS + RSS (1.4.1) Như vậy, sự biến đổi của biến Y là tổng của hai thành phần: sự biến đổi của phần dư (thể hiện cho các yếu tố không đưa vào mô hình) ký hiệu bởi RSS và sự sự biến đổi được thể hiện bởi mô hình ký hiệu bởi ESS. Về mặt hình học, ta có thể minh họa các giá trị trong hình 1.6. Hình 1.6 Minh họa các tổng bình phương Chia cả hai vế của (1.4.1) cho TSS ta có: 1 = ESS T SS + RSS T SS Tỷ số ESS thể hiện phần trăm sự biến đổi của biến Y trong mẫu được giải thích T SS bởi mô hình, tỷ số đó được gọi là hệ số xác định (Coefficient of Determination) của hàm hồi quy và được ký hiệu là R 2. R 2 = ESS T SS = 1 RSS Û 2 T SS = 1 i y 2 i Ta có 0 R 2 1.

27 Chương 1: Mô hình hồi quy tuyến tính hai biến 21 Nếu hàm hồi quy mẫu càng phù hợp tốt với các số liệu quan sát thì ESS càng lớn hơn RSS (vì Ŷ i càng gần Y i ) và do đó R 2 càng gần 1. Trường hợp đặc biệt, khi hồn tồn không có sai lệch giữa giá trị quan sát và giá trị ước lượng thì RSS = 0 và R 2 = 1. Khi đó, biến X giải thích được 100% sự thay đổi của biến phụ thuộc. Ngược lại, nếu hàm hồi quy mẫu càng kém phù hợp với các số liệu quan sát thì RSS sẽ càng lớn hơn ESS (vì Ŷ i càng xa Y i ) và do đó R 2 càng gần 0. Khi R 2 = 0, biến X hồn tồn không giải thích được sự thay đổi của biến Y, khi đó ta nói rằng mô hình là không phù hợp, có nghĩa là quan hệ giữa biến X và biến Y được thể hiện bởi mô hình hồi quy mẫu là hồn tồn không phù hợp với số liệu mẫu. Và như vậy, có thể cho rằng mô hình hồi quy tổng thể cũng không phù hợp. Ví dụ Với số liệu cho trong bảng ở ví dụ ta tính được: Yi 2 = T SS = = 8890; ESS = (0, 5091) = 8552, 73. Vậy R 2 = 8552, = 0, Kết quả này có nghĩa là trong hàm hồi quy mẫu, biến X (thu nhập) giải thích 96, 21% sự thay đổi của biến Y (chi tiêu tiêu dùng). Do vậy, có thể nói rằng mức độ phù hợp của SRF là khá cao. * Một số lưu ý về hệ số xác định R 2 : 1) Không có tiêu chuẩn chung để xác định R 2 bao nhiêu là cao hay thấp và ta không nên chỉ căn cứ vào R 2 để đánh giá mô hình là tốt hay không tốt. Để xem xét mô hình là tốt hay không tốt ta nên căn cứ vào nhiều yếu tố: R 2, dấu của hệ số hồi quy, kinh nghiệm thực tế, khả năng dự báo chính xác. Theo kinh nghiệm, với số liệu chuỗi thời gian thì R 2 > 0, 9 được xem là tốt, với số liệu chéo thì R 2 > 0, 7 được xem là tốt. 2) Từ công thức xác định ESS và R 2 ta thấy rằng với mô hình hai biến có chứa hệ số chặn thì R 2 = 0 khi và chỉ khi β2 = 0. 3) Trong mô hình hồi quy tuyến tính hai biến đang xét thì cũng tuyến tính theo cả biến số. Vì vậy, trong thực nghiệm, người ta còn dùng hệ số tương quan r để đo mức độ chặt chẽ của mối quan hệ này. Tuy nhiên, ý nghĩa của hệ số xác định và hệ số tương quan là khác nhau. Công thức tính hệ số tương quan: r = xi y i x 2 i. y 2 i Người ta chứng minh được: r = ± R 2 và r cùng dấu với β2.

28 22 Chương 1: Mô hình hồi quy tuyến tính hai biến 4) Nếu mô hình không có hệ số chặn thì các phát biểu trên về R 2 đều có thể không đúng nữa, R 2 có thể nhận giá trị âm. Ví dụ Với số liệu trong ví dụ 1.2.1, hệ số tương quan r = ± R 2 = ± 0, 9621 = ±0, 981 Vì β2 = 0, 5091 > 0 chứng tỏ X và Y có quan hệ đồng biến nên r = +0, MÔ HÌNH HỒI QUY QUA GỐC TỌA ĐỘ Trong các phần đã trình bày ở trên, các mô hình đều có chứa hệ số chặn (mô hình hồi quy không qua gốc tọa độ) mặc dù nó không thể hiện đến tác động của biến X lên biến Y. Trong một số tình huống, ta có giải thích ý nghĩa của hệ số chặn là giá trị trung bình của biến Y khi X bằng 0. Tuy nhiên, có những tình huống cách giải thích này là không phù hợp và cũng có những tình huống mô hình không chứa hệ số chặn (hay còn gọi là mô hình hồi quy qua gốc tọa độ). Mục này chúng ta sẽ làm rõ hơn ý nghĩa của hệ số chặn trong mô hình hồi quy cũng như tác động của việc không sử dụng hệ số chặn trong mô hình. Các dạng tổng quát của hàm hồi quy qua gốc tọa độ: P RF : E(Y X i ) = β 2 X i SRF : Ŷ i = β2 X i Y i = β 2 X i + U i Y i = β2 X i + Û i Sử dụng phương pháp OLS, ta xác định được các công thức sau: β 2 = Xi Y i X 2 i ; var( β2 ) = σ2 X 2 i với σ 2 được ước lượng bởi: σ 2 = Û 2 i n 1 = RSS n 1. * Chú ý: 1) Đối với mô hình hồi quy qua gốc tọa độ Û i không nhất thiết phải bằng 0. 2) Hệ số xác định R 2 có thể âm làm cho R 2 không có ý nghĩa. Đối với mô hình hồi quy qua gốc tọa độ, ta có thể tính R 2 thô theo công thức sau: R 2 thô = ( X i Y i ) 2. X 2 i Y 2 i Ta không thể so sánh R 2 thô với R 2 do công thức tính khác nhau. Mô hình hồi quy qua gốc tọa độ được sử dụng phải dựa trên cơ sở lý thuyết kinh tế hoặc có trước tiên nghiệm tốt. Những trường hợp giữa X và Y có bản chất quan hệ là tỷ lệ như chi phí sản xuất khả biến (Y ) tỷ lệ thuận với sản lượng sản

29 Chương 1: Mô hình hồi quy tuyến tính hai biến 23 phẩm làm ra (X); Tốc độ tăng của giá/tỉ lệ lạm phát (Y ) tỷ lệ thuận với tốc độ tăng của lượng cung tiền (X),... Thông thường ta nên dùng mô hình hồi quy đơn biến bình thường (hồi quy không qua gốc tọa độ), sau đó kiểm định β 1, xét một trong hai trường hợp xảy ra: + Nếu β 1 = 0 có ý nghĩa thống kê ta có thể sử dụng mô hình hồi quy qua gốc tọa độ. + Nếu β 1 0 có ý nghĩa thống kê, ta sử dụng mô hình hồi quy không qua gốc tọa độ. Ví dụ Bảng sau cung cấp số liệu về suất sinh lợi hàng năm của Afuture Fund và suất sinh lợi trung bình của cơ cấu chứng khoán thị trường, tính bởi chỉ số Fisher, trong giai đoạn Năm Suất sinh lợi Suất sinh lợi dựa trên của Afuture (%) Y chỉ số Fisher (%) X , 5 19, , 2 8, , 2 29, , 0 26, , 7 61, , 3 45, , 6 9, , 0 14, , 3 35, , 5 31, 0 Đường đặc tính của phân tích đầu tư được biểu diễn như sau: Y i = β 1 + β 2 X i + U i Trong lý thuyết, các nhà nghiên cứu không đạt được sự thống nhất về giá trị có trước của β 1. Một số kết quả thực nghiệm cho thấy β 1 > 0 và có ý nghĩa thống kê, nhưng một số khác lại cho thấy nó không khác 0 một cách có ý nghĩa thống kê. Trong trường hợp sau ta có thể viết mô hình dưới dạng một mô hình hồi quy qua gốc tọa độ Y i = β 2 X i + U i. Sử dụng mô hình hồi quy qua gốc tọa độ ta có các kết quả hồi quy sau: Ŷ i = 1, 0899X i se = (0, 1916) R 2 = 0, 7825 thô t = (5, 6884)

30 24 Chương 1: Mô hình hồi quy tuyến tính hai biến Kết quả này cho thấy β 2 > 0 có ý nghĩa thống kê. Sự giải thích là 1% tăng của suất sinh lợi thị trường sẽ làm tăng trung bình 1, 09% suất sinh lợi của Afuture Fund. Chạy hồi quy không qua gốc tọa độ ta có các kết quả sau: Ŷ i = 1, , 0899X i se = (7, 6886) (0, 1916) R 2 = 0, 7155 t = (0, 1664) (4, 4860) Từ các kết quả trên, ta không thể bác bỏ giả thiết cho rằng giá trị đúng của tung độ gốc bằng 0, do vậy xác nhận cho việc sử dụng mô hình hồi quy qua gốc tọa độ. 1.6 MỘT SỐ VẤN ĐỀ BỔ SUNG Hồi quy và đơn vị đo của biến Khi đơn vị đo của biến X và Y thay đổi, ta không cần tiến hành hồi quy lại mà chỉ dùng công thức đổi đơn vị đo. Các tính chất của ước lượng từ phương pháp OLS sẽ không thay đổi khi ta thay đổi đơn vị của biến. Hàm hồi quy ban đầu: Ŷ i = β1 + β2 X i. Hàm hồi quy mới: Ŷi = β 1 + β 2 Xi. trong đó Ŷi = k 1 Y i ; Xi = k 2 X i (k 1, k 2 là các hệ số quy đổi giữa hai hệ thống đơn vị cũ và mới. Lần lượt thay các giá trị Ŷ i và X i vào hàm hồi quy mới ta có: β 1 = k 1 β1 ; β 2 = k 1 k 2 β2. Ngồi ra, ta còn có: σ 2 = k 2 1 σ2 ; R 2 XY = R2 X Y var( β 1 ) = k 2 1 var( β1 ); var( β 2 ) = se( β 1 ) = k 1 se( β1 ); se( β 2 ) = k 1 k 2 se( β2 ). ( k1 k 2 ) 2var( β2 ) Ví dụ Hàm SRF: Ŷ = 5 + 7X, Y đơn vị triệu đồng/tháng; X đơn vị tấn. Hàm SRF mới, tính theo triệu đồng/năm và theo kg: Ŷ = X = X Hồi quy với phần mềm Eviews Phần trình bày ở trên cho ta cách giải quyết một vấn đề ứng dụng phân tích hồi quy được thực hiện bằng cách tính tay. Với việc sử dụng phần mềm Eviews sẽ

31 Chương 1: Mô hình hồi quy tuyến tính hai biến 25 cho cách giải quyết đơn giản hơn. Sử dụng số liệu đã cho ở ví dụ 1.2.1, ta thu được kết quả hồi quy bằng phần mềm Eviews 6 trong bảng dưới đây. Chú thích cho bảng kết quả: Dependent Variable: cho biết biến phụ thuộc là Y Method: Least Squares: cho biết phương pháp ước lượng là phương pháp bình phương nhỏ nhất. Data, Time: cho biết ngày, giờ thực hiện. Sample: cho biết phạm vi quan sát được sử dụng để thực hiện hồi quy là từ quan sát thứ 1 đến quan sát thứ 10. Included observations: cho biết tổng số quan sát trong mẫu thực hiện là 10. Variable: cho biết danh sách các biến độc lập trong mô hình hồi quy. Lưu ý rằng C để chỉ vị trí của hằng số trong hàm hồi quy, tương ứng với tham số β 1. Coefficient: cho biết giá trị của các hệ số hồi quy ước lượng được tương ứng với C và X, tức là β1 = 24, 45455; β2 = 0, Std. Error: cho biết giá trị sai số chuẩn của β1, β2, tức là se( β1 ) = 6, ; se( β2 ) = 0, t- Statistic: cho biết giá trị của thống kê t ứng với giả thiết tham số hồi quy = 0, tức là t j = β j 0 se( βj ). Prob.: cho biết giá trị p-value của t tương ứng. R-squared: cho biết hệ số xác định R 2, R 2 = 0, Adjusted R-squared: hệ số R 2 đã hiệu chỉnh, R 2 = 0, S.E. of regression: sai số tiêu chuẩn của hàm hồi quy σ = σ = 6, Sum squared resid: tổng bình phương sai số RSS = 337, 2727.

32 26 Chương 1: Mô hình hồi quy tuyến tính hai biến Log likelihood: ln hàm hợp lý. Durbin-Watson stat: thống kê Durbin-Watson. Mean dependent var: trung bình của biến phụ thuộc Y = 111. S.D.dependent var: độ lệch tiêu chuẩn của biến phụ thuộc. Akaike info criterion: tiêu chuẩn Akaike Schwarz criterion: tiêu chuẩn Schwarz Hannan-Quinn criter.: tiêu chuẩn Hannan-Quinn F-statistic: giá trị thống kê của F (F = 202, 8679) Prob(F-statistic): P (F > F statistic) = 0,

33 Chương 2 MÔ HÌNH HỒI QUY BỘI 2.1 MÔ HÌNH HỒI QUY BỘI Mô hình hồi quy tuyến tính k biến có thể viết dưới dạng sau: Y = β 1 + β 2 X β k X k + U (2.1.1) Trong đó, Y là biến phụ thuộc và các X j (j = 1, k) là các biến độc lập. β j (j = 1, k) được gọi là các hệ số hồi quy bội. U là sai số ngẫu nhiên, nó đại diện cho các yếu tố khác ngồi các biến X j (j = 1, k) có tác động đến Y nhưng không đưa vào mô hình. * Các giả thiết của mô hình: Giả thiết 1: Việc ước lượng được dựa trên cơ sở mẫu ngẫu nhiên. Giả thiết 2: Kỳ vọng của sai số ngẫu nhiên tại mỗi giá trị (X 2i,..., X ki ) bằng 0: E(U (X 2i,..., X ki )) = 0, i. Giả thiết 3: Phương sai của sai số ngẫu nhiên tại các giá trị (X 2i,..., X ki ) là hằng số: var(u (X 2i,..., X ki )) = σ 2, i Giả thiết 4: Giữa các biến độc lập X j (j = 1, n) không có đa cộng tuyến hoàn hảo, nghĩa là không tồn tại các hằng số λ 2,..., λ k không đồng thời bằng 0 sao cho: λ 2 X λ k X k = 0. Với giả thiết 2 thì (2.1.1) được viết lại là: E(Y X 2,..., X k ) = β 1 + β 2 X β k X k (2.1.2) Khi đó, β 1 còn được gọi là hệ số chặn và β 1 chính là giá trị trung bình của biến phụ thuộc Y khi các biến độc lập trong mô hình nhận giá trị bằng 0. Các hệ số góc β 2,..., β k còn được gọi là các hệ số hồi quy riêng. Hệ số hồi quy riêng β m (m = 2, k) đo lường tác động riêng phần của biến X m lên giá trị trung bình của biến phụ thuộc khi các biến khác trong mô hình không đổi.

34 28 Chương 2: Mô hình hồi quy bội 2.2 MÔ HÌNH HỒI QUY SỬ DỤNG NGÔN NGỮ MA TRẬN Để đơn giản trong cách biểu diễn, trong phần này ta sẽ trình bày phân tích hồi quy sử dụng ngôn ngữ ma trận, trong đó quan tâm đến việc biểu diễn các ước lượng OLS cũng như ma trận hiệp phương sai. Xét mô hình hồi quy tuyến tính k biến (2.1.1): Hay viết cho từng quan sát" Y = β 1 + β 2 X β k X k + U Y i = β 1 + β 2 X 2i + + β k X ki + U i (2.1.1 ) Giả sử ta có n quan sát (Y i, X 2i,..., X ki ), i = 1, n. Khi đó Y 1 = β 1 + β 2 X 21 + β 3 X β k X k1 + U 1 Y 2 = β 1 + β 2 X 22 + β 3 X β k X k2 + U 2 (2.2.1)... Y n = β 1 + β 2 X 2n + β 3 X 3n β k X kn + U n Ký hiệu Y 1 β 1 U 1 1 X 21 X X k1 Y 2 Y =... β = β 2... U = U 2... X = 1 X 22 X X k Y n β k U n 1 X 2n X 3n... X kn Khi đó, (2.2.1) có thể viết dưới dạng ma trận như sau: * Các giả thiết của phương pháp OLS: Y = Xβ + U (2.2.2) Các giả thiết 1 4 được trình bày trên ngôn ngữ ma trận như sau: Giả thiết 1: Việc ước lượng dựa trên cơ sở mẫu ngẫu nhiên (X, Y ). Giả thiết 2: E(U X) = 0 n 1. Giả thiết 3: E(UU T ) = σ 2.I, trong đó U T là ma trận chuyển vị của U, I là ma trận đơn vị cấp n. Giả thiết 4: Tồn tại ma trận nghịch đảo (X T X) PHƯƠNG PHÁP ƯỚC LƯỢNG OLS Hàm hồi quy mẫu tương ứng với mô hình (2.2.2) được viết dưới dạng: Ŷ = X β (2.3.1)

35 Chương 2: Mô hình hồi quy bội 29 trong đó Ŷ 1 β 1 Ŷ 2 Ŷ =... β β 2 =... Ŷ n β k Véc tơ phần dư: Khi đó ta có Û = Y Ŷ = Y X β. Û 2 Û 2 i = (Û 1, Û 2,..., Û n )... = Û T.Û Û 1 Do đó, ta cũng có Û 2 i = Û T.Û = (Y X. β) T.(Y X. β) = (Y T. βt.x T )(Y X. β) Û n = Y T Y βt.x T.Y Y T.X. β + βt X T.X. β = Y T 2 βt.x T.Y + βt.x T.X. β (vì βt.x T.Y = Y T.X. β) Theo phương pháp bình phương nhỏ nhất, véc tơ β được chọn sao cho tổng bình phương của các phần dư nhỏ nhất, tức là Û 2 i = Y T Y 2 βt.x T.Y + βt.x T.X. β min Từ đó, ta có công thức ước lượng OLS cho các hệ số hồi quy như sau: β = (X T X) 1 X T Y (2.3.2) trong đó ma trận (X T X) có dạng như sau: n X2i X3i... Xki X T X2i X 2 X = 2i X2i X 3i... X2i X ki Xki Xki X 2i Xki X 3i... X 2 ki β 1 β 2 β =... β k Ví dụ Số liệu quan sát của một mẫu cho ở bảng dưới đây Y i X 2i X 3i trong đó: Y là lượng hàng bán được của một loại hàng (tấn/tháng) X 2 là thu nhập của người tiêu dùng (triệu đồng/năm)

36 30 Chương 2: Mô hình hồi quy bội X 3 là giá bán của loại hàng này (nghìn đồng/kg) Tìm hàm hồi quy mẫu Ŷ i = β1 + β2 X 2i + β3 X 3i. Giải: Từ bảng số liệu đã cho ta tính được các tổng Y i = 165; X 2i = 60; X 3i = 52; Yi 2 = 2781; X 2 3i = 308; X 2i X 3i = 282; Ma trận nghịch đảo: (X T X) 1 = β = Vậy hàm hồi quy mẫu cần tìm là: 1 X 2i Y i = 1029; = X 2 2i = 388; X 3i Y i = 813; / = 1164/ / , Hay β = 0, , Ŷ i = 14, , 76178X 2i 0, 58901X 3i 2.4 ĐỘ PHÙ HỢP CỦA HÀM HỒI QUY Tương tự như đối với mô hình hồi quy hai biến, ta sẽ sử dụng hệ số xác định hồi quy bội R 2 để đánh giá sự phù hợp của hàm hồi quy. Với các ký hiệu như với mô hình hai biến: T SS = (Y i Y ) 2 = Y T.Y n(y ) 2 ESS = (Ŷ i Y ) 2 = βt.x T.Y n(y ) 2 RSS = Û 2 i = Y T.Y βt.x T.Y Ta cũng có: Hệ số xác định hồi quy bội: T SS = ESS + RSS. R 2 = ESS T SS = 1 RSS T SS (2.4.1) R 2 nhận giá trị trong đoạn [0, 1] và nó đánh giá mức độ phù hợp của mô hình với số liệu mẫu. Và khi mô hình là phù hợp với số liệu mẫu thì ta cũng kỳ vọng

37 Chương 2: Mô hình hồi quy bội 31 nó thể hiện tốt sự phù hợp trong tổng thể. R 2 thể hiện phần trăm sự thay đổi của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình. Khi đưa thêm một biến số bất kỳ vào mô hình nói chung sẽ làm gia tăng R 2, không kể nó có giúp ích giải thích thêm biến phụ thuộc hay không. Như vậy, việc sử dụng R 2 để so sánh mức độ phù hợp giữa các mô hình với số biến khác nhau có thể không còn đúng nữa. Để so sánh hai số hạng R 2 ta cần phải tính đến số lượng biến độc lập có trong mô hình. Có thể thực hiện điều này một cách dễ dàng nếu chúng ta xem xét một hệ số xác định thay thế khác như sau: n R 2 = 1 Ûi 2 i=1 /(n k) = 1 n yi 2/(n 1) i=1 RSS/(n k) T SS/(n 1) trong đó k là số các tham số trong mô hình bao gồm cả hệ số tự do. (2.4.2) R 2 được gọi là R 2 có hiệu chỉnh. Thuật ngữ có hiệu chỉnh có nghĩa là hiệu chỉnh theo bậc tự do tương ứng với các tổng bình phương trong công thức định nghĩa của R 2. Số bậc tự do của n là (n k) và số bậc tự do của n là (n 1). Ûi 2 i=1 Giữa R 2 và R 2 có mối quan hệ như sau: R 2 = 1 (1 R 2 ) n 1 n k 2.5 TÍNH TỐT NHẤT CỦA ƯỚC LƯỢNG OLS yi 2 i=1 (2.4.3) Định lý Gauss - Markov: Khi các giả thiết 1-4 thỏa mãn thì các ước lượng thu được từ phương pháp OLS là các ước lượng tuyến tính, không chệch và có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính không chệch. Tính chất tuyến tính, không chệch và phương sai nhỏ nhất được viết tắt là tính chất BLUE (Best linear unbiased estimator). Tương tự mô hình hồi quy hai biến, để đánh giá độ chính xác của các ước lượng ta cũng sử dụng phương sai var( βj ). Để tính var( βj ) ta có thể xác định qua ma trận hiệp phương sai của β có dạng tổng quát như sau: var( β1 ) cov( β1, β2 )... cov( β1, βk ) cov( β2, β1 ) var( β2 )... cov( β2, βk ) cov( β) = Để tìm cov( β) ta áp dụng công thức cov( βk, β1 ) cov( βk, β2 )... var( βk ) cov( β) = σ 2 (X T X) 1

38 32 Chương 2: Mô hình hồi quy bội Trong công thức trên (X T X) 1 là ma trận nghịch đảo của ma trận (X T X), còn σ 2 là phương sai của sai số ngẫu nhiên U i nhưng chưa biết nên ta phải dùng ước lượng không chệch của nó là σ 2 : σ 2 = RSS n k = Û 2 i n k trong đó k là số biến của mô hình. Sai số chuẩn của βj : se( βj ) = var( βj ), j = 1, 2,..., k Ví dụ Xét tiếp ví dụ 2.3.1, hãy tìm ma trận hiệp phương sai của β. Giải: Theo tính toán ở trên ta đã xác định được ma trận (X T X) 1, ta cần tính σ 2. Ta có T SS = Y T Y n((y ) 2 ) = Yi 2 n(y ) 2 = (16, 5) 2 = 58, 5 ESS = βt (X T Y ) n(y ) 2 = 165 = (14, , , 58901) (16, 5) 2 = 56, RSS = 58, 5 56, 211 = 2, 289; σ 2 = RSS 2, 289 = = 0, 327 n , 327 Vậy cov( β) = , , , 6968 Hay cov( β) = 0, , , , , , Từ đó, ta có var( β1 ) = 8, 55593; var( β2 ) = 0, ; var( β3 ) = 0, MỘT SỐ DẠNG CỦA MÔ HÌNH HỒI QUY Mô hình logarit kép (log - log) Trong kinh tế học chúng ta đã biết đến dạng hàm sản xuất Cobb - Douglas như sau: Q = β 1 K β2 L β3 (2.6.1)

39 Chương 2: Mô hình hồi quy bội 33 trong đó Q, K, L lần lượt là sản lượng, vốn và lao động. Nếu xét thêm yếu tố ngẫu nhiên thì ta có: Q = β 1 K β2 L β3 e U (2.6.2) Mô hình (2.6.2) có dạng phi tuyến theo cả tham số và các biến số K, L. Do đó, để áp dụng phương pháp OLS ta phải biến đổi mô hình về dạng tuyến tính theo tham số như sau: với β 1 = ln(β 1). ln(q) = β 1 + β 2 ln(k) + β 3 ln(l) + U (2.6.3) Mô hình (2.6.3) được gọi là mô hình logarit kép (hay mô hình dạng log - log). Trong mô hình này, tổng (β 2 + β 3 ) cho ta thông tin để đánh giá việc tăng quy mô sản xuất. Nếu (β 2 + β 3 ) = 1 thì tăng quy mô không hiệu quả, nghĩa là các yếu tố đầu vào (vốn và lao động) tăng lên k lần thì sản lượng sẽ tăng tương ứng k lần. Nếu (β 2 + β 3 ) < 1 thì tăng quy mô kém hiệu quả, nghĩa là các yếu tố đầu vào tăng lên k lần nhưng sản lượng tăng ít hơn k lần. Nếu (β 2 + β 3 ) > 1 thì tăng quy mô có hiệu quả, nghĩa là các yếu tố đầu vào tăng lên k lần nhưng sản lượng tăng nhiều hơn k lần. Hay Một cách tổng quát, mô hình hồi quy dạng log - log có thể được viết như sau: ln(y ) = β 1 + β 2 ln(x 2 ) + + β k ln(x k ) + U (2.6.4) Ý nghĩa của các hệ số β j trong mô hình (2.6.4) được xem xét như sau: Với j = 1, 2,..., k ta có: β j = ln(y ) ln(x j ) = ln(y )/Y dx j /X j ln(y )/Y = β j dx j /X j Từ biểu thức trên ta thấy β j có ý nghĩa như sau: trong điều kiện các yếu tố khác trong mô hình không đổi, nếu X j gi tăng (giảm) 1% thì trung bình Y gia tăng (giảm) là β j %. Do đó, các hệ số β j còn được gọi là hệ số co giãn của Y theo X j. Với mô hình (2.6.4), hệ số co giãn của Y theo X j luôn luôn bằng β j, không phụ thuộc vào giá trị của X j. Như vậy, mô hình dạng log - log được sử dụng để mô tả các mối quan hệ trong đó hệ số co giãn là không đổi. Ví dụ Khảo sát về nhu cầu tiêu thụ cà phê (Y - số tách 1 người dùng mỗi ngày) và giá bán lẻ thực tế trung bình (X - USD/pao) người ta thu được bảng số liệu sau:

40 34 Chương 2: Mô hình hồi quy bội Năm Y X Năm Y X , 57 0, , 11 1, , 50 0, , 94 1, , 35 0, , 97 1, , 30 0, , 06 1, , 25 0, , 02 1, , 20 0, 75 Ký hiệu Y = ln Y, hồi quy ta được kết quả: Ŷ i = 0, , 253 ln X i se = (0, 0152) (0, 0494) R 2 = 0, 7448 t = (51, 004) ( 5, 125) p = (0, 001) ( 0, 000) Từ kết quả này, ta thấy hệ số co giãn của nhu cầu theo giá là 0, 253 có nghĩa là khi giá cà phê tăng 1% thì nhu cầu về cà phê bình quân giảm đi 0, 253%. Do giá trị của hệ số co giãn theo giá cả là 0, 253 nhỏ hơn 1 về giá trị tuyệt đối, nên ta có thể nói cầu cà phê không có tính co giãn đối với giá cả Mô hình bán logarit Mô hình log - lin Các nhà kinh tế, nhà kinh doanh và Chính phủ thường quan tâm tới việc xác định tốc độ tăng trưởng của một số biến kinh tế như dân số, GNP, lượng cung tiền, việc làm, năng suất, thâm hụt thương mại,... Khi đó, mô hình dạng bán logarit dưới đây có thể là phù hợp: ln(y ) = β 1 + β 2 X + U (2.6.5) Trong mô hình (2.6.5), hệ số β 2 được diễn giải như sau: khi X tăng 1 đơn vị thì Y trung bình thay đổi một lượng tương tối là 100.β 2 (%). Ví dụ Trong lý thuyết tiền tệ, tài chính và ngân hàng, chúng ta đã biết công thức tính lãi gộp: với r là tốc độ tăng trưởng gộp theo thời gian của Y; t: thời gian (tháng, quý, năm...) Y 0 : giá trị của biến phụ thuộc tại thời điểm t = 0; Y t = Y 0 (1 + r) t (2.6.6) Y t : giá trị của biến phụ thuộc tại thời điểm t nào đó.

41 Chương 2: Mô hình hồi quy bội 35 Lấy ln hai vế của (2.6.6) ta được: ln Y t = ln Y 0 + t ln(1 + r) Đặt β 1 = ln Y 0, β 2 = ln(1 + r) ta có thể viết lại như sau: ln Y t = β 1 + β 2 t Nếu đưa thêm yếu tố ngẫu nhiên vào ta được mô hình hồi quy dạng log - lin: ln Y t = β 1 + β 2 t + U t (2.6.7) + β 2 > 0: biểu thị tốc độ tăng trưởng của biến phụ thuộc Y. + β 2 < 0: biểu thị tốc độ giảm sút của biến phụ thuộc Y. Thay cho việc ước lượng mô hình (2.6.7), các nhà nghiên cứu đôi khi ước lượng mô hình sau: Y t = β 1 + β 2 t + U t (2.6.8) Mô hình (2.6.8) được gọi là mô hình xu hướng tuyến tính và biến thời gian t được gọi là biến xu hướng. Mô hình xu hướng tuyến tính khác biệt so với mô hình log - lin ở chỗ biến phụ thuộc Y theo thời gian không thể hiện dưới dạng logarit. Trong mô hình (2.6.8) thì β 2 = dy/dt là tốc độ thay đổi tuyệt đối của Y. + Nếu β 2 > 0 thì Y có xu hướng tăng. ( β 2 = β 2 là tốc độ tăng trưởng tuyệt đối của Y ) + Nếu β 2 < 0 thì Y có xu hướng giảm. ( β 2 = β 2 là tốc độ giảm sút tuyệt đối của Y ) Lựa chọn mô hình nào phụ thuộc vào việc ta quan tâm tới ước lượng thay đổi tương đối hay tuyệt đối của biến phụ thuộc theo thời gian. Nếu quan tâm tới lượng thay đổi tuyệt đối của biến phụ thuộc thì mô hình xu hướng tuyến tính thích hợp hơn. Ngồi ra, ta không thể so sánh R 2 của hai mô hình này. Hơn nữa, mô hình log - lin và mô hình xu hướng tuyến tính chỉ thích hợp nếu số liệu chuỗi thời gian có tính chất dừng (giá trị trung bình và phương sai của biến chuỗi thời gian không thay đổi có tính chất hệ thống theo thời gian). Ví dụ Khảo sát mẫu số liệu sau đây về GDP của Việt Nam theo giá so sánh năm 1994 giai đoạn , đơn vị: tỷ VND. Để khảo sát mức độ gia tăng trung bình tính theo số tuyệt đối (tỷ VND) của GDP qua mỗi năm, ta có thể sử dụng mô hình hồi quy tuyến tính của GDP theo thời gian, kết quả hồi quy trong hình 2.1 dưới đây.

42 36 Chương 2: Mô hình hồi quy bội Hình 2.1 Kết quả hồi quy mô hình tuyến tính theo các biến Kết quả cho thấy các hệ số hồi quy đều có ý nghĩa thống kê. Hệ số xác định cao (R 2 = 0, ), cho thấy mức độ phù hợp của mô hình rất lớn. Ý nghĩa kinh tế của các tham số hồi quy: + β 1 = 83267, 68: GDP của năm 1989 khoảng 83267, 68 tỷ VND (ứng với t = 0). + β 2 = 19335, 46: Mỗi năm trong giai đoạn ( ), GDP tăng bình quân 19335, 46 tỷ VND. Nếu ta muốn ước lượng tốc độ tăng trưởng bình quân của GDP trong giai đoạn trên, ta có thể sử dụng mô hình hồi quy dạng log - lin, kết quả như trong hình 2.2. Kết quả cho thấy các tham số hồi quy đều có ý nghĩa thống kê, cũng như mức độ phù hợp rất cao của mô hình (R 2 = 0, ). Ý nghĩa kinh tế của các tham số hồi quy: + β 1 = 11, = ln Y 0 Y 0 = GDP 1989 = e 11,72923 = , β 2 = 0, , 24%: cho thấy tốc độ tăng trưởng GDP bình quân năm của Việt Nam giai đoạn ( ) khoảng 7, 24%.

43 Chương 2: Mô hình hồi quy bội 37 Hình 2.2 Kết quả hồi quy mô hình tuyến tính theo các biến Mô hình lin - log Mô hình này được sử dụng trong trường hợp ta khảo sát mức thay đổi tuyệt đối của biến phụ thuộc khi biến độc lập thay đổi 1%. Xét mô hình lin-log: Y = β 1 + β 2 ln X + U (2.6.9) Hệ số β 2 trong mô hình được giải thích là: nếu X tăng lên 1% thì trung bình Y thay đổi một lượng tuyệt đối là 0, 01.β 2 đơn vị. Ví dụ Giả sử có số liệu như trong bảng 2.1. Năm GNP Lượng Năm GNP Lượng (tỉ USD) cung tiền (tỉ USD) cung tiền , 3 861, , , , 8 908, , , , , , , , , , , , , , , , , , , , , , , , , 1 Bảng 2.1 GDP và lượng cung tiền

44 38 Chương 2: Mô hình hồi quy bội Chúng ta quan tâm tới việc tìm xem GNP tăng lên bao nhiêu (về giá trị tuyệt đối) nếu lượng cung tiền tăng lên 1%. Với Y là GNP, X là lượng cung tiền, hồi quy Y theo ln X ta được các kết quả sau: Ŷ t = 16329, , 785 ln X t se = (696, 6) (94, 04) R 2 = 0, 9831 t = ( 23, 44) (27, 486) p = (0, 000) (0, 000) Theo kết quả trên, hệ số β2 = 2584, 785 có nghĩa là trong khoảng thời gian , lượng cung tiền tăng lên 1% kéo theo sự gia tăng bình quân của GNP khoảng 25,85 tỉ USD Mô hình nghịch đảo Mô hình có dạng sau được gọi là mô hình nghịch đảo: Y = β 1 + β 2. 1 X + U (2.6.10) Mô hình này có một số đặc điểm sau: 1) Khi biến X dần tới vô cùng thì 1/X tiến về 0, khi đó biến phụ thuộc Y sẽ tiến về β 1, giá trị này được gọi là tiệm cận ngang. 2) Nếu β 2 > 0 thì Y là hàm giảm theo X; β 2 < 0 thì Y là hàm tăng theo X; khi Y = 0 thì X = β 2 /β 1. Một số trường hợp có thể áp dụng mô hình nghịch đảo: 1) Đường cong Phillips biểu thị quan hệ giữa tỷ lệ thay đổi tiền lương Y và tỷ lệ thất nghiệp X. Hình 2.3 Tỷ lệ thay đổi tiền lương và tỷ lệ thất nghiệp Hình 2.4 Đồ thị AFC và sản lượng

45 Chương 2: Mô hình hồi quy bội 39 Xem hình 2.3, khi tỷ lệ thất nghiệp tăng nhưng vẫn ở dưới mức tỷ lệ thất nghiệp tự nhiên U N thì tiền lương tăng (Y > 0) nhưng mức lương tăng có khuynh hướng giảm dần (đường cong dốc xuống hướng về 0). Khi tỷ lệ thất nghiệp tăng vượt quá mức U N, tiền lương sẽ giảm (Y < 0) nhưng mức giảm sẽ tăng dần (đường cong càng xa dần 0) và tỷ lệ giảm sút tiền lương không vượt quá giá trị β 1. 2) Quan hệ giữa chi phí sản xuất cố định trung bình AFC (Average fixd cost) và sản lượng: lý thuyết kinh tế cho thấy khi sản lượng tăng thì chi phí sản xuất cố định trung bình trên một sản phẩm có khuynh hướng giảm dần nhưng không vượt quá mức tối thiểu. Quan hệ này được biểu diễn qua biểu đồ hình ) Đường chi tiêu Engel biểu diễn mối quan hệ chi tiêu của người tiêu dùng cho một hàng hóa với tổng chi tiêu hay thu nhập của người đó (X). Nếu ta gọi Y là chi tiêu cho một loại hàng hóa và X là thu nhập thì số hàng hóa có đặc điểm sau: Có một mức thu nhập tới hạn hay ngưỡng mà dưới mức đó thì người tiêu dùng không mua loại hàng hóa này. Trong hình dưới đây thì mức thu nhập ngưỡng này này là (β 2 /β 1 ). Có một mức tiêu dùng bão hòa (đã thỏa mãn) mà cao hơn mức đó người tiêu dùng sẽ không chi tiêu thêm nữa cho dù thu nhập có cao thế nào đi nữa. Chính mức này là đường tiệm cận β 1 vẽ trong đồ thị. Hình 2.5 Đường chi tiêu Engel Ví dụ Cho số liệu về tỷ lệ thay đổi tiền lương Y và tỷ lệ thất nghiệp X của Anh trong giai đoạn Năm Y (%) X(%) Năm Y (%) X(%) , 8 1, , 6 1, , 5 1, , 6 1, , 4 1, , 2 1, , 5 1, , 6 1, , 3 1, , 7 2, , 9 1, , 8 1, , 0 1, , 3 1, , 0 1, , 6 1, , 6 1, 8

46 40 Chương 2: Mô hình hồi quy bội Mô hình nghịch đảo thích hợp với số liệu ở bảng trên cho ta các kết quả sau: ( 1 ) Ŷ t = 1, , 7243 Xt se = (2, 06748) (2, 84778) R 2 = 0, 3849 t = ( 0, 691) (3, 064) F statistic = 9, 39 p = (0, 000) (0, 000) (0, 0079) Theo kết quả trên, β 1 = 1, 4282 nghĩa là giới hạn bên dưới của tỷ lệ thay đổi tiền lương xấp xỉ là 1, 43, tức là khi X tăng lên vô hạn, tỷ lệ giảm sút của tiền lương sẽ không vượt quá 1, 43%/năm. Tỷ lệ thất nghiệp tự nhiên Y 0 = 0 X 0 = β 2 8, 7243 = = 6, , 11(%/năm). β 1 1, Mô hình hồi quy đa thức Mô hình hồi quy đa thức bậc k tổng quát có dạng Y i = β 0 + β 1 X i + +β 2 X 2 i β kx k i + U i (2.6.11) Ta thấy trong những hàm hồi quy đa thức này chỉ có một biến giải thích ở vế phải nhưng nó xuất hiện với những lũy thừa khác nhau khiến cho chúng trở thành mô hình hồi quy bội. Những mô hình này vẫn là mô hình tuyến tính theo tham số β j nên chúng có thể ước lượng bằng phương pháp OLS thông thường. Ví dụ Để minh họa cho hồi quy đa thức, hãy xem xét số liệu trong bảng sau về sản lượng và tổng chi phí sản xuất ngắn hạn của một loại sản phẩm. Sản lượng (nghìn sản phẩm) Tổng chi phí (triệu đồng) Loại mô hình nào sẽ thích hợp với các dữ liệu? Để thực hiện mục đích này, chúng ta hãy xem xét đồ thị phân tán trong hình 2.6. Từ đồ thị phân tán ta thấy quan hệ giữa chi phí và sản lượng được biểu thị bởi một đường cong. Tổng chi phí lúc đầu tăng chậm sau đó tăng nhanh. Dạng đường cong này có thể được thể hiện bởi hồi quy đa thức bậc ba sau đây: Y i = β 0 + β 1 X i + β 2 X 2 i + β 3X 3 i + U i trong đó Y là tổng chi phí và X là sản lượng. Kết quả hồi quy như trong hình 2.7. Hàm hồi quy mẫu: Ŷ i = 141, , 47766X i 12, 96154X 2 i + 0, 93959X3 i

47 Chương 2: Mô hình hồi quy bội 41 Hình 2.6 Đồ thị phân tán tổng chi phí theo sản lượng Hình 2.7 Kết quả hồi quy mô hình đa thức bậc 3 * Nhận xét: + Các tham số hồi quy đều có ý nghĩa thống kê. + Hệ số xác định có giá trị lớn (R 2 = 0, 9983) cho thấy sự thay đổi của sản lượng giải thích được 99, 83% sự biến động của chi phí. + Dựa vào các tham số hồi quy, ta có thể cho rằng: khi sản lượng tăng lên 1 đơn vị, chi phí tăng lên (63, , , 93959) = 51, triệu đồng. + Ngay cả khi không sản xuất (X = 0) vẫn phải mất một khoản chi phí tối thiểu trung bình là Y min = β 1 = 141, 7667 triệu đồng. Điều này phù hợp với thực tế. Chi phí trong trường hợp này có thể là những chi phí cố định, bảo trì, bảo quản,...

48 Chương 3 SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 3.1 QUY LUẬT PHÂN PHỐI XÁC SUẤT CỦA MỘT SỐ THỐNG KÊ MẪU Xét mô hình hồi quy tuyến tính k biến: Y = β 1 + β 2 X β k X k + U (3.1.1) Với mẫu ngẫu nhiên kích thước n : {(X 2i,..., X ki, Y i ), i = 1, 2,..., n} ta thu được hàm hồi quy mẫu như sau: Ŷ i = β1 + β2 X 2i + + βk X ki Từ kết quả ước lượng, để đưa ra các suy diễn thống kê cho các hệ số hồi quy tổng thể, chúng ta cần xác định quy luật phân phối xác suất của các βj (j = 1, 2,..., k). Để có được điều này, chúng ta cần có giả thiết sau: Giả thiết 5: Sai số ngẫu nhiên tuân theo quy luật phân phối chuẩn U i N(0, σ 2 ), i. Các giả thiết 1 5 được gọi là các giả thiết của mô hình hồi quy tuyến tính cổ điển và mô hình thỏa mãn các giả thiết này được gọi là mô hình hồi quy tuyến tính cổ điển. Khi các giả thiết 1 5 thỏa mãn thì phương pháp OLS là phương pháp ước lượng tốt nhất cho bài toán hồi quy có dạng (3.1.1) và ta có kết quả về phân phối xác suất của các βj (j = 1, 2,..., k) qua định lý sau đây: Định lý Khi các giả thiết 1 5 thỏa mãn ta có: β j N(β j, var( βj )), j = 1, 2,..., k Định lý Khi các giả thiết 1 5 thỏa mãn ta có: t = β j β j se( βj ) T (n k), j = 1, 2,..., k Tương tự, ta cũng có t = (a βj + b βs ) (aβ j + bβ s ) se(a βj + b βs ) với a, b là hai số thực bất kỳ không đồng thời bằng 0. T (n k).

49 Chương 3: Suy diễn thống kê và dự báo từ mô hình hồi quy KHOẢNG TIN CẬY CHO CÁC HỆ SỐ HỒI QUY Khoảng tin cậy cho một hệ số hồi quy: đánh giá tác động khi một biến độc lập thay đổi Ta xây dựng được các khoảng tin cậy của β j, j = 1, k với độ tin cậy 1 α như sau: + Khoảng tin cậy đối xứng: ) ( βj se( βj ).t (n k) < β α/2 j < βj + se( βj ).t (n k). α/2 Khoảng tin cậy này được diễn giải như sau: với độ tin cậy 1 α, khi biến X j gia tăng 1 đơn vị và các yếu tố khác không đổi thì trung bình của biến Y gia tăng trong khoảng này. + Khoảng tin cậy bên trái: ( ) < β j < βj + se( βj ).t (n k) α. Khoảng tin cậy này để ước lượng giá trị lớn nhất cho hệ số hồi quy. + Khoảng tin cậy bên phải: ) ( βj se( βj ).t (n k) α < β j < +. Khoảng tin cậy này để ước lượng giá trị nhỏ nhất cho hệ số hồi quy. Ví dụ Bảng dưới đây cho các số liệu về doanh số bán Y, chi phí chào hàng X 2 và chi phí quảng cáo X 3 trong năm 2013 ở 12 khu vực bán hàng của một công ty. Doanh số bán Chi phí chào hàng Chi phí quảng cáo Y i (triệu đồng) X 2i (triệu đồng) X 3i (triệu đồng) Kết quả hồi quy tuyến doanh số bán theo chi phí chào hàng và chi phí quảng cáo.

50 44 Chương 3: Suy diễn thống kê và dự báo từ mô hình hồi quy Ta tìm khoảng tin cậy của β 2 và β 3 với độ tin cậy 95%. Với độ tin cậy 1 α = 0, 95 và n = 12 thì t (n 3) = t (9) α/2 0,025 = 2, Khoảng tin cậy của β 2 : (4, , , 262 < β 2 < 4, , , 262) hay (3, 588 < β 2 < 5, 711) Kết quả trên cho biết, nếu giữ chi phí quảng cáo không đổi, khi chi phí chào hàng tăng 1 triệu đồng/năm thì doanh số bán trung bình ở một khu vực bán hàng tăng trong khoảng từ 3, 588 đến 5, 711 triệu đồng/năm. + Khoảng tin cậy của β 3 : (2, , , 262 < β 3 < 2, , , 262) hay (1, 702 < β 3 < 3, 418) Kết quả trên cho biết, nếu giữ chi phí chào hàng không đổi, khi chi phí quảng cáo tăng 1 triệu đồng/năm thì doanh số bán trung bình ở một khu vực bán hàng tăng trong khoảng từ 1, 702 đến 3, 418 triệu đồng/năm Khoảng tin cậy cho biểu thức của hai hệ số hồi quy: đánh giá tác động khi hai biến độc lập cùng thay đổi Với mô hình (3.1.1), giả sử X 2 và X 3 cùng gia tăng (giảm) một đơn vị, khi đó giá trị trung bình của Y gia tăng (giảm) (β 2 + β 3 ) đơn vị. Vậy để ước lượng mức gia tăng của trung bình Y thì ta xây dựng khoảng tin cậy cho (β 2 + β 3 ). Trên cơ sở công thức khoảng tin cậy cho một hệ số hồi quy và với lập luận tương tự ta có công thức khoảng tin cậy của (β 2 + β 3 ) với độ tin cậy 1 α là: ( ) ( β2 + β3 ) se( β2 + β3 ).t (n k) < β α/2 2 + β 3 < ( β2 + β3 ) + se( β2 + β3 ).t (n k). α/2

51 Chương 3: Suy diễn thống kê và dự báo từ mô hình hồi quy 45 Một cách tổng quát, với a, b là các giá trị bất kỳ (có thể nhận giá trị âm hoặc dương) thì khoảng tin cậy cho mức gia tăng của trung bình của biến Y khi X 2 tăng a đơn vị và X 3 tăng b đơn vị được tính bởi công thức: ( ) (a β2 + b β3 ) se(a β2 + b β3 ).t (n k) < aβ α/2 2 + bβ 3 < (a β2 + b β3 ) + se(a β2 + b β3 ).t (n k). α/2 trong đó sai số chuẩn se(a β2 + b β3 ) được tính theo công thức se(a β2 + b β3 ) = a 2 var( β2 ) + b 2 var( β3 ) + 2abcov( β2, β3 ). Ví dụ Xét tiếp ví dụ 3.2.1, giả sử chi phí chào hàng giảm 1 triệu đồng và chi phí quảng cáo tăng 5 triệu đồng thì doanh số bán tăng trong khoảng nào với độ tin cậy 95%? Ta cần tìm khoảng tin cậy 95% cho ( β 2 + 5β 3 ). Công thức khoảng tin cậy: ( ) ( β2 + 5 β3 ) se( β2 + 5 β3 ).t (n 3) < β α/ β 3 < ( β2 + 5 β3 ) + se( β2 + 5 β3 ).t (n 3). α/2 Với cov( β2, β3 ) = 0, ta có: se( β2 + 5 β3 ) = var( β2 ) + 25var( β3 ) 10cov( β2, β3 ) = 2, Do đó, khoảng tin cậy của ( β 2 + 5β 3 ) là: (3, 2626; 13, 0404). Vậy với độ tin cậy 95%, nếu chi phí chào hàng giảm 1 triệu đồng và chi phí quảng cáo tăng 5 triệu đồng thì doanh số bán sẽ tăng trong khoảng từ 3, 26 đến 13, 04 triệu đồng Khoảng tin cậy của phương sai sai số ngẫu nhiên Phương sai tổng thể σ 2 chính là phương sai của sai số ngẫu nhiên U. Thông thường do không có thông tin trên tổng thể nên không thể tính σ 2, ta thay bằng ước lượng điểm của nó là σ 2. Với sai số ngẫu nhiên có phân phối chuẩn, người ta chứng minh được rằng đại lượng ngẫu nhiên χ 2 = (n k) σ2 σ 2 χ2 (n k). với k là số hệ số trong mô hình hồi quy. Với độ tin cậy 1 α, tra bảng phân phối χ 2 ta tìm được các giá trị tới hạn χ 2(n k) 1 α/2, χ2(n k) thỏa mãn điều kiện: α/2 P ( χ 2(n k) 1 α/2 χ2 χ 2(n k) ) α/2 = 1 α. Từ đó, χ 2(n k) 1 α/2 (n k) σ2 χ2(n k). σ2 α/2

52 46 Chương 3: Suy diễn thống kê và dự báo từ mô hình hồi quy Vậy với độ tin cậy 1 α, ta có các khoảng tin cậy của phương sai như sau: ( (n k) σ 2 ) 1) Khoảng tin cậy hai phía: χ 2(n k) σ 2 (n k) σ2 χ 2(n k) α/2 1 α/2 ( (n k) σ 2 2) Khoảng tin cậy bên phải: 3) Khoảng tin cậy bên trái: ( 0; χ 2(n k) α ) ; + (n k) σ 2 ) χ 2(n k) 1 α Ví dụ Trở lại với ví dụ 3.2.1, ta tìm khoảng tin cậy cho σ 2 với độ tin cậy 95%. Từ bảng kết quả hồi quy ta có σ 2 = 46, Với độ tin cậy 1 α = 0, 95 và số bậc tự do là n 3 = 9 thì χ 2(n 3) = χ 2(9) α/2 0,025 = 19, 023; χ2(n 3) 1 α/2 = χ2(9) 0,975 = 2, Vậy khoảng tin cậy hai phía của σ 2 là ( 9 46, , 023 σ 2 ) 9 46, , 7004 hay (1003, 2766 σ , 5941) Ý nghĩa của khoảng tin cậy Khoảng tin cậy của β j với độ tin cậy 95% được hiểu như sau: nếu ta chọn ngẫu nhiên nhiều mẫu từ cùng một tổng thể, mỗi mẫu ta xác định được một khoảng tin cậy, thì có khoảng 95% số khoảng tin cậy đó là có chứa giá trị β j. Hình 3.1 Minh họa các khoảng tin cậy Trong thực tế phân tích hồi quy, ta thường chỉ có một mẫu duy nhất và một khoảng tin cậy cụ thể tương ứng và ta hy vọng rằng khoảng tin cậy này nằm trong số 95% khoảng tin cậy chó chứa β j.

53 Chương 3: Suy diễn thống kê và dự báo từ mô hình hồi quy 47 Khi lấy độ tin cậy càng lớn thì xác suất để mẫu được chọn có khoảng tin cậy tương ứng chứa giá trị β j càng lớn, tuy nhiên khi đó khoảng tin cậy sẽ rộng hơn, nghĩa là độ chính xác của khoảng tin cậy giảm. Một khoảng tin cậy quá rộng thì thông tin đem lại về giá trị của hệ số cần ước lượng là kém chính xác. Khi đã cố định độ tin cậy thì độ dài khoảng tin cậy sẽ phụ thuộc các yếu tố sau: + Thứ nhất, số bậc tự do (n k). Số bậc tự do càng nhỏ thì giá trị tới hạn t α/2 (n k) càng lớn và do đó khoảng tin cậy càng rộng. + Thứ hai, mối tương quan tuyến tính giữa X j và các biến độc lập còn lại trong mô hình. Khi mối tương quan càng chặt thì Rj 2 càng cao và khi đó làm cho se( βj càng lớn, do đó khoảng tin cậy sẽ rộng hơn. Khi Rj 2 gần đến giá trị 1 thì khoảng tin cậy sẽ rộng ra vô cùng và trở nên mất ý nghĩa thực tế. 3.3 KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐ HỒI QUY Ta biết rằng tác động của một biến độc lập lên biến phụ thuộc được thể hiện bởi các hệ số hồi quy trong mô hình. Trong phân tích hồi quy ta thường quan tâm đến việc kiểm định các giả thuyết liên quan đến việc đánh giá mức độ của các tác động này. Đây là các bài toán kiểm giả thuyết về hệ số hồi quy Kiểm định giả thuyết về một hệ số hồi quy Kiểm định giả thuyết H 0 : β j = β 0 j (j = 1, 2,..., k) ta dùng thống kê t = β j β j se( βj ) (j = 1, 2,..., k) Trường hợp đặc biệt H 0 : β j = 0, giả thuyết này ngụ ý rằng biến độc lập X j không ảnh hưởng đến biến phụ thuộc Y. Tùy theo giả thuyết đối H 1, ta có bảng tóm tắt quy tắc kiểm định trong bảng 3.1. Với t 0 là giá trị quan sát của thống kê kiểm định được tính bởi: t 0 = β j β j se( βj ) Ví dụ Với số liệu cho ở ví dụ 3.2.1, ta kiểm định cặp giả thuyết H 0 : β 2 = 0; H 1 : β 2 0 với mức ý nghĩa 5%. Giải: Ta có t 0 = β 2 0 se( β2 ) = β 2 se( β2 ) 4, = = 9, 911 0,

54 48 Chương 3: Suy diễn thống kê và dự báo từ mô hình hồi quy Loại Giả Phương Quy tắc kiểm định thuyết pháp bác bỏ H 0 ) H 0 : β j = βj 0 Khoảng tin cậy β 0 / ( βj t (n k) α/2.se( β j ); βj + t (n k) α/2.se( β j ) Hai phía H 1 : β j β 0 j Giá trị tới hạn t 0 > t (n k) α/2 p-value p value < α ) H 0 : β j βj 0 Khoảng tin cậy β 0 / ( βj t (n k) α.se( β j ); + Bên trái H 1 : β j < β 0 j Giá trị tới hạn t 0 < t (n k) α p-value ( H 0 : β j βj 0 Khoảng tin cậy β 0 / p value/2 < α ; βj + t (n k) α.se( β j ) Bên phải H 1 : β j > β 0 j Giá trị tới hạn t 0 > t (n k) α p value = P ( t α > t 0 ) p-value p value/2 < α Bảng 3.1 Tóm tắt quy tắc kiểm định một hệ số hồi quy ) Với mức ý nghĩa α = 0, 05 và n = 12 thì t (n 3) = t (9) α/2 0,025 = 2, 262. Vì t 0 > t (9) 0,025 nên ta bác bỏ giả thiết H 0, tức chi phí chào hàng thực sự có ảnh hưởng đến doanh số bán ở một khu vực bán hàng. Tương tự như vậy, ta có thể kiểm định giả thiết H 0 : β 3 = 0; H 1 : β 3 0. Ta có t 0 = β 3 0 se( β3 ) = β 3 se( β3 ) 2, = = 6, , Vì t 0 > t (9) 0,025 nên ta bác bỏ giả thiết H 0, tức chi phí quảng cáo thực sự có ảnh hưởng đến doanh số bán hàng Kiểm định giả thuyết về một ràng buộc giữa các hệ số hồi quy Xét mô hình hồi quy k biến Y i = β 1 + β 2 X 2i + + β k X ki + U i Giả sử kết quả hồi quy cho thấy β2 β3 và ta muốn kiểm định giả thiết cho rằng tác động của biến X 2 và biến X 3 lên biến Y là khác nhau. Khi đó, ta sẽ kiểm định cặp giả thuyết sau: H 0 : β 2 β 3 = 0, H 1 : β 2 β 3 0. Thống kê dùng để kiểm định cặp giả thuyết này là: t = ( β2 β3 ) 0 se( β2 β3 ).

55 Chương 3: Suy diễn thống kê và dự báo từ mô hình hồi quy 49 Nếu giả thuyết H 0 đúng thì thống kê t có phân phối Student với (n k) bậc tự do. Do đó, các bước thực hiện cũng như cách thức đưa ra kết luận kiểm định cho các giả thuyết này đều tương tự như trong trường hợp kiểm định một hệ số. Trường hợp tổng quát, giả thuyết H 0 : aβ i + bβ j = a. Ta có thể tóm tắt trong bảng 3.2. Loại kiểm định Giả thuyết Quy tắc bác bỏ H 0 Hai phía H 0 : aβ j + bβ s = a t 0 > t (n k) α/2 H 1 : aβ j + bβ s a Bên trái H 0 : aβ j + bβ s a t 0 < t (n k) α H 1 : aβ j + bβ s < a Bên phải H 0 : aβ j + bβ s a t 0 > t (n k) α H 1 : aβ j + bβ s > a Bảng 3.2 Quy tắc kiểm định một ràng buộc giữa các hệ số hồi quy Giá trị quan sát t 0 được tính bởi: t 0 = (a βj + b βs ) a se(a βj + b βs ). với a, b, a là các hằng số cho trước, tùy vào yêu cầu cụ thể của giả thuyết cần kiểm định. Ví dụ Xét tiếp ví dụ 3.2.1, với mức ý nghĩa 5% có thể cho rằng chi phí cho chào hàng hiệu quả hơn chi phí cho quảng cáo không? Để trả lời câu hỏi này, ta xét cặp giả thuyết sau đây: { { H 0 : β 2 β 3 H 0 : β 2 β 3 0 H 1 : β 2 > β 3 H 1 : β 2 β 3 > 0 Ta có cov( β2, β3 ) = 0, Từ đó se( β2 β3 ) = 0, , , = 0, 731 Do đó, giá trị quan sát của thống kê kiểm định là: t 0 = Tra bảng tìm t (n k) α = t (9) 0,05 = 1, 833. (4, , 5601) 0 0, 731 = 2, 858. Ta thấy t 0 > t (9) 0,05 nên có đủ cơ sở để bác bỏ H 0 và thừa nhận H 1. Như vậy, thông tin từ mẫu đủ cơ sở để cho rằng chi phí cho chào hàng hiệu quả hơn chi phí cho quảng cáo.

56 50 Chương 3: Suy diễn thống kê và dự báo từ mô hình hồi quy Kiểm định giả thuyết về nhiều ràng buộc giữa các hệ số hồi quy Xét mô hình k biến sau: Y = β 0 + β 1 X β m X m + β m+1 X m β k 1 X k 1 + U (3.3.1) Chẳng hạn, ta muốn kiểm định đồng thời m ràng buộc { H 0 : β 1 = 0,..., β m = 0 H 1 : β β2 m 0 (3.3.2) Nếu giả thuyết H 0 trong (3.3.2) là đúng thì mô hình hồi quy (3.3.1) và mô hình hồi quy sau là tương đương: Y = β 1 + β m+1 X m β k 1 X k 1 + U (3.3.3) Ta gọi mô hình (3.3.1) là mô hình hồi quy không có ràng buộc (Unrestricted model), ký hiệu (U) và mô hình (3.3.3) là mô hình hồi quy có ràng buộc (Restricted model) (hay mô hình bị thu hẹp), ký hiệu (R). Để kiểm định giả thuyết (3.3.2) ta có thể sử dụng kiểm định F. Tư tưởng của kiểm định F là dựa trên sự khác biệt giữa RSS trong hai mô hình. Nếu H 0 là đúng thì kết quả ước lượng hai mô hình này phải khá giống nhau và như vậy sự khác biệt giữa RSS trong hai mô hình ước lượng là khá nhỏ. Do đó, nếu sau khi ước lượng, kết quả cho thấy sự khác biệt giữa RSS của hai mô hình là lớn thì điều này ủng hộ cho việc bác bỏ giả thuyết H 0. Để đánh giá sự khác biệt thế nào là lớn hay không đủ lớn, chúng ta dựa vào giá trị quan sát của thống kê kiểm định F. Các bước thực hiện kiểm định F như sau: Bước 1: Thiết lập cặp giả thuyết thống kê. Bước 2: Ước lượng hàm hồi quy không có ràng buộc thu được RSS U và hàm hồi quy có ràng buộc thu được RSS R. Bước 3: Tính giá trị quan sát của thống kê kiểm định theo công thức F 0 = (RSS R RSS U )/m RSS U /(n k U ) (3.3.4) trong đó m là số ràng buộc trong giả thuyết H 0, k U là số hệ số hồi quy trong mô hình không có ràng buộc (đang xét là k). Bước 4: So sánh nếu F 0 > f α (m, n k U ) thì giả thuyết H 0 bị bác bỏ. Trường hợp ngược lại, chưa có đủ cơ sở để bác bỏ H 0. Hoặc có thể dựa vào giá trị xác suất P-value= P (F > F 0 ) < α, ta kết luận bác bỏ giả thuyết H 0. * Kiểm định F sử dụng R 2 :

57 Chương 3: Suy diễn thống kê và dự báo từ mô hình hồi quy 51 Khi biến phụ thuộc của mô hình không ràng buộc và mô hình có ràng buộc là như nhau, giá trị quan sát trong công thức (3.3.6) có thể được tính bởi công thức tương đương sau: F 0 = (R2 U R2 R )/m (1 R 2 U )/(n k U) (3.3.5) Phương pháp kiểm định trên đây còn được gọi là kiểm định Wald. Kiểm định Wald được sử dụng với nhiều mục đích khác nhau liên quan đến hệ số hồi quy như kiểm định tổ hợp tuyến tính, kiểm định thừa biến,... Ngoài ra, cũng lưu ý rằng nếu giả thiết là H 0 : β j = 0 thì kết luận của kiểm định Wald tương đương với kết luận theo kiểm định t. Ví dụ Xét mối quan hệ giữa chi tiêu (CT) với thu nhập từ lao động (TN), giá trị tài sản (TS), thu nhập từ chứng khốn (CK) và thu nhập phụ khác (TNP) trong năm. Kết quả hồi quy từ mẫu gồm 30 quan sát như sau: CT i = 78, , 72T N i 0, 002T S i + 3, 89CK i + 0, 18T NP i + Û i se (32, 15) (0, 037) (0, 054) (4, 19) (0, 60) R 2 = 0, 9997 Giả sử muốn kiểm định giả thuyết cho rằng các biến TS, CK và TNP đều cùng không tác động đến CT. Ta thiết lập cặp giả thiết H 0 : β 3 = 0, β 4 = 0, β 5 = 0; H 1 : β β β Kết quả ước lượng mô hình có ràng buộc CT = β 1 + β 2 T N + U như sau: CT i = 80, , 85T N i + Û i se (8, 52) (0, 004) R 2 = 0, 9993 Do đó, giá trị quan sát của thống kê kiểm định là: F 0 = (0, , 9993)/3 (1 0, 9997)/(30 5) = 11, 11. Tra bảng tìm được f (3,25) 0,05 = 2, 99. Như vậy, F 0 > f (3,25) 0,05 nên ta bác bỏ giả thuyết H 0 và thừa nhận giả thuyết H 1. Vậy với mức ý nghĩa 5%, có ít nhất một trong các biến TS, CK và TNP là có tác động tới chi tiêu. Trong ví dụ ở trên trình bày kiểm định giả thuyết về sự đồng thời bằng 0 của các hệ số hồi quy. Kiểm định Wald cũng được áp dụng một cách hoàn toàn tương tự cho các ràng buộc tuyến tính nói chung giữa các hệ số hồi quy. Chẳng hạn, H 0 : β 2 = 0, β 3 = 0, β 4 + β 5 = 1.

58 52 Chương 3: Suy diễn thống kê và dự báo từ mô hình hồi quy Kiểm định sự phù hợp của hàm hồi quy Một trường hợp đặc biệt của kiểm định giả thuyết về nhiều ràng buộc của các hệ số hồi quy là bài toán kiểm định sau: H 0 : β 2 = β 3 =.. = β k = 0; H 1 : Không phải tất cả các hệ số hồi quy riêng đồng thời bằng 0. Giả thiết H 0 ngụ ý rằng toàn bộ các biến độc lập trong mô hình đều không ảnh hưởng đến biến phụ thuộc. Khi đó, ta nói mô hình không phù hợp. Cặp giả thuyết trên tương đương với cặp giả thiết sau: H 0 : R 2 = 0; H 1 : R 2 > 0 Để áp dụng quy trình kiểm định F trong trường hợp này, ta thực hiện như sau: Ước lượng hai mô hình: + Mô hình hồi quy gốc - Mô hình không có điều kiện ràng buộc thu được R 2 + Mô hình có điều kiện ràng buộc Y = β 1 + β 2 X β k X k + U Y = β 1 + U Mô hình này không có biến độc lập nên có hệ số xác định bằng 0. Do hai mô hình đều có cùng biến phụ thuộc nên giá trị quan sát của thống kê kiểm định có thể được tính theo công thức sau: F 0 = R 2 /(k 1) (1 R 2 )/(n k). Với mức ý nghĩa α, tra bảng phân phối F với bậc tự do n 1 = k 1 và n 2 = n k để tìm giá trị f α (k 1, n k). So sánh giá trị thống kê F và giá trị tra bảng f α (k 1, n k): Nếu F > f α (k 1, n k) thì ta bác bỏ giả thuyết H 0, tức là các hệ số hồi quy không đồng thời bằng 0 (hay hệ số xác định R 2 khác 0 có nghĩa), nghĩa là có ít nhất một biến độc lập giải thích cho sự biến đổi của biến phụ thuộc. Hàm hồi quy được gọi là phù hợp. Nếu F f α (k 1, n k) thì ta không bác bỏ giả thuyết H 0, tức các hệ số hồi quy đồng thời bằng 0 (hay hệ số xác định R 2 bằng 0 có ý nghĩa), tất cả các biến độc lập cùng lúc không ảnh hưởng đến biến phụ thuộc. Điều này có nghĩa là hàm hồi quy mẫu không giải thích được sự thay đổi của biến phụ thuộc. Nói cách khác, hàm hồi quy mẫu không phù hợp. Ví dụ Xét tiếp ví dụ 3.2.1, ta kiểm định cặp giả thuyết

59 Chương 3: Suy diễn thống kê và dự báo từ mô hình hồi quy 53 { H 0 : β 2 = β 3 = 0 H 1 : có ít nhất một hệ số β j 0 hay { H 0 : R 2 = 0 H 1 : R 2 > 0 Ta có: F 0 = R 2 (n k) (1 R 2 )(k 1) = 0, 9677 (12 3) (1 0, 9677) (3 1) = 134, 79. Tra bảng f α (k 1, n k) = f 0,05 (2, 9) = 4, 256. Như vậy, F > f α (k 1, n k) nên ta bác bỏ giả thiết H 0, thừa nhận giả thiết H 1. Vậy với mức ý nghĩa 5% thì có ít nhất chi phí chào hàng hoặc chi phí quảng cáo ảnh hưởng đến doanh số bán hàng hay có thể coi hàm hồi quy là phù hợp So sánh kiểm định T và kiểm định F Trường hợp kiểm định một ràng buộc Khi kiểm định cặp giả thuyết dạng: H 0 : β j = β ; H 1 : β j β ta có thể áp dụng cả hai loại kiểm định T và kiểm định F với kết luận là hoàn toàn giống nhau. Có được điều này là do: ( (t 0 ) 2 βj β ) 2 = = F0 (3.3.6) se( βj ) Mặt khác, với mọi giá trị α, quan hệ giữa hai giá trị tới hạn của hai phân phối này là như sau: (t α (n k)) 2 = f α (1, n k) (3.3.7) Do đó, giá trị xác suất p của hai thống kê quan sát là bằng nhau khi thực hiện kiểm định trên cùng một mẫu. Trường hợp kiểm định đồng thời nhiều hơn một ràng buộc Khi kiểm định giả thiết đồng thời bằng 0 của nhiều hệ số, việc sử dụng kiểm định T cho từng hệ số thay vì dùng kiểm định F là không xác đáng và không đáng tin cậy trong một số trường hợp. Chẳng hạn, như trong tình huống với kết quả hồi quy như trong hình 3.2. Ta thấy t 0 ứng với từng biến độc lập X 2, X 3 rất nhỏ, lần lượt là 1, 4317 và 0, 5622, nên ta đi đến kết luận là cả hai biến này đều không giải thích cho biến phụ thuộc. Tuy nhiên, kiểm định F lại cho kết quả ngược lại.

60 54 Chương 3: Suy diễn thống kê và dự báo từ mô hình hồi quy Hình 3.2 Kết quả hồi quy 3.4 KIỂM ĐỊNH GIẢ THUYẾT VỀ PHƯƠNG SAI SAI SỐ NGẪU NHIÊN Phương pháp kiểm định giả thuyết về phương sai của sai số ngẫu nhiên được tiến hành tương tự như kiểm định giả thuyết về hệ số hồi quy. Ta có thể tóm tắt các phương pháp qua bảng 3.3. Giả thuyết kiểm định: H 0 : σ 2 = σ 2 0. Giá trị kiểm định: χ 2 0 (n k) σ2 = σ0 2. Loại kiểm định Giả thiết Phương pháp Quy tắc bác bỏ H 0 ( (n k) σ 2 Khoảng tin cậy σ0 2 (n k) σ 2 ) / ; χ 2(n k) α/2 H 0 : σ 2 = σ 2 0 Giá trị χ 2 0 > χ 2(n k) α/2 χ 2(n k) 1 α/2 Hai phía H 1 : σ 2 σ 2 0 tới hạn hoặc χ 2 0 < χ 2(n k) 1 α/2 p-value p value < α/2 hoặc p value > 1 α/2 H 0 : σ 2 σ0 2 Khoảng tin cậy ( (n k) σ 2 ) σ0 2 / ; + χ 2(n k) α Bên phải H 1 : σ 2 > σ 2 0 Giá trị tới hạn χ 2 0 > χ 2(n k) α p-value p value < α ( H 0 : σ 2 σ0 2 Khoảng tin cậy σ0 2 (n k) σ 2 ) / ; χ 2(n k) 1 α Bên trái H 1 : σ 2 < σ 2 0 Giá trị tới hạn χ 2 0 < χ 2(n k) 1 α p-value Bảng 3.3 Tóm tắt quy tắc kiểm định phương sai p value > 1 α Ví dụ Với số liệu ở ví dụ 3.2.1, có thể cho rằng phương sai của sai số ngẫu nhiên là 2500 hay không với mức ý nghĩa 5%?

61 Chương 3: Suy diễn thống kê và dự báo từ mô hình hồi quy 55 Theo yêu cầu, ta kiểm định giả thiết H 0 : σ 2 = 2500; H 1 : σ Phương pháp khoảng tin cậy: Theo ví dụ 3.2.3, khoảng tin cậy của phương sai với độ tin cậy 95% là (1003, 2766 σ , 5941). Nhận thấy, 2500 thuộc vào khoảng tin cậy của σ 2. Do đó, ta không bác bỏ giả thiết H 0. + Phương pháp giá trị tới hạn: Giá trị kiểm định: χ 2 0 Các giá trị tới hạn: = (n 3) σ2 σ 2 0 = (12 3) 46, = 7, 634. χ 2 α/2 (n 3) = χ2 0,025(9) = 19, 023; χ 2 1 α/2 (n 3) = χ2 0,975(9) = 2, Như vậy, χ 2 1 α/2 (n 3) < χ2 0 < χ2 α/2 (n 3) nên χ2 0 không thuộc miền bác bỏ. Do đó, ta không bác bỏ giả thiết H 0, tức là có thể cho rằng phương sai sai số ngẫu nhiên là DỰ BÁO GIÁ TRỊ CỦA BIẾN PHỤ THUỘC VÀ SAI SỐ DỰ BÁO Dự báo giá trị của biến phụ thuộc Có 2 loại dự báo: + Dự báo giá trị trung bình có điều kiện của Y với giá trị X = X 0 ; + Dự báo giá trị riêng biệt Y 0 của Y với giá trị X = X 0. Dự báo giá trị trung bình có điều kiện Cho 1 X 0 X 0 2 =... ta cần dự báo giá trị trung bình của biến phụ thuộc Y, tức dự báo X 0 k E(Y/X 0 ) = β 1 + β 2 X β k X 0 k Dự báo điểm (ước lượng điểm) của E(Y/X 0 ) chính là Ŷ 0 Ŷ 0 = β1 + β2 X βk X 0 k

62 56 Chương 3: Suy diễn thống kê và dự báo từ mô hình hồi quy Ta hãy tìm dự báo khoảng (ước lượng khoảng) của E(Y/X 0 ) khi X 2 nhận giá trị X 0 2,..., X k nhận giá trị X 0 k. Với X = X 0 ta có Vì cov( β) = σ 2 (X T X) 1 nên Ŷ 0 = (X 0 ) T β var(ŷ0 ) = (X 0 ) T cov( β)x 0 var(ŷ 0 ) = σ 2 (X 0 ) T (X T X) 1 X 0. Nhưng ta chưa biết σ 2 nên phải dùng ước lượng không chệch của nó là σ 2. Vậy ta có var(ŷ 0 ) = σ 2 (X 0 ) T (X T.X) 1.X 0 ; se(ŷ 0 ) = var(ŷ 0 ) Với độ tin cậy 1 α, dự báo khoảng của E(Y/X 0 ) là: ) (Ŷ0 se(ŷ 0 ).t (n k) < E(Y/X 0 ) < Ŷ α/2 0 + se(ŷ 0 ).t (n k) α/2 Dự báo giá trị riêng biệt Ta tìm dự báo khoảng cho giá trị của biến phụ thuộc Y khi X = X 0 với độ tin cậy 1 α, tức là tìm khoảng tin cậy cho Y 0. Khoảng tin cậy của Y 0 với độ tin cậy 1 α là: ) (Ŷ0 se(y 0 Ŷ 0 ).t (n k) < Y α/2 0 < Ŷ 0 + se(y 0 Ŷ 0 ).t (n k) α/2 trong đó var(y 0 Ŷ 0 ) = var(ŷ 0 ) + σ 2 ; se(y 0 Ŷ 0 ) = var(y 0 Ŷ 0 ) Với mô hình hồi quy hai biến Y = β 1 + β 2 X + U ta có các công thức sau: [ ] var(ŷ 0 ) = σ 2 1 n + (X 0 X) 2 (3.5.1) n x 2 i i=1 [ ] var(y 0 Ŷ 0 ) = σ n + (X 0 X) 2 = var(ŷ n 0 ) + σ 2 (3.5.2) x 2 i i=1 Ví dụ Với số liệu cho ở ví dụ 3.2.1, hãy dự báo giá trị trung bình và dự báo giá trị riêng biệt cho doanh số bán của một khu vực bán hàng khi chi phí chào hàng là 165 triệu đồng/năm và chi phí quảng cáo là 200 triệu đồng/năm với độ tin cậy 95%?

63 Chương 3: Suy diễn thống kê và dự báo từ mô hình hồi quy 57 Giải: Ta tính được các giá trị Ŷ 0 = 1607, 388; se(ŷ 0 ) = 25, 2017; t (9) 0,025 = 2, 263 Vậy dự báo khoảng cho doanh số bán trung bình của một khu vực bán hàng với độ tin cậy 95% là: (1607, , , 263 < E(Y/X 0 ) < 1607, , , 263) Tiếp theo, ta có hay (1550, 328 < E(Y/X 0 ) < 1664, 3483) var(y 0 Ŷ 0 ) = var(ŷ 0 ) + σ 2 = 635, , 5922 = 2755, se(y 0 Ŷ 0 ) = 2755, 7177 = 52, Vậy dự báo khoảng cho giá trị riêng biệt của doanh số là: (1607, , , 263 < Y 0 < 1607, , , 263) hay (1488, 5420 < Y 0 < 1726, 1340) Ta thấy khoảng tin cậy của giá trị dự báo riêng biệt có độ rộng lớn hơn so với dự báo giá trị trung bình Đánh giá sai số dự báo Kết quả dự báo thường gắn với sai số dự báo. Với mô hình hồi quy, sai số dự báo được tính trên sự sai lệch giữa giá trị thực tế và giá trị ước lượng của biến phụ thuộc. Sau đây là một số chỉ số để đo lường độ chính xác dự báo. a) Căn bậc hai của trung bình bình phương sai số (Root Mean Squared Error) n (Y i Ŷ i ) 2 i=1 RMSE = n b) Sai số tuyệt đối trung bình (Mean Absolute Error) n Y i Ŷ i MAE = i=1 Đây là thước đo rất hữu ích khi người phân tích muốn đo lường sai số dự báo có cùng đơn vị tính với dữ liệu gốc. c) Sai số tuyệt đối trung bình tính theo phần trăm (Mean Absolute Percentage Error) n Y i Ŷ i i=1 Y i MAP E = n n

64 58 Chương 3: Suy diễn thống kê và dự báo từ mô hình hồi quy Giá trị của hai thước đo đầu tiên phụ thuộc vào đơn vị đo của biến phụ thuộc, còn thước đo MAPE là không phụ thuộc vào đơn vị đo. MPAE là thước đo hữu ích khi độ lớn của biến dự báo có ý nghĩa quan trọng trong việc đánh giá mức độ chính xác của dự báo. MPAE cho một chỉ số về độ lớn của sai số dự báo so với giá trị thực của biến số. Phương pháp này đặc biệt hữu ích khi Y i có giá trị lớn. Thông thường với các số liệu kinh tế, yêu cầu sai số dự báo nhỏ hơn 5%. Tuy nhiên, với một số biến số như chỉ số VNINDEX hay chỉ số giá CPI theo tháng thì sai số 5% được cho là quá lớn.

65 Chương 4 MÔ HÌNH VỚI BIẾN GIẢ VÀ ỨNG DỤNG Trong những mô hình hồi quy tuyến tính mà chúng ta đã nghiên cứu thì các biến đều là biến số lượng (biến định lượng), giá trị quan sát của các biến đó là những con số. Chẳng hạn, thu nhập, giá cả, chi tiêu cho một loại hàng... là những biến định lượng. Nhưng trong thực tế có nhiều trường hợp các biến giảûi thích (hoặc thậm chí cả biến phụ thuộc) là biến chất lượng (biến định tính). 4.1 BẢN CHẤT CỦA BIẾN GIẢ - MÔ HÌNH TRONG ĐÓ BIẾN ĐỘC LẬP ĐỀU LÀ BIẾN GIẢ Biến định tính thường biểu thị có hay không một tính chất hoặc biểu thị các mức độ khác nhau của một tiêu thức thuộc tính nào đó, chẳng hạn như giới tính (nam hay nữ), tôn giáo, chủng tộc, nơi cư trú, hình thức sở hữu của doanh nghiệp (sở hữu tư nhân hay nhà nước), ngành nghề kinh doanh,... Để lượng hóa được những biến định tính, trong phân tích hồi quy người ta sử dụng biến giảû. Để hiểu được kỹ thuật sử dụng biến giả trong mô hình hồi quy, chúng ta xét ví dụ sau đây. Giả sử một công ty sử dụng hai công nghệ sản xuất (ký hiệu là công nghệ A và công nghệ B). Năng suất của mỗi công nghệ là đại lượng ngẫu nhiên phân phối theo quy luật chuẩn có phương sai bằng nhau. Để nghiên cứu về năng suất của công ty này, chúng ta có thể sử dụng mô hình hồi quy Y i = β 1 + β 2 D i + U i (4.1.1) trong đó Y là năng suất; D là biến giả, D nhận một trong hai giá trị 0 hoặc 1. D i = 1 nếu sản lượng thu được là của công nghệ A D i = 0 nếu sản lượng thu được là của công nghệ B Mô hình (4.1.1) giống như mô hình hồi quy hai biến mà chúng ta đã nghiên cứu ở phần trước, chỉ khác là biến số lượng X được thay bằng biến giả D. Dùng mô hình này chúng ta có thể biết được năng suất trung bình của công nghệ A có khác với năng suất trung bình của công nghệ B hay không. Từ (4.1.1) ta có E(Y i /D i = 0) = β 1 ; E(Y i /D i = 1) = β 1 + β 2 Như vậy, hệ số β 1 biểu thị năng suất trung bình của công nghệ B. Tổng β 1 + β 2 biểu thị năng suất trung bình của công nghệ A.

66 60 Chương 4: Mô hình với biến giả và ứng dụng β 2 phản ánh mức chênh lệch về năng suất trung bình giữa công nghệ A và công nghệ B. Giả thiết không: β 2 = 0 chính là giả thiết cho rằng giữa công nghệ A và công nghệ B không có sự khác nhau về năng suất. Trong thí dụ trên, ta giả thiết có hai công nghệ khác nhau, khi đó ta có hai phạm trù (mức độ) khác nhau. Để lượng hóa ta sử dụng một biến giả. Kỹ thuật biến giả có thể sử dụng cho trường hợp có nhiều hơn hai phạm trù. Chẳng hạn, trong thí dụ trên, nếu ta giả thiết có ba công nghệ sản xuất khác nhau (A, B và C). Trong trường hợp này ta sử dụng hai biến giả D 1 và D 2 và mô hình hồi quy sẽ là Trong đó: Ta có: Y i = β 1 + β 2 D 1i + β 3 D 2i + U i (4.1.2) D 1i = 1 nếu năng suất của công nghệ A D 1i = 0 nếu năng suất của công nghệ khác D 2i = 1 nếu năng suất của công nghệ B D 2i = 0 nếu năng suất của công nghệ khác Khi D 1i = 1 và D 2i = 0 thì (4.1.2) biểu thị năng suất của công nghệ A Khi D 1i = 0 và D 2i = 1 thì (4.1.2) biểu thị năng suất của công nghệ B Khi D 1i = 0 và D 2i = 0 thì (4.1.2) biểu thị năng suất của công nghệ C E(Y i /D 1i = 1, D 2i = 0) = β 1 + β 2 E(Y i /D 1i = 0, D 2i = 1) = β 1 + β 3 E(Y i /D 1i = 0, D 2i = 0) = β 1 Như vậy: β 1 biểu thị năng suất trung bình của công nghệ C β 1 + β 3 biểu thị năng suất trung bình của công nghệ B β 1 + β 2 biểu thị năng suất trung bình của công nghệ A β 2 biểu thị phần chênh lệch của năng suất trung bình giữa công nghệ C và công nghệ A β 3 biểu thị phần chênh lệch của năng suất trung bình giữa công nghệ C và công nghệ B. * Chú ý: i) Để phân biệt m mức độ (m phạm trù) người ta dùng m 1 biến giả. Số biến giả ít hơn số mức độ (phạm trù) là 1 để tránh hiện tượng cộng tuyến. ii) Phạm trù được gán giá trị 0 được coi là phạm trù cơ sở. Phạm trù được gọi là cơ sở được hiểu theo nghĩa việc so sánh được tiến hành với phạm trù này. Trong thí dụ có 3 công nghệ sản xuất ở trên, công nghệ C là phạm trù cơ sở.

67 Chương 4: Mô hình với biến giả và ứng dụng 61 Ví dụ Khảo sát về năng suất của hai công nghệ sản xuất, người ta thu được các số liệu cho ở bảng sau D i Y i trong đó: Y i (i = 1, 10) là năng suất một ngày (đơn vị tính: tấn) D i = 1 nếu là công nghệ A; D i = 0 nếu là công nghệ B. Từ các số liệu cho ở bảng trên, ta tìm được hàm hồi quy tuyến tính mẫu của Y theo D là Ŷ i = 27, 8 + 6, 4D i R 2 = 0, 7758 D i = 0 Ŷ = 27, 8 D i = 1 Ŷ = 27, 8 + 6, 4 = 34, 2 Kết quả trên cho biết: Năng suất trung bình của công nghệ B là 27, 8 tấn/ngày và năng suất trung bình của công nghệ A là 34, 2 tấn/ngày. Cũng với mẫu số liệu trên, nếu ta đặt ngược lại: D i = 1 nếu là công nghệ B; D i = 0 nếu là công nghệ A. D i Y i Ta tìm được hàm hồi quy mẫu như sau: Ŷ i = 34, 2 6, 4D i R 2 = 0, 7758 D i = 0 Ŷ = 34, 2 : Năng suất trung bình công nghệ A. D i = 1 Ŷ = 34, 2 6, 4 = 27, 8 : Năng suất trung bình công nghệ B. * Nhận xét: So sánh hai trường hợp mã hóa trái ngược nhau đối với yếu tố công nghệ A hay công nghệ B trong ví dụ trên ta thấy kết quả hồi quy hồn tồn giống nhau mặc dù phương trình hồi quy có khác nhau ở giá trị và dấu của các tham số hồi quy. Như vậy, các con số gán cho mỗi tính chất của một biến định tính chỉ mang ý nghĩa định danh, không có vai trò tham gia vào các phép tính. 4.2 MÔ HÌNH VỚI BIẾN ĐỘC LẬP BAO GỒM BIẾN ĐỊNH LƯỢNG VÀ BIẾN ĐỊNH TÍNH Mô hình với một biến định lượng và một biến định tính Ta xét mô hình hồi quy với một biến định lượng và một biến định tính với số phạm trù 2. Trường hợp có n biến định lượng và 1 biến định tính các thủ tục phân tích cũng tiến hành tương tự.

68 62 Chương 4: Mô hình với biến giả và ứng dụng Trường hợp biến định tính có hai phạm trù Trong trường hợp này, theo chú ý trên ta chỉ cần sử dụng 1 biến giả. Ví dụ Xem xét tác động của bậc thợ (X) lên tiền lương (Y ) của công nhân ngành cơ khí. Giả sử tiền lương không chỉ phụ thuộc vào bậc thợ mà còn phụ thuộc vào khu vực làm việc. Khu vực làm việc chia làm 2 khu vực: công ty tư nhân và khu vực quốc doanh. Khu vực làm việc là biến định tính có 2 phạm trù nên ta xét biến giả D như sau: D i = 1 nếu công nhân làm việc tại công ty tư nhân D i = 0 nếu công nhân làm việc trong khu vực quốc doanh Khi đó, ta xét mô hình sau Ta có: Y i = β 1 + β 2 X i + β 3 D i + U i (4.2.1) E(Y i /X i, D i = 0) = β 1 + β 2 X i (4.2.1 ) (4.2.1 ) biểu thị tiền lương trung bình của công nhân cơ khí làm việc trong khu vực quốc doanh E(Y i /X i, D i = 1) = (β 1 + β 3 ) + β 2 X i (4.2.1") (4.2.1 ) biểu thị tiền lương trung bình của nhân cơ khí làm việc trong khu vực tư nhân. β 3 biểu thị mức chênh lệch về tiền lương trung bình của công nhân làm việc ở hai khu vực và cùng bậc thợ. Nếu không có cơ sở để bác bỏ giả thuyết H 0 : β 3 = 0 thì có nghĩa là tiền lương trung bình của công nhân ngành cơ khí ở hai khu vực không chênh lệch nhau. β 2 biểu thị tốc độ tăng lương theo bậc thợ. Như vậy, ở mô hình trên ta đã giả thiết rằng tốc độ tăng lương theo bậc thợ ở hai khu vực (tư nhân và nhà nước) là như nhau. Ta có thể minh họa trong hình 4.1. Nếu tốc độ tăng lương theo bậc thợ ở hai khu vực khác nhau tức hai mô hình (4.2.1 ) và (4.2.1 ) khác nhau về hệ số góc. Khi đó, có thể xảy ra các trường hợp: Thứ nhất, hệ số chặn (β 1 ) của hai mô hình giống nhau. Trường hợp này ta sử dụng mô hình hồi quy dạng Y i = β 1 + β 2 X i + β 3 X i D i + U i biến XD được gọi là biến tương tác, biến này biểu thị ảnh hưởng đồng thời của cả bậc thợ và khu vực làm việc đối với tiền lương. Khi đó, ta có:

69 Chương 4: Mô hình với biến giả và ứng dụng 63 Hình 4.1 Trường hợp khác hệ số chặn và cùng hệ số góc Tiền lương trung bình của công nhân cơ khí làm việc trong khu vực quốc doanh E(Y i /X i, D i = 0) = β 1 + β 2 X i Tiền lương trung bình của công nhân cơ khí làm việc trong khu vực tư nhân: E(Y i /X i, D i = 1) = β 1 + (β 2 + β 3 )X i Nếu giả thuyết H 0 : β 3 = 0 bị bác bỏ thì có nghĩa là tiền lương trung bình của công nhân ngành cơ khí ở hai khu vực khác nhau về tốc độ tăng lương theo bậc thợ. Thứ hai, hệ số chặn (β 1 ) của hai mô hình khác nhau. Trường hợp này ta sử dụng mô hình hồi quy dạng Y i = β 1 + β 2 X i + β 3 D i + β 4 X i D i + U i Tiền lương trung bình của công nhân cơ khí làm việc trong khu vực quốc doanh E(Y i /X i, D i = 0) = β 1 + β 2 X i Tiền lương trung bình của công nhân cơ khí làm việc trong khu vực tư nhân: E(Y i /X i, D i = 1) = (β 1 + β 3 ) + (β 2 + β 4 )X i Nếu giả thiết H 0 : β 3 = β 4 = 0 không bị bác bỏ thì có nghĩa là tiền lương trung bình của công nhân ngành cơ khí ở hai khu vực không khác nhau. Nếu có ít nhất một trong hai hệ số này khác 0 có ý nghĩa thì tiền lương trung bình của công nhân ở hai khu vực là khác nhau. Nếu chỉ có hệ số β 4 là khác 0 có ý nghĩa thì tốc độ tăng lương theo bậc thợ của hai khu vực khác nhau. Nếu chỉ có hệ số β 3 là khác 0 có ý nghĩa thì tốc độ tăng lương theo bậc thợ của hai khu vực là giống nhau nhưng

70 64 Chương 4: Mô hình với biến giả và ứng dụng Hình 4.2 Minh họa cho các trường hợp có sự chênh lệch về tiền lương trung bình của những công nhân có cùng bậc thợ của hai khu vực. Ta có thể minh họa các trường hợp trong hình??. Trong thực tế ta không xác định trước được bài toán rơi vào trường hợp nào, vì vậy ta phải xét các mô hình hồi quy với các trường hợp khác nhau: 1- Khác nhau về hệ số chặn, mô hình hồi quy có dạng Y i = β 1 + β 2 X i + β 3 D 1i + U i 2- Khác nhau về hệ số góc, mô hình hồi quy có dạng Y i = β 1 + β 2 X i + β 3 X i D 1i + U i 3- Khác nhau về cả hệ số chặn và hệ số góc, mô hình hồi quy có dạng Y i = β 1 + β 2 X i + β 3 D i + β 4 X i D 1i + U i Sau đó chọn ra mô hình hồi quy phù hợp nhất. Ta cũng có thể sử dụng mô hình ứng với trường hợp 3 và tiến hành kiểm định giả thuyết H 0 : β 3 = β 4 = 0. Nếu ta không có cơ sở để bác bỏ giả thuyết này, nghĩa là tiền lương trung bình ở hai khu vực là không khác nhau. Khi đó, ta có thể sử dụng mô hình hồi quy của Y theo X. Nếu bác bỏ giả thuyết H 0 ta cần tiến hành

71 Chương 4: Mô hình với biến giả và ứng dụng 65 kiểm định riêng từng hệ số để xem xét sự khác nhau về tiền lương nằm ở hệ số chặn hay hệ số góc. Nếu chấp nhận giả thuyết H 0 : β 3 = 0 thì có nghĩa là không có sự khác nhau ở hệ số chặn. Nếu chấp nhận giả thuyết H 0 : β 4 = 0 thì có nghĩa là không có sự khác nhau ở hệ số góc. Trường hợp khi biến định tính có nhiều hơn hai phạm trù Giả sử biến định tính có m phạm trù (m > 2). Trường hợp này chúng ta đưa vào mô hình m 1 biến giả làm biến giải thích. Thí dụ, chúng ta muốn hồi quy thu nhập hàng năm của một giáo viên trường phổ thông trung học theo thâm niên và nơi dạy. Trong trường hợp này, biến biểu thị thâm niên giảng dạy là biến định lượng, còn biến biểu thị nơi giáo viên giảng dạy là biến định tính. Chẳng hạn, chúng ta có thể phân chia nơi công tác thành ba vùng khác nhau: các thành phố lớn, các tỉnh đồng bằng và miền núi. Như vậy biến định tính sẽ có 3 phạm trù: thành phố, đồng bằng, miền núi. Chúng ta sử dụng mô hình sau: Y i = β 1 + β 2 X i + β 3 D 1i + β 4 D 2i + U i (4.2.2) trong đó: Y là thu nhập của một giáo viên phổ thông trung học (triệu đồng/ năm) X là thâm niên giảng dạy của giáo viên (năm) D 1i = 1 nếu giáo viên giảng dạy ở thành phố D 1i = 0 nếu giáo viên giảng dạy ở các nơi khác D 2i = 1 nếu giáo viên giảng dạy ở các tỉnh đồng bằng D 2i = 0 nếu giáo viên giảng dạy ở các nơi khác Như vậy, chúng ta coi giáo viên giảng dạy ở miền núi là phạm trù cơ sở. Từ (4.2.2) ta có E(Y i /X i, D 1i = 0, D 2i = 0) = β 1 + β 2 X i (4.2.3) (4.2.3) biểu thị thu nhập trung bình của một giáo viên có thâm niên công tác là X i giảng dạy ở miền núi. Tương tự ta có: Thu nhập trung bình của một giáo viên có thâm niên công tác là X i giảng dạy ở các tỉnh đồng bằng: E(Y i /X i, D 1i = 0, D 2i = 1) = β 1 + β 2 X i + β 4 (4.2.4) Thu nhập trung bình của một giáo viên có thâm niên công tác là X i giảng dạy ở các thành phố: E(Y i /X i, D 1i = 1, D 2i = 0) = β 1 + β 2 X i + β 3 (4.2.5)

72 66 Chương 4: Mô hình với biến giả và ứng dụng Sau khi ước lượng hàm hồi quy (4.2.2), chúng ta sẽ biết được mức chênh lệch về thu nhập của giáo viên phổ thông trung học ở thành phố và đồng bằng so với giáo viên công tác ở miền núi Hồi quy với một biến định lượng và hai biến định tính Trong trường hợp này chúng ta vẫn áp dụng nguyên tắc đã nêu ở phần trên. Số biến giả được đưa vào mô hình phụ thuộc vào số biến định tính và số phạm trù có ở mỗi biến định tính. Có thể xác định số biến giả đưa vào mô hình theo công thức sau: k n = (n i 1) i=1 trong đó: n là số biến giả được đưa vào mô hình; k là số biến định tính; n i là số mức độ (phạm trù) của biến định tính thứ i. Thí dụ, chúng ta xét tiếp thí dụ về thu nhập của giáo viên phổ thông trung học đã nêu trên. Bây giờ ta đưa thêm vào mô hình một biến định tính biểu thị về môn giảng dạy và xét ba nhóm môn khác nhau là: tự nhiên, xã hội và Anh văn. mô hình hồi quy có dạng: Y i = β 1 + β 2 X i + β 3 D 1i + β 4 D 2i + β 5 D 3i + β 6 D 4i + U i trong đó: Y là thu nhập của giáo viên phổ thông trung học (triệu đồng/năm) Ta có X là thâm niên giảng dạy của giáo viên (năm) D 1i = 1 nếu giáo viên giảng ở thành phố D 1i = 0 nếu giáo viên giảng ở nơi khác D 2i = 1 nếu giáo viên giảng ở các tỉnh đồng bằng D 2i = 0 nếu giáo viên giảng ở nơi khác D 3i = 1 nếu giáo viên giảng các môn tự nhiên D 3i = 0 nếu giáo viên giảng môn thuộc nhóm khác D 4i = 1 nếu giáo viên giảng các môn xã hội D 4i = 0 nếu giáo viên giảng môn thuộc nhóm khác E(Y i /D 1i = 0, D 2i = 0, D 3i = 0, D 4i = 0, X i ) = β 1 + β 2 X i (4.2.6) E(Y i /D 1i = 0, D 2i = 0, D 3i = 0, D 4i = 1, X i ) = β 1 + β 2 X i + β 6 (4.2.7) E(Y i /D 1i = 1, D 2i = 0, D 3i = 1, D 4i = 0, X i ) = β 1 + β 2 X i + β 3 + β 5 (4.2.8) (4.2.6) chính là thu nhập trung bình của một giáo viên có thâm niên công tác là X i giảng môn Anh văn và dạy ở miền núi.

73 Chương 4: Mô hình với biến giả và ứng dụng 67 (4.2.7) chính là thu nhập trung bình của một giáo viên có thâm niên công tác là X i giảng dạy các môn xã hội và dạy ở miền núi. (4.2.8) chính là thu nhập trung bình của một giáo viên có thâm niên công tác là X i giảng dạy các môn tự nhiên và dạy ở thành phố. Tương tự, ta có thể tính kỳ vọng có điều kiện với các giá trị khác của các biến D 1, D 2, D 3, D 4 và phát biểu ý nghĩa của các kết quả đó. Với cách xây dựng mô hình như đã trình bày, ta có thể thực hiện tương tự cho trường hợp mô hình có nhiều biến định lượng và biến định tính Kiểm định sự khác biệt giữa hàm hồi quy của hai nhóm Kiểm định Chow Khi hồi quy một mẫu số liệu theo chuỗi thời gian, do trải qua các thời kỳ khác nhau nên có khả năng xảy ra những thay đổi về cấu trúc trong mối quan hệ giữa biến phụ thuộc Y và các biến độc lập X. Qua đó, giá trị của các tham số hồi quy có thể bị biến động. Hay khi tổng thể bao gồm hai nhóm mang đặc tính khác nhau và ta muốn biết các hệ số hồi quy của hai nhóm này có bằng nhau (tức là các hệ số là ổn định) hay không. Kiểm định CHOW sẽ giúp ta giải quyết được vấn đề đó. Giả sử ta khảo sát một mẫu số liệu có n quan sát (đã được sắp xếp theo thời gian hay sắp xếp thành hai nhóm theo các đặc tính). Mẫu số liệu này có thể được chia làm hai mẫu nhỏ với số quan sát lần lượt là n 1 (ứng với n 1 mốc thời gian đầu hay n 1 quan sát trong nhóm đặc tính thứ nhất) và n 2 = n n 1 (ứng với n n 1 mốc thời gian sau hay n n 1 quan sát trong nhóm đặc tính thứ hai). Xét mô hình: Y i = α 1 + α 2 X i + U i (i = 1, 2,..., n 1 ) (4.2.9) Y i = β 1 + β 2 X i + V i (i = n 1 + 1, n 1 + 2,..., n) (4.2.10) Như vậy, mô hình gồm 2 phương trình (4.2.9) và (4.2.10) là mô hình không có ràng buộc gì về sự giống nhau giữa hai nhóm. Nếu quan hệ giữa Y và X là như nhau giữa hai nhóm thì ta có H 0 : α 1 = β 1, α 2 = β 2 H 1 : ít nhất một cặp hệ số α j β j, j = 1, 2 Như vậy, mô hình có ràng buộc sẽ là Y i = α 1 + α 2 X i + U i (i = 1, 2,..., n) (4.2.11) Kiểm định Chow được thực hiện như sau: + Ước lượng mô hình (4.2.11) cho các mẫu:

74 68 Chương 4: Mô hình với biến giả và ứng dụng Mẫu n 1 quan sát từ 1 đến n 1 thu được RSS 1. Mẫu n n 1 quan sát từ n đến n thu được RSS 2. Mẫu n quan sát từ 1 đến n thu được RSS. + Thống kê kiểm định là: F 0 = [RSS (RSS 1 + RSS 2 )]/k ((RSS 1 + RSS 2 )/(n 2k) F (k, n 2k) + Nếu giá trị quan sát của thống kê kiểm định là F 0 > f α (k, n 2k) thì ta bác bỏ giả thuyết H 0. Các hệ số hồi quy của mô hình là khác nhau giữa hai nhóm (hay cấu trúc mô hình thay đổi). Nếu giá trị quan sát của thống kê kiểm định là F 0 f α (k, n 2k) thì ta chưa có cơ sở bác bỏ giả thuyết H 0. Các hệ số hồi quy của mô hình là như nhau giữa hai nhóm (hay cấu trúc mô hình không thay đổi). Ví dụ Giả sử doanh nghiệp thương mại KUT thực hiện quảng cáo khác nhau ở hai giai đoạn: giai đoạn I (từ tháng 1/2005 đến tháng 10/2005); giai đoạn II (từ tháng 11/2005 đến tháng 8/2006). Để tìm hiểu xem ảnh hưởng của quảng cáo đến số lượng hàng hóa có khác nhau hay không giữa hai giai đoạn trên, doanh nghiệp thu thập một mẫu số liệu sau đây có liên quan giữa chi phí quảng cáo với số lượng hàng tiêu thụ: Ta thực hiện kiểm định Chow để xem xét ảnh hưởng của quảng cáo lên số lượng hàng bán của doanh nghiệp KUT có khác nhau hay không giữa hai giai đoạn trên. Ta lần lượt thực hiện các bước sau: Thiết lập cặp giả thuyết kiểm định: { H 0 : Cấu trúc mô hình không đổi ảnh hưởng quảng cáo như nhau H 1 : Cấu trúc mô hình thay đổi ảnh hưởng quảng cáo khác nhau

75 Chương 4: Mô hình với biến giả và ứng dụng 69 Lần lượt ước lượng mô hình hồi quy mẫu lớn (1/2005-8/2006), mô hình hồi quy giai đoạn I (1/ /2005), mô hình hồi quy giai đoạn II (11/2005-8/2006) ta được các kết quả trong hình 4.3. Hình 4.3 Kết quả hồi quy các mô hình Y. Nhận xét: + Biến giải thích X trong mỗi mô hình đều có ảnh hưởng lên biến phụ thuộc + Các tham số hồi quy rất khác nhau khi so sánh mô hình giai đoạn I với mô hình giai đoạn II.

76 70 Chương 4: Mô hình với biến giả và ứng dụng Tính giá trị quan sát của thống kê kiểm định F F 0 = [RSS (RSS 1 + RSS 2 )]/k ((RSS 1 + RSS 2 )/(n 2k) = [ (14706, , 974)]/2 (14706, , 974)/16 = 2319, 862 Giá trị tới hạn: f α (k, n 2k) = f 0,05 (2, 16) = 3, 63. Như vậy, F 0 > f α (k, n 1 + n 2 2k) nên ta bác bỏ giả thuyết H 0. Mô hình hồi quy của giai đoạn trước và của giai đoạn sau khác nhau. Vậy có thể cho rằng ảnh hưởng chi phí quảng cáo lên số lượng hàng bán giai đoạn I khác với giai đoạn II. Thật vậy, so sánh kết quả hồi quy hai giai đoạn trên ta thấy: + Giai đoạn I: Ŷ i = 21, , 8215X i + Giai đoạn II: Ŷ i = 6554, , 974X i Khi các yếu tố khác không đổi, bình quân chi phí quảng cáo tăng (giảm) 1 triệu đồng/tháng thì số lượng hàng bán của giai đoạn trước có thể tăng (giảm) khoảng 103 sản phẩm/tháng, trong khi ở giai đoạn II là khoảng 416 sản phẩm/tháng. Hoạt động quảng cáo ở giai đoạn sau mang lại hiệu quả cao hơn so với giai đoạn trước đối với công tác bán hàng của doanh nghiệp KUT. Kiểm định sử dụng biến giả Hạn chế của kiểm định Chow là không chỉ ra được sự khác biệt ở hệ số nào trong hai mô hình nếu hai mô hình là khác nhau. Và kiểm định này cũng đòi hỏi số quan sát ở mỗi nhóm phải đủ lớn. Với phương pháp sử dụng biến giả ta có thể khắc phục được cả hai hạn chế trên. Để minh họa cho phương pháp sử dụng biến giả để kiểm định sự khác biệt về cấu trúc của mô hình trong hai nhóm quan sát ta trở lại với ví dụ Đặt biến giả Z = 0 nếu thuộc giai đoạn đầu (2005M1 2005M10) Xét mô hình: Z = 0 nếu thuộc giai đoạn sau (2005M M8) Y = β 1 + β 2 X + β 3 Z + β 4 Z X + U (4.2.12) Kết quả hồi quy mô hình (4.2.12) trong hình 4.4. Từ kết quả trên, ta thấy các hệ số β 3, β 4 đều khác 0 có ý nghĩa thống kê. Do vậy, có sự khác biệt về cấu trúc của mô hình giữa hai giai đoạn, sự khác biệt cả về hệ số chặn lẫn hệ số góc. Với cách sử dụng biến giả, ta cũng có kết quả hồi quy với từng giai đoạn như trong kiểm định Chow.

77 Chương 4: Mô hình với biến giả và ứng dụng 71 Hình 4.4 Kết quả hồi quy mô hình SỬ DỤNG BIẾN GIẢ TRONG PHÂN TÍCH MÙA Như chúng ta đều biết nhiều chuỗi thời gian trong kinh tế có tính chất thời vụ rất rõ. Chẳng hạn, doanh số bán ra của các cửa hàng quần áo vào những ngày gần tết; doanh số bán của các cửa hàng văn phòng phẩm vào những ngày đầu năm học,... Thông thường người ta muốn loại nhân tố mùa khỏi chuỗi thời gian để có thể tập trung vào các thành phần khác của chuỗi thời gian như khuynh hướng tăng hoặc giảm hồn tồn đều đặn trong một thời kỳ dài. Quá trình loại thành phần khỏi chuỗi thời gian thu được như vậy gọi là chuỗi thời gian đã được điều chỉnh theo mùa. Có một số phương pháp điều chỉnh theo mùa của chuỗi thời gian, ở mục này ta xét phương pháp biến giả. Việc đưa biến giả để loại yếu tố mùa khỏi chuỗi thời gian được thực hiện dựa vào các giả thiết: 1- Yếu tố mùa chỉ ảnh hưởng đến hệ số chặn của hồi quy. 2- Yếu tố mùa ảnh hưởng đến cả hệ số góc. Tương ứng với mỗi giả thiết, mô hình được xem xét cũng khác nhau. Để thuận tiện cho việc trình bày ta xét thí dụ sau. Giả sử ta cần nghiên cứu mối liên hệ giữa thu nhập và chi tiêu cho việc mua sắm quần áo, dụng cụ gia đình, người ta thu thập được mẫu ngẫu nhiên kích thước n và cho rằng mỗi một quý có thể biểu thị mẫu theo mùa, vì vậy người ta đề nghị mô hình sau Y i = β 1 + β 2 X i + β 3 D 1i + β 4 D 2i + β 5 D 3i + U i (4.3.1) trong đó: Y là chi tiêu của người tiêu dùng về các loại hàng nói trên; X là thu nhập của người tiêu dùng.

78 72 Chương 4: Mô hình với biến giả và ứng dụng D 1i = 1 nếu quan sát ở quý 2; D 1i = 0 nếu quan sát ở quý khác D 2i = 1 nếu quan sát ở quý 3; D 1i = 0 nếu quan sát ở quý khác D 3i = 1 nếu quan sát ở quý 4; D 3i = 0 nếu quan sát ở quý khác Như vậy, phạm trù cơ sở là quý 1, nếu có ảnh hưởng theo mùa của từng quý khác nhau thì hệ số β 3, β 4, β 5 khác nhau có ý nghĩa về mặt thống kê. Mỗi một hệ số cho ta biết chi tiêu trung bình ở mỗi quý khác với quý 1 như thế nào. Với giả thiết E(U i ) = 0, ta có: Chi tiêu trung bình về quần áo và dụng cụ gia đình trong quý 1 là E(Y i /D 1i = 0, D 2i = 0, D 3i = 0, X i ) = β 1 + β 2 X i Chi tiêu trung bình về quần áo và dụng cụ gia đình trong quý 2 là E(Y i /D 1i = 1, D 2i = 0, D 3i = 0, X i ) = β 1 + β 2 X i + β 3 β 2 cho biết tốc độ tăng (nếu β 2 > 0) hay giảm (nếu β 2 < 0) của chi tiêu về quần áo và dụng cụ gia đình theo thu nhập. β 3 biểu thị mức chênh lệch về chi tiêu mặt hàng trên giữa quý 2 và quý 1. Nếu β 3 khác 0 có ý nghĩa thì có nghĩa mức chi tiêu về mặt hàng này ở quý 2 khác quý 1 thực sự. Cụ thể là nếu β 3 > 0 thì chi tiêu về mặt hàng đang xét ở quý 2 cao hơn quý 1, mức cao hơn này chính là β 3 (với điều kiện giá bán ở quý 1 và quý 2 là như nhau). Nếu β 3 < 0 thì chi tiêu về mặt hàng đang xét ở quý 2 thấp hơn quý 1, mức thấp hơn này chính là β 3 (với điều kiện giá bán ở quý 1 và quý 2 là như nhau). Chi tiêu trung bình về quần áo và dụng cụ gia đình trong quý 3 là: E(Y i /D 1i = 0, D 2i = 1, D 3i = 0, X i ) = β 1 + β 2 X i + β 4 β 3 biểu thị mức chênh lệch về chi tiêu mặt hàng trên giữa quý 3 và quý 1. Nếu β 4 0 có ý nghĩa thì có nghĩa mức chi tiêu về mặt hàng này ở quý 3 khác quý 1 thực sự. Nếu β 4 > 0 thì chi tiêu về mặt hàng đang xét ở quý 3 cao hơn quý 1, mức cao hơn này chính là β 4 (với điều kiện giá bán ở quý 1 và quý 3 là như nhau). Nếu β 4 < 0 thì chi tiêu về mặt hàng đang xét ở quý 3 thấp hơn quý 1, mức thấp hơn này chính là β 4 (với điều kiện giá bán ở quý 1 và quý 3 là như nhau). Chi tiêu trung bình về quần áo và dụng cụ gia đình trong quý 4 là: E(Y i /D 1i = 0, D 2i = 0, D 3i = 1, X i ) = β 1 + β 2 X i + β 5 Ý nghĩa kinh tế của β 5 tương tự như β 3 và β 4. Bây giờ giả sử rằng có sự ảnh hưởng tương tác giữa mùa và thu nhập lên chi tiêu, nói cách khác là có sự ảnh hưởng lên cả hệ số góc của hồi quy. Sử dụng phương pháp tương tự đã trình bày ở trên ta đi đến mô hình: Y i = β 1 + β 2 X i + β 3 D 1i + β 4 D 2i + β 5 D 3i + β 6 (D 1i X i ) + β 7 (D 2i X i ) + β 8 (D 3i X i ) + U i (4.3.2)

79 Chương 4: Mô hình với biến giả và ứng dụng 73 Như vậy, việc phân tích thời vụ có thể sử dụng 2 mô hình (4.3.1) và (4.3.2). Tuy nhiên, mô hình (4.3.2) tổng quát hơn. Để tránh sự không thích hợp ta nên dùng mô hình (4.3.2). Qua việc ước lượng hồi quy (4.3.2) chúng ta có thể biết được hệ số góc nào có ý nghĩa, hệ số góc nào không có ý nghĩa. Ví dụ Khảo sát số lượng tủ lạnh bán được tại Mỹ từ quý 1 năm 1978 đến quý 4 năm 1985, ta có bảng số liệu ở dưới. Năm: quý FRIG D1 D2 D3 Năm: quý FRIG D1 D2 D : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : Nhìn vào đồ thị biểu diễn số liệu trong hình 4.5 ta thấy đồ thị dao động lên xuống đều đặn, điều này đặc trưng cho những dao động theo mùa. Quan sát kỹ hơn nhận thấy số lượng tủ lạnh bán được vào quý 2 và quý 3 cao hơn quý 1 và quý 4. Để ước lượng tác động của yếu tố mùa vụ, chúng ta có thể dùng mô hình biến giả. Vì 1 năm có 4 quý nên chúng ta sử dụng 3 biến giả và chọn quý 4 làm cơ sở. Như vậy: D 1 = { 1 quý 1 0 quý khác D 2 = { 1 quý 2 0 quý khác Hình 4.5 Đồ thị biểu diễn số liệu D 3 = { 1 quý 3 0 quý khác Khi đó, hàm hồi quy có thể viết dưới dạng: Y = β 0 + β 1 D 1 + β 2 D 2 + β 3 D 3 + U

80 74 Chương 4: Mô hình với biến giả và ứng dụng Kết quả hồi quy như sau: Từ bảng kết quả, ta có các giá trị ước lượng về số lượng tủ lạnh bán được ở các quý như sau: + Quý 4 (ứng với D 1 = D 2 = D 3 = 0) : Ŷ = β0 = 1160 cho biết số lượng tủ lạnh trung bình bán được ở quý 4 xấp xỉ là 1160 cái. + Quý 1 (ứng với D 1 = 1; D 2 = D 3 = 0) : Ŷ = β0 + β1 = , 125 = 1222, 125 cho biết số lượng tủ lạnh trung bình bán được ở quý 1 xấp xỉ là cái. Như vậy, hệ số của biến giả D 1 ( β1 = 62, 125) cho biết số lượng tủ lạnh bán được ở quý 1 nhiều hơn quý 4 xấp xỉ là cái. + Quý 2 (ứng với D 1 = D3 = 0; D 2 = 1) : Ŷ = β0 + β2 = , 5 = 1467, 5 cho biết số lượng tủ lạnh trung bình bán được ở quý 2 xấp xỉ là cái. Như vậy, hệ số của biến giả D 2 ( β2 = 307, 5) cho biết số lượng tủ lạnh bán được ở quý 2 nhiều hơn quý 4 xấp xỉ là cái. + Quý 3 (ứng với D 1 = D 2 = 0; D 3 = 1) : Ŷ = β0 + β3 = , 75 = 1569, 75 cho biết số lượng tủ lạnh trung bình bán được ở quý 3 xấp xỉ là cái. Như vậy, hệ số của biến giả D 3 ( β3 = 409, 75) cho biết số lượng tủ lạnh bán được ở quý 3 nhiều hơn quý 4 xấp xỉ là cái. 4.4 HỒI QUY TUYẾN TÍNH TỪNG KHÚC Trong trường hợp hàm hồi quy có sự thay đổi về mặt cấu trúc ứng với từng khoảng giá trị khác nhau của biến độc lập, nghĩa là mỗi một khoảng tương ứng với một cấu trúc khác nhau của hàm hồi quy, lúc đó ta có thể dùng một hàm hồi

81 Chương 4: Mô hình với biến giả và ứng dụng 75 quy tuyến tính từng khúc biểu diễn chung cho các cấu trúc khác nhau. Để minh họa ta hãy xem hình 4.6, trong đó phản ánh mối quan hệ giữa tiền hoa hồng và doanh thu. Hình 4.6 Quan hệ giữa tiền hao hồng và doanh thu Công ty trả hoa hồng dựa vào doanh thu, nếu doanh thu dưới mức X thì cách tính tiền hoa hồng khác với cách tính tiền hoa hồng khi doanh thu trên mức X. Cụ thể hơn, ta giả thiết tiền hoa hồng tăng tuyến tính theo doanh thu cho tới ngưỡng X, sau đó tiền hoa hồng cũng tăng lên tuyến tính theo doanh thu nhưng với tốc độ nhanh hơn. Như vậy, ta có hồi quy tuyến tính từng khúc gồm hai phần hay hai đoạn tuyến tính. Kỹ thuật biến giả có thể được sử dụng để ước lượng các độ dốc (khác nhau) của hồi quy tuyến tính từng khúc biểu diễn trong hình vẽ trên. Ta tiến hành như sau: Ước lượng mô hình Y i = β 1 + β 2 X i + β 3 (X i X )D i + U i (4.4.1) trong đó: Y là tiền hoa hồng, X là doanh thu; X giá trị ngưỡng của doanh thu. { D i = 1 nếu X i > X 0 nếu X i X Với giả thiết E(U i ) = 0 ta có E(Y i /D i = 0, X i ) = β 1 + β 2 X i (4.4.2) (4.4.2) cho biết mức hoa hồng trung bình khi doanh thu X E(Y i /D i = 1, X i ) = β 1 β 3 X + (β 2 + β 3 )X i (4.4.3) (4.4.3) cho biết mức hoa hồng trung bình khi doanh thu > X Ta chú ý rằng khi β 3 = 0 thì phương trình (4.4.1) sẽ trở thành phương trình của đường thẳng. Vì vậy, kiểm định giả thiết β 3 = 0 sẽ cho ta kết luận được hàm hồi quy có thay đổi cấu trúc hay không.

82 76 Chương 4: Mô hình với biến giả và ứng dụng Ví dụ Bảng số liệu giả định về tổng chi phí và tổng sản lượng như sau: Tổng chi phí (USD) Tổng sản lượng (tấn) Ta biết được tổng chi phí làm thay đổi độ dốc X là 5500 tấn. Gọi Y là tổng chi phí và X là tổng sản lượng. Hồi quy Y theo X ta được kết quả sau: Ŷ i = 145, , 2791X i + 0, 0945(X i X )D i t = ( 0, 824) (6, 067) (1, 145) p = (0, 4368) (0, 0005) (0, 2899) R 2 = 0, 9737 D i = { 1 nếu X i > nếu X i 5500 D i = 0 Ŷ i = 145, , 2791X i D i = 1 Ŷ i = 655, , 3736X i Từ kết quả hồi quy ta thấy: chi phí biên của quá trình sản xuất ứng với phân khúc (1) (X i 5500) là 0, 2791 USD, trong khi ứng với phân khúc (2) (X i > 5500) là 0, 3736 USD. Như vậy, chi phí biên ở phân khúc (2) cao hơn phân khúc (1), điều này phù hợp với Quy luật lợi suất giảm dần. Nói rõ hơn, ở phân khúc (2), tốc độ gia tăng sản lượng sản xuất thấp hơn tốc độ gia tăng tổng chi phí. Mức sản lượng 5500 sản phẩm là điểm giới hạn giữa hai phân khúc. Nhận xét này có thể giúp ích cho nhà quản trị sản xuất khi quan tâm tới chi phí, sản lượng sản xuất và giá thành của sản phẩm. * Trường hợp mô hình có sự thay đổi về cấu trúc ứng với các giá trị X 1 và X 2. Trong trường hợp này chúng ta sẽ sử dụng mô hình có dạng: Y i = β 1 + β 2 X i + β 3 (X i X 1 )D 1i + β 4 (X i X 2 )D 2i + U

83 Chương 4: Mô hình với biến giả và ứng dụng 77 trong đó D 1i = { 1 nếu X i > X 1 0 nếu X i X 1 D 2i = { 1 nếu X i > X 2 0 nếu X i X 2 Vậy ta có β 1 + β 2 X i nếu 0 < X i X 1 E(Y i ) = β 1 β 3 X 1 + (β 2 + β 3 )X i nếu X 1 < X i X 2 β 1 β 3 X 1 β 4 X 2 + (β 2 + β 3 + β 4 )X i nếu X i > X HỒI QUY VỚI BIẾN GIẢ - MÔ HÌNH SEMI LOGARIT Mô hình Log - Lin * Trường hợp 1: Dạng 2 biến đơn giản với biến giả là biến độc lập. ln Y i = β 1 + β 2 D i Chẳng hạn, xét Y là thu nhập của một nhân viên (triệu đồng/tháng). D i = 0 : có bằng đại học, D i = 1 : có bằng thạc sỹ. - Thu nhập của nhân viên có bằng đại học: ln Y i = β 1. - Thu nhập của nhân viên có bằng thạc sỹ: ln Y i = β 1 + β 2. Như vậy, β 1 cho thấy trung bình log (thu nhập) của nhân viên có bằng đại học. Để ước lượng thu nhập bình quân nhân viên có bằng đại học ta tính antilogβ 1 = e β1. Tương tự, β 1 + β 2 cho thấy log (thu nhập) của nhân viên có bằng thạc sỹ. Từ đó, thu nhập trung bình của nhân viên có bằng thạc sỹ là antilog(β 2 + β 1 ) = e β1+β2. Chênh lệch thu nhập giữa nhân viên có bằng thạc sỹ với nhân viên có bằng đại học là: e β1+β2 e β1 eβ1+β2 e β1 e β1 = e β2 1 (e β2 1).100% là % chênh lệch thu nhập giữa nhân viên có bằng thạc sỹ so với nhân viên có bằng đại học. Ví dụ Giả sử ta có mẫu số liệu sau đây khi khảo sát thu nhập (triệu đồng/tháng) của 16 nhân viên thuộc cùng lĩnh vực hoạt động, trong đó có chú ý bằng cấp: Bằng cấp (D) Thu nhập (Y ) 6 9 5, ,

84 78 Chương 4: Mô hình với biến giả và ứng dụng D i = 0 : có bằng đại học; D i = 1 : có bằng thạc sỹ Kết quả hồi quy: Mô hình hồi quy: ln Y i = 1, , D i - Thu nhập bình quân nhân viên có bằng đại học (D i = 0): ln Y i = 1, Y = e 1, = 6, (triệu đồng/tháng) - Thu nhập bình quân nhân viên có bằng thạc sỹ (D i = 1): ln Y i = 1, , = 2, Y = e 2, = 10, (triệu đồng/tháng) - % chênh lệch bình quân về thu nhập giữa nhân viên có bằng thạc sỹ so với nhân viên có bằng đại học: e 0, = 0, , 8%. * Trường hợp 2: Dạng hàm 3 biến log - lin, trong đó 1 biến độc lập là biến định lượng, biến độc lập còn lại là biến giả: ln Y i = β 1 + β 2 D 2i + β 3 X 3i. Giả sử mô hình trên khảo sát thu nhập Y (triệu đồng/tháng) của các nhân viên cùng một ngành hoạt động trong một doanh nghiệp. D 2i = 0 : nhân viên có bằng đại học, D 2i = 1 : nhân viên có bằng thạc sỹ. X là số năm công tác. - Thu nhập của nhân viên có bằng đại học với X năm công tác: ln Y i = β 1 + β 3 X 3i (D 2i = 0) - Thu nhập của nhân viên có bằng thạc sỹ với X năm công tác: ln Y i = (β 1 + β 2 ) + β 3 X 3i (D 2i = 1)

85 Chương 4: Mô hình với biến giả và ứng dụng 79 So sánh 2 mô hình trên ta thấy hệ số góc β 3 bằng nhau, điều này có nghĩa tốc độ tăng thu nhập là như nhau, không phân biệt bằng cấp. Tốc độ tăng thu nhập ở đây được hiểu là % thu nhập gia tăng so với mức thu nhập cũ. Tung độ gốc của 2 mô hình chênh lệch nhau β 2, cho thấy thu nhập nhân viên có bằng thạc sỹ cao hơn thu nhập nhân viên có bằng đại học (e β2 1).100%. Ví dụ Xét tiếp ví dụ 4.5.1, khi ta đưa thêm vào biến số năm công tác trong ngành (X 3 ) Bằng cấp (D) Số năm (X) Thu nhập (Y ) 6 9 5, , Kết quả hồi quy: Mô hình hồi quy: ln Y i = 1, , D 2i + 0, X 3i Ta thấy p-value của các hệ số hồi quy rất nhỏ, chứng tỏ các biến độc lập đều có ảnh hưởng lên biến phụ thuộc và R 2 = 0, là khá lớn, cho thấy mức độ phù hợp của mô hình cao. * β 2 = 0, cho thấy cùng số năm công tác, so với thu nhập nhân viên có bằng đại học, thu nhập bình quân của nhân viên có bằng thạc sỹ cao hơn là e 0, , 29%. * β 3 = 0, cho thấy cùng một bằng cấp, nếu hơn nhau 1 năm công tác, thu nhập bình quân hơn nhau e 0, , 79% so với thu nhập của nhân viên có thu nhập thấp hơn.

86 80 Chương 4: Mô hình với biến giả và ứng dụng Mô hình Lin - Log Xét mô hình có dạng Y i = β 1 + β 2 D 2i + β 3 ln X 3i. Giả sử khảo sát khối lượng hàng bán cho người tiêu dùng đối với 2 loại thực phẩm cá và thịt tại 12 điểm bán hàng trong một khu vực. Y - Khối lượng hàng bán (kg), X 3 - Giá bán (nghìn đồng/kg). D 2i = 0 : Cá; D 2i = 1 : Thịt. Mức tiêu thụ cá: Y i = β 1 + β 3 ln X 3i (D 2i = 0). Mức tiêu thụ thịt: Y i = (β 1 + β 2 ) + β 3 ln X 3i (D 2i = 1). So sánh hai mô hình ta thấy: + Tham số β 3 giống nhau: khi giá thay đổi 1%, lượng cá hoặc thịt tiêu thụ biến động như nhau và bằng (β 3 /100)kg. + Tham số β 2 thể hiện sự chênh lệch mức tiêu thụ giữa hai loại thực phẩm khi giá bán như nhau. Ví dụ Xét mẫu số liệu như sau: Thực phẩm (D) Giá bán (X) Khối lượng hàng bán (Y) Kết quả hồi quy như sau: Mô hình hồi quy: Y i = 8650, , 627D 2i 1918, 647 ln X 3i

87 Chương 4: Mô hình với biến giả và ứng dụng 81 Ta thấy p-value của các hệ số hồi quy rất nhỏ, chứng tỏ các biến độc lập đều có ảnh hưởng lên biến phụ thuộc. Ngồi ra, tham số β 3 < 0 tho thấy giá bán hai loại thực phẩm này nghịch biến với lượng hàng tiêu thụ, điều này phù hợp với quy luật cung cầu. Giá trị R 2 = 0, là khá lớn, cho thấy mức độ phù hợp của mô hình cao. - Mức tiêu thụ cá: Y i = 8650, , 647 ln X 3i (D 2i = 0) - Mức tiêu thụ thịt: Y i = (8650, , 627) 1918, 647 ln X 3i = 10190, , 647 ln X 3i (D 2i = 1) - β 2 = 1539, 627: nếu bán cùng mức giá, lượng thịt tiêu thụ nhiều hơn lượng cá tiêu thụ trung bình là 1539, 627kg. - β 3 = 1918, 647: khi giá bán tăng 1%, lượng cá hoặc thịt tiêu thụ sẽ giảm như nhau và giảm khoảng 19, 18kg.

88 Chương 5 PHÂN TÍCH ĐẶC TRƯNG VÀ LỰA CHỌN MÔ HÌNH 5.1 CÁC THUỘC TÍNH CỦA MÔ HÌNH TỐT Các tiêu chuẩn đánh giá một mô hình tốt theo quan điểm của A.C.Harvey được vận dụng khá rộng rãi bao gồm: + Tính đơn giản/tiết kiệm: Mô hình càng đơn giản càng tốt. Điều này không có nghĩa là mô hình càng ít biến càng tốt, mô hình đơn giản nhưng phải chứa đủ các biến chủ yếu ảnh hưởng đến biến phụ thuộc để giải thích bản chất của vấn đề đang nghiên cứu. + Tính đồng nhất: Với một tập dữ liệu đã cho, các tham số ước lượng phải duy nhất. + Tính thích hợp/phù hợp: Các biến độc lập càng giải thích được nhiều sự thay đổi của biến phụ thuộc càng tốt, tức là R 2 (hoặc R 2 ) càng cao càng tốt. Tuy nhiên, trong nhiều trường hợp, không phải chỉ căn cứ vào R 2 (hoặc R 2 ) mà còn phải xét phối hợp với một số chỉ tiêu khác để xem mô hình có phù hợp hay không. + Tính bền vững về mặt lý thuyết: Mô hình phải phù hợp với cơ sở lý thuyết nền tảng. Một mô hình có giá trị R 2 cao nhưng dấu của hệ số hồi quy sai thì cũng không được đánh giá là mô hình tốt. + Có khả năng dự báo tốt: Một mô hình càng tốt khi cho kết quả dự báo càng sát với thực tế. 5.2 CÁC TIÊU CHUẨN ĐỂ LỰA CHỌN MÔ HÌNH Ngồi việc sử dụng giá trị R 2 (hay R 2 ) để so sánh giữa các mô hình, ta còn có thể sử dụng một số tiêu chuẩn khác như: + Giá trị của hàm hợp lý log - likelihood (L): L = n 2 ln σ2 n 2 ln(2π) 1 2 U 2 i Giá trị của L càng lớn thì chứng tỏ mô hình càng phù hợp. Giá trị của làm log - likelihood tính bằng phần mềm Eviews được ước lượng bằng công thức: L = n ( 1 + ln(2π) + ln RSS ) 2 n

89 Chương 5: Phân tích đặc trưng và lựa chọn mô hình 83 + Tiêu chuẩn AIC (Akaike info criterion - AIC): AIC = RSS n e2k/n trong đó k là số tham số trong mô hình hồi quy. Giá trị AIC càng nhỏ chứng tỏ mô hình hồi quy càng thích hợp. Phần mềm Eviews ước lượng giá trị AIC bằng biểu thức AIC = 2L n + 2k n + Tiêu chuẩn Schwarz (Schwarz criterion - SC): ( ) RSS SC = n k/n n Giá trị SC càng nhỏ chứng tỏ mô hình hồi quy càng phù hợp. Phần mềm Eviews ước lượng giá trị SC bằng biểu thức: SC = 2L n + k ln n n + Tiêu chuẩn Hannan-Quinn (Hannan-Quinn criterion - HQC): HQC = [ln(n)] 2k/n 1 Û 2 n i = [ln(n)] 2k/n RSS n HQC càng nhỏ sẽ càng tốt. Phần mềm Eviews ước lượng giá trị HQC bằng biểu thức: HQC = 2k n ln[ln(n)] 2 n L Nói chung, khi so sánh các tiêu chuẩn của mô hình này với mô hình khác thì một môt hình có thể tốt hơn theo tiêu chuẩn này nhưng lại không tốt hơn theo tiêu chuẩn kia. Khi đó, vấn đề đặt ra là tiêu chuẩn nào được ưu tiên hơn. Điều này phụ thuộc vào quan điểm của nhà kinh tế lượng. Nếu chú ý đến độ phức tạp của mô hình thì người ta thường chú ý tới tiêu chuẩn SC, còn trong phân tích chuỗi thời gian người ta hay sử dụng tiêu chuẩn AIC. * Chú ý: việc so sánh các tiêu chuẩn giữa các mô hình đòi hỏi biến phụ thuộc có cùng dạng trong mô hình hồi quy. Nếu biến phụ thuộc xuất hiện dưới các dạng khác nhau thì phải thực hiện quy đổi về dạng tương đương. Trong thực tế ta không thể biết trước một mô hình đúng là gì? Có thể do nền tảng lý thuyết yếu nên ta không thể xác định đúng các biến và dạng hàm quan hệ, hoặc có thể ta không thu thập được số liệu của một biến rất quan trọng phải có mặt trong mô hình,... Vì vậy, khi xây dựng mô hình ta có thể gặp phải sai số đặc trưng mô hình. Phần tiếp theo chúng ta sẽ xem xét một số loại sai số đặc trưng mô hình.

90 84 Chương 5: Phân tích đặc trưng và lựa chọn mô hình 5.3 CÁC LOẠI SAI SỐ ĐẶC TRƯNG VÀ HẬU QUẢ Sai số đặc trưng mô hình do bỏ sót biến thích hợp Giả sử mô hình đúng là Y = β 1 + β 2 X 2 + β 3 X 3 + U trong đó β 3 0 có ý nghĩa thống kê hay biến X 3 là cần thiết để giải thích Y. Nhưng ta lại chọn mô hình: Y = α 1 + α 2 X 2 + V Hậu quả của vấn đề này là: α 1, α 2 tương ứng là các ước lượng chệch và không vững của β 1, β 2. Ước lượng của phương sai nhiễu σ 2 là bị chệch. var( α 2 ) nói chung là chệch so với giá trị đúng. Từ các kết luận trên ta suy ra khoảng tin cậy cho các hệ số hồi quy tổng thể và các thủ tục kiểm định liên quan sẽ không còn đáng tin cậy Sai số đặc trưng mô hình do có biến không cần thiết Giả sử mô hình đúng là Y = β 1 + β 2 X 2 + U trong đó β 3 0 có ý nghĩa thống kê hay biến X 3 là cần thiết để giải thích Y. Nhưng ta lại chọn mô hình: Y = α 1 + α 2 X 2 + α 3 X 3 + V trong đó α 3 0 không có ý nghĩa thống kê hay biến X 3 là không cần thiết để giải thích Y. Hậu quả của vấn đề này là: α 1, α 2 tương ứng là các ước lượng không chệch và vững của β 1, β 2. Ước lượng của phương sai nhiễu σ 2 là không chệch. α 1, α 2 nói chung không phải là ước lượng hiệu quả. Như vậy, ta thấy rằng mô hình bỏ sót biến thích hợp sẽ gây hậu quả cực kỳ nghiêm trọng hơn việc mô hình có thừa biến không cần thiết. Hay ta có thể nói rằng trong việc xác định các biến để lập nên mô hình kinh tế lượng thì thừa biến tốt hơn là thiếu biến. Tuy nhiên, việc thừa biến cũng gây ra hậu quả kém chính xác trong ước lượng và kiểm định.

91 Chương 5: Phân tích đặc trưng và lựa chọn mô hình Sai số đặc trưng mô hình do chấp nhận dạng hàm sai Trường hợp mô hình có dạng hàm đa thức Giả sử mô hình đúng có dạng hàm đa thức bậc 3: Y = β 0 + β 1 X + β 2 X 2 + β 3 X 3 + U Nhưng vì một lý do nào đó ta lại chọn dạng hàm sai là đa thức bậc 2: Y = α 0 + α 1 X + α 2 X 2 + V Trong trường hợp này ta có thể xem X 3 như là một biến thích hợp bị bỏ sót khỏi mô hình. Từ đó có thể nói rằng các hậu quả của việc chấp nhận một dạng hàm sai tương tự như hậu quả gây ra do mô hình có biến thích hợp bị bỏ sót. Tuy nhiên, nếu xảy ra tình huống ngược lại, mô hình đúng có dạng hàm đa thức bậc 2 nhưng ta lại sử dụng hàm đa thức bậc 3, khi đó X 3 được xem như là một biến không cần thiết trong mô hình và hậu quả xảy ra tương đối nhẹ nhàng hơn hậu quả xảy ra do X 3 là một biến thích hợp bị bỏ sót trong mô hình. Trường hợp mô hình không phải dạng hàm đa thức Khi đó, mô hình có thể có các dạng: Lin-Lin, Log-Log, Log-Lin, Lin-Log,... và thực sự ta không có một căn cứ nào để cho rằng dạng hàm này là tốt hơn dạng hàm kia, ngoại trừ vieecjphair xem xét dạng mô hình dựa vào phân tích lý thuyết (chẳng hạn nếu lý thuyết yêu cầu xen xét các hệ số co giãn thì ta phải nghĩa đến dạng hàm Log-Log) và dựa vào việc ước lượng từng mô hình một, sau đó thực hiện các kiểm định để xem xét tính phù hợp của mô hình đó với bộ số liệu được quan sát Sai số đặc trưng mô hình do có sai số trong đo lường Sai số đo lường trong biến phụ thuộc Giả sử xét mô hình: Y i = β 1 + β 2 X i + U i Và ta không có giá trị đúng Y i mà chỉ có Yi = Y i + ɛ i. Suy ra: Yi = β 1 + β 2 X i + V i, với V i = U i + ɛ i, ɛ i là sai số đo lường. Giả sử sai số đo lường ɛ i chỉ là ngẫu nhiên, tức là ta có: E(U i ) = E(ɛ i ) = 0, cov(x i, U i ) = 0, cov(x i, ɛ i ) = 0, cov(u i, ɛ i ) = 0 Ta có: xi y β i 2 = = k x 2 i Yi = β 2 + k i U i + k i ɛ i, k i = x i. i x 2 i

92 86 Chương 5: Phân tích đặc trưng và lựa chọn mô hình E( β2 ) = β 2 V ar( β2 ) = σ2 V x 2 i = σ2 U + σ2 ɛ x 2 i > σ2 U x 2 i (giá trị đúng). Điều này chứng tỏ ước lượng theo OLS của mô hình có sai số đo lường trong biến phụ thuộc vẫn là ước lượng không chệch và là ước lượng vững, nhưng nó không phải là ước lượng hiệu quả. Sai số đo lường trong biến giải thích Giả sử xét mô hình: Y i = β 1 + β 2 X i + U i Và ta không có giá trị đúng X i mà chỉ có X i = X i + ɛ i. Suy ra: Y i = β 1 + β 2 (X i ɛ i) + U i = β 1 + β 2 X i + V i, với V i = U i β 2 ɛ i, ɛ i là sai số đo lường. Giả sử sai số đo lường ɛ i chỉ là ngẫu nhiên, tức là ta có: Khi đó: E(U i ) = E(ɛ i ) = 0, cov(x i, U i ) = 0, cov(u i, ɛ i ) = 0, cov(ɛ i, ɛ j ) = 0, i j. cov(v i, X i ) = E { [V i E(V i )][X i E(X i )] } = E [ (U i β 2 ɛ i )ɛ i ] = β2 σ 2 ɛ 0. Như vậy, biến giải thích trong mô hình (X ) đã có tương quan với nhiễu V i. Do đó, các hàm ước lượng theo OLS sẽ bị chệch và không vững. 5.4 CÁCH PHÁT HIỆN CÁC SAI SỐ ĐẶC TRƯNG MÔ HÌNH Kiểm định bỏ sót biến Giả sử thực hiện hồi quy mô hình sau Y i = β 1 + β 2 X 2 + U i (5.4.1) Vấn đề đặt ra là ngồi biến X 2 ảnh hưởng đến biến phụ thuộc Y thì còn biến độc lập nào khác ảnh hưởng quan trọng đến Y nữa hay không mà chưa được đưa vào mô hình? Giả sử mô hình đúng là Y i = α 1 + α 2 X 2i + α 3 X 3i + V i (5.4.2) Vậy làm cách nào có thể phát hiện được biến X 3 có bị bỏ sót hay không?

93 Chương 5: Phân tích đặc trưng và lựa chọn mô hình 87 Trường hợp 1: Có số liệu về biến X 3 + Cách 1: dùng kiểm định t (và R 2 ) Hồi quy mô hình (5.4.2) và kiểm định H 0 : α 3 = 0, đồng thời có thể kết hợp với việc so sánh giá trị R 2 của hai mô hình (5.4.1) và (5.4.2). Trường hợp nghi ngờ bỏ sót nhiều biến độc lập, ta vẫn có thể áp dụng cách làm trên bằng cách xét lần lượt bổ sung từng biến một. Ví dụ Cho mẫu số liệu về chi phí sản xuất (Y) và sản lượng (X) như sau: X Y Kết quả hồi quy biến (Y) theo biến (X) theo một số mô hình trong hình 5.1, 5.2, 5.3. Hình 5.1 Mô hình Y i = β 1 + β 2 X i + β 3 X 2 i + β 4 X 3 i + U i Từ các kết quả thu được, ta có các nhận xét sau: + Loại mô hình đa thức bậc hai vì kiểm định t cũng như kiểm định p-value đều cho thấy các tham số hồi quy không có ý nghĩa thống kê. + So sánh mô hình đa thức bậc 3 với mô hình hồi quy tuyến tính, kiểm định t cũng như kiểm định p-value cho thấy các hệ số hồi quy đều có ý nghĩa thống kê. Riêng giá trị R 2 trong hàm đa thức bậc 3 cao hơn so với hàm tuyến tính, vậy hàm bậc 3 là phù hợp hơn. + Cách 2: Dùng kiểm định Wald (được trình bày ở chương 2) + Cách 3: Dùng phương pháp nhân tử Lagrange (LM - Lagrange Multiplier) Ta gọi mô hình (5.4.1) là mô hình có ràng buộc, ký hiệu (R); mô hình (5.4.2) là mô hình không có ràng buộc, ký hiệu (U).

94 88 Chương 5: Phân tích đặc trưng và lựa chọn mô hình Hình 5.2 Mô hình Y i = β 1 + β 2 X i + β 3 X 2 i + U i Hình 5.3 Mô hình Y i = β 1 + β 2 X i + U i Ta sẽ kiểm định giả thuyết H 0 : α 3 = 0 (không bỏ sót biến X 3 ) như sau: Bước 1: Hồi quy mô hình (R) thu được phần dư Û R. Bước 2: Nếu X 3 bị bỏ sót, ảnh hưởng của nó được quan sát bằng phần dư Û R. Do đó, Û R được xem như có liên hệ với biến bị bỏ sót (U i = α 3 X 3i + V i ). Ngồi ra, Û R cũng có liên hệ với X 2 (vì được tính bởi Û R = Y i β1 β2 X 2i ). Từ đó, hồi quy Û R theo tất cả các biến độc lập: Û R = γ 1 + γ 2 X 2i + γ 3 X 3i + ɛ (hồi quy phụ - Auxiliary Regression) và tính được hệ số xác định của mô hình hồi quy phụ, ký hiệu là R 2 aux. Đại lượng ngẫu nhiên: nr 2 aux χ2 (1). Với mức ý nghĩa α, nếu nr 2 aux > χ2 (1) thì bác bỏ H 0, nghĩa là thừa nhận biến X 3 bị bỏ sót. * Trong trường hợp hồi quy bội và nghi ngờ bỏ sót nhiều biến độc lập ta áp

95 Chương 5: Phân tích đặc trưng và lựa chọn mô hình 89 dụng cách làm tương tự: Mô hình (R) : Y = β 1 + β 2 X β m X m + U Mô hình (U) : Y = β 1 + β 2 X β m X m + β m+1 X m β k X k + V Đặt giả thuyết H 0 : β m+1 = = β k = 0 (không bỏ sót biến X m+1,..., X k ). X m+1,..., X k ). H 1 : có ít nhất một β j 0 (bỏ sót ít nhất một trong các biến Hồi quy mô hình (R), thu được phần dư Û R. Sau đó sử dụng hồi quy phụ Û R = γ 1 + γ 2 X γ k X k + ɛ Ta bác bỏ giả thuyết H 0 khi nr 2 aux > χ2 α(k m). Ví dụ Trở lại ví dụ 5.4.1, giả sử ta chọn mô hình đa thức bậc nhất thay vì mô hình đa thức bậc 3 Y i = β 0 + β 1 X i + U i Y i = α 0 + α 1 X i + α 2 X 2 i + α 3X 3 i + V i Ta kiểm định giả thuyết H 0 : α 2 = α 3 = 0 (không bỏ sót hai biến X 2, X 3 ). Dựa vào bảng kết quả hồi quy trong ví dụ ta có được nr aux = 10 0, 9896 = 9, 896. Với α = 0, 05 thì χ 2 0,05 (2) = 5, 99. Như vậy, nr aux > χ 2 0,05 (2) nên ta bác bỏ giả thiết H 0, tức là mô hình bỏ sót ít nhất một trong hai biến trên. + Cách 4: Sử dụng tỷ lệ hàm hợp lý (likelihood ratio - LR) LR = 2(l R l U ), trong đó l R và l U là giá trị lớn nhất của logarit hàm hợp lý ứng với mô hình (R) và mô hình (U) tương ứng. Dưới giả thuyết H 0, thống kê LR có phân phối tiệm cận χ 2 (k m), với (k m) là số biến số độc lập nghi ngờ bị bỏ sót. Nếu LR > χ 2 α(k m) thì ta bác bỏ giả thiết H 0. Ví dụ Ta xét tiếp ví dụ 5.4.1, hồi quy mô hình đa thức bậc nhất, sử dụng phần mềm Eviews, kiểm định việc bỏ sót biến X 2, X 3 ta có kết quả như sau: Ta thấy LR = 45, 62 > χ 2 0,05 (2) hay p value = 0, 0000 < 0, 05 nên ta lại có kết luận mô hình đa thức bậc 1 bỏ sót ít nhất một trong hai biến.

96 90 Chương 5: Phân tích đặc trưng và lựa chọn mô hình Trường hợp 2: không có số liệu về biến X 3 + Cách 1: Kiểm định RESET của Ramsey (REgression Specification Error Test) Với cách kiểm định này ta sẽ sử dụng tổ hợp tuyến tính Ŷ 2, Ŷ 3, Ŷ 4,... thay cho X 3. Thủ tục kiểm định như sau: Bước 1: Hồi quy mô hình gốc thu được Ŷ i Bước 2: Hồi quy mô hình Y i = α + βx i + U i (old) Y i = α 1 + α 2 X 2i + α 3 Ŷ 2 i + α 4 Ŷ 3 i + α 5 Ŷ 4 i + V i (new) Bước 3: Lập giả thuyết H 0 : α 3 = α 4 = α 5 = 0 (không bỏ sót biến) Nếu F 0 = (R2 new R2 old )/m (1 Rnew 2 )/(n k) > f α(m, n k): bác bỏ H 0. m: số biến độc lập mới được đưa thêm vào mô hình (ở đây m = 3). k: số hệ số của mô hình mới (ở đây k = 5). Ví dụ Ta xét tiếp ví dụ Hồi quy mô hình gốc ta được: Ŷ i = 166, , 39333X i + Û i. Từ đó, ta tính được Ŷ i và hệ số xác định R old 2 = 0, Tiếp theo, hồi quy mô hình Y i = α 1 + α 2 X 2i + α 3 Ŷi 2 + α 4 Ŷi 3 + V i ta được Ŷ i = 2140, , 5521X i 0, 0919Ŷ 2 + 0, Ŷ 3 + Vi và Rnew 2 = 0, Lập giả thuyết: H 0 : α 3 = α 4 = 0 (không bỏ sót biến). Tính giá trị quan sát: F 0 = (R2 new R2 old )/m (0, , )/2 (1 Rnew 2 = )/(n k) (1 0, )/(10 4) Với mức ý nghĩa α = 5% thì f α (m, n k) = f 0,05 (2, 6) = 5, 14. = 284, 37. Như vậy, F 0 = 284, 37 > f 0,05 (2, 6) = 5, 143 nên ta bác bỏ H 0, nghĩa là có bỏ sót biến. Thực hiện kiểm định RESET với phần mềm Eviews ta có kết quả như trong hình 5.4. Ta thấy F 0 = 284, 4035 và p value = 0, 0000 nên ta cũng có kết luận mô hình có bỏ sót biến. + Cách 2: Kiểm định nhân tử Lagrange Bước 1: Hồi quy mô hình (old) thu được Û i.

97 Chương 5: Phân tích đặc trưng và lựa chọn mô hình 91 Hình 5.4 Kết quả kiểm định RESET Ramsey Bước 2: Hồi quy Û i = α 1 + α 2 X 2i + α 3 Ŷ 2 i + α 4 Ŷ 3 i + α 5 Ŷ 4 i + V i ta tính được R 2 aux. Bước 3: Lập giả thuyết H 0 : α 3 = α 4 = α 5 = 0 (không bỏ sót biến) Nếu nr 2 aux > χ 2 α(m) thì ta bác bỏ giả thiết H 0. m: số biến độc lập mới thêm vào mô hình (đang xét m = 3). * Lưu ý: bậc của Ŷ có thể được xác định dựa trên khảo sát dạng đồ thị của phần dư Û i theo Ŷ i. Thông thường, bậc của Ŷ càng cao thì kết quả kiểm định càng chính xác. Ví dụ Xét tiếp ví dụ Hồi quy mô hình (old) (mô hình đa thức bậc 1) ta thu được phần dư Û i Ŷ i = 166, , 933X i, R 2 = 0, 8409 Khảo sát đồ thị phần dư Û i theo Ŷ i trong hình 5.5. Từ đồ thị, ta có thể chọn mô hình hồi quy phụ sau: Û i = α 1 + α 2 X 2i + α 3 Ŷi 2 + α 4 Ŷi 3 + V i Kết quả hồi quy: Û i = 1973, , 619X 2i 0, 092Ŷ 2 0, 0001Ŷ 3 i + Vi i + Raux 2 = 0, Hình 5.5 Đồ thị phần dư Lập giả thuyết H 0 : α 3 = α 4 = 0 (không bỏ sót biến). Ta có nr 2 aux = 10 0, 9896 = 9, 896 > χ 2 0,05 (2) = 5, 99 nên ta bác bỏ giả thuyết H 0, nghĩa là có bỏ sót biến.

98 92 Chương 5: Phân tích đặc trưng và lựa chọn mô hình Kiểm định thừa biến Ta có thể áp dụng một trong các qui tắc kiểm định sau: Kiểm định thông thường (khi xét bỏ 1 biến) hoặc kiểm định F để kiểm định hai hay nhiều biến. Kiểm định Wald (áp dụng cho trường hợp khi xét bỏ một hoặc nhiều biến). Sử dụng tỷ lệ hàm hợp lý tương tự như cách 4 trình bày trong phần kiểm định bỏ sót biến. Ví dụ Xét tiếp ví dụ Hồi quy mô hình đa thức bậc 3, ta kiểm định xem sự có mặt của các biến X 2, X 3 là cần thiết hay không? Mô hình: Giả thuyết H 0 : β 2 = β 3 = 0. Y i = β 0 + β 1 X i + β 2 X 2 i + β 3X 3 i + U i Kết quả kiểm định Wald và kiểm định tỷ lệ hàm hợp lý. Hình 5.6 Kiểm định Wald Hình 5.7 Kiểm định tỷ lệ hàm hợp lý Với kiểm định Wald ta có F 0 = 177, 2348 > f 0,05 (1, 16) hay p value = 0, 0000 < 0, 05 nên ta bác bỏ giả thuyết H 0. Với kiểm định sử dụng tỷ lệ hàm hợp lý ta có LR = 45, 6 > χ 2 0,05 (2) = 5, 99 hay p value = 0, 0000 < 0, 05 nên ta cũng kết luận bác bỏ giả thuyết H 0. Trong thực nghiệm, dựa vào kết quả hồi quy nếu cho thấy giá trị p-value tương ứng với một biến nào đó lớn, nghĩa là hệ số hồi quy của biến đó không có ý nghĩa thống kê, thì ta có thể xem như biến độc lập đó không cần thiết có trong mô hình (thừa biến). Tuy nhiên, cần lưu ý rằng nếu trong lý thuyết kinh tế cho rằng biến độc lập đó có ảnh hưởng đến biến phụ thuộc thì ta nên giữ lại trong mô hình Kiểm định dạng mô hình hồi quy phù hợp (MWD test) - Chọn lựa giữa mô hình tuyến tính và mô hình tuyến tính logarit Phương pháp này được đề xuất bởi 3 nhà nghiên cứu J. Mackinnon, H. White và R. Davidson nên còn được gọi là kiểm định MWD (MWD test). Cặp giả thuyết kiểm định: { H 0 : Mô hình tuyến tính bình thường H 1 : Mô hình tuyến tính logarit

99 Chương 5: Phân tích đặc trưng và lựa chọn mô hình 93 Các bước kiểm định như sau: Bước 1: Hồi quy mẫu số liệu theo mô hình tuyến tính bình thường, ước lượng Ŷ i, ký hiệu Ŷ i Lin. Bước 2: Hồi quy mẫu số liệu theo mô hình tuyến tính logarit, ước lượng ln Ŷ i, ký hiệu ln Ŷ i Log. Bước 3: Thiết lập Z 1i theo công thức: Z 1i = ln Ŷ i Lin ln Ŷ i Log. Bước 4: Hồi quy mô hình tuyến tính bình thường Y theo các biến X và biến Z 1i. Bác bỏ giả thiết H 0 nếu hệ số hồi quy của biến Z 1i có ý nghĩa thống kê dựa vào kiểm định t. Mô hình phù hợp hơn là mô hình tuyến tính logarit. Bước 5: Thiết lập Z 2i theo công thức: Z 1i = e ln Ŷ i Log Ŷi Lin. Bước 6: Hồi quy mô hình tuyến tính logarit giữa ln Y với các ln X và Z 2i. Bác bỏ giả thiết H 1 nếu hệ số hồi quy của biến Z 2i có ý nghĩa thống kê dựa vào kiểm định t. Vậy mô hình phù hợp hơn là mô hình tuyến tính bình thường. Ví dụ Mẫu số liệu trong bảng 5.1 khảo sát số lượng hoa hồng bán được theo giá hoa hồng, giá hoa cẩm chướng giai đoạn quý 3/1971 đến quý 2/1975 tại Metro Detroit, Michigan - USA. Giá hoa hồng X 2 Giá hoa cẩm chướng X 3 Số lượng hoa hồng Quan sát ($/chục) ($/chục) bán được Y (chục) 1971Q3 2, 26 3, Q4 2, 54 2, Q1 3, 07 4, Q2 2, 91 3, Q3 2, 73 3, Q4 2, 77 3, Q1 3, 59 3, Q2 3, 23 3, Q3 2, 6 3, Q4 2, 89 3, Q1 3, 77 3, Q2 3, 64 3, Q3 2, 82 2, Q4 2, 96 3, Q1 4, 24 3, Q2 3, 69 3, Bảng 5.1 Ta thực hiện kiểm định để lựa chọn giữa hai mô hình tuyến tính và tuyến tính logarit. Bước 1: Hồi quy mô hình tuyến tính thông thường biến Y theo biến X 2 và X 3, kết quả trong hình 5.8.

100 94 Chương 5: Phân tích đặc trưng và lựa chọn mô hình Hình 5.8 Bước 2: Hồi quy mô hình tuyến tính logarit: ln Y theo ln X 2 và ln X 3, kết quả trong hình 5.9. Hình 5.9 Bước3: Thiết lập Z 1i theo công thức: Z 1i = ln Ŷ i Lin ln Ŷ i Log. Bước 4: Hồi quy mô hình tuyến tính thông thường Y theo các biến X 2, X 3 và biến Z 1i, kết quả trong hình Nhận thấy, p-value/z 1 = 0, 9838 rất lớn, do đó hệ số hồi quy của biến Z 1i không có ý nghĩa thống kê. Như vậy, ta chấp nhận giả thuyết H 0, tức là ta chọn mô hình tuyến tính thông thường. Giả sử có ý kiến cho rằng mô hình đúng là mô hình tuyến tính logarit, ta có thể kiểm định các bước tiếp theo. Bước 5: Thiết lập Z 2i theo công thức: Z 2i = Antilog ln Ŷ i Log Ŷ i Lin.

101 Chương 5: Phân tích đặc trưng và lựa chọn mô hình 95 Hình 5.10 Bước 6: Hồi quy mô hình tuyến tính logarit giữa ln Y với ln X 2, ln X 3 và Z 2i, kết quả trong hình Hình 5.11 Nhận thấy p-value/z 2 = 0, 1225 nên với mức ý nghĩa 12% thì hệ số hồi quy của biến Z 2 không có ý nghĩa thống kê. Như vậy, ta chấp nhận giả thuyết H 1, tức mô hình đúng là mô hình tuyến tính logarit. Kiểm định MWD trong trường hợp này không cho thấy một kết luận chính xác. Để làm sáng tỏ hơn, nhìn vào bảng kết quả hồi quy của hai mô hình ta có một số nhận xét: + Các biến độc lập trong mỗi mô hình đều phù hợp. + Kiểm định F cho thấy cả hai mô hình đều phù hợp.

102 96 Chương 5: Phân tích đặc trưng và lựa chọn mô hình + R 2 và R 2 của cả hai mô hình đều khá cao. Vậy ở mức ý nghĩa 12%, cả hai mô hình này đều có thể chọn. Tuy nhiên, tùy mục tiêu khảo sát mà ta chọn mô hình tuyến tính hay ô hình tuyến tính logarit, điều này phụ thuộc vào vai trò của các tham số hồi quy. Nếu chọn mức ý nghĩa > 12% thì ta sẽ chọn mô hình nào? 5.5 MÔ HÌNH KHÔNG LỒNG NHAU Các giả thiết không lồng nhau ý nói giả thuyết này không ẩn chứa trong giả thuyết kia và ngược lại. Để kiểm định những mô hình không lồng nhau, người ta có hai cách tiếp cận: phương pháp tiếp cận so sánh và phương pháp tiếp cận loại trừ Phương pháp tiếp cận so sánh Phương pháp này nhằm mục đích lựa chọn mô hình dựa theo một số tiêu chuẩn nào đó. Mô hình được chọn sẽ là mô hình thỏa các tiêu chuẩn một cách tốt nhất. Chẳng hạn, ta có thể dựa vào R 2 hay R 2 (biến phụ thuộc ở dạng giống nhau và hai mô hình có cùng biến độc lập); tiêu chuẩn AIC, SC, Phương pháp tiếp cận loại trừ Xét hai mô hình (C) và (D) như sau: (C) : Y i = α 0 + α 1 X i + U i (D) : Y i = β 1 + β 2 Z i + V i Kiểm định F cho sự không lồng nhau Giả sử ta cần chọn một trong hai mô hình (C) và (D), người ta xây dựng mô hình ghép (kết hợp) như sau: trong đó W là phần nhiễu. (E) : Y i = γ 0 + γ 1 X i + γ 2 Z i + W i, Dễ thấy rằng (E) là mô hình mẹ (kết hợp), nghĩa là mô hình (E) bao hàm tất cả các biến độc lập của mô hình (C) và (D). Tuy nhiên, (C) không nằm trong (D) và ngược lại nên chúng được gọi là những mô hình không lồng nhau. Ta thấy rằng nếu mô hình (C) là mô hình đúng thì γ = 0, ngược lại, nếu mô hình (D) là mô hình đúng thì γ 1 = 0. Do đó, người ta sẽ sử dụng kết quả hồi quy mô hình kết hợp (E) và đánh giá mức ý nghĩa thống kê của các hệ số hồi quy ước lượng bằng cách sử dụng kiểm định t (trường hợp mô hình (C) và (D) chỉ có một

103 Chương 5: Phân tích đặc trưng và lựa chọn mô hình 97 biến độc lập) hoặc sử dụng kiểm định F (trường hợp mô hình (C) và (D) có nhiều biến độc lập). Khi thực hiện phương pháp kiểm định này, chúng ta cần lưu ý những điểm sau: 1) Khi X và Z có cộng tuyến, đặc biệt là cộng tuyến ở mức độ cao, thì từng hệ số γ 1 = 0, γ 2 = 0 sẽ không có ý nghĩa thống kê mặc dù ta có thể bác bỏ giả thiết γ 1 = γ 2 = 0. Trong trường hợp này không có cách nào để quyết định được mô hình nào, (C) hay (D), là mô hình đúng. 2) Khi X và Z có cộng tuyến ở mức độ nào đó, mà biểu hiện của nó không rõ ràng quan sát được như trong chú ý thứ nhất thì giả thiết ban đầu về mô hình tham chiếu sẽ có ảnh hưởng đến quyết định chọn mô hình. Giả sử ban đầu ta chọn mô hình (C) là mô hình tham chiếu và thấy rằng các hệ số hồi quy của nó đều có ý nghĩa thống kê. Khi thêm các biến của mô hình (D) vào mô hình (C) để trở thành mô hình kết hợp (E) và sử dụng kiểm định F, nhận thấy rằng các biến độc lập của (D) đồng thời không có ý nghĩa thống kê. Điều này khiến người ta dễ chấp nhận (C) là mô hình đúng. Nhưng nếu mô hình tham chiếu là mô hình (D) thì ta hồn tồn có thể gặp tình huống tương tự và cũng dễ dàng đưa ra quyết định chọn mô hình (D) là mô hình đúng. Kiểm định J của Davidson - Mackinnon Được thực hiện qua các bước sau: Hồi quy mô hình (D) và ước lượng giá trị trung bình của Y, ký hiệu Ŷ D i. Coi Ŷ D i như là một biến độc lập và thực hiện hồi quy mô hình (C ): (C ) : Y i = λ 0 + λ 1 X i + λ 2 Ŷ D i + U i. Kiểm định giả thuyết H 0 : λ 2 = 0. Nếu không có cơ sở bác bỏ H 0 thì ta có thể quyết định chọn (C) là mô hình đúng. Nếu bác bỏ H 0 thì mô hình (C) không thể là mô hình đúng. Lặp lại quá trình trên với mô hình tham chiếu là mô hình (C). Hồi quy (C) và tính Ŷi C. Bổ sung Ŷi C vào mô hình (D) ta được mô hình (D ) (D ) : Y i = δ 0 + δ 1 X i + δ 2 Ŷi C + V i. Kiểm định giả thuyết: H 0 : δ 2 = 0. Nếu chấp nhận H 0, ta chọn mô hình đúng là mô hình (D). Nếu bác bỏ H 0 thì không thể xem mô hình (D) là mô hình đúng. * Bảng tóm tắt quy tắc quyết định theo kiểm định J:

104 98 Chương 5: Phân tích đặc trưng và lựa chọn mô hình H 0 : λ 2 = 0 Không bác bỏ Bác bỏ H 0 : δ 2 = 0 Không bác bỏ Thừa nhận (C) và (D) Thừa nhận (D) Bác bỏ Thừa nhận (C) Bác bỏ (C) và (D) Qua bảng này ta thấy, nếu bác bỏ cả hai mô hình thì có nghĩa là không có mô hình nào có thể giúp chúng ta giải thích được cho sự biến thiên của biến phụ thuộc Y. Nếu thừa nhận cả hai mô hình thì có thể nói với dữ liệu hiện có không có đủ thông tin để phân biệt được mô hình nào tốt hơn. Đó là những điểm hạn chế của quy tắc kiểm định J. Việc sử dụng kiểm định J, được khuyến cáo, chỉ cho kết quả đáng tin cậy khi cỡ mẫu lớn.

105 Chương 6 MÔ HÌNH VI PHẠM CÁC GIẢ THIẾT Trong các chương trước chúng ta đã nói đến 5 giả thiết của mô hình hồi quy tuyến tính cổ điển, trong đó các giả thiết 1 4 để đảm bảo rằng các ước lượng OLS là các ước lượng BLUE và giả thiết 5 được thỏa mãn thì các suy diễn thống kê mới có giá trị. Đối với giả thiết 1 nói chung đã được đảm bảo nên ta chỉ quan tâm đến các giả thiết 2 5. Vậy điều gì sẽ xảy ra nếu mô hình không thỏa mãn một trong các giả thiết này và khi đó làm thế nào để khắc phục được các vấn đề này. Nội dung chương 5 sẽ giải đáp các câu hỏi này. 6.1 KỲ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC KHÔNG Xét mô hình hồi quy tuyến tính k biến Y = β 1 + β 2 X β k X k + U (6.1.1) Giả thiết 2 yêu cầu E(U X 2,..., X k ) = 0. Nếu giả thiết này thỏa mãn thì sẽ có E(U) = 0 (6.1.2) cov(x j, U) = 0, j = 2, k (6.1.3) Do đó, nếu (6.1.2) hoặc (6.1.3) không thỏa mãn thì giả thiết 2 sẽ không còn thỏa mãn Nguyên nhân Nguyên nhân 1: Thiếu biến quan trọng. Một mô hình được cho là thiếu biến quan trọng Z nào đó nếu: i) Biến Z có tác động đến biến phụ thuộc Y ; ii) Biến Z có tương quan với ít nhất một trong các biến độc lập sẵn có trong mô hình. Với điều kiện i) thì biến Z sẽ là một trong các thành phần của sai số ngẫu nhiên U. Khi đó, nếu Z có tương quan với biến X j nào đó trong mô hình (điều kiện ii)) thì có thể làm cho X j và U có tương quan với nhau gây ra sự vi phạm (??) và làm cho gỉ thiết 2 không còn được thỏa mãn. Nguyên nhân 2: Dạng hàm sai.

106 100 Chương 6: Mô hình vi phạm các giả thiết Với mô hình (6.1.1), lấy kỳ vọng hai vế ta có: E(Y i (X2i,...,X ki )) = β 1 + β 2 X 2i + + β 2 X ki + E(U i (X2i,...,X ki )) Do đó, giả thiết 2 tương đương với giả thiết sau: E(Y i (X2i,...,X ki )) = β 1 + β 2 X 2i + + β k X ki (6.1.4) Biểu thức (6.1.4) ngụ ý rằng kỳ vọng của biến phụ thuộc Y là một hàm tuyến tính của các biến số X j. Như vậy, nếu kỳ vọng này có dạng hàm khác, chẳng hạn E(Y i (X2i,...,X ki )) = β 1 + β 2 X 2i + + β k X ki + βx2i 2 Hay E(Y i (X2i,...,X ki )) = β 1 + β 2 ln(x 2i ) + + β k ln(x ki ) thì khi đó (6.1.4) là không thỏa mãn và cũng có ý nghĩa rằng giả thiết 2 bị vi phạm. Nguyên nhân 3: Tính tác động đồng thời của số liệu. Ví dụ Xét mô hình cung cầu về một loại hàng hóa Q D = β 1 + β 2 P + U Q S = α 1 + α 2 P + V Q D = Q S trong đó Q S, Q D và P lần lượt là cung, cầu và giá bán của một đơn vị hàng hóa này. U, V tương ứng là sai số ngẫu nhiên của hàm cầu, hàm cung. Do số liệu quan sát về Q S, Q D và P thỏa mãn điều kiện thị trường cân bằng nên hệ này có thể viết lại thành: Q = β 1 + β 2 P + U (6.1.5) Q = α 1 + α 2 P + V (6.1.5 ) Xét mô hình (6.1.5) một cách riêng rẽ. Giả sử tại thời điểm ban đầu, đường cầu Q D1 cắt đường cung Q S tại M 1, tương ứng với mức giá cân bằng P 1. Khi U thay đổi, chẳng hạn được gia tăng do sự tăng giá của hàng hóa cạnh tranh, đường cầu dịch chuyển sang phải đến vị trí Q D2. Lúc này điểm cân bằng mới là M 2 tương ứng với mức giá mới P 2. Điều này được minh họa như trong hình 6.1. Như vậy, khi U gia tăng thì cũng kéo theo P gia tăng. Điều này thể hiện có sự tương quan thuận chiều giữa U và P và khi đó giả thiết 2 không còn thỏa mãn đối với mô hình (6.1.5). Nguyên nhân 4: Sai số đo lường của các biến độc lập. Giả sử biến X 2 bị đo sai thành X 2 :

107 Chương 6: Mô hình vi phạm các giả thiết 101 Hình 6.1 Đồ thị cung cầu một loại hàng hóa X 2 = X 2 + V, trong đó V là sai số đo lường. Khi đó, thay vì (6.1.1), thực tế ta sử dụng mô hình: Y = β 1 + β 2 X β k X k + (U β 2 V ) (6.1.6) Thông thường, mức sai lệch V càng lớn khi giá trị của biến bị đo sai X 2 càng lớn, nghĩa là V và X2 thường có tương quan cao với nhau, do đó mô hình (6.1.6) sẽ vi phạm giả thiết Hậu quả của kỳ vọng sai số ngẫu nhiên khác không Ước lượng OLS sẽ là ước lượng chệch Tức là ta sẽ có E( βj ) β j. Khi đó, các giá trị có thể có của βj phân bổ sung quanh một giá trị β nào đó chứ không phải là giá trị β j. Các suy diễn thống kê không còn đáng tin cậy Do βj là ước lượng chệch của β j nên thống kê t = β j β j theo quy luật Student. se( βj ) sẽ không còn tuân Cách phát hiện kỳ vọng sai số ngẫu nhiên khác không Phần trên chúng ta đã đưa ra 4 nguyên nhân chính gây ra sự vi phạm giả thiết 2. Trong giới hạn bài giảng, chúng ta sẽ chỉ tìm hiểu cách phát hiện sự vi phạm giả thiết 2 do nguyên nhân thứ nhất và nguyên nhân thứ hai.

108 102 Chương 6: Mô hình vi phạm các giả thiết Mô hình bỏ sót biến quan trọng Để xem xét mô hình có bỏ sót biến Z nào đó hay không ta có thể sử dụng kiểm định t-test đã trình bày trong chương 3. Trường hợp xem xét mô hình có thiếu một số biến Z 1, Z 2,..., Z m mà các giá trị của các biến đã có thì ta có thể dùng kiểm định F hay các kiểm định khác đã được trình bày trong chương 5. Mô hình có dạng hàm sai Kiểm định dạng hàm sai trong trường hợp lựa chọn giữa hai mô hình lồng nhau ta có thể sử dụng kiểm định Ramsey. Trường hợp ta muốn lựa chọn giữa hai mô hình không lồng nhau thì ta dùng kiểm định J của Davidson - Mac Kinnon hay dùng phương pháp kiểm định mô hình ghép (kết hợp) đã trình bày trong chương Một số biện pháp khắc phục Dựa trên các nguyên nhân gây nên hiện tượng kỳ vọng sai số ngẫu nhiên khác không ta có những cách khắc phục khác nhau: + Nguyên nhân thiếu biến: Nếu biến bị thiếu là Z đã biết thì ta chỉ việc thêm biến Z vào mô hình. Nếu biến Z là không quan sát được thì ta có thể dùng biến đại diện (proxy variable). Một biến Z được coi là biến đại diện cho biến Z nếu nó là quan sát được và có tương quan với biến Z. Khi đó, ta có thể đưa biến Z này vào mô hình thay thế cho biến Z. Ví dụ Xem xét các yếu tố tác động đến năng suất của người lao động, ta xét mô hình hồi quy sau NS = β 1 + β 2 KN + β 3 HV + β 4 NL + U trong đó NS, KN, HV, NL lần lượt là năng suất, số năm kinh nghiệm, trình độ học vấn và năng lực bẩm sinh cá nhân. Năng lực bẩm sinh cá nhân là biến không quan sát được và thường có quan hệ tương quan với trình độ học vấn nên nếu không đưa biến NL vào thì mô hình sẽ gặp vấn đề thiếu biến quan trọng. Trong thực tế, ta có thể dùng biến chỉ số IQ làm biến đại diện cho biến năng NL vì IQ được cho là có tương quan cao với năng lực bẩm sinh cá nhân và đồng thời là biến quan sát được.

109 Chương 6: Mô hình vi phạm các giả thiết SAI SỐ NGẪU NHIÊN KHÔNG TUÂN THEO QUY LUẬT CHUẨN Trong các bài toán về xây dựng khoảng tin cậy, bài toán kiểm định giả thuyết thống kê về các hệ số hồi quy cũng như bài toán dự báo giá trị trung bình và giá trị riêng biệt của biến phụ thuộc ta buộc phải có giả thiết U i N(0, σ 2 ), i. Tuy nhiên, trong nhiều trường hợp giả thiết này là không thỏa mãn. Khi đó, điều gì sẽ xảy ra với mô hình Hậu quả khi sai số ngẫu nhiên không tuân theo quy luật chuẩn Khi sai số ngẫu nhiên không tuân theo quy luật chuẩn thì các ước lượng βj sẽ không tuân theo quy luật chuẩn và do đó các thống kê t sẽ không tuân theo quy luật Student, thống kê F sẽ không tuân theo quy luật Fisher. Vậy khi đó các suy diễn thống kê về các hệ số chỉ còn đáng tin cậy khi kích thước mẫu lớn. Điều này được khẳng định qua định lý sau: Định lý Khi các giả thiết 1 4 thỏa mãn thì thống kê t = β j β j se( βj ) có phân phối tiệm cận với quy luật chuẩn hóa N(0, 1) Cách phát hiện sai số ngẫu nhiên không tuân theo quy luật chuẩn Cách 1: Xem xét đồ thị phần dư Xem xét đồ thị tần suất (historgram plot) của phần dư có thể giúp chúng ta có ý tưởng về hình dạng của phân phối xác suất. Chúng ta biết rằng để biến ngẫu nhiên nào đó tuân theo quy luật chuẩn hoặc xấp xỉ chuẩn thì hàm mật độ của nó phải đối xứng. Như vậy, nếu phân phối quá lệch về bên phải hoặc bên trái, quá nhọn hoặc quá dẹt thì đó là các dấu hiệu cho rằng sai số ngẫu nhiên của mô hình là không tuân theo quy luật chuẩn. Cách 2: Kiểm định Jacque - Beta (JB) Ta biết rằng biến ngẫu nhiên có phân phối chuẩn sẽ có độ bất đối xứng bằng 0 và độ nhọn bằng 3. Do đó, nếu một biến ngẫu nhiên nào đó có độ bất đối xứng quá khác 0 hoặc độ nhọn quá khác 3 thì đấy là dấu hiệu cho rằng biến đó không tuân theo quy luật chuẩn. Kiểm định Jacque - Beta được thực hiện với cặp giả thuyết H 0 : sai số ngẫu nhiên tuân theo quy luật chuẩn H 1 : sai số ngẫu nhiên không tuân theo quy luật chuẩn

110 104 Chương 6: Mô hình vi phạm các giả thiết Các bước thực hiện: Bước 1: Ước lượng mô hình hồi quy gốc, thu được các phần dư Û i Bước 2: Tính giá trị quan sát của thống kê kiểm định: ( S 2 JB = n 6 ) (K 3) trong đó S là độ bất đối xứng (Skewness), K là độ nhọn (K urtosis) và được tính bởi công thức sau: S = 3 4 Ûi /n Ûi /n (, K = 2 Û i /n) 3/2 ( 2 Û i /n) 2 trong đó n là kích thước mẫu. Nếu giả thuyết H 0 là đúng thì thống kê kiểm định sẽ tuân theo quy luật Khi bình phương với số bậc tự do là 2. Bước 3: Nếu JB > χ 2 α(2) thì bác bỏ giả thuyết H 0 và thừa nhận giả thuyết H 1. Ví dụ Hình 6.2 là kết quả kiểm định JB cho một mô hình bằng phần mềm Eviews. Kết quả này gồm hai phần: phần hình vẽ thể hiện phân phối mẫu của phần dư và phần thống kê thể hiện kết quả kiểm định. Kết quả kiểm định cho thấy thống kê JB = 1, 329 ứng với giá trị xác suất p = 0, 514. Do đó, ta chưa có cơ sở bác bỏ giả thuyết H 0 hay có thể cho rằng sai số ngẫu nhiên trong mô hình tuân theo quy luật chuẩn. Hình 6.2 Kết quả kiểm định JB

111 Chương 6: Mô hình vi phạm các giả thiết ĐA CỘNG TUYẾN Bản chất và nguyên nhân của đa cộng tuyến Bản chất của đa cộng tuyến Xét mô hình hồi quy bội Y = β 1 + β 2 X β k X k + U Mô hình lý tưởng là các biến độc lập không có tương quan với nhau, mỗi biến chứa đựng một thông tin riêng về Y và thông tin đó không có trong biến độc lập khác. Khi đó, hệ số tương quan riêng cho biết ảnh hưởng của từng biến độc lập đối với biến phụ thuộc khi giả định các biến độc lập còn lại khác không đổi. Trong trường hợp này ta nói không có hiện tượng đa cộng tuyến. Trong trường hợp có quan hệ tương quan giữa các biến độc lập trong mô hình ta gọi là hiện tượng đa cộng tuyến. * Cách tiếp cận với vấn đề đa cộng tuyến bằng biểu đồ Venn: Hình 6.3 Minh họa các mức độ đa cộng tuyến Mức độ đa cộng tuyến được đánh giá là cao hay thấp biểu thị qua hình 6.3, trong đó diện tích chung của hai hình tròn tượng trưng cho hai biến độc lập. * Cách tiếp cận đại số của vấn đề đa cộng tuyến: Nếu tồn tại các số thực λ 2, λ 3,..., λ k không đồng thời bằng 0 sao cho λ 2 X 2 + λ 3 X λ k X k = 0 thì ta nói giữa các biến X i (i = 2, 3,..., k) xảy ra hiện tượng đa cộng tuyến hoàn hảo.

112 106 Chương 6: Mô hình vi phạm các giả thiết Nếu tồn tại các số thực λ 2, λ 3,..., λ k không đồng thời bằng 0 sao cho λ 2 X 2 + λ 3 X λ k X k + V = 0 với V là sai số ngẫu nhiên, thì ta có đa cộng tuyến không hoàn hảo giữa các biến X i (i = 2, 3,..., k). Ví dụ Một công ty xe khách tuyến đường Vũng Tàu - Sài Gòn, giá vé là đồng một hành khách cho một lượt đi. Giả sử số lượng khách và doanh thu (đơn vị: nghìn đồng) trong một tuần lễ như sau: Ngày Số khách/ngày Doanh thu Tổng doanh thu/ngày (X 2 ) bán vé/ngày (X 3 ) (X 3 ) , 35 31, , 15 42, , 50 32, , 30 39, , 20 35, , 45 61, , 90 64, 74 Ta có: Doanh thu do bán vé = Số hành khách x 50000đ, tức là X 3i = 50000X 2i. Đây là trường hợp cộng tuyến hoàn hảo giữa biến X 2 và biến X 3, hệ số tương quan giữa hai biến này là r 23 = 1. Phân tích cột tổng doanh thu trong ngày ta thấy: Từ đó, X 3i = X 3i + V i X 2i = X 3i = (X 3i V i) = X 3i U i. Đây là trường hợp đa cộng tuyến không hoàn hảo giữa biến X 2 và X3. Tuy nhiên, hệ số tương quan giữa hai biến trên cũng rất gần bằng 1 (r 23 = 0, ). * Lưu ý: Khi nói đến đa cộng tuyến, chúng ta chỉ quan tâm đến các biến độc lập mà không xem xét gì đến biến phụ thuộc. Nguyên nhân của đa cộng tuyến Có nhiều nguyên nhân dẫn đến hiện tượng đa cộng tuyến. Một số nguyên nhân chính là: - Phương pháp thu thập số liệu sử dụng: mẫu không đặc trưng cho tổng thể. - Do bản chất của các mối quan hệ giữa các biến đã ngầm chứa hiện tượng đa cộng tuyến.

113 Chương 6: Mô hình vi phạm các giả thiết 107 Chẳng hạn, hồi quy lượng điện năng tiêu thụ (Y ) theo thu nhập (X 1 ) và diện tích nhà ở (X 2 ). Trong mối quan hệ này ẩn chứa đa cộng tuyến vì thông thường những gia đình có thu nhập cao thì có nhà rộng hơn những gia đình có thu nhập thấp. - Đặc trưng mô hình: chẳng hạn khi bổ sung những biến có lũy thừa bậc cao vào mô hình, đặc biệt khi phạm vi dữ liệu của biến biến độc lập là nhỏ. - Một mô hình xác định quá mức: xảy ra khi số biến giải thích nhiều hơn cỡ mẫu. Trong trường hợp này ta không xác định được duy nhất các hệ số hồi quy Ước lượng các tham số khi có đa cộng tuyến Trường hợp đa cộng tuyến hoàn hảo Xét mô hình hồi quy ba biến: Ta xét các độ lệch SRF : Y i = β1 + β2 X 2i + β3 X 3i + Û i x 2i = X 2i X 2, x 3i = X 3i X 3, y i = Y i Y. Theo tính chất hàm hồi quy mẫu đi qua giá trị trung bình ta có Y = β1 + β2 X 2 + β3 X 3. Thay vào hàm SRF ta được hàm hồi quy viết dưới dạng độ lệch: y i = β2 x 2i + β3 x 3i + Û i. Nếu áp dụng phương pháp OLS, dựa vào Û 2 i min, các tham số ước lượng và phương sai của các tham số được tính bởi công thức: β 2 = ( y i x 2i )( x 2 3i ) ( y i x 3i )( x 2i x 3i ) ( x 2 2i )( x 2 3i ) ( x 2i x 3i ) 2 β 3 = ( y i x 3i )( x 2 2i ) ( y i x 2i )( x 2i x 3i ) ( x 2 2i )( x 2 3i ) ( x 2i x 3i ) 2 V ar( β2 ) = x 2 3i ( x 2 2i )( x 2 3i ) ( x 2i x 3i ) 2 σ2 V ar( β3 ) = x 2 2i ( x 2 2i )( x 2 3i ) ( x 2i x 3i ) 2 σ2 Khi có đa cộng tuyến hoàn hảo xảy ra, nghĩa là X 3i = λx 2i, dẫn tới x 3i = λx 2i, do đó: β 2 = 0/0, β3 = 0/0 (không xác định); Var β2 = 1/0, Var β3 = 1/0. Nếu thay x 3i = λx 2i vào mô hình y i = β2 x 2i + β3 x 3i + Û i, ta có y i = β2 x 2i + β3 λx 2i + Û i = ( β2 + λ β3 )x 2i + Û i = αx 2i + Û i.

114 108 Chương 6: Mô hình vi phạm các giả thiết Đây chính là cách biểu diễn của mô hình hồi quy qua gốc tọa độ. Sử dụng công thức hồi quy qua gốc tọa độ, ta có: α = β2 + λ β3 = yi x 2i x 2 2i. α = β2 + λ β3 là một phương trình nhưng chứa 2 ẩn β2 và β3 cho nên ta có thể có vô số lời giải cho β2 và β3 khi α và λ chứa một giá trị nào đó. Như vậy, trong trường hợp đa cộng tuyến hoàn hảo, ta không thể tách riêng ảnh hưởng của từng biến độc lập tác động lên biến phụ thuộc. Ta chỉ có thể ước lượng ảnh hưởng chung của các biến cộng tuyến lên biến phụ thuộc. Trường hợp đa cộng tuyến không hoàn hảo Ta có thể biểu diễn mối quan hệ cộng tuyến không hoàn hảo giữa X 1, X 2 dưới dạng độ lệch như sau: x 3i = λx 2i + v i (6.3.1) trong đó, λ 0, v i là sai số ngẫu nhiên sao cho x 2i v i = 0 (nghĩa là x 2 và v không có cộng tuyến). Thay (6.3.1) vào công thức xác định các hệ số hồi quy ta có: β 2 = ( y i x 2i )(λ 2 x 2 2i + v 2 i ) (λ y i x 2i + y i v i )(λ x 2 2i ) ( x 2 2i )(λ2 x 2 2i + v 2 i ) (λ x 2 2i )2 β 3 = (λ y i x 2i + y i v i )( x 2 2i ) ( y i x 2i )(λ x 2 2i ) ( x 2 2i )(λ2 x 2 2i + v 2 i ) (λ x 2 2i )2 Như vậy, ta xác định được duy nhất các tham số ước lượng cho mô hình hồi quy Hậu quả của đa cộng tuyến 1) Khi xảy ra hiện tượng đa cộng tuyến, các hệ số ước lượng được vẫn có tính chất BLUE nhưng phương sai và hiệp phương sai của chúng lớn, nghĩa là các giá trị ước lượng thay đổi nhiều từ mẫu này sang mẫu khác, điều này làm cho việc xác định giá trị ước lượng chính xác trở nên khó khăn. Xét mô hình hồi quy với hai biến độc lập X 2, X 3 : Y i = β 1 + β 2 X 2i + β 3 X 3i + U i. V ar( β2 ) = σ2 1. x 2 2i 1 r23 2 ; V ar( β3 ) = σ2 1. x 2 3i 1 r23 2 ; Cov( β2, β3 ) = r 23 là hệ số tương quan giữa X 2 và X 3. r 23 σ 2 (1 r 2 23 ) x 2 2i. x 2 3i. Khi r 23 1, nghĩa là mức độ cộng tuyến tăng dần, thì phương sai của các ước lượng gia tăng và tại giới hạn khi r 23 = 1, nghĩa là cộng tuyến hoàn hảo thì chúng tiến tới.

115 Chương 6: Mô hình vi phạm các giả thiết 109 Tương tự, hiệp phương sai của các ước lượng có xu hướng tăng dần (theo giá trị tuyệt đối) khi r Tốc độ gia tăng của phương sai và hiệp phương sai có thể được xác định bởi nhân tử phóng đại phương sai VIF: V IF = 1 1 r23 2. Nhận thấy rằng, khi r 23 1 thì V IF. Cộng tuyến cao. Khi r 23 0 thì V IF 1. Không có đa cộng tuyến. Ta xét một số trường hợp để thấy tốc độ gia tăng của phương sai và hiệp phương sai theo sự gia tăng của r 23 qua sự gia tăng của V IF. r 23 = 0 Var( β2 ) = σ2 x 2 2i = A: Không có đa cộng tuyến. r 23 = 0, 95 Var( β2 ) 10, 26A: tăng lên hơn 10 lần so với r 23 = 0. r 23 = 0, 99 Var( β2 ) 150, 25A: tăng lên hơn 50 lần so với r 23 = 0. r 23 = 0, 995 Var( β2 ) 100, 25A: tăng lên hơn 100 lần so với r 23 = 0. r 23 = 0, 999 Var( β2 ) 500, 25A: tăng lên hơn 500 lần so với r 23 = 0. * Tổng quát, với mô hình hồi quy k biến, trong đó có (k 1) biến giải thích X 2, X 3,..., X k. Ta có 1 V IF = 1 Rj 2 với R 2 j là giá trị R2 trong hàm hồi quy của X j theo (k 2) biến giải thích còn lại. Nếu có hiện tượng đa cộng tuyến giữa biến X j với các biến còn lại thì Rj 2 sẽ gần bằng 1, khi đó V IF sẽ lớn. V IF càng lớn, cộng tuyến càng cao. Theo kinh nghiệm, V IF > 10 khi đó R 2 j > 0, 9 được coi là cộng tuyến cao. 2) Do hậu quả 1, khoảng tin cậy của các hệ số hồi quy có khuynh hướng rộng hơn, điều này dẫn đến độ chính xác của ước lượng khoảng cho tham số hồi quy β j giảm đi. 3) Khi kiểm định giả thuyết H 0 : β j = β j, ta có thể sử dụng thống kê t = βj β j se( βj ). Trường hợp đa cộng tuyến cao thì se( βj ) có xu hướng tăng mạnh, dẫn đến giá trị t có khuynh hướng nhỏ đi. Do đó, ta có xu hướng chấp nhận giả thuyết H 0. 4) Mặc dù tỷ số t bé nhưng hệ số xác định R 2 có thể rất cao. 5) Các ước lượng OLS của β j và các se( βj ) trở nên rất nhạy với những thay đổi nhỏ trong số liệu. 6) Dấu của các hệ số ước lượng βj có thể sai dẫn đến phản ánh không đúng các quy luật kinh tế. 7) Thêm vào hay bớt đi các biến cộng tuyến với các biến khác, mô hình sẽ thay đổi về độ lớn của các ước lượng hoặc dấu của chúng.

116 110 Chương 6: Mô hình vi phạm các giả thiết Cách phát hiện đa cộng tuyến Hệ số xác định R 2 cao nhưng tỷ số t thấp Khi hệ số xác định R 2 cao, kinh nghiệm cho thấy R 2 > 0, 8 thì thường giả thiết H 0 về các hệ số hồi quy đồng thời bằng 0 bị bác bỏ. Tuy nhiên, tỷ số t thấp thì ta có xu hướng chấp nhận giả thiết H 0. Như vậy, ta thấy có hiện tượng nghịch lý xảy ra. Hạn chế của quy tắc này là nó chỉ thể hiện rõ khi có đa cộng tuyến ở mức độ cao. Ví dụ Một khảo sát của công ty KCT kinh doanh máy vi tính tại 10 cửa hàng để tìm hiểu ảnh hưởng của doanh số bán hàng và tiền thưởng cho bộ phận kinh doanh lên lợi nhuận sau thuế, giả sử số liệu thu được như sau (đơn vị: triệu đồng): Tiền thưởng Doanh số bán Lợi nhuận Tiền thưởng Doanh số bán Lợi nhuận (X 2 ) (X 3 ) (Y ) (X 2 ) (X 3 ) (Y ) 1, , , 7 1, , 685 1, , 62 2, , 8 3, , 654 1, , 06 2, , 16 4, , 25 2, , 96 Kết quả hồi quy như sau: Nhận thấy R 2 = 0, là rất lớn, trong khi đó tỷ số t của hệ số hồi quy β 2 rất nhỏ và giá trị p-value(x 2 ) = 0, 1161 > 0, 05 do đó β 2 không có ý nghĩa thống kê, biến X 2 (tiền thưởng) không có ảnh hưởng lên lợi nhuận. Vậy có khả năng hai biến độc lập là tiền thưởng và doanh số bán hàng có cộng tuyến cao.

117 Chương 6: Mô hình vi phạm các giả thiết 111 Hệ số tương quan giữa các biến độc lập cao Kinh nghiệm cho thấy khi hệ số tương quan cặp giữa các biến độc lập lớn hơn 0, 8 thì vấn đề cộng tuyến trở nên nghiêm trọng. Đây chỉ là điều kiện đủ chứ không phải điều kiện cần. Ví dụ Với số liệu trong ví dụ ta có bảng ma trận hệ số tương quan như sau: Hệ số tương quan r 23 = 0, rất lớn, chứng tỏ có hiện tượng đa cộng tuyến cao. Tuy nhiên, có nhiều trường hợp cộng tuyến cao nhưng hệ số tương quan lại thấp. Ví dụ Xét mô hình hồi quy có 3 biến độc lập X 1, X 2, X 3 với số liệu mẫu như sau: X 1 = (1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0) X 2 = (0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0) X 3 = (1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0) Nhận thấy có đa cộng tuyến hoàn hảo vì X 3 = X 1 + X 2 nhưng các hệ số tương quan cặp tương ứng là r 12 = 0, 333; r 13 = r 23 = 0, 59 không cao. Đối với mô hình hồi quy có hai biến độc lập thì dấu hiệu hệ số tương quan cặp cao là điều kiện cần và đủ cho bản chất đa cộng tuyến ở mức độ cao. Sử dụng hồi quy phụ Xét mô hình hồi quy nhiều biến: Y = β 1 + β 2 X 2 + β 3 X β k X k + U. Ta ước lượng mô hình hồi quy phụ giữa biến độc lập X j với các biến độc lập còn lại dưới dạng mô hình sau: X j = α 1 + α 2 X α j 1 X j 1 + α j+1 X j α k X k + V. Sau khi ước lượng mô hình hồi quy phụ, ta tính được hệ số xác định của mô hình, ký hiệu R 2 j.

118 112 Chương 6: Mô hình vi phạm các giả thiết Lập giả thuyết: H 0 : R 2 j = 0 hay H 0 : không có đa cộng tuyến. Sử dụng thống kê F để kiểm định như sau: F j = Rj 2 /(k 2) (1 Rj 2 )/(n k + 1). Nếu F j > f α (k 2; n k + 1): bác bỏ H 0 (n: cỡ mẫu, k: số tham số trong mô hình hồi quy). Trên nguyên tắc ta phải kiểm định giá trị Rj 2 của tất cả các hồi quy phụ, tuy nhiên ta có thể áp dụng quy tắc ngón tay cái của Klien, tức là hiện tượng cộng tuyến trở thành vấn đề nghiêm trọng chỉ nếu giá trị Rj 2 thu được từ một hàm hồi quy phụ nào đó lớn hơn giá trị R 2 của hàm hồi quy chính - hàm hồi quy của biến phụ thuộc Y. Phương pháp sử dụng hồi quy phụ cũng có hạn chế, đặc biệt là khi vấn đề cộng tuyến chỉ bao hàm một số biến độc lập trong mô hình. Khi đó, việc chấp nhận giả thuyết H 0 : Rj 2 = 0 của hồi quy phụ có thể không phát hiện được đa cộng tuyến bộ phận giữa một số biến độc lập với nhau. Ví dụ Trở lại với ví dụ 6.3.2, thực hiện hồi quy phụ tiền thưởng theo doanh số bán hàng ta được kết quả như sau: Kết quả cho thấy: R 2 = 0, Giá trị thống kê F = 106, 2288 với p value = 0, < 0, 05. Do vậy, trong kiểm định F ta bác bỏ giả thuyết H 0, nghĩa là có xảy ra đa cộng tuyến giữa 2 biến độc lập là tiền thưởng và doanh số bán hàng. Sử dụng nhân tử phóng đại phương sai VIF 1 V IF j = 1 Rj 2

119 Chương 6: Mô hình vi phạm các giả thiết 113 với Rj 2 là hệ số xác định của hàm hồi quy phụ. Khi Rj 2 tiến về 1, nghĩa là mức đa cộng tuyến giữa X j với những biến độc lập còn lại càng cao thì V IF j càng lớn. Tại điểm giới hạn V IF j tiến tới. Theo kinh nghiệm khi V IF j > 10 Rj 2 > 0.9 thì mức độ cộng tuyến được xem là cao. Việc đánh giá mức độ cộng tuyến thông qua giá trị V IF cũng có ý nghĩa tương đối, tức là giá trị VIF cao thì không có nghĩa là phương sai và sai số của các ước lượng cao. Ví dụ Theo ví dụ 6.3.5, ta có V IF = 1 1 R 2 2 = 1 = 14, > , Chứng tỏ có đa cộng tuyến cao giữa X 2 và X 3. Ví dụ Cho số liệu về lượng tiêu dùng thịt gà tính theo đầu người Y, thu nhập khả dụng thực theo đầu người X 1, giá bán lẻ thực của thịt gà X 2, giá bán lẻ thực của thịt heo X 3 và giá bán lẻ thực của thịt bò X 4 ở Mỹ cho thời kỳ từ năm 1960 đến Dựa trên lý thuyết kinh tế vĩ mô nghiên cứu về nhu cầu của một loại hàng, một cách tổng quát, là một hàm theo thu nhập thực của người tiêu dùng, giá trị thực của sản phẩm, giá trị thực của các hàng hóa bổ sung hay hàng hóa thay thế, ta ước lượng mô hình hồi quy trong đó biến phụ thuộc là giá trị logarit tự nhiên của lượng thịt gà tiêu dùng tính theo đầu người. Kết quả hồi quy trong bảng là ước lượng của mô hình tuyến tính logarit, các hệ số hồi quy đều mang ý nghĩa là hệ số co giãn riêng của Y theo từng biến độc lập tương ứng.

120 114 Chương 6: Mô hình vi phạm các giả thiết Như vậy hệ số co giãn của cầu thịt gà theo thu nhập xấp xỉ là 0, 342%; hệ số co giãn của cầu thịt gà theo giá thịt gà là 0, 504%; hệ số co giãn của cầu thịt gà theo giá thịt heo và giá thịt bò (hàng thay thế) lần lượt là 0, 148% và 0, 091%. Nhận thấy rằng hệ số co giãn của cầu thịt gà theo giá thịt gà có giá trị tuyệt đối < 1, điều này chứng tỏ rằng thịt gà là mặt hàng không co giãn theo giá. Ngồi ra, dấu của các hệ số hồi quy tỏ ra phù hợp với lý thuyết kinh tế. Nếu xem xét ở mức độ ý nghĩa thống kê của các giá trị ước lượng thì nhận thấy hệ số hồi quy theo giá thịt heo, thịt bò không có ý nghĩa thống kê. Điều này dường như đưa đến nhận định rằng giá của thịt heo, thịt bò không ảnh hưởng đến lượng cầu về thịt gà và như vậy mâu thuẫn với lý thuyết kinh tế. Do đó, chúng ta cần xem xét có hay không khả năng cộng tuyến cao giữa các biến độc lập trong mô hình. Ta xem xét ma trận hệ số tương quan giữa các biến độc lập trong hàm cầu về thịt gà. Dễ thấy rằng các hệ số tương quan cặp trong bảng trên đều có giá trị cao. Với kết quả này, khả năng có cộng tuyến giữa các biến độc lập là cao, tuy nhiên ta

121 Chương 6: Mô hình vi phạm các giả thiết 115 cũng cần xét đến các công cụ phát hiện khác. Ta sử dụng hồi quy phụ để xem xét, kết quả thể hiện trong 4 bảng dưới đây. Các hệ số hồi quy riêng trong mô hình hồi quy phụ đều khác 0 có ý nghĩa thống kê, giá trị R 2 của các mô hình đều lớn hơn Kiểm định F cho thấy các giá trị p-value đều rất nhỏ, chứng tỏ R 2 có ý nghĩa đáng kể về mặt thống kê. Kết quả này cho thấy từng biến độc lập trong hàm cầu về thịt gà có cộng tuyến cao với các biến độc lập khác trong mô hình. Như vậy, việc các hệ số hồi quy theo giá thịt heo, thịt bò trong hàm cầu về thịt gà không có ý nghĩa thống kê là do hậu quả của vấn đề đa cộng tuyến trong mô hình.

122 116 Chương 6: Mô hình vi phạm các giả thiết Cách khắc phục đa cộng tuyến Sử dụng thông tin tiên nghiệm Sử dụng thông tin tiên nghiệm đã biết để gộp biến làm giảm số biến và do đó làm giảm đa cộng tuyến. Ví dụ Khảo sát mô hình hồi quy giữa chi tiêu tiêu dùng (Y) theo thu nhập (X 2 ) và sự giàu có (X 3 ): Y i = β 1 + β 2 X 2i + β 3 X 3i + U i Trong mô hình này thu nhập và sự giàu có là hai biến có khuynh hướng cộng tuyến cao. Giả sử nghiên cứu thực nghiệm trước đây cho ta biết quan hệ giữa các

123 Chương 6: Mô hình vi phạm các giả thiết 117 hệ số hồi quy riêng là β 3 = 0, 1β 2, nghĩa là mức độ ảnh hưởng của thu nhập đối với chi tiêu gấp 10 lần mức độ ảnh hưởng của sự giàu có đối với chi tiêu. Khi đó, ta có thể dùng mô hình hồi quy thay thế sau: Y i = β 1 + β 2 X 2i + 0, 1β 2 X 3i + U i = β 1 + β 2 (X 2i + 0, 1X 3i ) + U i = β 1 + β 2 X i + U i, trong đó X i = X 2i + 0, 1X 3i. Khi ước lượng được β2 ta dễ dàng ước lượng được β 3 = 0, 1 β2. Ví dụ Khi hồi quy hàm sản xuất Cobb - Douglas ln Q i = β 1 + β 2 ln K i + β 3 ln L i chúng ta có thể gặp hiện tượng đa cộng tuyến do K và L cùng tăng theo quy mô sản xuất. Nếu biết hiệu suất không đổi theo quy mô thì ta có thêm thông tin β 2 + β 3 = 1. Với thông tin tiên nghiệm này, chúng ta có thể biến đổi mô hình ban đầu như sau: hay ln Q i = β 1 + β 2 ln K i + β 3 ln L i ln Q i = β 1 + β 2 ln K i + (1 β 2 ) ln L i ln Q i = β 1 + β 2 ln K i β 2 ln L i + ln L i ln Q i ln L i = β 1 + β 2 (ln K i ln L i ) ln(q i /L i ) = β 1 + β 2 ln(k i /L i ) Thông thường người ta muốn kiểm tra các dự đốn tiên nghiệm của lý thuyết kinh tế dựa vào dữ liệu thực tế. Tuy nhiên, khi ta sử dụng thông tin tiên nghiệm để khắc phục vấn đề đa cộng tuyến thì có nghĩa là ta đã xem như thông tin tiên nghiệm này thích hợp với dữ liệu thực tế (nhưng có thể với dữ liệu mà ta đang khảo sát thì thông tin tiên nghiệm này lại không thích hợp). Thu thập thêm số liệu hoặc lấy thêm mẫu mới Việc gia tăng cỡ mẫu có thể làm giảm mức độ nghiêm trọng của đa cộng tuyến. Chẳng hạn, trong mô hình hồi quy 3 biến, công thức tính phương sai của hệ số hồi quy: var( β2 ) = σ2 1. x 2 1i 1 r23 2. Khi cỡ mẫu tăng thì x 2 1i cũng sẽ tăng. Như vậy, với giả định hệ số tương quan r 23 không đổi (nghĩa là giả định bản chất của cộng tuyến không thay đổi), var( β2 ) sẽ giảm, do đó giúp ta ước lượng và kiểm định các giả thiết liên quan tới β2 chính xác hơn. Hạn chế của phương pháp này là việc thu thập thêm số liệu hay lấy mẫu mới không phải lúc nào cũng thực hiện được.

124 118 Chương 6: Mô hình vi phạm các giả thiết Ví dụ Khảo sát chi tiêu tiêu dùng (Y ) theo thu nhập (X 2 ) và sự giàu có (X 3 ) với mẫu gồm 10 quan sát, ta được mô hình hồi quy như sau: Ŷ i = 24, , 8716X 2i 0, 0349X 3i t = (3, 875) 2, 7726 ( 1, 1595) R 2 = 0, 9682 Với kết quả trên, hệ số hồi quy của biến giàu có β3 = 0, 0349 chẳng những có dấu sai với quy luật kinh tế mà cũng không có ý nghĩa thống kê ở mức ý nghĩa 10%. Ta gia tăng kích thước mẫu, từ 10 quan sát lên 40 quan sát thu được kết quả hồi quy như sau: Ŷ i = 2, , 7299X 2i + 0, 0650X 3i t = (0, 8713) 6, 0014 (2, 0014) R 2 = 0, 9672 Kết quả là hệ số hồi quy của biến giàu có β3 = 0, 0650 chẳng những có dấu đúng với quy luật kinh tế mà còn có ý nghĩa thống kê ở mức ý nghĩa 10%. Kết hợp số liệu chéo và số liệu chuỗi thời gian Tobin đã đề xuất kết hợp số liệu chuỗi thời gian và số liệu chéo để khắc phục hiện tượng đa cộng tuyến. Số liệu chuỗi thời gian thường xảy ra đa cộng tuyến giữa các biến. Đối với số liệu chéo, giá trị các biến thường không thay đổi nhiều, ví dụ như giá cả của một loại hàng hóa của cùng thời điểm tại các địa phương khác nhau. Kinh nghiệm cho thấy, việc kết hợp hai loại số liệu trên để được số liệu hỗn hợp có thể tránh những khó khăn trên. Ví dụ Khảo sát mô hình hồi quy tuyến tính log giữa số lượng xe hơi bán ra (Y) tùy thuộc vào giá trị trung bình của xe (P) và thu nhập của người tiêu dùng (I): ln Y t = β 1 + β 2 ln P t + β 3 ln I t + U t. Nếu sử dụng dữ liệu chuỗi thời gian thì yếu tố giá cả và thu nhập thường có khuynh hướng cộng tuyến cao. Nếu sử dụng số liệu chéo thì ta có thể ước lượng hệ số co giãn của thu nhập β3 khá tin cậy vì tại một thời điểm thì giá cả ít có sự thay đổi. Sử dụng kết quả ước lượng này, kết hợp với số liệu thời gian, ta có ước lượng hệ số co giãn của giá dựa vào mô hình sau: Y t = β 1 + β 2 ln P t + U t trong đó, ta sử dụng giá trị ước lượng của Y t là (ln Y t β3 ln I t ). Kỹ thuật này có vấn đề về việc giải thích rằng độ co giãn của thu nhập từ số liệu chéo có giống như là độ co giãn này thu được từ phân tích chuỗi thời gian thuần túy hay không.

125 Chương 6: Mô hình vi phạm các giả thiết 119 Bỏ bớt biến độc lập Ta bỏ bớt một trong các biến có cộng tuyến với nhau. Nhưng việc bỏ biến có thể dẫn đến hậu quả là ước lượng của các hệ số còn lại trong mô hình bị chệch khi biến bỏ sót thực sự cần phải có trong mô hình. Giảm cộng tuyến trong hồi quy đa thức Đối với hồi quy đa thức, nếu biến độc lập tương ứng với các bậc lũy thừa khác nhau có khuynh hướng cộng tuyến cao thì ta có thể giảm ảnh hưởng của đa cộng tuyến bằng cách sử dụng hàm hồi quy độ lệch theo giá trị trung bình. Chẳng hạn, ta có mô hình hồi quy đa thức ban đầu như sau: Y = β 1 + β 2 X + β 3 X 2 + β 3 X 3 + U i = β 1 + β 2 Z 2 + β 3 Z 3 + β 4 Z 4 + U i Ta có thể chuyển về dạng: Y = β 1 + β 2 (Z 2 Z 2 ) + β 3 (Z 3 Z 3 ) + β 4 (Z 4 Z 4 ) + V i Chuyển dạng dữ liệu bằng cách sử dụng sai phân bậc một Giả sử chúng ta hồi quy trên dữ liệu chuỗi thời gian Y t = β 1 + β 2 X 2t + β 3 X 3t + U t. Ta gặp phải hiện tượng đa cộng tuyến giữa X 2t và X 3t do có thể cùng tăng hoặc cùng giảm theo từng năm. Để tối thiểu tác động của đa cộng tuyến, trong trường hợp này, ta có thể sử dụng kỹ thuật hồi quy sai phân bậc một như sau: Y t 1 = β 1 + β 2 X 2,t 1 + β 3 X 3,t 1 + U t 1 Y t Y t 1 = β 2 (X 2t X 2,t 1 ) + β 3 (X 3t X 3,t 1) + (U t U t 1 ) Phương trình trên được gọi là phương trình sai phân cấp một. Phương trình này có thể làm giảm đa cộng tuyến. Mặc dù giữa biến X 2t và X 3t có thể xảy ra đa cộng tuyến cao không có cơ sở cho rằng giữa biến (X 2t X 2,t 1 ) và (X 3t X 3,t 1 ) cũng xảy ra đa cộng tuyến cao. Tuy nhiên, với mô hình sai phân cấp 1 sẽ có một số vấn đề mới nảy sinh như sau: + (U t U t 1 ) có thể có tính tự tương quan, khi đó vi phạm một trong các giả thiết của mô hình hồi quy tuyến tính cổ điển. Nếu hiện tượng tự tương quan là nghiêm trọng thì mô hình này còn kém hiệu quả hơn cả mô hình ban đầu. + Kỹ thuật này có thể không thích hợp với số liệu chéo vì chúng không có một trật tự logic cho các quan sát như chuỗi thời gian.

126 120 Chương 6: Mô hình vi phạm các giả thiết + Mô hình sai phân cấp 1 thu được là mô hình hồi quy qua gốc tọa độ. Điều này làm cho ý nghĩa của R 2 bị mất đi. * Kết luận: Trong thực tế hầu như các biến độc lập đều có đa cộng tuyến với nhau, nhưng với mức độ cao hay thấp. Khi có đa cộng tuyến thì các ước lượng thu được vẫn thỏa tính chất là các ước lượng tuyến tính, không chệch, có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính, không chệch. Trong thực nghiệm người ta quan tâm đến mức độ ảnh hưởng của đa cộng tuyến đối với kết quả ước lượng hơn là việc xác định đa cộng tuyến có tồn tại hay không. Một khi ảnh hưởng của đa cộng tuyến được xem là nghiêm trọng, người ta có thể dùng nhiều công cụ khác nhau để tìm cách hạn chế ảnh hưởng của nó. Tuy nhiên, mỗi công cụ tỏ ra thích hợp trong những hoàn cảnh cụ thể. Khi vấn đề đa cộng tuyến được đánh giá là không ảnh hưởng nghiêm trọng đến kết quả nghiên cứu, đôi khi người ta có thể bỏ qua, bởi vì việc khắc phục đa cộng tuyến có thể gây ra những hậu quả nghiêm trọng hơn. 6.4 PHƯƠNG SAI SAI SỐ THAY ĐỔI Bản chất và nguyên nhân của phương sai thay đổi Bản chất của phương sai thay đổi Một trong các giả thiết quan trọng của mô hình hồi quy tuyến tính cổ điển là phương sai của sai số hồi quy là một số không đổi và bằng σ 2. Var(U i ) = E(U 2 i ) = σ2, i. (6.4.1) Trong thực tế phương sai có điều kiện của sai số hồi quy có thể thay đổi khi giá trị biến độc lập X i thay đổi, tức là E(U 2 i ) = σ2 i. Bằng đồ thị, ta có thể minh họa trường hợp phương sai không đổi và phương sai thay đổi trong hình 6.4 và 6.5. Nguyên nhân của phương sai thay đổi 1) Do bản chất của các mối quan hệ kinh tế. Chẳng hạn, khi thu nhập (X) tăng thì chi tiêu (Y ) cho các mặt hàng xa xỉ cũng tăng và mức biến động càng lớn khi thu nhập càng tăng. Trường hợp này dẫn đến hiện tượng phương sai tăng dần khi (X) tăng dần. Tương tự, khi hồi quy tiết kiệm (Y ) theo thu nhập (X). Rõ ràng khi thu nhập tăng, tiết kiệm có xu hướng tăng dần với mức độ càng lớn. Phương sai vì vậy có khuynh hướng tăng.

127 Chương 6: Mô hình vi phạm các giả thiết 121 Hình 6.4 Phương sai sai số không thay đổi Hình 6.5 Phương sai sai số thay đổi 2) Sai số đo lường và sai số khi tính toán có xu hướng giảm dần, dẫn đến phương sai có khả năng giảm. Nhờ cải thiện phương pháp và sử dụng những công cụ hiện đại hơn trong thu thập số liệu, sai số đo lường cũng như sai số tính toán có xu hướng giảm xuống, kéo theo phương sai giảm. 3) Do việc tích lũy kinh nghiệm và sai số theo thời gian ngày càng giảm. Chẳng hạn, lỗi của người đánh máy càng ít nếu thời gian thực hành càng tăng. Trường hợp này, σ 2 i có khuynh hướng giảm dần. 4) Do trong mẫu xuất hiện các giá trị có thể rất nhỏ hoặc rất lớn so với các giá trị của các quan sát khác trong mẫu (giá trị outlier). Đó là một vài trường hợp bất thường với dữ liệu rất khác biệt (rất lớn hoặc rất nhỏ so với các quan sát bình thường khác). Nhất là đối với những mẫu có kích thước nhỏ, có thể dẫn đến những thay đổi khi chấp nhận hay bác bỏ giả thiết trong kiểm định phương sai thay đổi.

128 122 Chương 6: Mô hình vi phạm các giả thiết 5) Do xác định sai dạng mô hình hồi quy (dạng hàm sai, thiếu biến quan trọng). 6) Trường hợp phương sai không đồng đều thường gặp khi thu thập số liệu chéo. Chẳng hạn như khảo sát về doanh thu và chi phí quảng cáo của các công ty cùng lĩnh vực kinh doanh. Do quy mô, thương hiệu của các công ty không giống nhau nên doanh thu của các công ty có quy mô khác nhau ứng với mức đầu tư quảng cáo sẽ biến động không giống nhau Hậu quả của phương sai thay đổi 1) Các ước lượng OLS tuy vẫn còn tính chất là ước lượng tuyến tính không chệch nhưng không còn là ước lượng hiệu quả nữa (ước lượng có phương sai nhỏ nhất). 2) Ước lượng phương sai và hiệp phương sai của các ước lượng OLS bị chệch. Xét mô hình hồi quy 2 biến: Y i = β 1 + β 2 X i + U i. Trường hợp phương sai không đổi thì công thức xác định phương sai của hệ số hồi quy β2 là: Var( β2 ) = σ2 x 2 i và ước lượng không chệch của nó là Var( β2 ) = σ2 x 2 i = RSS (n 2) x 2 i Khi giả thiết phương sai của nhiễu thay đổi: E(Ui 2) = σ2 i, công thức tính phương sai của β2 là: Var( β2 ) = x 2 i.σ 2 i ( x 2 i )2. Như vậy, việc dùng Var( β2 ) để ước lượng cho Var( β2 ) không còn đảm bảo là ước lượng không chệch nữa. 3) Việc dùng thống kê t và F để kiểm định giả thiết không còn đáng tin cậy nữa. Thống kê t xác định bởi t = β β se( β). Do sử dụng ước lượng của se( β) là ŝe( β) nên không có gì đảm bảo thống kê t còn tuân theo quy luật phân phối Student, do đó kết quả kiểm định không còn đáng tin cậy. 4) Kết quả dự báo không còn hiệu quả nữa khi sử dụng các ước lượng OLS có phương sai không nhỏ nhất.

129 Chương 6: Mô hình vi phạm các giả thiết Cách phát hiện phương sai thay đổi Phương pháp định tính * Dựa vào bản chất của vấn đề nghiên cứu Ta phát hiện phương sai thay đổi thường dựa vào kinh nghiệm từ những cuộc nghiên cứu trước đó hoặc do suy đoán hoặc dựa vào bản chất của hiện tượng nghiên cứu. Chẳng hạn, việc nghiên cứu quan hệ giữa chi tiêu cho tiêu dùng với thu nhập thì người ta thấy rằng phương sai phần dư của chi tiêu cho tiêu dùng có xu hướng tăng theo thu nhập. Do đó, đối với những mẫu điều tra tương tự, người ta có khuynh hướng cho rằng phương sai của nhiễu thay đổi. Ta đã biết rằng việc sử dụng số liệu chéo dễ dàng dẫn đến hiện tượng phương sai thay đổi. Như vậy nếu tiến hành nghiên cứu quan hệ giữa đầu tư với doanh thu, lãi suất,... và sử dụng số liệu chéo thì hầu như xảy ra hiện tượng phương sai thay đổi nếu trong mẫu khảo sát bao gồm số liệu của những công ty có quy mô nhỏ, trung bình và quy mô lớn được gộp trong mẫu. * Xem xét đồ thị phần dư Xem xét đồ thị phân tán của phần dư Ûi 2 theo Ŷ i. theo một biến độc lập X nào đó hoặc Đối với hồi quy đơn, vẽ biểu đồ Û 2 i theo Ŷ i hay Û 2 i theo biến độc lập X. Hình 6.6 Một số dạng biến thiên của Û 2 i Hình 6.6 (a) cho thấy biến đổi của Ûi 2 không có tính hệ thống, trong khi các hình còn lại cho thấy Ûi 2 có xu hướng thay đổi khi Ŷ i tăng lên.

130 124 Chương 6: Mô hình vi phạm các giả thiết Ví dụ Khảo sát một mẫu thu nhập - chi tiêu (đơn vị: đồng) Obs Thu nhập X Chi tiêu Y Obs Thu nhập X Chi tiêu Y 1 8, 2 8, , 4 20, , 2 19, , 3 38, , 5 33, , 3 31, , 2 17, , 3 10, , 0 33, , 6 31, , 3 25, , 1 25, , 1 13, , 1 12, , 1 29, , 7 38, , 4 14, , 3 40, , 1 21, , 2 6, 1 Hồi quy chi tiêu Y theo thu nhập X ta thu được kết quả như trong bảng. Nhìn vào biểu đồ phần dư đối với biến thu nhập (X) ở hình 6.7 và biểu đồ phân tán của phần dư bình phương đối với biến thu nhập (X) ở hình 6.7 cho thấy độ rộng các điểm phân tán có xu hướng tăng lên khi X tăng. Điều này chứng tỏ phương sai của sai số thay đổi khi X tăng. Đồ thị phần dư cho ta một cái nhìn ban đầu về hiện tượng phương sai thay đổi, nó có thể giúp cho thấy rằng phương sai thay đổi là do sự thay đổi của một biến số nào đó trong mô hình. Tuy nhiên, với mô hình hồi quy bội, nhiều khi sự thay đổi trong phương sai là do đóng góp của nhiều biến số hoặc dạng thức của phương sai thay đổi là phức tạp mà ta khó có thể phát hiện. Khi đó, ta phải xem xét đến các phương pháp kiểm định được trình bày trong mục tiếp theo.

131 Chương 6: Mô hình vi phạm các giả thiết 125 Hình 6.7 Đồ thị phần dư theo thu nhập Hình 6.8 Đồ thị phần dư bình phương theo thu nhập Phương pháp định lượng * Kiểm định Park/Harvey: Park giả định rằng phương sai của nhiễu thay đổi dưới dạng hàm mũ theo biến độc lập X i như sau: Ta biến đổi về dạng tuyến tính log: σi 2 = σ2.x β2 i.e Vi với V i là sai số ngẫu nhiên. ln σ 2 i = ln σ2 + β 2 ln X i + V i Vì σ 2 i chưa biết nên sử dụng ước lượng Û 2 i (của hồi quy gốc) để thay thế. Các bước tiến hành như sau: Bước 1: thực hiện hồi quy gốc Y i = α 1 + α 2 X i + U i, ta ước lượng được Û i và Ŷ i. Bước 2: thực hiện hồi quy ln Û 2 i = β 1 + β 2 ln X i + V i, β 1 = ln σ 2. Bước 3: kiểm định giả thuyết H 0 : β 2 = 0 (phương sai không thay đổi) H 1 : β 2 0 (phương sai thay đổi) Việc kiểm định cặp giả thuyết này có thể thông qua việc kiểm định t, kiểm định F thông thường hoặc kiểm định Wald như đã trình bày trong chương 3. Đối với hồi quy bội, các bước thực hiện tương tự như đối với hồi quy đơn, nhưng ta có thể hồi quy ln Û 2 i theo mỗi biến độc lập hoặc ln Û 2 i theo Ŷ i. Hạn chế của kiểm định Park là ở bước 2 ta giả sử các nhiễu V i thỏa mãn các giả thiết cổ điển. Nếu V i vi phạm giả thiết thì kết quả kiểm định ở bước 3 không còn đáng tin cậy nữa.

132 126 Chương 6: Mô hình vi phạm các giả thiết Ví dụ Xét tiếp ví dụ Hồi quy ln(resid 2 ) theo ln(thunhap) và thực hiện kiểm định Park bằng phần mềm Eviews ta được: Kết quả cho thấy, với mức ý nghĩa 5%, p-value/f = 0, 0000 < 0, 05 nên ta bác bỏ giả thuyết H 0. Nghĩa là có hiện tượng phương sai thay đổi. * Kiểm định Glejser: Kiểm định này được thực hiện tương tự như kiểm định Park, tuy nhiên Glejser sử dụng các dạng hàm sau: Û i = β 1 + β 2 X i + V i Û i = β 1 + β 2 Xi + V i Û i = β 1 + β 2 1 X i + V i Û i = β 1 + β 2 1 Xi + V i Û i = β 1 + β 2 X i + V i Û i = β 1 + β 2 Xi 2 + V i Việc kiểm định giả thuyết H 0 : β 2 = 0 nghĩa là kiểm định giả thiết phương sai không đổi. Hạn chế của kiểm định Glejser: + V i có thể không thỏa mãn các giả thiết cổ điển, khi đó kết luận của việc kiểm định giả thiết không còn đáng tin cậy nữa.

133 Chương 6: Mô hình vi phạm các giả thiết Hai mô hình cuối không là hồi quy tuyến tính, do đó không thể áp dụng phương pháp OLS thông thường. + Ngoại trừ mô hình đầu tiên, các mô hình còn lại đều đòi hỏi điều kiện về biến độc lập X để cho biểu thức của mô hình có nghĩa về mặt toán học. Ví dụ Ta sử dụng mẫu số liệu trong ví dụ Thực hiện kiểm định Glejser với bốn mô hình đầu bằng Eviews ta được kết quả từng mô hình như sau: Kết luận: Với mức ý nghĩa 5%, trong cả bốn trường hợp kết quả kiểm định đều giống nhau ở chỗ p value/f < 0, 05 nên ta bác bỏ giả thuyết H 0. Nghĩa là có xảy ra hiện tượng phương sai thay đổi. Kết quả này khớp với kết quả kiểm định Park trước đó. * Kiểm định Breusch - Pagan (kiểm định BP) Nếu U 2 có tương quan với ít nhất một trong các biến X j thì (6.4.1) sẽ không thỏa mãn, nghĩa là khi đó mô hình có hiện tượng phương sai thay đổi. Do đó, để

134 128 Chương 6: Mô hình vi phạm các giả thiết xem xét giả thiết phương sai không đổi, xét mô hình hồi quy phụ sau: U 2 i = a 1 + a 2 X 2i + + a k X ki + V i (6.4.2) trong đó V i là sai số ngẫu nhiên trong mô hình hồi quy phụ, thỏa mãn các giả thiết của phương pháp OLS, nghĩa là có kỳ vọng bằng 0 và phương sai không đổi. Nếu trong mô hình này có ít nhất một trong các hệ số a j 0 (j = 2, 3,..., k) thì đây là chứng cứ cho rằng mô hình k biến ban đầu có hiện tượng phương sai thay đổi. Do đó, để xem xét giả thiết này, chúng ta kiểm định cặp giả thuyết sau: H 0 : a 2 = = a k = 0; H 1 : a a 2 k 0. Việc kiểm định cặp giả thuyết này có thể được thực hiện bằng cách sử dụng kiểm định F cho mô hình (6.4.2). Tuy nhiên, việc ước lượng mô hình (6.4.2) là không thực hiện được vì chúng ta không có quan sát của Ui 2 và do đó chúng ta sẽ sử dụng ước lượng của chúng là Ûi 2. Nghĩa là ta sẽ ước lượng mô hình: Û 2 i = b 1 + b 2 X 2i + + b k X ki + W i (6.4.3) với W i là sai số ngẫu nhiên trong mô hình hồi quy phụ (6.4.3). Khi đó, việc kiểm định giả thuyết trên được đưa về kiểm định cặp giả thuyết sau: H 0 : b 2 = = b k = 0; H 1 : b b 2 k > 0. Người ta chứng minh được rằng khi H 0 là đúng và n lớn, thống kê F thông thường sẽ xấp xỉ phân phối Fisher với bậc tự do (k 1, n k) và thống kê LM được tính bởi công thức sau: LM = nr 2 u sẽ có phân phối Khi bình phương với k 1 bậc tự do. Do đó, kiểm định BP được thực hiện như sau: Bước 1: Ước lượng mô hình tuyến tính k biến ban đầu thu được các phần dư Û i. Bước 2: Ước lượng mô hình (6.4.3) thu được R 2 u. Bước 3: Tính giá trị quan sát của các thống kê kiểm định: F qs = R 2 u/(k 1) (1 R 2 u)/(n k) LM qs = nr 2 u Nếu F qs > f α (k 1, n k)

135 Chương 6: Mô hình vi phạm các giả thiết 129 Hoặc LM qs > χ 2 α(k 1) thì bác bỏ giả thuyết H 0 và ta kết luận rằng mô hình có hiện tượng phương sai thay đổi. Ta cũng có thể sử dụng xác suất P-value tương ứng với thống kê quan sát để đưa ra kết luận tương ứng. Ví dụ Trở lại ví dụ 6.4.1, sử dụng phần mềm Eviews ta được kết quả kiểm định BP như sau: Từ bảng kết quả trên ta có: F qs = 18, 093 > f 0,05 (1, 18) = 4, 41 hay p value = 0, 0005 < 0, 05 LM qs = 10, 025 > χ 2 0,05 (1) = 3, 84 hay p value = 0, 0015 < 0, 05. Như vậy, cả hai kiểm định đều cho thấy rằng đủ chứng cứ để bác bỏ H 0. Vậy có thể kết luận rằng mô hình ban đầu có hiện tượng phương sai thay đổi. Nếu ta nghi ngờ Ûi 2 có tương quan với một biến độc lập nào đó trong mô hình thì có thể sử dụng dạng biến đổi của kiểm định BP bằng cách hồi quy Ûi 2 theo biến độc lập này (có hệ số chặn) và kiểm định sự bằng 0 hay khác 0 của hệ số góc trong mô hình hồi quy này bằng kiểm định t hoặc kiểm định F như thông thường. * Kiểm định White: Kiểm định này khảo sát phần dư Ûi 2 theo biến độc lập. Giả sử xét mô hình hồi quy gốc sau: Y i = β 1 + β 2 X 2i + β 3 X 3i + U i (6.4.4)

136 130 Chương 6: Mô hình vi phạm các giả thiết Các bước thực hiện: Bước 1: Hồi quy mô hình gốc ta được phần dư Û i. Bước 2: Hồi quy mô hình phụ sau đây Û 2 i = α 1 + α 2 X 2i + α 3 X 3i + α 4 X 2 2i + α 5X 2 3i + α 6X 2i X 3i + V i (6.4.5) Mô hình hồi quy phụ luôn phải có hệ số chặn α 1 bất kể mô hình gốc có hay không có hệ số chặn, có thể đưa ra lũy thừa bậc cao hơn của các biến độc lập và có thể bỏ qua số hạng tích chéo X 2i X 3i. Kết quả bước này ta thu được hệ số xác định R 2 aux. Bước 3: Thực hiện kiểm định H 0 : phương sai không đổi. H 0 : α 2 = α 3 = α 4 = α 5 = α 6 = 0. Ta có thống kê n.r 2 aux χ2 (df), với df là số hệ số hồi quy của mô hình hồi quy phụ, không kể hệ số chặn (mô hình đang xét thì df = 5). Nếu n.r 2 aux > χ2 α(df) : bác bỏ H 0, nghĩa là phương sai thay đổi. * Chú ý: Kiểm định White không đòi hỏi nhiễu U i phải có phân phối chuẩn. Với hàm hồi quy phụ (6.4.5), việc đưa thêm các bình phương của các biến độc lập cũng như tích chéo của chúng làm toán khá nhiều bậc tự do. Vì vậy, người ta còn đề xuất ra một kiểm định khác, đó là kiểm định dựa trên biến phụ thuộc như sau: thay vì xét hàm hồi quy phụ với nhiều biến độc lập (6.4.5), chúng ta xét hàm hồi quy phụ chỉ với hai biến độc lập như sau: và kiểm định cặp giả thuyết Û 2 i = γ 1 + γ 2 Ŷ i + γ 3 Ŷ 2 i + W i (6.4.6) H 0 : γ 2 = γ 3 = 0; H 1 : γ γ Lý do của việc sử dụng Ŷ i và Ŷi 2 Ta có: là như sau: Ŷ i = β1 + β2 X 2i + β3 X 3i nên Ŷ 2 i = a 1 + a 2 X 2 2i + a 3X 2 3i + a 4X 2i X 3i + a 5 X 2i + a 6 X 3i. Như vậy, Ŷ i và Ŷi 2 có thể được sử dụng để thay thế cho các thành phần trong vế phải của (6.4.5) để chuyển (6.4.5) thành dạng (6.4.6). Ví dụ Khảo sát nhu cầu ăn kem bình quân đầu người tại Mỹ (Hộp - 0, 586l/người) theo các yếu tố: Income (thu nhập bình quân hộ gia đình - US- D/tuần), Price (Giá bán - USD/hộp) và Temp (nhiệt độ ngồi trời - độ F) ta có bảng số liệu sau:

137 Chương 6: Mô hình vi phạm các giả thiết 131 Obs Income Price Temp Demand Obs Income Price Temp Demand , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , 548 Kết quả kiểm định White có tích chéo: Từ bảng kết quả ta có n.r 2 aux = 12, 826 < χ2 0,05 (9) = 16, 9 hay p value = 0, 1706 > 0, 05. Như vậy, ta chưa có cơ sở bác bỏ giả thiết H 0, nghĩa là phương sai không đổi.

138 132 Chương 6: Mô hình vi phạm các giả thiết Cách khắc phục phương sai thay đổi Trường hợp đã biết phương sai σ 2 i Ta sử dụng phương pháp bình phương nhỏ nhất tổng quát (Generalized Least Squares - GLS). Phương pháp GLS thực chất là phương pháp OLS áp dụng cho các biến đã được biến đổi từ một mô hình vi phạm các giả thiết cổ điển thành một mô hình thỏa mãn các giả thiết cổ điển. Do đó, các tham số ước lượng được từ mô hình mới sẽ có tính chất BLUE. Xét mô hình hồi quy 2 biến: Y i = β 1 + β 2 X i + U i, trong đó các giả thiết về mô hình hồi quy tuyến tính cổ điển đều được thỏa mãn, trừ giả thiết phương sai của nhiễu bị vi phạm, Var(U i ) = σ 2 i. Phương trình trên có thể viết thành: Y i = β 1 X 0i +β 2 X i +U i, trong đó X 0i = 1, i. Chia hai vế của phương trình cho σ i (σ i > 0) ta được: Y i X 0i X i = β 1 + β 2 + U i. σ i σ i σ i σ i Đặt Y i = Yi σ ; X 0i i σ i Khi đó, Ta có, = X 0i ; X i σ i = X i ; U i σ i = U i. Y i = β 1 X 0i + β 2X i + U i. ( Var(Ui ) = Var Ui ) = 1 σ i σi 2 Var(U i ) = σ2 i σi 2 = 1, i. Vậy Ui có phương sai không đổi. Do các giả thiết khác của mô hình hồi quy tuyến tính cổ điển được giữ nguyên và Ui cũng đã thỏa mãn giả thiết phương sai không đổi nên ta có thể dùng phương pháp OLS cho mô hình trên. Trường hợp chưa biết phương sai σ 2 i Ta cũng áp dụng phương pháp OLS, tuy nhiên việc này đòi hỏi phải có những giả thiết nhất định về phương sai của sai số. Dưới đây ta xét một số giả thiết thông dụng: Giả thiết 1: Phương sai của sai số tỷ lệ thuận với bình phương của biến giải thích, nghĩa là Var(U i ) = E(U 2 i ) = σ2 X 2 i. Ta biến đổi mô hình gốc bằng cách chia hai vế cho X i : với V i = U i X i là nhiễu đã được biến đổi. Y i X i = β 1 X i + β 2 + U i X i = β 1 1 X i + β 2 + V i

139 Chương 6: Mô hình vi phạm các giả thiết 133 Ta có ( E(Vi 2 ) = E Ui ) 2 1 = X i Xi 2 E(Ui 2 ) = σ2 Xi 2 Xi 2 = σ 2, i. Vậy tất cả các giả thiết của mô hình hồi quy tuyến tính cổ điển đã được thỏa mãn, ta có thể áp dụng phương pháp OLS để tìm hồi quy Y i X i theo 1 X i, hệ số chặn là β 2. Sau đó, muốn trở lại mô hình gốc, ta nhân cả hai vế cho X i. Trong thực tế, người ta dùng Û i là ước lượng của U i, vì thế người ta thường khảo sát Ûi 2 theo X i. Trong trường hợp hồi quy bội, ta có thể sử dụng công cụ đồ thị biểu diễn Ûi 2 theo từng biến độc lập, hoặc sử dụng hồi quy phụ Ûi 2 theo bình phương của từng biến độc lập. Từ đó, có thể đánh giá xem biến độc lập nào thích hợp với giả thiết nhiều nhất để tiến hành biến đổi trên biến độc lập này. Tuy nhiên, việc biến đổi mô hình gốc theo một biến độc lập nào đó có thể dẫn đến việc vi phạm một giả thiết cổ điển khác. Giả thiết 2: Phương sai của sai số tỷ lệ thuận với biến giải thích, nghĩa là σ 2 i = Var(U i) = E(U 2 i ) = σ2 X i. Ta biến đổi mô hình gốc bằng cách chia hai vế cho X i : Y i = β 1 + β 2 Xi + U i 1 = β 1 + β 2 Xi + V i Xi Xi Xi Xi trong đó V i = U i Xi. Ta có ( Ui ) Var(V i ) = Var = Var(U i) Xi X i = σ2 X i X i = σ 2, i. Như vậy mô hình vừa biến đổi trên là mô hình hồi quy qua gốc tọa độ, sau khi ước lượng β 1 và β 2 ta trở lại mô hình gốc bằng cách nhân hai vế cho X i. * Ghi chú: hai giả thiết nêu trên đòi hỏi những điều kiện nhất định về biến độc lập. Chẳng hạn, đối với giả thiết 1, biến độc lập không có giá trị 0. Đối với giả thiết 2 thì biến độc lập phải là các giá trị dương. Trong thực tế, khi làm việc trên mẫu thì phải loại ra các quan sát không thỏa điều kiện nêu trên. Giả thiết 3: Phương sai của sai số tỷ lệ thuận với bình phương của giá trị kỳ vọng của Y i, nghĩa là σ 2 i = Var(U i) = E(U 2 i ) = σ2 [E(Y i )] 2. Ta biến đổi mô hình gốc như sau: trong đó V i = Ta có Y i E(Y i ) = β 1 E(Y i ) + β X i 2 E(Y i ) + U i E(Y i ) = β 1 1 E(Y i ) + β X i 2 E(Y i ) + V i U i E(Y i ). ( Ui ) Var(V i ) = Var = Var(U i) E(Y i ) [E(Y i )] 2 = σ2 [E(Y i )] 2 [E(Y i )] 2 = σ 2.

140 134 Chương 6: Mô hình vi phạm các giả thiết Như vậy, nhiễu V i có phương sai không đổi. Hay mô hình sau khi biến đổi đã thỏa mãn giả thiết phương sai không đổi. Tuy nhiên, mô hình này chưa thể ước lượng được vì E(Y i ) = β 1 + β 2 X i + E(U i ) = β 1 + β 2 X i. E(X i ) phụ thuộc vào các giá trị β 1, β 2 chưa biết. Nhưng do Ŷ i = β1 + β2 X i là ước lượng điểm của E(Y i ). Do vậy, ta có thể tiến hành ước lượng theo 2 bước sau đây: Bước 1: Ước lượng mô hình hồi quy gốc bằng phương pháp OLS thu được Ŷ i. Sau đó, dùng Ŷ i biến đổi mô hình gốc như sau: Y i 1 X i = β 1 + β 2 + V i, V i = U i Ŷ i Ŷ i Ŷ i Ŷ i ( ) Bước 2: Ước lượng mô hình (*), mặc dù Ŷ i không đúng bằng E(Y i ) nhưng nó là ước lượng vững, khi cỡ mẫu tăng lên vô hạn thì chúng hội tụ về E(Y i ). Vì vậy, phương pháp này có thể áp dụng cho mẫu có kích thước tương đối lớn. Giả thiết 4: Sử dụng phép biến đổi logarit Để giảm mức độ phương sai thay đổi của mô hình hồi quy tuyến tính ta có thể dùng mô hình tuyến tính log: Y i = β 1 + β 2 X i + U i ln Y i = β 1 + β 2 ln X i + U i. * Ghi chú: hệ số hồi quy β 2 trong hai mô hình tuyến tính và tuyến tính log là khác nhau. Việc sử dụng mô hình nào còn tùy thuộc vào cơ sở lý thuyết và mức độ nghiêm trọng của hiện tượng phương sai thay đổi. Ví dụ Khảo sát 30 cửa hàng kinh doanh cùng một loại sản phẩm để tìm hiểu mối quan hệ giữa chi phí quảng cáo X (triệu đồng/tháng) và sản lượng tiêu thụ sản phẩm Y (đơn vị sản phẩm), ta được bảng số liệu như sau: Obs X Y Obs X Y Obs X Y 1 7, 9 5, , 9 9, , 0 14, 4 2 8, 4 6, , 4 10, , 0 15, 2 3 8, 9 7, , 0 11, , 5 14, 0 4 9, 9 6, , 0 11, , 0 13, , 5 7, , 5 12, , 9 14, , 0 8, , 0 11, , 4 17, , 5 8, , 4 12, , 9 18, , 0 7, , 9 13, , 0 18, , 4 8, , 9 11, , 5 17, , 9 9, , 5 14, , 0 19, 1

141 Chương 6: Mô hình vi phạm các giả thiết 135 Xét mô hình Y = β 1 + β 2 X + U. Hồi quy mô hình trên và biểu diễn đồ thị phần dư Û i theo biến X ta được: Từ đồ thị ta có thể khẳng định có hiện tượng phương sai sai số thay đổi. Sử dụng phép biến đổi logarit (giả thiết 4), hồi quy theo mô hình tuyến tính logarit và vẽ biểu đồ phần dư ta được kết quả sau: Kết quả kiểm định White: Qua đồ thị phần dư cũng như kết quả kiểm định White ta thấy mô hình tuyến tính logarit có phương sai không đổi. Khuyết tật của mô hình đã được khắc phục.

142 136 Chương 6: Mô hình vi phạm các giả thiết Ước lượng sai số chuẩn Khi mô hình có hiện tượng phương sai thay đổi, các ước lượng OLS cho các hệ số vẫn là ước lượng không chệch, chỉ có phương sai của các hệ số ước lượng và hiệp phương sai giữa các hệ số ước lượng là chệch. Từ đó, White đề xuất phương pháp sai số chuẩn vững (robust standard error) với tư tưởng như sau: vẫn sử dụng các hệ số ước lượng từ các phương pháp OLS, tuy nhiên phương sai các hệ số ước lượng thì được tính toán lại mà không sử dụng đến giả thiết phương sai sai số không đổi. Xét mô hình hồi quy hai biến: Y = β 1 + β 2 X + U. Khi các giả thiết khác được thỏa mãn thì ta có: n var( β2 ) = x 2 2i σ2 i i=1 ( n x 2 2i i=1 ) 2 (6.4.7) Khi σi 2 = σ 2 thì (6.4.7) sẽ trở thành (1.3.1) là công thức tính phương sai với phương pháp OLS. Khi σi 2 σ2, White đã đề xuất thay công thức (6.4.7) bởi công thức sau: n x 2 2iÛ i 2 /(n 2) i=1 var( β2 ) = ( n ) 2/n (6.4.8) x 2 2i i=1 và sai số chuẩn vững được tính là căn bậc hai của biểu thức trong (6.4.7). Như vậy, trong (6.4.8) ta lấy Û 2 i σ 2 i và có tính đến bậc tự do của các tổng. Ví dụ Xét ví dụ 6.4.6, dùng phần mềm Eviews ta tính được các sai số chuẩn theo White như sau: So sánh với bảng kết quả hồi quy gốc ở trên ta thấy chỉ có sai số chuẩn se( βj ) là bị thay đổi để đảm bảo chúng là các ước lượng có tính vững.

143 Chương 6: Mô hình vi phạm các giả thiết TỰ TƯƠNG QUAN Bản chất và nguyên nhân của hiện tượng tự tương quan Bản chất của hiện tượng tự tương quan Khái niệm tự tương quan có thể hiểu là sự tương quan giữa các thành phần của chuỗi các quan sát được sắp xếp theo thứ tự thời gian trong các số liệu chuỗi thời gian, hoặc sắp xếp theo thứ tự không gian đối với số liệu chéo. Trong phạm vi bài giảng, chúng ta chỉ xem xét vấn đề tự tương quan đối với số liệu chuỗi thời gian. Trong mô hình hồi quy tuyến tính cổ điển, ta giả thiết rằng không có tương quan giữa các sai số ngẫu nhiên U i, nghĩa là cov(u i, U j ) = 0, i j. Nói cách khác, mô hình cổ điển giả thiết rằng sai số ứng với quan sát nào đó không bị ảnh hưởng bởi sai số ứng với một quan sát khác. Nếu xét kết hợp giả thiết kỳ vọng của nhiễu E(U i ) = 0 và định nghĩa về hiệp phương sai, ta có thể biểu diễn tính không tự tương quan giữa các nhiễu bằng biểu thức sau: E(U i U j ) = 0, i j. Tuy nhiên, trong thực tế có thể xảy ra hiện tượng mà sai số của các quan sát lại phụ thuộc nhau, nghĩa là cov(u i, U j ) 0, i j. Xét mô hình gốc: Y t = β 1 + β 2 X t + U t. Giả sử rằng có tự tương quan xảy ra, nghĩa là có một cơ chế tạo ra dãy U t. * Tự tương quan bậc 1: Xét trường hợp đơn giản, U t được tạo bởi U t = ρu t 1 + ɛ t ( 1 ρ 1) (6.5.1) trong đó ɛ t thỏa mãn các giả thiết thông thường của phương pháp OLS (E(ɛ t ) = 0; Var(ɛ t ) = σ 2 ɛ ; Cov(ɛ t, ɛ t+s ) = 0, s 0). ρ: hệ số tự hiệp phương sai hay hệ số tự tương quan bậc nhất hay hệ số tự tương quan trễ một thời kỳ. Mô hình (6.5.1) được gọi là mô hình tự tương quan bậc nhất (tự hồi quy bậc nhất) Markov, ký hiệu AR(1). Khi ρ < 0 ta nói mô hình có tự tương quan bậc 1 âm. Điều này ngụ ý rằng giữa U t và U t 1 có quan hệ tuyến tính ngược chiều.

144 138 Chương 6: Mô hình vi phạm các giả thiết Khi ρ > 0 ta nói mô hình có tự tương quan bậc 1 dương. Điều này ngụ ý rằng giữa U t và U t 1 có quan hệ tuyến tính cùng chiều. Khi ρ = 0 ta nói mô hình không có tự tương quan. * Tự tương quan bậc 2: Nếu U t được tạo ra theo cơ chế sau U t = ρ 1 U t 1 + ρ 2 U t 2 + ɛ t trong đó ɛ t thỏa mãn các giả thiết thông thường của phương pháp OLS (E(ɛ t ) = 0; Var(ɛ t ) = σ 2 ɛ ; Cov(ɛ t, ɛ t+s ) = 0, s 0) Khi đó, ta nói U t có tự tương quan bậc hai Markov, ký hiệu AR(2). * Tự tương quan bậc p: Tổng quát, nếu U t được tạo bởi U t = ρ 1 U t 1 + ρ 2 U t ρ p U t p + ɛ t thì ta nói U t có tự tương quan bậc p Markov, ký hiệu AR(p). Chẳng hạn, khảo sát sản lượng của quý theo lượng lao động và vốn. Nếu xảy ra sự kiện đình công trong một quý nào đó thì có thể xảy ra 2 tình huống: + Tình huống 1: Việc đình công chỉ ảnh hưởng đến sản lượng của quý này và không có gì đảm bảo nó cũng ảnh hưởng đến các quý sau thì ta có thể xem là không có hiện tượng tự tương quan xảy ra. + Tình huống 2: Việc đình công xảy ra ở quý này nhưng nó có thể tiếp tục gây hậu quả cho các quý sau thì có nghĩa là có tự tương quan xảy ra. Một ví dụ khác là xét mối quan hệ giữa chi tiêu tiêu dùng và thu nhập của các hộ gia đình ở cùng khu vực. Rất có thể việc chi tiêu tiêu dùng tăng của một hộ gia đình nào đó sẽ dẫn đến việc tăng chi tiêu tiêu dùng của các hộ gia đình khác. Nguyên nhân có thể là do tâm lý tiêu dùng của các hộ gia đình không muốn thua kém nhau. Trong bối cảnh này có tự tương quan xảy ra giữa các quan sát chéo. Hình 6.9 biểu diễn sự biến thiên của nhiễu U t (hoặc Û t ) theo thời gian t để minh họa cho vấn đề tự tương quan. Hình 6.9 (a) cho thấy nhiễu biến thiên có tính chu kỳ; hình 6.9 (b, c) mô tả các nhiễu có xu hướng tăng, giảm tuyến tính theo t; hình 6.9 (d) mô tả xu hướng thay đổi của nhiễu theo thời gian có dạng hàm bậc hai; ba trường hợp này thể hiện tính chất tự tương quan của nhiễu. Hình 6.9 (e) biểu diễn tính không hệ thống trong sự biến thiên của nhiễu theo thời gian, điều này cho phép nhận định không có tự tương quan giữa các nhiễu.

145 Chương 6: Mô hình vi phạm các giả thiết 139 Hình 6.9 Đồ thị U t (hoặc Ût) theo thời gian Nguyên nhân của tự tương quan a) Nguyên nhân khách quan + Thứ nhất, do tính chất quán tính của dãy số liệu. Nét nổi bật của hầu hết các chuỗi thời gian như: tổng sản phẩm quốc dân GNP, chỉ số giá, tỷ lệ thất nghiệp... mang tính chu kỳ. Khi nền kinh tế thốt khỏi tình trạng suy thối thì hầu hết các chỉ số này có khuynh hướng bắt đầu gia tăng, nghĩa là giá trị của chuỗi ở thời điểm sau thường cao hơn thời điểm trước. Xu hướng này sẽ còn tiếp tục cho đến khi có một nhân tố nào đó xảy ra tác động đến nền kinh tế và dẫn đến hậu quả là làm chậm hoặc thay đổi khuynh hướng biến thiên của chuỗi dữ liệu. Vì vậy, trong hồi quy chuỗi thời gian, các quan sát kế tiếp có nhiều khả năng tương quan phụ thuộc nhau. + Thứ hai, là hiện tượng mạng nhện. Để minh họa ta xét việc cùng một lúc nhiều mặt hàng nông sản. Khi mức cung tăng lên thì mức cung của hàng hóa sẽ phản ứng lại với giá có trễ một khoảng thời gian, bởi vì các quyết định cung phải có thời gian để thực hiện. Mức giá của mặt hàng nông sản nào đó năm nay sẽ phụ thuộc vào giá sản phẩm đó năm ngối. Mô hình cung sẽ là Y t = β 1 + β 2 P t 1 + U t trong đó P t là giá hàng hóa ở thời điểm t. Nếu như P t < P t 1 thì thời kỳ sau t, nghĩa là t + 1, người nông dân có thể quyết định sản xuất hàng hóa đó ít hơn cho phù hợp với tình hình của thị trường. Khi đó, đại lượng U t sẽ có tương quan với nhau. + Thứ ba, là hiện tượng trễ.

146 140 Chương 6: Mô hình vi phạm các giả thiết Trong phân tích hồi quy chuỗi thời gian ta gặp hiện tượng biến phụ thuộc ở thời kỳ t phụ thuộc vào chính biến đó ở thời kỳ trước đó, t 1 và các biến khác. Chẳng hạn, khi nghiên cứu quan hệ giữa tiêu dùng và thu nhập ta thấy tiêu dùng thời kỳ hiện tại, ngồi sự phụ thuộc của biến thu nhập thời kỳ t, còn phụ thuộc vào tiêu dùng của thời kỳ trước và mô hình có dạng: Y t = β 1 + β 2 X t + β 3 Y t 1 + U t trong đó Y t là tiêu dùng ở thời kỳ t; X t là thu nhập ở thời kỳ t; Y t 1 là tiêu dùng ở thời kỳ t 1; U t là nhiễu. Mô hình trên nói rằng người tiêu dùng thường ít thay đổi thói quen tiêu dùng (có trễ). Nếu bỏ qua số hạng mô tả tính trễ trong mô hình thì sai số sẽ mang tính chất hệ thống do ảnh hưởng của tiêu dùng thời kỳ trước lên tiêu dùng của thời kỳ hiện tại. b) Nguyên nhân chủ quan + Thứ nhất, do xử lý số liệu. Trong phân tích thực nghiệm, số liệu thô thường được xử lý. Chẳng hạn, trong hồi quy chuỗi thời gian gắn với các số liệu quý, các số liệu này thường được suy ra từ số liệu tháng bằng cách cộng 3 quan sát theo tháng rồi chia cho 3. Việc lấy trung bình này làm trơn các số liệu và làm giảm sự dao động trong số liệu tháng. Chính sự làm trơn này có thể dẫn đến sai số có hệ thống trong các nhiễu và gây ra tự tương quan. Một kiểu xử lý khác là nội suy hay ngoại suy số liệu. Chẳng hạn, tổng điều tra dân số được tiến hành 10 năm một lần, có số liệu tổng điều tra dân số năm 1979 và Ta dùng nó để nội suy số liệu trong các năm 1980, 1981,..., Cách làm đó dẫn đến hiện tượng tự tương quan trong chuỗi. + Thứ hai, do lập mô hình. Có thể là do bỏ sót biến quan trọng hay chỉ định dạng hàm sai. Không đưa đủ các biến vào mô hình. Thí dụ, xét mô hình Y t = β 1 + β 2 X 2t + β 3 X 3t + β 4 X 4t + U t (6.5.2) trong đó Y là nhu cầu về thịt bò; X 2 là giá thịt bò; X 3 là thu nhập của người tiêu dùng; X 4 là giá thịt heo; t là thời gian; U t là sai số ngẫu nhiên. Nhưng vì lý do nào đó chúng ta đưa ra mô hình chỉ có 2 biến độc lập là X 2 và X 3 Yt = β1 + β2x2t + β3x3t + Vt (6.5.3) Vậy nếu (6.5.2) là mô hình đúng thì khi ta tiến hành hồi quy hàm (6.5.3) cũng tương đương là cho V t = β 4 X 4t + U t

147 Chương 6: Mô hình vi phạm các giả thiết 141 Nhưng vì việc tăng giá thịt heo có ảnh hưởng đến cầu thịt bò nên thành phần nhiễu V t sẽ có sai số hệ thống và tạo nên tự tương quan. Dạng hàm sai. Thí dụ, giả sử mô hình đúng của chi phí biên và sản lượng là MC i = β 1 + β 2 Q i + β 3 Q 2 i + U i (6.5.4) trong đó MC là chi phí biên; Q là sản lượng sản phẩm. Nhưng ta lại ước lượng mô hình hồi quy có dạng MC i = α 1 + α 2 Q i + V i (6.5.5) Đồ thị của (6.5.4) và (6.5.5) khi bỏ qua sai số ngẫu nhiên được biểu diễn ở hình Nhìn vào hình 6.10 ta thấy các điểm nằm trên đoạn AB của đường hồi quy (6.5.5) cho ước lượng quá cao chi phí biên đúng, còn điểm nằm ngoài đoạn này cho ước lượng thấp hơn. Khi đó, các sai số ngẫu nhiên V i được xác định như sau: V i = β 3 Q 2 i + U i và do đó nó bị ảnh hưởng có tính hệ Hình 6.10 Đồ thị chi phí biên theo sản lượng thống của sản lượng đối với chi phí biên. Vậy V i có tự tương quan do sử dụng dạng hàm không chính xác Hậu quả của tự tương quan + Các ước lượng OLS vẫn là các ước lượng tuyến tính, không chệch nhưng chúng không phải là ước lượng hiệu quả nữa. Nói cách khác, ước lượng OLS không phải là ước lượng tuyến tính không chệch tốt nhất nữa. + Phương sai ước lượng của các ước lượng OLS thường là chệch. Khi tính phương sai và sai số tiêu chuẩn của các ước lượng OLS thường cho những giá trị thấp hơn các giá trị thực và do đó làm cho giá trị của t lớn, dẫn đến kết luận sai khi kiểm định. Do đó, kiểm định t và kiểm định F không còn tin cậy nữa. + σ 2 là ước lượng chệch của σ 2 và trong một số trường hợp là chệch về phía dưới. + Giá trị ước lượng R 2 có thể không tin cậy khi dùng để thay thế cho giá trị thực của R 2. + Phương sai và sai số tiêu chuẩn của các giá trị dự báo không được tin cậy (không hiệu quả).

148 142 Chương 6: Mô hình vi phạm các giả thiết Như vậy, hậu quả của hiện tượng tự tương quan là vấn đề nghiêm trọng trong thực hành. Vì vậy, nếu trong số liệu quan sát có hiện tượng tự tương quan thì chúng ta phải tìm cách phát hiện và khắc phục cho được Cách phát hiện tự tương quan Xem xét đồ thị phần dư Giả thiết không có tự tương quan trong mô hình hồi quy tuyến tính cổ điển gắn với các nhiễu U t, nhưng U t không quan sát được, ta chỉ có thể quan sát được các phần dư Û t = Y t Ŷ t. Mặc dù Û t không hoàn toàn giống U t nhưng quan sát các phần dư Û t có thể gợi ý cho ta những nhận xét về U t. Ta có thể vẽ các loại đồ thị sau: Đồ thị phần dư Û t hoặc Û 2 t theo thời gian. Đồ thị Û t theo Û t 1 (được gọi là lược đồ AR(1)). Đồ thị các phần dư chuẩn hóa theo thời gian: Ût theo t. σ Nếu đồ thị có dạng ngẫu nhiên thì không có tự tương quan. Nếu đồ thị không ngẫu nhiên, biểu thị xu hướng biến thiên có tính chất hệ thống thì nhận định có tự tương quan xảy ra. Kiểm định đoạn mạch Kiểm định doạn mạch là một phép kiểm định thống kê giúp ta xác định xem có thể coi một dãy các ký hiệu, các khoản mục, các số liệu có phải là kết quả của một quá trình mang tính ngẫu nhiên hay không. Ta xét thí dụ về một mô hình chuỗi thời gian, từ số liệu của một mẫu ta đã ước lượng được mô hình và thu được chuỗi các phần dư như sau: Nhìn vào các dãy phần dư ta thấy đầu tiên có một phần dư âm, kế tiếp là phần dư dương,... (nếu theo thứ tự từ trái qua phải, từ trên xuống dưới). Ghi lại các dấu (+) và (-) theo thứ tự từ dãy các phần dư trên: Một đoạn mạch là một dãy các phần tử giống nhau mà ở liền trước và liền sau là các phần tử khác chúng hoặc không có phần tử nào. Chiều dài của một đoạn mạch là số phần tử của nó. Đặt: n là tổng số quan sát; n 1 là số ký hiệu dương (số phần dư dương); n 2 là số ký hiệu âm (số phần dư âm); N là số đoạn mạch.

149 Chương 6: Mô hình vi phạm các giả thiết 143 Giả thuyết kiểm định: H 0 : các phần dư là độc lập H 1 : các phần dư không độc lập Với giả thiết n 1 10 và n 2 10 thì N có phân phối gần với phân phối chuẩn với kỳ vọng E(N) và phương sai σn 2 được tính như sau: Độ lệch chuẩn E(N) = 2n 1n = 2n 1n n 1 + n 2 n σn 2 = 2n 1n 2 (2n 1 n 2 n 1 n 2 ) (n 1 + n 2 ) 2 (n 1 + n 2 1) = 2n 1n 2 (2n 1 n 2 n) n 2 (n 1) σ N = 2n1 n 2 (2n 1 n 2 n 1 n 2 ) (n 1 + n 2 ) 2 (n 1 + n 2 1) = 2n1 n 2 (2n 1 n 2 n) n 2 (n 1) Nếu giả thuyết H 0 có thể chấp nhận được thì chúng ta sẽ kỳ vọng số đoạn mạch N thu được nằm trong khoảng [E(N) ± z α σ N ] với hệ số tin cậy 1 α. Với z α là giá trị của Z N(0, 1) thỏa mãn: P ( Z > z α ) = α. Vậy quy tắc quyết định như sau: Chấp nhận giả thuyết H 0 (với mức ý nghĩa α) nếu N [E(N) ± z α σ N ] và bác bỏ giả thuyết H 0 nếu N / [E(N) ± z α σ N ]. Hạn chế của kiểm định này là không thể áp dụng khi điều kiện về n 1 và n 2 không thỏa mãn. Ví dụ Trở lại ví dụ trên, ta tính được: n 1 = 27; n 2 = 26 E(N) = = 27, 49; σ N = ( ) ( ) 2 ( ) = 3, 6 Với mức ý nghĩa α = 5% thì z α = 1, 96. Vậy (E(N) 1, 96.σ N ; E(N) + 1, 96.σ N ) = (20, 434; 34, 546). Vì N = 15 / (20, 434; 34, 546) nên ta bác bỏ giả thuyết H 0 cho rằng các phần dư là độc lập, chuỗi thời gian cần phải được điều chỉnh. Kiểm định d của Durbin - Watson Kiểm định d - Durbin - Watson chỉ dùng để kiểm định tự tương quan bậc nhất: U t = ρu t 1 + ɛ t. Thống kê d Durbin - Watson dùng trong kiểm định được định nghĩa là tỷ số giữa tổng bình phương sai lệch của các phần dư kế tiếp nhau với tổng bình phương các phần dư: n (Û t Û t 1 ) 2 d = t=2 n Ût 2 t=1

150 144 Chương 6: Mô hình vi phạm các giả thiết Khai triển biểu thức của d ta có: n n Ût 2 + d = t=1 n Ût 2 t=1 Ût 1 2 t=1 2 n Û t.û t 1 t=1 n Ût 2 t=1 Tổng n Ût 2 t=1 và n Ût 1 2 t=1 chỉ khác nhau một số hạng, do đó có thể xem hai tổng này là như nhau. n Û t Û t 1 t=2 Đặt ρ =, với ρ là hệ số tự tương quan bậc nhất của mẫu và là ước n Ût 2 t=1 lượng của ρ trong biểu thức (6.5.1) với 1 ρ 1. Ta có d 2(1 ρ). Vì ρ [ 1, 1] nên d [0, 4]. Ta xét các trường hợp đặc biệt của ρ như sau: d = 4 ρ = 1 : dấu hiệu tự tương quan âm rất cao giữa U t và U t 1. d = 2 ρ = 0 : dấu hiệu không có tự tương quan xảy ra. d = 0 ρ = 1 : dấu hiệu có tự tương dương rất cao giữa U t và U t 1. Trong thực nghiệm, giá trị d tính được có thể gần 4, điều này cho thấy khả năng có tự tương quan âm; d gần 0 cho thấy khả năng có tự tương quan dương. Tuy nhiên, khái niệm gần cần được đánh giá bằng những giá trị cụ thể mà chúng ta gọi là giá trị tới hạn. Bảng thống kê Durbin - Watson cho ta các giá trị tới hạn d U, d L dựa vào 3 tham số: mức ý nghĩa α, số quan sát n và số biến độc lập của mô hình k = k 1. Kiểm định Durbin-Watson được thực hiện như sau: Bước 1: Thiết lập cặp giả thuyết H 0 : ρ = 0 và H 1 : ρ 0. Bước 2: Ước lượng hồi quy bằng phương pháp bình phương nhỏ nhất thông thường OLS và thu được các phần dư Û t. Bước 3: Tính các giá trị thống kê d (phần mềm Eviews đã tính sẵn giá trị thống kê d trong bảng kết quả hồi quy). Bước 4: Tìm giá trị tới hạn d U và d L từ bảng thống kê Durbin-Watson. Quy tắc ra quyết định có thể dựa theo sơ đồ trong hình Nếu giá trị của d thuộc miền không có quyết định, tức ta không thể kết luận có tự tương quan hay không. Khi đó, ta kết luận thế nào? Để giải quyết vấn đề này đã có một số cải biên kiểm định d. Dưới đây là quy tắc kiểm định cải biên thường được áp dụng để kiểm định tự tương quan bậc nhất: Kiểm định 1 phía với mức ý nghĩa α đã cho:

151 Chương 6: Mô hình vi phạm các giả thiết 145 Hình 6.11 Sơ đồ ra quyết định của kiểm định Durbin-Watson 1) Kiểm định bên phải: H 0 : ρ = 0; H 1 : ρ > 0. - Nếu d < d U : bác bỏ H 0, thừa nhận H 1 (có tự tương quan dương). - Nếu d > d U : không có tự tương quan dương. 2) Kiểm định bên trái: H 0 : ρ = 0; H 1 : ρ < 0. - Nếu (4 d) < d U d > (4 d U ) : bác bỏ H 0, thừa nhận H 1 (có tự tương quan âm). - Nếu (4 d) > d U d < (4 d U ) : không có tự tương quan âm. Kiểm định 2 phía với mức ý nghĩa 2α: H 0 : ρ = 0; H 1 : ρ 0. Bác bỏ H 0 : + d < d U : có tự tương quan dương. + (4 d) < d U d > (4 d U ): có tự tương quan âm. Chấp nhận H 0 : d U < d < (4 d U ): không có tự tương quan. * Chú ý: Khi sử dụng kiểm định Durbin-Watson thì mô hình phải thỏa mãn các điều kiện sau: 1- Mô hình hồi quy phải có hệ số chặn. Nếu mô hình không có hệ số chặn thì n phải ước lượng mô hình có hệ số chặn để tính RSS =, sau đó tiến hành phương pháp kiểm định bình thường. Ût 2 t=1 2- Các sai số ngẫu nhiên có tương quan bậc nhất: U t = ρu t 1 + ɛ t. 3- Các biến độc lập là phi ngẫu nhiên. 4- Mô hình không chứa biến trễ của biến phụ thuộc. Chẳng hạn, mô hình sau không thể sử dụng kiểm định Durbin-Watson: Y t = β 1 + β 2 X t + β 3 Y t 1 + U t. 5- Không có quan sát bị mất trong dữ liệu. Ví dụ Cho các số liệu về thu nhập Y và tiêu dùng C trong khoảng thời gian từ năm 1958 đến năm 1988 cho ở bảng sau:

152 146 Chương 6: Mô hình vi phạm các giả thiết Năm C Y Năm C Y Năm C Y , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , 6 Hồi quy tiêu dùng C theo thu nhập Y ta được kết quả: Sử dụng kiểm định Durbin - Watson ta có: với α = 5%, n = 31, k = 1. Tra bảng ta được: d L = 1, 36; d U = 1, 5. Mô hình hồi quy của tiêu dùng theo thu nhập đã ước lượng ở bảng trên có d = 0, Ta thấy 0 < d < d L nên mô hình có tự tương quan dương. Hình 6.12 là biểu đồ phần dư theo thời gian. Trường hợp mô hình có chứa biến độc lập là biến biến trễ của biến phụ thuộc thì ta có thể sử dụng kiểm định Durbin-h. Kiểm định này được giới thiệu bởi Durbin (1970). Xét mô hình hồi quy: Y t = β 1 + β 2 X t + β 3 Y t 1 + U t. (6.5.6) Kiểm định Durbin-h sử dụng thống kê sau: ( h = 1 d ) n 2 1 n.var( β3 )

153 Chương 6: Mô hình vi phạm các giả thiết 147 Hình 6.12 Biểu đồ phần dư theo thời gian trong đó d là thống kê DW cho mô hình (6.5.6). Durbin đã chứng minh rằng nếu giả thuyết H 0 đúng về không có tự tương quan bậc 1 là đúng thì thống kê h tuân theo quy luật chuẩn hóa N(0, 1). Vì vậy, việc đưa ra kết luận trong kiểm định này được dựa trên sự so sánh giá trị quan sát của thống kê h với các giá trị tới hạn của quy luật chuẩn hóa. Ví dụ Xét ví dụ ở trên. Kết quả hồi quy mô hình: T D = 65, , 298T N + 0, 579T D( 1) se (24, 851) (0, 071) (0, 106) d = 1, 169; n = 30 Ta tính giá trị quan sát của thống kê h: h = ( 1 ) 1, = 2, , 1062 Với mức ý nghĩa 5%, giá trị tới hạn hai phía của quy luật N(0, 1) bằng 1, 96. Do đó, có thể kết luận rằng mô hình trên có tự tương quan bậc 1. Kiểm định Breusch-Godfrey (Kiểm định B-G) Xét mô hình hồi quy: Y t = β 1 + β 2 X 2t + + β k X kt + U t trong đó U t = ρ 1 U t 1 + ρ 2 U t ρ p U t p + ɛ t ɛ t thỏa mãn các giả thiết của mô hình hồi quy tuyến tính cổ điển.

154 148 Chương 6: Mô hình vi phạm các giả thiết Ta cần kiểm định giả thiết { H 0 : ρ 1 = ρ 2 = = ρ p = 0 H 1 : ρ ρ ρ2 p > 0 Giả thiết H 0 có nghĩa là không tồn tại tự tương quan ở bất kỳ bậc nào từ bậc 1 đến bậc p. Kiểm định B-G gồm các bước sau đây: Bước 1: Ước lượng mô hình hồi quy ban đầu bằng phương pháp OLS thu được phần dư Û t. Bước 2: Hồi quy phần dư Û t theo tất cả các biến độc lập trong mô hình ban đầu và với các biến độc lập bổ sung Û t 1, Û t 2,..., Û t p : ta thu được R 2. Û t = β 1 + β 2 X 2t + + β k X kt + ρ 1 Û t 1 + ρ 2 Û t ρ p Û t p + V t Bước 3: Với n đủ lớn, (n p)r 2 có phân phối xấp xỉ χ 2 (p). Quy tắc quyết định: + Nếu (n p)r 2 > χ 2 α(p) thì bác bỏ H 0, nghĩa là có tự tương quan với ít nhất 1 bậc nào đó. + Nếu (n p)r 2 χ 2 α(p) thì chưa có cơ sở bác bỏ H 0, không có hiện tượng tự tương quan. * Chú ý: (n p) chính là số quan sát còn lại sau khi lấy trễ đến bậc p, cho nên ta có thể coi (n p) là số quan sát của một mẫu mới. Đôi khi ta thường viết nr 2, trường hợp này ta hiểu n là kích thước của mẫu mới. Kiểm định B-G có các đặc điểm sau: - Áp dụng cho mẫu có kích thước lớn. - Có thể áp dụng cho mô hình có biến độc lập là biến trễ của biến phụ thuộc. - Kiểm định được tự tương quan với bậc bất kỳ. - Kiểm định B-G đòi hỏi phải định trước bậc của tự tương quan. Thông thường người ta tiến hành kiểm định với nhiều giá trị p khác nhau. Kiểm định BG dựa theo nguyên lý của nhân tử Lagrange nên còn gọi là LM-test. Ví dụ Sử dụng kết quả trong ví dụ 6.5.2, tiến hành kiểm định tự tương quan bậc 2 bằng kiểm định B-G ta được kết quả như trong bảng sau. Theo kết quả này, nr 2 = 13, hay p value = 0, 001 rất nhỏ nên ta bác bỏ giả thuyết H 0, nghĩa là có tồn tại tự tương quan bậc 2.

155 Chương 6: Mô hình vi phạm các giả thiết Các biện pháp khắc phục tự tương quan Để khắc phục tự tương quan ta chia ra 2 tình huống cơ bản: một là khi cấu trúc tự tương quan đã biết, hai là cấu trúc tự tương quan chưa biết. Khi đã biết hệ số tự tương quan ρ Vì các nhiễu U t không quan sát được nên tính chất của tương quan chuỗi thường là vấn đề suy đốn hoặc là do những đòi hỏi cấp bách của thực tiễn. Trong thực hành, người ta thường giả sử rằng ɛ t theo mô hình tự hồi quy bậc nhất, nghĩa là U t = ρu t 1 + ɛ t trong đó ρ < 1 và ɛ t thỏa mãn các điều kiện của phương pháp OLS. Nếu ρ đã biết thì vấn đề tương quan chuỗi có thể giải quyết được. Ta xét mô hình 2 biến: Y t = β 1 + β 2 X t + U t Phương trình đúng với mọi t nên đúng với t 1, do đó ta có Y t 1 = β 1 + β 2 X t 1 + U t 1 Từ đó, ρy t 1 = ρβ 1 + ρβ 2 X t 1 + ρu t 1 Y t ρy t 1 = β 1 (1 ρ) + β 2 (X t ρx t 1 ) + (U t ρu t 1 ) (6.5.7)

156 150 Chương 6: Mô hình vi phạm các giả thiết Mô hình hồi quy (6.5.7) được gọi là mô hình sai phân cấp 1 tổng quát. Đặt: Y t = Y t ρy t 1 ; β 1 = β 1(1 ρ); β 2 = β 2; X t = X t ρx t 1 ; ɛ t = U t ρu t 1. Khi đó, (6.5.6) có thể viết dưới dạng Y t = β 1 + β 2X t + ɛ t Vì ɛ t thỏa mãn các giả thiết của phương pháp OLS đối với các biến Y và X nên các ước lượng tìm được sẽ là các ước lượng tuyến tính không chệch tốt nhất. * Lưu ý: 1) Trong qui trình lấy sai phân chúng ta bị mất 1 quan sát vì quan sát đầu tiên không có quan sát đứng trước nó. Để tránh mất mát 1 quan sát này, quan sát đầu của Y và X được biến đổi như sau: Y 1 = Y 1 1 ρ 2 ; X 1 = X 1 1 ρ 2. 2) Với ρ = 1 thì phương trình sai phân tổng quát trở thành phương trình sai phân cấp 1: Y t Y t 1 = β(x t X t 1 ) + (U t U t 1 ) Thực hiện hồi quy phương trình sai phân cấp 1 là thực hiện hồi quy qua gốc tọa độ. Với ρ = 1 thì phương trình sai phân tổng quát có thể biến đổi thành: Y t + Y t 1 2 = β 1 + β 2 X t + X t U t + U t 1 2 (hồi quy trung bình trượt) Khi chưa biết hệ số tự tương quan ρ Thực tế, rất hiếm khi ta biết được giá trị của hệ số tự tương quan ρ, nên thông thường trong xử lý số liệu ta phải ước lượng ρ. Ta sẽ trình bày một số cách để ước lượng ρ. a) Ước lượng ρ dựa trên thống kê d Durbin - Watson Trong phần kiểm định d chúng ta đã biết công thức: Do đó, d 2(1 ρ) ρ 1 d 2 (6.5.8) Đẳng thức gần đúng này cho ta ước lượng ρ từ thống kê d. Tuy nhiên, ta cần lưu ý rằng quan hệ (6.5.8) chỉ là quan hệ xấp xỉ và có thể không đúng với mẫu nhỏ. Đối với các mẫu nhỏ có thể sử dụng thống kê d cải biên của Theil - Nagar.

157 Chương 6: Mô hình vi phạm các giả thiết 151 Theil và Nagar đã đề xuất rằng trong các mẫu nhỏ, thay cho việc ước lượng ρ như là (1 d/2), có thể ước lượng như là ρ = n2 (1 d/2) + k 2 n 2 k 2 trong đó n là tổng số các quan sát; k là số các hệ số (bao gồm cả tung độ gốc) cần phải ước lượng. Khi n lớn, ước lượng ρ này là bằng với ước lượng thu được bởi công thức đơn giản (1 d/2). Khi có ρ, ta thực hiện hồi quy mô hình sai phân tổng quát với ρ được thay thế bởi ρ. b) Sử dụng thủ tục lặp Cochrane - Orcutt để ước lượng ρ Xét mô hình hồi quy Y t = β 1 + β 2 X t + U t (6.5.9) Giả sử U t được sinh ra bởi mô hình AR(1): U t = ρu t 1 + ɛ t. (6.5.10) Các bước ước lượng ρ được tiến hành như sau: Bước 1: Ước lượng mô hình (6.5.9) bằng phương pháp OLS và thu được các phần dư Û t = Y t Ŷ t. ρ. Bước 2: Sử dụng các phần dư Û t để ước lượng mô hình (6.5.10) ta thu được Bước 3: Thay ρ vào phương trình sai phân tổng quát (6.5.7). Do không có gì để chắc chắn rằng ρ là ước lượng tốt nhất của ρ, nên người ta có thể tiến hành thủ tục Cochrane - Orcutt nhiều bước như sau: Bước 1: Ước lượng mô hình (6.5.9) bằng phương pháp OLS và thu được các phần dư Û t = Y t Ŷ t. Bước 2: Sử dụng các phần dư Û t để ước lượng mô hình (6.5.10) ta thu được ρ (ước lượng vòng lặp thứ nhất của ρ). Bước 3: Sử dụng ρ để ước lượng phương trình sai phân tổng quát, tức phương trình: Y t ρy t 1 = β 1 (1 ρ) + β 2 (X t ρx t 1 ) + (U t ρu t 1 ) thu được các tham số ước lượng của β 1 = β 1(1 ρ) là β 1, của β 2 là β2. Từ β 1, ta có thể ước lượng β 1 bằng β1 = β 1 1 ρ. Bước 4: Thay β1, β2 vào (6.5.9) ta thu được phần dư mới Û t = Y t β1 β2 X t.

158 152 Chương 6: Mô hình vi phạm các giả thiết Bước 5: Ước lượng mô hình hồi quy (6.5.10) sau đây ta thu được ρ (ước lượng vòng lặp thứ hai của ρ) Û t = ρû t 1 + V t (6.5.11) Bước 6: Sử dụng ρ thu được từ (6.5.11) để ước lượng phương trình sai phân tổng quát: Y t ρy t 1 = β 1 (1 ρ) + β 2 (X t ρx t 1 ) + (U t ρu t 1 ) ta thu được β1, β2. Từ β1, ta tính được β1 =. 1 ρ Thủ tục này tiếp tục cho đến khi các ước lượng kế tiếp nhau của ρ khác nhau một lượng rất nhỏ, chẳng hạn nhỏ hơn 0, 05 hoặc 0, 005. Trong thực tế thường dùng 3-4 bước lặp là đủ. Ví dụ Giả sử có một chuỗi số liệu về quan hệ giữa hai đại lượng kinh tế X là biến độc lập, Y là biến phụ thuộc trong vòng 24 năm cho bởi bảng số liệu sau: β 1 t Y X t Y X 1 104, 66 5, , 33 4, , 53 5, , 66 4, , 30 5, , 33 4, , 96 5, , 33 4, , 83 5, , 00 3, , 23 5, , 00 3, , 06 5, , 00 3, , 66 5, , 33 3, , 00 5, , 66 3, , 66 5, , 33 3, , 33 5, , 00 3, , 00 5, , 66 3, 96 Mô hình hồi quy thực nghiệm tương ứng với số liệu ở bảng trên là ln Y t = β 2 + β 3 ln X t + U t Với điều kiện là các giả thiết của phương pháp OLS thông thường thỏa mãn thì khi đó ta có: β 2 = 7, 2944; β3 = 1, 5272; se( β2 ) = 0, 1084; se( β3 ) = 0, 0694 t β2 = 67, 2916; t β3 = 21, 9878.

159 Chương 6: Mô hình vi phạm các giả thiết 153 Ta cần phải xem xét số liệu có xảy ra tự tương quan không? Vì n = 24, k = 1 và α = 0, 05 ta có d U = 1, 45; d L = 1, 27. Như vậy, giá trị thống kê d = 0, 9558 < d L nên có tương quan thuận chiều. Sai số chuẩn và t không có ý nghĩa nên phải ước lượng ρ. Ta có ρ theo các ước lượng: Phương pháp ρ D (Durbin - Watson) 0, 549 Cochrane - Orcuts Bước lặp 1 0, Bước lặp 2 0, Bước lặp 3 0, Bước lặp 4 0, Các thủ tục tính ρ đều có giá trị xấp xỉ nhau, ta dừng quá trình ước lượng. Ước lượng sai số chuẩn theo Newey-West Phương pháp sai số chuẩn vững áp dụng cho trường hợp phương sai sai số thay đổi, được đề xuất bởi White, đã được trình bày trong mục 6.4. Với hiện tượng tự tương quan, chúng ta có phương pháp tương tự được đề xuất bởi Newey và West (1987). Phương pháp này sẽ cho ta ước lượng sai số chuẩn của các hệ số hồi quy không dựa trên giả thiết về tự tương quan. Tuy các ước lượng không phải là ước lượng hiệu quả, nhưng sẽ là các ước lượng vững. Ví dụ Với số liệu trong ví dụ 6.5.2, ta tính các sai số chuẩn của các hệ số hồi quy theo Newey-West bằng phần mềm Eviews được kết quả như sau: So sánh với bảng kết quả hồi quy gốc ta thấy các giá trị khác được giữ nguyên, chỉ có sai số chuẩn se( βj ) được điều chỉnh lớn lên so với các giá trị cũ.

160 Tài liệu tham khảo [1] Nguyễn Thành Cả - Nguyễn Thị Ngọc Miên, Kinh tế lượng, Nxb Kinh tế Thành phố Hồ Chí Minh, [2] Phạm Trí Cao - Vũ Minh Châu, Kinh tế lượng ứng dụng, Nxb Lao động xã hội, [3] Nguyễn Quang Dong - Nguyễn Thị Minh, Giáo trình Kinh tế lượng, Nxb Kinh tế Quốc dân Hà Nội, [4] Huỳnh Đạt Hùng - Nguyễn Khánh Bình - Phạm Xuân Giang, Kinh tế lượng, Nxb Phương Đông, [5] Hoàng Ngọc Nhậm (chủ biên), Giáo trình Kinh tế lượng, Nxb Kinh tế Thành phố Hồ Chí Minh, [6] Bùi Minh Trí, Điều khiển học kinh tế, Nxb Giáo dục, [7] Hoàng Trọng - Chu Nguyễn Mộng Ngọc, Thống kê ứng dụng trong kinh tế - xã hội, Nxb Thống kê, [8] Nguyễn Cao Văn (chủ biên), Giáo trình lý thuyết xác suất và thống kê toán, Nxb Kinh tế Quốc dân Hà Nội, [9] Brooks, C., Introductory Econometrics for Finance, Second Edition, Cambridge University Press, [10] Greene, W. H., Econometric Analysis, Fifth Edition, Prentice Hall, [11] Gujarati, D., Basic Econometrics, Fourth Edition, McGraw Hill, 2004.

161 Phụ lục các bảng số thống kê

162 156 Phụ lục các bảng số thống kê Hình 6.13 Giá trị tới hạn chuẩn

163 Phụ lục các bảng số thống kê 157 Hình 6.14 Giá trị tới hạn Student

164 158 Phụ lục các bảng số thống kê Hình 6.15 Giá trị tới hạn F

165 Phụ lục các bảng số thống kê 159 Hình 6.16 Giá trị tới hạn F (tiếp theo)

166 160 Phụ lục các bảng số thống kê Hình 6.17 Giá trị tới hạn F (tiếp theo)

167 Phụ lục các bảng số thống kê 161 Hình 6.18 Giá trị tới hạn F (tiếp theo)

168 162 Phụ lục các bảng số thống kê Hình 6.19 Giá trị tới hạn F (tiếp theo)

169 Phụ lục các bảng số thống kê 163 Hình 6.20 Giá trị tới hạn F (tiếp theo)

170 164 Phụ lục các bảng số thống kê Hình 6.21 Giá trị tới hạn Khi bình phương

171 Phụ lục các bảng số thống kê 165 Hình 6.22 Giá trị tới hạn Khi bình phương (tiếp theo)

172 166 Phụ lục các bảng số thống kê Hình 6.23 Giá trị Durbin-Watson

173 Phụ lục các bảng số thống kê 167 Hình 6.24 Giá trị Durbin-Watson (tiếp theo)

174 168 Phụ lục các bảng số thống kê Hình 6.25 Giá trị Durbin-Watson (tiếp theo)

175 Phụ lục các bảng số thống kê 169 Hình 6.26 Giá trị Durbin-Watson (tiếp theo)

Kinh tế học vĩ mô Bài đọc

Kinh tế học vĩ mô Bài đọc Chương tình giảng dạy kinh tế Fulbight Niên khóa 2011-2013 Mô hình 1. : cung cấp cơ sở lý thuyết tổng cầu a. Giả sử: cố định, Kinh tế đóng b. IS - cân bằng thị tường hàng hoá: I() = S() c. LM - cân bằng

Διαβάστε περισσότερα

1. Ma trận A = Ký hiệu tắt A = [a ij ] m n hoặc A = (a ij ) m n

1. Ma trận A = Ký hiệu tắt A = [a ij ] m n hoặc A = (a ij ) m n Cơ sở Toán 1 Chương 2: Ma trận - Định thức GV: Phạm Việt Nga Bộ môn Toán, Khoa CNTT, Học viện Nông nghiệp Việt Nam Bộ môn Toán () Cơ sở Toán 1 - Chương 2 VNUA 1 / 22 Mục lục 1 Ma trận 2 Định thức 3 Ma

Διαβάστε περισσότερα

Năm Chứng minh Y N

Năm Chứng minh Y N Về bài toán số 5 trong kì thi chọn đội tuyển toán uốc tế của Việt Nam năm 2015 Nguyễn Văn Linh Năm 2015 1 Mở đầu Trong ngày thi thứ hai của kì thi Việt Nam TST 2015 có một bài toán khá thú vị. ài toán.

Διαβάστε περισσότερα

MALE = 1 nếu là nam, MALE = 0 nếu là nữ. 1) Nêu ý nghĩa của các hệ số hồi quy trong hàm hồi quy mẫu trên?

MALE = 1 nếu là nam, MALE = 0 nếu là nữ. 1) Nêu ý nghĩa của các hệ số hồi quy trong hàm hồi quy mẫu trên? Chương 4: HỒI QUY VỚI BIẾN GIẢ VÀ ỨNG DỤNG 1. Nghiên cứu về tuổi thọ (Y: ngày) của hai loại bóng đèn (loại A, loại B). Đặt Z = 0 nếu đó là bóng đèn loại A, Z = 1 nếu đó là bóng đèn loại B. Kết quả hồi

Διαβάστε περισσότερα

Ngày 26 tháng 12 năm 2015

Ngày 26 tháng 12 năm 2015 Mô hình Tobit với Biến Phụ thuộc bị chặn Lê Việt Phú Chương trình Giảng dạy Kinh tế Fulbright Ngày 26 tháng 12 năm 2015 1 / 19 Table of contents Khái niệm biến phụ thuộc bị chặn Hồi quy OLS với biến phụ

Διαβάστε περισσότερα

Năm 2017 Q 1 Q 2 P 2 P P 1

Năm 2017 Q 1 Q 2 P 2 P P 1 Dùng phép vị tự quay để giải một số bài toán liên quan đến yếu tố cố định Nguyễn Văn Linh Năm 2017 1 Mở đầu Tư tưởng của phương pháp này khá đơn giản như sau. Trong bài toán chứng minh điểm chuyển động

Διαβάστε περισσότερα

Năm Chứng minh. Cách 1. Y H b. H c. BH c BM = P M. CM = Y H b

Năm Chứng minh. Cách 1. Y H b. H c. BH c BM = P M. CM = Y H b huỗi bài toán về họ đường tròn đi qua điểm cố định Nguyễn Văn inh Năm 2015 húng ta bắt đầu từ bài toán sau. ài 1. (US TST 2012) ho tam giác. là một điểm chuyển động trên. Gọi, lần lượt là các điểm trên,

Διαβάστε περισσότερα

I 2 Z I 1 Y O 2 I A O 1 T Q Z N

I 2 Z I 1 Y O 2 I A O 1 T Q Z N ài toán 6 trong kì thi chọn đội tuyển quốc gia Iran năm 2013 Nguyễn Văn Linh Sinh viên K50 TNH ĐH Ngoại Thương 1 Giới thiệu Trong ngày thi thứ 2 của kì thi chọn đội tuyển quốc gia Iran năm 2013 xuất hiện

Διαβάστε περισσότερα

Sử dụngụ Minitab trong thống kê môi trường

Sử dụngụ Minitab trong thống kê môi trường Sử dụngụ Minitab trong thống kê môi trường Dương Trí Dũng I. Giới thiệu Hiện nay có nhiều phần mềm (software) thống kê trên thị trường Giá cao Excel không đủ tính năng Tinh bằng công thức chậm Có nhiều

Διαβάστε περισσότερα

1.3.3 Ma trận tự tương quan Các bài toán Khái niệm Ý nghĩa So sánh hai mô hình...

1.3.3 Ma trận tự tương quan Các bài toán Khái niệm Ý nghĩa So sánh hai mô hình... BÀI TẬP ÔN THI KINH TẾ LƯỢNG Biên Soạn ThS. LÊ TRƯỜNG GIANG Thành phố Hồ Chí Minh, ngày 0, tháng 06, năm 016 Mục lục Trang Chương 1 Tóm tắt lý thuyết 1 1.1 Tổng quan về kinh tế lượng......................

Διαβάστε περισσότερα

SỞ GD & ĐT ĐỒNG THÁP ĐỀ THI THỬ TUYỂN SINH ĐẠI HỌC NĂM 2014 LẦN 1

SỞ GD & ĐT ĐỒNG THÁP ĐỀ THI THỬ TUYỂN SINH ĐẠI HỌC NĂM 2014 LẦN 1 SỞ GD & ĐT ĐỒNG THÁP ĐỀ THI THỬ TUYỂN SINH ĐẠI HỌC NĂM 0 LẦN THPT Chuyên Nguyễn Quang Diêu Môn: TOÁN; Khối D Thời gian làm bài: 80 phút, không kể thời gian phát đề ĐỀ CHÍNH THỨC I. PHẦN CHUNG CHO TẤT CẢ

Διαβάστε περισσότερα

HỒI QUY TUYẾN TÍNH ĐƠN. GV : Đinh Công Khải FETP Môn: Các Phương Pháp Định Lượng

HỒI QUY TUYẾN TÍNH ĐƠN. GV : Đinh Công Khải FETP Môn: Các Phương Pháp Định Lượng 1 HỒI QUY TUYẾN TÍNH ĐƠN GV : Đnh Công Khả FETP Môn: Các Phương Pháp Định Lượng Knh tế lượng là gì? Knh tế lượng được quan tâm vớ vệc xác định các qu luật knh tế bằng thực nghệm (Thel, 1971) Knh tế lượng

Διαβάστε περισσότερα

Tôi có thể tìm mẫu đơn đăng kí ở đâu? Tôi có thể tìm mẫu đơn đăng kí ở đâu? Για να ρωτήσετε που μπορείτε να βρείτε μια φόρμα

Tôi có thể tìm mẫu đơn đăng kí ở đâu? Tôi có thể tìm mẫu đơn đăng kí ở đâu? Για να ρωτήσετε που μπορείτε να βρείτε μια φόρμα - Γενικά Tôi có thể tìm mẫu đơn đăng kí ở đâu? Tôi có thể tìm mẫu đơn đăng kí ở đâu? Για να ρωτήσετε που μπορείτε να βρείτε μια φόρμα Khi nào [tài liệu] của bạn được ban hành? Για να ρωτήσετε πότε έχει

Διαβάστε περισσότερα

5. Phương trình vi phân

5. Phương trình vi phân 5. Phương trình vi phân (Toán cao cấp 2 - Giải tích) Lê Phương Bộ môn Toán kinh tế Đại học Ngân hàng TP. Hồ Chí Minh Homepage: http://docgate.com/phuongle Nội dung 1 Khái niệm Phương trình vi phân Bài

Διαβάστε περισσότερα

có thể biểu diễn được như là một kiểu đạo hàm của một phiếm hàm năng lượng I[]

có thể biểu diễn được như là một kiểu đạo hàm của một phiếm hàm năng lượng I[] 1 MỞ ĐẦU 1. Lý do chọn đề tài Chúng ta đều biết: không có lý thuyết tổng quát cho phép giải mọi phương trình đạo hàm riêng; nhất là với các phương trình phi tuyến Au [ ] = 0; (1) trong đó A[] ký hiệu toán

Διαβάστε περισσότερα

Năm 2014 B 1 A 1 C C 1. Ta có A 1, B 1, C 1 thẳng hàng khi và chỉ khi BA 1 C 1 = B 1 A 1 C.

Năm 2014 B 1 A 1 C C 1. Ta có A 1, B 1, C 1 thẳng hàng khi và chỉ khi BA 1 C 1 = B 1 A 1 C. Đường thẳng Simson- Đường thẳng Steiner của tam giác Nguyễn Văn Linh Năm 2014 1 Đường thẳng Simson Đường thẳng Simson lần đầu tiên được đặt tên bởi oncelet, tuy nhiên một số nhà hình học cho rằng nó không

Διαβάστε περισσότερα

* Môn thi: VẬT LÝ (Bảng A) * Ngày thi: 27/01/2013 * Thời gian làm bài: 180 phút (Không kể thời gian giao đề) ĐỀ:

* Môn thi: VẬT LÝ (Bảng A) * Ngày thi: 27/01/2013 * Thời gian làm bài: 180 phút (Không kể thời gian giao đề) ĐỀ: Họ và tên thí sinh:. Chữ kí giám thị Số báo danh:..... SỞ GIÁO DỤC VÀ ĐÀO TẠO BẠC LIÊU KỲ THI CHỌN HSG LỚP 0 CẤP TỈNH NĂM HỌC 0-03 ĐỀ THI CHÍNH THỨC (Gồm 0 trang) * Môn thi: VẬT LÝ (Bảng A) * Ngày thi:

Διαβάστε περισσότερα

Bài Tập Môn: NGÔN NGỮ LẬP TRÌNH

Bài Tập Môn: NGÔN NGỮ LẬP TRÌNH Câu 1: Bài Tập Môn: NGÔN NGỮ LẬP TRÌNH Cho văn phạm dưới đây định nghĩa cú pháp của các biểu thức luận lý bao gồm các biến luận lý a,b,, z, các phép toán luận lý not, and, và các dấu mở và đóng ngoặc tròn

Διαβάστε περισσότερα

Ý NGHĨA BẢNG HỒI QUY MÔ HÌNH BẰNG PHẦN MỀM EVIEWS

Ý NGHĨA BẢNG HỒI QUY MÔ HÌNH BẰNG PHẦN MỀM EVIEWS Ý NGHĨA BẢNG HỒI QUY MÔ HÌNH BẰNG PHẦN MỀM EVIEWS CẦN KÍ TÊN Ý NGHĨA XEM HIỆU 1 Dependent Variable Tên biến phụ thuộc Y Phương pháp bình Method: Least phương tối thiểu (nhỏ OLS Squares nhất) Date - Time

Διαβάστε περισσότερα

ĐỀ BÀI TẬP LỚN MÔN XỬ LÝ SONG SONG HỆ PHÂN BỐ (501047)

ĐỀ BÀI TẬP LỚN MÔN XỬ LÝ SONG SONG HỆ PHÂN BỐ (501047) ĐỀ BÀI TẬP LỚN MÔN XỬ LÝ SONG SONG HỆ PHÂN BỐ (501047) Lưu ý: - Sinh viên tự chọn nhóm, mỗi nhóm có 03 sinh viên. Báo cáo phải ghi rõ vai trò của từng thành viên trong dự án. - Sinh viên báo cáo trực tiếp

Διαβάστε περισσότερα

Năm Pascal xem tại [2]. A B C A B C. 2 Chứng minh. chứng minh sau. Cách 1 (Jan van Yzeren).

Năm Pascal xem tại [2]. A B C A B C. 2 Chứng minh. chứng minh sau. Cách 1 (Jan van Yzeren). Định lý Pascal guyễn Văn Linh ăm 2014 1 Giới thiệu. ăm 16 tuổi, Pascal công bố một công trình toán học : Về thiết diện của đường cônic, trong đó ông đã chứng minh một định lí nổi tiếng và gọi là Định lí

Διαβάστε περισσότερα

x y y

x y y ĐÁP ÁN - ĐỀ KHẢO SÁT CHẤT LƯỢNG HỌC SINH LỚP THPT Bài Năm học 5 6- Môn: TOÁN y 4 TXĐ: D= R Sự biến thiên lim y lim y y ' 4 4 y ' 4 4 4 ( ) - - + y - + - + y + - - + Bài Hàm số đồng biến trên các khoảng

Διαβάστε περισσότερα

Môn: Toán Năm học Thời gian làm bài: 90 phút; 50 câu trắc nghiệm khách quan Mã đề thi 116. (Thí sinh không được sử dụng tài liệu)

Môn: Toán Năm học Thời gian làm bài: 90 phút; 50 câu trắc nghiệm khách quan Mã đề thi 116. (Thí sinh không được sử dụng tài liệu) SỞ GIÁO DỤC VÀ ĐÀO TẠO HÀ NỘI ĐỀ KIỂM TRA HỌC KÌ I LỚP TRƯỜNG THPT TRUNG GIÃ Môn: Toán Năm học 0-0 Thời gian làm bài: 90 phút; 50 câu trắc nghiệm khách quan Mã đề thi (Thí sinh không được sử dụng tài liệu)

Διαβάστε περισσότερα

Chương 11 HỒI QUY VÀ TƯƠNG QUAN ĐƠN BIẾN

Chương 11 HỒI QUY VÀ TƯƠNG QUAN ĐƠN BIẾN Chương 11 HỒI QUY VÀ TƯƠNG QUAN ĐƠN BIẾN Ths. Nguyễn Tiến Dũng Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội Email: dung.nguyentien3@hust.edu.vn MỤC TIÊU CỦA CHƯƠNG Sau khi học xong chương này, người

Διαβάστε περισσότερα

Suy ra EA. EN = ED hay EI EJ = EN ED. Mặt khác, EID = BCD = ENM = ENJ. Suy ra EID ENJ. Ta thu được EI. EJ Suy ra EA EB = EN ED hay EA

Suy ra EA. EN = ED hay EI EJ = EN ED. Mặt khác, EID = BCD = ENM = ENJ. Suy ra EID ENJ. Ta thu được EI. EJ Suy ra EA EB = EN ED hay EA ài tập ôn đội tuyển năm 015 guyễn Văn inh Số 6 ài 1. ho tứ giác ngoại tiếp. hứng minh rằng trung trực của các cạnh,,, cắt nhau tạo thành một tứ giác ngoại tiếp. J 1 1 1 1 hứng minh. Gọi 1 1 1 1 là tứ giác

Διαβάστε περισσότερα

KỸ THUẬT ĐIỆN CHƯƠNG IV

KỸ THUẬT ĐIỆN CHƯƠNG IV KỸ THẬT ĐỆN HƯƠNG V MẠH ĐỆN PH HƯƠNG V : MẠH ĐỆN PH. Khái niệm chung Điện năng sử ụng trong công nghiệ ưới ạng òng điện sin ba ha vì những lý o sau: - Động cơ điện ba ha có cấu tạo đơn giản và đặc tính

Διαβάστε περισσότερα

https://www.facebook.com/nguyenkhachuongqv2 ĐỀ 56

https://www.facebook.com/nguyenkhachuongqv2 ĐỀ 56 TRƯỜNG THPT QUỲNH LƯU TỔ TOÁN Câu ( điểm). Cho hàm số y = + ĐỀ THI THỬ THPT QUỐC GIA LẦN NĂM HỌC 5-6 MÔN: TOÁN Thời gian làm bài: 8 phút (không tính thời gian phát đề ) a) Khảo sát sự biến thiên và vẽ

Διαβάστε περισσότερα

Truy cập website: hoc360.net để tải tài liệu đề thi miễn phí

Truy cập website: hoc360.net để tải tài liệu đề thi miễn phí Tru cập website: hoc36net để tải tài liệu đề thi iễn phí ÀI GIẢI âu : ( điể) Giải các phương trình và hệ phương trình sau: a) 8 3 3 () 8 3 3 8 Ta có ' 8 8 9 ; ' 9 3 o ' nên phương trình () có nghiệ phân

Διαβάστε περισσότερα

Q B Y A P O 4 O 6 Z O 5 O 1 O 2 O 3

Q B Y A P O 4 O 6 Z O 5 O 1 O 2 O 3 ài tập ôn đội tuyển năm 2015 guyễn Văn Linh Số 8 ài 1. ho tam giác nội tiếp đường tròn () có là tâm nội tiếp. cắt () lần thứ hai tại J. Gọi ω là đường tròn tâm J và tiếp xúc với,. Hai tiếp tuyến chung

Διαβάστε περισσότερα

O C I O. I a. I b P P. 2 Chứng minh

O C I O. I a. I b P P. 2 Chứng minh ài toán rotassov và ứng dụng Nguyễn Văn Linh Năm 2017 1 Giới thiệu ài toán rotassov được phát biểu như sau. ho tam giác với là tâm đường tròn nội tiếp. Một đường tròn () bất kì đi qua và. ựng một đường

Διαβάστε περισσότερα

Chương 12: Chu trình máy lạnh và bơm nhiệt

Chương 12: Chu trình máy lạnh và bơm nhiệt /009 Chương : Chu trình máy lạnh và bơm nhiệt. Khái niệm chung. Chu trình lạnh dùng không khí. Chu trình lạnh dùng hơi. /009. Khái niệm chung Máy lạnh/bơmnhiệt: chuyển CÔNG thành NHIỆT NĂNG Nguồn nóng

Διαβάστε περισσότερα

Phụ thuộc hàm. và Chuẩn hóa cơ sở dữ liệu. Nội dung trình bày. Chương 7. Nguyên tắc thiết kế. Ngữ nghĩa của các thuộc tính (1) Phụ thuộc hàm

Phụ thuộc hàm. và Chuẩn hóa cơ sở dữ liệu. Nội dung trình bày. Chương 7. Nguyên tắc thiết kế. Ngữ nghĩa của các thuộc tính (1) Phụ thuộc hàm Nội dung trình bày hương 7 và huẩn hóa cơ sở dữ liệu Nguyên tắc thiết kế các lược đồ quan hệ.. ác dạng chuẩn. Một số thuật toán chuẩn hóa. Nguyên tắc thiết kế Ngữ nghĩa của các thuộc tính () Nhìn lại vấn

Διαβάστε περισσότερα

O 2 I = 1 suy ra II 2 O 1 B.

O 2 I = 1 suy ra II 2 O 1 B. ài tập ôn đội tuyển năm 2014 guyễn Văn inh Số 2 ài 1. ho hai đường tròn ( 1 ) và ( 2 ) cùng tiếp xúc trong với đường tròn () lần lượt tại,. Từ kẻ hai tiếp tuyến t 1, t 2 tới ( 2 ), từ kẻ hai tiếp tuyến

Διαβάστε περισσότερα

HÀM NHIỀU BIẾN Lân cận tại một điểm. 1. Định nghĩa Hàm 2 biến. Miền xác định của hàm f(x,y) là miền VD:

HÀM NHIỀU BIẾN Lân cận tại một điểm. 1. Định nghĩa Hàm 2 biến. Miền xác định của hàm f(x,y) là miền VD: . Định nghĩa Hàm biến. f : D M (, ) z= f( M) = f(, ) Miền ác định của hàm f(,) là miền VD: f : D HÀM NHIỀU BIẾN M (, ) z= f(, ) = D sao cho f(,) có nghĩa. Miền ác định của hàm f(,) là tập hợp những điểm

Διαβάστε περισσότερα

Xác định cỡ mẫu nghiên cứu

Xác định cỡ mẫu nghiên cứu VIỆN NGHIÊN CỨU Y XÃ HỘI HỌC Xác định cỡ mẫu nghiên cứu Nguyễn Trương Nam Copyright Bản quyền thuộc về tác giả và thongke.info. Khi sử dụng một phần hoặc toàn bộ bài giảng đề nghị mọi người trích dẫn:

Διαβάστε περισσότερα

(CH4 - PHÂN TÍCH PHƯƠNG SAI, SO SÁNH VÀ KIỂM ĐỊNH) Ch4 - Phân tích phương sai, so sánh và kiểm định 1

(CH4 - PHÂN TÍCH PHƯƠNG SAI, SO SÁNH VÀ KIỂM ĐỊNH) Ch4 - Phân tích phương sai, so sánh và kiểm định 1 TIN HỌC ỨNG DỤNG (CH4 - PHÂN TÍCH PHƯƠNG SAI, SO SÁNH VÀ KIỂM ĐỊNH) Phan Trọng Tiến BM Công nghệ phần mềm Khoa Công nghệ thông tin, VNUA Email: phantien84@gmail.com Website: http://timoday.edu.vn Ch4 -

Διαβάστε περισσότερα

Chương 2: Mô hình hồi quy đơn

Chương 2: Mô hình hồi quy đơn Chương : Mô hình hồ quy đơn I. Bản chất của phân tích hồ quy: 1. Khá nệm: Phân tích hồ quy là nghên cứu sự phụ thuộc của một bến (bến phụ thuộc) vào một hay nhều bến khác (các bến gả thích) để ước lượng

Διαβάστε περισσότερα

c) y = c) y = arctan(sin x) d) y = arctan(e x ).

c) y = c) y = arctan(sin x) d) y = arctan(e x ). Trường Đại học Bách Khoa Hà Nội Viện Toán ứng dụng và Tin học ĐỀ CƯƠNG BÀI TẬP GIẢI TÍCH I - TỪ K6 Nhóm ngành 3 Mã số : MI 3 ) Kiểm tra giữa kỳ hệ số.3: Tự luận, 6 phút. Nội dung: Chương, chương đến hết

Διαβάστε περισσότερα

A 2 B 1 C 1 C 2 B B 2 A 1

A 2 B 1 C 1 C 2 B B 2 A 1 Sáng tạo trong hình học Nguyễn Văn Linh Sinh viên K50 TNH ĐH Ngoại thương 1 Mở đầu Hình học là một mảng rất đặc biệt trong toán học. Vẻ đẹp của phân môn này nằm trong hình vẽ mà muốn cảm nhận được chúng

Διαβάστε περισσότερα

M c. E M b F I. M a. Chứng minh. M b M c. trong thứ hai của (O 1 ) và (O 2 ).

M c. E M b F I. M a. Chứng minh. M b M c. trong thứ hai của (O 1 ) và (O 2 ). ài tập ôn đội tuyển năm 015 Nguyễn Văn inh Số 5 ài 1. ho tam giác nội tiếp () có + =. Đường tròn () nội tiếp tam giác tiếp xúc với,, lần lượt tại,,. Gọi b, c lần lượt là trung điểm,. b c cắt tại. hứng

Διαβάστε περισσότερα

gặp của Học viên Học viên sử dụng khái niệm tích phân để tính.

gặp của Học viên Học viên sử dụng khái niệm tích phân để tính. ĐÁP ÁN Bài 1: BIẾN CỐ NGẪU NHIÊN VÀ XÁC SUẤT Tình huống dẫn nhập STT câu hỏi Nội dung câu hỏi Những ý kiến thường gặp của Học viên Kiến thức liên quan (Giải đáp cho các vấn đề) 1 Tính diện tích Hồ Gươm?

Διαβάστε περισσότερα

Dữ liệu bảng (Panel Data)

Dữ liệu bảng (Panel Data) 5/6/0 ữ lệu bảng (Panel ata) Đnh Công Khả Tháng 5/0 Nộ dung. Gớ thệu chung về dữ lệu bảng. Những lợ thế kh sử dụng dữ lệu bảng. Ước lượng mô hình hồ qu dữ lệu bảng Mô hình những ảnh hưởng cố định (FEM)

Διαβάστε περισσότερα

ĐỀ SỐ 16 ĐỀ THI THPT QUỐC GIA MÔN TOÁN 2017 Thời gian làm bài: 90 phút; không kể thời gian giao đề (50 câu trắc nghiệm)

ĐỀ SỐ 16 ĐỀ THI THPT QUỐC GIA MÔN TOÁN 2017 Thời gian làm bài: 90 phút; không kể thời gian giao đề (50 câu trắc nghiệm) THẦY: ĐẶNG THÀNH NAM Website: wwwvtedvn ĐỀ SỐ 6 ĐỀ THI THPT QUỐC GIA MÔN TOÁN 7 Thời gian làm bài: phút; không kể thời gian giao đề (5 câu trắc nghiệm) Mã đề thi 65 Họ, tên thí sinh:trường: Điểm mong muốn:

Διαβάστε περισσότερα

Tự tương quan (Autocorrelation)

Tự tương quan (Autocorrelation) Tự ương quan (Auocorrelaion) Đinh Công Khải Tháng 04/2016 1 Nội dung 1. Tự ương quan là gì? 2. Hậu quả của việc ước lượng bỏ qua ự ương quan? 3. Làm sao để phá hiện ự ương quan? 4. Các biện pháp khắc phục?

Διαβάστε περισσότερα

PHÂN TÍCH ẢNH HƢỞNG CỦA SÓNG HÀI TRONG TRẠM BÙ CÔNG SUẤT PHẢN KHÁNG KIỂU SVC VÀ NHỮNG GIẢI PHÁP KHẮC PHỤC

PHÂN TÍCH ẢNH HƢỞNG CỦA SÓNG HÀI TRONG TRẠM BÙ CÔNG SUẤT PHẢN KHÁNG KIỂU SVC VÀ NHỮNG GIẢI PHÁP KHẮC PHỤC Luận văn thạc sĩ kỹ thuật 1 ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHIỆP --------------------------------------- VŨ THỊ VÒNG PHÂN TÍCH ẢNH HƢỞNG CỦA SÓNG HÀI TRONG TRẠM BÙ CÔNG SUẤT PHẢN KHÁNG KIỂU SVC

Διαβάστε περισσότερα

x = Cho U là một hệ gồm 2n vec-tơ trong không gian R n : (1.2)

x = Cho U là một hệ gồm 2n vec-tơ trong không gian R n : (1.2) 65 TẠP CHÍ KHOA HỌC, Đại học Huế, Số 53, 2009 HỆ PHÂN HOẠCH HOÀN TOÀN KHÔNG GIAN R N Huỳnh Thế Phùng Trường Đại học Khoa học, Đại học Huế TÓM TẮT Một phân hoạch hoàn toàn của R n là một hệ gồm 2n vec-tơ

Διαβάστε περισσότερα

Tự tương quan (Autoregression)

Tự tương quan (Autoregression) Tự ương quan (Auoregression) Đinh Công Khải Tháng 05/013 1 Nội dung 1. Tự ương quan (AR) là gì?. Hậu quả của việc ước lượng bỏ qua AR? 3. Làm sao để phá hiện AR? 4. Các biện pháp khắc phục? 1 Tự ương quan

Διαβάστε περισσότερα

A. ĐẶT VẤN ĐỀ B. HƯỚNG DẪN HỌC SINH SỬ DỤNG PHƯƠNG PHÁP VECTƠ GIẢI MỘT SỐ BÀI TOÁN HÌNH HỌC KHÔNG GIAN

A. ĐẶT VẤN ĐỀ B. HƯỚNG DẪN HỌC SINH SỬ DỤNG PHƯƠNG PHÁP VECTƠ GIẢI MỘT SỐ BÀI TOÁN HÌNH HỌC KHÔNG GIAN . ĐẶT VẤN ĐỀ Hình họ hông gin là một hủ đề tương đối hó đối với họ sinh, hó ả áh tiếp ận vấn đề và ả trong tìm lời giải ài toán. Làm so để họ sinh họ hình họ hông gin dễ hiểu hơn, hoặ hí ít ũng giải đượ

Διαβάστε περισσότερα

BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐỀ THI MINH HỌA - KỲ THI THPT QUỐC GIA NĂM 2015 Môn: TOÁN Thời gian làm bài: 180 phút.

BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐỀ THI MINH HỌA - KỲ THI THPT QUỐC GIA NĂM 2015 Môn: TOÁN Thời gian làm bài: 180 phút. BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐỀ THI MINH HỌA - KỲ THI THPT QUỐC GIA NĂM Môn: TOÁN Thời gian làm bài: 8 phút Câu (, điểm) Cho hàm số y = + a) Khảo sát sự biến thiên và vẽ đồ thị (C) của hàm số đã cho b) Viết

Διαβάστε περισσότερα

SỞ GIÁO DỤC VÀ ĐÀO TẠO KÌ THI TUYỂN SINH LỚP 10 NĂM HỌC NGÀY THI : 19/06/2009 Thời gian làm bài: 120 phút (không kể thời gian giao đề)

SỞ GIÁO DỤC VÀ ĐÀO TẠO KÌ THI TUYỂN SINH LỚP 10 NĂM HỌC NGÀY THI : 19/06/2009 Thời gian làm bài: 120 phút (không kể thời gian giao đề) SỞ GIÁO DỤC VÀ ĐÀO TẠO KÌ TI TUYỂN SIN LỚP NĂM ỌC 9- KÁN OÀ MÔN : TOÁN NGÀY TI : 9/6/9 ĐỀ CÍN TỨC Thời gian làm bài: phút (không kể thời gian giao đề) ài ( điểm) (Không dùng máy tính cầm tay) a Cho biết

Διαβάστε περισσότερα

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG KẾ TOÁN QUẢN TRỊ (Dùng cho sinh viên hệ đào tạo đại học từ xa) Lưu hành nội bộ HÀ NỘI - 2007 HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG KẾ TOÁN QUẢN TRỊ Biên soạn :

Διαβάστε περισσότερα

(Propensity Score Matching Method) Ngày 11 tháng 5 năm 2016

(Propensity Score Matching Method) Ngày 11 tháng 5 năm 2016 Mô hình So sánh bằng Điểm Xu hướng (Propensity Score Matching Method) Lê Việt Phú Chương trình Giảng dạy Kinh tế Fulbright Ngày 11 tháng 5 năm 2016 1 / 20 Table of contents 1. Tác động can thiệp trung

Διαβάστε περισσότερα

BÀI TẬP LỚN MÔN THIẾT KẾ HỆ THỐNG CƠ KHÍ THEO ĐỘ TIN CẬY

BÀI TẬP LỚN MÔN THIẾT KẾ HỆ THỐNG CƠ KHÍ THEO ĐỘ TIN CẬY Trường Đại Học Bách Khoa TP HCM Khoa Cơ Khí BÀI TẬP LỚN MÔN THIẾT KẾ HỆ THỐNG CƠ KHÍ THEO ĐỘ TIN CẬY GVHD: PGS.TS NGUYỄN HỮU LỘC HVTH: TP HCM, 5/ 011 MS Trang 1 BÀI TẬP LỚN Thanh có tiết iện ngang hình

Διαβάστε περισσότερα

Бизнес Заказ. Заказ - Размещение. Официально, проба

Бизнес Заказ. Заказ - Размещение. Официально, проба - Размещение Εξετάζουμε την αγορά... Официально, проба Είμαστε στην ευχάριστη θέση να δώσουμε την παραγγελία μας στην εταιρεία σας για... Θα θέλαμε να κάνουμε μια παραγγελία. Επισυνάπτεται η παραγγελία

Διαβάστε περισσότερα

ĐỀ 83. https://www.facebook.com/nguyenkhachuongqv2

ĐỀ 83. https://www.facebook.com/nguyenkhachuongqv2 ĐỀ 8 https://www.facebook.com/nguyenkhachuongqv GV Nguyễn Khắc Hưởng - THPT Quế Võ số - https://huongphuong.wordpress.com SỞ GIÁO DỤC VÀ ĐÀO TẠO HƯNG YÊN KỲ THI THỬ THPT QUỐC GIA 016 LẦN TRƯỜNG THPT MINH

Διαβάστε περισσότερα

Chương 1: VECTOR KHÔNG GIAN VÀ BỘ NGHỊCH LƯU BA PHA

Chương 1: VECTOR KHÔNG GIAN VÀ BỘ NGHỊCH LƯU BA PHA I. Vcto không gian Chương : VECTOR KHÔNG GIAN VÀ BỘ NGHỊCH LƯ BA PHA I.. Biể diễn vcto không gian cho các đại lượng ba pha Động cơ không đồng bộ (ĐCKĐB) ba pha có ba (hay bội ố của ba) cộn dây tato bố

Διαβάστε περισσότερα

TRANSISTOR MỐI NỐI LƯỠNG CỰC

TRANSISTOR MỐI NỐI LƯỠNG CỰC hương 4: Transistor mối nối lưỡng cực hương 4 TANSISTO MỐI NỐI LƯỠNG Ự Transistor mối nối lưỡng cực (JT) được phát minh vào năm 1948 bởi John ardeen và Walter rittain tại phòng thí nghiệm ell (ở Mỹ). Một

Διαβάστε περισσότερα

B. chiều dài dây treo C.vĩ độ địa lý

B. chiều dài dây treo C.vĩ độ địa lý ĐỀ THI THỬ LẦN 1 TRƯỜNG THPT CHUYÊN HẠ LONG QUẢNG NINH MÔN VẬT LÝ LỜI GIẢI: LẠI ĐẮC HỢP FACEBOOK: www.fb.com/laidachop Group: https://www.facebook.com/groups/dethivatly.moon/ Câu 1 [316487]: Đặt điện áp

Διαβάστε περισσότερα

Batigoal_mathscope.org ñược tính theo công thức

Batigoal_mathscope.org ñược tính theo công thức SỐ PHỨC TRONG CHỨNG MINH HÌNH HỌC PHẲNG Batigoal_mathscope.org Hoangquan9@gmail.com I.MỘT SỐ KHÁI NIỆM CƠ BẢN. Khoảng cách giữa hai ñiểm Giả sử có số phức và biểu diễn hai ñiểm M và M trên mặt phẳng tọa

Διαβάστε περισσότερα

Μπορείτε να με βοηθήσετε να γεμίσω αυτή τη φόρμα; Για να ρωτήσετε αν κάποιος μπορεί να σας βοηθήσει να γεμίσετε μια φόρμα

Μπορείτε να με βοηθήσετε να γεμίσω αυτή τη φόρμα; Για να ρωτήσετε αν κάποιος μπορεί να σας βοηθήσει να γεμίσετε μια φόρμα - Γενικά Πού μπορώ να βρω τη φόρμα για ; Tôi có thể tìm mẫu đơn đăng kí ở đâu? Για να ρωτήσετε που μπορείτε να βρείτε μια φόρμα Πότε εκδόθηκε το [έγγραφο] σας; Για να ρωτήσετε πότε έχει εκδοθεί ένα έγγραφο

Διαβάστε περισσότερα

KỸ THUẬT ĐIỆN CHƯƠNG II

KỸ THUẬT ĐIỆN CHƯƠNG II KỸ THẬT ĐỆN HƯƠNG DÒNG ĐỆN SN Khái niệm: Dòng điện xoay chiều biến đổi theo quy luật hàm sin của thời gian là dòng điện sin. ác đại lượng đặc trưng cho dòng điện sin Trị số của dòng điện, điện áp sin ở

Διαβάστε περισσότερα

(Instrumental Variables and Regression Discontinuity Design)

(Instrumental Variables and Regression Discontinuity Design) Mô hình Biến Công cụ và Hồi quy Gián đoạn (Instrumental Variables and Regression Discontinuity Design) Kinh tế lượng ứng dụng Lê Việt Phú Chương trình Giảng dạy Kinh tế Fulbright Ngày 20 tháng 5 năm 2015

Διαβάστε περισσότερα

ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN (Chương trình đào tạo tín chỉ, từ Khóa 2011)

ĐỀ CƯƠNG CHI TIẾT HỌC PHẦN (Chương trình đào tạo tín chỉ, từ Khóa 2011) Đề cương chi tiết Toán cao cấp 2 1 TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP. HCM KHOA CÔNG NGHỆ THÔNG TIN CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập Tự do Hạnh phúc 1. Thông tin chung về môn học ĐỀ CƯƠNG CHI TIẾT HỌC

Διαβάστε περισσότερα

1. Nghiên cứu khoa học là gì?

1. Nghiên cứu khoa học là gì? Nội dung cần trình bày Bài 1: Khái niệm về NCKH và các bước viết một đề cương nghiên cứu PGS.TS. Lưu Ngọc Hoạt Viện YHDP và YTCC Trường ĐH Y Hà Nội 1. Nghiên cứu khoa học là gì? 2. Tại sao cán bộ y tế

Διαβάστε περισσότερα

MỤC LỤC LỜI NÓI ĐẦU...

MỤC LỤC LỜI NÓI ĐẦU... MỤC LỤC LỜI NÓI ĐẦU... 5 Chƣơng I: Mở đầu... 8 1.1 Tập hợp và các cấu trúc đại số... 8 1.1.1 Tập hợp và các tập con... 8 1.1.2 Tập hợp và các phép toán hai ngôi... 9 1.3 Quan hệ và quan hệ tương đương...

Διαβάστε περισσότερα

Chương 5. Chẩn đoán hồi quy: Phương sai thay đổi

Chương 5. Chẩn đoán hồi quy: Phương sai thay đổi Chương 5 Chẩn đoán hồi quy: Phương sai thay đổi Domadar N. Gujarati (Econometrics by example, 2011). Người dịch và diễn giải: Phùng Thanh Bình, MB (1/11/2017) Một trong những vấn đề thường gặp trong dữ

Διαβάστε περισσότερα

x i x k = e = x j x k x i = x j (luật giản ước).

x i x k = e = x j x k x i = x j (luật giản ước). 1 Mục lục Chương 1. NHÓM.................................................. 2 Chương 2. NHÓM HỮU HẠN.................................... 10 Chương 3. NHÓM ABEL HỮU HẠN SINH....................... 14 2 CHƯƠNG

Διαβάστε περισσότερα

Tuyển chọn Đề và đáp án : Luyện thi thử Đại Học của các trường trong nước năm 2012.

Tuyển chọn Đề và đáp án : Luyện thi thử Đại Học của các trường trong nước năm 2012. wwwliscpgetl Tuyển chọn Đề và đáp án : Luyện thi thử Đại ọc củ các trường trong nước năm ôn: ÌN Ọ KÔNG GN (lisc cắt và dán) ÌN ÓP ài ho hình chóp có đáy là hình vuông cạnh, tm giác đều, tm giác vuông cân

Διαβάστε περισσότερα

BÀI TẬP CHƯƠNG 1 Đ/S: a) 4,1419 triệu b) 3,2523 triệu Đ/S: nên đầu tư, NPV=499,3 $

BÀI TẬP CHƯƠNG 1 Đ/S: a) 4,1419 triệu b) 3,2523 triệu Đ/S: nên đầu tư, NPV=499,3 $ BÀI TẬP CHƯƠNG 1 1. Trong điều kiện lãi suất 0,9% một tháng, hãy cho biết: a) Giá trị tương lai của 3 triệu đồng bạn có hôm nay sau 3 năm. b) Giá trị hiện tại của khoản tiền 5 triệu đồng bạn sẽ nhận được

Διαβάστε περισσότερα

- Toán học Việt Nam

- Toán học Việt Nam - Toán học Việt Nam PHƯƠNG PHÁP GIẢI TOÁN HÌNH HỌ KHÔNG GIN ẰNG VETOR I. Á VÍ DỤ INH HỌ Vấn đề 1: ho hình chóp S. có đáy là tam giác đều cạnh a. Hình chiếu vuông góc của S trên mặt phẳng () là điểm H thuộc

Διαβάστε περισσότερα

Xác định nguyên nhân và giải pháp hạn chế nứt ống bê tông dự ứng lực D2400mm

Xác định nguyên nhân và giải pháp hạn chế nứt ống bê tông dự ứng lực D2400mm Xác định nguyên nhân và giải pháp hạn chế nứt ống bê tông dự ứng lực D2400mm 1. Giới thiệu Ống bê tông dự ứng lực có nòng thép D2400 là sản phẩm cung cấp cho các tuyến ống cấp nước sạch. Đây là sản phẩm

Διαβάστε περισσότερα

PHƯƠNG PHÁP TỌA ĐỘ TRONG KHÔNG GIAN

PHƯƠNG PHÁP TỌA ĐỘ TRONG KHÔNG GIAN PHƯƠNG PHÁP TỌA ĐỘ TRONG KHÔNG GIAN 1- Độ dài đoạn thẳng Ax ( ; y; z ), Bx ( ; y ; z ) thì Nếu 1 1 1 1. Một Số Công Thức Cần Nhớ AB = ( x x ) + ( y y ) + ( z z ). 1 1 1 - Khoảng cách từ điểm đến mặt phẳng

Διαβάστε περισσότερα

CÁC ĐỊNH LÝ CƠ BẢN CỦA HÌNH HỌC PHẲNG

CÁC ĐỊNH LÝ CƠ BẢN CỦA HÌNH HỌC PHẲNG CÁC ĐỊNH LÝ CƠ BẢN CỦA HÌNH HỌC PHẲNG Nguyễn Tăng Vũ 1. Đường thẳng Euler. Bài toán 1. Trong một tam giác thì trọng tâm, trực tâm và tâm đường tròn ngoại tiếp cùng nằm trên một đường thẳng. (Đường thẳng

Διαβάστε περισσότερα

ĐỀ PEN-CUP SỐ 01. Môn: Vật Lí. Câu 1. Một chất điểm có khối lượng m, dao động điều hòa với biên độ A và tần số góc. Cơ năng dao động của chất điểm là.

ĐỀ PEN-CUP SỐ 01. Môn: Vật Lí. Câu 1. Một chất điểm có khối lượng m, dao động điều hòa với biên độ A và tần số góc. Cơ năng dao động của chất điểm là. Hocmai.n Học chủ động - Sống tích cực ĐỀ PEN-CUP SỐ 0 Môn: Vật Lí Câu. Một chất điểm có khối lượng m, dao động điều hòa ới biên độ A à tần số góc. Cơ năng dao động của chất điểm là. A. m A 4 B. m A C.

Διαβάστε περισσότερα

L P I J C B D. Do GI 2 = GJ.GH nên GIH = IJG = IKJ = 90 GJB = 90 GLH. Mà GIH + GIQ = 90 nên QIG = ILG = IQG, suy ra GI = GQ hay Q (BIC).

L P I J C B D. Do GI 2 = GJ.GH nên GIH = IJG = IKJ = 90 GJB = 90 GLH. Mà GIH + GIQ = 90 nên QIG = ILG = IQG, suy ra GI = GQ hay Q (BIC). ài tập ôn đội tuyển I năm 015 Nguyễn Văn inh Số 7 ài 1. (ym). ho tam giác nội tiếp đường tròn (), ngoại tiếp đường tròn (I). G là điểm chính giữa cung không chứa. là tiếp điểm của (I) với. J là điểm nằm

Διαβάστε περισσότερα

HOC360.NET - TÀI LIỆU HỌC TẬP MIỄN PHÍ. đến va chạm với vật M. Gọi vv, là vận tốc của m và M ngay. đến va chạm vào nó.

HOC360.NET - TÀI LIỆU HỌC TẬP MIỄN PHÍ. đến va chạm với vật M. Gọi vv, là vận tốc của m và M ngay. đến va chạm vào nó. HOC36.NET - TÀI LIỆU HỌC TẬP IỄN PHÍ CHỦ ĐỀ 3. CON LẮC ĐƠN BÀI TOÁN LIÊN QUAN ĐẾN VA CHẠ CON LẮC ĐƠN Phương pháp giải Vật m chuyển động vận tốc v đến va chạm với vật. Gọi vv, là vận tốc của m và ngay sau

Διαβάστε περισσότερα

Nội dung. 1. Một số khái niệm. 2. Dung dịch chất điện ly. 3. Cân bằng trong dung dịch chất điện ly khó tan

Nội dung. 1. Một số khái niệm. 2. Dung dịch chất điện ly. 3. Cân bằng trong dung dịch chất điện ly khó tan CHƯƠNG 5: DUNG DỊCH 1 Nội dung 1. Một số khái niệm 2. Dung dịch chất điện ly 3. Cân bằng trong dung dịch chất điện ly khó tan 2 Dung dịch Là hệ đồng thể gồm 2 hay nhiều chất (chất tan & dung môi) mà thành

Διαβάστε περισσότερα

CÁC CÔNG THỨC CỰC TRỊ ĐIỆN XOAY CHIỀU

CÁC CÔNG THỨC CỰC TRỊ ĐIỆN XOAY CHIỀU Tà lệ kha test đầ xân 4 Á ÔNG THỨ Ự TỊ ĐỆN XOAY HỀ GÁO VÊN : ĐẶNG VỆT HÙNG. Đạn mạch có thay đổ: * Kh thì Max max ; P Max còn Mn ư ý: và mắc lên tếp nha * Kh thì Max * Vớ = hặc = thì có cùng gá trị thì

Διαβάστε περισσότερα

Vectơ và các phép toán

Vectơ và các phép toán wwwvnmathcom Bài 1 1 Các khái niệm cơ bản 11 Dẫn dắt đến khái niệm vectơ Vectơ và các phép toán Vectơ đại diện cho những đại lượng có hướng và có độ lớn ví dụ: lực, vận tốc, 1 Định nghĩa vectơ và các yếu

Διαβάστε περισσότερα

Bài Giảng Môn học: OTOMAT VÀ NGÔN NGỮ HÌNH THỨC

Bài Giảng Môn học: OTOMAT VÀ NGÔN NGỮ HÌNH THỨC Bài Giảng Môn học: OTOMAT VÀ NGÔN NGỮ HÌNH THỨC TS. Nguyễn Văn Định, Khoa CNTT Lời nói đầu Ngôn ngữ là phương tiện để giao tiếp, sự giao tiếp có thể hiểu là giao tiếp giữa con người với nhau, giao tiếp

Διαβάστε περισσότερα

CHƯƠNG 8: NGUYÊN LÝ THỨ NHẤT CỦA NHIỆT ĐỘNG LỰC HỌC DẠNG 1: ĐỊNH LUẬT THỨ NHẤT

CHƯƠNG 8: NGUYÊN LÝ THỨ NHẤT CỦA NHIỆT ĐỘNG LỰC HỌC DẠNG 1: ĐỊNH LUẬT THỨ NHẤT 1 CHƯƠNG 8: NGUYÊN LÝ THỨ NHẤT CỦA NHIỆT ĐỘNG LỰC HỌC 1.1. Kiến thức cơ bản: DẠNG 1: ĐỊNH LUẬT THỨ NHẤT - Dạng này là dạng ứng dụng định luật thứ nhất nhiệt động lực học để giải các bài toán về nhiêt.

Διαβάστε περισσότερα

Lecture-11. Ch-6: Phân tích hệ thống liên tục dùng biếnđổi Laplace

Lecture-11. Ch-6: Phân tích hệ thống liên tục dùng biếnđổi Laplace Ch-6: Phân tích hệ thống liên tục dùng biếnđổi Laplace Lecture- 6.. Phân tích hệ thống LTI dùng biếnđổi Laplace 6.3. Sơđồ hối và thực hiện hệ thống 6.. Phân tích hệ thống LTI dùng biếnđổi Laplace 6...

Διαβάστε περισσότερα

QCVN 28:2010/BTNMT. National Technical Regulation on Health Care Wastewater

QCVN 28:2010/BTNMT. National Technical Regulation on Health Care Wastewater CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM QCVN 28:2010/BTNMT QUY CHUẨN KỸ THUẬT QUỐC GIA VỀ NƯỚC THẢI Y TẾ National Technical Regulation on Health Care Wastewater HÀ NỘI - 2010 Lời nói đầu QCVN 28:2010/BTNMT

Διαβάστε περισσότερα

1.6 Công thức tính theo t = tan x 2

1.6 Công thức tính theo t = tan x 2 TÓM TẮT LÝ THUYẾT ĐẠI SỐ - GIẢI TÍCH 1 Công thức lượng giác 1.1 Hệ thức cơ bản sin 2 x + cos 2 x = 1 1 + tn 2 x = 1 cos 2 x tn x = sin x cos x 1.2 Công thức cộng cot x = cos x sin x sin( ± b) = sin cos

Διαβάστε περισσότερα

Ví dụ 2 Giải phương trình 3 " + = 0. Lời giải. Giải phương trình đặc trưng chúng ta nhận được

Ví dụ 2 Giải phương trình 3  + = 0. Lời giải. Giải phương trình đặc trưng chúng ta nhận được CHƯƠNG 6. PHƯƠNG TRÌNH VI PHÂN CẤP CAO Những ý tưởng cơ bản của phương trình vi phân đã được giải thích trong Chương 9, ở đó chúng ta đã tập trung vào phương trình cấp một. Trong chương này, chúng ta nghiên

Διαβάστε περισσότερα

Μετανάστευση Σπουδές. Σπουδές - Πανεπιστήμιο. Για να δηλώσετε ότι θέλετε να εγγραφείτε

Μετανάστευση Σπουδές. Σπουδές - Πανεπιστήμιο. Για να δηλώσετε ότι θέλετε να εγγραφείτε - Πανεπιστήμιο Θα ήθελα να εγγραφώ σε πανεπιστήμιο. Για να δηλώσετε ότι θέλετε να εγγραφείτε Tôi muốn ghi danh vào một trường đại học Θα ήθελα να γραφτώ για. Tôi muốn đăng kí khóa học. Για να υποδείξετε

Διαβάστε περισσότερα

BÀI TẬP. 1-5: Dòng phân cực thuận trong chuyển tiếp PN là 1.5mA ở 27oC. Nếu Is = 2.4x10-14A và m = 1, tìm điện áp phân cực thuận.

BÀI TẬP. 1-5: Dòng phân cực thuận trong chuyển tiếp PN là 1.5mA ở 27oC. Nếu Is = 2.4x10-14A và m = 1, tìm điện áp phân cực thuận. BÀI TẬP CHƯƠNG 1: LÝ THUYẾT BÁN DẪN 1-1: Một thanh Si có mật độ electron trong bán dẫn thuần ni = 1.5x10 16 e/m 3. Cho độ linh động của electron và lỗ trống lần lượt là n = 0.14m 2 /vs và p = 0.05m 2 /vs.

Διαβάστε περισσότερα

+ = k+l thuộc H 2= ( ) = (7 2) (7 5) (7 1) 2) 2 = ( ) ( ) = (1 2) (5 7)

+ = k+l thuộc H 2= ( ) = (7 2) (7 5) (7 1) 2) 2 = ( ) ( ) = (1 2) (5 7) Nhớm 3 Bài 1.3 1. (X,.) là nhóm => a X; ax= Xa= X Ta chứng minh ax=x Với mọi b thuộc ax thì b có dạng ak với k thuộc X nên b thuộc X => Với mọi k thuộc X thì k = a( a -1 k) nên k thuộc ax. Vậy ax=x Tương

Διαβάστε περισσότερα

Tối ưu tuyến tính. f(z) < inf. Khi đó tồn tại y X sao cho (i) d(z, y) 1. (ii) f(y) + εd(z, y) f(z). (iii) f(x) + εd(x, y) f(y), x X.

Tối ưu tuyến tính. f(z) < inf. Khi đó tồn tại y X sao cho (i) d(z, y) 1. (ii) f(y) + εd(z, y) f(z). (iii) f(x) + εd(x, y) f(y), x X. Tối ưu tuyến tính Câu 1: (Định lý 2.1.1 - Nguyên lý biến phân Ekeland) Cho (X, d) là không gian mêtric đủ, f : X R {+ } là hàm lsc bị chặn dưới. Giả sử ε > 0 và z Z thỏa Khi đó tồn tại y X sao cho (i)

Διαβάστε περισσότερα

Bài tập quản trị xuất nhập khẩu

Bài tập quản trị xuất nhập khẩu Bài tập quản trị xuất nhập khẩu Bài tập số 1: Anh (chị)hãy chỉ câu trả lời đúng sau đây theo INCOTERMS 2010: 1. Star.Co (Nhật Bản) ký HĐ mua gạo của Hope.Co (Việt Nam). Người mua có nghĩa vụ thuê tàu để

Διαβάστε περισσότερα

Thuật toán Cực đại hóa Kì vọng (EM)

Thuật toán Cực đại hóa Kì vọng (EM) Thuật toán Cực đại hóa Kì vọng (EM) Trần Quốc Long 1 1 Bộ môn Khoa học Máy tính Khoa Công nghệ Thông tin Trường Đại học Công nghệ Thứ Tư, 30/03/2016 Long (Đại học Công nghệ) Thuật toán EM 30/03/2016 1

Διαβάστε περισσότερα

Bài giảng Giải tích 3: Tích phân bội và Giải tích vectơ HUỲNH QUANG VŨ. Hồ Chí Minh.

Bài giảng Giải tích 3: Tích phân bội và Giải tích vectơ HUỲNH QUANG VŨ. Hồ Chí Minh. Bài giảng Giải tích 3: Tích phân bội và Giải tích vectơ HUỲNH QUANG VŨ Khoa Toán-Tin học, Đại học Khoa học Tự nhiên, Đại học Quốc gia Thành phố Hồ Chí Minh. E-mail: hqvu@hcmus.edu.vn e d c f 1 b a 1 TÓM

Διαβάστε περισσότερα

Tinh chỉnh lược đồ và các dạng chuẩn hoá

Tinh chỉnh lược đồ và các dạng chuẩn hoá Tinh chỉnh lược đồ và các dạng chuẩn hoá Bởi: Ths. Phạm Hoàng Nhung Thiết kế cơ sở dữ liệu mức khái niệm cung cấp cho chúng ta một tập các lược đồ quan hệ và các ràng buộc toàn vẹn, đây có thể được coi

Διαβάστε περισσότερα

Tứ giác BLHN là nội tiếp. Từ đó suy ra AL.AH = AB. AN = AW.AZ. Như thế LHZW nội tiếp. Suy ra HZW = HLM = 1v. Vì vậy điểm H cũng nằm trên

Tứ giác BLHN là nội tiếp. Từ đó suy ra AL.AH = AB. AN = AW.AZ. Như thế LHZW nội tiếp. Suy ra HZW = HLM = 1v. Vì vậy điểm H cũng nằm trên MỘT SỐ ÀI TOÁN THẲNG HÀNG ài toán 1. (Imo Shortlist 2013 - G1) ho là một tm giác nhọn với trực tâm H, và W là một điểm trên cạnh. Gọi M và N là chân đường co hạ từ và tương ứng. Gọi (ω 1 ) là đường tròn

Διαβάστε περισσότερα

XÂY DỰNG RUBRIC ĐỂ TỔ CHỨC VÀ ĐÁNH GIÁ QUÁ TRÌNH DẠY HỌC CÁC CHƯƠNG CHẤT KHÍ VÀ CƠ SỞ CỦA NHIỆT ĐỘNG LỰC HỌC - VẬT LÝ 10 CƠ BẢN

XÂY DỰNG RUBRIC ĐỂ TỔ CHỨC VÀ ĐÁNH GIÁ QUÁ TRÌNH DẠY HỌC CÁC CHƯƠNG CHẤT KHÍ VÀ CƠ SỞ CỦA NHIỆT ĐỘNG LỰC HỌC - VẬT LÝ 10 CƠ BẢN BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM THÀNH PHỐ HỒ CHÍ MINH NGUYỄN THANH LOAN XÂY DỰNG RUBRIC ĐỂ TỔ CHỨC VÀ ĐÁNH GIÁ QUÁ TRÌNH DẠY HỌC CÁC CHƯƠNG CHẤT KHÍ VÀ CƠ SỞ CỦA NHIỆT ĐỘNG LỰC HỌC - VẬT

Διαβάστε περισσότερα

có nghiệm là:. Mệnh đề nào sau đây đúng?

có nghiệm là:. Mệnh đề nào sau đây đúng? SỞ GD & ĐT TỈNH HƯNG YÊN TRƯỜNG THPT MINH CHÂU (Đề có 6 trng) ĐỀ THI THỬ THPT QG MÔN TOÁN LẦN NĂM HỌC 7-8 MÔN TOÁN Thời gin làm bài : 9 Phút; (Đề có câu) Họ tên : Số báo dnh : Mã đề 84 Câu : Bất phương

Διαβάστε περισσότερα

CHƯƠNG III NHIỆT HÓA HỌC 1. Các khái niệm cơ bản: a. Hệ: Là 1 phần của vũ trụ có giới hạn trong phạm vi đang khảo sát về phương diện hóa học.

CHƯƠNG III NHIỆT HÓA HỌC 1. Các khái niệm cơ bản: a. Hệ: Là 1 phần của vũ trụ có giới hạn trong phạm vi đang khảo sát về phương diện hóa học. CHƯƠNG III NHIỆT HÓA HỌC 1. Các khái niệm cơ bản: a. Hệ: Là 1 phần của vũ trụ có giới hạn trng phạm vi đang khả sát về phương diện hóa học. Phần còn lại của vũ trụ ba quanh hệ được gọi là môi trường ngài

Διαβάστε περισσότερα

Câu 2. Tính lim. A B. 0. C D Câu 3. Số chỉnh hợp chập 3 của 10 phần tử bằng A. C 3 10

Câu 2. Tính lim. A B. 0. C D Câu 3. Số chỉnh hợp chập 3 của 10 phần tử bằng A. C 3 10 ĐỀ THAM KHẢO THPT QUỐC GIA 8 MÔN TOÁN (ĐỀ SỐ ) *Biên soạn: Thầy Đặng Thành Nam website: wwwvtedvn Video bài giảng và lời giải chi tiết chỉ có tại wwwvtedvn Thời gian làm bài: 9 phút (không kể thời gian

Διαβάστε περισσότερα

BÁO CÁO BÀI TẬP LỚN CÁC BỘ BIẾN ĐỔI TĨNH

BÁO CÁO BÀI TẬP LỚN CÁC BỘ BIẾN ĐỔI TĨNH ĐẠI HỌC BÁCH KHOA ĐẠI HỌC QUỐC GIA TP HCM CHƯƠNG TRÌNH KS CLC VIỆT-PHÁP - - - - - - - - - - BÁO CÁO BÀI TẬP LỚN CÁC BỘ BIẾN ĐỔI TĨNH ĐỀ TÀI: THIẾT KẾ BỘ BIẾN ĐỔI DC/DC DẠNG BOOST GVHD:PGS TS PHAN QUỐC

Διαβάστε περισσότερα

1.5.2 Hai quá trình ngẫu nhiên quan trọng... 13

1.5.2 Hai quá trình ngẫu nhiên quan trọng... 13 Mục lục Lời nói đầu 5 1 Kiến thức chuẩn bị 7 1.1 Không gian L p và tính đo được.............. 7 1.2 Hàm biến phân bị chặn và tích phân Stieltjes...... 8 1.3 Không gian xác suất,biến ngẫu nhiên,lọc.........

Διαβάστε περισσότερα