d ụ: Bổ sung ữ liệu về giá và iện tích, số phịng tắm, số phịng ngủ của 14 căn
3.9.2. Biến giả nh ều thu ộc tính:
Số các lựa chọn cĩ thể cĩ của một biến định tính cĩ thể nhiều hơn hai. Ví dụ, đặt Y doanh số của một cơng ty, X là chi phí cho quảng cáo. Chúng ta kỳ vọng quan hệ giữa tiền tiết kiệm và thu nhập sẽ khác nhau theo các mùa khác nhau:
Với một đặc trưng cĩ m thuộc tính ta sẽ đặt m – 1 biến giả.
Ví dụ: Biến mùa vụ: 4 mùa: xuân, hạ, thu, đơng → 3 biến giả.
D1 = 1, nếu là mùa xuân
0, nếu khơng là mùa xuân
D2 = 1, nếu là mùa hạ
0, nếu khơng là mùa hạ
D3 = 1, nếu là mùa thu
0, nếu khơng là mùa thu
Yi : Doanh số,
Xi : Chi phí quảng cáo
Vậy phương trình hồi quy tổng quát:
Yi = 1 + 1D1i + 2D2i + 3D3i + 2Xi + 4Xi D1i + 5Xi D2i + 6Xi D3i + ui Vậy phương trình hồi quy cho từng mùa:
Mùa xuân: Yi = (1 + 1) + (2 + 4)Xi + ui Mùa hạ: Yi = (1 + 2) + (2 + 5)Xi + ui Mùa thu: Yi = (1 + 3) + (2 + 6)Xi + ui Mùa đơng: Yi = 1 + 2Xi + ui
2 32 3 2 3 C hư ơ ng IV ĐA CỘNG TUYẾN (Multicollinearity) 4.1. GIỚI T HIỆU:
Một trong những giả thiết của mơ hình hồi qui tuyến tính đa biến là khơng cĩ hiện tượng đa cộng tuyến hồn hảo. Vậy hiện tượng đa cộng tuyến, đa cộng tuyến hồn hảo là gì, nĩ sẽ ảnh hưởng như thế nào đến mơ hình và cách khắc phục hiện tượng này sẽ được trình bày ở chương này.
Hiện tượng đa cộng tuyến là hiện tượng các biến độc lập trong mơ hình phụ thuộc lẫn nhau và cĩ quan hệ gần như tuyến tính.
Hiện tượng đa cộng tuyến hồn hảo là hiện tượng các biến độc lập cĩ mối quan hệ tuyến tính chính xác (exact linear relationship) được thể hiện được dưới dạng hàm số tuyến tính.
1 + 2X2i + 3X3i + …+ kXki = 0
Ví dụ : Ước lượng hàm tiêu dùng. Y : Tiêu dùng, X2 : Thu nhập và X3 : của cải
X2 X3 Y 10 50 52 15 75 75 18 90 97 24 120 129 Dạng hàm: Yi = 1 + 2X2i + 3X3i + ui Yi = ˆ 1 + ˆ 2 X2i + ˆ 3 X3i + uˆ i
Theo dữ liệu ta thấy : X2 và X3 cĩ mối quan hệ tuyến tính chính xác
X3i - 5X2i = 0 ⇒ X3i = 5X2i
Vậy Yi = ˆ 1 + ˆ 2 X2i + ˆ 3 5X2i + uˆ i Yi = ˆ 1 + ( ˆ 2 + 5 ˆ 3 )X2i + uˆ i
Chúng ta chỉ cĩ thể ước lượng ( ˆ + 5 ˆ ) chứ khơng ước lượng riêng từng tham số
hồi qui ˆ và ˆ được.
Đa cộng tuyến hồn hảo thường rất ít khi xảy ra trong thực tế. Cịn đa cơng tuyến khơng hồn hảo thường hay xảy ra trong thực tế (Near collinearity)