- Dữ liệu về doanh thu biến động có tính chu kì theo năm, trong 1 năm thì doanh thu quý I thấp nhất, quý IV cao nhất.
Ước lượng lại mô hình (1) là:
Y = 36.672 + 0.416X2 + 0.104X3 + e
Bài 4.15
1. Viết mô hình hồi quy tuyến tính tổng thể của Y phụ thuộc X2, X3, X4:
2. Xét xem có hiện tượng đa cộng tuyến trong mô hình đó không? Nêu rõ cách phát hiện của bạn.
>cor(data.frame(X2,X3,X4))
Hệ số tương quan tuyến tính giữa X3 và X4 là: r34 = 0.8477 > 0.8 X3, X4 có mối liên hệ tuyến tính rất mạnh.
PRF (1) có đa cộng tuyến rất mạnh. 3. Bỏ biến:
Bước 1: Giữ lại X4 vì X4 có quan trọng trong mô hình. Bước 2: Xét bỏ lần lượt X2,X3
• Bỏ X2: Khi đó mô hình trở thành: PRF: Y = B1 + B3X3 + B4X4 + U (2)
Hệ số tương quan tuyến tính giữa X3 và X4 là: r34 = 0.8477 > 0.8 PRF (2) có đa cộng tuyến rất mạnh.
Bỏ biến X2 không khắc phục được đa cộng tuyến.
• Bỏ X3:
PRF: Y = B1 + B2X2 + B4X4 + U (3)
Hệ số tương quan tuyến tính giữa X2 và X4 là: r24 = -0.28 << 0.8 Không còn đa cộng tuyến trong mô hình (3).
Bỏ X3 khắc phục được đa cộng tuyến
Vậy ta chọn bỏ X3. Như đã chỉ ra ở trên, mô hình sau khi bỏ biến X3 không còn đa cộng tuyến nữa.
4. Thay B5=-0.5 vào PRF (1) ta được: Y= B1 + B2X2 + B3X3 -0.5X4 + U
Đặt Y+0.5X4 = Y*
Y* = B1 + B2X2 + B3X3 + U (4)
Hệ số tương quan tuyến tính giữa X2, X3 là r23 = -0.357 <<0.8 rất thấp Không có DCT trong mô hình (4)
Dùng mô hình (4) để ước lượng các hệ số B1, B2, B4:
> Ysao=Y+0.5*X4 > lm(Ysao~X2+X3) Call: lm(formula = Ysao ~ X2 + X3) Coefficients: (Intercept) X2 X3 43.15682 -0.28829 0.05381 SRF của (4) là: Y* = 43.16 – 0.29X2 + 0.05X3 + e Ước lượng cho B1 là: 43.16 Ước lượng cho B2 là: -0.29 Ước lượng cho B3 là: 0.05
Bài 4.16. Cho tập số liệu OTO.txt trong đó: