6. Tổng quan tài liệu nghiên cứu
3.3.1. Dò tìm sự vi phạm các giả định trong hồi quy tuyến tính
- Giả định liên hệ tuyến tính
Phƣơng pháp đƣợc sử dụng để kiểm tra giả định liên hệ tuyến tính là biểu đồ phân tán Scatterplot. Ta sử dụng phần mềm SPSS để vẽ biểu đồ này và kết quả cho thấy phần dƣ phân tán ngẫu nhiên trong vùng xung quanh đƣờng đi qua tung độ 0 nhƣ hình vẽ và không tạo theo một trật tự nào đối với giá trị dự đoán. Vì vậy giả định về liên hệ tuyến tính không bị vi phạm.
Hình 3.7: Biếu đồ phân tán Scatterplot (tổng) - Giả định về phân phối chuẩn của phần dƣ
Để xem phần dƣ có tuân theo phân phối chuẩn hay không ta xây dựng biểu đồ tần số Histogram và biểu đồ Q-Q plot để khảo sát phân phối chuẩn của phần dƣ. Sử dụng phần mềm SPSS để vẽ hai biểu đồ này và kết quả cho
thấy trên đồ thị Histogram ta thấy Mean = -7.34* 10-15 gần bằng 0 và độ lệch
chuẩn là 0.986 gần bằng 1. Bên cạnh đó tại biểu đồ Q-Q plot, các chấm phân tán sát với đƣờng chéo. Nhƣ vậy, phân phối phần dƣ có thể xem nhƣ phân phối chuẩn hay giả thuyết phân phối chuẩn không bị vi phạm.
Giá trị dự đoán chuẩn hóa
Ph
ần dƣ c
hu
ẩn
Hình 3.8: Biểu đồ tần số Histogram (tổng)
Hình 3.9: Biểu đồ Q-Q plot (tổng) - Phát hiện hiện tƣợng tự tƣơng quan
Khi phân tích hồi quy tổng dữ liệu ban đầu cho kết quả hệ số Durbin- Watson d= 1.875 (xem phụ lục 1), với kích cỡ mẫu n= 400 và số biến độc lập là 11, tra bảng thống kê Durbin-Watson với mức ý nghĩa 5% ta có dl=1.654
Phần dƣ chuẩn hóa T ần s ố Phân ph ối chu ẩn k ỳ v ọng
và du= 1.885, dl<d<du, nhƣ vậy chƣa đủ cơ sở để kết luận không có hiện tƣợng tự tƣơng quan. Ta sử dụng phần mềm Eview để tiến hành thêm kiểm định Breusch-Godfrey bậc 1 (xem phụ lục 1), thu đƣợc giá trị P-value =0.2174 > 0.05 nên mô hình không có hiện tƣợng tự tƣơng quan bậc 1.
- Phát hiện hiện tƣợng đa cộng tuyến
Theo Huy và Anh (2012) hệ số phóng đại phƣơng sai nhỏ hơn 10 sẽ không có hiện tƣợng đa cộng tuyến. Kết quả phân tích hồi quy tổng dữ liệu ban đầu có hệ số nhân tử phóng đại phƣơng sai VIF (Xi) < 4 (xem thêm phụ lục 1) nên kết luận không có hiện tƣợng đa cộng tuyến .
- Phát hiện hiện tƣợng phƣơng sai của sai số thay đổi
Sử dụng phần mềm Eview để tiến hành kiểm định White, ta thu đƣợc giá trị P-value=0.000<0.05 nên mô hình đã tồn tại hiện tƣợng phƣơng sai sai số thay đổi (xem phụ lục1).
Ta tiến hành khắc phụ hiện tƣợng phƣơng sai sai số thay đổi khi không
biết σi
2
, ta dùng Feasible Generalized Least Squares (FGLS- ƣớc lƣợng bình phƣơng tối thiểu tổng quát khả thi) và thực hiện theo trƣờng phái Glejser
(1969) với trọng số 1/ǀ Phần dƣǀ ) (Trần Đức Luân, 2009). Ta tiếp tục kiểm
tra hiện tƣợng phƣơng sai sai số thay đổi bằng kiểm định White (xem phụ lục1), ta thấy giá trị P-value=0.2204>0.05, nhƣ vậy hiện tƣợng phƣơng sai sai số không đồng nhất đã khắc phục hay mô hình không còn vi phạm giả định phƣơng sai sai số đồng nhất.
Nhƣ vậy, theo nhƣ phân tích ở trên mô hình không có hiện tƣợng đa cộng tuyến, không tồn tại hiện tƣợng tự tƣơng quan và có phƣơng sai của sai số đồng nhất. Phần dƣ có phân phối chuẩn. Giả định về liên hệ tuyến tính không bị vi phạm.