KẾT QUẢ NGHIÊN CỨU
4.6. Dò tìm sự vi phạm các giả định cần thiết trong hồi quy tuyến tính
Mô hình hồi quy tuyến tính bằng phương pháp Enter được thực hiện với một số giả định và mô hình chỉ thực sự có ý nghĩa khi các giả định này được đảm bảo. Do vậy, để đảm bảo cho độ tin cậy của mô hình, chúng ta còn phải thực hiện một loạt các dò tìm sự vi phạm các giả định cần thiết trong hồi quy tuyến tính.
Đầu tiên là giả định liên hệ tuyến tính. Phương pháp được sử dụng là biểu đồ Scatterplot với giá trị phần dư chuẩn hóa trên trục tung và giá trị dự đoán chuẩn hóa trên trục hoành. Nhìn vào biểu đồ ta thấy phần dư không thay đổi theo một trật tự nào đối với giá trị dự đoán. Vậy giả thuyết về liên hệ tuyến tính không bị vi phạm.
Giả định tiếp theo cần xem xét là phương sai của phần dư không đổi. Để thực hiện kiểm định này, chúng ta sẽ tính hệ số tương quan Spearman của giá trị tuyệt đối phần dư và các biến độc lập. Giá trị sig. của các hệ số tương quan với độ tin cậy 95% cho thấy ta không đủ cơ sở để bác bỏ giả thuyết H0
là giá trị tuyệt đối của phần dư độc lập với các biến độc lập. Như vậy, giả định về phương sai của sai số không đổi không bị vi phạm.
Để dò tìm sự vi phạm giả định phân phối chuẩn của phần dư ta sẽ dùng hai công cụ vẽ của phần mềm SPSS là biểu đồ Histogram và đồ thị P-
P plot. Nhìn vào biểu đồ Histogram (hình 4.2) ta thấy phần dư có phân phối chuẩn với giá trị trung bình gần bằng 0 và độ lệch chuẩn của nó gần bằng 1 (= 0.988). Nhìn vào đồ thị P-P plot biểu diễn các điểm quan sát thực tế tập trung khá sát đường chéo những giá trị kỳ vọng, có nghĩa là dữ liệu phần dư có phân phối chuẩn.
Hình 4.2. Biểu đồ Histogram
Hình 4.3 : Đồ thị Scatterplot
Giả định tiếp theo về tính độc lập của phần dư cũng cần được kiểm định. Ta dùng đại lượng thống kê Durbin-Watson (d) để kiểm định (Bảng 4.15). Đại lượng d này có giá trị từ 0 đến 4. Trong thực tế, khi tiến hành kiểm
định Durbin- Watson người ta thường áp dụng quy tắc kiểm định đơn giản như sau: nếu 1 < d < 3 thì kết luận mô hình không có tương quan; nếu 0 < d <1 thì kết luận mô hình có sự tương quan dương; nếu 3 < d < 4 thì kết luận mô hình có sự tương quan âm. Từ kết quả ở bảng 4.15 ta có 1< d =1.785 < 3 như vậy ta có thể kết luận các phần dư là độc lập với nhau và tính độc lập của phần dư đã được bảo đảm.
Cuối cùng, ta sẽ xem xét sự vi phạm đa cộng tuyến của mô hình. Ở phần phân tích hệ số tương quan ở trên, ta đã thấy rằng giữa biến phụ thuộc có quan hệ tương quan khá rõ với các biến độc lập nhưng ta cũng thấy được giữa các biến độc lập cũng có tương quan với nhau. Điều này sẽ tạo ra khả năng đa cộng tuyến của mô hình. Vì vậy, ta phải dò tìm hiện tượng đa cộng tuyến bằng cách tính độ chấp nhận của biến (Tolerance) và hệ số phóng đại phương sai (Variance inflation factor - VIF). Độ chấp nhận trong trường hợp này của bảy biến trong mô hình khá cao, đều lớn hơn 0.5 trong khi hệ số VIF khá thấp đa số nhỏ hơn 10 (bảng 4.17). Với hệ số VIF nhỏ hơn 10 ta có thể bác bỏ giả thuyết mô hình bị đa cộng tuyến.
Như vậy mô hình hồi quy tuyến tính được xây dựng theo phương trình ở trên là không vi phạm các giả định cần thiết trong hồi quy tuyến tính.