CHƯƠNG 2 : CỞ SỞ LÝ THUYẾT
4.5. Phân tích hồi quy tuyến tính
4.5.1.5. Dị tìm sự vi phạm các giả định cần thiết trong hồi quy tuyến tính
Mơ hình hồi quy tuyến tính bằng phương pháp OSL được thực hiện với một số giả
định và mơ hình chỉ thực sự có ý nghĩa khi các giả định này được đảm bảo. Do vậy, để đảm bảo cho độ tin cậy của mơ hình, chúng ta cịn phải thực hiện một loạt các dị
tìm sự vi phạm các giả định cần thiết trong hồi quy tuyến tính.
Giả định đầu tiên là giả định liên hệ tuyến tính. Phương pháp được sử dụng là biểu đồ phân tán Scatterplot với giá trị phần dư chuẩn hóa trên trục tung và giá trị dự đốn chuẩn hóa trên trục hồnh. Nhìn vào biểu đồ ta thấy phần dư không thay đổi
theo một trật tự nào đối với giá trị dự đoán. Vậy giả thuyết về liên hệ tuyến tính
Chương 4: Kết quả nghiên cứu 60
Giả định tiếp theo cần xem xét là phương sai của phần dư không đổi. Để thực hiện kiểm định này, chúng ta sẽ tính hệ số tương quan hạng Spearman của giá trị tuyệt
đối phần dư và các biến độc lập. Giá trị sig. của các hệ số tương quan với độ tin cậy
95% cho thấy ta không đủ cơ sở để bác bỏ giả thuyết Ho là giá trị tuyệt đối của phần dư độc lập với các biến độc lập. Như vậy, giả định về phương sai của sai số không
đổi không bị vi phạm.
Để dị tìm sự vi phạm giả định phân phối chuẩn của phần dư ta sẽ dùng hai công cụ
vẽ của phần mềm SPSS là biểu đồ Histogram và đồ thị Q-Q plot. Nhìn vào biểu đồ Histogram ta thấy phần dư có phân phối chuẩn với giá trị trung bình gần bằng 0 và
độ lệch chuẩn của nó gần bằng 1 (=0.985). Nhìn vào đồ thị Q-Q plot biểu diễn các điểm quan sát thực tế tập trung khá sát đường chéo những giá trị kỳ vọng, có nghĩa
là dữ liệu phần dư có phân phối chuẩn.
Giả định tiếp theo về tính độc lập của phần dư cũng cần được kiểm định. Ta dùng đại lượng thống kê Durbin-Watson (d) để kiểm định. Đại lượng d này có giá trị từ 0 đến 4. Tra bảng thống kê Durbin-Watson với số mẫu quan sát bằng 205 và số biến độc lập là 6 ta có du = 1.831. Như vậy, đại lượng d nằm trong khoảng (du, 4 – du)
hay (1.831, 2.169) thì ta có thể kết luận các phần dư là độc lập với nhau. Với dữ liệu thơng kê ta có được d = 2.017 và như vậy các tính độc lập của phần dư đã được bảo
đảm.
Cuối cùng, ta sẽ xem xét sự vi phạm đa cộng tuyến của mơ hình. Ở phần phân tích hệ số tương quan ở trên, ta đã thấy rằng giữa biến phụ thuộc có quan hệ tương quan khá rõ với các biến độc lập nhưng ta cũng thấy được giữa các biến độc lập cũng có tương quan với nhau. Điều này sẽ tạo ra khả năng đa cộng tuyến của mơ hình. Vì vậy, ta phải dị tìm hiện tượng đa cộng tuyến bằng cách tính độ chấp nhận của biến (Tolerance) và hệ số phóng đại phương sai (Variance inflation factor – VIF). Độ chấp nhận trong trường hợp này của bốn biến trong mơ hình khá cao, đều lớn hơn
Chương 4: Kết quả nghiên cứu 61
0.5 trong khi hệ số VIF khá thấp đều dưới 2. Hệ số VIF nhỏ hơn 10 là ta có thể bác bỏ giả thuyết mơ hình bị đa cộng tuyến.
Như vậy mơ hình hồi quy tuyến tính được xây dựng theo phương trình (4.4) khơng vi phạm các giả định cần thiết trong hồi quy tuyến tính.