1. Tính cấp thiết của đề tài
4.6 Kiểm định các giả định cần thiết trong hồi quy tuyến tính
Mô hình hồi quy tuyến tính bằng phương pháp Enter được thực hiện với một số giả định và mô hình chỉ thực sự có ý nghĩa khi các giả định này được đảm bảo. Do vậy, để đảm bảo cho độ tin cậy của mô hình, đề tài còn phải thực hiện một loạt các dò tìm sự vi phạm các giả định cần thiết trong hồi quy tuyến tính.
Giả định liên hệ tuyến tính và phương sai không đổi:
Nếu giả định tuyến tính được thỏa mãn (đúng) thì phần dư phải phân tán ngẫu nhiên trong một vùng xung quanh đường đi qua tung độ 0 của đồ thị phân tán của phần dư chuẩn hóa (Standardized Residual) và giá trị dự đoán chuẩn hóa (Standardized Predicted Value). Và nếu phương sai không đổi thì các phần dư phải phân tán ngẫu
58
nhiên quanh trục 0 (tức quanh giá trị trung bình của phần dư) trong một phạm vi không đổi (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2005).
Giả định liên hệ tuyến tính
Phương pháp được sử dụng là biểu đồ Scatterplot (hình 4.2) với giá trị phần dư chuẩn hóa trên trục tung và giá trị dự đoán chuẩn hóa trên trục hoành. Nhìn vào biểu đồ ta thấy phần dư không thay đổi theo một trật tự nào đối với giá trị dự đoán. Vậy giả thuyết về liên hệ tuyến tính không bị vi phạm.
Hình 4.1. Biểu đồ Scatterplot Giả định phương sai của phần dư không đổi
Để thực hiện kiểm định này, chúng ta sẽ tính hệ số tương quan hạng Spearman của giá trị tuyệt đối phần dư và các biến độc lập. Giá trị sig. của các hệ số tương quan với độ tin cậy 95% cho thấy không đủ cơ sở để bác bỏ giả thuyết H0 là giá trị tuyệt đối của phần dư độc lập với các biến độc lập. Như vậy, giả định về phương sai của sai số không đổi không bị vi phạm.
Để dò tìm sự vi phạm giả định phân phối chuẩn của phần dư ta sẽ dùng hai công cụ vẽ của phần mềm SPSS là biểu đồ Histogram và đồ thị P-P plot. Nhìn vào
59
biểu đồ Histogram (Hình 4.3) ta thấy phần dư có phân phối chuẩn với giá trị trung bình Mean = -3,95E-15, gần bằng 0 và độ lệch chuẩn của nó gần bằng 1 (Std. Dev. = 0,981). Do đó, có thể kết luận rằng giả thuyết phân phối chuẩn không bị vi phạm (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2005).
Nhìn vào đồ thị P-P plot (Hình 4.3) biểu diễn các điểm quan sát thực tế tập trung khá sát đường chéo những giá trị kỳ vọng, có nghĩa là dữ liệu phần dư có phân phối chuẩn. Dựa vào đồ thị phân tán của phần dư chuẩn hóa và giá trị dự đoán chuẩn hóa cho thấy các giá trị dự đoán chuẩn hóa và phần dư phân tán chuẩn hóa phân tán ngẫu nhiên trong một vùng xung quanh đường đi qua tung độ 0. Như vậy, giả định liên hệ tuyến tính và phương sai không thay đổi thỏa mãn.
60
Hình 4.3. Biểu đồ P-Plot Giả định về tính độc lập của phần dư
Ta dùng đại lượng thống kê Durbin-Watson (d) để kiểm định. Đại lượng d này có giá trị từ 0 đến 4. Trong thực tế, khi tiến hành kiểm định Durbin-Watson người ta thường áp dụng quy tắc kiểm định đơn giản như sau: nếu 1 < d < 3 thì kết luận mô hình không có tương quan; nếu 0 < d <1 thì kết luận mô hình có sự tương quan dương; nếu 3 < d < 4 thì kết luận mô hình có sự tương quan âm. Từ kết quảở bảng 3.23 ta có 1< d =2,009 < 3 như vậy ta có thể kết luận các phần dư là độc lập với nhau và tính độc lập của phần dư đã được bảo đảm. Vậy không có tương quan chuỗi bậc nhất giữa các phần dư, giả định về tính độc lập của các sai số được đảm bảo.
Giả định về đa cộng tuyến của mô hình
Ở phần phân tích hệ số tương quan ở trên, ta đã thấy rằng giữa biến phụ thuộc có quan hệ tương quan khá rõ với các biến độc lập nhưng ta cũng thấy được giữa các biến độc lập cũng có tương quan với nhau. Điều này sẽ tạo ra khả năng đa cộng tuyến của mô hình. Vì vậy, ta phải dò tìm hiện tượng đa cộng tuyến bằng cách tính độ chấp nhận của biến (Tolerance) và hệ số phóng đại phương sai (Variance inflation factor - VIF).
61
VIF< 5: Hiện tượng đa cộng tuyến giữa các biến độc lập ảnh hưởng không đáng kể đến mô hình. VIF >5: Hiện tượng đa cộng tuyến giữa các biến độc lập ảnh hưởng đáng kể đến mô hình
Mô hình cũng đáp ứng điều kiện về phần dư, phần dư có phân phối xấp xỉ chuẩn (trung bình Mean = -3,95E-15, độ lệch chuẩn Std.Dev = 0,981).
Đại lượng thống kê Durbin-Watson (d) = 2,009 nên các phần dư trong mẫu không có tương quan với nhau.
Như vậy mô hình hồi quy tuyến tính được xây dựng theo phương trình ở trên là không vi phạm các giả định cần thiết trong hồi quy tuyến tính. Để đánh giá độ phù hợp của mô hình ta sẽ dùng các công cụ như tính hệ số xác định hiệu chỉnh Adjusted R Square, kiểm định F và kiểm định t.
4.7 Kiểm định sự khác nhau về quyết định chọn giữa các nhóm du khách 4.7.1 Kiểm định sự khác biệt theo giới tính