Phân tích hồi quy không phải chỉ là việc mô tả các dữ liệu quan sát được. Từ các kết quả quan sát được trong mẫu, ta phải suy rộng kết luận cho mối liên hệ giữa các biến trong tổng thể. Sự chấp nhận và diễn dịch kết quả hồi quy không thể tách rời các giả định cần thiết và những chuẩn đoán về sự vi phạm các giả định đó. Nếu các giả định bị vi phạm thì các kết quả ước lượng được không đáng tin cậy nữa (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2005).
Vì vậy, ta cần thực hiện kiểm định các giả thiết cần thiết trong mô hình hồi quy có vi phạm hay không gồm các giả định sau:
- Giả định liên hệ tuyến tính: Phương pháp được sử dụng là đồ thị phân tán
Scatterplot với giá trị phần dư chuẩn hóa trên trục tung và giá trị dự báo chuẩn hóa trên trục hoành. Nếu giả định liên hệ tuyến tính và phương sai bằng nhau được thỏa mãn, thì ta sẽ không nhận thấy có liên hệ gì giữa các giá trị dự đoán và phần dư, chúng sẽ phân tán rất ngẫu nhiên. Nhận xét biểu đồ phân tán Scatterplot (Biểu đồ 4.8) dưới đây ta nhận thấy phần dư phân tán ngẫu nhiên trong một vùng xung quanh đường đi qua tung độ 0. Như vậy, giả định liên hệ tuyến tính của mô hình không bị vi phạm.
Nguồn: Kết quả xử lý trên Phần mềm SPSS 18.0
Biểu đồ 4.1: Biểu đồ phân tán
- Giả định phương sai của sai số không đổi: Nhận xét biểu đồ phân tán
Scatterplot (Biểu đồ 4.8) trên đây ta nhận thấy phần dư phân tán ngẫu nhiên quanh trục 0 (tức quanh giá trị trung bình của phần dư) trong một phạm vi không đổi. Như vậy, giả định phương sai của của sai số không đổi không bị vi phạm.
Để thực hiện kiểm định này, chúng ta sẽ tính hệ số tương quan hạng Spearman của giá trị tuyệt đối phần dư và các biến độc lập. Giá trị sig. của các hệ số tương quan với độ tin cậy 95% cho thấy không đủ cơ sở để bác bỏ giả thuyết H0 là giá trị tuyệt đối của phần dư độc lập với các biến độc lập. Như vậy, giả định về phương sai của sai số không đổi không bị vi phạm.
- Giả định về phân phối chuẩn của phần dư: Để khảo sát sự vi phạm về giả định
phân phối chuẩn của phần dư, sử dụng biểu đồ Histogram và biểu đồ P-P plot trong phân tích SPSS. Biểu đồ Histogram (Biểu đồ 4.9) cho thấy một đường cong phân phối chuẩn được đặt chồng lên biểu đồ tần số. Phân phối phần dư xấp xỉ chuẩn hóa (trung bình Mean gần bằng 0 và độ lệch chuẩn Std..Dev = 0,988 tức là gần bằng 1). Ngoài ra, nhìn vào đồ thị P-P plot (Biểu đồ 4.10), kết quả cho thấy các điểm quan sát không phân tán quá xa đường thẳng kỳ vọng. Do đó, có thể kết luận rằng giả thiết phân phối chuẩn không bị vi phạm.
Nguồn: Kết quả xử lý trên Phần mềm SPSS 18.0
Biểu đồ 4.2: Biểu đồ Histogram
Nguồn: Kết quả xử lý trên Phần mềm SPSS 18.0
Biểu đồ 4.3: Biểu đồ P-P Plot
- Giả định về tính độc lập của sai số (hay không có tương quan giữa các phần dư): Ta dùng đại lượng thống kê Durbin-Watson (d) để kiểm định (Bảng 4.15). Đại
lượng d có giá trị từ 0 đến 4. Trong thực tế, khi tiến hành kiểm định Durbin-Watson người ta thường áp dụng quy tắc kiểm định đơn giản như sau:
Nếu 1 < d < 3 thì mô hình không có tương quan.
Nếu 0 < d <1 thì mô hình có sự tương quan dương.
Từ kết quả ở bảng 4.16 ta có 1< (d =1,09) < 3 như vậy có thể kết luận các phần dư là độc lập với nhau và tính độc lập của phần dư đã được đảm bảo.
- Giả định không có mối tương quan giữa các biến độc lập (Đo lường đa cộng tuyến): Ở phần phân tích hệ số tương quan ở trên, ta thấy rằng giữa biến phụ thuộc có
quan hệ tương quan khá rõ với các biến độc lập nhưng ta cũng thấy được giữa các biến độc lập cũng có tương quan với nhau. Điều này sẽ tạo ra khả năng đa cộng tuyến của mô hình, vì vậy ta phải dò tìm hiện tượng đa cộng tuyến bằng cách tính Độ chấp nhận của biến (Tolerance) và Hệ số phóng đại phương sai VIF (Variance Inflation Factor). Độ chấp nhận trong trường hợp này của các biến trong mô hình khá cao, đều lớn hơn 0,5 trong khi hệ số VIF khá thấp và nhỏ hơn 5 (bảng 4.17). Với hệ số VIF nhỏ hơn 5 ta có thể bác bỏ giả thuyết mô hình bị đa cộng tuyến (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2005).
Như vậy mô hình hồi quy tuyến tính được xây dựng theo phương trình ở trên là không vi phạm các giả định cần thiết trong hồi quy tuyến tính.