Phân tích hồi quy không phải chỉ là việc mô tả các dữ liệu quan sát được. Từ các kết quả quan sát được trong mẫu, ta phải suy rộng kết luận cho mối liên hệ giữa các biến trong tổng thể. Sự chấp nhận và diễn dịch kết quả hồi quy không thể tách rời các giả định cần thiết và những chuẩn đoán về sự vi phạm các giả định đó. Nếu các giả định bị vi phạm thì các kết quả ước lượng được không đáng tin cậy nữa. (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2005).
Vì vậy, ta cần thực hiện kiểm định các giả thiết cần thiết trong mô hình hồi quy có vi phạm hay không gồm các giả định sau:
a) Kiểm định hiện tượng đa cộng tuyến:
Nếu hiện tượng đa cộng tuyến xuất hiện thì có thể sẽ dẫn đến hậu quả nghiêm trọng trong phân tích hồi quy như kiểm định t không có ý nghĩa, dấu của các ước lượng hệ số hồi quy có thể sai… Do đó, trong mô hình hồi quy bội, chúng ta giả định là giữa các biến độc lập không có hiện tượng đa cộng tuyến và chỉ số thường được dùng để kiểm tra hiện tượng này là hệ số phóng đại phương sai VIF (Variance Inflation Fator). VIF càng nhỏ thì hiện tượng đa cộng tuyến càng giảm. Trong thực tế, chỉ số VIF nhỏ hơn 2 là chấp nhận được. Kết quả kiểm định đa cộng tuyến của mô hình cho thấy hệ số VIF của các biến độc lập nhỏ hơn 2 (Bảng 3.23). Điều này chứng tỏ các biến độc lập của mô hình nghiên cứu không có tương quan hoàn toàn với nhau và hiện tượng đa cộng tuyến không xảy ra trong mô hình này.
Hình 3.10. Biểu đồ tần số của phần dư chuẩn hóa
Hình 3.11. Biểu đồ tần số P – P
Phần dư có thể không tuân theo phân phối chuẩn vì nhiều lý do: mô hình không đúng, số lượng phần dư không đủ nhiều để phân tích, phương sai không phải là hằng số…(Hoàng Trọng & Mộng Ngọc, 2008, 228). Biểu đồ tần số của phần dư chuẩn hóa và biểu đồ tần số P-P thường được sử dụng để kiểm định phân phối chuẩn.
Hình 3.10 cho thấy một đường cong phân phối chuẩn được đặt chồng lên biểu đồ tần suất. Có thể nói phân phối phần dư xấp xỉ chuẩn với độ lệch chuẩn Std.Dev = 0.992 (tức gần bằng 1).
Ngoài ra, thông qua đồ thị P-P plot (Hình 3.11) cho thấy các điểm quan sát không phân tán quá xa đường thẳng kỳ vọng. Do đó ta có thể kết luận rằng giả thiết phân phối chuẩn không bị vi phạm.
c) Giả định phương sai của phần dư không đổi
Theo Hoàng Trọng & Chu Nguyễn Mộng Ngọc (2008) hiện tượng phương sai của phần dư thay đổi có thể làm cho các ước lượng của hệ số hồi quy không chệch nhưng không hiệu quả (tức là không phải ước lượng phù hợp nhất), từ đó làm cho kiểm định các giả thuyết mất hiệu lực khiến chúng ta đánh giá nhầm về chất lượng của mô hình hồi quy tuyến tính.
Đồ thị phân tán ở hình 3.12 cho thấy phần dư phân tán ngẫu nhiên xung quanh đường đi qua tung độ 0 chứ không tạo nên hình dạng nào. Như vậy, giả định về phương sai không đổi của mô hình không bị vi phạm.
Hình 3.12. Đồ thị phân tán Scatterplot
d) Giả định về tính độc lập của phần dư
Để đảm bảo mô hình hồi quy có ý nghĩa thì cần phải thỏa mãn một giả định nữa là các phần dư độc lập lẫn nhau hay nói cách khác không có sự tương quan giữa các phần dư. Phương pháp kiểm định ý nghĩa nhất là kiểm định Dubin – Watson (d). Nếu 0 < d <1 thì kết luận mô hình có sự tương quan dương; nếu 1<d<3 thì kết luận mô hình không có sự tương quan; nếu 3 < d < 4 thì kết luận mô hình có sự tương quan âm.
Quan sát kiểm định Dubin-Watson của mô hình nghiên cứu ta thấy hệ số Dubin-Watton của mô hình nghiên cứu (Bảng 3.21) có giá trị d = 1.471 (lớn hơn 1 và nhỏ hơn 3), do đó có thể kết luận là không có sự tương quan giữa các phần dư.
e) Giả định liên hệ tuyến tính:
Phương pháp được sử dụng là đồ thị phân tán Scatterplot với giá trị phần dư chuẩn hóa trên trục tung và giá trị dự báo chuẩn hóa trên trục hoành. Nếu giả định liên hệ tuyến tính và phương sai bằng nhau được thỏa mãn, thì ta sẽ không nhận thấy có liên hệ gì giữa các giá trị dự đoán và phần dư, chúng sẽ phân tán rất ngẫu nhiên. Nhận xét đồ thị phân tán Scatterplot (Hình 3.12) trên đây ta nhận thấy phần dư phân tán ngẫu nhiên trong một vùng xung quanh đường đi qua tung độ 0. Như vậy, giả định liên hệ tuyến tính của mô hình không bị vi phạm.