Phân tích hồi quy không phải chỉ là việc mô tả các dữ liệu quan sát đƣợc. Từ các kết quả quan sát đƣợc trong mẫu, ta phải suy rộng kết luận cho mối liên hệ giữa các biến trong tổng thể. Sự chấp nhận và diễn dịch kết quả hồi quy không thể tách rời các giả định cần thiết và những chuẩn đoán về sự vi phạm các giả định đó. Nếu các giả định bị vi phạm thì các kết quả ƣớc lƣợng đƣợc không đáng tin cậy nữa. (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2005).
Vì vậy, ta cần thực hiện kiểm định các giả thiết cần thiết trong mô hình hồi quy có vi phạm hay không gồm các giả định sau:
a) Kiểm định hiện tượng đa cộng tuyến:
Nếu hiện tƣợng đa cộng tuyến xuất hiện thì có thể sẽ dẫn đến hậu quả nghiêm trọng trong phân tích hồi quy nhƣ kiểm định t không có ý nghĩa, dấu của các ƣớc lƣợng hệ số hồi quy có thể sai… Do đó, trong mô hình hồi quy bội, chúng ta giả định là giữa các biến độc lập không có hiện tƣợng đa cộng tuyến và chỉ số thƣờng đƣợc dùng để kiểm tra hiện tƣợng này là hệ số phóng đại phƣơng sai VIF (Variance Inflation Fator). VIF càng nhỏ thì hiện tƣợng đa cộng tuyến càng giảm. Trong thực tế, chỉ số VIF nhỏ hơn 2 là chấp nhận đƣợc. Kết quả kiểm định đa cộng tuyến của mô hình cho thấy hệ số VIF của các biến độc lập nhỏ hơn 2 (Bảng 3.23). Điều này chứng
tỏ các biến độc lập của mô hình nghiên cứu không có tƣơng quan hoàn toàn với nhau và hiện tƣợng đa cộng tuyến không xảy ra trong mô hình này.
b) Giả định về phân phối chuẩn của phần dư:
Hình 3.9: Biểu đồ tần số của phần dƣ chuẩn hóa
Phần dƣ có thể không tuân theo phân phối chuẩn vì nhiều lý do: mô hình không đúng, số lƣợng phần dƣ không đủ nhiều để phân tích, phƣơng sai không phải là hằng số…(Hoàng Trọng & Mộng Ngọc, 2008, 228). Biểu đồ tần số của phần dƣ chuẩn hóa và biểu đồ tần số P-P thƣờng đƣợc sử dụng để kiểm định phân phối chuẩn.
Hình 3.9 cho thấy một đƣờng cong phân phối chuẩn đƣợc đặt chồng lên biểu đồ tần suất. Có thể nói phân phối phần dƣ xấp xỉ chuẩn với độ lệch chuẩn Std.Dev = 0.985 (tức gần bằng 1).
Ngoài ra, thông qua đồ thị P-P plot (Hình 3.10) cho thấy các điểm quan sát không phân tán quá xa đƣờng thẳng kỳ vọng. Do đó ta có thể kết luận rằng giả thiết phân phối chuẩn không bị vi phạm.
c) Giả định phương sai của phần dư không đổi
Theo Hoàng Trọng & Chu Nguyễn Mộng Ngọc (2008) hiện tƣợng phƣơng sai của phần dƣ thay đổi có thể làm cho các ƣớc lƣợng của hệ số hồi quy không chệch nhƣng không hiệu quả (tức là không phải ƣớc lƣợng phù hợp nhất), từ đó làm cho kiểm định các giả thuyết mất hiệu lực khiến chúng ta đánh giá nhầm về chất lƣợng của mô hình hồi quy tuyến tính.
Đồ thị phân tán ở hình 3.11 cho thấy phần dƣ phân tán ngẫu nhiên xung quanh đƣờng đi qua tung độ 0 chứ không tạo nên hình dạng nào. Nhƣ vậy, giả định về phƣơng sai không đổi của mô hình không bị vi phạm.
d) Giả định về tính độc lập của phần dư
Để đảm bảo mô hình hồi quy có ý nghĩa thì cần phải thỏa mãn một giả định nữa là các phần dƣ độc lập lẫn nhau hay nói cách khác không có sự tƣơng quan giữa các phần dƣ. Phƣơng pháp kiểm định ý nghĩa nhất là kiểm định Dubin – Watson (d). Nếu 0 < d < 1 thì kết luận mô hình có sự tƣơng quan dƣơng; nếu 1 < d < 3 thì kết luận mô hình không có sự tƣơng quan; nếu 3 < d < 4 thì kết luận mô hình có sự tƣơng quan âm. Quan sát kiểm định Dubin-Watson của mô hình nghiên cứu ta thấy hệ số Dubin-Watton của mô hình nghiên cứu (Bảng 3.21) có giá trị d = 2.033 (lớn hơn 1 và nhỏ hơn 3), do đó có thể kết luận là không có sự tƣơng quan giữa các phần dƣ.
e) Giả định liên hệ tuyến tính:
Phƣơng pháp đƣợc sử dụng là đồ thị phân tán Scatterplot với giá trị phần dƣ chuẩn hóa trên trục tung và giá trị dự báo chuẩn hóa trên trục hoành. Nếu giả định liên hệ tuyến tính và phƣơng sai bằng nhau đƣợc thỏa mãn, thì ta sẽ không nhận thấy có liên hệ gì giữa các giá trị dự đoán và phần dƣ, chúng sẽ phân tán rất ngẫu nhiên. Nhận xét đồ thị phân tán Scatterplot (Hình 3.11) trên đây ta nhận thấy phần dƣ phân tán ngẫu nhiên trong một vùng xung quanh đƣờng đi qua tung độ 0. Nhƣ vậy, giả định liên hệ tuyến tính của mô hình không bị vi phạm.