Phân tích hồi quy không phải chỉ là việc mô tả các dữ liệu quan sát được. Từ các kết quả quan sát được trong mẫu, ta phải suy rộng kết luận cho mối quan hệ giữa các biến trong tổng thể. Sự chấp nhận và diễn dịch kết quả hồi quy không thể tách rời các giả định cần thiết và sự chẩn đoán về sự vi phạm các giả định đó. Nếu các giả định bị vi phạm, thì các kết quả ước lượng được không đáng tin cậy nữa.
Vì vậy, để diễn dịch từ kết quả hồi quy của mẫu cho tổng thể có giá trị, trong phần này sẽ tiến hành kiểm định các giả định của hàm hồi quy bao gồm các giả định sau:
- Không có hiện hiện đa cộng tuyến
- Phương sai của phần dư không đổi
- Các phần dư có phân phối chuẩn
4.3.2.1 Giả định mô hình không có hiện tượng đa cộng tuyến
Hiện tượng đa cộng tuyến là các biến độc lập có tương quan chặt chẽ với nhau. Đa cộng tuyến sẽ gây khó khăn trong việc phân tích sự ảnh hưởng của từng biến độc lập lên biến phụ thuộc. Vấn đề của hiện tượng này là chúng cung cấp cho mô hình những thông tin rất giống nhau, rất khó tách rời ảnh hưởng của từng biến một đến biến phụ thuộc; làm tăng độ lệch chuẩn của hệ số hồi quy và làm giảm trị thống kê t của kiểm định mức ý nghĩa trong khi hệ số R square vẫn khá cao.
Ở phần phân tích hệ số tương quan giữa các biến độc lập với biến phụ thuộc và giữa các biến độc lập với nhau, ta thấy rằng giữa các biến phụ thuộc có quan hệ tương quan với các biến độc lập và cũng như giữa các biến độc lập cũng có mối tương quan với nhau. Nếu mối tương quan khá chặt sẽ dễ dẫn đến hiện tượng đa cộng tuyến của mô hình. Vì vậy, chúng ta phải dò tìm hiện tượng đa cộng tuyến bằng cách tính độ chấp nhận của biến (Tolerance) và hệ số phóng đại phương sai (VIF). Chỉ khi VIF vượt quá 2, thì mô hình mới xảy ra hiện tượng đa cộng tuyến (Hoàng Trọng - Chu Nguyễn Mộng Ngọc, 2008)
Hiện tượng phương sai của phần dư thay đổi có thể làm cho các ước lượng của hệ số hồi quy không chệch nhưng không hiệu quả (tức không phải ước lượng phù hợp nhất). Từ đó làm cho kiểm định các giả thuyết mất hiệu lực khiến chúng ta đánh giá nhầm về chất lượng mô hình hồi quy.
Để biết được mô hình có bị hiện tượng phương sai thay đổi, chúng ta có thể dùng đồ thị Scatter Plot để giải thích. Qua biểu đồ 4.1 ta nhận thấy giá trị phần dư phân tán ngẫu nhiên xung quanh đường đi qua tung độ 0 chứ không theo hình dạng nào. Như vậy, giả định phương sai không đổi của mô hình không bị vi phạm.
Biểu đồ 4.1 Đồ thị phân tán Scatter Plot
Scatterplot Dependent Variable: SHL
Regression standardized Predicted Value
(Nguồn: Kết quả phân tích SPSS)
4.3.2.3 Giả định phân phối chuẩn phần dư
Phần dư có thể không tuân theo phân phối chuẩn vì những lý do sau: sử dụng sai mô hình, phương sai không phải là hằng số, số lượng các phần dư không đủ nhiều để phân tích,... Vì vậy, chúng ta thực hiện nhiều cách khác nhau để dò tìm vi phạm. Nghiên cứu thực hiện khảo sát phân phối chuẩn của phần dư bằng cách xây dựng biểu đồ tần số Histogram và biểu đồ Q-Q plot.
Nhìn vào biểu đồ Histogram ta thấy phần dư có dạng gần với phân phối chuẩn, giá trị trung bình gần bằng 0 và độ lệch chuẩn gần bằng 1 (cụ thể là 0.991) nên không vi phạm giả thiết biến phụ thuộc có phân bố chuẩn theo mỗi giá trị biến độc lập.
Tổng độ lệch bình phương df Độ lệch bình phương F Sig. 1 Regressio n 82.627 6 13.771 122.556 .000 b Residual 38.542 343 .112 Total 121.169 349
Biểu đồ 4.2 Biểu đồ tần số Histogram
Histogram
Mean = -1 39E-15 Std. Dev. = 0.991 N = 350
(Nguồn: Kết quả phân tích SPSS)
Biểu đồ Q-Q plot cũng cho ta thấy các điểm quan sát thực tế tập trung khá sát đường chéo những giá trị kỳ vọng, có nghĩa là phần dư có phân phối chuẩn.
Như vậy, từ biểu đồ tần số Histogram và biểu đồ Q-Q plot ta có thể kết luận rằng giả thiết phân phối chuẩn không bị vi phạm.
Biểu đồ 4.3 Biểu đồ Q-Q plot
(Nguồn: Kết quả phân tích SPSS)