Giả định liên hệ tuyến tính
Biểu đồ phân tán Scatter Plot giữa các phần dư chuẩn hóa và giá trị dự đoán chuẩn hóa giúp chúng ta dò tìm xem, dữ liệu hiện tại có vi phạm giả định liên hệ tuyến tính hay không. Trong nghiên cứu này, tác giả biểu diễn giá trị phần dư chuẩn hóa (Standardized Residual) ở trục hoành và giá trị dự đoán chuẩn hóa (Predicted Value) ở trục tung như sau:
Biểu đồ 4.1: Phân tán Scatter Plot
Kết quả điều tra cho thấy đồ thị có phần dư phân tán ngẫu nhiên trong vùng xung quanh đường thẳng qua hoành độ 0. Như vậy có thể kết luận là mô hình tuyến tính.
Giả định về phân phối chuẩn của phần dư
Phần dư có thể không tuân theo phân phối chuẩn vì nhiều lý do, sử dụng mô hình không đúng, phương sai không phải là hằng số, số lượng phần dư không đủ nhiều để phân tích (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2008). Trong phần này tác giả sử dụng biểu đồ Histogram, P – P để xem xét. Nhìn vào Hình 4.2 và Hình 4.3, giả định phần dư phân phối chuẩn của phần dư không bị vi phạm
Từ biểu đồ ta thấy được, một đường cong phân phối chuẩn được đặt chồng lên biểu đồ tần số. Đường cong này có dạng hình chuông, phù hợp với dạng đồ thị của phân phối chuẩn. Dựa vào đồ thị trên có thể nói phân phối chuẩn của phần dư xấp xỉ chuẩn (Mean=5.05E-15) và độ lệch chuẩn Std.Dev=0,989 tức là gần bằng 1. Do đó, có thể kết luận giả thiết phân phối chuẩn của phần dư không bị vi phạm.
B i ể u đ ồ 4 . 3 :
Biểu đồ 4.3: Biểu đồ tần số P-P plot
Kết quả từ biểu đồ tần số P-P plot cho thấy các điểm phân vị trong phân phối của phần dư tập trung thành một đường chéo, như vậy, giả định phân phối chuẩn của phần dư không bị vi phạm.
Giả định về tính độc lập của sai số (không có tự tương quan giữa các phần dư)
Tự tương quan là sự tương quan giữa các thành phần của chuỗi quan sát được sắp xếp theo thứ tự thời gian hoặc không gian. Có nhiều lý do dẫn đến hiện tượng tự tương quan như các biến có ảnh hưởng không được đưa hết vào mô hình do giới hạn và mục tiêu nghiên cứu, sai số trong đo lường các biến… điều này cũng gây ra những tác động sai lệch nghiêm trọng đến mô hình. Đại lượng thống kê Durbin – Watson có thể dùng để kiểm định tương quan của các sai số kề nhau.
Kiểm định giả thiết:
H0: hệ số tương quan tổng thể của các phần dư bằng 0 H1: hệ số tương quan tổng thể của các phần dư khác 0
Trong thực tế khi tiến hành kiểm định Durbin – Watson, người ta thường áp dụng quy tắc kiểm định đơn giản sau:
o Nếu 1< d< 3 thì kết luận mô hình không có tự tương quan
o Nếu 0 < d < 1 thì kết luận mô hình có tự tương quan dương
o Nếu 3 < d < 4 thì kết luận mô hình có tự tương quan âm
Giá trị Durbin Watson của nghiên cứu bằng 2.060 nằm trong khoản 1<d<3, do đó có thể kết luận mô hình không có tự tương quan.
Giả định không có mối tương quan giữa các biến độc lập (Đo lường đa cộng tuyến)
Trong mô hình hồi quy bội, tác giả đã giả định giữa các biến giải thích không có đa cộng tuyến tức là giữa các biến độc lập có tương quan chặt chẽ với nhau. Để kiểm tra hiện tượng đa cộng tuyến, một thước đo được sử dụng nhiều nhất là phân tử phóng đại phương sai VIF.
Độ chấp nhận của biến (Tolerance) là khá cao, bên cạnh đó hệ số phóng đại phương sai VIF đều thấp (cao nhất là 1,492) cho thấy các biến độc lập này có mối tương quan chặt chẽ với nhau, do vậy không xảy ra hiện tượng đa cộng tuyến trong mô hình, có thể yên tâm sử dụng mô hình hồi quy. Về quy tắc là khi VIF vượt quá 10 là có dấu hiệu của hiện tượng đa cộng tuyến (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2008).