7. Tổng quan tài liệu nghiên cứu
3.6.5. Kiểm định sự vi phạm các giả thuyết của mô hình
ạ Kiểm định sự tuyến tính của mô hình
Giả định đầu tiên là giả định liên hệ tuyến tính. Phƣơng pháp đƣợc sử dụng là biểu đồ phân tán Scatterplot với giá trị phần dƣ chuẩn hóa trên trục tung và giá trị dự đoán chuẩn hóa trên trục hoành.
Hình 3.2. Biểu đồ phân tán Scatterplot
Nhìn vào biểu đồ ta thấy phần dƣ không thay đổi theo một trật tự nào đối với giá trị dự đoán. Vậy giả thuyết về liên hệ tuyến tính không bị vi phạm.
b. Kiểm định hệ số tương quan
Nguyên nhân hiện tƣợng này có thể là do các biến có ảnh hƣởng không đƣợc đƣa hết vào mô hình do giới hạn và mục tiêu nghiên cứu, chọn mối liên hệ tuyến tính mà lẽ ra là phi tuyến, sai số trong đo lƣờng các biến ..., các lý do này có thể dẩn đến vấn đề tƣơng quan chuỗi trong sai số và tƣơng quan chuỗi cũng gây ra những tác động sai lệch nghiêm trọng đến mô hình hồi quy tuyến tính nhƣ hiện tƣợng phƣơng sai thay đổi . Đại lƣợng thông kê Dubin - Watson có thể dùng để kiểm định tƣơng quan nàỵ Nếu các phần dƣ không có tƣơng quan chuổi bậc nhất với nhau , giá trị d thƣờng bằng 2.
Dựa vào kết quả bảng Model Summaryf theo bảng 3.29 ở trên ta thấy giá trị d = 2.009 nghĩa là có thể chấp nhận giả định không có tƣơng quan giữa các phần dƣ.
c. Hiện tượng đa cộng tuyến
Cộng tuyến là trạng thái trong đó các biến độc lập có tƣơng quan chặt chẽ với nhaụ Vấn đề của hiện tƣợng này chúng cung cấp cho mô hình những thông tin rất giống nhau và rất khó tách rời ảnh hƣởng của từng biến một đến biến phụ thuộc; làm tăng độ lệch chuẩn của các hệ số hồi quy và làm giảm trị thống kê t của kiểm định ý nghĩa trong khi hệ số R square vẫn khá caọ
Trong mô hình hồi quy bội này giả định giữa các biến độc lập của mô hình không có hiện tƣợng đa cộng tuyến. Hiện tƣợng này sẽ đƣợc kiểm định thông qua hệ số phóng đại phƣơng sai VIF (Variance inflation factor). Khi VIF vƣợt quá 10, đó là dấu hiệu của đa cộng tuyến .
Bảng Coefficientsa theo bảng 3.28 nhƣ trên cho thấy hệ số phóng đại phƣơng sai (hệ số VIF) có giá trị đều nhỏ hơn 2 (tức nhỏ hơn 10) chứng tỏ không có hiện tƣợng đa cộng tuyến.
d. Các phần dư có phân phối chuẩn
Phần dƣ có thể không tuân theo phân phối chuẩn vì những lý do: Sử dụng mô hình không đúng, phƣơng sai không phải là hằng số, số lƣợng các phần dƣ không đủ nhiều để phân tích. Vì vậy, ta sử dụng nhiều cách khảo sát khác nhau để đảm bảo tính xác đáng của kiểm định. Trong nghiên cứu này sẽ sử dụng cách xây dựng biểu đồ tần số Histogram và biểu đồ P-P plot để khảo sát phân phối của phần dƣ.
Hình 3.3. Biểu đồ tần số Histogram
Biểu đồ tần số Histogram cho thấy một đƣờng cong phân phối chuẩn đƣợc đặt chồng lên biểu đồ tần số. Nhƣ vậy phân phối phần dƣ xấp xỉ chuẩn (giá trị trung bình gần bằng 0 và độ lệch chuẩn gần bằng 1 (= 0.987)),
nên có thể kết luận rằng giả thiết phân phối chuẩn không bị vi phạm nghĩa là các phần dƣ có phân phối chuẩn.
Hình 3.4. Đồ thị P-P plot
Nhìn vào đồ thị P-P plot biểu diễn các điểm quan sát thực tế tập trung khá sát đƣờng chéo những giá trị kỳ vọng, có nghĩa là dữ liệu phần dƣ có phân phối chuẩn .
Do đó có thể kết luận giả thuyết phân phối chuẩn của phần dƣ không bị vi phạm .