Kiểm tra giả định liên hệ tuyến tính: Phƣơng pháp đƣợc sử dụng là đồ thị
Scatterplot với giá trị phần dƣ chuẩn hóa (Standardized Residual) trên trục tung và giá trị dự đoán chuẩn hóa (Standardized Predicted Value) trên trục hoành. Nếu giả định liên hệ tuyến tính và phƣơng sai bằng nhau đƣợc thỏa mãn, thì ta sẽ không nhận thấy có liên hệ gì giữa các giá trị dự đoán và phần dƣ, chúng sẽ phân tán rất ngẫu nhiên (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008, tập 1, trang 224).
Quan sát hình 4.1, ta thấy các phần dƣ phân tán ngẫu nhiên chứ không tạo thành một hình dạng nào. Điều này có nghĩa là giả định liên hệ tuyến tính không bị vi phạm. i e DU TC HH PV CT Yˆ 0,734 0,135 0,085 0,071 0,07
59
Hình 4.1. Đồ thị phân tán Scatterplot
Nguồn: Kết quả phân tích dữ liệu khảo sát của đề tài
Kiểm tra giả định về phân phối chuẩn của phần dƣ: Phần dƣ có thể không
tuân theo phân phối chuẩn vì những lý do nhƣ: Sử dụng sai mô hình, phƣơng sai không phải là hằng số, số lƣợng các phần dƣ không đủ nhiều để phân tích… (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008, tập 1, trang 228). Chúng ta sẽ sử dụng các biểu đồ tần số (Histogram, P-P plot) của các phần dƣ (đã đƣợc chuẩn hóa) để kiểm tra giả định này.
Kết quả biểu đồ tần số Histogram của phần dƣ đƣợc thể hiện trong Hình 4.2 cho thấy phân phối phần dƣ xấp xỉ chuẩn (trung bình Mean = 9,54*10-7 gần bằng 0 và độ lệch chuẩn Std. Dev. = 0,988 tức là gần bằng 1). Điều này có nghĩa là giả định về phân phối chuẩn của phần dƣ không bị vi phạm.
60
Hình 4.2. Đồ thị tần số Histogram
Nguồn: Kết quả phân tích dữ liệu khảo sát của đề tài
Kết quả biểu đồ tần số P-P plot đƣợc thể hiện trong Hình 4.3 cho thấy các điểm quan sát không phân tán quá xa đƣờng thẳng kỳ vọng, nên ta có thể kết luận là phƣơng sai của sai số không đổi.
Hình 4.3. Đồ thị tần số P-P plot
Nguồn: Kết quả phân tích dữ liệu khảo sát của đề tài
Kiểm tra giả định về tính độc lập của sai số (không có tƣơng quan gi ữa các
phần dƣ): Ta dùng đại lƣợng thống kê Durbin-Watson (d) để kiểm định tƣơng quan
của các sai số kề nhau (tƣơng quan chuỗi bậc nhất). Giả thuyết khi tiến hành kiểm định này là: H0: Hệ số tƣơng quan tổng thể của các phần dƣ bằng 0
61
H1: Hệ số tƣơng quan tổng thể của các phần dƣ khác 0
Đại lƣợng d có giá trị biến thiên trong khoảng từ 0 đến 4. Nếu các phần dƣ không có tƣơng quan chuỗi bậc nhất với nhau, giá trị d sẽ gần bằng 2 (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008, tập 1, trang 232-233). Theo kết quả từ Bảng 4.8, giá trị d = 1,724< 2 có nghĩa là giá trị d tính đƣợc rơi vào miền chấp nhận giả thuyết không có tƣơng quan chuỗi bậc nhất. Nhƣ vậy, ta có thể kết luận là không có tƣơng quan giữa các phần dƣ.
Kiểm tra giả định không có mối tƣơng quan gi ữa các biến độc lập (đo
lƣờng đa cộng tuyến): Cộng tuyến là trạng thái trong đó các biến độc lập có tƣơng
quan chặt chẽ với nhau (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008, tập 1, trang 235). Các công cụ chuẩn đoán giúp ta phát hiện sự tồn tại của cộng tuyến trong dữ liệu và đánh giá mức độ cộng tuyến làm thoái hóa các tham số đƣợc ƣớc lƣợng là: Độ chấp nhận của biến (Tolerance), hệ số phóng đại phƣơng sai (Variance Inflation Factor - VIF). Nếu độ chấp nhận của một biến nhỏ, thì nó gần nhƣ là một kết hợp tuyến tính của các biến độc lập khá, và đó là dấu hiệu của đa cộng tuyến. Hệ số phóng đại phƣơng sai VIF là nghịch đảo của độ chấp nhận biến (Tolerance). Khi Tolerance nhỏ thì VIF lớn, quy tắc là khi VIF vƣợt quá 10, đó là dấu hiệu của đa cộng tuyến (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008, tập 1, trang 251 - 252).
Nhìn kết quả từ Bảng 4.10 cho thấy, các hệ số phóng đại phƣơng sai VIF của các biến độc lập khá nhỏ (1< 2), trong khi đó hệ số VIF của một biến độc lập lớn hơn 10 mới đƣợc xem là có hiện tƣợng đa cộng tuyến. Do đó, ta có thể bác bỏ giả thuyết mô hình đa cộng tuyến. Điều này có nghĩa là không có mối tƣơng quan giữa các biến độc lập hoặc không có hiện tƣợng đa cộng tuyến.
Nhƣ vậy, mô hình hồi quy bội đƣợc xây dựng không vi phạm các giả định cần thiết trong hồi quy tuyến tính.