CHƢƠNG 4 : PHÂN TÍCH KẾT QUẢ NGHIÊN CỨU
4.3 Phân tích nhân tố khám phá (EFA)
4.4.2.3 Dị tìm sự vi phạm các giả định cần thiết trong hồi quy tuyến
Scatterplot với giá trị phần dư chuẩn hóa (Standardized Residual) trên trục tung và giá trị dự đốn chuẩn hóa (Standardized Predicted Value) trên trục hoành. Nếu giả định liên hệ tuyến tính và phương sai bằng nhau được thỏa mãn, thì ta sẽ khơng nhận thấy có liên hệ gì giữa các giá trị dự đoán và phần dư, chúng sẽ phân tán rất ngẫu nhiên (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008, tập 1, trang 224).
Quan sát hình 4.1, ta thấy các phần dư phân tán ngẫu nhiên chứ khơng tạo thành một hình dạng nào. Điều này có nghĩa là giả định liên hệ tuyến tính khơng bị vi phạm.
Hình 4.1: Đồ thị phân tán Scatterplot
Kiểm tra giả định về phân phối chuẩn của phần dƣ: Phần dư có thể khơng tn theo phân phối chuẩn vì những lý do như: sử dụng sai mơ hình, phương sai khơng phải là hằng số, số lượng các phần dư không đủ nhiều để phân tích… (Hồng Trọng và Chu Nguyễn Mộng Ngọc, 2008, tập 1, trang 228). Chúng ta sẽ sử dụng các biểu đồ tần số (Histogram, P-P plot) của các phần dư (đã được chuẩn hóa) để kiểm tra giảđịnh này.
Kết quả biểu đồ tần số Histogram của phần dư được thể hiện trong Hình 4.2 cho thấy phân phối phần dư xấp xỉ chuẩn (trung bình Mean = 9,54*10-7 gần bằng 0 và độ lệch chuẩn Std. Dev. = 0,988 tức là gần bằng 1). Điều này có nghĩa là giả định về phân phối chuẩn của phần dư không bị vi phạm.
Hình 4.2: Đồ thị tần số Histogram
(Nguồn: Kết quả phân tích dữ liệu khảo sát của tác giả)
Kết quả biểu đồ tần số P-P plot được thể hiện trong Hình 4.3 cho thấy các điểm quan sát không phân tán quá xa đường thẳng kỳ vọng, nên ta có thể kết luận là giảđịnh về phân phối chuẩn của phần dư khơng bị vi phạm.
Hình 4.3: Đồ thị tần số P-P plot
(Nguồn: Kết quả phân tích dữ liệu khảo sát của tác giả)
Kiểm tra giả định về tính độc lập của sai số (khơng có tƣơng quan giữa các phần dƣ): Ta dùng đại lượng thống kê Durbin-Watson (d) để kiểm định tương quan của các sai số kề nhau (tương quan chuỗi bậc nhất). Giả thuyết khi tiến hành kiểm định này là:
H0: hệ sốtương quan tổng thể của các phần dư = 0
Đại lượng d có giá trị biến thiên trong khoảng từ0 đến 4. Nếu các phần dư khơng có tương quan chuỗi bậc nhất với nhau, giá trị d sẽ gần bằng 2 (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008, tập 1, trang 232-233). Theo kết quả từ Bảng 4.13, giá trị d = 1,913 < 2 có nghĩa là giá trịd tính được rơi vào miền chấp nhận giả thuyết khơng có tương quan chuỗi bậc nhất. Như vậy, ta có thể kết luận là khơng có tương quan giữa các phần dư.
Kiểm tra giả định khơng có mối tƣơng quan giữa các biến độc lập (đo lƣờng Đa cộng tuyến): Cộng tuyến là trạng thái trong đó các biến độc lập có tương quan chặt chẽ với nhau (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008, tập 1, trang 235). Các cơng cụ chuẩn đốn giúp ta phát hiện sự tồn tại của cộng tuyến trong dữ liệu và đánh giá mức độ cộng tuyến làm thối hóa các tham số được ước lượng là: Độ chấp nhận của biến (Tolerance), hệ sốphóng đại phương sai (Variance Inflation Factor - VIF). Nếu độ chấp nhận của một biến nhỏ, thì nó gần như là một kết hợp tuyến tính của các biến độc lập khá, và đó là dấu hiệu của Đa cộng tuyến. Hệ số phóng đại phương sai VIF là nghịch đảo của độ chấp nhận biến (Tolerance). Khi Tolerance nhỏ thì VIF lớn, quy tắc là khi VIF vượt quá 10, đó là dấu hiệu của Đa cộng tuyến (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008, tập 1, trang 251 - 252).
Nhìn kết quả từ Bảng 4.15 cho thấy, các hệ sốphóng đại phương sai VIF của các biến độc lập khá nhỏ, cao nhất là 1,572 < 2, trong khi đó hệ số VIF của một biến độc lập > 10 mới được xem là có hiện tượng đa cộng tuyến. Do đó, ta có thể bác bỏ giả thuyết mơ hình đa cộng tuyến. Điều này có nghĩa là khơng có mối tương quan giữa các biến độc lập hoặc khơng có hiện tượng đa cộng tuyến.
Như vậy, mơ hình hồi quy bội được xây dựng không vi phạm các giả định cần thiết trong hồi quy tuyến tính.