CHƯƠNG 4 : Kết quả nghiên cứu thực nghiệm
4.4 Phân tích hồi quy đa biến
4.4.2.3 Dị tìm sự vi phạm các giả định cần thiết trong hồi quy tuyến
Kiểm tra giả định liên hệ tuyến tính: phương pháp được sử dụng là đồ thị Scatterplot với giá trị phần dư chuẩn hóa (Standardized Residual) trên trục tung và giá trị dự đốn chuẩn hóa (Standardized Predicted Value) trên trục hồnh. Nếu giả định liên hệ tuyến tính và phương sai bằng nhau được thỏa mãn, thì ta sẽ khơng nhận thấy có liên hệ gì giữa các giá trị dự đoán và phần dư, chúng sẽ phân tán rất ngẫu nhiên (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008).
Quan sát hình 4.1 ta thấy các phần dư phân tán ngẫu nhiên chứ khơng tạo thành một hình dạng nào. Điều này có nghĩa là giả định liên hệ tuyến tính khơng bị vi phạm.
Hình 4.1: Đồ thị phân tán Scatterplot
Kiểm tra giả định về phân phối chuẩn của phần dư: phần dư có thể không tuân theo phân phối chuẩn vì những lý do như: sử dụng sai mô hình, phương sai không phải là hằng số, số lượng các phần dư khơng đủ nhiều đề phân tích,... Chúng ta sẽ sử dụng các biểu đồ tần số (Histogram, P-P plot) của các phần dư (đã được chuẩn hóa) để kiểm tra giả định này.
Kết quả biểu đồ tần số Histogram của phần dư được thể hiện trong hình 4.2
cho thấy phân phối phần dư xấp xỉ chuẩn (trung bình Mean = 7,70*-16 gần bằng 0 và
độ lệch chuẩn Std Dev. = 0,991 tức là gần bằng 1). Điều này có nghĩa là giả định về phân phối chuẩn của phần dư khơng bị vi phạm.
Hình 4.2: Đồ thị tần số Histogram
Kết quả biểu đồ tần số P-P plot được thể hiện trong Hình 4.3 cho thấy các điểm quan sát không phân tán quá xa đường thẳng kỳ vọng, nên ta có thể kết luận là giả định về phân phối chuẩn của phần dư không bị vi phạm.
Kiểm tra giả định về tính độc lập của sai số (khơng có tương quan giữa các phần dư): ta dùng đại lượng thống kê Durbin-Waston (d) để kiểm định tương quan của các sai số kề nhau (tương quan chuỗi bậc nhất). Giả thuyết khi tiến hành kiểm định này là:
Ho: hệ số tương quan tổng thể của các phần dư = 0
Đại lượng d có giá trị biến thiên trong khoảng từ 0 đến 4. Nếu các phần dư khơng có tương quan chuỗi bậc nhất với nhau, giá trị d sẽ gần bằng 2 (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008). Theo kết quả từ Bảng 4.10, cho kết quả giá trị d = 1,753 < 2 có nghĩa là giá trị d tính được rơi vào miền chấp nhận giả thuyết khơng có tương quan chuỗi bậc nhất. Như vậy, ta có thể kết luận là khơng có tương quan giữa các phần dư.
Kiểm tra giả định khơng có mối tương quan giữa các biến độc lập (đo lường đa cộng tuyến). Cộng tuyến là trạng thái trong đó các biến độc lập có tương quan chặt chẽ với nhau (Hồng Trọng và Chu Nguyễn Mộng Ngọc, 2008). Các công cụ chẩn đốn giúp ta phát hiện sự tờn tại của cộng tuyến trong dữ liệu và đánh giá mức độ cộng tuyến làm thối hóa các tham số được ước lượng là: độ chấp nhận của biến (Tolerance), hệ số phóng đại phương sai (Variance Inflation Factor – VIF). Nếu độ chấp nhận của một biến nhỏ, thì nó gần như là một kết hợp tuyến tính của các biến độc lập khá, và quy tắc là khi VIF vượt quá 10 đó là dấu hiệu của đa cộng tuyến.
Nhìn kết quả từ Bảng 4.12 cho thấy, các hệ số phóng đại phương sai VIF của các biến độc lập khá nhỏ, cao nhất là 1,579 < 2 (trong khi hệ số VIF của một biến độc lập > 10 mới được xem là có hiện tượng đa cộng tuyến). Điều này có nghĩa là khơng có mối tương quan giữa các biến độc lập trong mơ hình.
Như vậy, mơ hình hời quy đa biến được xây dựng không vi phạm các giả định cần thiết trong hời quy tuyến tính.
4.5 Kiểm định các giả thuyết nghiên cứu liên quan yếu tố nhân khẩu học về ý định tập thể dục thường xuyên ở phụ nữ mang thai tại TP. HCM