Phân tích hồi quy tuyến tính để biết được cường độ tác động của các biến độc lập lên biến phụ thuộc. Từ đó, kiểm tra được độ thích hợp của mô hình, xây dựng mô hình hồi quy bội, kiểm định các giả thuyết. Vấn đề chấp nhận và diễn giải các kết quả hồi quy được xem xét trong mối liên hệ với các giả thuyết nghiên cứu. Do đó mà trong phân tích hồi quy bội có kiểm định các giả thuyết của hàm hồi quy, nếu như các giả thuyết đó bị vi phạm thì các kết quả ước lượng các tham số trong hàm hồi quy không đạt được giá trị tin cậy. Tiêu chuẩn của đánh giá khi thực hiện phân tích hồi quy bội
(Hoàng Trọngvà Chu Nguyễn Mộng Ngọc,2008), bao gồm:
• Đánh giá sự phù hợp của mô hình: Thông qua thước đo RP
2
Pđiều chỉnh (Adjusted R square) để phản ánh sát hơn mức độ phù hợp của mô hình hồi quy tuyến tính đa biến. Dùng RP
2
P
để đánh giá độ phù hợp của mô hình sẽ an toàn hơn vì nó không thổi phồng mức độ phù hợp của mô hình. (Hoàng Trọng và Chu Nguyện Mộng Ngọc,
2008)
• Kiểm định độ phù hợp của mô hình: Kiểm định F sử dụng để xem xét mối quan hệ giữa biến phụ thuộc Y có mối liên hệ tuyến tính với toàn bộ tập biến hay không bằng chỉ số ý nghĩa sig. Nếu chỉ số sig. < 0.05 tức là kết hợp của các biến hiện có
trong mô hình có thể giải thích được thay đổi của biến Y, tức mô hình xây dựng phù
hợp với tập dữ liệu. (Hoàng Trọng và Chu Nguyện Mộng Ngọc, 2008)
• Xác định tầm quan trọng của các biến trong mô hình: Có 2 vấn đề cần quan tâm khi xác định tầm quan trọng tương đối của từng biến độc lập trong mô hình hồi quy tuyến tính bội, đó là:
- Tầm quan trọng của từng biến độc lập khi chúng tác động riêng biệt, và
- Tiếp theo là tầm quan trọng của các biến độc lập khi chúng được sử dụng cùng với những biến khác trong mô hình hồi quy bội.
Vấn đề thứ nhất được giải quyết thông qua hệ số tương quan giữa các biến độc lập và biến phụ thuộc, trị tuyệt đối của các hệ số tương quan càng lớn thì liên hệ tuyến tính càng mạnh. Vấn đề thứ hai thông qua hệ số tương quan từng phần và tương
quan riêng (Part and partial correlations). (Hoàng Trọng và Chu Nguyện Mộng
• Dò tìm sự vi phạm các giả định cần thiết trong hồi quy tuyến tính:
- Giả định liên hệ tuyến tính: Sử dụng đồ thị phân tán giữa các phần dư và giá trị dự đoán mà mô hình tuyến tính đưa ra. Nếu giả định liên hệ tuyến tính và phương sai bằng nhau được thỏa mãn, thì sẽ không nhận thấy mối liên hệ nào giữa các giá trị dự đoán và phần dư, chúng sẽ phân tán ngẫu nhiên.
- Giả định phương sai của sai số không đổi: Sử dụng kiểm định Breusch Godfrey
(BG) với giả thuyết được đặt ra là phương sai của sai số không thay đổi, nếu giả thuyết này đúng thì giá trị p value lớn hơn 0.05.
- Giả định về phân phối chuẩn của phần dư: Sử dụng biểu đồ tần số Histogram và biểu đồ tần số P-P plot, nếu các chấm phân tán sát với đường chéo, phân phối phần dư có thể xem như chuẩn.
- Giả định về tính độc lập của sai số (không có tương quan giữa các phần dư): giả định về sai số thực eRiR cho đây là biến ngẫu nhiên, độc lập, có phân phối chuẩn với trung bình bằng 0 và phương sai không đổi. Sử dụng đại lượng thống kê
Durbin – Watson (d) với giả thuyết đặt ra là: hệ số tương quan tổng thể của các
phần dư bằng 0. Nếu các phần dư không có tương quan chuỗi bậc nhất với nhau thì giá trị d nằm trong khoảng (dRUR; 4-dRUR).
- Dò tìm đa cộng tuyến: Các công cụ để phát hiện sự tồn tại của cộng tuyến trong dữ liệu và đánh giá mức độ cộng tuyến là thoái hóa các tham số được ước lượng: Độ chấp nhận của biến (Tolerance) – nếu độ chấp nhận của một biến nhỏ, thì có thể có một sự kết hợp tuyến tính của các biến khác giải thích biến độc lập trên. Hệ số phóng đại phương sai (VIF), khi VIF vượt quá 10 đó là dấu hiệu của đa cộng tuyến.