Mô hình hồi quy tuyến tính bội được sử dụng để phân tích mối quan hệ giữa một biến phụ thuộc với nhiều biến độc lập. Ở nghiên cứu này, phân tích hồi quy tuyến tính bội được thực hiện để xem xét sự tương quan giữa các biến, kiểm định các giả định của mô hình hồi quy và phân tích hồi quy.
Xem xét sự tương quan giữa các biến:
Sử dụng hệ số Pearson để xem xét các mối quan hệ tương quan tuyến tính giữa biến phụ thuộc với biến độc lập, cũng như giữa các biến độc lập với nhau. Nếu hệ số tương quan giữa biến phụ thuộc với các biến độc lập lớn, chứng tỏ giữa chúng có mối quan hệ với nhau và phân tích hồi quy tuyến tính có thể phù hợp. Mặt khác, nếu giữa các biến độc lập cũng có tương quan lớn với nhau thì đó cũng là dấu hiệu
cho biết giữa chúng có thể xảy ra hiện tượng đa cộng tuyến (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008).
Kiểm định các giả định của mô hình hồi quy:
Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008), sự chấp nhận và diễn dịch kết quả hồi quy không thể tách rời các giả định cần thiết và sự chẩn đoán về sự vi phạm các giả định. Nếu các giả định bị vi phạm thì các kết quả ước lượng được không đáng tin cậy nữa. Vì thế, để đảm bảo sự diễn dịch từ kết quả hồi quy của mẫu cho tổng thể có giá trị, cần phải tiến hành kiểm định các giả định của hàm hồi quy. Bao gồm:
+ Giả định liên hệ tuyến tính và phương sai của phần dư không đổi: Phương pháp được sử dụng là biểu đồ phân tán Scatter plot với giá trị phần dư chuẩn hóa trên trục tung và giá trị dự đoán chuẩn hóa trên trục hoành. Nếu giả định liên hệ tuyến tính và phương sai bằng nhau được thỏa mãn, thì ta sẽ không nhận thấy có liên hệ gì giữa các giá trị dự đoán và phần dư, chúng sẽ phân tán rất ngẫu nhiên (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008, trang 224).
+ Giả định về phân phối chuẩn của phần dư: Phần dư có thể không tuân theo phân phối chuẩn vì những lý do: sử dụng mô hình không đúng, phương sai không phải là hằng số, số lượng các phần dư không đủ nhiều để phân tích. Vì vậy, ta sử dụng nhiều cách khảo sát khác nhau để đảm bảo tính xác đáng của kiểm định (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008, trang 228). Nghiên cứu này sẽ sử dụng cách xây dựng biểu đồ tần số Histogram và PP plot để khảo sát phân phối của phần dư.
+ Giả định về tính độc lập của sai số (không có tương quan giữa các phần dư): Nguyên nhân hiện tượng này có thể là do các biến có ảnh hưởng không được đưa hết vào mô hình do giới hạn và mục tiêu nghiên cứu, chọn mối liên hệ tuyến tính mà lẽ ra là phi tuyến, sai số trong đo lường các biến,… Các lý do này có thể dẫn đến vấn đề tương quan chuỗi trong sai số và tương quan chuỗi cũng gây ra những tác động sai lệch nghiêm trọng đến mô hình hồi qui tuyến tính như hiện
tượng phương sai thay đổi. Đại lượng thống kê DurbinWatson có thể dùng để kiểm định tương quan này (Hoàng Trọng và Chu Nguyễn Mộng Ngọc, 2008, trang 232).
+ Giả định không có mối tương quan giữa các biến độc lập (đo lường đa cộng tuyến): Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008, trang 235, 252), cộng tuyến là trạng thái trong đó các biến độc lập có tương quan chặt chẽ với nhau. Vấn đề của hiện tượng này là chúng cung cấp cho mô hình những thông tin rất giống nhau và rất khó tách rời ảnh hưởng của từng biến một đến biến phụ thuộc; làm tăng độ lệch chuẩn của các hệ số hồi qui và làm giảm trị thống kê t của kiểm định mức ý nghĩa trong khi hệ số R Square vẫn khá cao. Ta có thể kiểm tra hiện tượng đa cộng tuyến thông qua hệ số phóng đại phương sai VIF (Variance Inflation Factor).
Phân tích hồi quy:
Nếu các giả định không bị vi phạm thì mô hình hồi quy tuyến tính bội được xây dựng. Phương trình hồi quy có dạng:
Y = β0 + β1*X1 + β2*X2 + β3*X3 + … + βi*Xi
Trong đó: Y là biến phụ thuộc;
Xi là các biến độc lập; β0 là hằng số;
βi là các hệ số hồi qui (i > 0).
Khi tiến hành phân tích hồi quy tuyến tính bội, cần lưu ý:
+ Phương pháp đưa biến vào phân tích hồi quy tuyến tính bội là phương pháp đưa các biến vào mô hình một lượt (phương pháp Enter).
+ Kiểm tra hệ số xác định đã được điều chỉnh (Ajusted R Square) để xem xét mức độ phù hợp của mô hình hồi quy tuyến tính bội. Hệ số xác định đã được điều chỉnh (Ajusted R Square) được sử dụng để phản ánh sát hơn mức độ phù hợp của
mô hình tuyến tính bội vì nó không phụ thuộc vào độ lệch phóng đại của R Square (Nguyễn Đình Thọ, 2011).
+ Kiểm định F trong phân tích phương sai là một phép kiểm định giả thuyết về độ phù hợp của mô hình tuyến tính tổng thể. Nếu giả thuyết H0 của kiểm định F bị bác bỏ thì có thể kết luận mô hình hồi quy tuyến tính bội phù hợp với tập dữ liệu và có thể sử dụng được (Nguyễn Đình Thọ, 2011).