Xây dựng mô hình hồi quy đa biến: mô hình hồi quy đa biến là một trong những mô hình thống kê được sử dụng phổ biến trong kiểm định lý thuyết khoa học (kiểm
định mô hình nghiên cứu và các giả thuyết nghiên cứu). Khi sử dụng mô hình hồi quy đa biến chúng ta cần chú ý đến sự phù hợp của mô hình và kiểm trả các giả định của nó.
- Các tiêu chí trong hồi quy đa biến:
+ Giá trị Sig của kiểm định F được sử dụng để kiểm định độ phù hợp của mô hình hồi quy. Nếu sig nhỏ hơn 0.05, ta kết luận mô hình hồi quy tuyến tính phù hợp với tập dữ liệu và có thể sử dụng được.
+ Giá trị R2 (R Square), R2 hiệu chỉnh (Adjusted R Square) phản ánh mức độ giải thích biến phụ thuộc của các biến độc lập trong mô hình hồi quy. R2 hiệu chỉnh phản ánh sát hơn so với R2. Mức dao động của 2 giá trị này là từ 0 đến 1.
+ Trị số Durbin – Watson (DW) dùng để kiểm tra hiện tượng tự tương quan chuỗi bậc nhất (kiểm định tương quan của các sai số kề nhau). Theo Field (2009), nếu DW nhỏ hơn 1 và lớn hơn 3, chúng ta cần thực sự lưu ý bởi khả năng rất cao xảy ra hiện tượng tự tương quan chuỗi bậc nhất. Theo Yahua Qiao (1999), thường giá trị DW nằm trong khoảng 1.5 – 2.5 sẽ không xảy ra hiện tượng tự tương quan.
+ Giá trị sig của kiểm định t được sử dụng để kiểm định ý nghĩa của hệ số hồi quy. Nếu sig kiểm định t của hệ số hồi quy của một biến độc lập nhỏ hơn 0.05, ta kết luận biến độc lập đó có tác động đến biến phụ thuộc.
+ Hệ số phóng đại phương sai VIF dùng để kiểm tra hiện tượng đa cộng tuyến. Thông thường, nếu VIF của một biến độc lập lớn hơn 10 nghĩa là đang có đa cộng tuyến xảy ra với biến độc lập đó. Khi đó, biến này sẽ không có giá trị giải thích biến thiên của biến phụ thuộc trong mô hình hồi quy.
+ Kiểm tra các giả định hồi quy, bao gồm phần dư chuẩn hóa và liên hệ tuyến tính:
Phần dư có thể không tuân theo phân phối chuẩn vì những lý do như: sử dụng sai mô hình, phương sai không phải là hằng số, số lượng các phần dư không đủ nhiều để phân tích... Vì vậy, chúng ta cần thực hiện nhiều cách khảo sát khác nhau. Hai cách phổ biến nhất là căn cứ vào biểu đồ Histogram và Normal P- P Plot. Đối với biểu đồ Histogram, nếu giá trị trung bình Mean gần bằng 0, độ lệch
chuẩn gần bằng 1, ta có thể khẳng định phân phối là xấp xỉ chuẩn. Đối với biểu đồ Normal P-P Plot, nếu các điểm phân vị trong phân phối của phần dư tập trung thành 1 đường chéo, như vậy, giả định phân phối chuẩn của phần dư không bị vi phạm.
Kiểm tra vi phạm giả định liên hệ tuyến tính: biểu đồ phân tán Scatter Plot giữa các phần dư chuẩn hóa và giá trị dự đoán chuẩn hóa giúp chúng ta dò tìm xem, dữ liệu hiện tại có vi phạm giả định liên hệ tuyến tính hay không. Nếu phần dư chuẩn hóa phân bổ tập trung xunh quanh đường hoành độ 0, chúng ta có thể kết luận giả định quan hệ tuyến tính không bị vi phạm.