Nếu kết luận được hai biến có liên hệ chặt chẽ với nhau, đồng thời giả định rằng đã cân nhắc kỹ bản chất của mối liên hệ tiềm ấn giữa hai biến, và xem như đã
Xi = Ai1* F1 + Ai2 * F2 + Ai3* F3 +…+ Aim * Fm + ViUi
xác định đúng mối quan hệ nhân quả có thật giữa chúng thì ta có thể mô hình hóa mối quan hệ nhân quả của hai biến này bằng mô hình hồi qui tuyến tính trong đó một biến được gọi là biến phụ thuộc (biến được giải thích – Y) và biến kia là biến độc lập (biến giải thích – X). Mô hình này sẽ mô tả hình thức của mối quan hệ và qua đó giúp ta dựđoán được mức độ của biến phụ thuộc khi biết trước giá trị của biến độc lập.
- Mô hình hồi quy tuyến tính bội:
Mô hình hồi quy bội mở rộng mô hình hồi quy tuyến tính hai biến bằng cách thêm vào một số biến độc lập để giải thích tốt hơn cho biến phụ thuộc.
Mô hình hồi qui có dạng như sau:
Trong đó:
Xpi : Biểu hiện giá trị của biến độc thứ p tại quan sát thứ i ;
β k : Hệ số hồi qui riêng phần;
ei : Là một biến độc lập ngẫu nhiên có phân phối chuẩn với trung bình là 0 và phương sai không đổi α².
Mô hình hồi quy tuyến tính bội giả định rằng biến phụ thuộc có phân phối chuẩn đối với bất kì kết hợp nào của các biến độc lập trong mô hình.
- Hệ sốtương quan mẫu R:
Dùng để đánh giá mức độ tương quan tuyến tính giữa các biến độc lập với biến phụ thuộc trong mô hình và ta có:
Tương quan tuyến tính giữa hai biến là tương quan tuyến tính hoàn hảo khi: |R|=1
Tương quan tuyến tính giữa hai biến là tương quan tuyến tính mạnh khi: 0,7 ≤ |R| <1
Tương quan tuyến tính giữa hai biến là tuong quan tuyến tính trung bình:
0,4≤|R|<0,6
Tương quan tuyến tính giữa hai biến là tuong quan tuyến tính yếu: 0 ≤ |R| < 0,3
Hai biến không có sựtương quan: R = 0
- Đánh giá độ phù hợp của mô hình hồi quy tuyến tính bội:
Hệ số R² (R-square) đã được chứng minh là hàm không giảm theo số biến độc lập được đưa vào mô hình, càng thêm nhiều biến độc lập vào mô hình thì R² càng tăng, tuy nhiên điều này cũng được chứng minh rằng không phải phương trình
càng có nhiều biến sẽ càng phù hợp với dữ liệu (tức là tốt hơn). Như vậy R-square có khuynh hướng là một ước lượng lạc quan của thước đo sự phù hợp của mô hình đối với dữ liệu trong trường hợp có hơn một biến giải thích trong mô hình.
Mô hình thường không phù hợp với dữ liệu thực tế như giá trị R² thể hiện. Khi đó, ta sẽ sử dụng R- square hiệu chỉnh để phản ánh mức độ phù hợp của mô hình hồi quy tuyến tính đa biến. R² không nhất thiết tăng lên khi nhiều biến được thêm vào phương trình, nó là thước đo sự phù hợp của mô hình và được sử dụng cho mô hình hồi quy tuyến tính đa biến vì nó không phụ thuộc vào độ lệch phóng đại của R2.(Theo Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2005)
- Tương quan mẫu phần dư:
Dùng hệ số Durbin –Waston để đánh giá mức độ tương quan giữa các phần dư theo quy ước như sau:
0 TƯƠNG QUAN DƯƠNG 1 KHÔNG TƯƠNG QUAN 3 TƯƠNG QUAN ÂM 4
- Kiểm định độ phù hợp của mô hình:
Kiểm định F trong bảng phân tích phương sai vẫn là một phép kiểm đinh giả thuyết vềđộ phù hợp của mô hình hồi quy tuyến tính tổng thể. Trong nghiên cứu này, kiểm dịnh F sẽđược sử dụng để kiể tra xem biến phụ thuộc có liên hệ tuyến tính với toàn bộ tập hợp các biến độc lập hay không với giả thuyết H0 là: “ β1= β2 = β3 = β4 = 0”.
Nếu giả thuyết H0 bị bác bỏ, ta có thể kết luận là kết hợp của các biến hiện có trong mô hình có thể giải thích được thay đổi của Y, điều này cũng có nghĩa là mô hình ta xây dựng phù hợp với tập dữ liệu (Theo Hoàng Trọng & Mộng Ngọc).
- Xác định khảnăng xảy ra đa cộng tuyến trong mô hình:
Ta sử dụng giá trị của hệ sốphóng đại phương sai VIF (Variance Inflation Factor) để kiểm tra khảnăng xảy ra đa cộng tuyến giữa các biến độc lập trong mô hình với quy ước VIF ≥ 10 thì xảy ra hiện tượng đa cộng tuyến (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2005).
- Xác định tầm quan trọng của các biến trong mô hình:
Trong mô hình hồi quy bội có rất nhiều biến độc lập và đểxác định xem với những biến mà ta đã đưa vào mô hình, biến nào có vai trò quan trọng hơn trong việc dựđoán giá trị lý thuyết của Y hay chúng quan trọng như nhau. Đểlàm được điều đó, ta sẽ sử dụng hệ số tương quan giữa biến phụ thuộc với các biến độc lập. Bên cạnh đó, khi muốn xác định tầm quan trọng của các biến khi chúng được sử dụng cùng với những biến khác trong mô hình ta dùng hệ số tương quan từng phần và tương quan riêng (Part and partical corrections). (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2005)
Chương 4: PHÂN TÍCH KẾT QUẢ