Các bước xây dựng mô hình:
B1. Xem xét ma trận hệ số tương quan
để xem xét mối quan hệ giữa biến phụ thuộc và các biến ựộc lập thông qua xây dựng ma trận tương quan. đồng thời ma trận tương quan là công cụ xem xét mối quan hệ giữa các biến ựộc lập với nhau nếu các biến này có tương quan chặt thì nguy cơ xảy ra hiện tượng ựa cộng tuyến cao dẫn ựến việc vi phạm giả ựịnh của mô hình.
B2. đánh giá ựộ phù hợp của mô hình
Thông qua hệ số R2 ta ựánh giá ựộ phù hợp của mô hình xem mô hình trên giải thắch bao nhiêu % sự biến thiên của biến phụ thuộc.
R2 =
TSS ESS
trị trung bình của chúng.
TSS: tổng bình phương sai lệch giữa giá trị Yi và giá trị trung bình của chúng. Khi ựưa càng nhiều biến vào mô hình thì hệ số này càng cao. Tuy nhiên, R2 ở hồi quy bội không phản ánh ựúng sự phù hợp của mô hình như trong mô hình hồi quy ựơn. Lúc này, ta phải sử dụng R2 ựiều chỉnh ựể ựánh giá sự phù hợp của mô hình.
2 R = 1- (1 - R2 ) k n n − −1
B3. Kiểm ựịnh sự phù hợp của mô hình
Sử dụng kiểm ựịnh F ựể kiểm ựịnh với giả thiết Ho: ư1 = ư2 = ưn = 0
Nếu giả thiết này bị bác bỏ thì ta có thể kết luận mô hình ta xây dựng phù hợp với tập dữ liệu.
B4. Xác ựịnh tầm quan trọng của các biến
Ý tưởng ựánh giá tầm quan trọng tương ựối của các biến ựộc lập trong mô hình thông qua xem xét mức ựộ tăng của R2 khi một biến giải thắch ựược ựưa thêm vào mô hình. Nếu mức ựộ thay ựổi này mà lớn thì chứng tỏ biến này cung cấp thông tin ựộc nhất về sự phụ thuộc mà các biến khác trong phương trình không có ựược. Ta ựánh giá tầm quan trọng của một biến thông qua hai hệ số:
Hệ số tương quan từng phần: căn bậc hai của R2 change. Thể hiện mối tương quan giữa biến Y và X mới ựưa vào. Tuy nhiên, sự thay ựổi của R2 không thể hiện tỉ lệ phần biến thiên mà một mình biến ựó có thể giải thắch. Lúc này, ta sử dụng hệ số
tương quan riêng bằng căn bậc hai của Prk2, Prk2=
k 2 k 2 R 1 R R − − 2 .
B5. Lựa chọn biến cho mô hình
đưa nhiều biến ựộc lập vào mô hình hồi quy không phải lúc nào cũng tốt vì những lý do sau (trừ khi chúng có tương quan chặt với biến phụ thuộc):
- Mức ựộ tăng R2 quan sát không hẳn phản ảnh mô hình hồi quy càng phù hợp hơn với tổng thể.
- đưa vào các biến không thắch ựáng sẽ làm tăng sai số chuẩn của tất cả các ước lượng mà không cải thiện ựược khả năng dự ựoán.
- Mô hình nhiều biến thì khó giải thắch và khó hiểu hơn mô hình ắt biến. Ta sử dụng SPSS ựể giải quyết vấn ựề trên. Các thủ tục chọn biến trên SPSS: phương pháp ựưa vào dần, phương pháp loại trừ dần, phương pháp từng bước (là sự
kết hợp của hai phương pháp loại trừ dần và ựưa vào dần).
B6. Dò tìm sự vi phạm các giả các giả thiết (ựã nêu ở trên bằng các xử lý của SPSS).