7. Kết cấu của luận văn
3.2.7.5. Phân tích hồi quy
a. Định nghĩa
Phân tích hồi quy là nghiên cứu sự phụ thuộc của một biến (biến phụ thuộc hay biến đƣợc giải thích) vào một hay nhiều biến khác (biến độc lập hay biến giải thích) với ý tƣởng cơ bản là ƣớc lƣợng hay dự đoán giá trị trung bình của biến phụ thuộc trên cơ sở đã biết của biến độc lập.
b. Các giả định khi xây dựng mô hình hồi quy
Mô hình hồi quy có dạng:
Yi = B0+ B1 X1i+ B2 X2i+…+ Bn Xni + ei
Các giả định quan trọng khi phân tích hồi quy tuyến tính
- Giả thiết 1: Giả định liên hệ tuyến tính.
- Giả thiết 2: Phƣơng sai có điều kiện không đổi của các phần dƣ. - Giả thiết 3: Không có sự tƣơng quan giữa các phần dƣ.
- Giả thiết 5: Giả thiết về phân phối chuẩn của phần dƣ.
c. Xây dựng mô hình hồi quy
Các bƣớc xây dựng mô hình:
Bước 1: Xem xét ma trận hệ số tương quan
Để xem xét mối quan hệ giữa biến phụ thuộc và các biến độc lập thông qua xây dựng ma trận tƣơng quan. Đồng thời ma trận tƣơng quan là công cụ xem xét mối quan hệ giữa các biến độc lập với nhau nếu các biến này có tƣơng quan chặt thì nguy cơ xảy ra hiện tƣợng đa cộng tuyến cao dẫn đến việc vi phạm giả định của mô hình.
Bước 2: Đánh giá độ phù hợp của mô hình
Thông qua hệ số R2ta đánh giá độ phù hợp của mô hình xem mô hình trên giải thích bao nhiêu % sự biến thiên của biến phụ thuộc.
Bước 3: Kiểm định sự phù hợp của mô hình
Sử dụng kiểm định F để kiểm định với giả thiết Ho: B1 = B2 = Bn = 0
Nếu giả thiết này bị bác bỏ thì ta có thể kết luận mô hình ta xây dựng phù hợp với tập dữ liệu.
Bước 4: Xác định tầm quan trọng của các biến
Ý tƣởng đánh giá tầm quan trọng tƣơng đối của các biến độc lập trong mô hình thông qua xem xét mức độ tăng của R2 khi một biến giải thích đƣợc đƣa thêm vào mô hình. Nếu mức độ thay đổi này mà lớn thì chứng tỏ biến này cung cấp thông tin độc nhất về sự phụ thuộc mà các biến khác trong phƣơng trình không có đƣợc.
Bước 5: Lựa chọn biến cho mô hình
Đƣa nhiều biến độc lập vào mô hình hồi quy không phải lúc nào cũng tốt vì những lý do sau (trừ khi chúng có tƣơng quan chặt với biến phụ thuộc):
- Mức độ tăng R2 quan sát không hẳn phản ảnh mô hình hồi quy càng phù hợp hơn với tổng thể.
- Đƣa vào các biến không thích đáng sẽ làm tăng sai số chuẩn của tất cả các ƣớc lƣợng mà không cải thiện đƣợc khả năng dự đoán.
- Mô hình nhiều biến thì khó giải thích và khó hiểu hơn mô hình ít biến. Ta sử dụng SPSS để giải quyết vấn đề trên. Các thủ tục chọn biến trên SPSS: Phƣơng pháp đƣa vào dần, phƣơng pháp loại trừ dần, phƣơng pháp từng bƣớc (là sự kết hợp của hai phƣơng pháp loại trừ dần và đƣa vào dần).
Bước 6: Dò tìm sự vi phạm các giả các giả thiết (đã nêu ở trên bằng các xử lý của SPSS).
Ngoài ra, sử dụng phân tích chi bình phƣơng một mẫu để tìm ra quy luật phân phối của mẫu và đánh giá độ tin cậy của thang đo thông qua hệ số Cronbach Alpha.
Dữ liệu đƣợc nhập và làm sạch thông qua phần mềm SPSS 16.