1./ Phân tích hệ sốtương quan Pearson
Hệ số tương quan Pearson (Pearson Correlation Coefficient) đo lường mức
độ tương quan tuyến tính giữa hai biến. Do đó, nghiên cứu phân tích hệ số tương
quan Pearson nhằm xem xét tổng quát mối quan hệ giữa từng biến độc lập với biến phụ thuộc và giữa các biến độc lập với nhau. Hệ sốtương quan Pearson sẽ nhận giá trị từ+1 đến -1. Khi hệ số này tiến gần đến 1 thì mối quan hệ tuyến tính càng chặt chẽ. Nếu giữa hai biến độc lập có sự tương quan chặt chẽ thì phải lưu ý vấn đề đa
cộng tuyến khi phân tích hồi quy. Đa cộng tuyến là trạng thái trong đó các biến độc lập có tương quan chặt chẽ với nhạu. Vấn đề của hiện tượng đa cộng tuyến là chúng cung cấp cho mô hình những thông tin rất giống nhau và rất khó tách rời ảnh hưởng của từng biến một đến biến phụ thuộc. Nếu hệ số phóng đại phương sai (VIF –
Variance Inflation Factor) của một biến độc lập bất kì lớn hơn 10 thì biến này hầu
như không có giá trị giải thích biến thiên của biến phụ thuộc trong mô hình hồi quy
2./ Phân tích hồi quy đa biến
Là phương pháp được sử dụng để phân tích mối quan hệ giữa một biến phụ
thuộc với nhiều biến độc lập. Phương trình hồi quy tuyến tính đa biến có dạng:
Yi= β0 + β1 X1i+ β2 X2i+ … + βp Xpi + ei
Mục đích của việc phân tích hồi quy đa biến là dự đoán mức độ biến phụ
thuộc (với độ chính xác trong phạm vi giới hạn) khi biết trước giá trị của biến độc lập. Các tham số quan trọng trong phân tích hồi quy đa biến theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008), gồm có:
- Hệ số β (hệ số hồi quy chuẩn hóa): hệ số đo lường sự thay đổi trong giá trị
trung bình của biến phụ thuộc khi một biến độc lập thay đổi một đơn vị (các biến
độc lập còn lại không đổi).
- Hệ số xác định R2 hiệu chỉnh: nhằm xác định tỷ lệ biến thiên của biến phụ
thuộc được giải thích bởi biến độc lập trong mô hình hồi quy. Hệ số này có thể thay
đổi từ0 đến 1, theo quy tắc: R2 càng gần 1 thì mô hình xây dựng càng thích hợp, và R2 càng gần 0 mô hình càng kém phù hợp.
- Kiểm định ANOVA: là xem xét toàn bộ biến thiên quan sát được của biến phụ thuộc chia làm hai phần: biến thiên hồi quy và biến thiên phần dư và so sánh
hai biến thiên này. Nếu biến thiên hồi quy lớn hơn nhiều so với biến thiên phần dư
thì mô hình hồi quy càng phù hợp. Nếu ý nghĩa của kiểm định Sig. < 0,05 thì mô hình hồi quy phù hợp với tập dữ liệu.