3.5 Sơ lƣợc lý thuyết về nghiên cứu định lƣợng
3.5.3 Phân tích hồi quy
3.5.3.2 Hồi quy tuyến tính đơn
- Xây dựng mô hình của hồi quy tuyến tính đơn:
Mô hình hồi quy tuyến tính đơn giản (gọi tắt là hồi quy đơn hay SLR) là mô hình xem xét mối quan hệ giữa hai biến: biến độc lập X và biến phụ thuộc Y được biểu diễn ở dạng sau:
Yi = +
Trong đó:
- Yi là giá trị của Y tại quan sát thứ i, i= 1,2,..N (N là kích thước đám đông) - : giá trị của biến độc lập X tại quan sát thứ i
- là sai số (error) tại quan sát thứ i, nghĩa là những giải thích khác cho Y ngoài X, trong đó bao gồm các biến độc lập khác (không hiện diện trong mô hình) và sai số, ví dụ như sai số đo lường
- là hằng số hồi quy - là trọng số hồi quy
Mối quan hệ giữa X và Y là mối quan hệ thống kê. Nếu = 0, mối quan hệ giữa X và Y là mối quan hệ hàm số hay quan hệ xác định và phần
Yi = được gọi là phần cấu trúc của mô hình
Xét mối liên hệ giữa một biến phụ thuộc và một biến độc lập. Mô hình được xây dựng từ dữ liệu mẫu có dạng đường thẳng như sau:
̂ Trong đó:
- : giá trị của biến độc lập X tại quan sát thứ i
- ̂ : Giá trị dự đoán (giá trị lý thuyết) thứ I của biến phụ thuộc, dấu ^ đại diện cho giá trị dự đoán.
- và : là hệ số hồi quy. Phương pháp dùng để xác định (tung độ của vị trí tại đó đường thẳng cắt trục tung) và (độ dốc) là phương pháp bình phương nhỏ nhất thông thường (OLS – Ordinary Least Square).
Nghĩa là ta phải tìm ̂ sao chó nó càng gần với giá trị thực Yi càng tốt.
- Đánh giá độ phù hợp của mô hình:
Đánh giá độ phù hợp của mô hình nhằm chứng minh sự phù hợp của mô hình. Người ta dùng hệ số xác định (Coerricient or Determination) để biết mô hình hồi quy tuyến tính đã xây dựng phù hợp đến mức độ nào:
0 ≤ ≤ 1 Trong đó:
- (Sum of Squares explained by Regression) là tổng bình phương của tất cả các sai lệch giữa giá trị của biến Y tính theo hàm hồi quy mẫu với giá trị trung bình. Phần này đo độ chính xác của hàm hồi quy.
- (Total Sum of Squares) là tổng bình phương của tất cả các sai lệch giữa giá trị quan sát Yi với giá trị trung bình của chúng.
= + ( : biến thiên sai số)
Nếu = 1: đường hồi quy hoàn toàn phù hợp, nghĩa là tất cả sai lệch của Y (so với giá trị trung bình) đều giải thích được bởi mô hình hồi quy.
Nếu = 0: các biến X và Y không có quan hệ
càng lớn hơn : hàm hồi quy mẫu phù hợp tốt với các số liệu quan sát.
Nếu tất cả các giá trị quan sát của Yi đều nằm trên đường hồi quy ̂ thì
= , do đó = 0. Ngược lại nếu càng lớn hơn thì hàm hồi quy mẫu kém phù hợp với các số liệu quan sát.
- Kiểm định các giả thiết: được tiến hành theo hai bước
- Kiểm định các giả thiết về độ phù hợp của mô hình (phân tích phương sai): sau khi xây dựng xong mô hình hồi quy tuyến tính ta cần xem xét độ phù hợp của mô hình đối với tập dữ liệu qua giá trị với giả thiết = 0.
Nếu sau khi kiểm định, ta có đủ bằng chứng bác bỏ giả thiết H0: = 0 ta kết luận mô hình hồi quy tuyến tính được xây dựng phù hợp với tổng thể.
Đại lượng F được sử dụng cho kiểm định này. Nếu xác suất F nhỏ thì giả thuyết bị bác bỏ. Trong SPSS, số liệu F được lấy từ bảng phân tích phương sai ANOVA (a):
- Kiểm định các giả thiết về ý nghĩa của hệ số hồi quy:
Cho dù mô hình tuyến tính mẫu xây dựng được có giá trị độ dốc ≠ 0, nhưng ta chưa thể chắc chắn độ dốc của mô hình tổng thể khác 0. Vì vậy, ta phải làm kiểm định để có kết luận về β1. Giả thuyết dùng để kiểm định giả thiết này là H0: β1 = 0, ta kỳ vọng giả thuyết này sẽ bị bác bỏ vì nếu β1 = 0, nghĩa là Y độc lập với X. Do đó, mối quan hệ tương quan tuyến tính ta nhận thấy ở mẫu xãy ra là do ngẫu nhiên, mô hình hồi quy tuyến tính ta xây dựng được dựa trên một mối quan hệ
“giả ” giữa hai biến.
Trị thống kê dùng để kiểm định giả thiết là: t =