7 CẤU TRÚC LUẬN VĂN
2.1.1 Khái niệm hàm hồi quy tổng thể
Hàm hồi quy tổng thể là hàm được xây dựng dựa trên kết quả nghiên cứu khảo sát tổng thể. Trong phân tích hồi quy ta xem biến độc lập X có giá trị xác định, biến phụ thuộc Y là biến ngẫu nhiên. Ước lượng tốt nhất cho Y trong trường hợp này là giá trị kỳ vọng của Y ứng với điều kiện X
nhận giá trị Xi xác định. Hàm số dạng:
E(Y /Xi) =f(Xi) = β1 +β2Xi
được gọi là hàm hồi quy tổng thể PRF (Population Regression Function). PRF cho biết sự thay đổi của giá trị trung bình của Y khi X nhận các giá
trị khác nhau. Nếu PRF có một biến độc lập thì gọi là hồi quy đơn, PRF có từ hai biến độc lập trở lên thì gọi là hồi quy bội (hồi quy nhiều biến).
Một hàm hồi quy được biểu diễn ở dạng:
Yi = E(Y /Xi) +Ui = β1 +β2Xi+Ui
được gọi là dạng ngẫu nhiên của hàm hồi quy, trong đó β1, β2 là các tham số chưa biết nhưng cố định, và gọi là các hệ số hồi quy. β1 được gọi là hệ số chặn hay hệ số tự do, hay là tung độ gốc. β2 được gọi là hệ số góc hay độ dốc. β2 cho biết giá trị trung bình của Y sẽ tăng (giảm) bao nhiêu đơn vị khi giá trị của X tăng lên 1 đơn vị, với điều kiện các yếu tố khác không đổi. Ui là độ sai lệch giữa các giá trị quan sát thực tế Yi và E(Y /Xi), Ui
được gọi là nhiễu hay sai số ngẫu nhiên. Ui là đại lượng ngẫu nhiên nhận giá trị bất kỳ.Ui đại diện cho ảnh hưởng của các yếu tố còn lại đối với biến phụ thuộc mà không được đưa vào mô hình. Sai số ngẫu nhiên U trong mô hình hồi quy ảnh hưởng không có tính hệ thống đối với biến phụ thuộc. Tính chất này được biễu diễn theo xác suất thống kê là kỳ vọng có điều kiện của sai số ngẫu nhiên U bằng 0, nghĩa là E(Ui/Xi) = 0.
Hàm hồi quy tuyến tính luôn được hiểu là hồi quy tuyến tính đối với các tham số, nó có thể hoặc không phải là tuyến tính đối với biến, phạm vi của đề tài này chỉ đề cập đến hồi quy tuyến tính đối với các tham số.