Thông thường thì rất khó để có được số liệu cho toàn bộ tổng thể, do đó để ước lượng được giá trị của các hệ số trong hàm hồi quy, người ta sẽ ước tính thông qua số liệu mẫu. Điều này dẫn đến khái niệm hàm hồi quy mẫu.
(iv)2.2.2.1. Mẫu ngẫu nhiên
Mẫu ngẫu nhiên là một bộ phận rút ra từ tổng thể vẫn chứa đựng vấn đề nghiên cứu một cách ngẫu nhiên. Số lượng phần tử trong mẫu thường được xác định trước, tùy theo mục đích nghiên cứu và các điều kiện như không gian, thời gian, nguồn lực.
Số lượng phần tử trong mẫu gọi là kích thước mẫu, kí hiệu là n.
Ví dụ: Nghiên cứu mối quan hệ thu nhập – chi tiêu của các hộ gia đình ở Việt Nam
năm 2014.
Tổng thể: tất cả các hộ gia đình trên phạm vi nước Việt Nam chỉ trong năm 2014. Tuy nhiên do số hộ lớn và kinh phí điều tra lớn nên ta chỉ thực hiện điều tra một số hộ. Như bộ số liệu VHLSS 2014 được thực hiện với kết quả thông tin thu được của 9.399 hộ.
Hình II-2. Ví dụ về mẫu ngẫu nhiên
Trong hình tổng thể là là toàn bộ các hộ gia đình năm 2014; Mẫu ngẫu nhiên là là số các hộ gia đình được lựa chọn ngẫu nhiên để điều tra. Có vô số mẫu có thể rút ra từ tổng thể với các kích cỡ khác nhau.
(v)2.2.2.2. Mô hình hồi quy mẫu
Mô hình hồi quy mẫu (SRM – Sample Regression Model): Là phương trình biểu diễn mối quan hệ giữa một biến phụ thuộc (Y) với một biến độc lập (X) xác định trên một mẫu ngẫu nhiên có dạng như sau:
= + +
Với các quan sát cụ thể, ta có thể viết: Tổng thể
Mẫu 2
= + + Trong đó i = 1, 2,…, n với n là kích thước mẫu.
Trong mô hình hồi quy có 3 thành phần: Biến số, Hệ số, Phần dư. + Biến số: bao gồm biến phụ thuộc và biến độc lập.
+ Hệ số (còn gọi là hệ số hồi quy mẫu, nhưng không gọi là tham số): gắn liền với các biến độc lập thể hiện mối quan hệ giữa biến phụ thuộc – biến độc lập. Nhưng các hệ số hồi quy này là hệ số hồi quy trong mẫu hay hệ số ước lượng (hay ước lượng hệ số) nó chỉ là ước lượng của các hệ số hồi quy trong tổng thể. Trong tổng thể, các hệ số là chữ Hy Lạp thì trong mẫu các hệ số được có thêm mũ, chẳng hạn tương ứng với hệ số tự do 1 trong tổng thể sẽ là hệ số 1 trong mẫu, tương ứng với hệ số góc 2 trong tổng thể sẽ là hệ số 2 trong mẫu.
+ Phần dư: Tương tự như trong tổng thể, bên cạnh biến độc lập X còn các yếu tố khác tác động đến biến phụ thuộc Y. Yếu tố ngẫu nhiên trong mẫu gọi là phần dư (residual) và kí hiệu là e.
Ví dụ: Một công ty xuất nhập khẩu lương thực muốn nghiên cứu lượng xuất khẩu
gạo (Q) phụ thuộc vào giá bán (P) của loại gạo đó. Mô hình hồi quy mẫu:
= + . +
(vi)2.2.2.3. Hàm hồi quy mẫu
Hàm hồi quy mẫu (SRF – Sample Regression Function) là hàm số thể hiện mối quan hệ giữa trung bình giữa biến phụ thuộc và biến độc lập, xác định trên toàn bộ mẫu. Tương tự cách xây dựng hàm hồi quy tổng thể từ mô hình hồi quy tổng thể ta cũng có thể xây dựng hàm hồi quy mẫu từ mô hình hồi quy mẫu có dạng sau:
= +
Trong đó là giá trị ước lượng cho giá trị Y.
Ý nghĩa các hệ số hồi quy ước lượng: Với mẫu cụ thể đã cho như sau:
được gọi là ước lượng hệ số chặn, cho biết ước lượng của giá trị trung bình của biến phụ thuộc Y khi biến độc lập X nhận giá trị bằng 0.
được gọi là ước lượng hệ số góc, thể hiện quan hệ giữa biến độc lập và giá trị trung bình của biến phụ thuộc trong mẫu:
Nếu = 0 : trong mẫu X không ảnh hưởng đến Y, Y không phụ thuộc X hay khi X thay đổi thì Y không thay đổi.
Nếu ≠ 0 : trong mẫu X có ảnh hưởng đến Y, Y có phụ thuộc X hay khi X thay đổi thì Y có thay đổi và sự thay đổi còn tùy thuộc dấu hệ số β2
Nếu > 0: trong mẫu X và Y có quan hệ cùng chiều, khi biến độc lập X tăng (giảm) một đơn vị thì giá trị trung bình của biến phụ thuộc Y tăng (giảm) đơn vị.
Nếu < 0 : trong mẫu X và Y có quan hệ ngược chiều, khi biến độc lập X tăng (giảm) một đơn vị thì giá trị trung bình của biến phụ thuộc Y giảm (tăng) | | đơn vị.