(i)2.2.1.1. Tổng thể
Tổng thể là tập hợp tất cả các phần tử có cùng dấu hiệu nghiên cứu định tính hay định lượng nào đó, cụ thể hơn là có các yếu tố, có mối quan hệ mà ta quan tâm. Tổng thể được xác định trên cơ sở không gian và thời gian cụ thể tùy thuộc mục đích nghiên cứu.
Ví dụ: Xem xét mối quan hệ thu nhập – chi tiêu của hộ gia đình Việt Nam năm 2014.
Tổng thể là tất cả các hộ gia đình trên phạm vi nước Việt Nam chỉ trong năm 2014. Trong trường hợp này số phần tử là hữu hạn đếm được; không gian và thời gian cố định.
(ii)2.2.1.2. Mô hình hồi quy tổng thể
Mô hình hồi quy tổng thể (PRM – Population Regression Model): Là phương trình biểu diễn mối quan hệ giữa một biến phụ thuộc (Y) với một biến độc lập (X) xác định trên toàn bộ tổng thể có dạng như sau:
= + + u
Trong mô hình hồi quy tổng thể có 3 thành phần: Biến số, Hệ số, Sai số. + Thành phần thứ nhất: Biến số, bao gồm biến phụ thuộc và biến độc lập.
Biến phụ thuộc: là biến số mà ta đang quan tâm đến giá trị của nó, thường ký hiệu là Y và nằm ở vế trái của phương trình. Biến phụ thuộc còn được gọi là biến được giải thích (explained variable) hay biến phản ứng.
Biến độc lập: là biến số được cho là có tác động đến biến phụ thuộc, thường ký hiệu là X và nằm ở vế phải của phương trình. Bỉến độc lập còn được gọi là biến giải thích (explanatory variable) hay biến điều khiển (control variable).
Các biến số phụ thuộc và độc lập đưa vào mô hình phải là các biến có giá trị là quan sát được, chẳng hạn năng suất lúa là 5 tấn/hec ta, lạm phát năm 2010 là 15%, hay thu nhập một hộ gia đình là 5 triệu đồng/tháng… Việc nhận biết biến phụ thuộc và biến độc lập trong nhiều bài toán cụ thể là khá đơn giản, chẳng hạn khi ta quan tâm đến lạm phát và muốn đánh giá tác động của cung tiền lên lạm phát thì lạm phát sẽ là biến phụ thuộc và cung tiền là biến độc lập. Hay khi quan tâm đến tác động của trình độ học vấn lên mức thu nhập thì mức thu nhập sẽ là biến phụ thuộc và trình độ học vấn là biến độc lập.
+ Thành phần thứ hai là Hệ số, hay Hệ số hồi quy (cũng là các tham số): gắn liền với các biến độc lập thể hiện mối quan hệ giữa biến phụ thuộc – biến độc lập. Sử dụng các chữ cái Hy Lạp như α, β, γ… hoặc đánh số β1, β2... để kí hiệu cho hệ số hồi quy.
Lưu ý: Hệ số β2 gắn với một biến độc lập thực sự trong mô hình là biến X, còn hệ số β1 thì không. Hệ số β1 còn gọi là hệ số chặn.
+ Thành phần thứ ba là Sai số ngẫu nhiên: đại diện cho các yếu tố hay các biến số khác, ngoài X, có tác động đến Y. Sai số ngẫu nhiên được ký hiệu là u, v.
Trong mô hình tổng thể, sai số ngẫu nhiên là rất quan trọng và luôn phải có, vì những nguyên nhân sau:
+ Lý thuyết chưa đầy đủ: trong kinh tế xã hội, các lý thuyết không thể bao quát đầy đủ tất cả các yếu tố tác động đến một biến phụ thuộc.
+ Sự hạn chế của số liệu: có những yếu tố cần đưa vào thành biến nhưng không có số liệu hoặc không đầy đủ hoặc có số liệu nhưng vẫn có sai sót.
+ Tầm quan trọng của biến: những biến có ảnh hưởng ít thường không cần đưa vào mô hình.
Ví dụ: Một công ty xuất nhập khẩu lương thực muốn nghiên cứu Lượng xuất khẩu gạo phụ thuộc vào giá bán của loại gạo đó như thế nào.
Ở đây sẽ có 2 biến gồm: biến phụ thuộc là lượng xuất khẩu gạo, kí hiệu là Q và biến độc lập là giá bán của loại gạo đó, kí hiệu là P.
Mô hình hồi quy tổng thể:
= + + u
(iii)2.2.1.3. Hàm hồi quy tổng thể
Hàm hồi quy tổng thể (PRF – Population Regression Function) là hàm số thể hiện mối quan hệ giữa trung bình giữa biến phụ thuộc và biến độc lập, xác định trên toàn bộ tổng thể.
Hàm hồi quy tổng thể cho chúng ta biết giá trị trung bình của biến phụ thuộc Y thay đổi như thế nào theo biến độc lập X.
Trong mô hình hồi quy tổng thể chúng ta không có các quan sát về sai số ngẫu nhiên u (còn gọi là sai số ngẫu nhiên không quan sát được). Do đó, để hàm hồi quy có ý nghĩa, cần đưa ra giả thiết cho thành phần sai số ngẫu nhiên là tại mỗi giá trị của X thì kỳ vọng của u bằng 0: E(u\X) = 0
Với giả thiết E(u\X) = 0, ta có thể lấy kỳ vọng 2 vế mô hình hồi quy tổng thể, ta có:
E(Y\X) = +
Trong đó E(Y\X) là kỳ vọng của biến Y khi biết giá trị của biến X, hay còn gọi là kỳ vọng của Y với điều kiện X.
Các hệ số hồi quy và còn được gọi là các tham số của tổng thể, có ý nghĩa như sau:
được gọi là hệ số chặn, cho biết giá trị trung bình của biến phụ thuộc Y khi biến độc lập X nhận giá trị bằng 0: E(Y\X = 0) =
được gọi là hệ số góc, thể hiện quan hệ giữa biến độc lập và giá trị trung bình của biến phụ thuộc, cho biết khi X thay đổi 1 đơn vị thì trung bình của Y thay đổi như thế nào và bao nhiêu?
Nếu = 0: X không ảnh hưởng đến Y, Y không phụ thuộc X hay khi X thay đổi thì Y không thay đổi.
Nếu ≠ 0: X có ảnh hưởng đến Y, Y có phụ thuộc X hay khi X thay đổi thì Y có thay đổi và sự thay đổi còn tùy thuộc dấu hệ số
> 0: X và Y có quan hệ cùng chiều, khi biến độc lập X tăng (giảm) một đơn vị thì giá trị trung bình của biến phụ thuộc Y tăng (giảm) đơn vị.
< 0: X và Y có quan hệ ngược chiều, khi biến độc lập X tăng (giảm) một đơn vị thì giá trị trung bình của biến phụ thuộc Y giảm (tăng) | | đơn vị.
Ví dụ 1: Giải thích ý nghĩa kinh tế của các hệ số hồi quy trong hàm hồi quy sau:
E(CT\TN) = 2,15 + 0,75TN
Với CT: chi tiêu, TN: thu nhập hộ gia đình (đơn vị: triệu đồng/tháng).
= 2,15: khi thu nhập các hộ bằng 0 thì chi tiêu trung bình (mức tiêu dùng tự định trung bình) là 2,15 triệu đồng/tháng.
= 0,75 > 0: khi thu nhập các hộ tăng hoặc giảm 1 triệu đồng/tháng thì chi tiêu trung bình các hộ sẽ tăng hoặc giảm 0,75 triệu đồng/tháng (khuynh hướng tiêu dùng cận biên của các hộ là 0,75 triệu đồng/tháng), còn khuynh hướng tiết kiệm cận biên là 1 – 0,75 = 0,25 triệu đồng/tháng.
Ví dụ 2:
Xét tổng thể giả định gồm 30 hộ gia đình với các mức chi tiêu và thu nhập hàng tháng được cho trong bảng dưới đây:
Bảng II-1.Thu nhập và chi tiêu của hộ gia đình
Đơn vị: triệu đồng Chi tiêu Thu nhập 5 6 7 8 9 3,8 1 1 4,3 3 1 2 2 4,8 1 2 2 5,3 3 1 1 6,3 1 3 1 2 7,3 2 1 E(CT\TN) 4,3 4,8 5,3 5,8 6,3
Các giá trị trong bảng được trình bày như sau: ví dụ với cột thứ nhất, với lượng thu nhập là 5 triệu đồng/tháng/hộ thì có 1 hộ có lượng chi tiêu là 3,8 triệu đồng/tháng. Có 3 hộ gia đình có cùng mức thu nhập là 5 triệu đồng/tháng và chi tiêu là 4,3 triệu, có 1 hộ có cùng mức thu nhập là 5 triệu đồng/tháng và chi tiêu là 4,8 triệu
Tại các mức thu nhập ta có thể tính được chi tiêu trung bình: ( | = 5) =1 ∗ 3,8 + 3 ∗ 4,3 + 1 ∗ 4,8
1 + 3 + 1 = 4,3
Để tính hai hệ số ta chỉ cẩn tối thiểu 2 phương trình: E(CT\TN = 5)= + . 5 = 4,3 E(CT\TN = 6)= + . 6 = 4,8
= 1,8 ; = 0,5
Từ kết quả trên ta có hàm hồi quy tổng thể: E(CT | TN) =1,8 + 0,5TN.
Nếu tăng thu nhập thêm 1 triệu đồng/tháng thì chi tiêu trung bình sẽ gia tăng 0.5 triệu đồng/tháng – con số này cho phép đánh giá tác động của thu nhập lên chi tiêu của các hộ gia đình.
Khi lượng thu nhập bằng 0 thì chi tiêu trung bình (tiêu dùng tự định) là 1,8 triệu đồng/tháng.
Khi thu nhập bằng 10 triệu đồng/tháng thì chi tiêu trung bình là 6,8 triệu đồng/tháng. Đây chính là bài toán dự báo về giá trị trung bình của biến phụ thuộc: hộ gia đình có thể dự báo được rằng nếu thu nhập là TNi cụ thể nào đó thỉ chi tiêu trung bình sẽ đạt được là bao nhiêu.
=> Ứng dụng của phân tích hồi quy
Phân tích hồi quy cho phép:
1. Đánh giá tác động của biến độc lập lên giá trị trung bình của biến phụ thuộc. 2. Kiểm nghiệm các lý thuyết kinh tế về mối quan hệ phụ thuộc giữa các biến số. 3. Thực hiện dự báo về giá trị của biến phụ thuộc khi biết giá trị của biến độc lập. Chú ý: phân tích hồi quy quan tâm chủ yếu đến các mối quan hệ nhân quả chứ không phải các mối quan hệ thống kê thuần túy. Ngoài ra, cũng cần nhắc lại rằng mối quan hệ nhân quả này được xác lập ngoài mô hỉnh, dựa trên lý thuyết kinh tế hoặc suy diễn lôgic. Chẳng hạn cầu về lao động của doanh nghiệp phụ thuộc vào mức lương, dư nợ tín dụng phụ thuộc vào lãi suất, năng suất lao động phụ thuộc vào số năm kinh nghiệm của người lao động, Các mối quan hệ phụ thuộc này được xác lập sẵn trước khi xây dựng mô hình hồi quy, và mô hình hồi quy dùng giúp định lượng mối quan hệ này.