2.1.1 Khái niệm phân tích hồi quy
Các hiện tượng kinh tế xã hội tồn tại trong mối quan hệ phụ thuộc lẫn nhau. Hiện tượng này xảy ra có thể chịu sự tác động của nhiều hiện tượng khác. Việc quan sát, ghi chép lại các hiện tượng kinh tế xã hội có thể giúp con người có cơ sở để xác định mối quan hệ, sự tương tác giữa các hiện tượng đó. Ví dụ như Cầu về một loại hàng hóa chịu sự tác động của giá cả hàng hóa đó, giá giảm thì cầu về hàng hóa sẽ tăng.
Phân tích hồi quy là việc nghiên cứu mối liên hệ phụ thuộc của một biến (gọi là biến phụ thuộc hay biến được giải thích) với một hay nhiều biến khác (gọi là biến độc lập hay giải thích) nhằm ước lượng và/hoặc dự báo giá trị trung bình của biến phụ thuộc với các giá trị đã biết của các biến độc lập.
Ví dụ 1: Lượng cầu về một loại hàng hóa X có thể phụ thuộc vào giá của hàng hóa đó, thu nhập của người tiêu dùng và giá của những hàng hóa khác cạnh tranh với hàng hóa này. Vậy trong trường hợp này, lượng cầu về hàng hóa X là biến phụ thuộc, giá của bản thân hàng hóa, giá của hàng hóa cạnh tranh và thu nhập của người tiêu dùng là các biến độc lập.
Ví dụ 2: Một nhà kinh tế lao động nghiên cứu tỷ lệ thay đổi của tiền lương trong quan hệ với tỷ lệ thất nghiệp, ở đây tỷ lệ thay đổi của tiền lương là biến phụ thuộc, tỷ lệ thất nghiệp là biến độc lập. Mô hình cho phép dự đoán được sự thay đổi trung bình của tỷ lệ tiền lương với một tỷ lệ thất nghiệp nhất định.
2.1.2 Các bước thực hiện phân tích hồi quy
Hình II-1.Các bước thực hiện phân tích hồi quy Bước 1: Nêu ra các giả thuyết
Căn cứ vào các lý thuyết kinh tế hay căn cứ vào các phân tích, quan sát, người nghiên cứu đưa ra các giả thuyết về mối quan hệ giữa các biến số với mục tiêu nghiên cứu.
Ví dụ như kinh tế học khẳng định rằng trong điều kiện các yếu tố khác không đổi mức tiêu dùng của các hộ gia đình phụ thuộc theo quan hệ cùng chiều với thu nhập khả dụng của họ. Từ đây ta đưa ra giả thuyết về ảnh hưởng của biến thu nhập khả dụng tới mức tiêu dùng của hô gia đình là dương.
Bước 2: Thiết lập mô hình
Mô hình thể hiện mối quan hệ giữa các biến số như sau:
= + + u
Trong đó, Y là biến phụ thuộc, X là biến độc lập, là hệ số chặn, là hệ số góc, u là yếu tố ngẫu nhiên đại diện cho tất cả các nhân tố ảnh hưởng tới Y nhưng không được đưa vào mô hình.
Với ví dụ trên, Y chính là mức tiêu dùng của hộ gia đình, X là thu nhập khả dụng của hộ gia đình, là hệ số chặn, , là hệ số góc, u là yếu tố ngẫu nhiên đại diện cho tất cả các nhân tố ảnh hưởng tới mức tiêu dùng của hộ gia đình nhưng không được đưa vào mô hình.
Bước 3: Thu thập số liệu
Dự báo/Ra quyết định Phân tích kết quả Ước lượng các tham số
Thu thập số liệu Thiết lập mô hình Nêu ra các giả thuyết
Trong mô hình, các tham số , , u là chưa biết. Cần thu nhập dữ liệu để ước tính ra các tham số này. Dữ liệu thu thập được là một mẫu ngẫu nhiên tương ứng với các biến số. Độ chính xác của dữ liệu ảnh hưởng rất lớn đối với kết quả ước lượng của mô hình.
Bước 4: Ước lượng tham số
Sử dụng các phương pháp kinh tế lượng phù hợp để ước lượng ra các tham số
, , từ đó có được số đo về mức ảnh hưởng của biến độc lập tới biến phụ thuộc dựa trên cơ sở các số liệu hiện có.
Bước 5: Phân tích kết quả
Phân tích kết quả dựa trên hai phương diện: kinh tế và kỹ thuật.
Dựa trên lý thuyết kinh tế để phân tích và đánh giá kết quả nhận được có phù hợp với lý thuyết kinh tế, phù hợp về mặt logic không?
Kết quả ước lượng có phù hợp với các tiêu chuẩn kỹ thuật của mô hình ước lượng không? Quan hệ giữa các biến số có thể không tuân thủ dạng hàm ban đầu dự kiến, trong trường hợp này cần phải hiệu chỉnh mô hình.
Bước 6: Dự báo/ Ra quyết định
Nếu kết quả phù hợp có thể sử dụng để dự báo. Từ đó giúp đưa ra các quyết định kinh tế.
2.2 MÔ HÌNH HỒI QUY
2.2.1 Mô hình hồi quy tổng thể
(i)2.2.1.1. Tổng thể
Tổng thể là tập hợp tất cả các phần tử có cùng dấu hiệu nghiên cứu định tính hay định lượng nào đó, cụ thể hơn là có các yếu tố, có mối quan hệ mà ta quan tâm. Tổng thể được xác định trên cơ sở không gian và thời gian cụ thể tùy thuộc mục đích nghiên cứu.
Ví dụ: Xem xét mối quan hệ thu nhập – chi tiêu của hộ gia đình Việt Nam năm 2014.
Tổng thể là tất cả các hộ gia đình trên phạm vi nước Việt Nam chỉ trong năm 2014. Trong trường hợp này số phần tử là hữu hạn đếm được; không gian và thời gian cố định.
(ii)2.2.1.2. Mô hình hồi quy tổng thể
Mô hình hồi quy tổng thể (PRM – Population Regression Model): Là phương trình biểu diễn mối quan hệ giữa một biến phụ thuộc (Y) với một biến độc lập (X) xác định trên toàn bộ tổng thể có dạng như sau:
= + + u
Trong mô hình hồi quy tổng thể có 3 thành phần: Biến số, Hệ số, Sai số. + Thành phần thứ nhất: Biến số, bao gồm biến phụ thuộc và biến độc lập.
Biến phụ thuộc: là biến số mà ta đang quan tâm đến giá trị của nó, thường ký hiệu là Y và nằm ở vế trái của phương trình. Biến phụ thuộc còn được gọi là biến được giải thích (explained variable) hay biến phản ứng.
Biến độc lập: là biến số được cho là có tác động đến biến phụ thuộc, thường ký hiệu là X và nằm ở vế phải của phương trình. Bỉến độc lập còn được gọi là biến giải thích (explanatory variable) hay biến điều khiển (control variable).
Các biến số phụ thuộc và độc lập đưa vào mô hình phải là các biến có giá trị là quan sát được, chẳng hạn năng suất lúa là 5 tấn/hec ta, lạm phát năm 2010 là 15%, hay thu nhập một hộ gia đình là 5 triệu đồng/tháng… Việc nhận biết biến phụ thuộc và biến độc lập trong nhiều bài toán cụ thể là khá đơn giản, chẳng hạn khi ta quan tâm đến lạm phát và muốn đánh giá tác động của cung tiền lên lạm phát thì lạm phát sẽ là biến phụ thuộc và cung tiền là biến độc lập. Hay khi quan tâm đến tác động của trình độ học vấn lên mức thu nhập thì mức thu nhập sẽ là biến phụ thuộc và trình độ học vấn là biến độc lập.
+ Thành phần thứ hai là Hệ số, hay Hệ số hồi quy (cũng là các tham số): gắn liền với các biến độc lập thể hiện mối quan hệ giữa biến phụ thuộc – biến độc lập. Sử dụng các chữ cái Hy Lạp như α, β, γ… hoặc đánh số β1, β2... để kí hiệu cho hệ số hồi quy.
Lưu ý: Hệ số β2 gắn với một biến độc lập thực sự trong mô hình là biến X, còn hệ số β1 thì không. Hệ số β1 còn gọi là hệ số chặn.
+ Thành phần thứ ba là Sai số ngẫu nhiên: đại diện cho các yếu tố hay các biến số khác, ngoài X, có tác động đến Y. Sai số ngẫu nhiên được ký hiệu là u, v.
Trong mô hình tổng thể, sai số ngẫu nhiên là rất quan trọng và luôn phải có, vì những nguyên nhân sau:
+ Lý thuyết chưa đầy đủ: trong kinh tế xã hội, các lý thuyết không thể bao quát đầy đủ tất cả các yếu tố tác động đến một biến phụ thuộc.
+ Sự hạn chế của số liệu: có những yếu tố cần đưa vào thành biến nhưng không có số liệu hoặc không đầy đủ hoặc có số liệu nhưng vẫn có sai sót.
+ Tầm quan trọng của biến: những biến có ảnh hưởng ít thường không cần đưa vào mô hình.
Ví dụ: Một công ty xuất nhập khẩu lương thực muốn nghiên cứu Lượng xuất khẩu gạo phụ thuộc vào giá bán của loại gạo đó như thế nào.
Ở đây sẽ có 2 biến gồm: biến phụ thuộc là lượng xuất khẩu gạo, kí hiệu là Q và biến độc lập là giá bán của loại gạo đó, kí hiệu là P.
Mô hình hồi quy tổng thể:
= + + u
(iii)2.2.1.3. Hàm hồi quy tổng thể
Hàm hồi quy tổng thể (PRF – Population Regression Function) là hàm số thể hiện mối quan hệ giữa trung bình giữa biến phụ thuộc và biến độc lập, xác định trên toàn bộ tổng thể.
Hàm hồi quy tổng thể cho chúng ta biết giá trị trung bình của biến phụ thuộc Y thay đổi như thế nào theo biến độc lập X.
Trong mô hình hồi quy tổng thể chúng ta không có các quan sát về sai số ngẫu nhiên u (còn gọi là sai số ngẫu nhiên không quan sát được). Do đó, để hàm hồi quy có ý nghĩa, cần đưa ra giả thiết cho thành phần sai số ngẫu nhiên là tại mỗi giá trị của X thì kỳ vọng của u bằng 0: E(u\X) = 0
Với giả thiết E(u\X) = 0, ta có thể lấy kỳ vọng 2 vế mô hình hồi quy tổng thể, ta có:
E(Y\X) = +
Trong đó E(Y\X) là kỳ vọng của biến Y khi biết giá trị của biến X, hay còn gọi là kỳ vọng của Y với điều kiện X.
Các hệ số hồi quy và còn được gọi là các tham số của tổng thể, có ý nghĩa như sau:
được gọi là hệ số chặn, cho biết giá trị trung bình của biến phụ thuộc Y khi biến độc lập X nhận giá trị bằng 0: E(Y\X = 0) =
được gọi là hệ số góc, thể hiện quan hệ giữa biến độc lập và giá trị trung bình của biến phụ thuộc, cho biết khi X thay đổi 1 đơn vị thì trung bình của Y thay đổi như thế nào và bao nhiêu?
Nếu = 0: X không ảnh hưởng đến Y, Y không phụ thuộc X hay khi X thay đổi thì Y không thay đổi.
Nếu ≠ 0: X có ảnh hưởng đến Y, Y có phụ thuộc X hay khi X thay đổi thì Y có thay đổi và sự thay đổi còn tùy thuộc dấu hệ số
> 0: X và Y có quan hệ cùng chiều, khi biến độc lập X tăng (giảm) một đơn vị thì giá trị trung bình của biến phụ thuộc Y tăng (giảm) đơn vị.
< 0: X và Y có quan hệ ngược chiều, khi biến độc lập X tăng (giảm) một đơn vị thì giá trị trung bình của biến phụ thuộc Y giảm (tăng) | | đơn vị.
Ví dụ 1: Giải thích ý nghĩa kinh tế của các hệ số hồi quy trong hàm hồi quy sau:
E(CT\TN) = 2,15 + 0,75TN
Với CT: chi tiêu, TN: thu nhập hộ gia đình (đơn vị: triệu đồng/tháng).
= 2,15: khi thu nhập các hộ bằng 0 thì chi tiêu trung bình (mức tiêu dùng tự định trung bình) là 2,15 triệu đồng/tháng.
= 0,75 > 0: khi thu nhập các hộ tăng hoặc giảm 1 triệu đồng/tháng thì chi tiêu trung bình các hộ sẽ tăng hoặc giảm 0,75 triệu đồng/tháng (khuynh hướng tiêu dùng cận biên của các hộ là 0,75 triệu đồng/tháng), còn khuynh hướng tiết kiệm cận biên là 1 – 0,75 = 0,25 triệu đồng/tháng.
Ví dụ 2:
Xét tổng thể giả định gồm 30 hộ gia đình với các mức chi tiêu và thu nhập hàng tháng được cho trong bảng dưới đây:
Bảng II-1.Thu nhập và chi tiêu của hộ gia đình
Đơn vị: triệu đồng Chi tiêu Thu nhập 5 6 7 8 9 3,8 1 1 4,3 3 1 2 2 4,8 1 2 2 5,3 3 1 1 6,3 1 3 1 2 7,3 2 1 E(CT\TN) 4,3 4,8 5,3 5,8 6,3
Các giá trị trong bảng được trình bày như sau: ví dụ với cột thứ nhất, với lượng thu nhập là 5 triệu đồng/tháng/hộ thì có 1 hộ có lượng chi tiêu là 3,8 triệu đồng/tháng. Có 3 hộ gia đình có cùng mức thu nhập là 5 triệu đồng/tháng và chi tiêu là 4,3 triệu, có 1 hộ có cùng mức thu nhập là 5 triệu đồng/tháng và chi tiêu là 4,8 triệu
Tại các mức thu nhập ta có thể tính được chi tiêu trung bình: ( | = 5) =1 ∗ 3,8 + 3 ∗ 4,3 + 1 ∗ 4,8
1 + 3 + 1 = 4,3
Để tính hai hệ số ta chỉ cẩn tối thiểu 2 phương trình: E(CT\TN = 5)= + . 5 = 4,3 E(CT\TN = 6)= + . 6 = 4,8
= 1,8 ; = 0,5
Từ kết quả trên ta có hàm hồi quy tổng thể: E(CT | TN) =1,8 + 0,5TN.
Nếu tăng thu nhập thêm 1 triệu đồng/tháng thì chi tiêu trung bình sẽ gia tăng 0.5 triệu đồng/tháng – con số này cho phép đánh giá tác động của thu nhập lên chi tiêu của các hộ gia đình.
Khi lượng thu nhập bằng 0 thì chi tiêu trung bình (tiêu dùng tự định) là 1,8 triệu đồng/tháng.
Khi thu nhập bằng 10 triệu đồng/tháng thì chi tiêu trung bình là 6,8 triệu đồng/tháng. Đây chính là bài toán dự báo về giá trị trung bình của biến phụ thuộc: hộ gia đình có thể dự báo được rằng nếu thu nhập là TNi cụ thể nào đó thỉ chi tiêu trung bình sẽ đạt được là bao nhiêu.
=> Ứng dụng của phân tích hồi quy
Phân tích hồi quy cho phép:
1. Đánh giá tác động của biến độc lập lên giá trị trung bình của biến phụ thuộc. 2. Kiểm nghiệm các lý thuyết kinh tế về mối quan hệ phụ thuộc giữa các biến số. 3. Thực hiện dự báo về giá trị của biến phụ thuộc khi biết giá trị của biến độc lập. Chú ý: phân tích hồi quy quan tâm chủ yếu đến các mối quan hệ nhân quả chứ không phải các mối quan hệ thống kê thuần túy. Ngoài ra, cũng cần nhắc lại rằng mối quan hệ nhân quả này được xác lập ngoài mô hỉnh, dựa trên lý thuyết kinh tế hoặc suy diễn lôgic. Chẳng hạn cầu về lao động của doanh nghiệp phụ thuộc vào mức lương, dư nợ tín dụng phụ thuộc vào lãi suất, năng suất lao động phụ thuộc vào số năm kinh nghiệm của người lao động, Các mối quan hệ phụ thuộc này được xác lập sẵn trước khi xây dựng mô hình hồi quy, và mô hình hồi quy dùng giúp định lượng mối quan hệ này.
2.2.2 Mô hình hồi quy mẫu
Thông thường thì rất khó để có được số liệu cho toàn bộ tổng thể, do đó để ước lượng được giá trị của các hệ số trong hàm hồi quy, người ta sẽ ước tính thông qua số liệu mẫu. Điều này dẫn đến khái niệm hàm hồi quy mẫu.
(iv)2.2.2.1. Mẫu ngẫu nhiên
Mẫu ngẫu nhiên là một bộ phận rút ra từ tổng thể vẫn chứa đựng vấn đề nghiên cứu một cách ngẫu nhiên. Số lượng phần tử trong mẫu thường được xác định trước, tùy theo mục đích nghiên cứu và các điều kiện như không gian, thời gian, nguồn lực.
Số lượng phần tử trong mẫu gọi là kích thước mẫu, kí hiệu là n.
Ví dụ: Nghiên cứu mối quan hệ thu nhập – chi tiêu của các hộ gia đình ở Việt Nam
năm 2014.
Tổng thể: tất cả các hộ gia đình trên phạm vi nước Việt Nam chỉ trong năm 2014. Tuy nhiên do số hộ lớn và kinh phí điều tra lớn nên ta chỉ thực hiện điều tra một số hộ. Như bộ số liệu VHLSS 2014 được thực hiện với kết quả thông tin thu được của 9.399 hộ.
Hình II-2. Ví dụ về mẫu ngẫu nhiên
Trong hình tổng thể là là toàn bộ các hộ gia đình năm 2014; Mẫu ngẫu nhiên là là số các hộ gia đình được lựa chọn ngẫu nhiên để điều tra. Có vô số mẫu có thể rút ra từ tổng thể với các kích cỡ khác nhau.
(v)2.2.2.2. Mô hình hồi quy mẫu
Mô hình hồi quy mẫu (SRM – Sample Regression Model): Là phương trình biểu diễn mối quan hệ giữa một biến phụ thuộc (Y) với một biến độc lập (X) xác định trên một mẫu ngẫu nhiên có dạng như sau:
= + +
Với các quan sát cụ thể, ta có thể viết: Tổng thể
Mẫu 2
= + + Trong đó i = 1, 2,…, n với n là kích thước mẫu.
Trong mô hình hồi quy có 3 thành phần: Biến số, Hệ số, Phần dư. + Biến số: bao gồm biến phụ thuộc và biến độc lập.