Mục đích của phân tích hồi qui• Ước lượng giá trị trung bình của biến phụ thuộc khi biết giá trị của biến độc lập, tức là phải ước lượng các tham số của mô hình.. • Kiểm định các giả th
Trang 1BÀI GIẢNG
KINH TẾ LƯỢNG
ECONOMETRICS
Lê Anh Đức Khoa Toán kinh tế
ĐH Kinh tế Quốc dân
Trang 2CHƯƠNG I: MÔ HÌNH HỒI QUY HAI BIẾN , MỘT VÀI TƯ TƯỞNG CƠ BẢN
1.1 Phân tích hồi quy
a Bản chất của phân tích hồi quy
b Phân tích hồi quy và các quan hệ khác
1.2 Bản chất nguồn số liệu cho phân tích hồi quy
a Các loại số liệu
b Nguồn gốc các số liệu
c Bản chất chung của số liệu kinh tế – xã hội
1.3 Mô hình hồi quy tổng thể
1.4 Sai số ngẫu nhiên và bản chất của nó
Trang 31.1 Phân tích hồi quy (regression analysis)
a Bản chất của phân tích hồi quy
• Thuật ngữ “hồi quy” được Francis Galton sử dụng
vào năm 1886
• Là phân tích mối liên hệ phụ thuộc giữa một biến gọi
là biến phụ thuộc (dependent variable) vào một hoặc một số biến khác gọi là biến giải thích (explanatory
variable)
Biến phụ thuộc, ký hiệu là Y
Trang 4Thí dụ: “Luật Francis Galton - Karl Pearson”
• Vấn đề: nghiên cứu mối liên hệ phụ thuộc giữa chiều cao của các cháu trai vào chiều cao của các ông bố.
Y = chiều cao của các cháu trai (inches)
X = chiều cao của các ông bố (inches)
• Đồ thị (tham khảo giáo trình trang 10) Đồ thị này được vẽ với một tổng thể giả định.
Trang 5• Kết quả nghiên cứu của F.Galton – K.Pearson :
- Với chiều cao đã biết của người bố thì chiều cao của các cháu trai sẽ là một khoảng, dao động quanh giá trị trung bình;
- Chiều cao của người bố tăng thì chiều cao của các cháu trai cũng tăng (hệ số góc lớn hơn 0);
- Với nhóm các ông bố có chiều cao nhỏ (thấp) thì chiều cao trung bình của các cháu trai cao hơn bố Ngược lại, với nhóm các ông bố có chiều cao lớn (cao) thì chiều cao trung bình của các cháu trai thấp hơn bố (hệ số góc nhỏ hơn 1)
Trang 6Các thí dụ khác
• Chi cho tiêu dùng cá nhân – thu nhập khả dụng
• Mức cầu – giá
• Tỷ lệ thay đổi của tiền lương – tỷ lệ thất nghiệp
• Tỷ lệ tiền mặt nắm giữ trong tổng thu nhập – tỷ lệ lạm phát
• Mức cầu – mức chi cho quảng cáo
• Sản lượng của một loại nông sản – lượng phân bón, lượng mưa, nhiệt độ, v.v…
Trang 7Mục đích của phân tích hồi qui
• Ước lượng giá trị trung bình của biến phụ thuộc khi biết giá trị của biến độc lập, tức là phải ước lượng các tham
số của mô hình
• Kiểm định các giả thuyết về bản chất của mối quan hệ giữa biến phụ thuộc và biến độc lập mà lý thuyết kinh tế đưa ra Trong trường hợp này phải trả lời hai câu hỏi:
- Có tồn tại quan hệ giữa biến phụ thuộc và biến độc lập hay không?
- Nếu tồn tại quan hệ thì mức độ chặt chẽ như thế nào?
• Dự báo giá trị trung bình của biến phụ thuộc khi biết giá trị của biến độc lập.
Trang 8b Phân tích hồi quy và các quan hệ khác
Phân tích hồi quy nghiên cứu quan hệ thống kê (statistical relationship)
Ta phân biệt với các quan hệ sau:
• Phân tích hồi quy và quan hệ hàm số (functional relationship)
• Phân tích hồi quy và phân tích tương quan (correlation analysis)
• Phân tích hồi quy và quan hệ nhân quả (causation relationship)
Trang 9• Phân tích hồi quy và quan hệ hàm số
- Trong quan hệ hàm số:
+ Ứng với mỗi giá trị của biến độc lập cho duy nhất một giá trị của biến phụ thuộc
+ Các biến không phải là các biến ngẫu nhiên
- Trong phân tích hồi quy
+ Ứng với mỗi giá trị cho trước của biến độc lập có thể có nhiều giá trị khác nhau của biến phụ thuộc.+ Các biến là các biến ngẫu nhiên
Trang 10• Phân tích hồi quy và phân tích tương quan
- Phân tích tương quan
+ Đo mức độ kết hợp tuyến tính giữa hai biến bằng hệ số tương quan
+ Các biến có tính chất đối xứng
- Trong phân tích hồi quy
+ Ước lượng và dự báo một biến trên cơ sở giá trị
đã cho của các biến khác
+ Các biến không có tính chất đối xứng
Trang 11• Phân tích hồi quy và quan hệ nhân quả
- Quan hệ nhân quả là hệ hai chiều giữa hai đối tượng trong đó vai trò của các đối tượng được xác định rõ đâu là nguyên nhân và đâu là kết quả
- Trong phân tích hồi quy biến giải thích không nhất thiết là nguyên nhân gây lên biến phụ thuộc, mối quan hệ giữa các biến được xác lập tuỳ thuộc vào mục đích nghiên cứu
Trang 121.2 Bản chất nguồn số liệu cho phân tích
hồi quy
a Các loại số liệu
• Số liệu theo thời gian (Time series data)
Ví dụ: CPI, GDP,…
• Số liệu chéo (Undate – Cross section data)
Ví dụ: Doanh thu, lợi nhuận (của các DN)
• Số liệu kết hợp (Pooled data)
• Số liệu bảng (Panel data)
Trang 14c Bản chất chung của số liệu KT – XH
• Phần lớn là các số liệu phi thực nghiệm, mang tính ngẫu nhiên, kém tin cậy.
• Có sẵn để thu thập, tính toán phù hợp với mục đích nghiên cứu.
Ghi nhớ: Kết quả của nghiên cứu sẽ không chỉ phụ thuộc vào mô hình được lựa chọn mà còn phụ thuộc rất nhiều vào chất lượng của số liệu.
Trang 151.3 Mô hình hồi qui tổng thể
• Tổng thể (Population) là toàn bộ tập hợp các phần tử đồng nhất theo một dấu hiệu nghiên cứu định tính hoặc định lượng nào đó
• Giả sử có một tổng thể nghiên cứu gồm N phần tử với hai dấu hiệu nghiên cứu X, Y tạo thành một biến ngẫu nhiên hai chiều (X, Y).
• Để nghiên cứu BNN (X, Y) ta lập các bảng phân phối xác suất.
• Tham khảo thí dụ 1.3 trang 14, sách bài giảng
Trang 16• Bảng phân phối xác suất đồng thời của X và Y
Y1 P(Y1, X1) P(Y1, X2) … P(Y1, Xk)
Y2 P(Y2, X1) P(Y2, X2) … P(Y2, Xk)
Trang 17• Các bảng phân phối xác suất có điều kiện của Y theo Xi (i
= 1, 2, …, k)
• Kỳ vọng toán của Y với điều kiện của Xi:
• E(Y/Xi) là một hàm số và gọi là hàm hồi quy tổng thể của
Y đối với X i (Population Regression Function – PRF) Nó cho biết giá trị trung bình của Y thay đổi như thế nào theo
X
(Y/Xi) Y1 Y2 … YhP(Y/Xi) P(Y1, Xi) P(Y2, Xi) … P(Yh, Xi)
Trang 18• Nếu hàm hồi quy tổng thể có một biến độc lập thì gọi là hàm hồi quy đơn - Simple regression.
E(Y/Xi) = f(Xi)
• Nếu hàm hồi quy tổng thể có hơn một biến độc lập thì gọi là hàm hồi quy bội - Multiple regression
E(Y/X1i, X2i,…) = f(X1i, X2i, …)
)
Trang 19• Giả sử PRF có dạng tuyến tính:
hoặc
• Hàm này gọi là hàm hồi quy tuyến tính đơn
• Trong đó:
gọi là hệ số chặn (intercept coefficient)
gọi là hệ số góc (slope coefficient)
Trang 20• Tại một giá trị cá biệt của Yi ta có:
gọi là mô hình hồi quy tổng thể (Population Regression Model – PRM)
• Thuật ngữ “tuyến tính” được hiểu theo hai nghĩa
+ Tuyến tính đối với các tham số
+ Tuyến tính đối với các biến số (X, Y)
• Khi nói đến “hàm hồi quy tuyến tính” tức là hàm hồi quy tuyến tính đối với các tham số, nó có thể là tuyến tính hoặc phi tuyến đối với các biến số
Trang 211.4 Sai số ngẫu nhiên và bản chất của nó
• Đặt Ui = Y i – E(Y/X i) gọi là sai số ngẫu nhiên (random errors)
• Sai số ngẫu nhiên đại diện cho tất cả những yếu tố không phải biến độc lập nhưng cũng tác động đến biến phụ thuộc + Những yếu tố không biết
+ Những yếu tố không có số liệu
+ Những yếu tố mà tác động của nó quá nhỏ không mang tính hệ thống
• Sự tồn tại của SSNN là tất yếu khách quan và nó có vai trò đặc biệt quan trọng trong phân tích hồi quy, nó phải thoả mãn những điều kiện nhất định thì thì việc phân tích trên mô hình hồi quy mới có ý nghĩa
Trang 221.5 Hàm hồi qui mẫu
• Trong thực tế chúng ta không có được tổng thể hoặc
có nhưng không thể (không cần thiết) nghiên cứu toàn
bộ tổng thể vì vậy không thể tìm được PRF mặc dù dạng của PRF có thể biết
• Mẫu ngẫu nhiên là một bộ phận mang thông tin của tổng thể được lấy ra từ tổng thể theo những nguyên tắc nhất định
• Giả sử từ tổng thể lập một mẫu ngẫu nhiên (mẫu cụ
thể) kích thước n: W = {(X i ,Y i ) ; i =1÷n}
Trang 23• Trong mẫu tồn tại một hàm số gọi là hàm hồi quy mẫu (Sample Regression Function - SRF) có dạng giống như PRF mô tả xu thế biến động của trung bình biến phụ thuộc theo biến độc lập.
• Thực chất nó là một ước lượng điểm của PRF
Trang 24• Mẫu ngẫu nhiên là ngẫu nhiên
Ước lượng ngẫu nhiên (estimates) của
tham số 1, 2
Ước lượng cụ thể (estimators) của tham
Trang 25• Tại một giá trị cá biệt của Y ta có
gọi là mô hình hồi quy mẫu (Sample Regression Model – SRM)
• Phần dư ei là sai số ngẫu nhiên của mẫu, thực
chất chúng là các ước lượng điểm của các sai số
Trang 26Tổng thể (Population) (Sample) Mẫu
Sai số ngẫu nhiên Ui Phần dư ei
Trang 27Các thuật ngữ cơ bản
Tiếng Anh Tiếng Việt Regression analysis Phân tích hồi quy
Dependent variable Biến phụ thuộc
Explanatory variable/ Independent variable Biến giải thích/ biến độc lập
Time series data Số liệu theo thời gian
Cross section data Số liệu chéo
Pooled data Số liệu kết hợp
Panel data Số liệu bảng
Population Tổng thể
PRF – Population Regression Function Hàm hồi quy tổng thể
PRM - Population Regression Model Mô hình hồi quy tổng thể
Trang 28Các thuật ngữ cơ bản
Tiếng Anh Tiếng Việt Simple regression Hồi quy đơn
Multiple regression Hồi quy bội
Intercept coefficient Hệ số chặn hoặc hệ số tự do
Slope coefficient Hệ số góc
Random error Sai số ngẫu nhiên
SRF – Sample Regression Function Hàm hồi quy mẫu
SRM - Sample Regression Model Mô hình hồi quy mẫu
Estimated regression coefficients Các hệ số hồi quy ước lượng được Residual Phần dư