Bài giảng Kinh tế lượng: Chương 2 - Giới thiệu hàm hồi quy đưa ra một số khái niệm, hàm hồi quy tổng thể PRF, hàm hồi quy mẫu SRF, phân biệt các dạng quan hệ trong phân tích hồi quy, tuyến tính trong hồi quy, hàm hồi quy hai biến.
Trang 1Nguyen Minh Duc 2009 1
KINH TẾ LƯỢNG
GIỚI THIỆU HÀM HỒI QUY
TS Nguyễn Minh Đức
Một số khái niệm
l Tổng thể: là tập hợp tất cả những cá thể hay những nhân tố cĩ
cùng 1 hoặc vài đặc tính chung
Ví dụ: tập hợp tất cả những người Việt nam đang theo học các trường Trung cấp, cao đẳng và đại học là tổng thể của sinh viên Việt nam
l Mẫu: là tập hợp con của tổng thể hay nĩi cách khác mẫu là những
phần tử được rút ra từ tổng thể
Ví dụ: những sinh viên của Trường đại học Mở thành phố Hồ Chí Minh là 1 mẫu của tổng thể sinh viên Việt nam
l Phân tích hồi qui: quan tâm mối liên hệ của biến phụ thuộc với 1
hay nhiều biến giải thích (biến độc lập) qua việc ước lượng hay dự
đốn giá trị trung bình của tổng thể
Hay nĩi cách khác: kết quả phân tích hồi qui cĩ thể được dùng
để ước lượng hay dự đốn giá trị trung bình của 1 biến dựa trên số
Trang 2TS Nguyễn Minh Đức 2009 3
Một số khái niệm
Biến phụ thuộc và biến độc lập cịn cĩ 1 số tên gọi khác:
l Biến phụ thuộc hay cịn được xem như là biến được giải thích,
biến được dự báo, biến được hồi qui, biến phản ứng, biến nội sinh Giá trị của biến phụ thuộc thường được tìm kiếm và phân tích sau khi kết thúc hồi qui
l Biến độc lập hay cịn gọi là biến giải thích, biến dự báo, biến hồi
qui, biến tác nhân hay biến kiểm sốt, biến ngoại sinh
l Đường hồi qui: là đường tập hợp (trình diễn) những giá trị (ước
lượng) trung bình của biến phụ thuộc dựa vào giá trị đã biết của biến giải thích (vẽ đường hồi qui)
l Hàm hồi qui tổng thể (population regression function) PRF
Cho thấy mối liên hệ giữa biến phụ thuộc và biến giải thích dựa trên số liệu đã biết của tồn bộ tổng thể Hàm hồi qui tổng thể cĩ thể
dự đốn được giá trị chính xác của biến phụ thuộc
Hàm hồi qui tổng thể PRF
l Ví dụ: khi phân tích mối liên hệ giữa giá trị xuất nhập khẩu và thuế nhập khẩu đối với mặt hàng xe hơi được nhập khẩu vào Việt nam
l Đểxây dựng được hàm hồi qui này, phải thu thập số liệu về thuế nhập khẩu do Việt nam áp đặt đối với tất cả xe hơi được nhập khẩu từ các nước trên thế giới, đồng thời tìm giá trị nhập khẩu của tất cả xe hơi nhập khẩu
l Trong thực tế, đối với những nghiên cứu về kinh tế xã hội rất khĩ thu thập được số liệu của tồn bộ tổng thể
l Ví dụ: khi phân tích mối liên hệ giữa chiều cao của cha và con trên lãnh thổ Việt Nam Những người tiến hành nghiên cứu
khơng thể thu thập được số liệu về chiều cao của tất cả người cha trên tồn lãnh thổ Việt Nam
l Hàm hồi qui tổng thể cĩ thể được nĩi tĩm gọn như hồi qui tổng thể
Trang 3TS Nguyễn Minh Đức 2009 5
Hàm hồi quy tổng thể Y= β 1 + β 2 X +ε i
0
100
200
300
400
500
600
0 100 200 300 400 500 600 700 800 900
Thu nhập khả dụng, X (XD)
Xi
E(Y/Xi)= β 1 + β 2 Xi
Yi= β 1 + β 2 Xi + ε i
ε i
Y = E(Y/Xi)
Yi
β 1
β 2
Thu nhập X (XD)
Hàm hồi qui mẫu SRF
l Hồi qui mẫu (Sample Regression function): cho thấy mối liên hệ giữa biến phụ thuộc với biến giải thích dựa trên giá trị trung bình của tổng thể hay giá trị ñã biết của mẫu
l Do khó khăn trong việc tìm kiếm giá trị của tổng thể hay những giới hạn về tài chính và nguồn lực trong quá trình tiến hành nghiên cứu, những mẫu nghiên cứu sẽ ñược quan sát và phân tích thay cho giá trị của tổng thể
l Dựa vào ví dụ trên về chiều cao của cha và con, sau khi tiến hành thu thập
số liệu mẫu về chiều cao của 1000 cặp cha và con sống ở các nơi trên lãnh thổ Việt nam Hàm hồi qui được xây dựng trên mẫu này với 1000 quan sát được gọi là hàm hồi qui mẫu
l Một trong những mục tiêu của phân tích hồi qui là tìm giá trị ước lượng gần với giá trị thực tế hoặc giá trị tổng thể, mặc dù không biết trước được giá trị thật của tổng thể Hay nói cách khác giá trị càng gần với b1, b2 thì kết quả hồi qui càng tốt hay , có thể đưa hàm hồi qui ứng dụng vào thực tế Dựa vào biểu đồ trên, nếu đường hồi qui mẫu (SRF) càng gần với đường hồi qui tổng thể thì kết quả hồi qui càng có giá trị cao
Trang 4TS Nguyễn Minh Đức 2009 7
0 100
200
300
400
500
0 100 200 300 400 500 600 700 800 900
Thu nh
?
?d
?
Thu nhập X
(PRF) (SRF)
Xi
Yi
E(Y/Xi) Yi
e i
uii
1
Phân biệt các dạng quan hệ trong phân tích hồi qui
Quan hệ thống kê và quan hệ hàm số:
l Giả sử hàm số y có dạng sau đây: y = a + bX1
l Nếu giá trị của X1thay đổi thì chỉ cho duy nhất 1 giá trị của y Quan hệ hàm số thường gặp ở một số ngành khoa học tự nhiên: vật lý, hóa học
l Ví dụ: trong thí nghiệm hóa học, mỗi lần thay đổi thành phần của nhân tố hóa học thì chỉ cho 1 kết quả duy nhất, hay chỉ cho 1 hợp chất mới duy nhất
l Đối với quan hệ thống kê: từ ví dụ trên, nếu thay đổi giá trị của X thì y có thể nhận nhiều giá trị khác, không thể biết giá trị chính xác Đó là do sự tác động của nhiều yếu tố khác hoặc nhiều biến khác Trong thực tế những biến ngẫu nhiên này rất khó nhận dạng ñược
l Ví dụ: khi tiến hành thí nghiệm về ảnh hưởng của phân bón đối với năng suất của cây trồng Có thể kết luận năng suất của cây trồng có thể tăng, giảm hay mất hoàn toàn bởi vì do ảnh hưởng của rất nhiều nhân tố như thiên tai (nắng, mưa,…) hoặc dịch hại (côn trùng, sâu, rầy…) Những nhân tố này rất khó kiểm soát trong quá trình nghiên cứu, vì vậy mối quan hệ trong thí nghiệm trên ñược gọi là mối quan hệ thống kê
Trang 5TS Nguyễn Minh Đức 2009 9
Phân biệt các dạng quan hệ trong phân tích hồi qui
Quan hệ hồi qui và nhân quả
l Trong mối quan hệ nhân quả cĩ 1 tác nhân gây ra biến động hoặc ảnh hưởng đến những biến khác
l Ví dụ: số người hút thuốc lá cao thì số bệnh nhân bị ung thư phổi cao, mối quan hệ này cĩ thể nĩi là mối quan hệ nhân quả vì thuốc lá là tác nhân gây ra bệnh ung thư
l Mặc dù trong phân tích hồi qui cũng quan tâm đến mối liên hệ giữa 2 biến số với nhau nhưng phân tích hồi quy khơngphải luơn bao hàm quan hệ nhân quả, vì cịn rất nhiều yếu tố hay biến số khác ảnh hưởng đến mối liên hệ này
l Ngồi ra trong phân tích hồi qui cĩ 1 sai lầm là quy kết mối quan hệ nhân quả giữa hai biến số trong khi thực tế chúng đều là hệ quả của một nguyên nhân khác
l Ví dụ: khi phân tích hồi qui tìm mối liên quan giữa số lượng tivi tính trên đầu người và tuổi thọ Kết quả nghiên cứu đã tìm thấy, số lượng tivi tính theo đầu người và tuổi thọ cĩ quan hệ đồng biến, nếu số lượng tivi tính theo đầu người càng cao thì tuổi thọ của người dân càng cao Tuy nhiên mối quan hệ này khơng phải là quan hệ nhân quả, số lượng tivi trên đầu người khơng thể làm cho tuổi thọ tăng lên hay giảm đi
Phân biệt các dạng quan hệ trong phân tích hồi qui
Quan hệ hồi qui và tương quan
l Phân tích tương quan khơng quan tâm đến mối liên hệ nhân quả
l Mục đích chính của phân tích tương quan là đo mức độ mạnh, yếu trong mối liên hệ tuyến tính giữa 2 biến
l Trong khi đĩ phân tích hồi qui khơng đo lường mức độ liên hệ giữa 2 biến mà chủ yếu ước lượng hay dự đốn giá trị trung bình của 1 biến (biến phụ thuộc) dựa trên giá trị đã biết của những biến khác
l Khi tiến hànhhồi qui cần cĩ sự phân biệt biến nào là biến độc lập và biến nào là biến phụ thuộc, nhưng trong phân tích tương quan khơng cần phân biệt những biến này
l Ví dụ: phân tích tương quan của 2 nghiên cứu sau là tương tự nhau
Nghiên cứu tương quan giữa điểm mơn tốn và bài kiểm tra mơn thống kê Cũng giống như nghiên cứu tương quan giữa điểm mơn thống kê và bài kiểm tra tốn
l Ngồi ra, những lý thuyết tương quan thường giả định những biến số
đang nghiên cứu là ngẫu nhiên Trong khi lý thuyết hồi qui giả định biến phụ thuộc cĩ tính chất suy đốn và biến giải thích là đã được
Trang 6TS Nguyễn Minh Đức 2009 11
Tuyến tính trong hồi qui
l Trong hồi qui, mô hình tuyến tính hay hàm tuyến tính đối với biến khi biến độc lập (biến giải thích) có hệ số mũ bằng 1
l Mô hình tuyến tính đối với tham số khi tất cả các tham số của
mô hình có hệ số mũ bằng 1, hệ số mũ của biến có thể nhận bất kỳ giá trị nào
X; Y = a + bX2; Y = a + b (1/X)
l Mô hình sau đây ñược gọi là tuyến tính đối với biến: Y =a + bX; Y=a2+bX; Y = a + b3X
tham số, không dựa vào biến số
Hàm hồi quy hai biến
Hàm hồi qui tổng thể (PRF)
E(Y/Xi ) = f(Xi ) = b1+ b2Xi hoặc Yi= b1+ b2Xi+ ui
l ui= Yi- E(Y/Xi)
b1, b2là các tham số của hàm hồi qui, giá trị của b1, b2 cần phải tìm
và ước lượng trong quá trình hồi qui
b1: hệ số tung độ (intercept coefficient)
b2: hệ số gốc (slope coefficient)
u i : sai số hồi qui hay sai số ngẫu nhiên Nguyên nhân tạo nên sai
số này là do sai sót trong quá trình thu thập thông tin, số liệu, hoặc
do mô hình hồi qui không thích hợp, ngoài ra còn do các tác động khác không dự trù được
X: biến giải thích, giá trị của X đã biết hoặc quan sát được
Trang 7TS Nguyễn Minh Đức 2009 13
Giả sử khi quan sát số lượng cá tra xuất khẩu
và thuế nhập khẩu hàng năm trong giai đoạn 2005-2009
l i = 5 tượng trưng cho 5 quan sát trong 5 năm
l Y1= b1+ b2X1 + u 1 i=1, giá trị quan sát trong năm 2005
l Y2= b1+ b2X2 + u 2 i=2, giá trị quan sát trong năm 2006
l Y3= b1+ b2X3 + u 3 i=3, giá trị quan sát trong năm 2007
l Y4= b1+ b2X4 + u 4 i=4, giá trị quan sát trong năm 2008
l Y5= b1+ b2X5 + u 5 i=5, giá trị quan sát trong năm 2009
Hàm hồi quy hai biến
: giá trị ước lượng của biến phụ thuộc cho tổng thể Y
: biến giải thích, giá trị đã được biết trước
: ước lượng tham số của b1, b2, giá trị của cần phải ước
lượng trong quá trình hồi qui
Khi thêm biến ngẫu nhiên hay sai số ngẫu nhiên vào hàm số,
hàm hồi qui bây giờ là hàm hồi qui tổng thể:
Yi= b1+ b2Xi + ei
ei: ước lượng của sai số ngẫu nhiên, hay nói cách khác eilà khoảng chênh lệch giữa giá trị thực và giá trị ước lượng của Y
eicó thể nhận giá trị dương hoặc âm
i 2 1
Yˆ =β +β
i
Yˆ
i
X
2
1,ˆ
β
Hàm hồi qui mẫu (SRF)’’’
Trang 8TS Nguyễn Minh Đức 2009 15
Phương pháp bình phương tối thiểu
(Ordinary Least squares)
Thuộc tính của hệ số ước lượng
Hệ số ước lượng của hàm hồi qui có thuộc tính tuyến
tính không chệch tốt nhất (BLUE)
l Ước lượng tối ưu: có phương sai tối thiểu2
^
2 β
β =
E
Phương pháp bình phương tối thiểu
(Ordinary Least squares)
Giả định
1. Mô hình hồi qui tuyến tính
2. Giá trị của X được giữ cố định trong những lần lặp lại
mẫu
3. Giá trị kì vọng của biến số ngẫu nhiên=0
(Homoscedasticity)
ngẫu nhiên
6. Không có tương quan giữa uivà Xi
8. Giá trị của X phải có biến động
9. Mô hình hồi qui được giả định là chính xác
varu i X i δ
E
covu i u j =
( ) 0 cov u i X i =
Trang 9TS Nguyễn Minh Đức 2009 17
Phương pháp bình phương tối thiểu
(Ordinary Least squares)
tổng bình phương sai số có giá trị nhỏ nhất
i 2 1 i i
i
n
1
i
i 2 1 i n
1
i
2
i Y ˆ ˆ X
∑
=
(Y ˆ ˆ X ) 2 e 0 2
ˆ
1 i i n
1 i
i 2 1 i 1
n
1
i
2
i
=
−
= β β
−
−
=
β
∂
∂
∑
∑
∑
=
=
=
(Y ˆ ˆ X )X 2 e X 0 2
ˆ
1 i i i i
n
1 i
i 2 1 i 2
n
1
i
2
i
=
−
= β β
−
−
= β
∂
∂
∑
∑
∑
=
=
=
(3.7)
(3.8)
Phương pháp bình phương tối thiểu
(Ordinary Least squares)
∑
∑Yi=nβˆ1+βˆ2 Xi
∑
∑
i 2 i 1 i
Y
X Y
^ 2
^
∑
∑
=
=
−
−
−
=
1 i
2 i
n
1
i
i i
2
X X
X X Y Y
Y Y
yi = i−
∑
=
=
n
1
i
i i 2
x y ˆ
Trang 10TS Nguyễn Minh Đức 2009 19
Phương pháp bình phương tối thiểu
(Ordinary Least squares)
Thuộc tính thống kê của OLS estimators
sát (Xi,Yi), có thể được tính toán dễ dàng
thay đổi theo mẫu dùng để ước lượng
OLS estimates đạt được từ mẫu, do đó đường hồi qui mẫu
có thuộc tính:
1. Giá trị trung bình của sai số eibằng 0
của Yi
của Yi
4. Giá trị trung bình của ước lượng bằng giá trị trung bình
thực của Y
5. đi qua giá trị trung bình của dữ liệu graph 1.ppt
2
1,ˆ
β
X ˆ ˆ
Y β1 β2
( )Yˆ Y
E e i =
∑
=
=
n 1 i i
i Y 0 e
2
1,ˆ
ˆ β
β