Định nghĩa Phân tích hồi qui là phân tích mối liên hệ phụ thuộc giữa một biến gọi là biến phụ thuộc biến được giải thích, biến nội sinh phụ thuộc vào một hoặc một số biến khác gọi là các
Trang 1Tham khảo và nâng cao
8 D Gujarati Basic Econometrics Third Edition McGraw-Hill,Inc 1996
9Maddala Introduction to Econometrics New york 1992
Trang 2
Bµi më ®Çu
1 Khái niệm về Kinh tế lượng (Econometrics)
- Nhiều định nghĩa, tùy theo quan niÖm cña mçi t¸c gi¶
- Econo + Metric
Khái niệm: KTL nghiên cứu những mối quan hệ Kinh tế Xã hội; thông qua việc
xây dựng, phân tích, đánh giá các mô hình để cho ra lời giải bằng số, hỗ trợ việc
ra quyết đinh
Econometrics – Pragmatic Economics
- KTL sử dụng kết quả của :
+ Lý thuyết kinh tế+ Mô hình toán kinh tế+ Thống kê, xác suất
2 Phương pháp luận (các bước tiến hành)
2.1 Đặt luËn thuyÕt về vấn đề nghiên cứu
- Xác định phạm vi, bản chất, tính chất của các đối tượng và mối quan hệ giữa chúng
- Xác định mô hình lý thuyết kinh tế hợp lý
2.2 Xây dựng mô hình kinh tế to¸n :
+ Mỗi đối tượng đại diện bởi một hoặc một số biến số
+ Mỗi mối quan hệ: Phương trình, hàm số, bất phương trình…
+ Giá trị các tham số : cho biết bản chất mối quan hệ
2.3 X©y dùng m« h×nh kinh tÕ l-îng t-¬ng øng
- M« h×nh kinh tÕ to¸n: phô thuéc hµm sè
- M« h×nh kinhtÕ l-îng: phô thuéc t-¬ng quan vµ håi quy
2.4 Thu thập số liệu
- Số liệu được dùng : từ thống kê
2.5 Uớc lượng các tham số cña m« h×nh
Với bộ số liệu xác định và phương pháp cụ thể, kết quả ước lượng là những con số cụ thể
2.6 Kiểm định m« h×nh.
- Bằng phương pháp kiểm định thống kê: kiểm định giá trị các tham số, bản chất mối quan hệ
Trang 3_ 3
- Nếu khụng phự hợp : quay lại cỏc bước trờn
- Biến đổi, xõy dựng mụ hỡnh mới để cú kết quả tốt nhất
2.7 Dự bỏo
- Dựa trờn kết quả được cho là tốt : dự bỏo về mối quan hệ, về cỏc đối tượng trong những điều kiện xỏc định
2.8.Kiểm soát và Đề xuất chính sách
- Dựa vào kết quả phân tích của mô hình mà đề xuất chính sách kinh tế
Ví dụ: Nghiên cứu tính quy luật của tiêu dùng.
1 Xây dựng một luận thuyết kinh tế về tiêu dùng
Trong tác phẩm: Lý thuyết về việc làm, lãi suất và tiền tệ, Keynes viết:” Luật tâm lý cơ bản là một ng-ời sẽ tăng tiêu dùng khi thu nhập của ng-ời đó tăng lên, song không thể tăng nhiều bằng mức tăng của thu nhập”
2 Xây dựng mô hình kinh tế toán t-ơng ứng
Có số liệu sau về tổng mức tiêu dùng cá nhân ( Y ) và tỏng thu nhập gộp GDP ( X
) của Mỹ giai đoạn 1980 – 1991 ( đơn vị: tỷ USD ) tính theo giá cố định năm 1987:
Trang 4Chẳng hạn có cơ sở để cho rằng GDP của Mỹ vào năm 1994 là 6000 tỷ USD Lúc đó
có thể tìm đ-ợc một dự báo điểm cho Tổng mức tiêu dùng cá nhân của Mỹ vào năm
đó là:
Yˆ1994 -231,8 + 0,7194*6000 = 4084,6 tỷ USD
Từ đó có thể xây d-ng tiếp các dự báo bằng khoảng tin cậy
8 Kiểm soát hoặc đề xuất chính sách
Chẳng hạn chính phủ Mỹ tin rằng nếu có đ-ợc tổng mức tiêu dùng cá nhân là 4000 tỷ USD thì sẽ duy trì đ-ợc tỷ lệ thất nghiệp ở mức 6,5% Từ đó để duy trì đ-ợc tỷ lệ thất nghiệp nói trên cần phải có đ-ợc GDP là:
GDP ( 4000 + 231,8 )/ 0,7194 5882 tỷ USD
3 Số liệu dựng trong KTL
3.1 Phõn loại
- Số liệu theo thời gian
- Số liệu theo khụng gian
Trang 5_ 5
- Số liệu ngẫu nhiên phi thực nghiệm
- Phù hợp mục đích nghiên cứu
Chó ý: DÆc ®iÓm chung cña c¸c sè liÖu kinh tÕ x· héi lµ kÐm tin cËy
Chương 1 CÁC KHÁI NIỆM CƠ BẢN
1 Phân tích hồi qui – Regression Analysis
1.1 Định nghĩa
Phân tích hồi qui là phân tích mối liên hệ phụ thuộc giữa một biến gọi là biến phụ thuộc (biến được giải thích, biến nội sinh) phụ thuộc vào một hoặc một số biến khác gọi là (các) biến giải thích (biến độc lập, biến ngoại sinh, biến hồi qui).
1.2 Ví dụ Tiªu dïng vµ Thu nhËp
- Biến phụ thuộc (dependent variable) ký hiệu là Y
- Biến giải thích / hồi qui (regressor(s)) ký hiệu là X, hoặc X 2 , X 3…
- Biến giải thích nhận những giá trị xác định, trong điều kiện đó biến phụ thuộc là một biÕn ngẫu nhiên
Phân tích hồi qui nghiên cứu mối liên hệ phụ thuộc giữa biến phụ thuộc Y
mµ thùc chÊt lµ mét biÕn ngÉu nhiªn, phụ thuộc vào các giá trị xác định của (các) biến giải thích như thế nào
X = X i (Y/X i)
1.3 Mục đích hồi qui
- Ước lượng trung bình biến phụ thuộc trong những điều kiện xác định của biến giải thích
- Ước lượng các tham số
- Kiểm định về mối quan hệ
- Dự báo giá trị biến phụ thuộc khi biến giải thích thay đổi
(*)Hồi qui : qui về trung bình
1.4 So sánh với các quan hệ toán khác
- Quan hệ hàm số : x y
Trang 6- Quan hệ tương quan xy
2 Mụ hỡnh hồi qui Tổng thể
- Tổng thể : toàn bộ những cỏ thể mang dấu hiệu nghiờn cứu
- Phõn tớch hồi qui dựa trờn toàn bộ tổng thể
Giả sử biến phụ thuộc Y chỉ phụ thuộc một biến giải thớch X
2.1 Hàm hồi qui tổng thể (PRF : Population Regression Function).
Xột quan hệ hồi qui:
X = X i(Y/X i) Biến ngẫu nhiờn Y trong điều kiện X = X i (i
=1ữn)
1 và 2 đ-ợc gọi là các hệ số hồi quy ( regression coefficient)
Trong đó: 1 = E(Y/Xi = 0): hệ số chặn (INPT : intercept term)
Trang 7Bản chất của SSNN : đại diện cho tất cả những yếu tố khụng phải biến
giải thớch nhưng cũng tỏc động tới biến phụ thuộc:
+ Những yếu tố khụng biết
+ Những yếu tố khụng cú số liệu
+ Những yếu tố không ảnh h-ởng nhiều đến biến phụ thuộc
+ Sai số của số liệu thống kê
3 Mụ hỡnh hồi qui mẫu
- Khụng biết toàn bộ Tổng thể, nờn dạng của PRF cú thể biết nhưng giỏ trị j thỡ khụng biết
- Mẫu : một bộ phận mang thụng tin của tổng thể
- W = {(X i , Y i ), i = 1ữ n} được gọi là một mẫu kớch thước n, cú n quan sỏt (observation).
3.1 Hàm hồi qui mẫu (SRF : Sample Regression Function)
- Trong mẫu W, tồn tại một hàm số mụ tả xu thế biến động của biến phụ
thuộc theo biến giải thớch về mặt trung bỡnh, Yˆ= f ˆ X( ) gọi là hàm hồi qui mẫu (SRF)
- Hàm hồi qui mẫu cú dạng giống hàm hồi qui tổng thể
- Thụng thường Y i ≠ Yˆ i , đặt e i = Y i – Yˆ i và gọi là phần dư (residual).
- Bản chất của phần dư e i giống sai số ngẫu nhiờn u i
Trang 8Yˆ, ˆ1, ˆ2, e i là ước lượng điểm tương ứng của E(Y/X i ), 1, 2, ui
3.3 Mô hình hồi quy mầu – ( SRM: Sample regression model )
Yˆi = ˆ1 + ˆ2 X i + e i
Chương 2 ƯỚC LƯỢNG VÀ Kiểm định Mễ HèNH HỒI QUI
đơn
1 Mụ hỡnh
- Mụ hỡnh hồi qui đơn ( Simple regression ) là mụ hỡnh một ph-ơng trình gồm
một biến phụ thuộc (Y) và một biến giải thớch (X).
Y
1
2 1
2
) ˆ
Lấy đạo hàm riêng của Q theo ˆ1 và ˆ2 và cho bằng 0:
Q/ ˆ1 = -2 (Yi - ˆ1- ˆ2Xi) = 0 Q/ ˆ2 = -2 Xi (Yi- ˆ1- ˆ2Xi) = 0 ˆ n + ˆ X = Y
Trang 9n i i i
x
y x
1 2 1
yˆi = ˆ2xi gọi là hàm hồi quy mẫu đi qua gốc toạ độ
1
ˆ
, ˆ2 ước lượng bằng phương phỏp bỡnh phương nhỏ nhất, gọi là cỏc ước lượng bỡnh phương nhỏ nhất (OLS) của 1 và 2
2.2.Phương phỏp OLS cú cỏc tớnh chất sau:
a SRF đi qua điểm trung bình mẫu ( X , Y )
b Trung bình của các giá trị -ớc l-ợng bằng trung bình mẫu Yˆ Y
i Y ei
1
ˆ = 0
3 Cỏc giả thiết cơ bản của OLS
Một ước lượng sẽ dựng được khi nú là tốt nhất Để ước lượng OLS là tốt nhất thỡ
tổng thể phải thỏa món một số giả thiết sau:
Giả thiết 1: Mô hình hồi quy có dạng tuyến tính đối với tham số.
Giả thiết 2: Biến giải thớch là phi ngẫu nhiờn
Giả thiết 4: Phương sai sai số ngẫu nhiờn bằng nhau Var(u i ) = 2 i
Giả thiết 7: Các giá trị của biến giải thích phải khác nhau càng nhiều càng tốt
Var(X) 0
Trang 10Giả thiết 8: Kích th-ớc mẫu phải lớn hơn số tham số cần -ớc l-ợng của mô hình Giả thiết 9: Mô hình đ-ợc chỉ định đúng.
Giả thiết 10: Không có đa cộng tuyến giữa các biến giải thích của mô hình hồi quy
bội
Định lý: Nếu tổng thể thỏa món cỏc giả thiết trờn thỡ ước lượng OLS sẽ là
ước lượng tuyến tớnh, khụng chệch, tốt nhất (trong số cỏc ước lượng khụng chệch) của cỏc tham số.
4 Cỏc tham số của ước lượng OLS
Cỏc ước lượng ˆj là biến ngẫu nhiờn tựy thuộc mẫu, nờn cú cỏc tham số đặc trưng
Kỡ vọng : E( ˆ1) = 1 E( ˆ2) = 2
1 2 1
n i i
x n
X
Var( ˆ2) = 2
1 2
1
n i i
ˆ= ˆ 2 là độ lệch chuẩn của đường hồi qui : (Se of Regression)
n i i
x n X
1 2 1
x
1 2
Trang 11Y Y y
Y Y y
i i
i i
i i
n
e y
y
1
2 1
2 1
TSS = ESS + RSS TSS (Total Sum of Squares) : đo tổng biến động của biến phụ thuộc ESS (Explained Sum of Squares): tổng biển động của biến phụ thuộc được
giải thớch bởi MH – biến giải thớch
RSS (Residual Sum of Squares) : tổng biến động của biến phụ thuộc được
giải thớch bởi cỏc yếu tố nằm ngoài mụ hỡnh – Sai số ngẫu nhiờn
Đặt R2 =
TSS
RSS TSS
ESS 1 gọi là hệ số xỏc định, 0 R2 1
thuộc được giải thớch bởi biến giải thớch (theo mụ hỡnh, trong mẫu).
6 Hệ số t-ơng quan R :
Là căn bậc hai của hệ số xác định và đo mức độ t-ơng quan tuyến tính giữa Y và X
7 Phân phối xác suất của sai số ngẫu nhiên.
Muốn tiến hành các suy diễn thống kờ, thỡ phải biết phõn phối xỏc suất của cỏc
ước lượng, phõn phối đú tựy thuộc phõn phối xỏc suất của SSNN
Cơ sở của giả thiết này là:
+ Do ui th-ờng là sự tổng hợp của một số lớn các nhân tố ngấu nhiên độc lập và ảnh
h-ởng bế đều nh- nhau nên theo hệ quả của định lý giới hạn trung tâm thì có thể xem là
ui phân phối chuẩn
+ Phân phối chuẩn chỉ có hai tham số là và 2 nên dễ sử dụng
+ Phân phối chuẩn có tính chất là nếu ui phân phối chuẩn thì mọi hàm tuyến tính của
nó cũng phân phối chuẩn
+ Phân phối chuẩn có tính chất là tính độc lập và không t-ơng quan là đồng nhất
Kết hợp các giả thiết 3,4,5 và 11 ta có giả thiết chung là:
ui n.i.d (0,2 )
Mô hình thoả mãn các giả thiết trên gọi là mô hình hồi quy tuyến tính cổ điển ( CLRM ).
8 Các tính chất của các -ớc l-ợng OLS.
Trang 129.1 Ước lượng khoảng
Với độ tin cậy 1 - cho trước, khoảng tin cậy của các hệ số håi quy:
j
ˆ – Se( ˆj )t/2 (n – 2) < j < ˆj + Se( ˆj )t/2 (n – 2) j
) 2 ( ˆ
2 2 /
) 2 ( ˆ
2 2 / 1
9.2 Kiểm định giả thuyÕt
Với mức ý nghĩa cho trước, kiểm định mối quan hệ thứ tự của hệ số với các số thực cho trước
Trang 13* 0
: H
: H
j j
j j
j
j j
* 0
: H
: H
j j
j j
* 0
: H
: H
j j
j j
0 : H
0 : H
2 1
2 0
R
0 : H
2 1
2 0
) 2 /(
1
1 / )
2 /(
1 /
RSS ESS
- Nếu F qs > F( 1; n - 2) thì bác bỏ H0 : biến giải thích giải thích được cho
sự biến động của biến phụ thuộc, hàm hồi qui được gọi là phù hợp
- Ngược lại, Y không phụ thuộc vào biến giải thích, hàm hồi qui không phù
Trang 14x
X X
i
x
X X
Trang 15) ˆ
1 = 0 Q/ ˆ
2 = 0 Q/ ˆ3 = 0 ˆ1n + ˆ2X2i + ˆ3X3i = Yi ˆ1X2i + ˆ2X2i2 + ˆ3X3i = X2iYi ˆ1X3i + ˆ2X2ĩ X3i + ˆ3X3i2 = X3iYi
x3iyix2i2-x2iyix2i x3i ˆ3 = - x2i2x3i2– (x2i x3i)2
yˆ i = ˆ2x2i ˆ3x3i Hàm hồi quy mẫu đi qua gốc toạ độ
1.2. Các tham số của các -ớc l-ợng OLS.
E( ˆ
j ) = j j = 1 , 3
Trang 162 3
2 2
3 2 3 2
2 2
2 3
2 3
2 2
) (
2
i i i
i
i i i
i
x x x
x
x x X X x X x X
2
Var( ˆ2) =
2
3 2
2 3
2 2
2 3
) ( i i
i i
i
x x x
2 3
2 2
2 2
) ( i i
i i
i
x x x
Cov( ˆ2 ˆ3) =
2 3
2 2
2 23
2 23
) 1 ( r x i x i
ˆ
i
i i i
i
y
y x y
1.4 Hệ số t-ơng quan.
a Hệ số tuơng quan bội R: Là căn bậc hai của hệ số xác định bội và đo mức độ
t-ơng quan tuyến tính chung giữa Y, X 2 và X 3
b Hệ số t-ơng quan cặp r ij: Đo mức độ t-ơng quan tuyến tính giữa biến i và biến j của mô hình
12
r =
2 2 2
2
2 ) (
i i
i i
y x
y x
2 13
r =
2 2 3
2
3 ) (
i i
i i
y x
y x
) 2
( x x
Trang 17_ 17
c Hệ số t-ơng quan riêng phần r ij , k : Đo mức độ t-ơng quan tuyến tính giữa biến
i và biến j của mô hình với điều kiện biến k không đổi
r 12,3 =
) 1 )(
1
23
2 13
23 13 12
r r
r r r
23
2 12
23 12 13
r r
r r r
1
13
2 12
13 12 23
r r
r r r
Ví dụ: Bảng sau đây cho Tỷ lệ lạm phát Y(%), Tỷ lệ thất nghiệp X2(%) và Tỷ lệ lạm
phát kỳ vọng X3(%) của Mỹ giai đoạn 1970- 1982:
a Hồi quy Y với X 2 và cho nhận xét
b Hồi quy Y với X 2 và X 3 và so sánh với kết quả thu đ-ợc ở phần a
2 Mô hình hồi quy tổng quát k biến - Dạng ma trận của mụ hỡnh
Trang 18kn n
k k
n
n
u u
u u
X X
X X
X X
X X
Y Y
Y Y
1
2 1 2
1
2
1 1
2
2 22
1 21
1
2 1
Y Y
ˆ ˆ
ˆ ˆ
1
2 1
e e
1
2 1
e
1
2= e’e min
Nếu tồn tại (X’X)-1 thì βˆ = (X’X)-1X’Y
Khi đó βˆ = (X’X)-1X’Y là ước lượng tuyến tính không chệch tốt nhất của
2.4 Các tham số của ước lượng
Kì vọng : E(βˆ) = Phương sai – hiệp phương sai
) ˆ , ˆ ( ) ˆ , ˆ (
) ˆ ( )
ˆ , ˆ (
) ˆ , ˆ (
) ˆ , ˆ ( )
ˆ (
2 1
2 2
1 2
1 2
1 1
k k
k
k k
Var Cov
Cov
Cov Var
Cov
Cov Cov
Trang 192.5 Sự phự hợp của hàm hồi qui
Cho biết tỉ lệ sự biến động của biến phụ thuộc được giải thớch bởi tất cả cỏc biến
giải thớch cú trong mụ hỡnh
R2có các tính chất sau:
+ 0 R 2 1
Tính chất này dùng để đánh giá mức độ thích hợp của hàm hồi quy
+ Giá trị của R 2 đồng biến với số biến giải thích của mô hình Tuy nhiên không thể lấy điều đó để xem xét việc đ-a thêm biến giải thích vào mô hình
2.6 Hệ số xỏc định bội hiệu chỉnh.
R 2 = 1 – (1 – R 2)
k n
Trang 203 Suy diễn thống kê.
3.1 Ước lượng khoảng
i Khoảng tin cậy cho từng hệ số
j
ˆ – Se( ˆj )t 2(n – k) < j < ˆj + Se( ˆj )t1 (n – k) (j = 1 ,k )
Khoảng tin cậy đối xứng, bên phải, bên trái
ii Khoảng tin cậy cho hai hệ số
( ˆ i ˆj ) – Se( ˆ i ˆj )t 2(n – k) < ij <( ˆ i ˆj ) + Se( ˆ i ˆj )t1 (n – k)
) ˆ ( ) ˆ , ˆ ( 2 ) ˆ ( i Cov i j Var j Var
iii Khoảng tin cậy cho sai số ngẫu nhiờn
) ( 2 2
ˆ
k n
k n
ˆ
k n
k n
Khoảng tin cậy hai phía, bên phải, bên trái
3.2 Kiểm định giả thuyết
* 0
: H
: H
j j
j j
k n
* 0
: H
: H
j j
j j
j
j j
* 0
: H
: H
j j
j j
j i
: H
: H
1
) ˆ ˆ (
ˆ ˆ
j i
j i
k n
t
Trang 210 : H
2 1
2 0
H
0
: H
1
2 0
Ít nhất một biến giải thớch cú giải thớch cho Y
F qs =
) /(
1
) 1 /(
) /(
) 1 /(
2 2
k n R
k R k
n RSS
k ESS
Ví dụ: Với tệp số liệu đã cho, hãy tìm các -ớc l-ợng ˆ bằng ph-ơng pháp ma trận và
các tham số t-ơng ứng của mô hình Hãy tiến hành các -ớc l-ợng và kiểm định cần
: 0 :
H
0
: H
1
2 1
0
k m k j
j
k m
k m k
Ít nhất một biến giải thớch cú giải thớch cho Y
E(Y/X2, ,X k - m , ,X k ) = 1 + 2X2 + … + k X k (UR) E(Y/X2,…, X k - m ) = 1 + 2X2 + … + k X k - m (R)
F qs =
) /(
/ ) (
k n RSSur
m RSSur RSSr
) /(
) 1 (
/ ) (
2
2 2
k n R
m R R
ur
ủ ur
- Kiểm định thu hẹp hồi qui cũn dựng cho những trường hợp khỏc
5.2 Cỏc dạng thu hẹp hồi qui
Vớ dụ Y i = 1 + 2X2i + 3X3i + u i (UR)
H0: 3 = 1; H1: 3≠ 1
H0 đỳng Y i = 1 + 2X2i + X3i + u i
Y i – X3i = 1 + 2X2i + ui Y i * = 1 + 2X2i + ui (R)
Trang 22- C là chi tiêu cho tiêu dùng : 1 > 0; 1 > 2 > 0
- C là chi tiêu cho hàng hóa thông thường
- C là chi tiêu cho hàng hóa cao cấp
- C là chi tiêu cho hàng hóa thứ cấp
7.2 Hàm cầu
Trang 23_ 23
P i : giá cả hàng hóa
PT i : giá hàng hóa thay thế
PB i : giá hàng hóa bổ sung
Mô hình kinh tế có dạng Y i =0X2i2X3i3
lnY i = ln0 + 2lnX2i + 3lnX3i
Xét mô hình LY i = 1 + 2 LX2i + 3LX3i + vi
E(Y / X2i , X3i) = e1X2i2X3i3 1 : E(Y/X 2i = X 3i = 1) = e1
2 = E(Y)/X2 : Khi X 2 thay đổi 1%, yếu tố khác không đổi, thì E(Y) thay đổi