Bài giảng Kinh tế lượng - Chương 1: Mô hình hồi quy tuyến tính hai biến cung cấp cho người học các kiến thức: Mô hình và một số khái niệm, phương pháp ước lượng OLS, tính không chệch và độ chính xác của ước lượng OLS, độ phù hợp của hàm hồi quy - hệ số xác định R2,... Mời các bạn cùng tham khảo nội dung chi tiết.
Trang 1Chương 1:
MÔ HÌNH HỒI QUY TUYẾN TÍNH HAI BIẾN
Bộ môn Toán kinh tế
Trường Đại học Ngân hàng TPHCM
Blog: https://nguyenphuongblog.wordpress.com Email: nguyenphuong0122@gmail.com
Ngày 14 tháng 9 năm 2015
Trang 2NỘI DUNG
1 Mô hình và một số khái niệm
Mô hình hồi quy
Hàm hồi quy tổng thể
Hàm hồi quy mẫu
2 Phương pháp ước lượng OLS
Tư tưởng của phương pháp OLS
Công thức ước lượng hệ số chặn, hệ số góc
Trình bày kết quả phân tích hồi quy
3 Tính không chệch và độ chính xác của ước lượng OLSCác giả thiết của phương pháp OLS
Độ chính xác của ước lượng OLS
4 Độ phù hợp của hàm hồi quy - hệ số xác định R2
5 Khoảng tin cậy choβ1,β2 vàσ2
Phân phối xác suất của các ước lượng
Khoảng tin cậy choβ1,β2
Khoảng tin cậy cho phương sai sai số ngẫu nhiên
6 Kiểm định giả thuyết
Kiểm định giả thuyết về hệ số hồi quy
Kiểm định giả thuyết vềσ2
Kiểm định sự phù hợp của hàm hồi quy
7 Dự báo giá trị của biến phụ thuộc
8 Một số vấn đề bổ sung
Đơn vị đo lường trong phân tích hồi quy
Hệ số chặn và mô hình hồi quy
2
Trang 3Bài toán quan trọng trong phân tích kinh tế: đánh giá tác động của của mộtbiến số lên một số biến số khác.
Ví dụ: muốn đánh giá tác động của thu nhập lên chi tiêu tiêu dùng
Suy luận thông thường: khi thu nhập tăng thì mức chi tiêu tiêu dùng sẽ giatăng
−→ có thể biểu diễn mối quan hệ phụ thuộc hàm số giữa các biến này như sau:
TD = f(TN)
Mô hình hồi quy tuyến tính
Mô hình hồi quy tuyến tính hai biến thể hiện mối quan hệ phụ thuộc giữabiến Y và biến X có dạng như sau:
Y =β1+β2X + u
Trang 4Biến phụ thuộc Biến độc lập
- là biến số mà ta đang quan tâm đến
giá trị của nó thường kí hiệu là Y và
nằm ở vế trái của phương trình
- là biến số được cho là có tác độngđến biến phụ thuộc, thường kí hiệu
là X và nằm ở vế phải của phươngtrình
- còn được gọi là biến được giải thích - còn được gọi là biến giải thích
Sai số ngẫu nhiên: là yếu tố đại diện cho các yếu tố có tác động đến biến Yngoài X
Hồi quy nghiên cứu sự phụ thuộc của một đại lượng kinh tế này (biến phụthuộc, biến được giải thích) vào một hay nhiều đại lượng kinh tế khác (biếnđộc lập, biến giải thích ) dựa trên ý tưởng là ước lượng giá trị trung bình củabiến phụ thuộc trên cơ sở các giá trị biết trước của các biến độc lập
ä Biến độc lập có giá trị xác định trước
ä Biến phụ thuộc là đại lượng ngẫu nhiên tuân theo các quy luật phân bốxác suất
Trang 5Hàm hồi quy tổng thể là hồi quy được thực hiện trên số liệu của tổng thể vàphản ánh chính xác mối quan hệ giữa biến độc lập và biến phụ thuộc.
Hàm hồi quy tổng thể-PRF: E(Y|X) =β1+β2X
Mô hình hồi quy tổng thể-PRM: Yi=β1+β2Xi+ ui, i = 1, N;
trong đó E(Y|X) là kỳ vọng của biến Y khi biết giá trị của X, hay còn gọi là
kỳ vọng của Y với điều kiện X
Ví dụ Hồi quy TD (tiêu dùng) theo TN (thu nhập)
Mô hình hồi quy tuyến tính như sau: TD =β1+β2TN + u
Các hệ số hồi quy
ä β1 được gọi là hệ số chặn, nó chính bằng giá trị trung bình của biến phụ
Trang 6Hàm hồi quy mẫu là hồi quy được thực hiện trên số liệu của mẫu dùng để ướclượng hàm hồi quy tổng thể.
Hàm hồi quy mẫu-SRF: Y = ˆˆ β1+ ˆβ2X
Mô hình hồi quy mẫu-SRM: Yi= ˆβ1+ ˆβ2Xi+ ei, i = 1, n;
trong đó ˆY là ước lượng cho E(Y|Xi); ˆβ1, ˆβ2 là ước lượng choβ1, β2; ei là phần
dư, ước lượng cho ui
Trang 7Xét mô hình hồi quy tổng thể: Y =β1+β2X + u
Mô hình hồi quy mẫu tại mỗi quan sát: Yi=β1+β2Xi+ ui
ei= Yi−Ybi
Trang 8Phương pháp xác định bβ1, bβ2 dựa trên tiêu chuẩn cực tiểu tổng bình phươngcác phần dư được gọi là phương pháp bình phương bé nhất.
nX
i=1
e2i =
nX
i=1(Yi−Ybi)2=
nX
i=1(Yi−bβ1−βb2Xi)2
Tìm bβ1, bβ2sao cho: f( bβ1, bβ2) =
nPi=1
e2
nPi=1(Yi−βb1−βb2Xi)2−→ min
β1= Y − bβ2Xb
β2=
nPi=1
xiyi nPi=1
x2 ivới xi= Xi− X, yi = Yi− Y và X, Y là trung bình mẫu của X, Y
Trang 10XiYi− n.X.Y = 61680 − 10 × 84, 3 × 72, 2 = 815, 4
P x2
nPi=1
Trang 11(a)Đồ thị phân tán (b)Mô hình hồi quy
Trang 12Ví dụ
Trong tệp số liệu ch1vd1.wf1 có 135 quan sát cho các biến số: số năm làm việcsau khi tốt nghiệp ngành ngân hàng (KN, năm) và mức lương hàng năm (TN,triệu đồng) Hãy ước lượng hàm hồi quy tuyến tính của TN theo KN
Trang 13Trình bày kết quả phân tích hồi quy:
Trang 14Giả thiết 1: Với mỗi giá trị của X, giá trị của Y là
Yi=β1+β2Xi+ ui
Giả thiết 2: Kỳ vọng của sai số ngẫu nhiên khi biết giá trị của X
E(ui) = E(u|Xi) = 0, ∀iKhi giả thiết 2 thỏa mãn thì
E(ui) = 0Cov(Xi, ui) = 0
Từ đó, ta được:
E(Y|Xi) =β1+β2Xi
Giả thiết 3: Phương sai của các sai số ui không đổi
Var(ui) = Var(u|Xi) =σ2, ∀i
Trang 15Giả thiết 4: Không có sự tương quan giữa các ui:cov[ui, uj] = 0, ∀i , j.
−→ ui là ngẫu nhiên, sai số ở quan sát này không ảnh hưởng đến sai số ở cácquan sát khác
Giả thiết 5: ui có phân phối chuẩn, ui ∼ N(0, σ2)
Trang 16;var( bβ1) =
nPi=1
X2 i
n
nPi=1
xiyi nPi=1
x2 i
=
nX
i=1
wiyi=β2+
nX
i=1
wiui ; wi= nxi
Pi=1
x2 i
Trang 17Ước lượng của phương sai sai số ngẫu nhiênσ2
x2 i
;var( bβ1) =
nPi=1
X2 i
n
nPi=1
x2 iˆ
σ2
Sai số chuẩn (standard error) của hệ số ước lượng
Trang 18Giữa các giá trị mẫu của biến phụ thuộc Yi và các ước lượng của nó bYi có sựsai lệch.
−→ Nếu sai lệch là nhỏ thì hàm hồi quy mẫu khá phù hợp với số liệu mẫu
−→ Khi sai lệch lớn thì hàm hồi quy mẫu là phù hợp thấp với số liệu mẫu
Để đánh giá một cách định lượng sự phù hợp của hàm hồi quy mẫu đối với sốliệu mẫu −→ đưa ra khái niệm hệ số xác định, kí hiệu là R2
Trang 20Tính chất
TSS = ESS + RSS
Sự biến đổi của Y là tổng của hai thành phần: của sự biến đổi của phần dư(thể hiện cho các yếu tố không đưa vào mô hình) và sự biến đổi được thể hiệnbởi mô hình
Trang 21Tỷ số ESS
TSS thể hiện phần trăm sự biến đổi của biến Y trong mẫu được giảithích bởi mô hình, còn được gọi là hệ số xác định của hàm hồi quy và được kýhiệu là R2
R2= ESS
RSSTSS
0 ≤ R2≤ 1
R2= 1: biến X giải thích được 100% sự thay đổi của biến Y
R2= 0: biến X hoàn toàn không giải thích được sự thay đổi của biến Y
−→ mô hình không phù hợp −→ có thể cho rằng mô hình hồi quy tổngthể không phù hợp
Trang 22x2 i
3 R2= r2X,Y
3 R2= 0 khi và chỉ khi ˆβ2= 0
ii) Trong mô hình hồi quy hai biến không chứa hệ số chặn thì các phát biểu
về R2 đều có thể không đúng nữa vì R2 có thể nhận giá trị âm
Trang 24β1,β2 và σ2 β1,β2
Xét mô hình hồi quy
Y =β1+β2X + u
Khoảng tin cậy củaβj
Khoảng tin cậy đối xứng
ˆβj− tα/2(n − 2)se( ˆβj); ˆβj+ tα/2(n − 2)se( ˆβj);Khoảng tin cậy bên phải (dùng để ước lượng tối thiểu choβj)
ˆβj− tα(n − 2)se( ˆβj); +∞;Khoảng tin cậy bên trái (dùng để ước lượng tối đa choβj)
−∞; ˆβj+ tα(n − 2)se( ˆβj);trong đó tα(n) là giá trị tới hạn Student bậc n mứcα
Ý nghĩa: Khoảng tin cậy (1 −α) ∗ 100% cho hệ số góc βj (j = 1, 2, , k) chobiết khi biến Xjtăng 1 đơn vị và các biến khác trong mô hình không đổi thìgiá trị trung bình của biến phụ thuộc thay đổi trong khoảng nào
Trang 26β1,β2 và σ2
Khoảng tin cậy cho phương sai của sai số ngẫu nhiên
(n − 2)ˆσ2
χ2 α/2(n − 2)
≤σ2≤ (n − 2)ˆσ2
χ2 1− α/2(n − 2)trong đó ˆσ2 là sai số chuẩn của hồi quy -S.E of regression
Trang 27Các bước khi kiểm định giả thuyết thống kê:
ä Bước 1: Xác định cặp giả thuyết thống kê H0 và H1
ä Bước 2: Tính giá trị quan sát của thống kê kiểm định
ä Bước 3: So sánh thống kê quan sát với giá trị tới hạn
−→kết luận chấp nhận H0hay bác bỏ H0
ä Bước 4: Kết luận
Trang 28Kiểm định cặp giả thuyết H0:βj= 0 và H1:βj, 0 với mức ý nghĩa α.Cách 1: Dùng khoảng tin cậy đối xứng củaβjvới độ tin cậy (1 −α) :
Bước 1: Tính KTC của ˆ β j − se(ˆ β j )tα/2(n − 2); ˆ β j + se(ˆ β j )tα/2(n − 2); Bước 2:
Bước 3:
- Nếu p − value ≥ α thì chấp nhận H 0
- Nếu p − value < α thì không chấp nhận H 0
Trang 29Bài toán: Kiểm định giả thuyết H0:βj=β∗ với mức ý nghĩaα.
t =ˆ
βj−β∗se( ˆβj)
Hai phía βj=β∗ βj, β∗ |t|> tα/2(n − 2) P (|T| ≥ |t|)Bên trái βj≥β∗ βj< β∗ t< −tα(n − 2) P (T< t)Bên phải βj≤β∗ βj> β∗
Trang 30Bài toán: Kiểm định giả thuyết H0:σ2=σ2
0với mức ý nghĩaα
χ2=(n − 2)ˆσ2
σ2 0
Trang 31Bài toán: Kiểm định sự phù hợp của hàm hồi quy với mức ý nghĩaα.
Kiểm định cặp giả thuyết
H0: R2= 0 (Hàm hồi quy không phù hợp)
H1: R2, 0 (Hàm hồi quy phù hợp)Tiêu chuẩn thống kê
Fqs= ESS/1
RSS/(n − 2) =
R2/1(1 − R2)/(n − 2) =
R2(n − 2)(1 − R2) Nếu Fqs> Fα(1; n − 2) thì bác bỏ H0, kết luận hàm hồi quy là phù hợp
Ví dụ
Từ số liệu đã cho của ví dụ trước về chi tiêu và thu nhập Hãy kiểm định sựphù hợp của mô hình với mức ý nghĩa 5%
Trang 32Khoảng tin cậy (1 −α) cho giá trị trung bình của biến phụ thuộc Y khi
X = X0 là:
ˆY0− t(n − 2)
α/2se( ˆY0); ˆY0+ t(n − 2)α/2se( ˆY0);trong đó
ˆ
Y0= ˆβ1+ ˆβ2X0 là ước lượng điểm cho E(Y|X0);
se( ˆY0) = ˆσ
s1
(X0− X)2
Pn i=1x2 i
Khoảng tin cậy (1 −α) cho giá trị riêng biệt của biến phụ thuộc Y khi X = X0là:
ˆY0− t(n − 2)
α/2se(Y0− ˆY0); ˆY0+ t(n − 2)α/2se(Y0− ˆY0);trong đó
Trang 33Ví dụ
Từ số liệu đã cho của ví dụ trước về chi tiêu và thu nhập Hãy dự báo giá trịtrung bình và giá trị riêng biệt của chi tiêu khi thu nhập ở mức 60 triệu
Trang 34Trong hàm hồi quy hai biến , nếu đơn vị tính của X và Y thay đổi thì takhông cần hồi quy lại mà chỉ cần áp dụng công thức đổi đơn vị tính.
Hàm hồi quy theo đơn vị tính cũ: bYi= bβ1+ bβ2Xi
Hàm hồi quy theo đơn vị tính mới: bYi∗= ˆβ∗
β∗
2= k1
k2ˆ
34
Trang 36Ví dụ: Giả sử có hàm hồi quy tổng thể sau về mối quan hệ giữa số năm kinhnghiệm KN (năm) và mức thu nhập của người lao động TN (triệu
đồng/tháng) trong ngành dệt may
TN = 3, 6 + 0, 6KN + u
−→ khi số năm kinh nghiệm bằng 0 - nghĩa là người vừa mới bắt đầu làm việc
- thì mức thu nhập trung bình của người lao động là 3,6 triệu/tháng
Ví dụ: Xét hàm hồi quy tổng thể về mối quan hệ giữa giá và nhu cầu về vàng:
Q = 25 − 0, 1P + u