Chương 4: Mô hình hồi quy với biến giả
Trang 1Ch ương 4: Mô hình hồi quy với
biến giả
I Bản chất của biến giả - Mô hình có biến giả
1 Khái niệm:
• Biến chất lượng:
Là biến mà nhận những giá trị thuộc tính (phạm trù) nhất định Một biến chất lượng có thể nhận 2, 3 hoặc nhiều hơn các thuộc tính
• Biến giả:
Là biến chỉ nhận 2 giá trị với mục đích để lượng hoá các biến chất nhằm đưa các biến chất vào mô hình khi phân tích một hiện tượng kinh tế xã hội
Một loại hàng được sản xuất trong nước hoặc là được nhập khẩu
D = 1 khi là hàng sản xuất trong nước,
= 0 khi không phải được sản xuất trong nước (nhập khẩu)
2 Biến chất có 2 thuộc tính:
Ví dụ: Giả sử một công ty sử dụng 2 quá trình sản xuất
A và B để sản xuất ra một loại sản phẩm
• Phương trình HQ: Yi= β1+β2Di+Ui
Yi: Sản lượng sản phẩm gắn với quá trình thứ i
• Thoả mãn các giả thiết cơ bản của OLS:
E(Ui/Di) = 0
Var(Ui/Di) = Var(Uj/Dj) = σ2
Cov(Ui,Uj) = 0
• Dilà biến giả:
Di= 1 nếu sản lượng sản phẩm thu được từ A
= 0 nếu sản lượng sản phẩm thu được từ B
• Mô hình cho biết sản lượng trung bình giữa A và B có
khác nhau không
• Hệ số chặn β1cho biết sản lượng trung bình gắn với B
E(Yi/Di=0) = β1
• Hệ số góc β2 cho biết sự khác nhau về sản lượng trung bình của A so với B E(Yi/Di=1) = β1+ β2
• Kiểm định GT: H0: β2= 0 Cho biết không có sự khác nhau về sản lượng trung bình giữa A và B
Trang 2• Ví dụ 4.1:
Để so sánh kết
quả sản lượng
do 2 quá trình
sản xuất A và B
có khác nhau
hay không người
ta tiến hành lấy
một mẫu như
sau:
A:Di=1;B:Di=0 Sản lượng 1 ca
3 Biến chất có 3 thuộc tính trở lên
Ví dụ: Giả sử có 3 quá trình sản xuất A, B, C
Đưa vào 2 biến giả D1và D2
Xét mô hình:
Yi= β1+ β2D1i+ β3D2i+ Ui Trong đó:
D1= 1 nếu sản lượng sản phẩm thu được từ A
D1= 0 nếu sản lượng sản phẩm thu được từ quá trình khác
D2= 1 nếu sản lượng sản phẩm thu được từ B
D2= 0 nếu sản lượng sản phẩm thu được từ quá trình khác
• Ta có các kết hợp:
• Lấy kỳ vọng:
E(Yi/D1=1;D2=0)=β1 + β2
E(Yi/D1=0;D2=1)=β1 + β3
E(Yi/D1=0;D2=0)=β1
Hệ số chặn cho biết sản lượng trung bình của C
Hệ số góc β2cho biết sự thay đổi trung bình của sản
lượng khi chuyển từ C sang A
Hệ số góc β3 cho biết sự thay đổi trung bình của sản
lượng khi chuyển từ C sang B
sản lượng trung bình của A và C
sản lượng trung bình của B và C
• Lưu ý:
Để phân biệt n thuộc tính ta dùng n -1 biến giả Thuộc tính cơ sở là thuộc tính khi tất các biến
Trang 3• Ví dụ 4.2:
Dựa vào bảng số
liệu dưới đây để
so sánh về sản
lượng của 3 quá
trình sản xuất
A (D1=1, D2=0),
B (D1=0,D2=1),
D 1 D 2 Y D 1 D 2 Y
0 1 18,5
II Mô hình hồi quy một biến lượng và một biến chất
1 Trường hợp biến chất chỉ có 2 thuộc tính
• Xét mô hình: Yi= β1+ β2Di+ β3Xi+ Ui Trong đó:
Yi: Tiền lương hàng tháng của công nhân cơ khí thứ i
Xi: Bậc thợ của công nhân i
Di= 1 nếu công nhân i làm việc trong khu vực tư nhân
Di= 0 nếu công nhân i làm việc trong khu vực quốc doanh
Tiền lương trung bình của công nhân cơ khi trong khu vực nhà nước:
E(Yi/Xi, Di=0) = β1+ β3Xi
Tiền lương trung bình của công nhân cơ khí trong khu vực tư nhân:
E(Yi/Xi, Di=1) = (β1+ β2) + β3Xi
• Kiểm định H0: β2= 0
Cho biết liệu có sự khác nhau về mức lương
ở 2 khu vực hay không.
• Ví dụ 4.3:
Dựa vào bảng số liệu sau đây để lập phương
trình hồi quy mô tả sự phụ thuộc của tiền
lương công nhân vào khu vực làm việc (Di=
1: tư nhân, Di= 0: nhà nước) và bậc thợ (3
bậc).
Xi
Xi
Trang 42 Trường hợp biến chất có nhiều hơn 2 thuộc tính
Ví dụ: Hồi quy thu nhập hàng năm của cán bộ giảng
dạy với tuổi nghề giảng dạy và khu vực giảng dạy
(Bắc, Trung, Nam)
• Mô hình:
Yi= β1+ β2D1i+ β3D2i+ β4Xi+ Ui
Trong đó:
Y: thu nhập hàng năm của giảng viên
X: tuổi nghề của giảng viên
D1 = 1 nếu thuộc một trường miền Bắc
= 0 nếu không thuộc một trường miền Bắc
D2 = 1 nếu thuộc một trường miền Nam
= 0 nếu không thuộc một trường miền Nam
Coi giảng viên ở miền Trung là phạm trù cơ sở
của giảng viên các vùng khác so với miền Trung
• Thu nhập trung bình của giảng viên ở miền Trung:
E(Yi/D1=0, D2=0, Xi) = β1+ β4Xi Thu nhập trung bình của giảng viên ở miền Bắc:
E(Yi/D1=1, D2=0, Xi) = (β1 + β2) + β4Xi Thu nhập trung bình của giảng viên ở miền Nam:
E(Yi/D1=0, D2=1, Xi) = (β1 + β3) + β4Xi
III Hồi quy với một biến lượng và hai biến chất
• Số biến giả phụ thuộc vào số biến chất và các thuộc
tính mà mỗi biến chất có
• Ví dụ: Thu nhập giảng viên phụ thuộc vào Vùng và
Giới tính
Vùng có 3 thuộc tính: Bắc, Trung, Nam
Giới tính có 2 thuộc tính: Nam, Nữ
Mô hình có dạng:
Yi=β1+β2D1i+β3D2i+β4D3i+β5Xi+Ui
Trong đó:
Yilà thu nhập hàng năm của giảng viên
Xilà tuổi nghề của giảng viên
D1i=1 nếu giảng viên thuộc miền Bắc
=0 nếu giảng viên không thuộc miền Bắc
D2i=1 nếu giảng viên thuộc miền Nam
=0 nếu giảng viên không thuộc miền Nam
D3i=1 nếu giảng viên là nam
=0 nếu giảng viên là nữ
Phạm trù cơ sở là giảng viên thuộc miền Trung
Trang 5Thu nhập trung bình của một giảng viên nữ ở miền
Trung: E(Yi/D1=0,D2=0,D3=0,Xi)=β1+β5Xi
Thu nhập trung bình của một giảng viên nam ở miền
Trung: E(Yi/D1=0,D2=0,D3=1,Xi)=β1+β4+β5Xi
Thu nhập trung bình của một giảng viên nữ ở miền
Bắc: E(Yi/D1=1,D2=0,D3=0,Xi)=β1+β2+β5Xi
Thu nhập trung bình của một giảng viên nam ở miền
Bắc: E(Yi/D1=1,D2=0,D3=1,Xi)=β1+β2+β4+β5Xi
Thu nhập trung bình của một giảng viên nữ ở miền
Nam: E(Yi/D1=0,D2=1,D3=0,Xi)=β1+β3+β5Xi
Thu nhập trung bình của một giảng viên nam ở miền
Nam: E(Yi/D1=0,D2=1,D3=1,Xi)=β1+β3+β4+β5Xi
IV Kết hợp hai hồi quy
Ví dụ:
Có hồi quy của tiết kiệm và thu nhập trước và sau mốc chuyển đổi kinh tế của một quốc gia
Có 4 khả năng:
Dùng biến giả để kết hợp 2 hồi quy:
Gộp tất cả n và m quan sát
Ước lượng hồi quy: Yi=β1+ 2Di+ 3Xi+ 4(DiXi)+Ui
= 0 đối với quan sát từ thời kỳ chuyển đổi về sau
E(Yi/Di=0,Xi)= β1+ 3Xi
E(Yi/Di=1,Xi)= (β1+ 2)+(β3+β4)Xi
Ví du: Số liệu tiết kiệm và thu nhập cá nhân ở nước Anh từ nằm 1946
và 1963 (Triệu pound) Chia làm hai giai đoạn 1946 – 1954 (thời kỳ sau chiến tranh thế giới thứ II: thời kỳ tái thiết) và 1955-1963 (thời kỳ hậu tái thiết) Hãy đánh giá xem mối quan hệ giữa tiết kiệm Y và thu nhập X có thay đổi giữa hai thời kỳ hay không?
Trang 6V Ảnh hưởng tương tác giữa các biến giả:
Xét mô hình: Yi=β1+β2D2i+β3D3i+β4Xi+Ui
Trong đó: Yilà chi tiêu hàng năm về quần áo
Xilà thu nhập
D2= 1 nếu là nữ; = 0 nếu là nam
D3= 1 nếu là sinh viên; = 0 nếu là công nhân viên
Chi tiêu quần áo trung bình:
1 1 Nữ sinh viên β1+β2+β3+β4Xi
0 0 Nam công nhân viên β1+β4Xi
1 0 Nữ công nhân viên β1+β2+β4Xi
0 1 Nam sinh viên β1+β3+β4Xi
Giả thiết của mô hình:
+ Ảnh hưởng của biến giới tính đến chi tiêu quần áo là giống nhau giữa 2 tầng lớp sinh viên và công nhân viên
+ Ảnh hưởng của biến tầng lớp đến chi tiêu quần áo là giống nhau giữa 2 giới tính nam và nữ
Hai biến giới tính và tầng lớp trong mô hình trên không tương tác với nhau
Ảnh hưởng của chúng lên trung bình Y là phép cộng đơn giản
Trong thực tế có sự tương tác giữa các biến giả: nữ sinh viên có mức chi tiêu quần áo nhiều hơn hẳn
Mô hình có tương tác:
Yi=β1+β2D2i+β3D3i+β4(D2iD3i) + β5Xi+Ui
Chi tiêu trung bình về quần áo của nữ sinh viên:
E(Y/D2=1,D3=1,Xi)= (β1+β2+β3+β4)+ β5Xi
Kiểm định giả thiết: H0: 4=0
Cho biết sự tương tác có ý nghĩa về mặt thống kê hay
không
6 Sử dụng biến giả trong phân tích mùa:
6.1 Yếu tố mùa vụ chỉ ảnh hưởng đến hệ số chặn
Giả sử ở các hộ gia đình có sự phụ thuộc thu nhập
vào chi tiêu và thời gian trong năm
Yi=β1+β2D2i+β3D3i+β4D4i +β5Xi+Ui
Trong đó: Yi: chi tiêu; Xi: thu nhập;
= 0 nếu quan sát nằm ở quý khác
= 0 nếu quan sát nằm ở quý khác
= 0 nếu quan sát nằm ở quý khác
Chi tiêu trung bình trong quý 1 là:
E(Yi/D2=0,D3=0,D4= 0,Xi)= β1+β5Xi
Chi tiêu trung bình trong quý 2 là:
E(Yi/D2=1,D3=0,D4=0,Xi)= (β1+β2)+ β5Xi
Trang 7Chi tiêu trung bình trong quý 3 là:
E(Yi/D2=0,D3=1,D4=0,Xi)= (β1+β3)+ β5Xi
Chi tiêu trung bình trong quý 4 là:
E(Yi/D2=0,D3=0,D4=1,Xi)= (β1+β4)+ β5Xi
mỗi quý khác với quý 1 như thế nào
6.2 Yếu tố mùa vụ đến cả hệ số góc
Mô hình: Yi=β1+β2D2i+β3D3i+β4D4i +β5Xi+ β6(D2iXi) +
β7(D3iXi) + β8(D4iXi)+Ui
Yi=(β1+β2D2i+β3D3i+β4D4i)+ (β5+ β6D2i+ β7D3i+β8D4i)Xi+Ui
7 Hồi quy tuyến tính từng khúc
Là mô hình có dạng đồ thị thay đổi độ dốc nhưng vẫn đảm bảo tính liên tục.
Xét mối quan hệ phụ thuộc của tiêu dùng Y
và thu nhập X của nước ta trong 2 thời kỳ trước và sau chuyển đổi.
Gọi năm chuyển đổi là t0
Mô hình: Yt=β1+β2Xt +β3(Xt – Xt0)Dt + Ut
Dt= 1 nếu t > t0
= 0 nếu t ≤ t0
Trung bình của tiêu dùng trong những năm trước
chuyển đổi kinh tế là:
E(Yt/Dt=0,Xt)= β1+ 2Xt
Trung bình của tiêu dùng trong những năm sau
chuyển đổi kinh tế là:
E(Yt/Dt=1,Xt)= β1 -β3Xt0+(β2+ 3)Xt
β2cho độ dốc của đường hồi quy trước khi chuyển
đổi
(β2+ 3) cho độ dốc của đường hồi quy sau khi
chuyển đổi
Không có sự gián đoạn trên đồ thị vì:
E(Yt0) = β1+ 2Xt0= β1 -β3Xt0+(β2+ 3)Xt0
Kiểm định H0:β3= 0 cho biết có sự thay đổi độ dốc hay không
Nếu mô hình có nhiều thay đổi về cấu trúc ứng với t0
và t1, ta có:
Yt= 1+ 2Xt+ 3(Xt– Xt0)D1t+ β4(Xt– Xt1)D2t+Ut Trong đó:
D1= 1 nếu t > t0; = 0 nếu t nhận giá trị khác
D2= 1 nếu t > t1; = 0 nếu t nhận giá trị khác
Phương trình cho 3 giai đoạn là:
E(Yt) = β1+ 2Xtnếu 0 < t ≤ t0
= β1 -β3Xt0 +(β2+ 3)Xtnếu t0< t ≤ t1
= β1 -β3Xt0–β4Xt1+(β2+ 3 + β4)Xtnếu t > t1
Trang 8Ví dụ: Cho bảng số liệu tương ứng với hai giai đoạn I và II
a) Hãy thiết lập mô hình tuyến tính đơn cho 2 giai đoạn
riêng biệt
b) Lập mô hình: Yt= 1+ 2Xt+ 3(Xt– Xt0)Dt+ Ut
Với D1= 0 nếu số liệu ở giai đoạn I; = 1 nếu số liệu ở
giai đoạn II; Xt0= 15,5
I
Y 0,36 0,21 0,08 0,2 0,1 0,12 0,41 0,5 0,43
X 8,8 9,4 10 10,6 11 11,9 12,7 13,5 14,3
II
Y 0,59 0,9 0,95 0,82 1,04 1,53 1,94 1,75 1,99
X 15,5 16,7 17,7 18,6 19,7 21,1 22,8 23,9 25,2