1
CHƯƠNG V
HỒI QUY VỚI BIẾN GIẢ
2
Ví dụ 5.1: Xét sự phụ thuộccủa thu nhập(Y) (triệu
đồng/tháng) vào thời gian công tác (X) (năm) và nơi
làm việccủangườilaođộng (DNNN và DNTN).
Z = 1: làm trong DNNN và Z = 0: làm trong DNTN
Trong đóY vàX làbiếnsố lượng, còn Z là chỉ tiêu chất
lượng cho biết có hay không mộtthuộc tính nào đó. Z
đượcgọilàbiếngiả trong mô hình
5.1. Sử dụng biếngiả trongmôhìnhhồi quy
3
E(Y/X,Z) = β
1
+ β
2
X
i
+ β
3
Z
i
(5.1)
E(Y/X,Z=0) = β
1
+ β
2
X
i
(5.2)
E(Y/X,Z=1) = β
1
+ β
2
X
i
+ β
3
(5.3)
(5.2): mứcthunhập bình quân tháng củangườilaođộng
tại DNTN khi có thờigiancôngtáclàX năm. Giả sử
: 2 người có cùng thời gian công tác thì trung
bình mức thu nhậpcủangườilàmtại DNNN cao hơn
ngườilàmtại DNTN 0,4 triệu đồng/tháng
.
4,0
ˆ
3
=
β
Y
1
ˆ
β
3
ˆ
β
31
ˆˆ
ββ
+
Hình 5.1
X
E(Y/X,Z) = β
1
+ β
2
X
i
+ β
3
Z
i
Y
X
1
ˆ
β
3
ˆ
β
31
ˆˆ
ββ
+
Hình 5.2
E(Y/X,Z) = β
1
+ β
2
X
i
+ β
3
Z
i
+ β
4
X
i
Z
i
6
Xét sự phụ thuộccủa thu nhập (Y) (triệu đồng/tháng)
vào thời gian công tác (X) (năm) và nơilàmviệccủa
ngườilaođộng (DNNN, DNTN và DNLD)
Z
1i
= 0 phạmtrù
Z
2i
= 0 cơ sở
Để lượng hoá chỉ tiêu chấtlượng trên, ta phải dùng 2
biếngiả Z
1
và Z
2
.
⎩
⎨
⎧
∉
∈
=
DNN
N
DNNN
Z
i
0
1
1
⎩
⎨
⎧
∉
∈
=
DNTN
DNTN
Z
i
0
1
2
Ví dụ 5.2:
E(Y/X,Z1,Z2) = β
1
+ β
2
X
i
+ β
3
Z
1i
+ β
4
Z
2i
E(Y/X,Z1=0,Z2=0) = β
1
+ β
2
X
i
E(Y/X,Z1=1,Z2=0) = β
1
+ β
2
X
i
+ β
3
E(Y/X,Z1=0,Z2=1) = β
1
+ β
2
X
i
+ β
4
: 2 người có cùng thời gian công tác thì
trung bình mức thu nhậpcủangườilàmtại DNNN cao
hơnngườilàmtại DNLD 0,4 triệu đồng/tháng.
: 2 người có cùng thời gian công tác thì
trung bình mức thu nhậpcủangườilàmtại DNTN thấp
hơnngườilàmtại DNLD 0,2 triệu đồng/tháng.
Lưuý:Mộtchỉ tiêu chấtlượng có m phạm trù khác nhau
thì ta phảidùngm-1 biếngiảđểlượng hoá cho chỉ tiêu
chấtlượng đó.
4,0
ˆ
3
=
β
2,0
ˆ
4
−=
β
8
Tiếpvídụ 5.2:
Thu nhập còn phụ thuộc vào trình độ ngườilao
động (từđạihọctrở lên, cao đẳng và khác)
D
1i
=
1: nếutrìnhđộ từđạihọctrở lên
0: nếu không
D
2i
=
1: nếutrìnhđộ cao đẳng
0: nếu không có trình độ cao đẳng
Ví dụ 5.3.
9
Số biếngiảđưa vào mô hình phụ thuộcvàosố
biến định tính và số phạmtrùcóở mỗibiến định
tính. Số biếngiảđưa vào mô hình có thểđượcxác
định theo công thứcsau:
Trong đó: n – số biếngiảđưa vào mô hình;
k – số biến định tính
n
i
–số phạmtrùcủabiến định tính thứ i.
∑
=
−=
k
i
i
nn
1
)1(
* Tổng quát:
10
Z = 1, nếu quan sát trong mùa, và Z=0 nếuquansát
không nằm trong mùa.
Từ tháng 1-6: trong mùa, Tháng 7-12: ngoài mùa.
Y: chi tiêu cho quầnáo, X: thunhậpkhả dụng
-Nếuyếutố mùa chỉảnh hưởng đếnhệ số chặn
-Nếuyếutố mùa có ảnh hưởng đếnhệ số góc thì
Môhìnhsaucótínhtổng quát hơn. Thông qua việckiểm
định giả thiết chúng ta sẽ biết đượchệ số góc nào có ý
nghĩa.
iii
ZXY
321
ˆˆˆ
ˆ
βββ
++=
iiiii
ZXZXY
4321
ˆˆˆˆ
ˆ
ββββ
+++=
5.2. Sử dụng biếngiả trongphântíchmùa
11
Ví dụ 5.4. Cho số liệutiếtkiệmvàthunhập cá nhân ở
nướcAnhtừ 1946-63 (triệu pounds)
TK I Tiết kiệm Thu nhậpTK II Tiết kiệm Thu nhập
1946 0.36 8.8 1955 0.59 15.5
1947 0.21 9.4 1956 0.9 16.7
1948 0.08 10 1957 0.95 17.7
1949 0.2 10.6 1958 0.82 18.6
1950 0.1 11 1959 1.04 19.7
1951 0.12 11.9 1960 1.53 21.1
1952 0.41 12.7 1961 1.94 22.8
1953 0.5 13.5 1962 1.75 23.9
1954 0.43 14.3 1963 1.99 25.2
5.3. Kiểm định sựổn định cấutrúccủacácmô
hình hồiquybằng biếngiả
12
Thờikỳ tái thiết: 1946-54
Thờikỳ hậutáithiết
Có các trường hợpsauxảyra:
11
λ
α
=
22
λ
α
=
11
λ
α
=
22
λ
α
≠
11
λ
α
≠
22
λ
α
=
11
λ
α
≠
22
λ
α
≠
iii
vXY
+
+
=
21
α
α
iii
XY
ε
λ
λ
+
+
=
21
* Hàm tiếtkiệm
13
Chúng ta kiểmtraxemhàmtiếtkiệmcóbị thay đổicấu
trúc giữa2 thờikỳ hay không. Chúng ta xét hàm tiếtkiệm
tổng quát củacả 2 thờikỳ:
iiiiii
eZXZXY ++++=
4321
ˆˆˆˆ
ββββ
Vớin = n
1
+ n
2
Trong đó Z = 1: quan sát thuộcthờikỳ tái thiết
Z = 0 : quan sát thuộcthờikỳ hậutáithiết
* Kiểm định giả thiếtH
0
: β
3
=0
NếuchấpnhậnH
0
: loạibỏ Z ra khỏimôhình
* Kiểm định giả thiếtH
0
: β
4
=0
NếuchấpnhậnH
0
: loạibỏ Z
i
X
i
ra khỏimôhình
* Hàm tiếtkiệm
14
t = (-5,27) (9,238) (3,155) (-3,109)
p
t
= (0,000) (0,000) (0,007) (0,008)
Kếtquả trên cho thấycả tung độ gốcvàhệ số góc chênh
lệch đều có ý nghĩathống kê. Điều đóchứng tỏ rằng các
hồi quy trong hai thờikỳ là khác nhau.
iiiiii
eZXZXY
+
−
+
+
−= 1034,04839,115045,075,1
* Từ số liệu ở bảng ta có kếtquả hồiquy theo mô
hình như sau:
15
Thờikỳ tái thiết: Z = 1
Thờikỳ hậutáithiết: Z = 0
eiXY
eXXY
ii
iiii
++−=
+
−
++−=
0475,02661,0
1034,04839,115045,075,1
iii
eXY ++−= 15045,075,1
Từ kếtquả trên, chúng ta có thể tính hồi quy
cho 2 thờikỳ như sau:
-0.27
-1.75
ii
XY 15045,075,1
ˆ
+−=
ii
XY 0475,02661,0
ˆ
+−=
Thu nhập
Tiếtkiệm
17
Ví dụ 5.5: Sảnlượng dưới X*, thì chi phí hoa hồng
sẽ khác vớikhisảnlượng trên X*.
Hàm hồiquysẽ có dạng:
Y: Chi phí; X: sảnlượng;
X*: giá trị ngưỡng sảnlượng
iiiii
uZXXXY +−++= )(
*
321
βββ
⎪
⎩
⎪
⎨
⎧
≤
>
=
*
*
1
:0
:1
XX
XX
Z
i
i
i
5.4. Hàm tuyếntínhtừng khúcYX
Y
X
*
X
19
Trong đótổng SL làm thay đổi độ dốc(X*) là
5500 tấn
iiiii
eZXXXY +−++−= )(095,0279,0717,145
*
t = (-0,824) (6,607) (1,145)
R
2
= 0,9737 X* = 5500
Ta có kếtquả hồiquynhư sau:
Chi Phí 256 414 634 778 1003
Số
Lượng 1000 2000 3000 4000 5000
Chi Phí 1839 2081 2423 2734 2914
Số
Lượng 6000 7000 8000 9000 10000
20
Nếutacómộtbiếnphụ thuộclàbiếngiả tứclà
biếnchỉ nhận hai giá trị 0 và 1. Chúng ta không
thể sử dụng phương pháp bình phương bé nhất
(OLS) để ướclượng hàm hồiquy mà phải dùng
các phương pháp khác để ướclượng như:
-Môhìnhxácsuấttuyến tính (LPM)
-Mô hình Logit (Logit model)
-Mô hình Probit (Probit model)
-Mô hình Tobit (Tobit model)
Lưuý: Nếubiếnphụ thuộclàbiếngiả:
. 5.3. 9 Số biếngiảđưa vào mô hình phụ thuộcvàosố biến định tính và số phạmtrùcóở mỗibiến định tính. Số biếngiảđưa vào mô hình có thểđượcxác định theo công thứcsau: Trong đó: n – số biếngiảđưa vào. DNTN Trong đóY vàX làbiếnsố lượng, còn Z là chỉ tiêu chất lượng cho biết có hay không mộtthuộc tính nào đó. Z đượcgọilàbiếngiả trong mô hình 5.1. Sử dụng biếngiả trongmôhìnhhồi quy 3 E(Y/X,Z) =. kếtquả hồiquynhư sau: Chi Phí 256 414 634 778 1003 Số Lượng 1000 2000 3000 4000 5000 Chi Phí 1839 2081 2423 2734 2914 Số Lượng 6000 7000 8000 9000 10000 20 Nếutacómộtbiếnphụ thuộclàbiếngiả tứclà biếnchỉ