Chạy mô hình hồi quy giữa Giá bán căn nhà PRICE : ngàn USD/m2 và diện tích SQFT: m2; số phòng ngủ BEDRMS người ta thu được bảng số liệu sau: Dependent Variable: PRICE Method: Least Squa
Trang 1Chương 3: MỘT SỐ ỨNG DỤNG Bài tập 1
Chạy mô hình hồi quy giữa Giá bán căn nhà (PRICE : ngàn USD/m2 ) và diện tích (SQFT: m2); số phòng ngủ (BEDRMS) người ta thu được bảng số liệu sau:
Dependent Variable: PRICE Method: Least Squares Date: 04/05/15 Time: 23:33 Sample: 1 14
Included observations: 14 Variable Coefficient Std Error t-Statistic Prob
Adjusted R-squared 0.826099 S.D dependent var 88.49816 S.E of regression 36.90497 Akaike info criterion 10.24198 Sum squared resid 14981.74 Schwarz criterion 10.37892 Log likelihood -68.69385 Hannan-Quinn criter 10.22930 F-statistic 31.87767 Durbin-Watson stat 2.319848 Prob(F-statistic) 0.000026
a) Hãy giải thích ý nghĩa của các hệ số hồi quy đứng trước các biến giải thích? Theo bạn tung độ gốc < 0 là hợp lý hay bất hợp lý? giải thích
b) Có ý kiến cho rằng mô hình này không phù hợp Bạn hãy kiểm chứng ý kiến trên với mức ý nghĩa 12% , với 13
0,06
t =1,66 c) Khi diện tích tăng thêm 1% thì giá bán căn hộ thay đổi bao nhiêu?
d) Khi số phòng ngủ tăng thêm 5% thì giá bán căn bộ thay đổi bao nhiêu ?
Giải:
a) PRICE = -174,974 + 299,9724log(SQFT) -145,0942 LOG(BEDRMS)
β = khi diện tích tăng 1% trong điều kiện số phòng ngủ không đổi thì giá bán căn nhà trung bình tăng 2,999724 ngàn USD/m2
β2 = -145,0942 khi số phòng ngủ tăng 1% thì trong điều kiện diện tích không đổi thì giá bán nhà trung bình giảm 1,450942 ngàn USD/m2
Tung độ góc nhỏ hơn 0 là hợp lý vì khi không bán được nhà với những căn nhà có diện tích nhỏ thì
sẽ tốn kém về chi phí xây dựng cũng như bảo trì
b) Cặp giả thiết cần kiểm định là:
2 0 2 1
H : R 0
H : R 0
≠
Trang 2Ở đây sử dụng p_value(F) = 0 nên ta dễ dàng bác bỏ H0
c) Khi diện tích tăng thêm 1% thì giá bán căn hộ tăng lên 2,999724 ngàn USD/m2
d) Khi số phòng ngủ tăng thêm 5% thì giá bán căn hộ giảm 7,2545 ngàn USD/m2
Bài tập 2 Theo file “Baitap_2_Chuong3.wf1” tìm hiểu về mối liên hệ giữa
Wage : Tiền lương phụ thuộc vào
Educ: Số năm đi học
Age: Tuổi
Exper: Số năm kinh nghiệm
người ta đề xuất mô hình sau:
2
a) Hãy giải thích tại sao họ lại dùng mô hình log
b) Hãy giải thích tại sao người ta lại thêm các biến Educ2, Age2 và Exper2 vào mô hình
c) Kết quả Eviews cho ta như sau:
Dependent Variable: LOG(WAGE) Method: Least Squares
Date: 04/06/15 Time: 22:31 Sample: 1 49
Included observations: 49 Variable Coefficient Std Error t-Statistic Prob
Adjusted R-squared 0.292131 S.D dependent var 0.312741 S.E of regression 0.263124 Akaike info criterion 0.299183 Sum squared resid 2.907844 Schwarz criterion 0.569443 Log likelihood -0.329981 Hannan-Quinn criter 0.401719 F-statistic 4.301529 Durbin-Watson stat 1.836202 Prob(F-statistic) 0.001816
Trang 31) Có ý kiến cho rằng tuổi đã được thể hiện qua số năm kinh nghiệm và số năm đi học nên cần loại biến này khỏi mô hình Hãy kiểm chứng ý kiến trên với mức ý nghĩa 5% F0,05;7;42 =2,237
Gợi ý: Chạy mô hình trong Eviews không có biến Age sau đó sử dụng kiểm định hồi quy có điều kiện (kiểm định Wald)
2) Hãy chạy các mô hình Eviews khác nhau, từ đó tìm ra mô hình hồi quy tốt nhất
Giải:
a) Mô hình log được sử dụng vì khi phân tích mối liên hệ giữa Wage người ta thấy như sau:
Wage1 = (1 + r )Wage0
Wage2 = (1 + r)Wage1= (1 + r)2Wage0
…
Wagek = (1 + r)kWage0 ↔ ln(Wage) = k*ln(1+r) + ln(Wage0)
( r là tỷ suất lợi nhuận tăng thêm khi đi học thêm 1 năm)
Tổng quát : r đgl các yếu tố tác động đến việc thay đổi mức lương
b) Các biến Educ2, Age2 và Exper2 được thêm vào mô hình để thể hiện quy luật cận biên giảm dần
là khi các biến Age, Educ, Exper thay đổi ở những giá trị cao thì sự tác động đến mức lương vẫn còn nhưng không ảnh hưởng nhiều như ở các mức giá trị thấp
c)
1) Với mức ý nghĩa 5% p-value của age= 0.99>0.05 => age không có ý nghĩa giải thích trong mô hình,
p-value của age2 =0.956> 0.05=> biến age2 không có ý nghĩa trong mô hình
=
≠
∃
=
=
) 6
; 3 (
0
:
0 :
1
6
3
0
k H
H
k
β
β
β
Wald Test:
Equation: FULL
Null Hypothesis: C(4)=C(7)=0
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std Err
Trang 4C(7) 2.11E-05 0.000381
Restrictions are linear in coefficients
chạy kiểm tra F test, từ bảng eviews trên ta có p-value của F statistic= 0.9376> 0.05=> chấp nhận
H0 => biến age, age2 có thể đông thời loại khỏi mô hình
Hoặc làm theo cách sau:
1)
Dependent Variable: LOG(WAGE)
Method: Least Squares
Date: 05/03/15 Time: 21:18
Sample: 1 49
Included observations: 49
H
H
β = β =
∃ β = β ≠
'
(1)
0,033013
F
R
Ta có: ܨ.ହ;;ସଶ = 2,237 => ܨௐ < ܨ.ହ;;ସଶ
Vậy: chấp nhận ܪ
Trang 52)
Bài tập 3 Theo file “Baitap_3_Chuong3.wf1” Mô hình tìm hiểu về số người sẽ di chuyển bằng xe buýt
BUSTRAVL = Mức độ giao thông bằng xe buýt ở đô thị tính theo ngàn hành khách mỗi giờ
với nhiều yếu tố ảnh hưởng khác nhau như:
FARE = Giá vé xe buýt tính bằng Mỹ kim
GASPRICE = Giá một ga lông nhiên liệu tính bằng Mỹ kim
INCOME = Thu nhập bình quân đầu người tính bằng Mỹ kim
POP = Dân số thành phố tính bằng ngàn người
DENSITY = Mật độ dân số tính (người/dặm vuông)
LANDAREA = Diện tích thành phố (dặm vuông)
a) Hãy kỳ vọng dấu của các hệ số đứng trước các biến giải thích ? Lý giải rõ tại sao các hệ số này lại nhận dấu (-) hoặc (+)
b) Kết quả Eviews cho ta như sau:
Dependent Variable: BUSTRAVL Method: Least Squares
Date: 04/06/15 Time: 23:03 Sample: 1 40
Included observations: 40 Variable Coefficient Std Error t-Statistic Prob
Adjusted R-squared 0.906667 S.D dependent var 2431.757 S.E of regression 742.9113 Akaike info criterion 16.21666 Sum squared resid 18213267 Schwarz criterion 16.51221 Log likelihood -317.3332 Hannan-Quinn criter 16.32352 F-statistic 64.14338 Durbin-Watson stat 2.082671 Prob(F-statistic) 0.000000
1) Hãy giải thích ý nghĩa các hệ số đứng trước các biến giải thích
2) Hãy sử dụng kiểm định Wald để tiến hành loại bỏ các biến FARE, GASPRICE,
LANDAREA với mức ý nghĩa 5% F0,05;7;33=2,302
Trang 63) Hãy chọn lựa mô hình hồi quy tuyến tính đa biến tốt nhất? Giải thích
c) Dựa trên 1 số biến không có ý nghĩa, người ta đề xuất một mô hình có kết quả trong Eviews như sau:
Dependent Variable: LOG(BUSTRAVL) Method: Least Squares
Date: 04/06/15 Time: 23:18 Sample: 1 40
Included observations: 40 Variable Coefficient Std Error t-Statistic Prob
Adjusted R-squared 0.608666 S.D dependent var 1.157544 S.E of regression 0.724121 Akaike info criterion 2.286924 Sum squared resid 18.87667 Schwarz criterion 2.455812 Log likelihood -41.73848 Hannan-Quinn criter 2.347989 F-statistic 21.21967 Durbin-Watson stat 2.054301 Prob(F-statistic) 0.000000
1) Hãy giải thích ý nghĩa các hệ số đứng trước biến giải thích
2) Kiểm định sự phù hợp của mô hình với mức ý nghĩa 5%
Giải:
a) FARE (-) khi giá vé tăng thì người dân sẽ chuyển đi các phương tiện khác và ngược lại (tuân theo quy luật cung cầu)
GASPRICE (+) khi giá gasprice tăng để tiết kiệm người ta chuyển sang đi bằng các phương tiện công cộng
Income (-) vì khi thu nhập cao người ta sẽ chuyển sang sử dụng các phương tiện cá nhân thay vì đi
xe bus
Pop(+) vì khi dân số thành phố tăng thì để hạn chế việc kẹt xe người ta sẽ chuyển sang sử dụng các phương tiện công cộng
Landarea (-) vì khi diện tích thành phố tăng lên thì việc di chuyển bằng các phương tiện cá nhân khác sẽ nhanh hơn
Density (+) vì khi dân số tăng thì giải quyết vấn đề đi lại khó khăn người ta sẽ chuyển sang đi xe bus
b)
Trang 72744,68 522,1132 238,6544FARE
1) Ý nghĩa:
- Khi tất cả các yếu tố không tác động thì mỗi giờ thành phố có trung bình 2744,680 lượt hành khách đi xe buýt
- Khi giá một galông nhiên liệu tăng 1 đơn vị Mỹ Kim thì lượng hành khách trung bình mỗi giờ đi xe buýt tăng thêm 522113 người (trong điều kiện các yếu tố còn lại không thay đổi)
- Khi giá vé tăng 1 đơn vị Mỹ Kim thì lượng hành khách trung bình mỗi giờ đi xe buýt giảm 238,6544 người (các yếu tố còn lại không đổi)
- Khi thu nhập bình quân tăng 1 đơn vị Mỹ Kim thì số lượng hành khách trung bình giảm 194,744 người (các yếu tố còn lại không đổi)
- Khi dân số tăng lên 1000 người thì trung bình mỗi giờ tăng thêm 1711,442 người đi xe buýt (các yếu tố khác không đổi)
- Khi mật độ dân số tăng lên 1000người/dặm vuông thì trung bình mỗi giờ tăng thêm 116 người đi xe buýt (các yếu tố khác không đổi)
2)
Dependent Variable: BUSTRAVL
Method: Least Squares
Date: 05/04/15 Time: 19:14
Sample: 1 40
Included observations: 40
Trang 8Prob(F-statistic) 0.000000
• Dựa vào bảng dữ liệu 1:
W
(1)
SS / (n k)
F
R
=
k: tham số của mô hình đầu tiên
m: tham số của mô hình lúc sau
0,5;3;33
1,8736228 18213267 / 3
0,3158
18213267 / (40 7)
2,90
W
F
F
−
−
=
1
H
β = β = β =
Với β1,β2, β3 lần lượt là các hệ số đứng trước các biến FARE, GASPRICE, LANDAREA
Vì FW = 0,3158 < F0,05;3;33 nên ta chấp nhận giả thiết H0 và có thể bỏ đi ba biến trên
c)
1) Ý nghĩa hệ số đứng trước biến giải thích:
- Hệ số đứng trước LOG(INCOME) cho biết khi thu nhập thay đổi 1% thì lượt khách trung bình sẽ thay đổi -4,73%
- Hệ số đứng trước LOG(POP) cho biết khi dân số thay đổi 1% thì lượt khách trung bình
sẽ thay đổi 1,82.1%=1,82%
- Hệ số đứng trước LOG(LANDAREA) cho biết diện tích tăng lên 1% thì lượt khách trung bình thay đổi -0,97.1%= - 0,97%
2) Ta có p-value của mô hình bằng 0 < mọi mức ý nghĩa nên mô hình trên phù hợp
Bài tập 4 Sử dụng file số liệu “ Baitap_4_Chuong_3.wf1” để đánh giá hành vi chi tiêu của người tiêu dùng, khi hồi quy biến chi tiêu (CT) theo lương (TN), tài sản(TS) và thu nhập phụ thu được từ tài sản (TNP) ta thu được kết quả sau:
Dependent Variable: CT Method: Least Squares Date: 04/06/15 Time: 23:50 Sample (adjusted): 1 33 Included observations: 33 after adjustments Variable Coefficient Std Error t-Statistic Prob
Trang 9C 55.37481 13.42016 4.126241 0.0003
Adjusted R-squared 0.999502 S.D dependent var 557.2878 S.E of regression 12.43618 Akaike info criterion 7.992310 Sum squared resid 4485.099 Schwarz criterion 8.173704 Log likelihood -127.8731 Hannan-Quinn criter 8.053343 F-statistic 21410.05 Durbin-Watson stat 1.925566 Prob(F-statistic) 0.000000
a) Biến TS có ý nghĩa thống kê ?
b) Biến TNP có ý nghĩa thống kê không?
c) Để kiểm định cả hai biến TS và TNP cùng không tác động đến biến CT, chúng ta ước lượng hàm hồi quy mới trong Eviews như sau:
Dependent Variable: CT Method: Least Squares Date: 04/06/15 Time: 23:51 Sample (adjusted): 1 33 Included observations: 33 after adjustments Variable Coefficient Std Error t-Statistic Prob
Adjusted R-squared 0.999284 S.D dependent var 557.2878 S.E of regression 14.91413 Akaike info criterion 8.301186 Sum squared resid 6895.366 Schwarz criterion 8.391884 Log likelihood -134.9696 Hannan-Quinn criter 8.331703 F-statistic 44649.03 Durbin-Watson stat 1.470261 Prob(F-statistic) 0.000000
Vậy có thể kết luận rằng cả hai biến TS và TNP cùng không tác động đến biến CT không ? với mức
ý nghĩa 4%, F0,05;2;31=3,304
d) Kết luận trong câu c) có mâu thuẫn với câu a); b) không? Giải thích
Giải:
1 2
H
H
β
β
=
≠
Vì p-value = 0,668 < α chấp nhận H0 β2=0
Biến TS không có ý nghĩa thống kê
1 3
H
H
β
β
=
≠
Vì p-value = 0,6371 < α chấp nhận H0 β3=0
Trang 10Biến TNP không có ý nghĩa thống kê
1
H
H
β β
β
(1)
8,329
F
R
F > F0,05;2;31 Bác bỏ H0 Cả 2 biến TS và TNP cùng tác động lên biến CT với mức ý nghĩa 4%
d Kết luận câu c không mâu thuẫn với kết luận câu a, b vì
0 2
1 2
&
H
H
β
β
≠
≠
Đây là hai kiểm định hoàn toàn khác nhau có thể từng biến giải thích không có ý nghĩa đối với mô hình nhưng khi kiểm định cùng lúc các biến lại có ý nghĩa đối với mô hình thì ta vẫn nên giữ lại các biến này
Bài tập 5 Với Wage là tiền lương, grade là trình độ học vấn và union là biến giả nhận giá trị 1 nếu người lao động tham gia công đoàn và bằng 0 nếu ngược lại
Mô hình (1) được đề xuất như sau:
log wage 1,91 0,05grade 0,20union
, n = 100 1) Hãy giải thích ý nghĩa các hệ số đứng trước các biến giải thích dựa trên kết quả tìm được
2) Với mức ý nghĩa 10% có thể cho rằng biến union đưa vào mô hình là có ý nghĩa
không?
3) Với mức ý nghĩa 5% có thể cho rằng biến union đưa vào mô hình là có ý nghĩa không? 4) Có thể cho rằng nếu một người lao động chưa tham gia công đoàn thì việc gia nhập công đoàn của anh ta sẽ làm gia tăng lương thêm 0,2 đơn vị hãy không? Hãy giải thích tại sao
Mô hình (2) được đề xuất như sau:
log wage 1,93 0,05grade 0,015grade* union e
, n=100 1) Hãy giải thích ý nghĩa của hệ số đứng trước biến grade*union khi chạy Eviews
2) Với mức ý nghĩa 10% có thể cho rằng tác động của số năm đi học lên mức lương của người tham gia công đoàn mạnh hơn người không tham gia công đoàn không?
Trang 11Giải:
Mô hình (1)
log wage 1,91 0,05grade 0,20union
, n = 100
1) Khi người lao động có tham gia công đoàn (union = 1)
log wage 1,91 0,05grade 0,20
Khi người lao động không có tham gia công đoàn (union = 0) thì
log wage 1,91 0,05grade
Khi 1 người có tham gia công đoàn thì mức lương chênh lệch trung bình với 1 người không tham gia công đoàn tối thiểu là 20%
2)
( )
H
H
Z
se
β =
β ≠
β − β
β
0 0
1,85
p_value = 2P(Z >Z0) = 0,0644 < 0,1 bác bỏ H0 ,
3) Tương tự như câu 2
4) Theo mô hình (1) nếu 1 người tham gia công đoàn thì mức lương tối thiểu trung bình có thể nhận chênh lệch so với 1 người không tham gia công đoàn là
log w gea = ⇔ ge=e0 ,2=
Theo yêu cầu ta cần kiểm định cặp giả thiết
H
H
β =
β ≠
( )
Z
se
β
0 0
9,4574
p_value = 2P(Z >Z0) = 0,0 < mọi mức ý nghĩa bác bỏ H0
Mô hình (2)
log wage 1,93 0,05grade 0,015grade* union e
, n=100
Trang 121) 0,015 có ý nghĩa là 2 người có cùng giống nhau về trình độ học vấn thì sự chênh lệch mức lương tối thiểu giữa 1 người có và không tham gia công đoàn là 1,5%
2) H
H
β =
β ≠
( )
Z
se
p value P Z Z
β − β
β
0
0
0
0,166
Bài tập 6.
Chạy mô hình hồi quy giữa Giá bán căn nhà (PRICE : ngàn USD/m2 ) và diện tích (SQFT: m2); số phòng ngủ (BATHS) người ta thu được bảng số liệu sau:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/05/15 Time: 23:58
Sample: 1 14
Included observations: 14
Variable Coefficient Std Error t-Statistic Prob
Adjusted R-squared 0.783593 S.D dependent var 88.49816
S.E of regression 41.16898 Akaike info criterion 10.46066
Sum squared resid 18643.74 Schwarz criterion 10.59760
Log likelihood -70.22460 Hannan-Quinn criter 10.44798
F-statistic 24.53596 Durbin-Watson stat 1.731978
Prob(F-statistic) 0.000088
a) Hãy giải thích ý nghĩa các hệ số đứng trước các biến giải thích?
b) Biến BATHS đưa vào mô hình có phù hợp không ?
c) Kiểm định tính có ý nghĩa của mô hình với mức ý nghĩa 5%
Giải:
a Ý nghĩa các hệ số:
- Khi diện tích tăng 1% thì giá bán tăng thêm 284,2528/100=2,842528 (ngàn USD/m2)
- Khi số phòng tắm tăng thêm 1% thì giá bán giảm xuống – 18,18913/100=-0,1818913 (ngàn USD/m2)
β β
=
≠
Vì p-value =0,6662 < α => chấp nhận H0 => β2=0