Thông tin tài liệu
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
1
GV: Nguyễn Thị Mai Bình
Môn học: KINH TẾ LƯỢNG
Lớp: 04QK, 04QB, 04QB (Năm học 2006 – 2007)
Gợi ý đáp án Bài tập số 2: MÔ HÌNH HỒI QUI BỘI
Câu 1: (40điểm) Xem xét dữ liệu về tiêu dùng thịt gà ở Mỹ giai đọan 1960 đến 1982 được trình bày
trong file Table 7.9 thuộc bộ dữ liệu của Gujarati (hoặcc file chicken demand). Trong đó:
Y = lượng thịt gà tiêu thụ bình quân đầu người (pound)
X2 = thu nhập khả dụng bình quân đầu người (USD)
X3 = Giá bán lẻ của thịt gà (cent/pound)
X4 = Giá bán lẻ của thịt bò (cent/pound)
X5 = Giá bán lẻ của thịt heo (cent/pound)
X6 = Giá bán lẻ bình quân có trọng số của thịt bò và thịt heo (cent/pound)
Các anh/chị hãy:
a) Xây dựng mô hình theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình nào là mô
hình tối ưu. Giải thích quá trình thực hiện và các kiểm định cần thiết. (α=5%)
Mô hình hồi qui tổng thể của lượng thịt gà tiêu thụ bình quân đầu người (Y) theo thu nhập khả dụng bình
quân đầu người (X2), giá bán lẻ của thịt gà (X3), giá bán lẻ của thịt bò (X4), giá bán lẻ của thịt heo (X5),
Giá bán lẻ bình quân có trọng số của thịt bò và thịt heo (X6)
(PRF): Y = β
1
+ β
2
X
2
+ β
3
X
3
+ β
4
X
4
+ β
5
X
5
+ β
6
X
6
+u
i
Chạy Eview với mô hình trên ta có:
Dependent Variable: Y
Method: Least Squares
Date: 04/30/07 Time: 14:23
Sample: 1960 1982
Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
C 38.59691 4.214488 9.158150 0.0000
X2 0.004889 0.004962 0.985370 0.3383
X3 -0.651888 0.174400 -3.737889 0.0016
X4 0.243242 0.089544 2.716443 0.0147
X5 0.104318 0.070644 1.476674 0.1580
X6 -0.071110 0.098381 -0.722805 0.4796
R-squared 0.944292 Mean dependent var 39.66957
Adjusted R-squared 0.927908 S.D. dependent var 7.372950
S.E. of regression 1.979635 Akaike info criterion 4.423160
Sum squared resid 66.62224 Schwarz criterion 4.719376
Log likelihood -44.86635 F-statistic 57.63303
Durbin-Watson stat 1.100559 Prob(F-statistic) 0.000000
Với kết quả của bảng trên ta thấy các hệ số P_value của các biến X2, X5, X6 đều lớn hơn α = 5% vì vậy
ta thực hiện kiểm định Wald với:
H
0
: β
2
= β
5
= β
6
= 0
H
1
: có ít nhất một giá trị β
i
≠ 0 với (i = 2, 5, 6)
Chạy Eview ta có kết quả:
Wald Test:
Equation: EQ01
Test Statistic Value df Probability
F-statistic 7.852143 (3, 17) 0.0017
Chi-square 23.55643 3 0.0000
Null Hypothesis Summary:
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
2
Normalized Restriction (= 0) Value Std. Err.
GV: Nguyễn Thị Mai Bình
C(2) 0.004889 0.004962
C(5) 0.104318 0.070644
C(6) -0.071110 0.098381
Restrictions are linear in coefficients.
P_value sau khi chạy Wald test trong kiểm định trên ta có:
P_value =0.0017 < α = 5%
Vì vậy ta bác bỏ giả thuyết H
0
, vậy có ít nhất một giá trị β
i
≠ 0 với (i = 2, 5, 6)
Để thực hiện việc xây dựng mô hình từ đơn giản đến phức tạp, ta căn cứ vào hệ số P_value của các biến
độc lập. Biến được loại ra khỏi mô hình là biến có hệ số P_value lớn.
- Đầu tiên ta bỏ biến X6 ra khỏi mô hình vì biến này có P_value = 0.4796 (P_value lớn nhất). Lúc này
kết quả Eview như sau:
Dependent Variable: Y
Method: Least Squares
Date: 04/30/07 Time: 14:42
Sample: 1960 1982
Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
C 37.23236 3.717695 10.01490 0.0000
X2 0.005011 0.004893 1.024083 0.3194
X3 -0.611174 0.162849 -3.753010 0.0015
X4 0.198409 0.063721 3.113734 0.0060
X5 0.069503 0.050987 1.363144 0.1896
R-squared 0.942580 Mean dependent var 39.66957
Adjusted R-squared 0.929821 S.D. dependent var 7.372950
S.E. of regression 1.953198 Akaike info criterion 4.366473
Sum squared resid 68.66969 Schwarz criterion 4.613320
Log likelihood -45.21444 F-statistic 73.87052
Durbin-Watson stat 1.065034 Prob(F-statistic) 0.000000
- Căn cứ vào kết quả chạy Eview sau khi bỏ biến X6, ta nhận thấy vẫn còn có các biến X2, X5 có
P_value lớn hơn α = 5%. Ta tiếp tục bỏ biến X2 do P_value = 0.3194 (P_value lớn nhất) và được kết
quả như sau:
Dependent Variable: Y
Method: Least Squares
Date: 04/30/07 Time: 14:46
Sample: 1960 1982
Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
C 35.68084 3.399337 10.49641 0.0000
X3 -0.654097 0.157564 -4.151300 0.0005
X4 0.232528 0.054387 4.275460 0.0004
X5 0.115422 0.024303 4.749224 0.0001
R-squared 0.939235 Mean dependent var 39.66957
Adjusted R-squared 0.929641 S.D. dependent var 7.372950
S.E. of regression 1.955702 Akaike info criterion 4.336146
Sum squared resid 72.67063 Schwarz criterion 4.533624
Log likelihood -45.86568 F-statistic 97.89329
Durbin-Watson stat 1.251523 Prob(F-statistic) 0.000000
Lúc này các biến X3, X4, X6 đều có P_value nhỏ hơn α = 5%. Vậy mô hình trên có thể là mô hình phù
hợp nhất. Tuy nhiên, để kiểm tra lại có phải việc loại bỏ biến X6, và X2 ra khổi mô hình là phù hợp. Ta
thực hiện lại việc kiểm định Wald với:
H
0
: β
2
= β
6
= 0
H
1
: có ít nhất một giá trị β
i
≠ 0 với (i = 2, 6)
Chạy Eview ta có kết quả:
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
3
GV: Nguyễn Thị Mai Bình
Wald Test:
Equation: HOIQUI_U
Test Statistic Value df Probability
F-statistic 0.771684 (2, 17) 0.4778
Chi-square 1.543368 2 0.4622
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(2) 0.004889 0.004962
C(6) -0.071110 0.098381
Restrictions are linear in coefficients.
P_value sau khi chạy Wald test trong kiểm định trên ta có:
P_value =0.4778 > α = 5%
Vì vậy ta chấp nhận giả thuyết H
0
, điều này có nghĩa việc loại bỏ 2 biến thu nhập khả dụng bình quân
đầu người (X2 và giá bán lẻ bình quân có trọng số của thịt bò và thịt heo (X6) ra khỏi mô hình là phù
hợp
Mô hình hồi qui phù hợp nhất là:
Y
ˆ
= 35.68083973 - 0.6540969702*X3 + 0.2325281315*X4 + 0.1154218668*X5
b) Giải thích ý nghĩa các tham số của mô hình phù hợp nhất:
Ta có:
β
1
= 35.68083973 không giả thích được vì có ẩn chứa những biến bỏ sót ngoài mô hình hoặc chọn hàm
sai.
β
3
= - 0.6540969702: tác động biên của X3 lên Y. Trong điều kiện các biến khác không đổi, theo thông
tin từ dữ liệu mẫu ta có nếu giá bán lẻ của thịt gà tăng lên 1 cent/pound thì lượng thịt gà tiêu thụ bình
quân đầu người sẽ giảm đi 0.6540969702pound
β
4
= 0.2325281315 tác động biên của X4 lên Y. Trong điều kiện các biến khác không đổi, theo thông tin
từ dữ liệu mẫu ta có nếu giá bán lẻ của thịt bò tăng lên 1 cent/pound thì lượng thịt gà tiêu thụ bình quân
đầu người sẽ tăng lên 0.2325281315 pound
β
5
= 0.1154218668 tác động biên của X5 lên Y. Trong điều kiện các biến khác không đổi, theo thông tin
từ dữ liệu mẫu ta có nếu giá bán lẻ của thịt heo tăng lên 1 cent/pound thì lượng thịt gà tiêu thụ bình quân
đầu người sẽ tăng lên 0.1154218668 pound
(Với hệ số β
4
và β
5
cho thấy thịt gà có thể là sản phẩm thay thế cho thịt bò và thịt heo)
Câu 2: (40 điểm) Xem xét dữ liệu về các yếu tố ảnh hưởng đền giá nhà trong fike Data7-3 thuộc bộ
dữ liệu Ramanathan. Trong đó:
Price = giá nhà
Baths = số phòng tắm
Bedrms = số phòng ngủ
Famroom = nhận giá trị 1 nếu nhà có phòng gia đình và giá trị 0 cho trường hợp ngược lại
Firepl = nhận giá trị 1 nếu nhà có thiết bị báo cháy và giá trị 0 cho trường hợp ngược lại
Pool = nhận giá trị 1 nếu nhà có hồ bơi và giá trị 0 cho trường hợp ngược lại
Sqft = diện tích nhà
Các anh/chị hãy:
a) Xây dựng các mô hình sau theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình
nào là mô hình tối ưu (xem xét các mô hình tổng quát dưới đây). Giải thích quá trình thực hiện
và các kiểm định cần thiết. (α=5%)
a. Price = β
1
+ β
2
Baths + β
3
Bedrms + β
4
Famroom + β
5
Firepl + β
6
Pool + β
7
Sqft
Chạy mô hình trên với Eview, ta có kết quả:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 15:19
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
4
Sample: 1 14
GV: Nguyễn Thị Mai Bình
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 39.05715 89.53975 0.436199 0.6758
BATHS -0.263691 41.45465 -0.006361 0.9951
BEDRMS -7.045531 28.73627 -0.245179 0.8134
FAMROOM -21.34471 42.87340 -0.497854 0.6338
FIREPL 26.18799 53.84537 0.486355 0.6416
POOL 53.19581 22.06352 2.411030 0.0467
SQFT 0.146551 0.030101 4.868577 0.0018
R-squared 0.911504 Mean dependent var 317.4929
Adjusted R-squared 0.835650 S.D. dependent var 88.49816
S.E. of regression 35.87726 Akaike info criterion 10.30494
Sum squared resid 9010.244 Schwarz criterion 10.62447
Log likelihood -65.13456 F-statistic 12.01657
Durbin-Watson stat 2.602259 Prob(F-statistic) 0.002213
Với kết quả của bảng trên ta thấy các hệ số P_value của các biến Baths, Bedrms, Famroom, Firepl đều
lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với:
H
0
: β
2
= β
3
= β
4
= β
5
= 0
H
1
: có ít nhất một giá trị β
i
≠ 0 với (i = 2, 3, 4, 5)
Chạy Eview ta có kết quả:
Wald Test:
Equation: Untitled
Test Statistic Value df Probability
F-statistic 0.086452 (4, 7) 0.9839
Chi-square 0.345807 4 0.9867
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(2) -0.263691 41.45465
C(3) -7.045531 28.73627
C(4) -21.34471 42.87340
C(5) 26.18799 53.84537
Restrictions are linear in coefficients.
P_value sau khi chạy Wald test trong kiểm định trên ta có:
P_value = 0.9839 > α = 5%
Vì vậy ta chấp nhận giả thuyết H
0
, vậy các hệ số trước các biến Baths, Bedrms, Famroom, Firepl đều
bằng 0; hay các biến số phòng tắm, số phòng ngủ, có phòng gia đình, có thiết bị báo cháy không ảnh
hưởng đến giá nhà. Vì vậy ta có thể bỏ các biến trên ra khỏi mô hình. Lúc này ta có mô hình:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 15:29
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 22.67277 29.50580 0.768417 0.4584
POOL 52.78980 16.48172 3.202931 0.0084
SQFT 0.144415 0.014185 10.18086 0.0000
R-squared 0.907132 Mean dependent var 317.4929
Adjusted R-squared 0.890247 S.D. dependent var 88.49816
S.E. of regression 29.31856 Akaike info criterion 9.781728
Sum squared resid 9455.359 Schwarz criterion 9.918669
Log likelihood -65.47210 F-statistic 53.72383
Durbin-Watson stat 2.526380 Prob(F-statistic) 0.000002
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
5
GV: Nguyễn Thị Mai Bình
Với các giá trị P_value trước biến Pool và biến sqft đều nhỏ hơn 5%. Vì vậy chấp nhận hô hình này
Vậy phương trình hồi qui lúc này:
PRICE = 22.67277002 + 52.78979633*POOL + 0.1444149156*SQFT +
i
u
ˆ
b. Price = β
1
+ β
2
Baths + β Bedrms + β Famroom + β
3 4 5
Firepl + β Pool + β
6 7
Sqft + β
8
Firepl* Sqft
Chạy mô hình trên với Eview, ta có kết quả:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 16:33
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C -391.6926 362.2206 -1.081365 0.3211
BATHS -5.049608 40.23999 -0.125487 0.9042
BEDRMS 0.068210 28.36362 0.002405 0.9982
FAMROOM -21.67260 41.42130 -0.523223 0.6196
FIREPL 437.6739 340.0121 1.287230 0.2454
POOL 65.52753 23.57464 2.779578 0.0320
SQFT 0.502063 0.291755 1.720837 0.1361
FIREPL*SQFT -0.355295 0.290125 -1.224627 0.2666
R-squared 0.929200 Mean dependent var 317.4929
Adjusted R-squared 0.846601 S.D. dependent var 88.49816
S.E. of regression 34.66139 Akaike info criterion 10.22469
Sum squared resid 7208.472 Schwarz criterion 10.58986
Log likelihood -63.57282 F-statistic 11.24945
Durbin-Watson stat 2.524457 Prob(F-statistic) 0.004472
Với kết quả của bảng trên ta thấy các hệ số P_value của các biến Baths, Bedrms, Famroom, Firepl, Sqft,
Firepl* Sqft đều lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với:
H
: β
0 2
= β = β = β = β = β = 0
3 4 5 7 8
H
: có ít nhất một giá trị β ≠ 0 với (i = 2, 3, 4, 5, 7, 8)
1 i
Chạy Eview ta có kết quả:
Wald Test:
Equation: Untitled
Test Statistic Value df Probability
F-statistic 12.67148 (6, 6) 0.0035
Chi-square 76.02890 6 0.0000
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(2) -5.049608 40.23999
C(3) 0.068210 28.36362
C(4) -21.67260 41.42130
C(5) 437.6739 340.0121
C(7) 0.502063 0.291755
C(8) -0.355295 0.290125
Restrictions are linear in coefficients.
P_value sau khi chạy Wald test trong kiểm định trên ta có:
P_value = 0.0035> α = 5%
Vì vậy ta bác bỏ giả thuyết H
, vậy có ít nhất một giá trị β ≠ 0 với (i = 2, 3, 4, 5, 7, 8)
0 i
Để thực hiện việc xây dựng mô hình từ đơn giản đến phức tạp, ta căn cứ vào hệ số P_value của các biến
độc lập. Biến được loại ra khỏi mô hình là biến có hệ số P_value lớn.
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
6
GV: Nguyễn Thị Mai Bình
- Đầu tiên ta bỏ biến Bedrms ra khỏi mô hình vì biến này có P_value = 0.9982 (P_value lớn nhất). Lúc
này kết quả Eview như sau:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 16:42
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C -391.3735 312.0440 -1.254225 0.2500
BATHS -5.013808 34.61187 -0.144858 0.8889
FAMROOM -21.69964 36.90877 -0.587926 0.5751
FIREPL 437.5656 312.0188 1.402370 0.2036
POOL 65.50844 20.55132 3.187553 0.0153
SQFT 0.501915 0.264005 1.901154 0.0990
FIREPL*SQFT -0.355152 0.262910 -1.350849 0.2188
R-squared 0.929200 Mean dependent var 317.4929
Adjusted R-squared 0.868515 S.D. dependent var 88.49816
S.E. of regression 32.09023 Akaike info criterion 10.08183
Sum squared resid 7208.479 Schwarz criterion 10.40136
Log likelihood -63.57283 F-statistic 15.31173
Durbin-Watson stat 2.525083 Prob(F-statistic) 0.001044
- Căn cứ vào kết quả chạy Eview sau khi bỏ biến Bedrms, ta nhận thấy các hệ số P_value của các biến
Baths, Famroom, Firepl, Sqft, Firepl* Sqft đều lớn hơn α = 5%. Ta tiếp tục bỏ biến Baths, do
P_value = 0.8889 (P_value lớn nhất) và được kết quả như sau
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 16:45
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C -396.8103 290.2054 -1.367343 0.2087
FAMROOM -23.43309 32.70893 -0.716412 0.4941
FIREPL 437.8164 292.2995 1.497835 0.1726
POOL 66.06998 18.90720 3.494435 0.0081
SQFT 0.498254 0.246188 2.023872 0.0776
FIREPL*SQFT -0.354257 0.246230 -1.438725 0.1882
R-squared 0.928988 Mean dependent var 317.4929
Adjusted R-squared 0.884606 S.D. dependent var 88.49816
S.E. of regression 30.06262 Akaike info criterion 9.941969
Sum squared resid 7230.087 Schwarz criterion 10.21585
Log likelihood -63.59378 F-statistic 20.93140
Durbin-Watson stat 2.543786 Prob(F-statistic) 0.000210
- Căn cứ vào kết quả chạy Eview sau khi bỏ biến Bedrms, Baths; ta nhận thấy các hệ số P_value của
các biến Famroom, Firepl, Sqft, Firepl* Sqft đều lớn hơn α = 5%. Ta tiếp tục bỏ biến Famroom, do
P_value = 0.4941 (P_value lớn nhất) và được kết quả như sau:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 16:47
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C -376.6690 280.9210 -1.340836 0.2128
FIREPL 402.0001 280.0962 1.435221 0.1850
POOL 63.03432 17.92106 3.517331 0.0065
SQFT 0.482192 0.238444 2.022249 0.0739
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
7
GV: Nguyễn Thị Mai Bình
FIREPL*SQFT -0.340550 0.238755 -1.426357 0.1875
R-squared 0.924432 Mean dependent var 317.4929
Adjusted R-squared 0.890846 S.D. dependent var 88.49816
S.E. of regression 29.23837 Akaike info criterion 9.861294
Sum squared resid 7693.940 Schwarz criterion 10.08953
Log likelihood -64.02906 F-statistic 27.52457
Durbin-Watson stat 2.550994 Prob(F-statistic) 0.000046
- Căn cứ vào kết quả chạy Eview sau khi bỏ biến Bedrms, Baths, Famroom; ta nhận thấy các hệ số
P_value của các biến Firepl, Sqft, Firepl* Sqft đều lớn hơn α = 5%. Ta tiếp tục bỏ biến Firepl* Sqft,
do P_value =
0.1875 (P_value lớn nhất) và được kết quả như sau:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 16:49
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 21.73385 31.51070 0.689729 0.5061
FIREPL 4.317827 28.16788 0.153289 0.8812
POOL 52.95961 17.30140 3.061001 0.0120
SQFT 0.142938 0.017711 8.070628 0.0000
R-squared 0.907350 Mean dependent var 317.4929
Adjusted R-squared 0.879555 S.D. dependent var 88.49816
S.E. of regression 30.71350 Akaike info criterion 9.922238
Sum squared resid 9433.193 Schwarz criterion 10.10483
Log likelihood -65.45567 F-statistic 32.64424
Durbin-Watson stat 2.595128 Prob(F-statistic) 0.000018
- Tiếp tục bỏ biến Firepl do P_value = 0.8812 > 0.05 ta có:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 16:50
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 22.67277 29.50580 0.768417 0.4584
POOL 52.78980 16.48172 3.202931 0.0084
SQFT 0.144415 0.014185 10.18086 0.0000
R-squared 0.907132 Mean dependent var 317.4929
Adjusted R-squared 0.890247 S.D. dependent var 88.49816
S.E. of regression 29.31856 Akaike info criterion 9.781728
Sum squared resid 9455.359 Schwarz criterion 9.918669
Log likelihood -65.47210 F-statistic 53.72383
Durbin-Watson stat 2.526380 Prob(F-statistic) 0.000002
Với các giá trị P_value trước biến Pool và biến sqft đều nhỏ hơn 5%. Vì vậy chấp nhận hô hình này
Vậy phương trình hồi qui lúc này:
PRICE = 22.67277002 + 52.78979633*POOL + 0.1444149156*SQFT +
i
u
ˆ
c. Price = β
1
+ β
2
Baths + β Bedrms + β Famroom + β
3 4 5
Firepl + β Pool + β
6 7
Sqft +
β
8
Famroom* Bedrms
Chạy mô hình trên với Eview, ta có kết quả:
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
8
GV: Nguyễn Thị Mai Bình
Điều này có nghĩa mô hình có hiện tượng đa cộng tuyến hoàn hảo.
Lúc này ta tạo biến mới Famroom_Bedrms và lập bảng ma trận tương quan để xác định cá biến bị đa cộng
tuyến. Ta có:
PRICE BATHS BEDRMS FAMROOM FIREPL POOL SQFT FAMROOM
_BEDRMS
PRICE 1.000000 0.669612 0.315634 0.472715 0.495681 0.179062 0.905827 0.477140
BATHS 0.669612 1.000000 0.532327 0.534885 0.457693 -0.185695 0.787318 0.615893
BEDRMS 0.315634 0.532327 1.000000 0.337350 0.547723 -0.377778 0.464730 0.532557
0.968264
FAMROOM 0.472715 0.534885 0.337350 1.000000 0.781736 0.025950 0.520220
FIREPL 0.495681 0.457693 0.547723 0.781736 1.000000 -0.121716 0.551010 0.756927
POOL 0.179062 -0.185695 -0.377778 0.025950 -0.121716 1.000000 -0.124679 -0.060671
SQFT 0.905827 0.787318 0.464730 0.520220 0.551010 -0.124679 1.000000 0.559476
0.968264
FAMROOM
_BEDRMS
0.477140 0.615893 0.532557 0.756927 -0.060671 0.559476 1.000000
Lúc này ta có hệ số tương quan giữa hai biến FAMROOM và FAMROOM_BEDRMS bằng 0.968264 (gần
bằng 1). Vậy có hiện tượng đa cộng tuyến là do 2 biến trên có mối quan hệ chặt chẽ với nhau vì vậy ta bỏ 1
trong 2 biến; giả sử bỏ biến FAMROOM ta có kết quả chạy Eview như sau:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 17:01
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 23.04862 96.48374 0.238886 0.8180
BATHS -0.263691 41.45465 -0.006361 0.9951
BEDRMS -1.709353 27.73050 -0.061642 0.9526
FIREPL 20.85181 46.43392 0.449064 0.6670
POOL 53.19581 22.06352 2.411030 0.0467
SQFT 0.146551 0.030101 4.868577 0.0018
FAMROOM_BEDR
MS
-5.336177 10.71835 -0.497854 0.6338
R-squared 0.911504 Mean dependent var 317.4929
Adjusted R-squared 0.835650 S.D. dependent var 88.49816
S.E. of regression 35.87726 Akaike info criterion 10.30494
Sum squared resid 9010.244 Schwarz criterion 10.62447
Log likelihood -65.13456 F-statistic 12.01657
Durbin-Watson stat 2.602259 Prob(F-statistic) 0.002213
Với kết quả của bảng trên ta thấy các hệ số P_value của các biến Baths, Bedrms, Firepl, Famroom* Bedrms
đều lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với:
H
: β
0 2
= β = β = β = 0
3 5 8
H
: có ít nhất một giá trị β ≠ 0 với (i = 2, 3, 5, 8)
1 i
Chạy Eview ta có kết quả:
Wald Test:
Equation: Untitled
Test Statistic Value df Probability
F-statistic 0.086452 (4, 7) 0.9839
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
9
GV: Nguyễn Thị Mai Bình
Chi-square 0.345807 4 0.9867
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(2) -0.263691 41.45465
C(3) -1.709353 27.73050
C(4) 20.85181 46.43392
C(7) -5.336177 10.71835
Restrictions are linear in coefficients.
P_value sau khi chạy Wald test trong kiểm định trên ta có:
P_value = 0.9839 > α = 5%
Vì vậy ta chấp nhận giả thuyết H
0
, vậy các hệ số trước các biến Baths, Bedrms, Firepl, Famroom*
Bedrms đều bằng 0; hay các biến số phòng tắm, số phòng ngủ, có thiết bị báo cháy và biến ảnh hưởng
của có phòng gia đình lên số lượng phòng ngủ không ảnh hưởng đến giá nhà. Vì vậy ta có thể bỏ các
biến trên ra khỏi mô hình. Lúc này ta có mô hình:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 15:29
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 22.67277 29.50580 0.768417 0.4584
POOL 52.78980 16.48172 3.202931 0.0084
SQFT 0.144415 0.014185 10.18086 0.0000
R-squared 0.907132 Mean dependent var 317.4929
Adjusted R-squared 0.890247 S.D. dependent var 88.49816
S.E. of regression 29.31856 Akaike info criterion 9.781728
Sum squared resid 9455.359 Schwarz criterion 9.918669
Log likelihood -65.47210 F-statistic 53.72383
Durbin-Watson stat 2.526380 Prob(F-statistic) 0.000002
Với các giá trị P_value trước biến Pool và biến sqft đều nhỏ hơn 5%. Vì vậy chấp nhận hô hình này
Vậy phương trình hồi qui lúc này:
PRICE = 22.67277002 + 52.78979633*POOL + 0.1444149156*SQFT +
i
u
ˆ
d. Price = β
1
+ β
2
Baths + β Bedrms + β Famroom + β
3 4 5
Firepl + β Pool + β
6 7
Sqft +
β
8
Pool*Sqft
Chạy mô hình trên với Eview, ta có kết quả:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 17:10
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 76.93417 64.38956 1.194824 0.2772
BATHS -10.24209 29.37901 -0.348619 0.7393
BEDRMS 4.867122 20.64732 0.235727 0.8215
FAMROOM -10.51463 30.40630 -0.345804 0.7413
FIREPL -1.107752 39.07848 -0.028347 0.9783
POOL -85.25082 50.95585 -1.673033 0.1453
SQFT 0.124680 0.022526 5.534876 0.0015
POOL*SQFT 0.074512 0.026121 2.852620 0.0291
R-squared 0.962442 Mean dependent var 317.4929
Adjusted R-squared 0.918624 S.D. dependent var 88.49816
S.E. of regression 25.24543 Akaike info criterion 9.590727
Sum squared resid 3823.992 Schwarz criterion 9.955903
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
10
Log likelihood -59.13509 F-statistic 21.96456
GV: Nguyễn Thị Mai Bình
Durbin-Watson stat 2.150252 Prob(F-statistic) 0.000712
Với kết quả của bảng trên ta thấy các hệ số P_value của các biến Baths, Bedrms, Famroom, Firepl, Pool đều
lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với:
H
: β
0 2
= β = β = β = β = 0
3 4 5 6
H
: có ít nhất một giá trị β ≠ 0 với (i = 2, 3, 4, 5, 6)
1 i
Chạy Eview ta có kết quả:
Wald Test:
Equation: Untitled
Test Statistic Value df Probability
F-statistic 0.675681 (5, 6) 0.6581
Chi-square 3.378405 5 0.6419
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(2) -10.24209 29.37901
C(3) 4.867122 20.64732
C(4) -10.51463 30.40630
C(5) -1.107752 39.07848
C(6) -85.25082 50.95585
Restrictions are linear in coefficients.
P_value sau khi chạy Wald test trong kiểm định trên ta có:
P_value = 0.6581 > α = 5%
Vì vậy ta chấp nhận giả thuyết H
0
, vậy các hệ số trước các biến Baths, Bedrms, Famroom, Firepl, Pool
đều bằng 0; hay các biến số phòng tắm, số phòng ngủ, có phòng gia đình, có thiết bị báo cháy, có hồ bơi
không ảnh hưởng đến giá nhà. Vì vậy ta có thể bỏ các biến trên ra khỏi mô hình. Lúc này ta có mô hình:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 17:17
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 42.79643 22.36292 1.913723 0.0820
SQFT 0.132927 0.011257 11.80854 0.0000
POOL*SQFT 0.031857 0.006697 4.757055 0.0006
R-squared 0.941294 Mean dependent var 317.4929
Adjusted R-squared 0.930620 S.D. dependent var 88.49816
S.E. of regression 23.31047 Akaike info criterion 9.323092
Sum squared resid 5977.157 Schwarz criterion 9.460032
Log likelihood -62.26164 F-statistic 88.18710
Durbin-Watson stat 2.756228 Prob(F-statistic) 0.000000
Với các giá trị P_value trước biến Pool*Sqft và biến Sqft đều nhỏ hơn 5%. Vì vậy chấp nhận hô hình này
Vậy phương trình hồi qui lúc này:
PRICE = 42.7964305 + 0.132927069*SQFT + 0.03185742065*(POOL*SQFT) +
i
u
ˆ
e. Price = β
1
+ β
2
Baths + β Bedrms + β Famroom + β
3 4 5
Firepl + β Pool + β
6 7
Sqft +
β
8
Famroom* Bedrms + β
9
Firepl* Sqft + β
10
Pool*Sqft + β
11
Firepl*Bedrms+
β
Pool*Baths
10
Chạy mô hình trên với Eview, ta có kết quả:
[...]... Cobb-Douglass cho mô hình hồi qui trên Viết ra dạng hàm lý thuyết cần ước lượng 2 Hãy viết mô hình hồi qui mẫu cho mô hình trên căn cứ vào các mô hình bên dưới và giải thích ý nghĩa của các tham số từ mô hình trên 3 Theo các anh chị mô hình trên có bị những bệnh nào không? Tại sao (anh chị hãy cho biết rõ anh chị dựa trên mô hình nào) 4 Một bạn sinh viên chạy thử mô hình 4.6 và nhận thấy rằng mô hình này cũng... chạy mô hình hồi qui ta được mô hình 3.1 Theo các anh chị mô hình trên tối ưu chưa tại sao? Hãy viết các kiểm định cần thiết để chứng minh kết luận trên Nếu mô hình trên chưa tối ưu theo các anh chị cần phải làm gì tiếp theo (với α = 5%) 3 Một bạn sinh viên cho rằng giá của nhà có hồ bơi sẽ lớn hơn nhiều so với nhà không có hồ bơi Bạn chạy mô hình hồi qui 3.2 Anh/chị hãy viết phương trình hồi qui của mô. .. tstat lớn) Mô hình (3) thể hiện mối quan hệ giữa 2 biến độc lập GDP và CPI, ta thấy mô hình này có ý nghĩa về mặt thống kê điều này có nghĩa có hiện tượng đa cộng tuyến trong mô hình gốc Mặt khác, R2 trong mô hình 3 (R2hqp=0.992224) lớn hơn mô hình ban đầu (R2 = 0.982318) và lớn nhất trong các mô hình vì vậy mức độ đa cộng tuyến giữa hai biến GDP và CPI rất mạnh Giải sử trong mô hình ban đầu (mô hình Ln... gốc là 1948) 1 Mô hình 1.1 thể hiện mối quan hệ của 2 biến này Anh chị có nhận xét gì về mô hình này 2 Một sinh viên cho rằng mô hình này có thể bị bệnh nên thực hiện các phép kiểm định trong các mô hình 1.2, mô hình 1.3 Theo các anh chị đây là các phép kiểm định gì, nêu rõ các giải thuyết và căn cứ theo mô hình trên các anh chị hãy cho biết mô hình trên có bị bệnh gì không ? 3 Nếu mô hình trên có bệnh... anh chị hãy đề xuất các phương án trị bệnh, nêu cụ thể cách làm trên Eview 4 Một sinh viên đề suất một mô hình 1.5, các anh chị hãy viết phương trình hồi qui của mô hình này Giải thích ý nghĩa của các tham số 5 Nếu mô hình 1.1 và mô hình 1.5 đều là mô hình tốt, anh/chị sẽ chọn mô hình nào tại sao ? Mô hình 1.1 Dependent Variable: FARMPOP Method: Least Squares Date: 06/24/07 Time: 22:28 Sample: 1948 1991... 1 Có sinh viên cho rằng nên sử dụng mô hình như mô hình 2.1 trong trường hợp này mới phù hợp Các anh chị hãy cho biết mô hình trên có tên gọi là gì và viết phương trình tổng quát cho mô hình trên (mô hình còn chứa β, chưa ước lượng) 2 Nhìn vào tất cả các mô hình bên dưới, các anh chị hãy giải thích khả năng xảy ra hiện tượng đa cộng tuyến trong mô hình 3 Trong mô hình 2.1, các biến nào không có ý nghĩa... lao động” hoặc “hiệu suất không thay đổi theo qui mô (với α = 5%) 1 Theo các anh chị dấu kỳ vọng của các biến độc lập này như thế nào 2 Hãy viết hàm Cobb-Douglass cho mô hình hồi qui trên Viết ra dạng hàm lý thuyết cần ước lượng 3 Hãy viết mô hình hồi qui mẫu cho mô hình trên căn cứ vào các mô hình bên dưới và giải thích ý nghĩa của các tham số từ mô hình trên 4 Các anh chị hãy viết các kiểm định... 3.2 Anh/chị hãy viết phương trình hồi qui của mô hình trên Giải thích ý nghĩa của các tham số hồi qui của mô hình trên, cho biết bạn sinh viên trên nghi ngờ đúng không? (với α = 5%) 4 Một sinh viên khác không đồng ý nên chạy mô hình 3.3, anh/ chị hãy viết phương trình hồi qui cho mô hình trên và giải thích ý nghĩa của các tham số của mô hình trên 5 Mô hình 3.1 Dependent Variable: PRICE Method: Least... tuyến trong mô hình 1.1 3 Trong mô hình 1.1, các biến nào không có ý nghĩa về mặt thống kê (không ảnh hưởng đến lượng thịt gà tiêu thụ bình quân đầu người) với mức ý nghĩa 10% Hãy cho biết nên thực hiện kiểm định nào để biết được có nên bỏ các biến trên ra khỏi mô hình 1.1 4 Việc xây dựng mô hình từ mô hình 1.1 đến mô hình 1.2 có tên gọi là gì? Hãy giải thích ý nghĩa các tham số của mô hình phù hợp... hiện các phép kiểm định trong các mô hình 2.2, mô hình 2.4 Theo các anh chị các mô hình trên dùng để xác định bệnh gì? Đây là các phép kiểm định gì, nêu rõ các giải thuyết và căn cứ theo mô hình trên các anh chị hãy cho biết mô hình trên có bị bệnh gì không? 3 Nếu mô hình trên có bệnh các anh chị hãy đề xuất các phương án trị bệnh 4 Một sinh viên khác cho rằng mô hình 2.5 mới phù hợp, mới có thể giải . Xây dựng mô hình theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình nào là mô hình tối ưu. Giải thích quá trình thực hiện và các kiểm định cần thiết. (α=5%) Mô hình hồi qui tổng. chọn mô hình tối ưu ta so sánh các …… số R 2 , AIC, Schwarz R 2 AIC SCHWARZ 2 R Mô hình 1 0.907132 0.89024 9.781728 9.918669 Mô hình 2 0.941294 0.930620 9.323092 9.460032 Vậy mô hình hồi qui. nhà Các anh/chị hãy: a) Xây dựng các mô hình sau theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình nào là mô hình tối ưu (xem xét các mô hình tổng quát dưới đây). Giải thích quá
Ngày đăng: 24/03/2014, 23:30
Xem thêm: Mô hình hồi qui bội, Mô hình hồi qui bội