Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 152 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
152
Dung lượng
4,94 MB
Nội dung
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
1
GV: Nguyễn Thị Mai Bình
Môn học: KINH TẾ LƯỢNG
Lớp: 04QK, 04QB, 04QB (Năm học 2006 – 2007)
Gợi ý đáp án Bài tập số 2: MÔHÌNHHỒIQUIBỘI
Câu 1: (40điểm) Xem xét dữ liệu về tiêu dùng thịt gà ở Mỹ giai đọan 1960 đến 1982 được trình bày
trong file Table 7.9 thuộc bộ dữ liệu của Gujarati (hoặcc file chicken demand). Trong đó:
Y = lượng thịt gà tiêu thụ bình quân đầu người (pound)
X2 = thu nhập khả dụng bình quân đầu người (USD)
X3 = Giá bán lẻ của thịt gà (cent/pound)
X4 = Giá bán lẻ của thịt bò (cent/pound)
X5 = Giá bán lẻ của thịt heo (cent/pound)
X6 = Giá bán lẻ bình quân có trọng số của thịt bò và thịt heo (cent/pound)
Các anh/chị hãy:
a) Xây dựng môhình theo phương pháp từ phức tạp đến đơn giản và cho biết môhình nào là mô
hình tối ưu. Giải thích quá trình thực hiện và các kiểm định cần thiết. (α=5%)
Mô hìnhhồiqui tổng thể của lượng thịt gà tiêu thụ bình quân đầu người (Y) theo thu nhập khả dụng bình
quân đầu người (X2), giá bán lẻ của thịt gà (X3), giá bán lẻ của thịt bò (X4), giá bán lẻ của thịt heo (X5),
Giá bán lẻ bình quân có trọng số của thịt bò và thịt heo (X6)
(PRF): Y = β
1
+ β
2
X
2
+ β
3
X
3
+ β
4
X
4
+ β
5
X
5
+ β
6
X
6
+u
i
Chạy Eview với môhình trên ta có:
Dependent Variable: Y
Method: Least Squares
Date: 04/30/07 Time: 14:23
Sample: 1960 1982
Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
C 38.59691 4.214488 9.158150 0.0000
X2 0.004889 0.004962 0.985370 0.3383
X3 -0.651888 0.174400 -3.737889 0.0016
X4 0.243242 0.089544 2.716443 0.0147
X5 0.104318 0.070644 1.476674 0.1580
X6 -0.071110 0.098381 -0.722805 0.4796
R-squared 0.944292 Mean dependent var 39.66957
Adjusted R-squared 0.927908 S.D. dependent var 7.372950
S.E. of regression 1.979635 Akaike info criterion 4.423160
Sum squared resid 66.62224 Schwarz criterion 4.719376
Log likelihood -44.86635 F-statistic 57.63303
Durbin-Watson stat 1.100559 Prob(F-statistic) 0.000000
Với kết quả của bảng trên ta thấy các hệ số P_value của các biến X2, X5, X6 đều lớn hơn α = 5% vì vậy
ta thực hiện kiểm định Wald với:
H
0
: β
2
= β
5
= β
6
= 0
H
1
: có ít nhất một giá trị β
i
≠ 0 với (i = 2, 5, 6)
Chạy Eview ta có kết quả:
Wald Test:
Equation: EQ01
Test Statistic Value df Probability
F-statistic 7.852143 (3, 17) 0.0017
Chi-square 23.55643 3 0.0000
Null Hypothesis Summary:
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
2
Normalized Restriction (= 0) Value Std. Err.
GV: Nguyễn Thị Mai Bình
C(2) 0.004889 0.004962
C(5) 0.104318 0.070644
C(6) -0.071110 0.098381
Restrictions are linear in coefficients.
P_value sau khi chạy Wald test trong kiểm định trên ta có:
P_value =0.0017 < α = 5%
Vì vậy ta bác bỏ giả thuyết H
0
, vậy có ít nhất một giá trị β
i
≠ 0 với (i = 2, 5, 6)
Để thực hiện việc xây dựng môhình từ đơn giản đến phức tạp, ta căn cứ vào hệ số P_value của các biến
độc lập. Biến được loại ra khỏi môhình là biến có hệ số P_value lớn.
- Đầu tiên ta bỏ biến X6 ra khỏi môhình vì biến này có P_value = 0.4796 (P_value lớn nhất). Lúc này
kết quả Eview như sau:
Dependent Variable: Y
Method: Least Squares
Date: 04/30/07 Time: 14:42
Sample: 1960 1982
Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
C 37.23236 3.717695 10.01490 0.0000
X2 0.005011 0.004893 1.024083 0.3194
X3 -0.611174 0.162849 -3.753010 0.0015
X4 0.198409 0.063721 3.113734 0.0060
X5 0.069503 0.050987 1.363144 0.1896
R-squared 0.942580 Mean dependent var 39.66957
Adjusted R-squared 0.929821 S.D. dependent var 7.372950
S.E. of regression 1.953198 Akaike info criterion 4.366473
Sum squared resid 68.66969 Schwarz criterion 4.613320
Log likelihood -45.21444 F-statistic 73.87052
Durbin-Watson stat 1.065034 Prob(F-statistic) 0.000000
- Căn cứ vào kết quả chạy Eview sau khi bỏ biến X6, ta nhận thấy vẫn còn có các biến X2, X5 có
P_value lớn hơn α = 5%. Ta tiếp tục bỏ biến X2 do P_value = 0.3194 (P_value lớn nhất) và được kết
quả như sau:
Dependent Variable: Y
Method: Least Squares
Date: 04/30/07 Time: 14:46
Sample: 1960 1982
Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
C 35.68084 3.399337 10.49641 0.0000
X3 -0.654097 0.157564 -4.151300 0.0005
X4 0.232528 0.054387 4.275460 0.0004
X5 0.115422 0.024303 4.749224 0.0001
R-squared 0.939235 Mean dependent var 39.66957
Adjusted R-squared 0.929641 S.D. dependent var 7.372950
S.E. of regression 1.955702 Akaike info criterion 4.336146
Sum squared resid 72.67063 Schwarz criterion 4.533624
Log likelihood -45.86568 F-statistic 97.89329
Durbin-Watson stat 1.251523 Prob(F-statistic) 0.000000
Lúc này các biến X3, X4, X6 đều có P_value nhỏ hơn α = 5%. Vậy môhình trên có thể là môhình phù
hợp nhất. Tuy nhiên, để kiểm tra lại có phải việc loại bỏ biến X6, và X2 ra khổi môhình là phù hợp. Ta
thực hiện lại việc kiểm định Wald với:
H
0
: β
2
= β
6
= 0
H
1
: có ít nhất một giá trị β
i
≠ 0 với (i = 2, 6)
Chạy Eview ta có kết quả:
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
3
GV: Nguyễn Thị Mai Bình
Wald Test:
Equation: HOIQUI_U
Test Statistic Value df Probability
F-statistic 0.771684 (2, 17) 0.4778
Chi-square 1.543368 2 0.4622
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(2) 0.004889 0.004962
C(6) -0.071110 0.098381
Restrictions are linear in coefficients.
P_value sau khi chạy Wald test trong kiểm định trên ta có:
P_value =0.4778 > α = 5%
Vì vậy ta chấp nhận giả thuyết H
0
, điều này có nghĩa việc loại bỏ 2 biến thu nhập khả dụng bình quân
đầu người (X2 và giá bán lẻ bình quân có trọng số của thịt bò và thịt heo (X6) ra khỏi môhình là phù
hợp
Mô hìnhhồiqui phù hợp nhất là:
Y
ˆ
= 35.68083973 - 0.6540969702*X3 + 0.2325281315*X4 + 0.1154218668*X5
b) Giải thích ý nghĩa các tham số của môhình phù hợp nhất:
Ta có:
β
1
= 35.68083973 không giả thích được vì có ẩn chứa những biến bỏ sót ngoài môhình hoặc chọn hàm
sai.
β
3
= - 0.6540969702: tác động biên của X3 lên Y. Trong điều kiện các biến khác không đổi, theo thông
tin từ dữ liệu mẫu ta có nếu giá bán lẻ của thịt gà tăng lên 1 cent/pound thì lượng thịt gà tiêu thụ bình
quân đầu người sẽ giảm đi 0.6540969702pound
β
4
= 0.2325281315 tác động biên của X4 lên Y. Trong điều kiện các biến khác không đổi, theo thông tin
từ dữ liệu mẫu ta có nếu giá bán lẻ của thịt bò tăng lên 1 cent/pound thì lượng thịt gà tiêu thụ bình quân
đầu người sẽ tăng lên 0.2325281315 pound
β
5
= 0.1154218668 tác động biên của X5 lên Y. Trong điều kiện các biến khác không đổi, theo thông tin
từ dữ liệu mẫu ta có nếu giá bán lẻ của thịt heo tăng lên 1 cent/pound thì lượng thịt gà tiêu thụ bình quân
đầu người sẽ tăng lên 0.1154218668 pound
(Với hệ số β
4
và β
5
cho thấy thịt gà có thể là sản phẩm thay thế cho thịt bò và thịt heo)
Câu 2: (40 điểm) Xem xét dữ liệu về các yếu tố ảnh hưởng đền giá nhà trong fike Data7-3 thuộc bộ
dữ liệu Ramanathan. Trong đó:
Price = giá nhà
Baths = số phòng tắm
Bedrms = số phòng ngủ
Famroom = nhận giá trị 1 nếu nhà có phòng gia đình và giá trị 0 cho trường hợp ngược lại
Firepl = nhận giá trị 1 nếu nhà có thiết bị báo cháy và giá trị 0 cho trường hợp ngược lại
Pool = nhận giá trị 1 nếu nhà có hồ bơi và giá trị 0 cho trường hợp ngược lại
Sqft = diện tích nhà
Các anh/chị hãy:
a) Xây dựng các môhình sau theo phương pháp từ phức tạp đến đơn giản và cho biết môhình
nào là môhình tối ưu (xem xét các môhình tổng quát dưới đây). Giải thích quá trình thực hiện
và các kiểm định cần thiết. (α=5%)
a. Price = β
1
+ β
2
Baths + β
3
Bedrms + β
4
Famroom + β
5
Firepl + β
6
Pool + β
7
Sqft
Chạy môhình trên với Eview, ta có kết quả:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 15:19
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
4
Sample: 1 14
GV: Nguyễn Thị Mai Bình
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 39.05715 89.53975 0.436199 0.6758
BATHS -0.263691 41.45465 -0.006361 0.9951
BEDRMS -7.045531 28.73627 -0.245179 0.8134
FAMROOM -21.34471 42.87340 -0.497854 0.6338
FIREPL 26.18799 53.84537 0.486355 0.6416
POOL 53.19581 22.06352 2.411030 0.0467
SQFT 0.146551 0.030101 4.868577 0.0018
R-squared 0.911504 Mean dependent var 317.4929
Adjusted R-squared 0.835650 S.D. dependent var 88.49816
S.E. of regression 35.87726 Akaike info criterion 10.30494
Sum squared resid 9010.244 Schwarz criterion 10.62447
Log likelihood -65.13456 F-statistic 12.01657
Durbin-Watson stat 2.602259 Prob(F-statistic) 0.002213
Với kết quả của bảng trên ta thấy các hệ số P_value của các biến Baths, Bedrms, Famroom, Firepl đều
lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với:
H
0
: β
2
= β
3
= β
4
= β
5
= 0
H
1
: có ít nhất một giá trị β
i
≠ 0 với (i = 2, 3, 4, 5)
Chạy Eview ta có kết quả:
Wald Test:
Equation: Untitled
Test Statistic Value df Probability
F-statistic 0.086452 (4, 7) 0.9839
Chi-square 0.345807 4 0.9867
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(2) -0.263691 41.45465
C(3) -7.045531 28.73627
C(4) -21.34471 42.87340
C(5) 26.18799 53.84537
Restrictions are linear in coefficients.
P_value sau khi chạy Wald test trong kiểm định trên ta có:
P_value = 0.9839 > α = 5%
Vì vậy ta chấp nhận giả thuyết H
0
, vậy các hệ số trước các biến Baths, Bedrms, Famroom, Firepl đều
bằng 0; hay các biến số phòng tắm, số phòng ngủ, có phòng gia đình, có thiết bị báo cháy không ảnh
hưởng đến giá nhà. Vì vậy ta có thể bỏ các biến trên ra khỏi mô hình. Lúc này ta có mô hình:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 15:29
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 22.67277 29.50580 0.768417 0.4584
POOL 52.78980 16.48172 3.202931 0.0084
SQFT 0.144415 0.014185 10.18086 0.0000
R-squared 0.907132 Mean dependent var 317.4929
Adjusted R-squared 0.890247 S.D. dependent var 88.49816
S.E. of regression 29.31856 Akaike info criterion 9.781728
Sum squared resid 9455.359 Schwarz criterion 9.918669
Log likelihood -65.47210 F-statistic 53.72383
Durbin-Watson stat 2.526380 Prob(F-statistic) 0.000002
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
5
GV: Nguyễn Thị Mai Bình
Với các giá trị P_value trước biến Pool và biến sqft đều nhỏ hơn 5%. Vì vậy chấp nhận hô hình này
Vậy phương trình hồiqui lúc này:
PRICE = 22.67277002 + 52.78979633*POOL + 0.1444149156*SQFT +
i
u
ˆ
b. Price = β
1
+ β
2
Baths + β Bedrms + β Famroom + β
3 4 5
Firepl + β Pool + β
6 7
Sqft + β
8
Firepl* Sqft
Chạy môhình trên với Eview, ta có kết quả:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 16:33
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C -391.6926 362.2206 -1.081365 0.3211
BATHS -5.049608 40.23999 -0.125487 0.9042
BEDRMS 0.068210 28.36362 0.002405 0.9982
FAMROOM -21.67260 41.42130 -0.523223 0.6196
FIREPL 437.6739 340.0121 1.287230 0.2454
POOL 65.52753 23.57464 2.779578 0.0320
SQFT 0.502063 0.291755 1.720837 0.1361
FIREPL*SQFT -0.355295 0.290125 -1.224627 0.2666
R-squared 0.929200 Mean dependent var 317.4929
Adjusted R-squared 0.846601 S.D. dependent var 88.49816
S.E. of regression 34.66139 Akaike info criterion 10.22469
Sum squared resid 7208.472 Schwarz criterion 10.58986
Log likelihood -63.57282 F-statistic 11.24945
Durbin-Watson stat 2.524457 Prob(F-statistic) 0.004472
Với kết quả của bảng trên ta thấy các hệ số P_value của các biến Baths, Bedrms, Famroom, Firepl, Sqft,
Firepl* Sqft đều lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với:
H
: β
0 2
= β = β = β = β = β = 0
3 4 5 7 8
H
: có ít nhất một giá trị β ≠ 0 với (i = 2, 3, 4, 5, 7, 8)
1 i
Chạy Eview ta có kết quả:
Wald Test:
Equation: Untitled
Test Statistic Value df Probability
F-statistic 12.67148 (6, 6) 0.0035
Chi-square 76.02890 6 0.0000
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(2) -5.049608 40.23999
C(3) 0.068210 28.36362
C(4) -21.67260 41.42130
C(5) 437.6739 340.0121
C(7) 0.502063 0.291755
C(8) -0.355295 0.290125
Restrictions are linear in coefficients.
P_value sau khi chạy Wald test trong kiểm định trên ta có:
P_value = 0.0035> α = 5%
Vì vậy ta bác bỏ giả thuyết H
, vậy có ít nhất một giá trị β ≠ 0 với (i = 2, 3, 4, 5, 7, 8)
0 i
Để thực hiện việc xây dựng môhình từ đơn giản đến phức tạp, ta căn cứ vào hệ số P_value của các biến
độc lập. Biến được loại ra khỏi môhình là biến có hệ số P_value lớn.
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
6
GV: Nguyễn Thị Mai Bình
- Đầu tiên ta bỏ biến Bedrms ra khỏi môhình vì biến này có P_value = 0.9982 (P_value lớn nhất). Lúc
này kết quả Eview như sau:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 16:42
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C -391.3735 312.0440 -1.254225 0.2500
BATHS -5.013808 34.61187 -0.144858 0.8889
FAMROOM -21.69964 36.90877 -0.587926 0.5751
FIREPL 437.5656 312.0188 1.402370 0.2036
POOL 65.50844 20.55132 3.187553 0.0153
SQFT 0.501915 0.264005 1.901154 0.0990
FIREPL*SQFT -0.355152 0.262910 -1.350849 0.2188
R-squared 0.929200 Mean dependent var 317.4929
Adjusted R-squared 0.868515 S.D. dependent var 88.49816
S.E. of regression 32.09023 Akaike info criterion 10.08183
Sum squared resid 7208.479 Schwarz criterion 10.40136
Log likelihood -63.57283 F-statistic 15.31173
Durbin-Watson stat 2.525083 Prob(F-statistic) 0.001044
- Căn cứ vào kết quả chạy Eview sau khi bỏ biến Bedrms, ta nhận thấy các hệ số P_value của các biến
Baths, Famroom, Firepl, Sqft, Firepl* Sqft đều lớn hơn α = 5%. Ta tiếp tục bỏ biến Baths, do
P_value = 0.8889 (P_value lớn nhất) và được kết quả như sau
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 16:45
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C -396.8103 290.2054 -1.367343 0.2087
FAMROOM -23.43309 32.70893 -0.716412 0.4941
FIREPL 437.8164 292.2995 1.497835 0.1726
POOL 66.06998 18.90720 3.494435 0.0081
SQFT 0.498254 0.246188 2.023872 0.0776
FIREPL*SQFT -0.354257 0.246230 -1.438725 0.1882
R-squared 0.928988 Mean dependent var 317.4929
Adjusted R-squared 0.884606 S.D. dependent var 88.49816
S.E. of regression 30.06262 Akaike info criterion 9.941969
Sum squared resid 7230.087 Schwarz criterion 10.21585
Log likelihood -63.59378 F-statistic 20.93140
Durbin-Watson stat 2.543786 Prob(F-statistic) 0.000210
- Căn cứ vào kết quả chạy Eview sau khi bỏ biến Bedrms, Baths; ta nhận thấy các hệ số P_value của
các biến Famroom, Firepl, Sqft, Firepl* Sqft đều lớn hơn α = 5%. Ta tiếp tục bỏ biến Famroom, do
P_value = 0.4941 (P_value lớn nhất) và được kết quả như sau:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 16:47
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C -376.6690 280.9210 -1.340836 0.2128
FIREPL 402.0001 280.0962 1.435221 0.1850
POOL 63.03432 17.92106 3.517331 0.0065
SQFT 0.482192 0.238444 2.022249 0.0739
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
7
GV: Nguyễn Thị Mai Bình
FIREPL*SQFT -0.340550 0.238755 -1.426357 0.1875
R-squared 0.924432 Mean dependent var 317.4929
Adjusted R-squared 0.890846 S.D. dependent var 88.49816
S.E. of regression 29.23837 Akaike info criterion 9.861294
Sum squared resid 7693.940 Schwarz criterion 10.08953
Log likelihood -64.02906 F-statistic 27.52457
Durbin-Watson stat 2.550994 Prob(F-statistic) 0.000046
- Căn cứ vào kết quả chạy Eview sau khi bỏ biến Bedrms, Baths, Famroom; ta nhận thấy các hệ số
P_value của các biến Firepl, Sqft, Firepl* Sqft đều lớn hơn α = 5%. Ta tiếp tục bỏ biến Firepl* Sqft,
do P_value =
0.1875 (P_value lớn nhất) và được kết quả như sau:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 16:49
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 21.73385 31.51070 0.689729 0.5061
FIREPL 4.317827 28.16788 0.153289 0.8812
POOL 52.95961 17.30140 3.061001 0.0120
SQFT 0.142938 0.017711 8.070628 0.0000
R-squared 0.907350 Mean dependent var 317.4929
Adjusted R-squared 0.879555 S.D. dependent var 88.49816
S.E. of regression 30.71350 Akaike info criterion 9.922238
Sum squared resid 9433.193 Schwarz criterion 10.10483
Log likelihood -65.45567 F-statistic 32.64424
Durbin-Watson stat 2.595128 Prob(F-statistic) 0.000018
- Tiếp tục bỏ biến Firepl do P_value = 0.8812 > 0.05 ta có:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 16:50
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 22.67277 29.50580 0.768417 0.4584
POOL 52.78980 16.48172 3.202931 0.0084
SQFT 0.144415 0.014185 10.18086 0.0000
R-squared 0.907132 Mean dependent var 317.4929
Adjusted R-squared 0.890247 S.D. dependent var 88.49816
S.E. of regression 29.31856 Akaike info criterion 9.781728
Sum squared resid 9455.359 Schwarz criterion 9.918669
Log likelihood -65.47210 F-statistic 53.72383
Durbin-Watson stat 2.526380 Prob(F-statistic) 0.000002
Với các giá trị P_value trước biến Pool và biến sqft đều nhỏ hơn 5%. Vì vậy chấp nhận hô hình này
Vậy phương trình hồiqui lúc này:
PRICE = 22.67277002 + 52.78979633*POOL + 0.1444149156*SQFT +
i
u
ˆ
c. Price = β
1
+ β
2
Baths + β Bedrms + β Famroom + β
3 4 5
Firepl + β Pool + β
6 7
Sqft +
β
8
Famroom* Bedrms
Chạy môhình trên với Eview, ta có kết quả:
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
8
GV: Nguyễn Thị Mai Bình
Điều này có nghĩa môhình có hiện tượng đa cộng tuyến hoàn hảo.
Lúc này ta tạo biến mới Famroom_Bedrms và lập bảng ma trận tương quan để xác định cá biến bị đa cộng
tuyến. Ta có:
PRICE BATHS BEDRMS FAMROOM FIREPL POOL SQFT FAMROOM
_BEDRMS
PRICE 1.000000 0.669612 0.315634 0.472715 0.495681 0.179062 0.905827 0.477140
BATHS 0.669612 1.000000 0.532327 0.534885 0.457693 -0.185695 0.787318 0.615893
BEDRMS 0.315634 0.532327 1.000000 0.337350 0.547723 -0.377778 0.464730 0.532557
0.968264
FAMROOM 0.472715 0.534885 0.337350 1.000000 0.781736 0.025950 0.520220
FIREPL 0.495681 0.457693 0.547723 0.781736 1.000000 -0.121716 0.551010 0.756927
POOL 0.179062 -0.185695 -0.377778 0.025950 -0.121716 1.000000 -0.124679 -0.060671
SQFT 0.905827 0.787318 0.464730 0.520220 0.551010 -0.124679 1.000000 0.559476
0.968264
FAMROOM
_BEDRMS
0.477140 0.615893 0.532557 0.756927 -0.060671 0.559476 1.000000
Lúc này ta có hệ số tương quan giữa hai biến FAMROOM và FAMROOM_BEDRMS bằng 0.968264 (gần
bằng 1). Vậy có hiện tượng đa cộng tuyến là do 2 biến trên có mối quan hệ chặt chẽ với nhau vì vậy ta bỏ 1
trong 2 biến; giả sử bỏ biến FAMROOM ta có kết quả chạy Eview như sau:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 17:01
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 23.04862 96.48374 0.238886 0.8180
BATHS -0.263691 41.45465 -0.006361 0.9951
BEDRMS -1.709353 27.73050 -0.061642 0.9526
FIREPL 20.85181 46.43392 0.449064 0.6670
POOL 53.19581 22.06352 2.411030 0.0467
SQFT 0.146551 0.030101 4.868577 0.0018
FAMROOM_BEDR
MS
-5.336177 10.71835 -0.497854 0.6338
R-squared 0.911504 Mean dependent var 317.4929
Adjusted R-squared 0.835650 S.D. dependent var 88.49816
S.E. of regression 35.87726 Akaike info criterion 10.30494
Sum squared resid 9010.244 Schwarz criterion 10.62447
Log likelihood -65.13456 F-statistic 12.01657
Durbin-Watson stat 2.602259 Prob(F-statistic) 0.002213
Với kết quả của bảng trên ta thấy các hệ số P_value của các biến Baths, Bedrms, Firepl, Famroom* Bedrms
đều lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với:
H
: β
0 2
= β = β = β = 0
3 5 8
H
: có ít nhất một giá trị β ≠ 0 với (i = 2, 3, 5, 8)
1 i
Chạy Eview ta có kết quả:
Wald Test:
Equation: Untitled
Test Statistic Value df Probability
F-statistic 0.086452 (4, 7) 0.9839
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
9
GV: Nguyễn Thị Mai Bình
Chi-square 0.345807 4 0.9867
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(2) -0.263691 41.45465
C(3) -1.709353 27.73050
C(4) 20.85181 46.43392
C(7) -5.336177 10.71835
Restrictions are linear in coefficients.
P_value sau khi chạy Wald test trong kiểm định trên ta có:
P_value = 0.9839 > α = 5%
Vì vậy ta chấp nhận giả thuyết H
0
, vậy các hệ số trước các biến Baths, Bedrms, Firepl, Famroom*
Bedrms đều bằng 0; hay các biến số phòng tắm, số phòng ngủ, có thiết bị báo cháy và biến ảnh hưởng
của có phòng gia đình lên số lượng phòng ngủ không ảnh hưởng đến giá nhà. Vì vậy ta có thể bỏ các
biến trên ra khỏi mô hình. Lúc này ta có mô hình:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 15:29
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 22.67277 29.50580 0.768417 0.4584
POOL 52.78980 16.48172 3.202931 0.0084
SQFT 0.144415 0.014185 10.18086 0.0000
R-squared 0.907132 Mean dependent var 317.4929
Adjusted R-squared 0.890247 S.D. dependent var 88.49816
S.E. of regression 29.31856 Akaike info criterion 9.781728
Sum squared resid 9455.359 Schwarz criterion 9.918669
Log likelihood -65.47210 F-statistic 53.72383
Durbin-Watson stat 2.526380 Prob(F-statistic) 0.000002
Với các giá trị P_value trước biến Pool và biến sqft đều nhỏ hơn 5%. Vì vậy chấp nhận hô hình này
Vậy phương trình hồiqui lúc này:
PRICE = 22.67277002 + 52.78979633*POOL + 0.1444149156*SQFT +
i
u
ˆ
d. Price = β
1
+ β
2
Baths + β Bedrms + β Famroom + β
3 4 5
Firepl + β Pool + β
6 7
Sqft +
β
8
Pool*Sqft
Chạy môhình trên với Eview, ta có kết quả:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 17:10
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 76.93417 64.38956 1.194824 0.2772
BATHS -10.24209 29.37901 -0.348619 0.7393
BEDRMS 4.867122 20.64732 0.235727 0.8215
FAMROOM -10.51463 30.40630 -0.345804 0.7413
FIREPL -1.107752 39.07848 -0.028347 0.9783
POOL -85.25082 50.95585 -1.673033 0.1453
SQFT 0.124680 0.022526 5.534876 0.0015
POOL*SQFT 0.074512 0.026121 2.852620 0.0291
R-squared 0.962442 Mean dependent var 317.4929
Adjusted R-squared 0.918624 S.D. dependent var 88.49816
S.E. of regression 25.24543 Akaike info criterion 9.590727
Sum squared resid 3823.992 Schwarz criterion 9.955903
ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2
10
Log likelihood -59.13509 F-statistic 21.96456
GV: Nguyễn Thị Mai Bình
Durbin-Watson stat 2.150252 Prob(F-statistic) 0.000712
Với kết quả của bảng trên ta thấy các hệ số P_value của các biến Baths, Bedrms, Famroom, Firepl, Pool đều
lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với:
H
: β
0 2
= β = β = β = β = 0
3 4 5 6
H
: có ít nhất một giá trị β ≠ 0 với (i = 2, 3, 4, 5, 6)
1 i
Chạy Eview ta có kết quả:
Wald Test:
Equation: Untitled
Test Statistic Value df Probability
F-statistic 0.675681 (5, 6) 0.6581
Chi-square 3.378405 5 0.6419
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(2) -10.24209 29.37901
C(3) 4.867122 20.64732
C(4) -10.51463 30.40630
C(5) -1.107752 39.07848
C(6) -85.25082 50.95585
Restrictions are linear in coefficients.
P_value sau khi chạy Wald test trong kiểm định trên ta có:
P_value = 0.6581 > α = 5%
Vì vậy ta chấp nhận giả thuyết H
0
, vậy các hệ số trước các biến Baths, Bedrms, Famroom, Firepl, Pool
đều bằng 0; hay các biến số phòng tắm, số phòng ngủ, có phòng gia đình, có thiết bị báo cháy, có hồ bơi
không ảnh hưởng đến giá nhà. Vì vậy ta có thể bỏ các biến trên ra khỏi mô hình. Lúc này ta có mô hình:
Dependent Variable: PRICE
Method: Least Squares
Date: 04/30/07 Time: 17:17
Sample: 1 14
Included observations: 14
Variable Coefficient Std. Error t-Statistic Prob.
C 42.79643 22.36292 1.913723 0.0820
SQFT 0.132927 0.011257 11.80854 0.0000
POOL*SQFT 0.031857 0.006697 4.757055 0.0006
R-squared 0.941294 Mean dependent var 317.4929
Adjusted R-squared 0.930620 S.D. dependent var 88.49816
S.E. of regression 23.31047 Akaike info criterion 9.323092
Sum squared resid 5977.157 Schwarz criterion 9.460032
Log likelihood -62.26164 F-statistic 88.18710
Durbin-Watson stat 2.756228 Prob(F-statistic) 0.000000
Với các giá trị P_value trước biến Pool*Sqft và biến Sqft đều nhỏ hơn 5%. Vì vậy chấp nhận hô hình này
Vậy phương trình hồiqui lúc này:
PRICE = 42.7964305 + 0.132927069*SQFT + 0.03185742065*(POOL*SQFT) +
i
u
ˆ
e. Price = β
1
+ β
2
Baths + β Bedrms + β Famroom + β
3 4 5
Firepl + β Pool + β
6 7
Sqft +
β
8
Famroom* Bedrms + β
9
Firepl* Sqft + β
10
Pool*Sqft + β
11
Firepl*Bedrms+
β
Pool*Baths
10
Chạy môhình trên với Eview, ta có kết quả:
[...]... Cobb-Douglass cho mô hìnhhồiqui trên Viết ra dạng hàm lý thuyết cần ước lượng 2 Hãy viết mô hìnhhồiqui mẫu cho môhình trên căn cứ vào các môhình bên dưới và giải thích ý nghĩa của các tham số từ môhình trên 3 Theo các anh chị môhình trên có bị những bệnh nào không? Tại sao (anh chị hãy cho biết rõ anh chị dựa trên môhình nào) 4 Một bạn sinh viên chạy thử môhình 4.6 và nhận thấy rằng môhình này cũng... chạy mô hìnhhồiqui ta được môhình 3.1 Theo các anh chị môhình trên tối ưu chưa tại sao? Hãy viết các kiểm định cần thiết để chứng minh kết luận trên Nếu môhình trên chưa tối ưu theo các anh chị cần phải làm gì tiếp theo (với α = 5%) 3 Một bạn sinh viên cho rằng giá của nhà có hồ bơi sẽ lớn hơn nhiều so với nhà không có hồ bơi Bạn chạy mô hìnhhồiqui 3.2 Anh/chị hãy viết phương trình hồiqui của mô. .. tstat lớn) Môhình (3) thể hiện mối quan hệ giữa 2 biến độc lập GDP và CPI, ta thấy môhình này có ý nghĩa về mặt thống kê điều này có nghĩa có hiện tượng đa cộng tuyến trong môhình gốc Mặt khác, R2 trong môhình 3 (R2hqp=0.992224) lớn hơn môhình ban đầu (R2 = 0.982318) và lớn nhất trong các môhình vì vậy mức độ đa cộng tuyến giữa hai biến GDP và CPI rất mạnh Giải sử trong môhình ban đầu (mô hình Ln... gốc là 1948) 1 Môhình 1.1 thể hiện mối quan hệ của 2 biến này Anh chị có nhận xét gì về môhình này 2 Một sinh viên cho rằng môhình này có thể bị bệnh nên thực hiện các phép kiểm định trong các môhình 1.2, môhình 1.3 Theo các anh chị đây là các phép kiểm định gì, nêu rõ các giải thuyết và căn cứ theo môhình trên các anh chị hãy cho biết môhình trên có bị bệnh gì không ? 3 Nếu môhình trên có bệnh... anh chị hãy đề xuất các phương án trị bệnh, nêu cụ thể cách làm trên Eview 4 Một sinh viên đề suất một môhình 1.5, các anh chị hãy viết phương trình hồiqui của môhình này Giải thích ý nghĩa của các tham số 5 Nếu môhình 1.1 và môhình 1.5 đều là môhình tốt, anh/chị sẽ chọn môhình nào tại sao ? Môhình 1.1 Dependent Variable: FARMPOP Method: Least Squares Date: 06/24/07 Time: 22:28 Sample: 1948 1991... 1 Có sinh viên cho rằng nên sử dụng môhình như môhình 2.1 trong trường hợp này mới phù hợp Các anh chị hãy cho biết môhình trên có tên gọi là gì và viết phương trình tổng quát cho môhình trên (mô hình còn chứa β, chưa ước lượng) 2 Nhìn vào tất cả các môhình bên dưới, các anh chị hãy giải thích khả năng xảy ra hiện tượng đa cộng tuyến trong môhình 3 Trong môhình 2.1, các biến nào không có ý nghĩa... lao động” hoặc “hiệu suất không thay đổi theo quimô (với α = 5%) 1 Theo các anh chị dấu kỳ vọng của các biến độc lập này như thế nào 2 Hãy viết hàm Cobb-Douglass cho môhìnhhồiqui trên Viết ra dạng hàm lý thuyết cần ước lượng 3 Hãy viết mô hìnhhồiqui mẫu cho môhình trên căn cứ vào các môhình bên dưới và giải thích ý nghĩa của các tham số từ môhình trên 4 Các anh chị hãy viết các kiểm định... 3.2 Anh/chị hãy viết phương trình hồiqui của môhình trên Giải thích ý nghĩa của các tham số hồiqui của môhình trên, cho biết bạn sinh viên trên nghi ngờ đúng không? (với α = 5%) 4 Một sinh viên khác không đồng ý nên chạy môhình 3.3, anh/ chị hãy viết phương trình hồiqui cho môhình trên và giải thích ý nghĩa của các tham số của môhình trên 5 Môhình 3.1 Dependent Variable: PRICE Method: Least... tuyến trong môhình 1.1 3 Trong môhình 1.1, các biến nào không có ý nghĩa về mặt thống kê (không ảnh hưởng đến lượng thịt gà tiêu thụ bình quân đầu người) với mức ý nghĩa 10% Hãy cho biết nên thực hiện kiểm định nào để biết được có nên bỏ các biến trên ra khỏi môhình 1.1 4 Việc xây dựng môhình từ môhình 1.1 đến môhình 1.2 có tên gọi là gì? Hãy giải thích ý nghĩa các tham số của môhình phù hợp... hiện các phép kiểm định trong các môhình 2.2, môhình 2.4 Theo các anh chị các môhình trên dùng để xác định bệnh gì? Đây là các phép kiểm định gì, nêu rõ các giải thuyết và căn cứ theo môhình trên các anh chị hãy cho biết môhình trên có bị bệnh gì không? 3 Nếu môhình trên có bệnh các anh chị hãy đề xuất các phương án trị bệnh 4 Một sinh viên khác cho rằng môhình 2.5 mới phù hợp, mới có thể giải . Xây dựng mô hình theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình nào là mô hình tối ưu. Giải thích quá trình thực hiện và các kiểm định cần thiết. (α=5%) Mô hình hồi qui tổng. chọn mô hình tối ưu ta so sánh các …… số R 2 , AIC, Schwarz R 2 AIC SCHWARZ 2 R Mô hình 1 0.907132 0.89024 9.781728 9.918669 Mô hình 2 0.941294 0.930620 9.323092 9.460032 Vậy mô hình hồi qui. nhà Các anh/chị hãy: a) Xây dựng các mô hình sau theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình nào là mô hình tối ưu (xem xét các mô hình tổng quát dưới đây). Giải thích quá