Mô hình hồi qui bội

152 889 4
Mô hình hồi qui bội

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2 1 GV: Nguyễn Thị Mai Bình Môn học: KINH TẾ LƯỢNG Lớp: 04QK, 04QB, 04QB (Năm học 2006 – 2007) Gợi ý đáp án Bài tập số 2: HÌNH HỒI QUI BỘI Câu 1: (40điểm) Xem xét dữ liệu về tiêu dùng thịt gà ở Mỹ giai đọan 1960 đến 1982 được trình bày trong file Table 7.9 thuộc bộ dữ liệu của Gujarati (hoặcc file chicken demand). Trong đó: Y = lượng thịt gà tiêu thụ bình quân đầu người (pound) X2 = thu nhập khả dụng bình quân đầu người (USD) X3 = Giá bán lẻ của thịt gà (cent/pound) X4 = Giá bán lẻ của thịt bò (cent/pound) X5 = Giá bán lẻ của thịt heo (cent/pound) X6 = Giá bán lẻ bình quân có trọng số của thịt bò và thịt heo (cent/pound) Các anh/chị hãy: a) Xây dựng hình theo phương pháp từ phức tạp đến đơn giản và cho biết hình nào là hình tối ưu. Giải thích quá trình thực hiện và các kiểm định cần thiết. (α=5%) Mô hình hồi qui tổng thể của lượng thịt gà tiêu thụ bình quân đầu người (Y) theo thu nhập khả dụng bình quân đầu người (X2), giá bán lẻ của thịt gà (X3), giá bán lẻ của thịt bò (X4), giá bán lẻ của thịt heo (X5), Giá bán lẻ bình quân có trọng số của thịt bò và thịt heo (X6) (PRF): Y = β 1 + β 2 X 2 + β 3 X 3 + β 4 X 4 + β 5 X 5 + β 6 X 6 +u i Chạy Eview với hình trên ta có: Dependent Variable: Y Method: Least Squares Date: 04/30/07 Time: 14:23 Sample: 1960 1982 Included observations: 23 Variable Coefficient Std. Error t-Statistic Prob. C 38.59691 4.214488 9.158150 0.0000 X2 0.004889 0.004962 0.985370 0.3383 X3 -0.651888 0.174400 -3.737889 0.0016 X4 0.243242 0.089544 2.716443 0.0147 X5 0.104318 0.070644 1.476674 0.1580 X6 -0.071110 0.098381 -0.722805 0.4796 R-squared 0.944292 Mean dependent var 39.66957 Adjusted R-squared 0.927908 S.D. dependent var 7.372950 S.E. of regression 1.979635 Akaike info criterion 4.423160 Sum squared resid 66.62224 Schwarz criterion 4.719376 Log likelihood -44.86635 F-statistic 57.63303 Durbin-Watson stat 1.100559 Prob(F-statistic) 0.000000 Với kết quả của bảng trên ta thấy các hệ số P_value của các biến X2, X5, X6 đều lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với: H 0 : β 2 = β 5 = β 6 = 0 H 1 : có ít nhất một giá trị β i ≠ 0 với (i = 2, 5, 6) Chạy Eview ta có kết quả: Wald Test: Equation: EQ01 Test Statistic Value df Probability F-statistic 7.852143 (3, 17) 0.0017 Chi-square 23.55643 3 0.0000 Null Hypothesis Summary: ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2 2 Normalized Restriction (= 0) Value Std. Err. GV: Nguyễn Thị Mai Bình C(2) 0.004889 0.004962 C(5) 0.104318 0.070644 C(6) -0.071110 0.098381 Restrictions are linear in coefficients. P_value sau khi chạy Wald test trong kiểm định trên ta có: P_value =0.0017 < α = 5% Vì vậy ta bác bỏ giả thuyết H 0 , vậy có ít nhất một giá trị β i ≠ 0 với (i = 2, 5, 6) Để thực hiện việc xây dựng hình từ đơn giản đến phức tạp, ta căn cứ vào hệ số P_value của các biến độc lập. Biến được loại ra khỏi hình là biến có hệ số P_value lớn. - Đầu tiên ta bỏ biến X6 ra khỏi hình vì biến này có P_value = 0.4796 (P_value lớn nhất). Lúc này kết quả Eview như sau: Dependent Variable: Y Method: Least Squares Date: 04/30/07 Time: 14:42 Sample: 1960 1982 Included observations: 23 Variable Coefficient Std. Error t-Statistic Prob. C 37.23236 3.717695 10.01490 0.0000 X2 0.005011 0.004893 1.024083 0.3194 X3 -0.611174 0.162849 -3.753010 0.0015 X4 0.198409 0.063721 3.113734 0.0060 X5 0.069503 0.050987 1.363144 0.1896 R-squared 0.942580 Mean dependent var 39.66957 Adjusted R-squared 0.929821 S.D. dependent var 7.372950 S.E. of regression 1.953198 Akaike info criterion 4.366473 Sum squared resid 68.66969 Schwarz criterion 4.613320 Log likelihood -45.21444 F-statistic 73.87052 Durbin-Watson stat 1.065034 Prob(F-statistic) 0.000000 - Căn cứ vào kết quả chạy Eview sau khi bỏ biến X6, ta nhận thấy vẫn còn có các biến X2, X5 có P_value lớn hơn α = 5%. Ta tiếp tục bỏ biến X2 do P_value = 0.3194 (P_value lớn nhất) và được kết quả như sau: Dependent Variable: Y Method: Least Squares Date: 04/30/07 Time: 14:46 Sample: 1960 1982 Included observations: 23 Variable Coefficient Std. Error t-Statistic Prob. C 35.68084 3.399337 10.49641 0.0000 X3 -0.654097 0.157564 -4.151300 0.0005 X4 0.232528 0.054387 4.275460 0.0004 X5 0.115422 0.024303 4.749224 0.0001 R-squared 0.939235 Mean dependent var 39.66957 Adjusted R-squared 0.929641 S.D. dependent var 7.372950 S.E. of regression 1.955702 Akaike info criterion 4.336146 Sum squared resid 72.67063 Schwarz criterion 4.533624 Log likelihood -45.86568 F-statistic 97.89329 Durbin-Watson stat 1.251523 Prob(F-statistic) 0.000000 Lúc này các biến X3, X4, X6 đều có P_value nhỏ hơn α = 5%. Vậy hình trên có thể là hình phù hợp nhất. Tuy nhiên, để kiểm tra lại có phải việc loại bỏ biến X6, và X2 ra khổi hình là phù hợp. Ta thực hiện lại việc kiểm định Wald với: H 0 : β 2 = β 6 = 0 H 1 : có ít nhất một giá trị β i ≠ 0 với (i = 2, 6) Chạy Eview ta có kết quả: ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2 3 GV: Nguyễn Thị Mai Bình Wald Test: Equation: HOIQUI_U Test Statistic Value df Probability F-statistic 0.771684 (2, 17) 0.4778 Chi-square 1.543368 2 0.4622 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. C(2) 0.004889 0.004962 C(6) -0.071110 0.098381 Restrictions are linear in coefficients. P_value sau khi chạy Wald test trong kiểm định trên ta có: P_value =0.4778 > α = 5% Vì vậy ta chấp nhận giả thuyết H 0 , điều này có nghĩa việc loại bỏ 2 biến thu nhập khả dụng bình quân đầu người (X2 và giá bán lẻ bình quân có trọng số của thịt bò và thịt heo (X6) ra khỏi hình là phù hợp Mô hình hồi qui phù hợp nhất là: Y ˆ = 35.68083973 - 0.6540969702*X3 + 0.2325281315*X4 + 0.1154218668*X5 b) Giải thích ý nghĩa các tham số của hình phù hợp nhất: Ta có: β 1 = 35.68083973 không giả thích được vì có ẩn chứa những biến bỏ sót ngoài hình hoặc chọn hàm sai. β 3 = - 0.6540969702: tác động biên của X3 lên Y. Trong điều kiện các biến khác không đổi, theo thông tin từ dữ liệu mẫu ta có nếu giá bán lẻ của thịt gà tăng lên 1 cent/pound thì lượng thịt gà tiêu thụ bình quân đầu người sẽ giảm đi 0.6540969702pound β 4 = 0.2325281315 tác động biên của X4 lên Y. Trong điều kiện các biến khác không đổi, theo thông tin từ dữ liệu mẫu ta có nếu giá bán lẻ của thịt bò tăng lên 1 cent/pound thì lượng thịt gà tiêu thụ bình quân đầu người sẽ tăng lên 0.2325281315 pound β 5 = 0.1154218668 tác động biên của X5 lên Y. Trong điều kiện các biến khác không đổi, theo thông tin từ dữ liệu mẫu ta có nếu giá bán lẻ của thịt heo tăng lên 1 cent/pound thì lượng thịt gà tiêu thụ bình quân đầu người sẽ tăng lên 0.1154218668 pound (Với hệ số β 4 và β 5 cho thấy thịt gà có thể là sản phẩm thay thế cho thịt bò và thịt heo) Câu 2: (40 điểm) Xem xét dữ liệu về các yếu tố ảnh hưởng đền giá nhà trong fike Data7-3 thuộc bộ dữ liệu Ramanathan. Trong đó: Price = giá nhà Baths = số phòng tắm Bedrms = số phòng ngủ Famroom = nhận giá trị 1 nếu nhà có phòng gia đình và giá trị 0 cho trường hợp ngược lại Firepl = nhận giá trị 1 nếu nhà có thiết bị báo cháy và giá trị 0 cho trường hợp ngược lại Pool = nhận giá trị 1 nếu nhà có hồ bơi và giá trị 0 cho trường hợp ngược lại Sqft = diện tích nhà Các anh/chị hãy: a) Xây dựng các hình sau theo phương pháp từ phức tạp đến đơn giản và cho biết hình nào là hình tối ưu (xem xét các hình tổng quát dưới đây). Giải thích quá trình thực hiện và các kiểm định cần thiết. (α=5%) a. Price = β 1 + β 2 Baths + β 3 Bedrms + β 4 Famroom + β 5 Firepl + β 6 Pool + β 7 Sqft Chạy hình trên với Eview, ta có kết quả: Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 15:19 ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2 4 Sample: 1 14 GV: Nguyễn Thị Mai Bình Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C 39.05715 89.53975 0.436199 0.6758 BATHS -0.263691 41.45465 -0.006361 0.9951 BEDRMS -7.045531 28.73627 -0.245179 0.8134 FAMROOM -21.34471 42.87340 -0.497854 0.6338 FIREPL 26.18799 53.84537 0.486355 0.6416 POOL 53.19581 22.06352 2.411030 0.0467 SQFT 0.146551 0.030101 4.868577 0.0018 R-squared 0.911504 Mean dependent var 317.4929 Adjusted R-squared 0.835650 S.D. dependent var 88.49816 S.E. of regression 35.87726 Akaike info criterion 10.30494 Sum squared resid 9010.244 Schwarz criterion 10.62447 Log likelihood -65.13456 F-statistic 12.01657 Durbin-Watson stat 2.602259 Prob(F-statistic) 0.002213 Với kết quả của bảng trên ta thấy các hệ số P_value của các biến Baths, Bedrms, Famroom, Firepl đều lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với: H 0 : β 2 = β 3 = β 4 = β 5 = 0 H 1 : có ít nhất một giá trị β i ≠ 0 với (i = 2, 3, 4, 5) Chạy Eview ta có kết quả: Wald Test: Equation: Untitled Test Statistic Value df Probability F-statistic 0.086452 (4, 7) 0.9839 Chi-square 0.345807 4 0.9867 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. C(2) -0.263691 41.45465 C(3) -7.045531 28.73627 C(4) -21.34471 42.87340 C(5) 26.18799 53.84537 Restrictions are linear in coefficients. P_value sau khi chạy Wald test trong kiểm định trên ta có: P_value = 0.9839 > α = 5% Vì vậy ta chấp nhận giả thuyết H 0 , vậy các hệ số trước các biến Baths, Bedrms, Famroom, Firepl đều bằng 0; hay các biến số phòng tắm, số phòng ngủ, có phòng gia đình, có thiết bị báo cháy không ảnh hưởng đến giá nhà. Vì vậy ta có thể bỏ các biến trên ra khỏi hình. Lúc này ta có hình: Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 15:29 Sample: 1 14 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C 22.67277 29.50580 0.768417 0.4584 POOL 52.78980 16.48172 3.202931 0.0084 SQFT 0.144415 0.014185 10.18086 0.0000 R-squared 0.907132 Mean dependent var 317.4929 Adjusted R-squared 0.890247 S.D. dependent var 88.49816 S.E. of regression 29.31856 Akaike info criterion 9.781728 Sum squared resid 9455.359 Schwarz criterion 9.918669 Log likelihood -65.47210 F-statistic 53.72383 Durbin-Watson stat 2.526380 Prob(F-statistic) 0.000002 ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2 5 GV: Nguyễn Thị Mai Bình Với các giá trị P_value trước biến Pool và biến sqft đều nhỏ hơn 5%. Vì vậy chấp nhận hô hình này Vậy phương trình hồi qui lúc này: PRICE = 22.67277002 + 52.78979633*POOL + 0.1444149156*SQFT + i u ˆ b. Price = β 1 + β 2 Baths + β Bedrms + β Famroom + β 3 4 5 Firepl + β Pool + β 6 7 Sqft + β 8 Firepl* Sqft Chạy hình trên với Eview, ta có kết quả: Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 16:33 Sample: 1 14 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C -391.6926 362.2206 -1.081365 0.3211 BATHS -5.049608 40.23999 -0.125487 0.9042 BEDRMS 0.068210 28.36362 0.002405 0.9982 FAMROOM -21.67260 41.42130 -0.523223 0.6196 FIREPL 437.6739 340.0121 1.287230 0.2454 POOL 65.52753 23.57464 2.779578 0.0320 SQFT 0.502063 0.291755 1.720837 0.1361 FIREPL*SQFT -0.355295 0.290125 -1.224627 0.2666 R-squared 0.929200 Mean dependent var 317.4929 Adjusted R-squared 0.846601 S.D. dependent var 88.49816 S.E. of regression 34.66139 Akaike info criterion 10.22469 Sum squared resid 7208.472 Schwarz criterion 10.58986 Log likelihood -63.57282 F-statistic 11.24945 Durbin-Watson stat 2.524457 Prob(F-statistic) 0.004472 Với kết quả của bảng trên ta thấy các hệ số P_value của các biến Baths, Bedrms, Famroom, Firepl, Sqft, Firepl* Sqft đều lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với: H : β 0 2 = β = β = β = β = β = 0 3 4 5 7 8 H : có ít nhất một giá trị β ≠ 0 với (i = 2, 3, 4, 5, 7, 8) 1 i Chạy Eview ta có kết quả: Wald Test: Equation: Untitled Test Statistic Value df Probability F-statistic 12.67148 (6, 6) 0.0035 Chi-square 76.02890 6 0.0000 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. C(2) -5.049608 40.23999 C(3) 0.068210 28.36362 C(4) -21.67260 41.42130 C(5) 437.6739 340.0121 C(7) 0.502063 0.291755 C(8) -0.355295 0.290125 Restrictions are linear in coefficients. P_value sau khi chạy Wald test trong kiểm định trên ta có: P_value = 0.0035> α = 5% Vì vậy ta bác bỏ giả thuyết H , vậy có ít nhất một giá trị β ≠ 0 với (i = 2, 3, 4, 5, 7, 8) 0 i Để thực hiện việc xây dựng hình từ đơn giản đến phức tạp, ta căn cứ vào hệ số P_value của các biến độc lập. Biến được loại ra khỏi hình là biến có hệ số P_value lớn. ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2 6 GV: Nguyễn Thị Mai Bình - Đầu tiên ta bỏ biến Bedrms ra khỏi hình vì biến này có P_value = 0.9982 (P_value lớn nhất). Lúc này kết quả Eview như sau: Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 16:42 Sample: 1 14 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C -391.3735 312.0440 -1.254225 0.2500 BATHS -5.013808 34.61187 -0.144858 0.8889 FAMROOM -21.69964 36.90877 -0.587926 0.5751 FIREPL 437.5656 312.0188 1.402370 0.2036 POOL 65.50844 20.55132 3.187553 0.0153 SQFT 0.501915 0.264005 1.901154 0.0990 FIREPL*SQFT -0.355152 0.262910 -1.350849 0.2188 R-squared 0.929200 Mean dependent var 317.4929 Adjusted R-squared 0.868515 S.D. dependent var 88.49816 S.E. of regression 32.09023 Akaike info criterion 10.08183 Sum squared resid 7208.479 Schwarz criterion 10.40136 Log likelihood -63.57283 F-statistic 15.31173 Durbin-Watson stat 2.525083 Prob(F-statistic) 0.001044 - Căn cứ vào kết quả chạy Eview sau khi bỏ biến Bedrms, ta nhận thấy các hệ số P_value của các biến Baths, Famroom, Firepl, Sqft, Firepl* Sqft đều lớn hơn α = 5%. Ta tiếp tục bỏ biến Baths, do P_value = 0.8889 (P_value lớn nhất) và được kết quả như sau Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 16:45 Sample: 1 14 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C -396.8103 290.2054 -1.367343 0.2087 FAMROOM -23.43309 32.70893 -0.716412 0.4941 FIREPL 437.8164 292.2995 1.497835 0.1726 POOL 66.06998 18.90720 3.494435 0.0081 SQFT 0.498254 0.246188 2.023872 0.0776 FIREPL*SQFT -0.354257 0.246230 -1.438725 0.1882 R-squared 0.928988 Mean dependent var 317.4929 Adjusted R-squared 0.884606 S.D. dependent var 88.49816 S.E. of regression 30.06262 Akaike info criterion 9.941969 Sum squared resid 7230.087 Schwarz criterion 10.21585 Log likelihood -63.59378 F-statistic 20.93140 Durbin-Watson stat 2.543786 Prob(F-statistic) 0.000210 - Căn cứ vào kết quả chạy Eview sau khi bỏ biến Bedrms, Baths; ta nhận thấy các hệ số P_value của các biến Famroom, Firepl, Sqft, Firepl* Sqft đều lớn hơn α = 5%. Ta tiếp tục bỏ biến Famroom, do P_value = 0.4941 (P_value lớn nhất) và được kết quả như sau: Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 16:47 Sample: 1 14 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C -376.6690 280.9210 -1.340836 0.2128 FIREPL 402.0001 280.0962 1.435221 0.1850 POOL 63.03432 17.92106 3.517331 0.0065 SQFT 0.482192 0.238444 2.022249 0.0739 ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2 7 GV: Nguyễn Thị Mai Bình FIREPL*SQFT -0.340550 0.238755 -1.426357 0.1875 R-squared 0.924432 Mean dependent var 317.4929 Adjusted R-squared 0.890846 S.D. dependent var 88.49816 S.E. of regression 29.23837 Akaike info criterion 9.861294 Sum squared resid 7693.940 Schwarz criterion 10.08953 Log likelihood -64.02906 F-statistic 27.52457 Durbin-Watson stat 2.550994 Prob(F-statistic) 0.000046 - Căn cứ vào kết quả chạy Eview sau khi bỏ biến Bedrms, Baths, Famroom; ta nhận thấy các hệ số P_value của các biến Firepl, Sqft, Firepl* Sqft đều lớn hơn α = 5%. Ta tiếp tục bỏ biến Firepl* Sqft, do P_value = 0.1875 (P_value lớn nhất) và được kết quả như sau: Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 16:49 Sample: 1 14 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C 21.73385 31.51070 0.689729 0.5061 FIREPL 4.317827 28.16788 0.153289 0.8812 POOL 52.95961 17.30140 3.061001 0.0120 SQFT 0.142938 0.017711 8.070628 0.0000 R-squared 0.907350 Mean dependent var 317.4929 Adjusted R-squared 0.879555 S.D. dependent var 88.49816 S.E. of regression 30.71350 Akaike info criterion 9.922238 Sum squared resid 9433.193 Schwarz criterion 10.10483 Log likelihood -65.45567 F-statistic 32.64424 Durbin-Watson stat 2.595128 Prob(F-statistic) 0.000018 - Tiếp tục bỏ biến Firepl do P_value = 0.8812 > 0.05 ta có: Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 16:50 Sample: 1 14 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C 22.67277 29.50580 0.768417 0.4584 POOL 52.78980 16.48172 3.202931 0.0084 SQFT 0.144415 0.014185 10.18086 0.0000 R-squared 0.907132 Mean dependent var 317.4929 Adjusted R-squared 0.890247 S.D. dependent var 88.49816 S.E. of regression 29.31856 Akaike info criterion 9.781728 Sum squared resid 9455.359 Schwarz criterion 9.918669 Log likelihood -65.47210 F-statistic 53.72383 Durbin-Watson stat 2.526380 Prob(F-statistic) 0.000002 Với các giá trị P_value trước biến Pool và biến sqft đều nhỏ hơn 5%. Vì vậy chấp nhận hô hình này Vậy phương trình hồi qui lúc này: PRICE = 22.67277002 + 52.78979633*POOL + 0.1444149156*SQFT + i u ˆ c. Price = β 1 + β 2 Baths + β Bedrms + β Famroom + β 3 4 5 Firepl + β Pool + β 6 7 Sqft + β 8 Famroom* Bedrms Chạy hình trên với Eview, ta có kết quả: ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2 8 GV: Nguyễn Thị Mai Bình Điều này có nghĩa hình có hiện tượng đa cộng tuyến hoàn hảo. Lúc này ta tạo biến mới Famroom_Bedrms và lập bảng ma trận tương quan để xác định cá biến bị đa cộng tuyến. Ta có: PRICE BATHS BEDRMS FAMROOM FIREPL POOL SQFT FAMROOM _BEDRMS PRICE 1.000000 0.669612 0.315634 0.472715 0.495681 0.179062 0.905827 0.477140 BATHS 0.669612 1.000000 0.532327 0.534885 0.457693 -0.185695 0.787318 0.615893 BEDRMS 0.315634 0.532327 1.000000 0.337350 0.547723 -0.377778 0.464730 0.532557 0.968264 FAMROOM 0.472715 0.534885 0.337350 1.000000 0.781736 0.025950 0.520220 FIREPL 0.495681 0.457693 0.547723 0.781736 1.000000 -0.121716 0.551010 0.756927 POOL 0.179062 -0.185695 -0.377778 0.025950 -0.121716 1.000000 -0.124679 -0.060671 SQFT 0.905827 0.787318 0.464730 0.520220 0.551010 -0.124679 1.000000 0.559476 0.968264 FAMROOM _BEDRMS 0.477140 0.615893 0.532557 0.756927 -0.060671 0.559476 1.000000 Lúc này ta có hệ số tương quan giữa hai biến FAMROOM và FAMROOM_BEDRMS bằng 0.968264 (gần bằng 1). Vậy có hiện tượng đa cộng tuyến là do 2 biến trên có mối quan hệ chặt chẽ với nhau vì vậy ta bỏ 1 trong 2 biến; giả sử bỏ biến FAMROOM ta có kết quả chạy Eview như sau: Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 17:01 Sample: 1 14 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C 23.04862 96.48374 0.238886 0.8180 BATHS -0.263691 41.45465 -0.006361 0.9951 BEDRMS -1.709353 27.73050 -0.061642 0.9526 FIREPL 20.85181 46.43392 0.449064 0.6670 POOL 53.19581 22.06352 2.411030 0.0467 SQFT 0.146551 0.030101 4.868577 0.0018 FAMROOM_BEDR MS -5.336177 10.71835 -0.497854 0.6338 R-squared 0.911504 Mean dependent var 317.4929 Adjusted R-squared 0.835650 S.D. dependent var 88.49816 S.E. of regression 35.87726 Akaike info criterion 10.30494 Sum squared resid 9010.244 Schwarz criterion 10.62447 Log likelihood -65.13456 F-statistic 12.01657 Durbin-Watson stat 2.602259 Prob(F-statistic) 0.002213 Với kết quả của bảng trên ta thấy các hệ số P_value của các biến Baths, Bedrms, Firepl, Famroom* Bedrms đều lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với: H : β 0 2 = β = β = β = 0 3 5 8 H : có ít nhất một giá trị β ≠ 0 với (i = 2, 3, 5, 8) 1 i Chạy Eview ta có kết quả: Wald Test: Equation: Untitled Test Statistic Value df Probability F-statistic 0.086452 (4, 7) 0.9839 ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2 9 GV: Nguyễn Thị Mai Bình Chi-square 0.345807 4 0.9867 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. C(2) -0.263691 41.45465 C(3) -1.709353 27.73050 C(4) 20.85181 46.43392 C(7) -5.336177 10.71835 Restrictions are linear in coefficients. P_value sau khi chạy Wald test trong kiểm định trên ta có: P_value = 0.9839 > α = 5% Vì vậy ta chấp nhận giả thuyết H 0 , vậy các hệ số trước các biến Baths, Bedrms, Firepl, Famroom* Bedrms đều bằng 0; hay các biến số phòng tắm, số phòng ngủ, có thiết bị báo cháy và biến ảnh hưởng của có phòng gia đình lên số lượng phòng ngủ không ảnh hưởng đến giá nhà. Vì vậy ta có thể bỏ các biến trên ra khỏi hình. Lúc này ta có hình: Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 15:29 Sample: 1 14 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C 22.67277 29.50580 0.768417 0.4584 POOL 52.78980 16.48172 3.202931 0.0084 SQFT 0.144415 0.014185 10.18086 0.0000 R-squared 0.907132 Mean dependent var 317.4929 Adjusted R-squared 0.890247 S.D. dependent var 88.49816 S.E. of regression 29.31856 Akaike info criterion 9.781728 Sum squared resid 9455.359 Schwarz criterion 9.918669 Log likelihood -65.47210 F-statistic 53.72383 Durbin-Watson stat 2.526380 Prob(F-statistic) 0.000002 Với các giá trị P_value trước biến Pool và biến sqft đều nhỏ hơn 5%. Vì vậy chấp nhận hô hình này Vậy phương trình hồi qui lúc này: PRICE = 22.67277002 + 52.78979633*POOL + 0.1444149156*SQFT + i u ˆ d. Price = β 1 + β 2 Baths + β Bedrms + β Famroom + β 3 4 5 Firepl + β Pool + β 6 7 Sqft + β 8 Pool*Sqft Chạy hình trên với Eview, ta có kết quả: Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 17:10 Sample: 1 14 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C 76.93417 64.38956 1.194824 0.2772 BATHS -10.24209 29.37901 -0.348619 0.7393 BEDRMS 4.867122 20.64732 0.235727 0.8215 FAMROOM -10.51463 30.40630 -0.345804 0.7413 FIREPL -1.107752 39.07848 -0.028347 0.9783 POOL -85.25082 50.95585 -1.673033 0.1453 SQFT 0.124680 0.022526 5.534876 0.0015 POOL*SQFT 0.074512 0.026121 2.852620 0.0291 R-squared 0.962442 Mean dependent var 317.4929 Adjusted R-squared 0.918624 S.D. dependent var 88.49816 S.E. of regression 25.24543 Akaike info criterion 9.590727 Sum squared resid 3823.992 Schwarz criterion 9.955903 ĐẠI HỌC DÂN LẬP HÙNG VƯƠNG Bài tập số 2 10 Log likelihood -59.13509 F-statistic 21.96456 GV: Nguyễn Thị Mai Bình Durbin-Watson stat 2.150252 Prob(F-statistic) 0.000712 Với kết quả của bảng trên ta thấy các hệ số P_value của các biến Baths, Bedrms, Famroom, Firepl, Pool đều lớn hơn α = 5% vì vậy ta thực hiện kiểm định Wald với: H : β 0 2 = β = β = β = β = 0 3 4 5 6 H : có ít nhất một giá trị β ≠ 0 với (i = 2, 3, 4, 5, 6) 1 i Chạy Eview ta có kết quả: Wald Test: Equation: Untitled Test Statistic Value df Probability F-statistic 0.675681 (5, 6) 0.6581 Chi-square 3.378405 5 0.6419 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. C(2) -10.24209 29.37901 C(3) 4.867122 20.64732 C(4) -10.51463 30.40630 C(5) -1.107752 39.07848 C(6) -85.25082 50.95585 Restrictions are linear in coefficients. P_value sau khi chạy Wald test trong kiểm định trên ta có: P_value = 0.6581 > α = 5% Vì vậy ta chấp nhận giả thuyết H 0 , vậy các hệ số trước các biến Baths, Bedrms, Famroom, Firepl, Pool đều bằng 0; hay các biến số phòng tắm, số phòng ngủ, có phòng gia đình, có thiết bị báo cháy, có hồ bơi không ảnh hưởng đến giá nhà. Vì vậy ta có thể bỏ các biến trên ra khỏi hình. Lúc này ta có hình: Dependent Variable: PRICE Method: Least Squares Date: 04/30/07 Time: 17:17 Sample: 1 14 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C 42.79643 22.36292 1.913723 0.0820 SQFT 0.132927 0.011257 11.80854 0.0000 POOL*SQFT 0.031857 0.006697 4.757055 0.0006 R-squared 0.941294 Mean dependent var 317.4929 Adjusted R-squared 0.930620 S.D. dependent var 88.49816 S.E. of regression 23.31047 Akaike info criterion 9.323092 Sum squared resid 5977.157 Schwarz criterion 9.460032 Log likelihood -62.26164 F-statistic 88.18710 Durbin-Watson stat 2.756228 Prob(F-statistic) 0.000000 Với các giá trị P_value trước biến Pool*Sqft và biến Sqft đều nhỏ hơn 5%. Vì vậy chấp nhận hô hình này Vậy phương trình hồi qui lúc này: PRICE = 42.7964305 + 0.132927069*SQFT + 0.03185742065*(POOL*SQFT) + i u ˆ e. Price = β 1 + β 2 Baths + β Bedrms + β Famroom + β 3 4 5 Firepl + β Pool + β 6 7 Sqft + β 8 Famroom* Bedrms + β 9 Firepl* Sqft + β 10 Pool*Sqft + β 11 Firepl*Bedrms+ β Pool*Baths 10 Chạy hình trên với Eview, ta có kết quả: [...]... Cobb-Douglass cho mô hình hồi qui trên Viết ra dạng hàm lý thuyết cần ước lượng 2 Hãy viết mô hình hồi qui mẫu cho hình trên căn cứ vào các hình bên dưới và giải thích ý nghĩa của các tham số từ hình trên 3 Theo các anh chị hình trên có bị những bệnh nào không? Tại sao (anh chị hãy cho biết rõ anh chị dựa trên hình nào) 4 Một bạn sinh viên chạy thử hình 4.6 và nhận thấy rằng hình này cũng... chạy mô hình hồi qui ta được hình 3.1 Theo các anh chị hình trên tối ưu chưa tại sao? Hãy viết các kiểm định cần thiết để chứng minh kết luận trên Nếu hình trên chưa tối ưu theo các anh chị cần phải làm gì tiếp theo (với α = 5%) 3 Một bạn sinh viên cho rằng giá của nhà có hồ bơi sẽ lớn hơn nhiều so với nhà không có hồ bơi Bạn chạy mô hình hồi qui 3.2 Anh/chị hãy viết phương trình hồi qui của mô. .. tstat lớn) hình (3) thể hiện mối quan hệ giữa 2 biến độc lập GDP và CPI, ta thấy hình này có ý nghĩa về mặt thống kê điều này có nghĩa có hiện tượng đa cộng tuyến trong hình gốc Mặt khác, R2 trong hình 3 (R2hqp=0.992224) lớn hơn hình ban đầu (R2 = 0.982318) và lớn nhất trong các hình vì vậy mức độ đa cộng tuyến giữa hai biến GDP và CPI rất mạnh Giải sử trong hình ban đầu (mô hình Ln... gốc là 1948) 1 hình 1.1 thể hiện mối quan hệ của 2 biến này Anh chị có nhận xét gì về hình này 2 Một sinh viên cho rằng hình này có thể bị bệnh nên thực hiện các phép kiểm định trong các hình 1.2, hình 1.3 Theo các anh chị đây là các phép kiểm định gì, nêu rõ các giải thuyết và căn cứ theo hình trên các anh chị hãy cho biết hình trên có bị bệnh gì không ? 3 Nếu hình trên có bệnh... anh chị hãy đề xuất các phương án trị bệnh, nêu cụ thể cách làm trên Eview 4 Một sinh viên đề suất một hình 1.5, các anh chị hãy viết phương trình hồi qui của hình này Giải thích ý nghĩa của các tham số 5 Nếu hình 1.1 và hình 1.5 đều là hình tốt, anh/chị sẽ chọn hình nào tại sao ? hình 1.1 Dependent Variable: FARMPOP Method: Least Squares Date: 06/24/07 Time: 22:28 Sample: 1948 1991... 1 Có sinh viên cho rằng nên sử dụng hình như hình 2.1 trong trường hợp này mới phù hợp Các anh chị hãy cho biết hình trên có tên gọi là gì và viết phương trình tổng quát cho hình trên (mô hình còn chứa β, chưa ước lượng) 2 Nhìn vào tất cả các hình bên dưới, các anh chị hãy giải thích khả năng xảy ra hiện tượng đa cộng tuyến trong hình 3 Trong hình 2.1, các biến nào không có ý nghĩa... lao động” hoặc “hiệu suất không thay đổi theo qui (với α = 5%) 1 Theo các anh chị dấu kỳ vọng của các biến độc lập này như thế nào 2 Hãy viết hàm Cobb-Douglass cho hình hồi qui trên Viết ra dạng hàm lý thuyết cần ước lượng 3 Hãy viết mô hình hồi qui mẫu cho hình trên căn cứ vào các hình bên dưới và giải thích ý nghĩa của các tham số từ hình trên 4 Các anh chị hãy viết các kiểm định... 3.2 Anh/chị hãy viết phương trình hồi qui của hình trên Giải thích ý nghĩa của các tham số hồi qui của hình trên, cho biết bạn sinh viên trên nghi ngờ đúng không? (với α = 5%) 4 Một sinh viên khác không đồng ý nên chạy hình 3.3, anh/ chị hãy viết phương trình hồi qui cho hình trên và giải thích ý nghĩa của các tham số của hình trên 5 hình 3.1 Dependent Variable: PRICE Method: Least... tuyến trong hình 1.1 3 Trong hình 1.1, các biến nào không có ý nghĩa về mặt thống kê (không ảnh hưởng đến lượng thịt gà tiêu thụ bình quân đầu người) với mức ý nghĩa 10% Hãy cho biết nên thực hiện kiểm định nào để biết được có nên bỏ các biến trên ra khỏi hình 1.1 4 Việc xây dựng hình từ hình 1.1 đến hình 1.2 có tên gọi là gì? Hãy giải thích ý nghĩa các tham số của hình phù hợp... hiện các phép kiểm định trong các hình 2.2, hình 2.4 Theo các anh chị các hình trên dùng để xác định bệnh gì? Đây là các phép kiểm định gì, nêu rõ các giải thuyết và căn cứ theo hình trên các anh chị hãy cho biết hình trên có bị bệnh gì không? 3 Nếu hình trên có bệnh các anh chị hãy đề xuất các phương án trị bệnh 4 Một sinh viên khác cho rằng hình 2.5 mới phù hợp, mới có thể giải . Xây dựng mô hình theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình nào là mô hình tối ưu. Giải thích quá trình thực hiện và các kiểm định cần thiết. (α=5%) Mô hình hồi qui tổng. chọn mô hình tối ưu ta so sánh các …… số R 2 , AIC, Schwarz R 2 AIC SCHWARZ 2 R Mô hình 1 0.907132 0.89024 9.781728 9.918669 Mô hình 2 0.941294 0.930620 9.323092 9.460032 Vậy mô hình hồi qui. nhà Các anh/chị hãy: a) Xây dựng các mô hình sau theo phương pháp từ phức tạp đến đơn giản và cho biết mô hình nào là mô hình tối ưu (xem xét các mô hình tổng quát dưới đây). Giải thích quá

Ngày đăng: 24/03/2014, 23:30

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan