Chương trình Giảng dạy Kinh tế Fulbright Năm học 2012-2013 Các Phương Pháp Định Lượng Lời giải đề nghị tập Chương Trình Giảng Dạy Kinh tế Fulbright Học kỳ Thu năm 2012 Các Phương Pháp Phân Tích Định Lượng LỜI GIẢI ĐỀ NGHỊ BÀI TẬP HỒI QUY ĐA BIẾN Ngày Phát: Thứ hai 03/12/2012 Ngày Nộp: Thứ hai 10/12/2012 Bản in nộp lúc 8h20 sáng, Hộp nộp tập phòng Lab Bản điện tử gửi lên http://intranet.fetp.edu.vn:81 Câu Dependent Variable: Y Method: Least Squares Date: 11/10/05 Time: 22:56 Sample: 200 Included observations: 200 Variable Coefficient C -1689.783 X2 0.007695 X3 79.76524 X2*X3 74.16483 X3*X3 37.87703 D1 746.9610 R-squared 0.172804 Adjusted R-squared G S.E of regression 1625.076 H Sum squared resid Log likelihood Durbin-Watson stat Std Error 518.2858 0.003576 49.25838 123.7128 8.552994 297.3025 -1759.404 1.855648 t-Statistic -3.260331 2.152021 1.619323 0.599492 4.428511 2.512462 Mean dependent var S.D dependent var Akaike info criterion Schwarz criterion Prob A B C D E F 1253.115 1764.184 17.65404 17.75299 F-statistic Prob(F-statistic) 8.105433 0.000001 Dựa vào bảng trả lời câu hỏi sau: a Mơ hình trình bày có quan sát, biến? Mơ hình có: + 200 quan sát + biến độc lập biến phụ thuộc Chương trình Giảng dạy Kinh tế Fulbright Năm học 2012-2013 Các Phương Pháp Định Lượng Lời giải đề nghị tập b Mơ hình có vi phạm giả thiết tính đa cộng tuyến biến độc lập hay khơng? Vì sao? Một phương pháp để nhận biết mơ hình vi phạm giả thiết đa cộng tuyến dựa vào kết hồi qui với giá trị R-squared, theo R-squared lớn (khoảng 90%) ta cho mơ hình có khả vi phạm giả thiết tượng đa cộng tuyến Với kết hồi qui R-squared xấp xỉ 17.28% ta cho mơ hình khơng vi phạm giả thiết đa cơng tuyến c Hãy điền số liệu thiếu (A,B,C,D, E, F, G, H) vào bảng đây, trình bày cách tính tốn bạn? Ta có bảng kết sau tính tốn giá trị thiếu sau: Dependent Variable: Y Method: Least Squares Date: 11/10/05 Time: 22:56 Sample: 200 Included observations: 200 Variable Coefficient Std Error t-Statistic Prob C -1689.783 518.2858 -3.260331 A = 0.0013 X2 0.007695 0.003576 2.152021 B = 0.032631 X3 79.76524 49.25838 1.619323 C = 0.107 X2*X3 74.16483 123.7128 0.599492 D = 0.5495 X3*X3 37.87703 8.552994 4.428511 E = 0.0000158 D1 746.9610 297.3025 2.512462 F = 0.0128 R-squared 0.172804 Mean dependent var 1253.115 Adjusted R-squared G = 0.151485 S.D dependent var 1764.184 S.E of regression 1625.076 Akaike info criterion 17.65404 Sum squared resid H = 512329169.12 Schwarz criterion 17.75299 Log likelihood -1759.404 F-statistic 8.105433 Durbin-Watson stat 1.855648 Prob(F-statistic) 0.000001 Trình bày tính tốn: Sử dụng hàm tính excel TDIST(ABS(t-statistic(i)), 194, 2), ta có: Chương trình Giảng dạy Kinh tế Fulbright Năm học 2012-2013 Các Phương Pháp Định Lượng Lời giải đề nghị tập o A = 0.001314365 o B = 0.032631233 o C = 0.107002265 o D = 0.549544334 o E = 1.58301E-05 o F = 0.012803976 - Tính G: Giá trị R2 hiệu chỉnh theo bậc tự ( R ) tính theo cơng thức sau o G = R 1 - n 1 200 (1 R ) (1 0.172804) = 0.151484515 nk 200 Tính H: Ta có cơng thức tính ước lượng phương sai sai số (σ2) tính uˆi2 2 ˆ , ta có tổng bình phương sai số (sum squared resid): s nk o H = uˆ i ˆ (n k ) 1625.067 * (200 6) = 512,329,169.1205 (đơn vị bình phương) d Viết phương trình hồi quy mẫu? Từ kết hồi quy cho, ta viết phương trình hồi quy mẫu sau: Yˆi 1689.783 0.007695 X 2i 79.76524 X 3i 74.16483( X 2i * X 3i ) 37.87703 X 32i 746.9610D1i e Bao nhiêu phần trăm biến thiên Y giải thích biến độc lập nói trên? Với R2 = 17,28% ta cho với điều kiện yếu tố khác khơng đổi, biến độc lập có mơ hình hồi quy giải thích khoảng 17,28% biến thiên mặt trung bình biến Y f Tính tốn tác động biên tế X2 lên Y? Tính tốn tác động biên tế X3 lên Y? Tính tốn tác động biên tế D1 lên Y? Bạn có nhận xét đặc trưng tác động biên biến nêu trên? Tác động biên tế biến X2, X3 D1 lên Y hệ số bê ta ước lượng biến tương ứng đạo hàm bậc Y theo biến Như vậy, ta có tính tốn sau: - = = 0.007695 74.16483 X 3i Chương trình Giảng dạy Kinh tế Fulbright Năm học 2012-2013 Các Phương Pháp Định Lượng - = = 79.76524 74.16483 X 2i 75.75406 X 3i - = = 746,96 Lời giải đề nghị tập Nhận xét đặc trưng: Tác động biên tế biến X2, X3, D1: + Biên tế D1 số không đổi + Biên tế X2 hàm tuyến tính theo X3 + Biên tế X3 hàm tuyến tính đa biến theo X2 X3 Tổng qt: Nếu mơ hình gồm biến tương tác tạo biến độc lập với tác động biên tế biến độc lập lên biến phụ thuộc hàm số theo biến độc lập tạo nên biến tương tác Tác động biên tế biến độc lập giá trị cụ thể Xi khác Xi thay đổi thay đổi theo dạng hàm số xác định g Nếu phép thay đổi mơ hình nói bạn đề nghị mơ hình bao gồm biến nào? Giải thích bạn lại đề nghị vậy? Ta thấy, lấy mức ý nghĩa 5% để đánh giá khả bác bỏ giả thuyết hệ số hồi quy khơng, ta loại bỏ biến có giá trị Pvalue lớn 5% (0.05) Do loại bỏ biến: o X3, có P-value = 0.107 > 0.05 o X2*X3 có P-value = 0.5495 > 0.05 Như mơ hình bao gồm biến: - Biến phụ thuộc: Y - Biến độc lập: X2, X3*X3, D1 Câu 2: File đính kèm tập (chi tieu y te_thu nhap.xls) liệu từ 65 quan sát Tp.Hồ Chí Minh Sử dụng Eview để làm công việc sau: a Lập bảng thống kê mô tả cho tất biến có tập liệu nói Phân loại biến Sử dụng Eview, Group Views/Descriptive Statistic ta có bảng thống kê mơ tả sau: Mean Median CHI_TIEU_Y _TE 1171.921 500.0000 TUOI_CUA_C TRE_EM_DU SO_NHAN_K HU_HO OI_15_TUOI THU_NHAP HAU 51.60317 0.936508 45361.98 5.269841 48.00000 1.000000 36001.00 4.000000 PHU_NU_TR ONG_TUOI_S GIOI_TINH_C BANG_CAP_ INH HU_HO CAO_NHAT 1.301587 1.571429 1.777778 1.000000 2.000000 1.000000 Chương trình Giảng dạy Kinh tế Fulbright Năm học 2012-2013 Các Phương Pháp Định Lượng Lời giải đề nghị tập Maximum Minimum Std Dev Skewness Kurtosis 10530.00 0.000000 1925.728 3.166478 13.91185 87.00000 18.00000 14.77087 0.233275 2.283607 4.000000 0.000000 1.075730 0.988476 3.298211 165875.0 101.0000 39142.42 1.095942 3.665004 19.00000 1.000000 3.755453 1.605422 5.337275 5.000000 0.000000 1.239601 1.409027 4.868147 2.000000 1.000000 0.498847 -0.288675 1.083333 7.000000 0.000000 2.003581 1.230287 3.855619 Jarque-Bera Probability 417.8342 0.000000 1.918583 0.383164 10.49284 0.005266 13.77229 0.001022 41.40249 0.000000 30.00743 0.000000 10.51823 0.005200 17.81458 0.000135 Sum Sum Sq Dev 73831.00 2.30E+08 3251.000 13527.08 59.00000 71.74603 2857805 9.50E+10 332.0000 874.4127 82.00000 95.26984 99.00000 15.42857 112.0000 248.8889 Observations 63 63 63 63 63 63 63 63 Mơ hình với biến Y (tổng chi tiêu cho y tế hộ) biến phụ thuộc biến lại biến giải thích, ta có kết phân loại sau: Định lượng gồm biến: Y, X1, X3, X5, X6 X7 Đinh tính gồm biến: X2 X4 b Lập bảng hệ số tương quan biến tập liệu nói Bạn có nhận xét mối tương quan biến này? Bảng hệ số tương quan: Chỉ tiêu Tổng chi tiêu cho y tế hộ Y (1000đ/năm) 1.0000 Thu nhập X1 (1000đ/nă m) Bằng cấp cao đạt X2 Tuổi chủ hộ X3 Giới tính chủ hộ X4 Trẻ em 15 tuổi X5 Phụ nữ độ tuổi sinh đẻ X6 Số nhân X7 Y (1000đ/năm) 0.3919 1.0000 0.0929 0.3978 1.0000 0.3886 -0.0197 -0.3156 1.0000 -0.0022 0.0679 -0.0583 0.0682 1.0000 0.1143 -0.0721 0.1332 0.0155 -0.0351 1.0000 -0.1387 -0.0287 -0.1008 0.0861 -0.0435 0.1235 1.0000 0.0233 0.0794 0.1931 -0.1271 -0.1961 0.4004 0.3392 X1 (1000đ/năm) X2 X3 X4 X5 X6 1.0000 X7 Nhận xét: Nhìn vào bảng trên, ta thấy mối quan hệ biến tập liệu mối quan hệ tương quan trung bình thấp, có số mối quan hệ tương quan thấp, không đáng kể Chương trình Giảng dạy Kinh tế Fulbright Năm học 2012-2013 Các Phương Pháp Định Lượng Lời giải đề nghị tập Có mối quan hệ đồng biến, số nghịch biến biến độc lập biến phụ thuộc Cụ thể: + Các biến X1, X2, X3, X5 X7 có tương quan đồng biến với Y + Các biến X4, X6 tương quan nghịch biến với Y Ngoài ta tham chiếu để xem xét mức độ tương quan biến theo bảng sau: Hệ số tương quan ±0.01 đến ±0.1 ±0.2 đến ±0.3 ±0.4 đến ±0.5 ±0.6 đến ±0.7 ±0.8 – 1.0 Ý nghĩa Mối tương quan thấp, không đáng kể Mối tương quan thấp Mối tương quan trung bình Mối tương quan cao Mối tương quan cao c Trong tập liệu nói trên, dùng biến lại để giải thích cho biến động “tổng chi tiêu y tế hộ” bạn có kỳ vọng dấu hệ số hồi quy? Dựa lý thuyết nghiên cứu trước quan sát thực tế ta kỳ vọng dấu hệ số hồi qui biến độc lập sau: Biến Kỳ vọng dấu hệ số hồi qui BANGCAONHAT + GIOITINHCHUHO - PHUNUTRONGTUOISINHSAN - QUIMOHOTREEMDUOI15 + SONHANKHAU + THUNHAP + TUOICUACHUHO + Nhận xét: + Các biến “Tuổi chủ hộ”, “Trẻ em 15 tuổi”, “Thu nhập”, “Số nhân khẩu” “Bằng cấp cao nhất” có hệ số hồi quy mang dấu dương, với mối quan hệ đồng biến biến với biến “Tổng chi tiêu y tế hộ” + Các biến “Phụ nữ tuổi sinh đẻ”, “Giới tính chủ hộ” có hệ số hồi quy mang dấu âm, với mối quan hệ nghịch biến biến với biến “Tổng chi tiêu y tế hộ” Chương trình Giảng dạy Kinh tế Fulbright Năm học 2012-2013 Các Phương Pháp Định Lượng Lời giải đề nghị tập d Xây dựng hàm hồi quy tuyến tính mối quan hệ câu (c), dấu hệ số hồi quy có kỳ vọng bạn không? Sử dụng Eview ta có kết hồi quy sau: Dependent Variable: TONG_CHI_TIEU_Y_TE_CUA_H Method: Least Squares Date: 01/03/13 Time: 15:19 Sample: 65 Included observations: 63 Variable Coefficient Std Error t-Statistic Prob THU_NHAP_X1 1000D_NAM_ BANG_CAP_CAO_NHAT_DAT_DU TUOI_CUA_CHU_HO_X3 GIOI_TINH_CUA_CHU_HO_X4 TRE_EM_DUOI_15_TUOI_X5 PHU_NU_TRONG_DO_TUOI_SIN SO_NHAN_KHAU_X7 C 0.018986 35.27848 58.04288 -246.4273 222.8695 -298.4548 18.87725 -2279.714 0.005865 123.1935 15.05469 423.5130 213.1087 179.7214 66.08648 1148.312 3.237059 0.286366 3.855469 -0.581865 1.045802 -1.660652 0.285645 -1.985274 0.0020 0.7757 0.0003 0.5630 0.3002 0.1025 0.7762 0.0521 R-squared Adjusted R-squared S.E of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic) 0.374655 0.295065 1616.849 1.44E+08 -550.5742 4.707340 0.000343 Mean dependent var S.D dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter Durbin-Watson stat 1171.921 1925.728 17.73251 18.00466 17.83955 1.688747 Ta có hàm hồi quy mẫu sau: Yˆi 2279.714 0.018986 X 1i 35.27848 X 2i 58.04288 X 3i 246.4273 X 4i 222.8695 X 5i 298.4548 X 6i 18.87725 X 7i Dấu hệ số hồi quy kỳ vọng câu c e Nêu ý nghĩa hệ số hồi quy tìm câu d? Các hệ số hồi quy câu (d) tác động biên tế hay tác động riêng phần biến X1, X2, X3, X4, X5, X6, X7 lên biến thiên Y mặt trung bình điều kiện yếu tố khác khơng đổi Từ đó, ta rút ý nghĩa hệ số hồi quy sau: + Giá trị ˆ1 = -2279.714 cho biết giá trị tung độ gốc biến Y giá trị Xi + ˆ = 0.018986 > 0: Mối quan hệ biến thu nhập biến chi tiêu cho y tế quan hệ đồng biến, hệ số cho biết điều kiện yếu tố khác không đổi, thu nhập tăng lên (giảm xuống) nghìn đồng/năm chi tiêu cho y tế tăng lên (giảm xuống) mặt trung bình khoảng 0,0189 nghìn đồng/năm Chương trình Giảng dạy Kinh tế Fulbright Năm học 2012-2013 Các Phương Pháp Định Lượng Lời giải đề nghị tập + ˆ3 = 35.27848 > 0: Mối quan hệ biến cấp cao đạt biến chi tiêu cho y tế quan hệ đồng biến, ngồi hệ số cho biết khác biệt theo quan hệ đồng biếnvề chi tiêu cho y tế mặt trung bình điều kiện khác khơng đổi khoảng 35.28 nghìn đồng/năm người thay đổi cấp độ cấp cao mà người đạt + Tương tự, bạn nhận xét ý nghĩa cho hệ số hồi quy lại f Theo bạn biến nói trên, biến có ảnh hưởng mạnh đến tổng chi tiêu cho y tế chủ hộ? Tại sao? Để xem xét biến có ảnh hưởng mạnh đến biến chi tiêu y tế hộ ta phải dùng hệ số hồi quy chuẩn hóa nhằm khử khác biệt đơn vị biến Hệ số hồi quy chuẩn hóa = Với giả định trung bình ước lượng hệ số hồi quy biến X i ta có hệ số hồi quy chuẩn hóa giá trị T-statistic Như vậy, từ bảng hồi quy câu d, ta thấy biến Tuổi chủ hộ (X3) có giá trị T-statistic (3,855) giá trị cao Vậy, với giả định ta xem biến X3 biến có ảnh hưởng mạnh đến biến chi tiêu y tế hộ mức ý nghĩa 5% g Hãy loại trừ biến có Pvalue > 5%, hồi quy biến phụ thuộc nói với biến độc lập lại? Loại trừ biến có giá trị P-value >5% theo ta loại nhóm biến X2, X4, X5, X6, X7 Chạy hồi quy Y theo X1 X3 ta có kết sau: Dependent Variable: TONG_CHI_TIEU_Y_TE_CUA_H Method: Least Squares Date: 01/03/13 Time: 15:06 Sample: 65 Included observations: 65 Variable Coefficient Std Error t-Statistic Prob THU_NHAP_X1 1000D_NAM_ 0.019489 TUOI_CUA_CHU_HO_X3 51.00887 C -2359.865 0.005142 13.56855 769.0325 3.789989 3.759346 -3.068615 0.0003 0.0004 0.0032 R-squared Adjusted R-squared S.E of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic) Mean dependent var S.D dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter Durbin-Watson stat 0.310692 0.288456 1603.737 1.59E+08 -570.4012 13.97264 0.000010 1145.923 1901.220 17.64312 17.74347 17.68271 1.647208 Chương trình Giảng dạy Kinh tế Fulbright Năm học 2012-2013 Các Phương Pháp Định Lượng Lời giải đề nghị tập Ta có hàm hồi quy mẫu lúc là: Yˆi 2359.865 0.019489 X 1i 51.00887 X 3i h Bạn có nhận xét hệ số R2 hai mơ hình giải thích quan sát bạn? Ta thấy, giá trị R2: - Mơ hình (mơ hình đầy đủ): 0.374655 - Mơ hình (mơ hình loại bỏ số biến): 0.310692 Như giá trị R2 mơ hình cao mơ hình 2, cho thấy bỏ thêm nhiều biến chưa xác định biến đưa vào có ý nghĩa hay khơng giá trị R2 tăng uˆt2 ESS 1 Điều giải thích sau: R TSS (Yt Y ) 2 Khi đưa thêm biến giải thích vào mơ hình khiến phần dư giảm xuống (vì chất khơng giải thích nằm phần dư), tăng thêm biến khiến tổng bình phương phần dư giảm, TSS không đổi, dẫn tới R2 luôn tăng Giá trị R2 tăng khả giải thích mơ hình, chất lại khơng làm rõ tầm quan trọng biến đưa vào, dựa vào giá trị R2 để đánh giá tính hiệu mơ hình dẫn đến tình khơng xác đưa q nhiều biến khơng cần thiết, làm phức tạp mơ hình i Bạn có nhận xét R2 điều chỉnh hai mơ hình? Giải thích quan sát bạn? Ta thấy, giá trị R2 điều chỉnh: - Mơ hình 1: 0.295065 - Mơ hình 2: 0.288456 Giá trị R2 điều chỉnh mơ hình xấp xỉ giá trị R2 điều chỉnh mơ hình Sự khác biệt chưa thể kết luận có khác biệt đáng kể mặt thống kê Việc loại biến có giá trị P-value >5% chưa thực kiểm định cần thiết có sở lý thuyết ủng hộ biến vừa loại thực có tác động đến biến chi tiêu y tế hộ Do đó, ta cần nghiên cứu sở lý thuyết để củng cố làm sở loại biến, tránh việc loại biến thực có tác động quan trọng đến biến phụ thuộc j Bạn dùng số để so sánh tính phù hợp hai mơ hình nói trên? Việc sử dụng R2 hiệu chỉnh theo bậc tự cho biết mức độ quan trọng (khả giải thích được) biến thêm vào đánh giá mức độ ý nghĩa biến thêm vào có đáng kể hay khơng Do sử dụng độ thích hợp hiệu chỉnh theo bậc tự (R2 Chương trình Giảng dạy Kinh tế Fulbright Năm học 2012-2013 Các Phương Pháp Định Lượng Lời giải đề nghị tập điều chỉnh) để đánh giá tính thích hợp mơ hình Lý R2 điều chỉnh cho phép đánh đổi việc tăng R2 giảm bậc tự do, đánh giá mức độ ý nghĩa hay độ quan trọng biến thêm vào k Thay coi “Y - tổng chi tiêu cho y tế hộ” biến phụ thuộc, bạn dùng logarit số tự nhiên “tổng chi tiêu y tế hộ” (ln(Y)) làm biến phụ thuộc Theo bạn thực mơ hình tốt hơn? Tại sao? Thực bước tiến hành Eview, ta có mơ hình hồi quy biến LNY theo biến giải thích cho mơ hình hồi quy biến Y sau: Dependent Variable: LNY Method: Least Squares Date: 01/03/13 Time: 15:26 Sample: 65 Included observations: 54 Variable Coefficient Std Error t-Statistic Prob THU_NHAP_X1 1000D_NAM_ BANG_CAP_CAO_NHAT_DAT_DU TUOI_CUA_CHU_HO_X3 GIOI_TINH_CUA_CHU_HO_X4 TRE_EM_DUOI_15_TUOI_X5 PHU_NU_TRONG_DO_TUOI_SIN SO_NHAN_KHAU_X7 C 1.15E-05 -0.010697 0.028601 -0.003740 0.032342 -0.158518 0.036062 4.500093 4.07E-06 0.086072 0.011199 0.315134 0.161353 0.131931 0.059494 0.861073 2.827762 -0.124284 2.553833 -0.011869 0.200443 -1.201524 0.606147 5.226147 0.0069 0.9016 0.0140 0.9906 0.8420 0.2357 0.5474 0.0000 R-squared Adjusted R-squared S.E of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic) 0.293188 0.185630 1.088138 54.46604 -76.85470 2.725850 0.018798 Mean dependent var S.D dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter Durbin-Watson stat Ta có phương trình hồi quy 6.502430 1.205794 3.142767 3.437431 3.256407 1.527577 sau: LNYˆi 4.500093 1.15E 05 X 1i 0.010697 X 2i 0.028601X 3i 0.00374 X 4i 0.032342 X 5i 0.158518 X 6i 0.036062 X 7i Để so sánh mơ hình tốt ta dựa vào R2 điều chỉnh với yêu cầu phải số lượng quan sát biến phụ thuộc hai mơ hình phải giống Tuy nhiên trường hợp biến phụ thuộc hai mơ hình khác nên ta kết luận mô hình thực tốt 10 ... y tế hộ” + Các biến “Phụ nữ tuổi sinh đẻ”, “Giới tính chủ hộ” có hệ số hồi quy mang dấu âm, với mối quan hệ nghịch biến biến với biến “Tổng chi tiêu y tế hộ” Chương trình Giảng dạy Kinh tế Fulbright. .. stat 1.855648 Prob(F-statistic) 0.000001 Trình bày tính tốn: Sử dụng hàm tính excel TDIST(ABS(t-statistic(i)), 194, 2), ta có: Chương trình Giảng dạy Kinh tế Fulbright Năm học 2012-2013 Các Phương... đồng/năm Chương trình Giảng dạy Kinh tế Fulbright Năm học 2012-2013 Các Phương Pháp Định Lượng Lời giải đề nghị tập + ˆ3 = 35.27848 > 0: Mối quan hệ biến cấp cao đạt biến chi tiêu cho y tế quan