Bài giảng có cấu trúc gồm 6 phần cung cấp cho người học các kiến thức: Quy luật phân phối xác suất, khoảng tin cậy của các hệ số, kiểm định T về các hệ số, kiểm định F về các hệ số, kiểm định X2 về các hệ số, dự báo biến phụ thuộc. Mời các bạn cùng tham khảo nội dung chi tiết.
Chương SUY DIỄN THỐNG KÊ & DỰ BÁO ▪ Các chương trước sử dụng trực tiếp 𝛽መ𝑗 để phân tích, sử dụng ước lượng điểm, phản ánh xu mẫu, chưa phải tổng thể ▪ Các toán suy diễn thống kê: ước lượng khoảng (khoảng tin cậy), kiểm định giả thuyết tham số tổng thể phân tích cho tổng thể ▪ Gắn với mức xác suất định (1 – α) hay α ▪ Phân tích với từ phần mềm chuyên dụng KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn 81 Chương Suy diễn thống kê dự báo NỘI DUNG CHƯƠNG ▪ 3.1 Quy luật phân phối xác suất ▪ 3.2 Khoảng tin cậy hệ số ▪ 3.3 Kiểm định T hệ số ▪ 3.4 Kiểm định F hệ số ▪ 3.5 Kiểm định 2 hệ số ▪ 3.6 Dự báo biến phụ thuộc KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn 82 Chương Suy diễn thống kê dự báo 3.1 QUY LUẬT PHÂN PHỐI XÁC SUẤT ▪ MH k biến: 𝑌 = 𝛽1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 + ⋯ + 𝛽𝑘 𝑋𝑘 + 𝑢 ▪ Mẫu: 𝑌𝑖 = 𝛽መ1 + 𝛽መ2 𝑋2𝑖 + 𝛽መ3 𝑋3𝑖 + ⋯ + 𝛽መ𝑘 𝑋𝑘𝑖 ▪ Muốn dùng 𝛽መ𝑗 mẫu để suy diễn hệ số βj tổng thể (j= 1,…, k) cần giả thiết quy luật phân phối xác suất ▪ Giả thiết 5: Sai số ngẫu nhiên phân phối Chuẩn ▪ Kết hợp với Giả thiết 2: E(ui) = Giả thiết 3: Var(ui) = σ2 , thì: ui ~ N(0, σ2) KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn 83 Chương Suy diễn thống kê dự báo Quy luật phân phối xác suất ▪ Khi đó: 𝛽መ𝑗 ~𝑁 𝛽𝑗 , 𝑉𝑎𝑟 𝛽መ𝑗 ▪ Chứng minh được: 𝛽መ𝑗 − 𝛽𝑗 ~𝑁 0,1 𝑉𝑎𝑟𝛽መ𝑗 𝛽መ𝑗 − 𝛽𝑗 ~𝑇 𝑛 − 𝑘 መ 𝑆𝑒(𝛽𝑗 ) ▪ Hai tốn suy diễn: • Ước lượng khoảng (khoảng tin cậy) với độ tin cậy (1 – α) • Kiểm định giả thuyết với mức ý nghĩa α KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn 84 Chương Suy diễn thống kê dự báo 3.2 KHOẢNG TIN CẬY CỦA CÁC HỆ SỐ ▪ Với độ tin cậy (1 – α), khoảng tin cậy đối xứng, tối đa, tối thiểu βj (j = 1,…,k ): ▪ Đối xứng 𝑛−𝑘 𝑛−𝑘 𝛽መ𝑗 − 𝑆𝑒 𝛽መ𝑗 𝑡𝜶/𝟐 < 𝛽𝑗 < 𝛽መ𝑗 + 𝑆𝑒 𝛽መ𝑗 𝑡𝜶/𝟐 ▪ Tối đa: 𝑛−𝑘 𝛽𝑗 < 𝛽መ𝑗 + 𝑆𝑒 𝛽መ𝑗 𝑡𝜶 𝑛−𝑘 መ መ ▪ Tối thiểu: 𝛽𝑗 − 𝑆𝑒 𝛽𝑗 𝑡𝜶 < 𝛽𝑗 KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn 85 Chương Suy diễn thống kê dự báo 3.2 Khoảng tin cậy hệ số Khoảng tin cậy nhiều hệ số ▪ Cho hai hệ số hồi quy, chẳng hạn β2 β3 𝑛−𝑘 መ መ መ መ 𝛽2 ± 𝛽3 − 𝑆𝑒 𝛽2 ± 𝛽3 𝑡𝛼/2 < β2 ± β3 𝑛−𝑘 < 𝛽መ2 ± 𝛽መ3 + 𝑆𝑒 𝛽መ2 ± 𝛽መ3 𝑡𝛼/2 ▪ Với: 𝑆𝑒 𝛽መ2 ± 𝛽መ3 = 𝑉𝑎𝑟 𝛽መ2 ± 𝛽መ3 = 𝑉𝑎𝑟(𝛽መ2 ) + 𝑉𝑎𝑟(𝛽መ3 ) ± 2𝐶𝑜𝑣(𝛽መ2 , 𝛽መ3 ) ▪ Mở rộng cho aβ2 + bβ3 ; β2, β3, β4… KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn 86 Chương Suy diễn thống kê dự báo 3.2 Khoảng tin cậy hệ số Khoảng tin cậy ▪ Ý nghĩa: mức ý nghĩa 95%, lấy nhiều mẫu nhiều khoảng tin cậy 95% khoảng chứa hệ số βj tổng thể ▪ Với mẫu quan sát: hi vọng thuộc 95% khoảng tính ▪ Độ tin cậy lớn khả cao khoảng tin cậy rộng ▪ Độ rộng khoảng tin cậy phụ thuộc: độ tin cậy, bậc tự (n: số quan sát, k: số hệ số), Se (phụ thuộc VIF, σ2, xji2 ) KINH TẾ LƯỢNG – Bộ môn Toán kinh tế – NEU – www.mfe.edu.vn 87 Chương Suy diễn thống kê dự báo 3.3 KIỂM ĐỊNH T VỀ HỆ SỐ HỒI QUY ▪ Kiểm định so sánh βj chưa biết với số thực βj* Tiêu chuẩn Cặp giả thuyết H0: 𝛽𝑗 = 𝛽𝑗∗ H1: 𝛽𝑗 ≠ 𝛽መ𝑗 − 𝛽𝑗∗ 𝑇𝑞𝑠 = 𝑆𝑒(𝛽መ𝑗 ) H0: 𝛽𝑗 = H1: 𝛽𝑗 > H0: 𝛽𝑗 = H1: 𝛽𝑗 < 𝛽𝑗∗ 𝛽𝑗∗ 𝛽𝑗∗ 𝛽𝑗∗ 𝛽𝑗∗ KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn Bác bỏ H0 𝑇𝑞𝑠 > 𝑛−𝑘 𝑡𝛼/2 𝑇𝑞𝑠 > 𝑛−𝑘 𝑡𝛼 𝑛−𝑘 𝑇𝑞𝑠 < −𝑡𝛼 88 Chương Suy diễn thống kê dự báo 3.3 Kiểm định T hệ số hồi quy Kiểm định T P-value ▪ Cặp giả thuyết quan trọng: H0: 𝛽𝑗 = H1: 𝛽𝑗 ≠ ▪ H0: Hệ số 𝛽መ𝑗 khơng có ý nghĩa thống kê (statistically insignificant): biến Xj khơng giải thích cho biến động Y ▪ Thống kê T: 𝑇0 = 𝛽መ𝑗 /𝑆𝑒 𝛽መ𝑗 𝑛−𝑘 ▪ Nếu 𝑇0𝑞𝑠 > 𝑡𝛼/2 bác bỏ H0 KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn 89 Chương Suy diễn thống kê dự báo 3.3 Kiểm định T hệ số hồi quy Kiểm định T nhiều hệ số ▪ Kiểm định cho β2 β3 : H0: 𝛽2 ± 𝛽3 = 𝛽∗ H1: 𝛽2 ± 𝛽3 ≠ 𝛽∗ ▪ Thống kê 𝛽መ2 ± 𝛽መ3 − 𝛽 ∗ 𝑇= 𝑆𝑒 𝛽መ2 ± 𝛽መ3 ▪ Quy tắc kiểm định giống với hệ số hồi quy ▪ Tương tự, mở rộng cho nhiều hệ số hồi quy KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn 90 Chương Suy diễn thống kê dự báo 3.4 Kiểm định F Kiểm định F ràng buộc ▪ Nếu hai mô hình (U) (R) biến phụ thuộc: (𝑅𝑈2 − 𝑅𝑅2 )/𝑚 𝐹= (1 − 𝑅𝑈2 )/(𝑛 − 𝑘𝑈 ) ▪ Các ràng buộc • Kiểm định bớt biến: (U) trước bớt, (R) sau bớt biến • Kiểm định thêm biến: (R) trước thêm, (U) sau thêm • Kiểm định đẳng thức bậc khác KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn 97 Chương Suy diễn thống kê dự báo 3.4 Kiểm định F Một số dạng ràng buộc ▪ MH gốc (U): Y = β1 + β2X2 + β3X3 + β4X4 + u ▪ Dạng 1: Các hệ số H0: β3 = β4 = (m = 2) MH có ràng buộc (R): Y = β1 + β2X2 + u ▪ Dạng 2: Tổng hiệu hệ số H0: β3 + β4 = MH (R): (m = 1) Y = β1 + β2X2 + β3 (X3 – X4) + u Y = β1 + β2X2 + β3 (X * ) + u KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn 98 Chương Suy diễn thống kê dự báo 3.4 Kiểm định F Một số dạng ràng buộc ▪ MH gốc (U): Y = β1 + β2X2 + β3X3 + β4X4 + u ▪ Dạng 3: Tổng hệ số số khác H0: β3 + β4 = MH (R): (m = 1) Y = β1 + β2X2 + β3X3 +(1–β3)X4 + u Y – X4 = β1 + β2X2 + β3 (X3 – X4) + u Y * = β1 + β2X2 + β3 (X * ) + u Lưu ý: Biến phụ thuộc thay đổi ▪ Dạng 4: Các ràng buộc khác H0: β2 = β3 + β4 = (m = 2) KINH TẾ LƯỢNG – Bộ môn Toán kinh tế – NEU – www.mfe.edu.vn 99 Chương Suy diễn thống kê dự báo 3.4 Kiểm định F Kiểm định F phù hợp mô hình ▪ Là kiểm định quan trọng với mơ hình ▪ Mơ hình:Y = β1 + β2X2 + β3X3 +…+ βkXk + u H0: β2 = … = βk = : hàm hồi quy không phù hợp H1: hệ số góc ≠ 0: hàm hồi quy phù hợp ▪ Kiểm định F 𝑅𝑈2 /(𝑘 − 1) 𝐹= (1 − 𝑅𝑈2 )/(𝑛 − 𝑘) ▪ Nếu 𝐹𝑞𝑠 > 𝑓𝛼 (𝑘 − 1, 𝑛 − 𝑘) bác bỏ H0 KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn 100 Chương Suy diễn thống kê dự báo 3.4 Kiểm định F Liên hệ kiểm định T F ▪ Với kiểm định ràng buộc, dùng T F ▪ Khi Fqs = ( Tqs )2 𝑓𝛼 1, 𝑛 − 𝑘𝑈 = 𝑛−𝑘 (𝑡𝛼/2 )2 ▪ Kiểm định F dùng cho ràng buộc dạng tuyến tính hệ số ▪ P-value kiểm định F = 𝑃 𝐹 𝑚, 𝑛 − 𝑘𝑈 > 𝐹𝑞𝑠 ▪ P-value tính phần mềm chuyên dụng KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn 101 Chương Suy diễn thống kê dự báo 3.4 Kiểm định F Ví dụ 3.1 (tiếp) ▪ (h) Kiểm định phù hợp mơ hình ▪ (i) Khi bớt biến L tổng bình phương phần dư tăng lên đến 1,48E+08 Có nên bỏ biến khơng? ▪ (j) Khi bớt biến K hệ số xác định giảm xuống cịn 0,65 Vậy có nên bỏ biến khơng? So sánh kết với kiểm định T ▪ (k) Khi thêm hai biến K2 K3 vào mơ hình hệ số xác định tăng lên đến 0,9664 Vậy có nên thêm hai biến vào khơng? KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn 102 Chương Suy diễn thống kê dự báo 3.5 KIỂM ĐỊNH KHI-BÌNH PHƯƠNG ▪ Kiểm định m ràng buộc, sử dụng hàm hợp lý ln(L), với 𝜒 (𝑚) so sánh 𝜒𝑞𝑠 𝛼 ▪ Ví dụ 3.1, kiểm định giả thuyết βK + βL = 3,6 Wald Test: Test Statistic Value df Prob t-statistic -1.341821 97 0.1828 F-statistic 1.800483 (1, 97) 0.1828 Chi-square 1.800483 0.1797 Null Hypothesis: C(2) + C(3) = 3.6 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std Err -3.6 + C(2) + C(3) -0.093098 0.069382 KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn 103 Chương Suy diễn thống kê dự báo Ví dụ 3.2: Ln(Y) phụ thuộc ln(K), ln(L) ▪ Với Y sản lượng, K vốn, L lao động Dependent Variable: LOG(Y) Variable Coefficient C 0.416571 LOG(K) 0.621661 LOG(L) 0.476395 R-squared 0.988628 F-statistic 4216.348 Sample: 100 Std Error t-Statistic Prob 0.114175 3.648529 0.0004 0.014506 42.85566 0.0000 0.005883 80.97390 0.0000 Sum sq resid 0.204993 Prob(F-statistic) 0.000000 ▪ Hiệp phương sai ước lượng hai hệ số góc xấp xỉ ▪ (a) Kiểm định tính hiệu theo quy mơ kiểm định T KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn 104 Chương Suy diễn thống kê dự báo Ví dụ 3.2 (tiếp) ▪ (b) Kiểm định giả thuyết “q trình sản xuất có hiệu không đổi theo quy mô” qua kết Dependent Variable: LOG(Y/L) Included observations: 100 Variable Coefficient Std Error t-Statistic Prob C 1.131938 0.007945 142.4783 0.0000 LOG(K/L) 0.537318 0.006444 83.37731 0.0000 R-squared 0.986099 Mean dep var 1.615989 Sum sq resid 0.288245 F-statistic 6951.776 KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn 105 Chương Suy diễn thống kê dự báo 3.6 DỰ BÁO BIẾN PHỤ THUỘC ▪ Với hồi quy biến: Y = 1 + 2X + u ▪ Tại X = X0 ▪ Ước lượng điểm: 𝑌0 = 𝛽መ1 + 𝛽መ2 𝑋0 ▪ Ước lượng khoảng: 𝑛−𝑘 𝑛−𝑘 𝑌0 − 𝑆𝑒 𝑌0 𝑡𝛼/2 < 𝑌0 < 𝑌0 + 𝑆𝑒 𝑌0 𝑡𝛼/2 ▪ Trong đó: 𝑆𝑒 𝑌0 = 𝑋0 − 𝑋ത + 𝑛 𝑛 σ𝑖=1 𝑋𝑖 − 𝑋ത KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn 106 Chương Suy diễn thống kê dự báo 3.5 Dự báo biến phụ thuộc Sai số dự báo ▪ Đánh giá chất lượng dự báo mơ hình hồi quy ▪ Tiêu chí: giá trị ước lượng Ŷi gần giá trị thực Yi ▪ Sử dụng m giá trị để đánh giá Thường lấy m = n RMSE MAE m ˆ (Yi Yi ) m i 1 m | Yˆi Yi | mi 1 MAPE Yˆi Yi (100%) m i 1 Yi m KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn 107 Chương Suy diễn thống kê dự báo 3.5 Dự báo biến phụ thuộc Ví dụ 3.3: Dự báo cho Y theo K, L ▪ Đánh giá dự báo cho Y qua mô hình K L ▪ MH với biến phụ thuộc ln(Y) quy giá trị Y Mô hình RMSE MAE 2.1(a) : lin-lin 268.74 218.47 6.86 2.1(b) : log-log 151.79 111.37 3.30 2.1(c) : lin-log 446.67 312.39 11.99 2.1(d) : log-lin 524.88 360.99 11.17 2.1(e) : tương tác 190.32 147.39 5.74 KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn MAPE 108 Chương Suy diễn thống kê dự báo 3.5 Dự báo biến phụ thuộc Ví dụ 3.3 (tiếp) ▪ MAPE mơ hình theo nhóm quan sát 2.1(a) : lin-lin 100 qs 6.86 50 qs đầu 7.25 50 qs sau 6.47 2.1(b) : log-log 3.30 3.20 3.40 2.1(c) : lin-log 11.99 9.94 14.04 2.1(d) : log-lin 11.17 12.41 9.94 5.74 5.98 5.51 Mơ hình 2.1(e) : tương tác KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn 109 Chương Suy diễn thống kê dự báo Trình bày kết nhiều mơ hình ▪ Kí hiệu *, **, *** : tương ứng hệ số có ý nghĩa thống kê mức 10%, 5%, 1% ▪ Kết mơ hình với số hộ gia đình Biến phụ thuộc MH (1) MH (2) MH (3) CONS (Chi tiêu) C 10.6 2.12*** -2.8 INCOME (Thu nhập) 0.56*** 0.58*** SIZE (Số người) 3.12** 3.31*** R-sq 0.45 0.257 0.74 MAPE 13.17% 12.72% 8.48% KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn 110 Chương Suy diễn thống kê dự báo Tóm tắt Chương ▪ Giả thiết: Sai số ngẫu nhiên phân phối chuẩn ▪ Khoảng tin cậy cho hệ số, nhiều hệ số ▪ Kiểm định T hệ số, hệ số có ý nghĩa thống kê ▪ Kiểm định F hệ số phù hợp ▪ Kiểm định thêm, bớt biến, ràng buộc ▪ Dự báo đánh giá sai số dự báo KINH TẾ LƯỢNG – Bộ mơn Tốn kinh tế – NEU – www.mfe.edu.vn 111 ... : lin-lin 268.74 218.47 6.86 2.1(b) : log-log 151.79 111 .37 3. 30 2.1(c) : lin-log 446.67 31 2 .39 11.99 2.1(d) : log-lin 524.88 36 0.99 11.17 2.1(e) : tương tác 190 .32 147 .39 5.74 KINH TẾ LƯỢNG... Error t-Statistic Prob C 1. 131 938 0.007945 142.47 83 0.0000 LOG(K/L) 0. 537 318 0.006444 83. 37 731 0.0000 R-squared 0.986099 Mean dep var 1.615989 Sum sq resid 0.288245 F-statistic 6951.776 KINH TẾ LƯỢNG... ? ?3 −