+ Kiểm định White Xét mô hình: Yi = β1 + β2X2 + β3X3 + U (2) ei2 = α1 + α2X2 + α3X3 + α4X22 + α5X32 + α6X2X3 + V () Xét cặp giả thiết: H0: R2 = 0 H1: R2 ≠ 0 Thống kê: χ2 = nR2 ~ χ2 (5) Tính χ2qs + Nếu χ2qs > χ2 (5)α bác bỏ giả thiết H0 mô hình () phù hợp hay mô hình ban đầu có khuyết tật PSSS thay đổi + Nếu χ2qs < χ2 (5)α chưa có cơ sở bác bỏ giả thiết H0 mô hình () không phù hợp hay mô hình ban đầu không có khuyết tật PSSS thay đổi + Kiểm định dựa trên biến phụ thuộc Mô hình: Y = β1 + β2X2 + β3X3 + U (3) Kiểm định sự phù hợp của hàm hồi
LAP_Price = a1 + a2* MAIN +a3*RAM + u stt 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 giá laptop 15,274,100 15,270,300 15,272,200 15,269,350 15,267,450 15,269,350 15,295,950 15,262,700 15,263,650 15,261,750 15,259,850 15,260,800 15,257,950 15,258,900 15,256,050 15,251,300 15,249,400 15,247,500 15,245,600 15,244,650 15,243,700 15,241,800 15,242,750 15,240,850 15,238,950 15,237,050 15,238,950 15,236,100 15,237,050 15,234,200 mainboard 948,000 996,000 1,060,000 1,221,000 1,221,000 1,221,000 1,188,000 1,269,000 1,317,000 1,269,000 1,317,000 1,478,000 1,702,000 1,879,000 2,040,000 2,152,000 2,441,000 2,521,000 1,333,000 1,429,000 1,574,000 1,991,000 2,313,000 2,554,000 2,811,000 2,521,000 2,955,000 3,373,000 3,822,000 3,822,000 ram 233,000 209,000 217,000 241,000 418,000 337,000 393,000 402,000 418,000 434,000 482,000 522,000 506,000 514,000 610,000 867,000 931,000 940,000 163,000 273,000 209,000 225,000 402,000 265,000 177,000 241,000 177,000 193,000 257,000 249,000 Kết hồi quy GIALAPTOP theo MAINBOARD, RAM: Dependent Variable: GIALAPTOP Method: Least Squares Date: 05/05/13 Time: 08:23 Sample: 30 Included observations: 30 Variable Coefficient MAINBOARD -0.013986 RAM 0.007614 C 15278337 R-squared 0.631819 Adjusted R-squared 0.604546 S.E of regression 9258.202 Sum squared resid 2.31E+09 Log likelihood -314.9857 Durbin-Watson stat 0.939141 Std Error t-Statistic 0.002075 -6.738574 0.007907 0.962870 5291.934 2887.099 Mean dependent var S.D dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) Prob 0.0000 0.3442 0.0000 15254340 14722.41 21.19905 21.33917 23.16676 0.000001 Kiểm tra khuyết tật mơ hình: a Kiểm định đa cộng tuyến.( hồi quy phụ) - Khái niệm: Đa cộng tuyến tượng xảy biến độc lập mơ hình có quan hệ cộng tuyến với - Bản chất: Là tương quan lẫn biến độc lập với Cov(XiXj) < > - Nguyên nhân: Do thu thập số liệu ít, khơng tồn diện Do chất biến độc lập tương quan Do số dạng mơ hình sản sinh đa cộng tuyến - Hậu quả: Phương sai hiệp phương sai ước lượng bình quân bé lớn Giá trị tới hạn t trở nên nhỏ so với thực tế R2 cao Kiểm định t F trở nên hiệu Khoảng tin cậy rộng Tỷ số t ý nghĩa Các ước lượng bình phương bé sai số tiêu chuẩn chúng trở nên nhạy thay đổi nhỏ số liệu Dấu ước lượng hồi quy sai Thêm vào hay bớt biến cộng tuyến với biến khác, mơ hình thay đổi độ lớn ước lượng dấu chúng - Cách phát hiện: Mơ hình có giá trị R2 cao giá trị thống kê t thấp Dùng ma trận hệ số tương quan biến độc lập Hệ số tương quan từ 0.8 trở lên cao, từ 0.9 trở lên cao Dùng mơ hình hồi quy phụ, R2 mơ hình hồi quy phụ cao mơ hình hồi quy mơ hình hồi quy có xảy tượng đa cộng tuyến Dùng sổ phóng đại phương sai, VIF >=10, mơ hình xảy tượng đa cộng tuyến cao Từ trở lên có tượng ĐCT cao Xem xét tương quan riêng Áp dụng: Kiểm định đa cộng tuyến hồi quy phụ MAINBOARD theo RAM: MAINBOARD= α1 + α2*RAM + v + Kết quả: Dependent Variable: MAINBOARD Method: Least Squares Date: 05/05/13 Time: 09:43 Sample: 30 Included observations: 30 Variable Coefficient C 1924378 RAM 0.000580 R-squared 0.000000 Adjusted R-squared -0.035714 S.E of regression 843016.3 Sum squared resid 1.99E+13 Log likelihood -450.8755 Durbin-Watson stat 0.139385 Std Error t-Statistic 316123.3 6.087427 0.720012 0.000805 Mean dependent var S.D dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) Prob 0.0000 0.9994 1924600 828354.1 30.19170 30.28511 6.49E-07 0.999363 Dựa vào kết hồi quy, ta thấy giá trị P-value thống kê F Prob = 0.999363 lớn α = 0.05, mơ hình hồi quy ban đầu khơng có khuyết tật đa cộng tuyến b Kiểm định phương sai sai số thay đổi - khái niệm: xét mơ hình hồi quy: Y = β1 + β2X + U (1) Mơ hình (1) có khuyết tật phương sai sai số thay đổi khi: Var (U/Xi) ≠ Var (U/Xj) hay ϭi2 ≠ ϭj2 - Nguyên nhân: + Do chất mối quan hệ kinh tế + Do kỹ thuật thu thập số liệu cải tiến làm cho ϭ2 có xu hướng giảm + Do người học hành vi khứ + Do mẫu xuất quan sát ngoại lai + Do hàm bị định dạng sai - Hậu quả: + Ước lượng bình phương nhỏ khơng chệch không hiệu + Ước lượng phương sai bị chệch làm hiệu lực kiểm định - Cách phát hiện: + Bản chất vấn đề nghiên cứu: thông thường, số liệu chéo liên quan tới đơn vị không hay xảy tượng phương sai sai số thay đổi + Xem xét đồ thị phần dư: Yi = Ŷi + ei + Kiểm định Park Giả thiết: ϭi2 = ϭ2Xiβ2eVi (ϭ2 = Var (U/Xi, ϭ2 = const) Lnϭi2 = lnϭ2 + β2lnXi + Vi Lnei = β1 + β2lnX + V Xét cặp giả thiết: H0: R*2 = H1: R*2 ≠ Cách 1: Xét thống kê F = R2/ [(1 - R2) / (n – 2)] ~ F (1, n – 2) Tính Fqs, Fα(1, n – 2) + Nếu Fqs > Fα(1, n – 2) bác bỏ giả thiết H0 hay mơ hình ban đầu có khuyết tật PSSS thay đổi + Nếu Fqs < Fα(1, n – 2) chưa có sở bác bỏ giả thiết H0, hay mơ hình ban đầu khơng có khuyết tật PSSS thay đổi Cách 2: Xét thống kê: χ2 = nR*2 ~ χ2 (1) Tính χ2qs, χ2 (1)α/2, χ2 (1)1 – α/2 + Nếu χ2qs ϵ (χ2 (1)1 - α/2; χ2 (1)α/2) chưa có sở bác bỏ giả thiết H0 hay mơ hình ban đầu khơng có khuyết tật PSSS thay đổi + Nếu χ2qs < χ2 (1)1 – α/2 χ2qs > χ2 (1)α/2 bác bỏ giả thiết H0 hay mơ hình ban đầu có khuyết tật PSSS thay đổi + Kiểm định White Xét mơ hình: Yi = β1 + β2X2 + β3X3 + U (2) ei2 = α1 + α2X2 + α3X3 + α4X22 + α5X32 + α6X2X3 + V (*) Xét cặp giả thiết: H0: R2 = H1: R2 ≠ Thống kê: χ2 = nR2 ~ χ2 (5) Tính χ2qs + Nếu χ2qs > χ2 (5)α bác bỏ giả thiết H0 mơ hình (*) phù hợp hay mơ hình ban đầu có khuyết tật PSSS thay đổi + Nếu χ2qs < χ2 (5)α chưa có sở bác bỏ giả thiết H0 mơ hình (*) khơng phù hợp hay mơ hình ban đầu khơng có khuyết tật PSSS thay đổi + Kiểm định dựa biến phụ thuộc Mơ hình: Y = β1 + β2X2 + β3X3 + U (3) Kiểm định phù hợp hàm hồi quy: ei2 = α1 + α2Ŷi2 + Vi (**) Xét cặp giả thiết: H0: R*2 = H1: R*2 ≠ Cách 1: xét thống kê χ2 = nR*2 ~ χ2 (1) Tính χ2qs; χ2 (1)α + Nếu χ2qs > χ2 (1)α bác bỏ giả thiết H0 mơ hình (**) phù hợp hay mơ hình ban đầu có khuyết tật PSSS thay đổi + Nếu χ2qs < χ2 (1)α chưa có sở bác bỏ giả thiết H0 mơ hình (**) khơng phù hợp hay mơ hình ban đầu khơng có khuyết tật PSSS thay đổi Cách 2: xét thống kê F = R*2/ [(1 – R*2) / (n – 2)] ~ F (1, n – 2) Tính Fqs; Fα(1, n – 2) + Nếu Fqs > Fα(1, n – 2) bác bỏ giả thiết H0 mơ hình (**) phù hợp hay mơ hình ban đầu có khuyết tật PSSS thay đổi + Nếu Fqs < Fα(1, n – 2) chưa có sở bác bỏ giả thiết H0 mơ hình (**) khơng phù hợp hay mơ hình ban đầu khơng có khuyết tật PSSS thay đổi Áp dụng: + phát khuyết tật PSSS thay đổi kiểm định Park: Hồi quy e2 theo biến MAINBOARD: e2 = α1 + α2MAINBOARD + v - Kết hồi quy: Dependent Variable: E2 Method: Least Squares Date: 05/05/13 Time: 23:27 Sample: 30 Included observations: 30 Variable Coefficient C -1.99E+10 YMU2 8.57E-05 R-squared 0.027895 Adjusted R-squared -0.006823 S.E of regression 1.84E+08 Sum squared resid 9.44E+17 Log likelihood -612.3908 Durbin-Watson stat 2.021106 Std Error t-Statistic Prob 2.22E+10 -0.892893 0.3795 9.56E-05 0.896364 0.3777 Mean dependent var 77142879 S.D dependent var 1.83E+08 Akaike info criterion 40.95939 Schwarz criterion 41.05280 F-statistic 0.803468 Prob(F-statistic) 0.377701 Dựa vào bảng kết hồi quy, ta thấy giá trị P-value thống kê F: Prob = 0.377701 lớn α = 0.05, đó, mơ hình hồi quy ban đầu khơng có khuyết tật PSSS thay đổi + phát khuyết tật PSSS thay đổi Kiểm định White: Hồi quy phụ để kiểm định: e2 = α1 + α2*MAINBOARD + α3*RAM + α4*MAINBOARD^2 + α5*RAM^2 + v Kết quả: White Heteroskedasticity Test: F-statistic 0.437334 Obs*R-squared 1.961921 Probability Probability Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 05/05/13 Time: 23:59 Sample: 30 Included observations: 30 Variable Coefficient C 3.23E+08 MAINBOARD -171.8679 MAINBOARD^2 2.84E-05 RAM -118.6564 RAM^2 3.58E-05 R-squared 0.065397 Adjusted R-squared -0.084139 S.E of regression 1.91E+08 Sum squared resid 9.08E+17 Log likelihood -611.8006 Durbin-Watson stat 2.058703 Std Error t-Statistic Prob 3.23E+08 1.000286 0.3268 270.3069 -0.635825 0.5307 5.82E-05 0.487475 0.6302 789.5431 -0.150285 0.8817 0.000732 0.048847 0.9614 Mean dependent var 77142879 S.D dependent var 1.83E+08 Akaike info criterion 41.12004 Schwarz criterion 41.35358 F-statistic 0.437334 Prob(F-statistic) 0.780376 0.780376 0.742763 Dựa vào bảng kết quả, ta thấy giá trị P-value thống kê F: Prob = 0.780376 lớn α = 0.05, mơ hình ban đầu khơng có khuyết tật PSSS thay đổi c Kiểm định tự tương quan - khái niệm: Xét mơ hình: Yi = β1 + β2Xi + Ui (1) Mơ hình có khuyết tật tự tương quan khi: Cov (Ui,Uj) ≠0 (V i, j) - Nguyên nhân: + Nguyên nhân khách quan: quán tính Hiện tượng mạng nhện Trễ + Nguyên nhân chủ quan: Xử lí số liệu Sai lệch lập mơ hình - Cách phát hiện: + Phương pháp đồ thị: + Kiểm định d.Durbin – Waston: (Dùng để kiểm định khuyết tật tự tương quan bậc 1) n ∑ ( et −e t−1 )2 d= t =2 n ∑ et n = ∑ ( et −e t−1 ) t =2 RSS t−1 Nếu n đủ lớn d ≈ 2(1− ^ρ) Trong đó: ρ^ ước lượng điểm ρ ; ^ρ ∈[−1; 1]→ d ∈ [ 0; ] Với n kích thước mẫu α = 5% k’ = k – 1: số biến độc lập có mơ hình tìm đc dL dU dựa vào bảng + Nếu < d < dL mơ hình có tự tương quan dương bậc + Nếu dL < d < dU – dU < d < - dL khơng có kết luận khuyết tật tự tương quan + Nếu dU < d < dL mơ hình khơng có tự tương quan bậc + Nếu – dL < d < 4: mơ hình có tự tương quan dương bậc + Kiểm định BG: Xét mơ hình: Yt = β1 + β2Xt + Ut (1) et = α0 + α1et – + α2et – +…+ αpee – p + Vt (*) Xét cặp giả thiết: H0: R*2 = H1: R*2 ≠ χ = (n – p)R*2 ~ χ2 (p) Tính χ2qs, χ2α (p) + Nếu χ2qs > χ2α (p) bác bỏ giả thiết H0 mơ hình (*) phù hợp hay mơ hình (1) có khuyết tật tự tương quan + Nếu χ2qs < χ2α (p) chưa có sở bác bỏ H0 mơ hình (*) khơng phù hợp hay mơ hình (1) khơng có khuyết tật tự tương quan + Hồi quy phụ để kiểm định: e = α1 + α2*MAINBOARD + αMAINBOARD + α3*MAINBOARD + αRAM + ρle(-1) + vle(-1) + v - Kết quả: Breusch-Godfrey Serial Correlation LM Test: F-statistic 9.554647 Probability Obs*R-squared 8.061940 Probability 0.004713 0.004520 Test Equation: Dependent Variable: RESID Method: Least Squares Date: 05/06/13 Time: 00:28 Presample missing value lagged residuals set to zero Variable Coefficient Std Error t-Statistic MAINBOARD 0.000666 0.001821 0.365736 RAM -0.001477 0.006907 -0.213764 C -584.7820 4615.442 -0.126701 RESID(-1) 0.529848 0.171413 3.091059 R-squared 0.268731 Mean dependent var Adjusted R-squared 0.184354 S.D dependent var S.E of regression 8067.897 Akaike info criterion Sum squared resid 1.69E+09 Schwarz criterion Log likelihood -310.2911 F-statistic Durbin-Watson stat 2.181303 Prob(F-statistic) Prob 0.7175 0.8324 0.9002 0.0047 2.43E-13 8933.251 20.95274 21.13957 3.184882 0.040433 Kết luận: dựa vào bảng kết quả, giá trị P-value (F-statistic) = 0.040433 < α = 0.05 Mơ hình hồi quy phụ phù hợp hay mơ hình ban đầu có khuyết tật tự tương quan 1.527E+07 1.526E+07 1.525E+07 1.524E+07 1.523E+07 1.522E+07 10 15 YMU Đồ thị ước lượng Ŷi 20 25 30 40000 30000 20000 10000 -10000 -20000 10 15 20 E Đồ thị ei obs E 7247.577 4301.613 7035.779 6254.723 3007.091 5523.804 31235.91 -949.7827 549.7040 YMU 15266852 15265998 15265164 15263095 15264443 15263826 15264714 15263650 15263100 25 30 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 -2143.422 -3737.575 -840.4510 -435.8673 2928.666 1599.421 -3540.929 -1886.383 -2736.063 -15335.02 -15779.92 -14214.74 -10404.58 -6298.865 -3785.265 -1420.968 -7864.058 592.9511 3467.092 10209.33 7420.236 Bảng kết ei Ŷi : 15263893 15263588 15261640 15258386 15255971 15254451 15254841 15251286 15250236 15260935 15260430 15257915 15252205 15249049 15244635 15240371 15244914 15238357 15232633 15226841 15226780