hồi qui nói trên nếu có ?
hậu quả của tương quan chuỗi bậc nhất với hàm ước lượng OLS :
- phương sai ước lượng được của các ước lượng bình phương bé nhất thông thường là không chệch.
- kiểm định t và F nói chung không đáng tin cậy.
- Kết quả là R2 được tính toán như đã biết có thể là đo lượng không đáng tin cậy cho R2 thực.
- cho các phương sai và các sai số chuẩn của dự toán đã tính được cũng có thể không hiệu quả.
Đề nghị giải pháp khắc phục tương quan chuỗi trong phép hồi qui nói trên:
Khi cấu trúc tự tương quan là đã biết vì các nhiễu của các Ut không quan sát được nên tính chất của tương quan chuổi thường là vấn đề suy đoán hoặc là do những đồi hỏi cấp bách của thực tiển.trong thực hành người ta thường sử dụng mô hình tự hồi quy bậc nhất
Khi cấu trúc tự tương quan là chưa biết thì ta sử dụng phương pháp sai phân cấp 1,ước lượng p dựa theo thống kê d_Durbin_Watson, thủ tục
Cochrane_Orcutt để ước lượng p, thủ tục Cochrane_Orcutt 2 bước để ước lượng p, phương pháp d_Durbin_Watson 2 bước để ước lương p và các
* khắc phục
Ước lượng p dựa trên thống kê Durbin – Watson
p^= 1 - d/2 = 1 - 1.374931/2 = 1 - 0.6874655 = 0.3125345
phương trình hồi qui SALES phụ thuộc vào INVENTORIES viết lại:
SALES = b`1 + b`2*INVENTORIES + et
với b`1 = b1*(1-p) = -911.691393*(1-0.3125345) = -626.7563793 b`2 = b2 = 0.6428449796
hay : SALES = -626.7563793 + 0.6428449796* INVENTORIES Bài Tập 10 :
Một quan sát thú vị về việc thuê bao truyền hình cáp , người ta đưa ra những dữ liệu sau đây :
AGE AIR HOME INST SUB SVC TV Y
11.42 11 255.631 15 90 7.5 15 106067.33 9 31 15 14 7 11 10455 7.33 9 31 15 14 7 11 10455 6.92 10 34.84 10 11.7 7 22 8958 26 12 153.434 25 46 10 20 11741 8.83 8 26.621 15 11.217 7.66 18 9378 13.08 8 18 15 12 7.5 12 10433 5.58 7 9.324 15 6.428 7 17 10167 12.42 8 32 10 20.1 5.6 10 9218 4.92 6 28 15 8.5 6.5 6 10519 4.08 6 8 17.5 1.6 7.5 8 10025 4.25 9 5 15 1.1 8.95 9 9714 10.67 7 15.204 10 4.355 7 7 9294 17.58 7 97.889 24.95 78.91 9.49 12 9784 8.08 7 93 20 19.6 7.5 9 8173 0.17 6 3 9.95 1 10 13 8967 13.25 5 2.6 25 1.65 7.55 6 10133 12.67 5 18.284 15.5 13.4 6.3 11 9361 5.25 6 55 15 18.708 7 16 9085 15 6 1.7 20 1.352 5.6 6 10067 17 5 270 15 170 8.75 15 8908 6.83 6 46.54 15 15.388 8.73 9 9632 5.67 6 20.417 5.95 6.555 5.95 10 8995 7 5 120 25 40 6.5 10 7787 11.25 7 46.39 15 19.9 7.5 9 8890 2.92 4 14.5 9.95 2.45 6.25 6 8041 2.17 5 9.5 20 3.762 6.5 6 8605 7.08 4 81.98 18 24.882 7.5 8 8639 12.17 4 39.7 20 21.187 6 9 8781 13.08 4 4.113 10 3.487 6.85 11 8551 0.17 6 8 10 3 7.95 9 9306 7.67 5 99.75 9.95 42.1 5.73 8 8346 10.33 4 33.379 15 20.35 7.5 8 8803 12.25 5 35.5 17.5 23.15 6.5 8 8942 2 4 34.775 15 9.866 8.25 11 8591 13.08 6 64.84 10 42.608 6 11 9163 1 6 30.556 20 10.371 7.5 8 7683 4 5 16.5 14.95 5.164 6.95 8 7924 4.67 4 70.515 9.95 31.15 7 10 8454 3 4 42.04 20 18.35 7 6 8429
Trong đó:
- SUB : số đăng ký thuê bao được yêu cầu lắp đặt cho mỗi hệ thống cáp truyền hình
- Home : số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua
- Inst : phí lắp đặt ( USD/Lần)
- SVC : Phí dịch vụ cho mỗi hệ thống (USD/tháng )
- TV : số kênh truyền hình mà mỗi hệ thống cáp cung cấp (kênh /hệ thống cáp )
- Age : thời gian hệ thống đã họat động ( năm )
- Air : số kêng truyền hình mà hệ thống nhận được từ hệ thống cáp
- Y : thu nhập bình quân đầu người (USD/ người )
1. Hãy phân tích quan hệ kỳ vọng của số đăng ký thuê bao (SUB) với các nhân tố ảnh hưởng có sẳn trong dữ liệu ?
Dependent Variable: SUB Method: Least Squares Date: 05/15/10 Time: 13:22 Sample: 1 40
Included observations: 40
Variable Coefficient Std. Error t-Statistic Prob.
C -6.807726 26.65981 -0.255355 0.8001 AGE 1.193511 0.502651 2.374434 0.0237 AIR -5.111142 1.518459 -3.366005 0.0020 HOME 0.405549 0.035003 11.58599 0.0000 INST -0.526420 0.476074 -1.105751 0.2771 SVC 2.038732 2.126968 0.958516 0.3450 TV 0.756508 0.687811 1.099877 0.2796 Y 0.001655 0.003469 0.477101 0.6365
R-squared 0.887748 Mean dependent var 24.50850
Adjusted R-squared 0.863193 S.D. dependent var 33.53720
S.E. of regression 12.40453 Akaike info criterion 8.050857
Sum squared resid 4923.914 Schwarz criterion 8.388633
Log likelihood -153.0171 F-statistic 36.15343
Durbin-Watson stat 2.182694 Prob(F-statistic) 0.000000
0.40554886*HOME - 0.5264195572*INST + 2.038732364*SVC + 0.7565077307*TV + 0.001655168974*Y 0.7565077307*TV + 0.001655168974*Y
Phân tích quan hệ kỳ vọng của số đăng ký thuê bao: trong điều kiện các yếu tố khác không thay đổi:
+ Age: khi thời gian hoạt động của hệ thống tăng thêm 1 năm thì trung bình sẽ tăng thêm 1.19 số thuê bao
+ Air: số kênh truyền hình mà hệ thống nhận được từ hệ thống cáp tăng thêm 1 kênh thì về trung bình sẽ giảm 5.1 thuê bao
+ Home : số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua tăng thêm 1 hộ thì về trung bình sẽ tăng thêm 0.4 thuê bao
+ Inst : phí lắp đặt ( USD/Lần) giảm 1 USD/Lần thì về trung bình sẽ tăng thêm 0.526 thuê bao
+ SVC: Phí dịch vụ cho mỗi hệ thống (USD/tháng ) tăng thêm 1 USD/tháng thì về trung bình sẽ tăng thêm 2.039 thuê bao
+ TV : số kênh truyền hình mà mỗi hệ thống cáp cung cấp (kênh /hệ thống cáp ) tăng thêm 1 kênh thì về trung bìnhsẽ tăng thêm 0.756 thuê bao
+ Y : thu nhập bình quân đầu người (USD/ người ) tăng thêm 1 USD/Người thì về trung bình sẽ tăng thêm được 0.00165 thuê bao.
2. Có ý kiến cho rằng mô hình ở câu 1 cần phải bổ sung thêm các biến độc lập là bình phương các biến độc lập . Anh chị cần có kiểm định nào để chấp nhận ý kiến nầy ?
+ ước lượng mô hình với các biến bổ sung
Dependent Variable: SUB Method: Least Squares Date: 05/15/10 Time: 13:31 Sample: 1 40
Included observations: 40
C -488.2440 264.2862 -1.847406 0.0766AGE -1.357140 1.462274 -0.928102 0.3622 AGE -1.357140 1.462274 -0.928102 0.3622 AGE2_MU 0.139275 0.073366 1.898355 0.0693 AIR 18.71175 5.239156 3.571519 0.0015 AIR2_MU -1.582278 0.373179 -4.239994 0.0003 HOME 0.439400 0.083881 5.238396 0.0000 HOME2_MU 0.000221 0.000284 0.777523 0.4441 INST 0.391969 2.124189 0.184526 0.8551 INST2_MU -0.021041 0.065512 -0.321175 0.7507 SVC 12.14427 19.19417 0.632706 0.5327 SVC2_MU -0.778979 1.285439 -0.606002 0.5500 TV -0.661471 2.654203 -0.249216 0.8052 TV2_MU 0.048444 0.101687 0.476402 0.6379 Y 0.084534 0.052575 1.607864 0.1204
Y2_MU -4.55E-06 2.83E-06 -1.603944 0.1213
R-squared 0.949466 Mean dependent var 24.50850
Adjusted R-squared 0.921167 S.D. dependent var 33.53720
S.E. of regression 9.416297 Akaike info criterion 7.602757
Sum squared resid 2216.666 Schwarz criterion 8.236087
Log likelihood -137.0551 F-statistic 33.55130
Durbin-Watson stat 2.246892 Prob(F-statistic) 0.000000
kiểm định WALD:
giả thiết: Ho: R2 = 0 H1: R2 # 0
Wald Test: Equation: Untitled
Test Statistic Value df Probability
F-statistic 4.336042 (7, 25) 0.0029
Chi-square 30.35229 7 0.0001
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(3) 0.139275 0.073366
C(7) 0.000221 0.000284
C(8) 0.391969 2.124189
C(11) -0.778979 1.285439
C(13) 0.048444 0.101687
C(15) -4.55E-06 2.83E-06
Restrictions are linear in coefficients.
Theo kết quả của bảng trên: F(7;25)= 3.5 < 4.336042; 0.0029<0.1 --- bác bỏ giả thiết Ho: R2=0. tức là mô hình có ý nghĩa thống kê, hay các biến đưa vào mô hình có biến ảnh hưởng đến biến phụ thuộc SUB. Vì vậy ta cần xem xét nên đưa biến nào vào và nên loại bỏ biến nào.
3. Thực hiện ước lượng theo yêu cầu của câu 2 . Nhận xét mô hình nầy và căn cứ vào đó tìm ra mô hình tốt nhất bằng cách lọai bỏ các biến độc lập ít có ý nghĩa.
Dependent Variable: SUB Method: Least Squares Date: 05/15/10 Time: 13:38 Sample: 1 40
Included observations: 40
Variable Coefficient Std. Error t-Statistic Prob.
C -488.2440 264.2862 -1.847406 0.0766 AGE -1.357140 1.462274 -0.928102 0.3622 AGE2_MU 0.139275 0.073366 1.898355 0.0693 AIR 18.71175 5.239156 3.571519 0.0015 AIR2_MU -1.582278 0.373179 -4.239994 0.0003 HOME 0.439400 0.083881 5.238396 0.0000 HOME2_MU 0.000221 0.000284 0.777523 0.4441 INST 0.391969 2.124189 0.184526 0.8551 INST2_MU -0.021041 0.065512 -0.321175 0.7507 SVC 12.14427 19.19417 0.632706 0.5327 SVC2_MU -0.778979 1.285439 -0.606002 0.5500 TV -0.661471 2.654203 -0.249216 0.8052 TV2_MU 0.048444 0.101687 0.476402 0.6379 Y 0.084534 0.052575 1.607864 0.1204
Y2_MU -4.55E-06 2.83E-06 -1.603944 0.1213
R-squared 0.949466 Mean dependent var 24.50850
Adjusted R-squared 0.921167 S.D. dependent var 33.53720
Sum squared resid 2216.666 Schwarz criterion 8.236087
Log likelihood -137.0551 F-statistic 33.55130
Durbin-Watson stat 2.246892 Prob(F-statistic) 0.000000
SUB = -488.2440184 - 1.357139585*AGE + 0.1392753913*AGE2_MU + 18.71174637*AIR - 1.582278197*AIR2_MU + 0.4394004589*HOME + 18.71174637*AIR - 1.582278197*AIR2_MU + 0.4394004589*HOME + 0.0002207113314*HOME2_MU + 0.3919688673*INST -
0.0210408497*INST2_MU + 12.14426735*SVC - 0.7789787661*SVC2_MU - 0.6614709744*TV + 0.7789787661*SVC2_MU - 0.6614709744*TV +
0.04844376526*TV2_MU + 0.0845340609*Y - 4.546508689e- 006*Y2_MU
nhận xét: ta thấy Prob của một số biến đưa vào mô hình lớn hơn mức ý nghĩa 10%, điều này chứng tỏ một số biến đưa vào mô hình không có tác động gì đến SUB
R2 = 0.949466 cao, trị thống kê thấp do xảy ra hiện tượng đa cộng tuyến. hay nói cách khác mô hình đưa ra bị sai lệch, không còn đúng với mô hình thực.
* ước lượng lại mô hình bằng cách loại bỏ những biến ít có ý nghĩa:
Dependent Variable: SUB Method: Least Squares Date: 05/27/10 Time: 10:50 Sample: 1 40
Included observations: 40
Variable Coefficient Std. Error t-Statistic Prob.
C -60.49268 16.26712 -3.718709 0.0007
AGE2_MU 0.054963 0.014206 3.868916 0.0005
AIR 19.00283 4.529471 4.195376 0.0002
AIR2_MU -1.551656 0.306301 -5.065791 0.0000
HOME 0.496449 0.028582 17.36914 0.0000
R-squared 0.924209 Mean dependent var 24.50850
Adjusted R-squared 0.915547 S.D. dependent var 33.53720
S.E. of regression 9.746190 Akaike info criterion 7.508098
Sum squared resid 3324.587 Schwarz criterion 7.719208
Durbin-Watson stat 2.585383 Prob(F-statistic) 0.000000
SUB = -60.49268428 + 0.05496300001*AGE2_MU + 19.00283309*AIR -1.551655918*AIR2_MU + 0.4964486269*HOME 1.551655918*AIR2_MU + 0.4964486269*HOME
4. Phương trình sau cùng mà anh chị lựa chọn như thế nào ? giải thích ý nghĩa ?
Phương trình sau cùng bao gồm các biến: HOME, AIR và bình phương của AIR, AGE.
+ Prob của một số biến đưa vào mô hình nhỏ hơn mức ý nghĩa 10%, điều này chứng tỏ các biến đưa vào mô hình đều có tác động gì đến SUB
+ R2=0.924209 cho thấy mô hình đưa ra có ý nghĩa thống kê cao, các biến đưa vào mô hình giải thích được 92.4% biến SUB.
+trong điều kiện các yếu tố khác không thay đổi:
+ Age: khi bình phương thời gian hoạt động của hệ thống tăng thêm 1 năm thì trung bình số đăng kí thuê bao sẽ tăng thêm 0.055 số thuê bao
+ Air: số kênh truyền hình mà hệ thống nhận được từ hệ thống cáp tăng thêm 1 kênh thì về trung bình số đăng kí thuê bao sẽ tăng thêm 19 thuê bao + khi bình phương số kênh truyền hình mà hệ thống nhận được từ hệ thống cáp tăng thêm 1 kênh thì về trung bình số đăng kí thuê bao sẽ giảm 1.55 thuê bao. Điều này cho thấy số lượng thuê bao đăng kí sẽ tăng them cùng với số kênh truyền hình nhưng đến một lúc nào đó người ta sẽ chú trọng hơn về chất lượng kênh truyền hình vì thế mà tốc độ tăng số đăng kí thuê bao sẽ giảm dần so với tốc độ tăng kênh truyền hình, đến lúc số kênh truyền hình tăng lên nhưng số đăng kí thuê bao không tăng nữa
+ Home : số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua tăng thêm 1 hộ thì về trung bình số đăng kí thuê bao sẽ tăng thêm 0.5 thuê bao