j S e t
5.3.3 Kiểm định sự khác biệt giữa hàm hồi quy của hai nhĩm
Nhiều khi ta muốn biết các hệ số hồi quy của hai nhĩm của một tổng thể cĩ đặc tính khác nhau (nam/nữ, thành thị/nơng thơn,…) cĩ bằng nhau hay khơng? Nếu các hệ số bằng nhau, ta nĩi các hệ số là ổn định. Để kiểm tra về tính ổn định này, cĩ thể sử dụng hai phương pháp: Kiểm định Chow và kiểm định sử dụng biến giả.
Kiểm định Chow
Giả sử muốn khảo sát hành vi chi tiêu Y theo thu nhập X của nam giới giữa hai thời kỳ trước khi lập gia đình và sau khi lập gia đình cĩ sự khác nhau hay khơng, ta lập luận như sau: Nếu việc chi tiêu giữa hai thời kỳ khơng cĩ sự khác biệt thì ta chỉ cần sử dụng một hàm hồi quy; cịn nếu cĩ sự khác biệt thì sử dụng hai hàm hồi quy cho thời kỳ trước khi lập gia đình (PRF1) và sau khi lập gia đình (PRF2) theo các bước dưới đây:
Y
Quan hệ giữa chi tiêu và thu nhập qua hai thời kỳ của nam giới
Bước 1: Hồi quy riêng từng thời kỳ với thời kỳ trước khi lập gia đình cĩ n1 quan sát và thời kỳ sau khi lập gia đình cĩ n2 quan sát.
+ Trước khi lập gia đình, hàm hồi quy dạng: 1 2 2
i i i
Y X U
Tính RSS1 với n k1 bậc tự do.
+ Sau khi lập gia đình, hàm hồi quy dạng: 1 2 2 i i i Y X V Tính RSS2 với n k2 bậc tự do. Khí đĩ RSSU RSS RSS1 2 cĩ n n k1 2 bậc tự do. 1 2 PRF PRF Y X 1 PRF 2 PRF X
62 Bước 2: Kết hợp các quan sát của cả hai thời kỳ ta được n n n 1 2 và ước lượng
mơ hình sau:
1 2 2
i i i
Y X R
Tính RSSR của mơ hình này cĩ n k bậc tự do. Bước 3:
+ Xét cặp giả thuyết 0
H : Hồi quy của hai thời kỳ là như nhau 1
H : Hồi quy của hai thời kỳ là khác nhau + Tính giá trị quan sát của phân phối F
/ /( 2 ) R U C U RSS RSS k F RSS n k
+ Với mức ý nghĩa cho trước, nếu FC f k n( , 2 )k thì bác bỏ giả thuyết H0, cịn ngược lại chưa cĩ cơ sở bác bỏ H0.
Chú ý: Cĩ thể mở rộng kiểm định Chow cho nhiều thời kỳ.
Ví dụ 5.3.3.1: Cĩ số liệu của Mexico giai đoạn 1955-1974, trong đĩ sản lượng Y đo bằng GDP thực (đơn vị tính Pesos của năm 1960), X được đo bằng tổng lao động (ngàn người), X được đo bằng vốn cố định (triệu Pesos của năm 1960).
Năm GDP Lượng lao động Vốn cố định
1955 114043 8310 182113 1956 120410 8529 193749 1957 129187 8738 205192 1958 134705 8952 215130 1959 139960 9171 225021 1960 150511 9569 237026 1961 157897 9527 248897 1962 165286 9662 260661 1963 178491 10334 275466 1964 199457 10981 295378 1965 212323 11746 315715 1966 226977 11521 337642 1967 241194 11540 363599 1968 260881 12066 391847 1969 277498 12297 422382 1970 296530 12955 455049
63
1971 306712 13338 484677
1972 329030 13738 520553
1973 354057 15924 561531
1974 374977 14154 609825
Thực hiện thủ tục kiểm định Chow cho hai giai đoạn 1955-1964 và 1965-1974, được kết quả như sau:
+ Giai đoạn 1955-1964:
Dependent Variable: LOG(GDP) Method: Least Squares
Date: Time: Sample: 1955 1964 Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob. LOG(LUONGLAODONG) 0.711856 0.189157 3.763313 0.0070 LOG(VONCODINH) 0.742188 0.104530 7.100261 0.0002 C -3.777963 0.528148 -7.153231 0.0002 R-squared 0.997701 Mean dependent var 11.89745 Adjusted R-squared 0.997044 S.D. dependent var 0.176759 S.E. of regression 0.009610 Akaike info criterion -6.208638 Sum squared resid 0.000647 Schwarz criterion -6.117862 Log likelihood 34.04319 Hannan-Quinn criter. -6.308218 F-statistic 1518.806 Durbin-Watson stat 1.719946 Prob(F-statistic) 0.000000
Giai đoạn 1965-1974:
Dependent Variable: LOG(GDP) Method: Least Squares
Date: Time: Sample: 1965 1974 Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob. LOG(LUONGLAODONG) 0.013197 0.067314 0.196047 0.8501 LOG(VONCODINH) 0.856308 0.032029 26.73541 0.0000 C 1.308925 0.316382 4.137168 0.0044 R-squared 0.998224 Mean dependent var 12.55465 Adjusted R-squared 0.997716 S.D. dependent var 0.189885 S.E. of regression 0.009075 Akaike info criterion -6.323336 Sum squared resid 0.000576 Schwarz criterion -6.232561 Log likelihood 34.61668 Hannan-Quinn criter. -6.422917 F-statistic 1966.811 Durbin-Watson stat 1.698737 Prob(F-statistic) 0.000000
64 + Cả thời kỳ 1955-1974:
Dependent Variable: LOG(GDP) Method: Least Squares
Date: 10/28/17 Time: 16:59 Sample: 1955 1974
Included observations: 20
Variable Coefficient Std. Error t-Statistic Prob. LOG(LUONGLAODONG) 0.339732 0.185692 1.829548 0.0849 LOG(VONCODINH) 0.845997 0.093352 9.062488 0.0000 C -1.652419 0.606198 -2.725873 0.0144 R-squared 0.995080 Mean dependent var 12.22605 Adjusted R-squared 0.994501 S.D. dependent var 0.381497 S.E. of regression 0.028289 Akaike info criterion -4.155221 Sum squared resid 0.013604 Schwarz criterion -4.005861 Log likelihood 44.55221 Hannan-Quinn criter. -4.126064 F-statistic 1719.231 Durbin-Watson stat 0.425667 Prob(F-statistic) 0.000000
Xét cặp giả thuyết 0
H : Hồi quy của hai thời kỳ là như nhau 1
H : Hồi quy của hai thời kỳ là khác nhau Ta cĩ: 1 2 0.000647 0.000576 0.001223 U RSS RSS RSS , RSSR 0.013604 / 0.013604 - 0.001223 / 3 47.24284546 /( 2 ) 0.001223/ 20 2 3 R U C U RSS RSS k F RSS n k
Với mức ý nghĩa 5%, f k n( , 2 )k f0.05(3,14) 3.344 FC. Bác bỏ giả thuyết H0, cĩ nghĩa là sản lượng GDP thực ở hai thời kỳ là khác nhau.
Kiểm định sử dụng biến giả
65 1
0
nếu quan sát là sau khi lập gia đình nếu quan sát là trước khi lập gia đình
i
D Mơ hình hồi quy:
i i i i i i
Y X D D X U
Trong đĩ biểu thị sự chênh lệch về tung độ gốc, biểu thị sự chênh lệch về độ dốc . Việc kiểm định giả thuyết H0: 0 chính là kiểm định giả thuyết khơng cĩ sự khác nhau về mặt cấu trúc hồi quy giữa hai thời kỳ.
Ví dụ 5.3.3.2: Cĩ bảng số liệu về thu nhập X và tiết kiệm Y của Mỹ giai đoạn 1970-1995
như sau:
Quan sát Tiết kiệm Thu nhập Quan sát Tiết kiệm Thu nhập
1970 61.0 727.1 1983 167.0 2522.4 1971 68.6 790.2 1984 235.7 2810.0 1972 63.6 855.3 1985 206.2 3002.0 1973 89.6 965.0 1986 196.5 3187.6 1974 97.6 1054.2 1987 168.4 3363.1 1975 104.4 1159.2 1988 189.1 3640.8 1976 96.4 1273.0 1989 187.8 3894.5 1977 92.5 1401.4 1990 208.7 4166.8 1978 112.6 1580.1 1991 246.4 4343.7 1979 130.1 1769.5 1992 272.6 4613.7 1980 161.8 1973.3 1993 214.4 4790.2 1981 199.1 2200.2 1994 189.4 5021.7 1982 205.5 2347.3 1995 249.3 5320.8
+ Vào năm 1982, Mỹ rơi vào khủng hoảng kinh tế, do đĩ để kiểm định về cấu trúc trong mối quan hệ giữa tiết kiệm và thu nhập, ta cĩ thể đưa vào biến giả với mốc thời gian là năm 1982. 1 0 i D
nếu quan sát từ năm 1982 trở về sau nếu quan sát là trước năm 1982
Mơ hình hồi quy với biến giả dạng:
i i i i i i
66 Cặp giả thuyết thống kê:
0
H : Hồi quy của hai thời kỳ là như nhau 1
H : Hồi quy của hai thời kỳ là khác nhau Kết quả hồi quy bằng Eviews:
Dependent Variable: CHITIEU Method: Least Squares Date: Time: Sample: 1970 1995 Included observations: 26
Variable Coefficient Std. Error t-Statistic Prob. BIENGIA 152.4786 33.08237 4.609058 0.0001 BIENGIA*THUNHAP -0.065469 0.015982 -4.096340 0.0005 THUNHAP 0.080332 0.014497 5.541347 0.0000
C 1.016117 20.16483 0.050391 0.9603
R-squared 0.881944 Mean dependent var 162.0885 Adjusted R-squared 0.865846 S.D. dependent var 63.20446 S.E. of regression 23.14996 Akaike info criterion 9.262501 Sum squared resid 11790.25 Schwarz criterion 9.456055 Log likelihood -116.4125 Hannan-Quinn criter. 9.318238 F-statistic 54.78413 Durbin-Watson stat 1.648454 Prob(F-statistic) 0.000000
Từ kết quả hồi quy, ta nhận thấy các hệ số hồi quy và đều khác 0 và cĩ ý nghĩa thống kê. Do vậy cĩ sự khác biệt về cấu trúc của mơ hình giữa hai giai đoạn.
+ Ngồi ra, ta cĩ thể kiểm định Chow với mốc 1982 (Mỹ khủng hoảng kinh tế) bằng Eviews như sau:
Chow Breakpoint Test: 1982
Null Hypothesis: No breaks at specified breakpoints Varying regressors: All equation variables
Equation Sample: 1970 1995
F-statistic 10.69006 Prob. F(2,22) 0.0006
Log likelihood ratio 17.65293 Prob. Chi-Square(2) 0.0001 Wald Statistic 21.38012 Prob. Chi-Square(2) 0.0000
Kết quả kiểm định cho thấy giá trị xác suất Prob. F(2,22)=0.006 < 0.05, bác bỏ H0, cĩ nghĩa là cuộc khủng hoảng kinh tế 1982 cĩ ảnh hưởng đến cấu trúc của hàm hồi quy.
67