X- y A z+ 9 t=
p_prim 2x-3 x<2 2 <
2.1.3.1. Các giả thuyết cơ bản của phương pháp OLS
Giả thuyết /: Các biến giải thích là phi ngẫu nhiên.
Trên thực tế thì các biến giải thích cũng cĩ thể xem là ngẫu nhiên và lý
thuyết kinh tế lượng cũng đã được xây dựng trên quan điểm chúng là các biến
ngẫu nhiên, nhưng trong chương trình kinh tế lượng căn bản và nếu trong m ơ hình khơng cĩ trễ phân phối (tức là mơ hình chứa giá trị trễ của biến phụ thuộc như một biến giải thích) thì điều kiện này được xem như luơn đúng. Tuy nhiên, khi xét các m ơ hình chuỗi thời gian, đặc biệt là mơ hình dùng để dự báo thì giả
thiết này cện phải được kiểm tra chặt chẽ nhu m ơ hình dự báo ARIMA ữong
mục 2.3.
Giả thuyết 2: Kỳ vọng của nhiễu ngẫu nhiên bằng khơng (E(U)=0).
Tức là ảnh hường trung bình của các yếu tố ngồi m ơ hình đến biến phụ thuộc là khơng đáng kể.
Giả thuyết này cần thiết cho sự thống nhất giữa định nghĩa hàm hồi quy tuyến tính tổng thể (PRF) và m ơ hình hồi quy tuyến tính tổng thể (PRM). Giả sử ta đang xét mơ hình hồi quy tuyến tính hai biến E(Y / X) = ệ[ + P2X (PRF), và PRM là Y = p, + P2X + u. Lấy kỳ vọng hai vế của PRM, nếu E(U) * 0 thì PRF và PRM khơng thống nhất.
Giả thuyết 3: Phương sai của sai sổ ngẫu nhiêu u khơng đổi: var(Uị) = ơ2 Vi = l,n.
Cĩ nghĩa là sự biến động của các yếu tố ngồi m ơ hình đều đợn.
Nếu điều kiện này bị vi phạm thì mơ hình được gọi là mắc phải hiện tượng phương sai sai số thay đổi; khi đĩ các ước lượng tham số khơng cịn hiệu quả nữa."
Giả thuyết 4: Các nhiễu ngẫu nhiên khơng tương quan: cov(Ui, u ) = 0 Vi * j. Tức là sai số của quan sát này khơng ảnh hưởng đến sai số của quan sát khác.
Nếu giả thuyết này bị vi phạm thì mơ hình được gọi là mắc phải hiện tượng tự tương quan; hậu quả, cách phát hiện và khắc phục được trình bày trong chương "Tự tương quan".
Già thuyết 5: M ơ hình được chỉ định là đúng.
Giả thuyết này bị vi phạm sẽ gây ra các sai lầm chỉ định như: bỏ sĩt biển thích hợp, đưa vào những biến khơng thích họp, dạng hàm khơng đúng và hậu quả của nĩ được chỉ ra trong chương "Chọn m ị hình và kiểm định việc chi định mơ hình".
Giả thuyết ố: Nếu m ơ hình cĩ hơn một biến giải thích (mơ hình hồi quy bội) thì cần thêm giả thuyết ma trận X khơng suy biến, hay nĩi cách khác các biến giải thích khơng cĩ quan hệ cộng tuyến hồn hảo với nhau
Nêu điều kiện này bị vi phạm sẽ khơng ước lượng được các tham sổ bằng phương pháp OLS. Tuy nhiên, điều kiện này trên thực tế rất hiếm khi xảy ra m à thơng thường sẽ xảy ra hiện tượng đa cộng tuyến khơng hồn hảo. Tuy đa cộng tuyến khơng hồn hảo khơng ảnh hưởng đến việc ước lượng m ơ hình và các ước lượng thu được vẫn đảm bảo các tính chất phát biểu trong định lý Gauss- Markov, nhung nĩ sẽ làm cho các suy diễn thống kê khơng cịn chính xác, và thậm chí trong trường họp cĩ đa cộng tuyến cao sẽ làm cho các ước lượng bị sai dấu, vì vậy tiến hành kiểm tra đa cộng tuyến là hết sức cần thiết.
Già thuyết 7: Nhiễu ngẫu nhiên cĩ phân bố chuẩn, kết họp với các điều kiện 2 và 3 thì tức là Ui ~ N(0, ơ2
). Chỉ cần các giả thuyết từ Ì đến 6 thì các ước lượng
OLS là các ước lượng tuyến tính, khơng chệch và tốt nhất trong lớp các ước lượng tuyến tính, khơng chệch của chúng nhưng nhờ điều kiện này, ta giải quyết được các bài tốn về kiểm định giả thuyết, ước lượng khoảng tin cậy và dự báo. 2.1.3.2. Phương pháp kiểm định một số giả thiết cơ bản
Phương pháp bình phương tối thiểu thu được kết quả các ước lượng rất 'đẹp', tuy nhiên cũng cần lưu ý rằng phương pháp này dựa trên một số các giả thuyết cơ bản, nếu các điều kiện này khơng đúng thì sẽ làm mất đi các tính chất đã phát biểu và khi đĩ mơ hình được gẩi là 'cĩ khuyết tật'.
Khi làm việc với mơ hình, chúng ta thường phải kiểm định một số giả thiết cơ bản sau:
Ì. Kiểm tra sự phù hợp về dấu của các ước lượng và kiểm định sự phù hợp của mơ hình.
2. Kiểm tra hiện tượng đa cộng tuyến.
3. Kiểm định hiện tượng phương sai sai sổ thay đổi. 4. Kiểm định hiện tượng tự tương quan.
5. Kiểm định nhiễu u cĩ phân phổi chuẩn.
6. Kiểm định lựa chẩn mơ hình: kiểm định thêm biến, bỏ biến, kiểm định dạng hàm.
Nêu mơ hình đang xét là mơ hình chuỗi thời gian, thì kiểm định đầu tiên cần phải xét là các biến cĩ phải là phi ngẫu nhiên khơng, tức là các biến cĩ dừng khơng. Kiểm định này được giới thiệu cụ thể ở phần 2.3.
• Hướng dẫn thực hiện các kiểm định qua ví dụ:
Cho bảng số liệu về cầu thịt gà ở Mỹ trong thời gian từ 1960 đến 1982 như sau: Bảng2.1. Cầu thịt gà ở M ỹ trong thời gian từ 1960 đến 1982
Y X2 X3 X4 X5 Xĩ 27.80000 397.5000 42.20000 50.70000 78.30000 65.80000 29.90000 413.3000 38.10000 52.00000 79.20000 66.90000 29.80000 439.2000 40.30000 54.00000 79.20000 67.80000 30.80000 459.7000 39.50000 • 55.30000 79.20000 69.60000 31.20000 492.9000 37.30000 54.70000 77.40000 68.70000 33.30000 528.6000 38.10000 63.70000 8020000 73.60000 35.60000 560.3000 39.30000 69.80000 80.40000 76.30000 36.40000 624.6000 37.80000 65.90000 83.90000 77.20000 36.70000 666.4000 38.40000 64.50000 85.50000 78.10000 38.40000 717.8000 40.10000 70.00000 93.70000 84.70000 51
40.40000 768.2000 38. .60000 73.20000 106 .1000 93.30000 40.30000 843.3000 39. .80000 67.80000 104 .8000 89.70000 40.30000 843.3000 39. .80000 67.80000 104 .8000 89.70000 41.80000 911.6000 39 .70000 79.10000 114 .0000 100.7000 40.40000 931.1000 52. .10000 95.40000 124 .1000 113.5000 40.70000 1021.500 48. .90000 94.20000 127. .6000 115.3000 40.10000 1165.900 58. .30000 123.5000 142. .9000 136.7000 42.70000 1349.600 57. .90000 129.9000 143. .6000 139.2000 44.10000 1449.400 56 .50000 117.6000 139 .2000 132.0000 46.70000 1575.500 63 .70000 130.9000 165 .5000 132.1000 50.60000 1759.100 61 .60000 129.8000 203 .3000 154.4000 50.10000 1994.200 58 .90000 128.0000 219 .6000 174.9000 51.70000 2258.100 66 .40000 141.0000 221 .6000 180.8000 52.90000 2478.700 70 .40000 168.2000 232 .6000 189.4000
Nguồn: Sổ liệu được lấy từ báo cáo bộ nơng nghiệp Mỹ.
Trong đĩ Y: lượng tiêu thụ thịt gà/người (đơn vị: pao); X2: thu nhập khả dụng/ người (đv: đơla); X3: giá bán lẻ thịt gà; X4: giá bán lẻ thịt lợn;
X5: giá bán lẻ thịt bị;
Xĩ: giá bán lẻ trung bình cĩ trọng số giữa thịt lợn và thịt bị (trọng số
được tính theo tỷ lệ tiêu thụ của thịt lợn và thịt bị trên tổng số thịt lợn và thịt bị tiêu thụ).
Các đơn giá từ X 2 đến X ĩ đều cĩ đơn vị là cent/ pao và đều là giá thực tế. Theo luật cởu thì cởu về một mặt hàng sẽ phụ thuộc vào thu nhập khả dụng, giá của mặt hàng đĩ hoặc giá các mặt hàng thay thế hay bổ sung, trong đĩ b i ế n giá mặt hàng và thu nhập được xem là quan trọng hơn. Trên cơ sở đĩ, ta thu thập các số liệu như bảng trên. M ơ hình cởu hàng hĩa được đề xuất bởi các nhà kinh
tế tốn là m ơ hình tuyến tính hoặc loga tuyến tính. T a t i ế n hành theo hướng hồi quy m ơ hình v ớ i tập tất cả các biến độc lập được cho là cĩ ảnh hưởng đáng kể t ớ i
biến phụ thuộc. Giả sử ta ước lượng m ơ hình loga t u y ế n tính v ớ i tập các b i ế n giải thích từ X 2 đến X5, các kết luận rút ra với độ t i n cậy 9 5 % . Các kết quả sau đây thu được với sự trợ giúp của phởn m ề m E v i e w s 4.0 ( v ớ i kí hiệu L N Z là logarit của biến Z ) .
Băng 2.2. Kết quả ước lượng mơ hình Dependent Variable: LNY
Sample: 1960 1982 Included observations: 23
Variable Coefĩicient Std. Error t-Statistic Prob. LNX2 0.342555 0.083266 4.113970 0.0007 LNX3 -0.504592 0.110894 -4.550212 0.0002 LNX4 0.148545 0.099673 1.490334 0.1535 LNX5 0.091105 0.100716 0.904568 0.3776
c 2.189792 0.155715 14.06283 0.0000
R-squared 0.982313 Mean dependent var 3.663887 Adjusted R-squared 0.978383 S.D. dependent var 0.187659 S.E. of regression 0.027591 Akaike info criterion -4.152987 Sum squared resiđ 0.013703 Schwarz criterion -3.906140 Log likelihood 52.75935 F-statistic 249.9282 Durbin-Watson stat 1.826069 Prob(F-statistic) 0.000000
Két quà ước lượng được từ phân mèm Eviews 4.0
Kết quả ước lượng cho thấy dấu của các hệ số hồi quy đều phù hợp với lý thuyết và thịt bị và thịt lợn là 2 mặt hàng thay thế cho thịt gà. Cũng kết luận được m ơ hình là phù hợp vì thống kê F khá lớn (giá trị prob=0). Tuy nhiên, cĩ thể nhận thấy R2 khá cao trong khi giá trị prob ứng với ước lượng hệ sổ của LNX4 và LNX5 tương ứng là 0.1535 và 0.3776 đều lớn hơn mức 5%, nên giá trị ước
lượng các tham số trên khơng cĩ ý nghĩa thống kê mức 5%, hơn nữa vì loga các mức giá thịt gà, thịt lợn thịt bị đều xuất hiện trong m ơ hình nên rất cĩ khả năng mơ hình cĩ đa cộng tuyến. Xét ma trận tương quan giữa các biến này.
Bảng 2.3. M a trận tương quan
LNX3 LNX4 LNX5
LNX3 1.000000 0.946751 0.933064 LNX4 0.946751 1.000000 0.954277 LNX5 0.933064 0.954277 1.000000
Kết quà thu được từ phần mềm Eviews 4.0
Hệ số tương quan giữa các biến khá cao (đều lịn hơn 0.9). Ta cĩ thể tiến hành hồi quy ph, hồi quy LNX3 theo LNX4 thu được kết quả như sau:
Bảng 2.4. Kết quả hồi quy phụ
Dependent Variable: LNX3 Method: Least Squares Date: 07/25/08 Time: 20:22 Sample: 1960 1982
Includeđ observations: 23
Variable Coefficient Std. Error t-Statistic Prob. LNX4 0.552804 0.041024 13.47517 0.0000
c 1.395677 0.182542 7.645788 0.0000
R-squared 0.896337 Mean dependent var 3.846870 Adjusted R-squared 0.891401 S.D. dependent var 0.221815 S.E. of regression 0.073098 Akaike info criterion -2.311098 Sum squared resid 0.112209 Schwarz criterion -2.212359 Log likelihood 28.57762 F-statistic 181.5802 Durbin-Watson stat 0.773099 Prob(F-statistic) 0.000000
Kết quà ước lượng được từ phần mềm Eviews 4.0
K ế t quả trên cho thấy m ơ hình phù hợp, vì vậy m ơ hình hồi quy ờ bảng 2 cĩ đa
cộng tuyến. C ĩ thể khắc phục đa cộng tuyến bằng cách giảm bớt số b i ế n t r o n g
m ơ hình, ta thu thập số liệu về giá trang bình cĩ trọng số của tht lợn và tht bị
(biến Xĩ), và hồi quy m ơ hình:
Bảng 2.5. Kết quả hồi quỵ m ơ hình
Dependent Variable: LNY Method: Least Squares Date: 07/25/08 Time: 20:30 Sample: 1960 1982
Included observations: 23
Variable Coefficient Stđ. Error t-Statistic Prob. LNX2 0.481286 0.068188 7.058251 0.0000 LNX3 -0.350628 0.079394 -4.416310 0.0003 LNX6 -0.061035 0.129960 -0.469645 0.6440
c 2.029865 0.118682 17.10338 0.0000
R-squared 0.980303 Mean dependent var 3.663887 Adjusted R-squared 0.977193 S.D. dependent var 0.187659 S.E. of regression 0.028340 Akaike info criterion -4.132296 Sum squared resid 0.015260 Schwarz criterion -3.934819 Log likelihood 51.52141 F-statistic 315.2063 Durbin-Watson stat 1.910653 Prob(F-statistic) 0.000000
Kết quả ước lượng được từ phần mềm Eviews 4.0
Tuy nhiên dấu của LNX6 lại khơng phù họp với kỳ vọng nên phương án khác
phục này khơng hiệu quả. Ta cĩ thể bỏ bớt biến LNX5 hoặc LNX4 hoặc cả 2 biến này. Giả sử ta bỏ cả 2 biến LNX4 và LNX5 ra khỏi m ơ hình, rồi xét kiểm
định thu hẹp hàm hồi quy với 2 biển trong diện bị nghi ngợ bỏ đi là LNX4 và LNX5, hồi quy mơ hình sau:
Bảng 2.6. Kết quả hồi quỵ m ơ hình
Dependent Variable: LNY Method: Least Squares Date: 07/25/08 Time: 20:51 Sample: 1960 1982 Incluđed observations: 23
Variable Coefficient Stđ. Error t-Statistic Prob. LNX2 0.451528 0.024695 18.28435 0.0000 LNX3 -0.372212 0.063466 -5.864740 0.0000
c 2.032820 0.116183 17.49673 0.0000
R-squared 0.980074 Mean đependent var 3.663887 Adjusted R-squared 0.978082 S.D. dependent var 0.187659 S.E. of regression 0.027783 Akaike info criterion -4.207711 Sum squared resid 0.015437 Schwarz criterion -4.059603 Log likelihood 51.38868 F-statistic 491.8681 Durbin-Watson stat 1.875601 Prob(F-statistic) 0.000 000
Két quả ước lượng được từ phân mém Eviews 4.0
Thống kê F ứng với kiểm định thu hẹp tính được là:
r (0.980303 - 0.980074)/2 (Ì-0.980303)/19
Giá trị của Fq s rất nhỏ vì vậy chắc chắn chấp nhận giả thuyết hệ số đi với biến LNX4 và LNX5 bằng khơng, nên cĩ thể bỏ 2 biến này ra khỏi m ơ hình, (nếu tiến hành bằng cách bỏ lần lượt LNX4 và LNX5 ta cũng thu được kết luận tương tự) bây giợ ta sẽ tiến hành các kiểm định khuyết tật và lựa chọn m ơ hình đối với m ơ hình ở bảng 6. Rõ ràng, các ước lượng phù họp về dấu, m ơ hình phù hợp và khơng cĩ dấu hiệu của đa cộng tuyến.
Kiểm định hiện tượng phương sai sai số thay đổi bằng kiểm định White cĩ thành phần chéo thu được kết quà:
Bảng 2.7. K ế t quả kiểm định White White Heteroskedasticity Test:
F-statistic 0.712368 Probability 0.622540 Obs*R-squared 3.984192 Probability 0.551694 Test Equation:
Dependent Variable: RESIDA2 Method: Least Squares Date: 07/25/08 Time:21 :16 Sample: 1960 1982 Included observations: 23
Variable Coefficient Std. Eưor t-Statistic Prob.
c -0.137588 0.132843 -1.035715 0.3148 LNX2 -0.019003 0.025520 -0.744630 0.4667 LNX2 -0.019003 0.025520 -0.744630 0.4667 LNX2A2 -0.004129 0.002949 -1.399967 0.1795 LNX2*LNX3 0.019406 0.015220 1.275075 0.2194 LNX3 0.104310 0.102456 1.018093 0.3229 LNX3A 2 -0.030405 0.024535 -1.239230 0.2321 R-squared 0.173226 Mean dependent var 0.000671 Adjusted R-squaređ -0.069943 S.D. dependent var 0.000875 S.E. of regression 0.000905 Akaike info criterion -10.95864 Sum squared resid 1.39E-05 Schwarz criterion -10.66242 Log likelihood 132.0243 F-statistic 0.712368 Durbin-Watson stat 2.325913 Prob(F-statistic) 0.622540
Két quà ước lượng được từ phân mèm Eviews 4.0
Thống kê F và thống kê X2 đều cho thấy m ơ hình trên khơng phù họp, chứng tỏ khơng cĩ hiện tượng phương sai sai số thay đổi trong m ơ hình ở bảng 6. (Bạn cĩ thể kiểm tra bằng một số kiểm định khác đã được học trong chương trình).
Tiếp theo ta kiểm tra hiện tượng tự tương quan trong m ơ hình bằng kiểm
định Durbin-Watson. Dựa vào kết quả hới quy thống kê d=l .875601, giá trị của du và di tương ứng tra bảng được là 1.543 và 1.168, như vậy
1.543 = d < d < 4 - d =2.457nên mơ hình khơng cĩ tự tương quan theo kiểm đinh Durbin-Watson với mức ý nghĩa 5%. Durbin-Watson với mức ý nghĩa 5%.
Nếu kiểm định tự tương quan bằng kiểm định BG, ta cĩ:
Bảng 2.8. Kết quả kiểm định BG
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 2.197648 Probability 0.139972
Obs*R-squared 4.513975 Probability 0.104665 Test Equation:
Dependent Variable: RESID
Methođ: Least Squares Date: 07/25/08 Time: 2 :28
Presample missing value lagged residuals sét to zero.
Variable Coefficient Std. Error t-Statistic Prob.
LNX2 0.012091 0.025874 0.467310 0.6459
LNX3 -0.027883 0.066455 -0.419573 0.6798
c 0.025676 0.115211 0.222864 0.8262 RESID(-l) 0.030333 0.228400 0.132808 0.8958 RESID(-l) 0.030333 0.228400 0.132808 0.8958 RESID(-2) -0.460720 0.221363 -2.081286 0.0520
R-squared 0.196260 Mean dependent var 6.48E-16
Adjusted R-squared 0.017651 S.D. dependent var 0.026490 S.E. of regression 0.026255 Akaike info criterion -4.252277 Sum squared resid 0.012408 Schwarz criterion -4.005431
Log likelihood 53.90119 F-statistic 1.098824
Durbin-Watson stat 2.040070 Prob(F-statistic) 0.387210
Kết quả ước lượng được từ phân mèm Eviews 4.0
Trong đĩ RESID là phần dư thu được từ mơ hình hồi quy ở bảng 6, RESID(-t) là giá trị trễ t thời kỳ của phần du. Dựa vào kết quả thống kê F và x2
cũng cĩ kết luận mơ hình hồi quy ở bảng 6 khơng cĩ tự tương quan vi mức ý nghĩa 5%.
Kiểm định dạng hàm hồi quy bằng kiểm định Ramsey: Bảng 2.9. Kết quả kiểm định Ramsey Ramsey RESET Test:
F-statistic 0.853106 Probability 0.484086 Log likelihood ratio 3.225483 Probability 0.358149 Test Equation:
Dependent Variable: LNY Method: Least Squares Date: 07/25/08 Time: 21:36 Sample: 1960 1982 Included observations: 23
Variable Coefficient Std. Eưor t-Statistic Prob. LNX2 15.28108 602.3526 0.025369 0.9801 LNX3 -12.54556 496.5485 -0.025266 0.9801 c 29.29882 1495.961 0.019585 0.9846 FITTEDA 2 -9.576232 548.2262 -0.017468 0.9863 FITTEDA3 1.091353 100.0286 0.010910 0.9914 FITTEDA4 -0.034110 6.837039 -0.004989 0.9961 R-squared 0.982682 Mean dependent var 3.663887 Adjusted R-squared 0.977588 S.D. dependent var 0.187659 S.E. of regression 0.028094 Akaike info criterion -4.087080 Sum squared resid 0.013417 Schwarz criterion -3.790864 Log likelihood 53.00142 F-statistic 192.9239 Durbin-Watson stat 1.708167 Prob(F-statistic) 0.000000
Nguồn: Kết quả ước lượng được từ phần mềm Eviews 4.0
Trong bảng báo cáo trên, FITTED chính là các giá trị ước lượng của biến phụ thuộc từ mơ hình ở bảng 6 (Ỳ) và FITTEDA
t là giá trị Ỳ với lũy thừa t. Kết quả trên cho thấy mơ hình ờ bảng 6 khơng mắc sai lm dạng hàm.
K i ể m định phân phối chuẩn hĩa của nhiễu ngẫu nhiên.
Bảng 2.Ỉ0. Kết quả kiểm định Jarque-Bera
Series: Residuals Sample 1960 1982 Observations 23 Mean 6.48E-16 Median -0.007377 Maximum 0.050824 Minimum -0.044980 std. Dev. 0.026490