Kinh tÕ l−îng n©ng cao BÀI 1 HỒI QUY VỚI BIẾN GIẢ 1. ĐẶT VẤN ĐỀ Trong nhiều tình huống, cùng với các biến định lượng còn có những biến định tính . Ví dụ khi nghiên cứu tiêu dùng của hộ dân cư, các biến thu nhập, giá cả, số nhân khẩu, có thể định lượng được, nhưng giới tính của chủ hộ, cấu trúc thế hệ của hộ, tôn giáo - tín ngưỡng, một chính sách của chính phủ là các biến không định lượng được. Trong nhiều trường hợp, chính mức giá trị của các biến định lượng cũng làm thay đổi quan hệ của chúng một cách cơ bản. Có thể dễ dàng nhận ra rằng, khi tiền lương tăng đến một mức nào đó thì lượng cung lao động không còn tăng mà có thể giảm, điều này đã được mô tả trong nhiều nghiên cứu về thị trường lao động. Cũng như vậy, thu nhập ở những mức khác nhau có thể tương ứng với những tỷ lệ tiết kiệm khác nhau. Nói tóm lại, trong hầu hết các quan hệ định lượng có sự can thiệp của các biến không định lượng mà ở đây ta gọi là các biến định tính. Cần có một kỹ thuật đưa các biến như vậy vào trong các mô hình, không chỉ với tư cách các biến giải thích mà còn với tư cách là các biến phụ thuộc. 2. KỸ THUẬT BIẾN GIẢ 2.1. Hồi quy với biến giải thích là biến định tính (mô hình ANOVA) a. Biến định tính có hai phạm trù. Lúc đó dùng một biến giả để thay thế cho nó. VD: Thu nhập có phụ thuộc giới tính ? Y i : thu nhập D i = ⎩ ⎨ ⎧ 0 1 Nếu quan sát là Nam Nếu quan sát là Nữ Mô hình : Y i = β 1 + β 2 D i + u i Thu nhập trung bình của nam E(Y/D i = 1) = β 1 + β 2 Thu nhập trung bình của nữ E(Y/D i = 0) = β 1 Nếu β 2 ≠ 0 thì TN trung bình có phụ thuộc giới tính Biến D dùng như trên gọi là biến giả (Dummy variable). Bμi 1: håi quy víi biÕn gi¶ Ví dụ: Bảng sau cho 10 quan sát về lương giáo viên phổ thông ở mức khởi điểm. ST T Lương (Y: nghìn $) GiớiD 1 22 m 1 2 19 f 0 3 18 f 0 4 21,7 m 1 5 18,5 f 0 6 21 m 1 7 20,5 m 1 8 17 f 0 9 17,5 f 0 10 21,2 m 1 Biến giới: m = nam; f = nữ. Kết quả ước lượng hồi quy: Y i = 18 + 3,28D i + e i Giá trị T 3,54 4,265 Dễ dàng thấy rằng, β 2 khác không, hơn thế nữa, hệ số này dương có ý nghĩa. Kết luận đầu tiên của chúng ta là: lương khởi điểm trung bình của nam cao hơn nữ. Ước lượng cụ thể về các mức này như sau: ¾ Lương khởi điểm trung bình của nữ E(Y/D=0) = β 1 , ước lượng được là 18,00 (nghìn $). ¾ Lương khởi điểm trung bình của nam E(Y/D=1)= β 1 + β 2 , ước lượng được là 21,28 (nghìn $). → Qui tắc đặt biến giả - Biến giả chỉ nhận giá trị 0 và 1 - Cá thể nào cũng phải có giá trị - Biến giả chia tổng thể thành những thành phần riêng biệt b. Biến định tính có k phạm trù. Lúc đó dùng k-1 biến giả để thay thế cho chúng. Ví dụ: Chi phí cho văn hoá phẩm có phụ thuộc vào trình độ học vấn? Y i : Chi phí cho văn hoá phẩm. D 2i = ⎩ ⎨ ⎧ khacdotrinhconeu hoctieudotrinhconeu 0 1 Kinh tÕ l−îng n©ng cao D 3i = ⎩ ⎨ ⎧ khacdotrinhconeu hoctrungdotrinhconeu 0 1 D 4i = ⎩ ⎨ ⎧ khacdotrinhconeu hocdaidotrinhconeu 0 1 Mô hình có dạng: Y i = β 1 + β 2 D 2i + β 3 D 3i + β 4 D 4i + u i c. Mô hình có hai biến định tính VD : Thu nhập trung bình có khác nhau giữa thành thị và nông thôn, gữa nam và nữ ? D 2 = ⎩ ⎨ ⎧ 0 1 Nếu là nam Nếu là nữ D 3 = ⎩ ⎨ ⎧ 0 1 Nếu làm việc ở thành thị Nếu làm việc ở nông thôn E(Y/D 2i , D 3i ) = β 1 + β 2 D 2i + β 3 D 3i + u i Các chú ý: • Nếu mô hình có k biến giải thích là định tính với số phạm trù tương ứng là n 1 , n 2 , . . . n k thì phải dùng tổng cộng n 1 + n 2 + . . . + n k – k biến giả. • Biến nhận mọi giá trị bằng 0 gọi là phạm trù cơ sở dùnh để so sánh với các phạm trù khác. • Các hệ số góc riêng phần được gọi là các hệ số chênh lệch. • Việc đưa thêm các biến giải thích là định lượng vào mô hình được làm như thông lệ. • 2.2. Sự tương tác giữa các biến giả Khi sử dụng cùng một lúc nhiều biến giả có thể xảy ra sự tương tác giữa chúng. Để tính đến điều đó ta thêm vào mô hình biến tương tác. Ví dụ: Chi tiêu cho quần áo có phụ thuộc vào giới tính và tính chất công việc? Mô hình 1: Y i = β 1 + β 2 D 2i + β 3 D 3i + β 5 X i + u i Trong mô hình trên đã giả thiết giới tính và tính chất công việc không có tương tác. Mô hình 2: Y i = β 1 + β 2 D 2i + β 3 D 3i + β 4 D 2i *D 3i + β 5 X i + u i Bμi 1: håi quy víi biÕn gi¶ Kiểm định H 0 : β 4 = 0 (không có tương tác) H 1 : β 4 ≠ 0 (có tương tác) Lúc đó mức độ tương tác bằng β 4 . 2.3. Đánh giá sự tác động đối với biến định lượng Xét mô hình: E(Y/X i ) = β 1 + β 2 X i và biến định tính có hai phạm trù là A 1 và A 2 . D = ⎩ ⎨ ⎧ ∉ ∈ 1 1 A sát quan 0 A sát quan 1 a. Biến định tính tác động đến hệ số chặn E(Y/X i , D i ) = β 1 + β 2 D i + β 3 X i b. Biến định tính tác động đến hệ số góc E(Y/X i , D i ) = β 1 + β 2 X i + β 3 D i X i c. Tác động đến cả hai hệ số E(Y/X i , D i ) = β 1 + β 2 X i + β 3 D i + β 4 D i X i Như vậy việc sử dụng biến giả có thể cho phép đánh giá chính sách. Ví dụ: Tệp số liệu ch4bt1 chứa các số liệu mức tiêu dùng thực tế theo đầu người(CS) và thu nhập thực tế theo đầu người của Mỹ(Y) giai đoạn 1929-1970. Trong giai đoạn này đã xảy ra thế chiến II(1941-1946) và từ 1960 Mỹ đã tham chiến tại Việt nam. Vậy chiến tranh có ảnh hưởng đến tiêu dùng của người Mỹ hay không? Kinh tÕ l−îng n©ng cao Hồi quy CS theo Y cho kết quả sau: Dependent Variable: CS Method: Least Squares Date: 11/21/08 Time: 09:13 Sample: 1929 1970 Included observations: 42 Variable Coefficie nt Std. Error t-Statistic Prob. C 58.09624 49.97286 1.162556 0.2519 Y 0.872195 0.029209 29.86016 0.0000 R-squared 0.957064 Mean dependent var 1498.54 8 Adjusted R- squared 0.955991 S.D. dependent var 403.024 3 S.E. of regression 84.54767 Akaike info criterion 11.7589 6 Sum squared resid 285932.3 Schwarz criterion 11.8417 0 Log likelihood - 244.9381 F-statistic 891.628 9 Durbin-Watson stat 0.337500 Prob(F-statistic) 0.00000 0 Thêm biến giả D 1 =1trong thời kỳ 1941-1946 và hồi quy thu được kết quả sau: Dependent Variable: CS Method: Least Squares Date: 11/21/08 Time: 09:21 Sample: 1929 1970 Included observations: 42 Variable Coefficie nt Std. Error t-Statistic Prob. C 101.5147 25.45745 3.987621 0.0003 D1 - 204.9233 18.78558 -10.90854 0.0000 Y 0.863631 0.014718 58.67883 0.0000 R-squared 0.989402 Mean dependent var 1498.54 8 Bμi 1: håi quy víi biÕn gi¶ Adjusted R- squared 0.988858 S.D. dependent var 403.024 3 S.E. of regression 42.54105 Akaike info criterion 10.4075 7 Sum squared resid 70579.89 Schwarz criterion 10.5316 8 Log likelihood - 215.5589 F-statistic 1820.42 4 Durbin-Watson stat 1.634232 Prob(F-statistic) 0.00000 0 Hồi quy CS với D1 y và D1*Y cho kết quả sau: Dependent Variable: CS Method: Least Squares Date: 11/21/08 Time: 22:17 Saple: 1929 1970 Included observations: 42 Variable Coefficie nt Std. Error t-Statistic Prob. C 96.01328 21.86063 4.392063 0.0001 D1 956.9913 299.3244 3.197171 0.0028 Y 0.866943 0.012641 68.58342 0.0000 D1*Y - 0.729170 0.187572 -3.887416 0.0004 R-squared 0.992417 Mean dependent var 1498.54 8 Adjusted R- squared 0.991819 S.D. dependent var 403.024 3 S.E. of regression 36.45391 Akaike info criterion 10.1203 7 Sum squared resid 50497.74 Schwarz criterion 10.2858 6 Log likelihood - 208.5277 F-statistic 1657.79 6 Durbin-Watson stat 1.267117 Prob(F-statistic) 0.00000 0 Thêm biến D2=1trong thời kỳ từ 1960 trở đi và hồi quy cho kết quả sau: Kinh tÕ l−îng n©ng cao Dependent Variable: CS Method: Least Squares Date: 11/21/08 Time: 09:29 Sample: 1929 1970 Included observations: 42 Variable Coefficie nt Std. Error t-Statistic Prob. C 132.3042 33.32473 3.970151 0.0003 D1 - 196.3546 19.52647 -10.05581 0.0000 D2 33.54774 23.83096 1.407737 0.1673 Y 0.838927 0.022787 36.81532 0.0000 R-squared 0.989927 Mean dependent var 1498.54 8 Adjusted R- squared 0.989132 S.D. dependent var 403.024 3 S.E. of regression 42.01552 Akaike info criterion 10.4043 5 Sum squared resid 67081.54 Schwarz criterion 10.5698 4 Log likelihood - 214.4913 F-statistic 1244.82 6 Durbin-Watson stat 1.639287 Prob(F-statistic) 0.00000 0 2.4. Kiểm định sự thay đổi cấu trúc của mô hình. Hàm hồi quy đồng nhất Hàm hồi quy không đồng nhất ⎩ ⎨ ⎧ ≠+ == 0:H 0:H 2 4 2 31 430 ββ ββ a. Kiểm định Chow Kiểm định về sự đồng nhất của hàm hồi quy Toàn bộ tổng thể Y i = β 1 + β 2 X i + u i Trong A 1 : Y i = α 1 + α 2 X i + u 1i Trong A 2 : Y i = γ 1 + γ 2 X i + u 2i Bμi 1: håi quy víi biÕn gi¶ ⎩ ⎨ ⎧ :H :H 1 0 [ α 1 = γ 1 = β 1 ] và [ α 2 = γ 2 = β 2 ] [ α 1 ≠ γ 1 ] hoặc [ α 2 ≠ γ 2 ] Hàm hồi quy đồng nhất Hàm hồi quy không đồng nhất Lấy mẫu W 1 kích thước n 1 trong A 1 hồi qui MH thu được RSS 1 Lấy mẫu W 2 kích thước n 2 trong A 2 hồi qui MH thu được RSS 2 Với mẫu W = W 1 ∪ W 2 kích thước n 1 + n 2 , hồi qui thu được RSS Tính RSS = RSS 1 + RSS 2 . F qs = k knn RSS RSSRSS 2 21 −+ × − Nếu F qs > F α (k ; n 1 + n 2 – 2k) : bác bỏ H 0 b. Dùng biến giả để kiểm định sự thay đổi cấu trúc. Với mẫu W = W 1 ∪ W 2 kích thước n 1 + n 2 hồi quy mô hình: Y i = β 1 + β 2 D i + β 3 X i + β 4 D i X i + u i Và kiểm định thu hẹp hàm hồi quy với giả thuyết H 0 : β 2 = β 4 = 0. Ví dụ: Cho số liệu trong bảng dưới đây về tiết kiệm S và thu nhập Y (đầu người) ở Vương quốc Anh trong giai đoạn 1946 - 1963 (triệu pao). Người ta cho rằng, thời kỳ khôi phục kinh tế sau thế chiến thứ hai 1946 - 1954 và thời kỳ sau đó, hành vi tiết kiệm từ thu nhập khác nhau. Hãy kiểm tra ý kiến này với mức ý nghĩa 5% bằng kiểm định Chow và bằng thủ tục biến giả. Năm Tiết kiệm Thu nhập Năm Tiết kiệm Thu nhập 1946 0.36 8.8 1955 0.59 15.5 1947 0.21 9.4 1956 0.9 16.7 1948 0.08 10.0 1957 0.95 17.7 1949 0.2 10.6 1958 0.82 18.6 1950 0.1 11.0 1959 1.04 19.7 1951 0.12 11.9 1960 1.53 21.1 Kinh tÕ l−îng n©ng cao 1952 0.41 12.7 1961 1.94 22.8 1953 0.50 13.5 1962 1.75 23.9 1954 0.43 14.3 1963 1.99 25.2 Kiểm định Chow cho kết quả sau: Chow Breakpoint Test: 1955 F-statistic 5.037060 Probability 0.022493 Log likelihood ratio 9.757442 Probability 0.007607 Dùng biến giả thu được kết quả sau: Dependent Variable: TK Method: Least Squares Date: 11/21/08 Time: 09:51 Sample: 1946 1963 Included observations: 18 Variable Coefficie nt Std. Error t-Statistic Prob. C - 1.750172 0.331888 -5.273377 0.0001 D1 1.483923 0.470362 3.154852 0.0070 TN 0.150450 0.016286 9.238172 0.0000 D1*TN - 0.103422 0.033260 -3.109471 0.0077 R-squared 0.952626 Mean dependent var 0.77333 3 Adjusted R- squared 0.942475 S.D. dependent var 0.64280 6 S.E. of regression 0.154173 Akaike info criterion - 0.70835 1 Sum squared resid 0.332771 Schwarz criterion - 0.51049 0 Log likelihood 10.37516 F-statistic 93.8410 Bμi 1: håi quy víi biÕn gi¶ 9 Durbin-Watson stat 1.468099 Prob(F-statistic) 0.00000 0 Kiểm định F về thu hẹp hồi quy: Wald Test: Equation: Untitled Null Hypothesis: C(2)=0 C(4)=0 F-statistic 5.03706 0 Probability 0.02249 3 Chi-square 10.0741 2 Probability 0.00649 3 VÍ DỤ: XU HƯỚNG DÀI HẠN TRONG TỶ GIÁ MẬU DỊCH Một trong những vấn đề được nhiều người quan tâm trong các tài liệu về kinh tế của các nước đang phát triển là vấn đề tỷ giá mậu dịch giữa các nước sản xuất nguyên liệu và các nước sản xuất hàng hoá công nghiệp. Hầu như phổ biến các nước bán sản phẩm thô hay nguyên liệu là các nước nghèo hay kém phát triển còn những nước bán hàng hoá là sản phẩm chế biến là các nước giàu. Một trong các quan điểm kinh tế phổ biến là tỷ giá mậu dịch có khả năng dịch chuyển liên tục ngược lại đối với các nước bán sản phẩm thô. Quan điểm này dựa trên lý thuyết về sự phụ thuộc theo đó, người ta gọi các nước sản xuất công nghiệp là các trung tâm còn các nước khác là các nước ngoại vi. Hay theo quan điểm của trường phái tân cổ điển thì có một sự khác biệt rất lớn về tính co giãn của cung và cầu trong hai loại hàng hoá như vậy. Để trả lời cho câu hỏi có hay không sự chuyển dịch ngược của tỷ giá mậu dịch trước tiên, ta nhắc lại một vài khái niệm liên quan giữa khối lượng trao đổi mậu dịch NBTT (hàng đổi hàng) với giá xuất khẩu P x và giá nhập khẩu P M . Ta có : M X P P NBTT = Biểu thức trên đo lường khối lượng xuất khẩu đảm bảo tài chính cho khối lượng nhập khẩu. Tỷ số này tăng cho thấy một xu hướng tốt; tỷ lệ này giảm cho thấy một tác động (sự di chuyển) ngược đối với quốc gia tương ứng. Thu nhập từ trao đổi mậu dịch của một quốc gia (YTT) đo bằng tỷ lệ giữa tích của khối lượng xuất khẩu Q X với giá xuất khẩu và giá nhập khẩu: M XX P PQ YTT = . YTT có thể dùng để đo sức mua của xuất khẩu. Rõ ràng là có thể tăng thu nhập từ trao đổi [...]... 12 9 911 19 6 6-2 14 0 01 140976 19 6 6-3 12 213 13 7828 19 6 6-4 12 820 14 5465 19 6 7 -1 11 349 13 6989 19 6 7-2 12 615 14 512 6 19 6 7-3 11 014 14 1536 19 6 7-4 12 730 15 1776 19 6 8 -1 12 539 14 8862 19 6 8-2 14 849 15 8 913 19 6 8-3 13 203 15 5727 19 6 8-4 14 947 16 8409 19 6 9 -1 14 1 51 1627 81 196 9-2 15 949 17 6057 19 6 9-3 14 024 17 2 419 19 6 9-4 14 315 18 3327 19 7 0 -1 12 3 81 170 415 19 7 0-2 13 9 91 1 813 13 19 7 0-3 12 174 17 6 712 19 7 0-4 10 985 18 0370 a Hãy hồi quy... 1 neu la quy 4 D4 = ⎨ ⎩0 neu la quy khac Ta có mô hình: Yt = 1 + β2D2t + β3D3t + β4D4t + β5Xt + ut Ví dụ: Có số liệu sau về tổng lợi nhuận và tổng doanh số của ngành công nghiệp chế biến Mỹ từ quý 1- 1 965 đến quý 4 -1 970: Năm và quý Lợi nhuận(tr USD) 19 6 5 -1 10 503 Doanh số( tr USD) 11 4862 Kinh tÕ l−îng n©ng cao 19 6 5-2 12 092 12 3968 19 6 5-3 10 834 12 1454 19 6 5-4 12 2 01 1 319 17 19 6 6 -1 12 245 12 9 911 19 6 6-2 14 0 01. .. định từ 19 50 trở đi và chia tệp số liệu trên thành hai thời kỳ 19 00 - 19 38 và 19 50 - 19 70 (xem như có sự bất bình thường trong những năm 19 39 - 19 49) Tiến hành các hồi quy và kiểm định Chow, ta nhận được các kết quả sau: Thời kỳ 19 00 - 19 70: lnNBTTt = 4,438 - 0,0 013 4T RSSN =1, 245 Thời kỳ 19 00 - 19 38: lnNBTTt = 4,572 - 0,00725T RSSn1 = 0, 517 2 Thời kỳ 19 50 - 19 70: RSSn2 = 0,0087 lnNBTTt = 5,523 - 0, 015 40T... R-squared 6597.974 18 40.287 3.585296 0.0 016 0.040954 0. 011 972 3.420 714 0.0024 0.347206 Mean dependent 12 838.5 var 4 Adjusted R0. 317 533 S.D dependent var 14 33.28 squared 4 S.E of regression 11 84.058 Akaike info 17 .0709 criterion 4 Sum squared resid 3084385 Schwarz criterion 17 .16 91 8 1 Log likelihood - F-statistic 11 .7 012 202.8 513 8 Durbin-Watson 1. 116 103 Prob(F-statistic) 0.00244 stat 7 Thêm các biến... Squares Date: 11 / 21/ 08 Time: 10 :23 Sample(adjusted): 19 65:3 19 70:4 Included observations: 22 after adjusting endpoints Variable Coefficie Std Error t-Statistic Prob nt C 7450.805 20 91. 104 3.563097 0.0024 D4 17 34.704 688.48 51 2. 519 595 0.0220 D3 325.9880 676.4989 0.4 818 75 0.6360 D2 4 61. 8268 656.8974 0.703043 0.4 915 DS 0.0 317 52 0. 013 520 2.348538 0.0 312 R-squared 0.480284 Mean dependent 12 978.6 var 4 Adjusted... var 13 93.95 squared 2 S.E of regression 11 16.904 Akaike info 17 .0 712 criterion 2 Sum squared resid 212 0706 Schwarz criterion 17 . 319 1 0 9 Log likelihood - F-statistic 3.92754 18 2.7835 8 Durbin-Watson 0.440938 Prob(F-statistic) 0. 019 50 stat 2 2.6 Hồi qui tuyến tớnh từng khỳc Hàm hồi quy tuyến tính gấp khúc tại đIểm X = Xt0 Kinh tÕ l−îng n©ng cao 1 : X ≥ X t 0 ⎩0 : X < X t 0 D= ⎨ E(Y/Xt, Dt) = 1 + β2Xt... lnNBTTt = b1 + b2T Đây là một mô hình nửa logarit và b2 thể hiện sự thay đổi của NBTT theo thời gian Spaor đã dùng một số hồi quy với các dãy số liệu theo thời gian và thời kỳ khác nhau Chúng ta có thể nghiên cứu hai kết quả hồi quy trên cơ sở số liệu của những năm 19 00 - 19 38 và 19 00 19 70 như sau: Thời kỳ 19 00 - 19 38: lnNBTTt = 4.572 - 0,00725 T R2 = 0.37 Se (0,0 018 8) T (3,86) Thời kỳ 19 00 - 19 70: lnNBTTt... này cần ước lượng hệ số tự tương quan trong hàm Ut = ρUt -1 + εt Khi đã có ước lượng của ρ, ta sử dụng phương trình sai phân tổng quát ước lượng các tham số trong mô hình này và từ đó suy ra ước lượng của các tham số ban đầu Các phép đổi biến được tiến hành như sau: 1 Với biến D, các giá trị trong thời kỳ đầu (19 4 6 -1 954) nhận giá trị 0; giá trị ứng với quan sát đầu tiên của thời kỳ sau (19 5 5 -1 963) nhận... sau (19 5 5 -1 963) nhận giá trị 1/ ( 1- ρ), các giá trị ứng với các quan sát sau đó nhận giá trị 1 Bμi 1: håi quy víi biÕn gi¶ 2 Các giá trị quan sát của biến Yt biến đổi theo công thức (Yt - Yt -1 ) 3 Các giá trị DtYt nhận giá trị 0 trong các quan sát ở thời kỳ đầu; giá trị đầu tiên trong thời kỳ sau DtYt=Yt còn các giá trị quan sát sau đó (DtYt -Dt-1Yt -1 ) nhận giá trị (Yt - Yt -1 ) 4 Các giá trị quan sát của... với doanh số và cho nhận xét b Vẽ đồ thị của lợi nhuận và doanh số theo thời gian và cho nhận xét c Từ đó hãy tìm cách hoàn thiện mô hình Hồi quy lợi nhuận theo doanh số: Dependent Variable: LN Method: Least Squares Date: 11 / 21/ 08 Time: 22:28 Sample: 19 65 :1 1970:4 Included observations: 24 Variable Coefficie Std Error t-Statistic nt Prob Bμi 1: håi quy víi biÕn gi¶ C DS R-squared 6597.974 18 40.287 . 19 6 6-2 14 0 01 140976 19 6 6-3 12 213 13 7828 19 6 6-4 12 820 14 5465 19 6 7 -1 11 349 13 6989 19 6 7-2 12 615 14 512 6 19 6 7-3 11 014 14 1536 19 6 7-4 12 730 15 1776 19 6 8 -1 12 539. 12 539 14 8862 19 6 8-2 14 849 15 8 913 19 6 8-3 13 203 15 5727 19 6 8-4 14 947 16 8409 19 6 9 -1 14 1 51 1627 81 19 6 9-2 15 949 17 6057 19 6 9-3 14 024 17 2 419 19 6 9-4 14 315 18 3327