Chương Hồi qui với biến giả ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy 1 Bản chất biến giả g • Trước đâyy chúngg ta sử dụng ụ g biến ggiải thích định ị lượng ợ g Trong g giảng đề cập mơ hình biến giải thích định tính nhằm giải tình như: tìm hiểu khác biệt giới tính việc tốn lương, lương khác biệc doanh số mùa năm, khác biệt hai giai đọan sách khác • Cơng cụ xử lý biến giả (dummy) Chúng ta giải thích g nhiều trườngg hợp ợp khác từ đơn ggiản đến pphức tạp ạp Biến giả thể biến định tính – Mơ hình có biến giải thích biến giả – Mơ hì hìnhh cóó biến biế giải iải thích hí h định đị h lượng l vàà biến biế giả iả ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy Bản chất biến giả g Xét: Y(định lượng) Í X(định lượng); Trường hợp Y Í X(định lượng), A(định tính) ? Y Giả sử: - qui luật mùa - qui luật thời vụ - thời kỳ β1’ • Để giải thích tượng này, người ta đưa vào mơ hình β1 biến giả, ký hiệu D: cá thể i có dấu hiệu A1 D= ế cáá thể i cóó dấu dấ hiệu hiệ A2 ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy A1 A2 X Bản chất biến giả Ví dụ: Giả sử có q trình sản xuất (ký hiệu trình sx A trình sx B) để sản xuất loại sản phNm Giả sử sản phNm thu từ trình sản xuất đại lượng ngẫu nhiên có phân phối chuNn có kỳ vọng khác phương sai Chúng ta có thểể biểu ể thị q trình sản xuất ấ phương trình hồi qui sau: yi = β1 + β2D + ui yi sản lượng sản phNm ứng với trình sản xuất thứ i D biến giả nhận giá trị: ế sản ả lượng l sản ả phNm hN th thu đ từ quáá trình t ì h sx A D= sản lượng sản phNm thu từ trình sx B Qua mơ hình biết sản lượng trung bình trình sx A có khác q trình sx B hay khơng ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy Bản chất biến giả g Ta thấy rằng: E(y|Di =0)= β1 E(y|Di =1)= β1 + β2 • Hệ số chặn β1 hồi qui tuyến tính đo sản lượng trung bình gắn với trình sản xuất B, độ dốc β2 đường hồi qui đo khác vềề sản lượng sinh việc thay đổi ổ từ trình sản xuất ấ B đến ế q trình sản xuất A • Kiểm định ị giả g thiết H0: β2 =0 cungg cấpp kiểm định ị giả g thiết khơng g có khác sản lượng trình sản xuất A B tạo • Thủ tục biến giả dễ dàng mở rộng cho trường hợp có nhiều phạm trù (ví dụ q trình sản xuất xuất ) ) ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy Hồi q qui với biến giả g • Phần ta xét mơ hình hồi qui có biến lượng biến chất, với sốố phạm h trùù nhiều hiề hhơn hhoặc ặ bằ 2 Trường T hhợp có ó nhiều hiề biế biến llượng vàà ộ biến chất thủ tục làm tương tự a- Trường hợp biến chất có phạm trù: Giả sử phải ước lượng mối quan hệ tiền lương người lao động số năm công tác họ yi = β1 + β2xi +ui Trong đó: yi = tiền lương hàng năm người lao động i xi = sốố năm công tác người ời lao l đđộng ii Ở hồn tồn chưa nói người lao động nam hay nữ Bâyy ggiờ ggiả sử g chúng g ta muốn tìm hiểu xem xem liệu ệ có pphải người g lao động nữ bị phân biệt đối xử việc trả lương họ khơng? ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy Hồi qui với biến giả • Ước lượng chung cho người lao động nam nữ cách xác định biến ghi nhận có mặt hay vắng mặt thuộc tính "nữ “ Di = quan sát i thuộc người lao động nữ Di = ế quan sát i thuộc vềề người lao động nam • Khi mơ hình hồi qui có dạng sau: yi = β1 + β2Di + β3xi +ui Giá trị kỳ vọng có điều kiện sau: nữ E(y|Di =0)= β1 + β3xi E(y|Di =1)= (β1 + β2) + β3xi nam Chúng ta thấy hệ số βj nói lên điều gì? ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy Hồi qui với biến giả Chúngg ta thấyy rằngg hệệ số βj nói lên điều ggì? y Tiền lương lao động nam Tiền iề lương l lao l động độ nữ β2 β1 x Hệ số β2 chênh lệch tung độ gốc Dễ dàng kiểm định xem liệu chênh lệch có ý nghĩa thống kê khơng: đơn giản tính giá trị thống kê t cho β2 so với hay ới giá trị tới hạn tra bảng t* làm kiểm định ý nghĩa thống kê hệ số hồi qui ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy Hồi qui với biến giả bb- Trường hợp với biến lượng hai biến chất: Giả sử phải ước lượng mối quan hệ tiền lương đối tượng số năm công tác họ, giả thiết thêm rằng, ằ ngồi ài giới iới tính tí h vùng ù màà lao l độ động làm việc iệ ũ ảnh ả h hưởng hưở tới thu nhập Như ta có hai biến chất: – Vùng có phạm trù – Giới tính có phạm trù Mơ hình có dạng: yi = β1 + β2D1i + β3D2i + β4D3i + β5xi +ui Trongg đó: yi = thu nhậpp hàng g năm người g lao độngg i xi = số năm công tác người lao động i ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy Hồi qui với biến giả bb- Trường hợp với biến lượng hai biến chất: yi = β1 + β2D1i + β3D2i + β4D3i + β5xi +ui D1 = lao động doanh nghiệp miền Bắc ế lao động không thuộc doanh nghiệp miền ề Bắc ắ D2 = lao động doanh nghiệp miền Nam lao động không thuộc doanh nghiệp miền Nam D3 = lao động nam lao động nữ Phạm trù cở người lao động thuộc doanh nghiệp miền Trung Giả sử E(ui)=0, thu nhập trung bình lao động nữ doanh nghiệp g ệp miền Trung g là: E(y|D1 =0, D2 =0, D3 =0, xi)= β1 + β5xi ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy 10 So sánh hai Hồi qui a- Kiểm định Chow: Ví dụ: Dependent Variable: SAVINGS Method: Least Squares Date: 11/05/02 Time: 12:11 Sample: 1970 1995 Included observations: 26 SAVINGS=C(1)+C(2)*INCOME C(1) C(2) R-squared R squared Adjusted R-squared S.E of regression Sum squared resid Log likelihood RSS Cả giai đoạn Coefficient Std Error t-Statistic Prob 62.42267 0.037679 12.76075 0.004237 4.891772 8.893776 0.0001 0.0000 0.767215 767215 0.757515 31.12361 23248.30 -125 125.2390 2390 ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy Mean dependent var S.D dependent var Akaike info criterion Schwarz criterion Durbin-Watson Durbin Watson stat 162.0885 162 0885 63.20446 9.787614 9.884391 859717 0.859717 20 So sánh hai Hồi qui a- Kiểm định Chow: Ví dụ: Dependent Variable: SAVINGS Method: Least Squares Date: 11/05/02 Time: 12:11 S Sample: l 1970 1981 Included observations: 12 SAVINGS=C(1)+C(2)*INCOME Xét với 1: RSS1 C(1) C(2) R-squared Adjusted R-squared S.E of regression Sum squared resid Log likelihood Xét với ới 22: RSS2 Std Error t-Statistic Prob 1.016117 080332 0.080332 11.63771 008367 0.008367 0.087313 601576 9.601576 0.9321 0000 0.0000 0.902143 0.892358 13.36051 1785.032 -47.04097 Mean dependent var S.D dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat 106.4417 40.72222 8.173495 8.254313 0.864230 Dependent Variable: SAVINGS Method: Least Squares Date: 11/05/02 Time: 12:12 Sample: 1982 1995 Included observations: 14 SAVINGS C(1) C(2)*INCOME SAVINGS=C(1)+C(2)*INCOME C(1) C(2) ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy Coefficient R-squared R squared Adjusted R-squared S.E of regression Sum squared resid Log likelihood Coefficient Std Error t-Statistic Prob 153.4947 0.014862 32.71227 0.008393 4.692266 1.770773 0.0005 0.1020 207169 0.207169 0.141100 28.87505 10005.22 -65.86777 Mean dependent var S.D dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat 209 7857 209.7857 31.15670 9.695396 9.786690 1.786588 21 So sánh hai Hồi qui • Ước lượng hồi qui: – Gđoạn 1: Yˆt = 0161 + 0803 X t – Gđoạn 2: Yˆt = 153 4947 + 0148 X t RSS1 = 1,785.03 RSS2 = 10,005.22 RSS = 23,248.3 23 248 – Toàn bộ: Yˆt = 62 4226 + 0376 X t – RSS = 23,248.30, – RSS =RSS1+RSS2=1,785.03+10,005.22=11,790.25 • F-statistic: * , 22 F ( 23,248.30 − 11,790.252) / = = 10.69 11,790.252 / 22 – Fc2,22=3.44 – Bác bỏ – Không thể gộp hai số liệu ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy 22 So sánh hai Hồi qui b- Thủ tục biến giả: Gộp số liệu ước lượng hồi qui sau: yi = β1 + β2Di + β3xi + β4Dixi +ui Với: D= số liệu từ số liệu từ Lấy kỳ vọng có điều kiện vế phương trình với giả thiết E(ui)=0 ta có: E(y|Di =0, xi)= β1 + β3xi E(y|Di =1, xi)= (β1 + β2)+ (β3 + β4)xi Ta thấy β2 hệ số chặn biểu thị khác số liệu ‘Bài Kinh tếthị lượng’ Phạmkhác Cảnh Huy 23 vàgiảng β4 biểu độ©dốc So sánh hai Hồi qui Ví dụ: Thủ tục biến giả • • • • • • • Chúng ta thực kiểm định Tiết kiệm (Y), thu nhập (X) 1 Y = β + β t X t + u t , T1=12 Giai đoạn (1970-1981): ( ) Yt = β 12 + β 22 X t + u t , T2=14 Giai đoạn (1982-1995): Toàn (1970-95): Yt = β1 + β X t + u t , T1+T2=26 Chúng ta kiểm định H : β11 = β12 & β 21 = β 22 Cả hai thời kỳ có hệ số chặn độ dốc ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy 24 So sánh hai Hồi qui Ví dụ: Thủ tục biến giả • Hồi qqui với biến ggiả,, ta viết: Yt = α + α Dt + β1 X t + β Dt X t + u t Dt=0 cho giai đoạn 1: Dt=1 cho giai đoạn 2: Yt = α + β1 X t + u t Yt = (α + α ) + ( β1 + β ) X t + u t • Hồi qui với biến giả, xét khác hệ số chặn hệ số góc Dt=0 hay Dt=1 (hồi qui khơng giới hạn) • Hồi qui giới hạn xét có hệ số chặn hệ số góc giai đoạn ( α = β = 0) ) 2 • Chạy hồi qui giai đoạn việc sử dụng biến giả ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy 25 So sánh hai Hồi qui Ví dụ: Thủ tục biến giả Yt Yt = α + α Dt + β1 X t + β Dt X t + u t Hồi qui không giới hạn D =1 D =0 Hồi qui giới hạn Y =α + β X t t Giai đoạn 1=T1 ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy t Giai đoạn 2=T2 1 t + ut Xt 26 So sánh hai Hồi qui Ví dụ: Thủ tục biến giảgiả tiết kiệm thu nhập Hồi qui biến giả Yt = α + α Dt + β1 X t + β Dt X t + u t Dependent Variable: SAVINGS Method: Least Squares Date: 10/27/03 Time: 15:42 Sample: 1970 1995 Included observations: 26 SAVINGS=C(1)+C(2)*DUM+C(3)*INCOME+C(4)*DUM*INCOME C(1) C(2) C(3) C(4) RSSUR Hồi qui giới hạn: H :α2 = β2 = Yt = α1 + β1 X t + ut RSSR R-squared Adjusted R-squared S.E of regression Sum squared resid Log likelihood Coefficient Std Error t-Statistic Prob 1.016117 152.4786 080332 0.080332 -0.065469 20.16483 33.08237 014497 0.014497 0.015982 0.050391 4.609058 541347 5.541347 -4.096340 0.9603 0.0001 0000 0.0000 0.0005 0.881944 0.865846 23.14996 11790.25 -116.4125 116.4125 Mean dependent var S.D dependent var Akaike info criterion Schwarz criterion Durbin-Watson Durbin Watson stat 162.0885 63.20446 9.262501 9.456055 1.648454 Dependent Variable: SAVINGS Method: Least Squares Date: 10/27/03 Time: 15:44 Sample: 1970 1995 Included observations: 26 SAVINGS=C(1)+C(2)*INCOME C(1) C(2) R-squared Adjusted R-squared S.E of regression Sum squared resid Log likelihood ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy Coefficient Std Error t-Statistic Prob 62.42267 0.037679 12.76075 0.004237 4.891772 8.893776 0.0001 0.0000 0.767215 0.757515 31.12361 23248.30 -125.2390 Mean dependent var S.D dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat 162.0885 63.20446 9.787614 9.884391 0.859717 27 So sánh hai Hồi qui Ví dụ: Thủ tục biến giả • Chúngg ta xem lại ví dụụ kiểm định ị Chow Chow Test: * k , T1 + T2 − k F = ( RSS R − RSSUR ) / k RSSUR / (T1 + T2 − k ) Kiểm định thống kê F: Nếu F* > Fc (tra bảng) => Bác bỏ H : α = β2 = ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy 28 So sánh hai Hồi qui Ví dụ: Thủ tục biến giả • Kiểm định thống kê F * , 22 F H : α = β = là: ( 23,248.30 − 11,790.252) / = = 10.69 11,790.252 / 22 Do F2,22c=3.44, bác bỏ H0 : α = β2 = Hai giai đoạn khác hệ số chặn hệ số góc Từ hồi qui với biến giả, biết hệ số chặn hệ số ố góc giai đoạn Giai doan ( Dt = ): Yˆt = 0161 + 0803 X t Giai doan ( Dt = ): Yˆt = (1 0161 + 152 4786 ) + (0 0803 − 0655 ) = 153 4947 + 0148 X t ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy 29 Hồi qui tuyến tính khúc Xét trường hợp tiêu dùng trước sau chuyển đổi? Phân tích hồi qui tuyến tính khúc cho phép thay đổi độ dốc hạn chế đường thẳng ước lượng liên tục: ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy 30 Hồi qui tuyến tính khúc Gọi t0 mốc thời gian chuyển đổi, ta xét mơ hình: yt = β1 + β2xt + β3(xt – xto)Dt +ut Lấy kỳ vọng có điều kiện vế phương trình: E(ui)=0 ta có: E(y|Dt =0, xi)= β1 + β2xt E(y|Dt =1, xi)= β1+ (β2 + β3)xt – β3xto Ta thấy β3 = phương trình trở thành phương trình đường thẳng,vì ẳ kiểm ể định β3 = cung cấp ấ cho ta kiểm ể định đơn giản vềề thay đổi cấu trúc ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy 31 Sử dụng biến giả phân tích mùa • Nhiều liệu ệ chuỗi thời ggian bịị tác động ộ g yyếu tố mùa ((sự ự dao động) – Sản lượng bán cửa hàng (Noel, ngày lễ tết) – Cầu Cầ vềề tiền, iề ddu lị lịch, h • Chúng ta cần hiệu chỉnh yếu tố mùa phân tích • Ta xem xét việc sử dụng biến giả phân tích mùa ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy 32 Sử dụng biến giả phân tích mùa Yt = α + α D2 t + α D3 t + α D4 t + u t Dependent Variable: FRIG Method: Least Squares Date: 11/05/02 Time: 12:41 Sample: 1978:1 1985:4 Included observations: 32 FRIG=C(1)+C(2)*D2+C(3)*D3+C(4)*D4 C(1) ( ) C(2) C(3) C(4) R-squared Adjusted R-squared S E of regression S.E Sum squared resid Log likelihood Coefficient Std Error t-Statistic Prob 1222.125 245.3750 347.6250 -62.12500 59.99041 84.83926 84.83926 84.83926 20.37200 2.892234 4.097454 -0.732267 0.0000 0.0073 0.0003 0.4701 0.531797 0.481632 169 6785 169.6785 806142.4 -207.5545 Mean dependent var S.D dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat 1354.844 235.6719 13 22216 13.22216 13.40537 0.392512 α1: Sản Sả lượng ượ g bán bá tủủ lạnh trung u g bbình quí qu α2,α3,α4: Sự khác biệt sản lượng qui với quí ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy 33 Ví dụ Ví dụ Ví dụ Ví dụ ‘Bài giảng Kinh tế lượng’ © Phạm Cảnh Huy 34 ... 1.016117 152 .47 86 080332 0.080332 -0.06 546 9 20.1 648 3 33.08237 0 144 97 0.0 144 97 0.015982 0.050391 4. 609058 541 347 5. 541 347 -4. 096 340 0.9603 0.0001 0000 0.0000 0.0005 0.881 944 0.865 846 23. 149 96 11790.25... 1222.125 245 .3750 347 .6250 -62.12500 59.99 041 84. 83926 84. 83926 84. 83926 20.37200 2.8922 34 4.09 745 4 -0.732267 0.0000 0.0073 0.0003 0 .47 01 0.531797 0 .48 1632 169 6785 169.6785 806 142 .4 -207.5 545 Mean... -1 144 .157 3.288 848 1395.056 801.1703 861.1182 0.317 642 9.511530 -2.088837 -1.328687 10.35393 0.0000 0. 042 2 0.19 04 0.0000 0.722665 0.7 049 63 2270.152 2 .42 E+08 -46 4.3908 ‘Bài giảng Kinh tế lượng? ?? © Phạm