Bài giảng Kinh tế lượng 1 - Bài 5: Phân tích hồi quy với biến định tính giúp người học nắm được khái niệm biến giả; mô hình có biến độc lập chỉ là biến giả; mô hình có biến độc lập là biến giả và biến định lượng.
Bài 5: Phân tích hồi quy với biến định tính BÀI PHÂN TÍCH HỒI QUY VỚI BIẾN ĐỊNH TÍNH Hướng dẫn học Các trước nghiên cứu biến độc lập biến định lượng, tức giá trị chúng đo số Ví dụ biến: chi tiêu, thu nhập, sản lượng, vốn, lao động, Bài ta quan tâm đến việc đưa biến định tính vào mơ hình vai trị biến độc lập Mục 5.1 trình bày khái niệm biến giả, cách dùng biến giả nhằm lượng hóa biến định tính Mục 5.2 giới thiệu mơ hình có biến định tính biến độc lập mục 5.3 trường hợp mơ hình hồi quy có biến độc lập biến định lượng biến định tính Để học tốt sinh viên cần thực hiện: Học lịch trình môn học theo tuần, đọc kĩ khái niệm Theo dõi ví dụ hiểu kết Đọc tài liệu: Nguyễn Quang Dong, Nguyễn Thị Minh, 2012, Giáo trình kinh tế lượng, NXB Đại học Kinh tế quốc dân Sinh viên tự học, làm việc theo nhóm, trao đổi với giảng viên Tham khảo thông tin từ trang Web môn học Nội dung: Khái niệm biến giả; Mơ hình có biến độc lập biến giả; Mơ hình có biến độc lập biến giả biến định lượng Mục tiêu: Sau học xong này, sinh viên cần đảm bảo yêu cầu sau: Hiểu rõ khái niệm biến giả; Biết cách dùng biến giả vai trị biến độc lập mơ hình hồi quy; Hiểu vai trị, ý nghĩa hệ số kèm với biến giả mơ hình hồi quy 86 TXTOKT04 _Bai5_v1.0015108207 Bài 5: Phân tích hồi quy với biến định tính Tình dẫn nhập Thực tế có nhiều trường hợp mà biến độc lập ta gặp biến định tính, thể số trạng thái (cịn gọi tính chất hay phạm trù) biến mô tả giới tính, tơn giáo, chủng tộc, vùng miền, hình thức doanh nghiệp, Tình 1: Trong ví dụ học trước, hồi quy chi tiêu hộ gia đình phụ thuộc vào thu nhập số người hộ Có ý kiến cho hành vi chi tiêu hộ gia đình cịn phụ thuộc vào yếu tố khu vực hộ gia đình sinh sống để xem xét vấn đề ta cần trả lời câu hỏi: Mơ hình kinh tế lượng lựa chọn có dạng nào? Mơ tả chất biến phụ thuộc biến độc lập Khi đưa biến “Khu vực” (nhận giá trị tương ứng hộ gia đình thành thị hay nơng thơn) vào mơ hình vai trị biến độc lập ta cần làm nào? Cách đưa biến trung gian (biến giả nhằm lượng hóa biến định tính) vào mơ nào? Cách phân tích sao? Tình 2: Ta muốn xem xét doanh nghiệp thu nhập nhân viên phụ thuộc vào yếu tố giới tính nhân viên hay khơng có câu hỏi sau xảy ra: Ta phải xây dựng mơ hình hồi quy với biến phụ thuộc, biến độc lập gì? Cấu trúc mơ nào? Bản chất số liệu biến mơ hình đo số nào? Khi lựa chọn mơ hình tuyến tính hồi quy biến phụ thuộc biến đo mức lương khởi điểm nhân viên mà doanh nghiệp chi trả (biến định lượng) phụ thuộc vào biến giải thích biến giới tính (biến định tính) với hai phạm trù nam nữ Một số câu hỏi cần quan tâm là: o Muốn “lượng hóa’’biến định tính giới tính với trạng thái nam nữ làm nào? o Khi dùng biến giả thực mục đích cách đưa biến giả vào mơ hình tiến hành phân tích kết sao? Tình 3: Ta muốn xem xét sản lượng doanh nghiệp phụ thuộc vào việc sử dụng phương pháp công nghệ A (truyền thống) hay B (hiện đại)? Như ta cần quan tâm đến cách lượng hóa yếu tố định tính “Phương pháp cơng nghệ” (với hai trạng thái doanh nghiệp sử dụng phương pháp công nghệ A, B” ta cần trả lời câu hỏi: Xây dựng mơ hình hồi quy với biến phụ thuộc, biến độc lập gì? Cấu trúc mơ nào? Bản chất số liệu biến mơ nào? Tình 4: Có ý kiến cho mức chi cho giáo dục hộ gia đình khác vùng miền bắc, miền trung miền nam Vậy để nhận định ý kiến này, cần trả lời câu hỏi tương ứng: TXTOKT04 _Bai5_v1.0015108207 87 Bài 5: Phân tích hồi quy với biến định tính Ở mơ hình hồi quy kinh tế lượng xây dựng với biến hồi quy nào? Những biến mơ hình có giá trị số, chữ (tức biến biến định lượng, biến biến định tính?) Cách thức đưa biến giả tiến hành phân tích nào? Ngồi ra, người đọc tìm tình tương tự đời sống kinh tế xã hội 88 TXTOKT04 _Bai5_v1.0015108207 Bài 5: Phân tích hồi quy với biến định tính 5.1 Khái niệm biến giá 5.1.1 Giới thiệu biến định tính biến giả Trong kinh tế xã hội có nhiều yếu tố đặc trưng trạng thái tính chất hay phạm trù mà ta gọi biến định tính Chẳng hạn yếu tố giới tính gồm hai trạng thái nam nữ, yếu tố quê quán đặc trưng hai trạng thái thành thị nông thôn, yếu tố vùng miền chia ba trạng thái miền Bắc, miền Trung miền Nam,… Để đưa thuộc tính biến định tính vào mơ hình hồi quy định lượng ta cần phải “lượng hóa” thuộc tính cách dùng biến giả (dummy variable) nhận hai giá trị 5.1.2 Các ví dụ Ví dụ 5.1: Trong tình ta cần hồi quy với biến định tính “Khu vực” (với hai trạng thái thành thị nơng thơn) thơng tin biến “Khu vực” thể biến giả “KV” sau: hộ gia đình sống thành thị KV = hộ gia đình sống nông thôn Như số liệu với biến giả khu vực: Thứ tự quan sát Khu vực KV Thành thị Nông thôn Nông thôn Thành thị Nông thôn n Thành thị Ví dụ 5.2: Trong tình 2, thơng tin biến định tính “Giới tính” nhân viên (với hai trạng thái nam nữ) thể biến giả “D” sau: người nam D= người nữ Như số liệu với biến giả giới tính: TXTOKT04 _Bai5_v1.0015108207 Thứ tự quan sát Giới tính D Nữ Nam Nam Nữ 89 Bài 5: Phân tích hồi quy với biến định tính Nam n Nữ Ví dụ 5.3: Trong tình ta có thơng tin biến “Phương pháp công nghệ” (với hai trạng thái doanh nghiệp dùng phương pháp công nghệ A hay B) thể biến giả “CN” sau: doanh nghiệp dùng phương pháp công nghệ A CN = doanh nghiệp dùng phương pháp công nghệ B Số liệu với biến giả phương pháp công nghệ: Thứ tự quan sát Phương pháp công nghệ sử dụng CN A B A B B n A Ví dụ 5.4: Trong tình nêu trên, thơng tin biến “Vùng miền” (với ba trạng thái miền bắc, miền trung miền nam) thể hai biến giả “D2” “D3” sau: quan sát thuộc miền Bắc D2 = quan sát không thuộc miền Bắc quan sát thuộc miền Nam D3 = quan sát không thuộc miền Nam Số liệu với biến giả vùng miền: 90 Thứ tự quan sát Vùng miền D2 D3 Miền Bắc Miền Bắc Miền Trung 0 Miền Nam Miền Trung 0 n Miền Bắc TXTOKT04 _Bai5_v1.0015108207 Bài 5: Phân tích hồi quy với biến định tính Nhận xét: Vì ta xét biến định tính có hữu hạn trạng thái cá thể tổng thể tương ứng với trạng thái định, cá thể không chuyển từ trạng thái sang trạng thái khác nên biến giả sử dụng có đặc điểm sau: o Biến giả nhận giá trị o Mỗi cá thể tổng thể tương ứng với giá trị biến giả o Biến giả chia tổng thể thành phần riêng biệt Việc lựa chọn gán giá trị ứng với trạng thái nhằm thuận lợi cho việc giải thích ý nghĩa hệ số biến giả Biến giả dùng mơ hình vai trị biến độc lập nên ta thường đánh số D2 trở hệ số kèm thường ký hiệu β2 Khi biến định tính có nhiều hai trạng thái ta sử dụng biến giả có nhiều giá trị (như biến giả nhận giá trị 0,1,2,3, tương ứng cho trạng thái) gặp khó khăn việc nghiên cứu so sánh tương ứng trạng thái số yếu tố kỹ thuật khác nên người ta thường dùng nhiều biến giả với hai giá trị theo quy tắc: Số biến giả sử dụng số trạng thái biến định tính – (Trong ví dụ 5.1, ví dụ 5.2 ví dụ 5.3 biến định tính gồm hai trạng thái ta sử dụng biến giả Cịn ví dụ 5.4 biến định tính vùng miền có trạng thái nên ta sử dụng biến giả) Trạng thái biến định tính mà ứng với giá trị biến giả nhận giá trị gọi trạng thái gốc hay trạng thái Việc lựa chọn trạng thái trạng thái tùy ý (Trong Ví dụ 5.1, trạng thái “Nơng thơn” trạng thái bản; Ví dụ 5.2, trạng thái “Nam” trạng thái bản; Ví dụ 5.3, trạng thái “Phương pháp công nghệ B” trạng thái ví dụ trạng thái trạng thái “Miền trung”) 5.2 Mơ hình có biến độc lập biến giả 5.2.1 Giới thiệu tình Chẳng hạn muốn xem xét so sánh ảnh hưởng việc dùng phương pháp công nghệ A hay B đến sản lượng doanh nghiệp Ta tiến hành hồi quy mơ hình với biến phụ thuộc (SL) biến sản lượng doanh nghiệp phụ thuộc vào biến định tính mơ tả việc doanh nghiệp dùng phương pháp công nghệ A hay B Thật ta tạo biến giả phương pháp công nghệ, ký hiệu “CN”: doanh nghiệp sử dụng phương pháp công nghệ A CN = doanh nghiệp không sử dụng phương pháp công nghệ A (tức sử dụng phương pháp công nghệ B) Với việc đưa biến giả CN vào mơ biến độc lập thơng thường mơ hình hồi quy: TXTOKT04 _Bai5_v1.0015108207 91 Bài 5: Phân tích hồi quy với biến định tính Mơ hình hồi quy tổng SL 1 CN u Khi sử dụng phương pháp công nghệ A SL 1 u Khi sử dụng phương pháp công nghệ B SL 1 u Hàm hồi quy tổng thể E ( SL / CN ) 1 CN Khi sử dụng phương pháp công nghệ A E ( SL / CN 1) 1 Khi sử dụng phương pháp công nghệ B E ( SL / CN 0) 1 Nhận xét: Sản lượng trung bình dùng phương pháp công nghệ A β0+ β2; Sản lượng trung bình dùng phương pháp cơng nghệ B β1 β2 mức chênh lệch sản lượng trung bình doanh nghiệp sử dụng phương pháp cơng nghệ A hay B (Trạng thái trạng thái “sử dụng phương pháp công nghệ B”) Do đó: Muốn xem xét có phải sản lượng doanh nghiệp khác dùng hai phương pháp cơng nghệ A B hay khơng ta thực toán kiểm định cặp giả thuyết: H0: β2 =0 H1: β2 ≠ o o Nếu bác bỏ H0, chấp nhận H1 ta kết luận sản lượng doanh nghiệp khác dùng hai phương pháp công nghệ A B Nếu không bác bỏ H0 ta kết luận sản lượng doanh nghiệp dùng hai phương pháp công nghệ A B Muốn xem xét có phải doanh nghiệp dùng phương pháp cơng nghệ A cao ta dùng phương pháp cơng nghệ B hay khơng ta thực toán kiểm định cặp giả thuyết: H0: β2 ≤ H1: β2 > o 92 Nếu bác bỏ H0, chấp nhận H1 ta kết luận sản lượng doanh nghiệp dùng phương pháp công nghệ A cao dùng phương pháp công nghệ B TXTOKT04 _Bai5_v1.0015108207 Bài 5: Phân tích hồi quy với biến định tính o Nếu khơng bác bỏ H0 ta kết luận sản lượng doanh nghiệp dùng phương pháp công nghệ A không cao dùng phương pháp công nghệ B Muốn xét xét mức sản lượng doanh nghiệp sử dụng hai phương pháp công nghệ A B chênh lệch khoảng ta tìm khoảng tin cậy đối xứng hệ số β2 se ( ) t( n/ 2k ) se ( ) t( n/ 2k ) (ở k=2) 5.2.2 Các ví dụ cụ thể Ví dụ 5.5: Giả sử có 100 quan sát hộ gia đình, với CT chi tiêu hộ gia đình (triệu đồng/năm), KV khu vực gia đình sinh sống (với trạng thái thành thị nông thôn) Tạo biến giả: hộ gia đình sống thành thị KV = hộ gia đình sống nơng thơn Tiến hành hồi quy chi tiêu hộ gia đình phụ thuộc vào khu vực gia đình sinh sống: Mơ hình hồi quy tổng thể CT 1 KV u Hộ gia đình thành thị CT 1 u Hộ gia đình nơng thơn CT 1 u Hàm hồi quy tổng thể E (CT / KV ) 1 KV Hộ gia đình thành thị E (CT / KV 1) 1 Hộ gia đình nơng thơn E (CT / KV 0) 1 Dependent Variable: CT Method: Least Squares Date: 04/17/15 Time: 05:54 Sample: 100 Included observations: 100 Variable Coefficient Std Error t–Statistic C 194.2407 7.298745 26.61290 0.0000 KV 69.54187 10.76141 6.462151 0.0000 R–squared 0.298795 Mean dependent var 226.2300 Adjusted R–squared 0.291640 F-statistic 41.75939 Sum squared resid 281913.7 Prob(F-statistic) 0.000000 TXTOKT04 _Bai5_v1.0015108207 Prob 93 Bài 5: Phân tích hồi quy với biến định tính Hàm hồi quy mẫu CTi KVi Hộ gia đình thành thị CT 1 194, 2407 69, 54187 263, 78257 Hộ gia đình nơng thơn CT 1 194, 2407 Mức chi tiêu hộ gia đình thành thị 263,78257 triệu đồng/năm Mức chi tiêu hộ gia đình nơng thơn 194,2407 triệu đồng/năm Mức chênh lệch chi tiêu hộ gia đình thành thị so với nơng thơn 69,54187 triệu đồng/năm Muốn biết với mức ý nghĩa 5%, có phải mức chi tiêu hộ gia đình thành thị cao mức chi tiêu hộ gia đình nơng thơn hay khơng, ta thực toán kiểm định giả thuyết thống kê: H0: β2 ≤ H1: β2 > Miền bác bỏ giả thuyết H0 là: 2 ( nk ) W T , T t se( ) Giá trị quan sát tiêu chuẩn kiểm định là: Tqs 69,54187 6,462151 10,76141 (98) 1, 645 Tqs> t( n k ) n = 935, k = 2, α = 0,05, t( n k ) t0,05 Đủ sở để bác bỏ giả thuyết H0 chấp nhận giả thuyết H1 Kết luận: Với mức ý nghĩa 5% đủ sở nói mức chi tiêu hộ gia đình thành thị cao nơng thơn Ví dụ 5.6: Sử dụng 935 quan sát số liệu ch4bt8.wf1 (trích từ Applied Econometrics, Asteriou – web Palgrave) (Data_giaotrinh_ktl_13/ch4bt8): Wage (USD/tháng) mức lương người lao động Urban biến giả nhận giá trị người lao động thành thị, người lao động nông thôn Tạo biến giả: hộ gia đình sống thành thị Urban = hộ gia đình sống nơng thơn 94 TXTOKT04 _Bai5_v1.0015108207 Bài 5: Phân tích hồi quy với biến định tính Hàm hồi quy tổng thể: E(Wage/Urban) = 1 + 2Urban Người lao động thành thị: E(Wage/Urban = 1) = 1 + 2 Người lao động nông thôn: E(Wage/Urban = 0) = 1 Dependent Variable: WAGE Method: Least Squares Included observations: 935 Variable Coefficient Std Error T-Statistic Prob C 3330.110 24.40500 136.4519 0.0000 URBAN 178.1316 28.80869 6.183260 0.0000 R-squared 0.039365 Mean dependent var 3457.945 Adjusted R-squared 0.038336 F-statistic 38.23270 Sum squared resid 1.47E+08 Prob(F-statistic) 0.000000 Hàm hồi quy mẫu: Người lao động thành thị: Người lao động nông thôn: Urban 3330,11 178,1316 Urban 3330,11 178,1316 3508,2416 3330,11 Muốn tiền cơng trung bình người khu vực thành thị 3508,2416 USD/tháng Mức tiền công người khu vực nông thôn 3330,11 USD/tháng Ước lượng điểm mức chênh lệch tiền công người lao động thành thị nông thôn 178,1316 USD/tháng Muốn biết với độ tin cậy 95% mức chênh lệch lương người thành thị nông thôn ta tìm khoảng tin cậy đối xứng β2 se ( ) t( n/ 2k ) se ( ) t( n/ 2k ) (933) n 935, k 2, – 0.95 , t( n/2k ) t0,025 1,96 ; 178,1315822 se ( ) 28,80869 121,6665498 < β2 < 234,5966146 Kết luận: Với độ tin cậy 95% mức chênh lệch lương người thành thị nông thôn dao động khoảng (121,6665498; 234,5966146) USD/tháng Muốn biết với mức ý nghĩa 5%, có phải lương người thành thị cao lương người nông thôn hay không, ta thực toán kiểm định giả thuyết thống kê: TXTOKT04 _Bai5_v1.0015108207 95 Bài 5: Phân tích hồi quy với biến định tính H0: β2 ≤ H1: β2 > Miền bác bỏ giả thuyết H0 là: 2 ( nk ) W T , T t se( ) Giá trị quan sát tiêu chuẩn kiểm định là: Tqs 178,1315822 6,18326 28,80869 (933) 1, 645 → Tqs> t( n k ) n = 935, k = 2, α = 0,05, t( n k ) t0,05 Chấp nhận giả thuyết H1 Kết luận: Với mức ý nghĩa 5% đủ sở nói lương người thành thị cao lương người nông thơn 5.3 Mơ hình có biến độc lập biến giả biến định lượng 5.3.1 Giới thiệu tình Trong mục 5.2 nghiên cứu mơ hình hồi quy có biến độc lập biến định tính (được lượng hóa biến giả nhận giá trị 1), mục ta xét trường hợp biến độc lập mơ hình có biến định lượng thông thường Chẳng hạn muốn nghiên cứu, so sánh mức lương người lao động phụ thuộc vào số năm học có khác nam nữ hay khơng? Ta xây dựng mơ hình hồi quy với biến: Wage (USD/tháng) mức lương người lao động Educ số năm học người lao động Male biến giả (lượng hóa cho biến giới tính) nhận giá trị quan sát nam, quan sát nữ Mơ hình hồi quy tổng thể: Wage 1 Male Educ u 96 Lao động nam: Wage Educ u Lao động nữ: Wage 1 Educ u TXTOKT04 _Bai5_v1.0015108207 Bài 5: Phân tích hồi quy với biến định tính Wage E(Wage/Educ) = 1 + 2 + 3Educ E(Wage/Educ) = 1 + 3Educ 2 1 Educ Nhận xét: o Khi số năm học tăng năm lương trung bình người lao động tăng β3 đơn vị o Khi số năm học lương trung bình nam cao nữ β2 đơn vị o Nếu β2 > có nghĩa số năm học, lương trung bình nam cao nữ o Nếu β2 = có nghĩa số năm học, lương trung bình nam nữ o Nếu 2 < có nghĩa số năm học, tiền cơng nam thấp nữ Muốn biết việc điến biến giả Male vào mơ hình có ý nghĩa hay khơng (hay xem xét hệ số β2 có ý nghĩa thống kê khơng) ta tiến hành kiểm định cặp giả thuyết thống kê: H0: β2 = H1: β2 ≠ o o Nếu bác bỏ H0, chấp nhận H1 ta kết luận biến Male có mơ hình cần thiết (hay hệ số β2 có ý nghĩa thống kê) Nếu chưa bác bỏ H0 ta kết luận ta kết luận biến Male có mơ hình khơng cần thiết (hay hệ số β2 khơng có ý nghĩa thống kê) Muốn xem số năm học mức lương lao động nam cao lương lao động nữ hay khơng ta tiến hành kiểm định cặp giả thuyết thống kê: H0: β2 ≤ H1: β2 > o TXTOKT04 _Bai5_v1.0015108207 Nếu bác bỏ H0, chấp nhận H1 ta kết luận có số năm học tiền cơng nam cao tiền cơng nữ 97 Bài 5: Phân tích hồi quy với biến định tính o Nếu nhận giả thuyết H0 ta kết luận có số năm học tiền cơng nam khơng cao tiền công nữ Muốn xét xét mức chênh lệch mức lương nam nữ (khi có số năm học) biến động khoảng ta ước lượng hệ số β2 khoảng tin cậy đối xứng: se ( ) t( n/ 2k ) se ( ) t( n/ 2k ) (ở k = 3) 5.3.2 Các ví dụ cụ thể Ví dụ 5.7: Tiếp tục dùng số liệu cho 100 hộ gia đình Ta hồi quy chi tiêu hộ gia đình phụ thuộc vào biến: Biến thu nhập biến “KV” CT: Chi tiêu hộ gia đình(triệu đồng/năm) TN: Thu nhập hộ gia đình (triệu đồng/năm) KV: Biến giả khu vực gia đình sình sống (lượng hóa cho biến định tính với trạng thái thành thị nơng thơn) hộ gia đình sống thành thị KV = hộ gia đình sống nơng thơn Mơ hình hồi quy tổng thể: CT 1 KV 3TN u Các hộ gia đình thành thị: Các hộ gia đình nông thôn: CT 1 3TN u CT 1 3TN u Dependent Variable: CT Method: Least Squares Included observations: 100 98 Variable Coefficient Std Error t–Statistic Prob C 59.62006 6.837323 8.719796 0.0000 KV 30.27209 4.781050 6.331681 0.0000 TN 0.593527 0.027074 21.92211 0.0000 R–squared 0.882238 Mean dependent var 226.2300 Adjusted R–squared 0.879810 F–statistic 363.3475 Sum squared resid 47345.25 Prob (F–statistic) 0.000000 TXTOKT04 _Bai5_v1.0015108207 Bài 5: Phân tích hồi quy với biến định tính CTi 1 KVi TN i Hàm hồi quy mẫu: CTi ( 1 ) TN i Hộ gia đình thành thị: (59,62006 + 0,593527) + 30,27209TN i CTi 1 TN i Hộ gia đình nơng thơn: 59,62006 + 30,27209TN i Mức chi tiêu tối thiểu hộ gia đình thành thị là: 59,62006 + 30,27209 = 89,89215 triệu đồng/năm Mức chi tiêu tối thiểu hộ gia đình nơng thơn 59.62006 triệu đồng/năm Mức chênh lệch chi tiêu hộ gia đình thành thị so với nơng thơn 30,27209 triệu đồng/năm Muốn biết với độ tin cậy 95%, có mức thu nhập mức chênh lệch chi tiêu hộ gia đình thành thị nơng thơn dao động khoảng ta tìm khoảng tin cậy đối xứng β2 se ( ) t( n/2k ) se ( ) t( n/ 2k ) (97) 1,96 ; 30,27209 ; se( ) 4,781050 n = 100, k = 3, α = 0,95, t( n/2k ) t0,025 20,901232 < β2 < 39,642948 Kết luận: Với độ tin cậy 95%, có mức thu nhập mức chênh lệch chi tiêu hộ gia đình thành thị nơng thơn dao động khoảng (20,901232, 39,642948) USD/tháng Muốn biết với mức ý nghĩa 5%, có phải mức chi tiêu hộ gia đình thành thị nơng thôn khác hay không, ta thực toán kiểm định giả thuyết thống kê: H0: β2 = H1: β2 ≠0 Miền bác bỏ giả thuyết H0 là: 2 (nk ) W T , T t / se( ) Giá trị quan sát tiêu chuẩn kiểm định là: Tqs 30,27209 6,331681 4,781050 (97) 1,96 → │Tqs│> t( n/2k ) n = 100, k = 3, α = 0,05, t( n k ) t0,025 Chấp nhận giả thuyết H1 TXTOKT04 _Bai5_v1.0015108207 99 Bài 5: Phân tích hồi quy với biến định tính Kết luận: Với mức ý nghĩa 5% đủ sở nói mức chi tiêu hộ gia đình thành thị nông thôn khác Muốn biết với mức ý nghĩa 5%, có phải mức thu nhập mức chi tiêu hộ gia đình thành thị cao so với hộ gia đình nơng thơn hay khơng, ta thực toán kiểm định giả thuyết thống kê: H0: β2 ≤ H1: β2 > Miền bác bỏ giả thuyết H0 là: 2 ( nk ) W T , T t se( ) Giá trị quan sát tiêu chuẩn kiểm định là: Tqs 30,27209 6,331681 4,781050 (97) 1, 645 → Tqs> t( n k ) n = 100, k = 3, α = 0,05, t( n k ) t0,05 Chấp nhận giả thuyết H1 Kết luận: Với mức ý nghĩa 5% đủ sở nói có mức thu nhập chi tiêu hộ gia đình thành thị cao so với nơng thơn Ví dụ 5.8: Tiếp tục dùng số liệu (Sử dụng 935 quan sát số liệu ch4bt8.wf1 (trích từ Applied Econometrics, Asteriou–web Palgrave) (Data_giaotrinh _ktl_13/ch4bt8) Dependent Variable: WAGE Method: Least Squares Date: 04/18/15 Time: 15:13 Sample: 935 Included observations: 935 100 Variable Coefficient Std Error t–Statistic Prob C 2803.999 53.16238 52.74405 0.0000 MALE 580.8848 17.69155 32.83402 0.0000 EDUC 30.10292 3.986869 7.550516 0.0000 R–squared 0.585947 Mean dependent var 3457.945 Adjusted R–squared 0.585059 F–statistic 659.4609 Sum squared resid 63232525 Prob(F–statistic) 0.000000 TXTOKT04 _Bai5_v1.0015108207 Bài 5: Phân tích hồi quy với biến định tính Hàm hồi quy mẫu: Wage 1 Male Educ Lao động nam: Wage ( 1 ) Educ (580,8848 17,69155) 30,10292 Educ Lao động nữ: Wage 1 Educ 580,8848 30,10292 Educ Ước lượng điểm mức chênh lệch lương nam nữ (khi có số năm học) 580,8848 USD/tháng Muốn biết với độ tin cậy 95%, có số năm học mức chênh lệch lương nam nữ ta tìm khoảng tin cậy đối xứng β2: se ( ) t( n/2k ) se ( ) t( n/ 2k ) (932) n = 935, k = 3, – α = 0,95, t( n/2k ) t0,025 1,96 ; 580,8848 ; se( ) 17,69155 546,209362 < β2 < 615,560238 Kết luận: Với độ tin cậy 95%, có số năm học mức chênh lệch lương nam nữ dao động khoảng (546,209362, 615,560238) USD/tháng Muốn biết với mức ý nghĩa 5%, có phải lương nam nữ (hay hệ số biến giả khơng có ý nghĩa thống kê), ta thực toán kiểm định giả thuyết thống kê: H0: β2 = H1: β2 ≠ Miền bác bỏ giả thuyết H0 là: 2 (nk ) W T , T t /2 se( ) Giá trị quan sát tiêu chuẩn kiểm định là: Tqs 580,8848 32,83402528 17,69155 (932) 1,96 │Tqs│> t( n/2k ) n = 935, k = 3, α = 0,05, t( n/2k ) t0,025 Đủ sở chấp nhận giả thuyết H1 Kết luận: Với mức ý nghĩa 5% đủ sở nói có số năm học tiền cơng trung bình nam nữ khác TXTOKT04 _Bai5_v1.0015108207 101 Bài 5: Phân tích hồi quy với biến định tính Muốn biết với mức ý nghĩa 5%, có phải số năm học lương nữ thấp nam (hay lương trung bình nam cao nữ) hay khơng, ta thực tốn kiểm định giả thuyết thống kê: H0: β2 ≤ H1: β2 > Miền bác bỏ giả thuyết H0 là: 2 ( nk ) W T , T t se( ) Giá trị quan sát tiêu chuẩn kiểm định là: Tqs 580,8848 32,83402528 17,69155 (932) 1, 645 Tqs> t( n k ) n = 935, k = 3, α = 0,05, t( n/2k ) t0,05 Đủ sở chấp nhận giả thuyết H1 Kết luận: Với mức ý nghĩa 5% đủ sở nói có số năm học tiền cơng trung bình nam cao nữ (hay lương trung bình nữ thấp nam) Ví dụ 5.9: Dùng số liệu (Sử dụng 33 quan sát số liệu ch3bt4.wf1 (trích từ Data_giaotrinh _ktl_13/ch3bt4) với biến: CT, TN chi têu thu nhập người lao động theo tháng (triệu đồng) GT biến giả nhằm lượng hóa biến giới tính người lao động (GT = ứng với lao động nam, GT = ứng với lao động nữ) Mô hình hồi quy tổng thể: CT 1 2GT 3TN u Lao động nam: Lao động nữ: CT 1 3TN u CT 1 3TN u Dependent Variable: CT Method: Least Squares Date: 04/18/15 Time: 18:16 Sample (adjusted): 33 Included observations: 33 after adjustments 102 Variable Coefficient Std Error t–Statistic Prob C 68.73748 7.840218 8.767292 0.0000 TXTOKT04 _Bai5_v1.0015108207 Bài 5: Phân tích hồi quy với biến định tính GT 11.63350 5.230464 2.224181 0.0338 TN 0.852228 0.003835 222.2053 0.0000 R–squared 0.999404 Mean dependent var 1642.161 Adjusted R–squared 0.999365 F–statistic 25169.39 Sum squared resid 5919.280 Prob(F–statistic) 0.000000 Ước lượng điểm mức chênh lệch chi tiêu nam nữ (khi có thu nhập) 11,63350 triệu đồng/tháng Muốn biết với độ tin cậy 95% mức chênh lệch chi tiêu nam nữ (khi có thu nhập) dao động khoảng ta tìm khoảng tin cậy đối xứng β2 se ( ) t( n/ 2 k ) se ( ) t( n/ 2 k ) (30) 2, 042 ; n 33, k 3, – 0,95 n = 33, k = 3, – α = 0,95, t( n/2k ) t0,025 11, 63350 ; se( ) 5, 230464 0,952892512 < β2 < 22,333957488 Kết luận: Với độ tin cậy 95% mức chênh lệch chi tiêu trung bình nam nữ (khi thu nhập) dao động khoảng (0,952892512, 22,333957488) triệu đồng/tháng Muốn biết với mức ý nghĩa 5%, có tiêu nam nữ (hay biến giả GT có mặt hồi quy khơng cần thiết), ta thực tốn kiểm định giả thuyết thống kê: H0: β2 = H1: β2 ≠ Miền bác bỏ giả thuyết H0 là: 2 (nk ) W T , T t /2 se( ) Giá trị quan sát tiêu chuẩn kiểm định là: Tqs 11,63350 2,224181 5,230464 (30) 2, 042 │Tqs│> t( n/2k ) bác bỏ H0, chấp n = 33, k = 3, α = 0,05, t( n/2k ) t0,025 nhận H1 Kết luận: Với mức ý nghĩa 5% đủ sở nói chi tiêu nam nữ có mức thu nhập khác TXTOKT04 _Bai5_v1.0015108207 103 Bài 5: Phân tích hồi quy với biến định tính Muốn biết với mức ý nghĩa 5%, có tiêu nam cao nữ (khi có thu nhập) hay khơng, ta thực toán kiểm định giả thuyết thống kê: H0: β2 ≤ H1: β2 > Miền bác bỏ giả thuyết H0 là: 2 ( nk ) W T , T t se( ) Giá trị quan sát tiêu chuẩn kiểm định là: Tqs 11,63350 2,224181 5,230464 (30) 1, 697 Tqs > t( n k ) bác bỏ H0, chấp nhận H1 n = 33, k = 3, α = 0,05, t( n k ) t0,05 Kết luận: Với mức ý nghĩa 5% đủ sở nói có mức thu nhập chi tiêu nam cao so với nữ Muốn biết với mức ý nghĩa 5%, có phải thu nhập tăng lên triệu đồng mức chi tiêu tăng nhiều 500 nghìn đồng hay không (đối với nam nữ)? Ta thực toán kiểm định giả thuyết thống kê: H0: β3 ≤ 0,85 H1: β3 > 0,85 Miền bác bỏ giả thuyết H0 là: 0,5 (nk ) W T , T t se( ) Tqs 0,852228 0,85 0,5809 0,003835 (30) 1, 697 Tqs < t( n k ) chưa bác bỏ H0 n = 33, k = 3, α = 0,05, t( n k ) t0,05 Kết luận: Với mức ý nghĩa 5% đủ sở nói thu nhập người lao động tăng lên triệu đồng mức chi tiêu họ tăng nhiều 0,85 triệu đồng Có ý kiến cho mức chi tiêu biên thấp triệu đồng Với mức ý nghĩa 5% nhận xét ý kiến này.Ta thực toán kiểm định giả thuyết thống kê: H0: β3 ≥1 104 TXTOKT04 _Bai5_v1.0015108207 Bài 5: Phân tích hồi quy với biến định tính H1: β3