Ta tiến hành hồi quy mô hình với biến phụ thuộc (SL) là biến sản lượng của doanh nghiệp phụ thuộc vào biến định tính mô tả về việc doanh nghiệp dùng phương pháp công nghệ A hay B.. (Tr[r]
(1)Bài 5: Phân tích hồi quy với biến định tính
BÀI PHÂN TÍCH HỒI QUY VỚI BIẾN ĐỊNH TÍNH
Hướng dẫn học
Các trước nghiên cứu biến độc lập biến định lượng, tức giá trị chúng đo số Ví dụ biến: chi tiêu, thu nhập, sản lượng, vốn, lao động,
Bài ta quan tâm đến việc đưa biến định tính vào mơ hình vai trị biến độc lập Mục 5.1 trình bày khái niệm biến giả, cách dùng biến giả nhằm lượng hóa biến định tính Mục 5.2 giới thiệu mơ hình có biến định tính biến độc lập mục 5.3 trường hợp mơ hình hồi quy có biến độc lập biến định lượng biến định tính
Để học tốt sinh viên cần thực hiện:
Học lịch trình mơn học theo tuần, đọc kĩ khái niệm Theo dõi ví dụ hiểu kết
Đọc tài liệu: Nguyễn Quang Dong, Nguyễn Thị Minh, 2012, Giáo trình kinh tế lượng, NXB Đại học Kinh tế quốc dân
Sinh viên tự học, làm việc theo nhóm, trao đổi với giảng viên Tham khảo thông tin từ trang Web môn học
Nội dung:
Khái niệm biến giả;
Mô hình có biến độc lập biến giả;
Mơ hình có biến độc lập biến giả biến định lượng Mục tiêu:
Sau học xong này, sinh viên cần đảm bảo yêu cầu sau: Hiểu rõ khái niệm biến giả;
Biết cách dùng biến giả vai trị biến độc lập mơ hình hồi quy;
(2)Bài 5: Phân tích hồi quy với biến định tính
Tình dẫn nhập
Thực tế có nhiều trường hợp mà biến độc lập ta gặp biến định tính, thể số trạng thái (cịn gọi tính chất hay phạm trù) biến mô tả giới tính, tơn giáo, chủng tộc, vùng miền, hình thức doanh nghiệp,
Tình huống 1:
Trong ví dụ học trước, hồi quy chi tiêu hộ gia đình phụ thuộc vào thu nhập số người hộ Có ý kiến cho hành vi chi tiêu hộ gia đình cịn phụ thuộc vào yếu tố khu vực hộ gia đình sinh sống để xem xét vấn đề ta cần trả lời câu hỏi:
Mơ hình kinh tế lượng lựa chọn có dạng nào? Mô tả chất biến phụ thuộc biến độc lập
Khi đưa biến “Khu vực” (nhận giá trị tương ứng hộ gia đình thành thị hay nơng thơn) vào mơ hình vai trị biến độc lập ta cần làm nào?
Cách đưa biến trung gian (biến giả nhằm lượng hóa biến định tính) vào mơ nào? Cách phân tích sao?
Tình huống 2:
Ta muốn xem xét doanh nghiệp thu nhập nhân viên phụ thuộc vào yếu tố giới tính nhân viên hay khơng có câu hỏi sau xảy ra:
Ta phải xây dựng mơ hình hồi quy với biến phụ thuộc, biến độc lập gì? Cấu trúc mơ nào?
Bản chất số liệu biến mơ hình đo số nào?
Khi lựa chọn mơ hình tuyến tính hồi quy biến phụ thuộc biến đo mức lương khởi điểm nhân viên mà doanh nghiệp chi trả (biến định lượng) phụ thuộc vào biến giải thích biến giới tính (biến định tính) với hai phạm trù nam nữ Một số câu hỏi cần quan tâm là:
o Muốn “lượng hóa’’biến định tính giới tính với trạng thái nam nữ làm nào? o Khi dùng biến giả thực mục đích cách đưa biến giả vào mơ hình tiến hành
phân tích kết sao?
Tình huống 3:
Ta muốn xem xét sản lượng doanh nghiệp phụ thuộc vào việc sử dụng phương pháp công nghệ A (truyền thống) hay B (hiện đại)?
Như ta cần quan tâm đến cách lượng hóa yếu tố định tính “Phương pháp cơng nghệ” (với hai trạng thái doanh nghiệp sử dụng phương pháp công nghệ A, B” ta cần trả lời câu hỏi:
Xây dựng mơ hình hồi quy với biến phụ thuộc, biến độc lập gì? Cấu trúc mơ nào?
Bản chất số liệu biến mơ nào?
Tình huống 4:
(3)Bài 5: Phân tích hồi quy với biến định tính
Ở mơ hình hồi quy kinh tế lượng xây dựng với biến hồi quy nào?
Những biến mơ hình có giá trị số, chữ (tức biến biến định lượng, biến biến định tính?)
Cách thức đưa biến giả tiến hành phân tích nào?
(4)Bài 5: Phân tích hồi quy với biến định tính 5.1 Khái niệm biến giá
5.1.1 Giới thiệu biến định tính biến giả
Trong kinh tế xã hội có nhiều yếu tố đặc trưng trạng thái tính chất hay phạm trù mà ta gọi biến định tính Chẳng hạn yếu tố giới tính gồm hai trạng thái nam nữ, yếu tố quê quán đặc trưng hai trạng thái thành thị nông thôn, yếu tố vùng miền chia ba trạng thái miền Bắc, miền Trung miền Nam,…
Để đưa thuộc tính biến định tính vào mơ hình hồi quy định lượng ta cần phải “lượng hóa” thuộc tính cách dùng biến giả (dummy variable) nhận hai giá trị
5.1.2 Các ví dụ Ví dụ 5.1:
Trong tình ta cần hồi quy với biến định tính “Khu vực” (với hai trạng thái thành thị nơng thơn) thơng tin biến “Khu vực” thể biến giả “KV” sau:
hộ gia đình sống thành thị KV =
hộ gia đình sống nơng thôn
Như số liệu với biến giả khu vực:
Thứ tự quan sát Khu vực KV
1 Thành thị
2 Nông thôn
3 Nông thôn
4 Thành thị
5 Nông thôn
n Thành thị
Ví dụ 5.2:
Trong tình 2, thơng tin biến định tính “Giới tính” nhân viên (với hai trạng thái nam nữ) thể biến giả “D” sau:
1 người nam D=
0 người nữ
Như số liệu với biến giả giới tính:
Thứ tự quan sát Giới tính D
1 Nữ
2 Nam
3 Nam
(5)Bài 5: Phân tích hồi quy với biến định tính
5 Nam
n Nữ
Ví dụ 5.3:
Trong tình ta có thơng tin biến “Phương pháp cơng nghệ” (với hai trạng thái doanh nghiệp dùng phương pháp công nghệ A hay B) thể biến giả “CN” sau:
1 doanh nghiệp dùng phương pháp công nghệ A CN =
0 doanh nghiệp dùng phương pháp công nghệ B
Số liệu với biến giả phương pháp công nghệ:
Thứ tự quan sát Phương pháp công nghệ sử dụng CN
1 A
2 B
3 A
4 B
5 B
n A
Ví dụ 5.4:
Trong tình nêu trên, thơng tin biến “Vùng miền” (với ba trạng thái miền bắc, miền trung miền nam) thể hai biến giả “D2” “D3” sau:
1 quan sát thuộc miền Bắc D2 =
0 quan sát không thuộc miền Bắc
Số liệu với biến giả vùng miền:
Thứ tự quan sát Vùng miền D2 D3
1 Miền Bắc
2 Miền Bắc
3 Miền Trung 0
4 Miền Nam
5 Miền Trung 0
n Miền Bắc
1 quan sát thuộc miền Nam D3 =
(6)Bài 5: Phân tích hồi quy với biến định tính
Nhận xét:
Vì ta xét biến định tính có hữu hạn trạng thái cá thể tổng thể tương ứng với trạng thái định, cá thể không chuyển từ trạng thái sang trạng thái khác nên biến giả sử dụng có đặc điểm sau:
o Biến giả nhận giá trị
o Mỗi cá thể tổng thể tương ứng với giá trị biến giả o Biến giả chia tổng thể thành phần riêng biệt
Việc lựa chọn gán giá trị ứng với trạng thái nhằm thuận lợi cho việc giải thích ý nghĩa hệ số biến giả Biến giả dùng mơ hình vai trị biến độc lập nên ta thường đánh số D2 trở hệ số kèm thường ký hiệu β2
Khi biến định tính có nhiều hai trạng thái ta sử dụng biến giả có nhiều giá trị (như biến giả nhận giá trị 0,1,2,3, tương ứng cho trạng thái) gặp khó khăn việc nghiên cứu so sánh tương ứng trạng thái số yếu tố kỹ thuật khác nên người ta thường dùng nhiều biến giả với hai giá trị theo quy tắc: Số biến giả sử dụng số trạng thái biến định tính –
(Trong ví dụ 5.1, ví dụ 5.2 ví dụ 5.3 biến định tính gồm hai trạng thái ta sử dụng biến giả Cịn ví dụ 5.4 biến định tính vùng miền có trạng thái nên ta sử dụng biến giả)
Trạng thái biến định tính mà ứng với giá trị biến giả nhận giá trị gọi trạng thái gốc hay trạng thái Việc lựa chọn trạng thái trạng thái tùy ý
(Trong Ví dụ 5.1, trạng thái “Nơng thơn” trạng thái bản; Ví dụ 5.2, trạng thái “Nam” trạng thái bản; Ví dụ 5.3, trạng thái “Phương pháp công nghệ B” trạng thái ví dụ trạng thái trạng thái “Miền trung”) 5.2 Mơ hình có biến độc lập biến giả
5.2.1 Giới thiệu tình
Chẳng hạn muốn xem xét so sánh ảnh hưởng việc dùng phương pháp công nghệ A hay B đến sản lượng doanh nghiệp
Ta tiến hành hồi quy mơ hình với biến phụ thuộc (SL) biến sản lượng doanh nghiệp phụ thuộc vào biến định tính mơ tả việc doanh nghiệp dùng phương pháp công nghệ A hay B
Thật ta tạo biến giả phương pháp công nghệ, ký hiệu “CN”: 1 doanh nghiệp sử dụng phương pháp công nghệ A CN =
0 doanh nghiệp không sử dụng phương pháp công nghệ A (tức sử dụng phương pháp công nghệ B)
(7)Bài 5: Phân tích hồi quy với biến định tính
Mơ hình hồi quy tổng thế SL12CNu Khi sử dụng phương pháp công nghệ A SL12u Khi sử dụng phương pháp công nghệ B SL1u
Hàm hồi quy tổng thể E(SL/CN)12CN Khi sử dụng phương pháp công nghệ A E(SL/CN 1)12
Khi sử dụng phương pháp công nghệ B E(SL/CN 0)1
Nhận xét:
Sản lượng trung bình dùng phương pháp công nghệ A β0+ β2; Sản lượng trung bình dùng phương pháp cơng nghệ B β1
β2 mức chênh lệch sản lượng trung bình doanh nghiệp sử dụng phương pháp công nghệ A hay B
(Trạng thái trạng thái “sử dụng phương pháp cơng nghệ B”) Do đó:
Muốn xem xét có phải sản lượng doanh nghiệp khác dùng hai phương pháp công nghệ A B hay khơng ta thực tốn kiểm định cặp giả thuyết:
o Nếu bác bỏ H0, chấp nhận H1 ta kết luận sản lượng doanh nghiệp khác
nhau dùng hai phương pháp công nghệ A B
o Nếu không bác bỏ H0 ta kết luận sản lượng doanh nghiệp
dùng hai phương pháp công nghệ A B
Muốn xem xét có phải doanh nghiệp dùng phương pháp cơng nghệ A cao ta dùng phương pháp công nghệ B hay khơng ta thực tốn kiểm định cặp giả thuyết:
H0: β2≤
H1: β2>
o Nếu bác bỏ H0, chấp nhận H1 ta kết luận sản lượng doanh nghiệp dùng
phương pháp công nghệ A cao dùng phương pháp công nghệ B
H0: β2 =0
(8)Bài 5: Phân tích hồi quy với biến định tính
o Nếu không bác bỏ H0 ta kết luận sản lượng doanh nghiệp dùng phương
pháp công nghệ A không cao dùng phương pháp công nghệ B Muốn xét xét mức sản lượng doanh nghiệp sử dụng hai phương pháp công
nghệ A B chênh lệch khoảng ta tìm khoảng tin cậy đối xứng hệ số β2
( ) ( )
2 ( 2) / 2 ( 2) /
n k n k
se t se t
(ởđây k=2)
5.2.2 Các ví dụ cụ thể
Ví dụ 5.5:
Giả sử có 100 quan sát hộ gia đình, với CT chi tiêu hộ gia đình (triệu đồng/năm), KV khu vực gia đình sinh sống (với trạng thái thành thị nông thôn)
Tạo biến giả:
1 hộ gia đình sống thành thị
KV =
0 hộ gia đình sống nơng thơn
Tiến hành hồi quy chi tiêu hộ gia đình phụ thuộc vào khu vực gia đình sinh sống:
Mơ hình hồi quy tổng thể CT 12KV u Hộ gia đình thành thị CT 12 u Hộ gia đình nơng thơn CT 1u
Hàm hồi quy tổng thể E(CT/KV)12KV Hộ gia đình thành thị E(CT/KV 1)12
Hộ gia đình nơng thơn E(CT/KV 0)1
Dependent Variable: CT Method: Least Squares Date: 04/17/15 Time: 05:54 Sample: 100
Included observations: 100
Variable Coefficient Std Error t–Statistic Prob
C 194.2407 7.298745 26.61290 0.0000
KV 69.54187 10.76141 6.462151 0.0000
R–squared 0.298795 Mean dependent var 226.2300
Adjusted R–squared 0.291640 F-statistic 41.75939
(9)Bài 5: Phân tích hồi quy với biến định tính
Hàm hồi quy mẫu CTi 12KVi
Hộ gia đình thành thị CT 1 2194, 2407 69,54187 263, 78257
Hộ gia đình nơng thơn CT 1194, 2407
Mức chi tiêu hộ gia đình thành thị 263,78257 triệu đồng/năm Mức chi tiêu hộ gia đình nơng thơn 194,2407 triệu đồng/năm
Mức chênh lệch chi tiêu hộ gia đình thành thị so với nơng thôn 69,54187 triệu đồng/năm
Muốn biết với mức ý nghĩa 5%, có phải mức chi tiêu hộ gia đình thành thị cao mức chi tiêu hộ gia đình nơng thơn hay khơng, ta thực tốn kiểm định giả thuyết thống kê:
Miền bác bỏ giả thuyết H0 là:
) ( 2 , ) ( k n t T se T
W
Giá trị quan sát tiêu chuẩn kiểm định là:
69,54187 6,462151 10,76141
qs
T
n = 935, k = 2, α = 0,05, ( ) (98)
0,05 1,645
n k
t t Tqs>t(n k)
Đủ sở để bác bỏ giả thuyết H0 chấp nhận giả thuyết H1
Kết luận:
Với mức ý nghĩa 5% đủ sở nói mức chi tiêu hộ gia đình thành thị cao nơng thơn
Ví dụ 5.6:
Sử dụng 935 quan sát số liệu ch4bt8.wf1 (trích từ Applied Econometrics, Asteriou – web Palgrave) (Data_giaotrinh_ktl_13/ch4bt8):
Wage (USD/tháng) mức lương người lao động
Urban biến giả nhận giá trị người lao động thành thị, người lao động nông thôn
Tạo biến giả:
1 hộ gia đình sống thành thị Urban =
0 hộ gia đình sống nông thôn H0: β2≤
(10)Bài 5: Phân tích hồi quy với biến định tính
Hàm hồi quy tổng thể: E(Wage/Urban) = 1 + 2Urban Người lao động thành thị: E(Wage/Urban = 1) = 1 + 2 Người lao động nông thôn: E(Wage/Urban = 0) = 1 Dependent Variable: WAGE
Method: Least Squares Included observations: 935
Variable Coefficient Std Error T-Statistic Prob
C 3330.110 24.40500 136.4519 0.0000
URBAN 178.1316 28.80869 6.183260 0.0000
R-squared 0.039365 Mean dependent var 3457.945
Adjusted R-squared 0.038336 F-statistic 38.23270
Sum squared resid 1.47E+08 Prob(F-statistic) 0.000000
Hàm hồi quy mẫu: Wage Urban3330,11178,1316Urban
2
Người lao động
thành thị: 1 3330,11178,13163508,2416
Wage Người lao động
nông thôn: 13330,11
Wage
Muốn tiền cơng trung bình người khu vực thành thị 3508,2416 USD/tháng
Mức tiền công người khu vực nông thôn 3330,11 USD/tháng
Ước lượng điểm mức chênh lệch tiền công người lao động thành thị nông thôn 178,1316 USD/tháng
Muốn biết với độ tin cậy 95% mức chênh lệch lương người thành thị nông thôn ta tìm khoảng tin cậy đối xứng β2
( ) ( )
2 ( 2) / 2 ( 2) /
n k n k
se t se t
n 935, k 2, – 0.95 , ( ) (933)
/ 0,025 1,96
n k
t t ;2 178,1315822
2
( ) 28,80869
se
121,6665498 < β2 < 234,5966146
Kết luận:
Với độ tin cậy 95% mức chênh lệch lương người thành thị nông thôn dao động khoảng (121,6665498; 234,5966146) USD/tháng