Thực tế có rất nhiều trường hợp mà biến độc lập ta gặp là biến định tính, thể hiện bởi một số trạng thái (còn gọi là tính chất hay các phạm trù) như biến mô tả về giới tính, tôn giáo, c[r]
(1)BÀI PHÂN TÍCH HỒI QUY VỚI BIẾN ĐỊNH TÍNH
Hướng dẫn học
Các trước nghiên cứu biến độc lập biến định lượng, tức giá trị chúng đo số Ví dụ biến: chi tiêu, thu nhập, sản lượng, vốn, lao động,
Bài ta quan tâm đến việc đưa biến định tính vào mơ hình vai trị biến độc lập Mục 5.1 trình bày khái niệm biến giả, cách dùng biến giả nhằm lượng hóa biến định tính Mục 5.2 giới thiệu mơ hình có biến định tính biến độc lập mục 5.3 trường hợp mơ hình hồi quy có biến độc lập biến định lượng biến định tính
Để học tốt sinh viên cần thực hiện:
Học lịch trình mơn học theo tuần, đọc kĩ khái niệm Theo dõi ví dụ hiểu kết
Đọc tài liệu: Nguyễn Quang Dong, Nguyễn Thị Minh, 2012, Giáo trình kinh tế lượng, NXB Đại học Kinh tế quốc dân
Sinh viên tự học, làm việc theo nhóm, trao đổi với giảng viên Tham khảo thông tin từ trang Web môn học
Nội dung:
Khái niệm biến giả;
Mơ hình có biến độc lập biến giả;
Mơ hình có biến độc lập biến giả biến định lượng Mục tiêu:
Sau học xong này, sinh viên cần đảm bảo yêu cầu sau: Hiểu rõ khái niệm biến giả;
Biết cách dùng biến giả vai trị biến độc lập mơ hình hồi quy;
(2)Tình dẫn nhập
Thực tế có nhiều trường hợp mà biến độc lập ta gặp biến định tính, thể số trạng thái (cịn gọi tính chất hay phạm trù) biến mơ tả giới tính, tơn giáo, chủng tộc, vùng miền, hình thức doanh nghiệp,
Tình huống 1:
Trong ví dụ học trước, hồi quy chi tiêu hộ gia đình phụ thuộc vào thu nhập số người hộ Có ý kiến cho hành vi chi tiêu hộ gia đình cịn phụ thuộc vào yếu tố khu vực hộ gia đình sinh sống để xem xét vấn đề ta cần trả lời câu hỏi:
Mơ hình kinh tế lượng lựa chọn có dạng nào? Mơ tả chất biến phụ thuộc biến độc lập
Khi đưa biến “Khu vực” (nhận giá trị tương ứng hộ gia đình thành thị hay nơng thơn) vào mơ hình vai trị biến độc lập ta cần làm nào?
Cách đưa biến trung gian (biến giả nhằm lượng hóa biến định tính) vào mơ nào? Cách phân tích sao?
Tình huống 2:
Ta muốn xem xét doanh nghiệp thu nhập nhân viên phụ thuộc vào yếu tố giới tính nhân viên hay khơng có câu hỏi sau xảy ra:
Ta phải xây dựng mơ hình hồi quy với biến phụ thuộc, biến độc lập gì? Cấu trúc mơ nào?
Bản chất số liệu biến mơ hình đo số nào?
Khi lựa chọn mơ hình tuyến tính hồi quy biến phụ thuộc biến đo mức lương khởi điểm nhân viên mà doanh nghiệp chi trả (biến định lượng) phụ thuộc vào biến giải thích biến giới tính (biến định tính) với hai phạm trù nam nữ Một số câu hỏi cần quan tâm là:
o Muốn “lượng hóa’’biến định tính giới tính với trạng thái nam nữ làm nào? o Khi dùng biến giả thực mục đích cách đưa biến giả vào mơ hình tiến hành
phân tích kết sao? Tình huống 3:
Ta muốn xem xét sản lượng doanh nghiệp phụ thuộc vào việc sử dụng phương pháp công nghệ A (truyền thống) hay B (hiện đại)?
Như ta cần quan tâm đến cách lượng hóa yếu tố định tính “Phương pháp công nghệ” (với hai trạng thái doanh nghiệp sử dụng phương pháp công nghệ A, B” ta cần trả lời câu hỏi:
Xây dựng mơ hình hồi quy với biến phụ thuộc, biến độc lập gì? Cấu trúc mơ nào?
Bản chất số liệu biến mơ nào? Tình huống 4:
(3) Ở mơ hình hồi quy kinh tế lượng xây dựng với biến hồi quy nào?
Những biến mơ hình có giá trị số, chữ (tức biến biến định lượng, biến biến định tính?)
Cách thức đưa biến giả tiến hành phân tích nào?
(4)5.1 Khái niệm biến giá
5.1.1 Giới thiệu biến định tính biến giả
Trong kinh tế xã hội có nhiều yếu tố đặc trưng trạng thái tính chất hay phạm trù mà ta gọi biến định tính Chẳng hạn yếu tố giới tính gồm hai trạng thái nam nữ, yếu tố quê quán đặc trưng hai trạng thái thành thị nông thôn, yếu tố vùng miền chia ba trạng thái miền Bắc, miền Trung miền Nam,…
Để đưa thuộc tính biến định tính vào mơ hình hồi quy định lượng ta cần phải “lượng hóa” thuộc tính cách dùng biến giả (dummy variable) nhận hai giá trị
5.1.2 Các ví dụ Ví dụ 5.1:
Trong tình ta cần hồi quy với biến định tính “Khu vực” (với hai trạng thái thành thị nơng thơn) thơng tin biến “Khu vực” thể biến giả “KV” sau:
hộ gia đình sống thành thị
KV =
hộ gia đình sống nơng thơn Như số liệu với biến giả khu vực:
Thứ tự quan sát Khu vực KV
1 Thành thị
2 Nông thôn
3 Nông thôn
4 Thành thị
5 Nông thôn
n Thành thị
Ví dụ 5.2:
Trong tình 2, thơng tin biến định tính “Giới tính” nhân viên (với hai trạng thái nam nữ) thể biến giả “D” sau:
1 người nam D=
0 người nữ Như số liệu với biến giả giới tính:
Thứ tự quan sát Giới tính D
1 Nữ
2 Nam
3 Nam
(5)5 Nam
n Nữ
Ví dụ 5.3:
Trong tình ta có thơng tin biến “Phương pháp công nghệ” (với hai trạng thái doanh nghiệp dùng phương pháp cơng nghệ A hay B) thể biến giả “CN” sau:
1 doanh nghiệp dùng phương pháp công nghệ A CN =
0 doanh nghiệp dùng phương pháp công nghệ B Số liệu với biến giả phương pháp công nghệ:
Thứ tự quan sát Phương pháp công nghệ sử dụng CN
1 A
2 B
3 A
4 B
5 B
n A
Ví dụ 5.4:
Trong tình nêu trên, thơng tin biến “Vùng miền” (với ba trạng thái miền bắc, miền trung miền nam) thể hai biến giả “D2” “D3” sau:
1 quan sát thuộc miền Bắc D2 =
0 quan sát không thuộc miền Bắc
Số liệu với biến giả vùng miền:
Thứ tự quan sát Vùng miền D2 D3
1 Miền Bắc
2 Miền Bắc
3 Miền Trung 0
4 Miền Nam
5 Miền Trung 0
n Miền Bắc
1 quan sát thuộc miền Nam D3 =
(6)Nhận xét:
Vì ta xét biến định tính có hữu hạn trạng thái cá thể tổng thể tương ứng với trạng thái định, cá thể không chuyển từ trạng thái sang trạng thái khác nên biến giả sử dụng có đặc điểm sau:
o Biến giả nhận giá trị
o Mỗi cá thể tổng thể tương ứng với giá trị biến giả o Biến giả chia tổng thể thành phần riêng biệt
Việc lựa chọn gán giá trị ứng với trạng thái nhằm thuận lợi cho việc giải thích ý nghĩa hệ số biến giả Biến giả dùng mơ hình vai trị biến độc lập nên ta thường đánh số D2 trở hệ số kèm thường ký hiệu β2
Khi biến định tính có nhiều hai trạng thái ta sử dụng biến giả có nhiều giá trị (như biến giả nhận giá trị 0,1,2,3, tương ứng cho trạng thái) gặp khó khăn việc nghiên cứu so sánh tương ứng trạng thái số yếu tố kỹ thuật khác nên người ta thường dùng nhiều biến giả với hai giá trị theo quy tắc: Số biến giả sử dụng số trạng thái biến định tính –
(Trong ví dụ 5.1, ví dụ 5.2 ví dụ 5.3 biến định tính gồm hai trạng thái ta sử dụng biến giả Cịn ví dụ 5.4 biến định tính vùng miền có trạng thái nên ta sử dụng biến giả)
Trạng thái biến định tính mà ứng với giá trị biến giả nhận giá trị gọi trạng thái gốc hay trạng thái Việc lựa chọn trạng thái trạng thái tùy ý
(Trong Ví dụ 5.1, trạng thái “Nơng thơn” trạng thái bản; Ví dụ 5.2, trạng thái “Nam” trạng thái bản; Ví dụ 5.3, trạng thái “Phương pháp cơng nghệ B” trạng thái ví dụ trạng thái trạng thái “Miền trung”) 5.2 Mơ hình có biến độc lập biến giả
5.2.1 Giới thiệu tình
Chẳng hạn muốn xem xét so sánh ảnh hưởng việc dùng phương pháp công nghệ A hay B đến sản lượng doanh nghiệp
Ta tiến hành hồi quy mơ hình với biến phụ thuộc (SL) biến sản lượng doanh nghiệp phụ thuộc vào biến định tính mơ tả việc doanh nghiệp dùng phương pháp công nghệ A hay B
Thật ta tạo biến giả phương pháp công nghệ, ký hiệu “CN”: 1 doanh nghiệp sử dụng phương pháp công nghệ A CN =
0 doanh nghiệp không sử dụng phương pháp công nghệ A (tức sử dụng phương pháp công nghệ B)
(7)Mơ hình hồi quy tổng thế SL12CNu
Khi sử dụng phương pháp công nghệ A SL12u
Khi sử dụng phương pháp công nghệ B SL1u
Hàm hồi quy tổng thể E(SL/CN)12CN
Khi sử dụng phương pháp công nghệ A E(SL/CN 1)12 Khi sử dụng phương pháp công nghệ B E(SL/CN 0)1
Nhận xét:
Sản lượng trung bình dùng phương pháp công nghệ A β0+ β2; Sản lượng trung bình dùng phương pháp cơng nghệ B β1
β2 mức chênh lệch sản lượng trung bình doanh nghiệp sử dụng phương pháp công nghệ A hay B
(Trạng thái trạng thái “sử dụng phương pháp cơng nghệ B”) Do đó:
Muốn xem xét có phải sản lượng doanh nghiệp khác dùng hai phương pháp công nghệ A B hay khơng ta thực tốn kiểm định cặp giả thuyết:
o Nếu bác bỏ H0, chấp nhận H1 ta kết luận sản lượng doanh nghiệp khác
nhau dùng hai phương pháp công nghệ A B
o Nếu không bác bỏ H0 ta kết luận sản lượng doanh nghiệp
dùng hai phương pháp công nghệ A B
Muốn xem xét có phải doanh nghiệp dùng phương pháp công nghệ A cao ta dùng phương pháp cơng nghệ B hay khơng ta thực tốn kiểm định cặp giả thuyết:
H0: β2≤ H1: β2>
o Nếu bác bỏ H0, chấp nhận H1 ta kết luận sản lượng doanh nghiệp dùng
phương pháp công nghệ A cao dùng phương pháp công nghệ B H0: β2 =0
(8)o Nếu không bác bỏ H0 ta kết luận sản lượng doanh nghiệp dùng phương
pháp công nghệ A không cao dùng phương pháp công nghệ B Muốn xét xét mức sản lượng doanh nghiệp sử dụng hai phương pháp công
nghệ A B chênh lệch khoảng ta tìm khoảng tin cậy đối xứng hệ số β2
( ) ( )
2 ( 2) / 2 ( 2) /
n k n k
se t se t
(ởđây k=2) 5.2.2 Các ví dụ cụ thể
Ví dụ 5.5:
Giả sử có 100 quan sát hộ gia đình, với CT chi tiêu hộ gia đình (triệu đồng/năm), KV khu vực gia đình sinh sống (với trạng thái thành thị nông thôn)
Tạo biến giả:
1 hộ gia đình sống thành thị KV =
0 hộ gia đình sống nông thôn
Tiến hành hồi quy chi tiêu hộ gia đình phụ thuộc vào khu vực gia đình sinh sống:
Mơ hình hồi quy tổng thể CT 12KV u
Hộ gia đình thành thị CT 12 u
Hộ gia đình nông thôn CT 1u
Hàm hồi quy tổng thể E(CT/KV)12KV
Hộ gia đình thành thị E(CT/KV 1)12 Hộ gia đình nơng thơn E(CT/KV 0)1 Dependent Variable: CT
Method: Least Squares Date: 04/17/15 Time: 05:54 Sample: 100
Included observations: 100
Variable Coefficient Std Error t–Statistic Prob
C 194.2407 7.298745 26.61290 0.0000
KV 69.54187 10.76141 6.462151 0.0000
R–squared 0.298795 Mean dependent var 226.2300
Adjusted R–squared 0.291640 F-statistic 41.75939
(9)Hàm hồi quy mẫu CTi 12KVi
Hộ gia đình thành thị CT 1 2194, 2407 69,54187 263, 78257 Hộ gia đình nơng thơn CT 1194, 2407
Mức chi tiêu hộ gia đình thành thị 263,78257 triệu đồng/năm Mức chi tiêu hộ gia đình nơng thơn 194,2407 triệu đồng/năm
Mức chênh lệch chi tiêu hộ gia đình thành thị so với nơng thơn 69,54187 triệu đồng/năm
Muốn biết với mức ý nghĩa 5%, có phải mức chi tiêu hộ gia đình thành thị cao mức chi tiêu hộ gia đình nơng thơn hay khơng, ta thực toán kiểm định giả thuyết thống kê:
Miền bác bỏ giả thuyết H0 là:
) (
2 ,
) (
k n
t T se T
W
Giá trị quan sát tiêu chuẩn kiểm định là:
69,54187 6,462151 10,76141
qs
T
n = 935, k = 2, α = 0,05, ( ) (98)
0,05 1,645
n k
t t Tqs>t(n k)
Đủ sở để bác bỏ giả thuyết H0 chấp nhận giả thuyết H1 Kết luận:
Với mức ý nghĩa 5% đủ sở nói mức chi tiêu hộ gia đình thành thị cao nơng thơn
Ví dụ 5.6:
Sử dụng 935 quan sát số liệu ch4bt8.wf1 (trích từ Applied Econometrics, Asteriou – web Palgrave) (Data_giaotrinh_ktl_13/ch4bt8):
Wage (USD/tháng) mức lương người lao động
Urban biến giả nhận giá trị người lao động thành thị, người lao động nông thôn
Tạo biến giả:
1 hộ gia đình sống thành thị Urban =
0 hộ gia đình sống nơng thơn H0: β2≤
(10)Hàm hồi quy tổng thể: E(Wage/Urban) = 1 + 2Urban Người lao động thành thị: E(Wage/Urban = 1) = 1 + 2 Người lao động nông thôn: E(Wage/Urban = 0) = 1 Dependent Variable: WAGE
Method: Least Squares Included observations: 935
Variable Coefficient Std Error T-Statistic Prob
C 3330.110 24.40500 136.4519 0.0000
URBAN 178.1316 28.80869 6.183260 0.0000
R-squared 0.039365 Mean dependent var 3457.945
Adjusted R-squared 0.038336 F-statistic 38.23270
Sum squared resid 1.47E+08 Prob(F-statistic) 0.000000
Hàm hồi quy mẫu: Wage Urban3330,11178,1316Urban
2
1
Người lao động
thành thị: 1 3330,11178,13163508,2416
Wage
Người lao động
nông thôn: 13330,11
Wage
Muốn tiền công trung bình người khu vực thành thị 3508,2416 USD/tháng
Mức tiền công người khu vực nông thôn 3330,11 USD/tháng
Ước lượng điểm mức chênh lệch tiền công người lao động thành thị nông thôn 178,1316 USD/tháng
Muốn biết với độ tin cậy 95% mức chênh lệch lương người thành thị nơng thơn ta tìm khoảng tin cậy đối xứng β2
( ) ( )
2 ( 2) / 2 ( 2) /
n k n k
se t se t
n 935, k 2, – 0.95 , ( ) (933)
/ 0,025 1,96
n k
t t ;2 178,1315822
2
( ) 28,80869 se
121,6665498 < β2 < 234,5966146 Kết luận:
Với độ tin cậy 95% mức chênh lệch lương người thành thị nông thôn dao động khoảng (121,6665498; 234,5966146) USD/tháng
(11)H0: β2≤ H1: β2> Miền bác bỏ giả thuyết H0 là:
) (
2 ,
) (
k n
t T se T
W
Giá trị quan sát tiêu chuẩn kiểm định là:
178,1315822 6,18326 28,80869
qs
T
n = 935, k = 2, α = 0,05, ( ) (933)
0,05 1,645
n k
t t → Tqs>t(n k)
Chấp nhận giả thuyết H1 Kết luận:
Với mức ý nghĩa 5% đủ sở nói lương người thành thị cao lương người nông thôn
5.3 Mơ hình có biến độc lập biến giả biến định lượng 5.3.1 Giới thiệu tình
Trong mục 5.2 nghiên cứu mơ hình hồi quy có biến độc lập biến định tính (được lượng hóa biến giả nhận giá trị 1), mục ta xét trường hợp biến độc lập mơ hình có biến định lượng thơng thường
Chẳng hạn muốn nghiên cứu, so sánh mức lương người lao động phụ thuộc vào số năm học có khác nam nữ hay không? Ta xây dựng mơ hình hồi quy với biến:
Wage (USD/tháng) mức lương người lao động Educ số năm học người lao động
Male biến giả (lượng hóa cho biến giới tính) nhận giá trị quan sát nam, quan sát nữ
Mơ hình hồi quy tổng thể:
Lao động nam: Wage12 3Educu Lao động nữ: Wage 1 3Educ u
1
(12)Nhận xét:
o Khi số năm học tăng năm lương trung bình người lao động tăng β3
đơn vị
o Khi số năm học lương trung bình nam cao nữ β2
đơn vị
o Nếu β2 > có nghĩa số năm học, lương trung bình nam cao
hơn nữ
o Nếu β2 = có nghĩa số năm học, lương trung bình nam
nữ
o Nếu 2 < có nghĩa số năm học, tiền cơng nam thấp nữ
Muốn biết việc điến biến giả Male vào mơ hình có ý nghĩa hay khơng (hay xem xét hệ số β2 có ý nghĩa thống kê khơng) ta tiến hành kiểm định cặp giả thuyết thống kê:
o Nếu bác bỏ H0, chấp nhận H1 ta kết luận biến Male có mơ hình cần
thiết (hay hệ số β2 có ý nghĩa thống kê)
o Nếu chưa bác bỏ H0 ta kết luận ta kết luận biến Male có mơ hình
khơng cần thiết (hay hệ số β2 khơng có ý nghĩa thống kê)
Muốn xem số năm học mức lương lao động nam cao lương lao động nữ hay không ta tiến hành kiểm định cặp giả thuyết thống kê:
o Nếu bác bỏ H0, chấp nhận H1 ta kết luận có số năm học tiền
cơng nam cao tiền công nữ H0: β2 =
H1: β2≠
H0: β2≤ H1: β2>
E(Wage/Educ) = 1 + 3Educ Wage
Educ
E(Wage/Educ) = 1 + 2 + 3Educ
2
(13)o Nếu nhận giả thuyết H0 ta kết luận có số năm học tiền cơng
nam không cao tiền công nữ
Muốn xét xét mức chênh lệch mức lương nam nữ (khi có số năm học) biến động khoảng ta ước lượng hệ số β2 khoảng tin cậy đối xứng:
( ) ( )
2 ( 2) / 2 ( 2) /
n k n k
se t se t
(ở k = 3) 5.3.2 Các ví dụ cụ thể
Ví dụ 5.7:
Tiếp tục dùng số liệu cho 100 hộ gia đình Ta hồi quy chi tiêu hộ gia đình phụ thuộc vào biến: Biến thu nhập biến “KV”
CT: Chi tiêu hộ gia đình(triệu đồng/năm) TN: Thu nhập hộ gia đình (triệu đồng/năm)
KV: Biến giả khu vực gia đình sình sống (lượng hóa cho biến định tính với trạng thái thành thị nơng thơn)
1 hộ gia đình sống thành thị
KV =
0 hộ gia đình sống nơng thơn
Mơ hình hồi quy tổng thể: CT 1 2KV 3TN u
Các hộ gia đình thành thị: Các hộ gia đình nơng thơn:
1
CT TN u
1
CT TN u
Dependent Variable: CT Method: Least Squares Included observations: 100
Variable Coefficient Std Error t–Statistic Prob
C 59.62006 6.837323 8.719796 0.0000
KV 30.27209 4.781050 6.331681 0.0000
TN 0.593527 0.027074 21.92211 0.0000
R–squared 0.882238 Mean dependent var 226.2300
Adjusted R–squared 0.879810 F–statistic 363.3475
(14) Mức chi tiêu tối thiểu hộ gia đình thành thị là:
59,62006 + 30,27209 = 89,89215triệu đồng/năm
Mức chi tiêu tối thiểu hộ gia đình nông thôn 59.62006triệu đồng/năm Mức chênh lệch chi tiêu hộ gia đình thành thị so với nông thôn
30,27209 triệu đồng/năm
Muốn biết với độ tin cậy 95%, có mức thu nhập mức chênh lệch chi tiêu hộ gia đình thành thị nơng thơn dao động khoảng ta tìm khoảng tin cậy đối xứng β2
( ) ( )
2 ( 2) / 2 ( 2) /
n k n k
se t se t
n = 100, k = 3, α = 0,95, ( ) (97)
/ 0,025 1,96
n k
t t ; 2 30,27209
; ( ) 4,7810502
se 20,901232 < β2 < 39,642948
Kết luận:
Với độ tin cậy 95%, có mức thu nhập mức chênh lệch chi tiêu hộ gia đình thành thị nơng thơn dao động khoảng (20,901232, 39,642948) USD/tháng
Muốn biết với mức ý nghĩa 5%, có phải mức chi tiêu hộ gia đình thành thị nơng thôn khác hay không, ta thực toán kiểm định giả thuyết thống kê:
H0: β2 = H1: β2≠0 Miền bác bỏ giả thuyết H0 là:
) ( / 2 , ) ( k n t T se T
W
Giá trị quan sát tiêu chuẩn kiểm định là:
30,27209 6,331681 4,781050 qs T
n = 100, k = 3, α = 0,05, ( ) (97)
0,025 1,96
n k
t t → │Tqs│> ( ) /
n k
t
Chấp nhận giả thuyết H1 Hàm hồi quy mẫu:
Hộ gia đình thành thị: Hộ gia đình nơng thơn:
i
CT KVi TNi
i
i
CT ( )
(59,62006 + 0,593527) + 30,27209TN
i TN
i
i
CT
59,62006 + 30,27209TN
(15)Kết luận:
Với mức ý nghĩa 5% đủ sở nói mức chi tiêu hộ gia đình thành thị nông thôn khác
Muốn biết với mức ý nghĩa 5%, có phải mức thu nhập mức chi tiêu hộ gia đình thành thị cao so với hộ gia đình nơng thơn hay khơng, ta thực toán kiểm định giả thuyết thống kê:
H0: β2≤ H1: β2 > Miền bác bỏ giả thuyết H0 là:
) (
2 ,
) (
k n
t T se T
W
Giá trị quan sát tiêu chuẩn kiểm định là:
30,27209 6,331681 4,781050
qs
T
n = 100, k = 3, α = 0,05, ( ) (97)
0,05 1,645
n k
t t → Tqs>t(n k)
Chấp nhận giả thuyết H1 Kết luận:
Với mức ý nghĩa 5% đủ sở nói có mức thu nhập chi tiêu hộ gia đình thành thị cao so với nông thôn
Ví dụ 5.8:
Tiếp tục dùng số liệu (Sử dụng 935 quan sát số liệu ch4bt8.wf1 (trích từ Applied Econometrics, Asteriou–web Palgrave) (Data_giaotrinh _ktl_13/ch4bt8)
Dependent Variable: WAGE Method: Least Squares Date: 04/18/15 Time: 15:13 Sample: 935
Included observations: 935
Variable Coefficient Std Error t–Statistic Prob
C 2803.999 53.16238 52.74405 0.0000
MALE 580.8848 17.69155 32.83402 0.0000
EDUC 30.10292 3.986869 7.550516 0.0000
R–squared 0.585947 Mean dependent var 3457.945
Adjusted R–squared 0.585059 F–statistic 659.4609
(16)Hàm hồi quy mẫu: Wage 12Male3Educ
Lao động nam:
Educ Educ Wage 10292 , 30 ) 69155 , 17 8848 , 580 ( ) (1 2 3
Lao động nữ: Wage 13Educ 580,884830,10292Educ
Ước lượng điểm mức chênh lệch lương nam nữ (khi có số năm học) 580,8848 USD/tháng
Muốn biết với độ tin cậy 95%, có số năm học mức chênh lệch lương nam nữ ta tìm khoảng tin cậy đối xứng β2:
( ) ( )
2 ( 2) / 2 ( 2) /
n k n k
se t se t
n = 935, k = 3, – α = 0,95, ( ) (932)
/ 0,025 1,96
n k
t t ;
2 580,8848
;
2
( ) 17,69155 se
546,209362 < β2 < 615,560238 Kết luận:
Với độ tin cậy 95%, có số năm học mức chênh lệch lương nam nữ dao động khoảng (546,209362, 615,560238) USD/tháng
Muốn biết với mức ý nghĩa 5%, có phải lương nam nữ (hay hệ số biến giả khơng có ý nghĩa thống kê), ta thực toán kiểm định giả thuyết thống kê:
H0: β2 = H1: β2≠ Miền bác bỏ giả thuyết H0 là:
) ( / 2 , ) ( k n t T se T
W
Giá trị quan sát tiêu chuẩn kiểm định là:
580,8848 32,83402528 17,69155 qs T
n = 935, k = 3, α = 0,05, ( ) (932)
/ 0,025 1,96
n k
t t │Tqs│> ( ) /
n k
t
Đủ sở chấp nhận giả thuyết H1 Kết luận:
(17) Muốn biết với mức ý nghĩa 5%, có phải số năm học lương nữ thấp nam (hay lương trung bình nam cao nữ) hay khơng, ta thực tốn kiểm định giả thuyết thống kê:
H0: β2≤ H1: β2> Miền bác bỏ giả thuyết H0 là:
) (
2 ,
) (
k n
t T se T
W
Giá trị quan sát tiêu chuẩn kiểm định là:
580,8848
32,83402528 17,69155
qs
T
n = 935, k = 3, α = 0,05, ( ) (932)
/ 0,05 1,645
n k
t t Tqs>t(n k)
Đủ sở chấp nhận giả thuyết H1 Kết luận:
Với mức ý nghĩa 5% đủ sở nói có số năm học tiền cơng trung bình nam cao nữ (hay lương trung bình nữ thấp nam) Ví dụ 5.9:
Dùng số liệu (Sử dụng 33 quan sát số liệu ch3bt4.wf1 (trích từ Data_giaotrinh _ktl_13/ch3bt4) với biến:
CT, TN chi têu thu nhập người lao động theo tháng (triệu đồng) GT biến giả nhằm lượng hóa biến giới tính người lao động (GT = ứng với lao động nam, GT = ứng với lao động nữ)
Dependent Variable: CT Method: Least Squares Date: 04/18/15 Time: 18:16 Sample (adjusted): 33
Included observations: 33 after adjustments
Variable Coefficient Std Error t–Statistic Prob
C 68.73748 7.840218 8.767292 0.0000
Mô hình hồi quy tổng thể: CT 1 2GT 3TN u
Lao động nam: Lao động nữ:
1
CT TN u
1
(18)GT 11.63350 5.230464 2.224181 0.0338
TN 0.852228 0.003835 222.2053 0.0000
R–squared 0.999404 Mean dependent var 1642.161
Adjusted R–squared 0.999365 F–statistic 25169.39
Sum squared resid 5919.280 Prob(F–statistic) 0.000000 Ước lượng điểm mức chênh lệch chi tiêu nam nữ (khi có thu
nhập) 11,63350 triệu đồng/tháng
Muốn biết với độ tin cậy 95% mức chênh lệch chi tiêu nam nữ (khi có thu nhập) dao động khoảng ta tìm khoảng tin cậy đối xứng β2
( ) ( )
2 ( 2) / 2 ( 2) /
n k n k
se t se t
n 33, k 3, – 0,95 n = 33, k = 3, – α = 0,95, ( ) (30)
/ 0,025 2,042
n k
t t ;
2 11, 63350
; se( ) 5, 2304642
0,952892512 < β2 < 22,333957488 Kết luận:
Với độ tin cậy 95% mức chênh lệch chi tiêu trung bình nam nữ (khi thu nhập) dao động khoảng (0,952892512, 22,333957488) triệu đồng/tháng
Muốn biết với mức ý nghĩa 5%, có tiêu nam nữ (hay biến giả GT có mặt hồi quy không cần thiết), ta thực toán kiểm định giả thuyết thống kê:
Miền bác bỏ giả thuyết H0 là:
) ( / 2 , ) ( k n t T se T
W
Giá trị quan sát tiêu chuẩn kiểm định là:
11,63350 2,224181 5,230464
qs
T
n = 33, k = 3, α = 0,05, ( ) (30)
/ 0,025 2,042
n k
t t │Tqs│> ( ) /
n k
t bác bỏ H0, chấp nhận H1
Kết luận: Với mức ý nghĩa 5% đủ sở nói chi tiêu nam nữ có mức thu nhập khác
(19) Muốn biết với mức ý nghĩa 5%, có tiêu nam cao nữ (khi có thu nhập) hay khơng, ta thực tốn kiểm định giả thuyết thống kê:
H0: β2≤ H1: β2> Miền bác bỏ giả thuyết H0 là:
) ( 2 , ) ( k n t T se T
W
Giá trị quan sát tiêu chuẩn kiểm định là:
11,63350 2,224181 5,230464
qs
T
n = 33, k = 3, α = 0,05, ( ) (30)
0,05 1,697
n k
t t Tqs > t(n k)
bác bỏ H0, chấp nhận H1 Kết luận:
Với mức ý nghĩa 5% đủ sở nói có mức thu nhập chi tiêu nam cao so với nữ
Muốn biết với mức ý nghĩa 5%, có phải thu nhập tăng lên triệu đồng mức chi tiêu tăng nhiều 500 nghìn đồng hay khơng (đối với nam nữ)? Ta thực toán kiểm định giả thuyết thống kê:
H0: β3≤0,85
H1: β3> 0,85 Miền bác bỏ giả thuyết H0 là:
) ( 3 , ) ( ,
0 T t n k
se T
W
5809 , 003835 , 85 , 852228 ,
0
qs
T
n = 33, k = 3, α = 0,05, ( ) (30)
0,05 1,697
n k
t t Tqs < t(n k)
chưa bác bỏ H0 Kết luận: Với mức ý nghĩa 5% đủ sở nói thu nhập người lao động tăng lên triệu đồng mức chi tiêu họ tăng nhiều 0,85 triệu đồng
Có ý kiến cho mức chi tiêu biên thấp triệu đồng
Với mức ý nghĩa 5% nhận xét ý kiến này.Ta thực toán kiểm định giả thuyết thống kê:
(20)Miền bác bỏ giả thuyết H0 là:
) (
3 ,
) (
1 n k
t T se T
W
Giá trị quan sát tiêu chuẩn kiểm định là:
532464 ,
38 003835
,
1 85228 ,
0
qs
T
n = 33, k = 3, α = 0,05, ( ) (30)
0,05 1,697
n k
t t
Tqs< t(n k )
Bác bỏ H0 chấp nhận H1 Kết luận:
Với mức ý nghĩa 5% đủ sở nói mức chi tiêu biên người lao động thấp triệu đồng/tháng
(21)Tóm lược cuối
Trong thực tế, có nhiều biến kinh tế xã hội biến định tính, nhận giá trị trạng thái (hay phạm trù, tính chất) Bài học nhằm trang bị cách để dùng biến giả đại diện cho biến định tính mơ hình hồi quy
Trường hợp biến định tính có trạng thái, sử dụng biến giá giả để biểu diễn biến định tính Khi biến định tính có m trạng thái, cần sử dụng m biến giả Hệ số biến giả dùng để so sánh chênh lệch hệ số chặn nhóm trạng thái
biến định tính
Việc ước lượng kiểm định hệ số ta thực hệ số hồi quy thông thường Bài học xem xét trường hợp biến giả đại diện cho biến định tính vai trị biến độc
(22)Câu hỏi ôn tập
1. Thế biến định tính, biến giả? Tại lại gọi biến giả? So sánh khác biến định tính biến giả?
2. Thế gọi trạng thái “gốc” (còn gọi trạng thái bản) biến định tính? Biến giả mơ hình có tính biến (thật) có mơ hình hồi quy khơng? Tại sao? 3. Khi hồi quy với biến độc lập biến định tính làm nào? Trường hợp biến định
tính có m trạng thái cách đặt biến giả sao?
4. Trong học biến định tính đóng vai trị biến độc lập hay biến phụ thuộc?
5. Biến có thứ bậc (gọi biến thứ bậc, có giá trị xếp theo thứ tự) biến định tính hay định lượng?
6. Khi hồi quy với biến “Hạnh kiểm” xếp loại học sinh: Tốt Khá Trung bình Kém
Thì ta xem xét biến “Hạnh kiểm” biến định lượng nhận giá trị 1,2,3,4 khơng? Có dùng biến giả để đại diện cho biến không?
7. Hệ số biến giả mơ hình hồi quy có ý nghĩa gì?
8. Ước lượng điểm hệ số biến giả mơ hình < khơng? Nếu xảy phản ánh điều gì?
9. Chênh lệch hệ số chặn mơ hình nhóm trạng thái biến định tính = 0? Nếu xảy cho biết điều gì?