1. Trang chủ
  2. » Kinh Doanh - Tiếp Thị

Bài giảng Kinh tế lượng 1 - Bài 5: Phân tích hồi quy với biến định tính

22 15 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 22
Dung lượng 445,48 KB

Nội dung

Thực tế có rất nhiều trường hợp mà biến độc lập ta gặp là biến định tính, thể hiện bởi một số trạng thái (còn gọi là tính chất hay các phạm trù) như biến mô tả về giới tính, tôn giáo, c[r]

(1)

BÀI PHÂN TÍCH HỒI QUY VỚI BIẾN ĐỊNH TÍNH

Hướng dẫn học

Các trước nghiên cứu biến độc lập biến định lượng, tức giá trị chúng đo số Ví dụ biến: chi tiêu, thu nhập, sản lượng, vốn, lao động,

Bài ta quan tâm đến việc đưa biến định tính vào mơ hình vai trị biến độc lập Mục 5.1 trình bày khái niệm biến giả, cách dùng biến giả nhằm lượng hóa biến định tính Mục 5.2 giới thiệu mơ hình có biến định tính biến độc lập mục 5.3 trường hợp mơ hình hồi quy có biến độc lập biến định lượng biến định tính

Để học tốt sinh viên cần thực hiện:

 Học lịch trình mơn học theo tuần, đọc kĩ khái niệm  Theo dõi ví dụ hiểu kết

 Đọc tài liệu: Nguyễn Quang Dong, Nguyễn Thị Minh, 2012, Giáo trình kinh tế lượng, NXB Đại học Kinh tế quốc dân

 Sinh viên tự học, làm việc theo nhóm, trao đổi với giảng viên  Tham khảo thông tin từ trang Web môn học

Nội dung:

 Khái niệm biến giả;

 Mơ hình có biến độc lập biến giả;

 Mơ hình có biến độc lập biến giả biến định lượng Mục tiêu:

Sau học xong này, sinh viên cần đảm bảo yêu cầu sau:  Hiểu rõ khái niệm biến giả;

 Biết cách dùng biến giả vai trị biến độc lập mơ hình hồi quy;

(2)

Tình dẫn nhập

Thực tế có nhiều trường hợp mà biến độc lập ta gặp biến định tính, thể số trạng thái (cịn gọi tính chất hay phạm trù) biến mơ tả giới tính, tơn giáo, chủng tộc, vùng miền, hình thức doanh nghiệp,

Tình hung 1:

Trong ví dụ học trước, hồi quy chi tiêu hộ gia đình phụ thuộc vào thu nhập số người hộ Có ý kiến cho hành vi chi tiêu hộ gia đình cịn phụ thuộc vào yếu tố khu vực hộ gia đình sinh sống để xem xét vấn đề ta cần trả lời câu hỏi:

 Mơ hình kinh tế lượng lựa chọn có dạng nào? Mơ tả chất biến phụ thuộc biến độc lập

 Khi đưa biến “Khu vực” (nhận giá trị tương ứng hộ gia đình thành thị hay nơng thơn) vào mơ hình vai trị biến độc lập ta cần làm nào?

 Cách đưa biến trung gian (biến giả nhằm lượng hóa biến định tính) vào mơ nào? Cách phân tích sao?

Tình hung 2:

Ta muốn xem xét doanh nghiệp thu nhập nhân viên phụ thuộc vào yếu tố giới tính nhân viên hay khơng có câu hỏi sau xảy ra:

 Ta phải xây dựng mơ hình hồi quy với biến phụ thuộc, biến độc lập gì?  Cấu trúc mơ nào?

 Bản chất số liệu biến mơ hình đo số nào?

 Khi lựa chọn mơ hình tuyến tính hồi quy biến phụ thuộc biến đo mức lương khởi điểm nhân viên mà doanh nghiệp chi trả (biến định lượng) phụ thuộc vào biến giải thích biến giới tính (biến định tính) với hai phạm trù nam nữ Một số câu hỏi cần quan tâm là:

o Muốn “lượng hóa’’biến định tính giới tính với trạng thái nam nữ làm nào? o Khi dùng biến giả thực mục đích cách đưa biến giả vào mơ hình tiến hành

phân tích kết sao? Tình hung 3:

Ta muốn xem xét sản lượng doanh nghiệp phụ thuộc vào việc sử dụng phương pháp công nghệ A (truyền thống) hay B (hiện đại)?

Như ta cần quan tâm đến cách lượng hóa yếu tố định tính “Phương pháp công nghệ” (với hai trạng thái doanh nghiệp sử dụng phương pháp công nghệ A, B” ta cần trả lời câu hỏi:

 Xây dựng mơ hình hồi quy với biến phụ thuộc, biến độc lập gì?  Cấu trúc mơ nào?

 Bản chất số liệu biến mơ nào? Tình hung 4:

(3)

 Ở mơ hình hồi quy kinh tế lượng xây dựng với biến hồi quy nào?

 Những biến mơ hình có giá trị số, chữ (tức biến biến định lượng, biến biến định tính?)

 Cách thức đưa biến giả tiến hành phân tích nào?

(4)

5.1 Khái niệm biến giá

5.1.1 Giới thiệu biến định tính biến giả

Trong kinh tế xã hội có nhiều yếu tố đặc trưng trạng thái tính chất hay phạm trù mà ta gọi biến định tính Chẳng hạn yếu tố giới tính gồm hai trạng thái nam nữ, yếu tố quê quán đặc trưng hai trạng thái thành thị nông thôn, yếu tố vùng miền chia ba trạng thái miền Bắc, miền Trung miền Nam,…

Để đưa thuộc tính biến định tính vào mơ hình hồi quy định lượng ta cần phải “lượng hóa” thuộc tính cách dùng biến giả (dummy variable) nhận hai giá trị

5.1.2 Các ví dụ Ví dụ 5.1:

Trong tình ta cần hồi quy với biến định tính “Khu vực” (với hai trạng thái thành thị nơng thơn) thơng tin biến “Khu vực” thể biến giả “KV” sau:

hộ gia đình sống thành thị

KV =

hộ gia đình sống nơng thơn Như số liệu với biến giả khu vực:

Thứ tự quan sát Khu vực KV

1 Thành thị

2 Nông thôn

3 Nông thôn

4 Thành thị

5 Nông thôn

  

n Thành thị

Ví d 5.2:

Trong tình 2, thơng tin biến định tính “Giới tính” nhân viên (với hai trạng thái nam nữ) thể biến giả “D” sau:

1 người nam D=

0 người nữ Như số liệu với biến giả giới tính:

Thứ tự quan sát Giới tính D

1 Nữ

2 Nam

3 Nam

(5)

5 Nam

  

n Nữ

Ví d 5.3:

Trong tình ta có thơng tin biến “Phương pháp công nghệ” (với hai trạng thái doanh nghiệp dùng phương pháp cơng nghệ A hay B) thể biến giả “CN” sau:

1 doanh nghiệp dùng phương pháp công nghệ A CN =

0 doanh nghiệp dùng phương pháp công nghệ B Số liệu với biến giả phương pháp công nghệ:

Thứ tự quan sát Phương pháp công nghệ sử dụng CN

1 A

2 B

3 A

4 B

5 B

  

n A

Ví d 5.4:

Trong tình nêu trên, thơng tin biến “Vùng miền” (với ba trạng thái miền bắc, miền trung miền nam) thể hai biến giả “D2” “D3” sau:

1 quan sát thuộc miền Bắc D2 =

0 quan sát không thuộc miền Bắc

Số liệu với biến giả vùng miền:

Thứ tự quan sát Vùng miền D2 D3

1 Miền Bắc

2 Miền Bắc

3 Miền Trung 0

4 Miền Nam

5 Miền Trung 0

   

n Miền Bắc

1 quan sát thuộc miền Nam D3 =

(6)

Nhn xét:

 Vì ta xét biến định tính có hữu hạn trạng thái cá thể tổng thể tương ứng với trạng thái định, cá thể không chuyển từ trạng thái sang trạng thái khác nên biến giả sử dụng có đặc điểm sau:

o Biến giả nhận giá trị

o Mỗi cá thể tổng thể tương ứng với giá trị biến giả o Biến giả chia tổng thể thành phần riêng biệt

 Việc lựa chọn gán giá trị ứng với trạng thái nhằm thuận lợi cho việc giải thích ý nghĩa hệ số biến giả Biến giả dùng mơ hình vai trị biến độc lập nên ta thường đánh số D2 trở hệ số kèm thường ký hiệu β2

 Khi biến định tính có nhiều hai trạng thái ta sử dụng biến giả có nhiều giá trị (như biến giả nhận giá trị 0,1,2,3, tương ứng cho trạng thái) gặp khó khăn việc nghiên cứu so sánh tương ứng trạng thái số yếu tố kỹ thuật khác nên người ta thường dùng nhiều biến giả với hai giá trị theo quy tắc: Số biến giả sử dụng số trạng thái biến định tính –

(Trong ví dụ 5.1, ví dụ 5.2 ví dụ 5.3 biến định tính gồm hai trạng thái ta sử dụng biến giả Cịn ví dụ 5.4 biến định tính vùng miền có trạng thái nên ta sử dụng biến giả)

 Trạng thái biến định tính mà ứng với giá trị biến giả nhận giá trị gọi trạng thái gốc hay trạng thái Việc lựa chọn trạng thái trạng thái tùy ý

(Trong Ví dụ 5.1, trạng thái “Nơng thơn” trạng thái bản; Ví dụ 5.2, trạng thái “Nam” trạng thái bản; Ví dụ 5.3, trạng thái “Phương pháp cơng nghệ B” trạng thái ví dụ trạng thái trạng thái “Miền trung”) 5.2 Mơ hình có biến độc lập biến giả

5.2.1 Giới thiệu tình

Chẳng hạn muốn xem xét so sánh ảnh hưởng việc dùng phương pháp công nghệ A hay B đến sản lượng doanh nghiệp

Ta tiến hành hồi quy mơ hình với biến phụ thuộc (SL) biến sản lượng doanh nghiệp phụ thuộc vào biến định tính mơ tả việc doanh nghiệp dùng phương pháp công nghệ A hay B

Thật ta tạo biến giả phương pháp công nghệ, ký hiệu “CN”: 1 doanh nghiệp sử dụng phương pháp công nghệ A CN =

0 doanh nghiệp không sử dụng phương pháp công nghệ A (tức sử dụng phương pháp công nghệ B)

(7)

Mơ hình hồi quy tổng thế SL12CNu

Khi sử dụng phương pháp công nghệ A SL12u

Khi sử dụng phương pháp công nghệ B SL1u

Hàm hồi quy tổng thể E(SL/CN)12CN

Khi sử dụng phương pháp công nghệ A E(SL/CN 1)12 Khi sử dụng phương pháp công nghệ B E(SL/CN 0)1

Nhn xét:

 Sản lượng trung bình dùng phương pháp công nghệ A β0+ β2;  Sản lượng trung bình dùng phương pháp cơng nghệ B β1

 β2 mức chênh lệch sản lượng trung bình doanh nghiệp sử dụng phương pháp công nghệ A hay B

(Trạng thái trạng thái “sử dụng phương pháp cơng nghệ B”) Do đó:

 Muốn xem xét có phải sản lượng doanh nghiệp khác dùng hai phương pháp công nghệ A B hay khơng ta thực tốn kiểm định cặp giả thuyết:

o Nếu bác bỏ H0, chấp nhận H1 ta kết luận sản lượng doanh nghiệp khác

nhau dùng hai phương pháp công nghệ A B

o Nếu không bác bỏ H0 ta kết luận sản lượng doanh nghiệp

dùng hai phương pháp công nghệ A B

 Muốn xem xét có phải doanh nghiệp dùng phương pháp công nghệ A cao ta dùng phương pháp cơng nghệ B hay khơng ta thực tốn kiểm định cặp giả thuyết:

H0: β2 H1: β2>

o Nếu bác bỏ H0, chấp nhận H1 ta kết luận sản lượng doanh nghiệp dùng

phương pháp công nghệ A cao dùng phương pháp công nghệ B H0: β2 =0

(8)

o Nếu không bác bỏ H0 ta kết luận sản lượng doanh nghiệp dùng phương

pháp công nghệ A không cao dùng phương pháp công nghệ B  Muốn xét xét mức sản lượng doanh nghiệp sử dụng hai phương pháp công

nghệ A B chênh lệch khoảng ta tìm khoảng tin cậy đối xứng hệ số β2

( ) ( )

2 ( 2) / 2 ( 2) /

n k n k

se tse t

          

(ởđây k=2) 5.2.2 Các ví dụ cụ thể

Ví d 5.5:

Giả sử có 100 quan sát hộ gia đình, với CT chi tiêu hộ gia đình (triệu đồng/năm), KV khu vực gia đình sinh sống (với trạng thái thành thị nông thôn)

Tạo biến giả:

1 hộ gia đình sống thành thị KV =

0 hộ gia đình sống nông thôn

Tiến hành hồi quy chi tiêu hộ gia đình phụ thuộc vào khu vực gia đình sinh sống:

Mơ hình hồi quy tổng thể CT 12KVu

Hộ gia đình thành thị CT  12 u

Hộ gia đình nông thôn CT 1u

Hàm hồi quy tổng thể E(CT/KV)12KV

Hộ gia đình thành thị E(CT/KV 1)12 Hộ gia đình nơng thơn E(CT/KV 0)1 Dependent Variable: CT

Method: Least Squares Date: 04/17/15 Time: 05:54 Sample: 100

Included observations: 100

Variable Coefficient Std Error t–Statistic Prob

C 194.2407 7.298745 26.61290 0.0000

KV 69.54187 10.76141 6.462151 0.0000

R–squared 0.298795 Mean dependent var 226.2300

Adjusted R–squared 0.291640 F-statistic 41.75939

(9)

Hàm hồi quy mẫu CTi 12KVi

Hộ gia đình thành thị CT   1 2194, 2407 69,54187 263, 78257  Hộ gia đình nơng thơn CT 1194, 2407

 Mức chi tiêu hộ gia đình thành thị 263,78257 triệu đồng/năm  Mức chi tiêu hộ gia đình nơng thơn 194,2407 triệu đồng/năm

 Mức chênh lệch chi tiêu hộ gia đình thành thị so với nơng thơn 69,54187 triệu đồng/năm

 Muốn biết với mức ý nghĩa 5%, có phải mức chi tiêu hộ gia đình thành thị cao mức chi tiêu hộ gia đình nơng thơn hay khơng, ta thực toán kiểm định giả thuyết thống kê:

Miền bác bỏ giả thuyết H0 là:

    

  

 

 

 

) (

2 ,

) (

k n

t T se T

W 

 

Giá trị quan sát tiêu chuẩn kiểm định là:

69,54187 6,462151 10,76141

qs

T  

n = 935, k = 2, α = 0,05, ( ) (98)

0,05 1,645

n k

t  t   Tqs>t(n k)



 Đủ sở để bác bỏ giả thuyết H0 chấp nhận giả thuyết H1 Kết lun:

Với mức ý nghĩa 5% đủ sở nói mức chi tiêu hộ gia đình thành thị cao nơng thơn

Ví d 5.6:

Sử dụng 935 quan sát số liệu ch4bt8.wf1 (trích từ Applied Econometrics, Asteriou – web Palgrave) (Data_giaotrinh_ktl_13/ch4bt8):

Wage (USD/tháng) mức lương người lao động

Urban biến giả nhận giá trị người lao động thành thị, người lao động nông thôn

Tạo biến giả:

1 hộ gia đình sống thành thị Urban =

0 hộ gia đình sống nơng thơn H0: β2

(10)

Hàm hồi quy tổng thể: E(Wage/Urban) = 1 + 2Urban Người lao động thành thị: E(Wage/Urban = 1) = 1 + 2 Người lao động nông thôn: E(Wage/Urban = 0) = 1 Dependent Variable: WAGE

Method: Least Squares Included observations: 935

Variable Coefficient Std Error T-Statistic Prob

C 3330.110 24.40500 136.4519 0.0000

URBAN 178.1316 28.80869 6.183260 0.0000

R-squared 0.039365 Mean dependent var 3457.945

Adjusted R-squared 0.038336 F-statistic 38.23270

Sum squared resid 1.47E+08 Prob(F-statistic) 0.000000

Hàm hồi quy mẫu: Wage    Urban3330,11178,1316Urban

2

1 

 Người lao động

thành thị:  1 3330,11178,13163508,2416

  

 

Wage

Người lao động

nông thôn:  13330,11

 

Wage

 Muốn tiền công trung bình người khu vực thành thị 3508,2416 USD/tháng

 Mức tiền công người khu vực nông thôn 3330,11 USD/tháng

 Ước lượng điểm mức chênh lệch tiền công người lao động thành thị nông thôn 178,1316 USD/tháng

 Muốn biết với độ tin cậy 95% mức chênh lệch lương người thành thị nơng thơn ta tìm khoảng tin cậy đối xứng β2

( ) ( )

2 ( 2) / 2 ( 2) /

n k n k

se tse t

          

n 935, k 2, – 0.95    , ( ) (933)

/ 0,025 1,96

n k

t t  ;2 178,1315822

2

( ) 28,80869  se

 121,6665498 < β2 < 234,5966146 Kết lun:

Với độ tin cậy 95% mức chênh lệch lương người thành thị nông thôn dao động khoảng (121,6665498; 234,5966146) USD/tháng

(11)

H0: β2 H1: β2> Miền bác bỏ giả thuyết H0 là:

    

  

 

 

 

) (

2 ,

) (

k n

t T se T

W 

  Giá trị quan sát tiêu chuẩn kiểm định là:

178,1315822 6,18326 28,80869

qs

T  

n = 935, k = 2, α = 0,05, ( ) (933)

0,05 1,645

n k

t  t  → Tqs>t(n k)



 Chấp nhận giả thuyết H1 Kết lun:

Với mức ý nghĩa 5% đủ sở nói lương người thành thị cao lương người nông thôn

5.3 Mơ hình có biến độc lập biến giả biến định lượng 5.3.1 Giới thiệu tình

Trong mục 5.2 nghiên cứu mơ hình hồi quy có biến độc lập biến định tính (được lượng hóa biến giả nhận giá trị 1), mục ta xét trường hợp biến độc lập mơ hình có biến định lượng thơng thường

Chẳng hạn muốn nghiên cứu, so sánh mức lương người lao động phụ thuộc vào số năm học có khác nam nữ hay không? Ta xây dựng mơ hình hồi quy với biến:

Wage (USD/tháng) mức lương người lao động Educ số năm học người lao động

Male biến giả (lượng hóa cho biến giới tính) nhận giá trị quan sát nam, quan sát nữ

Mơ hình hồi quy tổng thể:

Lao động nam: Wage12 3Educu Lao động nữ: Wage  1 3Educu

1

(12)

Nhn xét:

o Khi số năm học tăng năm lương trung bình người lao động tăng β3

đơn vị

o Khi số năm học lương trung bình nam cao nữ β2

đơn vị

o Nếu β2 > có nghĩa số năm học, lương trung bình nam cao

hơn nữ

o Nếu β2 = có nghĩa số năm học, lương trung bình nam

nữ

o Nếu 2 < có nghĩa số năm học, tiền cơng nam thấp nữ

 Muốn biết việc điến biến giả Male vào mơ hình có ý nghĩa hay khơng (hay xem xét hệ số β2 có ý nghĩa thống kê khơng) ta tiến hành kiểm định cặp giả thuyết thống kê:

o Nếu bác bỏ H0, chấp nhận H1 ta kết luận biến Male có mơ hình cần

thiết (hay hệ số β2 có ý nghĩa thống kê)

o Nếu chưa bác bỏ H0 ta kết luận ta kết luận biến Male có mơ hình

khơng cần thiết (hay hệ số β2 khơng có ý nghĩa thống kê)

 Muốn xem số năm học mức lương lao động nam cao lương lao động nữ hay không ta tiến hành kiểm định cặp giả thuyết thống kê:

o Nếu bác bỏ H0, chấp nhận H1 ta kết luận có số năm học tiền

cơng nam cao tiền công nữ H0: β2 =

H1: β2

H0: β2 H1: β2>

E(Wage/Educ) = 1 + 3Educ Wage

Educ

E(Wage/Educ) = 1 + 2 + 3Educ

2

(13)

o Nếu nhận giả thuyết H0 ta kết luận có số năm học tiền cơng

nam không cao tiền công nữ

 Muốn xét xét mức chênh lệch mức lương nam nữ (khi có số năm học) biến động khoảng ta ước lượng hệ số β2 khoảng tin cậy đối xứng:

( ) ( )

2 ( 2) / 2 ( 2) /

n k n k

se tse t

          

(ở k = 3) 5.3.2 Các ví dụ cụ thể

Ví d 5.7:

Tiếp tục dùng số liệu cho 100 hộ gia đình Ta hồi quy chi tiêu hộ gia đình phụ thuộc vào biến: Biến thu nhập biến “KV”

CT: Chi tiêu hộ gia đình(triệu đồng/năm) TN: Thu nhập hộ gia đình (triệu đồng/năm)

KV: Biến giả khu vực gia đình sình sống (lượng hóa cho biến định tính với trạng thái thành thị nơng thơn)

1 hộ gia đình sống thành thị

KV =

0 hộ gia đình sống nơng thơn

Mơ hình hồi quy tổng thể: CT  1 2KV 3TN u

Các hộ gia đình thành thị: Các hộ gia đình nơng thơn:

1

CT   TN u

1

CT   TN u

Dependent Variable: CT Method: Least Squares Included observations: 100

Variable Coefficient Std Error t–Statistic Prob

C 59.62006 6.837323 8.719796 0.0000

KV 30.27209 4.781050 6.331681 0.0000

TN 0.593527 0.027074 21.92211 0.0000

R–squared 0.882238 Mean dependent var 226.2300

Adjusted R–squared 0.879810 F–statistic 363.3475

(14)

 Mức chi tiêu tối thiểu hộ gia đình thành thị là:

59,62006 + 30,27209 = 89,89215triệu đồng/năm

 Mức chi tiêu tối thiểu hộ gia đình nông thôn 59.62006triệu đồng/năm  Mức chênh lệch chi tiêu hộ gia đình thành thị so với nông thôn

30,27209 triệu đồng/năm

 Muốn biết với độ tin cậy 95%, có mức thu nhập mức chênh lệch chi tiêu hộ gia đình thành thị nơng thơn dao động khoảng ta tìm khoảng tin cậy đối xứng β2

( ) ( )

2 ( 2) / 2 ( 2) /

n k n k

se tse t

          

n = 100, k = 3,  α = 0,95, ( ) (97)

/ 0,025 1,96

n k

t  t  ; 2 30,27209

 ; ( ) 4,7810502

se  20,901232 < β2 < 39,642948

Kết luận:

Với độ tin cậy 95%, có mức thu nhập mức chênh lệch chi tiêu hộ gia đình thành thị nơng thơn dao động khoảng (20,901232, 39,642948) USD/tháng

 Muốn biết với mức ý nghĩa 5%, có phải mức chi tiêu hộ gia đình thành thị nơng thôn khác hay không, ta thực toán kiểm định giả thuyết thống kê:

H0: β2 = H1: β2≠0 Miền bác bỏ giả thuyết H0 là:

              ) ( / 2 , ) ( k n t T se T

W 

  Giá trị quan sát tiêu chuẩn kiểm định là:

30,27209 6,331681 4,781050   qs T

n = 100, k = 3, α = 0,05, ( ) (97)

0,025 1,96

n k

t  t  → │Tqs│> ( ) /

n k

t 

 Chấp nhận giả thuyết H1 Hàm hồi quy mẫu:

Hộ gia đình thành thị: Hộ gia đình nơng thơn:

i

CT     KVi TNi

i

i

CT ( )

(59,62006 + 0,593527) + 30,27209TN

i TN           

i

i

CT

59,62006 + 30,27209TN

(15)

Kết luận:

Với mức ý nghĩa 5% đủ sở nói mức chi tiêu hộ gia đình thành thị nông thôn khác

 Muốn biết với mức ý nghĩa 5%, có phải mức thu nhập mức chi tiêu hộ gia đình thành thị cao so với hộ gia đình nơng thơn hay khơng, ta thực toán kiểm định giả thuyết thống kê:

H0: β2 H1: β2 > Miền bác bỏ giả thuyết H0 là:

    

  

 

 

 

) (

2 ,

) (

k n

t T se T

W 

  Giá trị quan sát tiêu chuẩn kiểm định là:

30,27209 6,331681 4,781050

 

qs

T

n = 100, k = 3, α = 0,05, ( ) (97)

0,05 1,645

n k

t  t  → Tqs>t(n k)



 Chấp nhận giả thuyết H1 Kết lun:

Với mức ý nghĩa 5% đủ sở nói có mức thu nhập chi tiêu hộ gia đình thành thị cao so với nông thôn

Ví d 5.8:

Tiếp tục dùng số liệu (Sử dụng 935 quan sát số liệu ch4bt8.wf1 (trích từ Applied Econometrics, Asteriou–web Palgrave) (Data_giaotrinh _ktl_13/ch4bt8)

Dependent Variable: WAGE Method: Least Squares Date: 04/18/15 Time: 15:13 Sample: 935

Included observations: 935

Variable Coefficient Std Error t–Statistic Prob

C 2803.999 53.16238 52.74405 0.0000

MALE 580.8848 17.69155 32.83402 0.0000

EDUC 30.10292 3.986869 7.550516 0.0000

R–squared 0.585947 Mean dependent var 3457.945

Adjusted R–squared 0.585059 F–statistic 659.4609

(16)

Hàm hồi quy mẫu: Wage 12Male3Educ

Lao động nam:

Educ Educ Wage            10292 , 30 ) 69155 , 17 8848 , 580 ( ) (1 2 3

Lao động nữ: Wage 13Educ 580,884830,10292Educ

 Ước lượng điểm mức chênh lệch lương nam nữ (khi có số năm học) 580,8848 USD/tháng

 Muốn biết với độ tin cậy 95%, có số năm học mức chênh lệch lương nam nữ ta tìm khoảng tin cậy đối xứng β2:

( ) ( )

2 ( 2) / 2 ( 2) /

n k n k

se tse t

          

n = 935, k = 3, – α = 0,95, ( ) (932)

/ 0,025 1,96

n k

t t  ;

2 580,8848

  ;

2

( ) 17,69155  se

 546,209362 < β2 < 615,560238 Kết lun:

Với độ tin cậy 95%, có số năm học mức chênh lệch lương nam nữ dao động khoảng (546,209362, 615,560238) USD/tháng

 Muốn biết với mức ý nghĩa 5%, có phải lương nam nữ (hay hệ số biến giả khơng có ý nghĩa thống kê), ta thực toán kiểm định giả thuyết thống kê:

H0: β2 = H1: β2 Miền bác bỏ giả thuyết H0 là:

              ) ( / 2 , ) ( k n t T se T

W 

  Giá trị quan sát tiêu chuẩn kiểm định là:

580,8848 32,83402528 17,69155   qs T

n = 935, k = 3, α = 0,05, ( ) (932)

/ 0,025 1,96

n k

t  t  │Tqs│> ( ) /

n k

t

 Đủ sở chấp nhận giả thuyết H1 Kết lun:

(17)

 Muốn biết với mức ý nghĩa 5%, có phải số năm học lương nữ thấp nam (hay lương trung bình nam cao nữ) hay khơng, ta thực tốn kiểm định giả thuyết thống kê:

H0: β2 H1: β2> Miền bác bỏ giả thuyết H0 là:

    

  

 

 

 

) (

2 ,

) (

k n

t T se T

W 

  Giá trị quan sát tiêu chuẩn kiểm định là:

580,8848

32,83402528 17,69155

 

qs

T

n = 935, k = 3, α = 0,05, ( ) (932)

/ 0,05 1,645

n k

t  t   Tqs>t(n k)



 Đủ sở chấp nhận giả thuyết H1 Kết lun:

Với mức ý nghĩa 5% đủ sở nói có số năm học tiền cơng trung bình nam cao nữ (hay lương trung bình nữ thấp nam) Ví d 5.9:

Dùng số liệu (Sử dụng 33 quan sát số liệu ch3bt4.wf1 (trích từ Data_giaotrinh _ktl_13/ch3bt4) với biến:

CT, TN chi têu thu nhập người lao động theo tháng (triệu đồng) GT biến giả nhằm lượng hóa biến giới tính người lao động (GT = ứng với lao động nam, GT = ứng với lao động nữ)

Dependent Variable: CT Method: Least Squares Date: 04/18/15 Time: 18:16 Sample (adjusted): 33

Included observations: 33 after adjustments

Variable Coefficient Std Error t–Statistic Prob

C 68.73748 7.840218 8.767292 0.0000

Mô hình hồi quy tổng thể: CT  1 2GT 3TN u

Lao động nam: Lao động nữ:

1

CT   TN u

1

(18)

GT 11.63350 5.230464 2.224181 0.0338

TN 0.852228 0.003835 222.2053 0.0000

R–squared 0.999404 Mean dependent var 1642.161

Adjusted R–squared 0.999365 F–statistic 25169.39

Sum squared resid 5919.280 Prob(F–statistic) 0.000000  Ước lượng điểm mức chênh lệch chi tiêu nam nữ (khi có thu

nhập) 11,63350 triệu đồng/tháng

 Muốn biết với độ tin cậy 95% mức chênh lệch chi tiêu nam nữ (khi có thu nhập) dao động khoảng ta tìm khoảng tin cậy đối xứng β2

( ) ( )

2 ( 2) / 2 ( 2) /

n k n k

se tse t

          

n 33, k 3, – 0,95    n = 33, k = 3, – α = 0,95, ( ) (30)

/ 0,025 2,042

n k

t t  ;

2 11, 63350

  ; se( ) 5, 2304642

 0,952892512 < β2 < 22,333957488 Kết lun:

Với độ tin cậy 95% mức chênh lệch chi tiêu trung bình nam nữ (khi thu nhập) dao động khoảng (0,952892512, 22,333957488) triệu đồng/tháng

 Muốn biết với mức ý nghĩa 5%, có tiêu nam nữ (hay biến giả GT có mặt hồi quy không cần thiết), ta thực toán kiểm định giả thuyết thống kê:

Miền bác bỏ giả thuyết H0 là:

              ) ( / 2 , ) ( k n t T se T

W 

  Giá trị quan sát tiêu chuẩn kiểm định là:

11,63350 2,224181 5,230464

qs

T  

n = 33, k = 3, α = 0,05, ( ) (30)

/ 0,025 2,042

n k

t t  │Tqs│> ( ) /

n k

t  bác bỏ H0, chấp nhận H1

Kết lun: Với mức ý nghĩa 5% đủ sở nói chi tiêu nam nữ có mức thu nhập khác

(19)

 Muốn biết với mức ý nghĩa 5%, có tiêu nam cao nữ (khi có thu nhập) hay khơng, ta thực tốn kiểm định giả thuyết thống kê:

H0: β2 H1: β2> Miền bác bỏ giả thuyết H0 là:

              ) ( 2 , ) ( k n t T se T

W 

  Giá trị quan sát tiêu chuẩn kiểm định là:

11,63350 2,224181 5,230464

 

qs

T

n = 33, k = 3, α = 0,05, ( ) (30)

0,05 1,697

n k

t t   Tqs > t(n k)

   bác bỏ H0, chấp nhận H1 Kết lun:

Với mức ý nghĩa 5% đủ sở nói có mức thu nhập chi tiêu nam cao so với nữ

 Muốn biết với mức ý nghĩa 5%, có phải thu nhập tăng lên triệu đồng mức chi tiêu tăng nhiều 500 nghìn đồng hay khơng (đối với nam nữ)? Ta thực toán kiểm định giả thuyết thống kê:

H0: β30,85

H1: β3> 0,85 Miền bác bỏ giả thuyết H0 là:

               ) ( 3 , ) ( ,

0 T t n k

se T

W 

  5809 , 003835 , 85 , 852228 ,

0  

qs

T

n = 33, k = 3, α = 0,05, ( ) (30)

0,05 1,697

n k

t t   Tqs < t(n k)

  chưa bác bỏ H0 Kết lun: Với mức ý nghĩa 5% đủ sở nói thu nhập người lao động tăng lên triệu đồng mức chi tiêu họ tăng nhiều 0,85 triệu đồng

 Có ý kiến cho mức chi tiêu biên thấp triệu đồng

Với mức ý nghĩa 5% nhận xét ý kiến này.Ta thực toán kiểm định giả thuyết thống kê:

(20)

Miền bác bỏ giả thuyết H0 là:

    

  

   

 

 

) (

3 ,

) (

1 n k

t T se T

W 

  Giá trị quan sát tiêu chuẩn kiểm định là:

532464 ,

38 003835

,

1 85228 ,

0  

qs

T

n = 33, k = 3, α = 0,05, ( ) (30)

0,05 1,697

n k

t t

      Tqs< t(n k )

 Bác bỏ H0 chấp nhận H1 Kết lun:

Với mức ý nghĩa 5% đủ sở nói mức chi tiêu biên người lao động thấp triệu đồng/tháng

(21)

Tóm lược cuối

 Trong thực tế, có nhiều biến kinh tế xã hội biến định tính, nhận giá trị trạng thái (hay phạm trù, tính chất) Bài học nhằm trang bị cách để dùng biến giả đại diện cho biến định tính mơ hình hồi quy

 Trường hợp biến định tính có trạng thái, sử dụng biến giá giả  để biểu diễn biến định tính Khi biến định tính có m trạng thái, cần sử dụng m  biến giả   Hệ số biến giả dùng để so sánh chênh lệch hệ số chặn nhóm trạng thái

biến định tính

 Việc ước lượng kiểm định hệ số ta thực hệ số hồi quy thông thường  Bài học xem xét trường hợp biến giả đại diện cho biến định tính vai trị biến độc

(22)

Câu hỏi ôn tập

1. Thế biến định tính, biến giả? Tại lại gọi biến giả? So sánh khác biến định tính biến giả?

2. Thế gọi trạng thái “gốc” (còn gọi trạng thái bản) biến định tính? Biến giả mơ hình có tính biến (thật) có mơ hình hồi quy khơng? Tại sao? 3. Khi hồi quy với biến độc lập biến định tính làm nào? Trường hợp biến định

tính có m trạng thái cách đặt biến giả  sao?

4. Trong học biến định tính đóng vai trị biến độc lập hay biến phụ thuộc?

5. Biến có thứ bậc (gọi biến thứ bậc, có giá trị xếp theo thứ tự) biến định tính hay định lượng?

6. Khi hồi quy với biến “Hạnh kiểm” xếp loại học sinh: Tốt Khá Trung bình Kém

Thì ta xem xét biến “Hạnh kiểm” biến định lượng nhận giá trị 1,2,3,4 khơng? Có dùng biến giả  để đại diện cho biến không?

7. Hệ số biến giả mơ hình hồi quy có ý nghĩa gì?

8. Ước lượng điểm hệ số biến giả mơ hình < khơng? Nếu xảy phản ánh điều gì?

9. Chênh lệch hệ số chặn mơ hình nhóm trạng thái biến định tính = 0? Nếu xảy cho biết điều gì?

Ngày đăng: 01/04/2021, 18:20

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w