PHẦN MỞ ĐẦU GIỚI THIỆU VẤN ĐỀ NGHIÊN CỨU 1. Lý do chọn đề tài Tiền lương là một trong những yếu tố tạo động lực quan trọng nhất trong lao động. Có rất nhiều các yếu tố tác động đến tiền lương của người lao động như thị trường lao động, môi trường làm việc, tính chất công việc và đặc điểm của người lao động. Mỗi sự khác nhau ở các yếu tố này có thể sẽ dẫn đến kết quả trả lương khác nhau. Điều này tạo sự chênh lệch về tiền lương. Bên cạnh đó, chênh lệch tiền lương còn là hệ quả của việc phân công lao động. Tiền lương sẽ khác nhau khi mà mỗi người lao động được phân công đảm trách những công đoạn, công việc khác nhau trong cùng một quy trình sản xuất. Như vậy, sự tồn tại của chênh lệch tiền lương là tất yếu. Tuy nhiên, các nhà kinh tế học như Becker (1971), Cain (1986) phân biệt hai cách giải thích cho vấn đề chênh lệch tiền lương: đó là chênh lệch tiền lương do phân biệt đối xử và chênh lệch tiền lương do chênh lệch về vốn con người và/hoặc năng suất lao động. Sự chênh lệch tiền lương do chênh lệch về vốn con người và/hoặc do chênh lệch về năng suất lao động có thể xem là những chênh lệch “tích cực” tạo ra động lực để phát triển. Sự chênh lệch tiền lương do trình độ học vấn sẽ khiến người ta cố gắng học hỏi để đạt trình độ cao. Hay sự chênh lệch về tiền công do chênh lệch về năng suất lao động, về hiệu quả công việc, về khả năng ngoại ngữ, về việc tích luỹ kinh nghiệm, về khả năng sáng tạo v.v... sẽ tạo ra động lực để người lao động phấn đấu hoàn thiện chính mình, từ đó kích thích sự phát triển chung của xã hội. Những chênh lệch tiền lương “tiêu cực” thể hiện ở các bất bình đẳng nảy sinh trong xã hội mà chúng ta cần phải điều chỉnh. Ví dụ như sự chênh lệch tiền lương do kỳ thị lao động nữ giới, ưu ái lao động nam giới, chênh lệch tiền lương dẫn đến chênh lệch giàu nghèo, chênh lệch mức sống giữa thành thị - nông thôn, v.v... Do vậy, có thể phân chia các nguyên nhân của chênh lệch tiền lương thành hai nhóm. Nhóm thứ nhất có thể kể đến đó là do sự thay đổi của thị trường lao động, sự khác nhau hoặc sự thay đổi của môi trường lao động tại nơi làm việc, do sự khác nhau về tính chất của công việc hoặc do sự khác nhau về đặc điểm của bản thân người lao động. Nhóm thứ hai là do sự kỳ thị hoặc là do sự phân biệt đối xử trong xã hội và/hoặc của người sử dụng lao động đối với người lao động. Nhóm nguyên nhân này dẫn đến sự bất bình đẳng trong xã hội. Do vậy, nhằm (1) xác định mức độ chênh lệch tiền lương tại Việt Nam, (2) xác định các yếu tố thực sự tác động đến tiền lương và (3) phân rã khoảng chênh lệch tiền lương để làm rõ phần chênh lệch giải thích theo nhóm nguyên nhân thứ nhất và phần thể hiện bất bình đẳng theo nhóm nguyên nhân thứ hai nói trên, đề tài “Ứng dụng phương pháp hồi quy phân vị phân tích chênh lệch tiền lương ở Việt Nam” được chọn làm đề tài cho luận án tiến sĩ của tác giả tại trường Đại học Kinh tế TPHCM. 2. Mục tiêu nghiên cứu Để thực hiện các mục đích trên, đề tài hướng đến việc hoàn thành các mục tiêu sau đây: 1) Giới thiệu một cách có hệ thống về cơ sở lý thuyết và khả năng ứng dụng phương pháp hồi quy phân vị, cũng như phương pháp phân rã chênh lệch tiền lương dựa trên hồi quy phân vị. 2) Thực hiện hồi quy phân vị hàm tiền lương thực tế ở Việt Nam với biến phụ thuộc là logarit tiền lương thực tế theo giờ của người lao động. Hệ số của hàm tiền lương thực tế này được ước lượng bằng phương pháp hồi quy phân vị có hiệu chỉnh tính chệch do chọn mẫu và khắc phục nội sinh. 3) Xác định khoảng chênh lệch tiền lương theo giới tính (nam – nữ, nam - nữ ở thành thị, nam – nữ ở nông thôn) và phân rã các khoảng chênh lệch tiền lương này để làm rõ phần chênh lệch được giải thích bởi các biến độc lập và phần chênh lệch chưa được giải thích gây ra bởi chênh lệch về hệ số hồi quy. Đồng thời so sánh kết quả phân tích chênh lệch tiền lương theo giới tính năm 2002 và 2012 để làm rõ sự thay đổi theo thời gian. 4) Xác định khoảng chênh lệch tiền lương theo khu vực (thành thị - nông thôn, thành thị - nông thôn ở nam giới, thành thị - nông thôn ở nữ giới). Phân rã các khoảng chênh lệch tiền lương này để làm rõ phần chênh lệch được giải thích bởi các biến độc lập và phần chênh lệch chưa được giải thích gây ra bởi chênh lệch về hệ số hồi quy. Đồng thời so sánh kết quả phân tích chênh lệch tiền lương theo khu vực năm 2002 và 2012 để làm rõ sự thay đổi theo thời gian. 5) Xác định mức tăng lương theo thời gian từ năm 2002 đến năm 2012. Phân rã sự tăng lương này thành hai phần: phần tăng lương là do thay đổi về đặc điểm lao động và phần tăng lương là do thay đổi hệ số hồi quy. 3. Đối tượng – phạm vi nghiên cứu Đề tài này được thực hiện đựa trên bộ số liệu khảo sát mức sống hộ gia đình (VHLSS) năm 2002 và 2012 do Tổng cục Thống kê công bố. Đối tượng nghiên cứu của đề tài cũng chính là đối tượng được khảo sát về tiền lương và các yếu tố có liên quan trong các cuộc khảo sát này. Phạm vi nghiên cứu của đề tài là nghiên cứu tiền lương thực tế theo giờ của các đối tượng trong độ tuổi trên lãnh thổ Việt Nam. 4. Ý nghĩa khoa học và ý nghĩa thực tiễn Với mục tiêu nghiên cứu và phương pháp nghiên cứu được lựa chọn, đề tài của luận án mang lại các ý nghĩa khoa học và thực tiễn sau đây: (a) Đề tài áp dụng phương pháp hồi quy phân vị, một kỹ thuật hồi quy được giới thiệu bởi Koenker & Bassett (1978) và đã được dùng rất rộng rãi trên thế giới nhưng chưa phổ biến ở Việt Nam. Rất ít các đề tài nghiên cứu ở Việt Nam áp dụng kỹ thuật hồi quy phân vị, đặc biệt là áp dụng trong nghiên cứu hàm tiền lương và phân rã chênh lệch tiền lương. (b) Đề tài trình bày một cách ngắn gọn, đầy đủ và có hệ thống về lý thuyết của phương pháp hồi quy phân vị. Đây là điều mà cho đến nay chưa có tác giả ở Việt Nam nào thực hiện.
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRẦN THỊ TUẤN ANH
ỨNG DỤNG PHƯƠNG PHÁP HỒI QUY PHÂN VỊ PHÂN TÍCH CHÊNH LỆCH
TIỀN LƯƠNG Ở VIỆT NAM
LUẬN ÁN TIẾN SĨ KINH TẾ
NĂM 2015
Trang 3BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH
TRẦN THỊ TUẤN ANH
ỨNG DỤNG PHƯƠNG PHÁP HỒI QUY PHÂN VỊ PHÂN TÍCH CHÊNH LỆCH
TIỀN LƯƠNG Ở VIỆT NAM
Chuyên ngành : Lý thuyết xác suất và thống kê toán học
Mã số : 62.46.01.06
LUẬN ÁN TIẾN SĨ KINH TẾ
NGƯỜI HƯỚNG DẪN KHOA HỌC
1 PGS TS LÊ VĂN PHI
2 TS BÙI PHÚC TRUNG
Trang 5LỜI CAM ĐOAN
Tôi xin cam đoan luận án tiến sĩ với đề tài “ Ứng dụng phương pháp hồi quy
phân vị phân tích chênh lệch tiền lương ở Việt Nam” là công trình nghiên cứu khoa học
độc lập của riêng tôi Các số liệu trong luận án là trung thực, có nguồn gốc rõ ràng Các kết quả nghiên cứu của luận án chưa từng được ai ngoài tác giả công bố trong bất kỳ công trình nghiên cứu nào khác
Nghiên cứu sinh
Trần Thị Tuấn Anh
Trang 7MỤC LỤC
LỜI CAM ĐOAN i
MỤC LỤC iii
DANH MỤC CÁC BẢNG BIỂU vii
DANH MỤC CÁC HÌNH VẼ viii
DANH MỤC CÁC TỪ VIẾT TẮT xv
PHẦN MỞ ĐẦU 1
1 Lý do chọn đề tài 1
2 Mục tiêu nghiên cứu 2
3 Đối tượng – phạm vi nghiên cứu 3
4 Ý nghĩa khoa học và ý nghĩa thực tiễn 3
CHƯƠNG 1 CƠ SỞ LÝ THUYẾT VỀ HÀM TIỀN LƯƠNG VÀ VẤN ĐỀ PHÂN TÍCH CHÊNH LỆCH TIỀN LƯƠNG BẰNG HỒI QUY PHÂN VỊ 5
1.1 Hàm tiền lương mincer (1974) và các nghiên cứu mở rộng 5
1.2 Phương pháp hồi quy phân vị 8
a Giới thiệu phương pháp hồi quy phân vị 9
b Tính chất của phương pháp hồi quy phân vị 15
c Kiểm định giả thuyết thống kê với hồi quy phân vị 23
d Ưu điểm và nhược điểm của hồi quy phân vị 24
1.2.1 Tính chệch của ước lượng do chọn mẫu khi xây dựng hàm tiền lương và phương pháp hiệu chỉnh tính chệch do chọn mẫu 26
a Tính chệch do chọn mẫu (Sample selection bias) 27
b Hiệu chỉnh tính chệch do chọn mẫu - Thủ tục Heckman hai bước 29
1.2.2 Vấn đề nội sinh và phương pháp hồi quy phân vị hai bước (double - stage quantile regression) 32
1.3 Phương pháp phân rã chênh lệch bằng hồi quy phân vị 34
1.4 Sự phù hợp của hồi quy phân vị với các nghiên cứu về chênh lệch tiền lương 37
CHƯƠNG 2 TỔNG QUAN CÁC NGHIÊN CỨU VỀ CHÊNH LỆCH TIỀN LƯƠNG 39
2.1 Tổng quan các nghiên cứu về chênh lệch tiền lương trên thế giới 39
Trang 8dụng vào phân tích tiền lương 39
2.1.2 Những nghiên cứu về chênh lệch tiền lương áp dụng hồi quy phân vị được áp dụng vào hồi quy hàm tiền lương 44
2.2 Tổng quan các nghiên cứu ở Việt Nam 58
2.2.1 Các nghiên cứu định lượng về chênh lệch tiền lương không áp dụng hồi quy phân vị 58
2.2.2 Các nghiên cứu áp dụng hồi quy phân vị trong phân tích chênh lệch tiền lương
61
2.3 Những hạn chế trong các nghiên cứu định lượng về đề tài chênh lệch tiền lương ở việt nam 64
CHƯƠNG 3 PHƯƠNG PHÁP NGHIÊN CỨU 67
3.1 Số liệu sử dụng trong đề tài 67
3.1.1 Nguồn số liệu sử dụng 67
3.1.2 Thống kê mô tả mẫu số liệu 69
3.1.3 Mô tả hàm mật độ kernel của biến log – tiền lương trên mẫu số liệu 72
3.2 Phương pháp nghiên cứu của đề tài 78
3.2.1 Dạng hàm tiền lương 78
3.2.2 Phương pháp ước lượng hàm tiền lương và phân rã chênh lệch tiền lương 80
3.2.2.1 Ước lượng hàm tiền lương bằng phương pháp hồi quy phân vị 80
3.2.2.2 Hiệu chỉnh tính chệch do chọn mẫu 81
3.2.2.3 Phương pháp phân rã sự chênh lệch tiền lương 82
CHƯƠNG 4 KẾT QUẢ NGHIÊN CỨU 85
4.1 Áp dụng phương pháp hồi quy phân vị để ước lượng hàm tiền lương ở việt nam 85
4.1.1 Hồi quy và so sánh hàm hồi quy phân vị hàm tiền lương của nhóm lao động nam và nhóm lao động nữ 86
4.1.1.1 Hồi quy và so sánh hệ số hồi quy theo bằng cấp ở nhóm lao động nam và nhóm lao động nữ trong năm 2002 86
4.1.1.2 Hồi quy và so sánh hệ số hồi quy theo bằng cấp ở nhóm lao động nam và nhóm lao động nữ trong năm 2012 91
4.1.1.3 So sánh hệ số hồi quy theo bằng cấp ở nhóm lao động nam giữa năm 2002 và năm 2012 95 4.1.1.4 So sánh hệ số hồi quy theo bằng cấp ở nhóm lao động nữ giữa năm
Trang 94.1.2.1 Hồi quy và so sánh hệ số hồi quy theo bằng cấp ở nhóm lao động thành
thị và nhóm lao động nông thôn trong năm 2002 101
4.1.2.2 Hồi quy và so sánh hệ số hồi quy theo bằng cấp ở nhóm lao động thành thị và nhóm lao động nông thôn trong năm 2012 104
4.1.2.3 So sánh hệ số hồi quy theo bằng cấp ở nhóm lao động thành thị giữa năm 2002 và năm 2012 108
4.1.2.4 So sánh hệ số hồi quy theo bằng cấp ở nhóm lao động nông thôn giữa năm 2002 và năm 2012 110
4.2 Kết quả phân rã chênh lệch tiền lương 113
4.2.1 Phân rã chênh lệch tiền lương theo giới tính 114
4.2.1.1 Phân rã chênh lệch tiền lương theo giới tính năm 2002 114
4.2.1.2 Phân rã chênh lệch tiền lương theo giới tính năm 2012 117
4.2.1.3 So sánh kết quả chênh lệch tiền lương theo giới tính ở khu vực thành thị và nông thôn 119
4.2.1.4 So sánh kết quả phân rã chênh lệch tiền lương theo giới tính giữa năm 2002 và 2012 120
4.2.2 Phân rã chênh lệch tiền lương giữa thành thị và nông thôn 122
4.2.2.1 Phân rã chênh lệch tiền lương giữa thành thị và nông thôn năm 2002 122 4.2.2.2 Phân rã chênh lệch tiền lương giữa thành thị và nông thôn năm 2012 126 4.2.2.3 So sánh chênh lệch tiền lương giữa thành thị và nông thôn theo từng nhóm giới tính 128
4.2.2.4 So sánh chênh lệch tiền lương giữa thành thị và nông thôn năm 2002 và 2012 129
4.2.3 Phân rã chênh lệch tiền lương giữa năm 2002 và 2012 132
4.3 Kết luận về kết quả nghiên cứu 136
4.3.1.Về sự thay đổi hàm hồi quy tiền lương 136
4.3.1.1 Sự thay đổi hàm hồi quy tiền lương theo giới tính 136
4.3.1.2 Sự thay đổi hàm hồi quy tiền lương theo khu vực 136
4.3.1.3 Sự thay đổi hàm hồi quy tiền lương theo thời gian 137
4.3.1.4.So sánh kết quả hồi quy hàm tiền lương ở Việt Nam với các nghiên cứu trước đó 139
4.3.2.Về kết quả phân rã chênh lệch tiền lương 141
Trang 104.3.2.2 Kết quả phân rã chênh lệch tiền lương theo khu vực 143
4.3.2.3 Kết quả phân rã chênh lệch tiền lương theo thời gian 144
4.3.3.So sánh kết quả phân rã chênh lệch tiền lương của luận án với các nghiên cứu trước 145
CHƯƠNG 5: KẾT LUẬN VÀ ĐỀ XUẤT GIẢI PHÁP 149
5.1 Kết luận 149
5.2 Đề xuất gợi ý một số chính sách về lao động tiền lương 153
5.2.1.Nhóm giải pháp tăng tiền lương của người lao động 154
5.2.2.Nhóm giải pháp giảm bất bình đẳng tiền lương giữa các nhóm lao động 155
5.2.2.1 Đối với vấn đề chênh lệch tiền lương theo giới tính 156
5.2.2.2 Đối với vấn đề chênh lệch tiền lương theo thành thị - nông thôn 158
5.3 Các kết quả chính của luận án 159
5.3.1.Về mặt lý thuyết 159
5.3.2.Về mặt thực tiễn 160
5.4 Những hạn chế của luận án 161
PHỤ LỤC A: THỐNG KÊ MÔ TẢ 180
PHỤ LỤC B : KẾT QUẢ HỒI QUY PHÂN VỊ 188
PHỤ LỤC C: KẾT QUẢ PHÂN RÃ CHÊNH LỆCH TIỀN LƯƠNG 205
PHỤ LỤC D: DANH MỤC HÌNH VẼ CHƯƠNG 3 209
PHỤ LỤC E: DANH MỤC HÌNH VẼ CHƯƠNG 4 218
Trang 11DANH MỤC CÁC BẢNG BIỂU
Bảng 1 3: Tóm tắt một số nghiên cứu trên thế giới về chênh lệch tiền lương 55
Bảng 1 4: Bảng tóm tắt một số nghiên cứu về chênh lệch tiền lương ở Việt Nam 65
Bảng A 1: Danh sách các biến 180
Bảng A 2: Thống kê mô tả giá trị trung bình các biến - năm 2002 182
Bảng A 3: Thống kê mô tả giá trị trung bình các biến - năm 2012 183
Bảng A 4: Bảng thống kê số quan sát trong mẫu theo giới tính ở thành thị và nông thôn 184
Bảng A 5: Thống kê số quan sát ở từng nhóm lao động theo nhóm tuổi - năm 2002 184
Bảng A 6: Thống kê số quan sát ở từng nhóm lao động theo nhóm tuổi - năm 2012 185
Bảng A 7: Thống kê số quan sát ở từng nhóm lao động theo bằng cấp năm 2002 và 2012 185
Bảng A 8: Thống kê mô tả biến log - tiền lương thực tế theo từng nhóm tuổi 186
Bảng A 9: Thống kê mô tả biến log - tiền lương theo từng nhóm lao động 187
Bảng A 10: Thống kê mô tả biến log - tiền lương theo từng nhóm bằng cấp 188
Bảng B 1: Kết quả hồi quy hàm tiền lương ở lao động nam giới và nữ giới năm 2002 189
Bảng B 2: Kết quả hồi quy hàm tiền lương ở lao động nam giới và nữ giới năm 2012 191
Bảng B 3: Kết quả hồi quy hàm tiền lương ở lao động thành thị và nông thôn năm 2002 193
Bảng B 4: Kết quả hồi quy hàm tiền lương ở lao động thành thị và nông thôn năm 2012 195
Bảng B 5: Kết quả hồi quy hàm tiền lương ở lao động nam – nữ ở thành thị năm 2002 197
Bảng B 6: Kết quả hồi quy hàm tiền lương ở lao động nam - nữ ở thành thị năm 2012 199
Bảng B 7: Kết quả hồi quy hàm tiền lương ở lao động nam - nữ ở nông thôn năm 2002 201
Bảng B 8: Kết quả hồi quy hàm tiền lương ở lao động nam - nữ ở nông thôn năm 2012 203
Bảng C 1: Kết quả phân rã chênh lệch tiền lương giữa lao động nam và nữ 205
Bảng C 2: Kết quả phân rã chênh lệch tiền lương giữa lao động thành thị và nông thôn 206
Bảng C 3: Kết quả phân rã chênh lệch tiền lương giữa năm 2002 và 2012 207
Trang 12DANH MỤC CÁC HÌNH VẼ
Hình 1 1: Đồ thị biểu diễn các kết quả hồi quy phân vị của Y theo X 14
Hình 1 2: Đường hồi quy phân vị 2 biến đi qua ít nhất 2 quan sát của mẫu 18
Hình 1 3: Giá trị hồi quy tăng dần khi phân vị tăng dần tại X trung bình 20
Hình 1 4: Trích nghiên cứu của Buchinsky (1994) 45
Hình 1 5: Trích nghiên cứu của Fortin (1996) 47
Hình 1 6: Trích nghiên cứu của Machado & Mata (2005) 49
Hình 1 7: Trích nghiên cứu của Asplund và các cộng sự (2011) 53
Hình 1 8: Trích nghiên cứu của Binh T.N và các cộng sự (2007) 61
Hình 3 1 Kích thước mẫu theo từng nhóm giới tính năm 2002 209
Hình 3 2 Kích thước mẫu theo từng nhóm giới tính năm 2012 209
Hình 3 3 Tỷ lệ các nhóm tuổi trong mẫu số liệu 210
Hình 3 4 Tỷ lệ các nhóm bằng cấp theo giới tính năm 2002 210
Hình 3 5 Tỷ lệ các nhóm bằng cấp năm 2012 theo giới tính 211
Hình 3 6 Tỷ lệ các nhóm bằng cấp theo khu vực năm 2002 211
Hình 3 7 Tỷ lệ các nhóm bằng cấp theo khu vực năm 2012 212
Hình 3 8 Hàm mật độ tiền lương thực tế 212
Hình 3 9 Hàm mật độ tiền lương theo giới tính 213
Hình 3 10 Hàm mật độ tiền lương theo thành thị - nông thôn 214
Hình 3 11 Hàm mật độ tiền lương thực tế theo từng nhóm lao động 215
Hình 3 12 Hàm mật độ tiền lương thực tế từng nhóm lao động theo giới tính 216
Hình 3 13 Hàm mật độ tiền lương thực tế khu vực thành thị - nông thôn 217
Hình 4 1: Hệ số hồi quy theo bằng cấp của nhóm lao động nam - năm 2002 218
Hình 4 2: Hệ số hồi quy theo bằng cấp của nhóm lao động nữ - năm 2002 218
Trang 13Hình 4 5: So sánh hệ số hồi quy biến bằng cấp "Trung học phổ thông" năm 2002 220
Hình 4 6: So sánh hệ số hồi quy biến bằng cấp "Học nghề" năm 2002 220
Hình 4 7: So sánh hệ số hồi quy biến bằng cấp "Cao đẳng - Đại học" năm 2002 221
Hình 4 8: Hệ số hồi quy theo bằng cấp của nhóm lao động nam - năm 2012 221
Hình 4 9: Hệ số hồi quy theo bằng cấp của nhóm lao động nữ - năm 2012 222
Hình 4 10: So sánh hệ số hồi quy biến bằng cấp "Tiểu học" năm 2012 222
Hình 4 11: So sánh hệ số hồi quy biến bằng cấp "Trung học cơ sở" năm 2012 223
Hình 4 12: So sánh hệ số hồi quy biến bằng cấp "Trung học phổ thông" năm 2012 223
Hình 4 13: So sánh hệ số hồi quy biến bằng cấp "Học nghề" năm 2012 224
Hình 4 14: So sánh hệ số hồi quy biến bằng cấp "Cao đẳng/Đại học" năm 2012 224
Hình 4 15: So sánh hệ số hồi quy biến bằng cấp "Sau đại học" năm 2012 225
Hình 4 16: So sánh hệ số hồi quy biến bằng cấp "Tiểu học" giữa năm 2002 và 2012 ở nhóm lao động nam 225
Hình 4 17: So sánh hệ số hồi quy biến bằng cấp "Trung học cơ sở" giữa năm 2002 và 2012 ở nhóm lao động nam 226
Hình 4 18: So sánh hệ số hồi quy biến bằng cấp "Trung học phổ thông" giữa năm 2002 và 2012 ở nhóm lao động nam 226
Hình 4 19: So sánh hệ số hồi quy biến bằng cấp "Học nghề" giữa năm 2002 và 2012 ở nhóm lao động nam 227
Hình 4 20: So sánh hệ số hồi quy biến "Cao đẳng - Đại học" giữa năm 2002 và 2012 ở nhóm lao động nam 227
Hình 4 21: So sánh hệ số hồi quy biến bằng cấp "Sau đại học" giữa năm 2002 và 2012 ở nhóm lao động nam 228
Hình 4 22: So sánh hệ số hồi quy biến bằng cấp "Tiểu học" giữa năm 2002 và 2012 ở nhóm lao động nữ 228
Hình 4 23: So sánh hệ số hồi quy biến bằng cấp "Trung học cơ sở" giữa năm 2002 và 2012 ở nhóm lao động nữ 229
Trang 14và 2012 ở nhóm lao động nữ 229Hình 4 25: So sánh hệ số hồi quy biến bằng cấp "Học nghề" giữa năm 2002 và 2012 ở
nhóm lao động nữ 230Hình 4 26: So sánh hệ số hồi quy biến bằng cấp "Cao đẳng - Đại học" giữa năm 2002 và
2012 ở nhóm lao động nữ 230Hình 4 27: So sánh hệ số hồi quy biến bằng cấp "Sau đại học" giữa năm 2002 và 2012 ở
nhóm lao động nữ 231Hình 4 28: Hệ số hồi quy theo bằng cấp của nhóm lao động ở thành thị - năm 2002 231Hình 4 29: Hệ số hồi quy theo bằng cấp của nhóm lao động ở nông thôn - năm 2002 232Hình 4 30: So sánh hệ số hồi quy biến bằng cấp "Tiểu học " ở nhóm lao động thành thị
và nông thôn năm 2002 232Hình 4 31: So sánh hệ số hồi quy biến bằng cấp "Trung học cơ sở " ở nhóm lao động
thành thị và nông thôn năm 2002 233Hình 4 32: So sánh hệ số hồi quy biến bằng cấp "Trung học phổ thông" ở nhóm lao động
thành thị và nông thôn năm 2002 233Hình 4 33: So sánh hệ số hồi quy biến bằng cấp "Học nghề" ở nhóm lao động thành thị
và nông thôn năm 2002 234Hình 4 34: So sánh hệ số hồi quy biến bằng cấp "Cao đẳng / Đại học" ở nhóm lao động
thành thị và nông thôn năm 2002 234Hình 4 35: Hệ số hồi quy theo bằng cấp của nhóm lao động ở thành thị - năm 2012 235Hình 4 36: Hệ số hồi quy theo bằng cấp của nhóm lao động ở nông thôn - năm 2012 235Hình 4 37: So sánh hệ số hồi quy biến bằng cấp "Tiểu học" ở nhóm lao động thành thị và
nông thôn năm 2012 236Hình 4 38: So sánh hệ số hồi quy biến "Trung học cơ sở " ở nhóm lao động thành thị và
nông thôn năm 2012 236Hình 4 39: So sánh hệ số hồi quy biến bằng cấp "Trung học phổ thông " ở nhóm lao
động thành thị và nông thôn năm 2012 237Hình 4 40: So sánh hệ số hồi quy biến bằng cấp "Học nghề" ở nhóm lao động thành thị
và nông thôn năm 2012 237
Trang 15thành thị và nông thôn năm 2012 238Hình 4 42: So sánh hệ số hồi quy biến bằng cấp "Sau đại học" ở nhóm lao động thành thị
và nông thôn năm 2012 238Hình 4 43: So sánh hệ số hồi quy biến bằng cấp "Tiểu học" ở nhóm lao động thành thị
giữa năm 2002 với 2012 239Hình 4 44: So sánh hệ số hồi quy biến bằng cấp "Trung học cơ sở" ở nhóm lao động
thành thị giữa năm 2002 với 2012 239Hình 4 45: So sánh hệ số hồi quy biến bằng cấp "Trung học phổ thông" ở nhóm lao động
thành thị giữa năm 2002 với 2012 240Hình 4 46: So sánh hệ số hồi quy biến bằng cấp "Học nghề" ở nhóm lao động thành thị
giữa năm 2002 với 2012 240Hình 4 47: So sánh hệ số hồi quy biến bằng cấp “Cao đẳng – Đại học” ở nhóm lao động
thành thị giữa năm 2002 với 2012 241Hình 4 48: So sánh hệ số hồi quy biến bằng cấp "Sau đại học" ở nhóm lao động thành thị
giữa năm 2002 với 2012 241Hình 4 49: So sánh hệ số hồi quy biến bằng cấp "Tiểu học" ở nhóm lao động nông thôn
giữa năm 2002 với 2012 242Hình 4 50: So sánh hệ số hồi quy biến bằng cấp "Trung học cơ sở" ở nhóm lao động
nông thôn giữa năm 2002 với 2012 242Hình 4 51: So sánh hệ số hồi quy biến bằng cấp "Trung học phổ thông" ở nhóm lao động
nông thôn giữa năm 2002 với 2012 243Hình 4 52: So sánh hệ số hồi quy biến bằng cấp "Học nghề" ở nhóm lao động nông thôn
giữa năm 2002 với 2012 243Hình 4 53: So sánh hệ số hồi quy biến bằng cấp "Cao đẳng - Đại học" ở nhóm lao động
nông thôn giữa năm 2002 với 2012 244Hình 4 54: Kết quả phân rã chênh lệch tiền lương theo giới tính năm 2002 244Hình 4 55: Kết quả phân rã chênh lệch tiền lương theo giới tính ở thành thị năm 2002 245Hình 4 56: Kết quả phân rã chênh lệch tiền lương theo giới tính ở nông thôn năm 2002
245
Trang 16Hình 4 59: Kết quả phân rã chênh lệch tiền lương theo giới tính ở nông thôn năm 2012
247Hình 4 60: So sánh kết quả phân rã chênh lệch theo giới tính ờ thành thị và nông thôn
năm 2012 247Hình 4 61: So sánh kết quả phân rã chênh lệch theo giới tính năm 2002 và 2012 248Hình 4 62: So sánh kết quả phân rã chênh lệch theo giới tính ở thành thị năm 2002 và
2012 248Hình 4 63: So sánh kết quả phân rã chênh lệch theo giới tính ở nông thôn năm 2002 và
2012 249Hình 4 64: Kết quả phân rã chênh lệch tiền lương giữa lao động thành thị và nông thôn
năm 2002 249Hình 4 65: Kết quả phân rã chênh lệch tiền lương giữa lao động thành thị và nông thôn ở
nam giới năm 2002 250Hình 4 66: Kết quả phân rã chênh lệch tiền lương giữa lao động thành thị và nông thôn ở
nữ giới năm 2002 250Hình 4 67: Kết quả phân rã chênh lệch tiền lương giữa lao động thành thị và nông thôn
năm 2012 251Hình 4 68: Kết quả phân rã chênh lệch tiền lương giữa lao động thành thị và nông thôn ở
nam giới năm 2012 251Hình 4 69: Kết quả phân rã chênh lệch tiền lương giữa lao động thành thị và nông thôn ở
nữ giới năm 2012 252Hình 4 70: So sánh kết quả phân rã chênh lệch tiền lương giữa thành thị và nông thôn ở
nhóm lao động nam và nữ năm 2002 252Hình 4 71: So sánh kết quả phân rã chênh lệch tiền lương giữa thành thị và nông thôn ở
nhóm lao động nam và nữ năm 2012 253Hình 4 72: So sánh kết quả phân rã chênh lệch tiền lương giữa thành thị và nông thôn
năm 2002 và 2012 253Hình 4 73: So sánh kết quả phân rã chênh lệch tiền lương giữa thành thị và nông thôn ở
nhóm ở nhóm lao động nam năm 2002 và 2012 254
Trang 17nhóm lao động nữ năm 2002 và 2012 254Hình 4 75: Kết quả phân rã chênh lệch tiền lương giữa năm 2002 và 2012 255Hình 4 76: Kết quả phân rã chênh lệch tiền lương giữa năm 2002 và 2012 ở nhóm lao
động nam 255Hình 4 77: Kết quả phân rã chênh lệch tiền lương giữa năm 2002 và 2012 ở nhóm lao
động nữ 256Hình 4 78: Kết quả phân rã chênh lệch tiền lương giữa năm 2002 và 2012 ở nhóm lao
động nông thôn 257
Trang 19
DANH MỤC CÁC TỪ VIẾT TẮT
2SLS : Phương pháp bình phương nhỏ nhất hai bước
(Two-Stage Least Squares)
2SQR : Hồi quy phân vị hai bước
(Two-Stage Quantile Regression))
đ.l.n.n : đại lượng ngẫu nhiên
OLS : Phương pháp bình phương nhỏ nhất
(Ordinary Least Squares)
QR : Phương pháp hồi quy phân vị
(Quantile Regression)
TPHCM : Thành phố Hồ Chí Minh UNDP : Chương Trình Phát Triển Liên Hiệp Quốc
(United Nations Development Programme)
VHLSS : Khảo sát mức sống hộ gia đình
(VietNam Household Living Standard Survey)
Trang 21Như vậy, sự tồn tại của chênh lệch tiền lương là tất yếu Tuy nhiên, các nhà kinh
tế học như Becker (1971), Cain (1986) phân biệt hai cách giải thích cho vấn đề chênh lệch tiền lương: đó là chênh lệch tiền lương do phân biệt đối xử và chênh lệch tiền lương do chênh lệch về vốn con người và/hoặc năng suất lao động Sự chênh lệch tiền lương do chênh lệch về vốn con người và/hoặc do chênh lệch về năng suất lao động có thể xem là những chênh lệch “tích cực” tạo ra động lực để phát triển Sự chênh lệch tiền lương do trình độ học vấn sẽ khiến người ta cố gắng học hỏi để đạt trình độ cao Hay sự chênh lệch về tiền công do chênh lệch về năng suất lao động, về hiệu quả công việc, về khả năng ngoại ngữ, về việc tích luỹ kinh nghiệm, về khả năng sáng tạo v.v sẽ tạo ra động lực để người lao động phấn đấu hoàn thiện chính mình, từ đó kích thích sự phát triển chung của xã hội Những chênh lệch tiền lương
“tiêu cực” thể hiện ở các bất bình đẳng nảy sinh trong xã hội mà chúng ta cần phải điều chỉnh Ví dụ như sự chênh lệch tiền lương do kỳ thị lao động nữ giới, ưu ái lao động nam giới, chênh lệch tiền lương dẫn đến chênh lệch giàu nghèo, chênh lệch mức sống giữa thành thị - nông thôn, v.v Do vậy, có thể phân chia các nguyên
Trang 22do sự thay đổi của thị trường lao động, sự khác nhau hoặc sự thay đổi của môi trường lao động tại nơi làm việc, do sự khác nhau về tính chất của công việc hoặc do
sự khác nhau về đặc điểm của bản thân người lao động Nhóm thứ hai là do sự kỳ thị
hoặc là do sự phân biệt đối xử trong xã hội và/hoặc của người sử dụng lao động đối với người lao động Nhóm nguyên nhân này dẫn đến sự bất bình đẳng trong xã hội
Do vậy, nhằm (1) xác định mức độ chênh lệch tiền lương tại Việt Nam, (2) xác định các yếu tố thực sự tác động đến tiền lương và (3) phân rã khoảng chênh
lệch tiền lương để làm rõ phần chênh lệch giải thích theo nhóm nguyên nhân thứ nhất và phần thể hiện bất bình đẳng theo nhóm nguyên nhân thứ hai nói trên, đề tài
“Ứng dụng phương pháp hồi quy phân vị phân tích chênh lệch tiền lương ở Việt Nam” được chọn làm đề tài cho luận án tiến sĩ của tác giả tại trường Đại học Kinh tế
TPHCM
2 Mục tiêu nghiên cứu
Để thực hiện các mục đích trên, đề tài hướng đến việc hoàn thành các mục tiêu sau đây:
1) Giới thiệu một cách có hệ thống về cơ sở lý thuyết và khả năng ứng dụng phương pháp hồi quy phân vị, cũng như phương pháp phân rã chênh lệch tiền lương dựa trên hồi quy phân vị
2) Thực hiện hồi quy phân vị hàm tiền lương thực tế ở Việt Nam với biến phụ thuộc là logarit tiền lương thực tế theo giờ của người lao động Hệ số của hàm tiền lương thực tế này được ước lượng bằng phương pháp hồi quy phân vị có hiệu chỉnh tính chệch do chọn mẫu và khắc phục nội sinh
3) Xác định khoảng chênh lệch tiền lương theo giới tính (nam – nữ, nam - nữ ở thành thị, nam – nữ ở nông thôn) và phân rã các khoảng chênh lệch tiền lương này để làm rõ phần chênh lệch được giải thích bởi các biến độc lập và phần chênh lệch chưa được giải thích gây ra bởi chênh lệch về hệ số hồi quy Đồng thời so sánh kết quả phân tích chênh lệch tiền lương theo giới tính năm 2002
và 2012 để làm rõ sự thay đổi theo thời gian
Trang 234) Xác định khoảng chênh lệch tiền lương theo khu vực (thành thị - nông thôn, thành thị - nông thôn ở nam giới, thành thị - nông thôn ở nữ giới) Phân rã các khoảng chênh lệch tiền lương này để làm rõ phần chênh lệch được giải thích bởi các biến độc lập và phần chênh lệch chưa được giải thích gây ra bởi chênh lệch về hệ số hồi quy Đồng thời so sánh kết quả phân tích chênh lệch tiền lương theo khu vực năm 2002 và 2012 để làm rõ sự thay đổi theo thời gian 5) Xác định mức tăng lương theo thời gian từ năm 2002 đến năm 2012 Phân rã
sự tăng lương này thành hai phần: phần tăng lương là do thay đổi về đặc điểm lao động và phần tăng lương là do thay đổi hệ số hồi quy
3 Đối tượng – phạm vi nghiên cứu
Đề tài này được thực hiện đựa trên bộ số liệu khảo sát mức sống hộ gia đình (VHLSS) năm 2002 và 2012 do Tổng cục Thống kê công bố Đối tượng nghiên cứu của đề tài cũng chính là đối tượng được khảo sát về tiền lương và các yếu tố có liên quan trong các cuộc khảo sát này Phạm vi nghiên cứu của đề tài là nghiên cứu tiền lương thực tế theo giờ của các đối tượng trong độ tuổi trên lãnh thổ Việt Nam
4 Ý nghĩa khoa học và ý nghĩa thực tiễn
Với mục tiêu nghiên cứu và phương pháp nghiên cứu được lựa chọn, đề tài của luận án mang lại các ý nghĩa khoa học và thực tiễn sau đây:
(a) Đề tài áp dụng phương pháp hồi quy phân vị, một kỹ thuật hồi quy được giới thiệu bởi Koenker & Bassett (1978) và đã được dùng rất rộng rãi trên thế giới nhưng chưa phổ biến ở Việt Nam Rất ít các đề tài nghiên cứu ở Việt Nam áp dụng kỹ thuật hồi quy phân vị, đặc biệt là áp dụng trong nghiên cứu hàm tiền lương và phân rã chênh lệch tiền lương
(b) Đề tài trình bày một cách ngắn gọn, đầy đủ và có hệ thống về lý thuyết của phương pháp hồi quy phân vị Đây là điều mà cho đến nay chưa có tác giả
ở Việt Nam nào thực hiện
(c) Hàm tiền lương của các nhóm lao động được ước lượng bằng phương
Trang 24hiện tượng nội sinh trong mô hình, đem lại ước lượng vững và đáng tin cậy
(d) Đề tài xây dựng và ước lượng hàm tiền lương ở Việt Nam bằng phương pháp hồi quy phân vị cho từng nhóm lao động cụ thể: lao động nam và lao động nữ, lao động thành thị và lao động nông thôn, lao động nam ở thành thị và lao động nữ ở thành thị, lao động nam ở nông thôn và lao động nữ ở nông thôn
(e) Đề tài xác định mức chênh lệch tiền lương theo giới tính ở Việt Nam (trên toàn bộ mẫu số liệu cũng như ở từng khu vực thành thị - nông thôn) Đồng thời đề tài nghiên cứu sự thay đổi các mức chênh lệch này theo thời gian bằng cách so sánh kết quả tính toán giữa năm 2002 với 2012
(f) Đề tài phân rã khoảng chênh lệch tiền lương theo giới tính để xác định phần chênh lệch tiền lương thể hiện qua phần chênh lệch về đặc điểm lao
động và phần chênh lệch thể hiện qua sự khác nhau về hệ số hồi quy (được xem như là dấu hiệu của phân biệt đối xử tiền lương giữa nam và nữ)
(g) Đề tài xác định mức chênh lệch tiền lương giữa hai khu vực thành thị và nông thôn ở Việt Nam và nghiên cứu sự thay đổi của mức chênh lệch này theo thời gian bằng cách so sánh kết quả tính toán giữa hai hai thời điểm nghiên cứu là năm 2002 và 2012
(h) Đề tài phân rã khoảng chênh lệch tiền lương giữa hai khu vực thành thị và nông thôn nhằm xác định phần chênh lệch thể hiện qua khác nhau về đặc điểm lao động và phần chênh lệch thể hiện thông qua khác nhau về hệ số
hồi quy (được xem như là dấu hiệu của sự khác nhau trong chính sách đãi ngộ của khu vực thành thị - nông thôn)
Trang 25CHƯƠNG 1
CƠ SỞ LÝ THUYẾT VỀ HÀM TIỀN LƯƠNG
VÀ VẤN ĐỀ PHÂN TÍCH CHÊNH LỆCH TIỀN LƯƠNG BẰNG HỒI QUY PHÂN VỊ
Nhằm thực hiện các mục tiêu nghiên cứu đã nêu, đề tài áp dụng phương pháp hồi quy phân vị có hiệu chỉnh tính chệch do vấn đề chọn mẫu và có xử lý nội sinh để ước lượng hàm tiền lương dạng Mincer (1974) mở rộng Biến phụ thuộc được lựa chọn là logarit tiền lương thực tế dựa trên số liệu của VHLSS 2002 và VHLSS 2012 Sau đó, phương pháp Machado - Mata (2005) được áp dụng để tiến hành phân rã chênh lệch tiền lương và xác định các thành phần của khoảng chênh lệch này Do vậy, chương 1 sẽ bao gồm các nội dung sau đây:
- Trình bày hàm tiền lương do Mincer (1974) đề xuất và một số các mở rộng
- Trình bày phương pháp hồi quy phân vị do Koenker & Bassett (1978) đề xuất và các đặc điểm của hồi quy phân vị
- Tính chệch của ước lượng do vấn đề chọn mẫu và hiệu chỉnh ước lượng chệch do chọn mẫu đối với hồi quy phân vị
- Phương pháp phân rã chênh lệch do Machado - Mata(2005) đề xuất
RỘNG
Mincer (1974) đã giới thiệu phương trình tiền lương thể hiện mối quan hệ giữa logarit tiền lương (hoặc tiền công/thu nhập) với các yếu tố như số năm đi học, kinh nghiệm làm việc và bình phương của biến kinh nghiệm dựa trên lập luận rằng
Trang 26số tiền công được trả cho một người trong hiện tại phụ thuộc vào mức đầu tư vào
vốn con người (human capital) của bản thân họ trước đó
Ký hiệu mức tiền lương nhận được tại thời điểm t là E Mincer giả sử rằng đầu t
tư của một cá nhân vào vốn con người của bản thân ở kỳ t là k , hiệu quả tương ứng t
cùng kỳ mang lại cho mỗi đơn vị đầu tư là r t Khi đó, mức tiền lương nhận được ở thời điểm t được thể hiện như sau:
- Số năm đi học (s) là số năm được dành toàn thời gian cho việc học của người
lao động (trong thời gian đi học k0 k1 k s11 (năm))
- Hiệu quả mang lại của số năm đi học đối với tiền lương tiềm năng là không đổi theo thời gian (r0 r1 r s1)
- Hiệu quả mang lại của việc đầu tư cho đi học sau khi tốt nghiệp đối với tiền lương tiềm năng là không đổi theo thời gian (r s r t1)
Khi đó phương trình tiền lương được viết lại như sau
1 0
Ta có ln(1x) và x là hai vô cùng bé tương đương khi (x0)
Do đó, khi giá trị của , khá nhỏ, ta được
1
ln ln
t
E E s k
Trang 27Để xây dựng mối quan hệ giữa tiền lương tiềm năng và thâm niên công tác, Mincer giả sử rằng đầu tư vào học vấn sau tốt nghiệp giảm dần theo thời gian với dạng hàm số như sau:
1
s z
z k
.2
Trang 28Đây là phương trình tiền lương Mincer dạng tĩnh, được sử dụng rất nhiều trong các công trình nghiên cứu về tiền lương và phân tích sự chênh lệch tiền lương Một trong những công trình nghiên cứu xuất sắc, kế thừa phương trình tiền lương của Mincer (1974) được phát triển bởi Card (1994) Công trình này tập trung nghiên cứu tác động trung bình của số năm đi học đến tiền lương, thông qua kỹ thuật hồi quy theo phương pháp bình phương nhỏ nhất và phương pháp hồi quy với biến công cụ Dạng hàm tiền lương được mở rộng thành dạng
2
lnw t szz X u
Trong đó, s: số năm đi học
z: Số năm kinh nghiệm tính đến thời điểm t với z t s
X: Các biến độc lập khác có tác động đến tiền lương như giới tính, công việc, ngành nghề…
Sau công trình nghiên cứu của Card (1994), rất nhiều các nghiên cứu khác đã
mở rộng phương trình tiền lương của Mincer Các công trình này không phải chỉ nghiên cứu tiền lương trung bình và phân tích chênh lệch tiền lương trung bình, như nghiên cứu của Oaxaca-Blinder (1973), mà còn mở rộng ra nghiên cứu các tham số thống kê khác của hàm phân phối có điều kiện của tiền lương Trong số đó, Buchinsky (1994) thực hiện hồi quy phân vị trên hàm tiền lương của Mincer Tiếp theo đó là hàng loạt các nghiên cứu khác về tiền lương và chênh lệch tiền lương dựa trên phương trình tiền lương của Mincer đã được công bố Những nghiên cứu khác nhau sử dụng những biến độc lập khác nhau trong hàm tiền lương Mincer (1974) mở rộng
1.2 PHƯƠNG PHÁP HỒI QUY PHÂN VỊ
Phương pháp hồi quy phân vị được Koenker & Bassett giới thiệu lần đầu tiên năm 1978 Thay vì ước lượng các tham số của hàm hồi quy trung bình bằng phương pháp OLS, Koenker & Bassett (1978) đề xuất việc ước lượng tham số hồi quy trên từng phân vị của biến phụ thuộc để sao cho tổng chênh lệch tuyệt đối của hàm hồi quy tại phân vị τ của biến phụ thuộc là nhỏ nhất Nói một cách khác, thay vì xác định
Trang 29tác động biên của biến độc lập đến giá trị trung bình của biến phụ thuộc, hồi quy phân vị sẽ giúp xác định tác động biên của biến độc lập đến biến phụ thuộc trên từng phân vị của biến phụ thuộc đó Trong Mục 1.1.2, đề tài giới thiệu đầy đủ các định nghĩa, tính chất của hồi quy phân vị Đồng thời đề tài so sánh phương pháp hồi quy phân vị với phương pháp OLS của hồi quy cổ điển để cho thấy ưu điểm của hồi quy phân vị và sự phù hợp của hồi quy phân vị trong những nghiên cứu về chênh lệch tiền lương, cũng như trong các nghiên cứu về bất bình đẳng trong xã hội
Định nghĩa về phân vị: Cho Y là một đ.l.n.n với hàm phân phối F Với Y
(0,1)
thì giá trị phân vị τ của Y là giá trị Q sao cho
Pr(YQ) Pr(YQ) (1.2) Hoặc có thể viết lại Q infy F y: Y( ) (1.3) Nếu Y là một đ.l.n.n liên tục, thì:
Pr(Yy)Pr(Yy)F y Y( )
Nếu F liên tục và tăng chặt thì Q F Y1( ).
Điều này có nghĩa là 100 % số quan sát của Y có giá trị không vượt quá giá trị phân
vị Q và 100(1)% số quan sát của Y có giá trị không thấp hơn Q
Giá trị phân vị, cũng như giá trị kỳ vọng của một đ.l.n.n, luôn là lời giải của
một bài toán cực trị liên quan đến đ.l.n.n đó Cụ thể, giá trị kỳ vọng E(Y) của đ.l.n.n
Y là lời giải cho bài toán tìm R sao cho 2
Trong khi giá trị trung bình của Y lời giải bài toán tìm cực tiểu (1.5) thì giá trị phân
vị Q của Y là lời giải của bài toán tìm cực tiểu hàm mục tiêu sau
Trang 30Hay arg min ( ) Y( ) ( 1) | | Y( ).
Định nghĩa về xác suất có điều kiện và phân vị có điều kiện
Hàm phân phối xác suất đồng thời của hai biến ngẫu nhiên X và Y, ký hiệu là
Nếu X và Y có hàm mật độ đồng thời là f x y( , ) Khi đó hàm mật độ xác suất biên
(marginal density function) của Y được xác định bởi
Trang 31Nếu F Y X| ( | )y x là liên tục và tăng chặt thì 1
|( | ) Y X( | )
Trang 32Khi gần 0, Q Y X( | x) thể hiện phần đuôi trái của hàm phân phối có điều kiện
gọi là phương pháp hồi qui y theo x
Tương tự, Koenker & Bassett (1978) cũng đề xuất dạng mở rộng của bài toán (1.10) để tìm ra hàm phân vị có điều kiện Q Y X( | ) Phương pháp này gọi là phương
pháp hồi quy phân vị Để mở rộng bài toán (1.10), giả sử ta có mẫu số liệu với các
Trang 33Khi đó, phương trình (1.13) trở thành ˆ arg min ( ).
Q Y X h X trở thành hàm hồi quy phân vị ở phân vị
Tương tự, hàm hồi quy phân vị tuyến tính ở phân vị có dạng Q Y X( |i i)X i
Và hàm hồi quy phân vị tuyến tính mẫu ở phân vị sẽ là
ˆ( |i i) i
Q Y X X hay ˆ
Y X u với Q u( i |X i) 0. (1.14) Giá trị ˆ
Cách viết này cho thấy việc ước lượng tham số trong hàm hồi quy ứng với phân vị
là dựa trên toàn bộ mẫu số liệu Mỗi quan sát được gán trọng số tương ứng Cụ thể, những quan sát nằm phía trên đường hồi quy phân vị được gán trọng số và những quan sát nằm phía dưới được gán trọng số 1
Công thức V() ở (1.18) còn có thể viết dưới dạng khác như sau
Trang 34Nếu 1
2
, hồi quy phân vị sẽ cho kết quả hàm hồi quy trung vị có điều kiện
Q Y X X Đây cũng chính là lời giải của bài toán hồi quy theo phương
pháp LAD (Least Absolute Deviation – Độ lệch tuyệt đối nhỏ nhất) rất phổ biến
trong kinh tế lượng cổ điển
Nguồn: tác giả tính toán từ số liệu mô phỏng trên Stata
Hình 1 1: Đồ thị biểu diễn các kết quả hồi quy phân vị của Y theo X
Hồi quy bằng phương pháp OLS chỉ thu được một đường hồi quy duy nhất thể hiện giá trị trung bình có điều kiện của biến phụ thuộc Y theo các giá trị của biến độc lập X Trong khi đó, hồi quy phân vị cho thấy được nhiều hàm hồi quy ứng với từng
q10 q25 q50OLSq75 q90
Trang 35b Tính chất của phương pháp hồi quy phân vị
Theo Koenker (2005) và Hao & Naiman (2007), hồi quy phân vị có những tính chất quan trọng thể hiện ưu điểm của phương pháp hồi quy này so với phương bình phương nhỏ nhất
b.1 Tính đẳng biến (Equivariance)
Giá trị phân vị có tính đẳng biến khi biến đổi qua hàm số đơn điệu: với (.)h là
một hàm số bất kỳ không giảm và Y là một đ.l.n.n liên tục, thì ta có
P Y a P h Y h a Vì vậyQ h Y ( ) h Q Y( ) Từ đó, Koenker (2005) chứng các tính chất đẳng biến quan trọng của hồi quy phân vị 1
- Hồi quy phân vị có tính đẳng biến khi thay đổi quy mô (scale equivariance)
- Hàm hồi quy phân vị còn có tính chất đẳng biến khi thay đổi vị trí Nghĩa là,
nếuy i* y i X i và * là tham số của hồi quy phân vị của y*i theoX thì i
*
- Một tính chất khác của hồi quy phân vị là đẳng biến khi thay đổi dạng biến
số Cụ thể, nếu X* X A với A là ma trận không suy biến, thì ˆ* A 1ˆ Tính đẳng biến của hồi quy phân vị đặc biệt hữu ích trong các tính toán biến đổi để ước lượng tham số khi dùng phương pháp quy hoạch tuyến tính
b.2 Tính ổn định (robustness)
Trang 36
Với hồi quy cổ điển, các ước lượng của phương pháp bình phương nhỏ nhất thay đổi ngay khi Y thay đổi Mỗi sự thay đổi trong i Y sẽ dẫn đến sự thay đổi của i
các ước lượng hồi quy OLS Điều này làm cho ảnh hưởng của các quan sát bất
thường (extreme value) đến ước lượng của OLS là rất lớn Trong khi đó, đối với hồi
quy phân vị, khi Y thay đổi nhưng chưa làm biến đổi dấu của i ˆ
Y X thì các tham
số ước lượng của hồi quy phân vị không thay đổi Nói khác đi, người ta có thể thay đổi giá trị của một quan sát ở một phía bất kỳ của đường hồi quy phân vị mà không làm ảnh hưởng đến kết quả hồi quy, nếu sự thay đổi đó không làm thay đổi phía của quan sát so với đường hồi quy phân vị Do đó, cho dù nếu có thay thế một quan sát ban đầu bằng một quan sát bất thường thì giá trị của tham số ước lượng trên hồi quy vẫn không thay đổi nếu quan sát bất thường này nằm cùng phía với quan sát ban đầu
so với hàm hồi quy Vì vậy ước lượng bằng phương pháp hồi quy phân vị được xem
là có tính ổn định hơn so với ước lượng OLS2
b.3 Hàm hồi quy phân vị k biến luôn đi qua ít nhất k quan sát của mẫu nghiên cứu
Xét hàm mục tiêu được viết dưới dạng công thức (1.17):
0
1
1( )
i i
n
Y X i
Trang 37i n
dòng có chỉ số thuộc tập) và ( )y là vectơ cột cấp k1 với các phần tử tương ứng
là ,Y i i Khi đó hệ nghiệm cơ bản là b( ) X( ) ( ) 1 y với Mỗi phương án thỏa mãn miền ràng buộc đều chứa k trong số n quan sát của mẫu nghiên cứu,
Trang 38phương án b được nêu ra trước đó cũng là một trong số các phương án ( )b với trường hợp 1, , k ứng với kquan sát đầu tiên
Hình 1 2: Đường hồi quy phân vị 2 biến đi qua ít nhất 2 quan sát của mẫu
Nguồn: tác giả tính toán từ số liệu mô phỏng
Như vậy, phương án tối ưu của bài toán quy hoạch tuyến tính trong hồi quy phân vị là một trong số các phương án ( )b nên chắc chắc cũng sẽ đi qua ít nhất k
quan sát của mẫu Hay nói cách khác, có ít nhất k quan sát có phần dư bằng 0 trong hàm hồi quy phân vị của mẫu
Hình 1 2 là một ví dụ minh họa bằng hình ảnh của tính chất trên đối với một hàm hồi quy phân vị hai biến Nhìn trên đồ thị, mỗi dấu chấm là biểu diễn của một quan sát trong mẫu, ta nhận thấy mỗi hàm hồi quy phân vị trên hình đi qua ít nhất hai quan sát của mẫu số liệu có được
b.4 Số quan sát có phần dư âm của hàm hồi quy phân vị ứng với phân vị τ có thể đạt tỷ lệ cao nhất là τ
q25 q75
Trang 39Xét phần dư ˆ
e Y Xcủa hàm hồi quy phân vị có chứa hệ số tự do Ký hiệu P là số quan sát có phần dư dương; N là số quan sát có phần dư âm và Z là số quan sát có phần dư bằng 0 Khi đó
Từ tính chất này có thể suy ra rằng với mỗi hàm hồi quy ứng với phân vị thì
sẽ có không quá 100%số quan sát của mẫu nằm phía dưới đường hồi quy phân vị (có phần dư ui âm) và không quá (1).100%số quan sát nằm phía trên (có phần dư
i
u không âm) hàm hồi quy phân vị đang xét.4
b.5 Tính tăng dần của các hàm hồi quy phân vị 5 tại giá trị trung bình của X
Ký hiệu
1
1 n i i
ứng với phân vị cao hơn sẽ luôn lớn hơn giá trị ước lượng Q Y Xˆ ( | ) i i tại phân vị thấp hơn Tuy nhiên, tính chất này chưa chắc đúng khi xét tại những giá trị X bất kỳ khác Tính chất này được minh họa trên Hình 1 3
4 Xem trang 56 của tài liệu Koenker (2005)
5
Trang 40Hình 1 3: Giá trị hồi quy tăng dần khi phân vị tăng dần tại X trung bình
Nguồn: tác giả tính toán từ số liệu mô phỏng
b.6 Ước lượng của hồi quy phân vị là ước lượng M-estimator
Ước lượng M-estimator được đề cập lần đầu tiên trong kết quả nghiên cứu của
Gouriéroux và Monfort (2008) Giả sử xét một mô hình tham số hoặc bán tham số với tham số và các quan sát (X y i, i i)1, ,n , một ước lượng được gọi là M- estimator của một hàm g( ) nếu ước lượng đó là lời giải của bài toán cực trị
Một M-estimator của một hàm được chứng minh là luôn hội tụ
về giá trị đúng của hàm số đó nếu thỏa mãn các điều kiện chính quy (regularity conditions)
+ Các cặp quan sát (X y là i.i.d (identical independent distribution- độc i, )i
lập và có cùng phân phối)
+ g( ) là một tập mở
X trung binh = 9,9524
q10 q25 q50 q75 q90