CHƯƠNG 3 : PHƯƠNG PHÁP NGHIÊN CỨU
3.1. Giới thiệu mơ hình nghiên cứu
Với mục tiêu nghiên cứu ban đầu là kiểm tra ảnh hưởng của các hoạt động di cư trong ngắn hạn và dài hạn của người thân trong gia đình đến việc đi học và tình trạng lao động của trẻ em ở lại. Do đó bài nghiên cứu này lập một mơ hình định lượng dựa trên các lý thuyết về mối quan hệ giữa di cư lao động và phúc lợi trẻ em và các nghiên cứu của Hanson và Woodruff (2003), Calero và cộng sự (2007), Antman (2012) đã nêu ở chương 2 để đo lường tác động của di cư lao động đến tình trạng đi học và lao động của trẻ em trong hộ gia đình. Tác giả lập một mơ hình kinh tế lượng tổng quát được trình bày dưới dạng phương trình kinh tế lượng như sau:
Yi = α1+ α2*Xi + α3*Dicui + µi (1)
Trong đó:
Yi là các biến phụ thuộc đo lường phúc lợi của từng đứa trẻ em trong từng
hộ gia đình theo các tiêu chí giáo dục và lao động đại diện bằng câu hỏi: Trẻ trong độ tuổi từ 6-18 tuổi hiện có ghi danh đi học khơng ? và trẻ có tham gia hoạt động kinh tế trong 12 tháng khơng?
Ngồi ra với biến phụ thuộc là biến trẻ có tham gia hoạt động kinh tế thì bài viết cũng phân tích thêm tách hoạt động lao động của trẻ thành 2 phần nghiên cứu là trẻ có tham gia hoạt động sản xuất kinh doanh của gia đình (làm việc bên trong gia đình) hay trẻ đi làm để nhận lương (làm việc bên ngồi gia đình) thì hoạt động nào thật sự bị ảnh hưởng bởi di cư trong ngắn hạn và dài hạn.
Dicui: đại diện hộ hiện có thành viên đi di cư lao động không ? (Di cư gồm
di cư trong ngắn hạn và di cư dài hạn).
Xi là các biến kiểm soát bao gồm các nhóm biến về đặc điểm cá nhân trẻ em, đặc điểm chủ hộ, đặc điểm hộ gia đình, đặc điểm xã, vùng miền.
Bài nghiên cứu này chia dữ liệu nghiên cứu thành 3 mẫu quan sát phúc lợi của trẻ em trong độ tuổi từ 6 đến dưới 18 tuổi trên phạm vi cả nước, nông thôn và thành thị để xem xét tác động của di cư lao động đến phúc lợi của trẻ em thông qua tiêu chí: (1) Trẻ có đi học khơng ? (2) Trẻ có đi làm khơng ? (3) Trẻ lao động bên trong hộ không (lao động nội bộ) ? và (3) Trẻ lao động bên ngồi hộ khơng ?. Xem xét di cư lao động ở mỗi khu vực tác động như thế nào đối với phúc lợi của trẻ em.
3.2. Mơ hình Probit với vấn đề nội sinh 3.2.1 Mơ hình Probit
Trong nhiều trường hợp nghiên cứu kinh tế lượng thì dữ liệu của biến phụ thuộc không phải lúc nào cũng là dữ liệu liên tục mà biến phụ thuộc là biến định tính mang tính đo lường nhị phân: có/ khơng, xảy ra/ khơng xảy ra, có tham gia/ khơng tham gia, v.v. Nếu sử dụng mơ hình tuyến tính thì ước lượng sẽ khơng hiệu quả do giả thuyết về phương sai đồng nhất của sai số bị vi phạm. Trong trường hợp này các mơ hình được nhiều nhà nghiên cứu sử dụng có thể là mơ hình Logit hay mơ hình Probit. Bài nghiên cứu này với biến phụ thuộc là các biến định tính: (1) Trẻ có đi học khơng ? (2) Trẻ có đi làm khơng ? (3) Trẻ lao động bên trong hộ không (lao động nội bộ) ? và (3) Trẻ lao động bên ngồi hộ khơng ?. Dựa vào phương pháp nghiên cứu của của nhóm tác giả Calero và cộng sự (2007), do đó bài nghiên cứu này lựa chọn mơ hình Probit để ước lượng kết quả hồi quy.
Phần này tác giả trình bày mơ hình Probit dựa trên tài liệu của tác giả Woodridge (2002)2.
Ví dụ: Xét trong trường hợp các yếu tố tác động đến việc đi học của trẻ trong bài nghiên cứu này. Việc trẻ có đi học hay không tùy thuộc chỉ số hữu dụng Ii (utility index).
Từ công thức tổng quát: Yi = Xiβ + εi
Y = 1 nếu có trẻ em đi học
Y = 0 nếu có trẻ em khơng đi học
Xj là các yếu tố tác động việc đi học của trẻ
Gọi chỉ số hữu dụng: Ii = Xiβ+ εi, khi đó
Nếu Ii < I* thì xác xuất đi học của trẻ bằng 0 và nếu Ii > I* thì xác xuất đi học của trẻ bằng 1.
Ii và I* không quan sát được, nhưng chúng có phân phối chuẩn Dựa vào giả thiết phân phối chuẩn
Pi = P(Y=1│X) = P(I*≤Ii ) = P(Zi ≤ β1 + Xi β) = F(β1+ Xiβ)
F là hàm mật độ tích lũy thường được chuẩn hóa (standardzed normal CDF)
F(Ii) = ∫ 1
2πe−z2/2 Ii
−∞ dz
Ii = F-1 (Ii) = F-1(Pi) = β1 + Xiβ
F(β1+ Xiβ) được gọi là hàm Probit
Mơ hình này được ước lượng bằng phương pháp maximum likelihood
3.2.2 Vấn đề nội sinh và biến công cụ
Một vấn đề có thể xảy ra khi ước lượng mơ hình Probit là biến độc lập có thể bị nội sinh. Biến nội sinh xuất hiện khi giả thiết khơng có sự tương quan giữa biến độc lập và sai số bị vi phạm. Biến độc lập bị nội sinh có khả năng gây ra ước lượng bị chệch và khơng vững. Lúc này thì kết quả ước lượng có thể bị mắc sai lầm: (1) bác bỏ giả thuyết H0 nhưng trong thực tế là đúng (sai lầm loại I ); (2) không bác bỏ một giả thuyết H0 nhưng trong thực tế là sai (sai lầm loại II).
Ở góc độ kinh tế lượng, sự xuất hiện của biến nội sinh có thể do một số nguyên nhân sau đây: (1) do bỏ sót biến trong mơ hình (Omitted Variables); (2) do có quan hệ tác động qua lại giữa biến độc lập với biến phụ thuộc trong phương trình hồi quy đồng thời (Simultaneity); (3) do sai số trong đo lường (Measurement
Error); (4) do biến trễ của biến phụ thuộc đóng vai trị như 1 biến độc lập và mơ hình có tự tương quan bậc nhất.
Phương pháp phổ biến để khắc phục hiện tượng nội sinh là sử dụng biến công cụ. Biến công cụ (z) này phải thỏa mãn 2 tính chất: (i) z khơng tương quan với sai số u; (2) nhưng z lại có tương quan với biến bị nội sinh.
3.2.3 Phương pháp và mơ hình Probit với biến cơng cụ
Phần này trình bày mơ hình Probit với biến nội sinh là biến liên tục. Phương trình mơ hình Probit với biến nội sinh được trình bày dựa trên tài liệu của tài liệu của tác giả Woodridge (2002):3
y*1i=(Xiβ + y2iα +ϵi) (2) y2i =(Xiγ + Ziθ +μi) (3) y1i =1(y*1i >0) (4) Với: Xi là các biến kiểm soát Zi các biến công cụ. y2i là biến nội sinh
y1i là biến phụ thuộc nhị phân
Phương trình (2) cùng với phương trình (4) là phương trình cấu trúc (the structural equation) và phương trình (3) gọi là phương trình giảm lược (the reduced form equation). Nếu có hiện tượng nội sinh thì có sự tương quan giữa ϵi và μi. Nếu
ϵi và μi là độc lập thì khơng có vấn đề nội sinh.
Một quy trình ước lượng mơ hình này là cách tiếp cận 2 giai đoạn. Giai đoạn đầu tiên ước lượng phương trình (3). Giai đoạn 2 ước lượng mơ hình Probit (2) với biến độc lập y1i được ước lượng từ phương trình (3) với các biến kiểm sốt X.
Trong giai đoạn đầu tiên của mơ hình IVprobit với biến phụ thuộc là biến định tính thơng thường thì áp dụng mơ hình Probit hay Logit có vẻ là phù hợp. Tuy nhiên, Angrist (2000) cho rằng trong giai đoạn đầu tiên thì sử dụng một mơ hình xác suất tuyến tính đối với biến phụ thuộc là biến nhị phân là phù hợp và là an toàn hơn so với sử dụng dự báo bằng mơ hình Probit. Sử dụng mơ hình Probit chỉ phù hợp nếu mơ hình ước tính trong giai đoạn đầu tiên là chính xác. Và nhiều bài nghiên cứu như của Calero và cộng sự (2007), Minh Nguyen và cộng sự (2009), Võ Thị Thu Hồi (2014) cũng sử dụng một mơ hình xác suất tuyến tính trong giai đoạn đầu tiên. Do đó bài nghiên cứu cũng sử dụng phương pháp này trong giai đoạn đầu tiên. Trên phần mềm Stata hỗ trợ để ước lượng mơ hình IVprobit bằng phương pháp này.
3.3. Nội sinh trong di cư
Từ các nghiên cứu thực nghiệm trước đây như Hanson và Woodruff (2003), Acosta (2006), McKenzie.D và H. Rapoport (2006) , Minh Nguyen (2009) được trình bày ở chương 2 khi nghiên cứu về di cư cho thấy có hiện tượng nội sinh khi ước tính tác động của di cư đến khả năng đi học và lao động của trẻ em. Như vậy, có thể có tương quan giữa biến độc lập và sai số gây ra ước lược chệch khi chạy hồi quy.
Để giải quyết vấn đề nội sinh trong nghiên cứu về di cư với phúc lợi trẻ em thì trước tiên phải tìm các biến cơng cụ tốt để khắc phục hiện tượng này. Hầu hết các nhà nghiên cứu như Hanson và Woodruff (2003), McKenzie và Rapoport (2006), Minh Nguyen và cộng sự (2009), Võ Thị Thu Hoài (2014) sử dụng mạng lưới lịch sử di cư (historical migration networks) như là biến công cụ. Các tác giả này cho rằng mạng lưới di cư sẽ cung cấp thơng tin làm tăng cơ hội tìm việc và hạ thấp chi phí tìm kiếm việc làm và giảm thời gian tìm kiếm việc làm cho những người di cư lao động tiềm năng. Ví dụ như khi có cơ hội việc làm thì những người di cư trước cũng có thể giới thiệu cho những người trong gia đình hay những người quen ở quê. Những người di cư trước còn có thể truyền kinh nghiệm kiến thức về
cơng việc giúp cho cơ hội di cư dễ dàng hơn. Do đó, bài nghiên cứu này sẽ sử dụng mạng lưới di cư như là biến công cụ. Mạng lưới di cư lịch sử có thể sẽ ảnh hưởng đến di cư nhưng khơng trực tiếp ảnh hưởng đến tình trạng học tập và lao động của trẻ. Mạng lưới di cư tác động đến chiến lược di cư trong ngắn hạn và dài hạn của người di cư .
Ngồi ra, một số biến cơng cụ được các nghiên cứu đề cập là khoảng cách nơi người di cư xuất cư đến nơi mà người di cư đến làm việc, chi phí chuyển tiền gửi v.v. Tuy nhiên do thiếu dữ liệu về các biến công cụ về khoảng cách, chi phí chuyển tiền gửi nên bài nghiên cứu này không thể sử dụng các biến công cụ này.
Với biến công cụ đã được giới thiệu là biến mạng lưới di cư nêu trên thì hồi quy giai đoạn đầu tiên được sử dụng để dự đoán mức độ di cư có dạng phương trình tổng quát như sau:
Mơ hình giai đoạn 1:
Dicui = β1 + β2*Xi +β3* Mangdicu + εi (5)
Trong đó:
Dicui: Đại diện trẻ có người thân đi di cư lao động. Bài nghiên cứu này chia
ra hai loại di cư ngắn hạn và di cư dài hạn (Dicu_nganhan và Dicu_daihan)
Mangdicu: Tỷ lệ hộ có người trong huyện di cư trong quá khứ ở đây sử dụng số hộ có người đã rời khỏi hộ trong huyện chia cho số hộ trong huyện trong dữ liệu điều tra hộ gia đình năm 2010.
εi : là sai số.
3.4. Ước lượng phương trình kinh tế lượng
Từ phương trình tổng quát kinh tế lượng (1) và (5) và theo các nghiên cứu thực nghiệm trước đây như Calero và cộng sự (2007), Hanson và Woodruff (2003), Minh Nguyễn và cộng sự (2009), Võ Thị Thu Hồi (2014). Phần này trình bày phương trình ước lượng chi tiết IVprobit hai giai đoạn:
Giai đoạn 1:
Dicu_nganhani/Dicu_daihani = β1 + β2*Tuoi + β3*Gioitinh +β4* Hocvanchuho +β5*Tuoichuho + β6*Gioitinhchuho +β7*Chuhodilam + β8*Lnchitieubq + β9*Tylenutren18 + β10*Tre6_18 +β11*Treduoi6 +β12*Qmovieclam +β13*So_dtngoaitru + β14*So_dtnoitru+ β15*Thientai + β16*TT-NT + β17DBSH+ β18TB +β19DBTB + β20TN +β21DNB +β22* Mangdicu + εi
Sau khi chạy hồi quy trong giai đoạn thứ nhất, thì biến dự báo
𝐃𝐢𝐜𝐮_𝐧𝐠𝐚𝐧𝐡𝐚𝐧̂ / 𝐃𝐢𝐜𝐮_𝐝𝐚𝐢𝐡𝐚𝐧̂ của Dicu_nganhan / Dicu_daihan sẽ được thay
thế trong giai đoạn 2 được trình bày giai đoạn 2 như sau:
Giai đoạn 2: Phương trình chi tiết ghi danh đi học và lao động của trẻ em:
Dihoci/Dilami = α1 + α2*Tuoi + α3*Gioitinh + α4* Hocvanchuho + α5*Tuoichuho + α6*Gioitinhchuho + α7*Chuhodilam + α8*Lnchitieubq + α9*Tylenutren18 + α10*Tre6_18 + α11*Treduoi6 + α12*Qmovieclam + α13*So_dtngoaitru + α14*So_dtnoitru+ α15*Thientai + α16*TT-NT + α17*DBSH+ α 18* DBTB + α 19*TB + α 20*TN + α 21*DNB + α22* 𝐃𝐢𝐜𝐮_𝐧𝐠𝐚𝐧𝐡𝐚𝐧̂ / 𝐃𝐢𝐜𝐮_𝐝𝐚𝐢𝐡𝐚𝐧̂ + µi
Trong đó:
Biến phụ thuộc gồm:
Dihoci/Dilami: Biến phụ thuộc là biến định tính lần lượt đại diện cho: từng
trẻ trong độ tuổi từ 6-18 tuổi trong mỗi hộ có ghi danh đi học khơng ? và trẻ em có hoạt động kinh tế khơng trong 12 tháng kể trong thời gian khảo sát của mẫu ?
Ngoài ra với biến phụ thuộc là biến lao động của trẻ em thì bài viết cũng phân tích thêm trẻ tham gia hoạt động sản xuất kinh doanh của gia đình khơng ? ( làm việc bên trong gia đình) hay trẻ tham gia các hoạt động kinh
tế nhằm kiếm tiền không ? ( làm việc bên ngồi gia đình) với biến phụ thuộc lần lượt là Ldnoibo, Ldbenngoai.
Nhóm biến đặc điểm di cư của hộ di cư:
Dicu_nganhan: Biến giả xem hộ có người di cư ngắn hạn khơng ? Nếu hộ
có người di cư ngắn hạn =1; ngược lại, khơng có người di cư ngắn hạn =0.
Dicu_daihan: Biến giả xem hộ có người di cư dài hạn khơng ? Nếu hộ có
người di cư ngắn hạn =1; ngược lại, khơng có người di cư dài hạn =0. Biến kiểm sốt gồm:
Thứ nhất, nhóm biến về đặc điểm của trẻ em bao gồm đặc tính của trẻ. Biến này bao gồm:
Tuoi: Tuổi của trẻ em từ 6 đến dưới 18 tuổi trong gia đình.
Gioitinh: Giới tính của trẻ em từ 6 đến dưới 18 tuổi trong gia đình.
Thứ hai, là nhóm biến về đặc điểm của chủ hộ và hộ. Trong đó:
Hocvanchuho: Số năm đi học của chủ hộ. Tuoichuho: Tuổi của chủ hộ.
Gioitinhchuho: Biến giả giới tính của chủ hộ. Nếu là nam =1; ngược lại nữ = 0.
Chuhodilam: Chủ hộ hiện có đi làm hay khơng ?
Thứ ba, là nhóm biến về đặc điểm của hộ
Lnchitieubq: Logarithm của chi tiêu bình quân một năm của mỗi người trong hộ.
Tylenutren18: Tỷ lệ nữ giới trên 18 tuổi trên tổng số người lớn trong gia
đình.
Tre6_18: Số lượng trẻ em đang trong độ tuổi từ 6 đến dưới 18 tuổi trong
gia đình.
Treduoi6: Số lượng trẻ em dưới 6 tuổi trong gia đình.
Thứ tư, đặc điểm cú sốc hộ gia đình
So_dtngoaitru: Số lần điều trị bệnh ngoại trú của tổng thành viên trong hộ
gia đình có chữa bệnh trong 12 tháng.
So_dtnoitru: Số lần điều trị bệnh nội trú của tổng thành viên trong hộ gia
đình có chữa bệnh trong 12 tháng.
Thientai4: Biến giả hộ gia đình có thuộc xã chịu thiệt hại từ thiên nhiên gồm hạn hán, lũ lụt, sâu bệnh, dịch bệnh, hỏa hoạn,v.v trong vòng 3 năm từ năm 2009 đến 2012 khơng ?
Thứ năm, nhóm biến vùng miền gồm:
TT-NT 5: Hộ gia đình có đang cư trú ở khu vực thành thị không ? Nếu ở khu vực thành thị =1; ngược lại vùng nông thôn =0
DBSH, DBTB, TB, TN, DNB: Vùng mà hộ gia đình tham gia điều tra đang cư trú ở đâu trong 6 vùng cả nước lần lượt là: Đồng bằng sông Hồng, Trung du và miền núi phía Bắc, Bắc Trung Bộ và duyên hải miền Trung, Tây Nguyên, Đông Nam bộ. Riêng vùng Đồng bằng sông Cửu Long là biến cơ sở khơng đưa vào mơ hình.
Biến cơng cụ:
Mangdicu : Tỷ lệ hộ có người trong huyện di cư trong quá khứ ở đây sử
dụng số hộ có người đã rời khỏi hộ trong huyện chia cho số hộ trong huyện trong dữ liệu điều tra hộ gia đình năm 2010. ( Biến công cụ giai đoạn 1)
và εi , µi là sai số chuẩn
4 Dữ liệu của biến thiên tai được lấy từ phiếu phỏng vấn cấp xã về dữ liệu thiên tai năm 2009 và năm 2010 của bộ VHLSS 2010 và dữ liệu thiên tai VHLSS 2012 và dữ liệu thu được chủ yếu là ở các xã thuộc vùng nông thôn. Nên biến cú sốc thiên tai chỉ phân tích với dữ liệu nơng thơn.
Chiến lược ước tính phương trình trên gồm các bước bao gồm :
Bước 1: Chạy mơ hình hồi quy IVprobit trong đó (1) biến phụ thuộc là Dihoc, Dilam, Ldnoibo, Ldbenngoai, (2) các biến kiểm soát là các biến xác định các thuộc tính chủ hộ, thuộc tính hộ gia đình, thuộc tính trẻ em, thuộc tính vùng miền, (3) biến bị nội sinh là Dicu_nganhan /Dicu_daihan (hộ có người di cư trong ngắn hạn hoặc di cư dài hạn không ?) và (4) biến công cụ là Mangdicu. Khi chạy hồi quy IVprobit trên phần mền Stata mặc định ước lượng Maximum likelihood để đưa ra kết quả hồi quy. Giai đoạn đầu tiên trong ước lượng này sẽ thể hiện mối quan hệ giữa biến nội sinh và biến công cụ. Từ kết quả ước lượng dự báo giai đoạn này sẽ ước lượng giai đoạn 2. Kết quả ước lượng giai đoạn 2 dùng để phân tích tác động của di cư với biến phụ thuộc là giáo dục của trẻ em.