Vấn đề nội sinh và biến công cụ

Một phần của tài liệu (LUẬN văn THẠC sĩ) tác động của di cư lao động đến phúc lợi của trẻ em ở việt nam (Trang 30)

CHƯƠNG 3 : PHƯƠNG PHÁP NGHIÊN CỨU

3.2. Mơ hình Probit với vấn đề nội sinh

3.2.2 Vấn đề nội sinh và biến công cụ

Một vấn đề có thể xảy ra khi ước lượng mơ hình Probit là biến độc lập có thể bị nội sinh. Biến nội sinh xuất hiện khi giả thiết khơng có sự tương quan giữa biến độc lập và sai số bị vi phạm. Biến độc lập bị nội sinh có khả năng gây ra ước lượng bị chệch và khơng vững. Lúc này thì kết quả ước lượng có thể bị mắc sai lầm: (1) bác bỏ giả thuyết H0 nhưng trong thực tế là đúng (sai lầm loại I ); (2) không bác bỏ một giả thuyết H0 nhưng trong thực tế là sai (sai lầm loại II).

Ở góc độ kinh tế lượng, sự xuất hiện của biến nội sinh có thể do một số nguyên nhân sau đây: (1) do bỏ sót biến trong mơ hình (Omitted Variables); (2) do có quan hệ tác động qua lại giữa biến độc lập với biến phụ thuộc trong phương trình hồi quy đồng thời (Simultaneity); (3) do sai số trong đo lường (Measurement

Error); (4) do biến trễ của biến phụ thuộc đóng vai trị như 1 biến độc lập và mơ hình có tự tương quan bậc nhất.

Phương pháp phổ biến để khắc phục hiện tượng nội sinh là sử dụng biến công cụ. Biến công cụ (z) này phải thỏa mãn 2 tính chất: (i) z khơng tương quan với sai số u; (2) nhưng z lại có tương quan với biến bị nội sinh.

3.2.3 Phương pháp và mơ hình Probit với biến cơng cụ

Phần này trình bày mơ hình Probit với biến nội sinh là biến liên tục. Phương trình mơ hình Probit với biến nội sinh được trình bày dựa trên tài liệu của tài liệu của tác giả Woodridge (2002):3

y*1i=(Xiβ + y2iα +ϵi) (2) y2i =(Xiγ + Ziθ +μi) (3) y1i =1(y*1i >0) (4) Với: Xi là các biến kiểm soát Zi các biến công cụ. y2i là biến nội sinh

y1i là biến phụ thuộc nhị phân

Phương trình (2) cùng với phương trình (4) là phương trình cấu trúc (the structural equation) và phương trình (3) gọi là phương trình giảm lược (the reduced form equation). Nếu có hiện tượng nội sinh thì có sự tương quan giữa ϵi và μi. Nếu

ϵi và μi là độc lập thì khơng có vấn đề nội sinh.

Một quy trình ước lượng mơ hình này là cách tiếp cận 2 giai đoạn. Giai đoạn đầu tiên ước lượng phương trình (3). Giai đoạn 2 ước lượng mơ hình Probit (2) với biến độc lập y1i được ước lượng từ phương trình (3) với các biến kiểm soát X.

Trong giai đoạn đầu tiên của mơ hình IVprobit với biến phụ thuộc là biến định tính thơng thường thì áp dụng mơ hình Probit hay Logit có vẻ là phù hợp. Tuy nhiên, Angrist (2000) cho rằng trong giai đoạn đầu tiên thì sử dụng một mơ hình xác suất tuyến tính đối với biến phụ thuộc là biến nhị phân là phù hợp và là an toàn hơn so với sử dụng dự báo bằng mơ hình Probit. Sử dụng mơ hình Probit chỉ phù hợp nếu mơ hình ước tính trong giai đoạn đầu tiên là chính xác. Và nhiều bài nghiên cứu như của Calero và cộng sự (2007), Minh Nguyen và cộng sự (2009), Võ Thị Thu Hồi (2014) cũng sử dụng một mơ hình xác suất tuyến tính trong giai đoạn đầu tiên. Do đó bài nghiên cứu cũng sử dụng phương pháp này trong giai đoạn đầu tiên. Trên phần mềm Stata hỗ trợ để ước lượng mơ hình IVprobit bằng phương pháp này.

3.3. Nội sinh trong di cư

Từ các nghiên cứu thực nghiệm trước đây như Hanson và Woodruff (2003), Acosta (2006), McKenzie.D và H. Rapoport (2006) , Minh Nguyen (2009) được trình bày ở chương 2 khi nghiên cứu về di cư cho thấy có hiện tượng nội sinh khi ước tính tác động của di cư đến khả năng đi học và lao động của trẻ em. Như vậy, có thể có tương quan giữa biến độc lập và sai số gây ra ước lược chệch khi chạy hồi quy.

Để giải quyết vấn đề nội sinh trong nghiên cứu về di cư với phúc lợi trẻ em thì trước tiên phải tìm các biến cơng cụ tốt để khắc phục hiện tượng này. Hầu hết các nhà nghiên cứu như Hanson và Woodruff (2003), McKenzie và Rapoport (2006), Minh Nguyen và cộng sự (2009), Võ Thị Thu Hoài (2014) sử dụng mạng lưới lịch sử di cư (historical migration networks) như là biến công cụ. Các tác giả này cho rằng mạng lưới di cư sẽ cung cấp thơng tin làm tăng cơ hội tìm việc và hạ thấp chi phí tìm kiếm việc làm và giảm thời gian tìm kiếm việc làm cho những người di cư lao động tiềm năng. Ví dụ như khi có cơ hội việc làm thì những người di cư trước cũng có thể giới thiệu cho những người trong gia đình hay những người quen ở q. Những người di cư trước cịn có thể truyền kinh nghiệm kiến thức về

công việc giúp cho cơ hội di cư dễ dàng hơn. Do đó, bài nghiên cứu này sẽ sử dụng mạng lưới di cư như là biến công cụ. Mạng lưới di cư lịch sử có thể sẽ ảnh hưởng đến di cư nhưng khơng trực tiếp ảnh hưởng đến tình trạng học tập và lao động của trẻ. Mạng lưới di cư tác động đến chiến lược di cư trong ngắn hạn và dài hạn của người di cư .

Ngoài ra, một số biến công cụ được các nghiên cứu đề cập là khoảng cách nơi người di cư xuất cư đến nơi mà người di cư đến làm việc, chi phí chuyển tiền gửi v.v. Tuy nhiên do thiếu dữ liệu về các biến công cụ về khoảng cách, chi phí chuyển tiền gửi nên bài nghiên cứu này không thể sử dụng các biến công cụ này.

Với biến công cụ đã được giới thiệu là biến mạng lưới di cư nêu trên thì hồi quy giai đoạn đầu tiên được sử dụng để dự đoán mức độ di cư có dạng phương trình tổng quát như sau:

Mơ hình giai đoạn 1:

Dicui = β1 + β2*Xi +β3* Mangdicu + εi (5)

Trong đó:

Dicui: Đại diện trẻ có người thân đi di cư lao động. Bài nghiên cứu này chia

ra hai loại di cư ngắn hạn và di cư dài hạn (Dicu_nganhan và Dicu_daihan)

Mangdicu: Tỷ lệ hộ có người trong huyện di cư trong quá khứ ở đây sử dụng số hộ có người đã rời khỏi hộ trong huyện chia cho số hộ trong huyện trong dữ liệu điều tra hộ gia đình năm 2010.

εi : là sai số.

3.4. Ước lượng phương trình kinh tế lượng

Từ phương trình tổng quát kinh tế lượng (1) và (5) và theo các nghiên cứu thực nghiệm trước đây như Calero và cộng sự (2007), Hanson và Woodruff (2003), Minh Nguyễn và cộng sự (2009), Võ Thị Thu Hồi (2014). Phần này trình bày phương trình ước lượng chi tiết IVprobit hai giai đoạn:

Giai đoạn 1:

Dicu_nganhani/Dicu_daihani = β1 + β2*Tuoi + β3*Gioitinh +β4* Hocvanchuho +β5*Tuoichuho + β6*Gioitinhchuho +β7*Chuhodilam + β8*Lnchitieubq + β9*Tylenutren18 + β10*Tre6_18 +β11*Treduoi6 +β12*Qmovieclam +β13*So_dtngoaitru + β14*So_dtnoitru+ β15*Thientai + β16*TT-NT + β17DBSH+ β18TB +β19DBTB + β20TN +β21DNB +β22* Mangdicu + εi

Sau khi chạy hồi quy trong giai đoạn thứ nhất, thì biến dự báo

𝐃𝐢𝐜𝐮_𝐧𝐠𝐚𝐧𝐡𝐚𝐧̂ / 𝐃𝐢𝐜𝐮_𝐝𝐚𝐢𝐡𝐚𝐧̂ của Dicu_nganhan / Dicu_daihan sẽ được thay

thế trong giai đoạn 2 được trình bày giai đoạn 2 như sau:

Giai đoạn 2: Phương trình chi tiết ghi danh đi học và lao động của trẻ em:

Dihoci/Dilami = α1 + α2*Tuoi + α3*Gioitinh + α4* Hocvanchuho + α5*Tuoichuho + α6*Gioitinhchuho + α7*Chuhodilam + α8*Lnchitieubq + α9*Tylenutren18 + α10*Tre6_18 + α11*Treduoi6 + α12*Qmovieclam + α13*So_dtngoaitru + α14*So_dtnoitru+ α15*Thientai + α16*TT-NT + α17*DBSH+ α 18* DBTB + α 19*TB + α 20*TN + α 21*DNB + α22* 𝐃𝐢𝐜𝐮_𝐧𝐠𝐚𝐧𝐡𝐚𝐧̂ / 𝐃𝐢𝐜𝐮_𝐝𝐚𝐢𝐡𝐚𝐧̂ + µi

Trong đó:

Biến phụ thuộc gồm:

Dihoci/Dilami: Biến phụ thuộc là biến định tính lần lượt đại diện cho: từng

trẻ trong độ tuổi từ 6-18 tuổi trong mỗi hộ có ghi danh đi học khơng ? và trẻ em có hoạt động kinh tế khơng trong 12 tháng kể trong thời gian khảo sát của mẫu ?

Ngoài ra với biến phụ thuộc là biến lao động của trẻ em thì bài viết cũng phân tích thêm trẻ tham gia hoạt động sản xuất kinh doanh của gia đình khơng ? ( làm việc bên trong gia đình) hay trẻ tham gia các hoạt động kinh

tế nhằm kiếm tiền không ? ( làm việc bên ngồi gia đình) với biến phụ thuộc lần lượt là Ldnoibo, Ldbenngoai.

Nhóm biến đặc điểm di cư của hộ di cư:

Dicu_nganhan: Biến giả xem hộ có người di cư ngắn hạn khơng ? Nếu hộ

có người di cư ngắn hạn =1; ngược lại, khơng có người di cư ngắn hạn =0.

Dicu_daihan: Biến giả xem hộ có người di cư dài hạn khơng ? Nếu hộ có

người di cư ngắn hạn =1; ngược lại, khơng có người di cư dài hạn =0. Biến kiểm sốt gồm:

Thứ nhất, nhóm biến về đặc điểm của trẻ em bao gồm đặc tính của trẻ. Biến này bao gồm:

Tuoi: Tuổi của trẻ em từ 6 đến dưới 18 tuổi trong gia đình.

Gioitinh: Giới tính của trẻ em từ 6 đến dưới 18 tuổi trong gia đình.

Thứ hai, là nhóm biến về đặc điểm của chủ hộ và hộ. Trong đó:

Hocvanchuho: Số năm đi học của chủ hộ. Tuoichuho: Tuổi của chủ hộ.

Gioitinhchuho: Biến giả giới tính của chủ hộ. Nếu là nam =1; ngược lại nữ = 0.

Chuhodilam: Chủ hộ hiện có đi làm hay khơng ?

Thứ ba, là nhóm biến về đặc điểm của hộ

Lnchitieubq: Logarithm của chi tiêu bình quân một năm của mỗi người trong hộ.

Tylenutren18: Tỷ lệ nữ giới trên 18 tuổi trên tổng số người lớn trong gia

đình.

Tre6_18: Số lượng trẻ em đang trong độ tuổi từ 6 đến dưới 18 tuổi trong

gia đình.

Treduoi6: Số lượng trẻ em dưới 6 tuổi trong gia đình.

Thứ tư, đặc điểm cú sốc hộ gia đình

So_dtngoaitru: Số lần điều trị bệnh ngoại trú của tổng thành viên trong hộ

gia đình có chữa bệnh trong 12 tháng.

So_dtnoitru: Số lần điều trị bệnh nội trú của tổng thành viên trong hộ gia

đình có chữa bệnh trong 12 tháng.

Thientai4: Biến giả hộ gia đình có thuộc xã chịu thiệt hại từ thiên nhiên gồm hạn hán, lũ lụt, sâu bệnh, dịch bệnh, hỏa hoạn,v.v trong vòng 3 năm từ năm 2009 đến 2012 khơng ?

Thứ năm, nhóm biến vùng miền gồm:

TT-NT 5: Hộ gia đình có đang cư trú ở khu vực thành thị không ? Nếu ở khu vực thành thị =1; ngược lại vùng nông thôn =0

DBSH, DBTB, TB, TN, DNB: Vùng mà hộ gia đình tham gia điều tra đang cư trú ở đâu trong 6 vùng cả nước lần lượt là: Đồng bằng sông Hồng, Trung du và miền núi phía Bắc, Bắc Trung Bộ và duyên hải miền Trung, Tây Nguyên, Đông Nam bộ. Riêng vùng Đồng bằng sông Cửu Long là biến cơ sở khơng đưa vào mơ hình.

Biến cơng cụ:

Mangdicu : Tỷ lệ hộ có người trong huyện di cư trong quá khứ ở đây sử

dụng số hộ có người đã rời khỏi hộ trong huyện chia cho số hộ trong huyện trong dữ liệu điều tra hộ gia đình năm 2010. ( Biến công cụ giai đoạn 1)

và εi , µi là sai số chuẩn

4 Dữ liệu của biến thiên tai được lấy từ phiếu phỏng vấn cấp xã về dữ liệu thiên tai năm 2009 và năm 2010 của bộ VHLSS 2010 và dữ liệu thiên tai VHLSS 2012 và dữ liệu thu được chủ yếu là ở các xã thuộc vùng nông thôn. Nên biến cú sốc thiên tai chỉ phân tích với dữ liệu nơng thơn.

Chiến lược ước tính phương trình trên gồm các bước bao gồm :

Bước 1: Chạy mơ hình hồi quy IVprobit trong đó (1) biến phụ thuộc là Dihoc, Dilam, Ldnoibo, Ldbenngoai, (2) các biến kiểm soát là các biến xác định các thuộc tính chủ hộ, thuộc tính hộ gia đình, thuộc tính trẻ em, thuộc tính vùng miền, (3) biến bị nội sinh là Dicu_nganhan /Dicu_daihan (hộ có người di cư trong ngắn hạn hoặc di cư dài hạn không ?) và (4) biến công cụ là Mangdicu. Khi chạy hồi quy IVprobit trên phần mền Stata mặc định ước lượng Maximum likelihood để đưa ra kết quả hồi quy. Giai đoạn đầu tiên trong ước lượng này sẽ thể hiện mối quan hệ giữa biến nội sinh và biến công cụ. Từ kết quả ước lượng dự báo giai đoạn này sẽ ước lượng giai đoạn 2. Kết quả ước lượng giai đoạn 2 dùng để phân tích tác động của di cư với biến phụ thuộc là giáo dục của trẻ em.

Chạy hồi quy với 4 biến phụ thuộc nêu trên ở phạm vi cả nước và 2 tiểu mẫu là vùng nông thôn và thành thị trong 2 trường hợp di cư ngắn hạn và dài hạn.

Bước 2: Sau khi chạy hồi quy IVprobit, bài nghiên cứu sẽ kiểm định các biến công cụ đưa vào mơ hình có phù hợp khơng. Trên phần mềm Stata việc kiểm định này đã được thực hiện khi chạy mơ hình hồi quy IVprobit bằng kiểm định Wald test of exogeneity. Kiểm định này cho biết sai số trong phương trình cấu trúc (the structural equation) là phương trình giai đoạn 2 và phương trình giảm lược (the reduced-form equation) là phương trình giai đoạn 1 của các biến nội sinh có tương quan với nhau khơng hay nói cách khác kiểm tra có hiện tượng nội sinh trong mơ hình khơng ?. Nghiên cứu này khơng cần kiểm tra Over identified bởi vì biến cơng cụ bằng với biến nội sinh. Ngoài ra, bài nghiên cứu này cần kiểm tra có phương sai thay đổi, tuy nhiên khi sử dụng mơ hình IVprobit trong phần mềm Stata không hỗ trợ kiểm tra trực tiếp giả thiết này như trong hồi quy OLS. Một cách đơn giản là so sánh các chỉ số standard error và chỉ số robust standard error của các biến độc lập trong hồi quy IVprobit có tương đồng hay không. Đối với kiểm định xem mơ hình có đa cộng tuyến thì Stata khơng hỗ trợ cơng cụ để kiểm

tra đa cộng tuyến do đó ta có thể sử dụng kiểm tra như trong hồi quy OLS bằng cách xem các biến độc lập có tương quan với nhau khơng.

Bước 3: Sau khi chạy hồi quy và sử dụng các kiểm định để kiểm tra mơ hình thì lập báo cáo kết quả cuối cùng và giải thích kết quả.

3.5. Dữ liệu

3.5.1 Nguồn dữ liệu

Các dữ liệu phục vụ cho bài nghiên cứu này sẽ được trích lọc từ bộ dữ liệu Điều tra mức sống hộ gia đình (VHLSS) năm 2012 với sự hỗ trợ kỹ thuật của Ngân hàng Thế giới. Mẫu dữ liệu VHLSS 2012 được thu thập từ dữ liệu của 46.995 hộ ở 3.133 xã/phường trong đó có 36.655 người trong 9.399 hộ gia đình được điều tra phỏng vấn trực tiếp về các vấn đề thu nhập chi tiêu và một số câu hỏi khác trong phạm vi cả nước. Nội dung khảo sát của VHLSS bao gồm danh sách các thành viên hộ gia đình, sức khỏe, thu nhập, giáo dục, chi tiêu, hàng hóa lâu bền, nhà ở, tham gia các chương trình trợ giúp.

Dữ liệu VHLSS 2012 là dữ liệu mới nhất từ cuộc điều tra mức sống hộ gia đình của GSO. Dữ liệu VHLSS 2012 cung cấp các thông tin về mức sống hộ gia đình. Bên cạnh những thơng tin về di cư lao động cũng giống như các dữ liệu điều tra khảo sát mức sống hộ gia đình các năm trước, thì bộ dữ liệu VHLSS 2012 cịn cung cấp thêm nhiều thơng tin về đặc điểm của người di cư mà bộ dữ liệu các năm trước đó khơng được đề cập. Dữ liệu này nhằm cung cấp thông tin thống kê cho điều tra di cư của quốc gia. Bài nghiên cứu này sử dụng bộ dữ liệu VHLSS2012 để phục vụ cho mục đích nghiên cứu riêng của mình. Ngồi ra, VHLSS năm 2012 cũng cung cấp nhiều dữ liệu các biến giáo dục, lao động và đặc điểm hộ gia đình đây là dữ liệu để xác định những tác động của di cư với các chỉ số giáo dục trẻ em và các chỉ số lao động trẻ em trong vòng 12 tháng của cuộc điều tra. Bài nghiên cứu này sẽ liên kết nối các dữ liệu liên quan giữa các biến số liên quan để đưa ra mẫu dữ liệu phục vụ cho mục đích nghiên cứu.

Trong bài nghiên cứu này còn sử dụng dữ liệu VHLSS 2010, do bài viết sử dụng mạng lưới lịch di cư (Mangdicu) là biến cơng cụ như đã trình bày ở phần trên nên tác giả sử dụng ở mục 1B phiếu điều tra câp hộ xem xét hộ có người đi di cư hay khơng?. Đối với biến thiên tai sử dụng dữ liệu câu 8 ở mục 2 phiếu phỏng vấn cấp xã do sự thiếu hụt dữ liệu trong phiếu phỏng vấn cấp xã ở dữ liệu VHLSS2012 mà tác giả có được. Tuy nhiên trong câu hỏi mục này là xã có thiên tai trong 3 năm kể từ khi điều tra từ năm 2009 đến năm 2012, do đó tác giả cũng sử dụng dữ liệu 2 năm là 2009 và 2010 trong mục này ở bộ dữ liệu VHLSS2010 để có thể tăng số lượng quan sát cho bài nghiên cứu.

Bên cạnh đó, bài nghiên cứu này cũng sử dụng một số dữ liệu thứ cấp từ kết quả khảo sát của GSO, IOM, Cục lãnh sự quán-bộ ngoại giao, v.v về di cư Việt

Một phần của tài liệu (LUẬN văn THẠC sĩ) tác động của di cư lao động đến phúc lợi của trẻ em ở việt nam (Trang 30)

Tải bản đầy đủ (PDF)

(119 trang)