mem hh Area race earnings lnearnings age gender yosch …
1 1 urban 1 3000 8.00637 27 Male 12 … 2 1 urban 1 3500 8.16052 40 Male 10 … 1 2 urban 1 6500 8.77956 28 Female 17 … 1 3 urban 1 7000 8.85367 53 Female 17 … 1 4 urban 1 5000 8.51719 58 Male 17 … 1 5 urban 1 5000 8.51719 32 Female 17 … 2 5 urban 1 4000 8.29405 34 Male 17 … 1 6 urban 1 6000 8.69951 56 Male 17 … 1 7 urban 1 6000 8.69951 29 Male 17 … 2 7 urban 1 5416.67 8.59724 28 Female 17 … 1 8 urban 1 7000 8.85367 49 Male 17 … 2 8 urban 1 5000 8.51719 50 Female 17 … … … … … … … … … … …
Rõ ràng, cấu trúc dữ liệu sau khi chuyển đổi có dạng như dữ liệu bảng không cân đối do số quan sát của các hộ không bằng nhau trong mọi trường hợp như trên. Do vậy, ta hồn tồn có thể sử dụng phương pháp hồi quy dữ liệu bảng theo mơ hình ảnh hưởng ngẫu nhiên như đã trình bày ở trên.
3.3 Mơ hình nghiên cứu thực nghiệm
Mơ hình lý thuyết để tính suất sinh lợi theo giáo dục được Mincer đề xuất vào năm 1974 có dạng cơ bản như sau:
lnYi = β0 + β1.YOSCHi + β2.EXPi + β3.EXPi2 + β4.lnWHi + ui (1)
Trong phương trình hồi quy cơ bản này, các biến độc lập, biến phụ thuộc lần lượt được định nghĩa như sau:
EXPi : Số năm kinh nghiệm làm việc của cá nhân thứ i.
EXPi2 : Bình phương của số năm kinh nghiệm làm việc của cá nhân thứ i. lnWHi: logarit tự nhiên của tổng số giờ làm việc trong năm của cá nhân thứ i. Ui : Phương sai.
Trong hàm thu nhập này, hệ số β1 chính là suất sinh lợi đối với mỗi năm học tăng thêm. Hệ số β3 được kỳ vọng sẽ mang dấu âm (-) trong khi hệ số β2 mang dấu dương (+) với hàm ý là mối tương quan giữa logarit của thu nhập với số năm kinh nghiệm làm việc của cá nhân theo dạng hình parabol ngược với ý nghĩa là logarit của thu nhập sẽ có xu hướng tăng với tốc độ giảm dần. β4 kỳ vọng sẽ mang dấu dương với ý nghĩa đơn giản là một cá nhân sẽ có mức thu nhập cao hơn với số giờ làm việc nhiều hơn.
Phương trình (1) nhằm tính tốn suất sinh lợi đối với mỗi năm giáo dục tăng thêm của cá nhân. Tuy nhiên, trên thực tế, đôi khi việc chênh lệch đối với từng năm học có vẻ chưa mang lại sự khác biệt rõ nét trong thu nhập của các cá nhân. Thay vào đó, việc vượt qua một mốc học vấn nào đó (tiểu học, trung học cơ sở, trung học phổ thông, cao đẳng, đại học, …) lại có vẻ có ý nghĩa hơn trong mối quan hệ đối với thu nhập của cá nhân. Do vậy, có nhiều nghiên cứu đã mở rộng hàm thu nhập của Mincer theo sau:
lnYi = β0 + β1.PRIMi + β2.LOWSECi + β3.UPPSECi + β4.VOCi + β5.UNIVi + β6.EXPi + β7.(EXPi)2 + β8.lnWHi + ui (2)
Trong đó, PRIMi , LOWSECi , UPPSECi ,VOCi , UNIVi lần lượt là biến giả thể hiện mức giáo dục Tiểu học, Trung học, Trường Cao đẳng nghề, Đại học đã hoàn thành của cá nhân thứ i.
Phương trình hồi quy (1), (2) là phương trình cơ bản và mở rộng của Mincer chỉ dựa trên 2 biến quan trọng đó là giáo dục và kinh nghiệm làm việc.
Từ suất sinh lợi theo bậc học k ta có thể tính suất sinh lợi cho từng năm đi học ở mỗi bậc học k như sau:
Trong đó rk là suất sinh lợi cho mỗi năm đi học ở bậc học k. βk, βk-1 lần lượt là suất sinh lợi theo bậc học k và bậc học ngay trước đó; nk là số năm đi học của bậc học k. Do vậy, ta lần lượt có nPRI = 5, nLSEC = 4, nUSEC = 3, nVOC=6, nUNI = 4. Ta có:
Tuy nhiên, trong nghiên cứu này, ngồi mơ hình hồi quy chỉ sử dụng các biến cơ bản là số năm đi học và kinh nghiệm làm việc, các biến điều khiển sẽ được thêm vào nhằm phát hiện tác động của các yếu tố khác lên thu nhập của người lao động, bao gồm biến GENDER thể hiện giới tính của từng cá nhân (GENDER = 1: Nam giới, GENDER = 0: Nữ giới), biến RACE thể hiện dân tộc của 1 cá nhân là dân tộc Kinh hoặc Hoa (RACE =1) hoặc các dân tộc khác (RACE=0), biến URBAN thể hiện khu vực làm việc của cá nhân là ở nông thôn hay thành thị (URBAN = 1: thành thị,
URBAN =0: nông thôn), biến VUNG chỉ khu vực địa lý, biến chỉ khu vực làm việc (STATESEC, PRISEC, FORSEC).
Sau đây là bảng thơng tin các biến mã hóa sử dụng trong nghiên cứu này và dấu kỳ vọng của nó: