Mô hình lý thuyết để tính suất sinh lợi theo giáo dục được Mincer đề xuất vào năm 1974 có dạng cơ bản như sau:
lnYi = β0 + β1.YOSCHi + β2.EXPi + β3.EXPi2 + β4.lnWHi + ui (1)
Trong phương trình hồi quy cơ bản này, các biến độc lập, biến phụ thuộc lần lượt được định nghĩa như sau:
lnYi : logarit tự nhiên của thu nhập trong năm của cá nhân thứ i.
EXPi : Số năm kinh nghiệm làm việc của cá nhân thứ i.
EXPi2 : Bình phương của số năm kinh nghiệm làm việc của cá nhân thứ i.
lnWHi: logarit tự nhiên của tổng số giờ làm việc trong năm của cá nhân thứ i.
Ui : Phương sai.
Trong hàm thu nhập này, hệ số β1 chính là suất sinh lợi đối với mỗi năm học tăng thêm. Hệ số β3 được kỳ vọng sẽ mang dấu âm (-) trong khi hệ số β2 mang dấu dương (+) với hàm ý là mối tương quan giữa logarit của thu nhập với số năm kinh nghiệm làm việc của cá nhân theo dạng hình parabol ngược với ý nghĩa là logarit của thu nhập sẽ có xu hướng tăng với tốc độ giảm dần. β4 kỳ vọng sẽ mang dấu dương với ý nghĩa đơn giản là một cá nhân sẽ có mức thu nhập cao hơn với số giờ làm việc nhiều hơn.
Phương trình (1) nhằm tính toán suất sinh lợi đối với mỗi năm giáo dục tăng thêm của cá nhân. Tuy nhiên, trên thực tế, đôi khi việc chênh lệch đối với từng năm học có vẻ chưa mang lại sự khác biệt rõ nét trong thu nhập của các cá nhân. Thay vào đó, việc vượt qua một mốc học vấn nào đó (tiểu học, trung học cơ sở, trung học phổ thông, cao đẳng, đại học, …) lại có vẻ có ý nghĩa hơn trong mối quan hệ đối với thu nhập của cá nhân. Do vậy, có nhiều nghiên cứu đã mở rộng hàm thu nhập của Mincer theo sau:
lnYi = β0 + β1.PRIMi + β2.LOWSECi + β3.UPPSECi + β4.VOCi + β5.UNIVi + β6.EXPi + β7.(EXPi)2 + β8.lnWHi + ui (2)
Trong đó, PRIMi , LOWSECi , UPPSECi ,VOCi , UNIVi lần lượt là biến giả thể hiện mức giáo dục Tiểu học, Trung học, Trường Cao đẳng nghề, Đại học đã hoàn thành của cá nhân thứ i.
Phương trình hồi quy (1), (2) là phương trình cơ bản và mở rộng của Mincer chỉ dựa trên 2 biến quan trọng đó là giáo dục và kinh nghiệm làm việc.
Từ suất sinh lợi theo bậc học k ta có thể tính suất sinh lợi cho từng năm đi học ở mỗi bậc học k như sau:
Trong đó rk là suất sinh lợi cho mỗi năm đi học ở bậc học k. βk, βk-1 lần lượt là suất sinh lợi theo bậc học k và bậc học ngay trước đó; nk là số năm đi học của bậc học k. Do vậy, ta lần lượt có nPRI = 5, nLSEC = 4, nUSEC = 3, nVOC=6, nUNI = 4. Ta có:
Tuy nhiên, trong nghiên cứu này, ngoài mô hình hồi quy chỉ sử dụng các biến cơ bản là số năm đi học và kinh nghiệm làm việc, các biến điều khiển sẽ được thêm vào nhằm phát hiện tác động của các yếu tố khác lên thu nhập của người lao động, bao gồm biến GENDER thể hiện giới tính của từng cá nhân (GENDER = 1: Nam giới, GENDER = 0: Nữ giới), biến RACE thể hiện dân tộc của 1 cá nhân là dân tộc Kinh hoặc Hoa (RACE =1) hoặc các dân tộc khác (RACE=0), biến URBAN thể hiện khu vực làm việc của cá nhân là ở nông thôn hay thành thị (URBAN = 1: thành thị,
URBAN =0: nông thôn), biến VUNG chỉ khu vực địa lý, biến chỉ khu vực làm việc (STATESEC, PRISEC, FORSEC).
Sau đây là bảng thông tin các biến mã hóa sử dụng trong nghiên cứu này và dấu kỳ vọng của nó:
Bảng 3.5: Các biến sử dụng trong hàm hồi quy. Biến Dấu kỳ vọng Diễn tả biến Biến phụ thuộc
lnEARNING Logarit của thu nhập cá nhân hàng tháng Biến độc lập
YOSCH (+)
Biến này thể hiện số năm đi học tổng cộng của một cá nhân. Dấu kỳ vọng được mong đợi sẽ là dấu dương (+), đó là vì ta tin rằng một cá nhân nếu dành càng nhiều thời gian cho việc học thì càng có khả năng có được mức thu nhập cao hơn
EXP (+)
Biến này thể hiện số năm kinh nghiệm làm việc của một cá nhân. Dấu kỳ vọng được mong đợi sẽ là dấu dương (+) với ngụ ý rằng một cá nhân sẽ càng có khả năng có được mức thu nhập cao hơn khi cá nhân đó tích lũy được càng nhiều năm kinh nghiệm.
EXP^2 (-)
Biến này thể hiện số năm kinh nghiệm làm việc bình phương của một cá nhân. Dấu kỳ vọng được mong đợi sẽ là dấu âm (-). Đó là vì ta tin rằng tác động của kinh nghiệm lên logarit thu nhập của một cá nhân không phải là một hàm tuyến tính mà là một hàm phi tuyến với suất sinh lợi có xu hướng giảm dần khi kinh nghiệm ngày càng tăng.
lnhrwrk (+)
Logarit của giờ làm trong tuần của cá nhân. Biến giờ làm (hrwrk) thể hiện số giờ làm việc trong 1 tuần của một cá nhân. Dấu kỳ vọng là (+) thể hiện mối tương quan dương giữa thu nhập và số giờ làm việc
Biến Dấu kỳ vọng Diễn tả biến
PRIM (+)
Biến PRIM là một biến giả. PRIM có giá trị bằng 1 nếu cá nhân đã tốt nghiệp tiểu học và không tham gia hình thức giáo dục có cấp bằng nào khác. Các trường hợp còn lại, PRIM có giá trị là 0.
LOWSEC (+)
Biến LOWSEC là một biến giả. LOWSEC có giá trị bằng 1 nếu cá nhân đã tốt nghiệp trung học cơ sở và không tham gia hình thức giáo dục có cấp bằng nào khác. Các trường hợp còn lại, LOWSEC có giá trị là 0.
UPPSEC (+)
Biến UPPSEC là một biến giả. UPPSEC có giá trị bằng 1 nếu cá nhân đã tốt nghiệp trung học phổ thông và không tham gia hình thức giáo dục có cấp bằng nào khác. Các trường hợp còn lại, UPPSEC có giá trị là 0.
VOC (+)
Biến VOC là một biến giả. VOC có giá trị bằng 1 nếu cá nhân đã tốt nghiệp cao đẳng hoặc trường nghề và không tham gia hình thức giáo dục có cấp bằng nào khác. Các trường hợp còn lại, VOC có giá trị là 0.
UNIV (+)
Biến UNIV là một biến giả. UNIV có giá trị bằng 1 nếu cá nhân đã tốt nghiệp đại học hoặc sau đại học. Các trường hợp còn lại, UNIV có giá trị là 0.
GENDER (+)
Biến GENDER là một biến giả. GENDER có giá trị bằng 1 nếu mẫu quan sát là nam giới. GENDER bằng 0 trong trường hợp mẫu quan sát là nữ giới.
RACE (+)
Biến RACE là một biến giả. RACE có giá trị bằng 1 nếu cá nhân thuộc dân tộc Kinh hoặc dân tộc Hoa. RACE bằng 0 trong các trường hợp còn lại.
URBAN (+)
Biến URBAN là một biến giả. URBAN có giá trị bằng 1 nếu cá nhân làm việc ở thành thị. URBAN bằng 0 trong trường hợp cá nhân làm việc ở nông thôn.
STATESEC
Biến STATESEC là một biến giả. STATESEC có giá trị bằng 1 nếu cá nhân làm việc ở khu vực nhà nước. Các trường hợp còn lại, STATESEC có giá trị bằng 0.
Biến Dấu kỳ vọng Diễn tả biến
PRISEC
Biến PRISEC là một biến giả. PRISEC có giá trị bằng 1 nếu cá nhân làm việc ở khu vực tư nhân. Các trường hợp còn lại, PRISEC có giá trị bằng 0.
FORSEC
Biến FORSEC là một biến giả. FORSEC có giá trị bằng 1 nếu cá nhân làm việc cho các công ty nước ngoài. Các trường hợp còn lại, FORSEC có giá trị bằng 0.
VUNG1
Biến VUNG1 là một biến giả. VUNG1 có giá trị bằng 1 nếu cá nhân sinh sống ở khu vực Đồng bằng Sông Hồng. Các trường hợp còn lại, VUNG1 có giá trị bằng 0.
VUNG2
Biến VUNG2 là một biến giả. VUNG2 có giá trị bằng 1 nếu cá nhân sinh sống ở khu vực Trung du và miền núi phía Bắc. Các trường hợp còn lại, VUNG2 có giá trị bằng 0.
VUNG3
Biến VUNG3 là một biến giả. VUNG3 có giá trị bằng 1 nếu cá nhân sinh sống ở khu vực Bắc Trung Bộ và duyên hải miền Trung. Các trường hợp còn lại, VUNG3 có giá trị bằng 0.
VUNG4
Biến VUNG4 là một biến giả. VUNG4 có giá trị bằng 1 nếu cá nhân sinh sống ở khu vực Tây
Nguyên. Các trường hợp còn lại, VUNG4 có giá trị bằng 0.
VUNG5
Biến VUNG5 là một biến giả. VUNG5 có giá trị bằng 1 nếu cá nhân sinh sống ở khu vực Đông Nam Bộ. Các trường hợp còn lại, VUNG5 có giá trị bằng 0.
VUNG6
Biến VUNG6 là một biến giả. VUNG6 có giá trị bằng 1 nếu cá nhân sinh sống ở khu vực Đồng bằng Sông Cửu Long. Các trường hợp còn lại, VUNG6 có giá trị bằng 0.
Chương 4: Kết quả nghiên cứu
Chương này trình bày khái quát về bộ số liệu, các thống kê mô tả, hình ảnh minh họa, tương quan giữa các biến sử dụng trong nghiên cứu này. Các kết quả hồi quy được trình bày trong sự so sánh với các kết quả tính toán của các tác giả khác cho các bộ số liệu trước đây.