Bảng 2.21 Thống kê mơ tả chi tiêu hộ gia đình cho giáo dục theo giới
tính của chủ hộ gia đình.
Giới tính chủ hộ
Chi tiêu hộ gia đình cho giáo dục
Giá trị trung bình Độ lệch chuẩn Tần suất
Nữ 6623 7876 157
Nam 5652 8891 437
Qua thực hiện mơ tả chi tiêu hộ gia đình cho giáo dục theo giới tính của chủ hộ cho thấy những hộ có chủ hộ là nữ lại có mức chi trung bình cho giáo dục cao hơn các hộ gia đình có chủ hộ là nam giới. Thực tế này trái ngược lại với kỳ vọng ban đầu trong giả thiết nghiên cứu. Điều này có thể do đặc thù riêng của bộ dữ liệu thu thập được ở vùng Đông Nam Bộ.
Để dự báo khả năng phụ thuộc giữa chi tiêu cho giáo dục và giới tính của chủ hộ gia đình, ta xem xét bảng tần suất sau:
Bảng 2.22 Mô tả tần suất 2 chiều giữa chi tiêu cho giáo dục và giới tính của chủ hộ gia đình
Giới tính chủ hộ
Nhóm chi tiêu cho giáo dục Tổng số
hộ
Thấp Trung bình - thấp Trung bình Trung bình cao Cao
Nữ 27 25 33 34 38 157
Nam 93 93 86 85 80 437
Tổng số hộ 120 118 119 119 118 594
Với bảng mô tả tần suất trên ta thực hiện kiểm định chi bình phương và được các thông số như sau: χ2
thực tế là 5, χ2
tự do 4 là 9. Kết quả này cho thấy khơng có khả năng chi tiêu cho giáo dục phụ thuộc vào giới tính của chủ hộ gia đình.
2.2.6 Mơ tả theo trình độ học vấn của chủ hộ gia đình
Bảng 2.23 Thống kê mơ tả chi tiêu hộ gia đình cho giáo dục theo trình
độ học vấn chủ hộ gia đình (số năm đi học của chủ hộ)
Số năm đi học
của chủ hộ Giá trị trung bình Chi tiêu hộ gia đình cho giáo dục Độ lệch chuẩn Tần suất
8 3900 5797 217
12 6678 8537 177
15 6813 11123 145
18 11358 17811 8
19 9181 7170 47
Qua thực hiện mơ tả chi tiêu hộ gia đình cho giáo dục theo trình độ học vấn của chủ hộ cho thấy có xu hướng khi chủ hộ có số năm đi học càng nhiều thì mức chi trung bình cho giáo dục của hộ đó cũng tăng theo. Tuy nhiên cũng có nhóm 47 hộ được khảo sát có chủ hộ có số năm đi học cao nhất (19 năm) nhưng mức chi trung bình cho giáo dục của hộ lại thấp hơn nhóm 8 hộ có chủ hộ có số năm đi học ít hơn (18 năm).
Để dự báo khả năng phụ thuộc giữa chi tiêu cho giáo dục và trình độ học vấn của chủ hộ gia đình, ta xem xét bảng tần suất sau:
Bảng 2.24 Mô tả tần suất 2 chiều giữa chi tiêu cho giáo dục và trình độ học vấn của chủ hộ gia đình
Số năm đi học của chủ hộ
Nhóm chi tiêu cho giáo dục Tổng số
hộ
Thấp Trung bình - thấp Trung bình Trung bình cao Cao
8 73 48 38 34 24 217 12 26 37 38 36 40 177 15 18 27 35 35 30 145 18 0 1 1 4 2 8 19 3 5 7 10 22 47 Tổng số hộ 120 118 119 119 118 594
Với bảng mô tả tần suất trên ta thực hiện kiểm định chi bình phương và được các thơng số như sau: χ2
thực tế là 72, χ2
lý thuyết ở mức ý nghĩa 5%, bậc tự do 16 là 26. Kết quả này cho thấy khả năng chi tiêu cho giáo dục phụ thuộc vào trình độ học vấn của chủ hộ gia đình là khá cao.
2.2.7 Mơ tả theo tuổi của chủ hộ gia đình
Bảng 2.25 Thống kê mơ tả chi tiêu hộ gia đình cho giáo dục theo nhóm tuổi của chủ hộ gia đình.
Nhóm tuổi
của chủ hộ
Chi tiêu hộ gia đình cho giáo dục
Giá trị trung bình Độ lệch chuẩn Tần suất
38 trở xuống 3531 5526 128
39 đến 43 5823 11766 119
44 đến 48 5968 5847 117
49 đến 54 6943 6940 118
55 trở lên 7564 10949 112
Qua thực hiện mô tả chi tiêu hộ gia đình cho giáo dục theo độ tuổi của chủ hộ cho thấy một xu hướng rất rõ ràng là ở các hộ gia đình có chủ hộ thuộc nhóm tuổi càng cao thì mức chi tiêu trung bình cho giáo dục của hộ đó cao hơn ở các hộ gia đình có chủ hộ thuộc nhóm tuổi thấp. Mức chi trung bình cho giáo dục của những hộ có chủ hộ thuộc nhóm tuổi cao nhất gấp hơn 2 lần so với ở nhóm tuổi thấp nhất.
Để dự báo khả năng phụ thuộc giữa chi tiêu cho giáo dục và độ tuổi của chủ hộ gia đình, ta xem xét bảng tần suất sau:
Bảng 2.26 Mô tả tần suất 2 chiều giữa chi tiêu cho giáo dục và nhóm
tuổi của chủ hộ gia đình.
Nhóm tuổi của chủ hộ
Nhóm chi tiêu cho giáo dục Tổng số
hộ
Thấp Trung bình - thấp Trung bình Trung bình cao Cao
38 trở xuống 44 28 29 17 10 128 39 đến 43 20 34 29 17 19 119 44 đến 48 20 15 22 32 28 117 49 đến 54 14 22 18 29 35 118 55 trở lên 22 19 21 24 26 112 Tổng số hộ 120 118 119 119 118 594
Với bảng mô tả tần suất trên ta thực hiện kiểm định chi bình phương và được các thơng số như sau: χ2
thực tế là 56, χ2
lý thuyết ở mức ý nghĩa 5%, bậc tự do 16 là 26. Kết quả này cho thấy khả năng chi tiêu cho giáo dục phụ thuộc vào độ tuổi của chủ hộ gia đình là khá cao.
2.2.8 Mô tả theo các khoản trợ cấp giáo dục
Bảng 2.27 Thống kê mô tả chi tiêu hộ gia đình cho giáo dục theo nhóm
trợ cấp giáo dục.
Nhóm trợ cấp
cho giáo dục
Chi tiêu hộ gia đình cho giáo dục Giá trị trung bình Độ lệch chuẩn Tần suất
Khơng có trợ cấp 5142 6249 454
11 nghìn đồng đến 30 nghìn đồng 2751 3858 24
Trên 30 nghìn đồng 9560 14506 116
Theo cơ sở dữ liệu thì có đến 454 hộ gia đình ở nhóm 1 khơng nhận được bất kỳ khoản trợ cấp giáo dục nào. Số tiền trung bình mà các hộ này chi cho giáo dục cao hơn khoản chi của 24 hộ được nhận trợ cấp giáo dục ở nhóm 2. Tuy nhiên, nhóm 3 là nhóm những hộ được nhận nhiều trợ cấp giáo dục nhất lại có số tiền chi trung bình cho giáo dục cao nhất.
Để dự báo khả năng phụ thuộc giữa chi tiêu của hộ gia đình cho giáo dục và số tiền họ nhận được từ trợ cấp giáo dục, ta xem xét bảng tần suất sau:
Bảng 2.28 Mô tả tần suất 2 chiều giữa chi tiêu cho giáo dục và nhóm trợ cấp cho giáo dục.
Nhóm trợ cấp cho giáo dục
Nhóm chi tiêu cho giáo dục Tổng số
hộ
Thấp Trung bình - thấp Trung bình Trung bình cao Cao
Khơng có trợ cấp 96 87 92 96 83 454
11.000 đến 30.000 9 8 4 2 1 24
Trên 30.000 15 23 23 21 34 116
Với bảng mô tả tần suất trên ta thực hiện kiểm định chi bình phương và được các thông số như sau: χ2
thực tế là 20, χ2
lý thuyết ở mức ý nghĩa 5%, bậc tự do 8 là 15. Kết quả này cho thấy khả năng chi tiêu cho giáo dục phụ thuộc vào các khoản trợ cấp giáo dục là khá cao.
Tóm tắt chương 2
Nội dung chương này gồm hai phần thực hiện thống kê mô tả. Phần thứ nhất, nghiên cứu đã mô tả chi tiết về chi tiêu của hộ gia đình cho giáo dục cũng như 8 nhân tố khác gồm: tổng chi tiêu của hộ gia đình, quy mơ của hộ gia đình, nơi sinh sống của hộ gia đình, dân tộc của chủ hộ, giới tính của chủ hộ, trình độ học vấn của chủ hộ, độ tuổi của chủ hộ, trợ cấp giáo dục là các nhân tố theo giả thiết nghiên cứu có khả năng ảnh hưởng đến chi tiêu của hộ gia đình cho giáo dục. Nghiên cứu đã sử dụng các bảng tần suất một chiều để làm thống kê mô tả cho các biến trên.
Ở phần thứ hai, nghiên cứu thực hiện mơ tả chi tiêu của hộ gia đình cho giáo dục theo các nhân tố khác để đưa ra những nhận định ban đầu về xu hướng tương quan trong từng trường hợp thông qua việc sử dụng các bảng thống kê tổng hợp và tần suất hai chiều. Với các kiểm định chi bình phương cho từng trường hợp, bước đầu ta có thể nhận định chi tiêu của hộ gia đình cho giáo dục nhiều khả năng phụ thuộc vào các nhân tố: tổng chi tiêu của hộ, nơi sinh sống của hộ, tuổi của chủ hộ, trình độ học vấn của chủ hộ, các khoản trợ cấp giáo dục; các nhân tố khác như: quy mơ hộ, giới tính của chủ hộ, dân tộc của chủ hộ nhiều khả năng khơng ảnh hưởng đến chi tiêu của hộ gia đình cho giáo dục. Tuy nhiên, các phán đoán này sẽ được kiểm chứng rõ hơn khi ta tiến hành chạy hồi quy ở chương 3 của nghiên cứu này.
Chương 3: PHÂN TÍCH CÁC NHÂN TỐ CÓ KHẢ NĂNG ẢNH HƯỞNG ĐẾN CHI TIÊU CỦA HỘ GIA ĐÌNH CHO GIÁO DỤC Ở VÙNG ĐƠNG NAM BỘ BẰNG MƠ HÌNH KINH TẾ
3.1 Mơ hình hồi quy
Áp dụng mơ hình Tilak (2002) như đã nêu trong phần cơ sở lý thuyết, nghiên cứu xây dựng mơ hình hồi quy tổng quát các nhân tố có khả năng ảnh hưởng đến chi tiêu hộ gia đình cho giáo dục như sau:
lneduexp = α + βiXi + εi
Trong đó α là hằng số, ε là sai số, Xi là các yếu tố có khả năng ảnh hưởng đến chi tiêu hộ gia đình cho giáo dục, βi là các hệ số hồi quy tương ứng.
Đặc điểm của các nhân tố có khả năng ảnh hưởng đến chi tiêu hộ gia đình cho giáo dục được nêu tóm tắt theo bảng sau:
Bảng 3.1 Mơ tả tóm tắt đặc điểm của các nhân tố có khả năng ảnh hưởng đến chi tiêu hộ gia đình cho giáo dục.
Tên biến Ký hiệu Đơn vị hHồi quy ệ số
Tổng chi tiêu hhexp Nghìn đồng β1
Quy mơ hộ hhsize Người β2
Nơi sinh sống của hộ urban (biến giả)
1: thành thị 0: nông thôn
β3
Dân tộc của chủ hộ hheth (biến giả)
1: dân tộc Kinh 0: dân tộc khác
β4
Giới tính của chủ hộ hhgender (biến giả)
1: nam 0: nữ
β5
Học vấn của chủ hộ hhedu Năm β6
Tuổi của chủ hộ hhage Năm β7
Theo giả thiết nghiên cứu được trình bày ở chương 1, mối quan hệ giữa các nhân tố: tổng chi tiêu hộ gia đình, quy mơ hộ gia đình, nơi sinh sống của hộ gia đình, dân tộc của chủ hộ, giới tính của chủ hộ, học vấn của chủ hộ, tuổi của chủ hộ, trợ cấp giáo dục với chi tiêu hộ gia đình cho giáo dục được diễn đạt cụ thể như sau:
Bảng 3.2 Mô tả kỳ vọng của các nhân tố có khả năng ảnh hưởng đến chi tiêu hộ gia đình cho giáo dục.
Biến số Tên biến Kỳ vọng
X1 Tổng chi tiêu Khi tổng chi tiêu của hộ gia đình càng cao
thì chi tiêu của hộ cho giáo dục cũng tăng
theo và ngược lại.
X2 Quy mô hộ Khi quy mơ hộ gia đình càng lớn hay nói
cách khác hộ càng có nhiều thành viên thì
chi tiêu của hộ cho giáo dục cũng tăng theo
và ngược lại.
X3 Nơi sinh sống của hộ Khi hộ gia đình sống ở vùng thành thị thì
chi tiêu của hộ cho giáo dục nhiều hơn hộ
sống ở vùng nông thôn.
X4 Dân tộc của chủ hộ Khi hộ gia đình có chủ hộ là người dân tộc
Kinh thì chi tiêu của hộ cho giáo dục nhiều
hơn hộ có chủ hộ là người thuộc các dân tộc khác.
X5 Giới tính của chủ hộ Khi hộ gia đình có chủ hộ là nam thì chi
tiêu của hộ cho giáo dục nhiều hơn hộ có
chủ hộ là nữ.
X6 Học vấn của chủ hộ Khi trình độ học vấn của chủ hộ càng cao
thì chi tiêu của hộ gia đình cho giáo dục cũng tăng theo và ngược lại.
X7 Tuổi của chủ hộ Khi độ tuổi của chủ hộ càng cao thì chi
tiêu của hộ gia đình cho giáo dục cũng tăng theo và ngược lại.
X8 Trợ cấp giáo dục Khi hộ gia đình nhận được càng nhiều trợ
cấp giáo dục thì chi tiêu của hộ cho giáo
Như vậy, kết hợp giữa mơ hình Tilak và giả thiết nghiên cứu các nhân tố có khả năng ảnh hưởng đến chi tiêu hộ gia đình cho giáo dục, mơ hình hồi quy tổng thể của nghiên cứu được diễn đạt cụ thể như sau:
lneduexp = α + β1hhexp + β2hhsize + β3urban + β4hheth + β5hhgender + β6hhedu + β7hhage + β8eduaid + ei (*)
Tuy nhiên, để kết quả ước lượng của mơ hình hồi quy bội đạt độ tin cậy cao nhất cũng như giải thích tốt hơn vấn đề nghiên cứu, Nguyễn Hoàng Bảo (2010) cho rằng cần xác định đúng dạng hàm của các biến số có trong mơ hình. Việc xác định này thơng qua kết hợp đánh giá dạng phân phối dữ liệu của từng biến cũng như mối quan hệ giữa từng biến độc lập với biến phụ thuộc qua đồ thị phân tán (xem phụ lục). Dạng hàm của từng biến được chọn khi có dạng đồ thị gần với phân phối chuẩn nhất kết hợp với phán đoán dạng hàm từ đồ thị phân tán.
Từ các phân tích trên, ta có mơ hình kinh tế như sau:
lneduexp = α + β1lnhhexp + β2lnhhsize + β3urban + β4hheth + β5hhgender + β6hhedu + β7lnhhage + β8eduaid + ei (**)
3.2 Ma trận tương quan
Ma trận hệ số tương quan giữa các biến trong mơ hình được thể hiện cụ thể theo bảng sau:
Bảng 3.3 Ma trận hệ số tương quan giữa các biến trong mơ hình
lneduexp hhexp hhsize urban hheth hhgender hhedu hhage eduaid lneduexp 1 hhexp 0,4378 1 hhsize 0,0777 0,1866 1 urban 0,276 0,2237 -0,0676 1 hheth 0,0673 0,0672 -0,0164 0,081 1 hhgender -0,0898 -0,108 0,1282 -0,2128 -0,0484 1 hhedu 0,2919 0,2671 -0,1814 0,2746 0,0613 -0,054 1 hhage 0,1361 0,1594 0,2172 0,1268 0,0046 -0,0778 0,0267 1 eduaid 0,1968 0,0757 -0,0043 0,0399 0,0073 -0,0908 0,0569 0,0754 1
Qua bảng trên chúng ta nhận thấy rằng hệ số tương quan giữa các biến độc lập của mơ hình đều ở mức thấp (cao nhất là 0,2746). Theo Nguyễn Trọng Hoài (2010), khi dữ liệu nghiên cứu là dạng dữ liệu chéo, với hệ số tương quan giữa các biến độc lập thấp (dưới 0,8) thì khả năng xảy ra đa cộng tuyến hoàn hảo hoặc đa cộng tuyến gần như hồn hảo là khơng thể xảy ra. Điều này cho phép ta thực hiện được ước lượng hồi quy bằng phương pháp OLS trên cơ sở dữ liệu của nghiên cứu. Thực tế, nếu ta thực hiện thêm kiểm định hệ số VIF cho mơ hình để xác định sự tồn tại của đa cộng tuyến cũng dẫn đến kết luận tương tự.
3.3 Các bước hồi quy
Với cơ sở dữ liệu đã có đồng thời sử dụng lệnh hồi quy trên phần mềm xử lý dữ liệu Stata, ta được bảng kết quả hồi quy gồm 8 biến độc lập được triển khai từ phương trình (**) cụ thể như sau:
Bảng 3.4 Kết quả hồi quy với 8 biến độc lập
reg lneduexp lnhhexp lnhhsize urban hheth hhgender hhedu lnhhage eduaid
Source SS df MS Number of obs 594
F( 8, 585) 36.74
Model 257,5425 8 32,1928 Prob > F 0,0000
Residual 512,6412 585 0,8763 R-squared 0,3344
Adj R-squared 0,3253
Total 770,1836 593 1,2988 Root MSE 0,9361
lneduexp Coef. Std. Err. t P>|t| [95% Conf. Interval]
lnhhexp 0,8604 0,0761 11,3100 0,0000 0,7110 1,0098 lnhhsize 0,0672 0,1370 0,4900 0,6240 -0,2019 0,3363 urban 0,3179 0,0831 3,8200 0,0000 0,1546 0,4812 hheth 0,0921 0,2142 0,4300 0,6670 -0,3286 0,5129 hhgender 0,0123 0,0916 0,1300 0,8930 -0,1676 0,1922 hhedu 0,0357 0,0122 2,9200 0,0040 0,0117 0,0597 lnhhage 0,2667 0,1775 1,5000 0,1340 -0,0820 0,6154 eduaid 0,0002 0,0000 4,2600 0,0000 0,0001 0,0003 _cons -2,9540 0,9568 -3,0900 0,0020 -4,8332 -1,0749
Với mức ý nghĩa 5%, các biến số quy mô hộ gia đình, dân tộc của chủ hộ, giới tính của chủ hộ, tuổi của chủ hộ đều có p-value ở mức trên 0.05 nên ta có thể xác định việc các biến này tồn tại trong mơ hình hồi quy là không