* Lập bảng các chỉ tiêu cần chạy số liệu
Bảng 3.7. Danh sách các biến, tên biến đƣa vào mô hình
STT Tên biến Tên biến sử dụng trong phần mềm phân tích Tên biến độc lập
1 Thu nhập bình quân thubq
2 Hộ gia đình phân theo mức giàu, nghèo ngheo_c6
3 Nhà ở (kiên cố, không kiên cố) nhao
4 Bằng cấp (đã tốt nghiệp ≤ cấp 3 và > cấp 3 trở lên) bangcap
5 Chi tiêu cho khám chữa bệnh trong vòng 12 tháng chikhac_2
6 Tỷ lệ khám chữa bệnh trong 12 tháng trước phỏng vấn tyle_kcb
Tên biến phụ thuộc
1 Sử dụng nguồn nước hợp vệ sinh nuoc
2 Sử dụng hố xí hợp vệ sinh hoxi
3.3.2.1. Kết quả chạy mô hình cho biến sử dụng nguồn nước hợp vệ sinh ở 2 vùng ĐBSH và ĐBSCL năm 2010.
a. Mô hình hồi quy biến nước của vùng ĐBSH
. logit nuoc thubq ngheo_c6 nhao bangcap chikhac_2 tyle_kcb [w=wt9] (frequency weights assumed)
Iteration 0: log likelihood = -209289.21 Iteration 1: log likelihood = -204783.44 Iteration 2: log likelihood = -193626.13 Iteration 3: log likelihood = -192259.27 Iteration 4: log likelihood = -192239.85 Iteration 5: log likelihood = -192239.84
Logistic regression Number of obs = 5264367 LR chi2(6) = 34098.74 Prob > chi2 = 0.0000 Log likelihood = -192239.84 Pseudo R2 = 0.0815 --- nuoc | Coef. Std. Err. z P>|z| [95% Conf. Interval] ---+--- thubq | .0004426 6.81e-06 65.04 0.000 .0004292 .0004559 ngheo_c6 | .4574127 .0165033 27.72 0.000 .4250669 .4897585 nhao | 2.502665 .0244251 102.46 0.000 2.454792 2.550537 bangcap | .8639539 .0172703 50.03 0.000 .8301047 .8978031 chikhac_2 | 6.08e-06 8.92e-07 6.82 0.000 4.34e-06 7.83e-06 tyle_kcb | -.9732218 .0146313 -66.52 0.000 -1.001899 -.944545 _cons | 1.558252 .0276505 56.36 0.000 1.504058 1.612446 --- . mfx
Marginal effects after logit y = Pr(nuoc) (predict) = .9961296
--- variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X ---+--- thubq | 1.71e-06 .00000 79.62 0.000 1.7e-06 1.7e-06 2479.48 ngheo_c6*| .0021847 .0001 21.57 0.000 .001986 .002383 .953608 nhao*| .0411529 .00109 37.65 0.000 .039011 .043295 .997081 bangcap*| .0030585 .00006 54.16 0.000 .002948 .003169 .365235 chikha~2 | 2.35e-08 .00000 6.81 0.000 1.7e-08 3.0e-08 4261.72 tyle_kcb | -.0037522 .00006 -63.24 0.000 -.003868 -.003636 .388544 --- (*) dy/dx is for discrete change of dummy variable from 0 to 1
b.Mô hình hồi quy biến nước của vùng ĐBSCL
. logit nuoc thubq ngheo_c6 nhao bangcap chikhac_2 tyle_kcb [w=wt9] (frequency weights assumed)
Iteration 0: log likelihood = -1816468.7 Iteration 1: log likelihood = -1715691.9 Iteration 2: log likelihood = -1702982.5 Iteration 3: log likelihood = -1702499.7 Iteration 4: log likelihood = -1702499.3 Iteration 5: log likelihood = -1702499.3
Logistic regression Number of obs = 4370583 LR chi2(6) = 227938.69 Prob > chi2 = 0.0000 Log likelihood = -1702499.3 Pseudo R2 = 0.0627 --- nuoc | Coef. Std. Err. z P>|z| [95% Conf. Interval] ---+--- thubq | .0001036 1.20e-06 86.46 0.000 .0001012 .0001059 ngheo_c6 | .3595866 .0047525 75.66 0.000 .3502718 .3689013 nhao | .6133895 .0029887 205.24 0.000 .6075318 .6192471 bangcap | .4279139 .0050365 84.96 0.000 .4180426 .4377853 chikhac_2 | .0000492 3.51e-07 140.16 0.000 .0000485 .0000499 tyle_kcb | -1.267275 .0040842 -310.29 0.000 -1.275279 -1.25927 _cons | 1.363211 .0051195 266.28 0.000 1.353177 1.373245 --- . mfx
Marginal effects after logit y = Pr(nuoc) (predict) = .87454997
--- variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X ---+--- thubq | .0000114 .00000 87.40 0.000 .000011 .000012 1971.31 ngheo_c6*| .0442128 .00065 67.85 0.000 .042936 .04549 .927823 nhao*| .075234 .00041 185.27 0.000 .074438 .07603 .739022 bangcap*| .0417772 .00043 96.38 0.000 .040928 .042627 .134224 chikha~2 | 5.40e-06 .00000 145.37 0.000 5.3e-06 5.5e-06 4000.32 tyle_kcb | -.1390356 .00043 -320.75 0.000 -.139885 -.138186 .52616 --- (*) dy/dx is for discrete change of dummy variable from 0 to 1
Qua chạy mô hình phân tích số liệu về biến sử dụng nước sinh hoạt với các biến liên quan của người dân của vùng ĐBSH và ĐBSCL ta có được bảng dưới đây:
Bảng 3.8. Bảng kết quả hồi quy của biến nƣớc hợp vệ sinh
TT Các biến Hệ số β P value Vùng 1 (ĐBSH) Vùng 8 (ĐBSCL) x1 thubq 0.0004426 0.0001036 <0,05 x2 ngheo_c6 0.4574127 0.3595866 <0,05 x3 nhao 2.502665 0.6133895 <0,05 x4 bangcap 0.8639539 0.4279139 <0,05 x5 chikhac_2 0.000000608 0.0000492 <0,05 x6 tyle_kcb -0.9732218 -1.267275 <0,05 _cons 1.558252 1.363211 R2 0.0815 0.0627
Bảng 3.9. Bảng hệ số dy/dx của nƣớc hợp vệ sinh
TT Các biến Hệ số dy/dx Vùng 1 (ĐBSH) Vùng 8 (ĐBSCL) x1 thubq 0.000000171 0.0000114 x2 ngheo_c6 0.0021847 0.0442128 x3 nhao 0.0411529 0.075234 x4 bangcap 0.0030585 0.0417772 x5 chikhac_2 0.00000000235 0.000000540 x6 tyle_kcb -0.0037522 -0.1390356 y = Pr(nuoc) (predict) 0.9961296 0.87454997
a. Hệ số R2:
Hệ số R2 có nghĩa là các biến độc lập trong mô hình hồi quy có thể giải thích được 8,15% biến phụ thuộc (biến nước) tác động đến mô hình ở vùng ĐBSH và 6,27% ở vùng ĐBSCL.
b. Hệ số kiểm định (Pvalue): tất cả các mô hình đều có ý nghĩa tương ứng với hệ số Pvalue 0 (0,000…). Hệ số Pvalue của các biến độc lập đưa vào mô hình đều <0,05 và 0 (các biến mô hình đều có ý nghĩa). Vì vậy, các biến trong mô hình đều có mối tương quan chặt và có ý nghĩa với biến nước, với độ tin cậy 95%. (Pvalue càng gần 0 càng tốt).
c. Viết phương trình mô hình hồi quy cho biến nước:
Áp dụng công thức (1) ta có:
Y(vùng 1) = 1.558252 + 0.0004426 x X1 + 0.4574127 x X2 + 2.502665 x X3 + 0.8639539 x X4 + 0.000000608 x X5 + (-0.9732218) x X6 + ei.
Y(vùng 8)= 1.363211+ 0.0001036 x X1+ 0.3595866 x X2 + 0.6133895 x X3 + 0.4279139 x X4 + 0.0000492 x X5 + (-1.267275) x X6 + ei.
d. Giải thích từng biến: (mô hình dx/dy):
- Đối với biến thu nhập trong mô hình cho biết nếu thu nhập của 1 người một tháng tăng lên 1000 đồng thì xác suất hộ được sử dụng nước hợp vệ sinh của vùng 1 là 0.000000171 thấp hơn vùng 8 là 0,0000114.
- Đối với biến nghèo, hộ gia đình từ nghèo mà thoát nghèo thì khả năng sử dụng nước hợp vệ sinh là 0,0021847 ở vùng 1 và 0,0442128 ở vùng 8.
- Biến nhà ở, hộ gia đình từ nhà không kiên cố mà có nhà kiên cố thì khả năng sử dụng nước hợp vệ sinh ở vùng 1 là 0,0411529, trong khi đó ở vùng 8 là 0,075234.
- Biến bằng cấp, từ chủ hộ có bằng cấp cao nhất từ cấp 3 trở xuống mà lên trình độ từ cấp 3 trở lên thì khả năng được sử dụng nước hợp vệ sinh ở vùng vùng 1 là 0,0030585, trong khi ở vùng 8 là 0,0417772.
- Biến chi tiêu cho y tế, nếu bình quân một người 1 tháng tăng 1000 đồng thì hộ gia đình có khả năng sử dụng nước hợp vệ sinh ở vùng 1 là 0,0000000235và vùng 8 là 0,0000054.
- Biến tỷ lệ khám chữa bệnh bình quân 1 người 1 tháng, nếu bình quân một người 1 tháng chi khám chữa bệnh tăng lên 1000 đồng thì hộ gia đình có khả năng sử dụng nước hợp vệ sinh ở vùng 1 là -0,0037522 và vùng 8 là -0,1390356.
Qua kết quả bảng 3.8 và 3.9 cho thấy:
- Các biến độc lập trên (Thu nhập, nhà ở, trình độ học vấn, sử dụng đồ dùng lâu bền…) đều có mối tương quan với biến sử dụng nước hợp vệ sinh có ý nghĩa thống kê với p<0,05 (tức là nằm trong khoảng tin cậy 95%). Đối với những biến độc lập ở trên mà có hệ số tương quan Coef (tức là β) càng cao thì khả năng tác động đến biến số sử dụng nước sạch hợp vệ sinh (tức là sử dụng) càng lớn. Các biến có tác động mạnh nhất xếp theo thứ tự từ cao đến thấp là: (1) Nhà ở (kiên cố, không kiên cố); (2) Trình độ học vấn; (3) Hộ phân theo mức giàu, nghèo;
3.3.2.2. Kết quả chạy mô hình cho biến sử dụng hố xí hợp vệ sinh ở 2 vùng ĐBSH và ĐBSCL năm 2010
a. Mô hình hồi quy biến sử dụng hố xí của người dân vùng ĐBSH
. logit hoxi thubq ngheo_c6 nhao bangcap chikhac_2 tyle_kcb [w=wt9] (frequency weights assumed)
Iteration 0: log likelihood = -1436798.2 Iteration 1: log likelihood = -1357320.3 Iteration 2: log likelihood = -1256400 Iteration 3: log likelihood = -1244672.6 Iteration 4: log likelihood = -1244460.7 Iteration 5: log likelihood = -1244460.6
Logistic regression Number of obs = 5264367 LR chi2(6) = 384675.09 Prob > chi2 = 0.0000
Log likelihood = -1244460.6 Pseudo R2 = 0.1339 --- hoxi | Coef. Std. Err. z P>|z| [95% Conf. Interval] ---+--- thubq | .0008997 2.63e-06 341.81 0.000 .0008945 .0009048 ngheo_c6 | .2758212 .0055466 49.73 0.000 .2649501 .2866923 nhao | .718504 .0182766 39.31 0.000 .6826826 .7543255 bangcap | .6370438 .0048494 131.36 0.000 .6275391 .6465485 chikhac_2 | .0000246 3.63e-07 67.94 0.000 .0000239 .0000254 tyle_kcb | -.2172685 .0047343 -45.89 0.000 -.2265475 -.2079895 _cons | -.161668 .0187599 -8.62 0.000 -.1984368 -.1248993 ---
Note: 0 failures and 15372 successes completely determined.
. mfx
Marginal effects after logit y = Pr(hoxi) (predict) = .9644896
--- variable | dy/dx Std. Err. z P>|z| [ 95% C.I. ] X ---+--- thubq | .0000308 .00000 503.87 0.000 .000031 .000031 2479.48 ngheo_c6*| .010631 .00025 42.46 0.000 .01014 .011122 .953608 nhao*| .0346475 .00119 29.00 0.000 .032306 .036989 .997081 bangcap*| .0204172 .00015 133.85 0.000 .020118 .020716 .365235 chikha~2 | 8.44e-07 .00000 67.70 0.000 8.2e-07 8.7e-07 4261.72 tyle_kcb | -.0074413 .00016 -45.57 0.000 -.007761 -.007121 .388544 ---