Kết quả hồi quy và thảo luận

Một phần của tài liệu (LUẬN văn THẠC sĩ) các yếu tố ảnh hưởng đến việc tham gia bảo hiểm xã hội tự nguyện của người lao động trên địa bàn quận 9, thành phố hồ chí minh (Trang 45 - 51)

CHƢƠNG 4 KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN

4.3. Kết quả hồi quy và thảo luận

Để đánh giá các yếu tố ảnh hưởng đến việc tham gia BHXH tự nguyện của người lao động trên địa bàn Quận 9, TP HCM tác giả sử dụng mơ hình hồi quy Logistic bằng phần mềm R. Kết quả ước lượng mơ hình hồi quy Logistic như sau:

Với bộ dữ liệu có 376 quan sát bao gồm người lao động tham gia bảo hiểm tự nguyện (TGBHTN) và người lao động không tham gia bảo hiểm tự nguyên, với các biến tgbaohiem=1.

Nếu người lao động tham gia bảo hiểm tự nguyện, và tgbaohiem=0, nếu người lao động không tham gia bảo hiểm tự nguyện; và các biến độc lập tuoi, vieclam, thunhap, gioitinh.

Trong nghiên cứu này muốn xem xét biến tgbaohiem (biến phụ thuộc) có liên hệ như thế nào với các biến độc lập nêu trên, bằng cách thực hiện hồi quy OLS cho mơ hình sau:

tgbaohiem = + tuoi+ vieclam+ thunhap+ gioitinh+u

Mơ hình này cịn được gọi là mơ hình xác suất tuyến tính LPM (Linear Probability Model) vì rằng kì vọng của biến phụ thuộc (trạng thái tham gia bảo hiểm) có thể được hiểu như xác suất có điều kiện xuất hiện sự kiện tham gia bảo hiểm.

Mơ hình LMP trên có một số khuyết điểm đáng quan t m như: Th nhất, LPM cho rằng xác suất quan sát thấy hành vi tham gia bảo hiểm là quan hệ tuyến tính với các biến giải thích bất kể quy mô về giá trị của các biến số này. Th hai, xác suất

của một sự kiện phải nằm giữa 0 và 1 nhưng LPM không đảm bảo rằng các giá trị xác suất ước lượng được sẽ nằm trong khoảng này. Th ba, giả định về sai số ngẫu nhiên tu n theo ph n phối chuẩn có thể khơng cịn đúng nữa khi biến phụ thuộc chỉ

37

nhận một trong hai giá trị 0 và 1. Th tư, phương sai của sai số ngẫu nhiên là thay

đổi, làm cho các kiểm định truyền thống là khơng đáng tin cậy.

Vì những lí do nêu trên, thì mơ hình Probit và Logistic thường được sử dụng cho các tình huống mà biến phụ thuộc là các biến nhị ph n.

Mơ hình Logistic (Logit)

Mơ hình này phát biểu rằng xác suất p quan sát thấy hành vi tham gia bảo hiểm tự nguyện liên hệ với các biến độc lập khác trong mô hình như sau:

(1) Vì p có giá trị từ 0 đến 1 nên hàm logit có giá trị từ - ∞ đến + ∞.

(2) Mặc dù log[p/(1-p)] là tuyến tính với các biến giải thích nhưng các xác suất thì khơng như vậy. Điều này ngược lại với mơ hình LPM.

(3) Nếu log[p/(1-p)] là dương thì khi giá trị của biến giải thích tăng dẫn đến khả năng quan sát thấy hành vi tham gia bảo hiểm tăng (và ngược lại).

(4) Nếu chúng ta tìm được các ước lượng cho các và thì chúng ta có thể ước lượng xác suất p cho bất kì quan sát nào theo phương trình trên.

Việc ước lượng các hệ số của mơ hình Logit được thực hiện bằng phương pháp ước lượng hợp lí cực đại (maximum likelihood - ML). Có nhiều phần mềm thống kê ước lượng cho mơ hình này. Ở đ y sử dụng phần mềm R để ước lượng với kết quả như sau:

Call:

Deviance Residuals:

Min 1Q Median 3Q Max -2.3921 -0.9133 0.5533 0.8012 1.5028

38

Coefficients:

Estimate Std. Error z value Pr(>|z|) (Intercept) -9.911e-02 6.056e-01 -0.164 0.87001 tuoi 3.927e-03 1.230e-02 0.319 0.74944 vieclam 1.074e+00 2.664e-01 4.033 5.51e-05 *** thunhap 2.242e-04 7.865e-05 2.851 0.00436 ** gioitinh -1.014e+00 2.538e-01 -3.993 6.52e-05 ***

Signif. codes: 0 „***‟ 0.001 „**‟ 0.01 „*‟ 0.05 „.‟ 0.1 „ ‟ 1 (Dispersion parameter for binomial family taken to be 1)

Null deviance: 447.25 on 375 degrees of freedom Residual deviance: 390.10 on 371 degrees of freedom AIC: 400.1

Number of Fisher Scoring iterations: 5 Kết quả trên được diễn giải như sau:

Hệ số của biến thunhap = 2.242e-04 = 2.242x10-4 có nghĩa là khi thu nhập tăng 1 đơn vị thì xác suất quan sát thấy hành vi tham gia bảo hiểm tự nguyện của người lao động này tăng lên khoảng 100[1-exp(2.242⨉10-4)] = 0.022 %.

Hệ số hồi quy của biến vieclam=1.074 của nhóm người có việc làm có khả năng tham gia bảo hiểm tự nguyện cao hơn nhóm người khơng có việc làm là 1.074 lần. Tức là xác suất tham gia bảo hiểm tự nguyện của người có việc làm cao hơn.

Ta có thể tính tỷ số OR(odd ratio) như sau: >exp(logit$coefficients)

(Intercept) tuoi vieclam thunhap gioitinh 0.9056464 1.0039348 2.9279586 1.0002243 0.3629343

39

Nghĩa là khi thu nhập tăng 1 đơn vị thì người này thuộc nhóm tham gia bảo hiểm tự nguyện tăng 1.0002243 lần, tức là tăng 0.022%.

Ta có thể ước lượng xác suất quan sát thấy người thứ hai trong mẫu nghiên cứu là thuộc nhóm tham gia bảo hiểm tự nguyện là bao nhiêu:

1/(1+exp(-logit$coef[1]+logit$coef[2]*50+logit$coef[3]*1+logit$coef[4]*1300+ + logit$coef[5]*1))

(Intercept) 0.3435022

Giá trị xác suất ước lượng này là 0.3435022. Thực tế thì quan sát thứ 2 này là người tham gia bảo hiểm tự nguyện. Nên chúng ta có thể nói mơ hình ph n loại (hay ước lượng) sai cho quan sát thứ hai này. Trong diễn giải các kết quả của mơ hình logistic (hay bất kì mơ hình ph n loại nào) nếu một người là tham gia bảo hiểm tự nguyện và giá trị xác suất ước lượng ứng với người này mà lớn h n 0.5 thì

ta nói mơ hình dự báo đúng và gán cho nó giá trị 1 và ngược lại (Gujarati, 2011).

Trong tình huống của chúng ta, mơ hình ước lượng xác suất tham gia bảo hiểm tự nguyện ứng với quan sát thứ hai là 0.3435022 trong khi thực tế người này có tham gia bảo hiểm do đó đ y là một ước lượng sai và do vậy được gán giá trị 0.

Sự khác biệt giữa giá trị p thực tế và ước lượng p gọi là deviance – một tiêu chí tương tự như phần dư trong ước lượng bằng phương pháp (OLS). Sai biệt này càng nh càng tốt. Tương tự như tiêu chí R2

đối với ước lượng bằng (OLS), với mơ hình Logit thì ta có chỉ tiêu R2 của MacFadden (MacFadden‟s R2) để đo lường mức độ phù hợp của mơ hình. Trong R chúng ta có thể tìm MacFadden‟s R2 kết quả như sau:

llh llhNull G2 McFadden r2ML r2CU -195.0490980 -223.6270450 57.1558940 0.1277929 0.1410206 0.2027241

40

Trong đó lfL = - 195.0490980 và lfL0 = - 223.6270450 (lần lượt ở cột llh và llhNull), được 12,78%. Tương tự như kiểm định F chúng ta có thể sử dụng thống kê tỉ số xác suất LR (likehood ratio statistic) theo công thức sau:

Để kiểm định cặp giả thuyết:

H0: Tất cả các hệ s hồi quy c a biến độc lập bằng khơng H1: C ít nhất một hệ s hồi quy c a biến độc lập khác khơng.

Đại lượng này có ph n phối χ2 với (k-1) bậc tự do (cũng chính là số biến độc lập trong mơ hình). Giá trị của thống kê λ = 57.156 là rất lớn nên chúng ta bắc b giá thuyết H0. Tức là có ít nhất một hệ số hồi quy của biến độc lập khác khơng.

Với mơ hình logistic, chỉ tiêu R2

của MacFadden rất khó sử dụng để diễn giải mơ hình logistic nói riêng và các mơ hình ph n loại nói chung. Chúng ta sử dụng một cách tiếp cận khác cho vấn đề này như sau: lấy số lượng các quan sát mà mơ hình dự báo đúng – tức là các quan sát được gán giá trị 1 chia cho tất cả các quan sát trong mơ hình (Gujarati, 2011). Trong thực tế, tỉ số này sẽ là một con số nằm giữ 0 và 1. Tất nhiên một mơ hình tốt thì tỉ số này càng gần 1 càng tốt.

Phần mềm sẽ tính Xác suất dự báo cho tất cả các quan sát trong bộ dữ liệu. Sau đ y ta xem xác suất dự báo cho 10 quan sát đầu tiên.

1 2 3 4 5

0.5907448 0.8180780 0.5649160 0.5807635 0.8941119

6 7 8 9 10

0.3268650 0.9079418 0.5721344 0.8577965 0.8823236 Phần mềm cho kết quả như sau:

glm.pred 0 1 Nontgbaohiem 30 15 tgbaohiem 76 255

Kết quả chỉ ra rằng có tất cả (30 + 15 = 45) quan sát là không tham gia bảo hiểm tự nguyện và mơ hình xác định đúng 30 quan sát đạt tỉ lệ chính xác 66.67%.

41

Có (76+255=331) quan sát tham gia bảo hiểm tự nguyện nhưng mơ hình chỉ xác định đúng 255 người tham gia bảo hiểm tự nguyện tức là đạt mức chính xác 77.04%.

Tỉ lệ dự báo chính xác của mơ hình là: (30+255)/376 = 75.80%.

Kết luận chƣơng 4

Từ mơ hình nghiên cứu, tác giả tiến hành ph n tích và kết quả ph n tích hồi quy đánh giá các yếu tố ảnh hưởng đến việc tham gia BHXH tự nguyện của người lao động trên địa bàn Quận 9, TP HCM tác giả sử dụng mơ hình hồi quy Logistic mơ hình lý thuyết phù hợp với mơ hình thực tế và giải thích được 75,80% (ngoại trừ biến tuổi).

42

Một phần của tài liệu (LUẬN văn THẠC sĩ) các yếu tố ảnh hưởng đến việc tham gia bảo hiểm xã hội tự nguyện của người lao động trên địa bàn quận 9, thành phố hồ chí minh (Trang 45 - 51)