Mơ hình logit

Một phần của tài liệu (LUẬN văn THẠC sĩ) các yếu tố ảnh hưởng đến việc tham gia bảo hiểm xã hội tự nguyện của người lao động trên địa bàn quận 9, thành phố hồ chí minh (Trang 31 - 34)

CHƢƠNG 3 THIẾT KẾ NGHIÊN CỨU

3.3. Mơ hình logit

Chúng ta biết rằng trong kinh tế lượng khi hồi quy với Y là biến phụ thuộc định lượng thì chúng ta ước lượng trung bình:

E( ,….,

Nếu Y là biến định tính mục tiêu của chúng ta là ước lượng xác suất một điều gì đó sẽ xảy ra.

Chúng ta xét vấn đề nghiên cứu trong đề tài là việc tham gia BHXH tự nguyện (Y) của người lao động. Y = 1, nếu người lao động tham gia BHXH tự nguyện, và Y = 0 nếu khác.

Mục tiêu chính của chúng ta là ước lượng xác suất tham gia BHXH tự nguyện (Y), khi cho trước các giá trị của các biến độc lập ( . Để x y dựng một hàm xác suất như thế, chúng ta cần nhớ hai điều kiện: (1) đó là khi giá trị của (các) độc lập (biến giải thích) thay đổi, thì xác suất ước lượng ln nằm trong khoảng (0, 1), và (2) đó là mối quan hệ giữa và là phi tuyến.

Quyết định của một người lao động có tham gia BHXH tự nguyện hay không phụ thuộc vào một chỉ số hữu dụng không thể quan sát được (unobservable utility index) I*i, chỉ số này phụ thuộc vào các biến giải thích như tuổi, giới tính, việc làm, thu nhập gia đình và mức đóng bảo hiểm… Chúng ta thể hiện chỉ số này như sau:

Trong đó B là vectơ hệ số, X tập biến độc lập, u là sai số ngẫu nhiên, và i là người thứ i. Nhưng chỉ số khơng thể quan sát có quan hệ như thế nào với quyết định thực sự là tham gia BHXH tự nguyện hay không tham gia BHXH tự nguyện. Do đó cần giả định rằng:

23

= 1 (một người có tham gia BHXH tự nguyện) nếu I*i  0

= 0 (một người không tham gia BHXH tự nguyện) nếu I*i < 0

Nghĩa là, nếu chỉ số hữu dụng I của một người lớn hơn mức ngưỡng I*, thì người đó sẽ tham gia BHXH tự nguyện nhưng nếu nh hơn I*, thì người đó sẽ không tham gia BHXH tự nguyện.

Như vậy:

Nếu ph n phối xác suất này là đối xứng quanh giá trị trung bình (bằng 0) của nó, thì phương trình trên có thể được viết lại là:

Do đó

Rõ ràng phụ thuộc vào ph n phối xác suất cụ thể của .

Mơ hình logit giả định rằng ph n phối xác suất của theo ph n phối xác suất logistic (logistic probability distribution), nên có thể được viết lại như sau:

(1)

Trong đó, là xác suất tham gia BHXH tự nguyện (tức là = 1) và

Xác suất của Y = 0, nghĩa là, một người không phải là người tham gia BHXH tự nguyện, được cho bởi:

(2)

24

(3)

Tỷ số Gọi là tỷ số odds (odds ratio) ủng hộ việc tham gia BHXH tự nguyện – tỷ số của xác suất mà một người là người tham gia BHXH tự nguyện so với xác suất mà người đó khơng phải là người tham gia BHXH tự nguyện.

Lấy log (tự nhiên) của phương trình (3), chúng ta có được một kết quả là: (4)

Phương trình (4) cho biết rằng log của tỷ số odds là một hàm tuyến tính của các B và cũng như các biến X. Và được gọi là logit (log của tỷ số odds) và vì thế có tên là mơ hình logit (logit model) cho các mơ hình giống như (4).

Chúng ta quan sát thấy rằng mơ hình xác suất tuyến tính được có giả định rằng có quan hệ tuyến tính với , trong khi đó mơ hình logit giả định rằng log của tỷ số odds có quan hệ tuyến tính với .

Nếu , logit, dương, thì nó có nghĩa rằng khi giá trị của (các) biến giải thích tăng, tỷ số odds của tham gia BHXH tự nguyện tăng, trong khi đó nếu nó m, thì tỷ số odds của tham gia BHXH tự nguyện giảm.

Sự giải thích mơ hình logit ở (4) như sau: mỗi hệ số góc cho biết log của odds ủng hộ việc tham gia BHXH tự nguyện thay đổi khi giá trị của biến X thay đổi một đơn vị.

Mặc dù mơ hình logit là tuyến tính, nhưng nó khơng thể được ước lượng theo phương pháp OLS thông thường. Vì, = 1 nếu một người tham gia BHXH tự nguyện, và Pi = 0 nếu một người không tham gia BHXH tự nguyện. Nhưng nếu chúng ta đưa các giá trị này một cách trực tiếp vào logit , thì chúng ta có biểu thức = ln(1/0) nếu một người tham gia BHXH tự nguyện và = ln(0/1) nếu một

25

người không tham gia BHXH tự nguyện. Đ y là các biểu thức khơng xác định. Vì thế, để ước lượng mơ hình logit chúng ta phải dựa vào các phương pháp ước lượng khác.

Phương pháp phổ biến nhất với các tính chất thống kê hấp dẫn là phương pháp hợp lý tối đa (ML – maximum likelihood). Các phần mềm thống kê đều có sẵn phương pháp ước lượng này.

Thước đo thông thường về mức độ phù hợp, , khơng có ý nghĩa nhiều khi biến phụ thuộc nhận các giá trị 1 hoặc 0. Các thước đo tương tự , được trình bày trong lý thuyết. Một thước đo như vậy gọi là McFadden , còn gọi là McF. Giống như ,

McF nằm giữa 0 và 1. Vì biến phụ thuộc nhận một giá trị 1 hoặc 0, nếu xác suất dự đoán cho một quan sát lớn hơn 0.5 chúng ta ph n loại quan sát đó như 1, nhưng nếu nh hơn 0.5, chúng ta ph n loại như 0.

Một phần của tài liệu (LUẬN văn THẠC sĩ) các yếu tố ảnh hưởng đến việc tham gia bảo hiểm xã hội tự nguyện của người lao động trên địa bàn quận 9, thành phố hồ chí minh (Trang 31 - 34)