CHƢƠNG 3 DỮ LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU
3.4. Các loại chiến lược phục hồi
3.5.1. Hồi quy logit
Mục tiêu của hồi qui Logistic là nghiên cứu mối tương quan giữa một (hay nhiều) yếu tố nguy cơ và đối tượng phân tích. Trong đĩ, đối tượng phân tích đĩng vai trị biến phụ thuộc và nhận một trong hai giá trị là 0 và 1, 0 đại diện cho câu trả lời là khơng cịn 1 đại diện cho câu trả lời là cĩ.
Trong trường hợp biến phụ thuộc cĩ nhiều hơn 2 giá trị tơi cĩ các mơ hình logit biến thể phù hợp sau:
Nếu là biến định danh cĩ nhiều lựa chọn thì dùng mơ hình multinominal logit.
Nếu là thứ bậc cĩ nhiều lựa chọn thì dùng mơ hình ordinal logit. Trong bài này, tơi em xét về mơ hình logit cho biến phụ thuộc nhị phân. Xét mơ hình hồi quy sau:
Yi = β1 + β2X2i + …+ βkXki + Ui
Gọi ρi là xác suất cĩ điều kiện để Yi nhận giá trị 1 (điều kiện là các giá trị cụ thể của X2i,…, Xki).
Nếu dùng OLS để ước lượng mơ hình trên như các trường hợp thơng thường sẽ gọi là mơ hình xác suất tuyến tính (LPM). Tuy nhiên mơ hình LPM lại cĩ thể đem lại dự báo xác suất ρi >1 hoặc ρi <0, điều này khơng đúng với nghĩa về xác suất, do đĩ mơ hình logit được áp dụng sẽ giúp giải quyết vấn đề này.
Ta cĩ mơ hình logit như sau:
ρi = f(Zi) = = (Logit)
với Zi = β1 + β2X2i + …+ βkXki
suy ra Zi = ( )
Trong đĩ, được gọi là Odd, hay nĩi cách khác Odd là xác suất để Y nhận giá trị 1
trên xác suất để Y nhận giá trị 0 theo điều kiện của X.
Từ đĩ, ta cĩ khái niệm Odd Ratio (ký hiệu OR) được định nghĩa là tỷ số nguy cơ với xác suất Y nhận giá trị 1 trên xác suất Y nhận giá trị 0 khi điều kiện X xảy ra chia cho xác suất Y nhận giá trị 1 trên xác suất Y nhận giá trị 0 khi điều kiện X khơng xảy ra.
Ta viết lại hàm hồi quy phía trên: (
) = β1 + β2X2i + …+ βkXki
Từ đĩ suy ra:
= e β1 + β2X2i + …+ βkXki
Trong điều kiện các yếu tố khác khơng đổi, chỉ xét sự thay đổi trong biến giả nhị phân X2i, ta cĩ Odd1 (xác suất Y xảy ra khi X2i nhận giá trị 1) là:
Odd1 =
Tương tự ta cĩ Odd0: Odd0 =
= e β1 + …+ βkXki
Khi đĩ, ta tính được Odd Ratio (OR), theo Szumilas (2010) như sau:
OR = = e β2
Xét giá trị biên của ρi theo các Xj (j = 2,…, k)
= ( ) = ( ) Đặt: = u Ta cĩ: ( ) = = ( ( )) ( ) = ( )
Dễ thấy được giá trị biên của các biến điều kiện X đối với ρi khơng cịn là βj như trong hồi quy tuyến tính nữa, mà là
( ) .
Tuy nhiên, cĩ một tính chất rất quan trọng của hồi quy logit mà ta nhận thấy ở đây, chính là βj luơn cùng dấu với giá trị biên của ρi theo Xj, nghĩa là:
Nếu βj > 0 thì khi Xj tăng dẫn tới ρi tăng.
βj < 0 thì khi Xj tăng dẫn tới ρi giảm.
βj = 0 thì Xj khơng tác động tới ρi.