Hồi quy logistic có thể sử dụng để đánh giá ảnh hƣởng của yếu tố nghiên cứu đến tỷ lệ mắc bệnh. Trong trƣờng này biến phụ thuộc là biến định tính và biến độc lập là biến liên tục. Ví dụ dƣới đây minh họa việc sử dụng mô hình hồi quy logit để phân tích số liệu định tính.
Ví dụ 2.18: Một thí nghiệm nhằm nghiên cứu ảnh hƣởng của tuổi đẻ lần đầu (tháng) đến tỷ lệ viêm vú ở bò. Số liệu thu thập trên 21 bò về tình trạng viêm vú (0: không mắc bệnh và 1: mắc bệnh) nhƣ sau: Bò số 1 2 3 4 5 6 7 8 9 10 11 Tuổi (tháng) 19 20 20 20 21 21 21 22 22 22 23 Viêm vú 1 1 0 1 0 1 1 1 1 0 1 Bò số 12 13 14 15 16 17 18 19 20 21 Tuổi (tháng) 26 27 27 27 27 29 30 30 31 32 Viêm vú 1 0 1 0 0 1 0 0 0 0
Số liệu có thể phân tích theo phƣơng trình hồi quy logistic sau: log[pi /(1-pi)] = β0 + β1xi
xi: tuổi đẻ lần đầu của bò thứ i,
0: hệ số tung độ gốc,
1: hệ số góc.
Số liệu có thể nhập vào file VIDU18.XLS định dạng excel sau đó chuyển file VIDU18.TXT định dạng txt với 2 cột lần lƣợt là tuần tuổi (TUAN) và khối lƣợng của gà Hồ (KL).
SAS code của VIDU18.SAS:
data WORK.VIDU18 ;
%let _EFIERR_ = 0; /* set the ERROR detection macro variable */
infile 'D:\SAS2014\VIDU18.txt' delimiter='09'x MISSOVER DSD lrecl=32767 firstobs=2 ;
informat TUOI best32. ; informat VIEMVU best32. ; format TUOI best12. ; format VIEMVU best12. ; input
TUOI VIEMVU ;
PROC GENMOD DESC;
MODEL VIEMVU = TUOI /DIST = BIN LINK = LOGIT TYPE3;
RUN;
Trong đó: Thủ tục PROCEDURE GENMOD đƣợc sử dụng để phân tích hồi quy logit, DESC để chọn giá trị 1 đối với trƣờng hợp mắc bệnh ; Mô hình phân tích ảnh hƣởng của tuổi đẻ lần đầu (TUOI) đến bệnh viêm vú (VIEMVU), DIST = BIN phân bố nhị thức (0 hoặc 1 tƣơng ứng mắc bệnh hoặc không mắc bệnh), LINK = LOGIT mô hình sử dụng là mô hình logit, TYPE3 tính trực tiếp xác suất cho yếu tố tuổi (TUOI).
Kết quả từ SAS:
The GENMOD Procedure Model Information
Data Set WORK.MATITIS
Model Information
Link Function Logit
Dependent Variable VIEMVU
Observations Used 21
Response Profile
Ordered Value VIEMVU Total Frequency
1 1 11
2 0 10
PROC GENMOD is modeling the probability that VIEMVU='1'.
Criteria For Assessing Goodness Of Fit
Criterion DF Value Value/DF
Deviance 19 23.8416 1.2548 Scaled Deviance 19 23.8416 1.2548 Pearson Chi-Square 19 20.4851 1.0782 Scaled Pearson X2 19 20.4851 1.0782 Log Likelihood -11.9208 Algorithm converged.
Analysis Of Parameter Estimates
Parameter DF Estimate Standard Error Wald 95% Confidence Limits Chi-Square Pr > ChiSq
Intercept 1 6.7439 3.2640 0.3466 13.1412 4.27 0.0388
TUOI 1 -0.2701 0.1315 -0.5278 -0.0124 4.22 0.0399
Scale 0 1.0000 0.0000 1.0000 1.0000
NOTE: The scale parameter was held fixed.
LR Statistics For Type 3 Analysis
Source DF Chi-Square Pr > ChiSq
Trong đoa; Kết phân tích từ PROCEDURE GENMODE; Thông tin về mô hình phân tích; và cấu trúc số liệu; Hệ số hồi quy 0 = 6,7439 và 1 = -0,2701;
Xác suất P = 0,0223 nên kết luận tuổi đẻ lứa đầu có ảnh đến tỷ lệ mắc bệnh viêm vú ở bò.