Hồi quy logistic

Một phần của tài liệu giáo trình phân tích số liệu SAS (Trang 112 - 115)

Hồi quy logistic có thể sử dụng để đánh giá ảnh hƣởng của yếu tố nghiên cứu đến tỷ lệ mắc bệnh. Trong trƣờng này biến phụ thuộc là biến định tính và biến độc lập là biến liên tục. Ví dụ dƣới đây minh họa việc sử dụng mô hình hồi quy logit để phân tích số liệu định tính.

Ví dụ 2.18: Một thí nghiệm nhằm nghiên cứu ảnh hƣởng của tuổi đẻ lần đầu (tháng) đến tỷ lệ viêm vú ở bò. Số liệu thu thập trên 21 bò về tình trạng viêm vú (0: không mắc bệnh và 1: mắc bệnh) nhƣ sau: Bò số 1 2 3 4 5 6 7 8 9 10 11 Tuổi (tháng) 19 20 20 20 21 21 21 22 22 22 23 Viêm vú 1 1 0 1 0 1 1 1 1 0 1 Bò số 12 13 14 15 16 17 18 19 20 21 Tuổi (tháng) 26 27 27 27 27 29 30 30 31 32 Viêm vú 1 0 1 0 0 1 0 0 0 0

Số liệu có thể phân tích theo phƣơng trình hồi quy logistic sau: log[pi /(1-pi)] = β0 + β1xi

xi: tuổi đẻ lần đầu của bò thứ i,

0: hệ số tung độ gốc,

1: hệ số góc.

Số liệu có thể nhập vào file VIDU18.XLS định dạng excel sau đó chuyển file VIDU18.TXT định dạng txt với 2 cột lần lƣợt là tuần tuổi (TUAN) và khối lƣợng của gà Hồ (KL).

SAS code của VIDU18.SAS:

data WORK.VIDU18 ;

%let _EFIERR_ = 0; /* set the ERROR detection macro variable */

infile 'D:\SAS2014\VIDU18.txt' delimiter='09'x MISSOVER DSD lrecl=32767 firstobs=2 ;

informat TUOI best32. ; informat VIEMVU best32. ; format TUOI best12. ; format VIEMVU best12. ; input

TUOI VIEMVU ;

PROC GENMOD DESC;

MODEL VIEMVU = TUOI /DIST = BIN LINK = LOGIT TYPE3;

RUN;

Trong đó:  Thủ tục PROCEDURE GENMOD đƣợc sử dụng để phân tích hồi quy logit, DESC để chọn giá trị 1 đối với trƣờng hợp mắc bệnh ;  Mô hình phân tích ảnh hƣởng của tuổi đẻ lần đầu (TUOI) đến bệnh viêm vú (VIEMVU), DIST = BIN phân bố nhị thức (0 hoặc 1 tƣơng ứng mắc bệnh hoặc không mắc bệnh), LINK = LOGIT mô hình sử dụng là mô hình logit, TYPE3 tính trực tiếp xác suất cho yếu tố tuổi (TUOI).

Kết quả từ SAS:

The GENMOD Procedure Model Information

Data Set WORK.MATITIS

Model Information

Link Function Logit

Dependent Variable VIEMVU

Observations Used 21

Response Profile

Ordered Value VIEMVU Total Frequency

1 1 11

2 0 10

PROC GENMOD is modeling the probability that VIEMVU='1'.

Criteria For Assessing Goodness Of Fit

Criterion DF Value Value/DF

Deviance 19 23.8416 1.2548 Scaled Deviance 19 23.8416 1.2548 Pearson Chi-Square 19 20.4851 1.0782 Scaled Pearson X2 19 20.4851 1.0782 Log Likelihood -11.9208 Algorithm converged.

Analysis Of Parameter Estimates

Parameter DF Estimate Standard Error Wald 95% Confidence Limits Chi-Square Pr > ChiSq

Intercept 1 6.7439 3.2640 0.3466 13.1412 4.27 0.0388

TUOI 1 -0.2701 0.1315 -0.5278 -0.0124 4.22 0.0399

Scale 0 1.0000 0.0000 1.0000 1.0000

NOTE: The scale parameter was held fixed.

LR Statistics For Type 3 Analysis

Source DF Chi-Square Pr > ChiSq

Trong đoa;  Kết phân tích từ PROCEDURE GENMODE;  Thông tin về mô hình phân tích; và  cấu trúc số liệu;  Hệ số hồi quy 0 = 6,7439 và 1 = -0,2701; 

Xác suất P = 0,0223 nên kết luận tuổi đẻ lứa đầu có ảnh đến tỷ lệ mắc bệnh viêm vú ở bò.

Một phần của tài liệu giáo trình phân tích số liệu SAS (Trang 112 - 115)

Tải bản đầy đủ (PDF)

(171 trang)