MÔ HÌNH HỒI QUY LOGISTIC ĐA BIẾN

Một phần của tài liệu hồi quy logistic và ứng dụng (Trang 29)

Các yếu tố có thể làm tăng nguy cơ tử vong khi nhiễm trùng huyết là tuổi bệnh nhân, hạ huyết áp, procalcitonin hoặc suy giảm miễn dịch… Trong bài toán này ta chỉ xét đến ba yếu tố: procalcitonin, hạ huyết áp và tuổi bệnh nhân. Thông tin của 30 bệnh nhân nhiễm trùng huyết bao gồm: age (tuổi), hypotension (hạ huyết áp), procalcitonin (ng/ml) và death (tử vong). Tìm mô hình thể hiện mối quan hệ giữa nguy cơ tử vong khi nhiễm trùng huyết với các yếu tố trên. Dữ liệu của 30 bệnh nhân được trình bày trong Phụ lục 2 (số liệu được trích từ giáo trình Thống kê dự báo).

2.3.1 Tiến hành phân tích

a)Mã hóa dữ liệu

Nhập dữ liệu vào SPSS với biến age, hypotension, procalcitonin là các biến độc lập và biến death là biến phụ thuộc.

Biến death mã hóa dưới dạng nhị phân như sau: death1 nếu bệnh nhân tử vong và death0 nếu bệnh nhân không tử vong.

Vì biến phụ thuộc death là dữ liệu nhị phân nên ta dùng mô hình hồi quy Logistic đa biến để thể hiện mối liên hệ giữa death và các biến age, hypotension, procalcitonin.

25

b)Trình tự thực hiện

Tại cửa sổ dữ liệu trên thanh menu chọn: Analyze > Regression > Binary Logistic. Ta được hộp thoại Logistic regression.

26

Chọn biến phụ thuộc (death) đưa vào khung Dependent. Lưu ý chỉ chọn biến có hai biểu hiện, nếu biến chúng ta chọn không có hai biểu hiện thì thì thủ tục này không thực hiện được.

Chọn các biến độc lập (age, hypotension, procalcitonin) đưa vào khung Covariates.

Trong nút Method ta chọn các phương pháp đưa biến độc lập vào mô hình. Điều kiện đưa vào căn cứ số thống kê likelihood-ratio (tỷ lệ thích hợp) hay số thống kê Wald. Ta có các phương pháp sau:

Enter: đưa vào bắt buộc, các biến trong khối biến độc lập được đưa vào trong một bước.

Forward (Conditional): là phương pháp đưa vào dần theo điều kiện. Nó kiểm tra việc loại biến căn cứ trên xác suất của số thống kê Likelihood-ratio dựa trên những ước lượng thông số có điều kiện.

Forward (LR): là phương pháp đưa vào dần kiểm tra việc loại biến căn cứ trên xác suất của có thống kê Likelihood-ratio dựa trên ước lượng khả năng xảy ra tối đa (maximum-likelihood estimates).  Forward (Wald): là phương pháp đưa vào dần kiểm tra việc loại

biến căn cứ trên xác suất của số thống kê Wald.

Backwald (Condition): là phương pháp loại trừ dần theo điều kiện. Nó kiểm tra việc loại biến căn cứ trên xác suất của số thống kê Likelihood-ratio dựa trên những ước lượng thông số có điều kiện.  Backwald (LR): là phương pháp loại trừ dần kiểm tra loại biến căn

cứ trên xác suất của số thông kê Likelihood-ratio dựa trên ước lượng khả năng xảy ra tối đa.

Backwald (Wald): là phương pháp loại trừ dần kiểm tra việc loại biến căn cứ trên xác suất của số thông kê Wald.

 Tuy nhiên, chúng ta thường sử dụng chế độ mặc định là phương pháp Enter.

27

Nhấp Options để mở hộp thoại Options. Trong hộp thoại này, ta chọn

Classification plots (đồ thị phân loại giá trị thực và giá trị dự đoán),

Hosmer-Lemeshow goodness of fit (Bảng giá trị ngẫu nhiên của giá trị quan sát và kỳ vọng) và CI for exp(B) (khoảng tin cậy của tỷ số odds) trong phần Statistics and Plots. Sau đó nhấp Continue trở về hộp thoại ban đầu.

Muốn tính được giá trị dự đoán, là xác suất mà một bệnh nhân sẽ mắc tử vong (biến phụ thuộc Y), ta nhấp Probabilities trong khung Predit value

28 Cuối cùng nhấp OK để thực hiện lệnh.

2.3.2 Đọc kết quả phân tích

Sau khi thực hiện các bước trên, kết quả xuất hiện với rất nhiều bảng. Chúng ta chỉ chú ý phân tích các bảng sau:

Bảng 2.6: Omnibus Tests of Model Coefficients

Chi-square df Sig.

Step 1 Step 26.962 3 .000

Block 26.962 3 .000

Model 26.962 3 .000

Bảng 2.6 cho ta kết quả của kiểm định độ phù hợp tổng thể của mô hình với giả thiết H:0 1 0 và đối thiết H : ít nhất một hệ số khác 0. Kết quả của bảng này cho thấy giá trị Sig.0.000  0.05 nên ta bác bỏ giả thiết. Vì vậy có sự liên hệ giữa biến death và ít nhất một trong các biến

age, hypotension, procalcitonin.

Bảng 2.7: Model Summary Step -2 Log likelihood Cox & Snell R Square Nagelkerke R Square 1 14.627(a) .593 .791

Bảng 2.7 cho thấy kết quả kiểm tra độ phù hợp của mô hình. Ta thấy giá trị 2 LL14.627 không cao nên ta có thể kết luận mô hình có độ phù hợp rất tốt.

Bảng 2.8: Contingency Table for Hosmer and Lemeshow Test

tu vong = khong tu vong = chet Total Observed Expected Observed Expected

Step 1 1 3 2.832 0 .168 3 2 3 2.827 0 .173 3 3 2 2.814 1 .186 3 4 3 2.785 0 .215 3 5 3 2.743 0 .257 3 6 0 .249 3 2.751 3 7 1 .219 2 2.781 3 8 0 .198 3 2.802 3 9 0 .185 3 2.815 3 10 0 .148 3 2.852 3

Bảng 2.8 thể hiện các giá trị quan sát, nó giúp ta kiểm tra dữ liệu nhập vào có chính xác hay không. Ở đây, ta thấy dữ liệu đã được nhập chính xác.

29 Bảng 2.9: Classification Table Observed Predicted tu vong Percentage Correct khong chet

Step 1 tu vong khong 14 1 93.3

chet 1 14 93.3

Overall Percentage 93.3

Mức độ chính xác của dự báo thể hiện qua Bảng 2.9. Bảng này cho thấy trong 15 bệnh nhân không tử vong thì mô hình dự đoán đúng 14 bệnh nhân với tỷ lệ đoán đúng là 93.3% và trong 15 bệnh nhân tử vong thì mô hình dự đoán đúng 14 bệnh nhân với tỷ lệ đoán đúng là 93.3%. Vì vậy, trong 30 bệnh nhân được xem xét thì mô hình dự đoán đúng 28 bệnh nhân, từ đó ta tính được tỷ lệ dự đoán đúng của toàn bộ mô hình là 93.3%.

Bảng 2.10: Variables in the Equation

B S.E. Wald df Sig. Exp(B) 95.0% C.I.for EXP(B) Lower Upper Step 1 age .013 .058 .049 1 .825 1.013 .904 1.135 hypotension 4.915 1.968 6.240 1 .012 136.326 2.882 6447.900 procalcitonin .137 1.875 .005 1 .942 1.147 .029 45.204 Constant -3.232 2.634 1.506 1 .220 .039

 Bảng 2.10 thể hiện kết quả của kiểm định Wald (kiểm định giả thuyết hồi quy khác 0). Nếu hệ số hồi quy 0 và k đều bằng 0 thì tỷ lệ chênh lệch giữa các xác suất sẽ bằng 1, tức xác suất để sự kiện xảy ra hay không xảy ra như nhau, lúc đó mô hình hồi quy không có tác dụng dự đoán.

Đối với hồi quy tuyến tính sử dụng kiểm định T để kiểm định giả thuyết H:k 0, k 1,3. Còn đối với hồi quy Binary Logistic, đại lượng Wald Chi Square được sử dụng để kiểm định ý nghĩa thống kê của hệ số hồi quy tổng thể.

Kết quả Bảng 2.10 cho thấy chỉ có hệ số của biến hypotension có . 0.012 0.05

sig    nên ta bác bỏ giả thiết. Còn các biến age có . 0.825 0.05

sig    và biến procalcitoninsig.0.942  0.05 nên ta chấp nhận giả thiết, tức là các hệ số này không có ý nghĩa thống kê.

Như vậy chỉ có biến hypotension có ý nghĩa thống kê trong mô hình, còn các biến ageprocalcitonin không có ý nghĩa thống kê trong mô hình.

30

 Mô hình được xây dựng là

ln 3.232 4.915 1 p hypotension p          

Trong đó, p là xác suất để death1.

Từ mô hình ta thấy yếu tố hạ huyết áp làm tăng khả năng tử vong khi nhiễm trùng huyết. Cụ thể là tác động biên của yếu tố hypotension lên khả năng tử vong khi nhiễm trùng huyết xác định với xác suất ban đầu bằng 0.5 thì tác động này bằng 0.5 1 0.5 4.915 1.229    .  Ta có 1 p odds p

 nên từ mô hình hồi quy ta được

 

exp 3.232 4.915

odds   hypotension

Tỷ số odds của biến hypotension là:

3.232 4.915 3.232 OR e 136.326 e      thuộc

khoảng ước lượng C.I.for EXP(B) là (2.882 ; 6447.900).

Sai số chuẩn của hệ số tự do  0 là 2.634. Khoảng ước lượng của

0

 với mức ý nghĩa 5% là

3.232 1.96 2.634; 3.232 1.96 2.634       8.395; 1.931 

Sai số chuẩn của biến hypotension  2 là 1.464. Khoảng ước lượng của 2 với mức ý nghĩa 5% là

5.278 1.96 1.464; 5.278 1.96 1.464      2.40856; 8.14744.

Vậy một bệnh nhân bị hạ huyết áp thì bệnh nhân này sẽ tử vong khi nhiễm trùng huyết với xác suất là:

3.232 4.915 1 3.232 4.915 1 0.843 1 e p e          .

Từ mô hình hồi quy ta thấy bệnh nhân trên có nguy cơ tử vong khi bị nhiễm trùng huyết với xác suất là 84.3% nhưng đây chỉ là xác suất dự báo và xác suất này chỉ chính xác suất có 93.3%.

31

CHƢƠNG 3

ỨNG DỤNG CỦA MÔ HÌNH HỒI QUY LOGISTIC

3.1 GIỚI THIỆU

Dự báo là một lĩnh vực khoa học được dùng phổ biến trong thống kê, trên cơ sở phân tích khoa học về các dữ liệu đã thu thập được. Hồi quy Logistic cũng là một trong những công cụ quan trọng của lĩnh vực dự báo trong thống kê. Trong thực tế có rất nhiều lĩnh vực ứng dụng hồi quy Logistic chẳng hạn như y học, kinh tế, xã hội, giáo dục,…

Chương 3 sẽ giới thiệu một số ứng dụng của mô hình hồi quy Logistic trong thực tiễn. Cụ thể là các ứng dụng về y học, xã hội và giáo dục. Các ứng dụng trong chương này đều được xử lý trên phần mềm SPSS.

Một phần của tài liệu hồi quy logistic và ứng dụng (Trang 29)

Tải bản đầy đủ (PDF)

(68 trang)