1. Trang chủ
  2. » Giáo án - Bài giảng

Bài giảng Hồi quy logistic

66 647 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 66
Dung lượng 844 KB

Nội dung

Hồi quy logistics trong SPSSBiến độc lập là biến nhị giá... Tính tỷ số số chênh OR• Đo lường mức độ tác động giữa chủng ngừa BCG và bệnh phong – Bảng 2x2 – Hồi quy logistics • Đơn biến:

Trang 1

Hồi quy logistics

Trang 2

Đã học…

• Hồi quy

• Hồi quy logistic

Trang 3

Mục tiêu

• Trình bày được nguyên lý của hồi quy

logistic

• Trình bày được các bước xây dựng mô

hình hồi quy logistic

• Kiểm soát được các vấn đề khi thực hiện

hồi quy logistic

• Thực hiện được phân tích trên SPSS và

phiên giải kết quả

Trang 4

Nguyên lý của hồi quy logistics

Trang 5

Ví dụ 1

Trang 6

Ví dụ 1 (tt)

Tuyến tính?

Trang 7

Ví dụ 2

Tuyến tính?

Trang 8

Vấn đề

• Giá trị trục tung – y: đi từ 0 đến 1

• Giá trị ước lượng theo hồi quy tuyến tính

có thể nằm ra ngoài giá trị ý nghĩa

• Sai số không có phân phối chuẩn

Trang 9

Hồi quy logistics

• Hồi quy logistic được sử dụng khi biến phụ thuộc là

biến nhị giá

– Được đo lường bằng:

• Nguy cơ (risk), hoặc

• Số chênh (odds), hoặc

• Tỷ số số chênh (odds ratio)

– Các đo lường này có miền xác định: risk(0,1), Odds(0,+α) )

• Khi đó, mô hình y = a + bx

– với miền xác định của y là (-α; +α) không thích hợp để sử α) ; +α) ) không thích hợp để sử dụng.

Trang 10

Hồi quy logistics (tt)

• Vấn đề: biến đổi đo lường biến phụ thuộc để

Trang 11

Hồi quy logistics (tt)

Tình trạng

bệnh

Có chủng ngừa

Không chủng ngừa

Trang 12

Hồi quy logistics (tt)

• Sử dụng thuật toán logit

– Logit = ln(θ/1- θ)

• Như vậy:

– Logit = ln(Odds) = ln[p/(1 - p)] = a + bx

 Tính toán được OR

Trang 13

Hồi quy logistics (tt)

• Như vậy:

• Odds của x = 0 là:

• Odds của x = 1 là:

• Vậy OR được tính:

Trang 14

Như vậy

• Hồi quy logistics:

– Dùng cho biến phụ thuộc là biến nhị giá

– Giúp xác định:

• Số chênh

• Tỷ số số chênh

• Tỷ lệ đã hiệu chỉnh

Trang 15

Hồi quy logistics trong SPSS

Biến độc lập là biến nhị giá

Trang 16

Tính tỷ số số chênh OR

• Đo lường mức độ tác động giữa chủng

ngừa BCG và bệnh phong

– Bảng 2x2

– Hồi quy logistics

• Đơn biến: 1 biến độc lập

• Kết quả phần Block 1

Trang 17

Kết quả hồi quy logistics

• Kết quả 1: Omnibus Test of Model Coefficients

– Giả thuyết Ho: việc đưa biến độc lập vào mô hình là không có ý nghĩa

– Đối thuyết Ha: việc đưa biến độc lập vào mô hình là

có ý nghĩa

Omnibus Tests of Model Coefficients

84.352 1 000 84.352 1 000 84.352 1 000

Step Block Model Step 1

Chi-α; +α) không thích hợp để sử square df Sig.

Trang 18

Kết quả hồi quy logistics (tt)

• ln(odds) = -α; +α) không thích hợp để sử 0.933 – 1.49 x chủng ngừa BCG

• Như vậy

ln(Odds) = -α; +α) không thích hợp để sử 0.933 – 1.49 x 0 = -α; +α) không thích hợp để sử 0.933  Odds=0.393

ln(Odds) = -α; +α) không thích hợp để sử 0.933 – 1.49 x 1 = -α; +α) không thích hợp để sử 2.423  Odds=0.089

Hiểu như thế nào?

Variables in the Equation

-α; +α) không thích hợp để sử 1.490 180 68.221 1 000 225 158 321 -α; +α) không thích hợp để sử 933 081 131.286 1 000 393

Trang 19

Phiên giải thế nào?

• OR=0.089/0.393 = 0.225

• Người được tiêm chủng BCG có nguy cơ mắc bệnh phong chỉ vào khoảng 22,5% so với người không tiêm BCG

Trang 21

Hồi quy logistics trong SPSS

Biến độc lập là biến thứ bậc

Trang 22

Tính tỷ số số chênh (1)

• Đo lường mối liên quan giữa bệnh phong và tuổi

• Giả định tính khuynh hướng của tuổi: sự khác biệt giữa

các lớp tuổi kế cận nhau là giống nhau:

• Mô hình: y = logit = ln(Odds) = ln[p/(1 -α; +α) không thích hợp để sử p)] = α) + βx + ε x + ε

Trang 24

Phiên giải kết quả

• So với nhóm tuổi nhỏ hơn, nhóm tuổi lớn hơn kề bên sẽ bị nguy cơ bị bệnh phong tăng gấp 1.463 lần

Variables in the Equation

Trang 25

Phiên giải kết quả (tt)

Trang 26

Tính tỷ số số chênh (2)

• Đo lường mối liên quan giữa bệnh phong và tuổi

• Không giả định tính khuynh hướng của tuổi:

y = logit = ln(Odds) = ln[p/(1 -α; +α) không thích hợp để sử p)] = α) + βx + ε 1x1 + βx + ε 2x2 + βx + ε 3x3 + βx + ε 4x4 + βx + ε 5x5 + ε

– x=0 (không nằm trong nhóm tuổi x)

– x=1 (nằm trong nhóm tuổi x)

• Biến giả (dummy variables): chọn indicator

để define categorical covariates

Trang 27

Kết quả

• OR của nhóm tuổi 15/24 và nhóm tuổi 24/34 là

không có ý nghĩa thống kê (hay hệ số hồi quy B trong 2 nhóm này không có ý nghĩa)

Variables in the Equation

Trang 28

Hồi quy logistics trong SPSS

Biến độc lập là biến danh định

Trang 29

Tương tự biến thứ bậc

Không có giả định tính khuynh hướng

Trang 30

Hồi quy logistics trong SPSS

Biến độc lập là biến định lượng

Trang 32

Thực hành 1

• Sử dụng bộ số liệu lowbtw, biến phụ thuộc quan

tâm: lowbtw (nhẹ cân: 0-α; +α) không thích hợp để sử không nhẹ cân, 1-α; +α) không thích hợp để sử nhẹ cân)

Trang 33

Hồi quy logistics đa biến Nhiều biến độc lập trong mô hình

Trang 34

Mô hình

• Biến phụ thuộc: bệnh phong

• Biến độc lập: chủng ngừa BCG

Trang 36

Xem xét

• Thay đổi của hệ số hồi quy

• Thay đổi của OR hiệu chỉnh và OR thô

Ngoài ra

– Thay đổi của -α; +α) không thích hợp để sử 2loglikelihood

– Giá trị p của biến thứ 3

– Kết quả của kiểm định Hosmer-α; +α) không thích hợp để sử Lemeshow

Trang 37

Xem xét (tt)

• Thay đổi của hệ số hồi quy (B)

– B mô hình 1: -α; +α) không thích hợp để sử 1.49

– B mô hình 2: -α; +α) không thích hợp để sử 1.194

– Tỷ số của hệ số hồi quy: 1.194/1.49 = 0.80

(thay đổi nhiều)

– “Nhiều”? Thay đổi >1%

Trang 39

Xem xét (tt)

• -α; +α) không thích hợp để sử 2loglikelihood

– Mô hình cũ: 1176.663

– Mô hình mới: 1152.028

– Thay đổi 1176.663-α; +α) không thích hợp để sử 1152.028=24.635

– Thay đổi của df = 2-α; +α) không thích hợp để sử 1=1

– Χ2(24.635,1)

Trang 40

Xem xét (tt)

• Giá trị p của biến thứ 3:

– p=0.000 (p<0.001)

– Rất nhỏ

Trang 42

Sử dụng thông tin nào?

• Biến thứ 3 là biến nhị giá hay không?

• Mô hình tiên đoán hay mô hình giải thích?

Trang 43

Giới có phải là nhiễu/tương tác?

• Nếu không là biến nhiễu, có phải là tương tác không?

Trang 44

Đưa biến tương tác vào mô hình

• Lưu ý:

– Phải có biến gốc

Trang 45

Kết quả

• Xem xét giá trị p của tương tác

Trang 46

Học vấn là nhiễu/tương tác?

Trang 47

Học vấn là nhiễu/tương tác?

Trang 48

Tiếp xúc phong u, phong củ

Trang 49

Đưa nhiều biến vào mô hình

Trang 50

Mô hình đa biến

Trang 51

Đưa biến số vào mô hình

• Enter: Kết quả cho một mô hình duy nhất

bao gồm tất cả các biến đã được lựa chọn

• Forward: lần lượt đưa dần từng biến độc

lập vào mô hình và sẽ giữ chúng lại nếu như biến đó có ý nghĩa thống kê

Trang 52

Đưa biến số vào mô hình (tt)

• Backward: đưa toàn bộ các biến độc lập vào mô

hình sau đó bỏ dần từng biến không có ý nghĩa

thống kê

• Stepwise: kết hợp 2 phương pháp forward và

backward, tại mỗi một bước phương pháp này sẽ tính toán để đưa vào hoặc loại ra các biến độc lập sau khi có sự xuất hiện của các biến khác

Trang 53

Mô hình: tuổi, học vấn, tiếp xúc phong u, phong củ

Trang 54

Kết quả

Trang 55

Mô hình: tuổi, học vấn, tiếp xúc phong u, phong củ

Trang 56

Kết quả

Trang 57

Có nên đưa biến giới vào không?

Trang 58

Vấn đề đưa biến số vào mô hình

• Mô hình giải thích hay mô hình tiên đoán?

Trang 59

Vấn đề đưa biến số vào mô hình (tt)

• Thực hiện backward selection

– Đưa các biến độc lập chính, các biến

nhiễu/tương tác vào mô hình

– Giữ lại trong mô hình những biến có p<0.2

Cần lưu ý ý nghĩa y sinh học của biến số!

Trang 60

So sánh mô hình

• Sử dụng likelihood ratio test:

– Mô hình A nằm trong mô hình B (nested

models)

– Sử dụng giá trị -α; +α) không thích hợp để sử 2log likelihood

– Chênh lệch bậc tự do giữa 2 mô hình

– Kiểm định Khi bình phương sự chênh lệch 2 giá trị -α; +α) không thích hợp để sử 2log likelihood

Trang 61

Ví dụ

• Mô hình không có biến số “giới”

• Mô hình có biến số “giới”

Trang 62

Tóm tắt

• Hồi quy logistics sử dụng khi đo lường

mức độ tác động OR

• Lưu ý các loại biến số độc lập khác nhau

• Việc đưa các biến số vào mô hình đòi hỏi nhiều thời gian, cân nhắc ý nghĩa y sinh học, ý nghĩa thống kê của biến số.

Trang 63

Trình bày và phiên giải???

Trang 66

Ghi nhớ

• Nguyên lý của hồi quy logistics

• Cách viết phương trình hồi quy, tính toán

và lý giải các giá trị: Odds, OR, p

• Nhiễu và tương tác trong hồi quy logistics

• Hồi quy đa biến – trình bày và phiên giải

Thực hành!!!!

Ngày đăng: 13/11/2016, 16:31

TỪ KHÓA LIÊN QUAN

w