• Mô tả mối liên quan giữa biến outcome và biến tiên lượng • Kiểm soát các biến nhiễu (Controlling for confounders). • Phát triển mô hình tiên lượng (Developing prognostic models).[r]
(1)Tuan V Nguyen
Senior Principal Research Fellow, Garvan Institute of Medical Research Professor, UNSW School of Public Health and Community Medicine
Professor of Predictive Medicine, University of Technology Sydney Adj Professor of Epidemiology and Biostatistics,
School of Medicine Sydney, University of Notre Dame Australia
(2)Mơ hình hồi qui logistic (logistic regression)
• Ví dụ dẫn nhập
(3)(4)The Challenger shuttle disaster
Flight Temp Damage
STS-1 66
STS-2 70
STS-3 69
STS-4 80
STS-5 68
STS-6 67
STS-7 72
STS-8 73
STS-9 70
STS 41B 57
STS 41C 63
STS 41D 70
STS 41G 78
STS 51A 67
STS 51C 53
STS 51D 67
Flight Temp Damage
STS 51B 75
STS 51G 70
STS 51F 81
STS 51I 76
STS 51J 79
STS 61A 75
STS 61B 76
STS 61C 58
(5)Nghiên cứu bệnh tiểu đường (type diabetes)
• Nghiên cứu cắt ngang 3155 cá nhân • Outcome: chẩn đốn tiểu đường
• Yếu tố nguy cơ: tuổi, giới tính, huyết áp, vịng eo, vịng mơng, cân nặng, tỉ trọng thể (BMI)
• Câu hỏi 1: BMI có liên quan đến bệnh tiểu đường? • Câu hỏi 2: Yếu tố có liên quan đến tiểu đường?
(6)> db = read.csv("~/Dropbox/_Conferences and Workshops/Dai hoc Duoc 6-2019/Datasets/Diabetes data.csv", header=T)
> head(db)
id age gender height weight waist hip sysbp diabp active hypertension
1 76 Female 163 53 90 93 160 90
2 40 Female 149 51 74 94 100 60
3 51 Female 151 55 91 100 120 80
4 43 Female 158 62 78 96 120 80
5 72 Female 148 47 91 95 130 60
6 44 Male 155 48 69 86 120 80
bmi whr diabetes
(7)Gian lận thẻ tín dụng (credit card)
• Nghiên cứu cắt ngang 284807 transactions • Outcome: gian lận (yes / no)
• Yếu tố nguy cơ: Time, Amount, V1-V28
(8)2019/Datasets/Credit card data.csv", header=T)
> head(cc, 3)
Time V1 V2 V3 V4 V5 V6 -1.359807 -0.07278117 2.5363467 1.3781552 -0.33832077 0.46238778 1.191857 0.26615071 0.1664801 0.4481541 0.06001765 -0.08236081 -1.358354 -1.34016307 1.7732093 0.3797796 -0.50319813 1.80049938
V7 V8 V9 V10 V11 V12 0.23959855 0.09869790 0.3637870 0.09079417 -0.5515995 -0.61780086 -0.07880298 0.08510165 -0.2554251 -0.16697441 1.6127267 1.06523531 0.79146096 0.24767579 -1.5146543 0.20764287 0.6245015 0.06608369
V13 V14 V15 V16 V17 V18 -0.9913898 -0.3111694 1.4681770 -0.4704005 0.2079712 0.02579058 0.4890950 -0.1437723 0.6355581 0.4639170 -0.1148047 -0.18336127 0.7172927 -0.1659459 2.3458649 -2.8900832 1.1099694 -0.12135931
V19 V20 V21 V22 V23 V24 0.403993 0.25141210 -0.01830678 0.2778376 -0.1104739 0.06692808 -0.145783 -0.06908314 -0.22577525 -0.6386720 0.1012880 -0.33984648 -2.261857 0.52497973 0.24799815 0.7716794 0.9094123 -0.68928096
(9)Đặc tính nghiên cứu
• Outcome (dependent) variable: biến nhị phân (binary variable), có 2 giá trị
• Predictor (independent) variables: đa dạng (nhị phân, biến liên tục)
(10)Ứng dụng mô hình hồi qui logistic
• Mơ tả mối liên quan biến outcome biến tiên lượng • Kiểm soát biến nhiễu (Controlling for confounders)