1. Trang chủ
  2. » Thể loại khác

SURVIVAL ANALYSIS trong Stata

50 48 3

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Kết cục phân tích sống cịn gọi failure Nếu bệnh nhân đến hết trình nghiên cứu xảy kết cục gọi failure Nếu bệnh nhân không xảy kết cục thời gian nghiên cứu gọi “censored” THIẾT LẬP SURVIVAL-TIME DATA stset time, failure(aids) id(case) id: failure event: case obs time interval: aids != & aids < exit on or before: (time[_n-1], time] failure -51 total observations exclusions -51 observations remaining, representing 51 subjects 25 failures in single-failure-per-subject data 3,164 total analysis time at risk and under observation at risk from t = earliest observed entry t = last observed exit t = 97 Trong lệnh stset, biến time biến đo lường thời gian Option failure biến quy định bệnh nhân failed (1) censored (0) Option id dùng để xác định biến ID liệu Sau sử dụng stset, dùng lệnh save để lưu liệu Có thể dùng lệnh stset với option fa(var==1) quy định giá trị death ==1 MÔ TẢ BỘ DỮ LIỆU TIME-EVENT DATA stdes failure _d: aids analysis time _t: time id: case | per subject | Category total mean median max -no of subjects 51 no of records 51 (first) entry time (final) exit time subjects with gap time on gap if gap time at risk failures 1 1 0 0 62.03922 67 97 0 3164 62.03922 67 97 25 4901961 0 Mơ tả liệu survival biến failure aids, biến time biến thời gian, case biến id Failure = 25 số trường hợp có outcome kết thúc thời gian nghiên cứu Exit time: thời gian kết thúc nghiên cứu Thời gian kết thúc trung bình 62.03 tháng, thời gian ngắn tháng có failure, thời gian dài 97 tháng có failure stsum failure _d: aids analysis time _t: time id: case | incidence | time at risk rate no of subjects | Survival time -| 25% 50% 75% -+ total | 3164 0079014 51 41 81 Tổng thời gian nguy (time at risk) thời gian tổng đối tượng từ tham gia đến kết thúc nghiên cứu Vì có 25 ca failure nên inciden rate 25/3164 = 0.007 Phần bên phải mô tả hàm phân phối sống cịn Kaplan-Meier Hàm ước lượng có 25% khả bệnh nhân mắc AIDS vòng 41 tháng sau chẩn đoán, 50% khả mắc AIDS vòng 81 tháng Xác suất bệnh nhân mắc AIDS không đạt đến 75% thời gian cao 97 tháng, khơng có khoảng phân vị 75% CHUYỂN COUNT-TIME DATA THÀNH SURVIVAL-TIME DATA Trong trường hợp có số liệu gồm biến time, failure số ca có outcome censored số ca khơng có outcome, gọi số liệu count-time data Chúng ta phải chuyển liệu thành dạng survival-time data Lệnh ctset quy định hours biến thời gian, failures biến số ca có outcome censored biến số ca khơng có outcome Thứ tự lệnh phải time, failure censored, không đổi khác Lệnh cttost tự động chuyển count-time data thành survival-time data ctset failtime fail dataset name: time: http://www.stata-press.com/data/r13/ctset1.dta failtime no fail: fail no lost: (meaning lost) no enter: (meaning all enter at time 0) Tuyên bố liệu count-time data ctset failtime fail, by(bearings) dataset name: time: http://www.stata-press.com/data/r13/ctset2.dta failtime no fail: fail no lost: (meaning lost) no enter: (meaning all enter at time 0) by: bearings Tuyên bố liệu count-time data theo phân nhóm biến bearings ctset failtime fail censored, by(bearings) dataset name: time: http://www.stata-press.com/data/r13/ctset3.dta failtime no fail: fail no lost: censored no enter: by: (meaning all enter at time 0) bearings Tuyên bố liệu count-time data theo phân nhóm có biến censored Tuyên bố liệu count-time data biến time thời gian, biến fail tình trạng fail, biến cens tình trạng mẫu biến ent thể số bệnh nhân tham gia vào nghiên cứu thời điểm khác (điều xảy nghiên cứu mà đối tượng không tham gia từ đầu) ct dataset name: time: http://www.stata-press.com/data/r13/cttost.dta time no fail: ndead no lost: ncens no enter: by: (meaning all enter at time 0) agecat treat Tuyên bố liệu count-time data list * + -+ | agecat treat time ndead ncens | | -| | 464 | | 268 | | 638 | | 803 | | 431 | | -| cttost failure event: obs time interval: exit on or before: weight: ndead != & ndead < (0, time] failure [fweight=w] -33 total observations exclusions -33 physical observations remaining, equal to 82 weighted observations, representing 39 failures in single-record/single-failure data 48726 total analysis time at risk and under observation at risk from t = earliest observed entry t = last observed exit t = 1227 Chuyển số liệu count-time thành survival time list agecat treat time ndead ncens + -+ | agecat treat time ndead ncens | | -| | 329 | | 353 | | 365 | | 377 | | 377 | | -| TÍNH HÀM SỐNG CÒN BẰNG BẢNG SỐNG list + + | group t died | | | | 143 | | 164 | | 188 | | 188 | | 190 | | | Bộ số liệu survival time ltable t died if group==1 Beg Interval Total Std Deaths Lost Survival Error [95% Conf Int.] 143 144 19 0.9474 0.0512 0.6812 0.9924 164 165 18 0.8947 0.0704 0.6408 0.9726 188 189 17 0.7895 0.0935 0.5319 0.9153 190 191 15 0.7368 0.1010 0.4789 0.8810 192 193 14 0.6842 0.1066 0.4279 0.8439 206 207 13 0.6316 0.1107 0.3790 0.8044 209 210 12 0.5789 0.1133 0.3321 0.7626 213 214 11 0.5263 0.1145 0.2872 0.7188 216 217 10 1 0.4709 0.1151 0.2410 0.6713 220 221 0.4120 0.1148 0.1937 0.6194 227 228 0.3532 0.1125 0.1502 0.5648 230 231 0.2943 0.1080 0.1105 0.5070 234 235 0.2355 0.1012 0.0751 0.4459 244 245 0.2355 0.1012 0.0751 0.4459 246 247 0.1570 0.0931 0.0312 0.3721 265 266 0.0785 0.0724 0.0056 0.2864 304 305 1 0.0000 Bảng sống cho nhóm Survival rate báo cáo bảng sống survival rates cuối thời khoảng Do đó, 94,7% chuột cịn sống từ ngày 144 trở Tiên đoán survival time cho đối tượng cụ thể stcox age ndrugtx treat site c.age#i.site, nohr basesurv(surv0) failure _d: analysis time _t: censor time Iteration 0: log likelihood = -2868.555 Iteration 1: log likelihood = -2851.487 Iteration 2: log likelihood = -2850.8935 Iteration 3: log likelihood = -2850.8915 Refining estimates: Iteration 0: log likelihood = -2850.8915 Cox regression Breslow method for ties No of subjects = 610 No of failures = 495 Time at risk = 142994 Log likelihood = -2850.8915 Number of obs = 610 LR chi2(5) = 35.33 Prob > chi2 = 0.0000 -_t | Coef Std Err z P>|z| [95% Conf Interval] -+ -age | -.0336943 0092913 -3.63 0.000 -.051905 -.0154837 ndrugtx | 0364537 0077012 4.73 0.000 0213597 0515478 treat | -.2674113 0912282 -2.93 0.003 -.4462153 -.0886073 site | -1.245928 5087349 -2.45 0.014 -2.24303 -.2488262 0337728 0155087 2.18 0.029 0033764 0641693 | site#c.age | | - generate surv1 = surv0^exp( (-0.0336943*30+0.0364537*5 - 0.2674113)) (18 missing values generated) line surv1 _t, sort ylab(0 to 1) xlab(0 200 to 1200) surv1 0 200 400 600 _t 800 1000 1200 Tiên đốn đường sống cịn cho đối tượng cụ thể Ví dụ người 30 tuổi (age=30), có số thuốc sử dụng trước (ndrugtx=5) điều trị dài hạn (treat=1) nơi A (site=0 agesite=30*0=0) Đầu tiên phải tạo hàm sống cịn cho mơ hình đồng biến tất predictor thiết lập =0 (surv0) Sau nâng hàm sống cịn lên cách lấy mũ kết hợp tuyến tính hệ số giá trị đồng biến số mơ hình đồng biến tính Do để tính thời gian sử dụng lại thuốc đối tượng tính -0.0336943*30+0.0364537*5 - 0.2674113*1 - 1.245928*0 - 0337728*0 generate surv2 = surv0^exp( (-0.0336943*30+0.0364537*5)) (18 missing values generated) label variable surv1 "long treatment" label variable surv2 "short treatment" line surv1 surv2 _t, sort ylab(0 to 1) xlab(0 200 to 1200) drop surv0-surv2 200 400 600 _t long treatment 800 1000 1200 short treatment Tiên đốn đường sống cịn cho đối tượng cụ thể hai nhóm khác Ví dụ người 30 tuổi (age=30), có số thuốc sử dụng trước (ndrugtx=5) điều trị ngắn hạn (treat=0) nơi A (site=0 agesite=30*0=0) Hàm sống cịn bệnh nhân nhóm điều trị ngắn hạn surv2 Đối với bệnh nhân nhóm điều trị ngắn hạn hàm sống cịn nhóm tính -0.0336943*30+0.0364537*5 Từ đồ thị cho thấy thời gian sử dụng lại thuốc nhóm ngắn nhóm dài hồn tồn khác MƠ HÌNH WEIBULLVÀ MƠ HÌNH MŨ Vẽ đồ thị với ln(S(t)) Sau chạy Kapla-Meier M ước lượng cho hàm sống sót S(t), kiểm tra phân phối hàm sống sót Chúng ta tạo biến S hàm sống sót sau KM model Sau tạo ln(S) Đồ thị cho thấy ln(S) có phân phối tuyến tính Điều cho thấy hàm sống sót có phân phối lũy thừa (hazard định theo thời gian), thích hợp để chạy hồi quy lũy thừa (exponential regression) Chạy mơ hình expotential model streg age, dist(exponential) nolog noshow Exponential regression log relative-hazard form No of subjects = 51 = 51 No of failures = 25 = 0.0372 Time at risk = 3164 LR chi2(1) Log likelihood _t = 4.34 Std Err 1.074414 _cons = -59.996976 Haz Ratio age Number of obs 0006811 Prob > chi2 z P>z 0349626 2.21 0007954 -6.24 [95% Conf Interval] 0.027 1.008028 1.145172 0.000 000069 0067191 Chạy mơ hình exponential model với biến age lệnh streg Kết tương tự mơ hình Cox cho thấy tương đồng hai mơ hình Nguy bệnh nhân mắc HIV phát triển thành AIDS 7,4% tuổi tăng lên tuổi Tiên đoán survival time cho subject stcurve, surviv at(age = 26) Survival Exponential regression 20 40 60 analysis time 80 Tiên đốn survival time cho bệnh nhân có độ tuổi = 26 100 stcurve, survival at1(age = 26) at2(age = 50) lpattern(dash solid) Survival Exponential regression 20 40 60 analysis time age = 26 80 100 age = 50 Sau chạy model exponential lệnh xtreg, vẽ đồ thị nguy tích lũy mơ hình, hàm sống hàm nguy Theo mặc định lệnh stcurve vẽ đường cong cho tất biến x mơ hình Chúng ta xác định giá trị cụ thể option at() Vì độ tuổi bệnh nhân dao động từ 26-50 vẽ cho độ tuổi hai độ tuổi Nhìn vào đồ thị thấy đường cong sống cịn tiên đốn (chuyển từ chẩn đoán HIV sang AIDS) người già giảm thấp so với người trẻ Tỷ số nguy theo tuổi > chứng minh điều này, nhiên vẽ độ thị giúp diễn giải tốt điều Lệnh stcurve khơng vẽ hàm sống cịn mà cịn vẽ hazard function, cumulative hazard function (stcurve, survival; stcurve, hazard, stcurve, cumhaz) Vẽ mơ hình với ln(-ln(S)) generate loglogS = ln(-ln(S)) generate logtime = ln(time) graph twoway scatter loglogS logtime, ylabel(,angle(horizontal)) loglogS -1 -2 -3 -4 logtime Để chạy mơ hình Weibull, phải kiểm tra phân phối ln(-ln(S)) khơng phải ln(S) mơ hình exponential Nếu phân phối ln(ln(S)) thẳng cịn ln(S) cong chứng tỏ chạy mơ hình Weibull Ở thấy phân phối ln(-ln(S)) có slope gần với nghĩa tương ứng với mơ hình exponential mơ hình Weibull Chạy mơ ình Weibull Minh họa cho phần mơ hình Weibull biến age Mơ hình Weibull đạt ước lượng tỷ số nguy 1.07 trung gian mơ hình Cox mơ hình exponential Mơ hình Weibull có thêm dòng vào cuối bảng Những dòng đề cập đến tham số hình dạng phân phối Weibull p Nếu p =1 tương ứng với mơ hình exponential: nghĩa nguy không thay đổi theo thời gian P> chứng tỏ nguy tăng dần theo thời gian, p< chứng tỏ nguy giảm dần theo thời gian 95%CI p dao động từ 0.79 đến 1.62 chấp nhận giả thuyết H p=1 Các tham số khác p ln(p), p 1/p cung cấp đầy đủ ba tương đương mặt toán học Mơ hình Weibull chạy lệnh stcurve tương tự mơ hình exponential Mơ hình exponential Weibull thích hợp mơ hình Cox thời gian sống thật theo phân phối exponential Weibull Còn khơng mơ hình khơng phù hợp diễn giải sai kết Mơ hình Cox, khơng có giả định cho trước phân phối thời gian sống cịn có ích hầu hết trường hợp KIỂM TRA GIẢ ĐỊNH PROPORTIONAL HAZARD CỦA MƠ HÌNH COX Sử dụng đồ thị log-minus-log survival plots stphplot, by(treat) plot1(msym(oh)) plot2(msym(th)) failure _d: time -2 -ln[-ln(Survival Probability)] analysis time _t: censor ln(analysis time) treat = treat = Đồ thị log-log biến treat cho thấy hai nhóm có song song, cho thấy biến treat chưa thật vi phạm giả thuyết proportionality bysort treat: stcox age ndrugtx site c.age#i.site, nohr -> treat = failure _d: censor analysis time _t: time Iteration 0: log likelihood = -1311.1538 Iteration 1: log likelihood = -1302.3552 Iteration 2: log likelihood = -1302.0834 Iteration 3: log likelihood = -1302.0827 Refining estimates: Iteration 0: log likelihood = -1302.0827 Cox regression Breslow method for ties No of subjects = 310 No of failures = 257 Time at risk = Number of obs = 310 65887 LR chi2(4) Log likelihood = -1302.0827 = 18.14 Prob > chi2 = 0.0012 -_t | Coef Std Err z P>|z| [95% Conf Interval] -+ -age | -.0332994 0139111 -2.39 0.017 ndrugtx | 0403077 0115213 site | -1.7505 7047318 -.0605646 -.0060341 3.50 0.000 -2.48 0.013 0177263 062889 -3.131749 -.3692513 | site#c.age | | 0454033 0213107 2.13 0.033 0036351 0871715 > treat = failure _d: censor analysis time _t: time Iteration 0: log likelihood = -1214.6484 Iteration 1: log likelihood = -1206.8412 Iteration 2: log likelihood = -1206.4699 Iteration 3: log likelihood = -1206.4683 Refining estimates: Iteration 0: log likelihood = -1206.4683 Cox regression Breslow method for ties No of subjects = 300 No of failures = 238 Time at risk = Number of obs = 300 77107 LR chi2(4) Log likelihood = -1206.4683 = 16.36 Prob > chi2 = 0.0026 -_t | Coef Std Err z P>|z| [95% Conf Interval] -+ -age | -.0383652 0126867 -3.02 0.002 -.0632308 -.0134997 ndrugtx | 0363666 0105992 site | -.4327386 7562894 3.43 0.001 0155926 -0.57 0.567 -1.915039 0.60 0.548 -.0315784 0571406 1.049561 | site#c.age | | 0139769 0232429 0595322 Kết phân mơ hình theo hai nhóm treat cho thấy hệ số mơ hình hai nhóm gần tương tự với hệ số mơ hình có biến treat, cho thấy biến treat chưa thật vi phạm giả định proportionality đưa vào mơ hình hồi quy đa biến cuối Sử dụng đồ thị smoothing HR stphtest, plot(age) msym(oh) -.5 scaled Schoenfeld - age Test of PH Assumption 200 400 Time 600 800 bandwidth = Đồ thị giả định hệ số Schoenfeld cho thấy đường giả định nằm ngang chứng tỏ biến age không vi phạm giả thuyết proportionality (p> 0,05) stphtest, plot(treat) msym(oh) -4 scaled Schoenfeld - treat -2 Test of PH Assumption 200 400 Time 600 800 bandwidth = Đồ thị cho thấy đường giả định biến treat khơng nằm ngang chứng tỏ biến treat vi phạm giả định proportionality (p< 0,05) Sử dụng phép kiểm Schoenfeld test stphtest, detail Test of proportional-hazards assumption Time: Time -| rho chi2 df Prob>chi2 + age | 0.01210 0.07 0.7912 ndrugtx | 0.05563 1.47 0.2260 treat | 0.10598 5.61 0.0179 site | 0.02336 0.25 0.6150 0b.site#co~e| 1.site#c.age| -0.01350 0.08 0.7722 + global test | 8.27 0.1419 -Phép kiểm Schoenfeld giúp kiểm tra tương quan hệ số dư Schoenfeld thang đo thời gian Phép kiểm Schoenfeld coi hệ số dư Schoenfeld biến outcome cịn thời gian biến predictor, lập mơ hình Cox cho hai biến tính HR chúng Nếu hazard ratio residual biến predictor thời gian định chứng tỏ tương quan Nếu rho dương có nghĩa log hazard ratio tăng lên theo thời gian ngược lại Phép kiểm cho thấy proportionality mơ hình có p =0,14 > 0,05 chứng tỏ tồn mơ hình khơng vi phạm giả thuyết proportionality Hệ số proportionality biến có p> 0,05 chứng tỏ biến khơng vi phạm giả thuyết trừ biến treat KIỂM TRA ĐỘ PHÙ HỢP CỦA MƠ HÌNH quietly stcox age ndrugtx treat site c.age#i.site, nohr mgale(mg) predict cs, csnell (18 missing values generated) stset cs, failure(censor) failure event: censor != & censor < obs time interval: (0, cs] exit on or before: failure -628 18 total observations event time missing (cs>=.) PROBABLE ERROR -610 observations remaining, representing 495 failures in single-record/single-failure data 495 total analysis time at risk and under observation at risk from t = earliest observed entry t = last observed exit t = 3.411917 sts generate H = na line H cs cs, sort xlab(0 to 4) ylab(0 to 4) Cox-Snell residual Nelson-Aalen cumulative hazard Cox-Snell residual Đường hệ số dư đường nguy tích lũy mơ hình nghiêng góc 45 độ chứng tỏ mơ hình phù hợp với số liệu ... đoán survival time cho subject stcurve, surviv at(age = 26) Survival Exponential regression 20 40 60 analysis time 80 Tiên đoán survival time cho bệnh nhân có độ tuổi = 26 100 stcurve, survival. .. dụng đồ thị log-minus-log survival plots stphplot, by(treat) plot1(msym(oh)) plot2(msym(th)) failure _d: time -2 -ln[-ln (Survival Probability)] analysis time _t: censor ln (analysis time) treat =... SO SÁNH SURVIVAL TIME THEO NHĨM Mơ tả thời gian sống cịn theo nhóm stsum, by(sex) failure _d: analysis time _t: smoking days | sex incidence | time at risk rate no of subjects | Survival

Ngày đăng: 02/09/2021, 16:35

TỪ KHÓA LIÊN QUAN

w