Mô hình hồi quy cho biến phân loại trong Stata

38 44 0
Mô hình hồi quy cho biến phân loại trong Stata

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

MỘT BIẾN OUTCOME NHỊ GIÁ-MỘT BIẾN PREDICTOR LIÊN TỤC Chạy mơ hình hồi quy logistic Ở bước Interation 0, log likelihood mơ tả mơ hình có constant Interation cuối (ở 3) mơ tả mơ hình cuối Chi bình phương test đánh giá giả thuyết H0 tất hệ số trừ constant = Pseudo R2: mô tả so sánh độ fit mơ hình với biến phụ thuộc giống nhau, khơng thể giống với R2 mơ hình hồi quy tuyến tính Mỗi ngày tăng thêm làm tăng log odds tiên đốn thermal distress lên 0.002097 Hay nói cách khác, nói ngày thêm vào làm tăng odds thermal distress lên e 0020907 = 1.0020929; 100 ngày tăng lên odd (e 0020907) 100 = 1.23 (e ≈ 2.71828, số ln) Chúng ta tính số lệnh display logistic any date Lệnh logistic cho mơ hình y chang lệnh logit thay tính log odd tính odd ratio Log likelihood log joint propability (likelihood) phương pháp Maximum likelihood (ML) phương pháp chuẩn dùng cho ước lượng tham số logistic model Phương pháp ML sử dụng phép kiểm chi bình phương cho giả thuyết H likelihood mơ hình có biến age khác biệt so với likelihood mơ hình khơng có biến age Kết pro> chi2 cho thấy phép kiểm có ý nghĩa thống kê nghĩa có mối tương quan tuyến tính age biến CHD Độ tự phép kiểm có predictor mơ hình Pseudo R2 dùng để tính likelihood ratio statisitc sau Chạy mơ hình Resctricted cubic splines (RCS) logistic regression mkspline bmis = bmi, nknots(3) cubic logit nas135 bmis1 bmis2 Iteration 0: log likelihood = -178.81246 Iteration 1: log likelihood = -168.87535 Iteration 2: log likelihood = -167.37152 Iteration 3: log likelihood = -167.36956 Iteration 4: log likelihood = -167.36956 Logistic regression Log likelihood = -167.36956 Number of obs = 465 LR chi2(2) = 22.89 Prob > chi2 = 0.0000 Pseudo R2 = 0.0640 -nas135 | Coef Std Err z P>|z| [95% Conf Interval] -+ -bmis1 | -.5218494 1121219 -4.65 0.000 -.7416043 -.3020945 bmis2 | 7046721 1456841 4.84 0.000 4191365 9902076 _cons | 8.961114 2.341176 3.83 0.000 4.372493 13.54974 testparm bmis1 bmis2 ( 1) [nas135]bmis1 = ( 2) [nas135]bmis2 = chi2( 2) = Prob > chi2 = 23.60 0.0000 Hệ số mũ bậc hai bậc khác có ý nghĩa thống kê, điều mơ hình RCS logistic regression phù hợp testparm bmis2 ( 1) [nas135]bmis2 = chi2( 1) = Prob > chi2 = 23.40 0.0000 There is evidence of strong departure from linearity (P-value < 0.001) Vẽ đường giá trị tiên đốn (log(odd)) mơ hình Đường giá trị tiên đốn y theo x có dạng S đường logistic Vẽ đường giá trị tiên đoán (log(odd)) cho hệ số biến độc lập 95%CI predictnl logor_hat = _b[wtdiff]*wtdiff, ci(lo hi) (33 missing values generated) note: confidence intervals calculated using Z critical values twoway (rarea lo hi wtdiff, sort color(gs14))(line logor_hat wtdiff, sort lc(black)), xlabel(-7( > 1)4) scheme(s1mono) legend(off) ylabel(-6(1)4, angle(horiz)) ytitle(Log odds ratio) xtitle("Weig > ht change, kg") Vẽ đường giá trị tiên đoán (Odd) cho hệ số biến độc lập 95%CI gen or = exp(logor_hat) (33 missing values generated) gen lb = exp(lo) (33 missing values generated) gen ub = exp(hi) (33 missing values generated) tw (line lb ub or wtdiff, sort lp(- - l) ) if inrange(wtdiff, -4,3) , xlabel(-4(1)3) scheme(s1mono) legend(off) ylabel(.125 0.25 0.25 0.5 8, angle(horiz)format(%4.3fc)) ytitle("Odds Ratio") xtitle("Weight change (kg)") yscale(log) If you want to plot the odds ratios instead of the log odds ratios you can exponentiate the three variables of interest and re-run the graph The odds ratios are usually plotted on the log scale In some journals, like American Journal of Epidemiology is compulsory Tiên đoán xác suất biến phụ thuộc với giá trị biến độc lập lincom _b[wtdiff]*2, or ( 1) 2*[nas135]wtdiff = -nas135 | Odds Ratio Std Err z P>|z| [95% Conf Interval] -+ -(1) | 4.292613 9471919 6.60 0.000 2.785472 6.615226 Every two kilograms increase in weight gain was associated with a fold (95% CI =2.8-6.6) increase odds of hyponatremia lincom _b[wtdiff]*(2 1) ( 1) 3*[nas135]wtdiff = nas135 | Coef Std Err z P>|z| [95% Conf Interval] -+ -(1) | 2.185343 3309844 6.60 0.000 1.536626 2.834061 The odds of hyponatremia among those who increased kg was times the odds for those runners who lost 1kg xblc bmis1 bmis2 , cov(bmi) at(19 21.01 22.5 25.02 27.4 30.61) ref(22.5) eform bmi exp(xb) (95% CI) 19 4.67 (2.40-9.06) 21.01 1.68 (1.33-2.11) 22.5 1.00 (1.00-1.00) 25.02 1.13 (0.91-1.41) 27.4 2.30 (1.33-4.00) 30.61 6.36 (2.22-18.18) So sánh OR bmi khác (19, 21.01…) BMI tham khảo (22.5) (dành cho mơ hình RCS logistic regression) Tính số ước lượng sau chạy mơ hình D: nghĩa outcome xảy ~D outcome khơng xảy (khơng có distress) +: xác xuất tiên đốn từ mơ hình >= ngưỡng Ở điểm ngưỡng mặc định 0.5 Như + nghĩa xác suất tiên đoán > 0.5 – xác suất tiên đoán nhỏ 0.5 Có 12 space ship có distress mơ hình tiên đốn (sensitivity) có spaceship khơng có distress mơ hình tiên đốn (specificity) Do correctly classified mơ hình 12 + = 17/23 (73.91%) MỘT BIẾN OUTCOME NHỊ GIÁ-MỘT BIẾN PREDICTOR NHỊ GIÁ Tính OR cho hai nhóm biến nhị giá cs nas135 female, or woolf | Female | | Exposed Unexposed | Total -+ + -Cases | 37 25 | 62 Noncases | 129 297 | 426 -+ + -Total | 166 322 | | Risk | 488 | 2228916 0776398 | | | 1270492 | Point estimate | [95% Conf Interval] | + -Risk difference | 1452518 | 0755191 2149846 Risk ratio | 2.870843 | 1.791408 4.600706 Attr frac ex | 6516703 | 4417799 7826421 Attr frac pop | 3889 | Odds ratio | 3.407442 | 1.970056 5.89357 (Woolf) + chi2(1) = 20.84 Pr>chi2 = 0.0000 Chạy mơ hình hồi quy logit nas135 female Iteration 0: log likelihood = -185.80042 Iteration 1: log likelihood = -176.60203 Iteration 2: log likelihood = -175.96672 Iteration 3: log likelihood = -175.96547 Iteration 4: log likelihood = -175.96547 Logistic regression Number of obs = 488 Log likelihood = -175.96547 LR chi2(1) = 19.67 Prob > chi2 = 0.0000 Pseudo R2 = 0.0529 -nas135 | Coef Std Err z P>|z| [95% Conf Interval] -+ -female | 1.225962 279546 4.39 0.000 6780617 1.773862 _cons | -2.474856 2082475 -11.88 0.000 -2.883014 -2.066699 Lệnh logit tính coeff predictor OR Nếu muốn hiển thị OR thêm option or logistic nas135 female Logistic regression Log likelihood = -175.96547 Number of obs = 488 LR chi2(1) = 19.67 Prob > chi2 = 0.0000 Pseudo R2 = 0.0529 -nas135 | Odds Ratio Std Err z P>|z| [95% Conf Interval] -+ -female | 3.407442 9525368 4.39 0.000 1.970056 5.89357 _cons | 0841751 0175292 -11.88 0.000 0559658 126603 -Note: _cons estimates baseline odds Mặc định lệnh logistic ln tính OR khơng phải Coef Muốn coef phải thêm option coef The odds of hyponatremia among female is 3.4 times higher than males We are 95% confident that the odds ratio relating gender (being female compared to male) to hyponatremia is between 1.97 and 5.89 Kiểm tra hệ số hậu ước lượng lincom _cons, eform ( 1) [nas135]_cons = Chạy mơ hình hồi quy generlized linear model (GLM) Option link(logit) link function mơ hình logistic Option family (binomal) phân phối biến response (worstat) Vì biến response biến nhị giá nên phân phối binomial hay cịn gọi phân phối Bernoulli Mơ hình hồi quy GLm cho kết tương tự mơ hình hồi quy logistic Tiên đốn xác suất từ mơ hình hồi quy Chúng ta tạo biến prob xác suất tiên đốn từ mơ hình hồi quy logistic xây dựng Sử dụng lệnh twoway để vẽ đồ thị biến predictor husinc xác suất tiên đốn Đồ thị cho thấy tương tự mơ hình odd of working phụ nữ có thấp phụ nữ không thu nhập chồng tăng lên Lệnh margin tính xác suất tiên đoán theo hai biến date (chuyển thành biến nhị giá) biến temp Để vẽ đường tiên đoán đẹp vẽ giá trị tiên đoán với khoảng cách temp độ mà Khi đường tiên đốn có dạng mềm mại Tính giá trị tiên đốn outcome cho giá trị predictor cho trước lincom _b[wtdiff]+_b[inter]*1 ( 1) [nas135]wtdiff + [nas135]inter = -nas135 | Odds Ratio Std Err z P>|z| [95% Conf Interval] -+ -(1) | 2.061436 3591489 4.15 0.000 1.465113 2.90047 Among women, the odds of hyponatremia doubles (OR=2, 95% CI = 1.5-2.9) for every one kilogram increase in weight gain lincom _b[female]+_b[inter]*3 ( 1) [nas135]female + 3*[nas135]inter = -nas135 | Odds Ratio Std Err z P>|z| [95% Conf Interval] -+ -(1) | 2.623888 1.771526 1.43 0.153 6986412 9.854544 Compared to males, females had fold increase odds of hyponatremia although not significant Vẽ đường tiên đoán cho outcome theo giá trị predictor predictnl logor2 = _b[wtdiff]*wtdiff+_b[female]*female+ /// +_b[inter]*inter gen oddsratios2 = exp(logor2) tw (line oddsratios2 wtdiff if female==0, sort lp(dash)) /// (line oddsratios2 wtdiff if female==1, sort) /// (pci 0.05 0) /// if inrange(wtdiff, -4,3) , /// xlabel(-4(1)3) scheme(s1mono) /// ylabel(.125 0.25 0.25 0.5 /// , angle(horiz) format(%4.3fc)) /// ytitle("Odds Ratio") /// xtitle("Weight change (kg)") yscale(log) /// legend(label(1 "Men") label(2 "Women") /// ring(0) pos(11) col(1) order(2 1) ) /// text(2 -3 "P-interaction=0.874") Kiểm tra outlier Sử dụng đồ thị vẽ DFBETA predicted probability MỘT BIẾN OUTCOME THỨ TỰ-NHIỀU PREDICTOR Chạy mơ hình ordered logistic regression So sánh mơ hình có thêm prdictor So sánh lr test mơ hình khơng có date khơng có tmep với mơ hình full cho thấy hai biến có ý nghĩa thêm vào mơ hình Tiên đốn giá trị cho tầng phân loại biến outcome Chuyến bay sts-51 cho thấy xác suất không xảy distress thấp, xảy 1-2 lần tăng dần >3 lần lên đến 0.99 MỘT BIẾN OUTCOME DANH ĐỊNH-NHIỀU PREDICTOR Chạy mơ hình polytomous logistic model (multinomial logistic model) ... phối Bernoulli Mơ hình hồi quy GLm cho kết tương tự mơ hình hồi quy logistic Tiên đốn xác suất từ mơ hình hồi quy Chúng ta tạo biến prob xác suất tiên đốn từ mơ hình hồi quy logistic xây dựng Sử... mơ hình cho thấy temp khơng có ý nghĩa thống kê làm tăng correctly classified mơ hình lên 78.26% Chúng ta cần kiểm tra ý nghĩa việc thêm temp vào mơ hình lệnh lrtest Kết cho thấy p=0.07 cho thấy... có date khơng có tmep với mơ hình full cho thấy hai biến có ý nghĩa thêm vào mơ hình Tiên đốn giá trị cho tầng phân loại biến outcome Chuyến bay sts-51 cho thấy xác suất không xảy distress thấp,

Ngày đăng: 01/09/2021, 15:07