1. Trang chủ
  2. » Thể loại khác

Thống kê phân tích dành cho biến phân loại với Stata

58 157 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 58
Dung lượng 260,65 KB
File đính kèm 114. THONG KE PHAN TICH CHO BIEN PHAN LOAI.rar (238 KB)

Nội dung

01 BIẾN PHỤ THUỘC NHỊ GIÁ – CÓ BIẾN ĐỘC LẬP (SO SÁNH VỚI MỘT TỶ LỆ) prtest schpray == 0.5 One-sample test of proportion schpray: Number of obs = 859 -Variable | Mean Std Err [95% Conf Interval] -+ -schpray | 3969732 0166937 3642542 4296923 -p = proportion(schpray) z = -6.0392 Ho: p = 0.5 Ha: p < 0.5 Pr(Z < z) = 0.0000 Ha: p != 0.5 Ha: p > 0.5 Pr(|Z| > |z|) = 0.0000 Pr(Z > z) = 1.0000 • Mean: tỷ lệ giá trị biến schpray Biến schpray biến giả (dummy var) bắt buộc có hai giá trị 0: nhóm khơng có 1: nhóm có Mean =0,39 tức giá trị biến schpray có tỷ lệ 39% • p < 0,001: bác bỏ giả thuyết H0: có khác biệt có ý nghĩa thống kê nhóm có nhóm khơng có 01 BIẾN KẾT CỤC NHỊ GIÁ – 01 BIẾN TIÊN ĐOÁN NHỊ GIÁ HOẶC NHIỀU GIÁ TRỊ Phép kiểm chi bình phương cho hai biến tabulate chd69 agec, col chi2 CHD Event | RECODE of age (Age) by 1969 | 35-40 41-45 46-50 51-55 56-60 | Total -+ -+ -No | 512 1,036 680 463 206 | 2,897 | 94.29 94.96 90.67 87.69 85.12 | 91.85 -+ -+ -Yes | 31 55 70 65 36 | 257 | 5.71 5.04 9.33 12.31 14.88 | 8.15 -+ -+ -Total | 543 1,091 750 528 242 | 3,154 | 100.00 100.00 100.00 100.00 100.00 | 100.00 Pearson chi2(4) = 46.6534 Pr = 0.000 Lập bảng 2x2 cho biến kết cục CHD biến tiên đoán age phép kiểm chi bình phương cho mối kết hợp Trừ hai cột đầu tiên, tỷ lệ bệnh nhân có CHD tăng dần theo độ tuổi (9,33%; 12,31% 14,88%) Phép kiểm chi bình phương cho thấy CHD age có mối kết hợp Tuy nhiên phép kiểm chi bình phương khơng giúp xác định chất mối kết hợp tabulate sex abany, chi2 row V + + | Key | | | | frequency | | row percentage | + + | ABORTION IF WOMAN | WANTS FOR ANY REASON Gender | YES NO | Total -+ + -MALE | 350 478 | 828 | 42.27 57.73 | 100.00 -+ + -FEMALE | 434 677 | 1,111 | 39.06 60.94 | 100.00 -+ + -Total | 784 1,155 | 1,939 | 40.43 59.57 | 100.00 Pearson chi2(1) = 2.0254 Cramér's V = 0.0323 Pr = 0.155 • p =0,15: khơng có khác biệt có ý nghĩa thống kê gender ý kiến phá thai • Một vấn đề phép kiểm chi bình phương mẫu lớn khác biệt nhỏ tỷ lệ hai nhóm có ý nghĩa thống kê Do mẫu lớn phải dùng thêm phép kiểm Cramer V • Cramer’s V=0,03: Cramer nhỏ chứng tỏ sức mạnh tương quan hai biến yếu • Cramer âm trường hợp biến aspirin mã aspirin (1) placebo (0) cịn heart attack attack (1) no attack (0) Khi Cramer V âm chứng tỏ nhóm aspirin (1) liên quan âm với nhóm heart attack (1) tabi 215 269\172 244, chi2 row V + + | Key | | | | frequency | | row percentage | + + | row | col | Total -+ + -1 | 215 269 | 484 | 44.42 55.58 | 100.00 -+ + -2 | 172 244 | 416 | 41.35 58.65 | 100.00 -+ + -Total | 387 513 | 900 | 43.00 57.00 | 100.00 Pearson chi2(1) = 0.8633 Pr = 0.353 Cramér's V = 0.0310 Tính phép kiểm chi bình phương khơng có số liệu gốc Chúng ta dùng lệnh tabi tab sex health, lrchi2 row + + | Key | | | | frequency | | row percentage | + + | CONDITION OF HEALTH Gender | EXCELLENT GOOD FAIR POOR | Total -+ + -MALE | 53 75 32 | 166 | 31.93 45.18 19.28 3.61 | 100.00 -+ + -FEMALE | 51 84 41 15 | 191 | 26.70 43.98 21.47 7.85 | 100.00 -+ + -Total | 104 159 73 21 | 357 | 29.13 44.54 20.45 5.88 | 100.00 likelihood-ratio chi2(3) = 3.8933 Pr = 0.273 chi2power, startf(1) endf(10) incr(1) alpha = 05 sample size factor = 1.00 power = 0.3496 for n = 357 sample size factor = 2.00 power = 0.6410 for n = 714 sample size factor = 3.00 power = 0.8293 for n = 1071 sample size factor = 4.00 power = 0.9272 for n = 1428 sample size factor = 5.00 power = 0.9715 for n = 1785 sample size factor = 6.00 power = 0.9896 for n = 2142 sample size factor = 7.00 power = 0.9964 for n = 2499 sample size factor = 8.00 power = 0.9988 for n = 2856 sample size factor = 9.00 power = 0.9996 for n = 3213 sample size factor = 10.00 power = 0.9999 for n = 3570 • alph =0,05: chọn mức ý nghĩa thống kê 0,05 • cỡ mẫu (sample size factor =1) power phép kiểm có 0,34 (34%), thấp so với yêu cầu (≥ 0,8) • cỡ mẫu tăng lên 1% (sample size factor =2) power tăng lên 0,64 • cỡ mẫu tăng 3% power 0,82 prtest treat == control Two-sample test of proportions treat: Number of obs = 20 control: Number of obs = 20 -Variable | Mean Std Err z P>|z| [95% Conf Interval] -+ -treat | 75 0968246 5602273 9397727 control | 35 1066536 1409627 5590373 -+ -diff | 1440486 | under Ho: 1573213 1176699 2.54 6823301 0.011 -diff = prop(treat) - prop(control) z = 2.5426 Ho: diff = Ha: diff < Pr(Z < z) = 0.9945 Ha: diff != Pr(|Z| < |z|) = 0.0110 Ha: diff > Pr(Z > z) = 0.0055 prtest cure, by(group) Two-sample test of proportions 0: Number of obs = 20 1: Number of obs = 20 -Variable | Mean Std Err z P>|z| [95% Conf Interval] -+ -0 | 35 1066536 1409627 5590373 | 75 0968246 5602273 9397727 -+ -diff | -.4 1440486 | under Ho: 1573213 -.6823301 -2.54 -.1176699 0.011 -diff = prop(0) - prop(1) z = -2.5426 Ho: diff = Ha: diff < Pr(Z < z) = 0.0055 Ha: diff != Pr(|Z| < |z|) = 0.0110 Ha: diff > Pr(Z > z) = 0.9945 Tính kết hợp hai biến kết cục nhị giá tiên đoán nhị giá cs chd69 arcus, or | Arcus Senilis | | | Exposed Unexposed Total -+ + -Cases | 102 153 | 255 Noncases | 839 2058 | 2897 -+ + -Total | 941 2211 | Risk | 3152 | 1083953 0691995 | | | | 080901 | Point estimate | [95% Conf Interval] | + -Risk difference | 0391959 | 0166915 0617003 Risk ratio | 1.566419 | 1.233865 1.988603 Attr frac ex | 3616011 | 1895387 4971343 Attr frac pop | 1446404 | Odds ratio | 1.63528 | 1.257732 2.126197 (Cornfield) + chi2(1) = 13.64 Pr>chi2 = 0.0002 Tính bảng 2x2 cho biến kết cục biến tiên đốn Hàng Risk tóm tắt nguy kết cục nhóm có khơng có yếu tố tiên đốn Risk difference hay cịn gọi excess risk hiệu số nguy hai nhóm Risk ratio relative risk tỷ số hai nguy hai nhóm Odds ratio tỷ số số chênh hai nhóm Attr frac ex.: (attributable risk fraction in exposed group) phần kết cục quy cho biến tiên đốn nhóm có yếu tố tiên đoán Attr frac Pop: (attributable risk fraction in population) phần kết cục quy cho biến tiên đoán dân số chung Giá trị p phép kiểm chi bình phương < 0.05 chứng tỏ biến kết cục biến tiên đốn có mối kết hợp Sử dụng phép kiểm Fisher exact trường hợp cỡ mẫu nhỏ Phép kiểm Fisher’exact test sử dụng có vọng trị ô giá trị thực < xi : logistic caco i.school i.school _Ischool_1-4 (naturally coded; _Ischool_1 omitted) Logistic regression Number of obs = LR chi2(3) = 43.49 Prob > chi2 = 0.0000 Log likelihood = -570.83886 Pseudo R2 1209 = 0.0367 -caco | Odds Ratio Std Err z P>|z| [95% Conf Interval] -+ -_Ischool_2 | 4708678 0794136 -4.47 0.000 3383301 655326 _Ischool_3 | 2659594 0600258 -5.87 0.000 1708846 4139306 _Ischool_4 | 0952903 0982542 -2.28 0.023 012629 7189957 -lưu lại OR tính theo mô hình phân loại Chúng ta thực tương tự mô hình có tính khuynh hướng estore b Lựa chọn mô hình hồi quy Để lựa chọn mô hình cần thực kiểm định likelihood với lệnh lrtest lrtest a b likelihood-ratio test LR chi2(2) = 0.43 (Assumption: b nested in a) Prob > chi2 = 0.8062 Hoài quy logistic cho hai biến phơi nhiễm có tính khuynh hướng logistic caco bcgscar school Logistic regression Number of obs = LR chi2(2) = 98.50 Prob > chi2 = 0.0000 Log likelihood = -543.33577 Pseudo R2 1209 = 0.0831 -caco | Odds Ratio Std Err z P>|z| [95% Conf Interval] -+ -bcgscar | 2712996 0515034 -6.87 0.000 1870068 393587 school | 6169927 0689991 -4.32 0.000 4955517 7681942 xây dựng phương trình hồi quy cho nhiều biến vừa khuynh hướng vừa phân loại xi : logistic caco i.agegrp sex bcgscar school mbcont pbcont i.agegrp _Iagegrp_1-5 Logistic regression Log likelihood = -527.17268 (naturally coded; _Iagegrp_1 omitted) Number of obs = LR chi2(9) = 130.82 Prob > chi2 = 0.0000 Pseudo R2 1209 = 0.1104 -caco | Odds Ratio Std Err z P>|z| [95% Conf Interval] -+ -_Iagegrp_2 | 1.425648 4031527 1.25 0.210 8190391 2.481531 _Iagegrp_3 | 1.898682 6196749 1.96 0.049 1.001485 3.599646 _Iagegrp_4 | 3.045966 8280187 4.10 0.000 1.78786 5.189393 _Iagegrp_5 | 3.81 0.000 1.545966 3.894327 2.45367 5782956 sex | 9840006 1630622 -0.10 0.922 7111148 1.361604 bcgscar | 3165049 0663799 -5.49 0.000 2098262 4774206 school | 6256273 0749521 -3.91 0.000 4946969 7912109 mbcont | 2.896347 1.515836 2.03 0.042 1.0384 8.07861 pbcont | 1.791958 4005866 2.61 0.009 1.15623 2.777226 xây dựng phương trình hồi quy cho nhiều biến có tính khuynh hướng logistic caco agegrp sex bcgscar school mbcont pbcont Logistic regression Number of obs = LR chi2(6) = 126.84 Prob > chi2 = 0.0000 Log likelihood = -529.16522 Pseudo R2 1209 = 0.1070 -caco | Odds Ratio Std Err z P>|z| [95% Conf Interval] -+ -agegrp | 1.258598 0668384 sex | 1.029841 1682939 4.33 0.000 0.18 0.857 1.134184 7475992 bcgscar | 3383164 0683668 -5.36 0.000 2276736 school | 6599573 0764139 -3.59 0.000 525967 1.396659 1.418637 5027285 8280816 mbcont | 2.903683 1.512648 2.05 0.041 1.04598 8.060745 pbcont | 1.795166 3998049 2.63 0.009 1.160197 2.777649 so sánh hai mô hình biến phơi nhiễm So sánh tỷ lệ hai nhóm (biến độc lập có hai giá trị Chúng ta sử dụng tập tin Mwanza2.dta Kiểm định mối liện hệ Cú pháp tab bpt bđl, row chi Ví dụ: tab case ed, row chi + + | Key | | | | frequency | | row percentage | + + | Education benh_chung | khonghoc 1-3 nam 4-6 nam + nam | Total -+ + -chung | | 263 45.82 51 8.89 255 44.43 5| 0.87 | 574 100.00 -+ + -benh | | 49 25.93 24 12.70 110 6| 58.20 3.17 | 189 100.00 -+ + -Total | | 312 40.89 75 365 11 | 763 9.83 47.84 1.44 | 100.00 Pearson chi2(3) = 26.7371 Pr = 0.000 Diễn giải kết Tỷ lệ không học nhóm bệnh 25.93 nhóm chứng 45.82% Tỷ số chứng bệnh giảm dần với lên trình độ văn hoá (tỷ lệ 5, 2, 2.5, 1) cho thấy trình độ học vấn cao nguy mắc bệnh tăng lên Có khác biệt có ý nghóa thống kê trình độ học vấn hai nhóm bệnh chứng (p < 0.001) Tỷ số bệnh chứng có khuynh hướng giảm trình độ học vấn tăng Tính or theo mô hình biến số khuynh hướng Cú pháp mhodds bpt bđl Ví dụ: mhodds case ed Score test for trend of odds with ed (The Odds Ratio estimate is an approximation to the odds ratio for a one unit increase in ed) -Odds Ratio chi2(1) P>chi2 [95% Conf Interval] -1.504866 22.24 0.0000 1.269793 1.783457 -Tính or theo mô hình biến số phân loại mhodds case ed, c(2, 1) Maximum likelihood estimate of the odds ratio Comparing ed==2 vs ed==1 Odds Ratio chi2(1) P>chi2 [95% Conf Interval] -2.525810 10.46 0.0012 1.411752 4.519009 - mhodds case ed, c(3, 1) Maximum likelihood estimate of the odds ratio Comparing ed==3 vs ed==1 -Odds Ratio chi2(1) P>chi2 [95% Conf Interval] -2.315326 19.47 0.0000 1.577058 3.399200 - mhodds case ed, c(4, 1) Maximum likelihood estimate of the odds ratio Comparing ed==4 vs ed==1 -Odds Ratio chi2(1) P>chi2 [95% Conf Interval] -6.440816 11.31 0.0008 1.846408 22.467464 Kiểm định tính khuynh hướng Chúng ta nhẩm tính mối quan hệ có tính khuynh hướng nhiên cần phải kiểm tra xem chúng có khuynh hướng thật không Cú pháp tabodds bpt bđl Ví dụ: tabodds case ed -ed | cases controls odds [95% Conf Interval] + khonghoc | 49 263 1-3 nam | 24 51 4-6 nam | 110 255 + nam | 0.18631 0.47059 0.43137 1.20000 0.13734 0.25275 0.28969 0.76444 0.34495 0.53945 0.36623 3.93196 -Test of homogeneity (equal odds): chi2(3) = 26.70 Pr>chi2 = 0.0000 Score test for trend of odds: chi2(1) = Pr>chi2 = 0.0000 Diễn giải kết 22.24 Kết cho thấy số chênh nhóm khác (chi bình phương = 26.7 pchi2 [95% Conf Interval] -1.513386 17.56 0.0000 1.246736 1.837067 -Test of homogeneity of ORs (approx): chi2(3) = 9.53 Pr>chi2 = 0.0230 Dieãn giải kết Đánh giá kiểm định tính đồng OR với p=0.023 kết luận có tương tác biến số Học vấn tăng nhóm tuổi nguy thấp Vì phải báo cáo OR tầng không báo cáo OR hiệu chỉnh mhodds case ed, by(rel) Score test for trend of odds with ed by rel note: only of the strata formed in this analysis contribute information about the effect of the explanatory variable (The Odds Ratio estimate is an approximation to the odds ratio for a one unit increase in ed) rel | Odds Ratio chi2(1) P>chi2 [95% Conf Interval] + -moslem | 1.136429 0.19 0.6614 0.64120 2.01413 catholic | 1.354621 5.13 0.0235 1.04168 1.76157 protesta | 1.331649 2.73 0.0984 0.94815 1.87027 khac | 1.604003 2.45 0.1179 khuyet | 0.88718 2.89999 Mantel-Haenszel estimate controlling for rel -Odds Ratio chi2(1) P>chi2 [95% Conf Interval] -1.345209 9.82 0.0017 1.117461 1.619374 -Test of homogeneity of ORs (approx): chi2(3) = 0.68 Pr>chi2 = 0.8782 Cách Chúng ta làm cho chuyện đơn giản bước sau gen ed2=ed :tạo biến có hai giá trị recode ed2 3=2 4=2 : biến ed2 có hai giá trị học không học (ed2: 376 changes made) label define ed2 "khong di hoc" " co di hoc" label value ed2 ed2 mhodds case ed2 : tính OR từ mô hình biến khuynh hướng Maximum likelihood estimate of the odds ratio Comparing ed2==2 vs ed2==1 -Odds Ratio chi2(1) P>chi2 [95% Conf Interval] -2.416169 23.25 0.0000 1.668360 3.499168 - mhodds case ed2, c(1,2) : tính OR từ mô hình biến số phân loại Maximum likelihood estimate of the odds ratio Comparing ed2==1 vs ed2==2 -Odds Ratio chi2(1) P>chi2 [95% Conf Interval] 0.413878 23.25 0.0000 0.285782 0.599391 - mhodds case ed2, by(age2) : xác định xem biến age2 có phải biến gây nhiễu hay tương tác Maximum likelihood estimate of the odds ratio Comparing ed2==2 vs ed2==1 by age2 age2 | Odds Ratio chi2(1) P>chi2 [95% Conf Interval] + -15-19 | 0.519231 1.02 0.3132 0.14200 1.89860 20-29 | 1.952381 4.10 0.0430 1.00905 3.77760 30-44 | 3.458647 16.76 0.0000 1.83654 6.51347 45+ | 2.847222 3.05 0.0808 0.83305 9.73136 Mantel-Haenszel estimate controlling for age2 -Odds Ratio chi2(1) P>chi2 [95% Conf Interval] -2.289748 17.94 0.0000 1.543506 3.396777 -Test of homogeneity of ORs (approx): chi2(3) = Pr>chi2 = 0.0455 8.03 mhodds case ed2, by(rel) : xaùc định xem biến rel có phải biến gây nhiễu hay tương tác Maximum likelihood estimate of the odds ratio Comparing ed2==2 vs ed2==1 by rel note: only of the strata formed in this analysis contribute information about the effect of the explanatory variable rel | Odds Ratio chi2(1) P>chi2 [95% Conf Interval] + -moslem | 2.022222 1.29 0.2562 0.58471 6.99382 catholic | 2.252252 7.69 0.0056 1.24857 4.06278 protesta | 1.393519 0.79 0.3745 0.66775 2.90811 khac | 2.019724 2.15 0.1425 0.77414 5.26941 khuyet | Mantel-Haenszel estimate controlling for rel -Odds Ratio chi2(1) P>chi2 [95% Conf Interval] -1.914248 10.89 0.0010 1.292931 2.834138 Test of homogeneity of ORs (approx): chi2(3) = Pr>chi2 = 0.7931 1.03 ... thuyết biến giải thích biến số phân loại Khi phải tạo biến giả với giá trị một giá trị biến giải thích giá trị giá trị lại biến giải thích Chúng ta phải thêm tiền tố xi chữ i Vào trước biến school... nghĩa thống kê Phép kiểm chi bình phương khơng dùng để tính taub, muốn tính taub cần có phân phối z sai số ước lượng ASE cho phân phối z 01 biến phụ thuộc biến nhị giá- 01 nhiều biến độc lập biến. .. quan hệ có ý nghĩa thống kê, Option endf(10) nghĩa phân tích power cho cỡ mẫu gấp 10 lần Option incr(1) yêu cầu Stata tăng cỡ mẫu lần hệ số đơn vị so với mẫu Nhiều nhà thống kê power mẫu phải

Ngày đăng: 02/09/2021, 20:03

HÌNH ẢNH LIÊN QUAN

01 BIẾN KẾT CỤC NHỊ GIÁ – 01 BIẾN TIÊN ĐỐN NHỊ GIÁ HOẶC NHIỀU GIÁ TRỊ - Thống kê phân tích dành cho biến phân loại với Stata
01 BIẾN KẾT CỤC NHỊ GIÁ – 01 BIẾN TIÊN ĐỐN NHỊ GIÁ HOẶC NHIỀU GIÁ TRỊ (Trang 2)
Lập bảng 2x2 cho biến kết cục CHD và biến tiên đốn age và phép kiểm chi bình phương cho mối kết hợp. - Thống kê phân tích dành cho biến phân loại với Stata
p bảng 2x2 cho biến kết cục CHD và biến tiên đốn age và phép kiểm chi bình phương cho mối kết hợp (Trang 2)
Tính bảng 2x2 cho biến kết cục và biến tiên đốn. - Thống kê phân tích dành cho biến phân loại với Stata
nh bảng 2x2 cho biến kết cục và biến tiên đốn (Trang 9)
Chúng ta dùng option lrchi2 để tính likelihood-ratio chi2 cho bảng 2x2. Để tính power analysis chúng ta phải tính được likelihood-ratio chi2. - Thống kê phân tích dành cho biến phân loại với Stata
h úng ta dùng option lrchi2 để tính likelihood-ratio chi2 cho bảng 2x2. Để tính power analysis chúng ta phải tính được likelihood-ratio chi2 (Trang 12)
Mơ hình cho thấy biến sex và biến therapy khơng cĩ tương tác với nhau (p=0,731). - Thống kê phân tích dành cho biến phân loại với Stata
h ình cho thấy biến sex và biến therapy khơng cĩ tương tác với nhau (p=0,731) (Trang 18)
01 biến phụ thuộc nhiều giá trị (biến thứ tự) – 01 hoặc nhiều biến độc lập - Thống kê phân tích dành cho biến phân loại với Stata
01 biến phụ thuộc nhiều giá trị (biến thứ tự) – 01 hoặc nhiều biến độc lập (Trang 38)
Lập mơ hình logistic dành cho biến phụ thuộc là biến thứ tự - Thống kê phân tích dành cho biến phân loại với Stata
p mơ hình logistic dành cho biến phụ thuộc là biến thứ tự (Trang 38)
so sánh giữa hai môhình của các biến phơi nhiễm - Thống kê phân tích dành cho biến phân loại với Stata
so sánh giữa hai môhình của các biến phơi nhiễm (Trang 47)
Tính or theo môhình biến số khuynh hướng - Thống kê phân tích dành cho biến phân loại với Stata
nh or theo môhình biến số khuynh hướng (Trang 48)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w