Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 24 trang
THÔNG TIN TÀI LIỆU
Nội dung
PHÂN TÍCH THỐNG KÊ
CƠ BẢN VỚI STATA
PGS.TS. Hoàng Văn Minh
Hà nội- tháng 6 năm 2015
NỘI DUNG
1. Khái niệm thống kê cơ bản
2. Lựa chọn trắc nghiệm thống kê
3. Thực hành thống kê với Stata
1
Thống kê
“Phân môn toán học có nhiệm vụ thu thập,
phân tích, phiên giải và trình bày SỐ LIỆU”
Thống kê
Quần thể
Chọn mẫu
Thống kê
suy luận
Mẫu
Thống kê mô tả
2
Số liệu là đối tượng chính của thống kê
Biến số# Hằng số
Biến số
Định
lượng
Định tính
3
Số liệu ?
Tuổi,
Giới
Trị số huyết áp
Hàm lượng ure máu
Mức độ trầm trọng của bệnh
Các phương pháp điều trị
Tử vong/sống sót
THỐNG KÊ
Mô tả biến
định lượng
Mô tả biến
định tính
Suy luận
biến định
lượng
Suy luận
biến định
tính
4
Thống kê mô tả biến định lượng
Đo lường độ tập trung (Location)
Trung bình (mean)
Trung vị (median)
Mode
Đo lường độ phân tán (Spread )
Khoảng số liệu (range)
Khoảng tứ phân vị (25%-75%) (Interquartile )
Độ lệch chuẩn (Standard deviation)
Phương sai (Variance)
Bài tập: sl1_ureamau
sum urea
sum urea, d
histogram urea, normal
graph box urea
5
Thống kê mô tả biến định tính
Tần số
Tỷ lệ phần trăm
Bài tập: sl1_ureamau
tab urecao
graph pie, over(urecao) plabel(_all percent)
6
Bài tập: sl1_ureamau
1. Thực hiện thống kê mô tả biến urea theo
nhóm tuổi (caotuoi)
2. Thực hiện thống kê mô tả biến urea cao
theo nhóm tuổi (caotuoi)
Bài tập: sl1_ureamau
tabstat urea, by( caotuoi) stat(n mean
median sd min max) f(%9.2g)
tab urecao caotuoi, col
graph pie, over(urecao) by(caotuoi)
plabel(_all percent)
graph bar (mean) urecao, over(caotuoi)
blabel(bar)
7
Thống kê
Quần thể
Chọn mẫu
Thống kê
suy luận
Mẫu
Thống kê mô tả
Thống kê suy luận
Ước lượng khoảng
Kiểm định giả thuyết
Quần thể
Chọn mẫu
Thống kê
suy luận
Mẫu
Thống kê mô tả
8
x=6,9; 95%CI: 5,4-8,7
p=55%, 95%CI: 42%-67%
Ước lượng khoảng-khoảng tin cậy
(confidence interval)
Thường chọn khoảng tin cậy 95% (95%CI)
Khi thực hiện đo đạc 100 lần thì it nhất 95 lần
kết quả nằm trong khoảng tin cậy
95% tin tưởng rằng giá trị thực của quần thể
nằm trong khoảng tin cậy
95%CI= Trung bình± 1,96*sai số chuẩn
9
Sai số chuẩn (standard errors)
95%CI= Trung bình± 1,96*sai số chuẩn
10
Bài tập: sl1_ureamau
ci urea
by caotuoi, sort: ci urea
ci urecao
by caotuoi, sort: ci urecao
proportion urecao
Kiểm định giả thuyết
=> Sử dụng trắc nghiệm (test) thống kê để khẳng định giả
thuyết của nhà nghiên cứu
Quần thể
Chọn mẫu
Ngoại suy
Trắc nghiệm thống kê
Mẫu NC
11
Các bước kiểm định giả thuyết
1. Hình thành giả thuyết (Ho vs. Ha)
2. Xác định
(=0,05)
ý
nghĩa
thống
kê
3. Xác định test TK
4. Thực hiện test TK để tính p
5. Phiên giải và kểt luận
1-Giả thuyết
Giả thuyết Ho: Không có sự khác biệt
Giả thuyết Ha: Có sự khác biệt
12
1-Giả thuyết
Tác dụng của tiêm nitrate tĩnh mạch có tác dụng
giảm tỷ lệ tử vong ở bệnh nhân nhồi máu cơ tim?
Giả thuyết Ho:
Giả thuyết Ha:
2-Mức ý nghĩa thống kê
Loại bỏ sai lầm loại I
= 0.05
p = probability= Xác suất để giả thuyết Ho đúng
P 95%
Ha xảy ra là chắc chắn
Chấp nhận Ha
P>0.05
= ???
13
2-Mức ý nghĩa thống kê
z (1-/2)
.01 (99)
2.576
.02 (98)
2.326
.05 (95)
1.960
.10 (90)
1.645
3-Lựa chọn trắc nghiệm thống
kê
MỤC TIÊU
BIẾN SỐ
1
Xác định sự khác biệt
Biến định lượng
2
3
Xác định liên quan
4
Biến định tính
14
Xác định sự khác biệt
của biến định lượng
Test tham số
(Phân bố chuẩn)
Test phi tham số
(Phân bố chuẩn &
không chuẩn)
Kiểm định phân bố số liệu
15
Kiểm định phân bố số liệu
•
histogram urea, bin (40) normal
•
sum urea, d
•
sktest urea
•
gladder urea
1. Xác định sự khác biệt
biến định lượng
2
nhóm
1
nhóm
>2
nhóm
Ph bố
Chuẩn
Chuẩn &
K chuẩn
Ph bố
Chuẩn
Chuẩn &
K chuẩn
t test
Sign test
Wilcoxon
test
ttest đlập
ttest g.cặp
Đ.lập:
MannWhitney
test
Gh. cặp:
Sign test
Wilcoxon
test
Test tham số
Ph bố
Chuẩn
ANOVA
(ph.sai đ
nhất)
Chuẩn &
K chuẩn
KruskalWallis test
Test phi tham số
16
5-Phiên giải kết quả
Tỷ lệ tử vong ở bệnh nhân nhồi máu cơ tim được
tiêm nitrate tĩnh mạch thấp hơn tỷ lệ tử vong ở
những bệnh nhân bị nhồi máu cơ tim mà không
được tiêm, sự khác biệt là có ý nghĩa thống kê
(p=5
Giá trị mong đợi [...]... nhân nhồi máu cơ tim được tiêm nitrate tĩnh mạch thấp hơn tỷ lệ tử vong ở những bệnh nhân bị nhồi máu cơ tim mà không được tiêm, sự khác biệt là có ý nghĩa thống kê (p Sử dụng trắc nghiệm (test) thống kê để khẳng định giả thuyết của nhà nghiên cứu Quần thể Chọn mẫu Ngoại suy Trắc nghiệm thống kê Mẫu NC 11 Các bước kiểm định giả thuyết 1 Hình thành giả thuyết (Ho vs Ha) 2 Xác định (=0,05) ý nghĩa thống kê 3 Xác định test TK 4 Thực hiện test TK để tính p 5 Phiên giải và kểt luận 1-Giả thuyết Giả thuyết... tử vong ở bệnh nhân nhồi máu cơ tim? Giả thuyết Ho: Giả thuyết Ha: 2-Mức ý nghĩa thống kê Loại bỏ sai lầm loại I = 0.05 p = probability= Xác suất để giả thuyết Ho đúng P 95% Ha xảy ra là chắc chắn Chấp nhận Ha P>0.05 = ??? 13 2-Mức ý nghĩa thống kê z (1-/2) 01 (99) 2.576... thể sử dụng: – Tỷ suất chênh: OR – Nguy cơ tương đối: RR Tốt Không tốt Tổng Điều trị 1 4 5 9 Điều trị 2 3 3 6 Tổng 7 8 15 22 OR= Odds Ratio= RR= Risk Ratio= odds1 -odds2 risk1 -risk2 OR và RR >1 =1 .. .Thống kê Phân môn toán học có nhiệm vụ thu thập, phân tích, phiên giải trình bày SỐ LIỆU” Thống kê Quần thể Chọn mẫu Thống kê suy luận Mẫu Thống kê mô tả Số liệu đối tượng thống kê Biến... blabel(bar) Thống kê Quần thể Chọn mẫu Thống kê suy luận Mẫu Thống kê mô tả Thống kê suy luận Ước lượng khoảng Kiểm định giả thuyết Quần thể Chọn mẫu Thống kê suy luận Mẫu Thống kê mô tả x=6,9;... graph box urea Thống kê mô tả biến định tính Tần số Tỷ lệ phần trăm Bài tập: sl1_ureamau tab urecao graph pie, over(urecao) plabel(_all percent) Bài tập: sl1_ureamau Thực thống kê mô tả biến urea