... Suy luận thông kê (Chỉ áp dụng cho mẫu xác suất với cỡ mẫu đủ lớn) Ước lợng điểm khoảng Kiểm định giả thuyết Giá trị p Biến số Thống kê mô tả Thống kê suy luận Tham số mẫu ( X , s, p ) Các test... số mẫu: ớc lợng hay kiểm định? Trẻ sơ sinh huyện A 5000 trẻ Tỷ lệ trẻ (P) có cân nặng < 2500 gram = ? Mẫu 500 trẻ Tỷ lệ trẻ (p) có cân nặng < 2500 gram = 20% ớc lợng hay kiểm định? Trẻ sơ sinh... trẻ ? Mẫu 500 trẻ 2954 1280 Trẻ sơ sinh huyện B 6000 trẻ Mẫu B 500 trẻ > 2785 886 ớc lợng hay kiểm định? T cõu hi nghiờn cu t gi thuyt nghiờn cu xut mc ý ngha thng kờ thớch hp Chn test thng kờ
Trang 1Hoàng Thị Hải Vân
Bộ môn Thống kê Tin học Y học Viện Đào tạo YHDP&YTCC
Tel: 0912693335 Email: hoangthihaivan@hmu.edu.vn
Phân biệt được ước lượng và kiểm định giả
thuyết
Giả thuyết nghiên cứu
Giá trị của p và mức ý nghĩa thống kê
Phân biệt được sai lầm loại I và sai lầm loại II
Liệt kê được các bước tiến hành kiểm định giả
thuyết
Có khả năng lựa chọn được trắc nghiệm thống kê
thích hợp cho một bộ số liệu cụ thể
Trang 2Thống kờ mụ tả:
là mụ tả kết quả thu được từ mẫu nghiờn cứu
biểu thị độ lớn, sự phõn bố của cỏc tham số của mẫu nghiờn
cứu như giỏ trị trung bỡnh, độ lệch chuẩn, cỏc tỷ lệ, bảng,
biểu, đồ thị sự phõn bố theo cỏc biến số khỏc nhau như tuổi,
giới, địa dư
Thống kờ suy luận:
là quỏ trỡnh ngoại suy kết quả nghiờn cứu từ mẫu ra quần
thể nghiờn cứu
bao gồm 2 phương phỏp: ước lượng và kiểm định
Quần thể đích
Quần thể nghiên cứu
Mẫu
Tham số quần thể
(à, σ, P ) Mẫu xác suất
- Mẫu kinh nghiệm
- Mẫu thuận tiện
- Mẫu chỉ tiêu
- Mẫu có mục đích.
Chọn mẫu
Ước l−ợng
• điểm
• khoảng
Kiểm định giả thuyết
Suy luận thông kê
(Chỉ áp dụng cho
Tham số mẫu
( , s, p ) Biến số
Thống kê suy luận
Trang 3Ước lượng:
ngoại suy từ tham số mẫu ra tham số quần thể:
từ trung bình của mẫu ( ) sang TB quần thể (µ)
từ tỷ lệ của mẫu (p) sang tỷ lệ của quần thể (P)
từ OR, RR, r của mẫu ra quần thể.
Kiểm định giả thuyết :
so sánh 2 hoặc nhiều quần thể NC từ sự khác biệt của
2 hoặc nhiều mẫu rút ra từ chính quần thể đó.
kiểm định mối tương quan của quần thể dựa theo mối
tương quan thu được từ mẫu
Trang 51. Từ câu hỏi nghiên cứu đặt ra giả thuyết nghiên cứu
2. Đềxuất mức ý nghĩa thống kê thích hợp
3. Chọn test thống kê thích hợp
4. Xác định vùng suy xét hoặc vùng loại bỏ
5. Tính toán test thống kê
6. Đềxuất quyết định thống kê
7. Rút ra kết luận
Giả thuyết nghiên cứu là một giả định được đặt ra bởi
người nghiên cứu và được xuất phát từ câu hỏi
nghiên cứu
Giả thuyết không (null hypothesis – Ho ): không có sự
khác biệt/ tất cả đều như nhau
Giả thuyết khác biệt (alternative hypothesis – Ha/H1) :
được chấp nhận khi Ho bị loại bỏ (có sự khác biệt)
Trang 6Sai lầm loại I: xảy ra khi giả thuyết Ho bị loại bỏ khi nó đúng
◦ Xác suất xảy ra sai lầm loại I chính là mức ý nghĩa thống kê
(α) thường bằng hoặc nhỏ hơn 0,05 Khi mức ý nghĩa
thống kê bằng 0,05, p<0,05, Ho bị loại bỏ
Sai lầm loại II: xảy ra khi chấp nhận giả thuyết H1 khi nó sai
◦ Xác suất xảy ra sai lầm loại II gọi là β Khi đó (1-β) được
gọi là lực của test (power test): khả năng loại trừ Ho khi Ha
là đúng
Chấp nhận Ho
Ho ñược chấp
nhân trong khi nó sai
Trang 7Khi giá trị P – có ý nghĩa thống kê ở mức 0,05 –
(100-5) 95% khoảng tin cậy sẽ không đi qua giá trị
“không” (null)
ung thư phổi là 1,6, 95%CI (0,5-2,3)
Trang 8Ở mức ý nghĩa thống kê 5%, giá trị giới hạn
(cut-off) của p là 0,05
Ở mức ý nghĩa thống kê 1%, giá trị giới hạn
(cut-off) của p là 0,01
Giá trị của p ñược tính toán dựa trên ñộ mạnh
của bằng chứng chống lại giả thuyết Ho
P Độ mạnh của bằng chứng
<0.001 Bằng chứng vô cùng mạnh mẽ
0,01 đến 0,001 Bằng chứng mạnh m
0,05 đến 0,01 Bằng chứng yếu
>0,05 Rất yếu hoặc không có bằng chứng
Giả thuyết Ho đã bị loại bỏ với nguy cơ sai lầm <5%
Trang 9Chỉ giá trị của P chưa ñủ cơ sở ñể kết luận
Cần phải biết giá trị thực tế của ñộ lớn: OR,
RR, trung bình của sự khác biệt giữa 2 nhóm
1. Nếu p=0,05, giả thuyết Ho chỉ có 5% cơ hội xảy ra
2. Sự khác biệt không có ý nghĩa thống kê (p>=0,05) có
nghĩa là không có sự khác biệt giữa các nhóm
3. Kết quả có ý nghĩa thống kê có nghĩa là cũng rất quan
trọng về mặt lâm sàng
4. Các nghiên cứu có giá trị p ở về 2 phía của giá trị 0,05
là mâu thuẫn nhau
5. Các nghiên cứu có giá trị p như nhau cung cấp các
bằng chứng như nhau chống lại giả thuyết Ho
6. P=0,05 có nghĩa là khi chúng ta quan sát thì chỉ 5% sự
kiện xảy ra tuân theo giả thuyết Ho
Trang 1011. Bạn nên sử dụng p một phía khi bạn không quan tâm
đến chiều hướng của kết quả hoặc sự khác biệt về một
hướng là không thể xác định
12. Các kết luận khoa học hay phương hướng điều trị căn
cứ vào việc giá trị p có ý nghĩa hay không
Test tham số và test phi tham số
Test cho biến ñịnh lượng và biến ñịnh tính
Test ghép cặp và test không ghép cặp
Test cho biến phụ thuộc và biến ñộc lập
Trang 11Biến định lượng (3)
Biến định tính (4)
Trang 13Nội dung kiểm tra Các chỉ số thể hiện phân bố
chuẩnKiểm tra biểu đồ cột
liên tục (histogram) Có hình chuông và đối xứng
kurtosis Nằm trong khoảng -1 đến +1 (cóthể chấp nhận -3 đến +3)
Kiểm tra bằng box plot
(biểu đồ hộp)
Không có các giá trị ngoại lai
Test kiểm tra phân bố
chuẩn
Skewness-kurtosis test (sktest, p>0,05)
1. So sánh huyết áp tối đa của mẫu nghiên cứu với hằng
số sinh học của người Việt Nam (120mmHg)
2. So sánh huyết áp tối đa của nam và nữ trong mẫu
nghiên cứu
3. So sánh huyết áp tối đa của mẫu nghiên cứu trước và
sau điều trị thuốc hạ huyết áp
4. So sánh huyết áp tối đa của các nhóm có BMI khác
nhau (<18,5; 18,50-24,99: >=25)
Trang 14Biến định lượng (3)
Biến định tính (4)
Khi bình phương test Fisher
2 Xác định sự khác biệt biến định tính
1
nhóm
2 nhóm
Z
test
Độc lập
Ghép cặp
Độc lập
Ghép cặp
>2 nhóm
Khi bình phương của Mc Nemar
Khi bình phương test
Cochran
Q test
Trang 151. So sánh tỷ lệ suy dinh dưỡng của mẫu nghiên
cứu với tỷ lệ chung của cả nước
thành thị
và sau can thiệp
là con của các bà mẹ có trình độ văn hóa khác
nhau (<tiểu học; trung học cơ sở; từ PTTH trở
Trang 163 Đo lường mối liên quan biến định lượng
>2 biến
Hệ số tương quan r của spearman nếu phân
bố không chuẩn
Có giá trị từ -1 đến +1
Khi HSTQ = 0 ⇒ 2 biến không có tương quan tuyến tính
Khi HSTQ > 0 ⇒ tương quan đồng biến
Khi HSTQ < 0 ⇒ tương quan nghịch biến
Càng gần 1 ⇒ tương quan càng chặt
HSTQ = 1 ⇒ không có sai số ngẫu nhiên
Bình phương của HSTQ (r 2 ) thể hiện tỷ lệ biến thiên của biến phụ thuộc
được quy là do sự thay đổi của biến độc lập (nếu giữa hai biến có quan hệ
Trang 18lượng theo sự biến đổi của các biến khác
Trang 19Biến phụ thuộc là biến ñịnh lượng có phân bố
Xây dựng mô hình hồi quy tuyến tính thể hiện
mối liên quan giữa cân nặng với chiều cao và
nhóm tuổi
Trang 20Biến định lượng (3)
Biến định tính (4)
4 Đo lường mối liên quan giữa các biến định tính
Trang 21Nguy cơ tương đối (RR)
được tính bằng tỷ lệ mới
mắc của những người có
tiếp xúc với yếu tố nguy cơ
(phơi nhiễm)/tỷ lệ mới mắc
của những người không tiếp
xúc với yếu tố nguy cơ
(không phơi nhiễm)
Không phơi nhiễm
Áp dụng cho nghiên cứu
ngang và nghiên cứu bệnh
chứng
Có phơi nhiễm
Không phơi nhiễm
Trang 22Xác ñịnh mối liên quan giữa tỷ lệ cao huyết
áp và giới tính của mẫu nghiên cứu
và việc tiêm vaccine phòng cúm
Trang 23Đểtìm mối liên quan giữa biến phụ thuộc là biến nhị
phân và các biến độc lập là định lượng hoặc định tính
Ví dụ: Nghiên cứu bệnh - chứng về tình trạng mắc bệnh
phong và có tiêm vaccine BCG, với các yếu tố nghi ngờ
nhiễu là tuổi, giới, nơi học,
Biến phụ thuộc: Mắc bệnh phong
Biến độc lập: có sẹo BCG, tuổi, giới, nơi học,