• Nguồn gốc của sai số có thể là ngẫu nhiên hoặc hệ thống • Có thể xuất hiện trong các giai đoạn của nghiên cứu: – Thiết kế nghiên cứu chất lượng – Tiến hành – Phân tích “Error - Sai số
Trang 1CÁC SAI SỐ TRONG NGHIÊN CỨU DỊCH TỄ HỌC
Ths Nguyễn Tấn Đạt
Trang 2Mục tiêu học tập:
1 Trình bày được định nghĩa và phân loại các loại sai
số
2 Nêu các biện pháp khắc phục sai số
3 Trình bày được khái niệm về yếu tố nhiễu, yếu tố
tương tác
4 Nêu biện pháp khắc phục yếu tố nhiễu
Trang 3• Sai số là gì?
• Có mấy loại?
• Xảy ra khi nào?
Trang 4• Xảy ra khi ước lượng (ví dụ: tỷ lệ mới mắc, tye lệ hiện
mắc, tử vong) hoặc mối liên quan (RR, OR) sai lệch so với tình huống đúng.
• Nguồn gốc của sai số có thể là ngẫu nhiên hoặc hệ
thống
• Có thể xuất hiện trong các giai đoạn của nghiên cứu:
– Thiết kế nghiên cứu (chất lượng)
– Tiến hành
– Phân tích
“Error - Sai số” trong DTH
Trang 5Sai số
Ngẫu nhiên Hệ thống (cơ hội) (sai lệch)
Trang 9C
B
Trang 10• Là sự dao động xung quanh giá trị thật của quần thể
• Nguồn gốc của sai số ngẫu nhiên
– Sự giao động về mặt sinh học của cá thể
• Luôn luôn hiện diện
– Sai số do chọn mẫu
• Một mẫu nhỏ có thể không đại diện cho toàn bộ dân số
– Sai số do đo lường
• Công cụ và tập huấn
Sai số ngẫu nhiên
Trang 11Sai số ngẫu nhiên
• Cỡ mẫu
– Nhỏ hơn
• Thường khác với quần thể đích
• Giới hạn lực (POWER) để phát hiện hiệu quả (effect)
– Lớn hơn
• Thường tương tự như quần thể đích
• Tăng lực (POWER) để phát hiện hiệu quả (effect)
• Cỡ? POWER CALCULATIONS
Bao gồm việc tính toán = độ lớn của sự khác biệt, số lượng sự kiện, mức độ sai số có thể chấp nhận.
Trang 12Ảnh hương đến tính tin cậy, liên quan đến độ chính xác và khả năng lặp lại giống nhau ơ các lần quan sát
• Đánh giá bằng cách so sánh với “tiêu chuẩn vàng”
• Sự lặp lại giống nhau giữa quan sát bên trong quần thể nghiên cứu và quần thể tham khảo (intra-observer inter- observer and intra-observer comparisons)
Trang 13• Sự sai lệch về kết quả hoặc suy luận từ sự thật
• Ảnh hương đến độ tin cậy, bao gồm tính giá trị nội suy hoặc/và ngoại suy
• Nguồn gốc của sai số hệ thống
• Sai số chọn
• Sai số thông tin (đo lường)
• Nhiễu
Sai số hệ thống (bias)
Trang 14• Tăng lên khi các tiêu chuẩn chọn lựa khác nhau được sử dụng (dựa vào tình trạng bệnh và/hoặc phơi nhiễm) vì vậy dân số nghiên cứu không đại diện cho quần thể quan tâm
Không thể làm giảm bằng cách tăng cỡ mẫu
Giảm thông qua các chiến lược thiết kế
Sai số chọn
Trang 15• Trở thành vấn đề khi mẫu nghiên cứu không
có tính đại diện cho quần thể tham khảo
• Cần cân nhắc kỹ trong quá trình thiết kế và phân
tích
• Nếu không nhận biết, thì kết quả được xem như
chính xác, khi đó chúng ta có thể bị sai lầm
Sai số chọn (tt)
Trang 16• Sai lệch do suy luận (Berkson’s Bias)
• Sai lệch về hiện mắc và mới mắc (Neyman’s Bias)
Trang 17Các nguyên tắc để giảm sai số chọn
Giai đoạn
Thiết kế Khung mẫu thích hợp cho dân số nguồn
Tiêu chuẩn bệnh và phơi nhiễm rõ ràng Nhóm so sánh thích hợp
Thu thập dữ
liệu
Tỷ lệ tham gia cao Các thông tin về các yếu tố chọn tìm tàng Xem xét các đối tượng không phản hồi
Phân tích dữ
liệu
Hiệu chỉnh theo xác suất chọn (nếu biết) Kiểm soát các biến xảy ra đồng thời có liên quan
So sánh đối tượng tham gia và không tham gia
Sử dung các nhóm so sánh khác nhau
Trang 18• Được xem như là sai số đo lường và sai số quan
sát
• Tăng lên khi đo lường hoặc phân loại không chính
xác của các biến xảy ra
• Có thể ảnh hưởng đến yếu tố phơi nhiễm hoặc kết
quả (thậm chí yếu tố gây nhiễu)
Sai số thông tin
Trang 20Nguyên tắc làm giảm sai số thông tin
Giai đoạn
nghiên cứu Cách tiếp cận
Thiết kế Dụng cụ và công cụ cụ thể
Nhóm so sánh phù hợp Người thu thập thông tin được huấn luyện kỹ
Thu thập
thông tin
Nhiều nguồn thông tin Bao gồm tiếp xúc và bệnh tật không liên quan
Đối tượng nghiên cứu và người thu thập thông tin không biết
Tỷ lệ phản hồi cao
Phân tích dữ
liệu
Chú ý dữ liệu khuyết Đánh giá và hiệu chỉnh dữ liệu
Trang 21Một mối liên quan giữa yếu tố phơi nhiễm và hậu quả cho trước bị ảnh hưởng bởi một yếu tố thứ 3 nữa.
Nhiễu
Trang 23Nguyên tắc xác định yếu tố gây nhiễu
1 Yếu tố nguy cơ được xác định cho hậu quả
2 Liên quan đến yếu tố phơi nhiễm
3 KHÔNG là bước trung gian trong con
đường nguyên nhân và hậu quả
Yếu tố gây nhiễu
Trang 24Hút thuốc
Thí dụ về nhiễu
Trang 25nguy cơ bệnh tim mạch hay không?
Trang 26Câu hỏi:
Câu hỏi: Việc hiến máu thường xuyên có làm giảm nguy cơ bệnh tim mạch hay
không?
Số liệu về đàn ông tuổi từ 55 trở lên:
Mức độ hiến máu thường
xuyên/năm bệnh tim mạch,nam giới, Tử vong liên quan đến
55yrs+ (per 1,000 per
year)
Trang 27Một giải thích có thể có cho sự liên quan giữa hiến máu
và bệnh tim mạch là sự liên quan một phần của chúng với
Trang 28Chúng ta biết rằng, trong số những người đàn ông trong các khoảng tuổi, những người mà tập thể dục thường xuyên có nguy cơ bệnh mạch vành thấp hơn
Độ thường xuyên
tập thể dục đến bệnh tim mạch, Tử vong liên quan
đàn ông >=55 tuổi/1,000/năm)
Chưa bao giờ 15 (RR=1.0) Thỉnh thoảng 10 (RR=0.67) Thường xuyên 4 (RR=0.27)
Trang 291-2 0.38 0.62 0.81 0.67
Tổng 0.27 0.67 1.00
Trang 305 Xác định yếu gây nhiễu dựa vào kiến thức có sẳn
6 Thu thập cả yếu tố gây nhiễu khi nghiên cứu
7 Hiệu chỉnh các yếu nhiêu khi phân tích
Adjusting means producing estimates of association for the
relationship you are interested in by minimising the effect that the confounder has on the relationship
Trang 31Thu thập dữ liệu
Bao gồm các yếu tố gây nhiễu
Phân tích dữ liệu
Hiệu chỉnh thống kê
Trang 32Tính dễ bị sai số, Thời gian & Chi phí, theo thiết kế nghiên cứu
Nghiên cứu tương quan
Nghiên cứu cắt ngang
NC bệnh - chứng
NC đoàn hệ
NC thử nghiệm ngẫu nhiên
Sai số chọn
- Tuyển vào
- Phản hồi
NA NA
TB NA
CAO THẤP
TB CAO
CAO TB
Sai số thông
tin
- Sai số nhớ lại
NA NA
TB TB
TB CAO
TB THẤP
THẤP THẤP
Trang 33Khi yếu tố thứ 3 làm thay đổi mối quan hệ giữa tiếp xúc và bệnh tật
Yếu tố tương tác
Trang 34Xác định yếu tố tương tác
• Tiến hành phân tích phân tầng (or hoặc thêm yếu tố
tương tác vào mô hình đa biến)
• Nếu chúng ta phát hiện mối liên quan giữa yếu tố
phơi nhiễm quan tâm và hậu quả:
– Khác nhau giữa các tầng của biến thứ 3 (đồng biến,
nghịch biến, thậm chí hiệu quả trái ngược) = yếu tố tương tác (effect modification)
– Giống nhau giữa các tầng = không có tương tác
Trang 35Uống rượu Ung thư thực quản
Hút thuốc lá
Yếu tố tương tác: ví dụ 1
Trang 37Không béo phì ref
Trang 39Không có yếu tố tương tác Tính RR (OR) gộp chung
Phân tầng và tính RR (OR) cho các tầng Tính RR (OR)