IV. Tài liệu học tập chủ yếu cho sinh viên
e: mức sai lệch mong muốn cho phép giữa tham số mẫu và quần thể.
Z(1- α/2) : Hệ số giới hạn tin cậy, phụ thuộc vào mức ý nghĩa thống kê α, nêu:
(α = 0,01 ứng với giá trị của Z(1- α/2 =1,64, với độ tin cậy 99%).
(α = 0,05 ứng với giá trị của Z(1- α/2 =1,96, với độ tin cậy 95%).
(α = 0,1 ứng với giá trị của Z(1- α/2 =2,58 với độ tin cậy 90%).
Ví dụ: nếu p = 40; e = 5; thì: q = 100 - 40 = 60; n = 2 2 2 1 . e pq Z −α
(40x60)
n = 1,962 = 368,8 hay 369 ngời. (5)2
Để khắc phục nhợc điểm của việc chọn giá trị tuyệt đối e2 đối với các bệnh có ớc lợng p lớn, ngời ta sử dụng giá trị tơng đối ε. Khi đó công thức tính cỡ mẫu đợc viết nh sau:
n = Z2 ( 1- α/ 2 )
3. 2. Cỡ mẫu ớc tính cho một tỷ lệ trong nghiên cứu ngang mô tả
Cỡ mẫu nêu trên áp dụng cho các nghiên cứu ngang mô tả theo mẫu ngẫu nhiên đơn và là cỡ mẫu tối thiểu hợp lý. (các nghiên cứu mô tả theo mẫu tầng hoặc mẫu chùm thì công thức tính phơng sai lại khác và do đó công thức tính khoảng tin cậy cũng khác đi, và tất nhiên việc tính cỡ mẫu mô tả cho các loại mẫu chùm, mẫu tầng phải tuân theo các công thức tơng ứng). Cỡ mẫu cho nghiên cứu ngang mô tả áp dụng trong điều tra sức khoẻ cộng đồng thờng là cỡ mâu cho các nghiên cứu ớc lợng tỷ lệ P-
3.3. Ước lợng cỡ mẫu cho một nghiên cứu tỷ lệ mắc:
• Cỡ mẫu chính xác cho một nghiên cứu xác định tỷ lệ hiện mắc phụ thuộc vào tính chính xác đòi hỏi phải đạt đợc và tỷ lệ hiện mắc của bệnh ta đang cần điều tra. Chẳng hạn, bệnh Phong có tỷ lệ hiện mắc ở vào khoảng 1/100, hay 10/1000 dân chúng. Nếu lấy một mẫu 100 ngời, chỉ có một trờng hợp mắc bệnh, và nếu không có trờng hợp nào thì điều ấy cũng hợp lý. Do vậy, một mẫu bé nh thế cha chắc đã đa lại sự đánh giá chính xác về tỷ lệ mắc bệnh Phong trong cộng đồng. Thậm chí ngay cả đến mẫu gồm 1000 dân chúng, thí số bệnh nhân mong đợi phát hiện ra cũng chỉ là 10 trờng hợp.
• Ngợc lại, đối với những bệnh trạng có tỷ lệ mắc phổ biến hơn, chẳn hạn nh bệnh Giun đờng ruột với tỷ lệ mắc 30%, thì một mẫu nghiên cứu gồm 100-200 ngời là đủ đa lại một ớc lợng tơng đối chính xác về tỷ lệ bệnh. Trờng hợp này nếu lấy mẫu lên đến 1000 ngời thì không cần thiết.
• Với một kỹ thuật chọn mẫu phù hợp, thì cỡ mẫu lớn sẽ đa lại kết quả càng gần với các giá trị thực, tức là tỷ lệ mắc bệnh của quần thể mà từ đó chúng ta lấy ra một mẫu để nghiên cứu. Tuy nhiên, cỡ mẫu nhỏ sẽ giúp ta tiết kiệm thời gian và giảm đợc chi phí. Hơn nữa, trong cỡ mẫu nhỏ, ngời nghiên cứu dễ có điều kiện kiểm soát đợc chất lợng hoạt động điều tra, do vậy lại tăng độ tin cậy của thông tin thu thập đợc. Vì thế trong một nghiên cứu tỷ lệ hiện mắc, ngời ta cần xác định cỡ mẫu nhỏ nhất (tối thiểu) mà vẫn đa lại một ớc lợng về tỷ lệ bệnh đạt độ chính xác mong muốn. Bảng dới đây trình bày các ví dụ về cỡ mẫu tối thiểu ứng với các tỷ lệ mắc khác nhau và các giới hạn sai số mẫu cụ thể trong kết quả ớc l- ợng đợc.
• Để sử dụng bảng này, trớc hết chọn một cột trong bảng ứng với tỷ lệ hiện mắc do ta ớc lợng không vợt quá 50%. (nếu tỷ lệ bệnh đợc ớc lợng là trên 50%, thì ta lại chọn cột giá trị tơng ứng với 100 trừ đi tỷ lệ ớc lợng đó). Sau đó chọn hàng thích hợp trong bảng tơng ứng với giá trị của sai số chọn mẫu có thể chấp nhận trong tỷ lệ ớc lợng thu đợc.
• Ví dụ: nếu ta nghi ngờ rằng tỷ lệ hiện mắc Sốt rét ở vào khoảng 20% đến 40% ở một cộng đồng ta đang cần điều tra, và ta mong muốn là kết quả điều tra đợc sai khác không quá 5% so với tỷ lệ mắc thực tồn tại trong cộng đồng đó, nhìn vào bảng, ta thấy cần thiết phải tiến hành chọn một mẫu ngẫu nhiên tối thiểu 369 ngời.