IV. Tài liệu học tập chủ yếu cho sinh viên
e: mức sai lệch mong muốn cho phép giữa tham số mẫu và quần thể.
Z(1- /2) : Hệ số giới hạn tin cậy, phụ thuộc vào mức ý nghĩa thống kê , nêu: ( = 0,01 ứng với giá trị của Z(1- /2 =1,64, với độ tin cậy 99%).
( = 0,05 ứng với giá trị của Z(1- /2 =1,96, với độ tin cậy 95%). ( = 0,1 ứng với giá trị của Z(1- /2 =2,58 với độ tin cậy 90%).
n = 2 2 2 1 . e pq Z
Ví dụ: nếu p = 40; e = 5; thì: q = 100 - 40 = 60; (40x60)
n = 1,962 = 368,8 hay 369 ng-ời. (5)2
Để khắc phục nh-ợc điểm của việc chọn giá trị tuyệt đối e2
đối với các bệnh có -ớc l-ợng p lớn, ng-ời ta sử dụng giá trị t-ơng đối . Khi đó công thức tính cỡ mẫu đ-ợc viết nh- sau:
n = Z2
( 1- / 2 )
3. 2. Cỡ mẫu -ớc tính cho một tỷ lệ trong nghiên cứu ngang mô tả
Cỡ mẫu nêu trên áp dụng cho các nghiên cứu ngang mô tả theo mẫu ngẫu nhiên đơn và là cỡ mẫu tối thiểu hợp lý. (các nghiên cứu mô tả theo mẫu tầng hoặc mẫu chùm thì công thức tính ph-ơng sai lại khác và do đó công thức tính khoảng tin cậy cũng khác đi, và tất nhiên việc tính cỡ mẫu mô tả cho các loại mẫu chùm, mẫu tầng phải tuân theo các công thức t-ơng ứng). Cỡ mẫu cho nghiên cứu ngang mô tả áp dụng trong điều tra sức khoẻ cộng đồng th-ờng là cỡ mâu cho các nghiên cứu -ớc l-ợng tỷ lệ P-
3.3. Ước l-ợng cỡ mẫu cho một nghiên cứu tỷ lệ mắc:
Cỡ mẫu chính xác cho một nghiên cứu xác định tỷ lệ hiện mắc phụ thuộc vào tính chính xác đòi hỏi phải đạt đ-ợc và tỷ lệ hiện mắc của bệnh ta đang cần điều tra. Chẳng hạn, bệnh Phong có tỷ lệ hiện mắc ở vào khoảng 1/100, hay 10/1000 dân chúng. Nếu lấy một mẫu 100 ng-ời, chỉ có một tr-ờng hợp mắc bệnh, và nếu không có tr-ờng hợp nào thì điều ấy cũng hợp lý. Do vậy, một mẫu bé nh- thế ch-a chắc đã đ-a lại sự đánh giá chính xác về tỷ lệ mắc bệnh Phong trong cộng đồng. Thậm chí ngay cả đến mẫu gồm 1000 dân chúng, thí số bệnh nhân mong đợi phát hiện ra cũng chỉ là 10 tr-ờng hợp.
Ng-ợc lại, đối với những bệnh trạng có tỷ lệ mắc phổ biến hơn, chẳn hạn nh- bệnh Giun đ-ờng ruột với tỷ lệ mắc 30%, thì một mẫu nghiên cứu gồm 100-200 ng-ời là đủ đ-a lại một -ớc l-ợng t-ơng đối chính xác về tỷ lệ bệnh. Tr-ờng hợp này nếu lấy mẫu lên đến 1000 ng-ời thì không cần thiết.
Với một kỹ thuật chọn mẫu phù hợp, thì cỡ mẫu lớn sẽ đ-a lại kết quả càng gần với các giá trị thực, tức là tỷ lệ mắc bệnh của quần thể mà từ đó chúng ta lấy ra một mẫu để nghiên cứu. Tuy nhiên, cỡ mẫu nhỏ sẽ giúp ta tiết kiệm thời gian và giảm đ-ợc chi phí. Hơn nữa, trong cỡ mẫu nhỏ, ng-ời nghiên cứu dễ có điều kiện kiểm soát đ-ợc chất l-ợng hoạt động điều tra, do vậy lại tăng độ tin cậy của thông tin thu thập đ-ợc. Vì thế trong một nghiên cứu tỷ lệ hiện mắc, ng-ời ta cần xác định cỡ mẫu nhỏ nhất (tối thiểu) mà vẫn đ-a lại một -ớc l-ợng về tỷ lệ bệnh đạt độ chính xác mong muốn. Bảng d-ới đây trình bày các ví dụ về cỡ mẫu tối thiểu ứng với các tỷ lệ mắc khác nhau và các giới hạn sai số mẫu cụ thể trong kết quả -ớc l-ợng đ-ợc.
Để sử dụng bảng này, tr-ớc hết chọn một cột trong bảng ứng với tỷ lệ hiện mắc do ta -ớc l-ợng không v-ợt quá 50%. (nếu tỷ lệ bệnh đ-ợc -ớc l-ợng là trên 50%, thì ta lại chọn cột giá trị t-ơng ứng với 100 trừ đi tỷ lệ -ớc l-ợng đó). Sau đó chọn hàng thích hợp