1. Trang chủ
  2. » Giáo án - Bài giảng

Các khái niệm lấy cỡ mẫu cơ bản

88 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Các Khái Niệm Lấy Mẫu Cơ Bản
Trường học Trường Đại Học
Định dạng
Số trang 88
Dung lượng 3,73 MB

Nội dung

Trong chöông naày chuùng toâi trình baøy ngaén goïc caùc chieán löôïc laáy maãu cô baûn töø moät quaàn theå laø moät coäng ñoàng ngöôøi. Ñoäc goiaû quan taâm saâu hôn veà caùc lyù thuyeát, cöù lieäu thoáng keâ veà laáy maãu coù theå tìm ñoïc caùc saøch veà lyù thuyeát laáy maãu. Phöông phaùp laày maãu ngaãu nhieân ñôn: Hình 1: Trong moät nghieân cöùu muoán xaùc ñònh tyû leä moät ñaëc tröng Y trong moät daân soá, hay moät soá trung bình cuaû moät ñaëc tröng Z trong daân soá. Theo qui öôùc chung tyû leä treân quaàn theå ñöôïc kyù hieäu laø P vaø soá trung bình treân quaàn theå ñöôïc kyù hieäu laø , vaø phöông sai treân quaàn theå ñöôïc kyù hieäu la 2. Do nhieàu lyù do, nhaø nghieân cöùu khoâng khaûo saùt treân quaàn theå, maø chæ khaûo saùt treân 1 maãu vôùi kích thöôùc n ñeå öôùc löôïng tyû leä ( p), soá trung bình x, phuông sai s2 nhaèm öôùc löôïng tyû leä P, soá trung bình  vaø phöông sai 2 treân quaàn theå. Neáu maãu ñöôïc laáy ngaãu nhieân töø quaàn theå thì caùc trò soá öôùc löôïng naày seõ khoâng coù sai leäch heä thoáng caùc trò soá treân quaàn theå. Trong chieán löôïc laáy maãu xaùc suaát coù 4 phöông phaùp laáy maãu cô baûn laø ngaãu nhieân ñôn, ngaãu nhieân heä thoáng, phaân taàng vaø laáy maãu cuïm.

Trang 1

Các Khái niệm lấy mẫu cơ bản

Trong chương nầy chúng tôi trình bày ngắn gọc các chiến lược lấy mẫu cơ bản từ một quần thể là một cộng đồng người Độc goiả quan tâm sâu hơn về các lý thuyết, cứ liệu thống kê về lấy mẫu có thể tìm đọc các sàch về lý thuyết lấy mẫu

Phương pháp lầy mẫu ngẫu nhiên đơn:

Hình 1:

Trong một nghiên cứu muốn xác định tỷ lệ một đặc trưng Y trong một dân số, hay một số trung bình cuả một đặc trưng Z trong dân số Theo qui ước chung tỷ lệ trên quần thể được ký hiệu là P vàsố trung bình trên quần thể được ký hiệu là , và phương sai trên quần thể được ký hiệu la 2 Do nhiều lý do, nhà nghiên cứu không khảo sát trên quần thể, mà chỉ khảo sát trên 1 mẫu với kích thước n để ước lượng tỷ lệ ( p), số trung bình x, phuơng sai s2 nhằm ước lượng tỷ lệ P, số trung bình  và phương sai 2 trên quần thể Nếu mẫu được lấy ngẫu nhiên từ quần thể thì các trị số ước lượng nầy sẽ không có sai lệch hệ thống các trị số trên quần thể

Trong chiến lược lấy mẫu xác suất có 4 phương pháp lấy mẫu cơ bản là ngẫu nhiên đơn, ngẫu nhiênhệ thống, phân tầng và lấy mẫu cụm

1 Lầy mẫu ngẫn nhiên đơn ( Simple random sampling)

Chúng ta biết số mẫu kích thước n có thể được lấy ra từ một quần thể có kích thước N, được xác địng bằng công thức N c n = N!/ n!(N-n)! Thí dụ nếu N= 25, n = 5 thì số mẫu có thể được lấy ra là25C5 = 53.130 mẫu

Do đó nếu p, x, 2

TRƯỜNG HỢP MỘT MẪU Ước lượng một tỷ lệ trong quần thể với một độ chính xác tuyệt đối

Ký hiệu và các

thông tin cần có (a) Tỷ lệ ước tính trong quần thể P

(b) Độ tin cậy 100 (1 - )%(c) Độ chính xác tuyệt đối mong muốn tính theo một biên (trong hai biên) của tỷ lệ (tính theo đơn vị phần trăm) d

Để tính được cỡ mẫu thường phải ước lượng trước trị số trong quần thể Nếukhông thể ước lượng được P, thì lấy trị số P = 0,5 (xem thí dụ 2) để tính Đólà trị số an toàn nhất để tính cỡ mẫu trong ước lượng một tỷ lệ trong quần thểbởi vì khi đó cỡ mẫu sẽ lớn nhất Nếu tỷ lệ ước tính trong quần thể được biếtlà một biên độ thì giá trị của biên nào gần nhất với 0, 5 được dùng để tính cỡmẫu

Trang 2

Phòng y tế địa phương muốn ước lượng tỷ lệ toàn bộ bệnh lao ở trẻ em dưới

5 tuổi tại địa phương họ Cỡ mẫu là bao nhiêu để tỷ lệ bệnh toàn bộ ướclượng lao động trong khoảng 5% về mỗi bên (trong hai biên) của trị số thậtvới độ tin cậy 95%, nếu phòng y tế dự đoán rằng tỷ lệ bệnh thật không vượtquá 20%

(a) Tỷ lệ bệnh ước tính trong quần thể P = 20%(b) Độ tin cậy 95%(c) Độ chính xác tuyệt đối (15-25%) d = 5%Bảng 1a (trang ??? ) cho thấy với P = 0,20 và d = 0,05 thì cỡ mẫu là 246 trẻdưới 5 tuổi

Trong thực tế, để khảo sát đủ 246 trẻ đòi hỏi đủ kinh phí và thời gian Dovậy, nhà nghiên cứu có thể giảm cỡ mẫu xuống bằng cách giảm độ tin cậyxuống

Thí dụ, độ tin cậy giảm xuống 90% thì cỡ mẫu sẽ giảm xuống còn 173 trẻ

em dưới 5 tuổi (Bảng 1b, trang ??? )

Một nhà nghiên cứu làm việc cho chương trình tiêm chủng quốc gia muốnxác định tỷ lệ trẻ em được chủng ngừa theo lịch tại địa phương Cỡ mẫu làbao nhiêu nếu tỷ lệ trẻ em được chủng ngừa dao động trong phạm vi 10%về mỗi biên (trong hai biên) của tỷ lệ tiêm chủng thực sự, ở độ tin cậy 95%(Nhà nghiên cứu không thể giả định được trước tỷ lệ tiêm chủng)

(a) Tỷ lệ dự tính trước trong quần thể

(do P không biết nên chọn trị số an toàn nhất) 50%(b) Độ tin cậy 95%(c) Độ chính xác tuyệt đối (40-60%) 10%

Bảng 1a (trang ??? ) cho thấy với P = 0,5 d = 0,10 thì cỡ mẫu là 96 trẻ em

Cỡ mẫu để ước lượng một tỷ lệ trong quần thể với độ chính xác tương

2

Trang 3

Ký hiệu và các

thông tin cần có

Việc chọn lựa giá trị của P để tính cỡ mẫu nên chọn trị số P nhỏ vì P càngnhỏ thì cỡ mẫu tối thiểu càng lớn

Bảng 2a và 2b (trang ??? ) cho biết cỡ mẫu tối thiểu ứng với độ tin cậy95% và 90%

Một nhà nghiên cứu làm việc cho chương trình tiêm chủng quốc gia muốnxác định tỷ lệ trẻ em được chủng ngừa theo lịch tại địa phương Cỡ mẫu làbao nhiêu nếu ước lượng kết quả dao động về mỗi biên (trong hai biên) củatrị số thực một giá trị bằng 10% của tỷ lệ tiêm chủng thực (khác với 10% vềmỗi biên (trong hai biên) của trị số thực) ở độ tin cậy 95% (tỷ lệ tiêm chủngkhông dưới 50%)

(a) Tỷ lệ trong quần thể ước tính 50%(chọn giá trị P nhỏ vì P dự tính  50%)

(b) Độ tin cậy 95%(c) Độ chính xác tương đối (45-55%) 10% (của 50%)

Bảng 2a (trang ??? ) cho biết với P = 0,50 và  = 0,10 thì cỡ mẫu là 384.Trong thực tế, do thiếu thời gian và kinh phí nên không thể điều tra đủ 384trẻ Khi đó người điều tra có thể làm giảm cỡ mẫu bằng cách giảm độ tincậy xuống 90% Bảng 2b (trang ??? ) cho thấy trường hợp này cỡ mẫu giảmxuống còn 271

Trong điều tra trên thực địa, phương pháp chọn mẫu ngẫu nhiên đơn hầu như

ít được dùng Nếu dùng phương pháp khác để lấy mẫu thì do ảnh hưởng củathiết kế nên cần tăng cỡ mẫu lên Thí dụ, với phương pháp chọn mẫu theocụm thì ảnh hưởng thiết kế được ước lượng bằng 2 Điều này có nghĩa là đểđạt được cùng độ chính xác như phương pháp chọn ngẫu nhiên đơn thì cỡmẫu phải tăng lên gấp 2 lần so với phương pháp chọn mẫu ngẫu nhiên đơn

Do đó, trong thí dụ này với độ tin cậy là 95% thì cỡ mẫu sẽ là 768

Cỡ mẫu tối thiểu là bao nhiêu để ước lượng tỷ lệ phụ nữ mang thai trongquần thể đi khám thai trong 3 tháng đầu của thai kỳ, trong phạm vi 5% củatỷ lệthật với độ tin cậy là 95%? Người ta dự tính tỷ lệ khám thai trong giaiđoạn này khoảng từ 25% - 40%

(a) Tỷ lệ trong quần thể ước tính 25 40%

-3

Trang 4

(b) Độ tin cậy 95%

(c) Độ chính xác tương đối 5% (của 25 -40%) Bảng 2a (trang ???) cho biết các cỡ mẫu ứng với  = 0,05 và các tỷ lệ dự tính trong quần thể trong khoảng từ 25 - 40% như sau: P Cỡ mẫu 0,25 4610

0,30 3585

0,35 2854

0,40 2305

Do đó, để đạt được mục tiêu nghiên cứu cần khảo sát 4610 phụ nữ mang thai Nếu cần, với P = 0,25 cũng có thể chọn cỡ mẫu nhỏ hơn nhưng điều đó có nghĩa là hoặc làm giảm độ chính xác, hoặc làm giảm độ tin cậy hoặc làm giảm cả hai Kiểm định giả thuyết về một tỷ lệ trong quần thể. Phần này áp dụng cho các nghiên cứu được thiết kế để kiểm định giả thuyết về tỷ lệ các thành viên trong một quần thể cùng mang một đặc trưng nào đấy có bằng với một trị số nhất định hay không Ký hiệu và các thông tin cần có Thí dụ 5 (a) Tỷ lệ trong quần thể theo giả thuyết "không" (Ho) cần kiểm định Po (b) Tỷ lệ ước tính trước trong quần thể Pa (c) Mức ý nghĩa 100% (d) Lực của test 100(1 - )% (e) Giả thuyết có (HA) hoặc Pa>Po hoặc Pa<Po (kiểm định một phía) hoặc Pa  Po (kiểm định 2 phiá)

Bảng 3a-d (trang ??? ) cho biết cỡ mẫu tối thiểu ứng với m ý nghĩa 5%, lực của test là 90% và 80%, kiểm định một phiá và 2 phiá Đối với bảng 3c và 3d, các giá trị bổ sung của Po ở hàng cột nên dùng đến khi nào trị số của Pa>0,5

Theo y văn, tỷ lệ chữa khỏi một thể bệnh ung thư nào đấy trong 5 năm là 50% (tỷ lệ bệnh nhân không tái phát ung thư trong 5 năm sau khi điều trị) Một nhà nghiên cứu muốn kiểm định giả thuyết là tỷ lệ chữa khỏi thể bệnh ung thư này tại y tế tuyến huyện cũng là 50% Vì vậy, cỡ mẫu tối thiểu là bao nhiêu để nhà nghiên cứu loại bỏ giả thuyết không (Ho): Tỷ lệ chữa khỏi tại y tế tuyến huyện là dưới 50% với ước muốn chắc chắn đến 9% phát hiện

ra tỷ lệ chữa khỏi sthật sự tại tuyến huyện là 40% ở mức ý nghĩa 5%

4

Trang 5

Bài giải

Thí dụ 6

Bài giải

Thí dụ 7

Bài giải

(a) Tỷ lệ chữa khỏi cần kiểm định 50%

(b) Tỷ lệ chữa khỏi dự tính trước 40%

(c) Mức y nghĩa 5%

(d) Lực của test 90%

(e) Giả thuyết có (HA kiểm định một phia)ù tỷ lệ chữa khỏi <50% Bảng 3a (trang ??? ) cho thấy với Po = 0,50, Pa = 0,40 thì cỡ mẫu tối thiểu là 211 Kết quả các cuộc điều tra trước đây cho thấy tỷ lệ toàn bộ bệnh sâu răng trong học sinh tại một cộng đồng vào khoảng 25% Khi thiết kế một cuộc điều tra mới, thì cỡ mẫu là bao nhiêu để kiểm định giả thuyết là tỷ lệ toàn bộ bệnh sâu răng đã giảm, nếu người điều tra muốn chắc chắn 90% phát hiện được tỷ lệ sâu răng thực sự là 20% ở mức ý nghĩa 5% (a) Tỷ lệ chữa khỏi cần kiểm định 25%

(b) Tỷ lệ chữa khỏi dự tính trước 20%

(c) Mức y nghĩa 5%

(d) Lực của test 90%

(e) Giả thuyết có (kiểm định một phia)ù tỷ lệ sâu răng < 25% Bảng 3a (trang ??? ) cho thấy với Po = 0,25, Pa = 0,20 thì cỡ mẫu tối thiểu là 601 Khi người điều tra dùng cỡ mẫu này cho nghiên cứu của họ và nếu tìm thấy tỷ lệ sâu răng thực sự thấp hớn 20% thì lực của test sẽ lớn hơn 90%, có nghĩa là các nghiên cứu chắc chăn trên 90% phát hiện được tỷ lệ này Theo y văn, tỷ lệ thành công của phương pháp điều trị ngoại khoa đối với một loại bệnh tim là 70% Một phương pháp điều trị nội khoa được đề nghị trị liệu cho bệnh này được tin là cũng có tỷ lệ thành công như ngoại khoa Tại một bệnh viện không có đủ phương tiện và nhân viên y tế để tiến hành phẫu thuật đã quyết định dùng phương pháp điều trị nội khoa cho tất cả các bệnh nhân của họ mắc loại bệnh này Cỡ mẫu là bao nhiêu để kiểm định giả thuyết là tỷ lệ thành công của phương pháp điều trị nội khoa cũng là 70% tương ứng với giả thuyết có là không phải 70% ở mức ý nghĩa 5%? Các nhà nghiên cứu muốn rằng test có sức mạnh đến 90% phát hiện ra sự khác biệt giữa tỷ lệ thành công của 2 phương pháp là từ 10% trở lên về mỗi biên (a) Tỷ lệ thành công cần kiểm định 70%

(b) Tỷ lệ thành công dự tính trước 80% hay 60% (c) Mức y nghĩa 5%

(d) Lực của test 90%

5

Trang 6

(a) Tỷ lệ khám thai cần kiểm định 40%(b) Tỷ lệ khám thai dự tính trước 35% hoặc 45%(c) Mức y nghĩa 5%(d) Lực của test 90%(e) Giả thuyết có (kiểm định hai phia)ù tỷ lệ khám thai 40%

Bảng 3c (trang ??? ) cho thấy với Po = 0,40, |Pa - Po| = 0,05 thì cỡ mẫu tốithiểu là 1022

TRƯỜNG HỢP HAI MẪU

Ước lượng sự khác biệt giữa 2 tỷ lệ trong quần thể với một độ chính xác tuyệt đối

6

Trang 7

Ký hiệu và các

thông tin cần có (a) Hai tỷ lệ trong quần thể ước tính P1 và P2

(b) Độ tin cậy 100 (1 - )%(c) Độ chính xác tuyệt đối về mỗi biên của hiệu số thực giữa 2 tỷ lệ trong quần thể (tính theo đơn vị phần trăm) d (d) Trị số trung gian V = P1 (1- P1) + P2(1- P2)

Trị số V có thể tìm thấy sẵn ở bảng 4a (trang ??? ) từ điểm giao giữa cột ứngvới P2 (hoặc trị số bổ sung của P2 và dòng ứng với P1 (hoặc các trị số bổ sungcủa P1)

Bảng 4b và 4c (trang ??? - ???) cho biết cỡ mẫu tối thiểu ở độ tin cậy 95%và 90%

Cỡ mẫu là bao nhiêu cho mỗi nhóm để ước lươạng sự khác biệt nguy cơtrong phạm vi 5% về mỗi biên ở độ tin cậy 95% khi không có cơ sở nào ướctính được trị số P1 và P2

(a) Các tỷ lệ trong quần thể ước tính:

(chọn giải pháp an toàn) 50%, 50%(b) Độ tin cậy 95%(c) Độ chính xác tuyệt đối 5%(d) Trị số trung gian 0,50

Bảng 4b (trang ??? ) cho thấy với d = 0,50 và V = 0,50 thì cỡ mẫu tối thiểucủa mỗi nhóm sẽ là 769

Trong một nghiên cứu thăm dò trên 50 nông dân làm công tác thuỷ lợi chothấy có 40% mắc bệnh sán máng tiến triển Một nghiên cứu thăm dò kháccũng trên 50 nông dân nhưng không làm thuỷ lợi cho thấy tỷ lệ này là 32%.Nếu nhà dịch tễ muốn thực hiện một nghiên cứu có qui mô lớn hơn để ướclượng sự khác biệt nguy cơ mắc bệnh sán máng trong phạm vi 5% về mỗibiên của hiệu số giữa hai tỷ lệ mắc bệnh thật ở độ tin cậy 95% thì cỡ mẫucho mỗi nhóm là bao nhiêu?

Bài giải (a) Các tỷ lệ trong quần thể ước tính 40%, 32%

(b) Độ tin cậy 95%(c) Độ chính xác tuyệt đối 5%(d) Trị số trung gian 0,46

Bảng 4b (trang ??? ) cho thấy với d = 0,50 và V = 0,46 thì cỡ mẫu tối thiểucủa mỗi nhóm sẽ là 707

7

Trang 8

Kiểm định giả thuyết về 2 tỷ lệ trong quần thể

Phần này áp dụng cho các nghiên cứu được thiết kế để kiểm định giả thuyếtlà 2 tỷ lệ trong quần thể thì bằng nhau Đối với các nghiên cứu mà các tỷ lệtrong quần thể rất bé, xin xem thí dụ 13

Ký hiệu và các

thông tin cần có (a) Trị số của sự khác biệt giữa 2 tỷ lệ trong quần thể

(theo giả thuyết không) cần kiểm định P1 - P2 = 0(b) Các tỷ lệ trong quần thể ước tính P1 và P2

(c) Mức ý nghĩa 100 %(d) Lực của test 100 (1 - )%(e) Giả thuyết có hoặc P1 - P2>0 hoặc P1 - P2<0

(kiểm định một phiá)hoặc P1 - P2  0

Người ta tin rằng tỷ lệ bệnh nhân bị biến chứng do một phương pháp phẫuthuật là 5% trong khi tỷlệ bệnh nhân bị biến chứng do phương pháp phẫuthuật thứ hai là 15% trong khi tỷ lệ bệnh nhân bị biến chứng do phương phápphẫu thuật thứ hai là 15% Cỡ mẫu trong mỗi nhóm bệnh nhân là bao nhiêunếu ngườinghiên cứu muốn lực phát hiện ra tỷ lệ biến chứng do phương phápthứ hai cao hơn có ý nghĩa so với phương pháp thứ nhất là 90% ở mức ýnghĩa là 5%

(a) Sự khác biệt tỷ lệ biến chứng của 2 phương pháp cần kiểm định 0% (b) Các tỷ lệ biến chứng ước tính 5%, 15%(c) Mức ý nghĩa 5%(d) Giả thuyết có sự khác biệt nguy cơ (P1 - P2) <0%(kiểm định một phiá)

Thí dụ 12

Bảng 5a (trang ??? ) cho thấy với P1 = 0,05 và P2 = 0,15 thì cỡ mẫu tối thiểuBảng 5a (trang ) cho thấy với P1 = 0,05 và P2 = 0,15 thì cỡ mẫu tối thiểucho mỗi nhóùm là 153

(2) Để biết sâu hơn về các tỷ lệ nhớ tìm đọc Lemeshow, S et al, … Adeauacy of sample size in health studies (Chicheste, John Wiley, 1990; Tổ Chức Y Tế Thế Giới bảo trợ).

Trong một điều tra thăm dò tại một nước đang phát triển, nhà dịch tễ so sánh

1 mẫu 50 người lớn mắc một chứng bệnh thần kinh với một mẫu 50 người lànhững người không mắc bệnh 30 người lớn trong nhóùm mắc bệnh (60%) và

25 người trong nhóm không mắc bệnh (50%) làm các nghề có liên quan đếnviệc đánh bắt cá Nếu tỷ lệ người dân làm các nghề có liên quan đến việcđánh bắt cá trên toàn bộ quần thể bằng với tỷ lệ trong cuộc thăm dò trênmẫu này, thì cỡ mẫu sẽ là bao nhiêu cho mỗi nhóm trong một nghiên cứu cóqui mô lớn hơn, khi mà dịch tễ muốn chắc chắn đến 90% pháthiện ra sự khác

8

Trang 9

Bài giải

Bài giải

biệt thật sự giữa 2 nhóm ở mức ý nghĩa 5%?

(a) Sai biệt giữa 2 tỷ lệ làm các nghề liên quan đến đánh bắt cá cần kiểmđịnh 0%(b) Các tỷ lệ làm các nghề liên quan đến đánh bắt cá (ước tính) 60%, 50%

(c) Mức ý nghĩa 5%(d) Lực của test 90% (e) Giả thuyết có (kiểm định hai phiá) sự sai biệt nguy cơ  0%

Bảng 5c (trang ??? ) cho thấy cỡ mẫu là điểm giao giữa cột có chứa các trịsố nhỏ nhất của P1, P2, các trị số bổ sung của P1, P2 và dòng có chứa các trị sốcủa |P2 - P1| Trong trường hợp này, với 1 - P1 = 0,4 và |P2 - P1| = 0,10 thì cỡmẫu tối thiểu là 519 cho mỗi nhóm

Hai cộng đồng tham gia vào một nghiên cứu đánh giá một chương trình sànglọc nhằm phát hiện sớm một loại bệnh ung thư Ở cộng đồng thứ nhất,chương trình sàng lọc bệnh tiến hành trên tất cả mọi người có độ tuổi trên

35, trong khi cộng đồng thứ hai không tiế hành sàng lọc bệnh Tỷ lệ bệnhung thư mới mắc hàng năm ở cộng đồng không qua sàng lọc là 50/100.000(=0,0005) Nếu tỷ lệ này giảm xuống còn 20/100.000 (=0.0002) ở dân số quachương trình sàng lọc thì đó là cơ sở để triển khai đại trà chương trình sànglọc Cỡ mẫu là bao nhiêu cho mỗi cộng đồng nếu người nghiên ứu muốn cóđến 80% cơ hội để phát hiện ra việc giảm tỷ lệ bệnh mới ở mức này, ở mức

ý nghĩa 5%?

(a) Sự khác biệt giữa 2 tỷ lệ bệnh ung thư cần kiểm định 0%(b) Các tỷ lệ bệnh ung thư dự tính 0,05%: 0,02ø%(c) Mức ý nghĩa 5%(d) Lực của test 80%(e) Giả thuyết có sự sai biệt giữa 2 tỷ lệ (kiểm định 1 phiá) (P1 - P2) > 0%

Bảng 5f (trang ??? ) cho thấy với P1 = 0,0005 và P2 = 0,0002 thì cỡ mẫu tốithiểu cho mỗi nhóm là 45.770

CÁC NGHIÊN CỨU BỆNH – CHỨNG

Các thí dụ 14 và 15 liên quan đến tỷ số chênh (OR) là tỷ số giữa độ chênhcủa một biến số xảy ra trong cùng một hoàn cảnh và độ chênh cũng của biến

9

Trang 10

cố đó nhưng xảy ra trong hoàn cảnh khác Thí dụ, nếu biến cố đó là mộtbệnh thì số mắc bệnh và số không mắc bệnh có thể được xếp theo sự tiếpxúc với yếu tố nguy cơ nào đó như sau:

Tiếp xúc Không tiếp xúcMắc bệnh a bKhông mắc bệnh c d

Như vậy tỷ số chênh sẽ là ad/bc (3)

Ước lượng tỷ số chênh với một độ chính xác tương đối

Ký hiệu và các

thông tin cần có

Thí dụ 14

(a) Hai trong ba trị số cần biết

 Xác xuất tiếp xúc ở nhóm bệnh (ước tính) c/(a+b) P1

 Xác xuất tiếp xúc ở nhóm chứng (ước tính) c/(a+d) P2

 Tỷ số chênh (ước tính) OR (b) Độ tin cậy 100 (1 - )%(c) Độ chính xác tương đối 

Khi số mắc bệnh trong quần thể tương đối ít so với người không mắc bệnhthì:

c  (a + c)Và

( 3) Để có thể rõ hơn có thể tìm đọc Dịch tễ học cơ bản của Lê Hoàng Ninh và Nuyễn Văn Truyền chủ biên, NXB Y học 1995.

Tại một vùng mà bệnh tả là vấn đề y tế công cộng hàng đầu, với khoảng30% dân số dùng nguồn nước bị nhiễm bẩn Một nghiên cứu bệnh chứng vềsự liên quan giữa bệnh tả và sự tiếp xúc với nguồn nước nhiễm bẩn đượctiến hành tại vùng này để ước lượng tỷ số chênh với độ chính xác tương đốibằng 25% của trị số chênh thật sự mà trị số này ước tính gần bằng 2 với độ

10

Trang 11

tin cậy bằng 95% Cỡ mẫu tối thiểu là bao nhiêu cho mỗi nhóm bệnh vànhóm chứng

Bài giải (a) Xác xuất tiếp xúc ở nhóm bệnh (ước tính)

Xác xuất tiếp xúc ở nhóm chứng (ước tính) (gần bằng với tỷ lệ tiếp xúc toàn bộ trong quần thể)30%

Tỷ số chênh (ước tính) 2(b) Độ tin cậy 95%(c) Độ chính xác tương đối 25%

Bảng 6C (trang 44) cho biết với OR = 2 và P2* = 0,3 thì cỡ mẫu cho mỗinhóm là 408

Kiểm định giả thuyết về tỷ số chênh (OR)

Phần này trình bày điểm chính cách xác định cỡ mẫu tối thiểu để kiểm địnhgiả thuyết là tỷ số chênh trong quần thể bằng 1

(a) Tỷø số chênh theo giả thuyết không (Ho) cần kiểm định ORo = 1

(b) Hai trong 3 trị số sau đây cần phải biết:

 Xác xuất tiếp xúc ở nhóm bệnh (ước tính) : a/(a+b) P1*

 Xác xuất tiếp xúc ở nhóm chứng (ước tính): c/(a+d) P2*

 Tỷ số chênh (ước tính) ORa

(c) Mức ý nghĩa 100 %(d) Lực của test 100 (1 - )%(e) Giả thuyết có (HA)

(kiểm định 2 phiá) OR+a 

Nếu ORa < 1 thì trị số P1 và 1/ORa được dùng thay thế

Hiệu lực vaccin BCG trong phòng lao ở trẻ em còn bị nghi ngờ nên mộtnghiên cứu được thiết kế để so sánh tỷ lệ chủng ngừa lao ở nhóm bệnh lao

11

Trang 12

Bài giải

và nhóm chứng Các thông tin hiện có cho thấy khoảng 30% trẻ trong nhóm chứng không chủng ngừa BCG Các nhà nghiên cứu muốn có đến 80% cơ hội phát hiện ra tỷ số chênh không bằng 1 ở mức ý nghĩa 5% Nếu tỷ số chênh bằng 2 được coi như tỷ lệ chủng ngừa BCG ở 2 nhóm bệnh và chứng khác biệt có ý nghĩa thì cỡ mẫu tối thiểu cho mỗi nhóm là bao nhiêu?

(a) Tỷ số chênh cần kiểm định 1

(b) Xác xuất tiếp xúc ở nhóm bệnh (ước tính) ?

Xác xuất tiếp xúc ở nhóm chứng (ước tính) 30%

Tỷ số chênh (ước tính) 2

(c) Mức ý nghĩa 5%

(d) Lực của test 80% (e) Giả thuyết có (HA) tỷ số chênh  1

Bảng 7b (trang ??? ) cho thấy với OR = 2 và P2* = 0,3 thì cỡ mẫu tối thiểu cho mỗi nhóm là 130

CÁC NGHIÊN CỨU ĐOÀN HỆ (COHORT)

Ước lượng nguy cơ tương đối với độ chính xác tương đối

12

Trang 13

Ký hiệu và các

thông tin cần cóù (a) Hai trong các trị số cần có:

 Xác xuất mắc bệnh ở nhóm tiếp xúcvới yếu tố nguy cơ (ước tính) P1

 Xác xuất mắc bệnh ở nhóm không tiếp xúc (ước tính) P2

 Nguy cơ tương đối (ước tính) RR(b) Độ tin cậy 100 (1 - )%

(c) Độ chính xác tương đối 

Một nhà dịch tễ thiết kế một nghiên cứu để điều tra mối quan hệ giữa mộtchất gây ô nhiễm không khí mới được xác nhận gần đây với một loại bệnhphổi Cỡ mẫu tối thiểu cho mỗi nhóm tiếp xúc và không tiếp xúc là baonhiêu nếu dịch tễ muốn ước lượng nguy cơ tương đối trong phạm vi 50% củatrị số thật (mà trị số này ước tính gần bằng 2) với độ tin cậy 95%? Biết rằngtỷ lệ bệnh ở nhóm không tiếp xúc với chất ô nhiễm không khí là20%

(a) Xác xuất mắc bệnh ở nhóm tiếp xúc (ước tính) ? Xác xuất mắc bệnh ở nhóm không tiếp xúc (ước tính) 20% Nguy cơ tương đối (ước tính)

(b) Độ tin cậy 95%(c) Độ chính xác tương đối 50%

Bảng 8d (trang ??? ) cho thấy với RR = 2 và P2 = 0,20 thì cỡ mẫu tối thiểucho mỗi nhóm là 44

Kiểm định giả thuyết về nguy cơ tương đối.

Phần này nêu những điểm chính, cách xác định cỡ mẫu tối thiểu để kiểmđịnh giả thuyết là nguy cơ tương đối trong quần thể bằng 1

Ký hiệu và các

thông tin cần có (a) Nguy cơ tương đối theo giả thuyết không cần kiểm định Ro

=1(b) Hai trong các trị số sau đây cần có:

13

Trang 14

 Xác xuất mắc bệnh ở nhóm tiếp xúc (ước tính) P1

 Xác xuất mắc bệnh ở nhóm không P2

(c) Mức ý nghĩa 100%(d) Lực của test 100 (1-)

%

(e) Giả thuyết có (HA) RRA  RRo

(e) Giả thuyết có RRa (kiểm định 2 phía)

Các bảng 9a-c (trang ??? ) cho biết rõ cỡ mẫu ở mức ý nghĩa 5% và lực củatest là 90%, 80% và 50% kiểm định về 2 phiá

Nếu RRa < 1, các trị số của P1 và 1/ RRa được dùng thay thế

Hai phương pháp điều trị một loại bệnh ung thư được đánh giá theo kiểunghiên cứu đoàn hệ trong một thử nghiệm lâm sàng tại nhiều trung tâm Cácbệnh nhân được phân phối ngẫu nhiên để nhận hoặc liệu pháp A hoặc liệupháp B và được theo dõi nguy cơ tái phát bệnh trong 5 năm sau khi điều trị.Liệu pháp A là phương pháp mới sẽ được triển khai đại trà nếu biện phápnày chứng tỏ cho thấy nguy cơ tái phát bệnh trong 5 năm đầu sau điều trịgiảm một nửa (RRa = 0,5), trong khi nguy cơ tái phát ở những bệnh nhânđiều trị phương pháp B là 35% Cỡ mẫu trong mỗi nhóm là bao nhiêu nếunhóm nghiên cứu muốn chắc chắn đến 90% loại bỏ giả thuyết không (RRo =1) nếu giả thuyết này sai và test được thực hiện ở mức ý nghĩa 5%?

(a) Nguy cơ tương đối cần kiểm định 1(b) Xác xuất tái phát của liệu pháp A (ước tính) ? Xác xuất tái phát của liệu pháp B (ước tính) 35% Nguy cơ tương đối (ước tính) 0,5(c) Mức ý nghĩa 5%(d) Lực của test 90%(e) Giả thuyết có (HA) nguy cơ tương đối  1

Bảng 9a (trang ) cho thấy với RRa = 0,5 (1/RRa = 2) và P2= 0,35 (P1 =0,175) thì cỡ mẫu tối thiểu cho mỗi nhóm là 135 (số này có được qi tắc nộisuy, con số chính xác qua tính toán là 131)

14

Trang 15

LẤY MẪU BẢO ĐẢM CHẤT LƯỢNG MỘT LÔ

Chấp nhận tỷ lệ bệnh toàn bộ trong quần thể không lớn hơn một trị số nào đấy

Phần này nêu những điểm chính, cách xác định cỡ mẫu tối thiểu cần chọn ra từ một quần thể định sẵn để mà, nếu như khi khảo sát trên mẫu thấy một đặc trưng đang nghiên cứu không lớn hơn một trị số nhất định nào đấy, thì tỷ lệ toàn bộ của đặc trưng này trên quần thể cũng không lớn hơn một trị số nào đấy

Ký hiệu và các

thông tin cần có (a) Tỷ lệ toàn bộ trong quần thể (ước tính) P

(b) Kích thước quần thể N (c) Số tối đa các cá thể trong mẫu có đặc trưng đang nghiên cứu d*

(d) Độ tin cậy 100 (1 - )%

Thí dụ 18

Bài giải

Ký hiệu và các

Các bảng 10a-j (trang ??? ) trình bày cỡ mẫu tối thiểu ứng với độ tin cậy 95% và 90% và trị số của d*từ 0 tới 4

Tại một trường có 2500 học sinh, cỡ mẫu là bao nhiêu nếu khi khảo sát trên mẫu thấy không quá 2 em có ký sinh trùng sốt rét trong máu thì cho phép kết luận rằng tỷ lệ toàn bộ bệnh sốt rét tại trường này không vượt quá 10% với độ tin cậy 95%?

(a) Tỷ lệ toàn bộ trong quần thể (ước tính) 10%

(b) Kích thước quần thể 2500

(c) Số tối đa cá thể trong mẫu mắc bệnh sốt rét 2

(d) Độ tin cậy 95%

Bảng 10 c (trang ??? ) cho thấy với P = 0,10 và N = 2500 thì cỡ mẫu tối thiểu là 61 trẻ em

Nguyên tắc quyết định "loại bỏ một lô"

Phần này được áp dụng cho những nghiên cứu được thiết kế để kiểm định một lô (quần thể mà từ đó mẫu được lấy ra) có cùng đạt một chuẩn mực hay không Giả thuyết không trong trường hợp này là tỷ lệ cá thể trong quần thể cùng có một đặc trưng đang nghiên cứu thì bằng với một trị số định trước và việc kiểm định được thực hiện về một phiá nhằm xác định lô được chấp nhận là cùng một chuẩn mực , nếu giả thuyết không bị loại bỏ

Để làm được điều này, trị số ngưỡng các cá thể mang đặc trưng này cần được tính toán để làm cơ sở cho việc ra quyết định:

Nếu số cá thể trong mẫu có mang đặc trưng nghiên cứu không vượt qua ngưỡng thì giả thuyết không bị loại bỏ (và lô được chấp nhận) Ngược lại, nếu vượt qua ngưỡng thì lô bị loại bỏ

15

Trang 16

thông tin cần có a) Tỷ lệ trong quần thể theo giả thuyết "không" cần kiểm định Po

(b) Tỷ lệ trong quần thể (ước định) Pa

(c) Mức ý nghĩa 100 %

(d) lực của test (100 (1 - )%

Thí dụ 19 Bài giải Các bảng 11a-c (trang ??? ) trình bày cỡ mẫu tối thiểu ứng với mức ý nghĩa 5%, lực của test 90% và 80% kiểm định về 1 phiá Lãnh đạo Sở Y tế một thành phố lớn đề ra mục tiêu chủng ngừa đạt tỷ lệ 90% cho tất cả các trẻ em trong diện tiêm Nhằm đối phó với quản ngại rằng một vài loại bệnh ở trẻ em có thể bùng phát thành dịch tại một số khu vực của thành phố Nhóm nghiên cứu của Sở đang thiết kế một cuộc điều tra để xác định các khu vực có tỷ lệ tiêm chủng bằng hoặc thấp hơn 50% để có biện pháp can thiệp thích ứng Cỡ mẫu tối thiểu tại mỗi khu vực và trị số ngưỡng nên chọn là bao nhiêu để kiểm định giả thuyết Tỷ lệ trẻ em không chủng ngừa là từ 50% trở lên, ở mức ý nghĩa 5%? Nhóm nghiên cứu muốn chắc chắn đến 90% tìm ra các khu vực có tỷ lệ chủng ngừa đạt mục tiêu đề ra của Sở (Nghĩa là tại các khu vực đó chỉ có 10% trẻ không được chủng ngừa đầy đủ) (a) Tỷ lệ trong quần thể cần kiểm định 50%

(b) Tỷ lệ trong quần thể (ước định) 10%

(c) Mức định nghĩa 5%

(d) Lực của test 90%

Do nhầm lẫn tai hại ở những nhóm trẻ được xem là chủng ngừa đạt mục tiêu thì tỷ lệ tiêm chủng thực sự chỉ bằng hoặc thấp hơn 50%, Po = 0,50 và Pa = 0,10 Bảng 11a (trang ??? ) cho thấy trong trường hợp này cỡ mẫu là 10 và

vị trí số ngưỡng là 2

Do đó, tại mỗi khu vực một mẫu 10 trẻ sẽ được điều tra Nếu có hơn 2 trẻ trong mẫu không được chủng ngừa thì cả lô (tức quần

thể mà từ đó mẫu được lấy ra) sẽ bị loại, và lãnh đạo Sở sẽ tiến hành các bước can thiệp thích hợp để nâng cao tỷ lệ chủng ngừa tại khu vực này Tuy nhiên nếu chỉ phát hiện ít hơn hoặc bằng 2 trẻ không được chủng ngừa thì giả thuyết "không" bị loại bỏ và nhóùm trẻ tại khu vực này không được xem là nhóm trẻ ưu tiên trong chiến dịch chủng ngừa bổ sung

16

Trang 17

CÁC NGHIÊN CỨU VỀ TỶ LỆ BỆNH MỚI Ước lượng tỷ lệ bệnh mới với độ chính xác tương đối.

Ký hiệu và các

thông tin cần có (a) Độ chính xác tương đối 

(b) Độ tin cậy 100 (1 - )%

(a) Độ chính xác tương đối 10%(b) Độ tin cậy 95%

Bảng 12 cho thấy với  = 0,10 và độ tin cậy bằng 95% thì cỡ mẫu tối thiểu là385

Kiểm định giả thuyết về tỷ lệ bênh mới

Phần này áp dụng cho các nghiên cứu được thiết kế nhằm kiểm định giảthuyết là tỷ lệ bệnh mới (hay một hệ quả) thì bằng với một trị số nào đấy

Ký hiệu và các

thông tin cần có (a) Tỷ lệ bệnh mới trong quần thể theo giả thuyết

"không" cần kiểm định o

(b) Tỷ lệ bệnh mới trong quần thể (ước tính) a

(c) Mức ý nghĩa 100 %(d) Lực của test 100 (1 - )%(e) Giả thuyết có (HA) hoặc a > o hoặc a < o

(kiểm định 1 phiá) hoặc a  o (kiểm định 2 phiá)

Các bảng 13a-d (trang ??? ) trình bày các cỡ mẫu tối thiểu ứng với mức ýnghĩa 5%, lực của test 90% và 80% kiểm định về 1 phiá và 2 phiá

Thí dụ 21 Một nghiên cứu đoàn hệ theo dõi trong 5 năm trên 1 số ít ngưới dân cho thấy

tỷ lệ bệnh mới hằng năm của 1 bệnh là 40% Cỡ mẫu tối thiểu là bao nhiêuđể kiểm định giả thuyết Tỷ lệ bệnh mới trong quần thể là 40% ở mức ýnghĩa 5%? Nhà nghiên cứu muốn rằng test có sức mạnh đến 90% cơ hội pháthiện ra tỷ lệ bệnh mới thực sự hàng năm là 40% và loại bỏ giả thuyết

"không" nếu tỷ lệ bệnh thật lớn hơn 40%

17

Trang 18

Bài giải (a) Tỷ lệ bệnh mới cần kiểm định 40%

(b) Tỷ lệ bệnh mới ước tính 50%

(c) Mức ý nghĩa 5%

(d) Lực của test 90%

(e) Giả thuyết "có" (kiểm định 1 phiá) tỷ lệ bệnh mới > 40% Bảng 13a (trang ??? ) cho thấy với o = 0,40 và a = 0,05 thì cỡ mẫu tối thiểu là 169 Kiểm định giả thuyết về 2 tỷ lệ bệnh mới trong các nghiên cứu đoàn hệ. Phần nay áp dụng cho nghiên cứu được thiết kế để kiểm định giả thuyết là các tỷ lệ bệnh mới (hay một hệ quả, một đặc trưng nào đó ở 2 nhóm thì bằng nhau Các đối tượng hoặc được đưa vào các nhóm nghiên cứu cùng một lúc và được theo dõi cho đến khi hệ quả đang nghiên cứu xảy ra hay không thể theo dõi được nữa (xem thí dụ 22), hoặc được quy vào các nhóm nghiên cứu khi thời điểm tiếp xúc xác định được và chỉ theo dõi đến một thời gian nhất định nào đó mà thôi (xem thí dụ 23) Ký hiệu và các thông tin cần có (a) Sự sai biệt giữa các tỷ lệ bệnh mới trong quần thể theo giả thuyết không cần kiểm định 1 - 2 = 0 (b) Các tỷ lệ bệnh mới (ước tính) 1 và 2 (c) Mức ý nghĩa 100 % (d) Lực của test 100 (1 - )% (e) Giả thuyết có (HA) hoặc 1 - 2 > 0 hoặc 1 - 2 < 0

(kiểm định 1 phiá) hoặc 1 2  0 (kiểm định 2 phiá) (f) Thời khoảng nghiên cứu (nếu hằng định) T

Nếu một nghiên cứu kết thúc trước khi tất cả các đối tượng có đủ thời gian cần thiết để hệ quả bệnh tật có thể xảy ra, khi đó sự quan hệ quả bệnh tật trên mọi đối tượng bị hạn chế Do đó cần hiệu chỉnh tỷ lệ mới  theo công thức sau:

f () = 3T/(T - 1 + e-T) như trong thí dụ 23

Các bảng 14a-d (trang ??? ) trình bày cỡ mẫu tối thiểu ứng với mức ý nghĩa 5%, lực của test là 90% và 80%, kiểm định về 1 phiá và cả 2 phiá, khi thời khoảng nghiên cứu không hằng định và cỡ mẫu ở 2 nhóm bằng nhau Đối với các nghiên cứu hằng định thì ở đây không có bảng nào để ứng dụng vì có quá nhiều tham số liên quan đến việc tính cỡ mẫu nên rất khó xếp vào bảng

18

Trang 19

(a) Sự khác biệt giữa các tỷ lệ bệnh mới cần kiểm định 0(b) Các tỷ lệ bệnh mới (ước định) 25%, 10%(c) Mức ý nghĩa 5%(d) Lực của test 80%(e) Giả thuyết có (kiểm định 2 phiá) 1  2

(f) Thời khoảng nghiên cứu (không áp dụng)

Bảng 14d (trang 80) cho thấy với 1 = 0,25 và 2 = 0,10 thì cỡ mẫu tối thiểucho mỗi nhóm công nhân là 23

Một nghiên cứu có các điểm giống như trong thí dụ 22 cũng được tiến hành,nhưng có 1 điểm khác là thời khoảng nghiên cứu giới hạn trong 5 năm Cỡmẫu là bao nhiêu cho mỗi nhóm?

(a) Sự khác biệt giữa các tỷ lệ bệnh mới cần kiểm định 0(b) Các tỷ lệ bệnh mới (ước định) 25%, 10%(c) Mức ý nghĩa 5%(d) Lực của test 80%(e) Giả thuyết có (kiểm định 2 phiá) 1  2

(f) Thời khoảng nghiên cứu 5 năm

Trị số  cần chỉnh lý theo công thức đã nêu ở trang 18

f(= 0,175) = 0,0918 trong đó  = (1 + 2)/2 f(1 = 0,25) = 0,1456

f(2 = 0,10) = 0,0469Công thức tính cỡ mẫu như sau:

n1 = Z1 - /2 [(1 k)  f(  )]  Z1 -  [kf( 1)  f( 2)]2/(1 - 2)2

19

Trang 20

Trong đó k là tỷ số giữa cỡ mẫu trong nhóm thứ 2 (n2) và cỡ mẫu trong nhómthứ (n1) (trong trường hợp này k = 1).

Do đó:

n1 = 1,96 [ 2 ( 0 , 0918 )]  0,842 (0,1456  0,04692/(0,25 - 0,10)2

= 1,462/0,023

= 65,0

Như vậy cỡ mẫu tối thiểu cho mỗi nhóm là 65

Khi kiểm định một phía, công thức để tính cỡ mẫu như sau:

n1 = Z1 -  [( 1 k)f(  )] + Z1 -  [kf( 1)  f( 2)]2/(1  2)2

20

Trang 21

ĐỊNH NGHĨA CÁC THUẬT NGỮ THÔNG DỤNG

Lấy mẫu đảm

Bảo chất lượng 1 lô

Các định nghĩa ngắn gọn liệt kê ở đây nhằm lại cho độc giả Các giải thíchđầy đủ hơn về các thuật ngữ thống kê và các lý giải về lý thuyết thốâng kêdùng để tính cỡ mẫu được trình bày trong cuốn sách của Lemeshow, S vàcộng sự, Adequacy of Samole size in health studies (Chichester, John Wiley,

1990 được xuất bản dưới sự bảo trợ của Tổ chức y tế thế giới

Mức ý nghĩa của test: xác xuất để loại bỏ giả thuyết "không" khi giả thuyếtnày đúng (xác xuất sai lầm loại I)

Xác xuất chấp nhận giả thuyết "không" khi giả thuyết này sai (xác xuất sailầm loại II)

Là nghiên cứu mà các đối tượng đưa vào nghiên cứu trên căn bản là chúngcó mang một đặc trưng nào đó (như mắc một bệnh); nhóm bệnh gồm các cáthể có mang đặc trưng này (bệnh) và nhóm chứng không mang đặc trưng này(không bệnh) Cả hai nhóm đều được nghiên cứu để xác định tình hình tiếpxúc trước đây cũng như hiện nay với một yếu tố nguy cơ nào đấy nghi ngờ lànguyên nhân của bệnh

Là kiểu lấy mẫu theo đơn vị, đơn vị này là các cụm hoặc các nhóm trong cácđơn vị nghiên cứu

Là nghiên cứu mà các đối tượng được chọn lựa đưa vào nghiên cứu dựa trêncăn bản là có hay không có đặc trưng đó (thí dụ như có hoặc không có tiếpxúc với một yếu tố nguy cơ) bị nghi ngờ là có liên quan đến một hệ quả nàođó (như một bệnh chẳng hạn) Các đối tượng trong cả 2 nhóm (tiếp xúc vàkhông tiếp xúc) đều được theo dõi để xem hệ quả xảy ra như thế nào

Xác xuất để ước lượng một tham số trong quần thể thì nằm trong phạm vicác giá trị giới hạn của trị số thật,thường được ký hiệu"1-"

Trong cách chọn mẫu theo cụm, tác động thiết kế cho biết sai biệt do lấymẫu theo cụm Tác động thiết kế được ước lượng bằng tỷ số giữa phương saikhi chọn mẫu theo cụm và phương sai khi chọn mẫu theo kiểu ngẫu nhiênđơn

Là số một biến cố nào đó (thí dụ như số ca mới mắc) tính trên một quần thểnhất định theo một đơn vị thời gian

Là kỹ thuật lấy mẫu có nguồn gốc từ công nghiệp, kiểu lấy mẫu sao chođảm bảo chắc chắn rằng lô hàng mà từ đó mẫu lấy ra đạt các tiêu chuẩn chất

21

Trang 22

Lot quality sampling

Giả thuyết "không"

Là tỷ số giữa số chênh của một biến cố xảy ra trong cùng một tình huống vàsố chênh cũng của biến cố đó nhưng xảy ra trong tình huống khác (đề cập lại

ở trang ??? )

Dùng trong kiểm định giả thuyết, khi sự khác biệt được kiểm định về mộtphiá xác định trước (thí dụ, kiểm định giả thuyết không là (Ho):  1   2, ngờinghiên cứu chỉ muốn kiểm định xem có đúng là x1   2hay không, chứkhông kiểm định  1   2

Tỷ lệ các cá thể trong quần thể có mang một đặc trưng nào đó

Xác xuất để loại bỏ chính xác giả thuyết không khi giả thuyết này sai,thường được ký hiệu "1 - "

Số đo sao cho ước lượng đúng trị số thật một tham số trong quần thể Ta cóthể ước lượng trị số thật theo độ chính xác tuyệt đối và tương đối

Số ca hiện mắc bệnh (hoặc người mang một đặc trưng nào đó) trong quầnthể tại tại một thời điểm nào đó

Là tỷ lệ nguy cơ (xác xuất) một hệ quả (như mắc bệnh hay tử vong) ở nhómtiếp xúc và nhóm không tiếp xúc với yếu tố nguy cơ

Xem định nghĩa 

Là cách lấy mẫu mà từng đơn vị nghiên cứu (study unit) có cùng một cơ mayđược chọn lựa và từng mẫu đều có cùng một cơ may được chọn

Các cá thể của một quần thể được chọn đo lường một số đặc trưng

Dùng trong kiểm định giả thuyết, khi sự khác biệt được kiểm định khôngtheo một hướng định trước (thí dụ, trong kiểm định không xác định  1   2hay  1   2 mà chỉ xác định  1   2

Số sai chuẩn từ số trung bình Z1, Z 1 -/2; là các hàm số của độ tin cậy và

 1

Z là hàm của lực của test

(4) Để rõ hơn có thể tìm đọc: Dịch tễ học cơ bản, Lê Hoàng Ninh và Nguyễn Văn Truyền chủ biên, NXB Y học 1995.

22

Trang 23

(5) Tìm đọc tài liệu (in Roneo): Phương pháp chọn mẫu, kiểm định giả thuyết, Sự ước lượng do BS Lê Hoàng Ninh biên soạn dành cho hội thảo: Thống kê ứng dụng trong nghiên cứu dịch tễ tổ chức tại Viện VSYTCC Tp Hồ Chí Minh 1994.

23

Trang 24

Bảng 1a Ước lượng một tỷ lệ trong quần thể với một độ chính xác tuyệt đối

(1a) độ tin cậy 95%

p

d 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,55 0,60 0,65 0,70 0,75 0,80 0,85 0,90 0,950,01 1825 3457 4898 6147 7203 8067 8740 9220 9508 9608 9508 9220 8740 8067 7203 6147 4898 3457 18250,02 456 864 1225 1537 1801 2017 2185 2305 2377 2401 2377 2305 2185 2017 1801 1537 1225 864 456

2

Z

n  x/ (  ) /

Trang 25

Bảng 1b Ước lượng một tỷ lệ trong quần thể với một độ chính xác tuyệt đối

(1b) Độ tin cậy 90%

P

D 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,55 0,60 0,65 0,70 0,75 0,80 0,85 0,90 0,950,01 1285 2435 3450 4330 5074 5683 6156 6494 6697 6765 6697 6494 6156 5683 5074 4330 3450 2435 12850,02 321 609 863 1082 1268 1421 1539 1624 1674 1691 1674 1624 1539 1421 1268 1082 863 609 321

Trang 26

Bảng 2a Ước lượng một tỷ lệ quần thể với một độ chính xác tương đối

(2a) độ tin cậy 95%

p

0,01 729904 345744 217691 153664 115248 89637 71344 57624 46953 38416 31431 25611 20686 16464 12805 9604 6779 4268 2022 0,02 182476 86436 54423 38416 28812 22409 17836 14406 11738 9604 7858 6403 5171 4116 3201 2401 1695 1067 505 0,03 81100 38416 24188 17074 12805 9960 7927 6403 5217 4268 3492 2846 2298 1829 1423 1067 753 474 225 0,04 45619 21609 13606 9604 7203 5602 4459 3602 2935 2401 1964 1601 1293 1029 800 600 424 267 126

1-x/2( 1  ) / 

26

Trang 27

Bảng 2b Ước lượng một tỷ lệ trong quần thể với một độ chính xác tương đối

(2b) Độ tin cậy 90%

d

P 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,55 0,60 0,65 0,70 0,75 0,80 0,85 0,90 0,950,01 514145 243542 153341 108241 81181 63141 50255 40590 33074 27060 22140 18040 14571 11597 9020 6765 4775 3007 1424 0,02 128536 60886 38335 27060 20295 15785 12564 10148 8268 6765 5535 4510 3643 2899 2255 1691 1194 752 356 0,03 57127 27060 17038 12027 9020 7016 5584 4510 3675 3007 2460 2004 1919 12289 1002 752 531 334 158

Trang 28

Bảng 3a Kiểm định giả thuyết về một tỷ lệ trong quần thể

1 P o 1 P o P a 1 P a P o P a z

1 2

Trang 29

Bảng 3b Kiểm định giả thuyết về một tỷ lệ trong quần thể

(3b) Mức ý nghĩa 5%, lực của test 80%, kiểm định một phiá

Trang 30

Bảng 3c Kiểm định giả thuyết về một tỷ lệ trong quần thể

(3c) Mức ý nghĩa 5%, lực của test 90%, kiểm định hai phiá

* Cỡ mẫu nhỏ hơn 5

X là trị số nhỏ hơn của Po và (1-Po)

30

Trang 31

Bảng 3 Kiểm định giả thuyết về một tỷ lệ trong quần thể

(3d) Mức ý nghĩa 5%, lực của test 80%, kiểm định hai phiá

Cỡ mẫu nhỏ hơn 5

X là trị số nhỏ hơn của Po và (1-Po )

31

Trang 32

Bảng 4 Ước lượng sự khác biệt giữa 2 tỷ lệ trong quần thể với một độ chính xác tuyệt đối.

2 2 1 1 2 1

Trang 33

Bảng 4a (tiếp theo) Ước lượng sự khác biệt giữa 2 tỷ lệ trong quần thể với một độ chính xác tuyệt đối.

X là trị số nhỏ hơn của P2 và (1–P2)

Y là trị số nhỏ hơn của P1 và (1–P1)

33

Trang 34

Bảng 4b Ước lượng sự khác biệt giữa 2 tỷ lệ trong quần thể với một độ chính xác tuyệt đối.

(4b) Cỡ mẫu ở độ tin cậy 95%

Trang 35

* Cỡ mẫu nhỏ hơn 5

35

Trang 36

Bảng 4c Ước lượng sự khác biệt giữa 2 tỷ lệ trong quần thể với một độ chính xác tuyệt đối Cỡ mẫu ở độ tin cậy 90%

Trang 37

Bảng 5 Kiểm định giả thuyết về 2 tỷ lệ trong quần thể

2 1

2 2 2 1 1 - 1

2 2 2 1 1 - 1 2

2

2 11

2 1 2 /

Trang 38

Bảng 5b Kiểm định giả thuyết về 2 tỷ lệ trong quần thể

(5b) Mức ý nhgĩa 5%, lực của test 80%, kiểm định một phiá

Trang 39

Bảng 5 c Kiểm định giả thuyết về 2 tỷ lệ trong quần thể

(5c) Mức ý nhgĩa 5%, lực của test 90%, kiểm định hai phiá

Trang 40

Bảng 5d Kiểm định giả thuyết về 2 tỷ lệ trong quần thể

(5d) Mức ý nghĩa 5%, lực của test 80%, kiểm định hai phiá

Ngày đăng: 02/04/2024, 08:38

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w