Các kỹ thuật chọn mẫu và u nh-ợc điểm

Một phần của tài liệu Tài liệu thực hành đo lường sự kết hợp giữa nguy cơ và bệnh (Trang 30 - 35)

IV. Tài liệu học tập chủ yếu cho sinh viên

2.Các kỹ thuật chọn mẫu và u nh-ợc điểm

Có hai nhóm kỹ thuật chọn mẫu là: chọn mẫu xác suất (probability sampling) và mẫu không xác suất (nonprobability sampling).

2.1. Mẫu xác suất

Mỗi cá thể trong quần thể đều có một cơ hội biết tr-ớc để đ-ợc chọn vào mẫu.

Cơ sở của chọn mẫu xác suất :Kỹ thuật này chỉ thực hiện đ-ợc khi biết khung chọn mẫu của quần thể nghiên cứu.

2. 1.1 Mẫu ngẫu nhiên đơn (single random sampling):

Là mẫu mà tất cả các cá thể trong quần thể có cùng cơ hội đ-ợc chọn vào mẫu nh- nhau.

Ví dụ : Chọn 500 hồ sơ từ 5000 hồ sơ sản phụ đã đẻ tại Bệnh viện Phụ sản Hà Nội trong năm 1998 để nghiên cứu. Theo cách chọn ngẫu nhiên đơn thì mỗi sản phụ có xác suất là 10% đ-ợc chọn vào mẫu.

Sơ đồ 1: Cách chọn mẫu ngẫu nhiên đơn, các tham số quần thể và tham số mẫu

Chọn ngẫu nhiên

Các b-ớc:

 Lập danh sách (khung mẫu) từ 1 - N

 Dùng bảng số ngẫu nhiên (chú ý các quy -ớc sử dụng bảng số ngẫu nhiên) hoặc rút thăm ra số đơn vị mẫu.

Quần thể cỡ N Mẫu chọn với cỡ n P à  P x s

Ưu điểm:

 Cách làm đơn giản, tính ngẫu nhiên và tính đại diện cao

 Là kỹ thuật chọn mẫu xác suất cơ bản và có thể đ-ợc lồng vào tất cả các kỹ thuật chọn mẫu xác suất phức tạp khác.

Nh-ợc điểm:

 Phải có một khung mẫu các đơn vị mẫu để phục vụ cho chọn mẫu. Điều này không thể có đ-ợc khi một mẫu lớn hoặc mẫu luôn dao động.

 Việc thu thập số liệu sẽ gặp khó khăn khi phân bố của các cá thể đ-ợc chọn vào mẫu tản mạn trong quần thể.

2.1.2 Mẫu ngẫu nhiên hệ thống (systematic sampling):

Mỗi cá thể đ-ợc chọn cách nhau một khoảng hằng định theo sau bởi sự bắt đầu ngẫu nhiên.

Các b-ớc:

 Lập danh sách (khung mẫu) từ 1 - N

 Xác định khoảng cách mẫu k = N/n (N: số cá thể trong quần thể, n cỡ mẫu chọn)

 Một số ngẫu nhiên (i) giữa 1 và k đ-ợc chọn.

 Các cá thể có số thứ tự i + 1k; i + 2k; i + 3k.. . sẽ đ-ợc chọn vào mẫu cho đến khi kết thúc danh sách.

Sơ đồ 2 : chọn mẫu hệ thống với khoảng cách mẫu (k) và số bắt đầu là (i)

k k K K K

...

Số ngẫu nhiên đ-ợc chọn giữa i và k

i + k i + 2k i + 3k i + (n-1)k

Ví dụ: từ ví dụ 1, khoảng cách mẫu k ở đây sẽ bằng N/n và bằng 5000/500 = 10 (k). Tìm số ngẫu nhiên (i), dùng bảng số ngẫu nhiên hoặc làm 10 phiếu có đánh số từ 1 đến 10. Bốc thăm ngẫu nhiên để chọn đ-ợc một số bất kỳ có số thứ tự từ 1 đến 10. Giả sử ta bốc đ-ợc phiếu có số thứ tự là 7 (i) trong 10 phiếu đã cho ở trên. Vậy các cá thể có số thứ tự 7 (i), 17, 27, 37, 47, 57, ….4997 sẽ đ-ợc chọn vào mẫu. Cuối cùng ta sẽ chọn đ-ợc đủ n = 500 cá thể theo yêu cầu vào mẫu nghiên cứu và đ-ợc gọi là ph-ơng pháp chọn mẫu ngẫu nhiên hệ thống.

Ưu điểm:

 Nhanh và dễ tiến hành

 Mẫu phân bố đều và đại diện

 Không cần biết chính xác danh sach quần thể nghiên cứu. Trong một số tr-ờng hợp, mặc dù khung mẫu không có sẵn hoặc không biết tổng số cá thể trong quần thể nghiên cứu, nh-ng việc chọn mẫu hệ thông vẫn có thể tiến hành bằng cách xác định một quy luật phù hợp tr-ớc khi tiến hành chọn mẫu.

Ví dụ 1 : Để thu thập đ-ợc số liệu về sẹo lao ở trẻ em trong một cộng đồng vùng nông thôn khi không biết danh sách các hộ gia đình, ng-ời nghiên cứu có thể xác định một quy luật chọn mẫu tr-ớc thu thập số liệu nh- sau:

- Hộ gia đình thứ nhất có thể là hộ nằm ở bên phải của Uỷ ban nhân dân xã hoặc Trạm y tế xã

- Các hộ tiếp theo sẽ cách hộ vừa điều tra 5 hộ về bên trái

- Tất cả các trẻ em trong các hộ gia đình đ-ợc chọn đều đ-ợc kiểm tra sẹo lao cho đến khi đủ số trẻ cần cho cuộc điều tra.

- Số hộ gia đình cần điều tra có thể đ-ợc -ớc đoán từ số trẻ trung bình trong một gia đình ở cộng đồng này và số trẻ cần nghiên cứu (cỡ mẫu).

Ví dụ 2:

1) Tất cả các bệnh nhân đến khám vào ngày thứ t- trong tuần sẽ đ-ợc chọn vào mẫu. Bệnh nhân đến khám ngày lẻ sẽ chọn vào nhóm 1, đến ngày chẵn chọn vào nhóm 2 để phục vụ cho một thử nghiệm nào đó.

2) Các cá thể đứng thành một vòng tròn, sau đó đếm lần l-ợt theo số thứ tự: 1,2,3; rồi lặp lại cho đến hết. Ng-ời đ-ợc chọn đếm số 1 phải đ-ợc chọn ngẫu nhiên. Các cá thể số 1 vào nhóm 1; số 2 nhóm 2; số 3 nhóm3. Nh- vậy ta đã có 3 nhóm đ-ợc chọn một cách ngẫu nhiên cho một thử nghiệm.

Nh-ợc điểm:

 Khó khăn khi xây dựng khung mẫu

 Phụ thuộc v¯o phân bố đặc trưng nghiên cứu ở quần thể. Kho°ng cách ”k” có thể trùng với một số quy luật nào đó của quần thể chọn mẫu.

2. 1.3. Mẫu ngẫu nhiên phân tầng (stratified random sampling):

Là mẫu đạt đ-ợc bởi việc phân chia các cá thể của quần thể nghiên cứu thành các nhóm riêng rẽ đ-ợc gọi là tầng và cách chọn mẫu ngẫu nhiên đơn sẽ đ-ợc sử dụng trong mỗi tầng.

Sơ đồ 3: Chọn mẫu phân tầng trong điều tra sử dụng dịch vụ y tế của các đối t-ợng kinh tế khác nhau của một cộng đồng. Tất cả các Hộ của công đồng A Hộ T/B Hộ nghèo Hộ giàu

n1 n2 n3 Mẫu đ-ợc chọn từ các tầng khác nhau vào nghiên cứu

Các b-ớc:

- Phân chia quần thể nghiên cứu thành các tầng khác nhau dựa vào một hoặc vài đặc điểm nào đó nh- nhóm tuổi, giới. tầng lớp xã hội, dân tộc, kinh tế giàu nghèo. . giữa các tầng không có sự chồng chéo.

- Thực hiện việc chọn mẫu ngẫu nhiên đơn trong từng tầng.

Ưu điểm:

 Mẫu đạt đ-ợc từ mỗi tầng có tính đại diện và khái quát cao cho tầng đó

 Số liệu thu thập thuận tiện hơn so với mẫu ngẫu nhiên

 Khi sử dụng mẫu tỷ lệ, tầng có kích cỡ lớn hơn sẽ có nhiều cá thể đ-ợc chọn vào mẫu hơn. Khi đó cỡ mẫu cho một tầng i nào đó sẽ là:

ni = n.x N Ni . Nh-ợc điểm:

 Đòi hỏi phải có khung mẫu trong mỗi tầng của mỗi cá thể trong quần thể để gán số ngẫu nhiên. Điều này khó thực hiện đ-ợc trong thực tế.

2.1.4. Mẫu chùm (Cluster sạmpling):

Mẫu chùm là mẫu đạt đ-ợc bởi việc lựa chọn ngẫu nhiên các cá thể gọi là chùm từ nhiều chùm trong một quần thể nghiên cứu. Trong tr-ờng hợp này, đơn vị mẫu là các chùm không đồng nhát chứ không phải là các cá thể.

Các b-ớc

1) Xác định chùm: Chùm th-ờng đ-ợc nhà nghiên cứu quy định. Quần thể th-ờng tập hợp tự nhiên thành các chùm nh- 1 làng, xã, tr-ờng học, bệnh viện, khoa, phòng. Chúng th-ờng có chung các đặc điểm. nh-ng kích th-ớc khác nhau. Từ những chùm này ta lập danh mục của các đơn vị bậc một đó.

2) Lập danh sách tất cả các chùm và chọn một cách ngẫu nhiên đơn hay PPS. Có thể dùng 2 cách chọn tiếp tuỳ ý của nhà nghiên cứu.

Cách 1: Chọn tất cả các cá thể trong các chùm đã chọn ở trên bao gồm vào mẫu

nghiên cứu. Theo cách này, đơn vị mẫu (samping unit) chính là các chùm đ-ợc chọn, yếu tố quan sát (observation element) lại là các cá thể trong chùm. Cách này đ-ợc gọi là mẫu chùm 1 bậc và xác suất của một chùm đ-ợc chọn vào mẫu bằng số chùm dự kiến chon chia cho tổng số các chùm.

Cách 2: Liệt kê danh sách tất cả các cá thể trong các chùm đã chọn, sau đó áp dung

các ph-ơng pháp chọn ngẫu nhiên đơn hay ngẫu nhiên hệ thống trong mỗi chùm để chọn ra các cá thể vào mẫu. Trong tr-ờng hợp này, đơn vị mẫu và đơn vị quan sát là trùng nhau.

Trong đó:

ni : Cỡ mẫu của tầng i

N : Cỡ mẫu của tất cả các tầng NI : Dân số tầng i

Ưu điểm:

- Chi phí: rẻ hơn so với cách chọn mẫu ngẫu nhiên đơn.

- Dễ làm: khi nghiên cứu ở một quần thể lớn và khi tiến hành điều tra sẽ thuận tiện vì các hộ th-ờng sống gần nhau.

Nh-ợc điểm:

- Tính đại diện của mẫu chùm và tính chính xác (precision) thấp hơn so với mẫu ngẫu nhiên đơn.

- Muốn khắc phục đ-ợc vấn đề này thì cỡ chùm càng nhỏ càng tốt, tuy nhiên chi phí lại cao.

- Phân tích số liệu từ mẫu chùm th-ờng phức tạp hơn với so với các mẫu khác.

- Việc lựa chọn chùm vào mẫu nghiên cứu cũng khá phức tạp, đặc biệt là khi cỡ chùm không đều nhau. trong tr-ờng hợp này, ng-ời ta th-ờng áp dụng ph-ơng pháp chọn chùm theo ph-ơng pháp PPS (sẽ đ-ợc trình bày trong phần XXX)

2. 1.5. Mẫu nhiều giai đoạn (multistage sampling)

Là ph-ơng pháp ghép nhiều kỹ thuật chọn mẫu trong cùng một nghiên cứu, có thể kết hợp cả mẫu xác suất và mẫu không xác suất.

Trong tr-ờng hợp phải nghiên cứu ở những quần thể quá lớn về dân số và địa d- có cấu trúc phức tạp cần phải áp dụng nhiều kỹ thuật chọn mẫu trong các giai đoạn khác nhau. Một trong những mẫu nhiều giai đoạn là mẫu 2 bậc đ-ợc tiến hành nh- sau:

Sơ đồ 4: Giai đoạn 1 là chọn mẫu chùm, giai đoạn 2 là chọn mẫu ngẫu nhiên.

*Giai đoạn 1 (Bậc 1) *Giai đoạn 2 (Bậc 2) n1 n2 n3 n4 n5

1. Xác định chùm: Chùm th-ờng đ-ợc nhà nghiên cứu quy định. Quần thể th-ờng tập hợp tự nhiên thành các chùm nh- làng, xã, tr-ờng học, bệnh viện, khoa, phòng. Chúng th-ờng có chung các đặc điểm. nh-ng kích th-ớc khác nhau. Từ những chùm này ta lập danh mục của các đơn vị bậc một đó.

2. Chọn ngẫu nhiên : Trong mỗi đơn vị bậc 1 vừa đ-ợc chọn, lập danh sách (hộ gia đình hoặc các cá thể) rồi chọn ra đơn vị bậc 2 sao cho đủ cỡ mẫu cần nghiên cứu.

2.2. Mẫu không xác suất

2.2.1. Mẫu thuận tiện (convenience or accidental sampling)

Dựa trên cơ sở các cá thể nghiên cứu có sẵn khi thu thập số liệu (ví dụ: tất cả các bệnh nhân đến khám trong ngày). Ph-ơng pháp này không quan tâm đến sự lựa chọn ngẫu nhiên hay không. Nó th-ờng đ-ợc áp dụng trong các nghiên cứu lâm sàng, ít sử dụng trong điều tra sức khoẻ cộng đồng.

2.2.2. Mẫu chỉ tiêu (quota sampling)

Là ph-ơng pháp đảm bảo rằng một số nhất định các đơn vị mẫu từ các loại khác nhau của quần thể nghiên cứu với các tính chất đặc tr-ng sẽ có mặt trong mẫu. Nó gần giống nh- cách chọn mẫu tầng nh-ng không ngẫu nhiên. Ng-ời nghiên cứu đặt kế hoạch là sẽ chọn bao nhiêu đối t-ợng cho mỗi tầng hoặc nhóm đối t-ợng và bằng cách chọn mẫu thuận tiện để chọn cho đủ số l-ợng này từ mỗi tầng.

2.2.3 Mẫu có mục đích: (purposive sampling)

Ng-ời nghiên cứu đã xác định tr-ớc các nhóm quan trọng trong quần thể để tiến hành thu thập số liệu. Các nhóm khác nhau sẽ có tỷ lệ mẫu khác nhau. Đây là cách rất hay dùng trong các điều tra thăm dò, phỏng vấn sâu để xác định vấn đề sức khoẻ của cộng đồng.

Một phần của tài liệu Tài liệu thực hành đo lường sự kết hợp giữa nguy cơ và bệnh (Trang 30 - 35)