SỐ LƯỢNG MẪU NGHIÊN CỨU

Một phần của tài liệu BÀI GIẢNG DỊCH TỄ HỌC THÚ Ý (Trang 108)

1. Cơ sở xác định số lượng mẫu trong nghiên cứu dịch tễ học

Trước hết cần phải nắm được những khái niệm về khoảng tin cậy trong ước lượng đây là cơ sở để giải quyết bài toán xác định số lượng mẫu trong nghiên cứu dịch tễ học. Nghĩa là từ mẫu nghiên cứu, ta có được tham số mẫu, giá trị đó chính là ước lượng của tham số quần thể. Bao quanh giá trị ước lượng

này là một khoảng các giá trị mà chúng ta tin tưởng rằng với một hệ số tin cậy đã định (1-α), tham số

quần thể nhận một trong các giá trị thuộc khoảng này.

Trong các nghiên cứu dịch tễ học, mức độ quan sát thường là các cá thể nên những khác biệt giữa các cá thể không chỉ dừng lại ở các sai số đơn giản là đo đạc. Các cá thể nọ còn khác cá thể kia ở nhiều khía cạnh khác như: Gen, môi trường sống, nhiều yếu tố ngẫu nhiên… nên dẫn tới những sai số nhất định. Cho nên sự biến thiên giữa các cá thể là một quy luật dẫn đến các sai số tiềm ẩn trong các kết luận.

- Biến thiên cá thể: Trong nghiên cứu dịch tễ học, độ lớn của biến thiên cá thể biểu thị qua các dao động chọn mẫu. Trước hết chúng ta phải thừa nhận rằng các cá thể trong một quần thể không cùng mắc một bệnh nào đó với khả năng như nhau đó chính là một biểu thị của biến thiên cá thể. Trong một quần thể, ta có thể rút ra rất nhiều mẫu ngẫu nhiên với các cỡ khác nhau mỗi mẫu sẽ cho một kết quả nghiên cứu khác nhau. Trong các mẫu lấy ra với cỡ mẫu khác nhau, thì cỡ mẫu càng lớn, sẽ cho kết quả nghiên cứu càng gần với kết quả nghiên cứu toàn bộ, nghĩa là kết quả phân tán ít hơn.

- Khoảng dao động: Là một chỉ số quan trọng của dao động trong việc chọn mẫu nghiên cứu chính do những dao động trong việc chọn mẫu mà ta không thể có được những kết quả chính xác.

Nếu biết được trung bình của các tham số quần thể ta có thể chỉ ra được một khoảng dao động nhất định có chứa kết quả nghiên cứu mẫu của hầu hết các lần lấy mẫu ngẫu nhiên cùng cỡ, với những tỷ lệ phần trăm nhất định. Cũng chính từ tỷ lệ muốn chọn này, có thể xác định được độ lớn của khoảng dao động. Công thức chung tính khoảng dao động của một tham số A là:

µA± Z(1-α/2)√σ2A

* Trong đó:

A có thể là trung bình hoặc tỷ lệ quan sát được

µA là trung bình của A trong quần thể σ2A là độ lệch chuẩn (phương sai) của A Z(1-α/2) là giá trị của hệ số giới hạn tin cậy

α là xác xuất sai lầm hay còn gọi là nguy cơ sai lầm

- Khoảng tin cậy: Là một khoảng trị số được ước lượng ra từ kết quả nghiên cứu mẫu sao cho tham số quần thể tương ứng rơi vào một trị số nào đó trong khoảng này một cách chắc chắn ở một ngưỡng xác suất nhất định nào đó. Việc ấn định ra một khoảng như vậy, gọi là phương pháp ước lượng khoảng tin cậy, sử dụng nó để ước lượng sao cho tham số quần thể chắc chắn sẽ rơi vào một trị số nào đó trong khoảng tin cậy này với một mức tin cậy nhất định. Nắm được những khái niệm về khoảng tin cậy trong

ước lượng, đó là cơ sở để giải quyết bài toán xác định số lượng mẫu trong các nghiên cứu dịch tễ học. Nghĩa là từ một mẫu nghiên cứu, ta có được tham số mẫu, giá trị đó chính là ước lượng điểm của thông số quần thể tương ứng. Bao quanh giá trị ước lượng điểm này là một khoảng các giá trị mà chúng ta tin

tưởng rằng với một hệ số tin cậy đã định (1 - α), thông số quần thể nhận một trong các giá trị thuộc

khoảng này. Trong các nghiên cứu dịch tễ học, mục tiêu của chúng ta là có được tham số quần thể, nhưng trên thực tế, chúng ta thường không thể tính trực tiếp được các tham số quần thể này vì không thể nghiên cứu được quần thể toàn bộ. Cho nên các tham số quần thể phải ước lượng từ các kết quả mẫu tương ứng.

Các tham số quần thể theo quy ước biểu thị bằng các chữ:

µ: Là trung bình quả quần thể

P: là tỷ lệ quần thể (tỷ lệ ốm, mắc bệnh, chết…)

σ: là độ lệch chuẩn của quần thể (phương sai)

α:là xác xuất sai lầm hay nguy cơ sai lầm

Độ lệch chuẩn của quần thể được tính theo công thức sau:

σ = √ P(1-P)

2. Ứng dụng phương pháp khoảng tin cậy trong ước lượng các tham số quần thể

Từ những khái niệm trên, ta có công thức biểu diễn khoảng tin cậy (Cl) của một ước lượng như

sau: Cl = ước lượng ± (hệ số tin cậy x sai số chuẩn của ước lượng)

Hay Cl = ước lượng ± [(1-α) x SE(P)] Trong đó:

- Ước lượng và ước lượng điểm được tính từ mẫu nghiên cứu (ước lượng ở đây là ước lượng của tham số quần thể và ước lượng tham số mẫu-ước lượng điểm).

- Hệ số tin cậy, phản ánh độ tin cậy mong muốn (1-α)

- Sai số chuẩn của ước lượng là biến thiên trong số tất cả các giá trị có thể của ước lượng từ mẫu này sang mẫu khác.

Như vậy, trong một quần thể, nếu tất các mẫu cùng cỡ n được nghiên cứu và trong mỗi mẫu đều

dùng khoảng tin cậy 100(1-α)% để ước lượng tham số quần thể. Thì tần suất các khoảng tin cậy có chứa

tham số thật của quần thể là 100(1-α)%. Điều đó có nghĩa là người nghiên cứu có thể tin đến 100(1-α)%

rằng khoảng tin cậy này có chữa tham số của quần thể.

VD: với xác suất sai lầm α = 0,05 thì hệ số tin cậy 1-α = 1 - 0,05 = 0,95; ta có thể coi mức độ tin cậy là 95%.

Nếu đặt d = hệ số tin cậy x sai số chuẩn của ước lượng (SE(P))

d được gọi là sai số ước lượng, tức là độ lớn tối ta còn có thể chấp nhận được giữa giá trị ước lượng từ nghiên cứu mẫu và tham số thực của quần thể

Như vậy, với hệ số tin cậy (1-α) đã định người nghiên cứu mong muốn sao cho thiết kế mẫu nghiên cứu của mình tạo ra được một sai số ước lượng bé, tức là d nhỏ. Giá trị d càng bé, thì ước lượng đó càng tốt.

Các yếu tố chi phối độ lớn của khoảng tin cậy: Hệ số tin cậy càng lớn thì khoảng tin cậy càng rộng. Sai số chuẩn của ước lượng, phụ thuộc vào trị số của độ lệch chuẩn nghĩa là trị số này càng lớn thì khoảng tin cậy càng rộng. Nếu độ lệch chuẩn quá lớn thì khoảng tin cậy đặc biệt rộng, nó sẽ cho một ước lượng ít chính xác cho tham số quần thể, cho dù số lượng mẫu n nghiên cứu lớn.

3. Ước lượng sai số chuẩn (Standard Error = SE) tỷ lệ P của tham số quần thể nghiên cứu

Xét các thành phần tạo nên d khi hệ số tin cậy (1-α) đã được định trước, tức α cố định, thì hệ số tin cậy cũng nhận một giá trị xác định. Do vậy độ lớn của d chỉ còn phụ thuộc vào sai số chuẩn của tỷ lệ P (SEP), mà ta đã ước lượng hay tham số của quần thể ước lượng. Sai số chuẩn của tỷ lệ P được tính bằng công thức:

σ √P(1-P)

SE(P) = = (1)

√n √n

Trong đó:

- P là tỷ lệ mà người nghiên cứu phải ước lượng trước khi bắt đầu nghiên cứu, nó phải tương đối phù hợp với thực tế

- n là số lượng mẫu (cỡ mẫu) cần tìm

- σ Là độ lệch chuẩn (phương sai) của quần thể

4. Ước định sai số ước lượng d (hay độ chính xác mong muốn d)

Với tỷ lệ ước lượng của P khi tiến hành nghiên cứu, thì kết quả sẽ dao động trong một khoảng nhất định, với một trị số sai lệch mong muốn nào đó. Trị số sai lệch này được gọi là độ chính xác d và được tính bằng công thức sau:

d = Z(1-α/2) x SE(P) (2)

Trong đó:

- d là sai số ước lượng hay độ chính xác mong muốn - SE(P) là sai số chuẩn của tỷ lệ P

- Z(1-α/2) là giá trị của hệ số giới hạn tin cậy

Giá trị của hệ số giới hạn tin cậy, phụ thuộc vào hệ số tin cậy (1-α) mà người nghiên cứu phải tự

chọn lấy cho nghiên cứu của mình. Thông thường ta thường dùng các hệ số tin cậy sau:

Hệ số tin cậy (1-α) Tương ứng với giá trị của hệ số giới hạn tin cậy Z(1-α/2)

0,90 0,95 0,99 1,645 1,96 2,57

Z(1-α/2) thường được sử dụng phổ biến trong các điều tra dịch tễ học là 1,96 tương ứng với hệ số tin cậy của ước lượng là 95%.

5. Tính số lượng mẫu nghiên cứu n

Từ công thức (1) và (2) ta suy ra:

√P(1-P) d = Z(1-α/2) x SE(P) d = Z(1-α/2) x √n Do vậy, ta có: P(1 - P) n = (Z(1-α/2))2 x d2

6. Phương pháp lấy mẫu bệnh phẩm để xác định bệnh

Khi biết tổng đàn và biết được số động vật mắc bệnh, ta có thể tính được số mẫu bệnh phẩm cần lấy trong số những động vật mắc bệnh để xác định chính xác bệnh gây ra, theo công thức sau:

n*= [1 - (1 - α)1/d][N - d/2) + 1/2] Hoặc: n* = [1 - (1 - α)1/d][N - (d - 1/2] Trong đó: -n* là số bệnh phẩm cần lấy - (1 - α) là mức độ tin cậy - N là tổng đàn động vật - d là số động vật nghi có bệnh

Một phần của tài liệu BÀI GIẢNG DỊCH TỄ HỌC THÚ Ý (Trang 108)

Tải bản đầy đủ (PDF)

(122 trang)