Nhóm các cá thể đ-ợc rút ra từ quần thể nghiên cứu để phục vụ trực tiếp cho mục tiêu nghiên cứu đ-ợc gọi là mẫu nghiên cứu.

Một phần của tài liệu Tài liệu thực hành đo lường sự kết hợp giữa nguy cơ và bệnh (Trang 27 - 30)

IV. Tài liệu học tập chủ yếu cho sinh viên

Nhóm các cá thể đ-ợc rút ra từ quần thể nghiên cứu để phục vụ trực tiếp cho mục tiêu nghiên cứu đ-ợc gọi là mẫu nghiên cứu.

tiếp cho mục tiêu nghiên cứu đ-ợc gọi là mẫu nghiên cứu.

Một nghiên cứu với mẫu có thể khống chế đ-ợc một số sai số với mức chi phí thấp mà vẫn đảm bảo đ-ợc kết quả có độ tin cậy.

1.2. Quần thể nghiên cứu và quần thể đích (study population target population)

Quần thể là một tập hợp các đơn vị thống kê, mà trên mỗi đơn vị thống kê này, một giá trị về tiêu thức nghiên cứu sẽ đ-ợc lấy ra và đ-ợc kể là một số hạng trong một chuỗi thống kê.

Đơn vị thống kê trong các nghiên cứu dịch tễ th-ờng là 1 ng-ời (một cá thể). Quần thể nghiên cứu: là quần thể mà từ đó mẫu đ-ợc rút ra cho nghiên cứu. Quần thể đích (định danh), là quần thể lớn mà kết quả nghiên đ-ợc ngoại suy:

Ví dụ: Quần thể phụ nữ 15 – 49 tuổi có 3 con, nữ y tá phòng mổ, nam công nhân nhà máy cao su tuổi nghề từ 15 năm trở lên...Trong những quần thể nh- thế, ta chỉ lấy một số cá thể vào mẫu nghiên cứu, rồi từ kết quả nghiên cứu đ-ợc, ta sẽ quy ra cho toàn bộ quần thể này. Lý t-ởng nhất nếu cả quần thể nghiên cứu và quần thể đích là một.

Ví dụ 1: trẻ em 5 tuổi một tỉnh có thể coi là một quần thể đích cho việc nghiên cứu tình trạng suy dinh d-ỡng. Tuy nhiên, do một lý do nào đó, mẫu nghiên cứu có thể chỉ đ-ợc rút ra từ số trẻ em của 3 huyện A, B, C, trong số 10 huyện của tỉnh. Khi đó trẻ em ≤ 5 tuổi tại 3 huyện này là quần thể nghiên cứu.

1.3. Đơn vị quan sát (observation unit) và đơn vị mẫu (sampling unit).

Đơn vị quan sát là một chủ thể hoặc ng-ời mà sự quan sát hoặc đo l-ờng sẽ đ-ợc làm trên chủ thể đó khi thực hiện nghiên cứu.

Đơn vị mẫu là chủ thể đ-ợc sử dụng khi chọn mẫu nghiên cứu.

Trong nhiều tr-ờng hợp, hai khái niệm này trùng nhau, tuy nhiên, nhiều tr-ờng hợp chúng lại khác nhau.

Ví dụ 2: trong một cuộc đánh giá tình trạng bệnh sốt rét của một xã, việc xác định ký sinh trùng sốt rét đ-ợc tiến hành lấy mẫu máu làm xét nghiệm ở từng cá thể. Tất cả các cá thể trong xã đều đ-ợc chọn vào mẫu thăm khám. Khi ấy, đơn vị mẫu và đơn vị quan sát là trùng nhau.

Ví dụ 3. Trong một cuộc đánh giá tình trạng suy dinh d-ỡng của trẻ em ≤ 5 tuổi, do danh sách của các đối t-ợng này th-ờng là không có sẵn trong cộng đồng nên danh sách các hộ gia đình đ-ợc sử dụng để chọn mẫu. Tất cả trẻ em ≤ 5 tuổi trong các hộ gia đình đ-ợc chọn vào mẫu để khám. Khi đó đơn vị quan sát là trẻ em ≤ 5 tuổi, còn đơn vị mẫu là hộ gia đình.

1.4. Khung mẫu(sampling)

Khi tiến hành chọn mẫu từ một quần thể nghiên cứu, cần thiết phải có một danh sách các đơn vị mẫu hoặc bản đồ phân bố các đơn vị mẫu. Danh sách hoặc

bản đồ nh- vậy đ-ợc gọi là khung mẫu. Có đ-ợc khung mẫu đầy đủ và chính xác là điều kiện thuận lợi cho b-ớc chọn mẫu.

1.5. Những sai số có thể gặp phải trong nghiên cứu mẫu và cách khắc phục

Có rất nhiều. Tuỳ loại hình mẫu nghiên cứu mà loại sai số nào là nghiêm trọng nhiều hay ít, có thể tránh đ-ợc, hay hạn chế đ-ợc đến đâu...Những loại sai số quan trọng, chung nhất, th-ờng gặp phổ biến là: (xin xem thêm ở sách đã dẫn).

a) Sai số lấy mẫu.

Sai số lấy mẫu là sai số sẽ gây ra sự khác biệt giữa kết quả mẫu và kết quả thực của quần thể. Trên thực tế, kết quả thực của quần thể ta không đ-ợc biết (vì không nghiên cứu quần thể toàn bộ), ta th-ờng gọi nó là kết quả lý thuyết (trung bình lý thuyết, hoặc tỷ lệ lý thuyết), nên ta cũng không biết đ-ợc kết quả mẫu có khác biệt không, và nếu có thì khác biệt đến đâu, khác biệt nh- thế nào đối với kết quả thực của quần thể.

Ta sẽ phải dựa vào các thủ tục chọn mẫu thích hợp, một cách chặt chẽ, tuân thủ nghiêm ngặt và đầy đủ các thủ tục chọn mẫu này. Đ-ợc nh- thế, và cũng chỉ có nh- thế, chúng ta mới làm đ-ợc cho sai số lấy mẫu số là nhỏ nhất, để kết quả mẫu gần kết quả thực của quần thể.

Sai số do các biến thiên ngẫu nhiên.

Sai số chọn là sai số nảy sinh khi chúng ta chọn không đúng các đối t-ợng vào trong mẫu, thí dụ chúng ta đã chọn phải bộ phận không đại diệ của quần thể, nh- khi ta nghiên cứu tỷ lệ một bệnh nào đó trong quần thể học sinh, lại không bao gồm số học sinh nghỉ học (có nhiều khả năng nghỉ học chính ta định tìm) mà chỉ thăm khám trong số học sinh có đến tr-ờng chẳng hạn. Sai số chọn không thể tính đ-ợc, chỉ có bản thân ng-ời nghiên cứu mới biết đ-ợc cần làm nh- thế nào để tránh đ-ợc.

Còn sai số sẽ do các biến thiên ngẫu nhiên nảy sinh phụ thuộc vào may rủi từ mẫu này sang mẫu khác, dù ta tuân thủ triệt để các thủ tục chọn mẫu thì cũng thật khó hy vọng lặp lại những mẫu nh- nhau khi lấy mẫu nhiều lần. Ng-ời ta có thể hạn chế sai số này bằng hai cách: Quần thể định danh từ đó rút mẫu ra phải đồng nhất (định nghĩa về quần thể định danh phải chặt chẽ, rõ ràng) và tính ngẫu nhiên trong quá trình chọn các cá thể vào mẫu phải đảm bảo đúng đắn, đầy đủ từ đầu đến cuối ở tất cả các b-ớc cần phải áp dụng kỹ thuật ngẫu nhiên.

b) Sai số có tính chất hệ thống.

Trong nghiên cứu mẫu, các yếu tố gây nhiễu đóng vai trò rất quan trọng. Có những yếu tố nhiễu rõ ràng có thể tránh đ-ợc chung trong nhiều nghiên cứu, những cũng còn có những yếu tố nhiễu tiềm ẩn khác, mà chỉ chính nhà nghiên cứu về vần đề nào đó mới có thể thấy đ-ợc nhờ vào những hiểu biết về cơ chế bệnh sinh, về các yếu tố nguy cơ có thể có tác dụng với bệnh, về các hiểu biết mới phát sinh của y học...mới có thể loại bỏ đ-ợc hoặc hạn chế đ-ợc các sai số này, cùng với việc áp dụng các kỹ thuật ghép cặp, các kỹ thuật chuẩn hoá...

1.6. Tính ngẫu nhiên trong việc chọn mẫu.

Tính ngẫu nhiên ở đây đ-ợc toán học quy định, những nhà y học chúng ta hiểu theo cách gần đúng là không hề có một ý định chủ quan nào của bất cứ một ai, ở bất kỳ b-ớc nào của việc chọn mẫu.

Một mẫu đ-ợc gọi là mẫu ngẫu nhiên khi các cá thể trong quần thể định danh đ-ợc chọn vào mẫu cùng với một cơ hội may rủi nh- nhau, nói theo ngôn ngữ thống kê là mọi ng-ời đều có cùng một xác suất phản ánh vào trong mẫu.

Mẫu đ-ợc lấy ngẫu nhiên có hai -u điểm:

- Giảm tối thiểu đ-ợc sai số.

- Xác định đ-ợc tính chính xác của kết quả nghiên cứu mẫu.

Nếu mẫu đ-ợc lấy ngẫu nhiên thực sự, thì đáng ngại chỉ còn là có sai số ngẫu nhiên (mà chúng ta có thể làm giảm thiểu bằng xác định tính đồng nhất của quần thể định danh nh- trên đã nói, và mở rộng cỡ mẫu hợp lý).

1.7. Sai số chuẩn

Cần phải phân biệt độ lệch chuẩn với sai số chuẩn. Độ lệch chuẩn là số đo độ phân tán của các trị số của tiêu thức nghiên cứu là các trị số thu đ-ợc ở từng đơn vị nghiên cứu (đơn vị thống kê) trong dãy thống kê so với số trung bình của tiên thức của dãy đó. Thí dụ: l-ợng cholesterol của từng ng-ời so với l-ợng cholesterol trung bình của quần thể đó. Độ lệch chuẩn, nh- vậy, để xác định khoảng dao động của các số đo đó, để cho ta khái niệm về dãy thống kê đó phân tán nhiều hay ít.

Còn sai số chuẩn thuộc phạm trù quan niệm khác, sai số chuẩn nói lên tính biến thiên của các kết quả thống kê của mẫu (tính biến thiên của số trung bình mẫu hoặc tính biến thiên của tỷ lệ mẫu). Cần phải hiểu tính biến thiên này là tính biến thiên của kết quả nghiên cứu từ một mẫu này sang một mẫu khác trong cùng một quần thể nghiên cứu (khi ta làm

nhiều mẫu cùng cỡ lặp lại trong một quần thể, thì các kết quả mẫu đó sẽ khác nhau: chúng ta nói là kết quả mẫu có tính biến thiên). Sai số chuẩn càng nhỏ thì tính biến thiên càng nhỏ, và kết quả nghiên cứu càng nhiều tin cậy. Sai số chuẩn dùng tr-ớc hết là để xây dựng các khoảng tin cậy.

1.8. Giới hạn tin cậy.

Khoảng tin cậy dùng để tổng quát hoá thành kết quả quần thể từ kết quả nghiên cứu mẫu. Khoảng tin cậy có hai giới hạn: cận trên và cận d-ới. Khoảng tin cậy nh- vậy là một khoảng số nào đó có giới hạn rõ ràng, để cho giá trị thực của quần thể (là một con số có thực, nhất định có, nh-ng ta không có đ-ợc vì không điều tra toàn bộ quần thể), nhất định là rơi vào trong khoảng đó, ở một điểm nào đó. Khi nếu khoảng tin cậy bao giờ cũng phải nêu rõ khoảng tin cậy bao nhiêu phần trăm, điều này gắn liền với xác suất tin cậy. Thí dụ khi ta nêu 95% khoảng tin cậy, thì chúng ta đã nói rằng có tới 95% khả năng là khoảng đó có chứa đựng giá trị thực của quần thể. Đối với những cỡ mẫu đủ lớn hợp lý thì khoảng tin cậy 95% đ-ợc biểu thị nh- sau:

95% CI = kết quả mẫu ± 2 sai số chuẩn.

Một phần của tài liệu Tài liệu thực hành đo lường sự kết hợp giữa nguy cơ và bệnh (Trang 27 - 30)