đó là cách hiểu chưa ựầy ựủ bởi dịch tễ học không chỉ giới hạn trong các bệnh truyền nhiễm mà còn là môn học ựể xác ựịnh mối tương quan giữa sức khỏe với các yếu tố có trong môi trường x
Trang 1Chương II
XỬ LÝ DỮ LIỆU TRONG DỊCH TỄ HỌC THÚ Y
Dịch tễ học là môn học về trạng thái và diễn biến sức khỏe của một quần thể Nói như vậy dịch tễ học bao hàm vấn ựề sức khỏe theo không gian (trạng thái) và thời gian (diễn biến) đồng thời dịch tễ học bao hàm cả vấn ựề y học (sức khỏe) và toán học thống kê (quần thể) Trước ựây, tại các nước xã hội chủ nghĩa cũ, dịch tễ học ựược hiểu là môn học
về các bệnh truyền nhiễm Chắnh xác hơn là phần nghiên cứu về sự lây lan và biện pháp phòng chống bệnh truyền nhiễm trong các trường ựào tạo bác sỹ hay bác sỹ thú y đó là cách hiểu chưa ựầy ựủ bởi dịch tễ học không chỉ giới hạn trong các bệnh truyền nhiễm mà còn là môn học ựể xác ựịnh mối tương quan giữa sức khỏe với các yếu tố có trong môi trường xung quanh và quan trọng hơn, dịch tễ học là môn học nghiên cứu về một quần thể
và ựo lường bệnh tật của quần thể ựó
Dịch tễ học còn ựược ựịnh nghĩa là môn toán (thống kê) mang màu sắc y học Do vậy, với sự phát triển của ngành ựiện tử, dịch tễ học ựã ựược tin học hóa rất nhanh chóng Có thể nói rằng trong khoa học về sức khỏe của người và ựộng vật, dịch tễ học là môn học
ựược tin học hóa sớm nhất và có ý nghĩa nhất Nhiều phần mềm vi tắnh ựã ựược viết và ựược sử dụng rộng rãi Ngược lại tin học góp phần thúc ựẩy làm cho dịch tễ học phát triển
và dịch tễ học ựược sử dụng nhiều hơn và rộng rãi hơn trong việc quản lý bệnh tật
Trong chương này, chúng tôi xin giới thiệu một số phần mềm máy vi tắnh thường ựược
sử dụng trong dịch tễ học để hiểu và sử dụng các phần mềm này, yêu cầu người ựọc (i)
phải là người ựã nắm rõ các khái niệm về dịch tễ học (tỷ lệ mắc bệnh, tỷ suất mắc bệnh, tỷ
lệ chết, tỷ lệ tử vong, tỷ lệ tấn công, ựộ nhạy, ựộ ựặc hiệu, ngưỡng dương tắnhẦ) Mặt
khác cũng ựòi hỏi người ựọc (ii) phải có ựủ kiến thức về toán thống kê (số trung bình,
phương sai, khoảng tin cậy, phân bố chuẩnẦ) Việc sử dụng các phần mềm không khó, thực chất tin học là công cụ thực hiện các phép tắnh toán, chúng ta chỉ việc nhập số liệu và nhấp chuột là có kết quả Tuy nhiên, kết quả ựó nói lên ựiều gì thì cần kiến thức về dịch tễ
và toán thống kê Thậm chắ, có hiểu về dịch tễ học thì việc nhập số liệu vào máy mới ựúng
và chắnh xác, ựồng thời kết quả ựưa ra mới có ý nghĩa Bởi vì máy nhận bất kỳ số liệu nào khi ta nhập vào và cho kết quả theo số liệu nạp vào nó
Hạn chế trong khuôn khổ giới thiệu phần mềm dùng trong dịch tễ học, chương này không giải thắch các khái niệm dịch tễ học cũng như không trình bày chi tiết về toán thống
kê Người ựọc ựược mặc ựịnh là ựã có ựầy ựủ kiến thức về hai môn học trên Cuối cùng
(iii), ựa số các phần mềm ựều viết bằng tiếng Anh hoặc tiếng nước ngoài khác Do vậy ựối
với sinh viên và những người không thành thạo tiếng Anh hoặc ngôn ngữ nước ngoài nào
khác sẽ rất khó khăn khi học và sử dụng các phần mềm dịch tễ Với các ựiều kiện (i, ii và
iii) như nêu trên, sau khi ựọc xong chương này, người ựọc có thể sử dụng phần mềm Win
Episcope hoặc EpiCalc sau một vài lần thực tập trên máy
Trang 21 CÁC PHẦN MỀM VI TÍNH DÙNG TRONG DỊCH TỄ HỌC
1.1 ðặc ñiểm
Các phần mềm vi tính dùng trong dịch tễ học ban ñầu chủ yếu là ñể tính toán các con
số ño lường về bệnh trong dịch tễ học Cùng với sự phát triển tính năng của máy vi tính và thiết bị ñiện tử, nhiều phần mềm khác ra ñời có tính phức tạp cao phản ánh cụ thể và rõ ràng hơn về tình hình bệnh dịch Ví dụ các phần mềm vi tính kết hợp với kỹ thuật ñịnh vị GIS có thể xác ñịnh vị trí một ổ dịch trên bản ñồ một cách chính xác không những về kinh
ñộ, vĩ ñộ mà cả về ñộ cao so với mặt biển, hoặc phần mềm EpiMap cho phép chúng ta xác
lập bản ñồ dịch tễ mà nếu không có máy vi tính thì con người không thể làm nổi Cũng như vậy, người ta ñã ñưa ra các phần mềm về quản lý và thông báo dịch (trong các nước thành viên của OIE) sao cho các khái niệm dịch tễ trở thành ngôn ngữ chung của nhân loại khi nói về dịch bệnh Các phần mềm như vậy dành cho những cán bộ dịch tễ chuyên nghiệp Chương này chỉ giới thiệu phần mềm cơ bản ñể tính toán các chỉ số ño lường về bệnh tật
ñược giảng dạy cho sinh viên ñại học trong môn dịch tễ học
Cuối cùng, ñặc ñiểm của phần mềm vi tính dùng trong dịch tễ học thường là các ô trống, nhập số liệu vào các ô trống ñó giống như thay các con số vào các ký hiệu bằng chữ trong các công thức toán học Máy sẽ tính và cho ta kết quả mong muốn Ví dụ, công thức
v=S/t là công thức tính tốc ñộ trung bình v bằng quãng ñường ñi S chia cho thời gian t ðể
có v ta nhập giá trị cụ thể của S và con số giá trị của t, nhấn chuột, máy sẽ cho ra con số khác, ñó là v và là tốc ñộ trung bình ðây chỉ là ví dụ ñơn giản Trong nhiều trường hợp
cần phải có các khái niệm rõ và chi tiết hơn hơn Ví dụ, trong buôn bán, ta có thể tính lãi bằng chênh lệch giá trị số tiền chi ra khi mua và tiền thu vào khi bán; nhưng ñó chưa phải
là lãi thực, còn phải trừ tiền thuê cửa hàng và tiền thuê nhân công bán hàng… ðiều ñó cho thấy cần có khái niệm như thế nào là lãi Như vậy vẫn chưa ñủ, lại phải tính các khoản chi khác như thuế (nhiều loại thuế khác nhau)… Trong dịch tễ học cũng như vậy ðiều ñó nói lên rằng, phần mềm dùng trong dịch tễ học thực ra chỉ ñể tính toán các con số về bệnh tật Các công thức tính toán này ñều có trong các sách về dịch tễ học Muốn hiểu biết ý nghĩa các kết quả cần phải hiểu rõ công thức ñể tính kết quả là như thế nào Tóm lại, sử dụng phần mền vi tính dùng trong dịch tễ học chủ yếu là nhập số liệu (ñiền các con số vào các công thức toán học ñã ñược lập ra) ñể tính giá trị các số ño lường về bệnh tật
1.2 Các phần mềm ñược dùng nhiều trong dịch tễ học
Như trên ñã nói, có nhiều phần mềm vi tính dùng trong dịch tễ học Có những phần mềm mang tính ñặc thù của dịch tễ học như: Epi-Info, EpiCalc, WinEpiscope, EpiMap, ToolBox, Freecalc … và có phần mềm không chỉ dùng trong dịch tễ học như phần mềm GIS (ñịnh vị ñịa lý toàn cầu), thậm chí các phần mềm toán thống kê cũng là các phầm mềm
có thể sử dụng ñể tính toán các số ño lường về bệnh tật Với những người chuyên về dịch
tễ, việc sử dụng thành thạo các phần mềm trên là yêu cầu bắt buộc Vì hạn chế giới thiệu trong một chương sách chúng tôi giới thiệu hai phần mềm chính là WinEpiscope và Epicalc
2 SỬ DỤNG PHẦN MỀM WIN EPISCOPE
2.1 Giới thiệu
Sau khi cài ñặt phần mềm này vào máy vi tính, chúng ta có thể biết rõ hơn về nguồn gốc và các tác giả soạn thảo phần mềm này Sơ lược như sau: Win Episcope có nguồn gốc
Trang 3từ chương trình EPIDEMO do trường đại học Hồng gia Thú y và Nơng nghiệp Copenhagen (ðan Mạch) và đại học Utrecht (Hà Lan) biên soạn Sau đĩ nĩ được cải tiến
và đổi tên là EPISCOPE, tiếp theo đĩ được cải tiến trở thành WIN EPISCOPE với sự hợp tác của các trường đại học khác như Wagningen Agricultural University (Hà Lan) và đại học Zaragoza (Tây Ban Nha) Phần mềm này cĩ nhiều phiên bản khác nhau, chúng tơi xin giới thiệu trong chương này phiên bản 2.0 ðể cập nhật, ta cĩ thể tải các phiên bản mới nhất theo địa chỉ: http://www.infecepi.unizar.es hoặc http://zod.wau.nl hoặc
http://www.clive.ed.ac.uk
Một lý do khác là đây là phần mềm cơng cộng, ai cũng cĩ thể tải về, cài đặt vào máy,
sử dụng, sao chép và phổ biến cho người khác
Các tiêu chí cĩ thể tính tốn được bằng Win Episcope
Những người biết tiếng Anh và tiếng Tây Ban Nha cĩ thể dễ dàng sử dụng phần mềm này vì nĩ được viết ra trên cơ sở hai ngơn ngữ nĩi trên và phần Help giới thiệu đầy đủ các tiêu chí cĩ thể tính tốn được khi dùng phần mềm này
Các tiêu chí đĩ là: Các phương pháp chẩn đốn (trong Menu Test), Nghiên cứu về mẫu
(trong Menu Sample), Phân tích (trong Menu Analysis)
Sau khi cài đặt WIN EPISCOPE, nháy chuột vào chương trình ta sẽ thấy giao diện như sau xuất hiện trên màn hình:
Start Progams WinEpi
Giao diện này thay đổi ngay trong vịng vài giây sau đĩ, phần tên chương trình mất đi chỉ để lại giao diện trống và chúng ta cĩ thể bắt đầu sử dụng
Trang 4Trên thanh công cụ có các menu sau: File, Test, Samples, Analysis, Model, Window
và Help
Mục File dùng ñể lưu trữ các thư mục và các tính toán ñã ñược tiến hành và có chức năng giống như mục File của các phần mềm khác trong máy vi tính Các mục dùng trong dịch tễ học là test, samples, analysis , model và help
ðối với người ñã nắm rõ môn học dịch tễ hoc và biết tiếng Anh hoặc Tây Ban Nha, có
thể tự mình làm quen và sử dụng phần mềm này một cách dễ ràng Khi có khó khăn có thể vào phần Help ñể ñược hướng dẫn
Nhấn chuột vào mục Test chẳng hạn chúng ta sẽ thấy trên màn hình xuất hiện giao diện sau (hình 2.1):
Hình 2.1
Như hình trên cho thấy xuất hiện các submenu: Agreement, Evaluation, Advanced Evaluation, Cut-off Value và Multiple Test Ta nhấn chuột vào submenu Evaluation chẳng hạn, trên màn hình sẽ xuất hiện giao diện như sau (hình 2.2):
Test Evaluation…
Hình 2.2
Trang 5Trên thanh cơng cụ của window con sẽ xuất hiện dịng chữ: Diagnosis Test Evaluation
cĩ nghĩa là đánh giá phương pháp chẩn đốn Cửa sổ con này cĩ hai phần Phần trên cĩ các
ơ màu trắng và cĩ dịng chữ input of DATA cĩ nghĩa là phần để nhập số liệu Phần dưới ghi RESULTS là phần cho kết quả
Ơ nhập số liệu cĩ 2 cột (Yes và No) thuộc tiêu đề Disease (cĩ mắc bệnh và khơng mắc bệnh) và 2 dịng (+ và -) thuộc tiêu đề Test (kết quả dương tính hay âm tính)
ðể hiểu và sử dụng tiện ích này, nĩi cách khác tiện ích này dùng để làm gì chúng ta lấy
một thí dụ như sau: một nhà khoa học nọ sang chế ra một phương pháp chẩn bệnh bằng kỹ thuật ELISA nhằm phát hiện vi rút dịch tả lợn trong huyết thanh ðể xác định phương pháp này cĩ giá trị chính xác đến đâu cần phải xác định các tiêu chí sau:
- ðộ nhạy (sensitivity)
- ðộ đặc hiệu (specificity)
- Tỷ lệ mắc bệnh thực (true prevalence)
- Tỷ lệ mắc bệnh thấy được (apparent prevalence)
- Tỷ lệ dự đốn dương tính (predictive value +)
- Tỷ lệ dự đốn âm tính (predictive value -)
ðể làm việc đĩ, tác giả sử dụng mẫu máu của 50 lợn mắc bệnh và 50 lợn khơng mắc
bệnh để xác định giá trị của phương pháp ELISA do ơng ta sáng chế Sau khi xét nghiêm, kết quả thu được như sau: trong số 50 mẫu lợn bệnh, cĩ 47 mẫu dương tính và 3 mẫu âm tính Trong số 50 mẫu lợn khỏe mạnh cĩ 2 mẫu cho kết quả dương tính Ta nhập số liệu vào máy 4 con số nĩi trên như hình 2.3 sau đây:
Hình 2.3
Trang 6ðồng thời nhấp chuột vào các giá trị về độ tin cậy (Level of Confidence) Chúng ta
chọn với độ tin cậy là 95% chẳng hạn Sau khi nhập đầy đủ số liệu, nút calculate sẽ hiện rõ màu xanh Nhấn chuột vào nút calculate (tính) ta sẽ cĩ các kết quả trên màn hình như sau (hình 2.4.):
Hình 2.4
Nhìn vào bảng kết quả chúng ta thấy sensitivity (độ nhạy của phương pháp này) là 94%; với Lower Lim (cận dưới) là 87,4% và cận trên (Upper Lim) là 100% Cũng như vậy với độ đặc hiệu (Specificity) là 96% cận dưới là 90,56% và cận trên là 100%
Về kết quả các tiêu chí khác chúng ta thấy:
- Tỷ lệ mắc bệnh thực (true prevalence): 50%
- Tỷ lệ mắc bệnh thấy được (apparent prevalence): 49%
- Tỷ lệ dự đốn dương tính (predictive value +): 95,9%
- Tỷ lệ dự đốn âm tính (predictive value -): 94,1% (đã làm trịn số)
ðể hiểu các tiêu chí khác, chúng ta lập bảng 2X2 như sau (bảng 2.1):
Trang 7Thật ra, khi lập bảng 2X2 như trên ta cĩ thể tính các chỉ số như sau:
- ðộ nhạy (sensitivity) = A/A+C = 47/50 = 94%
- ðộ đặc hiệu (specificity) = D/B+D = 48/50 =96%
- Tỷ lệ mắc bệnh thực (true prevalence) = (A+C)/N = 50/100 = 50%
- Tỷ lệ mắc bệnh thấy được (apparent prevalence) = (A+B)/N = 40/100 = 49%
- Tỷ lệ dự đốn dương tính (predictive value +) = A/A+B = 47/49 = 95,9%
- Tỷ lệ dự đốn âm tính (predictive value -) = D/C+D = 48/51 = 94,1%
Tuy nhiên để tính giá trị cận trên và cận dưới (tốn thống kê) lại rất mất thời gian khi coi các kết quả trên đây cĩ phân bố chuẩn và tính chúng với độ tin cậy là 95% Nếu chúng
ta thay độ tin cậy ví dụ là 97,5% chúng ta nhấn chuột vào nút dành cho con số 97.5% chúng ta sẽ thấy các con số kết quả thay đổi theo nhưng chủ yếu là cận trên và cận dưới
Về ý nghĩa các con số trên, xin nhắc lại là bài viết này dành cho người đọc được mặc
định là đã cĩ kiến thức về dịch tễ học và tốn thống kê Bài viết này khơng giới thiệu cặn kẽ
các khái niệm sử dụng trong dịch tễ học Cũng như vậy đối với kiến thức về tốn thống kê
2.2 Các phương pháp chẩn đốn
Nhấn chuột vào submenu TEST ta cĩ
a Thử sự trùng hợp kết quả (Test of Agreement)
Trong nhiều trường hợp, phải sử dụng các phương pháp tốn kém để xác định dịch bệnh Các phương pháp này chưa phải đã là hồn hảo do khơng xác định được độ đặc hiệu
và độ nhạy của nĩ Trong hồn cảnh như vậy, khi dùng một phương pháp thay thế (rẻ hơn, nhanh hơn hoặc đơn giản và dễ thực hiện hơn…) phải so sánh với phương pháp nĩi trên
được lấy làm chuẩn Sự trùng hợp về kết quả của hai phương pháp được thể hiện bằng giá
trị Kappa, tỷ lệ trùng kết quả
Trong phần kết quả chúng ta thấy giá trị của Kappa và khoảng tin cậy (Confidence Interval) của Kappa được tính với hai giả thiết (i) giả thiết thứ nhất là sai số chuẩn của K bằng khơng [se(0)] và giả thiết thứ hai (ii) là sai số chuẩn của K khác 0 [se(1)]
ðể nhập số liệu, trong bảng 16 ơ cĩ phần hàng dọc là kết quả của phương pháp chuẩn;
các chữ A, B, C, D là tiêu chí đánh giá (ví dụ A là số dương tính, B số nghi ngờ và C là số
âm tính theo phương pháp chuẩn) Phần hàng ngang là kết quả của phương pháp thay thế Như vậy, ơ Aa là cùng cĩ kết quả dương tính với cả 2 phương pháp; Ac là dương tính với phương pháp chuẩn nhưng âm tính với phương pháp thay thế…
Thí dụ: ta cĩ 100 mẫu huyết thanh được xét nghiệm kháng thể vi rút cúm type A với hai phương pháp ELISA và HI (ức chế ngưng kết hồng cầu) ELISA được coi là chuẩn nhưng tốn kém và phức tạp trong khi thực hiên Sau khi xét nghiệm ta thấy số mẫu dương tính với cả hai phương pháp (Aa) là 60; dương tính với ELISA và âm tính với HI (Ab) là 3;
âm tính với ELISA và dương tính với HI (Ba) là 4 và âm tính với cả hai phương pháp (Bb)
là (100 – 60 – 4 – 3) = 33 mẫu Nhập các con số trên vào các ơ tương ứng, xác định độ tin cậy, nút calculate sẽ hiện rõ màu xanh, nhấn vào đĩ ta cĩ kết quả (xem hình 2.5) như sau:
Test Agreement…
Trang 8Hình 2.5
Trong phần kết quả cho thấy:
- Tỷ lệ trùng kết quả quan sát thấy (Observed Proportion of Agreement) là 93%,
- Tỷ lệ hy vọng trùng kết quả (Expected Proportion of Agreement) là 53,6%,
- Tỷ lệ trùng quan sát ựược trừ ựi tỷ lệ trùng do ngẫu nhiên (Observed Minus Chance)
là 39,4%
- Tỷ lệ trùng kết quả tối ựa ngoài tỷ lệ trùng do ngẫu nhiên (Max possible agreement beyond chance) là 46,4% và chỉ số Kappa là 0,894 với các cận trên và cận dưới theo giả thiết sai số chuẩn là 0 [Se(0)] và [Se(1)] khác 0
b đánh giá phương pháp chẩn ựoán (Evaluation)
Như ựã trình bày trong phần cuối mục giới thiệu (2.1)
c Advanced Evaluation Ờ đánh giá phân tắch phương pháp chẩn ựoán
Với ựộ nhạy và ựộ ựặc hiệu cho trước của một phương pháp chẩn ựoán, kèm theo tỷ lệ mắc bệnh thực và số mẫu kiểm tra sử dụng phương pháp ựó (các dữ liệu nhập vào máy), tiện ắch này cho biết mối tương quan giữa các chỉ số liên quan Trong hình 6 có thắ dụ về hai phương pháp chẩn ựoán Phương pháp 1 có (vắ dụ) ựộ nhạy (sensitivity) là 96% ựộ ựặc hiệu (specificity) là 98%, dùng phương pháp này ựể xét nghiệm 100 (sample) mẫu tại một quần thể có tỷ lệ mắc bệnh thực (true prevalence) là 2% Ta có kết quả là sẽ có hai mẫu dương tắnh mắc bệnh thật (dương tắnh thật) và hai mẫu dương tắnh nhưng thực chất không mắc bệnh (dương tắnh giả)
Ngoài ra máy cho ta biết:
- Tỷ lệ dương tắnh thấy ựược là 3,88% (trong khi thực sự chỉ có 2%)
- Giá trị tiên ựoán dương tắnh là: 49,48% (có nghĩa là khi dùng phương pháp này, chỉ một nửa số mẫu dương tắnh ựúng là dương tắnh từ bệnh phẩm mắc bệnh thực)
Trang 9- Giá trị tiên đốn âm tính là: 99,92% (cĩ nghĩa là khi dùng phương pháp này, một mẫu
cĩ kết quả âm tính thì chắc chắn 99,9% đúng là âm tính)
- Ngồi ra máy cịn cho ta các số liệu khác khi thay đổi tỷ lệ dương tính thật và mối tương quan giữa tỷ lệ dương tính thật với các chỉ số nêu trên
Test Advanced Evaluation…
Hình 2.6b
Hình 2.6b
Trang 10Cũng với 100 mẫu trên nếu ta sử dụng phương pháp xét nghiệm có ựộ nhạy là 60% và
ựộ ựặc hiệu là 80%, ta sẽ có kết quả khác, tỷ lệ mắc bệnh (dương tắnh) sẽ là 20,8% (trong
khi thực tế chỉ là 2%) Và mối tương quan dạng ựồ thị giữa các tiêu chắ cũng khác ựi Xem chi tiết trong hình 2.6a và 2.6b dưới ựây
d Xác ựịnh ngưỡng (dương tắnh) - cut-off value
Phần này dành chủ yếu cho người thiết lập các phương pháp chẩn ựoán mới
e đánh giá phương pháp chẩn ựoán dùng nhiều phép thử Ờ multitest
Trong khi chẩn ựoán bệnh ta không chỉ dùng một phép thử mà kết hợp nhiều phép thử (xét nghiệm) khác nhau, gọi là phương pháp chẩn ựoán ựa phép thử (multitest) Các phép thử không phải ựều cho cùng kết quả giống nhau Kết quả có thể là dương tắnh với phép thử này nhưng lại âm tắnh với phép thử khác để kết luận có hay không có bệnh, người ta
dùng hai cách ựánh giá, cách thứ nhất gọi là (i) ựánh giá kết quả ựồng thời (còn gọi là song
song Ờ in parallel) tức là tất cả các phép thử chẩn ựoán ựều phải cho kết quả dương tắnh thì mới kết luận là có bệnh Như vậy, phải làm tất cả các phép thử, sẽ tốn kém và mất thời
gian Nhưng cũng có thể kết luận bằng cách thứ hai (ii) lần lượt Ờ in series, tức là cứ thấy
một phép thử nào ựó cho kết quả dương tắnh là kết luận ựã có bệnh (tránh khỏi phải làm các phép thử khác, mà chỉ làm phép thử tiếp theo với các mẫu âm tắnh) Tiện ắch này sẽ phân tắch về ựộ nhạy, ựộ ựặc hiệu v.vẦ của phương pháp nhiều phép thử
Với ựặc ựiểm của từng bệnh và trong hoàn cảnh cụ thể khác nhau, các cơ quan quản lý
sẽ ựưa ra quyết ựịnh là dùng phương pháp nào (song song hay lần lượt) ựể kết luận bệnh khi dùng phương pháp chẩn ựoán ựa phép thử
2.3 Nghiên cứu về mẫu (Sample)
Dịch tễ học như ựã nói là môn toán (thống kê) mang màu sắc y học Do vậy việc xác
ựịnh cỡ mẫu và với số mẫu ựã sử dụng ta ựánh giá các kết quả thu ựược như thế nào ựược
xử lý trong tiện ắch này Vào submenu SAMPLES ta sẽ thất xuất hiện các mục như sau (hình 2.7):
Hình 2.7
Trang 11- Estimate mean - Ước lượng số trung bình
- Estimate difference between means - Ước lượng sự khác nhau về giá trị trung bình
- Estimate percentage - Ước lượng tỷ lệ phần trăm
- Estimate difference between percentage - Ước lượng sự khác nhau về tỷ lệ phần trăm
- Detection of Disease - Phát hiện bệnh
- Threshold value - Giá trị ngưỡng
- Unmached case control - bệnh chứng không cặp ñôi
- Mached case control - Nghiên cứu bệnh chứng cặp ñôi
- Cohort - Nghiên cứu thuần tập
Trong dịch tễ học, cỡ mẫu liên quan chặt chẽ ñến tỷ lệ (thực sự) có bệnh có trong quần thể, tỷ lệ thấy ñược (phát hiện), ñộ nhạy và ñộ ñặc hiệu của phép thử, khoảng tin cậy của kết quả mong muốn… Do vậy, cần phải tính toán cỡ mẫu sao cho kết quả phản ánh trung thực nhất trạng thái thực tế Ngược lại, với cỡ mẫu cho trước chúng ta phải tính toán và xác
ñịnh các con số kết quả nêu trên có giá trị ñến mức nào? Mặt khác, trong nghiên cứu hay ñiều tra dịch tễ, các phương pháp và mục tiêu nghiên cứu khác nhau (phát hiện bệnh –
detection, hay sàng lọc bệnh - screening…) ñòi hỏi các cỡ mẫu khác nhau Hơn nữa, ñể so sánh ñặc tính các quần thể một cách chính xác và ñúng ñắn ñòi hỏi phải có cỡ mẫu tối thiểu phù hợp Phần submenu này giúp chúng ta giải quyết các vấn ñề liên quan ñến mẫu
ñiều tra và các vấn ñề nêu trên
a Ước lượng giá trị trung bình - Estimate Mean
Khi nhấn chuột vào phần ước lượng giá trị trung bình (Estimate Mean) chẳng hạn, máy tính sẽ cho cung cấp cho ta số lượng mẫu cần thiết ñể xét nghiệm Ví dụ: trong một quần thể
có 1000 lợn, muốn biết trọng lượng trung bình của ñàn lợn này (tính bằng Kg) với ñộ tin cậy
là 95% cho rằng ñộ lệch chuẩn (Expected Standard Deviation) là 0,5 và sai số tuyệt ñối (Expected Standard Error) là 0,1 ta nhập các số liệu vào máy sau ñó nhấn nút calculate sẽ cho ta cỡ mẫu cần lấy (Required Sample Size) là 88 Có nghĩa là cần tính trọng lượng trung bình của 88 lợn thì số trung bình này mới ñại diện cho cả ñàn lợn 1000 con với ñộ tin cậy là 95% Với ñàn lợn 1000 con khác, trông bề ngoài không ñồng ñều so với ñàn trước Có nghĩa
là sai số chuẩn sẽ cao hơn, ví dụ là 1 (lớn hơn 0,5) chẳng hạn Sau khi nhập số liệu và nhấn chuột vào nút calculate ta sẽ có cỡ mẫu cần lấy (Required Sample Size) sẽ là 278 (lớn hơn
88, xem hình 2.8a và 2.8b)
Sample Estimate Mean
Hình 2.8a
Trang 12Hình 2.8b
b Ước lượng giá trị phần trăm – Estimate percentage
Trong nghiên cứu dịch tễ ta thường lấy một lượng mẫu nào đĩ, sau khi xét nghiệm thấy cĩ (ví dụ) 14% số mẫu dương tính Ta cĩ thể kết luận như thế nào về tồn bộ quần thể Ngược lại, một ví dụ khác: đối với một đàn gia súc cĩ n=1000 cá thể, trong đĩ cĩ khoảng 20% cĩ kháng thể, ta phải lấy bao nhiêu mẫu để giá trị % đĩ đại điện cho quần thể với độ tin cậy là 95% và sai số là +/- 5% (các con số nêu ra chỉ là các ví dụ)
Ta nhấn con trỏ vào mục Ước lượng phần trăm - Estimate Percentage sẽ xuất hiện của giao diện như hình 9 Nhập các số liệu vào các ơ như sau:
- ðộ lớn của quần thể - Population Size: 1000
- Tỷ lệ mắc bệnh dự đốn - Expected Prevalence (%): 20
- Sai số chấp nhận - Accepted Error (%): 5
- ðộ tin cậy - Level of Confidence: 95%
Nhấn nút calculate, trong phần kết quả màn hình xuất hiện ba dịng như sau:
- Tỷ lệ lấy mẫu - Sampling Fraction: 19,734
- Cỡ mẫu -Sample Size: n: 245,86
- Cỡ mẫu được điều chỉnh -Sample Size n(a):197,34
Trên một thanh nhấp nháy xuất hiện dịng chữ: Use value of n(a) = 198 cĩ nghĩa là hãy
sử dụng giá trị 198 (hình 2.9a) Nĩi cách khác phải lấy 198 mẫu để đạt các yêu cầu như đã nạp vào máy (kết quả tỷ lệ mắc bệnh khoảng gần 20 (+/-5%)
Sample Estimate Percentage
Hình 2.9a
Trang 13Nếu ta chấp nhận sai số cao hơn ví dụ 10% chẳng hạn ta thấy chỉ cần lấy 58 mẫu (hình 2.9b) Cùng trong cửa sổ này có một trang khác nhằm ñể tính sai số phần trăm với một cỡ mẫu nào ñó Ví dụ: cùng là quần thể 1000 con, tỷ lệ có kháng thể ước khoảng 20%, khi lấy
100 mẫu ñể xét nghiệm thì sai số sẽ là +/-7,84%
Hình 2.9b
c Phát hiện bệnh - Detection of Disease
Một tiện ích quan trọng khác là: (cỡ mẫu cần có ñể) Phát hiện bệnh - Detection of Disease Giả sử rằng trong ñàn 300 lợn có 2 lợn bị ho nghi bị suyễn lợn Khi thú y muốn xác ñịnh xem trong ñàn lợn này có bệnh suyễn lợn không; cần lấy mẫu bao nhiêu lợn ñể có kết quả 1 lợn dương tính với suyễn lợn Ta nhập số liệu vào phần Input như sau:
- Cỡ quần thể (tổng ñàn) - Population Size: 300
- Số ñộng vật mắc bệnh (ho) - No of Diseased animals: 2
- ðộ tin cậy - Level of Confidence: 95%
Sample Detection of Disease
Hình 2.10