MỤC LỤC
Trong giản đồ thanh, chiều dài của thanh được vẽ tỉ lệ với tần suất và trong đồ thị hình bánh, vòng tròn được chia sao cho diện tích của mỗi phần tỉ lệ với tần suất. Quy tắc chung để vẽ tổ chức đồ khi các khoảng không cùng chiều rộng là để chiều cao của hình chữ nhật tỉ lệ với tần suất chia cho chiều rộng, để cho diện tích của hình chữ nhật trong tổ chức đồ tỉ lệ với tần suất.
Bởi vì sự biến thiên nhỏ khi các quan sát tập trung gần chung quanh trung bình và lớn khi các quan sát phân tán trên một phạm vi đáng kể, sự biến thiên thường được đo lường theo độ lệch (deviation) của các quan sát so với trung bình. Tương đương của hai công thức trên được minh họa trong thí dụ 3.2 (lưu ý: nhiều máy tính cầm tay có những hàm để tính trung bình và độ lệch chuẩn. Các phím bấm thường được kí hiệu bằng x và σn-1, trong đó ơ là mẫu tự Hi lạp sigma thường).
Khả năng chuyển bất kì một biến có phân phối bình thường thành độ lệch bình thường chuẩn (SND) có nghĩa là chỉ cần một bảng cho phân phối bình thường chuẩn và không cần tất nhiều bảng cho tất cả các giá trị trung bình và độ lệch chuẩn khác nhau. Ðiểm phần trăm được mô tả ở đây được gọi là điểm phần trăm hai đuôi (two- sided) bởi vì chúng bao gồm cả các quan sát ở đuôi trên và dưới của phân phối.
Ðiều này là do một tính chất toán học rất hữu ích được gọi là định lí giới hạn trung tâm (central limit theorem) khẳng định rằng ngay cả biến không có phân phối bình thường, trung bình mẫu có khuynh hướng phân phối bình thường (có thể biểu diễn thực tế của định lí này bằng cách tiến hành một trò chơi lấy mẫu như trong thí dụ 3.4 nhưng thay thế 250 huyết áp bằng một dân số phân phối phi bình thường. Mẫu càng lớn thì trung bình mẫu càng gần với phân phối bình thường; cỡ mẫu cần thiết để cho xấp xỉ bình thường phụ thuộc vào dân số có phân phối bình thường nhiều hay ít nhưng trong phần lớn các trường hợp, cỡ mẫu 15 là đủ.
Thí dụ, có xác suất 5% có kết quả có mức ý nghĩa 5% chỉ do sự biến thiên lấy mẫu đơn thuần và do đó nếu chúng ta đánh giá kết quả là bằng chứng bác bỏ giả thuyết trung tính, có xác suất 5% chúng ta sẽ mắc sai lầm (hình 6.2a). Ðiều này xảy ra là do sự chồng lắp giữa phõn phối lấy mẫu thực của trung bỡnh mẫu quanh trung bỡnh dõn số à' (≠à ) và miền chấp nhận của giả thuyết trung tính dựa trên phân phối lấy mẫu giả thuyết về trung bỡnh khụng đỳng, à.
Khi độ lệch chuẩn dân số của hai nhóm khác nhau, nên làm theo phương án thứ nhất nghĩa là tìm sự biến đổi thang đo để điều chỉnh (xem Chương 19), để cho có thể dùng kiểm định t. Một phương án khác là dùng kiểm định phi tham số (xem Chương 20) hay dùng kiểm định Fisher-Behrens hay Welch (Armitage & Berry, 1987).
Các chương trình phân tích phương sai của các phần mềm máy tính nhỏ có thể dùng cho các quy hoạch cân đối hay quy hoạch chỉ có một số nhỏ các giá trị bị khuyết (missing value); trong những trường hợp này các chương trình hồi quy bội có thể dùng cho thiết kế không cân đối (xem Chương 10). Trong thí dụ này và để xem tác động con người có ý nghĩa không, chúng ta sẽ quan tâm đến việc ước lượng độ lớn của sự biến thiên nồng độ giữa các dung dịch được pha bởi một người và sự biến thiên giữa các dung dịch được pha bởi các người khác nhau.
Không giống như tương quan, việc lựa chọn biến nào để làm biến y là quan trọng bởi vì hai phương pháp không cùng cho một kết quả, y thường được gọi là biến số phụ thuộc (dependent variable) và x là biến số độc lập hay giải thích (independent or explanatory variable). Nói chung phải thận trọng khi sử dụng đường hồi quy để tính các giá trị ngoài phạm vi của x trong số liệu gốc, bởi vì quan hệ tuyến tính không nhất thiết sẽ đúng ở ngoài phạm vi mà nó được làm phù hợp.
Tổng bình phương do hồi quy của trọng lượng lúc sinh do chiều cao của mẹ và tuổi thai gồm tổng bình phương được giải thích bởi chiều cao của mẹ (tính như trong hồi quy tuyến tính đơn) cộng với tổng bình phương được giải thích bởi tuổi thai sau khi đã được giải thích bằng chiều cao của mẹ (Bảng 10.3a). Theo cách khác, tổng bình phương được giải thích bởi hồi quy với cả hai biến bao gồm tổng bình phương được giải thích bởi tuổi thai (tính bằng hồi quy tuyến tính đơn) cộng với tổng bình phương được giải thích do chiều cao của mẹ sau khi đã điều chỉnh theo tuổi thai.
Xác suất (B khi A đã xảy ra) được gọi là xác suất điều kiện (conditional probability) bởi vì nó là xác suất xảy ra biến cố B khi đã xảy ra biến cố A. Một thí dụ của biến cố phụ thuộc (dependent) là xác suất một đứa trẻ ở Ấn độ bị thiếu máu và suy dinh dưỡng, bởi vì đứa trẻ sẽ dễ bị thiếu máu nếu nó bị suy dinh dưỡng.
Do đó trong ví dụ này, xác suất xuất hiện đáp ứng với thuốc A 3 lần cũng bằng với xác suất xuất hiện đáp ứng với thuốc A 9 lần, cũng như Bảng 12.2 Trung bình dân số và sai số chuẩn của số lần xuất hiện, tỉ lệ và phần trăm của biến cố A trong mẫu. Ta có thể tính mức ý nghĩa bằng cách cộng vào (i) xác suất của giá trị mẫu quan sát được và các giá trị cực đoan hơn theo hướng đó và (ii) xác suất của mỗi giá trị theo hướng ngược lại mà những xác suất này nhỏ hơn xác suất của mẫu quan sát được.
Giống như kiểm định bỡnh thường, kiểm định chi bỡnh phương đối với bảng 2 ì 2 cú thể được cải tiến nhờ hiệu chỉnh tính liên tục, thường được gọi là hiệu chỉnh tính liên tục của Yates (Yates' continuity correction). Khi chúng rất nhỏ kiểm định chi bình phương (và kiểm định bình thường) không phải là xấp xỉ tốt, ngay cả khi có hiệu chỉnh tính liên tục và khi đó nên dùng kiểm định chính xỏc (exact test) cho bảng 2 ì 2 (xem Chương 14).
(cạch nghéa yù. Các thứ nhì hạn chế việc tính toán cho các bảng cực đoan cùng hướng với hướng đã quan sát và sau đó nhân đôi xác suất để có cả sự khác biệt theo hướng ngược lại. Khụng cú phương phỏp nào hay hơn phương phỏp kia nhưng phương pháp dễ tiến hành hơn. Mặc dù hai phương pháp cho kết quả khác nhau nhưng trên thực tế cách lựa chọn ít khi tác động đến việc đánh giá xem sự khác biệt là do tình cờ hay là hiệu quả có thực. = xácsuấtcủacác bảng cựcđoanhơntheohướng tương tự được. sạt quan baíng cuía suất xạc II). Lưu ýy rằng nếu trình bày số liệu như trong bảng 14.3(b) và áp dụng kiểm định chi bình phương là sai, bởi vì nó không tính đến bản chất cặp đôi của số liệu, đó là cùng 315 bệnh phẩm được xét nghiệm bởi cả hai phương pháp, chứ không phải là 630 bệnh phẩm khác nhau.
Số mắc toàn bộ có thể đo lường ở một thời điểm (mắc toàn bộ thời điểm - point prevalence) hay trong một khoảng thời gian (số mắc toàn bộ thời khoảng - period prevalence). Nó thường được tính theo phần trăm hay nếu nhỏ theo phần ngàn của dân số. giữa ở số dán bọỹ toaìn. trước cho khoaíng thời. âọ naìo gian thời mọỹt ở bệnh cọ người Số khoaíng) (thời. mắc hiện suất Tè 2. số dán bọỹ toaìn. điểm thời mọỹt tải. bệnh cọ người Số điểm) (thời mắc hiện suất Tè 1. Trong phương pháp chuẩn hóa trực tiếp (direct method), tỉ suất đặc hiệu tuổi giới tính từ mỗi dân số nghiên cứu đươc áp dụng cho một dân số chuản để có tỉ suất tử vong được điều chỉnh theo tuổi giới tính (age-sex adjusted mortality rate), trong phương pháp gián tiếp (indirect method) tỉ suất đặc hiệu tuổi giới tính của dân số chuẩn được áp dụng cho mỗi dân số quan tâm để có tỉ số tử vong chuẩn hóa (standardized mortality ratio).
Thí dụ, nếu bảng 16.1 cho thấy đường cong sống còn sau khi xạ trị ung thư phế quản tế bào nhỏ được so sánh với đường cong sống còn sau khi hóa trị, thủ tục này sẽ tạo ra 18 bảng 2 ì 2 , mỗi bảng cho một thỏng sau khi điều trị. Có thể chứng mình rằng nếu một dân số bị một nguy cơ chết hằng định, không những đường còn sẽ có dạng mũ như hình 16.2 mà phân phối của thời gian sống còn cũng có dạng hình mũ với kì vọng sống bằng nghịch đảo của nguy cơ chết.
Ở đây chúng ta thảo luận tổng quát cách phân tích tỷ suất và chúng ta dùng kí hiệu λ (kí tự Hi lạp lambda) cho tỉ suất trung bình số lần xuất hiện biến cố (nghĩa là số lần xuất hiện biến cố trung bình trong một đơn vị thời gian). Ðiều này dĩ nhiên ít đúng trong trường hợp bệnh truyền nhiễm hơn là bệnh không truyền nhiễm, nhưng với điều kiện không có bằng chứng mạnh mẽ về sự tập trung của bệnh, việc sử dụng vẫn xứng đáng.
Nếu không có sai lệch trong ghi nhận, thí dụ như sai lệch do khuynh hướng ghi tròn kilogram hay ghi tròn nửa kilogram, ta kì vọng rằng số lần xuất hiện các số 0, 1, 2,.., 9 trong chữ số cuối cùng bằng nhau và bằng 9,6. Có thể thấy rằng có số hồng cầu quan sát có một hay hai kí sinh trùng nhỏ hơn số kì vọng và số hồng cầu quan sát có ba hay bốn kí sinh trùng nhiều hơn kì vọng, gợi ý rằng kí sinh trùng tấn công vào tế bào có chọn lọc chứ không phải ngẫu nhiên.
Nhiều thử nghiệm huyết thanh học, như là thử nghiệm kết dính hồng cầu dùng cho kháng thể sởi, dựa trên một loạt những lần pha loãng gấp đôi và độ pha loãng của dung dịch loãng nhất mà có phản ứng được ghi nhận. Thí dụ, phép biến đổi nghịch đảo (reciprocal transformation) mạnh hơn phép biến đổi logarithm và sẽ thích hợp nếu phân phối bị lệch dương nhiều hơn phân phối bình thường, trong khi phép biến đổi lấy căn (root transformation) yếu hơn.
Có ba phương pháp phổ biến nhất là kiểm định sắp hạng có dấu Wilcoxon, kiểm định tổng sắp hạng Wilcoxon và tương quan sắp hạng Spearman sẽ được mô tả bằng cách dùng cách thí dụ đã được phân tích bởi các kĩ thuật cổ điển. Nói một cách chặt chẽ, phương pháp χ2 được mô tả ở chương 13 và 14 cũng là phi tham số nhưng chúng là phương pháp chuẩn cho việc phân tích tỉ lệ và bảng dự trù, nên chúng thường được kể là phương pháp cổ điển.
Một thí dụ của nghiên cứu quan sát là đánh giá hiệu quả của tiêm BCG chống lại bệnh lao ở một vùng có chương trình tiêm chủng tích cực ở đó BCG được tiêm chủng thường quy, bởi vì việc lựa chọn có tiêm hay không tiêm không phụ thuộc vào người nghiên cứu. Trong đa số các trường hợp, cách đơn giản nhất để tiến hành nghiên cứu cắt dọc là tiến hành nhiều lần điều tra cắt ngang (repeated cross- sectional surveys) ở những khoảng thời gian cố định và điều tra hay đo lường những thay đổi đã xảy ra giữa các cuộc điều tra, như sinh, tử vong, di trú, thay đổi trọng lượng hay mức kháng thể, hay xuất hiện các đợt bệnh mới.
Thí dụ để đánh giá việc bú sữa mẹ có bảo vệ đứa trẻ không bị chết, nhóm bệnh gồm những đứa trẻ bị chết trong năm đầu tiên và nhóm chứng là những đứa trẻ sống trong cùng khu vực có cùng tuổi và giới tính với bệnh. Cuối cùng, nghiên cứu bệnh chứng (giống như nghiên cứu cắt ngang) không thích hợp nếu như bệnh hưởng đến yếu tố nguy cơ và cũng có thể là hậu quả của yếu tố nguy cơ như trong trường hợp suy diinh dưỡng là yếu tố nguy cơ của tiêu chảy.
Nếu có thể tránh sử dụng mã zero bởi vì nhiều chương trình máy tính và nhiều gói phần mềm thống kê không thể phân biệt zero với không trả lời, không có số liệu. Thí dụ, trong nông thôn Tây Phi, một gia đình có thể dùng một hay nhiều trong tám loại nguồn nước (nước mưa, nước giếng sâu, nước giếng, suối phun, sống, hồ, cao, suối) để uống.
Thí dụ, trong thiết kế một cuộc nghiên cứu để thử nghiệm một loại vaccine bệnh phong mới, lúc đầu cần loại bỏ tất cả các bệnh nhân phong.Do đó người ta mong muốn một thử nghiệm có tỉ suất phát hiện dương tính thành công Bảng 22.1 So sánh sự nhớ lại của cha mẹ về tình trạng tiêm chủng của con với tình trạng tiêm chủng ghi trong hồ sơ sức khỏe chính thức. Ngược lại, khi phỏt hiện cỏc trường hợp mắc bệnh trong giai đoạn theo dừi sau khi tiêm chủng, người ta muốn một thử nghiệm có độ nhạy cảm cao, bởi vì điều quan trọng là phải tin chắc rằng tất cả các trường hợp dương tính được phát hiện là đúng, và nếu ít quan trọng hơn nếu chúng bị bỏ qua.
Những tình huống đó phát sinh khi (i) không có khung mẫu và xây dựng khung mẫu rất tốn kém hay không thể được, (ii) dân số trải ra trong một khu vực rộng, chi phí và thời gian di chuyển để đi khắp khu vực không cho phép, (iii) dân số có những nhóm hoàn toàn khác biệt. Thí dụ, trong khi lấy mẫu trường để ước lượng tỉ suất mắc toàn bộ của bệnh khi muốn sử dụng một phương pháp điều trị hiệu quả cho tất cả những người bị bệnh, người ta sẽ muốn khám tất cả các học sinh trong các trường được chọn chứ không khám một mẫu trong đó.
Nguy cơ quy trách đôi khi được tính bằng tỉ lệ so với tổng số tỉ suất mới mắc trong nhóm tiếp xúc và được gọi là phần trăm nguy cơ quy trách (attributable risk percent) hay nguy cơ quy trách tỉ lệ (proportional attributable risk), tỉ lệ quy trách (tiếp xúc), phân số quy trách (tiếp xúc) và phân số căn nguyên (tiếp xúc). (a) một chứng cho một bệnh. Ngẫu nhiờn Bảng 2ì2 đơn trỡnh bày yếu tố nguy cơ ì bệnh/chứng Kiểm định χ2 chuẩn. OR=tỉ số tích chéo, ad/bc. hồi quy logistic hay phân tích phân tầng. Bắt cặp đụi Bảng 2ì2 trỡnh bày sự phự hợp giữa bệnh và chứng đối với yếu tố nguy cơ. Kiểm định χ2 McNemar. cọ chứng khọng bệnh. khọng chứng cọ bệnh. hợp phuì khọng cặp số tè OR. hồi quy logistic điều kiện. Bắt cặp tầng Phõn tớch phõn tầng: bảng 2ì2 cho mỗi tầng. Kiểm định χ2 Mantel-Haenszel ).
Ðể thảo luận đầy đủ hơn vấn đề này và những vấn đề liên quan hãy xem Bradford Hill (1977) trong đó có bản sao Khẳng định của Hội đồng nghiên cứu y khoa về trách nhiệm trong nghiên cứu đối tượng con người (Medical Research Council's Statement on Responsibility in Investigations on Human Subjects) và tuyên ngôn Helsinki (Helsinki Declaration) của Hội đồng y khoa thế giới (World Medical Assembly) về Các khuyến cáo hướng dẫn bác sĩ y khoa trong nghiên cứu y sinh có liên quan đến đối tượng con người (Reccomendations Guiding Medical Doctor in Biomedical Research Involving Human Subjects). Thử nghiệm lâm sàng tuần tự (sequential clinical trial) là một thử nghiệm trong đó kết quả được đánh giá liên tục để xem đã có đủ bằng chứng để ngừng thử nghiệm và tuyên bố hoặc là đã xác định được sự khác biệt hay không có sự khác biệt nào.
Do đó chúng ta cần khoảng 60 bệnh nhân để thỏa mãn yêu cầu của chúng ta là có năng lực 90% xác định sự khác biệt có ý nghĩa giữa thuốc A và thuốc B ở mức 5%, nếu sự thiên lệch thực sự cho thuốc A là 0,7. Thảo luận ở trên lênquan đến việc xác định cỡ mẫu cho phép kiểm định một tỉ lệ đơn, đó là tỉ lệ người tham dự thiên lệch thuốc A so với thuốc B.
Ở mức thấp nhất là hệ điều hành (operating system), gồm các lệnh cần thiết để điều hành máy tính như ghi chép (COPY) tập tin, ghi ra màn hình (TYPE) một tập tin hay thực hiện (RUN) một chương trình, liệt kê thư mục (DIR) của một đĩa. Kế đến là chương trình (program) gồm một bộ lệnh để làm một nhiệm vụ nào đó, thí dụ như so sánh trọng lượng của trẻ với trọng lượng trung vị của tuổi đó ở trong tiêu chuẩn phát triển và tính trọng lượng quan sát được theo phần trăm của chuẩn.
Có thể làm kiểm định một đuôi bằng cách chia đôi giá trị P (không thể dùng khái niệm một hoặc hai đuôi cho độ tự do lớn hơn). Cải biên từ Bảng A4 của Pearson và Hartley (1966) có xin phép Biometrika Trustees Probits = giá trị của phân phối bình thường tương ứng với phần trăm tích lũy.