83 KHOẢNG TIN CẬY Trong nghiên cứu nhiều khi tìm được giá trị p vẫn chưa thể có kết luận về ý nghĩa thống kê một cách chắc chắn vì nếu các giá trị xung quanh trị số trung bình hay giá trị ước lượng có chứa phần nhiều hay ít giá trị của quần thể thật hay không. Nếu chưa nhiều và hội tụ gần thì chứng tỏ giá trị thu được tập trung và đại diện hoặc ngược lại. Khi tìm được 2 cự c của khoảng tin cậy là ta tìm được giới hạn tin cậy. Thông thường trong nghiên cứu người ta hay giới hạn khoảng tin cậy ở mức 95% (p = 0,05) nên gọi là CI 95% để đánh giá sự may rủi. Đối với các phân phối chuẩn hoặc có hệ thống thì khoảng tin cậy được tính theo công thức sau: (Nếu CI 95% thì t btd = 1,96 (dựa theo biểu đồ Gauss) Trong đó: BA XX − là các giá trị trung bình ngẫu nhiên hoặc mẫu chứng. S cb là đọ lệnh chung. t btd : Trị số phân phối t ở các bậc tự do với ý nghĩa thống kê có mức ấn định. Đối với các biến rời rạc khoảng tin cậy được tính trên cơ sở giá trị của nguy cơ tương đối RR hoặc tỷ xuất chênh OR. Cách này có sự phức tạp của sự hiển diện ở công thức một cách logarit tự nhiên với giá trị tương quan khác nhau. Để đơn giản người ta dự a trên trắc nghiệm đã tính được χ 2 để tính xấp xỉ và tìm phương sai theo công thức sau: z: Là trị số tương ứng với mức tin cậy mong muốn (1,645; l,96; 2,3261 2,576) Khoảng tin cậy có thể cung cấp các thông tin của trị số p, nên khoảng rộng của khoảng tin cậy dao động lớn, nhỏ có ý nghĩa rõ rệt và liên quan đến lực và cơ mẫu. Cỡ mẫu càng lớn thì ước lượng càng ổn định và khoảng tin cậy càng hẹp và ngược lại, chính vì vậy giá trị tin cậy cũng được xác định. 84 SAI SỐ QUAN TRẮC 1. Ba loại sai số Ta biết rằng, dù với sự quan trắc khá chính xác cùng một loại đại lượng, các kết quả của các quan trắc riêng biệt vẫn sai khác nhau, và do đó có chứa sai số. Hiệu x - a giữa kết quả quan trắc x và giá trị chân thực a của đại lượng được quan trắc gọi là sai số quan trắc. Đây lại một trong những bài toán cơ bản của việc xử lý bằng toán học các kết qu ả thực nghiệm chính là ước lượng giá trị chân thực của đại lượng quan trắc theo các kết quả đã thu được. Để giải bài toán đó, cắn biết các tính chất cơ bản của sai số quan trắc và biết cách sử dụng chúng. 1.1. Sai số thô Sai số sinh ra do vi phạm các điều kiện cơ bản của công việc quan trắc hoặc do sơ xuất của người làm thí nghiệm. Khi phát hiện có sai số thô, cần bỏ ngay kết quả quan trắc và quan trắc lại. Ta luôn luôn xem tằng chỉ giữ lại để xử lý bằng toán học các kết quả quan trắc không chứa sai số thô. 1.2. Sai số hệ thống Các sai số quan trắc do một số lớn nguyên nhân mang nhiều vẻ khác nhau gây nên. Ví dụ do không điều chính chính xác dụng cụ, do thay đổi của các điều kiện bên ngoài, ta có thể dễ dàng trừ bỏ các loại sai số hệ thống bằng cách dựa vào các hiệu chỉnh với sự tương ứng trong kết quả quan trắc. Ta xem rằng ngay từ đầu của việc sử lý bằng toán học các kết quả quan trắc, tất cả các sai số hệ thống đều đã được phát hiện và trừ bỏ. 1.3. Sai số ngẫu nhiên Sai số quan trắc còn lại sau khi đã khử tất cả các sai số hệ thống được g ọi là sai số ngẫu nhiên. Sai Bố ngẫu nhiên gây nên bởi một số rất lớn các nhân tố, mà tác dụng của chúng bé đến mức ta không thể tách riêng và tính riêng biệt cho từng nhân tố được. Bằng các phương pháp của lý thuyết xác suất, có thể tính được ảnh hưởng của chúng đến việc ước lượng giá trị chân thực của các đại lượng được quan trắc. 2. Phân phối của sai số ngẫu nhiên trong các quan trắc Sai số ngẫ u nhiên trong các quan trắc được đặc trưng bởi một luật phân phối xác định. Trong mô hình lý thuyết xác xuất, có sai số ngẫu nhiên z = x - a cũng được xem như là các đại lượng ngẫu nhiên (hay là biến ngẫu nhiên) có thể nhận các giá trị thực tuỳ ý đồng thời mỗi khoảng (l 1, z 2 ) tương ứng với một số hoàn toàn xác định được gọi là xác suất để đại lượng ngẫu nhiên z rơi vào khoảng đó, và ký hiệu là p (z 1 < z < z 2 ) 85 hoặc p (z ∈ z 1 . z 2 ) xác Suất đó là Sự lý tưởng hoá của tần suất tương đối của sự rơi vào khoảng (z 1 , z 2 ) tức là trong thực hành, chính tần suất tương đối đã nêu trên đây gần với xác suất đó. Quy tắc cho phép tìm xác suất p (z 1 < z < z 2 ) đối với khoảng (z 1 , z 2 ) tuỳ ý được gọi là luật phân phối xác suất của đại lượng ngẫu nhiên z. Ta có thể viết dưới dạng tích phân: Trong đó p (z) là một hàm không âm nào đó, được chuẩn hoá bởi điều kiện: Hàm đó xác định hoàn toàn luật phân phối xác suất tương ứng và được gọi là mật độ xác suất (hay gọi mật độ phân phối) 3. Phương pháp khử sai số thô 3.1. Phương pháp khử sai số thô khi biết δ Ta ký hiệu giá trị đột xuất là X A còn tất cả các giá trị còn lại là X 1 , và so sánh giá trị tuyệt đối của hiệu XX A − với đại lượng, đối với tỷ số thu được: Ta tính xác suất để cho tỷ số đang xét nhận một cách ngẫu nhiên giá trị không bé hơn 1 với điều kiện giá trị X A không chứa sai số thô. Nếu như xác suất tính được bằng cách đó rất bé, thì giá trị “đột xuất” chứa sai số thô và cần phải bỏ giá trị đó trong việc sử lý tiếp theo các kết quả quan trắc. Ví dụ: Giả sử trong số 41 kết quả quan trắc độc lập được tiến hành và sau khi tính toán ta có kết quả s = 0,133; Phát hiện có giá trị đột xuất x * = 6,866, đồng thời giá trị trung bình của 40 kết quả còn lại là X = 6,500 có thể xem rằng giá trị “đột suất” đó chứa sai số và như vậy nó có giá trị nào đó trong việc xử lý các kết quả nghiên cứu về sau không? Trong tình huống này chúng ta phải làm một phép thử đặc hiệu để đánh giá và sau đó đưa ra hướng giải quyết theo công thức: 86 Giải: Ta tính xác suất 1 -2 Φ (t) = 0,0066 < 0,007. Độ tin cậy của kết luận p > 0,993 => có thể xem rằng giá trị x * chứa sai số thô và bỏ giá trị đó trong việc sử lý sau này các kết quả quan trắc. 3.2. Phương pháp khử sai số thô khi không biết s Ta dùng sai số tiêu chuẩn thực nghiệm vì s không tìm thấy trong tài liệu hoặc vì lý do nào đó mà ta không sử dụng được. Công thức áp dụng và cách làm được tiến hành như sau: Ví dụ: Giả sử n kết quả quan trắc độc lập cùng độ chính xác ta có được giá trị trung bình x = 6,500 còn sai số tiêu chuẩn thực nghiệm S = 0,133 và giả Bộ quan trắc lần thứ n + 1 cho kết quả X * = 6,866. Ta đang đứng trước tình huống cần xem xét, lựa chọn vì giá trị trung bình của lần quan trắc ni lớn hơn so với kết quả quan trắc độc lập. Có thể khử kết quả đó khỏi việc xử lý về sau không là điều mà nhà nghiên cứu cần hết sức cân nhắc để sao cho mẫu nghiên cứu không nhỏ đi nếu không cần thiết, ngược lại nếu để thì có làm sai lệch toàn b ộ các kết quả nghiên cứu chung đã thu được hay không. Giải: Nếu số các kết quả chấp nhận được là n = 40 thì tỷ số thu được vượt quá giá trị tới hạn 2,74 với độ tin cậy p = 0,99 và ta có thể khử giá trị x với độ tin cậy của kết luận lớn hơn 0,99. Còn nếu số các kết quả chấp nhận được là hơn 5, tỷ số thu được bé hơn giá trị tới hạn là 2,78 ngay cả với độ tin cậy p = 0,95 ta cũng không nên kh ử giá trị x * vì mất quá nhiều số liệu (đây là sự vừa lòng với xác suất p = 5) 87 PHẦN PHỤ LỤC Bảng 1: Bảng t P Đtd 0,05 0,02 0,01 0,001 1 12,706 31,821 63,657 636,619 2 4,303 6,965 9,925 31 589 3 3,182 4,541 5,841 12,924 4 2,776 3,747 4,604 8,610 5 2,571 3,365 4,032 6,860 6 2,447 3,143 3,707 5,595 7 2,365 2,998 3,499 5,408 8 2,306 2,896 3,355 5,401 9 2,262 2,821 3,250 4,781 10 2,228 2,764 3,169 4,587 11 2,201 2,718 3,106 4,437 12 2,179 2,681 3.055 4,318 13 2,160 2,650 3,012 4,221 14 2,145 2,524 3,977 4,140 15 2,131 2,602 2,947 4,073 16 2,120 2,583 2,931 4,015 17 2,110 2,567 2,808 3,965 18 2,101 2,552 2,878 3,922 19 2,093 2,539 2,861 3,883 20 2,086 2,528 2,845 3,850 21 2,080 2,518 2,831 3,819 22 2,074 2,508 2,819 3,792 23 2,069 2,500 2,807 3,767 24 2,064 2,492 2,797 3.745 25 2,060 2,485 2,787 3,725 26 2,056 2,479 2,779 3,707 27 2,052 2,473 2,771 3,690 28 2,048 2,467 2,763 3,674 29 2,045 2,462 2,756 3,659 30 2,042 2,457 2,750 3,646 31 1,960 2,326 2,576 3,291 88 Bảng 2: Bảng χ 2 P Đtd 0,05 0,02 0,01 0,001 1 3,841 5,412 6,635 10,827 2 5,991 7,824 9,210 13,815 3 7,815 9,837 11,315 16,266 4 0488 11,668 13,277 18,467 5 11,070 13,388 1 5,068 20,515 6 12,592 15,033 16,812 22,457 7 14,067 16,622 18,475 24,322 8 15,507 18,168 20,090 26,125 9 16,019 19,679 21,666 27,877 10 18,367 21,161 23,209 20,588 11 19,675 22,618 24,725 31,261 12 21,026 24,054 26,217 32,909 13 22,362 25,472 27,688 34,528 14 23,685 26,873 29,141 36,123 15 24,996 28,259 30,578 37,697 16 26,296 29,633 32,000 39,252 17 27,587 30,995 33,409 40,790 18 28,869 32,346 34,805 42,312 19 30,144 33,687 36,191 43,820 20 31,410 35,020 37,566 45,315 21 32,871 36,315 38,932 46,797 22 33,921 37,659 40,289 48,268 23 35,172 38,968 41,638 49,728 24 36,415 40,270 42,980 51,179 25 37,652 41,566 44,314 52,620 26 38,885 42,856 45,642 54,052 27 40,113 44,140 46,963 55,476 28 41,337 15,419 48,278 56,893 29 42,557 46,693 49,588 58,302 30 43,773 47,962 50,892 59,703 89 Bảng 3: Bảng hệ số tương quan P Đtd 0,05 0,02 0,01 0,001 1 0,0877 0,9969 0,9995 0,9999 2 0,9000 0,9500 0,9800 0,9900 3 0,8054 0,8783 0,9343 0,9587 4 0,7293 0,8114 0,8822 0,9172 5 0,6694 0,7545 0,8329 0,8745 6 0,6215 0,7067 0,7887 0,8343 7 0,5822 0,6664 0,7498 0,7977 8 0,5494 0,6319 0,7155 0,7646 9 0,5214 0,6021 0,6851 0,7348 10 0,4973 0,5760 0,6581 0,7079 11 0,4762 0,5529 0,6339 0,6835 12 0,4575 0,5324 0,6120 0,6611 13 0,4409 0,5139 0,5923 0,6411 14 0,4259 0,4973 0,5742 0,6226 15 0,4124 0,4821 0,5577 0,6055 16 0,4000 0,4683 0,5425 0,5897 17 0,3887 0,4555 0,5285 0,5751 18 0,3783 0,4438 0,5155 0,5614 19 0,3687 0,4329 0,5034 0,5487 20 0,3598 0,4227 0,4921 0,5368 21 0,3233 0,3809 0,4451 0,4869 22 0,2960 0,3494 0,4093 0,4487 23 0,2746 0,3246 0,3810 0,4182 24 0,2573 0,3044 0,3578 0,3932 25 0,2428 0,2875 0,3384 0,3721 26 0,2306 0,2732 0,3218 0,3541 27 0,2108 0,2500 0,2948 0,3248 28 0,1954 0,2319 0,2937 0,0317 29 0,1829 0,2172 0,2565 0,2830 30 0,1726 0,2050 0,2422 0,2673 31 0,1638 0,1946 0,2301 0,2540 90 TÀI LIỆU THAM KHẢO 1. Bộ Y tế (2004), Cẩm nang thực hành quản lý và chăm sóc sức khoẻ Nhà xuất bản Lao động - Xã hội tr 11-93. 2. Ngô Như Hoà (1982). Thống kê trong nghiên cứu y học. Nhà xuất bản Y học, tập I, II. 3. Nguyễn Đình Khoa (1975). Phương pháp thống kê ứng dụng trong sinh học. Tủ sách Đại học Tổng hợp. 4. Nguyễn Xuân Phách và cộng sự (1992). Toán thống kê và tin học trong nghiên cứu y sinh, dược học. Học vi ện Quân Y. 5. Lê Khánh Trai, Hoàng Hữu Như (1974). Ứng dụng xác suất thống kê trong y sinh học. Nhà xuất bản Khoa học Kỹ thuật. 6. Dương Đình Thiện (1998). Dịch tễ học. Nhà xuất bản Y học. 7. Trường Đại học Y khoa Hà Nội (1992). Phương pháp nghiên cứu Bức khỏe cộng đồng. Nhà xuất bản Y học. 8. Akhnaarova. S (1989), Experiment optimization in chemistry and chemical engineering. Mockva. 9. Daliansyah Danil (2006), ProcesB Hazard Analysis Application through Design for Earlier Incident prevention, The 22 st annual conference of the Asia Pacific Occupational safety & health organization. Bangkok Thailand B 1 - B 11. 10. Jim whiting (2005), The new international safety risk management standard, The 21 st annual conference of the Asia Paciflc Occupational safety & health organization. Ban- Indonesia p 1750. 11. Joseph. Lellouch (1974). Methodes StatistiqueB en experimentation biologique. P. Flammation. 12. Mendenhall (1974). Introduction to probability and statistics. W.P.C. Ins. Balmont. 91 PHUƠNG PHÁP LUẬN TRONG NGHIÊN CÚU KHOA HỌC Y HỌC (Giáo trình sau đại học) NHÀ XUẤT BẢN Y HỌC 352 Đội Cấn Ba Đình Hà Nội ĐT: (04) 7.625922, 7.625934 Fax: (04) 7.625923 Chịu trách nhiệm xuất bản: HOÀNG TRỌNG QUANG Biên tập và sửa bản in: BAN BIÊN TẬP SÁCH DẠY NGHỀ - GIÁO TRÌNH Trình bày bìa: THANH HUYỀN In 500 cuốn, khổ 19 x 27 (cm), tại Xí nghiệp in, Nhà xuất bản Lao động - Xã hội. Giấy chấp nhận đăng ký kế hoạch xuất bản số 22-2007/CXB/245 151/YH. In xong và nộp lưu chiểu Quý II/2007. . 31,821 63 ,65 7 63 6 ,61 9 2 4,303 6, 965 9,925 31 589 3 3,182 4,541 5,841 12,924 4 2,7 76 3,747 4 ,60 4 8 ,61 0 5 2,571 3, 365 4,032 6, 860 6 2,447 3,143 3,707 5,595 7 2, 365 2,998 3,499 5,408 8 2,3 06 2,8 96. 13,277 18, 467 5 11,070 13,388 1 5, 068 20,515 6 12,592 15,033 16, 812 22,457 7 14, 067 16, 622 18,475 24,322 8 15,507 18, 168 20,090 26, 125 9 16, 019 19 ,67 9 21 ,66 6 27,877 10 18, 367 21, 161 23,209. 20,588 11 19 ,67 5 22 ,61 8 24,725 31, 261 12 21,0 26 24,054 26, 217 32,909 13 22, 362 25,472 27 ,68 8 34,528 14 23 ,68 5 26, 873 29,141 36, 123 15 24,9 96 28,259 30,578 37 ,69 7 16 26, 2 96 29 ,63 3 32,000 39,252