Xác suất - Thống kê là môn khoa học đo lường sự may rủi về các hiện tượng trong đời sống kinh tế, xã hội, từ đó giúp chúng ta có được quyết định đúng đắn, hợp lý với rủi ro thấp nhất. Bài viết này làm rõ ý nghĩa, tác dụng của môn khoa học Xác suất - Thống kê đối với lĩnh vực y học và đối với giảng dạy sinh viên thuộc khối sức khỏe tại trường đại học.
Kỹ thuật - Công nghệ NGHIÊN CỨU TRAO ĐỔI XÁC XUẤT - THỐNG KÊ VÀ CÁC ỨNG DỤNG TRONG NGHIÊN CỨU Y HỌC Nguyễn Cơng Bình • Tóm tắt: Xác xuất - Thống kê môn khoa học đo lường may rủi tượng đời sống kinh tế, xã hội, từ giúp có định đắn, hợp lý với rủi ro thấp Bài viết làm rõ ý nghĩa, tác dụng môn khoa học Xác suất - Thống kê lĩnh vực y học giảng dạy sinh viên thuộc khối sức khỏe trường đại học Từ khóa: xác xuất, thống kê, y học, rủi ro Summary: Probability - Statistics is the science of measuring the chance/risk of phenomena in economic and social life, thereby helping us to make the right, reasonable decision with the lowest risk This article clarifies the meaning and effects of the Science of Probability and Statistics for the medical field and for teaching students at universities health faculties Keywords: probability, statistics, medicine, risk Xác suất – Thống kê, nói ngắn gọn, mơn khoa học đo may rủi giúp ta có định lựa chọn kết luận rủi ro Ở trường Kinh doanh Công nghệ Hà Nội, Xác suất – Thống kê giảng dạy cho sinh viên khoa khối Sức khỏe Trong năm tới, mơn học mở rộng sang dạy cho chuyên ngành khác trường Vậy Xác suất – Thống kê môn học thiếu nghiên cứu Y – Dược ngành khoa học khác? Trong nghiên cứu Y Dược, thường gặp câu hỏi vấn đề sau: - Liệu loại vaccine (hay loại thuốc, phương pháp chữa bệnh mới) có thực tác dụng hay khơng? Trên thực tế, có trường hợp người tiêm không tiêm vaccine mắc bệnh, * Khoa Toán, Trường ĐH KD&CN Hà Nội người tiêm lẫn không tiêm không mắc bệnh Vậy việc dùng vaccine có độc lập với việc mắc bệnh không? - Tỷ lệ người khỏi bệnh dùng loại thuốc có thực lớn tỷ lệ dùng loại thuốc sẵn có hay khơng? - Có thể ước lượng kích thước sản phẩm (hoặc ước lượng tỷ lệ khỏi bệnh dùng phương pháp chữa bệnh mới) nằm khoảng tin cậy với xác suất tin cậy hay khơng? Những kết luận rút dẫn tới việc bác bỏ sản phẩm hay phương pháp chữa bệnh mới? - Có thể biểu diễn dạng hàm số đại lượng theo đại lượng khác khơng? Ví dụ, ta muốn biết quan hệ hàm số Y (dung lượng thở) X (chiều cao), Z (lồng ngực) Nếu biết Tạp chí Kinh doanh Công nghệ Số 10/2020 51 NGHIÊN CỨU TRAO ĐỔI quan hệ giúp nhiều cho việc phân tích dự báo Phương pháp gọi phương pháp hồi quy xác suất - Khi gặp hai định lượng có giá trung bình khác nhau, liệu ta kết luận chúng thực khơng? Chẳng hạn, tính chiều cao trung bình nam niên tuổi từ 18-25 hai vùng A, B thấy khác nhau, khơng thể nói niên vùng A cao (hay thấp hơn) niên vùng B? Kết luận nguy hiểm số liệu vùng đo thời điểm khác khác Sự khác gọi sai số ngẫu nhiên Phương pháp so sánh (trung bình, phương sai) lọc bỏ sai số ngẫu nhiên để sai khác có phải chất khơng? Bài tốn so sánh Xác suất - Thống kê có nhiều ứng dụng Chẳng hạn: - So sánh trung bình lượng protein huyết bệnh nhi suy dinh dưỡng trước sau điều trị để xem phương pháp có hiệu khơng? - So sánh tỷ lệ nhiễm độc chì làng nghề làng khơng làm nghề xem có khác có ý nghĩa khơng, để từ rút phương pháp phòng tránh Những vấn đề dặt giải phương pháp, kiểm định giả thuyết, ước lượng, so sánh, hồi quy, môn học Xác suất Thống kê Phải khẳng định rằng, khơng có kết luận Xác suất - Thống kê tuyệt đối đúng, thật tuyệt vời nhận kết luận với độ rủi ro thấp 5%, chí 1% Trong phương pháp Xác suất - Thống kê, phương pháp kiểm định giả thuyết bao trùm Chúng ta tiếp cận thêm phương pháp tìm hiểu ví dụ ứng dụng nghiên cứu y học đại Kỹ thuật - Công nghệ Khi kiểm định giả thuyết, ta thường nêu giả thuyết H đối thuyết K tiến hành thu thập số liệu (hoặc dựa số liệu có sẵn) tính tốn theo thủ tục thống kê để kết luận nên nhận H hay nhận K Chẳng hạn, nghiên cứu ta gặp giả thuyết H đối thuyết K sau: + H: “Chiều cao X nam niên tuổi từ 18 đến 25 đại lượng ngẫu nhiên có phân phối chuẩn” với đối thuyết K “X phân phối chuẩn”; + H: “Việc tiêm phịng loại bệnh độc lập với việc mắc bệnh tức tiêm phịng khơng có tác dụng” với đối thuyết K: “Tiêm phịng có ảnh hưởng (giảm) tỷ lệ mắc bệnh”; + H: “Tỷ lệ người khỏi bệnh điều trị phương pháp không khác tỷ lệ khỏi bệnh điều trị phương pháp cũ” đối thuyết K: “Hai tỷ lệ khác thực sự” Bằng thủ tục thống kê kiểm định giả thuyết, ta đến kết luận nhận H hay K Kết luận gặp hai loại sai lầm: - Sai lầm loại 1: Bỏ giả thuyết H nhận đối thuyết K, H Xác suất xảy sai lầm gọi xác suất sai lầm loại 1; - Sai lầm loại 2: Nhận giả thuyết H H sai, dẫn đến bỏ đối thuyết K Xác suất sai lầm gọi xác suất sai lầm loại Lý tưởng tìm tiêu chuẩn thống kê làm cho hai loại xác suất đồng thời đồng thời cực tiểu Tuy nhiên, người ta chứng minh rằng, tồn tiêu chuẩn thống kê thế, xác suất sai lầm giảm, xác suất sai lầm lại tăng Người ta đưa giải pháp là, tìm tiêu chuẩn thống kê cho xác suất sai lầm loại không vượt qua ngưỡng α nhỏ (thường 0,05 hay 0,01, chí 0,001, tùy u cầu tốn) cực tiểu hóa xác suất sai lầm loại Tạp chí Kinh doanh Công nghệ Số 10/2020 52 NGHIÊN CỨU TRAO ĐỔI Kỹ thuật - Cơng nghệ Các bước giải tốn kiểm định sau: + Từ tập thể gốc X, lấy mẫu ngẫu nhiên kích thước n: X1, X2, , Xn , ta thiết lập thống kê F = f(X1, X2, , Xn) hàm số từ mẫu thu thập với điều kiện phân phối xác suất F xác định giả thuyết H + Vì phân phối F xác định H đúng, nên với giá trị α cho, ta ln tìm miền ωα cho P(Fϵ ωα | H) ≤ α) (tức xác suất để thống kê F nhận giá trị thuộc ωα , giả thiết H không lớn α) Khi α nhỏ, theo nguyên lý tin tưởng thực hành, với phép thử, kết F nhận giá trị không thuộc ωα Nếu với lần quan sát có kết giá trị Fϵ ωα ta nói, giả thuyết H sai Kết luận mắc sai lầm với xác suất α Giá trị α gọi mức ý nghĩa kiểm định miền ωα gọi miền bác bỏ giả thuyết H Trong mùa dịch SARS-COV2 nay, tất nước chạy đua tìm vaccine phịng chống bệnh Tiếc rằng, đến chưa có vaccine thử nghiệm để áp dụng kiểm định xác suất - thống kê cho kết luận Ở đây, xin giới thiệu mơ hình chung để xác định xem loại vaccine có tác dụng (tức dùng loại vaccine có làm thay đổi (giảm) tỷ lệ mắc bệnh) hay không Khi điều tra số liệu dùng loại vaccine phòng bệnh, ta thu kết Bảng 1: Bảng1 Số liệu điều tra: Có tiêm Không tiêm Cộng Mắc bệnh 18 92 110 Đây số liệu điều tra sử dụng loại vaccine để phịng bệnh Ta thấy có người tiêm mắc bệnh người không tiêm, không mắc bệnh Vậy phải vaccine khơng có tác dụng? Dựa vào số liệu ta muốn kiểm tra giả thuyết: + H: Vaccine khơng có tác dụng, tức việc tiêm phòng mắc bệnh độc lập với + K: Vaccine có tác dụng, tức việc tiêm phịng có làm giảm số người mắc bệnh Ta suy luận sau: Nếu H đúng, tức tiêm phòng mắc bệnh độc lập, tỷ tệ mắc bệnh Khơng mắc bệnh 232 658 890 Tổng số 250 750 1.000 người có tiêm khơng tiêm phải tỷ lệ mắc bệnh cộng đồng 110 Tỉ lệ mắc bệnh chung là: = 0,11 1000 Vì vậy, với 250 người có tiêm, số người mắc bệnh phải là: 250 0,11 = 27,5 người Số người có tiêm khơng bị bệnh là: 250 – 27,5 = 222,5 Tương tự, ta tính số người khơng tiêm mắc bệnh là: 750 0,11 = 82,5 số người không tiêm không bị bệnh là: 750 – 82,5 = 667,5 Các kết thể Bảng - Bảng số liệu lý thuyết: Tạp chí Kinh doanh Công nghệ Số 10/2020 53 NGHIÊN CỨU TRAO ĐỔI Kỹ thuật - Công nghệ Bảng Bảng số liệu lý thuyết Có tiêm Khơng tiêm Cộng Mắc bệnh 27,5 82,5 110 Ta thấy số liệu hai Bảng thực nghiệm lý thuyết khác Sự khác sai số ngẫu nhiên điều tra, sai lầm giả thuyết tỷ lệ mắc bệnh tiêm phịng khơng tiêm phòng nhau? x2 = + + Theo lý thuyết Xác suất – Thống kê, giá trị quan sát đại lượng ngẫu nhên có phân phối x2 với (2-1) (2-1) = bậc tự Tra bảng phân phối x2 với bậc tự do, ta thấy nhận giá trị lớn 3,841 với xác suất 0,05 Ở đây, giá trị tính 4,916582 lớn 3,841 Điều chứng tỏ giả thuyết H ta bị bác bỏ, tức ta chấp nhận đối thuyết K: Vaccine thử nghiệm có tác Không mắc bệnh 222,5 667,5 890 Tổng số 250 750 1.000 Do việc điều tra ngẫu nhiên, nên số liệu thu giá trị đại lượng ngẫu nhiên Ta xét xem tổng bình phương sai lệch giá trị tương ứng hai bảng giá trị Tổng ký hiệu là: + = 4,916582 dụng Kết luận có khả mắc sai lầm 0,05 Chú ý: Bài toán giải cách so sánh hai tỷ lệ mắc bệnh người tiêm phịng khơng tiêm phòng Kết thu tương tự kết luận trên, tức tỷ lệ mắc bệnh khơng tiêm phịng lớn hẳn tỷ lệ tiêm phịng Vậy tiêm phịng loại vaccine thử nghiệm có tác dụng./ Ngày nhận bài: 25/05/2020 Tạp chí Kinh doanh Công nghệ Số 10/2020 54 ... pháp, kiểm định giả thuyết, ước lượng, so sánh, hồi quy, môn học Xác suất Thống kê Phải khẳng định rằng, khơng có kết luận Xác suất - Thống kê tuyệt đối đúng, thật tuyệt vời nhận kết luận với... 5%, chí 1% Trong phương pháp Xác suất - Thống kê, phương pháp kiểm định giả thuyết bao trùm Chúng ta tiếp cận thêm phương pháp tìm hiểu ví dụ ứng dụng nghiên cứu y học đại Kỹ thuật - Công nghệ... thủ tục thống kê kiểm định giả thuyết, ta đến kết luận nhận H hay K Kết luận gặp hai loại sai lầm: - Sai lầm loại 1: Bỏ giả thuyết H nhận đối thuyết K, H Xác suất x? ?y sai lầm gọi xác suất sai