Trong phần đầu của bài viết này tác giả dùng công thức xác suất đầy đủ và công thức Bayes để giải một số bài toán xác suất sơ cấp nổi tiếng như bài toán về tính công bằng trong thể thức rút thăm may mắn, bài toán Monty Hall. Riêng bài toán rút thăm may mắn được trình bày với lời giải chặt chẽ và tổng quát hơn những lời giải đã biết. Phần cuối bài giới thiệu một số ứng dụng của công thức Bayes trong y học, trong hoạt động tìm kiếm cứu hộ.
Tạp chí Khoa học Cơng nghệ Thực phẩm 21 (3) (2021) 23-31 MỘT SỐ ỨNG DỤNG CỦA CÔNG THỨC XÁC SUẤT ĐẦY ĐỦ VÀ CƠNG THỨC BAYES Nguyễn Đình Inh Trường Đại học Công nghiệp Thực phẩm TP.HCM Email: inhnd@hufi.edu.vn Ngày nhận bài: 16/7/2020; Ngày chấp nhận đăng: 20/8/2020 TĨM TẮT Cơng thức xác suất đầy đủ cơng thức Bayes nội dung quan trọng, lý thú giảng dạy chương trình Xác suất trường đại học Trong phần đầu báo tác giả dùng công thức xác suất đầy đủ công thức Bayes để giải số toán xác suất sơ cấp tiếng tốn tính cơng thể thức rút thăm may mắn, toán Monty Hall Riêng toán rút thăm may mắn trình bày với lời giải chặt chẽ tổng quát lời giải biết Phần cuối giới thiệu số ứng dụng công thức Bayes y học, hoạt động tìm kiếm cứu hộ Hy vọng viết mang lại điều bổ ích cho bạn bắt đầu việc giảng dạy hay học tập mơn Xác suất Từ khóa: Cơng thức xác suất đầy đủ, công thức Bayes, rút thăm may mắn, Monty Hall, tìm kiếm cứu hộ CƠNG THỨC XÁC SUẤT ĐẦY ĐỦ VÀ CƠNG THỨC BAYES Định lý Trong khơng gian xác suất ( , F,P ) , cho Ai Aj = với i j , Ai 1=1 n họ đầy đủ biến cố (tức n A = ) B biến cố thuộc F Khi i =1 i n P( B) = P( Ai ).P( B | Ai ) (1) i =1 P ( Ai | B ) = P( Ai ).P( B | Ai ) ; i = 1, n ( P ( B ) ) P ( B) (2) Công thức (1) gọi công thức xác suất đầy đủ, công thức (2) công thức Bayes Trong công thức Bayes, xác suất P ( Ai ) gọi xác suất tiên nghiệm, xác suất P ( Ai | B ) gọi xác suất hậu nghiệm Công thức Bayes hay định lý Bayes mang tên nhà toán học người Anh Thomas Bayes (1701-1761) Định lý trình bày luận cơng bố trước Hội khoa học Hoàng gia năm 1763 người bạn Bayes Richard Price [1] BÀI TỐN RÚT THĂM Có n thăm có m trúng thưởng ( m n ) Cho n người rút người Hỏi người rút trước, kẻ rút sau, có nhiều may ai? 23 Nguyễn Đình Inh Giải: Cơ may trúng thưởng người tham gia rút thăm khả (xác suất) người rút thăm trúng Ta dùng công thức xác suất đầy đủ để chứng minh xác suất trúng thưởng người nhau, rút trước hay rút sau Thật Trước hết mệnh đề “xác suất trúng thưởng người nhau” tương đương với mệnh đề “xác suất không trúng thưởng người nhau”, nói cách khác: vai trị m n − m nên khơng tính tổng quát giả sử m n − m Gọi Bk biến cố người rút thứ k thăm trúng thưởng, k = 1, n Dễ thấy P ( B1 ) = m n Với k n , gọi Ai biến cố có i người trúng k − − i người không trúng k − người (0 i k − 1) Vì có tất m thăm trúng n − m thăm không trúng nên cần thêm điều kiện i m k − − ( n − m) i m k − − i n − m Như điều kiện i max 0; k − − (n − m) i m; k − 1 i I1 = 0, , k − 1 k − m n − m i I = 0, , m m k − n − m i I = k − − (n − m), , m m n − m k − Ta xét trường hợp trường hợp trên: • Trường hợp k − m n − m tương ứng với i I1 = 0, , k − 1 , họ Ai iI họ đầy đủ biến cố nên theo công thức xác suất đầy đủ ta có k −1 P( Bk ) = P( Ai ).P( Bk | Ai ) (3) i =0 Để ý biến cố Ai tổng Cki −1 biến cố xung khắc đôi, biến cố thành phần i người trúng thứ tự khác (vì lấy i phần tử k − phần tử nên có Cki −1 tổ hợp), dễ thấy xác suất biến cố thành phần xác suất biến cố i người đầu trúng k − − i người không trúng, tức bằng: m m −1 m − i +1 n − m n − m − (k −1− i) +1 n n −1 n − i +1 n − i n−k +2 n − m ! ( ) m! m ( − i )! ( n − m − ( k − − i ) )! = n! ( n − ( k − 1) )! 24 Một số ứng dụng công thức xác suất đầy đủ công thức Bayes nên P ( Ai ) = Cki −1 m! (n − m)! (m − i )! ( n − m − ( k − − i ) )! n! ( n − (k − 1) )! m! (n − m)! (k − 1)! (m − i )! ( n − m − ( k − − i ) )! = n! i !(k − − i )! ( n − (k − 1) )! m! (n − m)! i !(m − i )! ( k − − i )!( n − m − ( k − − i ) )! = n! (k − 1)!( n − ( k − 1) )! = Cmi Cnk−−m1−i Cnk −1 (có thể dùng phân phối siêu bội: xác suất có i người trúng k − người rút C i C k −1−i xác suất có i người trúng k − người rút đồng thời; tức P ( Ai ) = m kn−−1m ) Cn Còn P( Bk | Ai ) = m−i n − (k − 1) Do P ( Ai ).P ( Bk | Ai ) = Cmi Cnk−−m1−i m−i k −1 Cn n − (k − 1) m! Cnk−−m1−i m−i i !(m − i )! = n! n − (k − 1) (k − 1)!( n − ( k − 1) )! (i + 1) = = m! Cnk−−m1−i (i + 1)!(m − (i + 1))! n! k k !( n − k )! (i + 1)Cmi +1Cnk−−m1−i kCnk Thay vào (3) ta (i + 1)Cmi +1Cnk−−m1−i k = jCmj Cnk−−mj k k kCn kCn j =1 i =0 k −1 P( Bk ) = 25 (4) Nguyễn Đình Inh Xét tập hợp S có n phần tử đơi khác nhau, ta chia S thành tập hợp A, B rời A có m phần tử B có n − m phần tử Từ tổ hợp chập k S có dạng ( x1 , x2 , , xk ) , ta “nhân” thành k sau: thứ x1 , x1 , x2 , , xk ( x1 lặp lần), thứ hai x1 , x2 , x2 , , xk ( x2 lặp lần), …, thứ k x1 , x2 , , xk , xk ( xk lặp lần) Như từ Cnk tổ hợp chập k S sinh kCnk có lặp phần tử Bây tổ hợp chập k S , xét riêng tổ hợp chứa j phần tử thuộc tập A k − j phần tử thuộc tập B có Cmj Cnk−−mj tổ hợp vậy, tổ hợp sinh jCmj Cnk−−mj có lặp mà phần tử lặp thuộc tập hợp A Cho j chạy từ tới k (lưu ý ta xét trường hợp k − m n − m nên số Cmj ; Cnk−−mj có nghĩa) lấy tổng ta tất k jC j =1 j m Cnk−−mj có lặp mà phần tử lặp thuộc tập A Mặt khác, n phần tử tập S có m phần tử thuộc tập A nên tổng cộng kCnk có lặp sinh từ tổ m hợp chập k S có kCnk mà phần tử lặp thuộc tập A Do ta có đẳng thức tổ n hợp sau: k jC j m j =1 Cnk−−mj = m kCnk n (5) Từ (4) vào (5) ta P ( Bk ) = m n • Trường hợp m k − n − m tương ứng với i I = 0, , m , họ Ai iI họ đầy đủ Ta có cơng thức tương tự (3), (4), (5) với i 0, , m ; j 1, , m + 1 , tức m P( Bk ) = P( Ai ).P( Bk | Ai ) i =0 m P( Bk ) = i =0 (i + 1)Cmi +1Cnk−−m1−i m+1 j k − j = jCmCn−m kCnk kCnk j =1 m+1 jC C j =1 j m k− j n−m = m kCnk n có kết P ( Bk ) = m n • Trường hợp m n − m k − tương ứng với i I = k − − (n − m), , m , Ai iI họ đầy đủ Tương tự j k − (n − m), , m + 1 có trường hợp 1, nhiên i k − − (n − m), , m ; P ( Bk ) = 26 m n Một số ứng dụng công thức xác suất đầy đủ công thức Bayes Vậy trường hợp có P ( Bk ) = m , tức xác suất trúng thưởng người n Kết cho thấy thể thức rút thăm phân phối đời sống công Các tài liệu đề cập đến toán rút thăm thường chứng minh P( B1 ) = P( B2 ) [2, 3] làm trường hợp cụ thể với n = 3, m = [2, 4] Để giải toán cách chặt chẽ cần lời giải tổng quát trình bày BÀI TỐN MONTY HALL “Let’s Make a Deal” game show tiếng kênh truyền hình Mỹ Monty Hall sáng lập, mua quyền phát sóng nhiều nước Trong game show có trị chơi sau: có cánh cửa, đằng sau cánh cửa phần q, sau cửa cịn lại khơng có Người chơi chọn cánh cửa, chọn cửa có q nhận q Ban đầu người chơi chọn trước cửa chưa mở Sau người dẫn chương trình (MC) mở hai cửa lại mở cửa khơng có q (MC chủ trị, xếp nên biết cửa có quà, cửa khơng) Sau MC mở cửa khơng có quà, người chơi quyền chọn, giữ cửa chọn ban đầu, đổi lấy cửa chưa mở cịn lại Theo bạn người chơi nên giữ hay đổi? Vì sao? Bài tốn gây nhiều tranh cãi người hâm mộ game show chủ đề bàn luận sôi báo chí khoa học báo chí đại chúng [5] Sau lời giải công thức Bayes: Giải: Đánh số ba cửa 1, 2, Gọi A1 , A2 , A3 biến cố cửa 1, 2, có quà, ta có A1 , A2 , A3 họ đầy đủ P ( A1 ) = P ( A2 ) = P ( A3 ) = Không tính tổng quát, giả sử người chơi chọn cửa Khi người chơi chọn cửa 1, có trường hợp xảy ra: MC mở cửa 2, hai MC mở cửa Ở cần xét trường hợp MC mở cửa 2, trường hợp cửa tương tự Gọi B2 biến cố MC mở cửa 2, xét trường hợp: • Nếu cửa có q MC có lựa chọn mở cửa với xác suất nên P ( B2 | A1 ) = • Nếu cửa có q MC có lựa chọn mở cửa nên xác suất mở cửa 0, tức P ( B2 | A2 ) = • Nếu cửa có q MC có lựa chọn mở cửa nên xác suất mở cửa 1, tức P ( B2 | A1 ) = Khi có thơng tin cửa MC mở xác suất cửa 1, cửa có q tính theo cơng thức Bayes 27 Nguyễn Đình Inh 1 P ( A1 | B2 ) = = = P ( A1 ) P ( B2 | A1 ) + P ( A2 ) P ( B2 | A2 ) + P ( A3 ) P ( B2 | A3 ) + + 1 3 3 P ( A1 ) P ( B2 | A1 ) 1 P ( A3 | B2 ) = = = P ( A1 ) P ( B2 | A1 ) + P ( A2 ) P ( B2 | A2 ) + P ( A3 ) P ( B2 | A3 ) + + 1 3 3 P ( A3 ) P ( B2 | A3 ) Rõ ràng đổi sang cửa lại thay giữ nguyên cửa chọn xác suất người chơi nhận q tăng lên gấp đơi Vì vậy, người chơi nên đổi cửa QUY TRÌNH BAYESIAN UPDATING Giả sử nghiên cứu vấn đề 𝒜, ban đầu ta đưa giả thuyết H1 , H , , H n 𝒜 với xác suất tiên nghiệm P ( H1 ) , P ( H ) , , P ( H n ) Các xác suất thể hiểu biết ban đầu ta 𝒜 Sau có thơng tin I1 , ta dùng công thức Bayes để cập nhật hiểu biết ta 𝒜, cách tính xác suất hậu nghiệm P ( H1 | I1 ) , P ( H | I1 ) , , P ( H n | I1 ) Khi có thêm thơng tin I ta lại coi P ( H1 | I1 ) , P ( H | I1 ) , , P ( H n | I1 ) xác suất tiên nghiệm dùng công thức Bayes để tiếp tục cập nhật hiểu biết 𝒜, cách tính xác suất hậu nghiệm P ( H1 | I1 I ) , P ( H | I1 I ) , , P ( H n | I1 I ) … Cứ thể sử dụng thông tin ta liên tục cập nhật hiểu biết 𝒜 Quy trình gọi Bayesian updating Bayesian updating áp dụng rộng rãi nhiều lĩnh vực khoa học, kỹ thuật, y học, triết học, v.v Ứng dụng Bayesian updating viết giới thiệu hoạt động tìm kiếm cứu nạn biển Một tìm kiếm điển hình vụ đội tìm kiếm cứu nạn Mỹ tìm kiếm người đánh cá bị tích rơi xuống biển [6] Thơng tin mà đội tìm kiếm nhận ông Aldridge bị rơi xuống biển khoảng từ tối ngày 27-7-2014 đến sáng ngày hôm sau Những sau đó, thơng tin thay đổi dịng hải lưu, hướng gió,… trực thăng tàu cứu hộ thu thập tiếp tục nạp vào máy tính Sử dụng Bayesian updating thông qua hệ thống xử lý gọi SAROPS (Search and Rescue Optimal Planning System), máy tính liên tục cập nhật định vị ngày xác khu vực mà người tích có khả Sau 12 đội tìm kiếm phát người đánh cá ôm phao trôi biển, gần kiệt sức sống Bayesian updating ứng dụng xét nghiệm y khoa Một số thuật ngữ quy ước để đánh giá độ xác xét nghiệm T sau: - Độ nhạy (sensitivity): tỷ lệ xét nghiệm T cho kết dương tính ( T + ) người bị bệnh B , ký hiệu P T + | B + , gọi dương thật (true positive) ( ( ) ) - Âm giả, P T − | B + , tỷ lệ xét nghiệm T cho kết âm tính người bị bệnh B - Độ chuyên hay độ đặc hiệu (specificity): tỷ lệ xét nghiệm T cho kết âm tính người khơng bị bệnh, P T − | B − , gọi âm thật ( ) 28 Một số ứng dụng công thức xác suất đầy đủ công thức Bayes ( ) - Dương giả, P T + | B − , tỷ lệ xét nghiệm T cho dương tính người khơng bị bệnh B Giả sử có hai xét nghiệm T1 T2 T1 có độ nhạy 93% độ chuyên 95%, T2 dương giả 7% âm giả 5% Xét nghiệm T1 dùng sàng lọc người có nguy bệnh B cịn xét nghiệm T2 dùng chẩn đoán bệnh người mà T1 cho kết dương tính Một người làm liên tiếp hai xét nghiệm độc lập T1 T2 cho kết dương tính Biết tỷ lệ hành bệnh B cộng đồng theo số liệu dịch tễ học 0,001; tính khả người mắc bệnh B Dùng cơng thức Bayes để tính tốn kết quả: Giả thiết toán cho ta biết P (T1+ | B + ) = 0,93; P (T1− | B − ) = 0,95 suy P (T1+ | B − ) = 0,05; P (T2+ | B − ) = 0,07; P (T2− | B + ) = 0,05 suy P (T2+ | B + ) = 0,95; P ( B + ) = 0,001 suy P ( B − ) = 0,999 Theo công thức xác suất đầy đủ P (T1+ ) = P ( B + ) P (T1+ | B + ) + P ( B − ) P (T1+ | B − ) = 0,001.0,93 + 0,999.0,05 = 159 3125 Khi biết xét nghiệm T1 dương tính ta có xác suất hậu nghiệm biến cố + B , B − thay đổi theo công thức Bayes sau: P(B |T + + )= P ( B − | T1+ ) = P ( B + ) P (T1+ | B + ) P (T + ) P ( B − ) P (T1+ | B − ) P (T + ) = 0,001.0,93 31 = 159 1696 3125 = 0,999.0,05 1665 = 159 1696 3125 Các xác suất lại coi xác suất tiên nghiệm xét nghiệm T2 , áp dụng công thức xác suất đầy đủ: P (T2+ ) = P (T2+ | B +T1+ ) P ( B + | T1+ ) + P (T2+ | B −T1+ ) P ( B − | T1+ ) Xét nghiệm T2 độc lập với T1 nên P (T2+ | B +T1+ ) = P (T2+ | B + ) = 0,95; P (T2+ | B −T1+ ) = P (T2+ | B − ) = 0,07 Do P (T2+ ) = 0,95 31 1665 73 + 0,07 = 1696 1696 848 Cuối theo cơng thức Bayes 29 Nguyễn Đình Inh P ( B + | T1+T2+ ) = P (T2+ | B +T1+ ) P ( B + | T1+ ) P (T2+ ) = 31 1696 = 403 13,8% 73 2920 848 0,95 Có thể thấy rằng, dựa vào kết dương tính xét nghiệm T1 tính xác suất người xét nghiệm mắc bệnh thấp ( P ( B + | T1+ ) = 31 1,83% thấp 1696 nhiều so với độ nhạy 93% T1 ), dựa vào kết dương tính T1 T2 khả người xét nghiệm bị bệnh khơng cao, đặc điểm y học đại - tính bất định đo lường nào, xét nghiệm chẩn đoán [7] KẾT LUẬN Bài báo trình bày số ứng dụng mang tính thực tiễn cao công thức xác xuất đầy đủ cơng thức Bayes việc giải tốn xác suất như: tìm kiếm cứu hộ, rút thăm may mắn, Monty Hall, xét nghiệm y khoa, v.v Bằng lời giải chặt chẽ tổng quát thu kết xác thú vị Hy vọng báo tài liệu tham khảo bổ ích việc giảng dạy học tập môn Xác suất TÀI LIỆU THAM KHẢO Bayes M., Price M - An Essay towards Solving a Problem in the Doctrine of Chances By the Late Rev Mr Bayes, F R S Communicated by Mr Price, in a Letter to John Canton, A M F R S., Philosophical Transactions (1683-1775) 53 (1763) 370-418 Nguyễn Bá Đô, Nguyễn Hồng Minh - Các câu chuyện toán học tập 1: Tất nhiên ngẫu nhiên, NXB Giáo dục (2003) 83-88 Trần Kim Thanh, Lê Trường Giang - Lý thuyết xác suất thống kê tốn, Trường Đại học Tài - Marketing (2017) 31-32 Nguyễn Văn Mậu - Mười vạn câu hỏi sao: Toán học, NXB Giáo dục Việt Nam (2018) 116-117 Đặng Hùng Thắng - Một số ứng dụng định lý Bayes, Thơng tin Tốn học 19 (2) (2015) 26-30 Flam F.D - The odds continually updated, The New York Times, September 29 (2014) (truy cập tại: https://www.nytimes.com/2014/09/30/science/the-oddscontinually-updated.html) Nguyễn Văn Tuấn - Giới thiệu phương pháp phân tích Bayes phần 1: Diễn giải kết chẩn đốn, Thời Y học số 62 (2011) 30-35 30 Một số ứng dụng công thức xác suất đầy đủ công thức Bayes ABSTRACT SOME APPLICATIONS OF TOTAL PROBABILITY THEOREM AND BAYES’ THEOREM Nguyen Dinh Inh Ho Chi Minh City University of Food Industry Email: inhnd@hufi.edu.vn The total probability theorem and the Bayes’ theorem are important and interesting contents taught in probability at the university In the first part of this article, we use the total probability theorem and the Bayes’ theorem to solve some well-known elementary probability problems, such as the problem of fairness in the lucky draw, the Monty Hall problem As for the lucky draw problem, we present a tighter and more general solution than the known solutions At the end of the article, we will introduce some applications of the Bayesian theorem in medicine and search and rescue operations Hopefully this article will bring some useful things for those who are starting to teach or study probability Keywords: Total probability theorem, Bayes’ theorem, lucky draw, Monty Hall, search and rescue operations 31 ... Bayes phần 1: Diễn giải kết chẩn đoán, Thời Y học số 62 (2011) 30-35 30 Một số ứng dụng công thức xác suất đầy đủ công thức Bayes ABSTRACT SOME APPLICATIONS OF TOTAL PROBABILITY THEOREM AND BAYES? ??... ( ) m! m ( − i )! ( n − m − ( k − − i ) )! = n! ( n − ( k − 1) )! 24 Một số ứng dụng công thức xác suất đầy đủ công thức Bayes nên P ( Ai ) = Cki −1 m! (n − m)! (m − i )! ( n − m − ( k − − i... cho kết âm tính người khơng bị bệnh, P T − | B − , gọi âm thật ( ) 28 Một số ứng dụng công thức xác suất đầy đủ công thức Bayes ( ) - Dương giả, P T + | B − , tỷ lệ xét nghiệm T cho dương tính