Bài giảng Thống kê y học - Bài 2: Một số khái niệm căn bản về xác suất cung cấp các kiến thức giúp người học có thể trình bày 2 định nghĩa về xác suất và đưa ra các ví dụ, xây dựng được tập giao và hợp của 2 tập hợp xác định,... Mời các bạn cùng tham khảo.
MỘT SỐ KHÁI NIỆM CĂN BẢN VỀ XÁC SUẤT Mục tiêu Sau khi nghiên cứu chủ đề, học viên có khả năng: Trình bày 2 định nghĩa về xác suất và đưa ra các ví dụ Xây dựng được tập giao và hợp của 2 tập hợp xác định Trình bày và phân biệt được hai cơng thức chuyển vị và tổ hợp Trình bày định nghĩa của xác suất có điều kiện Trình bày cơng thức cộng xác suất và cơng thức nhân xác suất Ðịnh nghĩa xác suất 1.1 Ðịnh nghĩa xác suất theo tần suất tương đối Theo ngơn ngữ thơng thường, xác suất chính là tần suất tương đối. Thí dụ mệnh đề khẳng định xác suất sinh con trai là 0,515 có nghĩa là khi thống kê nhiều lần sinh, tần suất tương đối sinh con trai sẽ xấp xỉ bằng 0,515 (tần suất tương đối là tần suất xảy ra biến cố quan tâm chia cho tổng số lần thử). Nói cách khác, nếu một q trình được lập lại n nhiều lần, và nếu có f lần xảy ra biến cố E, tần suất tương đối của biến cố E sẽ xấp xỉ bằng xác suất của E f P( E ) n (1) Thí dụ: Buffon thực hiện 4040 lần tung đồng tiền và quan sát được 2048 lần xuất hiện mặt sấp. Tần suất tương đối xảy ra mặt sấp là . Xác suất xảy ra mặt sấp cũng xấp xỉ bằng 0,507 1.1 Phép thử, kết cục, biến cố, biến cố đối lập Khi chúng ta gieo một đồng tiền lên một mặt phẳng có thể xảy ra một trong hai kết cục: xuất hiện mặt sấp hoặc xuất hiện mặt ngửa với kết quả khơng thể tiên đốn được. Người ta gọi việc gieo đồng tiền là phép thử (experiment) và sự xuất hiện mặt xấp hay mặt ngửa của đồng tiền là các kết cục (outcome) Tương tự, khi chúng ta tung con xúc xắc, có thể xuất hiện các mặt 1, 2, 3, 4, 5, 6 thì việc tung con xúc xắc được gọi là phép thử ngẫu nghiên và việc xuất hiện mặt 1, xuất hiện mặt 2, 3, 4, 5 và 6 được gọi các kết cục ngẫu nhiên. Nếu chúng ta quan tâm đến biến cố ra mặt xúc xắc chẵn thì biến cố (event) này bao gồm 3 kết cục: ra mặt 2, ra mặt 4 và ra mặt 6. Nói khác đi biến cố là tập hợp mà các phần tử là các kết cục. Bởi vì tập hợp có thể có bao gồm tồn bộ các phần tử, 0 phần tử hay 1 phần tử nên việc ra một mặt xúc xắc nào đó (thí dụ ra mặt 2) vừa có thể xem là kết cuộc vừa có thể xem là biến cố: biến cố đó đơi khi được gọi là biến cố sơ cấp Nếu chúng ta tung 3 con xúc xắc phân biệt , có kết cục sau có thể xảy ra {1,1,1} (ba con xúc xắc ra mặt 1); {1,1,2}; {1,1,3}; ; {6,6,5}; {6,6,6}. Biến cố có tổng số điểm của 3 con xúc xắc =18 bao gồm một kết cục {6,6,6}. Tương tự chúng ta có thể định nghĩa biến cố tổng số điểm của ba con xúc xắc =12 Đối với mỗi biến cố A có một biến cố đối lập (complementary event ) Ac (được đọc là khơng A) bao gồm các kết cục khơng có tính chất A. Trở về thí dụ của phép thử tung con súc sắc 6 mặt, biến cố đối lập với biến cố ra mặt chẵn là biến cố ra mặt lẻ. Biến cố đối lập cho biến cố ra mặt >=2 là biến cố ra mặt 1. 1.2 Kết cục đồng khả năng Khi chúng ta gieo con xúc xắc đồng nhất, cảm nhận thơng thường cho phép chúng ta giả định việc xuất hiện kết cục ra mặt 1, ra mặt 2, ra mặt 3, ra mặt 4, ra mặt 5, ra mặt 6 có xác xuất như nhau. Khi đó ta gọi các kết cục này là kết cục đồng khả năng 1.4 Ðịnh nghĩa xác suất cổ điển Nếu phép thử ngẫu nhiên có thể xảy ra theo N kết cục loại trừ lẫn nhau và có xác suất như nhau và gọi m là số các kết cục thuận lợi cho biến cố E, xác suất xảy ra biến cố E, được kí hiệu là P(E), sẽ bằng m chia cho N m P( E ) N (2) N còn được gọi là số các kết cục có thể và m số các kết cục thuận lợi Thí dụ: Nếu chúng ta tung con xúc xắc (xí ngầu) có 6 mặt: mặt 1, mặt 2, mặt 3, mặt 4, mặt 5, mặt 6 thì có thể xảy ra với 6 kết cục khác nhau. Những kết cục này loại trừ lẫn nhau (nếu ra mặt 1 thì khơng ra mặt 2 và ngược lại) và đồng xác suất. Giả sử ta quan tâm đến biến cố con xúc xắc ra mặt chẵn. Biến cố này có thể xảy ra theo 3 cách, nói khác đi biến cố này bao gồm 3 kết cục. Khi đó xác suất xảy ra biến cố ra mặt chẵn là 3/6=0.5 Thí dụ: Khoa phổi và khoa Thận của bệnh viện Chợ Rẫy có 50 bệnh nhân trong số này có 35 bệnh nhân nữ. Có 12 bệnh nhân của khoa Thận trong đó có là 8 người là nữ. Có bao nhiêu bệnh nhân nữ ở khoa phổi? Có bao nhiêu trong số những bệnh nhân của 2 khoa này là nữ hay nằm ở khoa Phổi Trước tiên chúng ta lập một bảng chéo để phân loại các bệnh nhân theo giới tính và theo khoa điều trị (Phổi hay Thận) và điền các thơng tin đã cho từ đề bài vào bảng này (các số in đậm của bảng). Từ các thơng tin này chúng ta tính các số ở các ơ còn lại (các số in thường) của bảng chéo Bảng Giới tính bệnh nhân khoa Phổi khoa Thận bệnh viện Chợ rẫy Khoa Phổi Khoa Thận Tổng số Nam 11 15 Nữ 27 35 Tổng số 38 12 50 Từ bảng chéo chúng ta biết được số bệnh nữ của khoa phổi là 27 và số bệnh nhân nữ hay nằm ở khoa phổi là 46 người Thí dụ: Sử dụng số liệu của bảng trên hãy tính các xác suất: 1. Chọn một người bất kì tính xác suất người nằm ở khoa Phổi P(Khoa Phổi): N: Số kết cuộc có thể là 50; m: số các kết cuộc thuận lợi cho 38; P (Khoa Phổi) = 2. Chọn một người bất kì tính xác suất người đó là nam P(Nam) N: Số kết cuộc có thể là 50; m: số các kết cuộc thuận lợi cho 15; P (Nam) = Khái niệm về nguy cơ và số chênh (odds) Một khái niệm quan trọng trong dịch tễ học là nguy cơ. Nguy cơ được định nghĩa là tỉ lệ mắc bệnh trong khoảng thời gian nghiên cứu một nhóm người người lúc đầu khơng bị bệnh. Như vậy còn có thể được xem là xác suất của một người bị mắc bệnh trong khoảng thời gian nghiên cứu với điều kiện lúc đầu khơng bị mắc bệnh. Đó là lí do tại sao xác suất và thống kê có một vai trò then chốt trong các nghiên cứu dịch tễ Những chúng ta sẽ thấy xác suất là một hàm số có đặc tính thuận lợi về mặt tốn học, thí dụ như ngun lí cộng tính. Tuy nhiên xác suất có miền xác định là đoạn [0;1] nên để mơ tả xác suất theo một biểu thức tuyến tính cần sử dụng các phép biến đổi để mở rộng miền xác định. Một trong các phép biến đổi đó là số chênh (odds) Số chênh của một biến cố A được kí hiệu là Odds(A) bằng xác suất của biến cố A chia cho xác suất của biến cố khơng A Odds(A)= = Miền xác định của số chênh là đoạn [0;∞) được mở rộng so với miền xác định của xác suất. Số chênh cũng có một đặc tính khác quan trọng là số chênh của biến cố khơng A bằng nghịch đảo của số chênh biến cố A Odds(Ac) = = 1: = 1:Odds Mặc dù lí do chính để sử dụng số chênh là đặc tính tốn học của nó, số chênh cũng là một khái niệm quen thuộc trong cuộc sống hàng ngày Thí dụ: Khi ta gieo đồng tiền chúng ta chúng ta có 2 kết cục sấp và ngửa đồng khả Khi xác suất mặt sấp, P(sấp) = = 0,5 Số chênh mặt sấp, Odds(sấp) = = . Thực ra trong dân gian cách nói xác suất ra mặt sấp là 0,5 khơng quen thuộc bằng cách nói là việc được mặt ngửa là 1 ăn 1 thua (hay 5 năm 5 thua) Khi biến cố A hiếm (P(A)35 35 Tổng số B1. Bác sĩ 25 75 105 B2. Phục vụ phòng thí nghiệm 20 30 35 35 120 B3. Phục vụ dinh dưỡng 6 10 25 B4. Phục vụ hồ sơ bệnh án 15 12 42 B5. Phục vụ điều dưỡng 200 375 442 203 1220 B6. Dược sĩ 12 24 B7. Quang tuyến 10 19 12 45 B8. Phục vụ điều trị 25 15 10 55 B9. Những ngành khác 20 35 50 25 130 Tổng số 260 513 608 385 1766 1. Dựa vào số liệu của bảng 1. Giải thích bằng lời những tập hợp sau đây. Những tập hợp đó có bao nhiêu phần tử: A4∩B3 ; B5∩A2 ; B3∪A4 ; (A4∪A3)∩B3 2. Trong các mệnh đề sau, mệnh đề nào là đúng 2+2 là 4 hay Darwin là con khỉ Bệnh AIDS do một loại virus gây ra và bệnh AIDS có thể lây lan qua muỗi Aedes aegypti Bài giải 1. Giải thích các tập hợp A4∩B3 là tập hợp những nhân viên cấp dưỡng >35 tuổi. n(A4∩B3) = 10 B5∩A2 là tập hợp những điều dưỡng tuổi từ 26 đến 30. n(B5∩A2) = 375 B3∪A4 tập hợp người nhân viên cấp dưỡng hay 35 tuổi n(B3∪A4)=385 +25 10 = 400 (A4∪A3)∩B3 tập hợp nhân viên cấp dưỡng tuổi từ 31 trở lên N{(A4∪A3)∩B3}=16 2. Mệnh đề (a) là mệnh đề hay. Mệnh đề này đúng do một mệnh đề con của nó là đúng (2+2 =4), Mệnh đề (b) là mệnh đề và. Mệnh đề này sai do một mệnh đề con của nó (bệnh AIDS có thể lây lan qua muỗi Aedes aegypti ) là sai Bài tập về chỉnh hợp, tổ hợp 1. Một nhân viên vật lí trị liệu sắp kế hoạch làm việc trong ngày. Anh ta biết rằng có 7 cơng việc phải làm trong ngày đó a. Nếu anh ta có thể tiến hành cơng việc theo ý muốn, thì anh ta có thể có bao nhiêu cách sắp xếp? b. Nếu anh ta quyết định nghỉ buổi chiều và chỉ làm 3 cơng việc vào buổi sáng thì anh ta có bao nhiêu cách sắp xếp? 2. Một nhân viên muốn làm xét nghiệm 4 mẫu máu nhưng bà ta chỉ có đủ hóa chất để xét nghiệm cho 3 mẫu mà thơi. Hỏi có bao nhiêu cách chọn 3 mẫu máu trong 4 mẫu để làm xét nghiệm? 3. Giả sử trong phòng thí nghiệm có 3 cơng việc khác nhau phải làm và có 5 người làm việc đó. Hỏi có bao nhiêu cách để giao 3 cơng việc này cho 5 người? Bài giải 1a. Do người nhân viên vật lí trị liệu này muốn liên kết 7 cơng việc khác nhau vào 7 thời điểm khác nhau trong kế hoạch cơng tác, anh ta có thể có sắp xếp cơng việc theo 7!=7 × 6 × 5 × 4 × 3 × 2 × 1= 5040 cách 1b. Nếu anh ta chỉ còn có đủ thời gian để làm 3 cơng việc, anh ta phải từ 7 cơng việc chọn ra 3, 3 cơng việc này sau khi được chọn sẽ được sắp xếp khác nhau. Như vậy, số kế hoạch anh ta có thể sắp xếp là: P = 7!/(73)! = 7 × 6 × 5 × 4 × 3 × 2 × 1 / 4 × 3 × 2 × 1 = 7 × 6 × 5 = 210 cách 2. Người nhân viên này muốn chọn từ 4 mẫu máu lấy 3 mẫu, 3 mẫu máu này sau khi chọn là khơng phân biệt (đều được làm xét nghiệm). Vậy số cách chọn 3 mẫu máu để xét nghiệm là 4C3 = 4!/(43)!3! = 4 × 3 × 2 × 1 / (1 × 3 × 2 × 1) = 4 3. Từ 5 người chọn ra 3, và 3 người này sẽ có những cơng việc khác nhau. Số kế hoạch có thể phân cơng là: 5P3 = 5!/(53)! = 5 × 4 × 3 × 2 × 1 / 3 × 2 × 1 = 60 ... định lí của nó có phản ánh thế giới thực hay khơng. Nhà tốn học Nga Kolmogorov là người đã có cơng x y dựng trình b y các bài tốn xác suất theo các khái niệm của lí thuyết đo lường và các tiên đề để x y dựng lí thuyết xác suất do ơng đưa ra được trình... P(A) = 1.3 Ðịnh nghĩa xác suất chủ quan Khái niệm về xác suất chủ quan lần đầu tiên được đề xướng bởi Von Newman, Morgenstern, Ramsey và Savage. Theo khái niệm n y, xác suất khơng chỉ áp dụng cho... 2. Chọn một người bất kì tính xác suất người đó là nam P(Nam) N: Số kết cuộc có thể là 50; m: số các kết cuộc thuận lợi cho 15; P (Nam) = Khái niệm về nguy cơ và số chênh (odds) Một khái niệm quan trọng trong dịch tễ học là nguy cơ. Nguy cơ được định nghĩa là tỉ