Bài giảng Thống kê y học - Bài 5: Phân phối xác suất cung cấp các kiến thức giúp người học có thể: Phân biệt được 3 phân phối xác suất phổ biến - Phân phối nhị thức, phân phối Poisson và phân phối bình thường; tính xác suất của phân phối nhị thức và phân phối poisson khi được cung cấp các tham số,... Mời các bạn cùng tham khảo nội dung chi tiết.
PHÂN PHỐI XÁC SUẤT Mục tiêu Sau khi nghiên cứu chủ đề, học viên có khả năng: Phân biệt được 3 phân phối xác suất phổ biến: phân phối nhị thức, phân phối Poisson và phân phối bình thường Tính xác suất của phân phối nhị thức và phân phối poisson khi được cung cấp các tham số Xác định được phân phối xác suất của phân phối chuẩn một giá trị bất kì, được phép sử dụng bảng số của phân phối chuẩn Tính tỉ lệ của dân số có một đặc trưng nhất định về một đại lượng có phân phối bình thường khi được cung cấp các tham số và bảng số của phân phối chuẩn Phân phối xác suất Như đã trình bày,nếu chúng ta chỉ quan tâm đến giá trị đại lượng được xác định bởi kết cục của phép thử,chúng ta mơ tả biến cố là biến số ngẫu nhiên. Thí dụ nếu chúng ta tung 3 đồng tiền mà chỉ quan tâm đến số đồng tiên ra mặt ngửa thì chúng ta tạo ra biến số ngẫu nhiên X là số đồng tiền ngửa. Khi đó chúng ta có thể kí hiệu (X=1) để biến cố gồm các kết cuộc có số đồng tiền ngửa là 1 (gồm 3 biến cố Sấp Sấp Ngửa; Sấp Ngửa Sấp; Ngửa Sấp Sấp). Xác suất của biến cố này được được gọi là phân phối xác suất của X. Áp dụng vào thí dụ trên chúng ta có phân phối xác suất của X như sau: xi Số biến cố thuận lợi f(xi)=P(X=xi) F(xi)=P(X ≤ x) 1/8 1/8 3/8 4/8 3/8 7/8 1/8 Ðịnh nghĩa: Phân phối xác suất của biến số rời rạc là một bảng mơ tả những giá trị của biến số rời rạc cùng với xác suất và xác suất tích luỹ tương ứng của nó. Xác suất của các biến số ngẫu nhiên X được gọi là hàm khối (mass function) của X kí hiệu là f(x). Xác suất tích luỹ của biến số ngẫu nhiên X được gọi là hàm phân phối (distribution function) của X và được kí hiệu là F(x) Hai đặc tính cơ bản của phân phối xác suất của biến số rời rạc: (1) 0 ≤ P(X=x) ≤ 1 (2) Σ P(X=x) = 1 Có hai phân phối xác suất rời rạc được sử dụng rộng rãi nhất là phân phối nhị thức và phân phối Poision. Chúng ta sẽ thảo luận về hai phân phối này và phân phối bình thường trong các phần sau 2 Phân phối nhị thức Bài toán: Giả sử chúng ta thực hiện n phép thử đồng nhất và độc lập với nhau, mỗi phép thử có 2 kết cuộc là thành cơng hay thất bại với xác suất thành cơng trong mỗi lần thử là p. Hãy tính xác suất có x lần thành cơng Khi thực hiện n lần thử chúng ta sẽ có 2n kết cục. Trong đó số kết cục có x lần thành cơng là = px(1p)nx và số kết cục có x lần thành cơng là nCr Vì vậy, xác suất có x lần thành cơng sau n lần thử là P( X x) n C x p x (1 p ) ( n x) Do xác suất này phụ thuộc vào x nên nó là hàm số của x và được gọi là hàm khối xác suất nhị thức (binomial probability mass function) f ( x) P( X x) n C x p x (1 p) ( n x) Thí dụ: giả sử trong một dân số nhất định, tỉ lệ sinh con trai là 52%. Nếu chúng ta xem xét kết quả của 5 lần sinh. Để tính xác suất trong 5 lần sinh này có đúng 3 lần sinh là con trai có thể lập luận như sau: Ðể trong 5 lần sinh có 3 lần sinh con trai, có 5C3 = 5!/[3!x2!] = 10 cách khác nhau (đó là TGTTG, TTTGG, TGGTT, TTGTG, TTGGT, TGTGT, GTTTG, GGTTT, GTGTT, GTTGT). Xác suất xảy ra của một cách như vậy = 0,523(10,52)2= 0,2304 x 0,1406 = 0,032. Như vậy xác suất trong 5 lần sinh có 3 lần sinh là con trai là 10 x 0,032 = 0,32 Chúng ta cũng có thể xem 5 lần sinh là thử nghiệm nhị thức gồm 5 lần thử đồng nhất và mỗi lần thử có hai kết cuộc (sinh con trai và sinh con gái ) và xác suất sinh con trai là 0,52 khơng thay đổi trong các lần thử. Áp dụng hàm mật độ xác suất nhị thức ta f (3) P( X 3) C 0,52 0,48 ( 3) 0,32 Thí dụ: Cho rằng 10% thanh niên trong dân số là hút thuốc lá. Để tính xác suất có đúng 2 thanh niên hút thuốc lá trong nhóm 10 thanh niên chúng ta có thể sử dụng hàm mật độ xác suất nhị thức với n = 10, x = 2, and p = 0,1. Trong tr ường h ợp này xác suất là 0,1937 Thí dụ: Giả sử có 30% trẻ dưới 5 tuổi bị suy dinh duỡng. Trong một mẫu 10 trẻ dưới 5, tính xác suất có đúng 4 bị suy dinh dưỡng Phân phối Poisson Bài tốn: Giả sử trong một đơn vị thời gian trung bình có λ lần xuất hiện kết cục quan tâm. Hãy tính xác suất trong một đơn vị thời gian có x lần xuất hiện kết cục này Giả định một đơn vị thời gian được chia thành N phân tử thời gian với N là một số vơ cùng lớn. Khi đó xác suất xảy ra kết cục quan tâm trong một phân tử thời gian là λ/N. Khi đó bài tốn có thể được đặt dưới dạng: Thực hiện thử nghiệm nhị thức với N lần thử đồng nhất và xác suất xảy kết cuộc quan tâm trong mỗi lần thử là λ/N. Áp dụng công thức hàm mật độ xác suất nhị thức ta được f ( x) P( X x x) C x p (1 p ) N N x Nx x! N x N ( N ( N 1) ( N x! ( N x) x x 1) N ( N x) N x ) e x! x e x! để nắm vững các phép biến đổi đại số kể trên cần nhớ lại định nghĩa của số e (cơ số của logarithm Neper) f (X e lim U U x) U =2,7183 Bài tốn: Giả sử trong một đơn vị thời gian trung bình có λ lần xuất hiện kết cục quan tâm. Hãy tính xác suất trong t đơn vị thời gian có x lần xuất hiện kết cục này Giả định một đơn vị thời gian được chia thành N phân tử thời gian với N là một số vơ cùng lớn. Như vậy trong t đơn vị thời gian có Nt phân tử thời gian. Xác suất xảy ra kết cục quan tâm trong một phân tử thời gian là λ/N. Khi đó bài tốn có thể được phát biểu dưới dạng: Thực hiện thử nghiệm nhị thức với Nt lần thử đồng nhất và xác suất xảy kết cuộc quan tâm trong mỗi lần thử là λ/N. Áp dụng cơng thức hàm mật độ xác suất nhị thức ta được f ( x) P( X x) x Nt x N xt x x! N x N C x p (1 p ) Nt ( ) Nt ( Nt 1) ( Nt x! ( Nt x ) Nt x tx x! N ( ) ( t)x e x x 1) N ( Nt x ) N t x! Một cách tổng qt, phân phối Poisson được dùng làm mơ hình cho số lần xuất hiện các biến số thuận lợi trong một khoảng thời gian (t đơn vị thời gian) khi đã biết λ, trung bình số lần xuất hiện biến cố trong một đơn vị thời gian. Hàm khối xác suất Poisson được trình bày cơng thức sau f (X x) ( t)x e t x! với λ là tham số của phân phối và là số lần xuất hiện trung bình của biến cố trong một khoảng thời gian nhất định (hay trong một khơng gian nhất định) và e=2,7183 Thí dụ: Giả sử số lần nhập viện trong ngày cấp cứu một bệnh viện có phân phối Poisson với số lần nhập viện trung bình là 3 lần/ngày Tính xác suất a. Vào ngày 12 tháng 8 năm 2003, có đúng 2 trường hợp cấp cứu b. Vào ngày 12 tháng 8 năm 2003, có 1 trường hợp cấp cứu nào c. Trong một tuần có 7 trường hợp cấp cứu Tỉ suất Số lần xuất hiện trung bình của biến cố trong một đơn vị thời gian, λ, còn được gọi là tỉ suất (rate) hay mật độ mắc mới (incidence rate). Khác với xác suất, λ là đại lượng có đơn vị. Qua hàm khối của phân phối Poisson có thể nhận xét nếu trung bình số lần xuất hiện của biến cố trong một đơn vị thời gian là λ thì trung bình số lần xuất hiện của t đơn vị thời gian là λt Phân phối xác suất biến liên tục Giả sử ta muốn tìm phân phối xác suất của biến liên tục (thí dụ như trọng lượng của trẻ sơ sinh), ta có thể phân loại trọng lượng sơ sinh thành nhiều nhóm nhỏ (thí dụ như từ 2,0kg đến