Định nghĩa
Định nghĩa 1.1 Cho Ω là một tập hợp khác rỗng Một lớp F các tập con của Ω được gọi là σ-đại số nếu thỏa mãn 3 điều kiện:
(3) Nếu A 1 , A 2 , , A n , ∈ F thì S∞ n=1A n ∈ F. Định nghĩa 1.2 Cho F là một σ-đại số trên tập Ω Hàm tập hợp P :
F → R được gọi là độ đo xác suất nếu thỏa mãn 3 điều kiện:
(3) Nếu A1, A2, , An, ∈ F ,Ai ∩Aj = ∅ với mọi i 6= j, thì
Trong xác suất, định nghĩa về không gian mẫu và biến cố được thể hiện qua khái niệm thí nghiệm ngẫu nhiên Thí nghiệm này cho phép lặp lại nhiều lần trong cùng một điều kiện, tuy nhiên, kết quả của nó lại không thể được dự đoán trước.
- Không gian mẫu của thí nghiệm: Tập tất cả các kết quả, kí hiệu Ω
- Biến cố: một tập con bất kì của không gian mẫu Kí hiệu A,B,C, .
- Biến cố sơ cấp: biến cố chỉ gồm 1 phần tử.
- Biến cố A được xem là xảy ra nếu có ít nhất một kết quả A xuất hiện
- Cho hai biến cố A và B được gọi là xung khắc nếu biến cố này xảy ra thì biến cố kia không xảy ra.
Biến cố đối lập là hiện tượng xảy ra khi thực hiện một phép thử, dẫn đến việc chỉ một trong hai biến cố có thể xảy ra Biến cố đối lập của A được ký hiệu là A'.
Như vậy A.A = ∅ và A+A= Ω Định nghĩa 1.4 Bộ ba (Ω,F,P), trong đó:
(1) Ω là một tập khác rỗng
(2) F là một σ-đại số trên tập Ω
P là một độ đo xác suất trên không gian xác suất F, trong đó mỗi phần tử A ∈ F được gọi là biến cố và giá trị P(A) đại diện cho xác suất của biến cố đó Theo định nghĩa, xác suất P(A) của một biến cố A trong một thí nghiệm với không gian mẫu Ω là số đo khả năng xảy ra của A, và giá trị P(A) phải thỏa mãn các điều kiện nhất định.
(iii) Nếu A 1 ,A 2 , là các biến cố đôi một xung khắc thì
Lúc đó P(A) được gọi là xác suất của biến cố A.
Trong một số trường hợp, xác suất có thể được định nghĩa khác nhau tùy thuộc vào không gian mẫu và các thiết lập "tương ứng" P Theo quan điểm thống kê, khi thực hiện phép thử n lần và biến cố A xuất hiện m lần, tỉ số fn = m/n được gọi là tần suất xuất hiện của A Khi số phép thử tăng lên vô hạn, tần suất fn sẽ tiến đến một hằng số xác định, được gọi là xác suất của biến cố A.
Vì thế, trong thực tế khi số phép thử n lớn, ta có thể xem tần suất f n như là xác suất của biến cố A.
Ví dụ 1.1 Có 1000 người có triệu chứng A đến cơ sở y tế để khám bệnh. Kết quả có thấy 200 mắc bệnh X Ta có f = 200/1000 = 20 phần trăm.
Nếu một người có triệu chứng A, xác suất mắc bệnh khoảng 20% Theo quan điểm cổ điển, trong một thí nghiệm với n(Ω) kết quả đồng khả năng và n(A) kết quả thuận lợi cho biến cố A, xác suất của biến cố A, ký hiệu P(A), được xác định bằng tỉ lệ giữa số kết quả thuận lợi và tổng số kết quả.
Trong một bình chứa 10 viên bi, bao gồm 3 viên bi đỏ, 4 viên bi xanh và 3 viên bi đen, ta tiến hành lấy ngẫu nhiên 4 viên bi Để tính xác suất, ta xem xét hai trường hợp: thứ nhất, xác suất có đúng 2 viên bi xanh; thứ hai, xác suất có 1 viên bi xanh, 1 viên bi đỏ và 2 viên bi đen.
Giải Lấy ngẫu nhiên 4 bi từ 10 bi có C 10 4 cách lấy.
Suy ra n(Ω) = C 10 4 a) Gọi A là biến cố: “4 bi lấy ra có đúng 2 bi xanh”.
Xác suất của biến cố A là:
7 (1.1) b) Gọi B là biến cố: “4 bi lấy ra có 1 bi xanh, 1 bi đỏ và 2 bi đen”.
Xác suất của biến cố B là:
Trong một đoàn tàu gồm 4 toa, có 20 khách lên ngẫu nhiên 4 toa, mỗi toa có sức chứa tối đa 20 khách Cần tính xác suất cho hai trường hợp: Thứ nhất, xác suất để toa 1 có 4 khách Thứ hai, xác suất để có 3 toa, mỗi toa chứa 6 khách.
Giải a) Gọi A là biến cố "Toa 1 có 4 khách".
Giá trị n(A) được tính thông qua 2 giai đoạn:
- Giai đoạn 2: Xếp 16 khách còn lại: 3 16 cách
4 20 ≈0,19. b) Gọi B là biến cố "Có 3 toa mỗi toa 6 khách".
Giá trị n(B) được tính thông qua các giai đoạn:
- Giai đoạn 1: Chọn 3 toa: C 4 3 cách.
- Giai đoạn 2: Chọn 6 khách cho mỗi toa: C 20 6 C 14 6 C 8 6 cách.
- Giai đoạn 3: Xếp 2 khách còn lại: 1 2 = 1 cách.
Tính chất i) P(ỉ) = 0, P(Ω) = 1. ii) 0 ≤ P(A) ≤ 1,∀A. iii) Nếu A⊂ B thì P(A) ≤P(B). iv) Công thức cộng:
Khi các biến cố xung khắc đôi một thì:
Một sinh viên phải thi hai môn là triết học và toán, với xác suất qua môn triết là 0,6 và môn toán là 0,7 Nếu sinh viên đã qua môn triết, xác suất qua môn toán sẽ tăng lên 0,8 Mục tiêu là tính xác suất để sinh viên đó thi qua ít nhất một trong hai môn.
Giải Gọi A là biến cố: “Sinh viên đó thi qua môn Triết”.
Gọi B là biến cố: “Sinh viên đó thi qua môn Toán”.
Xác suất để Sinh viên đó thi qua ít nhất 1 môn là:
Trong một lô hàng gồm 15 thiết bị, có 6 thiết bị được sản xuất bởi nhà máy X và 9 thiết bị từ nhà máy Y Việc chọn ngẫu nhiên các thiết bị trong lô hàng này là một quá trình quan trọng để đảm bảo tính ngẫu nhiên và công bằng trong phân phối.
Để kiểm tra tính xác suất, có 4 thiết bị cần xem xét: Thứ nhất, xác suất cả 4 thiết bị được chọn đều do cùng một nhà máy sản xuất Thứ hai, xác suất có ít nhất một thiết bị được chọn là do nhà máy X sản xuất.
Giải a) Gọi A X , A Y là các biến cố các thiết bị được chọn do nhà máy
X, Y sản xuất Ta có A X , A Y xung khắc.
Xác suất cả 4 thiết bị được chọn do cùng nhà máy sản xuất:
C 15 4 b) Gọi B là biến cố có ít nhất một thiết bị được chọn do nhà máy X sản xuất.
Trong một đội bóng bàn gồm hai vận động viên A và B, xác suất A vượt qua vòng bảng là 0,7 và xác suất B vượt qua là 0,5 Tuy nhiên, do ảnh hưởng tâm lý, xác suất cả hai cùng vượt qua vòng bảng chỉ là 0,4 Để tính xác suất cả hai vận động viên đều không vượt qua vòng bảng, ta cần xác định xác suất trái ngược với trường hợp cả hai đều vượt qua.
Giải Gọi A, B là các biến cố vận động viên A, B vượt qua vòng bảng.
P(A) = 0,7;P(B) = 0,5;P(AB) = 0,4 Xác suất cả hai vận động viên đều không vượt qua vòng bảng:
= 1−(0,7 + 0,5−0,4) = 0,2. Định nghĩa 1.8 (Bằng độ đo) Cho tập S khác rỗng và D là tập con của
S Gọi A là biến cố “điểm M thuộc D” Ta định nghĩa:
P (A) = m(D) m(S) trong đó m(D) độ đo của D.
Xác suất có điều kiện
Xác suất có điều kiện của biến cố A khi biến cố B đã xảy ra, ký hiệu là P(A|B), được định nghĩa trong trường hợp P(B) > 0.
P(B) Tính chất: i) 0≤ P(A|B) ≤1. ii) P(A|B) = 1−P(A|B). iii) P(A∪B|C) = P(A|C) +P(B|C)−P(AB|C).
Ví dụ 1.7 Một công ty đầu thầu 2 dự án A và B Xác suất thắng thầu dự án A và B tương ứng là 0,6 và 0,7 Xác suất thắng thầu đồng thời cả
Trong hai dự án, xác suất thắng thầu của công ty cho dự án A, khi đã biết công ty thắng thầu dự án B, là 0,5 Ngược lại, xác suất công ty không thắng thầu dự án B, khi đã biết công ty thắng thầu dự án A, cũng là 0,5.
Giải Gọi A, B là các biến cố công ty thắng dự án A, B.
Khi xem xét xác suất có điều kiện, ta thấy P(A|B) = 5/7 lớn hơn P(A) = 0,6 Điều này cho thấy việc biết biến cố B xảy ra đã làm tăng xác suất xảy ra biến cố A, tức là việc thắng dự án B mang lại lợi ích cho quá trình thầu dự án A.
Trong ví dụ này, hai xạ thủ bắn vào bia với xác suất bắn trúng lần lượt là p1 = 0,9 và p2 = 0,7 Để tính xác suất cả hai đều bắn trúng, ta nhân hai xác suất lại với nhau, kết quả là 0,9 x 0,7 = 0,63 Để tính xác suất có đúng một viên đạn trúng bia, ta cần tính xác suất xạ thủ thứ nhất bắn trúng và xạ thủ thứ hai bắn hụt (0,9 x 0,3) cộng với xác suất xạ thủ thứ nhất bắn hụt và xạ thủ thứ hai bắn trúng (0,1 x 0,7), tổng cộng là 0,27 + 0,07 = 0,34 Cuối cùng, xác suất bia bị trúng đạn là 1 trừ xác suất cả hai đều bắn hụt, tức là 1 - (0,1 x 0,3) = 0,97.
Giải Gọi A là biến cố xạ thủ I bắn trúng bia.
B là biến cố xạ thủ II bắn trúng bia.
C là biến cố cả hai xạ thủ trúng bia.
D là biến cố có một viên đạn trúng bia.
E là biến cố bia bị trúng đạn. a) Xác xuất để cả hai đều bắn trúng:
P(C) = P(A∩B) = P(A)P(B) = 0.9×0.7 = 0.63. b) Xác suất để có một viên đạn trúng bia:
Ta có: D = ( ¯A∩B)∪(A∩B).¯ A¯∩B và A∩B¯ là xung khắc với nhau
⇒P(D) = 0.1×0.7 + 0.9×0.3 = 0.34. c) Xác xuất để bia bị trúng đạn:
Các công thức tính xác suất
Cho hai biến cố A và B với P(A) > 0 Khi đó:
Tương tự, ta sẽ có:
Tổng quát: Cho n biến cố A i với P(A 1 A 2 A n−1 ) > 0 Khi đó:
Trong một lô sản phẩm gồm 100 sản phẩm, có 90 sản phẩm đạt yêu cầu và 10 sản phẩm không đạt Khi tiến hành kiểm tra ngẫu nhiên 5 sản phẩm mà không hoàn lại, lô hàng sẽ không được chấp nhận nếu có ít nhất 1 sản phẩm không đạt trong số 5 sản phẩm đó Để xác định xác suất chấp nhận lô hàng, cần tính xác suất không có sản phẩm nào trong số 5 sản phẩm kiểm tra là phế phẩm.
Giải ĐặtA i = biến cố "sản phẩm kiểm tra thứi là sản phẩm tốt",i = 1,5 Đặt A = biến cố "nhận lô hàng" Ta thấy A = A 1 A 2 A 3 A 4 A 5
Theo công thức xác suất của tích các biến cố ta cố ta có:
Trong bài toán xác suất này, một thủ kho có 9 chiếc chìa khóa giống hệt nhau nhưng chỉ có 2 chiếc mở được kho Chúng ta cần tính xác suất cho các trường hợp sau: a) Dừng ở lần thử thứ 2, b) Dừng ở lần thử thứ 3, và c) Dừng sau nhiều nhất hai lần thử Các xác suất này sẽ giúp hiểu rõ hơn về khả năng tìm ra chìa khóa mở kho trong các lần thử ngẫu nhiên.
Giải Gọi A i là biến cố lần thứ i chọn đúng chìa khóa, i = 1,2,3, a P A 1 A 2 = P A 1 P A 2 |A 1 = 7/9.2/8 b P A 1 A 2 A 3 = P A 1 P A 2 |A 1 P A 3 |A 1 A 2 = 7/9.6/8.2/7 c P A 1 ∪A 1 A 2 = P (A 1 ) +P A 1 A 2 = 2/9 + 7/9.2/8.
Định nghĩa
Biến ngẫu nhiên là hàm X xác định trên không gian mẫu Ω, với giá trị trong R, trong không gian xác suất (Ω,F, P) Đối với mọi x ∈ R, tập hợp các kết quả {$ : X($) < x} sẽ tạo thành một biến cố ngẫu nhiên.
- Tập hợp các giá trị của X được gọi là miền giá trị của X, kí hiệu
Biến ng
- Gieo ngẫu nhiên 3 lần một đồng xu Gọi X là số lần mặt xuất hiện. Khi đó X là một biến ngẫu nhiên nhận các giá trị 0, 1, 2 và 3.
- Gọi Y là số người đến đổ xăng ở của hàng AB trong một ngày Khi đó Y là biến ngẫu nhiên nhận các giá trị 0, 1, 2,
- Gọi Z là nhiệt độ trung bình trong một ngày (đơn vị: độ C) Khi đó
Z là biến ngẫu nhiên nhận các giá trị trong khoảng (−∞,+∞). Định nghĩa 1.11 Hàm số thực F X (x) = P(X < x), x ∈ R được gọi là hàm phân phối của biến ngẫu nhiên X.
Nhận xét: Hàm phân phối FX(x) chính là xác suất của X nhận giá trị trong khoảng (−∞, x).
Tính chất: i) 0≤ F X (x) ≤ 1,∀x ∈ R. ii) P(a ≤ X < b) = F(b)−F (a) đơn điệu không giảm với mọi ∀x ∈ R iii) F X (x) liên tục trái với mọi x, tức là lim x→x − 0
Phân phối rời rạc
Cho X là biến ngẫu nhiên rời rạc với tập giá trị X(Ω) Khi đó, hàm p(x)
0, x /∈ X(Ω) được gọi là hàm khối xác suất.
Trường hợp X(Ω) = {x 1 , , x n } hữu hạn và đặt p i = P(X = x i ) ta có bảng phân phối xác suất:
Nhận xét: i) P p i = 1. ii) Hàm phân phối của X sẽ là: F X (x) = P(X < x) = P x i 0 ký hiệu X ∼ Pois(λ) nếu X nhận giá trị trong tập
Tính chất: i) Nếu X ∼ Pois(λ) thì E(X) = λ,D(X) =λ. ii) Cho X 1 , X 2 độc lập và có phân phối Poisson với tham số λ 1 , λ 2 Khi đó X = X 1 +X 2 ∼ Pois(λ 1 +λ 2 ).
Phân phối Poisson mô tả số lượng sự kiện xảy ra trong một khoảng thời gian xác định, với tham số tỷ lệ tương ứng với độ dài của khoảng thời gian đó.
Một gara cho thuê ô tô nhận thấy rằng số đơn đặt hàng thuê ô tô vào ngày thứ 7 tuân theo phân phối Poisson với tham số λ = 2 Với 4 chiếc ô tô có sẵn, xác suất để có đúng 2 ô tô được thuê là P(X=2), trong khi xác suất để có đúng 4 ô tô được thuê là P(X=4) Hơn nữa, xác suất gara không đáp ứng được yêu cầu khi có nhiều hơn 4 ô tô được thuê có thể được tính bằng P(X>4).
Giải GọiX là số đơn đặt hàng ô tô vào ngày thứ 7 Ta cóX ∼ P ois(λ = 2). a P (X = 2) = e −2 2 2
Tại siêu thị A, trung bình có 20 khách hàng đến mua sắm trong 4 phút, tương đương với 5 khách mỗi phút a) Để tính xác suất có 30 khách trong 7 phút, ta áp dụng phân phối Poisson b) Tính xác suất có từ 3 đến 5 khách trong 2 phút cũng sử dụng phân phối này, với tỷ lệ khách hàng là 10 khách trong 2 phút.
Giải a Gọi X là số khách đến siêu thị trong 7 phút Lúc đó, X có phân phối Poisson với tham số λ = 7/4.20 = 35 Xác suất cần tìm:
30! b Gọi Y là số khách đến siêu thị trong 2 phút Lúc đó, Y có phân phối Poisson với tham số λ = 2/4.20 = 10 Xác suất cần tìm:
Phân phối chuẩn
Biến ngẫu nhiên X được gọi là có hàm phân phối chuẩn với tham số μ và σ², ký hiệu X ∼ N(μ, σ²), nếu hàm mật độ của nó có dạng: f(x) = 1/(σ√(2π)) e^(-(x−μ)²/(2σ²)), với x thuộc R Khi μ = 0 và σ = 1, ta có phân phối chuẩn tắc N(0,1).
Hàm mật độϕ(x)và hàm phân phối Φ(x)của phân phối chuẩn tắc N(0,1) tương ứng là: ϕ(x) = 1
Hỡnh 1.2: Đồ thị hàm mật độ chuẩn N(à, σ 2 )
Nhận xét: i) Biến ngẫu nhiên có phân phối chuẩn tác thường được kí hiệu là Z. ii) Φ (0) = 0,5; Φ (1/2) = 0,691; Φ (1) = 0,841; Φ (2) = 0,977. iii) Φ (x) = 1/2 + Φ (x) trong đó Φ (x) = √ 1
0 e −t 2 / 2 dt - hàm Laplace. Một vài giá trị hay sử dụng: Φ (0) = 0,5; Φ (1/2) = 0,691; Φ (1) = 0,841; Φ (2) = 0,977.
Giới trị tới hạn: Giá trị tới hạn mức α của phân phối chuẩn tắc được kí hiệu Z α , tức là:P (Z > z 0 ) =α hay z 0 = Φ −1 (1−α)
Giá trị z 0 được tra ở bảng.
5 Vectơ ngẫu nhiên 2 chiều rời rạc
Bảng phân phối đồng thời
Giả sử X nhận các giá trị trong tập {x i , i ∈ I} và Y nhận các giá trị trong tập {y j , j ∈ J} Đặt pij = P(X = xi, Y = yj), i ∈ I, j ∈ J Lúc đó ta có bảng phân phối đồng thời:
Trong ví dụ 1.21, một hộp chứa 2 bi trắng và 3 bi đen Khi lấy ngẫu nhiên 1 viên bi mà không hoàn lại, sau đó tiếp tục lấy thêm 2 viên bi nữa mà cũng không hoàn lại, ta đặt X và Y lần lượt là số bi đen được lấy ở lần 1 và lần 2 Để giải bài toán, trước tiên cần lập bảng phân phối đồng thời của X và Y, sau đó tính xác suất P(X + Y < 2).
Giải a Ta có X nhận các giá trị: 0, 1 và Y nhận các giá trị: 0, 1, 2.
Bảng phân phối đồng thời:
Ví dụ 1.22 Cho hai biến ngẫu nhiên X, Y độc lập có bảng phân phối:
Lập bảng phân phối đồng thời của (X, Y).
Giải Vì X, Y độc lập nên:
Bảng phân phối đồng thời:
Phân phối biên
Ta đưa vào kí hiệu: p i = P(X = x i ) = X j
Từ đó ta được bảng phân phối của X và được gọi là phân phối biên X:
Để xác định hàm phân phối biên trong thực hành, chúng ta có thể bắt đầu từ bảng phân phối đồng thời và tính toán các xác suất theo hàng hoặc theo cột, như được minh họa trong bảng dưới đây.
Phân phối biên Y được tìm hoàn toàn tương tự.
Tính chất của phân phối nhị thức 35
Các tính chất
Tính chất 1: Nếu X ∼ B(n, p) và Y ∼ B(m, p) là các biến ngẫu nhiên độc lập thì Z = X +Y ∼ B(m+n, p).
X C n+m k là hệ số của x k trong khai triển (x+ 1) n+m
C n i C m k−i là hệ số của x k trong khai triển (x+ 1) n (x+ 1) m
Hệ quả 2.1 Nếu các biến ngẫu nhiên X i , i = 1, n độc lập và có cùng phân phối, X i ∼Ber(p) thì:
Tính chất 2: Nếu X ∼ B(n, p) thì E(X) =np, D(X) =np(1−p). Chứng minh Theo hệ quả (2.1), ta có thể biểu diễn:
Trong đó các biến ngẫu nhiênX i , i= 1, n độc lập và có cùng phân phối,
Tính chất 3: Cho X ∼ B(n, p) Khi đó, số mốt của X, kí hiệu mod(X) được xác định: mod(X)
[(n+ 1)p], (n+ 1)p /∈ Z, {(n+ 1)p−1,(n+ 1)p}, (n+ 1)p∈ Z, Trong đó kí hiệu [x] là số nguyên lớn nhất không vượt quá x.
Chứng minh Ta có: P(X = k) = C n k p k q n−k , với q = 1−p.
Mặt khác, ta lại có:
Vậy khi (n+ 1)p−1∈ Z thì (n+ 1)p−1 và (n+ 1)plà các số mốt của
Trong trường hợp (n+ 1)p−1 ∈/ Z thì: mod(X) = [(n+ 1)p−1] + 1 = [(n+ 1)p].
Tớnh chất 4: Cho K, L là hai biến ngẫu nhiờn độc lập, K ∼ P ois(à) và L ∼ P ois(ν) Khi đó, với N = K +L ta có:
. Điều này có nghĩa là phân phối có điều kiện của K khi biết N là phân phối nhị thức B(N, à/(à+ν)).
Tính chất 5: Cho X, Y là hai biến ngẫu nhiên, X ∼ B(n, p) và phân phối có điều kiện của Y khi biết X là B(X, q), tức là Y|X ∼ B(X, q). Lúc đó, Y ∼ B(n, pq).
Chứng minh Từ X ∼ B(n, p) và Y ∼ B(X, q), theo công thức xác suất toàn phần ta có:
Từ C n k C k m = C m n C n−m k−m phương trình trên được biểu diễn dưới dạng:
Sau khi thế i = k −m trong biểu thức trên ta nhận được:
Tính chất 6: (Luật biến cố hiếm) ChoX ∼ B(n, p) Nếunp →λ, p →
Khi n tiến tới vô cùng và k cố định thì: n(n−1) (n−k+ 1) n k
Vì vậy, ta có: n→∞lim C n k λ n k
= λ k k!e −λ Ứng dụng: Khi p khá nhỏ và n khá lớn, ta có :
P(X = k) ≈ λ k e −λ k! , với λ = np. Điều này có nghĩa là X có phân phối xấp xỉ phân phối Poisson với tham số λ = np.
Trong ví dụ 2.3, một bao thóc giống có tỷ lệ lép là 0,0002 Khi chọn ngẫu nhiên 1000 hạt thóc, ta cần tính xác suất gần đúng để trong tổng số 10.000 hạt có đúng 5 hạt lép.
Giải Kiểm tra liên tiếp có hoàn lại 10000 hạt được xem như thực hiện
Theo công thức xấp xỉ ở trên ta có λ = 10 4 ×0,0002 = 2 và suất phải tìm là:
Định lý giới hạn
Định lý 2.1 [1] Định lý giới hạn địa phương Moivre-Laplace
Nếu n → ∞, p n ∈ (0,1) không đổi và x n = (k−np)/√ npq bị chặn đều theo k và n thì p n (k) =ϕ(x k )(1 +α n (k))/√ npq, trong đó q = 1−p,|α n |< c/√ n với x k ∈ [a, b], c > 0 là hằng số và ϕ(x) = 1
2 Chứng minh Sử dụng công thức Stirling: lnn! = ln√
Để khai triển tiệm cận hệ số nhị thức trong: b(k, n, p) = C n k p k q n−k
Ta có: k = np+x k √ npq, n−k = nq−x k √ npq Suy ra: lnk! = ln√
2πk+(np+x k √ npq) ln(np+x k √ npq)−np−x k √ npq+o 1 n
ln(n−k)! = ln q 2π(n−k) + (nq−x k √ npq) ln(nq−x k √ npq)
Sử dụng công thức: ln(1−x) = x− x 2 2 +o(x 3 ), để có khai triển: ln(np+ x k √ npq) = lnnp+ ln 1 +x k r q np
; ln(nq−x k √ npq) = lnnq+ ln(1 −x k r p nq)
Định lý 2.2 cho biết rằng, với các biến ngẫu nhiên độc lập X1, X2, , Xn có phân bố Bernoulli, xác suất P(Xi = 1) = p và P(Xi = 0) = 1−p, tổng Sn = X1 + + Xn sẽ tuân theo quy luật giới hạn Cụ thể, khi n tiến tới vô cùng, xác suất rằng Sn trừ đi giá trị kỳ vọng pn nằm trong khoảng (a, b) sẽ được mô tả bởi công thức: lim n→∞ P(a ≤ Sn - pn ≤ b) = pnp(1−p).
Chứng minh Theo giả thuyết, S n có phân bố nhị thức P(S n = k) Pn(k) = C n k p k (n−p) n−k Đặt z = z(n, k) = k−pn pnp(1−p).
∆ n = 1 pnp(1−p) bằng bước nhảy của z trong tổng phía trên Bởi vậy, theo định nghĩa tích phân Riemann, ta có: n→∞lim
Từ đó suy ra điều phải chứng minh.
Abraham de Moivre (1667-1754) là một nhà toán học người Pháp, bị bắt tù năm 1688 vì lý do tôn giáo và di tản sang London cho đến khi qua đời Ông được bầu vào Viện Hàn lâm Hoàng gia Anh năm 1697 và là một trong những người tiên phong nghiên cứu phép tính vi phân, được gọi là phương pháp fluxions Newton từng khẳng định rằng "nên gặp de Moivre vì ông ta biết hơn tôi" khi nói về phương pháp này De Moivre đã phát hiện và chứng minh định lý de Moivre-Laplace về dáng điệu tiệm cận của phân bố nhị thức cho trường hợp p = 1/2 vào năm 1773, sau đó được Laplace mở rộng cho trường hợp p bất kỳ Ngoài lý thuyết xác suất và phép tính vi phân, ông còn đóng góp vào lý thuyết tập hợp và số phức, với công thức nổi tiếng (cos(x) + i*sin(x))^n = cos(nx) + i*sin(nx) được gọi là công thức de Moivre.
Khi tung một đồng tiền 1000 lần và nhận được 600 lần mặt ngửa, liệu có thể coi đồng tiền này là cân bằng, với xác suất hiện lên của hai mặt là 1/2 hay không?
Để giải quyết câu hỏi, giả sử đồng tiền là cân bằng, ta có phân bố nhị thức với n = 1000 và p = 1/2, dẫn đến pn = 500 và pnp(1−p) ≈ 15,1811 Gọi k là số lần xuất hiện mặt ngửa trong 400 lần tung, theo định lý de Moivre - Laplace, ta có thể tính toán kết quả.
Xác suất để mặt ngửa xuất hiện ít nhất 600 lần khi tung đồng xu 1000 lần là rất nhỏ, cụ thể là nhỏ hơn 1/10^10, điều này cho thấy rằng nếu đồng xu là cân bằng, khả năng xảy ra kết quả này là gần như không thể.
Một xạ thủ thực hiện 200 lần bắn vào mục tiêu với xác suất trúng mỗi viên đạn là 0,6 Để tính xác suất có ít nhất 100 viên trúng đích, ta có thể sử dụng phân phối nhị thức Xác suất này cho thấy khả năng thành công của xạ thủ trong việc đạt được mục tiêu bắn trúng, phản ánh hiệu suất và độ chính xác của kỹ năng bắn.
Giải Gọi X là số viên đạn bắn trúng Ta có: X ∼ B(n= 200;p= 0,6). Áp dụng định lý Moivre - Laplace, X phõn phối xấp xỉ chuẩn với à np = 120;δ 2 = np(1−p) = 48.
Một công ty bảo hiểm xe máy với 10.000 khách hàng thu phí 120.000 đồng/năm từ mỗi chủ xe và trung bình bồi thường 1.000.000 đồng cho những xe gặp tai nạn giao thông Theo thống kê, tỷ lệ xe máy bị tai nạn trong một năm là 0,006 Để xác định xác suất công ty sẽ bị thất bại sau một năm hoạt động, cần tính toán số tiền thu được và số tiền bồi thường phải chi trả cho các trường hợp tai nạn.
Giải Gọi X là số xe bị tai nạn và Y (ngàn đồng) là số tiền lãi của công ty trong 1 năm.
Ta có: X ∼ B(n= 10000;p = 0,006) và Y = 12∗10 5 −1000X. Áp dụng định lý Moivre-Laplace, X có phân phối xấp xỉ chuẩn với tham số à = np = 60;δ 2 = np(1−p) = 59,64.
Xác suất để sau một năm hoạt động công ty bị thất bại:
Ví dụ 2.7 Gieo ngẫu nhiên 10000 hạt đậu tương Xác suất nảy mầm của mỗi là 0,9 Tính gần đúng xác suất để số hạt nảy mầm không ít hơn 8000.
Giải Gọi X là số hạt đậu tương nảy mầm Ta có X ∼ B(n= 10000;p0,9) Khi đó, ta phải tính gần đúng xác suất P(X ≥ 8000).
Theo công thức xấp xỉ ở trên ta có:
Xác suất phải tìm là: P(X ≥8000) ≈1.
Trong một lô hàng có tỷ lệ phế phẩm 5%, khi kiểm tra ngẫu nhiên 100 sản phẩm, xác suất để số sản phẩm đạt tiêu chuẩn nằm trong khoảng từ 90 đến 96 sản phẩm có thể được tính gần đúng.
Giải Gọi X là số sản phẩm tốt có trong 100 sản phẩm được kiểm tra Ta có: X ∼ B(n= 100;p= 0,95).
Lúc đó, xác suất cần tìm: Ta có:
2 Phân phối nhị thức hai chiều
Chúng ta sẽ mở rộng phân phối nhị thức một chiều thành hai chiều, dựa trên nguyên tắc mở rộng phân phối Bernoulli từ một chiều sang hai chiều Tiếp theo, chúng ta sẽ xây dựng phân phối cho tổng của các vectơ ngẫu nhiên có phân phối Bernoulli hai chiều.
Phân phối Bernoulli hai chiều
Xét một cặp biến ngẫu nhiên (X, Y) có phân phối đồng thời:
Lúc đó, ta nói rằng phân phối này có luật Bernoulli hai chiều.
Phân phối biên của X được cho bởi P(X = 0) = p 00 + p 01 và P(X 1) = p 10 + p 11 nghĩa là, X có phân phối theo luật Bernoulli (một chiều) với tham số p 10 + p 11 và giá trị trung bình của X bằng p 10 +p 11
Biên phân phối của biến ngẫu nhiên Y được xác định bởi P(Y = 0) = p00 + p10 và P(Y = 1) = p01 + p11, cho thấy Y tuân theo phân phối Bernoulli một chiều với tham số p01 + p11 Giá trị trung bình của Y cũng được tính bằng p01 + p11.
E(X) =p 10 +p 11 E(Y) = p 01 +p 11 Hiệp phương sai của vectơ (X, Y) được định nghĩa:
Hệ số tương quan ρ(X, Y) của (X, Y) được xác định bởi: ρ(X, Y) = Cov(X, Y) pD(X)pD(Y).
Công thức tính hệ số tương quan giữa hai biến ngẫu nhiên X và Y được đưa ra là ρ(X, Y) = (p00 * p11 - p10 * p01) / (√(p(p10 + p11) * (p00 + p01)) * √(p(p01 + p11) * (p00 + p10))) Nếu cặp biến ngẫu nhiên (X, Y) phân phối Bernoulli với các tham số p00, p10, p01 và p11 có tổng bằng 1 và hiệp phương sai Cov(X, Y) bằng 0, thì điều này cho thấy hai biến ngẫu nhiên X và Y không tương quan, tức là chúng độc lập với nhau.
Thật vậy, nếu Cov(X, Y) = 0 thì p 00 p 11 − p 10 p 01 = 0 hay p 00 p 11 p 10 p 01 Lúc đó:
Tương tự, ta sẽ chứng minh được P(X = i, Y = j) = P(X = i)P(Y j),∀i, j ∈ {0,1} hay X, Y độc lập.
Xây dựng phân phối nhị thức hai chiều
Tiếp theo ta sẽ suy ra phân phối của tổng của n vectơ ngẫu nhiên độc lập nhau (X 1 , Y 1 ), (X 2 , Y 2 ), ,(X n , Y n ) có cùng phân phối Bernoulli hai chiều với vectơ (X, Y).
Chúng ta sẽ tính các xác suất P(P n i=1 X i = k,P n i=1 Y i = l) với k và l thỏa mãn 0≤ k ≤ n, 0 ≤l ≤ n.
Giả sử (0;0), (1;0), (0;1) và (1;1) lần lượt xảy ra α, β, γ và δ lần với α+β+γ+δ = n thì tổng của các cặp(P n i=1 Xi,P n i=1 Yi) =P n i=1 (Xi, Yi) bằng (β +δ, γ + δ).
Xác suất của sự kiện được mô tả ở trên bằng:
P(X n i=1X i = k,X n i=1Y i = l) bằng tổng các xác suất P αβγδ trong đó α, β, γ và δ được tính cho tất cả giá trị không âm thỏa mãn các điều kiện: β +δ = k, γ + δ = l, α+β +γ +δ = n. Điều này có nghĩa là:
Trong đó k và l là các số nguyên không âm thỏa mãn: 0≤ k, l ≤ n.
Ta sẽ tính các phân phối biên của phân phối nhị thức hai chiều. Đầu tiên, ta có:
Phân phối biên củaPn i=1X i chính là phân phối nhị thức B(n, p 10 +p 11 ) với tham số p 10 + p 11
Tương tự, ta cũng có phân phối biên của Pn i=1Y i là phân phối nhị thức B(n, p 01 +p 11 ) với tham số p 01 +p 11 , tức là:
Giá trị kỳ vọng của Pn i=1X i và Pn i=1Y i được cho bởi:
Hiệp phương sai của Pn i=1Xi và Pn i=1Yi được cho bởi:
CovXX i ,XY i = EhXX i −EhXX i i XY i −EhXY i ii
Nếu i khác j, các vectơ ngẫu nhiên (Xi, Yi) và (Xj, Yj) là độc lập, tức là Xi và Yj cũng là các biến ngẫu nhiên độc lập.
Mặt khác, do tính chất cùng phân phối nên:
= n(p 00 p 11 −p 10 p 01 ). Xác suất đồng thời có thể biểu diễn lại:
Nếu ta giả sử p00, p10, p01, p11 > 0 và Cov(X, Y) = 0 thì ta có X và Y độc lập Mặt khác, tổng (P n i=1 X i ,P n i=1 Y i ) của n độc lập vectơ (X i , Y i ) có:
Nếu giả sử Cov(Pn i=1 Xi, Pn i=1 Yi) = 0, thì ta có Cov(X, Y) = 0 Khi p00, p10, p01 và p11 đều là các số dương, thì Xi và Yi là độc lập với mọi i = 1, 2, , n Do đó, Pn i=1 Xi và Pn i=1 Yi cũng độc lập với nhau.
3 Ứng dụng của phân phối nhị thức
Bài toán tối ưu
Một xưởng dệt với 50 máy dệt có xác suất hỏng hóc 0,1 cho mỗi máy trong mỗi ca làm việc Để đảm bảo sửa chữa kịp thời các máy hỏng, xưởng cần tính toán số lượng thợ máy tối thiểu cần bố trí trong một ca, với điều kiện mỗi thợ có khả năng sửa chữa 2 máy hỏng.
Trong mô hình Bernoulli với n = 50 và p = 0,1, ta xét X là số máy bị hỏng Mục tiêu là xác định số lượng máy hỏng tương ứng với xác suất xuất hiện lớn nhất.
Vậy cần 3 người thợ để sửa máy trong 1 ca làm việc.
Một nguồn phát tín hiệu thông tin nhiều lần độc lập với xác suất thu được mỗi lần là 0,4 Để tính xác suất thu được tin, cần xem xét số lần phát tín hiệu và xác suất thành công trong mỗi lần thu.
≥ 0,99 thì phải phát đi ít nhất bao nhiêu lần
Giải Gọi n là số tín hiệu cần phát đi và X là số lần thu được tín hiệu.
Ta có mô hình Bernoulli với n và p= 0,4.
Theo giả thiết ta có:
Vậy cần phát đi ít nhất 10 lần thì xác suất thu được tin ≥ 0,99.
Ví dụ 2.11 Một trò chơi yêu cầu người tham gia nộp phí tham dự là 500
Mỗi người chơi tham gia trò chơi cần trả lời 6 câu hỏi độc lập Với mỗi câu trả lời đúng, người chơi sẽ nhận được 1 triệu đồng, trong khi đó, nếu trả lời sai, họ sẽ bị phạt 100 đồng.
Trong trò chơi này, người chơi có xác suất trả lời đúng mỗi câu là 0,6 và số tiền thưởng là 000 đồng Để tính số tiền lời trung bình mà người chơi đạt được sau trò chơi, ta cần xác định số câu hỏi và xác suất trả lời đúng Để đảm bảo số tiền lời trung bình ít nhất là 6 triệu đồng, trò chơi cần bố trí tối thiểu một số lượng câu hỏi nhất định cho mỗi lần chơi.
Giải a)Gọi X là số câu trả lời đúng của người chơi Ta có: X ∼ B(n 6;p= 0,6).
Gọi Y là số tiền lời người chơi đạt được Lúc đó:
Số tiền người chơi có được là:
= 1100000.6.0,6−600000 = 3360000. b) Gọi n là số câu hỏi cần bố trí Lúc đó, số câu trả lời đúng X và số tiền lời Y người này đạt được sau trò chơi thỏa mãn:
⇔n ≥10Vậy cần bố trí tối thiểu 10 câu hỏi cho 1 lần chơi.
Sáng tạo các bất đẳng thức về hệ số tổ hợp
Định lý 2.3 (Bất đẳng thức Markov) Với biến ngẫu nhiên X không âm thì:
P {X ≥ε} ≤ E[X] ε Chứng minh Xét trường hợp X có phân phối liên tục với hàm mật độ f(x).
Z ε f(x)dx = εP {X ≥ ε}. Định lý 2.4 (Bất đẳng thức Chebyshev) Với biến ngẫu nhiên X bất kì ta có:
P {|X −E[X]| ≥ ε} ≤ D[X] ε 2 Chứng minh Do biến (X −E[X]) 2 không âm, áp dụng bất đẳng thức Markov, ta có:
≤ E[(X −E[X]) 2 ] ε 2 = D[X] ε 2 Tổng quát hơn, ta có:
E[(X −E[X]) q ] ε q Ứng dụng: Cho X ∼ B(n, p) Lúc đó, với mọi ε > 0, ta có:
(1−p) n , với dn/2e - số nguyên nhỏ nhất lớn hơn n/2.
Nếu sử dụng bất đẳng thức Chebyshev, ta được:
P(|X −np| ≥ λn) ≤ np(1−p) λ 2 n 2 = p(1−p) nλ 2 , với λ > 0 Điều này có nghĩa, với K = {k :|k −np| ≥λn,0≤ k ≤ n} ta có:
≤ p(1−p) n+1 nλ 2 Tóm lại, ta được các bài toán.
Bài toán 1: Cho p ∈ (0,1) và n ∈ N, n ≥ 2 Chứng minh: n
Bài toán 2: Cho p ∈ (0,1) và n ∈ N Chứng minh: n
(1−p) n , với dn/2e - số nguyên nhỏ nhất lớn hơn n/2.
Bài toán 3: Cho p ∈ (0,1) và n ∈ N Chứng minh:
Trường hợp đặc biệt, khi p = 1/3 ta được:
Bài toán 1’: Cho n∈ N, n ≥2 Chứng minh: n
Bài toán 2’: Chứng minh rằng với mọi n ∈ N, n ≥ 1, ta có n
, với dn/2e - số nguyên nhỏ nhất lớn hơn n/2.
Bài toán 3’: Chứng minh rằng với mọi n ∈ N, n ≥ 1, ta có
Sáng tạo các đẳng thức về hệ số tổ hợp
Mặt khác, từ (2.1) ta có: n
X k=1 kC n k p k (1−p) n−k +n.p n = np Đạo hàm 2 vế theo p ta được: n−1
Như vậy, ta được các bài toán:
Bài toán 1: Chứng minh rằng với mọi n∈ N, n ≥1, ta có: n
Bài toán 2: Chứng minh rằng với mọi n∈ N, n ≥2, ta có: n−1
Bài toán 3: Chứng minh rằng với mọi n∈ N, n ≥2, ta có: n−1
Trong luận văn này, tôi đã thực hiện được các công việc sau đây.
1 Hệ thống lại lý thuyết về xác suất, các công thức tính xác suất, biến ngẫu nhiên và các dạng phân phối, các số đặc trưng và vectơ ngẫu nhiên 2 chiều rời rạc.
2 Nghiên cứu các tính chất của phân phối nhị thức một chiều: phân phối của tổng các biến ngẫu nhiên, phân phối có điều kiện, các định lý giới hạn.
3 Nghiên cứu việc xây dựng phân phối nhị thức hai chiều từ phân phối Bernoulli hai chiều.
4 Nghiên cứu những ứng dụng của phân phối nhị thức trong bài toán tối ưu, sáng tạo đẳng thức và bất đẳng thức liên quan đến hệ số tổ hợp.
Mặc dù đã nỗ lực hết mình, luận văn này vẫn không tránh khỏi một số thiếu sót do hạn chế về thời gian và khả năng Rất mong nhận được ý kiến đóng góp từ quý thầy cô và các bạn để luận văn có thể được hoàn thiện hơn.
DANH MỤC TÀI LIỆU THAM KHẢO
[1] Nguyễn Duy Tiến, Vũ Viết Yên (2001),Lý thuyết xác suất, NXB Giáo dục.
[2] GS Nguyễn Tiến Dũng và GS Đỗ Đức Thái (2015), Nhập môn hiện đại xác suất và thống kê, Tủ sách Sputnik.
[3] Đinh Văn Gắng (2009), Lý thuyết xác suất và thống kê, NXB Giáo dục.
[4] Nguyễn Viết Phú, Nguyễn Duy Tiến (2004), Cơ sở lý thuyết xác suất, NXB Đại học quốc gia Hà Nội.
[5] Bộ Giáo dục và Đào tạo (2018), Chương trình giáo dục phổ thông: Môn Toán (Ban hành kèm theo Thông tư số 32/2018/TT-BGDĐT),
[6] Allan Gut (2013), Probability: A Graduate Course, Springer-Verlag, New York.
[7] Kazutomo Kawamura (1973), The structure of bivariate Poisson dis- tribution, Kodai Mathematical Seminar Reports, Vol 25 (3), p.246 – 256.
[8] https://en.wikipedia.org/wiki/Binomial_distribution
D