XÁC SUẤT
Không gian mẫu và biến cố
Phép thử là quá trình thực hiện các điều kiện nhất định để quan sát sự xuất hiện của một hiện tượng Trong thực tế, có nhiều phép thử có thể lặp lại nhiều lần trong cùng một điều kiện, nhưng kết quả của chúng vẫn không thể được xác định chắc chắn Những phép thử này được gọi là phép thử ngẫu nhiên Trong giáo trình này, thuật ngữ phép thử và thí nghiệm được sử dụng như nhau.
- Gieo một con xúc xắc.
- Hỏi tháng sinh của một sinh viên được chọn ngẫu nhiên.
- Đo chiều cao của một sinh viên được chọn ngẫu nhiên.
1.1.2 Không gian mẫu Định nghĩa 1.1 Tập tất cả các kết quả có thể xảy ra của một phép thử ngẫu nhiên được gọi là không gian mẫu Kí hiệu không gian mẫu là Ω.
Khi tung một đồng xu, có hai kết quả có thể xảy ra: mặt sấp (S) hoặc mặt ngửa (N) Không gian mẫu trong trường hợp này bao gồm hai khả năng là S và N.
Ví dụ 1.3 Một nhóm có 3 học sinh A, B và C Xếp ngẫu nhiên 3 học sinh này thành một hàng dọc Không gian mẫu sẽ là:
Ω = {ABC, ACB, BAC, BCA, CAB, CBA}.
Ví dụ 1.4 Tung ngẫu nhiên một đồng xu cho đến khi mặt sấp xuất hiện thì dừng Không gian mẫu sẽ là:
Ví dụ 1.5 Quan sát số lượng hàng hóa được bán trong một ngày ở một cửa hàng Không gian mẫu sẽ là:
Biến cố ngẫu nhiên, hay còn gọi là biến cố, là những hiện tượng hoặc sự kiện có khả năng xảy ra hoặc không xảy ra trong một phép thử ngẫu nhiên Để ký hiệu cho biến cố ngẫu nhiên, người ta thường sử dụng các chữ cái in hoa như A, B, C, và nhiều ký hiệu khác.
Khi một kết quả của phép thử xảy ra và dẫn đến biến cố A, ta gọi đó là kết quả thuận lợi cho A Mỗi biến cố A tương ứng với tập hợp các kết quả thuận lợi của nó, do đó, mỗi biến cố được xem như một tập con của không gian mẫu.
- Biến cố chỉ gồm một kết quả thuận lợi được gọi làbiến cố sơ cấp Không gian mẫu còn được gọi làkhông gian các biến cố sơ cấp.
- Biến cố được xem là xảy ra nếu có ít nhất một kết quả thuận lợi cho nó xuất hiện trong phép thử.
- Có 2 biến cố đặc biệt:
* Biến cố không thể (∅): là biến cố không thể xảy ra trong phép thử.
* Biến cố chắc chắn (Ω): là biến cố luôn xảy ra trong phép thử.
Ví dụ 1.6 Một hộp có 3 viên bi gồm một bi trắng (T), một bi xanh (X) và một bi vàng (V) Chọn ngẫu nhiên 2 viên bi Khi đó:
- Gọi A là biến cố chọn được bi vàng Ta có: A = {{T, V }, {X, V }}.
- Nếu khi thực hiện phép thử, ta chọn được một bi xanh và một bi vàng thì kết quả này là một kết quả thuận lợi cho biến cố A.
- Biến cố chọn được 2 bi vàng là biến cố không thể (∅).
- Biến cố chọn được bi xanh hoặc vàng là biến cố chắc chắn (Ω).
Ví dụ 1.7 Xét phép thử hỏi tháng sinh của một sinh viên được chọn ngẫu nhiên.
Biến cố sinh viên có tháng sinh 31 ngày là
Biến cố sinh viên có tháng sinh 32 ngày là ∅.
Biến cố sinh viên có tháng sinh bé hơn 32 ngày là Ω.
Ví dụ 1.8 Quan sát tuổi thọ (năm) của một thiết bị điện tử Lúc đó: Ω = {x ∈
R : x ≥ 0} Biến cố thiết bị điện tử bị hỏng trước 5 năm là A = {x ∈R : 0 ≤ x < 5}
1.1.4 Các phép toán trên biến cố
Cho A và B là hai biến cố của không gian mẫu Ω. a) Phép giao
Giao của hai biến cố A và B, kí hiệu A ∩ B (hoặc AB), là biến cố xảy ra khi và chỉ khi đồng thời hai biến cố A và B cùng xảy ra.
Giao của nbiến cố A i , i = 1, n, kí hiệu A 1 ∩ A 2 ∩ ∩ A n (hoặc A 1 A 2 A n ,∩ n i=1 A i ), là biến cố xảy ra nếu đồng thời các biến cố A i cùng xảy ra.
Nếu hai biến cố A và B không thể đồng thời xảy ra (A ∩ B = ∅) thì ta nói A và
Hợp của hai biến cố A và B, kí hiệu A ∪ B, là biến cố xảy ra khi và chỉ khi có ít nhất một trong hai biến cố A, B xảy ra.
Hợp của n biến cố A i , i = 1, n, kí hiệu A 1 ∪ A 2 ∪ ∪ A n (hoặc ∪ n i=1 A i ), là biến cố xảy ra nếu ít nhất một trong các biến cố A i xảy ra. c) Biến cố đối
Biến cố A và biến cố đối của A, ký hiệu là Ω\A hoặc A c, là hai khái niệm quan trọng trong xác suất Khi biến cố A xảy ra, điều đó có nghĩa là biến cố đối A không xảy ra, và ngược lại Sự hiểu biết về mối quan hệ này giúp phân tích và dự đoán các sự kiện trong không gian xác suất.
Theo Luật De Morgan, việc khai triển biến cố đối của các biến cố ∩ n i=1 A i và ∪ n i=1 A i có thể được thực hiện thông qua các biến cố đối của A i, với n biến cố A i, i = 1, n.
Hình 1.1: Biểu đồ Ven minh họa biến cố giao, biến cố hợp, biến cố đối
Chọn ngẫu nhiên một chữ số từ tập hợp I = {0, 1, 2, , 9} Gọi A, B và C lần lượt là các biến cố chọn được chữ số chẵn, chữ số lẻ và chữ số nhỏ hơn 3.
VìA ∩ B = ∅ nên A và B là hai biến cố xung khắc.
Ví dụ 1.10 Gieo đồng thời hai con xúc xắc cân đối đồng chất.
Biến cố “tổng số chấm xuất hiện trên hai mặt của hai xúc xắc bằng 7”:
Biến cố “số chấm xuất hiện trên hai mặt của hai xúc xắc hơn kém nhau 3 đơn vị”:
Ví dụ 1.11 Xét phép thử đo tuổi thọ (đơn vị: giờ) của một thiết bị điện tử.
Ta có không gian mẫu là:
Hai xạ thủ cùng nhắm vào một mục tiêu, với A là biến cố xạ thủ 1 bắn trúng và B là biến cố xạ thủ 2 bắn trúng Từ các biến cố A và B, ta có thể xây dựng các biểu diễn cho những tình huống liên quan.
- Xạ thủ 1 không bắn trúng mục tiêu: A.
- Cả hai xạ thủ bắn trúng mục tiêu: AB.
- Có ít nhất một xạ thủ bắn trúng mục tiêu: A ∪ B.
- Có đúng một xạ thủ bắn trúng mục tiêu: AB ∪ AB.
- Không có xạ thủ nào bắn trúng mục tiêu: A B.
Xác suất của biến cố
Cho Ω là một tập hợp khác rỗng Một lớp F các tập con của Ω được gọi là σ-đại số nếu thỏa mãn 3 điều kiện:
Nhắc lại σ-đại số Borel trên R là σ-đại số bé nhất chứa tất cả các tập mở của tập số thực R được kí hiệu là B(R )
1.2.2 Độ đo xác suất Định nghĩa 1.3 Cho F là một σ-đại số trên tập Ω Hàm tập hợp P : F →R được gọi là độ đo xác suất nếu thỏa mãn 3 điều kiện:
P (A n ). Định nghĩa 1.4 Bộ ba (Ω, F , P ), trong đó:
(1) Ω là một tập khác rỗng
(2) F là một σ-đại số trên tập Ω
(3) P là một độ đo xác suất trên F được gọi là không gian xác suất Mỗi phần tử A ∈ F được gọi là biến cố và giá trị
P (A) được gọi là xác suất của biến cố A.
Mỗi biến cố A được xem như một tập con của không gian mẫu, bao gồm tất cả các kết quả thuận lợi cho sự kiện đó xảy ra Tập con này là một phần tử của F và được đo lường theo độ đo xác suất P, do đó giá trị P(A) được xác định và gọi là xác suất của biến cố A.
Từ định nghĩa trên ta có một số tính chất cơ bản của xác suất như sau.
Chứng minh Từ điều kiện (3) của Định nghĩa 1.3 lấy A 1 = Ω, A n = ∅ với mọi n ≥ 2 ta được:
Chứng minh Vì Ω = A ∪ A và A ∩ A = ∅ nên
Chứng minh Vì A ⊂ B nên B = A ∪ (AB) Do đó:
□ Tính chất 1.4 Với A và B là hai biến cố bất kì,
Chứng minh Áp dụng điều kiện (3) của Định nghĩa 1.3 ta có các đẳng thức sau:
Cộng vế với vế ba đẳng thức (1.1), (1.2) và (1.3) ta được điều phải chứng minh □
Từ Tính chất 1.4 ta có tính chất tổng quát sau.
Tính chất 1.5 Cho A 1 , A 2 , , A n ∈ F Khi đó ta có
Ví dụ 1.13 Cho hai biến cốAvàB, biếtP (A) = 0, 4, P (B) = 0, 7,P (AB) = 0, 3. Tính P (A ∪ B), P (A ∪ B ), P (A ∪ B).
Mặt khác, B = AB ∪ AB nênP (B) = P (AB) + P (AB) hayP (AB) = P (B) − P (AB).
Trong một đội bóng bàn với hai vận động viên A và B, xác suất A vượt qua vòng bảng là 0,7 và xác suất B vượt qua là 0,5 Tuy nhiên, do ảnh hưởng tâm lý, xác suất cả hai vận động viên cùng vượt qua vòng bảng chỉ là 0,4 Để tính xác suất cả hai đều không vượt qua vòng bảng, ta cần sử dụng các xác suất đã cho để tìm ra kết quả.
Giải Gọi A, B là các biến cố vận động viên A, B vượt qua vòng bảng Ta có:
Xác suất cả hai vận động viên đều không vượt qua vòng bảng:
Ví dụ 1.15 Cho hai biến cố Avà B, biếtP (A) = 1/2, P (B) = 2/3 Chứng minh rằng 1/6 ≤ P (AB) ≤ 1/2.
Giải Ta có: P (A ∪ B ) = P (A) + P (B) − P (AB) Suy ra:
Các định nghĩa xác suất khác
Giả sử không gian mẫu Ω là một tập vô hạn đếm được có dạng:
Ω = {ω 1 , ω 2 , ω 3 , }. Đặt p i = P ({ω i }), i ≥ 1 Khi đó: P+∞ i=1 p i = 1 Với biến cố A bất kì, xác suất của biến cố A được xác định:
Ví dụ 1.16 Một người chơi một trò chơi với xác suất 1/2 k sẽ thắng đượck − 2 đô la, k ∈N = {1, 2, 3, } Tính xác suất người này thắng ít nhất 3 đô la.
Trong ví dụ này, trò chơi được xem như một phép thử, và kết quả của phép thử là số tiền mà người chơi thu được Do đó, không gian mẫu được xác định dựa trên các kết quả tài chính từ trò chơi.
Lúc đó, ta có thể xem:
Gọi A là biến cố người này thắng ít nhất 3 đô la Ta có: A = {3, 4, 5, 6, } Từ đó, ta được:
Xét trường hợp đặc biệt khi không gian mẫu Ω hữu hạn với các kết quả đồng khả năng Giả sử:
N Với mọi biến cố A, ta có:
Xác suất theo quan điểm cổ điển được định nghĩa trong bối cảnh của một phép thử ngẫu nhiên với không gian mẫu Ω hữu hạn và các kết quả đồng khả năng Cụ thể, nếu |A| là số phần tử của tập A, thì xác suất của biến cố A được xác định dựa trên số lượng các kết quả khả dĩ liên quan đến phép thử.
|Ω| , trong đó |A| là số phần tử của tập A.
Ví dụ 1.17 Gieo ngẫu nhiên 2 con xúc xắc cân đối Tính xác suất tổng số chấm xuất hiện bằng 8.
Giải Gọi A là biến cố tổng số chấm xuất hiện bằng 8 Ta có:
Xác suất của biến cố A:
Ví dụ 1.18 Một lớp có 20 sinh viên, trong đó có 10 sinh viên biết tiếng Anh,
Trong một nhóm gồm 12 sinh viên biết tiếng Pháp và 7 sinh viên biết cả tiếng Anh lẫn tiếng Pháp, khi chọn ngẫu nhiên một sinh viên, xác suất để sinh viên đó biết ít nhất một ngoại ngữ (tiếng Anh hoặc tiếng Pháp) được tính bằng cách xác định tổng số sinh viên biết ít nhất một trong hai ngôn ngữ Tổng số sinh viên trong nhóm là 12 + 7 = 19 Do đó, xác suất sinh viên biết ít nhất một ngoại ngữ là 19/19, tức là 100%.
Giải Gọi A là biến cố chọn được sinh viên biết tiếng Anh, B là biến cố chọn được sinh viên biết tiếng Pháp Xác suất cần tìm:
Trong phép thử G, khi tiến hành n phép thử và ghi nhận m lần xuất hiện của biến cố A, tỉ số f n = m/n được gọi là tần suất xuất hiện của A Khi số phép thử n tăng lên vô hạn, tần suất f n sẽ hội tụ đến giá trị p, mà giá trị này được xem là xác suất của biến cố A.
Trong thực tế, khi n lớn, ta có thể xem: p = P (A) ≈ f n
Trong định nghĩa trên, chúng ta công nhận sự hội tụ của tỷ số f_n Khái niệm hội tụ hầu chắc chắn cùng với cơ sở toán học cho sự hội tụ này sẽ được thảo luận chi tiết trong chương 4.
Trong một nghiên cứu về mối liên hệ giữa triệu chứng A và bệnh X, các nhà nghiên cứu đã khảo sát hồ sơ của 2000 bệnh nhân có triệu chứng A và phát hiện có 1460 trường hợp mắc bệnh X Từ đó, tỷ lệ mắc bệnh X trong nhóm này được tính toán là 73% (f = 1460/2000) Kết quả này cho thấy rằng xác suất một người có triệu chứng A sẽ mắc bệnh X là 73%.
1.3.3 Quan điểm hình học Định nghĩa 1.6 Giả sử không gian mẫu Ωlà một miền đo được (trên đường thẳng, trong mặt phẳng, không gian ba chiều, ) và S là một miền con đo được của Ω Ta lấy ngẫu nhiên một điểm trong miền Ω và đặt A là biến cố M ∈ S Khi đó, xác suất của biến cố A được xác định như sau:
P (A) = m(S) m(Ω) , trong đó m(S), m(Ω) là số đo của miền S và Ω Cụ thể,
- Nếu Ω là đường cong hay đoạn thẳng thỡ m(ã) là hàm chỉ độ dài.
- Nếu Ω là hỡnh phẳng hay mặt cong thỡ m(ã) là hàm chỉ diện tớch.
- Nếu Ω là hỡnh khối 3 chiều thỡ m(ã) là hàm chỉ thể tớch.
Khi lấy ngẫu nhiên một điểm M trong hình vuông có độ dài cạnh 2m, ta cần tính xác suất điểm này rơi vào hình tròn nội tiếp của hình vuông Hình tròn nội tiếp có bán kính bằng 1m, do đó, xác suất để điểm M nằm trong hình tròn này có thể được xác định bằng tỷ lệ diện tích của hình tròn so với diện tích của hình vuông.
- Diện tích của hình vuông:m(Ω) = 4(m 2 )
Theo quan điểm hình học, xác suất của biến cố A cần tìm:
Từ ví dụ trên, ta có công thức π = 4P(A) Khi thực hiện một phép thử lớn với m lần điểm M rơi vào hình tròn, ta có thể ước lượng P(A) ≈ m/n và π ≈ 4m/n Điều này cho thấy rằng các phép mô phỏng ngẫu nhiên có thể được sử dụng để tính xấp xỉ giá trị của π.
Xác suất có điều kiện
Trong một lớp học môn Triết học có 17 sinh viên nam và 13 sinh viên nữ, có 12 sinh viên nam và 11 sinh viên nữ đã thi đậu.
- Chọn ngẫu nhiên một sinh viên, xác suất sinh viên đó thi qua môn Triết học là 23/30.
- Nếu chọn ngẫu nhiên một sinh viên nam thì xác suất sinh viên đó thi qua môn Triết học sẽ là 12/17.
Xác suất P(A|B) thể hiện khả năng sinh viên thi qua môn Triết học (A) khi biết rằng sinh viên được chọn là nam (B) Hai xác suất này không bằng nhau, và P(A|B)/17 là xác suất của biến cố A dưới điều kiện B.
P (B) Định nghĩa 1.7 Cho không gian xác suất (Ω, F , P) và hai biến cố A, B ∈ F với P (B) ̸= 0 Xác suất của A với điều kiện B đã xảy ra, kí hiệu P (A|B), xác định bởi
Nhận xột 1.4 Hàm P (ã|B) : F → [0, 1] xỏc định như định nghĩa ở trờn là một độ đo xác suất trong không gian(Ω, F ).
Trong một khu vực dân cư, 60% người dân hút thuốc và 35% trong số đó mắc viêm phổi Khi chọn ngẫu nhiên một người hút thuốc từ khu vực này, xác suất người đó bị viêm phổi là một vấn đề cần được tính toán.
Giải Gọi A là biến cố người được chọn hút thuốc, B là biến cố người được chọn bị viêm phổi Xác suất để người này bị viêm phổi là:
Một sinh viên có thời gian làm bài thi là 2 giờ và xác suất hoàn thành bài thi trong thời gian ít hơn x giờ là x/4 Sau 1,5 giờ, sinh viên vẫn đang làm bài thi, do đó cần tính xác suất sinh viên sẽ sử dụng toàn bộ 2 giờ để hoàn thành bài thi.
Giải Kí hiệu A x là biến cố sinh viên đó hoàn thành bài thi ít hơn x (giờ) với
0 ≤ x ≤ 2, B là biến cố sinh viên đó sử dụng toàn bộ 2 (giờ) để làm bài thi Xác suất cần tính là
□ Các tính chất sau dễ dàng suy ra từ định nghĩa.
3) Nếu (A i ; 1 ≤ i ≤ n) là các biến cố đôi một xung khắc thì:
Công thức nhân xác suất
Định lí 1.1 Cho A 1 , A 2 , , A n là các biến có của không gian mẫu Ω thỏa mãn
Trong một hộp có 4 chiếc bút mới và 6 chiếc bút cũ, mỗi ngày người dùng sẽ lấy ngẫu nhiên một chiếc bút để sử dụng và sau đó trả lại vào hộp Để tính xác suất cho các trường hợp cụ thể, ta xem xét hai tình huống: Thứ nhất, xác suất sau 3 ngày sử dụng hộp còn đúng 1 bút mới Thứ hai, xác suất sau 2 ngày sử dụng hộp còn đúng 3 bút mới.
Giải Kí hiệu A k là biến cố ngày thứ k lấy được bút mới. a) P (A 1 A 2 A 3 ) = P (A 1 )P (A 2 |A 1 )P (A 3 |A 1 A 2 ) = 4
10 = 0, 24. b) Biến cố sau 2 ngày sử dụng hộp còn đúng 3 bút mới là A 1 A 2 ∪ A 1 A 2 , nên:
Trong một trường đại học, có 40% sinh viên theo học tiếng Anh và 30% học tiếng Pháp Trong số sinh viên học tiếng Anh, 55% cũng học tiếng Pháp Nếu chọn ngẫu nhiên một sinh viên và biết rằng sinh viên đó học tiếng Pháp, ta cần tính xác suất để sinh viên này cũng học tiếng Anh.
Giải Gọi A là biến cố chọn được sinh viên biết tiếng Anh, B là biến cố chọn được sinh viên biết tiếng Pháp.
Các biến cố độc lập
Hai biến cốA và B độc lập nếu việc xảy ra hay không xảy ra biến cố này không làm thay đổi xác suất xảy ra của biến cố kia.
P (A|B) = P (A) hoặc P (B|A) = P (B). Điều này tương đương với:
Từ đó ta định nghĩa hai biến cố độc lập như sau. Định nghĩa 1.8 Hai biến cố A và B được gọi là độc lập nếu
Trong trường hợp tổng quát, một tập hợp hữu hạn các biến cố {A1, A2, , An} (với n ≥ 2) được coi là độc lập nếu với mọi k (2 ≤ k ≤ n), các biến cố bất kỳ A_n1, A_n2, , A_nk (với 1 ≤ n1 < n2 < < nk ≤ n) đều thỏa mãn điều kiện độc lập.
Một tập con các biến cố của một tập hữu hạn các biến cố độc lập cũng sẽ độc lập Đối với trường hợp n = 3, ba biến cố A, B, C được coi là độc lập khi và chỉ khi chúng thỏa mãn bốn đẳng thức nhất định.
P (ABC) = P (A)P (B)P (C). Định lí 1.2 Nếu A và B độc lập thì A và B, A và B, A và B là những cặp biến cố độc lập.
Chứng minh Giả sửA và B là hai biến cố độc lập, ta chứng minh A và B độc lập. Việc chứng minhA và B, A và B độc lập hoàn toàn tương tự.
Theo định nghĩa hai biến cố độc lập, ta có:
Vì vậy A và B độc lập □
Nhận xét 1.5 Từ Định lí 1.2, ta có: Nếu A 1 , A 2 , , A n là các biến cố độc lập thì các biến cốB 1 , B 2 , , B n , trong đó B i là A i hoặc A i , cũng độc lập.
Hộp I chứa 3 bi đỏ và 7 bi xanh, trong khi hộp II có 6 bi đỏ và 4 bi xanh Khi lấy ngẫu nhiên một viên bi từ mỗi hộp, xác suất để lấy được hai viên bi cùng màu đỏ là một trong những tình huống cần tính toán Ngoài ra, xác suất để lấy được một bi xanh và một bi đỏ cũng là một trường hợp thú vị khác trong bài toán xác suất này.
Trong bài toán xác suất, ta định nghĩa biến cố A là việc lấy viên bi màu đỏ từ hộp I, và biến cố B là việc lấy viên bi màu đỏ từ hộp II Hai biến cố A và B được coi là độc lập với nhau Do đó, xác suất của cả hai biến cố xảy ra đồng thời được tính bằng tích của xác suất của từng biến cố: P(AB) = P(A) * P(B) = 3.
Trong ví dụ 1.26, một nồi hơi được trang bị 3 van bảo hiểm hoạt động độc lập, với xác suất hỏng của van 1, van 2 và van 3 lần lượt là 0,1; 0,2; và 0,3 trong khoảng thời gian T Để nồi hơi hoạt động an toàn, ít nhất một trong các van phải không hỏng Do đó, cần tính xác suất để nồi hơi duy trì hoạt động an toàn trong khoảng thời gian T.
Giải Gọi A i là biến cố van i bị hỏng trong khoảng thời gian T, i = 1, 2, 3 Ta có A 1 , A 2 , A 3 độc lập và
Xác suất để nồi hơi hoạt động an toàn trong khoảng thời gian T:
Biến cố độc lập được định nghĩa yếu hơn so với khái niệm độc lập trong Định nghĩa 1.9 Một tập hợp hữu hạn các biến cố {A1; A2; , An} (với n ≥ 2) được coi là đôi một độc lập nếu với mọi i khác j, điều kiện độc lập được thỏa mãn.
Nhận xét 1.6 Các biến cố A 1 , A 2 , , A n độc lập thì chúng độc lập đôi một. Tuy nhiên, điều ngược lại nói chung là không đúng.
Ví dụ 1.27 Cho tập hợp 4 điểm trong không gian
Chọn ngẫu nhiên một điểm trong tập này Gọi A i là biến cố tọa độ thứ i của điểm được chọn bằng 1, i = 1, 3 Lúc đó:
Do đó, P (A i A j ) = P (A i )P (A j ), i ̸= j, i, j = 1, 3 nên các biến cố A i độc lập đôi một, nhưng chúng không độc lập vì
Công thức xác suất toàn phần và công thức Bayes
1.7.1 Hệ đầy đủ Định nghĩa 1.11 Một hệ gồm n biến cố E 1 , E 2 , , E n được gọi là hệ đầy đủ nếu thỏa mãn hai điều kiện:
(i) E i ∩ E j = ∅ nếu i ̸= j (các biến cố đôi một xung khắc);
(ii) E 1 ∪ E 2 ∪ ∪ E n = Ω (chắc chắn có 1 biến cố xảy ra).
Nhận xét 1.7 Từ định nghĩa hệ đầy đủ ta suy ra: Nếu E 1 , E 2 , , E n là hệ đầy đủ thì:
Tuy nhiên, điều ngược lại nói chung là không đúng.
Ví dụ 1.28 Cho A và B là hai biến cố bất kỳ Khi đó, các hệ {∅, Ω}, {A, A}, {AB, AB, AB, A B} là các hệ đầy đủ.
Ví dụ 1.29 Trong hộp có 3 bi đỏ và 2 bi trắng Lấy ngẫu nhiên 3 viên bi Gọi
H i là biến cố lấy được i bi trắng, i = 0, 2 Khi đó hệ {H 0 , H 1 , H 2 } là đầy đủ.
1.7.2 Công thức xác suất toàn phần và công thức Bayes Định lí 1.3 Giả sử {E i ; 1 ≤ i ≤ n} là một hệ đầy đủ sao cho P (E i ) > 0, A là biến cố bất kì Khi đó:
P (A) = P (E 1 )P (A|E 1 ) + P (E 2 )P (A|E 2 ) + + P (E n )P (A|E n ) (1.4) Nếu thêm điều kiện P (A) > 0 thì
P (E 1 )P (A|E 1 ) + + P (E n )P (A|E n ) (1.5) Công thức (1.4) được gọi là công thức xác suất toàn phần (hay công thức xác suất đầy đủ) Công thức (1.5) được gọi là công thức Bayes.
Chứng minh Để chứng minh (1.4) ta có
Do AE 1 , AE 2 , , AE n đôi một xung khắc nên
Từ tính chất xác suất có điều kiện và (1.4) ra có ngay (1.5) □
Trong bài toán này, hộp I chứa 4 bi xanh, 3 bi đỏ và 2 bi vàng, trong khi hộp II có 5 bi xanh, 2 bi đỏ và 3 bi vàng Sau khi lấy ngẫu nhiên một viên bi từ hộp I và cho vào hộp II, chúng ta tiến hành lấy ngẫu nhiên hai viên bi từ hộp II Mục tiêu là tính xác suất để hai viên bi được lấy ra ở lần thứ hai là 2 bi xanh.
Giải Gọi E là biến cố viên bi lấy từ hộp I bỏ vào hộp II là bi xanh, A là biến cố 2 viên bi lấy lần 2 là 2 viên bi xanh.
Trong một nhà máy có ba phân xưởng sản xuất, phân xưởng I chiếm 50% sản phẩm, phân xưởng II chiếm 30%, và phân xưởng III chiếm 20% Tỷ lệ phế phẩm của phân xưởng I là 2%, phân xưởng II là 1%, và phân xưởng III là 3% Để tìm xác suất sản phẩm ngẫu nhiên được lấy ra là phế phẩm, ta cần tính tổng xác suất phế phẩm từ từng phân xưởng Ngoài ra, nếu sản phẩm được lấy ra là chính phẩm, ta cũng cần tính xác suất sản phẩm đó được sản xuất từ phân xưởng I.
Giải Gọi E 1 , E 2 , E 3 lần lượt là các biến cố sản phẩm lấy ra là của phân xưởng
I, II và III Khi đó: {E 1 , E 2 , E 3 } là hệ đầy đủ. a) Gọi A là biến cố sản phẩm lấy ra là phế phẩm Theo công thức xác suất toàn phần:
Nhận xét 1.8 Công thức xác suất toàn phần và công thức Bayes có ý nghĩa như sau:
- Công thức xác suất toàn phần giúp ta tính xác suất xảy ra của một biến cố dựa vào một hệ đầy đủ các giả thiết chi phối nó.
Các xác suất P(E1), , P(En) được xác định trước khi tiến hành phép thử được gọi là xác suất tiên nghiệm Ngược lại, các xác suất P(E1|A), , P(En|A) được xác định sau khi phép thử đã diễn ra và biến cố A đã xảy ra, được gọi là xác suất hậu nghiệm Công thức Bayes, vì vậy, còn được biết đến như công thức tính xác suất hậu nghiệm, cho phép đánh giá lại xác suất xảy ra của các giả thuyết sau khi biết kết quả của phép thử là biến cố A đã xảy ra.
Một công ty sản xuất một loại sản phẩm bằng hai máy, trong đó máy I có tỉ lệ phế phẩm 3% và máy II là 2% Sản lượng của máy I chiếm 2/3 tổng sản phẩm, trong khi máy II chiếm 1/3 Để tính tỉ lệ phế phẩm chung của công ty, cần xem xét tỉ lệ phế phẩm từ từng máy và trọng số sản lượng của chúng.
Giải Chọn ngẫu nhiên 1 sản phẩm GọiE là biến cố chọn được sản phẩm của nhà máy I, A là biến cố chọn được phế phẩm.
Vậy tỉ lệ phế phẩm của công ty là 2,7% □
Trong một nhóm gồm 3 người nhưng chỉ có 2 vé xem bóng đá, họ quyết định chia vé bằng cách sử dụng 3 phiếu: 2 phiếu ghi số 1 và 1 phiếu ghi số 0 Mỗi người sẽ lần lượt rút phiếu ngẫu nhiên mà không hoàn lại Để tính xác suất người rút phiếu thứ 2 nhận được vé, ta phân tích các trường hợp có thể xảy ra Đồng thời, cũng cần xem xét tính công bằng của phương pháp phân chia này.
Giải Gọi A i là biến cố người rút thứ i được vé, i = 1, 2, 3. a) Ta có {A 1 , A ¯ 1 } là nhóm đầy đủ Do đó:
= 2/3 1/2 + 1/3 2/2 = 2/3. b) Ta có P (A 1 ) = P (A 2 ) = 2/3, cần tính P (A 3 ) Mặt khác,
Vậy, việc làm trên là công bằng □
Công thức Bernoulli
Định nghĩa 1.12 Dãy n phép thử được gọi là dãy n phép thử Bernoulli nếu thỏa mãn các điều kiện sau:
- Các phép thử độc lập
- Trong mỗi phép thử chỉ xảy ra một trong hai biến cố, kí hiệu A (thành công) và A ¯ (thất bại).
- Xác suất xuất hiện biến cố A là p = P (A) không đổi trong các phép thử. Định lí 1.4 Xét dãy n phép thử Bernoulli với xác suất xảy ra biến cố A là
P (A) = p ∈ (0; 1) Khi đó, xác suất có đúng k lần xảy ra biến cố A là: p n (k) = C n k p k (1 − p) n−k
Chứng minh Khi thực hiện phép thử n lần độc lập, có đúng k lần xảy ra biến cố
Xác suất xảy ra đúng k lần biến cố A trong n lần thử nghiệm được tính bằng công thức p n (k) = C n k [P (A)] k [P (A)] n−k Trong đó, C n k là số cách chọn k lần xảy ra biến cố A từ n lần thử, P (A) là xác suất xảy ra biến cố A, và (1 - P) là xác suất không xảy ra biến cố A Do đó, xác suất này được biểu diễn dưới dạng C n k p k (1 − p) n−k.
Trong ví dụ 1.34, tín hiệu thông tin được phát đi 3 lần độc lập với xác suất nhận thông tin thành công mỗi lần là 0.4 a) Để tính xác suất nhận được thông tin đúng 2 lần, ta áp dụng công thức xác suất nhị thức b) Xác suất để nguồn thu nhận được thông tin ít nhất 1 lần cũng được tính theo công thức tương tự c) Để đạt được xác suất nhận tin ≥ 0.99, cần xác định số lần phát đi tối thiểu, điều này có thể thực hiện bằng cách sử dụng các phép toán xác suất phù hợp.
Mô hình dãy phép thử Bernoulli với n = 3 và p = 0,4 cho thấy xác suất để nguồn thu nhận được thông tin đúng 2 lần là 0,288 Ngoài ra, xác suất để nguồn thu nhận được ít nhất 1 thông tin đúng là 0,784 Nếu gọi n là số tín hiệu cần phát đi, theo giả thiết, ta có điều kiện p n (k ≥ 1) ≥ 0,99 tương đương với 1 − p n (0) ≥ 0,99.
Trong năm học vừa qua, tại trường đại học, tỉ lệ sinh viên thi trượt môn Toán là 34% và môn Lý là 20% Đáng chú ý, trong số sinh viên trượt môn Toán, có đến 50% cũng trượt môn Lý Để đảm bảo với xác suất không nhỏ hơn 99% có ít nhất một sinh viên đậu cả hai môn, cần xác định số lượng sinh viên cần chọn từ trường này.
Giải Gọi T, L là các biến cố sinh thi trượt môn Toán, Lý tương ứng Ta có:
Xác suất thi đậu cả 2 môn:
Gọin là số sinh viên cần khảo sát Ta có mô hình Bernoulli với n phép thử và xác suất p = 0, 63 Theo giả thiết: p n (k ≥ 1) = 1 − p n (0) ≥ 0, 99 ⇔ (1 − 0, 63) n ≤ 0, 01 ⇔ n ≥ 4, 63 ⇒ n = 5.
□ Định lí 1.5 Cho n ∈Z, n ≥ 1 và p ∈ (0; 1) Hàm số p n (k) = C n k p k (1 − p) n−1 với k ∈ {0, 1, 2 , n} đạt giá trị lớn nhất tại k =
Xạ thủ có xác suất bắn trúng mục tiêu là 0,6 và thực hiện 20 phát bắn độc lập Để xác định số lần bắn trúng mục tiêu có xác suất lớn nhất, ta cần tính toán xác suất của từng khả năng bắn trúng.
Giải (n + 1)p = 21.0, 6 = 12, 6 ̸∈ Z nên số lần bắn trúng mục tiêu có xác suất lớn nhất là k = 12 □
▷ 1.1 Cho A n , n ≥ 1 là dãy các biến cố Chứng minh a) S∞ i=1 A i =T∞ i=1 A i b) T∞ i=1 A i =S∞ i=1 A i
▷ 1.2 Chứng minh nếu A, B ∈ F thì A \ B ∈ F, trong đó
▷ 1.3 Chứng minh nếu A, B ∈ F và A ⊂ B thì
▷ 1.5 Chứng minh nếu A, B ∈ F và A ⊂ B thì P (A) ≤ P (B).
▷ 1.7 Cho {A n , n ≥ 1} ⊂ F thỏa mãn :A 1 ⊂ A 2 ⊂ ⊂ A n ⊂ Chứng minh
▷ 1.8 Cho {A n , n ≥ 1} ⊂ F thỏa mãn :A 1 ⊃ A 2 ⊃ ⊃ A n ⊃ Chứng minh
▷1.9 ChoA, B, C là 3 biến cố thỏaP (A) ≥ 0, 9; P (B) ≥ 0, 8và P (ABC ) = 0 Chứng minh rằngP (C) ≤ 0, 3.
▷ 1.10 Cho 3 biến cố A, B, C trong đó P (C) > 0, P (AC) > 0 Chứng minh:
▷ 1.11 Cho A ∈ F sao cho P (A) ̸= 0 Xác định một hàm tập P A như sau: với mỗi
B ∈ F, P A (B ) = P (B|A) Chứng minh P A cũng là một độ đo xác suất trên F.
▷ 1.12 Chứng minh rằng nếu A và B độc lập thì A và B c , A c và B, A c và B c cũng là những cặp biến cố độc lập.
▷ 1.13 Cho A, B là hai biến cố độc lập và A ⊂ B Chứng minh rằngP (A) = 0 hoặc
▷ 1.14 Chứng minh {A\B, AB, AB, AB} và {A, AB, AB} là các hệ đầy đủ.
▷ 1.15 Chứng minh công thức xác suất toàn phần và công thức Bayes.
▷ 1.16 Cho biến cố A và nhóm biến cố {E 1 , E 2 , , E n } xung khắc đôi một thoả điều kiệnA ⊂ E 1 ∪ E 2 ∪ ∪ E n , P (E i ) > 0 ∀i Lúc đó, ta cũng có:
▷ 1.17 Gieo đồng thời 2 con xúc xắc Tính xác suất: a) Tổng số chấm xuất hiện trên 2 con là 7. b) Số chấm xuất hiện trên 2 con hơn kém nhau 2.
▷ 1.18 Một nhà khách có 6 phòng đơn Có 10 khách đến thuê phòng, trong đó có
6 nam và 4 nữ Người quản lí chọn 6 người Tính xác suất: a) Cả 6 người đều là nam. b) Có 4 nam và 2 nữ. c) Có ít nhất 2 nữ. d) Có ít nhất 1 nữ.
▷ 1.19 Một hộp đựng 6 quả cầu trắng, 4 quả cầu đỏ và 2 quả cầu đen Chọn ngẫu nhiên 6 quả cầu Tìm xác suất để chọn được 3 quả trắng, 2 đỏ và 1 đen.
Trong bài toán xác suất này, chúng ta có 30 tấm thẻ được đánh số từ 1 đến 30 Đầu tiên, để tính xác suất tất cả 10 tấm thẻ được chọn đều mang số chẵn, ta cần xác định số lượng tấm thẻ chẵn trong tổng số và áp dụng công thức xác suất Tiếp theo, để tìm xác suất có đúng 5 tấm thẻ mang số chia hết cho 3, ta cũng cần xác định số lượng tấm thẻ chia hết cho 3 và sử dụng các phương pháp tính xác suất tương ứng.
Trong một quốc gia có 50 tỉnh, mỗi tỉnh đại diện bởi 2 đại biểu Quốc hội, có tổng cộng 100 đại biểu Khi chọn ngẫu nhiên 50 đại biểu để thành lập một ủy ban, ta cần tính xác suất cho hai trường hợp: Thứ nhất, xác suất có ít nhất 1 đại biểu từ thủ đô trong ủy ban Thứ hai, xác suất mỗi tỉnh đều có đúng 1 đại biểu trong ủy ban.
Để giải bài toán, trước tiên, chúng ta có 9 tấm phiếu mang các chữ số từ 1 đến 9 a) Tính xác suất để xếp thành một số chẵn, ta cần xác định số lượng cách sắp xếp các chữ số sao cho chữ số cuối cùng là 2, 4, 6 hoặc 8 b) Đối với trường hợp chọn ngẫu nhiên 4 tấm phiếu và xếp thành hàng, xác suất để có một số chẵn cũng sẽ phụ thuộc vào việc chữ số cuối cùng trong dãy số là một trong các chữ số chẵn.
▷ 1.23 Bộ bài có 52 lá, trong đó có 4 lá Át Lấy ngẫu nhiên 3 lá Tính xác suất: a) Có 1 lá Át. b) Có 2 lá Át. c) Có ít nhất 1 lá Át.
▷ 1.24 Một bình có 10 bi, trong đó có 3 bi đỏ, 4 bi xanh, 3 bi đen Lấy ngẫu nhiên
4 viên Tính xác suất: a) Có đúng 2 bi xanh. b) Có 1 bi xanh, 1 bi đỏ và 2 bi đen.
Trong bài toán xác suất này, có 15 sản phẩm, bao gồm 3 phế phẩm, được phân chia ngẫu nhiên vào 3 hộp I, II, III, mỗi hộp chứa 5 sản phẩm Để tính xác suất cho các trường hợp cụ thể: a) xác suất hộp I chỉ có 1 phế phẩm; b) xác suất tất cả các hộp đều có ít nhất một phế phẩm; và c) xác suất tất cả các phế phẩm đều nằm trong hộp III.
Một cửa hàng đồ điện nhập một lô bóng đèn, mỗi hộp chứa 12 chiếc Chủ cửa hàng kiểm tra chất lượng bằng cách lấy ngẫu nhiên 3 bóng để thử nghiệm Nếu cả 3 bóng đều tốt, hộp bóng điện đó sẽ được chấp nhận Để tính xác suất một hộp bóng điện được chấp nhận khi trong hộp có 4 bóng bị hỏng, cần phân tích xác suất chọn 3 bóng tốt từ 8 bóng tốt còn lại.
Trong đề cương ôn tập môn học, có tổng cộng 10 câu hỏi lý thuyết và 30 bài tập Mỗi đề thi sẽ bao gồm 1 câu hỏi lý thuyết và 3 bài tập được chọn ngẫu nhiên từ đề cương Học sinh A đã học 4 câu lý thuyết và 12 bài tập trong đề cương.
Khi học sinh A chọn ngẫu nhiên một đề thi từ các đề thi được tạo ra từ đề cương, ta cần tính xác suất cho các trường hợp sau: a) Xác suất học sinh A không trả lời được câu lý thuyết; b) Xác suất học sinh A chỉ trả lời được 2 câu bài tập; c) Xác suất học sinh A đạt yêu cầu, trong đó để đạt yêu cầu, học sinh cần trả lời đúng câu hỏi lý thuyết và ít nhất 2 câu bài tập.
Khi chọn ngẫu nhiên một vé xổ số có 5 chữ số từ 0 đến 9, ta có thể tính xác suất cho các trường hợp sau: a) Xác suất vé không có chữ số 1 là 0.9^5, tương đương với 59.049% b) Xác suất vé không có chữ số 2 cũng là 0.9^5, tức là 59.049% c) Xác suất vé không có chữ số 1 hoặc không có chữ số 2 được tính bằng công thức 1 - P(có chữ số 1 và có chữ số 2), cho kết quả khoảng 79.2%.
▷ 1.29 Xếp ngẫu nhiên 5 người A, B, C, D và E vào một cái bàn dài có 5 chỗ ngồi, tính xác suất: a) A và B đầu bàn. b) A và B cạnh nhau.
Một máy bay có ba bộ phận A, B, C với tầm quan trọng khác nhau: A chiếm 15%, B chiếm 30% và C chiếm 55% diện tích máy bay Máy bay sẽ rơi nếu bị trúng 1 viên đạn vào bộ phận A, 2 viên đạn vào B hoặc 3 viên đạn vào C Khi bắn 3 phát vào máy bay, xác suất máy bay rơi sẽ được tính toán dựa trên các trường hợp: a) máy bay bị trúng 2 viên đạn và b) máy bay bị trúng 3 viên đạn.
Một công ty sử dụng quảng cáo trên đài phát thanh và tivi, trong đó 25% khách hàng biết thông tin qua tivi, 34% qua đài phát thanh, và 10% biết qua cả hai hình thức Để tìm xác suất khách hàng biết thông tin quảng cáo của công ty, ta cần tính tổng xác suất của những khách hàng nhận biết qua ít nhất một trong hai hình thức quảng cáo.
BIẾN NGẪU NHIÊN
Biến ngẫu nhiên
Trước hết ta xét ví dụ sau:
Khi thực hiện phép thử ngẫu nhiên bằng cách tung đồng thời hai con xúc xắc, ta định nghĩa biến ngẫu nhiên X là tổng số chấm trên mặt xuất hiện của hai con xúc xắc Không gian mẫu cho phép thử này bao gồm tất cả các kết quả có thể từ việc tung hai con xúc xắc.
Ω = {(m; n) : m = 1, 6; n = 1, 6} X là một ánh xạ từ không gian mẫu vào tập số thực R, được định nghĩa bởi X((m, n)) = m + n X không chỉ đơn thuần là một ánh xạ, mà còn có tính chất là mỗi lần tung xúc xắc, giá trị của X trở thành một số ngẫu nhiên, phụ thuộc vào kết quả của phép thử Do đó, X được gọi là biến ngẫu nhiên.
Ta có định nghĩa tổng quát sau: Định nghĩa 2.1 Cho không gian xác suất (Ω, F , P ) Ánh xạ X : Ω →R được gọi là biến ngẫu nhiên nếu với mọi A ∈ B(R ) :
X −1 (A) = {ω ∈ Ω : X(ω) ∈ A} ∈ F Tập tất cả các giá trị của X được gọi là miền giá trị của X và kí hiệu là X(Ω).
Khi tung một đồng xu cho đến khi xuất hiện mặt sấp, ký hiệu số lần tung là X Hai mặt của đồng xu được ký hiệu là S (mặt sấp) và N (mặt ngửa) Không gian mẫu được xác định là Ω = {S, N, S, N, N, S, }, và σ-đại số F là tập hợp tất cả các tập con của không gian mẫu Ω.
Xét ánh xạ X : Ω →R xác định như sau:
Với mọi A ∈ B(R ) , X −1 (A) là một tập con của Ω nên X −1 (A) ∈ F Vậy, X là biến ngẫu nhiên.
Ví dụ 2.3 Chọn ngẫu nhiên một sinh viên của trường đại học A, gọi X là chiều cao của sinh viên đó.
Ta có không gian mẫu Ω = {toàn bộ sinh viên của đại học A}, σ-đại số F là tập tất cả các tập con của Ω.
Khi đó với mỗi sv ∈ Ω, X(sv) = chiều cao của sv Tương tự Ví dụ 2.2 ta có X là biến ngẫu nhiên.
Nhận xét 2.1 Để cho gọn trong trình bày, với A ⊂R, ta kí hiệu:
Hai loại biến ngẫu nhiên
2.2.1 Biến ngẫu nhiên rời rạc Định nghĩa 2.2 Nếu biến ngẫu nhiên X có miền giá trị có số lượng hữu hạn hoặc vô hạn đếm được thì X được gọi là biến ngẫu nhiên rời rạc.
Giả sử biến ngẫu nhiên rời rạc X có miền giá trị X(Ω) = {x 1 , x 2 , }, hàm số p(x) xác định bởi: p(x) =
Hàm xác suất (probability mass function) của biến ngẫu nhiên X được định nghĩa khi x không thuộc tập hợp X(Ω) Trong trường hợp X(Ω) là hữu hạn, ta có thể trình bày các giá trị của p(x) dưới dạng bảng, với các giá trị x như x1, x2, , xn và xác suất tương ứng P(X = x1), P(X = x2), , P(X = xn).
P P (X = x 1 ) P (X = x 2 ) P (X = x n ) Bảng trên được gọi là bảng phân phối xác suất của biến ngẫu nhiên X.
Trong ví dụ 2.4, có một hộp chứa 3 viên bi xanh và 4 viên bi đỏ, với kích thước và khối lượng của các viên bi hoàn toàn giống nhau Khi lấy ngẫu nhiên 3 viên bi từ hộp, biến ngẫu nhiên X được định nghĩa là số viên bi xanh trong số 3 viên bi được lấy ra Để phân tích, cần lập bảng phân phối xác suất cho X và tính xác suất P(X ≤ 1).
Giải. a) Ta có X là biến ngẫu nhiên rời rạc nhận các giá trị 0, 1, 2 và 3.
Vì vậy, bảng phân phối xác suất của biến ngẫu nhiên X là: x 0 1 2 3 p(x) 4
1 35 b) Hai biến cố (X = 0) và (X = 1) xung khắc nên:
Trong ví dụ 2.5, chúng ta tung một con xúc xắc cho đến khi xuất hiện mặt một chấm và gọi biến ngẫu nhiên X là số lần tung Để tìm hàm xác suất của biến ngẫu nhiên X, ta cần xác định xác suất cho mỗi giá trị có thể của X Tiếp theo, chúng ta sẽ tính xác suất P(2 ≤ X ≤ 5), tức là xác suất số lần tung nằm trong khoảng từ 2 đến 5.
Giải. a) Miền giá trị của X là X(Ω) = {1, 2, } =N ∗
Hàm xác suất của X là p(k) = 1
□ Tính chất 2.1 Cho biến ngẫu nhiên X có miền giá trị X(Ω) và hàm xác suất là p(x) Khi đó:
Ví dụ 2.6 Trong một tháng, số học sinh vắng học X của một lớp có phân phối như sau:
Tìm C và tính xác suất trong một tháng có ít nhất 2 học sinh nghỉ học.
49 Lúc đó, xác suất trong một tháng có ít nhất 2 học sinh nghỉ học:
□ 2.2.2 Biến ngẫu nhiên liên tục Định nghĩa 2.3 Cho biến ngẫu nhiênX : Ω →R Nếu tồn tại hàm sốy = f(x) thỏa mãn f (x) ≥ 0 ∀x sao cho với mọi a ≤ b ta có:
Z b a f (x)dx thì X được gọi là biến ngẫu nhiên liên tục Hàm số f(x) được gọi là hàm mật độ xác suất của X.
Từ định nghĩa ta có ngay các tính chất sau.
Tính chất 2.2 Cho biến ngẫu nhiên liên tục X có hàm mật độ xác suất f(x). Khi đó:
Ví dụ 2.7 Tuổi thọ (năm) của một loại thiết bị điện là biến ngẫu nhiên liên tục X có hàm mật độ xác suất: f (x) =
Khi chọn ngẫu nhiên một thiết bị điện, xác suất để thiết bị đó có tuổi thọ thấp hơn 1 năm và xác suất để thiết bị đó có tuổi thọ cao hơn 2 năm là hai yếu tố quan trọng cần xem xét Việc tính toán các xác suất này giúp hiểu rõ hơn về độ bền và hiệu suất của thiết bị, từ đó đưa ra quyết định mua sắm hợp lý hơn.
Ví dụ 2.8 Cho biến ngẫu nhiên liên tục X có hàm mật độ xác suất: f (x) =
0, nếu x ̸∈ [0; 3]. a) Tìm hằng số k. b) Tính xác suất P (|X| ≤ 1).
Hàm phân phối xác suất
Định nghĩa 2.4 Cho biến ngẫu nhiên X, hàm số:
F X (x) = P (X < x), x ∈R được gọi là hàm phân phối xác suất củaX.
1 Nếu X là biến ngẫu nhiên rời rạc với miền giá trị {x 1 , x 2 , , x n , } và hàm xác suất p(x) thì:
2 Nếu X là biến ngẫu nhiên liên tục với hàm mật độ xác suất f (x) thì:
Ví dụ 2.9 Cho biến ngẫu nhiên X có bảng phân phối xác suất: x 0 1 2 p(x) 0, 1 0, 6 0, 3 Tìm hàm phân phối xác suất F (x) của biến ngẫu nhiên X.
Giải Hàm phân phối xác suất của biến ngẫu nhiên X là:
Ví dụ 2.10 Cho biến ngẫu nhiên liên tục X có hàm mật độ xác suất: f (x) =
Tìm hàm phân phối xác suất F (x) của biến ngẫu nhiên X.
Giải Hàm phân phối xác suất của biến ngẫu nhiên X là:
□ Tính chất 2.3 Hàm phân phối xác suất F (x) của biến ngẫu nhiên X có một số tính chất sau:
3) Liên tục trái trên R, tức là: lim x→x − 0
5) Nếu X là biến ngẫu nhiên liên tục có hàm mật độ xác suất f (x) thì:
Nhận xét 2.2 Cho biến ngẫu nhiên X có hàm phân phối xác suất F (x) Khi đó, ta có: a) P (X ≥ a) = 1 − F (a). b) P (a ≤ X < b) = F (b) − F (a). c) Nếu hàm phân phối của X được định nghĩa bởi biểu thức:
F X (x) = P (X ≤ x), ∀x ∈R , thì hàm này là một hàm liên tục phải tại mọix ∈R Các tính chất 1, 2 và 4 ở trên vẫn đúng.
Ví dụ 2.11 Cho biến ngẫu nhiên X có hàm phân phối
F (x) = a + b arctan x, x ∈R a) Tìm a và b. b) Tìm x ∈R sao cho: P (X ≥ 1 − x) = 1/4.
Ví dụ 2.12 Cho biến ngẫu nhiên X có hàm phân phối xác suất:
1, x ≥ 2. a) Tìm a và b. b) Tìm hàm phân phối của Y = 2X + 1.
Giải a) Vì F (x) liên tục trái nên
Ví dụ 2.13 Cho biến ngẫu nhiên liên tục X có hàm phân phối xác suất:
Giải Vì F (x) liên tục trái tại x = 2 nên: lim x→2 − F (x) = F (2) ⇔ 1 − a/8 = 0 ⇔ a = 8.
Hàm mật độ xác suất: f(x) = F ′ (x) =
Kì vọng
Định nghĩa 2.5 Cho biến ngẫu nhiên X xác định trên không gian xác suất
(Ω, F , P ) có hàm phân phối xác suất F X (x) Khi đó, nếu
(trong đó tích phân vế phải là tích phân Lebesgue - Stieltjes) thì giá trị
R xdF X (x) được gọi là kỳ vọng của biến ngẫu nhiên X, kí hiệu là E(X), tức là:
1) Nếu X = C là hằng số thì E(C) = C.
2) Nếu a, b ∈R và X, Y là hai biến ngẫu nhiên cùng xác định trên không gian xác suất (Ω, F, P ) thì:
E(aX + b) = aE(X) + b và E(X ± Y ) = E(X) ± E(Y ). Định lí 2.1.
1) Nếu biến ngẫu nhiên rời rạc X có hàm xác suất p(x) thì:
2) Nếu biến ngẫu nhiên liên tục X có hàm mật độ xác suất f(x) thì:
Để tính kỳ vọng của biến ngẫu nhiên X, chúng ta xem xét hai trường hợp: Thứ nhất, khi X có phân phối rời rạc với bảng phân phối xác suất, trong đó các giá trị x là 1, 2, 3 với xác suất tương ứng p(x) là 0,2, 0,7 và 0,1 Thứ hai, khi X có phân phối liên tục với hàm mật độ f(x) =
Giải. a) Ta có: E(X) =P i p i x i = 0, 2 1 + 0, 7 2 + 0, 1 3 = 1, 9. b) Theo định nghĩa
□ Định lí 2.2 Cho X là biến ngẫu nhiên và g(x) là hàm Borel trên R sao cho
1) Nếu biến ngẫu nhiên rời rạc X có hàm xác suất p(x) thì:
2) Nếu biến ngẫu nhiên liên tục X có hàm mật độ xác suất f(x) thì:
Kì vọng của biến ngẫu nhiên là giá trị trung bình mà biến đó sẽ đạt được khi thực hiện nhiều phép thử Khi số lần thử nghiệm tăng lên, giá trị trung bình của các kết quả thu được sẽ gần giống với kì vọng của biến ngẫu nhiên.
Trong trường hợp biến ngẫu nhiên rời rạc X nhận các giá trị x_i (i = 1, k), chúng ta thực hiện n phép thử với n_1 lần X nhận giá trị x_1, n_2 lần X nhận giá trị x_2, , và n_k lần X nhận giá trị x_k, sao cho tổng số lần thử là n (Pk i=1 n_i = n) Giá trị trung bình của biến ngẫu nhiên X trong n phép thử này được tính bằng công thức: ¯x = (x_1 n_1 + x_2 n_2 + + x_k n_k) / n.
Ta chú ý rằng n 1 n , n 2 n , , n k n chính là tần suất xuất hiện giá trix 1 , x 2 , , x k trong n phép thử trên Do đó: ¯ x = x 1 f 1 + x 2 f 2 + + x n f n
Theo định nghĩa thống kê về xác suất, khi n tiến tới vô cùng, các tần suất sẽ hội tụ về các xác suất tương ứng, cho phép ta viết ¯ x ≈ x 1 p 1 + x 2 p 2 + + x n p n = E(X) với n đủ lớn Trong trò chơi may rủi, nếu số tiền đặt cược trong mỗi ván không đổi, trò chơi được coi là công bằng đối với người chơi khi kỳ vọng số tiền nhận được trong mỗi lần chơi bằng, lớn hơn hoặc nhỏ hơn số tiền đặt cược.
Trong một hộp chứa 7 bút xanh và 3 bút đỏ, một sinh viên ngẫu nhiên rút 2 bút để mua Giá của bút xanh là 2000 đồng và bút đỏ là 3000 đồng Mục tiêu là tính số tiền trung bình mà sinh viên này phải trả khi mua 2 bút.
Giải Gọi X (ngàn đồng) là số tiền sinh viên này phải trả Ta có X nhận các giá trị: 4, 5 và 6 Thực hiện tính các xác suất:
Bảng phân phối xác suất của X: x 4 5 6 p(x) 7/15 7/15 1/15
Số tiền trung bình phải trả:
Ví dụ 2.16 Một người tham gia trò chơi may rủi với tiền cược mỗi ván là
Người chơi bắt đầu với 10.000 đồng và tung 2 đồng xu Nếu có i mặt sấp (i = 1, 2), họ sẽ thu về (i + 1) 5000 đồng Ngược lại, nếu không đạt được mặt sấp, họ sẽ mất tiền Câu hỏi đặt ra là liệu người này có nên thường xuyên tham gia trò chơi này hay không.
Giải Gọi X (ngàn đồng) là số tiền người này nhận được trong 1 lần chơi Ta có X nhận các giá trị: 0, 10 và 15 Bảng phân phối của X: x 0 10 15 p(x) 1/4 1/2 1/4
Do đó: E(X) =P p i x i = 8, 75 (ngàn đồng) Vì số tiền này nhỏ hơn số tiền đặt cược nên nếu người này chơi càng nhiều thì thua càng lớn.
Vậy, người này không nên chơi trò này thường xuyên □
Phương sai và độ lệch chuẩn
Biến ngẫu nhiên X xác định trên không gian xác suất (Ω, F, P) có phương sai V(X) (còn gọi là Var(X) hoặc D(X)) nếu tồn tại kỳ vọng E((X − E(X))²) Phương sai này đo lường sự phân tán của biến ngẫu nhiên X quanh giá trị kỳ vọng của nó.
V (X) được gọi là độ lệch chuẩn của X. Tính chất 2.5.
1) V (X) ≥ 0, V (X) = 0 khi và chỉ khi P (X = C) = 1 (C - hằng số).
3) V (aX + b) = a 2 V (X) với mọi a, b ∈R. Định lí 2.3.
1) Nếu biến ngẫu nhiên rời rạc X có hàm xác suất p(x) thì:
2) Nếu biến ngẫu nhiên liên tục X có hàm mật độ xác suất f(x) thì:
Phương sai và độ lệch chuẩn là hai chỉ số quan trọng để đo lường mức độ phân tán của các giá trị của biến ngẫu nhiên quanh giá trị kỳ vọng Khi phương sai lớn, điều này cho thấy các giá trị của biến ngẫu nhiên phân tán rộng rãi, trong khi phương sai nhỏ cho thấy các giá trị này tập trung gần giá trị kỳ vọng hơn.
Ví dụ 2.17 Cho biến ngẫu nhiên rời rạc X có bảng phân phối xác suất:
Trung vị
Định nghĩa 2.7 Số thực m được gọi là trung vị của biến ngẫu nhiên X nếu:
Ví dụ 2.18 Tìm trung vị của biến ngẫu nhiênX có bảng phân phối xác suất: x 0 1 2 3 p(x) 0, 1 0, 3 0,4 0, 2
Giải Vì P (X < 2) = 0, 4 < 0, 5 và P (X > 2) = 0, 2 < 0, 5 nên med(X) = 2 □
Ví dụ 2.19 Tìm trung vị của biến ngẫu nhiênX có bảng phân phối xác suất: x 0 1 2 3 p(x) 0, 1 0, 4 0,3 0, 2
Ta có med(X) = m ∈ [1; 2] vì P (X < m) ≤ 0, 5 và P (X > m) ≤ 0, 5 với mọi m ∈ [1; 2] □ Định lí 2.4 Nếu biến ngẫu nhiên X có hàm phân phối xác suất F (x) liên tục trên R thì trung vị là nghiệm phương trình F (x) = 0, 5.
Chứng minh Thật vậy, P (X < m) ≤ 0, 5 tương đương với
Do X là biến ngẫu nhiên có hàm phân phối xác suất liên tục nên bất đẳng thức trên tương đương với:
Kết hợp (2.1) và (2.2) ta được F (m) = 0, 5 □
Ví dụ 2.20 Tìm trung vị của biến ngẫu nhiên X có hàm mật độ xác suất f (x) =
Giải Hàm phân phối xác suất của biến ngẫu nhiên X là:
Biến ngẫu nhiên độc lập
Định nghĩa 2.8 Các biến ngẫu nhiên X 1 , X 2 , , X n (n ≥ 2) được gọi là độc lập nếu với mọi x 1 , x 2 , , x n ∈R ta có:
Dãy biến ngẫu nhiên (X_n; n ≥ 1) được coi là độc lập khi mọi dãy con hữu hạn của nó là các biến ngẫu nhiên độc lập Theo Định lý 2.5, nếu hai biến ngẫu nhiên X và Y là độc lập, thì chúng không ảnh hưởng lẫn nhau trong các phép toán xác suất.
2) V (X ± Y ) = V (X) + V (Y ). Định nghĩa 2.9 Dãy biến ngẫu nhiên (X n ; n ≥ 1) được gọi làđôi một độc lập nếu với mọi i ̸= j ta có:
Một số phân phối xác suất quan trọng
2.8.1 Phân phối Bernoulli Định nghĩa 2.10 Biến ngẫu nhiên rời rạcXđược gọi là cóphân phối Bernoulli với tham số p (0 < p < 1) nếu X có miền giá trị X(Ω) = {0, 1} và hàm xác suất: p(k) = P (X = k) =
Tính chất 2.6 Nếu X ∼ Ber(p) thì E(X) = p và V (X) = p(1 − p).
2.8.2 Phân phối nhị thức Định nghĩa 2.11 Biến ngẫu nhiên rời rạcX được gọi là cóphân phối nhị thức với tham số n và p (n ∈N ∗ và 0 < p < 1) nếu X có miền giá trị X(Ω) = {0, 1, , n} và hàm xác suất: p(k) =
Hình 2.1: Đồ thị hàm xác suất của B(10;0,4) Tính chất 2.7.
1) Nếu X ∼ B(n, p) thì E(X) = np và V (X) = np(1 − p).
2) Nếu X 1 , X 2 , , X n là n biến ngẫu nhiên độc lập, cùng phân phối xác suất với
Biến ngẫu nhiên T = X₁ + X₂ + + Xn, với X ∼ Ber(p), có phân phối nhị thức B(n, p) Nhận xét rằng B(1, p) chính là phân phối Bernoulli Ber(p) Khi xem xét phép thử Bernoulli với xác suất thành công là p, ta có thể gọi X là kết quả của phép thử này.
Hình 2.2: Đồ thị hàm xác suất của B(20;0,6) là biến ngẫu nhiên chỉ số lần thành công trong dãyn phép thử này thìX ∼ B(n, p).
Tỉ lệ phế phẩm của nhà máy là 12%, với mỗi hộp chứa 20 sản phẩm Trung bình, mỗi hộp sẽ có khoảng 2,4 phế phẩm, và độ lệch chuẩn số phế phẩm trong mỗi hộp được tính toán là 1,55 Khi một khách hàng mua ngẫu nhiên một hộp sản phẩm, xác suất để hộp đó có chứa phế phẩm là 0,88 Cuối cùng, số phế phẩm trong hộp có xác suất lớn nhất là 2.
Giải Ta có mô hình Bernoulli với n = 20 và p = 0, 12 Gọi X là số phế phẩm trong mỗi hộp Khi đó, X ∼ B(n = 20; p = 0, 12). a) E(X) = np = 2, 4; SD(X) =p np(1 − p) ≈ 1, 45. b) P (X ≥ 1) = 1 − P (X = 0) = 1 − 0, 88 20 c) (n + 1)p = 2, 52 ̸∈ Z nên P (X = k) = C 20 k 0, 12 k 0, 88 20−k đạt giá trị lớn nhất tại k = 2 □
Một sinh viên tham gia thi vấn đáp và trả lời 5 câu hỏi độc lập, với khả năng trả lời đúng mỗi câu hỏi là 60% Nếu sinh viên trả lời đúng, họ sẽ nhận được điểm số tương ứng.
Để giải bài toán, trước tiên xác định xác suất để sinh viên trả lời đúng 3 câu, với mỗi câu đúng được cộng 4 điểm và mỗi câu sai bị trừ 2 điểm Tiếp theo, tính số điểm trung bình mà sinh viên đạt được Cuối cùng, xem xét một sinh viên khác có khả năng trả lời đúng mỗi câu như nhau và mong muốn đạt điểm trung bình không dưới 14, từ đó tìm ra khả năng tối thiểu mà sinh viên này cần có để trả lời đúng mỗi câu.
Mô hình Bernoulli với n = 5 và p = 0,6 được sử dụng để xác định số câu trả lời đúng của sinh viên, ký hiệu là X, với phân phối X ∼ B(n = 5; p = 0,6) Tính xác suất P(X = 3) bằng công thức P(X = 3) = p^5(3) = C(5, 3) * 0,6^3 * 0,4^2 Ngoài ra, số điểm Y mà sinh viên đạt được được tính theo công thức Y = 4X - 2(5 - X) = 6X - 10.
Số điểm trung bình sinh viên này đạt được:
E(Y) = 6E(X) - 10, với E(X) = np, cho thấy mối quan hệ giữa điểm số và xác suất trả lời đúng của sinh viên Cụ thể, khi p là xác suất trả lời đúng mỗi câu, Z là số câu trả lời đúng và T là số điểm đạt được, chúng ta có thể tính toán điểm số đạt được là 8 điểm.
Sinh viên này dự đoán khả năng trả lời đúng tối thiểu mỗi câu là 80% Biến ngẫu nhiên rời rạc X được gọi là có phân phối Poisson với tham số λ (λ > 0) nếu X có miền giá trị N = {0, 1, 2, } và hàm xác suất được xác định bởi công thức p(k) =
2) Nếu X 1 , X 2 , , X n là n biến ngẫu nhiên độc lập, cùng phân phối với X ∼
Biến ngẫu nhiên T = X1 + X2 + + Xn có phân phối Poisson P(nλ), trong đó λ là tỉ lệ xảy ra của các sự kiện Phân phối Poisson thường được sử dụng để mô tả số lượng các sự kiện xảy ra trong một khoảng thời gian nhất định, như số cuộc gọi đến tổng đài hoặc số khách hàng đến rút tiền tại ngân hàng, với tham số tỉ lệ tương ứng với độ dài của khoảng thời gian đó.
Hiện tượng này có thể được giải thích qua số biến cố xuất hiện trong khoảng thời gian [0, t], ký hiệu là N(t) Để hiểu rõ hơn, cần giả định ba giả thiết sau đây được thỏa mãn.
(i) Xác suất có đúng 1 biến cố xuất hiện trong khoảng thời gian có độ dài h bằng λh + o(h) với λ > 0 - hằng số.
(ii) Xác suất có ít nhất 2 biến cố xuất hiện trong khoảng thời gian có độ dài h bằng o(h 2 ).
(iii) Số biến cố xuất hiện trong các khoảng thời gian không giao nhau là các biến ngẫu nhiên độc lập nhau.
Khi đó, người ta chứng minh được rằng:
P (N (t) = k) = (λt) k e −λt k! , k ≥ 0. Điều này có nghĩa N (t) ∼ P oi(λt) Tham số λ chính là số biến cố trung bình xuất hiện trong một đơn vị thời gian.
Trong một gara cho thuê xe ôtô, có 2 ôtô loại A và số đơn đặt hàng vào ngày cuối tuần tuân theo phân phối Poisson với trung bình 2 đơn/ngày Tính xác suất trong ngày cuối tuần: a) có một ôtô loại A được thuê; b) có 2 ôtô loại A được thuê; c) gara không đáp ứng nhu cầu thuê ôtô loại này.
Giải Gọi X là số đơn đặt hàng thuê ô tô ngày cuối tuần của gara Ta có
Tại một tổng đài bưu điện, số cuộc gọi đến được mô tả bởi phân phối Poisson, với trung bình 2 cuộc gọi mỗi phút Để tính xác suất có đúng 5 cuộc gọi trong 1 phút, ta áp dụng công thức xác suất của phân phối Poisson.
Giải Gọi X là số cuộc điện thoại gọi đến trong khoảng thời gian 1 phút, theo giả thiết, X có phân phối Poisson Vì E(X) = 2 nênλ = 2 Do đó:
□ Định lí 2.6 (Luật biến cố hiếm) Cho {X n ; n ≥ 1} là dãy biến ngẫu nhiên có phân phối nhị thức X n ∼ B (n; p n ) Nếu tồn tại giới hạn lim n→∞ np n = λ thì: n→∞ lim P (X n = k) = e −λ λ k k! , k = 0, 1, 2,
(np n ) k k! = λ k k! Đặt λ n = np n Khi đó: n→∞ lim (1 − p n ) n = lim n→∞
Nếu X ∼ B(n; p) với n lớn và p nhỏ, thì X xấp xỉ phân phối Poisson với λ = np, tức là e −λ Các thừa số khác có giới hạn bằng 1, từ đó chứng minh được điều cần thiết.
Ví dụ 2.25 Tỉ lệ phế phẩm của một nhà máy là 0,006 Lấy ngẫu nhiên 1.000 sản phẩm của nhà máy, tính xác suất có đúng 9 phế phẩm.
Giải GọiX là số phế phẩm trong 1.000 sản phẩm, khi đó X ∼ B(1.000; 0, 006).
Vìn = 1.000 khá lớn và p = 0, 006 khá bé nên ta có thể xem X có phân phối xấp xỉ phân phối Poisson với λ = np = 6:
Một xưởng in sách nhận thấy rằng trung bình một cuốn sách 500 trang chứa 300 lỗi, tức là mỗi trang có khoảng 0,6 lỗi Để tính xác suất có đúng 2 lỗi trong một trang, ta áp dụng phân phối Poisson với λ = 0,6 Xác suất này được tính bằng công thức P(X=k) = (e^(-λ) * λ^k) / k!, với k = 2 Đối với xác suất có ít nhất 2 lỗi, ta tính P(X≥2) = 1 - P(X 0, ta có hàm phân phối:
Do đó, hàm mật độ của Z: f Z (z) = F Z ′ (z) =
□ 3.2.3 Hàm phân phối xác suất đồng thời Định nghĩa 3.4 Cho 2 biến ngẫu nhiên X và Y Hàm số
F X,Y (x, y) = P (X < x, Y < y), x, y ∈R được gọi là hàm phân phối xác suất đồng thời của vectơ ngẫu nhiên (X, Y ).
1 Nếu vectơ ngẫu nhiên (X; Y ) có hàm xác suất đồng thời p(x; y) thì:
2 Nếu vectơ ngẫu nhiên (X; Y ) có hàm mật độ xác suất đồng thời f (x, y) thì:
Ví dụ 3.4 Tìm hàm phân phối xác suất đồng thời ở Ví dụ 3.3.
Giải Với x ≥ 0 và y ≥ 0 ta có:
Từ định nghĩa về sự độc lập của hai biến ngẫu nhiên X và Y ta có: Định lí 3.3 Hai biến ngẫu nhiên X và Y độc lập khi và chỉ khi:
F X,Y (x, y) = F X (x).F Y (y), ∀x, y ∈R Định lí 3.4 Hai biến ngẫu nhiên X và Y độc lập khi và chỉ khi: f(x, y) = f X (x).f Y (y), ∀x, y ∈R Trong đó f (x, y), f X (x), f Y (y) lần lượt là hàm mật độ xác suất (hoặc hàm xác
Kì vọng có điều kiện
Ví dụ 3.5 Cho vectơ ngẫu nhiên (X, Y ) có hàm mật độ đồng thời f (x, y) =
0, ngược lại. a) Tính P (X > 1, Y < 1) và P (X < Y ). b) Chứng minh X, Y là 2 biến ngẫu nhiên độc lập.
2e −x−2y dxdy = 1/3. b) Các hàm mật độ biên: f X (x) =
3.3 Phân bố xác suất có điều kiện và kì vọng có điều kiện
Cho (X, Y ) có bảng phân bố xác suất đồng thời:
Y y 1 y j y n x 1 p 11 p 1j p 1n x 2 p 21 p 2j p 2n x m p m1 p mj p mn Khi đó ta có:
Từ đó ta có hàm xác suất có điều kiện của X với điều kiện Y = y j như sau: p y j (x) =
Kì vọng của X với điều kiện Y = y j :
3.3.2 Trường hợp liên tục Định nghĩa 3.5 Cho X và Y là hai biến ngẫu nhiên liên tục và y ∈ R Nếu tồn tại hàm số f y (x) ≥ 0, ∀x sao cho với mọi a < b ta có:
Hàm mật độ xác suất có điều kiện f y (x) của biến ngẫu nhiên X với điều kiện Y = y được ký hiệu là f(x|y).
Định lý 3.5 trình bày về hàm mật độ xác suất đồng thời f(x, y) của hai biến ngẫu nhiên (X, Y) Nó cho biết rằng f(x|y) là hàm mật độ xác suất có điều kiện của X khi Y = y, trong khi f(y|x) là hàm mật độ xác suất có điều kiện của Y khi X = x.
2) f (y|x) = f (x, y) f X (x) nếu f X (x) ̸= 0. Chứng minh 1) Với a < b ta có:
Áp dụng quy tắc l’Hôpital ta được:
Theo tính chất của tích phân: d dt
Chứng minh tương tự cho trường hợp (2) □
Ví dụ 3.6 Cho vectơ ngẫu nhiên (X, Y ) có hàm mật độ xác suất đồng thời: f(x, y) =
0 nếu trái lại. a) Cho x > 0, tìm f (y|x). b) Cho y > 0, tìm f(x|y).
Hiệp phương sai, hệ số tương quan
Định nghĩa 3.6 Cho vectơ ngẫu nhiên (X, Y ) Hiệp phương sai của X và Y là một số xác định bởi công thức:
Hai biến ngẫu nhiênX vàY được gọi là tương quan với nhau nếuCov(X, Y ) ̸= 0 và không tương quan nếu Cov(X, Y ) = 0. Định lí 3.6.
2) Cov(aX + a ′ , bY + b ′ ) = ab Cov(X, Y ), trong đó a, a ′ , b, b là các hằng số.
4) Nếu X và Y độc lập thì Cov(X, Y ) = 0.
2) Nếu X, Y độc lập thì chúng không tương quan, tuy nhiên điều ngược lại nói chung không đúng. Định lí 3.7 Cho vectơ ngẫu nhiên Z = (X, Y ).
Trong trường hợp (X, Y) là vectơ ngẫu nhiên liên tục, hàm mật độ xác suất được biểu diễn bởi f(x, y) và tích phân kép ∫∫ f(x, y) dx dy được sử dụng để tính xác suất Ngược lại, nếu (X, Y) là vectơ ngẫu nhiên rời rạc, hàm xác suất p(x, y) sẽ được áp dụng Định lý 3.8 nêu rõ các khái niệm này trong thống kê và xác suất.
1) Nếu X và Y là các biến ngẫu nhiên rời rạc có miền giá trị lần lượt là {x 1 , x 2 , , x m }, {y 1 , y 2 , , y n } thì:
2) Nếu (X, Y ) có hàm mật độ xác suất đồng thời f (x, y) thì:
Hệ số tương quan giữa hai biến ngẫu nhiên X và Y, ký hiệu ρ(X, Y), được xác định bằng công thức ρ(X, Y) = Cov(X, Y) / (√Var(X) * √Var(Y)) Theo định nghĩa, Cov(X, Y) được tính bằng E(XY) − E(X)E(Y) Áp dụng định lý 3.7, ta có thể dễ dàng rút ra các kết quả liên quan đến mối quan hệ giữa hai biến này.
2) Nếu X và Y độc lập thì ρ(X, Y ) = 0.
1) Đặt X ′ = X − EX, Y ′ = Y − EY Với mọi t ∈ R, ta có:
⇔ E(X − EX) 2 t 2 + 2tE (X − EX)(X − EY ) + E(Y − EY ) 2 ≥ 0
⇔ V (X)t 2 + 2t Cov(X, Y ) + V (Y ) ≥ 0. Đây là tam thức bậc hai theo t, do đó:
2) Nếu X, Y độc lập thì theo Định lí 3.6, ta có Cov(X, Y ) = 0, do đó:
V (X). Mặt khác, vì Cov(aX + b, X) = a Cov(X, X ) = aV (X) nên: ρ(aX + b, X ) = aV (X)
Hệ số tương quan ρ(X, Y) đo lường mức độ phụ thuộc tuyến tính giữa hai biến X và Y Khi giá trị |ρ(X, Y)| gần 1, mối quan hệ tuyến tính giữa X và Y trở nên mạnh mẽ Ngược lại, nếu |ρ(X, Y)| gần 0, mối liên hệ này rất yếu.
✓ Khi ρ(X, Y ) > 0, ta bảo X, Y có tương quan dương (thuận), tức là X, Y có xu hướng cùng tăng hoặc cùng giảm.
✓ Khi ρ(X, Y ) < 0, ta bảo X, Y có tương quan âm (nghịch), tức là X, Y có xu hướng tăng và giảm ngược chiều nhau.
Hình 3.1: Quan hệ tuyến tính giữa X và Y phụ thuộc vào ρ(X, Y )
Ví dụ 3.7 Vecto ngẫu nhiên (X, Y ) có phân phối được cho ở bảng sau:
P 0,4 0,6 Xác suất có điều kiện:
3 Phân phối có điều kiện:
Do đó: E(Y |X = 1) =P y i P (Y = y i |X = 1) = 5/3. Hiệp phương sai: Cov(X, Y ) = E(XY ) − E(X)E(Y ), trong đó:
▷ 3.1 Cho vectơ ngẫu nhiên (X, Y ) với hàm phân phối đồng thời F (x, y) Gọi
F X (x), F Y (y) là các hàm phân phối của X và Y Chứng minh: a) P (X ≥ a, Y ≥ b) = 1 − F X (a) − F Y (b) + F (a, b), ∀a, b ∈R. b) P (a 1 ≤ X < a 2 , b 1 ≤ Y < b 2 ) = F (a 1 , b 1 ) + F (a 2 , b 2 ) − F (a 1 , b 2 ) − F (a 2 , b 1 ), với mọi a 1 , a 2 , b 1 , b 2 ∈R , a 1 < a 2 , b 1 < b 2
Hai biến ngẫu nhiên liên tục X và Y được coi là độc lập khi và chỉ khi hàm mật độ đồng thời f XY (x, y) có thể được biểu diễn dưới dạng tích của hai hàm g(x) và h(y), tức là f XY (x, y) = g(x)h(y) cho mọi x, y thuộc R Trong đó, g và h là hai hàm số xác định trên tập hợp số thực R.
▷ 3.3 Số khách hàng mua máy ảnh kĩ thuật số hiệu Canon trong một tuần ở một cửa hàng là biến ngẫu nhiên X có bảng phân bố xác suất: x 0 1 2 3 4 p(x) 0, 1 0, 2 0, 3 0, 25 0, 15
Trong một cửa hàng bán máy ảnh kĩ thuật số Canon, 60% khách hàng chọn mua gói bảo hành mở rộng Gọi X là số khách hàng mua máy ảnh và Y là số khách hàng mua gói bảo hành Để tính xác suất P(X = 4, Y = 2), ta áp dụng công thức xác suất cho biến ngẫu nhiên Tiếp theo, để tính xác suất P(X = Y), ta cần xác định trường hợp khi số khách hàng mua máy ảnh và gói bảo hành bằng nhau Cuối cùng, lập bảng phân bố xác suất đồng thời của (X; Y) sẽ giúp phân tích mối quan hệ giữa số lượng khách hàng mua máy ảnh và gói bảo hành mở rộng.
▷ 3.4 Số trẻ em sinh ra trong 1 tuần ở làng A là 1 biến ngẫu nhiên X có bảng phân bố xác suất: x 0 1 2 3 p(x) 0, 4 0, 3 0, 2 0, 1
Số người chết trong 1 tuần ở làng đó là biến ngẫu nhiên Y có bảng phân bố xác suất: y 0 1 2 3 4 p(y) 0, 1 0, 3 0, 4 0, 15 0, 05
Giả sử X và Y độc lập. a) Tìm bảng phân bố xác suất của vectơ ngẫu nhiên (X, Y ). b) Tính P (X > Y ).
Cho biến ngẫu nhiên X có phân bố nhị thức B(n = 2; p = 0,4) và biến ngẫu nhiên Y có phân bố nhị thức B(n = X + 1; p = 0,4) Đầu tiên, cần lập bảng phân bố xác suất đồng thời của X và Y Tiếp theo, tính phương sai của tổng X + Y để có cái nhìn tổng quan về sự biến động của tổng hai biến ngẫu nhiên này.
▷ 3.6 Cho hai biến ngẫu nhiên rời rạc X và Y lần lượt có bảng phân phối xác suất: x 0 1 2 p(x) 0,15 0,47 0,38 y 0 1 2 p(y) 0,2 0,36 0,44
Cho biết hệ số tương quan ρ(X, Y ) = 0.64 Tính kì vọng và phương sai của biến ngẫu nhiên Z = 2X + 4Y.
▷ 3.7 Cho (X, Y ) có bảng phân bố xác suất đồng thời:
▷ 3.8 Cho (X, Y ) có bảng phân bố xác suất đồng thời:
4 0 1/3 0 a) Chứng minh X và Y không độc lập. b) Tính P (X = 4|Y = 2).
▷ 3.9 Cho (X, Y ) có bảng phân bố xác suất đồng thời:
2 0,06 0,14 0,3 a) Tính xác suất P (X + 2Y ≤ 3|X ≥ 1). b) Tính phương sai của biến ngẫu nhiên Z = 2X + Y.
▷ 3.10 Cho (X, Y ) có hàm mật độ xác suất đồng thời f (x, y) =
0 nếu trái lại. a) Tìm hằng số c. b) Tính xác suất P (0 ≤ X ≤ 1/2, 0 ≤ Y ≤ 1/2).
▷ 3.11 Cho (X, Y ) có hàm mật độ xác suất đồng thời: f (x, y ) =
0 nếu trái lại. a) Tìm hằng số c. b) Tìm các hàm mật độ xác suất của X và Y.
▷ 3.12 Cho (X, Y ) có hàm mật độ f (x, y) =
0 nếu trái lại. Tìm các hàm mật độ xác suất của X và Y.
▷ 3.13 Cho (X, Y ) có hàm mật độ xác suất đồng thời: f(x, y) = c
(1 + x 2 )(1 + y 2 ) a) Tìm hằng số c. b) Tìm hàm phân phối xác suất đồng thời của (X, Y ). c) Tìm xác suất (X, Y ) nhận giá trị trong miền hình chữ nhật có các đỉnh A(1; 1), B ( √
▷ 3.14 Cho (X, Y ) có hàm mật độ xác suất đồng thời: f(x, y) =
0 nếu trái lại. a) Với 0 ≤ x ≤ 1, tìm f (y|x). b) Tính xác suất P (X 2 + Y 2 ≤ 1).
▷ 3.15 Cho (X, Y ) có hàm mật độ xác suất đồng thời: f (x, y) =
0 nếu trái lại. a) Tìm hằng số c. b) Tìm ρ(X, Y ).
▷ 3.16 Cho (X, Y ) có hàm mật độ xác suất đồng thời: f(x, y) =
0 nếu trái lại. a) Với x > 0, tính E(Y |X = x). b) Với y > 0, tính E(X|Y = y).
▷ 3.17 Cho (X, Y ) có hàm mật độ xác suất đồng thời: f (x, y) =
0 nếu trái lại. a) Tìm hằng số c. b) Tìm hàm mật độ xác suất của X và của Y. c) Tính xác suất P (X ≥ 4Y |X ≥ 2Y ).
CÁC ĐỊNH LÍ GIỚI HẠN
Các khái niệm hội tụ
4.1.1 Hội tụ hầu chắc chắn Định nghĩa 4.1 Dãy biến ngẫu nhiên {X n ; n ≥ 1} được gọi làhội tụ hầu chắc chắn (hay còn được gọi là hội tụ theo xác suất 1) đến biến ngẫu nhiên X nếu
Khi đó ta viết X n − h.c.c −− → X khi n → ∞.
Mệnh đề 4.1 Các điều kiện sau đây là tương đương:
Chứng minh Hiển nhiên ta có (2) và (3) tương đương với nhau Do đó ta chỉ cần chứng minh (1) và (2) tương đương với nhau Đặt
4.1.2 Hội tụ theo xác suất Định nghĩa 4.2 Dãy biến ngẫu nhiên {X n ; n ≥ 1} được gọi là hội tụ theo xác suất đến biến ngẫu nhiên X nếu với mọi ε > 0, n→∞ lim P (ω : |X n (ω) − X(ω)| > ε) = 0.
Khi đó ta viết X n − → P X khi n → ∞.
Mệnh đề 4.2 Nếu X n −−−→ h.c.c X khi n → ∞ thì X n − → P X khi n → ∞.
Chứng minh Giả sử X n −−−→ h.c.c X khi n → ∞ Với ε > 0, từ Mệnh đề 4.1 suy ra n→∞ lim P (
4.1.3 Hội tụ theo phân phối Định nghĩa 4.3 Dãy biến ngẫu nhiên {X n ; n ≥ 1} hội tụ theo phân phối đến biến ngẫu nhiên X nếu F n (x) → F (x) khi n → ∞ tại các điểm liên tục của hàm
F (x), trong đó F n (x) là hàm phân phối xác suất của X n, F (x) là hàm phân phối củaX.
Khi đó kí hiệu X n − → d X khi n → ∞.
Ví dụ 4.1 Cho{X n ; n ≥ 1}là dãy biến ngẫu nhiên độc lập, có cùng phân phối xác suất với biến ngẫu nhiên X với hàm mật độ xác suất f (x) =
0 nếu x ≤ 1, trong đóα > 0 ĐặtY n = n −1/α max 1≤k≤n X k Chứng minhY n hội tụ theo phân phối đến biến ngẫu nhiên Y nào đó.
Giải Hàm phân phối xác suất của biến ngẫu nhiên Y n: F Y n (x) = 0 với x ≤ 0, với x > 0 ta có
Vậy biến ngẫu nhiênY n hội tụ theo phân phối đến biến ngẫu nhiên Y có hàm phân phối xác suất
□ Chúng ta thừa nhận mệnh đề sau mà không chứng minh.
Mệnh đề 4.3 (Xem Định lí 5.1.6 [2]) X n − → d X khi n → ∞ khi và chỉ khi với mọi hàm h liên tục bị chặn trên R ta đều có n→∞ lim E(h(X n )) = E(h(X)).
Chứng minh Giả sử X n − → P X Với ε > 0, ta có
Cho n → ∞ ta được lim sup n→∞
Bằng cách thay X n bởi X, X bởi X n , x bởi x − ε và x + ε bởi x ở chứng minh trên ta thu được lim inf n→∞ F X n (x) ≥ F (x − ε) (4.2)
Từ (4.1) và (4.1), cho ε → 0 ta được điều phải chứng minh □ Mệnh đề 4.5 Nếu X n − → d c với c là hằng số thì X n − P → c.
Chứng minh Giả sử X n − → d X = cvới clà hằng số Hàm phân phối xác suất của X:
Luật số lớn
Định lí 4.1 (Bất đẳng thức Chebyshev) Cho X là biến ngẫu nhiên Khi đó, với mọi ε > 0 ta có
P (|X − E(X)| > ε) ≤ V (X) ε 2 Chứng minh Với ε > 0 tùy ý, đặt A = (|X − E(X)| > ε) ta có
Định lý 4.2, hay còn gọi là Luật yếu số lớn, cho biết rằng với dãy các biến ngẫu nhiên độc lập {Xn, n ≥ 1} có phân phối xác suất, nếu biến ngẫu nhiên X có kỳ vọng E(X) = μ và phương sai V(X), thì xác suất P(A) sẽ bị giới hạn bởi P(A) ≤ V(X) / ε² Điều này có nghĩa là khi ε tăng lên, xác suất của A sẽ giảm xuống, khẳng định tính ổn định của kỳ vọng trong các biến ngẫu nhiên.
Chứng minh Đặt S n = X 1 + X 2 + + X n Do các biến ngẫu nhiên X k độc lập, cựng phõn phối xỏc suất nờn E(S n ) = nà và V (S n ) = nσ 2 Áp dụng bất đẳng thức Chebyshev, ta có
Hệ quả 4.1 Dãy {X n , n ≥ 1}các biến ngẫu nhiên độc lập, cùng phân phối xác suất với biến ngẫu nhiờn X cú kỡ vọng E(X) = à và phương sai V (X) = σ 2 hữu hạn thì
Luật số lớn khẳng định rằng nếu X1, X2, , Xn là các biến ngẫu nhiên độc lập với phân phối xác suất có kỳ vọng và phương sai hữu hạn, thì khi n đủ lớn, giá trị trung bình X sẽ tiệm cận với kỳ vọng E(X) Cụ thể, khi n tiến tới vô cùng, hiệu số giữa giá trị trung bình và kỳ vọng sẽ giảm dần, đồng thời phương sai của giá trị trung bình cũng sẽ xấp xỉ 1/n.
Một ứng dụng quan trọng của luật số lớn là ước lượng hàm phân phối xác suất Giả sử biến ngẫu nhiên X có hàm phân phối xác suất F(x) chưa được biết đến, ta ký hiệu là X1.
X 2 , , X n là các biến ngẫu nhiên độc lập, có cùng phân phối xác suất với biến ngẫu nhiên X Hàm phân phối xác suất thực nghiệm của X được định nghĩa
Thật vậy, do {I (X i < x); 1 ≤ i ≤ n} là dãy các biến ngẫu nhiên độc lập, có cùng phân phối xác suất với I(X < x) và
E(I(X < x)) = F (x), V (I(X < x)) = F (x)(1 − F (x)) hữu hạn. Áp dụng Định lí 4.2 ta được
I(X i < x) − → P F (x) khi n → ∞. Định lí sau còn được gọi là Luật mạnh số lớn Kolmogorov. Định lí 4.3 Nếu {X n ; n ≥ 1} là dãy biến ngẫu nhiên độc lập thỏa mãn điều kiện ∞
V (X n ) b 2 n < ∞, với {b n ; n ≥ 1} là dãy số dương tăng, b n → ∞ khi n → ∞ thì
Luật mạnh số lớn Marcinkiewicz-Zygmund phát biểu rằng, đối với 1 ≤ r < 2, nếu {X n ; n ≥ 1} là một dãy biến ngẫu nhiên độc lập có cùng phân phối xác suất và E(|X 1 | r ) < ∞, thì các điều kiện này đảm bảo tính chất hội tụ của dãy biến ngẫu nhiên.
Hệ quả 4.2 Nếu {X n ; n ≥ 1} là dãy biến ngẫu nhiên độc lập, có cùng phân phối xỏc suất với kỡ vọng chung à = E(X n ) hữu hạn thỡ
Định lí giới hạn trung tâm
Định nghĩa 4.4 Cho biến ngẫu nhiên X có hàm phân phối xác suất F X (x). Khi đó hàm số ϕ X (t) := E(e itX ) =
R e itx dF X (x), t ∈R được gọi là hàm đặc trưng của X.
Từ công thức Euler e ix = cos(x) + i sin(x) ta có ϕ(t) =
Hàm đặc trưng của một số phân phối xác suất thường gặp
Phân phối Kí hiệu Hàm đặc trưng Bernoulli Ber(p) 1 − p + pe it Nhị thức B(n; p) (1 − p + pe it ) n Poisson Poi(λ) e λ(e it −1)
Tính chất 4.1 Giả sử biến ngẫu nhiên X có hàm phân phối xác suất F X (x) và hàm đặc trưng ϕ X (t) Khi đó:
(i) Nếu X có hàm mật độ xác suất f (x) thì ϕ X (t) =R
R e itx f(x)dx. (ii) ϕ aX+b = e ibt ϕ X (at) với a và b là các hằng số.
(iii) Nếu X và Y là hai biến ngẫu nhiên độc lập thì ϕ X +Y (t) = ϕ X (t)ϕ Y (t).
Chứng minh Tính chất (i) là hiển nhiên Bây giờ ta chứng minh tính chất (ii). ϕ aX+b = E(e i(ax+b)t ) = E(e tbt e itX ) = e tbt E(e itX ) = e ibt ϕ X (at).
Cuối cùng, chúng ta chứng minh tính chất (iii) của hai biến ngẫu nhiên độc lập X và Y Vì X và Y độc lập, nên các hàm mũ phức e^(iX) và e^(iY) cũng độc lập Từ đó, ta có ϕ_X+Y(t) = E(e^(i(X+Y))) = E(e^(iX)e^(iY)) = E(e^(iX))E(e^(iY)) = ϕ_X(t)ϕ_Y(t).
Nếu X1, X2, , Xn là các biến ngẫu nhiên độc lập và có cùng phân phối xác suất với biến ngẫu nhiên X, thì hàm đặc trưng của tổng các biến này được biểu diễn là ϕ X1 + +Xn(t) = [ϕ X(t)]^n Theo Định lý 4.5, nếu ϕ Xn(t) là hàm đặc trưng của biến ngẫu nhiên Xn và ϕ X(t) là hàm đặc trưng của biến ngẫu nhiên X, thì mối quan hệ giữa chúng được xác định rõ ràng.
Khi và chỉ khi dãy các biến ngẫu nhiên độc lập {X n , n ≥ 1} hội tụ về một biến ngẫu nhiên X với kỳ vọng E(X) = à và phương sai V(X) = σ² hữu hạn, thì khi n tiến đến vô cùng, xác suất P(S n - nà) sẽ hội tụ.
Chứng minh Áp dụng Định lí 4.5, ta cần chứng minh hàm đặc trưng của
√ nσ hội tụ về hàm đặc trưng của phân phối chuẩn tắc.
Khụng mất tớnh tổng quỏt ta giả thiết à = 0 và σ = 1 (Nếu khụng thỡ đặt Z i = (X i − à)/σ) Khi đú ϕ Sn −nà
Định lý giới hạn trung tâm khẳng định rằng, đối với n biến ngẫu nhiên độc lập và cùng phân phối xác suất với kỳ vọng à và phương sai σ² hữu hạn, khi n đủ lớn, tổng S_n = X_1 + X_2 + + X_n sẽ có phân phối xấp xỉ phân phối chuẩn N(à; nσ²) Điều này cho thấy sự chuyển đổi từ phân phối bất kỳ sang phân phối chuẩn khi số lượng biến ngẫu nhiên tăng lên, điều này rất quan trọng trong thống kê và ứng dụng thực tiễn.
X = X 1 + X 2 + + X n n cú phõn phối xấp xỉ phõn phối chuẩn N(à; σ 2 /n).
Ví dụ 4.2 Tuổi thọ làm việc của một linh kiện điện tử là một biến ngẫu nhiên
Công ty X có kì vọng thời gian sử dụng linh kiện là 250 giờ với độ lệch chuẩn cũng là 250 giờ Mỗi linh kiện được sử dụng cho đến khi hỏng mới được thay thế Để tính xác suất rằng 100 linh kiện sẽ đủ sử dụng trong ít nhất 1 năm (365 ngày), cần xem xét tổng thời gian sử dụng của các linh kiện này.
Chứng minh rằng tuổi thọ của linh kiện thứ k, ký hiệu là Xk (1 ≤ k ≤ 100), được mô tả bởi các biến ngẫu nhiên X1, X2, , X100, độc lập và cùng phân phối xác suất với X Theo Định lý giới hạn trung tâm, chúng ta có thể áp dụng để phân tích sự phân bố của tổng tuổi thọ các linh kiện.
Hệ quả 4.3 (Định lí giới hạn tích phân Moivre-Laplace) Giả sử X n là biến ngẫu nhiên có phân phối nhị thức B(n; p) Đặt
Z n = X n − np pnp(1 − p) Khi đó với mọi x ∈R, n→∞ lim P (Z n < x) = Φ(x).
Nói cách khác, với n đủ lớn B(n; p) có phân phối xấp xỉ phân phối chuẩnN(np; np(1 − p)).
Xấp xỉ trên tốt nhất khi np > 5 và n(1 − p) > 5.
Xác suất bắn trúng mục tiêu của xạ thủ là 0,7 Khi xạ thủ thực hiện 100 phát bắn độc lập, chúng ta cần tính xác suất để có ít nhất 75 phát trúng mục tiêu.
Giải Gọi X là số phát trúng trong 100 phát đã bắn Khi đó, X ∼ B(100; 0, 7) Áp dụng hệ quả trên, X xấp xỉ phân phối chuẩn N(70; 21) Do đó,
□ Hiệu chỉnh liên lục đối với các biến ngẫu nhiên rời rạc
Khi sử dụng định lý giới hạn trung tâm cho dãy biến ngẫu nhiên rời rạc, chúng ta xấp xỉ một phân phối rời rạc bằng một phân phối liên tục Điều này dẫn đến việc cần "hiệu chỉnh" để giảm thiểu sai số.
Cho dãy biến ngẫu nhiên rời rạc {X n ; n ≥ 1} nhận giá trị nguyên và Y =
X 1 + + X n Giả sử ta cần tính các xác suất P (Y < k), P (Y ≤ k), P (Y > k),
P (Y ≥ k) với k là số nguyên Khi đó ta hiệu chỉnh như sau:
Trong một ví dụ về bảo hiểm xe máy, có 10,000 xe được mua bảo hiểm từ một công ty Mỗi chủ xe đóng phí bảo hiểm 100,000 đồng mỗi năm và có khả năng nhận lại 5 triệu đồng nếu xe gặp tai nạn giao thông Theo thống kê, tỷ lệ xe máy bị tai nạn giao thông là một yếu tố quan trọng cần xem xét khi đánh giá rủi ro và lợi ích của bảo hiểm.
1 năm là 0,006 Tính xác suất để: a) sau một năm hoạt động công ty bị lỗ. b) sau một năm hoạt động công ty lãi ít nhất 800 triệu.
Trong một năm, số xe máy mua bảo hiểm của công ty gặp tai nạn được ký hiệu là X, với phân phối X ∼ B(10 4; 0, 006) Với np = 60 và np(1 − p) = 59,64, chúng ta có thể xấp xỉ X bằng phân phối chuẩn N(60; 59,64) Câu hỏi đặt ra là xác suất công ty sẽ bị lỗ sau một năm hoạt động.
P (10 9 − 5.10 6 X < 0) = P (X > 200) = 1 − P (X < 200 − 0, 5) ≈ 1 − Φ(18, 06) ≈ 0. b) Xác suất sau một năm hoạt động công ty lãi ít nhất 800 triệu
Luật số lớn đối với dãy biến ngẫu nhiên đôi một độc lập
độc lập Định nghĩa 4.5 Cho a ≥ 0 Hàm số dương đo được f (x) trên [a; ∞) được gọi là hàm biến đổi chậm ở vô cực nếu f (tx) f (t) → 1 khi t → ∞ với mọi x > 0.
Vớix > 0, kí hiệulog + (x) = max{1, ln(x)}, trong đóln(x)là hàm logarit tự nhiên.
Các hàm logarit như log + (x), log + (log + (x)), log + (x) và log + (log + (x)) đều là những hàm biến đổi chậm ở vô cực Đặt ℓ(x) là các hàm biến đổi chậm ở vô cực, theo Định lý 1.5.13 trong tài liệu.
[11], suy ra tồn tại một hàm biến đổi chậm ở vô cực ℓ # (x) thỏa mãn
Hàmℓ # (x) được gọi là hàm liên hợp Bruijn củaℓ(x) Chẳng hạn, vớiℓ(x) = log + (x) ta có ℓ # (x) = 1/ log + (x).
Bổ đề 4.1 ([1, 13]) Cho 1 < r < 2, X là biến ngẫu nhiên Nếu P (|X| > x) ≍ x −r ℓ(x), trong đó ℓ(x) là hàm biến đổi chậm ở vô cực Khi đó,
Bổ đề 4.2 Cho {X n ; n ≥ 1} là dãy biến ngẫu nhiên đôi một độc lập với E(X n ) = 0 and E(X n 2 ) < ∞ Khi đó,
Chứng minh Để chứng minh a) ta sử dụng bất đẳng thức
Bây giờ ta chứng minh b) Ta có hằng đẳng thức n
Khi áp dụng kì vọng cho hai vế và sử dụng tính chất độc lập, chúng ta có thể chứng minh định lý 4.7 Định lý này chỉ ra rằng với 1 < r < 2 và 0 < p ≤ r, dãy biến ngẫu nhiên {X, X n ; n ≥ 1} là một dãy độc lập có cùng phân phối xác suất với kì vọng 0 Hơn nữa, xác suất P (|X| > x) tỉ lệ với x −r ℓ(x), trong đó ℓ(x) là hàm biến đổi chậm ở vô cực và thỏa mãn điều kiện ℓ(n 1/p ) = o(n r/p−1 ).
{a ni ; 1 ≤ i ≤ n, n ≥ 1} là mảng các số thực sao cho n
Chứng minh Để thuận tiện trong trình bày chứng minh, các hằng số dương C không nhất thiết giống nhau trong mỗi lần xuất hiện Với mỗi n ≥ 1 và 1 ≤ i ≤ n, đặt
Khi có hai dãy biến ngẫu nhiên độc lập {Y ni ; 1 ≤ i ≤ n} và {Z ni ; 1 ≤ i ≤ n} với cùng một phân phối xác suất, ta có thể biểu diễn tổng Pn i=1 a ni X i dưới dạng S n + S n ′ Đối với mọi ϵ > 0 và n ≥ 1, điều này cho thấy sự liên kết giữa các biến ngẫu nhiên trong nghiên cứu.
Tiếp theo ta chứng minh I 2 → 0 khi n → ∞ Áp dụng bất đẳng thức Cauchy- Schwarz và (4.3) ta có n
≤ Cℓ(n 1/p ) ϵn r/p−1 → 0 khi n → ∞. Định lí được chứng minh □
Sau đây ta sẽ xét một ứng dụng của Định lí 4.7 trong ước lượng mô hình hồi quy phi tham số.
Xét mô hình hồi quy phi tham số:
Trong mô hình hồi quy đa biến, biểu thức Y ni = f (x ni ) + ε ni (với 1 ≤ i ≤ n) mô tả mối quan hệ giữa biến phụ thuộc Y và các điểm thiết kế x ni nằm trong tập compact A ⊂ R m Hàm f(x) là hàm hồi quy xác định trên A, trong khi ε i đại diện cho các sai số ngẫu nhiên Một ước lượng cho hàm f(x) được đưa ra dưới dạng f ˆ n (x) = n.
Trong bài viết này, chúng tôi sẽ xem xét ước lượng W ni (x) = W (x, x n1 , x nn ) với các hàm trọng số Ước lượng này được giới thiệu lần đầu bởi Stone và sau đó được Georgiev nghiên cứu trong trường hợp thiết kế cố định Nhiều tác giả khác như Georgiev và Greblicki, Georgiev, và Muller cũng đã nghiên cứu ước lượng này trong bối cảnh có sai số ngẫu nhiên độc lập Chúng tôi sẽ tập trung vào việc nghiên cứu ước lượng với sai số ngẫu nhiên đôi một độc lập và có xác suất đuôi nặng.
Với x ∈ A, sau đây là một số giả thiết đối với các hàm trọng số
(A3)Pn i=1 |W ni (x)||f (x ni ) − f (x)|I(∥x ni − x∥ > a) = o(1) với mọi a > 0.
Định lý 4.8 khẳng định rằng với điều kiện 1 < r < 2 và 0 < p ≤ r, trong mô hình (4.4), dãy các sai số ngẫu nhiên (ε i ; 1 ≤ i ≤ n) là độc lập và có cùng phân phối xác suất với biến ngẫu nhiên ε, có kỳ vọng bằng 0.
P (|ε| > x) ≍ x −r ℓ(x), (4.6) trong đó ℓ(x) là hàm biến đổi chậm ở vô cực thỏa mãn ℓ(n 1/p ) = o(n r/p−1 ) Nếu n
W ni 2 (x) = O(n 1−2/p ), (4.7) thì với mọi x ∈ c(f ), f ˆ n (x) − P → f(x) khi n → ∞,trong đó c(f ) là tâp các điểm liên tục của hàm f (x) trên tập A.
Chứng minh Với x ∈ c(f), ta có f ˆ n (x) − f (x) = n
W ni (x)ε nj + [E( ˆ f n (x)) − f (x)]. Áp dụng Định lí 4.7 với a ni = n 1/p W ni (x), ta có n
Do đó, để hoàn thành chứng minh định lí ta cần chỉ ra rằng
Vì x ∈ c(f ), nên với ϵ > 0 tùy ý, tồn tại δ > 0 sao cho với mọi x ′ ∈ A thỏa mãn
∥x ′ − x∥ < δ ta đều có |f(x ′ ) − f (x)| < ϵ Nếu ta chọn a ∈ (0, δ), thì khi đó
|f(x)| → 0 khi n → ∞ tiếp sau đó cho ϵ → 0.
Chúng ta thừa nhận định lý 4.9 mà không cần chứng minh, trong đó xác định rằng với 1 ≤ p < α < 2, β > α và 1/α + 1/β = 1/p, hàm ℓ(x) là hàm biến đổi chậm ở vô cực Đối với dãy biến ngẫu nhiên (X, X_n; n ≥ 1) có tính chất độc lập và cùng phân phối xác suất với kỳ vọng bằng 0, ta có mảng các số thực (a_ni; 1 ≤ i ≤ n, n ≥ 1) thỏa mãn điều kiện n.
▷ 4.1 Cho {X n ; n ≥ 1} là dãy biến ngẫu nhiên độc lập, có cùng phân phối xác suất với hàm mật độ xác suất chung f(x) =
0 nếu x ≤ 0. Đặt Y n = min{X 1 , , X n } Chứng minh
▷ 4.2 Cho dãy biến ngẫu nhiên rời rạc {X n ; n ≥ 1} với
▷ 4.3 Cho dãy biến ngẫu nhiên liên tục {X n ; n ≥ 1} với hàm mật độ xác suất của
▷ 4.4 Cho dãy biến ngẫu nhiên liên tục {X n ; n ≥ 2} với hàm mật độ xác suất của
▷ 4.5 Cho X ∼ N (0; 1), biến ngẫu nhiên X n được xác định bởi
Giả sử{X, X n ; n ≥ 1}là dãy biến ngẫu nhiên độc lập Đặt Y n = X.X n Chứng minh
▷ 4.6 Cho {X n ; n ≥ 1} là dãy biến ngẫu nhiên độc lập, có cùng phân phối xác suất với kỡ vọng chung à và phương sai chung σ 2 hữu hạn Đặt
▷ 4.7 Cho {X n ; n ≥ 1} là dãy biến ngẫu nhiên dương, độc lập, có cùng phân phối xác suất và 0 < E(ln(X i )) = γ < ∞ Đặt
▷ 4.8 Cho {X n ; n ≥ 2} là dãy biến ngẫu nhiên với hàm phân phối xác suất của
e nx +xe n e nx + ( n+1 n ) e n 0 ≤ x ≤ 1, e nx +e n e nx + ( n+1 n ) e n x > 1.
▷ 4.9 Cho {X n , n ≥ 1} là một dãy các biến ngẫu nhiên độc lập cùng phân phối, E(X) = à và V (X) = σ 2 Với x ∈R tớnh giới hạn: n→∞ lim P (X 1 + X 2 + + X n < x).
Tuổi thọ của bóng đèn được mô tả bằng biến ngẫu nhiên X với kỳ vọng E(X) = 250 giờ và độ lệch chuẩn SD(X) = 250 giờ Để đảm bảo cửa hàng duy trì ánh sáng liên tục trong ít nhất 8750 giờ (khoảng 1 năm), sử dụng định lý giới hạn trung tâm để tính xác suất cho 30 bóng đèn mà cửa hàng đã mua Ngoài ra, cần xác định số lượng bóng đèn tối thiểu mà chủ cửa hàng phải mua để đảm bảo ánh sáng liên tục ít nhất 8750 giờ với xác suất lớn hơn 0,9772, cũng dựa trên định lý giới hạn trung tâm.
▷ 4.11 Tuổi thọ của một loại van điện lắp trong một thiết bị là biến ngẫu nhiên
X (nghìn giờ) có phân bố mũ với kỳ vọng E(X) = 10 (nghìn giờ) Để tính xác suất rằng trong 36 van điện được lắp vào thiết bị, ít nhất 20 van sẽ bị thay thế trước thời gian 5 ngàn giờ, ta cần sử dụng tính chất độc lập của tuổi thọ các van điện.
Để xác định số chỗ ngồi tối thiểu cần thiết cho nhà ăn phục vụ 1000 người trong hai đợt ăn trưa với xác suất mỗi người chọn một trong hai đợt như nhau, ta áp dụng định lý giới hạn trung tâm Mục tiêu là đảm bảo rằng xác suất có đủ chỗ cho khách vào ăn trưa đạt ít nhất 0,99.
▷ 4.13 Tuổi thọ (năm) của một thiết bị điện tử là một biến ngẫu nhiên X có hàm mật độ xác suất: f(x) =
Cửa hàng A nhập 10.000 thiết bị để bán, với lợi nhuận 15.000 đồng cho mỗi thiết bị không cần bảo hành và lỗ 5.000 đồng cho mỗi thiết bị phải bảo hành Thời gian bảo hành là 6 tháng Để cửa hàng A đạt lợi nhuận tối thiểu 125 triệu đồng, cần tính xác suất bán hết 10.000 thiết bị.
▷ 4.14 Thời gian (phút) phục vụ mỗi khách hàng tại một cửa hàng A là biến ngẫu nhiên X có phân phối mũ với trung bình là 0, 2 phút Quan sát ngẫu nhiên
35khách hàng vào chờ mua hàng ở cửa hàng đó Tính xấp xỉ xác suất để thời gian phục vụ trung bình của 35 khách hàng đó lớn hơn 0, 3 phút.
Một hộp chứa 50 viên pin loại A và 50 viên pin loại B Pin loại A có tuổi thọ trung bình là 500 giờ với độ lệch chuẩn 15 giờ, trong khi pin loại B có tuổi thọ trung bình là 400 giờ và độ lệch chuẩn 6 giờ Cần tính toán xác suất tổng tuổi thọ của 100 viên pin này lớn hơn 45.200 giờ.
Trọng lượng các viên thuốc chữa bệnh B tại xí nghiệp có phân phối chuẩn với trọng lượng trung bình 25mg và độ lệch chuẩn 9mg Mỗi vỉ thuốc gồm 10 viên, và một vỉ được xem là đạt tiêu chuẩn nếu trọng lượng nằm trong khoảng từ 2470mg đến 2530mg Khi chọn ngẫu nhiên 100 vỉ thuốc để kiểm tra, cần tính xác suất để có ít nhất 80 vỉ đạt tiêu chuẩn.
Tuổi thọ của bóng đèn được mô tả bằng biến ngẫu nhiên có phân phối mũ với trung bình 1500 giờ Bóng đèn được phân loại là loại A nếu tuổi thọ vượt quá 1600 giờ Mỗi hộp chứa 3 bóng đèn và được xem là đạt tiêu chuẩn nếu có ít nhất 2 bóng loại A Để kiểm tra, 40 hộp bóng đèn được chọn ngẫu nhiên Mục tiêu là tính xác suất xấp xỉ có nhiều nhất 10 hộp bóng đèn đạt tiêu chuẩn.
▷ 4.18 Tuổi thọ (năm) của một loại thiết bị là biến ngẫu nhiên có phân bố mũ với hàm phân phối xác suất
Phải chọn ngẫu nhiên bao nhiêu thiết bị để có ít nhất 100 thiết bị có tuổi thọ lớn hơn 7 (năm) với xác suất lớn hơn 0, 95?
Công ty bảo hiểm bán phí bảo hiểm xe máy với mức 125.000 đồng/năm và bồi thường trung bình 5 triệu đồng cho mỗi vụ tai nạn Tỉ lệ xe máy bị tai nạn trong một năm là 0,015, trong khi các chi phí khác chiếm 20% phí bảo hiểm Để xác suất lỗ thấp hơn 0,001, công ty cần xác định số lượng bảo hiểm tối thiểu phải bán trong một năm.
▷ 4.20 Số khách hàng vào mua hàng ở 1cửa hàng trong 1ngày là biến ngẫu nhiên
X có phân bố Poisson với số khách trung bình E(X) = 50 Giả sử hàm doanh thu
Y (triệu đồng) được xác định bởi Y = 3X Chọn ngẫu nhiên bao nhiêu ngày để doanh thu trung bình những ngày này lớn hơn 145 triệu đồng có xác suất lớn hơn
0, 95 Biết doanh thu mỗi ngày độc lập với nhau.
XÍCH MARKOV
Tính Markov
Trong Chương 4, chúng ta đã nghiên cứu các định lý giới hạn với dãy biến ngẫu nhiên độc lập Tuy nhiên, trong thực tế, nhiều dãy quan sát không độc lập theo thời gian, như nhiệt độ không khí hàng ngày, dân số một quốc gia qua các năm, hay giá vàng theo giờ Nếu giá trị trong tương lai của một dãy quan sát chỉ phụ thuộc vào giá trị hiện tại và hoàn toàn độc lập với giá trị quá khứ, thì dãy quan sát đó được gọi là dãy Markov.
Dân số của nước ta trong năm tới sẽ phụ thuộc vào dân số hiện tại và không bị ảnh hưởng bởi dân số của các năm trước.
Xét một hệ thống quan sát tại các thời điểm rời rạc 0, 1, 2, , với các quan sát là X0, X1, X2, Ta có dãy biến ngẫu nhiên {Xn; n ≥ 0}, trong đó Xn là trạng thái của hệ tại thời điểm n Giả thiết rằng Xn là biến ngẫu nhiên rời rạc cho mọi n Kí hiệu E là tập hợp tất cả các giá trị của {Xn; n ≥ 0}, được gọi là không gian trạng thái của hệ, với E có thể là tập hữu hạn hoặc vô hạn đếm được, và các phần tử của E được kí hiệu là i, j, k,
Giá trị P(X n+1 = k|X n = i), với i, k ∈ E và n ≥ 1, đại diện cho xác suất chuyển một bước của hệ thống, tức là xác suất tại thời điểm n + 1 hệ ở trạng thái k nếu tại thời điểm n hệ ở trạng thái i Nếu xác suất này chỉ phụ thuộc vào i và k mà không phụ thuộc vào n, hệ thống được gọi là thuần nhất Trong giáo trình này, chúng ta sẽ chỉ xem xét các hệ thống thuần nhất Định nghĩa 5.1 nêu rằng dãy các biến ngẫu nhiên rời rạc {X n ; n ≥ 0} là một xích Markov nếu với mọi n ≥ 1 và mọi k, i, i 0, i n−1 ∈ E, điều kiện trên được thỏa mãn.
Vì ta chỉ xét xích Markov thuần nhất nên:
Ta có (5.1) tương đương với
Ví dụ 5.1 Cho {X n ; n ≥ 0} là các biến ngẫu nhiên độc lập và có cùng phân phối xác suất với
Xác suất P(Xn = −1) được tính bằng 1 − P(Xn = 1) = p, với 0 < p < 1 Đặt Sn = X0 + + Xn cho n ≥ 1, ta chứng minh rằng {Sn; n ≥ 0} là một chuỗi Markov với không gian trạng thái là Z Dãy Sn còn được gọi là bước đi ngẫu nhiên đơn giản Điều này được chứng minh bởi vì Xn+1 độc lập với S0, S1, , Sn−1.
Ví dụ 5.2 Cho{X n ; n ≥ 0}là một xích Markov ĐặtY n = X 2n , khi đó{Y n ; n ≥ 0} cũng là một xích Markov.
Kí hiệu p ik = P (X n+1 = k|X n = i) = P (X 1 = k|X 0 = i), p ik (n) = P (X m+n = k|X m = i) = P (X n = k|X 0 = i). Định lí 5.1 (Phương trình C-K (Chapman-Kolmogorov)). p ik (n + m) = X j∈E p ik (n)p jk (m).
Chứng minh Theo công thức xác suất toàn phần và tính Markov ta có: p ij (n + m) = P (X n+m = j |X 0 = i)
□Trong phạm vi giáo trình này chúng ta chỉ xét các xích Markov có không gian trạng thái hữu hạn.
Xích Markov có không gian trạng thái hữu hạn
5.2.1 Ma trận xác suất chuyển và sơ đồ chuyển trạng thái
Xét xích Markov có không gian trạng thái hữu hạn E = {1, 2, , d} Đặt p ik = P (X 1 = k|X 0 = i), i, k ∈ E.
Ma trận xác suất chuyển trạng thái (sau 1 bước) là công cụ quan trọng trong việc mô tả xích Markov Để minh họa một cách trực quan, chúng ta sử dụng Sơ đồ chuyển trạng thái Ví dụ, xem xét xích Markov {X n ; n ≥ 1} với không gian trạng thái.
E = {1, 2, 3} và ma trận xác suất chuyển
Khi đó ta vẽ sơ đồ chuyển trạng thái như sau:
Ví dụ 5.3 Cho xích Markov có không gian trạng thái E = {1, 2, 3} và ma trận xác suất chuyển
a) Tính P (X 4 = 3|X 3 = 2). b) Tính P (X 3 = 1|X 2 = 1). c) Biết P (X 0 = 1) = 1 3 , tính P (X 0 = 1, X 1 = 2). d) Biết P (X 0 = 1) = 1 3 , tính P (X 0 = 1, X 1 = 2, X 2 = 3).
Cho xích Markov {X n ; n ≥ 0}, giả sử ta đã biết phân phối xác suất của X 0 : x 1 2 d p(x) P (X 0 = 1) P (X 0 = 2) P (X 0 = d)
Kí hiệuU = U (0) = [P (X 0 = 1), P (X 0 = 2), , P (X 0 = d)] là vectơ mô tả phân phối xác suất của X 0
Tương tự, kí hiệu U(n) = [P (X n = 1), P (X n = 2), , P (X n = d)] là vectơ mô tả phân phối xác suất của X n Đặt p ij (n) = P (X n = j |X 0 = i).
được gọi là ma trận xác suất chuyển sau n bước.
Từ Định lí 5.1 ta có Định lí 5.2.
Trong ví dụ 5.4, X n đại diện cho chất lượng của chi tiết tại công đoạn thứ n trong dây chuyền sản xuất, trong đó X n = 0 biểu thị chất lượng tốt và X n = 1 biểu thị chất lượng kém Hệ thống {X n ; n ≥ 0} được xác định là một chuỗi Markov với ma trận xác suất chuyển.
#. a) Vẽ sơ đồ chuyển trạng thái. b) Tính P (3), từ đó tìm P (X 4 = 1|X 1 = 1).
Giải a) Sơ đồ chuyển trạng thái:
Ví dụ 5.5 Cho xích Markov{X n ; n ≥ 0}với không gian trạng tháiE = {0, 1, 2} và ma trận xác suất chuyển
a) Vẽ sơ đồ chuyển trạng thái. b) Tính P (3), từ đó tìm P (X 3 = 1|X 1 = 1), P (X 3 = 1|X 0 = 0).
Giải a) Sơ đồ chuyển trạng thái:
Ví dụ 5.6 Cho xích Markov{X n ; n ≥ 0}với không gian trạng tháiE = {0, 1, 2} và ma trận xác suất chuyển
a) Vẽ sơ đồ chuyển trạng thái. b) Tính P (X 2 = 1|X 0 = 0), P (X 3 = 0|X 0 = 0).
Giải a) Sơ đồ chuyển trạng thái:
Ví dụ 5.7 Cho xích Markov{X n ; n ≥ 0}với không gian trạng tháiE = {0, 1, 2} và ma trận xác suất chuyển
Biết phân phối ban đầu của X 0 là U = [0, 3; 0, 4; 0, 3] Tính
Giải Theo Định lí 2.2 ta có
Trong ví dụ 5.8, một bức điện chứa các tín hiệu 0 và 1 được truyền qua một kênh với nhiều trạm, mỗi trạm nhận tín hiệu với xác suất a Ký hiệu X0 đại diện cho tín hiệu gốc, trong khi Xn là tín hiệu nhận được tại trạm n Các tín hiệu (Xn) tạo thành một chuỗi Markov với ma trận xác suất chuyển.
Giả sử tín hiệu truyền đi là X0 = 0 Để tính xác suất không nhận sai tín hiệu cho tới trạm thứ 2, ta cần phân tích các yếu tố liên quan đến quá trình truyền tín hiệu Tiếp theo, xác suất nhận đúng tín hiệu của trạm thứ 2 cũng cần được tính toán dựa trên các biến số ảnh hưởng Cuối cùng, xác suất nhận đúng tín hiệu của trạm thứ 5 cũng sẽ được xác định, giúp hiểu rõ hơn về độ tin cậy của hệ thống truyền tín hiệu.
Giải a) Xác suất để không nhận sai tín hiệu cho tới trạm thứ 2:
= p 00 p 00 = a 2 b) Xác suất để nhận đúng tín hiệu của trạm thứ 2:
Với ma trận xác suất chuyển sau 2 bước P(2):
# c) Xác suất để nhận đúng tín hiệu của trạm thứ 5:
Với ma trận xác suất chuyển sau 5 bước P(5):
Khi nghiên cứu về tình trạng nghiện hút tại địa phương A, chúng ta ký hiệu trạng thái không nghiện là 0 và nghiện là 1, với đơn vị thời gian được tính theo quý (3 tháng) Thống kê nhiều năm cho thấy xác suất một người không nghiện vẫn duy trì trạng thái không nghiện sau 1 quý là 0,99, trong khi xác suất một người nghiện tiếp tục nghiện sau 1 quý là 0,88 Điều này cho thấy trạng thái nghiện hay không nghiện của một cá nhân có thể được mô tả rõ ràng qua các xác suất này.
1 xích Markov với không gian trạng thái E = {0, 1} và ma trận xác suất chuyển P
Giả sử ban đầu có 17% số người nghiện, ta cần xác định phân phối số người nghiện và không nghiện sau 1 quý và 2 quý Sau 1 quý, số người nghiện và không nghiện sẽ được phân bố theo tỷ lệ tương ứng với sự thay đổi trong hành vi của họ Tiếp theo, sau 2 quý, phân phối này sẽ tiếp tục thay đổi, phản ánh sự ảnh hưởng của các yếu tố bên ngoài và chương trình can thiệp nếu có Việc phân tích này giúp hiểu rõ hơn về xu hướng và tỷ lệ người nghiện trong cộng đồng.
Giải Phân phối ban đầu của X 0 là U (0) = [0, 83; 0, 17]. a) Phân phối số người nghiện và không nghiện sau 1 quý là:
0, 8421 0, 1579 i b) Phân phối số người nghiện và không nghiện sau 2 quý:
Trong ví dụ này, có ba cửa hàng cùng cung cấp một loại sản phẩm, và khách hàng có thể lựa chọn mua hàng tại một trong ba cửa hàng dựa trên sở thích cá nhân Mỗi tháng, khách hàng sẽ không thay đổi cửa hàng mua sắm Gọi X0 là cửa hàng mà khách hàng chọn trong tháng thứ n Đây được xem như một quá trình Markov với ba trạng thái E = {1, 2, 3}, trong đó xác suất chuyển p ij biểu thị khả năng khách hàng hiện tại mua hàng tại cửa hàng i và chuyển sang mua tại cửa hàng j trong tháng tiếp theo Ma trận xác suất chuyển được sử dụng để mô tả các xác suất này.
và phân phối khách hàng ở tháng thứ nhất của cửa hàng 1 chiếm 20%, cửa hàng
2 chiếm 50%, cửa háng 3 chiếm 30% Tìm phân phối khách hàng của 3 cửa hàng ở tháng thứ 12.
Giải Phân phối khách hàng ở tháng thứ nhất: U (1) = [0, 2; 0, 5; 0, 3]
Ma trận xác suất chuyển sau 11 bước là:
Phân phối khách hàng của 3 cửa hàng ở tháng thứ 11:
Phân phối dừng và phân phối giới hạn
Định nghĩa 5.2 Phân phối Π = [π i ] 1×d được gọi là phân phối dừng của xích Markov {X n ; n ≥ 0} với ma trận xác suất chuyển P nếu Π.P = Π.
Ví dụ 5.11 Cho {X n ; n ≥ 0} là một xích Markov có không gian trạng thái
E = {1, 2, 3} và ma trận xác suất chuyển
Hãy tìm phân phối dừng.
Giải Đặt Π = [x; y; z] Khi đó Π là phân phối dừng khi và chỉ khi x,y,z là nghiệm không âm của hệ sau:
Giải hệ phương trình trên ta được phân phối dừng Π = [6/25, 2/5, 9/25] □ Định nghĩa 5.3 Cho xích Markov {X n ; n ≥ 0} có không gian trạng thái
E = {1, 2, , d} Giả sử với mọi i, j ∈ E, tồn tại giới hạn lim P(X n = j|X 0 = i) = π j, và giới hạn này không phụ thuộc vào i, đồng thời tổng Pd j=1 π j = 1 Khi đó, π = [π 1, π 2, , π d] được gọi là phân phối giới hạn của xích Markov {X n; n ≥ 0} Định lý 5.3 cho biết nếu xích Markov {X n; n ≥ 0} có phân phối giới hạn π = [π 1, , π d], thì đây là phân phối dừng duy nhất.
Chứng minh Giả sử U = [u 1 , , u d ] là phân phối dừng Theo Định lí 5.1 ta có u j =X k∈E u k p kj (n).
Vì chuỗi hội tụ đều với n nên u j =X k∈E u k lim n→∞ P kj (n) = X k∈E u k π j = π j
Xích Markov {X n ; n ≥ 0} với không gian trạng thái hữu hạn E có phân phối giới hạn π = [π 1 , , π d ] là phân phối dừng duy nhất, với điều kiện π j > 0 cho mọi j Định lý 5.4 chỉ ra rằng xích Markov này là chính quy nếu tồn tại n 0 sao cho P (X n 0 = j|X 0 = i) > 0 với mọi i, j.
Chứng minh Giả thiết {X n ; n ≥ 0} là xích chính quy Ta cố định j và đặt m j (n) = min i∈E p ij (n),
Ta có p ij (n + 1) =X k p ik p kj (n) ≥X k p ik m j (n) = m j (n).
Dãy (m j (n)) với n = 1, 2, là dãy tăng và bị chặn trên bởi 1, vì vậy tồn tại giới hạn lim n m j (n) = a j Tương tự, dãy (M j (n)) cũng là dãy giảm và bị chặn bởi 0, dẫn đến việc tồn tại giới hạn lim n M j (n) = A j.
Ta cóm j (n) ≤ P ij (n) ≤ M j (n)do đó định lí được chứng minh nếu ta chỉ ra a j = A j
Ký hiệur = min i,j P ij (n 0 ) > 0 Ta có P ik (n 0 ) ≥ r.1 ≥ P jk (n)nênP ik (n 0 ) ≥ rP jk (n) ∀i, thành thử p ij (n 0 + n) =X k p ik (n 0 )p kj (n)
(P ik (n 0 ) − rP jk (n))p kj (n) + rX k p jk (n)p kj (n)
(p ik (n 0 ) − rp jk (n)) + rp jj (2n)
Vì bất đẳng thức này đúng với mọi i nên ta có m j (n 0 + n) ≥ m j (n)(1 − r) + rP jj (2n).
Ta chứng minh quy nạp rằng với mọi k
M j (kn 0 + 1) − m j (kn 0 + 1) ≤ (1 − r) k (M j (1) − m j (1)) (5.3) Thật vậy với k = 1 đúng ( cho n = 1 ở (5.2)) Giả sử đúng với k ta có
Cho k → ∞ trong (5.3) ta nhận được A j − a j ≤ 0 Vì A j − a j ≥ nên ta kết luận
A j = a j Đảo lại giả sử với mọi i, j ∈ E tồn tại lim n p ij (n) = π j ≥ 0 Khi đó tồn tại n 0 (i, j) sao cho P ij (n) > 0 ∀n > n 0 (i, j) Đặt n 0 = max i,j n 0 (i, j) ta có P ij (n) > 0 ∀i, j ∈ E
Ví dụ 5.12 Cho xích Markov {X n ; n ≥ 0} có ma trận xác suất chuyển
VìP (2) có các phần tử đều dương nên {X n ; n ≥ 0} là xích Markov chính quy.
Mỗi người dân trong một vùng có thể thuộc vào ba tầng lớp: giàu (1), trung lưu (2) và nghèo (3) Con cái của họ có khả năng ở trong một trong ba tầng lớp này với xác suất khác nhau, tùy thuộc vào tầng lớp của cha mẹ Theo thống kê, ma trận xác suất chuyển được xác định để phân tích sự di chuyển giữa các tầng lớp xã hội.
Xích Markov này là chính quy nên có phân phối dừng duy nhất Tìm phân phối dừng đó.
Giải Đặt Π = [x; y; z] Khi đó Π là phân phối dừng khi và chỉ khi x,y,z là nghiệm không âm của hệ sau:
Giải hệ phương trình trên ta được phân phối dừng Π = [0, 0672; 0, 6240; 0, 3088] □
Ví dụ 5.14 Cho xích Markov{X n ; n ≥ 0}có không gian trạng tháiE = {1, 2, 3} và ma trận xác suất chuyển
Phân phối ban đầu là U = [0, 7; 0, 2; 0, 1]. a) Lập bảng phân phối xác suất của X 2. b) Tính P (X 0 = 1, X 1 = 3, X 2 = 3, X 3 = 2). c) Tìm phân phối dừng.
Giải a) Phân phối xác suất của X 2 là:
Bảng phân phối xác suất của X 2 là: x 1 2 3 p(x) 0, 385 0, 336 0, 279 b) Ta có:
P (X 0 = 1, X 1 = 3, X 2 = 3, X 3 = 2) = u 1 p 13 p 33 p 32 = 0, 7.0, 4.0, 3.0, 4 = 0, 0336. c) Đặt Π = [x; y; z] Khi đó Π là phân phối dừng khi và chỉ khi x,y,z là nghiệm không âm của hệ sau:
0, 4x + 0, 2y + 0, 3z = z x + y + z = 1Giải hệ phương trình trên ta được phân phối dừng Π = [16/47; 17/47; 14/47] □
Trong ví dụ 5.15, có ba cửa hàng (A, B, C) cung cấp cùng một loại sản phẩm, cho phép khách hàng lựa chọn theo sở thích cá nhân Mỗi tháng, khách hàng sẽ không thay đổi cửa hàng mua sắm của mình Theo thống kê, ma trận xác suất chuyển giữa các cửa hàng này được xác định để phân tích hành vi mua sắm của khách hàng.
Tìm phân phối giới hạn.
Giải xích Markov này là chính quy, do đó tồn tại một phân phối giới hạn π = [x, y, z] Phân phối này chính là phân phối dừng duy nhất và được xác định thông qua việc giải hệ phương trình tương ứng.
Giải hệ ta tìm được x = 0, 36, y = 0, 15, z = 0, 49 Điều này có nghĩa là khi thời gian đủ dài số khách hàng vào các cửa hàng A, B và C lần lượt là 36%, 15% và
Trong thị trấn N, mỗi người dân theo một trong ba nghề A, B, hoặc C, với xác suất con cái nối tiếp nghề của cha lần lượt là 3/5, 2/3 và 1/4 Nếu không theo nghề của cha, con cái sẽ chọn một trong hai nghề còn lại với xác suất bằng nhau Hiện tại, 20% dân số theo nghề A, 30% theo nghề B và 50% theo nghề C Cần xác định phân phối nghề nghiệp ở thế hệ tiếp theo và phân phối giới hạn theo nghề nghiệp của dân cư trong tương lai xa.
Trong thị trấn N, sự thay đổi trạng thái của một gia đình qua các thế hệ được mô tả bằng một xích Markov ba trạng thái, bao gồm nghề A (trạng thái 1), nghề B (trạng thái 2) và nghề C (trạng thái 3) Ma trận xác suất chuyển giữa các trạng thái này cho thấy khả năng chuyển đổi nghề nghiệp của các thành viên trong gia đình theo thời gian.
Phân phối ban đầu là U = [0, 2; 0, 3; 0, 5]. a) Phân phối nghề nghiệp ở thế hệ tiếp theo là:
Trong thế hệ tiếp theo, 36% người chọn nghề A, 43% chọn nghề B và 21% chọn nghề C Mô hình Xích Markov này là chính quy, do đó tồn tại phân phối giới hạn π = [x, y, z] Phân phối này là phân phối dừng duy nhất và được xác định bằng cách giải hệ phương trình π.P = π.
Kết quả giải bài toán cho thấy x = 0,37; y = 0,44; z = 0,19 Dự báo phân phối nghề nghiệp trong tương lai của cư dân thị trấn sẽ như sau: 37% cư dân theo nghề A, 44% theo nghề B, và 19% theo nghề C.
Trong một hệ thống điện kỹ thuật, các thiết bị cùng loại được phân loại thành bốn tình trạng: vừa mới thay, còn tốt, vẫn dùng được và đã bị hỏng Dựa trên số liệu thống kê, ma trận xác suất chuyển trạng thái của các thiết bị này được xác định theo đơn vị tuần.
Trong ma trận P, sau mỗi tuần, tỷ lệ thiết bị mới thay đổi trạng thái như sau: 0% trở thành tình trạng mới thay, 80% vẫn còn tốt và có thể sử dụng, 20% chuyển sang tình trạng hỏng hóc, trong khi 0% bị loại bỏ hoàn toàn.
Ta tìm được phân phối dừng Π = [1/6, 1/3, 1/3, 1/6].
Giả sử chi phí thay mới một thiết bị là 25 nghìn đồng và thiệt hại do mỗi thiết bị hỏng là 18,5 nghìn đồng, thì trung bình mỗi tuần, hệ thống cần chi 7,25 nghìn đồng cho mỗi thiết bị.
Ta xét phương án thứ hai cho việc thay thế vật tư thiết bị với ma trận xác suất chuyển trạng thái sau đây
Chính sách mới về thay thế vật tư thiết bị yêu cầu thay thế mỗi thiết bị khi kiểm tra và phát hiện thiết bị vẫn còn sử dụng được, giúp giảm thiểu thất thu do thiết bị hỏng Theo ma trận P, phân phối dừng Π = [1/4, 1/2, 1/4], hệ thống phải chi trung bình 6,25 nghìn đồng cho mỗi thiết bị mỗi tuần Nhờ chính sách này, hệ thống tiết kiệm được 1 nghìn đồng cho mỗi thiết bị mỗi tuần, và nếu có 2000 thiết bị, tổng số tiền tiết kiệm hàng tuần lên tới 2 triệu đồng.
Phân lớp trạng thái xích Markov
Để nắm bắt rõ hơn về xích Markov và giải quyết bài toán liên quan đến sự tồn tại của phân bố dừng cũng như phân phối giới hạn, chúng ta cần phân lớp trạng thái của xích Markov Theo định nghĩa, trạng thái i được coi là đến được trạng thái j, ký hiệu là i → j, nếu tồn tại n ≥ 0 với p_ij(n) > 0 Chúng ta cũng quy ước rằng p_ii(0) = 1.
Hai trạng thái i và j được gọi là liên lạc được nếu i → j và j → i Khi đó ta viết i ↔ j.
Quan hệ liên lạc giữa hai trạng thái i và j là một quan hệ tương đương, phân hoạch không gian trạng thái thành các lớp riêng biệt Các trạng thái trong cùng một lớp có khả năng liên lạc với nhau, trong khi các trạng thái thuộc các lớp khác nhau thì không thể liên lạc.
Ví dụ 5.18 Giả sử xích Markov {X n ; n ≥ 0} có sơ đồ chuyển trạng thái như Hình 5.1 Tìm các lớp tương đương của xích Markov này.
Nốt 1 và nốt 2 kết nối với nhau, thuộc về Lớp 1, trong khi nốt 3 và nốt 4 cũng liên lạc với nhau, tạo thành Lớp 2 Nốt 6, nốt 7 và nốt
Xích Markov được phân chia thành 4 lớp trạng thái: Lớp 1 gồm các trạng thái {1, 2}, Lớp 2 gồm {3, 4}, Lớp 3 bao gồm {6, 7, 8}, và Lớp 4 chỉ có trạng thái {5} Định nghĩa xích Markov tối giản là khi tất cả các trạng thái đều có thể liên lạc với nhau.
Hình 5.1: Sơ đồ chuyển trạng thái Ví dụ 5.18
Như vậy một xích Markov là tối giản thì không gian trạng thái không thể phân hoạch thành các lớp con nhỏ hơn.
Theo sơ đồ chuyển trạng thái trong Ví dụ 5.18, nếu xích Markov vào Lớp 3, nó sẽ luôn ở lại lớp này Ngược lại, Lớp 1 không có đặc điểm này; ví dụ, nếu bắt đầu với X0 = 1, xích Markov có thể ở lại Lớp 1 một thời gian, nhưng nếu rời khỏi Lớp 1, nó sẽ không quay lại nữa.
Trong lý thuyết xác suất, trạng thái 3 được phân loại là hồi quy, trong khi các trạng thái ở lớp 1 được gọi là không hồi quy Để làm rõ hơn, chúng ta định nghĩa f ii (n) là xác suất P (X n = i, X n−1 ̸= i, , X 1 ̸= i|X 0 = i) cho trạng thái i Ngoài ra, ký hiệu f ii ∗ cũng được sử dụng để biểu thị khái niệm này.
Xác suất để hệ thống bắt đầu từ trạng thái i và quay trở lại trạng thái i sau một số bước hữu hạn được ký hiệu là f ii (n) Trạng thái i được phân loại là hồi quy khi f ii ∗ = 1, trong khi đó, nó được coi là không hồi quy nếu f ii ∗ < 1.
Trạng thỏi hồi quy i được phân loại thành hai loại: trạng thỏi hồi quy dương khi a_i < ∞ và trạng thỏi hồi quy khụng khi a_i = ∞ Theo định lý 5.5, cho xích Markov tối giản {X_n; n ≥ 1}, ta có hai kết luận quan trọng: a) Xích Markov này sở hữu phân phối dừng duy nhất và b) Chỉ tồn tại những khả năng nhất định.
Mọi trạng thái của E là không hồi quy;
Mọi trạng thái của E là hồi quy không;
Mọi trạng thái của E là hồi quy dương.
▷ 5.1 Cho xích Markov {X n ; n ≥ 0} có P (X 1 = 3) = 1/3 và sơ đồ chuyển trạng thái:
0, 25 a) Tìm ma trận xác suất chuyển trạng thái. b) Tìm P (X 1 = 3, X 2 = 2, X 3 = 1). c) Tìm P (X 1 = 3, X 3 = 1).
▷ 5.2 Cho {X n ; n ≥ 0} là một xích Markov Chứng minh rằng với mọi m ≥ 1, ta có
Ngược lại, nếu {X n ; n ≥ 0} thỏa mãn điều kiện (5.4) với mọi m ≥ 1 thì {X n ; n ≥ 0} là một xích Markov.
▷ 5.3 Cho {X n ; n ≥ 0} là dãy biến ngẫu nhiên rời rạc, độc lập và có cùng phân phối xác suất với
Trong các dãy trên, dãy nào là xích Markov Trong trường hợp xích Markov, tìm ma trận xác suất chuyển.
▷ 5.4 Cho {X n ; n ≥ 0} là một xích Markov với không gian trạng thái E = {0, 1} và ma trận xác suất chuyển
▷ 5.5 Cho {X n ; n ≥ 0} là một xích Markov Đặt
Trong các dãy trên, dãy nào là xích Markov Trong trường hợp xích Markov, tìm ma trận xác suất chuyển.
▷ 5.6 Cho{X n ; n ≥ 0} là một xích Markov Chứng minh rằng với dãy {X n ; n ≥ 0} với điều kiện X m = r cũng là một xích Markov.
Trong bài viết này, chúng ta xem xét biến ngẫu nhiên X₀ = 0, trong đó Xₙ đại diện cho số mặt sấp xuất hiện khi tung một đồng xu cân đối n lần Định nghĩa Yₙ ≡ Xₙ (mod 10), chúng ta chứng minh rằng chuỗi (Yₙ; n ≥ 0) là một chuỗi Markov Cuối cùng, chúng ta tìm ma trận xác suất chuyển và phân phối dừng cho chuỗi này.
▷ 5.8 Cho (S n ; n ≥ 0) là đi dạo ngẫu nhiên đơn giản với S 0 = 0 (xem Ví dụ 5.1). Đặt Y n = |S n | Chứng minh (Y n ; n ≥ 0) là một xích Markov.
▷ 5.9 Cho {X n ; n ≥ 0} là xích Markov với X 0 = 0 (h.c.c.), không gian trạng thái
E = {0, 1, 2} và ma trận xác suất chuyển
Chứng minh rằng {Y n ; n ≥ 0} cũng là xích Markov Tìm ma trận xác suất chuyển của{Y n ; n ≥ 0}.
▷ 5.10 Cho {X n ; n ≥ 0} là xích Markov với ma trận xác suất chuyển
Xích Markov trên có phân phối dừng không Nếu có hãy tìm phân phối dừng đó.
▷ 5.11 Cho xích Markov {X n ; n ≥ 0} có sơ đồ chuyển trạng thái:
1 2 a) Đây có phải là xích Markov tối giản không? b) Tìm phân phối dừng. c) Phân phối dừng của xích Markov này có phải là phân phối giới hạn không?
Hồ Minh Châu, Lê Văn Dũng, và Lương Thị Mỹ Hạnh (2018) đã nghiên cứu về luật số lớn đối với tổng ngẫu nhiên có trọng số của các biến ngẫu nhiên độc lập đôi một với mô men cấp vô hạn Nghiên cứu này được công bố trong Tạp chí Khoa học Trường Đại học Sư phạm - ĐH Đà Nẵng, tập 30, số 04, trang 66–72.
[2] Nguyễn Viết Phú và Nguyễn Duy Tiến (2004), Cơ sở lý thuyết xác suất, Nhà xuất bản ĐHQG Hà Nội.
[3] Nguyễn Hải Thanh (2008), Vận trù học, Trường Đại học Nông nghiệp Hà Nội.
[4] Đặng Hùng Thắng (2006),Quá trình ngẫu nhiên và tính toán ngẫu nhiên, Nhà xuất bản ĐHQG Hà Nội.
[5] Đặng Hùng Thắng (2009), Mở đầu về lý thuyết xác suất và các ứng dụng, Nhà Xuất bản Giáo dục.
[6] Đặng Hùng Thắng (2009), Bài tập xác suất, Nhà Xuất bản Giáo dục.
[7] Nguyễn Duy Tiến (2005), Các mô hình xác suất và ứng dụng (Phần I - Xích Markov và ứng dụng), Nhà xuất bản ĐHQG Hà Nội.
[8] Nguyễn Duy Tiến và Vũ Viết Yên (2009), Lý thuyết xác suất, Nhà Xuất bản Giáo dục.
[9] Vũ Tiến Việt và Phạm Thị Hằng (2020), Xác suất thống kê và quá trình ngẫu nhiên, Nhà xuất bản ĐHQG Hà Nội.
[10] Vũ Viết Yên (2006), Bài tập lý thuyết xác suất, Nhà xuất bản Đại học Sư phạm.
[11] N Bingham, C Goldie, J Teugels (1989),Regular Variation, Cambridge Uni- versity Press.
[12] Jay L Devore (2010), Probability and Statistics for Engineering and the Sci- ences, 8th Edition, Brooks/Cole.
[13] L.V Dung , T.C Son, N.T Hai Yen (2018), Weak laws of large numbers for sequences of random variables with infinite rth moments, Acta Mathematica Hungarica, 156, 408–423.
[14] A A Georgiev , W Greblicki (1986), Nonparametric function recovering from noisy observations, J Stat Plan Inference, 13(1), 1–14.
[15] A A Georgiev (1988), Consistent nonparametric multiple regression: the fixed design case, Journal of Multivariate Analysis 25(1), 100–110.
[16] A Gut (2013),Probability: A Graduate Course, second ed., Springer.
[17] H.G M¨uller (1987), Weak and universal consistency of moving weighted av- erages, Periodica Mathematica Hungarica,18(3), 241–250.
[18] H Pishro-Nik (2014), Introduction to probability, statistics and random pro- cesses, Kappa Research, LLC.