1. Trang chủ
  2. » Luận Văn - Báo Cáo

Giáo trình lý thuyết xác suất

119 51 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Giáo Trình Lý Thuyết Xác Suất
Tác giả Tôn Thất Tú, Lê Văn Dũng, Tạ Công Sơn
Trường học Đại Học Đà Nẵng
Chuyên ngành Lý Thuyết Xác Suất
Thể loại Giáo Trình
Năm xuất bản 2022
Thành phố Đà Nẵng
Định dạng
Số trang 119
Dung lượng 789,21 KB

Cấu trúc

  • Chương 1. XÁC SUẤT (0)
    • 1.1. Không gian mẫu và biến cố (11)
      • 1.1.1. Phép thử (11)
      • 1.1.2. Không gian mẫu (11)
      • 1.1.3. Biến cố (12)
      • 1.1.4. Các phép toán trên biến cố (13)
    • 1.2. Xác suất của biến cố (14)
      • 1.2.1. σ -đại số (14)
      • 1.2.2. Độ đo xác suất (15)
    • 1.3. Các định nghĩa xác suất khác (17)
      • 1.3.1. Quan điểm cổ điển (17)
      • 1.3.2. Quan điểm thống kê (19)
      • 1.3.3. Quan điểm hình học (19)
    • 1.4. Xác suất có điều kiện (20)
    • 1.5. Công thức nhân xác suất (21)
    • 1.6. Các biến cố độc lập (22)
    • 1.7. Công thức xác suất toàn phần và công thức Bayes (24)
      • 1.7.1. Hệ đầy đủ (24)
      • 1.7.2. Công thức xác suất toàn phần và công thức Bayes (24)
    • 1.8. Công thức Bernoulli (27)
  • Chương 2. BIẾN NGẪU NHIÊN (0)
    • 2.1. Biến ngẫu nhiên (37)
    • 2.2. Hai loại biến ngẫu nhiên (38)
      • 2.2.1. Biến ngẫu nhiên rời rạc (38)
      • 2.2.2. Biến ngẫu nhiên liên tục (40)
    • 2.3. Hàm phân phối xác suất (41)
    • 2.4. Kì vọng (43)
    • 2.5. Phương sai và độ lệch chuẩn (46)
    • 2.6. Trung vị (47)
    • 2.7. Biến ngẫu nhiên độc lập (48)
    • 2.8. Một số phân phối xác suất quan trọng (49)
      • 2.8.1. Phân phối Bernoulli (49)
      • 2.8.3. Phân phối Poisson (51)
      • 2.8.4. Phân phối đều (53)
      • 2.8.5. Phân phối mũ (54)
      • 2.8.6. Phân phối chuẩn (55)
      • 2.8.7. Phân phối khi bình phương (59)
      • 2.8.8. Phân phối Student (t-distribution) (60)
      • 2.8.9. Phân phối F (61)
  • Chương 3. VECTƠ NGẪU NHIÊN (0)
    • 3.1. Định nghĩa (68)
    • 3.2. Phân bố xác suất của vectơ ngẫu nhiên (68)
      • 3.2.1. Vectơ ngẫu nhiên 2 chiều rời rạc (68)
      • 3.2.2. Vectơ ngẫu nhiên 2 chiều liên tục (71)
      • 3.2.3. Hàm phân phối xác suất đồng thời (73)
    • 3.3. Kì vọng có điều kiện (0)
      • 3.3.1. Trường hợp rời rạc (74)
      • 3.3.2. Trường hợp liên tục (75)
    • 3.4. Hiệp phương sai, hệ số tương quan (76)
  • Chương 4. CÁC ĐỊNH LÍ GIỚI HẠN (0)
    • 4.1. Các khái niệm hội tụ (84)
      • 4.1.1. Hội tụ hầu chắc chắn (84)
      • 4.1.2. Hội tụ theo xác suất (85)
      • 4.1.3. Hội tụ theo phân phối (85)
    • 4.2. Luật số lớn (87)
    • 4.3. Định lí giới hạn trung tâm (88)
    • 4.4. Luật số lớn đối với dãy biến ngẫu nhiên đôi một độc lập (92)
  • Chương 5. XÍCH MARKOV (0)
    • 5.1. Tính Markov (99)
    • 5.2. Xích Markov có không gian trạng thái hữu hạn (101)
      • 5.2.1. Ma trận xác suất chuyển và sơ đồ chuyển trạng thái (101)
      • 5.2.2. Phân phối xác suất (102)
    • 5.3. Phân phối dừng và phân phối giới hạn (107)
    • 5.4. Phân lớp trạng thái xích Markov (113)

Nội dung

XÁC SUẤT

Không gian mẫu và biến cố

Phép thử là quá trình thực hiện các điều kiện cụ thể để quan sát sự xuất hiện của một hiện tượng Mặc dù có nhiều phép thử có thể được lặp lại trong cùng một điều kiện, kết quả của chúng vẫn không thể dự đoán chính xác Những phép thử này được gọi là phép thử ngẫu nhiên Trong giáo trình này, thuật ngữ phép thử và thí nghiệm được sử dụng như nhau.

- Gieo một con xúc xắc.

- Hỏi tháng sinh của một sinh viên được chọn ngẫu nhiên.

- Đo chiều cao của một sinh viên được chọn ngẫu nhiên.

1.1.2 Không gian mẫu Định nghĩa 1.1 Tập tất cả các kết quả có thể xảy ra của một phép thử ngẫu nhiên được gọi là không gian mẫu Kí hiệu không gian mẫu là Ω.

Khi tung một đồng xu, có hai kết quả có thể xảy ra: mặt sấp (S) hoặc mặt ngửa (N) Trong trường hợp này, không gian mẫu bao gồm hai kết quả khả thi.

Ví dụ 1.3 Một nhóm có 3 học sinh A, B và C Xếp ngẫu nhiên 3 học sinh này thành một hàng dọc Không gian mẫu sẽ là:

Ω = {ABC, ACB, BAC, BCA, CAB, CBA}.

Ví dụ 1.4 Tung ngẫu nhiên một đồng xu cho đến khi mặt sấp xuất hiện thì dừng Không gian mẫu sẽ là:

Ví dụ 1.5 Quan sát số lượng hàng hóa được bán trong một ngày ở một cửa hàng Không gian mẫu sẽ là:

Biến cố ngẫu nhiên, hay còn gọi là biến cố, là những hiện tượng hoặc sự kiện có khả năng xảy ra hoặc không xảy ra trong một phép thử ngẫu nhiên Để ký hiệu cho các biến cố này, người ta thường sử dụng các chữ cái in hoa như A, B, C, và nhiều hơn nữa.

Khi một kết quả của phép thử dẫn đến sự xảy ra của biến cố A, chúng ta gọi đó là kết quả thuận lợi cho biến cố A Mỗi biến cố A được xác định bằng tập hợp các kết quả thuận lợi tương ứng, do đó, mỗi biến cố trở thành một tập con của không gian mẫu.

- Biến cố chỉ gồm một kết quả thuận lợi được gọi làbiến cố sơ cấp Không gian mẫu còn được gọi làkhông gian các biến cố sơ cấp.

- Biến cố được xem là xảy ra nếu có ít nhất một kết quả thuận lợi cho nó xuất hiện trong phép thử.

- Có 2 biến cố đặc biệt:

* Biến cố không thể (∅): là biến cố không thể xảy ra trong phép thử.

* Biến cố chắc chắn (Ω): là biến cố luôn xảy ra trong phép thử.

Ví dụ 1.6 Một hộp có 3 viên bi gồm một bi trắng (T), một bi xanh (X) và một bi vàng (V) Chọn ngẫu nhiên 2 viên bi Khi đó:

- Gọi A là biến cố chọn được bi vàng Ta có: A = {{T, V }, {X, V }}.

- Nếu khi thực hiện phép thử, ta chọn được một bi xanh và một bi vàng thì kết quả này là một kết quả thuận lợi cho biến cố A.

- Biến cố chọn được 2 bi vàng là biến cố không thể (∅).

- Biến cố chọn được bi xanh hoặc vàng là biến cố chắc chắn (Ω).

Ví dụ 1.7 Xét phép thử hỏi tháng sinh của một sinh viên được chọn ngẫu nhiên.

Biến cố sinh viên có tháng sinh 31 ngày là

Biến cố sinh viên có tháng sinh 32 ngày là ∅.

Biến cố sinh viên có tháng sinh bé hơn 32 ngày là Ω.

Ví dụ 1.8 Quan sát tuổi thọ (năm) của một thiết bị điện tử Lúc đó: Ω = {x ∈

R : x ≥ 0} Biến cố thiết bị điện tử bị hỏng trước 5 năm là A = {x ∈R : 0 ≤ x < 5}

1.1.4 Các phép toán trên biến cố

Cho A và B là hai biến cố của không gian mẫu Ω. a) Phép giao

Giao của hai biến cố A và B, kí hiệu A ∩ B (hoặc AB), là biến cố xảy ra khi và chỉ khi đồng thời hai biến cố A và B cùng xảy ra.

Giao của nbiến cố A i , i = 1, n, kí hiệu A 1 ∩ A 2 ∩ ∩ A n (hoặc A 1 A 2 A n ,∩ n i=1 A i ), là biến cố xảy ra nếu đồng thời các biến cố A i cùng xảy ra.

Nếu hai biến cố A và B không thể đồng thời xảy ra (A ∩ B = ∅) thì ta nói A và

Hợp của hai biến cố A và B, kí hiệu A ∪ B, là biến cố xảy ra khi và chỉ khi có ít nhất một trong hai biến cố A, B xảy ra.

Hợp của n biến cố A i , i = 1, n, kí hiệu A 1 ∪ A 2 ∪ ∪ A n (hoặc ∪ n i=1 A i ), là biến cố xảy ra nếu ít nhất một trong các biến cố A i xảy ra. c) Biến cố đối

Biến cố A được gọi là Ω\A, hay còn gọi là biến cố đối của A, ký hiệu là A c Khi biến cố A xảy ra, biến cố A c sẽ không xảy ra và ngược lại.

Theo Luật De Morgan, việc khai triển biến cố đối của các biến cố ∩ n i=1 A i và ∪ n i=1 A i có thể được thực hiện thông qua các biến cố đối của A i.

Hình 1.1: Biểu đồ Ven minh họa biến cố giao, biến cố hợp, biến cố đối

Trong ví dụ 1.9, chúng ta chọn ngẫu nhiên một chữ số từ tập hợp I = {0, 1, 2, , 9} Các biến cố A, B và C lần lượt đại diện cho việc chọn được chữ số chẵn, chữ số lẻ và chữ số nhỏ hơn 3.

VìA ∩ B = ∅ nên A và B là hai biến cố xung khắc.

Ví dụ 1.10 Gieo đồng thời hai con xúc xắc cân đối đồng chất.

Biến cố “tổng số chấm xuất hiện trên hai mặt của hai xúc xắc bằng 7”:

Biến cố “số chấm xuất hiện trên hai mặt của hai xúc xắc hơn kém nhau 3 đơn vị”:

Ví dụ 1.11 Xét phép thử đo tuổi thọ (đơn vị: giờ) của một thiết bị điện tử.

Ta có không gian mẫu là:

Hai xạ thủ đồng thời bắn vào một mục tiêu, trong đó A đại diện cho biến cố xạ thủ 1 bắn trúng mục tiêu và B đại diện cho biến cố xạ thủ 2 bắn trúng mục tiêu Sử dụng các biến cố A và B, chúng ta có thể diễn đạt các tình huống liên quan đến việc bắn trúng mục tiêu.

- Xạ thủ 1 không bắn trúng mục tiêu: A.

- Cả hai xạ thủ bắn trúng mục tiêu: AB.

- Có ít nhất một xạ thủ bắn trúng mục tiêu: A ∪ B.

- Có đúng một xạ thủ bắn trúng mục tiêu: AB ∪ AB.

- Không có xạ thủ nào bắn trúng mục tiêu: A B.

Xác suất của biến cố

Cho Ω là một tập hợp khác rỗng Một lớp F các tập con của Ω được gọi là σ-đại số nếu thỏa mãn 3 điều kiện:

Nhắc lại σ-đại số Borel trên R là σ-đại số bé nhất chứa tất cả các tập mở của tập số thực R được kí hiệu là B(R )

1.2.2 Độ đo xác suất Định nghĩa 1.3 Cho F là một σ-đại số trên tập Ω Hàm tập hợp P : F →R được gọi là độ đo xác suất nếu thỏa mãn 3 điều kiện:

P (A n ). Định nghĩa 1.4 Bộ ba (Ω, F , P ), trong đó:

(1) Ω là một tập khác rỗng

(2) F là một σ-đại số trên tập Ω

(3) P là một độ đo xác suất trên F được gọi là không gian xác suất Mỗi phần tử A ∈ F được gọi là biến cố và giá trị

P (A) được gọi là xác suất của biến cố A.

Mỗi biến cố A là một tập con của không gian mẫu, bao gồm tất cả các kết quả thuận lợi cho biến cố đó xảy ra Tập con này là một phần tử của F và là một tập đo được theo độ đo xác suất P Do đó, giá trị P(A) được xác định và gọi là xác suất của biến cố A.

Từ định nghĩa trên ta có một số tính chất cơ bản của xác suất như sau.

Chứng minh Từ điều kiện (3) của Định nghĩa 1.3 lấy A 1 = Ω, A n = ∅ với mọi n ≥ 2 ta được:

Chứng minh Vì Ω = A ∪ A và A ∩ A = ∅ nên

Chứng minh Vì A ⊂ B nên B = A ∪ (AB) Do đó:

□ Tính chất 1.4 Với A và B là hai biến cố bất kì,

Chứng minh Áp dụng điều kiện (3) của Định nghĩa 1.3 ta có các đẳng thức sau:

Cộng vế với vế ba đẳng thức (1.1), (1.2) và (1.3) ta được điều phải chứng minh □

Từ Tính chất 1.4 ta có tính chất tổng quát sau.

Tính chất 1.5 Cho A 1 , A 2 , , A n ∈ F Khi đó ta có

Ví dụ 1.13 Cho hai biến cốAvàB, biếtP (A) = 0, 4, P (B) = 0, 7,P (AB) = 0, 3. Tính P (A ∪ B), P (A ∪ B ), P (A ∪ B).

Mặt khác, B = AB ∪ AB nênP (B) = P (AB) + P (AB) hayP (AB) = P (B) − P (AB).

Trong một đội bóng bàn gồm hai vận động viên A và B, xác suất A vượt qua vòng bảng là 0,7, trong khi xác suất B là 0,5 Tuy nhiên, do ảnh hưởng tâm lý, xác suất cả hai vận động viên cùng vượt qua vòng bảng chỉ là 0,4 Để tính xác suất cả hai vận động viên không vượt qua vòng bảng, ta sử dụng công thức xác suất kết hợp.

Giải Gọi A, B là các biến cố vận động viên A, B vượt qua vòng bảng Ta có:

Xác suất cả hai vận động viên đều không vượt qua vòng bảng:

Ví dụ 1.15 Cho hai biến cố Avà B, biếtP (A) = 1/2, P (B) = 2/3 Chứng minh rằng 1/6 ≤ P (AB) ≤ 1/2.

Giải Ta có: P (A ∪ B ) = P (A) + P (B) − P (AB) Suy ra:

Các định nghĩa xác suất khác

Giả sử không gian mẫu Ω là một tập vô hạn đếm được có dạng:

Ω = {ω 1 , ω 2 , ω 3 , }. Đặt p i = P ({ω i }), i ≥ 1 Khi đó: P+∞ i=1 p i = 1 Với biến cố A bất kì, xác suất của biến cố A được xác định:

Ví dụ 1.16 Một người chơi một trò chơi với xác suất 1/2 k sẽ thắng đượck − 2 đô la, k ∈N = {1, 2, 3, } Tính xác suất người này thắng ít nhất 3 đô la.

Trong ví dụ này, trò chơi được xem như một phép thử, và kết quả của phép thử là số tiền mà người chơi thu được Do đó, không gian mẫu bao gồm tất cả các kết quả khả thi từ trò chơi này.

Lúc đó, ta có thể xem:

Gọi A là biến cố người này thắng ít nhất 3 đô la Ta có: A = {3, 4, 5, 6, } Từ đó, ta được:

Xét trường hợp đặc biệt khi không gian mẫu Ω hữu hạn với các kết quả đồng khả năng Giả sử:

N Với mọi biến cố A, ta có:

Xác suất theo quan điểm cổ điển được định nghĩa trong bối cảnh của phép thử ngẫu nhiên với không gian mẫu Ω hữu hạn và các kết quả đồng khả năng Cụ thể, nếu |A| là số phần tử của tập A, thì xác suất của biến cố A được xác định dựa trên số lượng phần tử của nó.

|Ω| , trong đó |A| là số phần tử của tập A.

Ví dụ 1.17 Gieo ngẫu nhiên 2 con xúc xắc cân đối Tính xác suất tổng số chấm xuất hiện bằng 8.

Giải Gọi A là biến cố tổng số chấm xuất hiện bằng 8 Ta có:

Xác suất của biến cố A:

Ví dụ 1.18 Một lớp có 20 sinh viên, trong đó có 10 sinh viên biết tiếng Anh,

Trong một nhóm gồm 12 sinh viên biết tiếng Pháp và 7 sinh viên biết cả tiếng Anh lẫn tiếng Pháp, khi chọn ngẫu nhiên một sinh viên, xác suất để sinh viên đó biết ít nhất một ngoại ngữ (tiếng Anh hoặc tiếng Pháp) được tính toán Số lượng sinh viên biết ít nhất một trong hai ngoại ngữ là tổng số sinh viên biết tiếng Pháp cộng với số sinh viên biết cả hai thứ tiếng, trừ đi số sinh viên chỉ biết tiếng Pháp Từ đó, ta có thể xác định xác suất mà sinh viên được chọn biết ít nhất một ngoại ngữ.

Giải Gọi A là biến cố chọn được sinh viên biết tiếng Anh, B là biến cố chọn được sinh viên biết tiếng Pháp Xác suất cần tìm:

Trong phép thử G, khi thực hiện n phép thử và biến cố A xuất hiện m lần, tỉ số f n = m/n được gọi là tần suất xuất hiện của A Khi số phép thử n tiến đến vô hạn, tần suất f n sẽ hội tụ đến giá trị p, và giá trị này được xác định là xác suất của biến cố A.

Trong thực tế, khi n lớn, ta có thể xem: p = P (A) ≈ f n

Trong định nghĩa 1.2, chúng ta nhận thấy sự hội tụ của tỷ số \( f_n \) Khái niệm hội tụ hầu chắc chắn cùng với cơ sở toán học cho sự hội tụ này sẽ được trình bày chi tiết trong chương 4.

Khi đánh giá xác suất mắc bệnh X ở những người có triệu chứng A, một khảo sát trên 2000 bệnh nhân cho thấy có 1460 người mắc bệnh X Từ đó, tỷ lệ f được tính toán là 1460/2000, tương đương với 73% Dựa vào dữ liệu này, ta có thể kết luận rằng xác suất một người có triệu chứng A sẽ mắc bệnh X là 73%.

1.3.3 Quan điểm hình học Định nghĩa 1.6 Giả sử không gian mẫu Ωlà một miền đo được (trên đường thẳng, trong mặt phẳng, không gian ba chiều, ) và S là một miền con đo được của Ω Ta lấy ngẫu nhiên một điểm trong miền Ω và đặt A là biến cố M ∈ S Khi đó, xác suất của biến cố A được xác định như sau:

P (A) = m(S) m(Ω) , trong đó m(S), m(Ω) là số đo của miền S và Ω Cụ thể,

- Nếu Ω là đường cong hay đoạn thẳng thỡ m(ã) là hàm chỉ độ dài.

- Nếu Ω là hỡnh phẳng hay mặt cong thỡ m(ã) là hàm chỉ diện tớch.

- Nếu Ω là hỡnh khối 3 chiều thỡ m(ã) là hàm chỉ thể tớch.

Khi lấy ngẫu nhiên một điểm M trong hình vuông có cạnh dài 2m, ta cần tính xác suất điểm M rơi vào hình tròn nội tiếp của hình vuông Hình tròn nội tiếp có bán kính bằng 1m, do đó xác suất để điểm M nằm trong hình tròn này có thể được xác định thông qua tỷ lệ diện tích của hình tròn so với diện tích của hình vuông.

- Diện tích của hình vuông:m(Ω) = 4(m 2 )

Theo quan điểm hình học, xác suất của biến cố A cần tìm:

Từ ví dụ trên, chúng ta có thể xác định rằng π = 4P(A) Khi thực hiện một phép thử với số lượng lớn n và có m lần điểm M rơi vào hình tròn, ta có thể ước lượng P(A) ≈ m/n, từ đó suy ra π ≈ 4m/n Điều này cho thấy rằng các phép mô phỏng ngẫu nhiên có thể được sử dụng để tính xấp xỉ giá trị của số π.

Xác suất có điều kiện

Trong một lớp học Triết học với 17 sinh viên nam và 13 sinh viên nữ, có 12 sinh viên nam và 11 sinh viên nữ đã thi đỗ môn học này.

- Chọn ngẫu nhiên một sinh viên, xác suất sinh viên đó thi qua môn Triết học là 23/30.

- Nếu chọn ngẫu nhiên một sinh viên nam thì xác suất sinh viên đó thi qua môn Triết học sẽ là 12/17.

Xác suất A, biểu thị khả năng sinh viên thi qua môn Triết học, không bằng xác suất B, điều kiện sinh viên được chọn là nam Để phân biệt hai xác suất này, ta ký hiệu P(A|B)/17, đại diện cho xác suất của biến cố A dưới điều kiện B.

P (B) Định nghĩa 1.7 Cho không gian xác suất (Ω, F , P) và hai biến cố A, B ∈ F với P (B) ̸= 0 Xác suất của A với điều kiện B đã xảy ra, kí hiệu P (A|B), xác định bởi

Nhận xột 1.4 Hàm P (ã|B) : F → [0, 1] xỏc định như định nghĩa ở trờn là một độ đo xác suất trong không gian(Ω, F ).

Trong một khu vực dân cư, tỷ lệ người hút thuốc là 60%, trong khi 35% trong số đó vừa hút thuốc vừa mắc bệnh viêm phổi Khi chọn ngẫu nhiên một người hút thuốc trong khu vực này, chúng ta cần xác định xác suất người đó bị viêm phổi.

Giải Gọi A là biến cố người được chọn hút thuốc, B là biến cố người được chọn bị viêm phổi Xác suất để người này bị viêm phổi là:

Trong một bài thi kéo dài 2 giờ, xác suất để một sinh viên hoàn thành bài thi trong thời gian ít hơn x giờ được xác định là x/4 Nếu sau 1,5 giờ, sinh viên vẫn còn làm bài, chúng ta cần tính xác suất rằng sinh viên sẽ sử dụng toàn bộ 2 giờ để hoàn thành bài thi.

Giải Kí hiệu A x là biến cố sinh viên đó hoàn thành bài thi ít hơn x (giờ) với

0 ≤ x ≤ 2, B là biến cố sinh viên đó sử dụng toàn bộ 2 (giờ) để làm bài thi Xác suất cần tính là

□ Các tính chất sau dễ dàng suy ra từ định nghĩa.

3) Nếu (A i ; 1 ≤ i ≤ n) là các biến cố đôi một xung khắc thì:

Công thức nhân xác suất

Định lí 1.1 Cho A 1 , A 2 , , A n là các biến có của không gian mẫu Ω thỏa mãn

Trong một hộp có 4 chiếc bút mới và 6 chiếc bút cũ, mỗi ngày người dùng sẽ ngẫu nhiên lấy ra một chiếc bút để sử dụng và trả lại vào cuối ngày Câu hỏi đặt ra là tính xác suất để sau 3 ngày sử dụng, hộp còn lại đúng 1 bút mới, và sau 2 ngày sử dụng, hộp còn lại đúng 3 bút mới.

Giải Kí hiệu A k là biến cố ngày thứ k lấy được bút mới. a) P (A 1 A 2 A 3 ) = P (A 1 )P (A 2 |A 1 )P (A 3 |A 1 A 2 ) = 4

10 = 0, 24. b) Biến cố sau 2 ngày sử dụng hộp còn đúng 3 bút mới là A 1 A 2 ∪ A 1 A 2 , nên:

Trong một trường đại học, có 40% sinh viên theo học tiếng Anh và 30% học tiếng Pháp Trong số sinh viên học tiếng Anh, 55% cũng học tiếng Pháp Khi chọn ngẫu nhiên một sinh viên đã biết học tiếng Pháp, ta cần tính xác suất để sinh viên đó cũng học tiếng Anh.

Giải Gọi A là biến cố chọn được sinh viên biết tiếng Anh, B là biến cố chọn được sinh viên biết tiếng Pháp.

Các biến cố độc lập

Hai biến cốA và B độc lập nếu việc xảy ra hay không xảy ra biến cố này không làm thay đổi xác suất xảy ra của biến cố kia.

P (A|B) = P (A) hoặc P (B|A) = P (B). Điều này tương đương với:

Từ đó ta định nghĩa hai biến cố độc lập như sau. Định nghĩa 1.8 Hai biến cố A và B được gọi là độc lập nếu

Trong trường hợp tổng quát, một tập hợp hữu hạn các biến cố {A1, A2, , An} (với n ≥ 2) được xem là độc lập nếu đối với mọi k (2 ≤ k ≤ n), các biến cố A n1, A n2, , A nk (với 1 ≤ n1 < n2 < < nk ≤ n) thỏa mãn điều kiện độc lập.

Một tập con các biến cố của một tập hữu hạn các biến cố độc lập cũng sẽ độc lập Đối với trường hợp n = 3, ba biến cố A, B, C được coi là độc lập khi và chỉ khi chúng thỏa mãn bốn đẳng thức nhất định.

P (ABC) = P (A)P (B)P (C). Định lí 1.2 Nếu A và B độc lập thì A và B, A và B, A và B là những cặp biến cố độc lập.

Chứng minh Giả sửA và B là hai biến cố độc lập, ta chứng minh A và B độc lập. Việc chứng minhA và B, A và B độc lập hoàn toàn tương tự.

Theo định nghĩa hai biến cố độc lập, ta có:

Vì vậy A và B độc lập □

Nhận xét 1.5 Từ Định lí 1.2, ta có: Nếu A 1 , A 2 , , A n là các biến cố độc lập thì các biến cốB 1 , B 2 , , B n , trong đó B i là A i hoặc A i , cũng độc lập.

Trong bài toán xác suất, hộp I chứa 3 bi đỏ và 7 bi xanh, trong khi hộp II có 6 bi đỏ và 4 bi xanh Để tính xác suất lấy được hai viên bi cùng màu đỏ, ta cần xác định xác suất lấy bi đỏ từ cả hai hộp Ngược lại, để tìm xác suất lấy được 1 bi xanh và 1 bi đỏ, ta sẽ tính xác suất lấy bi đỏ từ một hộp và bi xanh từ hộp còn lại.

Giả sử A là biến cố lấy được viên bi màu đỏ từ hộp I và B là biến cố lấy được viên bi màu đỏ từ hộp II Hai biến cố A và B là độc lập với nhau Do đó, xác suất xảy ra đồng thời của A và B được tính bằng tích của xác suất của từng biến cố: P(AB) = P(A) * P(B) = 3.

Một nồi hơi có ba van bảo hiểm hoạt động độc lập với xác suất hỏng của từng van lần lượt là 0,1, 0,2 và 0,3 trong khoảng thời gian T Để nồi hơi hoạt động an toàn, ít nhất một van phải không hỏng Do đó, xác suất để nồi hơi hoạt động an toàn trong khoảng thời gian T có thể được tính toán dựa trên xác suất hỏng của từng van.

Giải Gọi A i là biến cố van i bị hỏng trong khoảng thời gian T, i = 1, 2, 3 Ta có A 1 , A 2 , A 3 độc lập và

Xác suất để nồi hơi hoạt động an toàn trong khoảng thời gian T:

Biến cố độc lập được định nghĩa yếu hơn so với khái niệm độc lập trong Định nghĩa 1.9 Cụ thể, một tập hợp hữu hạn các biến cố {A1; A2; , An} (với n ≥ 2) được coi là đôi một độc lập nếu với mọi i khác j, điều kiện độc lập được thỏa mãn.

Nhận xét 1.6 Các biến cố A 1 , A 2 , , A n độc lập thì chúng độc lập đôi một. Tuy nhiên, điều ngược lại nói chung là không đúng.

Ví dụ 1.27 Cho tập hợp 4 điểm trong không gian

Chọn ngẫu nhiên một điểm trong tập này Gọi A i là biến cố tọa độ thứ i của điểm được chọn bằng 1, i = 1, 3 Lúc đó:

Do đó, P (A i A j ) = P (A i )P (A j ), i ̸= j, i, j = 1, 3 nên các biến cố A i độc lập đôi một, nhưng chúng không độc lập vì

Công thức xác suất toàn phần và công thức Bayes

1.7.1 Hệ đầy đủ Định nghĩa 1.11 Một hệ gồm n biến cố E 1 , E 2 , , E n được gọi là hệ đầy đủ nếu thỏa mãn hai điều kiện:

(i) E i ∩ E j = ∅ nếu i ̸= j (các biến cố đôi một xung khắc);

(ii) E 1 ∪ E 2 ∪ ∪ E n = Ω (chắc chắn có 1 biến cố xảy ra).

Nhận xét 1.7 Từ định nghĩa hệ đầy đủ ta suy ra: Nếu E 1 , E 2 , , E n là hệ đầy đủ thì:

Tuy nhiên, điều ngược lại nói chung là không đúng.

Ví dụ 1.28 Cho A và B là hai biến cố bất kỳ Khi đó, các hệ {∅, Ω}, {A, A}, {AB, AB, AB, A B} là các hệ đầy đủ.

Ví dụ 1.29 Trong hộp có 3 bi đỏ và 2 bi trắng Lấy ngẫu nhiên 3 viên bi Gọi

H i là biến cố lấy được i bi trắng, i = 0, 2 Khi đó hệ {H 0 , H 1 , H 2 } là đầy đủ.

1.7.2 Công thức xác suất toàn phần và công thức Bayes Định lí 1.3 Giả sử {E i ; 1 ≤ i ≤ n} là một hệ đầy đủ sao cho P (E i ) > 0, A là biến cố bất kì Khi đó:

P (A) = P (E 1 )P (A|E 1 ) + P (E 2 )P (A|E 2 ) + + P (E n )P (A|E n ) (1.4) Nếu thêm điều kiện P (A) > 0 thì

P (E 1 )P (A|E 1 ) + + P (E n )P (A|E n ) (1.5) Công thức (1.4) được gọi là công thức xác suất toàn phần (hay công thức xác suất đầy đủ) Công thức (1.5) được gọi là công thức Bayes.

Chứng minh Để chứng minh (1.4) ta có

Do AE 1 , AE 2 , , AE n đôi một xung khắc nên

Từ tính chất xác suất có điều kiện và (1.4) ra có ngay (1.5) □

Trong bài toán xác suất này, có hai hộp bi: Hộp I chứa 4 bi xanh, 3 bi đỏ và 2 bi vàng, trong khi Hộp II có 5 bi xanh, 2 bi đỏ và 3 bi vàng Sau khi lấy ngẫu nhiên một viên bi từ Hộp I và cho vào Hộp II, ta sẽ tiến hành lấy ngẫu nhiên hai viên bi từ Hộp II Mục tiêu là tính xác suất để hai viên bi được lấy ra ở lần thứ hai đều là bi xanh.

Giải Gọi E là biến cố viên bi lấy từ hộp I bỏ vào hộp II là bi xanh, A là biến cố 2 viên bi lấy lần 2 là 2 viên bi xanh.

Một nhà máy có ba phân xưởng sản xuất với tỷ lệ sản phẩm lần lượt là 50% từ phân xưởng I, 30% từ phân xưởng II và 20% từ phân xưởng III Tỷ lệ phế phẩm của từng phân xưởng là 2%, 1% và 3% Để tính xác suất sản phẩm lấy ra là phế phẩm, ta cần xem xét tỷ lệ phế phẩm của từng phân xưởng Nếu sản phẩm được lấy ra là chính phẩm, ta sẽ tính xác suất để xác định sản phẩm đó thuộc về phân xưởng I.

Giải Gọi E 1 , E 2 , E 3 lần lượt là các biến cố sản phẩm lấy ra là của phân xưởng

I, II và III Khi đó: {E 1 , E 2 , E 3 } là hệ đầy đủ. a) Gọi A là biến cố sản phẩm lấy ra là phế phẩm Theo công thức xác suất toàn phần:

Nhận xét 1.8 Công thức xác suất toàn phần và công thức Bayes có ý nghĩa như sau:

- Công thức xác suất toàn phần giúp ta tính xác suất xảy ra của một biến cố dựa vào một hệ đầy đủ các giả thiết chi phối nó.

Các xác suất tiên nghiệm P(E₁), , P(Eₙ) được xác định trước khi tiến hành phép thử, trong khi các xác suất hậu nghiệm P(E₁|A), , P(Eₙ|A) được xác định sau khi phép thử và biến cố A đã xảy ra Công thức Bayes được sử dụng để tính toán xác suất hậu nghiệm, cho phép đánh giá lại xác suất xảy ra của các giả thiết khi đã biết kết quả của phép thử là biến cố A.

Một công ty sản xuất một loại sản phẩm bằng hai máy, trong đó máy I có tỉ lệ phế phẩm 3% và máy II có tỉ lệ phế phẩm 2% Sản phẩm từ máy I chiếm 2/3 tổng sản phẩm, trong khi máy II chiếm 1/3 Để tính tỉ lệ phế phẩm chung của công ty, cần xem xét tỉ lệ phế phẩm của từng máy và tỷ lệ sản phẩm mà mỗi máy đóng góp vào tổng sản phẩm.

Giải Chọn ngẫu nhiên 1 sản phẩm GọiE là biến cố chọn được sản phẩm của nhà máy I, A là biến cố chọn được phế phẩm.

Vậy tỉ lệ phế phẩm của công ty là 2,7% □

Trong một nhóm gồm 3 người nhưng chỉ có 2 vé xem bóng đá, cách chia vé được thực hiện bằng cách sử dụng 3 phiếu: 2 phiếu ghi số 1 và 1 phiếu ghi số 0 Mỗi người sẽ lần lượt rút phiếu ngẫu nhiên mà không hoàn lại Để tính xác suất người rút phiếu thứ 2 nhận được vé, ta cần phân tích các khả năng Đồng thời, cần xem xét tính công bằng của phương pháp phân chia này.

Giải Gọi A i là biến cố người rút thứ i được vé, i = 1, 2, 3. a) Ta có {A 1 , A ¯ 1 } là nhóm đầy đủ Do đó:

= 2/3 1/2 + 1/3 2/2 = 2/3. b) Ta có P (A 1 ) = P (A 2 ) = 2/3, cần tính P (A 3 ) Mặt khác,

Vậy, việc làm trên là công bằng □

Công thức Bernoulli

Định nghĩa 1.12 Dãy n phép thử được gọi là dãy n phép thử Bernoulli nếu thỏa mãn các điều kiện sau:

- Các phép thử độc lập

- Trong mỗi phép thử chỉ xảy ra một trong hai biến cố, kí hiệu A (thành công) và A ¯ (thất bại).

- Xác suất xuất hiện biến cố A là p = P (A) không đổi trong các phép thử. Định lí 1.4 Xét dãy n phép thử Bernoulli với xác suất xảy ra biến cố A là

P (A) = p ∈ (0; 1) Khi đó, xác suất có đúng k lần xảy ra biến cố A là: p n (k) = C n k p k (1 − p) n−k

Chứng minh Khi thực hiện phép thử n lần độc lập, có đúng k lần xảy ra biến cố

Xác suất để biến cố A xảy ra đúng k lần trong n lần thử nghiệm được tính bằng công thức p n (k) = C n k [P (A)] k [P (A)] n−k Trong đó, C n k là số cách chọn k lần xảy ra biến cố A từ n lần thử nghiệm, và P (A) là xác suất xảy ra biến cố A Do đó, xác suất này có thể được biểu diễn dưới dạng C n k p k (1 − p) n−k.

Trong ví dụ 1.34, tín hiệu thông tin được phát đi ba lần độc lập với xác suất nhận thông tin thành công mỗi lần là 0.4 Câu a) yêu cầu tìm xác suất để nguồn thu nhận được thông tin đúng 2 lần Câu b) tìm xác suất để nguồn thu nhận được thông tin ít nhất một lần Cuối cùng, câu c) đặt ra câu hỏi về số lần phát tín hiệu tối thiểu cần thiết để xác suất nhận được thông tin đạt ít nhất 0.99.

Mô hình dãy phép thử Bernoulli với n = 3 và p = 0,4 cho thấy xác suất nhận được thông tin đúng 2 lần là 0,288 Ngoài ra, xác suất nhận được ít nhất một thông tin đúng là 0,784 Để đạt được xác suất p_n(k ≥ 1) ≥ 0,99, cần đảm bảo rằng 1 − p_n(0) ≥ 0,99.

Trong năm học vừa qua, tại một trường đại học, tỷ lệ sinh viên thi trượt môn Toán là 34% và môn Lý là 20% Đặc biệt, trong số sinh viên trượt môn Toán, có 50% cũng trượt môn Lý Để đảm bảo với xác suất không nhỏ hơn 99% rằng sẽ có ít nhất một sinh viên đậu cả hai môn Toán và Lý, cần phải xác định số lượng sinh viên tối thiểu cần chọn từ trường này.

Giải Gọi T, L là các biến cố sinh thi trượt môn Toán, Lý tương ứng Ta có:

Xác suất thi đậu cả 2 môn:

Gọin là số sinh viên cần khảo sát Ta có mô hình Bernoulli với n phép thử và xác suất p = 0, 63 Theo giả thiết: p n (k ≥ 1) = 1 − p n (0) ≥ 0, 99 ⇔ (1 − 0, 63) n ≤ 0, 01 ⇔ n ≥ 4, 63 ⇒ n = 5.

□ Định lí 1.5 Cho n ∈Z, n ≥ 1 và p ∈ (0; 1) Hàm số p n (k) = C n k p k (1 − p) n−1 với k ∈ {0, 1, 2 , n} đạt giá trị lớn nhất tại k =

Xạ thủ có xác suất bắn trúng mục tiêu là 0,6 và thực hiện 20 phát bắn độc lập Để xác định số lần bắn trúng mục tiêu có xác suất lớn nhất, ta áp dụng quy tắc xác suất Với xác suất thành công là 0,6, số lần trúng đích kỳ vọng sẽ là 20 x 0,6 = 12 Do đó, số lần bắn trúng mục tiêu có xác suất lớn nhất là 12 lần.

Giải (n + 1)p = 21.0, 6 = 12, 6 ̸∈ Z nên số lần bắn trúng mục tiêu có xác suất lớn nhất là k = 12 □

▷ 1.1 Cho A n , n ≥ 1 là dãy các biến cố Chứng minh a) S∞ i=1 A i =T∞ i=1 A i b) T∞ i=1 A i =S∞ i=1 A i

▷ 1.2 Chứng minh nếu A, B ∈ F thì A \ B ∈ F, trong đó

▷ 1.3 Chứng minh nếu A, B ∈ F và A ⊂ B thì

▷ 1.5 Chứng minh nếu A, B ∈ F và A ⊂ B thì P (A) ≤ P (B).

▷ 1.7 Cho {A n , n ≥ 1} ⊂ F thỏa mãn :A 1 ⊂ A 2 ⊂ ⊂ A n ⊂ Chứng minh

▷ 1.8 Cho {A n , n ≥ 1} ⊂ F thỏa mãn :A 1 ⊃ A 2 ⊃ ⊃ A n ⊃ Chứng minh

▷1.9 ChoA, B, C là 3 biến cố thỏaP (A) ≥ 0, 9; P (B) ≥ 0, 8và P (ABC ) = 0 Chứng minh rằngP (C) ≤ 0, 3.

▷ 1.10 Cho 3 biến cố A, B, C trong đó P (C) > 0, P (AC) > 0 Chứng minh:

▷ 1.11 Cho A ∈ F sao cho P (A) ̸= 0 Xác định một hàm tập P A như sau: với mỗi

B ∈ F, P A (B ) = P (B|A) Chứng minh P A cũng là một độ đo xác suất trên F.

▷ 1.12 Chứng minh rằng nếu A và B độc lập thì A và B c , A c và B, A c và B c cũng là những cặp biến cố độc lập.

▷ 1.13 Cho A, B là hai biến cố độc lập và A ⊂ B Chứng minh rằngP (A) = 0 hoặc

▷ 1.14 Chứng minh {A\B, AB, AB, AB} và {A, AB, AB} là các hệ đầy đủ.

▷ 1.15 Chứng minh công thức xác suất toàn phần và công thức Bayes.

▷ 1.16 Cho biến cố A và nhóm biến cố {E 1 , E 2 , , E n } xung khắc đôi một thoả điều kiệnA ⊂ E 1 ∪ E 2 ∪ ∪ E n , P (E i ) > 0 ∀i Lúc đó, ta cũng có:

▷ 1.17 Gieo đồng thời 2 con xúc xắc Tính xác suất: a) Tổng số chấm xuất hiện trên 2 con là 7. b) Số chấm xuất hiện trên 2 con hơn kém nhau 2.

▷ 1.18 Một nhà khách có 6 phòng đơn Có 10 khách đến thuê phòng, trong đó có

6 nam và 4 nữ Người quản lí chọn 6 người Tính xác suất: a) Cả 6 người đều là nam. b) Có 4 nam và 2 nữ. c) Có ít nhất 2 nữ. d) Có ít nhất 1 nữ.

▷ 1.19 Một hộp đựng 6 quả cầu trắng, 4 quả cầu đỏ và 2 quả cầu đen Chọn ngẫu nhiên 6 quả cầu Tìm xác suất để chọn được 3 quả trắng, 2 đỏ và 1 đen.

Trong một bộ thẻ đánh số từ 1 đến 30, có 30 tấm thẻ Khi chọn ngẫu nhiên 10 tấm thẻ, xác suất để tất cả 10 tấm đều mang số chẵn là một bài toán xác suất thú vị Đồng thời, xác suất để có đúng 5 tấm thẻ mang số chia hết cho 3 cũng là một phần quan trọng trong việc phân tích xác suất trong tình huống này.

Trong một quốc gia có 50 tỉnh, mỗi tỉnh đại diện bởi 2 đại biểu Quốc hội, việc chọn ngẫu nhiên 50 đại biểu từ tổng số 100 đại biểu để thành lập một ủy ban tạo ra nhiều khả năng khác nhau Để tính xác suất có ít nhất 1 đại biểu từ thủ đô trong ủy ban, cần xem xét số lượng đại biểu từ thủ đô và các tỉnh khác Đồng thời, xác suất để mỗi tỉnh đều có đúng 1 đại biểu trong ủy ban cũng cần được phân tích dựa trên cách chọn đại biểu từ mỗi tỉnh.

Để giải bài toán, trước tiên, ta viết các chữ số từ 1 đến 9 lên các tấm phiếu và sắp xếp chúng ngẫu nhiên a) Tính xác suất để tạo thành một số chẵn từ dãy số này b) Từ 9 tấm phiếu, chọn ngẫu nhiên 4 tấm và xếp chúng thành hàng, sau đó tính xác suất để tạo thành một số chẵn.

▷ 1.23 Bộ bài có 52 lá, trong đó có 4 lá Át Lấy ngẫu nhiên 3 lá Tính xác suất: a) Có 1 lá Át. b) Có 2 lá Át. c) Có ít nhất 1 lá Át.

▷ 1.24 Một bình có 10 bi, trong đó có 3 bi đỏ, 4 bi xanh, 3 bi đen Lấy ngẫu nhiên

4 viên Tính xác suất: a) Có đúng 2 bi xanh. b) Có 1 bi xanh, 1 bi đỏ và 2 bi đen.

Trong bài toán xác suất này, chúng ta có 15 sản phẩm, bao gồm 3 phế phẩm, được phân phối ngẫu nhiên vào 3 hộp I, II, III, mỗi hộp chứa 5 sản phẩm Để tính xác suất cho các trường hợp cụ thể: (a) xác suất hộp thứ I chỉ có 1 phế phẩm; (b) xác suất tất cả các hộp đều có phế phẩm; và (c) xác suất tất cả phế phẩm đều nằm trong hộp thứ III.

Một cửa hàng đồ điện nhập một lô bóng đèn điện, mỗi hộp chứa 12 chiếc, trong đó có 4 bóng bị hỏng Chủ cửa hàng kiểm tra chất lượng bằng cách chọn ngẫu nhiên 3 bóng để thử nghiệm Nếu cả 3 bóng đều tốt, hộp bóng điện sẽ được chấp nhận Để tìm xác suất một hộp bóng điện được chấp nhận, cần tính toán xác suất chọn được 3 bóng tốt từ 8 bóng tốt còn lại trong hộp.

Trong đề cương ôn tập môn học, có tổng cộng 10 câu hỏi lý thuyết và 30 bài tập Đề thi sẽ bao gồm 1 câu hỏi lý thuyết và 3 bài tập được chọn ngẫu nhiên từ đề cương Học sinh A đã học 4 câu lý thuyết và 12 bài tập trong đề cương này.

Khi học sinh A chọn ngẫu nhiên một đề thi từ các đề thi được tạo ra, xác suất để học sinh A không trả lời được câu lý thuyết là một yếu tố quan trọng cần tính toán Ngoài ra, xác suất học sinh A chỉ trả lời được 2 câu bài tập cũng cần được xem xét Cuối cùng, để xác định khả năng đạt yêu cầu của học sinh A, cần tính xác suất khi học sinh A trả lời đúng câu hỏi lý thuyết và ít nhất 2 bài tập.

Để tính xác suất cho vé xổ số 5 chữ số từ 0 đến 9, ta có thể phân tích các trường hợp sau: a) Xác suất vé không có chữ số 1 là số cách chọn 5 chữ số từ 0 đến 9 mà không có chữ số 1, tức là từ 0 đến 9 trừ 1, cho ra tổng số cách là 9^5 b) Xác suất vé không có chữ số 2 cũng tương tự, với tổng số cách là 9^5 c) Xác suất vé không có chữ số 1 hoặc không có chữ số 2 được tính bằng cách sử dụng nguyên lý bao hàm - loại trừ, với tổng số cách là 8^5 cho trường hợp không có chữ số 1, 8^5 cho trường hợp không có chữ số 2, và 7^5 cho trường hợp không có cả hai chữ số 1 và 2.

▷ 1.29 Xếp ngẫu nhiên 5 người A, B, C, D và E vào một cái bàn dài có 5 chỗ ngồi, tính xác suất: a) A và B đầu bàn. b) A và B cạnh nhau.

Một máy bay có ba bộ phận A, B, C với tầm quan trọng khác nhau: A chiếm 15%, B chiếm 30%, và C chiếm 55% diện tích máy bay Máy bay sẽ rơi nếu bị trúng 1 viên đạn vào A, 2 viên đạn vào B, hoặc 3 viên đạn vào C Khi bắn 3 phát vào máy bay, xác suất máy bay rơi sẽ được tính toán dựa trên các trường hợp sau: a) máy bay bị trúng 2 viên đạn; b) máy bay bị trúng 3 viên đạn.

Một công ty sử dụng hai hình thức quảng cáo: quảng cáo trên đài phát thanh và quảng cáo trên tivi Theo thống kê, 25% khách hàng biết thông tin quảng cáo qua tivi, 34% qua đài phát thanh, và 10% biết thông tin qua cả hai hình thức Khi chọn ngẫu nhiên một khách hàng, xác suất khách hàng đó biết thông tin quảng cáo của công ty là tổng xác suất của từng nhóm khách hàng, bao gồm cả những người biết qua cả hai hình thức.

BIẾN NGẪU NHIÊN

Biến ngẫu nhiên

Trước hết ta xét ví dụ sau:

Trong phép thử ngẫu nhiên khi tung đồng thời hai con xúc xắc, ta định nghĩa X là tổng số chấm trên mặt xuất hiện của cả hai con xúc xắc Không gian mẫu cho phép thử này bao gồm tất cả các kết quả có thể xảy ra từ việc tung hai xúc xắc.

Trong bài viết này, ta xem xét không gian mẫu Ω = {(m; n) : m = 1, 6; n = 1, 6}, với X là ánh xạ từ không gian mẫu vào tập số thực R, được xác định bởi X((m, n)) = m + n X không chỉ là một ánh xạ thông thường mà còn mang tính chất ngẫu nhiên, vì giá trị của X phụ thuộc vào kết quả của phép thử tung xúc xắc Do đó, X được gọi là biến ngẫu nhiên.

Ta có định nghĩa tổng quát sau: Định nghĩa 2.1 Cho không gian xác suất (Ω, F , P ) Ánh xạ X : Ω →R được gọi là biến ngẫu nhiên nếu với mọi A ∈ B(R ) :

X −1 (A) = {ω ∈ Ω : X(ω) ∈ A} ∈ F Tập tất cả các giá trị của X được gọi là miền giá trị của X và kí hiệu là X(Ω).

Trong ví dụ 2.2, chúng ta tung một đồng xu cho đến khi xuất hiện mặt sấp và dừng lại, với X là số lần tung Ký hiệu mặt sấp là S và mặt ngửa là N Không gian mẫu được xác định là Ω = {S, N, S, N, N, S, }, cùng với σ-đại số F là tập hợp tất cả các tập con của Ω.

Xét ánh xạ X : Ω →R xác định như sau:

Với mọi A ∈ B(R ) , X −1 (A) là một tập con của Ω nên X −1 (A) ∈ F Vậy, X là biến ngẫu nhiên.

Ví dụ 2.3 Chọn ngẫu nhiên một sinh viên của trường đại học A, gọi X là chiều cao của sinh viên đó.

Ta có không gian mẫu Ω = {toàn bộ sinh viên của đại học A}, σ-đại số F là tập tất cả các tập con của Ω.

Khi đó với mỗi sv ∈ Ω, X(sv) = chiều cao của sv Tương tự Ví dụ 2.2 ta có X là biến ngẫu nhiên.

Nhận xét 2.1 Để cho gọn trong trình bày, với A ⊂R, ta kí hiệu:

Hai loại biến ngẫu nhiên

2.2.1 Biến ngẫu nhiên rời rạc Định nghĩa 2.2 Nếu biến ngẫu nhiên X có miền giá trị có số lượng hữu hạn hoặc vô hạn đếm được thì X được gọi là biến ngẫu nhiên rời rạc.

Giả sử biến ngẫu nhiên rời rạc X có miền giá trị X(Ω) = {x 1 , x 2 , }, hàm số p(x) xác định bởi: p(x) =

Hàm xác suất (probability mass function) của biến ngẫu nhiên X được định nghĩa khi x không thuộc tập X(Ω) Đối với trường hợp X(Ω) hữu hạn, chúng ta có thể xây dựng bảng các giá trị của p(x) với các giá trị x như x1, x2, , xn và xác suất tương ứng P(X = x1), P(X = x2), , P(X = xn).

P P (X = x 1 ) P (X = x 2 ) P (X = x n ) Bảng trên được gọi là bảng phân phối xác suất của biến ngẫu nhiên X.

Trong ví dụ 2.4, chúng ta có một hộp chứa 3 viên bi xanh và 4 viên bi đỏ, với kích thước và khối lượng giống nhau Khi lấy ngẫu nhiên 3 viên bi từ hộp, biến ngẫu nhiên X được định nghĩa là số viên bi xanh trong 3 viên bi được chọn Để giải bài toán này, đầu tiên cần lập bảng phân phối xác suất cho biến X Sau đó, chúng ta sẽ tính xác suất P(X ≤ 1), tức là xác suất có tối đa 1 viên bi xanh trong 3 viên bi được lấy ra.

Giải. a) Ta có X là biến ngẫu nhiên rời rạc nhận các giá trị 0, 1, 2 và 3.

Vì vậy, bảng phân phối xác suất của biến ngẫu nhiên X là: x 0 1 2 3 p(x) 4

1 35 b) Hai biến cố (X = 0) và (X = 1) xung khắc nên:

Trong ví dụ 2.5, chúng ta tung một con xúc xắc cho đến khi xuất hiện mặt một chấm và gọi X là số lần tung Để tìm hàm xác suất của biến ngẫu nhiên X, chúng ta cần xác định xác suất cho từng giá trị của X Tiếp theo, chúng ta tính xác suất P (2 ≤ X ≤ 5) để biết khả năng số lần tung nằm trong khoảng từ 2 đến 5.

Giải. a) Miền giá trị của X là X(Ω) = {1, 2, } =N ∗

Hàm xác suất của X là p(k) = 1

□ Tính chất 2.1 Cho biến ngẫu nhiên X có miền giá trị X(Ω) và hàm xác suất là p(x) Khi đó:

Ví dụ 2.6 Trong một tháng, số học sinh vắng học X của một lớp có phân phối như sau:

Tìm C và tính xác suất trong một tháng có ít nhất 2 học sinh nghỉ học.

49 Lúc đó, xác suất trong một tháng có ít nhất 2 học sinh nghỉ học:

□ 2.2.2 Biến ngẫu nhiên liên tục Định nghĩa 2.3 Cho biến ngẫu nhiênX : Ω →R Nếu tồn tại hàm sốy = f(x) thỏa mãn f (x) ≥ 0 ∀x sao cho với mọi a ≤ b ta có:

Z b a f (x)dx thì X được gọi là biến ngẫu nhiên liên tục Hàm số f(x) được gọi là hàm mật độ xác suất của X.

Từ định nghĩa ta có ngay các tính chất sau.

Tính chất 2.2 Cho biến ngẫu nhiên liên tục X có hàm mật độ xác suất f(x). Khi đó:

Ví dụ 2.7 Tuổi thọ (năm) của một loại thiết bị điện là biến ngẫu nhiên liên tục X có hàm mật độ xác suất: f (x) =

Khi chọn ngẫu nhiên một thiết bị điện, có thể tính xác suất cho hai trường hợp: a) xác suất thiết bị có tuổi thọ thấp hơn 1 năm và b) xác suất thiết bị có tuổi thọ cao hơn 2 năm Việc phân tích các yếu tố ảnh hưởng đến tuổi thọ của thiết bị sẽ giúp hiểu rõ hơn về các xác suất này.

Ví dụ 2.8 Cho biến ngẫu nhiên liên tục X có hàm mật độ xác suất: f (x) =

0, nếu x ̸∈ [0; 3]. a) Tìm hằng số k. b) Tính xác suất P (|X| ≤ 1).

Hàm phân phối xác suất

Định nghĩa 2.4 Cho biến ngẫu nhiên X, hàm số:

F X (x) = P (X < x), x ∈R được gọi là hàm phân phối xác suất củaX.

1 Nếu X là biến ngẫu nhiên rời rạc với miền giá trị {x 1 , x 2 , , x n , } và hàm xác suất p(x) thì:

2 Nếu X là biến ngẫu nhiên liên tục với hàm mật độ xác suất f (x) thì:

Ví dụ 2.9 Cho biến ngẫu nhiên X có bảng phân phối xác suất: x 0 1 2 p(x) 0, 1 0, 6 0, 3 Tìm hàm phân phối xác suất F (x) của biến ngẫu nhiên X.

Giải Hàm phân phối xác suất của biến ngẫu nhiên X là:

Ví dụ 2.10 Cho biến ngẫu nhiên liên tục X có hàm mật độ xác suất: f (x) =

Tìm hàm phân phối xác suất F (x) của biến ngẫu nhiên X.

Giải Hàm phân phối xác suất của biến ngẫu nhiên X là:

□ Tính chất 2.3 Hàm phân phối xác suất F (x) của biến ngẫu nhiên X có một số tính chất sau:

3) Liên tục trái trên R, tức là: lim x→x − 0

5) Nếu X là biến ngẫu nhiên liên tục có hàm mật độ xác suất f (x) thì:

Nhận xét 2.2 Cho biến ngẫu nhiên X có hàm phân phối xác suất F (x) Khi đó, ta có: a) P (X ≥ a) = 1 − F (a). b) P (a ≤ X < b) = F (b) − F (a). c) Nếu hàm phân phối của X được định nghĩa bởi biểu thức:

F X (x) = P (X ≤ x), ∀x ∈R , thì hàm này là một hàm liên tục phải tại mọix ∈R Các tính chất 1, 2 và 4 ở trên vẫn đúng.

Ví dụ 2.11 Cho biến ngẫu nhiên X có hàm phân phối

F (x) = a + b arctan x, x ∈R a) Tìm a và b. b) Tìm x ∈R sao cho: P (X ≥ 1 − x) = 1/4.

Ví dụ 2.12 Cho biến ngẫu nhiên X có hàm phân phối xác suất:

1, x ≥ 2. a) Tìm a và b. b) Tìm hàm phân phối của Y = 2X + 1.

Giải a) Vì F (x) liên tục trái nên

Ví dụ 2.13 Cho biến ngẫu nhiên liên tục X có hàm phân phối xác suất:

Giải Vì F (x) liên tục trái tại x = 2 nên: lim x→2 − F (x) = F (2) ⇔ 1 − a/8 = 0 ⇔ a = 8.

Hàm mật độ xác suất: f(x) = F ′ (x) =

Kì vọng

Định nghĩa 2.5 Cho biến ngẫu nhiên X xác định trên không gian xác suất

(Ω, F , P ) có hàm phân phối xác suất F X (x) Khi đó, nếu

(trong đó tích phân vế phải là tích phân Lebesgue - Stieltjes) thì giá trị

R xdF X (x) được gọi là kỳ vọng của biến ngẫu nhiên X, kí hiệu là E(X), tức là:

1) Nếu X = C là hằng số thì E(C) = C.

2) Nếu a, b ∈R và X, Y là hai biến ngẫu nhiên cùng xác định trên không gian xác suất (Ω, F, P ) thì:

E(aX + b) = aE(X) + b và E(X ± Y ) = E(X) ± E(Y ). Định lí 2.1.

1) Nếu biến ngẫu nhiên rời rạc X có hàm xác suất p(x) thì:

2) Nếu biến ngẫu nhiên liên tục X có hàm mật độ xác suất f(x) thì:

Để tính kỳ vọng của biến ngẫu nhiên X, ta xem xét hai trường hợp: Thứ nhất, khi X có phân phối rời rạc với bảng phân phối xác suất gồm các giá trị x = 1, 2, 3 và xác suất tương ứng p(x) = 0,2, 0,7, 0,1 Thứ hai, khi X có phân phối liên tục với hàm mật độ f(x) Việc tính toán kỳ vọng giúp hiểu rõ hơn về đặc tính của biến ngẫu nhiên trong từng trường hợp.

Giải. a) Ta có: E(X) =P i p i x i = 0, 2 1 + 0, 7 2 + 0, 1 3 = 1, 9. b) Theo định nghĩa

□ Định lí 2.2 Cho X là biến ngẫu nhiên và g(x) là hàm Borel trên R sao cho

1) Nếu biến ngẫu nhiên rời rạc X có hàm xác suất p(x) thì:

2) Nếu biến ngẫu nhiên liên tục X có hàm mật độ xác suất f(x) thì:

Kì vọng của biến ngẫu nhiên là giá trị trung bình mà biến này sẽ đạt được khi thực hiện một số lượng lớn các phép thử Khi số lần thử nghiệm tăng lên, giá trị trung bình của các kết quả thu được sẽ dần xấp xỉ với kì vọng của biến ngẫu nhiên đó.

Trong trường hợp biến ngẫu nhiên rời rạc X nhận các giá trị x_i (i = 1, k), ta thực hiện n phép thử, trong đó có n_1 lần X nhận giá trị x_1, n_2 lần X nhận giá trị x_2, , n_k lần X nhận giá trị x_k, với tổng số lần thử là Pk i=1 n_i = n Giá trị trung bình của biến ngẫu nhiên X trong n phép thử này được tính bằng công thức: ¯x = (x_1 * n_1 + x_2 * n_2 + + x_k * n_k) / n.

Ta chú ý rằng n 1 n , n 2 n , , n k n chính là tần suất xuất hiện giá trix 1 , x 2 , , x k trong n phép thử trên Do đó: ¯ x = x 1 f 1 + x 2 f 2 + + x n f n

Theo định nghĩa thống kê, khi n tiến tới vô cùng, các tần suất sẽ hội tụ về các xác suất tương ứng, cho phép ta viết ¯ x ≈ x 1 p 1 + x 2 p 2 + + x n p n = E(X) với n đủ lớn Trong trò chơi may rủi, nếu số tiền đặt cược trong mỗi ván là không đổi, trò chơi được coi là công bằng đối với người chơi khi kỳ vọng số tiền nhận được trong mỗi lần chơi bằng, lớn hơn hoặc nhỏ hơn số tiền đặt cược.

Trong hộp có 7 bút xanh và 3 bút đỏ, một sinh viên rút ngẫu nhiên 2 bút để mua Giá của bút xanh là 2000 đồng và bút đỏ là 3000 đồng Mục tiêu là tính số tiền trung bình mà sinh viên này phải trả khi mua 2 bút.

Giải Gọi X (ngàn đồng) là số tiền sinh viên này phải trả Ta có X nhận các giá trị: 4, 5 và 6 Thực hiện tính các xác suất:

Bảng phân phối xác suất của X: x 4 5 6 p(x) 7/15 7/15 1/15

Số tiền trung bình phải trả:

Ví dụ 2.16 Một người tham gia trò chơi may rủi với tiền cược mỗi ván là

Người chơi bắt đầu với 10.000 đồng và tung 2 đồng xu Nếu nhận được i mặt sấp, họ sẽ thu về (i + 1) * 5.000 đồng, với i = 1 hoặc 2 Ngược lại, họ sẽ mất tiền Vậy, liệu người này có nên thường xuyên tham gia trò chơi này hay không?

Giải Gọi X (ngàn đồng) là số tiền người này nhận được trong 1 lần chơi Ta có X nhận các giá trị: 0, 10 và 15 Bảng phân phối của X: x 0 10 15 p(x) 1/4 1/2 1/4

Do đó: E(X) =P p i x i = 8, 75 (ngàn đồng) Vì số tiền này nhỏ hơn số tiền đặt cược nên nếu người này chơi càng nhiều thì thua càng lớn.

Vậy, người này không nên chơi trò này thường xuyên □

Phương sai và độ lệch chuẩn

Biến ngẫu nhiên X được xác định trên không gian xác suất (Ω, F, P) có phương sai V(X) (hay Var(X), D(X)) nếu tồn tại kỳ vọng E((X - E(X))^2) Phương sai đo lường độ phân tán của biến ngẫu nhiên X xung quanh giá trị kỳ vọng của nó.

V (X) được gọi là độ lệch chuẩn của X. Tính chất 2.5.

1) V (X) ≥ 0, V (X) = 0 khi và chỉ khi P (X = C) = 1 (C - hằng số).

3) V (aX + b) = a 2 V (X) với mọi a, b ∈R. Định lí 2.3.

1) Nếu biến ngẫu nhiên rời rạc X có hàm xác suất p(x) thì:

2) Nếu biến ngẫu nhiên liên tục X có hàm mật độ xác suất f(x) thì:

Phương sai và độ lệch chuẩn là hai chỉ số quan trọng để đo lường mức độ phân tán của các giá trị biến ngẫu nhiên xung quanh giá trị kỳ vọng Khi phương sai lớn, điều này cho thấy các giá trị biến ngẫu nhiên phân tán rộng rãi, trong khi phương sai nhỏ cho thấy các giá trị này tập trung gần giá trị kỳ vọng.

Ví dụ 2.17 Cho biến ngẫu nhiên rời rạc X có bảng phân phối xác suất:

Trung vị

Định nghĩa 2.7 Số thực m được gọi là trung vị của biến ngẫu nhiên X nếu:

Ví dụ 2.18 Tìm trung vị của biến ngẫu nhiênX có bảng phân phối xác suất: x 0 1 2 3 p(x) 0, 1 0, 3 0,4 0, 2

Giải Vì P (X < 2) = 0, 4 < 0, 5 và P (X > 2) = 0, 2 < 0, 5 nên med(X) = 2 □

Ví dụ 2.19 Tìm trung vị của biến ngẫu nhiênX có bảng phân phối xác suất: x 0 1 2 3 p(x) 0, 1 0, 4 0,3 0, 2

Ta có med(X) = m ∈ [1; 2] vì P (X < m) ≤ 0, 5 và P (X > m) ≤ 0, 5 với mọi m ∈ [1; 2] □ Định lí 2.4 Nếu biến ngẫu nhiên X có hàm phân phối xác suất F (x) liên tục trên R thì trung vị là nghiệm phương trình F (x) = 0, 5.

Chứng minh Thật vậy, P (X < m) ≤ 0, 5 tương đương với

Do X là biến ngẫu nhiên có hàm phân phối xác suất liên tục nên bất đẳng thức trên tương đương với:

Kết hợp (2.1) và (2.2) ta được F (m) = 0, 5 □

Ví dụ 2.20 Tìm trung vị của biến ngẫu nhiên X có hàm mật độ xác suất f (x) =

Giải Hàm phân phối xác suất của biến ngẫu nhiên X là:

Biến ngẫu nhiên độc lập

Định nghĩa 2.8 Các biến ngẫu nhiên X 1 , X 2 , , X n (n ≥ 2) được gọi là độc lập nếu với mọi x 1 , x 2 , , x n ∈R ta có:

Dãy biến ngẫu nhiên (Xn; n ≥ 1) được coi là độc lập khi mọi dãy con hữu hạn của nó là các biến ngẫu nhiên độc lập Theo định lý 2.5, nếu hai biến ngẫu nhiên X và Y độc lập, thì chúng không ảnh hưởng lẫn nhau trong các phép đo lường thống kê.

2) V (X ± Y ) = V (X) + V (Y ). Định nghĩa 2.9 Dãy biến ngẫu nhiên (X n ; n ≥ 1) được gọi làđôi một độc lập nếu với mọi i ̸= j ta có:

Một số phân phối xác suất quan trọng

2.8.1 Phân phối Bernoulli Định nghĩa 2.10 Biến ngẫu nhiên rời rạcXđược gọi là cóphân phối Bernoulli với tham số p (0 < p < 1) nếu X có miền giá trị X(Ω) = {0, 1} và hàm xác suất: p(k) = P (X = k) =

Tính chất 2.6 Nếu X ∼ Ber(p) thì E(X) = p và V (X) = p(1 − p).

2.8.2 Phân phối nhị thức Định nghĩa 2.11 Biến ngẫu nhiên rời rạcX được gọi là cóphân phối nhị thức với tham số n và p (n ∈N ∗ và 0 < p < 1) nếu X có miền giá trị X(Ω) = {0, 1, , n} và hàm xác suất: p(k) =

Hình 2.1: Đồ thị hàm xác suất của B(10;0,4) Tính chất 2.7.

1) Nếu X ∼ B(n, p) thì E(X) = np và V (X) = np(1 − p).

2) Nếu X 1 , X 2 , , X n là n biến ngẫu nhiên độc lập, cùng phân phối xác suất với

Biến ngẫu nhiên X ∼ Ber(p) dẫn đến biến ngẫu nhiên T = X1 + X2 + + Xn có phân phối nhị thức B(n, p) Nhận xét rằng B(1, p) chính là phân phối Bernoulli với xác suất thành công p Trong trường hợp này, xét dãy phép thử Bernoulli với xác suất thành công là p, và ký hiệu X là kết quả của các phép thử này.

Hình 2.2: Đồ thị hàm xác suất của B(20;0,6) là biến ngẫu nhiên chỉ số lần thành công trong dãyn phép thử này thìX ∼ B(n, p).

Tỉ lệ phế phẩm của nhà máy là 12%, và mỗi hộp sản phẩm chứa 20 sản phẩm Trung bình, mỗi hộp sẽ có 2,4 phế phẩm, với độ lệch chuẩn khoảng 1,4 Khi một khách hàng mua ngẫu nhiên một hộp, xác suất để hộp đó có chứa phế phẩm là 0,88 Để tìm số phế phẩm trong hộp có xác suất lớn nhất, ta cần xem xét các trường hợp có thể xảy ra.

Giải Ta có mô hình Bernoulli với n = 20 và p = 0, 12 Gọi X là số phế phẩm trong mỗi hộp Khi đó, X ∼ B(n = 20; p = 0, 12). a) E(X) = np = 2, 4; SD(X) =p np(1 − p) ≈ 1, 45. b) P (X ≥ 1) = 1 − P (X = 0) = 1 − 0, 88 20 c) (n + 1)p = 2, 52 ̸∈ Z nên P (X = k) = C 20 k 0, 12 k 0, 88 20−k đạt giá trị lớn nhất tại k = 2 □

Một sinh viên tham gia thi vấn đáp và phải trả lời 5 câu hỏi độc lập Khả năng trả lời đúng mỗi câu hỏi của sinh viên là 60% Nếu sinh viên trả lời đúng, họ sẽ nhận được

Để giải bài toán này, ta có 4 điểm cho mỗi câu trả lời đúng và trừ 2 điểm cho mỗi câu trả lời sai Đầu tiên, ta cần xác định xác suất để sinh viên trả lời đúng 3 câu Tiếp theo, tính số điểm trung bình mà sinh viên đạt được dựa trên khả năng trả lời Cuối cùng, đối với sinh viên thứ hai, với giả định rằng điểm trung bình không dưới 14, ta cần tìm khả năng tối thiểu để sinh viên này trả lời đúng mỗi câu.

Trong bài toán này, chúng ta sử dụng mô hình Bernoulli với n = 5 và p = 0,6, trong đó X đại diện cho số câu trả lời đúng của sinh viên Ta có phân phối X ∼ B(n = 5; p = 0,6) Để tính xác suất P(X = 3), ta sử dụng công thức: P(X = 3) = C(5, 3) * (0,6)^3 * (0,4)^2 Ngoài ra, Y là số điểm mà sinh viên đạt được, được tính theo công thức: Y = 4X − 2(5 − X) = 6X − 10.

Số điểm trung bình sinh viên này đạt được:

Giá trị kỳ vọng E(Y) được tính bằng công thức E(Y) = 6E(X) − 10, trong đó E(X) = 6np Với p là xác suất trả lời đúng mỗi câu của sinh viên, ta có E(Y) = 6 5 0,6 − 10 = 8 điểm Gọi Z là số câu trả lời đúng và T là số điểm đạt được của sinh viên mới này.

Sinh viên này dự đoán khả năng trả lời đúng tối thiểu mỗi câu là 80% Biến ngẫu nhiên rời rạc X được gọi là có phân phối Poisson với tham số λ (λ > 0) nếu X có miền giá trị N = {0, 1, 2, } và hàm xác suất được định nghĩa là p(k) =

2) Nếu X 1 , X 2 , , X n là n biến ngẫu nhiên độc lập, cùng phân phối với X ∼

Biến ngẫu nhiên T = X1 + X2 + + Xn có phân phối Poisson P oi(nλ), trong đó λ là tỷ lệ xuất hiện của các sự kiện Phân phối Poisson thường được sử dụng để mô tả số lượng các sự kiện xảy ra trong một khoảng thời gian xác định, như số cuộc gọi đến tổng đài hay số khách hàng đến rút tiền tại ngân hàng, với tham số tỷ lệ tương ứng với độ dài khoảng thời gian đó.

Hiện tượng này có thể được giải thích qua số biến cố xuất hiện trong khoảng thời gian [0, t], ký hiệu là N(t) Để hiểu rõ hơn, cần thỏa mãn ba giả thiết sau đây.

(i) Xác suất có đúng 1 biến cố xuất hiện trong khoảng thời gian có độ dài h bằng λh + o(h) với λ > 0 - hằng số.

(ii) Xác suất có ít nhất 2 biến cố xuất hiện trong khoảng thời gian có độ dài h bằng o(h 2 ).

(iii) Số biến cố xuất hiện trong các khoảng thời gian không giao nhau là các biến ngẫu nhiên độc lập nhau.

Khi đó, người ta chứng minh được rằng:

P (N (t) = k) = (λt) k e −λt k! , k ≥ 0. Điều này có nghĩa N (t) ∼ P oi(λt) Tham số λ chính là số biến cố trung bình xuất hiện trong một đơn vị thời gian.

Trong ví dụ 2.23, một gara cho thuê xe ôtô sở hữu 2 ôtô loại A, với số đơn đặt hàng vào ngày cuối tuần tuân theo phân phối Poisson, có trung bình 2 đơn/ngày Để tính xác suất trong ngày cuối tuần, ta xem xét các trường hợp: (a) xác suất có một ôtô loại A được thuê, (b) xác suất có 2 ôtô loại A được thuê, và (c) xác suất gara không đáp ứng nhu cầu thuê ôtô loại này.

Giải Gọi X là số đơn đặt hàng thuê ô tô ngày cuối tuần của gara Ta có

Tại một tổng đài bưu điện, số cuộc gọi đến được mô tả bởi biến ngẫu nhiên phân phối Poisson với mức trung bình là 2 cuộc gọi mỗi phút Để tính xác suất có đúng 5 cuộc gọi trong 1 phút, ta áp dụng công thức phân phối Poisson.

Giải Gọi X là số cuộc điện thoại gọi đến trong khoảng thời gian 1 phút, theo giả thiết, X có phân phối Poisson Vì E(X) = 2 nênλ = 2 Do đó:

□ Định lí 2.6 (Luật biến cố hiếm) Cho {X n ; n ≥ 1} là dãy biến ngẫu nhiên có phân phối nhị thức X n ∼ B (n; p n ) Nếu tồn tại giới hạn lim n→∞ np n = λ thì: n→∞ lim P (X n = k) = e −λ λ k k! , k = 0, 1, 2,

(np n ) k k! = λ k k! Đặt λ n = np n Khi đó: n→∞ lim (1 − p n ) n = lim n→∞

Nếu X ∼ B(n; p) với n lớn và p nhỏ, thì X xấp xỉ phân phối Poisson với λ = np, tức là e −λ Các thừa số khác có giới hạn bằng 1, từ đó ta có điều cần chứng minh.

Ví dụ 2.25 Tỉ lệ phế phẩm của một nhà máy là 0,006 Lấy ngẫu nhiên 1.000 sản phẩm của nhà máy, tính xác suất có đúng 9 phế phẩm.

Giải GọiX là số phế phẩm trong 1.000 sản phẩm, khi đó X ∼ B(1.000; 0, 006).

Vìn = 1.000 khá lớn và p = 0, 006 khá bé nên ta có thể xem X có phân phối xấp xỉ phân phối Poisson với λ = np = 6:

Một xưởng in sách phát hiện rằng một cuốn sách 500 trang trung bình chứa 300 lỗi, với số lượng chữ trên mỗi trang được cho là như nhau Để tính xác suất trên một trang, ta cần xác định xác suất có đúng 2 lỗi và xác suất có ít nhất 2 lỗi.

Xác suất một chữ bị lỗi được ký hiệu là p, và số lỗi trong một trang có n chữ được ký hiệu là X Trong trường hợp này, X tuân theo phân phối nhị thức B(n; p) với kỳ vọng E(X) = np = 300/500 = 0,6 Do xác suất lỗi của một chữ rất nhỏ và số lượng chữ trong một trang rất lớn, nên có thể xấp xỉ X bằng phân phối Poisson với λ = 0,6.

2! e −0,6 ≈ 0, 099. b) P X ≥ 2) = 1 − P (X < 2) ≈ 1 − 0, 549 − 0, 359 = 0, 122 □ 2.8.4 Phân phối đều Định nghĩa 2.13 Biến ngẫu nhiên liên tục X được gọi là có phân phối đều trên đoạn [a; b] (a < b) nếu có hàm mật độ xác suất: f (x) =

VECTƠ NGẪU NHIÊN

Định nghĩa

Định nghĩa 3.1: Cho hai biến ngẫu nhiên X và Y xác định trên không gian xác suất (Ω, F, P), ánh xạ Z: Ω → R × R được xác định bởi Z(ω) = (X(ω), Y(ω)) được gọi là vectơ ngẫu nhiên 2 chiều, ký hiệu là Z = (X, Y) Điều này áp dụng cho mọi tập hợp A thuộc B(R²) (σ-đại số Borel trên R²).

{Z ∈ A} = {ω ∈ Ω : (X(ω), Y (ω)) ∈ A} ∈ F Miền giá trị của Z = (X, Y ) được kí hiệu Z (Ω).

Phân bố xác suất của vectơ ngẫu nhiên

3.2.1 Vectơ ngẫu nhiên 2 chiều rời rạc Định nghĩa 3.2 Cho vectơ ngẫu nhiên Z = (X, Y ) có miền giá trị:

Hàm xác suất đồng thời của Z = (X, Y ) là hàm số p :R 2 → R xác định bởi: p(x, y) =

Trong trường hợpXvàY có miền giá trị lần lượt là{x 1 , x 2 , , x m },{y 1 , y 2 , , y n }, đặt: p ij = P (X = x i ; Y = y j ), i = 1, m, j = 1, n.

Bảng chữ nhật sau được gọi là bảng phân bố xác suất đồng thời của vectơ ngẫu nhiên (X, Y ).

Ví dụ 3.1 Gieo đồng thời 1 đồng xu và 1 con xúc xắc cân đối đồng chất Gọi

X là số mặt sấp xuất hiện của đồng xu, Y là số chấm xuất hiện trên mặt con xúc xắc Lập bảng phân phối xác suất đồng thời của (X, Y ).

Giải Gọi X là số mặt sấp xuất hiện của đồng xu, Y là số chấm xuất hiện trên mặt con xúc xắc Ta có X(Ω) = {0, 1}, Y (Ω) = {1, 2, 3, 4, 5, 6}.

Bảng phân bố xác suất đồng thời của X và Y là:

Trong một hộp có 5 quả bóng bàn, bao gồm 3 quả mới và 2 quả cũ, ta thực hiện hai lần lấy ngẫu nhiên Ở lần đầu tiên, hai quả bóng được lấy ra và sau đó trả lại hộp Ở lần thứ hai, lại tiếp tục lấy ra 2 quả bóng Gọi X là số quả bóng mới được lấy ra ở lần thứ nhất và Y là số quả bóng mới ở lần thứ hai Mục tiêu là lập bảng phân phối xác suất đồng thời cho các biến ngẫu nhiên (X, Y).

Bảng phân bố xác suất đồng thời của (X, Y ) là:

□ Định lí 3.1 Cho vectơ ngẫu nhiên Z = (X, Y ) có miền giá trị

2) Hàm xác suất của biến ngẫu nhiên X: p X (x) = X y j ∈Y (Ω)

3) Hàm xác suất của biến ngẫu nhiên Y: p Y (y) = X x i ∈X(Ω)

Phân phối xác suất của các biến ngẫu nhiên X và Y được gọi là phân phối biên.

2) Do {Y = y 1 },{Y = y 2 }, đôi một xung khắc và

Xét trường hợp (X, Y ) có bảng phân bố xác suất đồng thời:

Để tìm các phân phối biên, chúng ta chỉ cần tính tổng xác suất theo hàng và theo cột từ bảng phân bố đồng thời Cụ thể, bảng phân phối xác suất của biến ngẫu nhiên X và Y được xác định thông qua tổng các xác suất trong từng hàng và cột, với các giá trị p(x) và p(y) tương ứng.

3.2.2 Vectơ ngẫu nhiên 2 chiều liên tục Định nghĩa 3.3 Vectơ ngẫu nhiên (X, Y ) được gọi là có phân phối đồng thời liên tục nếu tồn tại hàm số f (x, y) ≥ 0, ∀ x, y sao cho với mọi a < b và c < d ta có:

Hàm f(x, y) được xác định là hàm mật độ xác suất đồng thời của hai biến ngẫu nhiên X và Y Theo định lý 3.2, nếu f(x, y) là hàm mật độ đồng thời của (X, Y), thì f_X(x) và f_Y(y) lần lượt là hàm mật độ xác suất của X và Y.

Các hàm f X (x) và f Y (y) được gọi là các hàm mật độ biên.

2) Hàm phân phối xác suất của biến ngẫu nhiên X:

Lấy đạo hàm hai vế theo x ta được f X (x) = F X ′ (x) =

Nhận xét 3.1 Cho vectơ ngẫu nhiên (X, Y ) có hàm mật độ xác suất đồng thời f(x, y) Khi đó, với D ∈ B(R 2 ) ta có:

Ví dụ 3.3 Cho vectơ ngẫu nhiên (X, Y ) có hàm mật độ xác suất đồng thời: f (x, y) =

0 nếu trái lại. a) Tìm hằng số c. b) Tìm hàm mật độ xác suất của X và của Y. c) Tìm xác suất để (X, Y ) nhận giá trị trong miền chữ nhật:

D = {(x, y) : 1 ≤ x ≤ 2, 0 < y < 2}. d) Tìm hàm mật độ của biến ngẫu nhiên Z = X/Y.

0 nếu trái lại. b) Các hàm mật độ biên: f X (x) =

0 e −x−y dxdy = e −4 − e −2 − e −3 + e −1 d) Với z > 0, ta có hàm phân phối:

Do đó, hàm mật độ của Z: f Z (z) = F Z ′ (z) =

□ 3.2.3 Hàm phân phối xác suất đồng thời Định nghĩa 3.4 Cho 2 biến ngẫu nhiên X và Y Hàm số

F X,Y (x, y) = P (X < x, Y < y), x, y ∈R được gọi là hàm phân phối xác suất đồng thời của vectơ ngẫu nhiên (X, Y ).

1 Nếu vectơ ngẫu nhiên (X; Y ) có hàm xác suất đồng thời p(x; y) thì:

2 Nếu vectơ ngẫu nhiên (X; Y ) có hàm mật độ xác suất đồng thời f (x, y) thì:

Ví dụ 3.4 Tìm hàm phân phối xác suất đồng thời ở Ví dụ 3.3.

Giải Với x ≥ 0 và y ≥ 0 ta có:

Từ định nghĩa về sự độc lập của hai biến ngẫu nhiên X và Y ta có: Định lí 3.3 Hai biến ngẫu nhiên X và Y độc lập khi và chỉ khi:

F X,Y (x, y) = F X (x).F Y (y), ∀x, y ∈R Định lí 3.4 Hai biến ngẫu nhiên X và Y độc lập khi và chỉ khi: f(x, y) = f X (x).f Y (y), ∀x, y ∈R Trong đó f (x, y), f X (x), f Y (y) lần lượt là hàm mật độ xác suất (hoặc hàm xác

Kì vọng có điều kiện

Ví dụ 3.5 Cho vectơ ngẫu nhiên (X, Y ) có hàm mật độ đồng thời f (x, y) =

0, ngược lại. a) Tính P (X > 1, Y < 1) và P (X < Y ). b) Chứng minh X, Y là 2 biến ngẫu nhiên độc lập.

2e −x−2y dxdy = 1/3. b) Các hàm mật độ biên: f X (x) =

3.3 Phân bố xác suất có điều kiện và kì vọng có điều kiện

Cho (X, Y ) có bảng phân bố xác suất đồng thời:

Y y 1 y j y n x 1 p 11 p 1j p 1n x 2 p 21 p 2j p 2n x m p m1 p mj p mn Khi đó ta có:

Từ đó ta có hàm xác suất có điều kiện của X với điều kiện Y = y j như sau: p y j (x) =

Kì vọng của X với điều kiện Y = y j :

3.3.2 Trường hợp liên tục Định nghĩa 3.5 Cho X và Y là hai biến ngẫu nhiên liên tục và y ∈ R Nếu tồn tại hàm số f y (x) ≥ 0, ∀x sao cho với mọi a < b ta có:

Hàm mật độ xác suất có điều kiện f y (x) được định nghĩa là Z b a f y (x)dx, trong đó X là biến ngẫu nhiên và Y = y là điều kiện Hàm này cũng được ký hiệu là f(x|y).

Định lý 3.5 nêu rõ rằng cho hai biến ngẫu nhiên (X, Y) với hàm mật độ xác suất đồng thời f(x, y), ta có thể xác định hàm mật độ xác suất có điều kiện f(x|y) của X khi biết Y = y, cũng như hàm mật độ xác suất có điều kiện f(y|x) của Y khi biết X = x.

2) f (y|x) = f (x, y) f X (x) nếu f X (x) ̸= 0. Chứng minh 1) Với a < b ta có:

Áp dụng quy tắc l’Hôpital ta được:

Theo tính chất của tích phân: d dt

Chứng minh tương tự cho trường hợp (2) □

Ví dụ 3.6 Cho vectơ ngẫu nhiên (X, Y ) có hàm mật độ xác suất đồng thời: f(x, y) =

0 nếu trái lại. a) Cho x > 0, tìm f (y|x). b) Cho y > 0, tìm f(x|y).

Hiệp phương sai, hệ số tương quan

Định nghĩa 3.6 Cho vectơ ngẫu nhiên (X, Y ) Hiệp phương sai của X và Y là một số xác định bởi công thức:

Hai biến ngẫu nhiênX vàY được gọi là tương quan với nhau nếuCov(X, Y ) ̸= 0 và không tương quan nếu Cov(X, Y ) = 0. Định lí 3.6.

2) Cov(aX + a ′ , bY + b ′ ) = ab Cov(X, Y ), trong đó a, a ′ , b, b là các hằng số.

4) Nếu X và Y độc lập thì Cov(X, Y ) = 0.

2) Nếu X, Y độc lập thì chúng không tương quan, tuy nhiên điều ngược lại nói chung không đúng. Định lí 3.7 Cho vectơ ngẫu nhiên Z = (X, Y ).

Trong trường hợp (X, Y) là vectơ ngẫu nhiên liên tục, hàm xác suất được biểu diễn bằng p(x, y), trong khi nếu (X, Y) là vectơ ngẫu nhiên rời rạc, hàm mật độ xác suất sẽ là f(x, y) Định lý 3.8 nêu rõ các khái niệm này trong bối cảnh xác suất.

1) Nếu X và Y là các biến ngẫu nhiên rời rạc có miền giá trị lần lượt là {x 1 , x 2 , , x m }, {y 1 , y 2 , , y n } thì:

2) Nếu (X, Y ) có hàm mật độ xác suất đồng thời f (x, y) thì:

Hệ số tương quan ρ(X, Y) giữa hai biến ngẫu nhiên X và Y được xác định bằng công thức ρ(X, Y) = Cov(X, Y) / (pV(X) * pV(Y)) Theo định nghĩa, Cov(X, Y) được tính bằng E(XY) − E(X)E(Y) Áp dụng Định lý 3.7, ta có thể dễ dàng rút ra các kết quả liên quan đến mối quan hệ giữa hai biến ngẫu nhiên này.

2) Nếu X và Y độc lập thì ρ(X, Y ) = 0.

1) Đặt X ′ = X − EX, Y ′ = Y − EY Với mọi t ∈ R, ta có:

⇔ E(X − EX) 2 t 2 + 2tE (X − EX)(X − EY ) + E(Y − EY ) 2 ≥ 0

⇔ V (X)t 2 + 2t Cov(X, Y ) + V (Y ) ≥ 0. Đây là tam thức bậc hai theo t, do đó:

2) Nếu X, Y độc lập thì theo Định lí 3.6, ta có Cov(X, Y ) = 0, do đó:

V (X). Mặt khác, vì Cov(aX + b, X) = a Cov(X, X ) = aV (X) nên: ρ(aX + b, X ) = aV (X)

Hệ số tương quan ρ(X, Y) thể hiện mức độ phụ thuộc tuyến tính giữa hai biến X và Y Khi giá trị tuyệt đối |ρ(X, Y)| gần 1, mối quan hệ tuyến tính giữa X và Y trở nên mạnh mẽ Ngược lại, nếu |ρ(X, Y)| gần 0, mối liên hệ tuyến tính này sẽ rất yếu.

✓ Khi ρ(X, Y ) > 0, ta bảo X, Y có tương quan dương (thuận), tức là X, Y có xu hướng cùng tăng hoặc cùng giảm.

✓ Khi ρ(X, Y ) < 0, ta bảo X, Y có tương quan âm (nghịch), tức là X, Y có xu hướng tăng và giảm ngược chiều nhau.

Hình 3.1: Quan hệ tuyến tính giữa X và Y phụ thuộc vào ρ(X, Y )

Ví dụ 3.7 Vecto ngẫu nhiên (X, Y ) có phân phối được cho ở bảng sau:

P 0,4 0,6 Xác suất có điều kiện:

3 Phân phối có điều kiện:

Do đó: E(Y |X = 1) =P y i P (Y = y i |X = 1) = 5/3. Hiệp phương sai: Cov(X, Y ) = E(XY ) − E(X)E(Y ), trong đó:

▷ 3.1 Cho vectơ ngẫu nhiên (X, Y ) với hàm phân phối đồng thời F (x, y) Gọi

F X (x), F Y (y) là các hàm phân phối của X và Y Chứng minh: a) P (X ≥ a, Y ≥ b) = 1 − F X (a) − F Y (b) + F (a, b), ∀a, b ∈R. b) P (a 1 ≤ X < a 2 , b 1 ≤ Y < b 2 ) = F (a 1 , b 1 ) + F (a 2 , b 2 ) − F (a 1 , b 2 ) − F (a 2 , b 1 ), với mọi a 1 , a 2 , b 1 , b 2 ∈R , a 1 < a 2 , b 1 < b 2

Hai biến ngẫu nhiên liên tục X và Y được coi là độc lập khi và chỉ khi hàm mật độ đồng thời f XY (x, y) có thể được biểu diễn dưới dạng tích của hai hàm số g(x) và h(y), với điều kiện g và h được xác định trên R Cụ thể, công thức là f XY (x, y) = g(x)h(y) cho mọi x, y thuộc R.

▷ 3.3 Số khách hàng mua máy ảnh kĩ thuật số hiệu Canon trong một tuần ở một cửa hàng là biến ngẫu nhiên X có bảng phân bố xác suất: x 0 1 2 3 4 p(x) 0, 1 0, 2 0, 3 0, 25 0, 15

Trong một cửa hàng bán máy ảnh kĩ thuật số hiệu Canon, 60% khách hàng chọn mua gói bảo hành mở rộng Gọi X là số khách hàng mua máy ảnh và Y là số khách hàng mua gói bảo hành mở rộng Để tính xác suất P(X = 4, Y = 2), chúng ta cần xác định số lượng khách hàng cụ thể trong từng trường hợp Tiếp theo, để tìm xác suất P(X = Y), chúng ta sẽ xem xét các tình huống mà số lượng khách hàng mua máy ảnh và gói bảo hành mở rộng bằng nhau Cuối cùng, việc lập bảng phân bố xác suất đồng thời của (X; Y) sẽ giúp chúng ta có cái nhìn tổng quát về mối quan hệ giữa số lượng khách hàng mua máy ảnh và gói bảo hành mở rộng.

▷ 3.4 Số trẻ em sinh ra trong 1 tuần ở làng A là 1 biến ngẫu nhiên X có bảng phân bố xác suất: x 0 1 2 3 p(x) 0, 4 0, 3 0, 2 0, 1

Số người chết trong 1 tuần ở làng đó là biến ngẫu nhiên Y có bảng phân bố xác suất: y 0 1 2 3 4 p(y) 0, 1 0, 3 0, 4 0, 15 0, 05

Giả sử X và Y độc lập. a) Tìm bảng phân bố xác suất của vectơ ngẫu nhiên (X, Y ). b) Tính P (X > Y ).

Biến ngẫu nhiên X có phân bố nhị thức B với n = 2 và p = 0,4, trong khi biến ngẫu nhiên Y có phân bố nhị thức B với n = X + 1 và p = 0,4 Đầu tiên, cần lập bảng phân bố xác suất đồng thời của X và Y để hiểu rõ mối quan hệ giữa chúng Sau đó, tính phương sai của tổng X + Y để đánh giá độ biến động của tổng hai biến ngẫu nhiên này.

▷ 3.6 Cho hai biến ngẫu nhiên rời rạc X và Y lần lượt có bảng phân phối xác suất: x 0 1 2 p(x) 0,15 0,47 0,38 y 0 1 2 p(y) 0,2 0,36 0,44

Cho biết hệ số tương quan ρ(X, Y ) = 0.64 Tính kì vọng và phương sai của biến ngẫu nhiên Z = 2X + 4Y.

▷ 3.7 Cho (X, Y ) có bảng phân bố xác suất đồng thời:

▷ 3.8 Cho (X, Y ) có bảng phân bố xác suất đồng thời:

4 0 1/3 0 a) Chứng minh X và Y không độc lập. b) Tính P (X = 4|Y = 2).

▷ 3.9 Cho (X, Y ) có bảng phân bố xác suất đồng thời:

2 0,06 0,14 0,3 a) Tính xác suất P (X + 2Y ≤ 3|X ≥ 1). b) Tính phương sai của biến ngẫu nhiên Z = 2X + Y.

▷ 3.10 Cho (X, Y ) có hàm mật độ xác suất đồng thời f (x, y) =

0 nếu trái lại. a) Tìm hằng số c. b) Tính xác suất P (0 ≤ X ≤ 1/2, 0 ≤ Y ≤ 1/2).

▷ 3.11 Cho (X, Y ) có hàm mật độ xác suất đồng thời: f (x, y ) =

0 nếu trái lại. a) Tìm hằng số c. b) Tìm các hàm mật độ xác suất của X và Y.

▷ 3.12 Cho (X, Y ) có hàm mật độ f (x, y) =

0 nếu trái lại. Tìm các hàm mật độ xác suất của X và Y.

▷ 3.13 Cho (X, Y ) có hàm mật độ xác suất đồng thời: f(x, y) = c

(1 + x 2 )(1 + y 2 ) a) Tìm hằng số c. b) Tìm hàm phân phối xác suất đồng thời của (X, Y ). c) Tìm xác suất (X, Y ) nhận giá trị trong miền hình chữ nhật có các đỉnh A(1; 1), B ( √

▷ 3.14 Cho (X, Y ) có hàm mật độ xác suất đồng thời: f(x, y) =

0 nếu trái lại. a) Với 0 ≤ x ≤ 1, tìm f (y|x). b) Tính xác suất P (X 2 + Y 2 ≤ 1).

▷ 3.15 Cho (X, Y ) có hàm mật độ xác suất đồng thời: f (x, y) =

0 nếu trái lại. a) Tìm hằng số c. b) Tìm ρ(X, Y ).

▷ 3.16 Cho (X, Y ) có hàm mật độ xác suất đồng thời: f(x, y) =

0 nếu trái lại. a) Với x > 0, tính E(Y |X = x). b) Với y > 0, tính E(X|Y = y).

▷ 3.17 Cho (X, Y ) có hàm mật độ xác suất đồng thời: f (x, y) =

0 nếu trái lại. a) Tìm hằng số c. b) Tìm hàm mật độ xác suất của X và của Y. c) Tính xác suất P (X ≥ 4Y |X ≥ 2Y ).

CÁC ĐỊNH LÍ GIỚI HẠN

Các khái niệm hội tụ

4.1.1 Hội tụ hầu chắc chắn Định nghĩa 4.1 Dãy biến ngẫu nhiên {X n ; n ≥ 1} được gọi làhội tụ hầu chắc chắn (hay còn được gọi là hội tụ theo xác suất 1) đến biến ngẫu nhiên X nếu

Khi đó ta viết X n − h.c.c −− → X khi n → ∞.

Mệnh đề 4.1 Các điều kiện sau đây là tương đương:

Chứng minh Hiển nhiên ta có (2) và (3) tương đương với nhau Do đó ta chỉ cần chứng minh (1) và (2) tương đương với nhau Đặt

4.1.2 Hội tụ theo xác suất Định nghĩa 4.2 Dãy biến ngẫu nhiên {X n ; n ≥ 1} được gọi là hội tụ theo xác suất đến biến ngẫu nhiên X nếu với mọi ε > 0, n→∞ lim P (ω : |X n (ω) − X(ω)| > ε) = 0.

Khi đó ta viết X n − → P X khi n → ∞.

Mệnh đề 4.2 Nếu X n −−−→ h.c.c X khi n → ∞ thì X n − → P X khi n → ∞.

Chứng minh Giả sử X n −−−→ h.c.c X khi n → ∞ Với ε > 0, từ Mệnh đề 4.1 suy ra n→∞ lim P (

4.1.3 Hội tụ theo phân phối Định nghĩa 4.3 Dãy biến ngẫu nhiên {X n ; n ≥ 1} hội tụ theo phân phối đến biến ngẫu nhiên X nếu F n (x) → F (x) khi n → ∞ tại các điểm liên tục của hàm

F (x), trong đó F n (x) là hàm phân phối xác suất của X n, F (x) là hàm phân phối củaX.

Khi đó kí hiệu X n − → d X khi n → ∞.

Ví dụ 4.1 Cho{X n ; n ≥ 1}là dãy biến ngẫu nhiên độc lập, có cùng phân phối xác suất với biến ngẫu nhiên X với hàm mật độ xác suất f (x) =

0 nếu x ≤ 1, trong đóα > 0 ĐặtY n = n −1/α max 1≤k≤n X k Chứng minhY n hội tụ theo phân phối đến biến ngẫu nhiên Y nào đó.

Giải Hàm phân phối xác suất của biến ngẫu nhiên Y n: F Y n (x) = 0 với x ≤ 0, với x > 0 ta có

Vậy biến ngẫu nhiênY n hội tụ theo phân phối đến biến ngẫu nhiên Y có hàm phân phối xác suất

□ Chúng ta thừa nhận mệnh đề sau mà không chứng minh.

Mệnh đề 4.3 (Xem Định lí 5.1.6 [2]) X n − → d X khi n → ∞ khi và chỉ khi với mọi hàm h liên tục bị chặn trên R ta đều có n→∞ lim E(h(X n )) = E(h(X)).

Chứng minh Giả sử X n − → P X Với ε > 0, ta có

Cho n → ∞ ta được lim sup n→∞

Bằng cách thay X n bởi X, X bởi X n , x bởi x − ε và x + ε bởi x ở chứng minh trên ta thu được lim inf n→∞ F X n (x) ≥ F (x − ε) (4.2)

Từ (4.1) và (4.1), cho ε → 0 ta được điều phải chứng minh □ Mệnh đề 4.5 Nếu X n − → d c với c là hằng số thì X n − P → c.

Chứng minh Giả sử X n − → d X = cvới clà hằng số Hàm phân phối xác suất của X:

Luật số lớn

Định lí 4.1 (Bất đẳng thức Chebyshev) Cho X là biến ngẫu nhiên Khi đó, với mọi ε > 0 ta có

P (|X − E(X)| > ε) ≤ V (X) ε 2 Chứng minh Với ε > 0 tùy ý, đặt A = (|X − E(X)| > ε) ta có

V (X) = E(X − E(X)²) ≥ E((X − E(X)² | A) ≥ ε² E(I_A) = ε² P(A) dẫn đến P(A) ≤ V(X) / ε² Định lý 4.2 (Luật yếu số lớn) khẳng định rằng dãy {X_n, n ≥ 1} gồm các biến ngẫu nhiên độc lập và có phân phối xác suất với kỳ vọng E(X) = μ và phương sai σ².

Chứng minh Đặt S n = X 1 + X 2 + + X n Do các biến ngẫu nhiên X k độc lập, cựng phõn phối xỏc suất nờn E(S n ) = nà và V (S n ) = nσ 2 Áp dụng bất đẳng thức Chebyshev, ta có

Hệ quả 4.1 Dãy {X n , n ≥ 1}các biến ngẫu nhiên độc lập, cùng phân phối xác suất với biến ngẫu nhiờn X cú kỡ vọng E(X) = à và phương sai V (X) = σ 2 hữu hạn thì

Luật số lớn cho biết rằng nếu X1, X2, , Xn là các biến ngẫu nhiên độc lập và phân phối xác suất với kỳ vọng μ và phương sai σ² hữu hạn, thì khi n đủ lớn, trung bình mẫu X̄ = (X1 + X2 + + Xn) / n sẽ xấp xỉ kỳ vọng μ Đồng thời, phương sai của trung bình mẫu σ²/n cũng sẽ tiệm cận giá trị 0 khi n tiến tới vô cùng.

Một ứng dụng quan trọng của luật số lớn là trong việc ước lượng hàm phân phối xác suất Giả sử biến ngẫu nhiên X có hàm phân phối xác suất F(x) chưa được xác định.

X 2 , , X n là các biến ngẫu nhiên độc lập, có cùng phân phối xác suất với biến ngẫu nhiên X Hàm phân phối xác suất thực nghiệm của X được định nghĩa

Thật vậy, do {I (X i < x); 1 ≤ i ≤ n} là dãy các biến ngẫu nhiên độc lập, có cùng phân phối xác suất với I(X < x) và

E(I(X < x)) = F (x), V (I(X < x)) = F (x)(1 − F (x)) hữu hạn. Áp dụng Định lí 4.2 ta được

I(X i < x) − → P F (x) khi n → ∞. Định lí sau còn được gọi là Luật mạnh số lớn Kolmogorov. Định lí 4.3 Nếu {X n ; n ≥ 1} là dãy biến ngẫu nhiên độc lập thỏa mãn điều kiện ∞

V (X n ) b 2 n < ∞, với {b n ; n ≥ 1} là dãy số dương tăng, b n → ∞ khi n → ∞ thì

Luật mạnh số lớn Marcinkiewicz-Zygmund phát biểu rằng, đối với dãy biến ngẫu nhiên độc lập và cùng phân phối xác suất {X n ; n ≥ 1} với 1 ≤ r < 2, nếu kỳ vọng E(|X 1 | r ) tồn tại và hữu hạn, thì các điều kiện này đảm bảo tính hội tụ của dãy biến ngẫu nhiên.

Hệ quả 4.2 Nếu {X n ; n ≥ 1} là dãy biến ngẫu nhiên độc lập, có cùng phân phối xỏc suất với kỡ vọng chung à = E(X n ) hữu hạn thỡ

Định lí giới hạn trung tâm

Định nghĩa 4.4 Cho biến ngẫu nhiên X có hàm phân phối xác suất F X (x). Khi đó hàm số ϕ X (t) := E(e itX ) =

R e itx dF X (x), t ∈R được gọi là hàm đặc trưng của X.

Từ công thức Euler e ix = cos(x) + i sin(x) ta có ϕ(t) =

Hàm đặc trưng của một số phân phối xác suất thường gặp

Phân phối Kí hiệu Hàm đặc trưng Bernoulli Ber(p) 1 − p + pe it Nhị thức B(n; p) (1 − p + pe it ) n Poisson Poi(λ) e λ(e it −1)

Tính chất 4.1 Giả sử biến ngẫu nhiên X có hàm phân phối xác suất F X (x) và hàm đặc trưng ϕ X (t) Khi đó:

(i) Nếu X có hàm mật độ xác suất f (x) thì ϕ X (t) =R

R e itx f(x)dx. (ii) ϕ aX+b = e ibt ϕ X (at) với a và b là các hằng số.

(iii) Nếu X và Y là hai biến ngẫu nhiên độc lập thì ϕ X +Y (t) = ϕ X (t)ϕ Y (t).

Chứng minh Tính chất (i) là hiển nhiên Bây giờ ta chứng minh tính chất (ii). ϕ aX+b = E(e i(ax+b)t ) = E(e tbt e itX ) = e tbt E(e itX ) = e ibt ϕ X (at).

Cuối cùng, chúng ta chứng minh tính chất (iii) cho hai biến ngẫu nhiên độc lập X và Y Vì X và Y độc lập, nên các hàm mũ phức e^(iX) và e^(iY) cũng độc lập Từ đó, ta có ϕ_X+Y(t) = E(e^(i(X+Y))) = E(e^(iX)e^(iY)) = E(e^(iX))E(e^(iY)) = ϕ_X(t)ϕ_Y(t).

Nếu X1, X2, , Xn là các biến ngẫu nhiên độc lập và có cùng phân phối xác suất với biến ngẫu nhiên X, thì hàm đặc trưng của tổng các biến ngẫu nhiên này được biểu diễn là ϕX1 + + Xn(t) = [ϕX(t)]n Định lý 4.5 chỉ ra rằng ϕXn(t) là hàm đặc trưng của biến ngẫu nhiên Xn, trong khi ϕX(t) là hàm đặc trưng của biến ngẫu nhiên X.

Khi và chỉ khi ϕ X n (t) hội tụ về ϕ X (t) khi n tiến tới vô cùng, nếu {X n , n ≥ 1} là dãy các biến ngẫu nhiên độc lập, cùng phân phối xác suất với biến ngẫu nhiên X có kỳ vọng E(X) = à và phương sai V(X) = σ² hữu hạn, thì giới hạn của xác suất P(S n − nà) khi n tiến tới vô cùng tồn tại.

Chứng minh Áp dụng Định lí 4.5, ta cần chứng minh hàm đặc trưng của

√ nσ hội tụ về hàm đặc trưng của phân phối chuẩn tắc.

Khụng mất tớnh tổng quỏt ta giả thiết à = 0 và σ = 1 (Nếu khụng thỡ đặt Z i = (X i − à)/σ) Khi đú ϕ Sn −nà

Định lý giới hạn trung tâm khẳng định rằng, đối với các biến ngẫu nhiên độc lập và cùng phân phối xác suất với kỳ vọng và phương sai hữu hạn, tổng của chúng sẽ có phân phối xấp xỉ phân phối chuẩn khi số lượng biến tăng đủ lớn Cụ thể, nếu X1, X2, , Xn là các biến ngẫu nhiên như vậy, thì tổng Sn = X1 + X2 + + Xn sẽ có phân phối gần giống với phân phối chuẩn N(nà; nσ²).

X = X 1 + X 2 + + X n n cú phõn phối xấp xỉ phõn phối chuẩn N(à; σ 2 /n).

Ví dụ 4.2 Tuổi thọ làm việc của một linh kiện điện tử là một biến ngẫu nhiên

X có kỳ vọng 250 giờ và độ lệch chuẩn cũng là 250 giờ Một công ty chỉ thay linh kiện khi linh kiện cũ hỏng, và mỗi linh kiện được sử dụng cho đến khi hết hạn Tính xác suất để 100 linh kiện đủ dùng ít nhất 1 năm (365 ngày).

Tuổi thọ của linh kiện thứ k được ký hiệu là Xk (1 ≤ k ≤ 100), với các biến ngẫu nhiên X1, X2, , X100 độc lập và cùng phân phối xác suất với X Theo Định lý giới hạn trung tâm, chúng ta có thể áp dụng các nguyên tắc thống kê để phân tích tuổi thọ của các linh kiện này.

Hệ quả 4.3 (Định lí giới hạn tích phân Moivre-Laplace) Giả sử X n là biến ngẫu nhiên có phân phối nhị thức B(n; p) Đặt

Z n = X n − np pnp(1 − p) Khi đó với mọi x ∈R, n→∞ lim P (Z n < x) = Φ(x).

Nói cách khác, với n đủ lớn B(n; p) có phân phối xấp xỉ phân phối chuẩnN(np; np(1 − p)).

Xấp xỉ trên tốt nhất khi np > 5 và n(1 − p) > 5.

Xác suất bắn trúng mục tiêu của xạ thủ là 0,7 Khi xạ thủ thực hiện 100 phát bắn độc lập, chúng ta cần tính xác suất để có ít nhất 75 phát trúng mục tiêu.

Giải Gọi X là số phát trúng trong 100 phát đã bắn Khi đó, X ∼ B(100; 0, 7) Áp dụng hệ quả trên, X xấp xỉ phân phối chuẩn N(70; 21) Do đó,

□ Hiệu chỉnh liên lục đối với các biến ngẫu nhiên rời rạc

Khi áp dụng định lý giới hạn trung tâm cho dãy biến ngẫu nhiên rời rạc, chúng ta có thể xấp xỉ một phân phối rời rạc bằng một phân phối liên tục Do đó, cần thực hiện các hiệu chỉnh để giảm thiểu sai số trong quá trình này.

Cho dãy biến ngẫu nhiên rời rạc {X n ; n ≥ 1} nhận giá trị nguyên và Y =

X 1 + + X n Giả sử ta cần tính các xác suất P (Y < k), P (Y ≤ k), P (Y > k),

P (Y ≥ k) với k là số nguyên Khi đó ta hiệu chỉnh như sau:

Trong một ví dụ, có 10.000 xe máy tham gia bảo hiểm từ một công ty, với mức phí 100.000 đồng mỗi năm cho mỗi chủ xe Trung bình, nếu xe máy gặp tai nạn giao thông, chủ xe sẽ nhận lại 5 triệu đồng Theo thống kê, tỷ lệ xe máy bị tai nạn giao thông trong số này là một yếu tố quan trọng cần xem xét.

1 năm là 0,006 Tính xác suất để: a) sau một năm hoạt động công ty bị lỗ. b) sau một năm hoạt động công ty lãi ít nhất 800 triệu.

Trong bài toán này, chúng ta xét số xe máy mua bảo hiểm của công ty bị tai nạn trong một năm, ký hiệu là X, với X tuân theo phân phối nhị thức B(10 4; 0, 006) Tính toán cho thấy np = 60 và np(1 − p) = 59,64, cho phép chúng ta xấp xỉ X bằng phân phối chuẩn N(60; 59,64) Để xác định xác suất công ty bị lỗ sau một năm hoạt động, ta cần tính toán dựa trên các thông số đã cho.

P (10 9 − 5.10 6 X < 0) = P (X > 200) = 1 − P (X < 200 − 0, 5) ≈ 1 − Φ(18, 06) ≈ 0. b) Xác suất sau một năm hoạt động công ty lãi ít nhất 800 triệu

Luật số lớn đối với dãy biến ngẫu nhiên đôi một độc lập

độc lập Định nghĩa 4.5 Cho a ≥ 0 Hàm số dương đo được f (x) trên [a; ∞) được gọi là hàm biến đổi chậm ở vô cực nếu f (tx) f (t) → 1 khi t → ∞ với mọi x > 0.

Vớix > 0, kí hiệulog + (x) = max{1, ln(x)}, trong đóln(x)là hàm logarit tự nhiên.

Các hàm log + (x), log + (log + (x)), log + (x) và log + (log + (x)) đều được coi là các hàm biến đổi chậm ở vô cực Đặt ℓ(x) là các hàm biến đổi chậm ở vô cực, theo Định lý 1.5.13 trong tài liệu.

[11], suy ra tồn tại một hàm biến đổi chậm ở vô cực ℓ # (x) thỏa mãn

Hàmℓ # (x) được gọi là hàm liên hợp Bruijn củaℓ(x) Chẳng hạn, vớiℓ(x) = log + (x) ta có ℓ # (x) = 1/ log + (x).

Bổ đề 4.1 ([1, 13]) Cho 1 < r < 2, X là biến ngẫu nhiên Nếu P (|X| > x) ≍ x −r ℓ(x), trong đó ℓ(x) là hàm biến đổi chậm ở vô cực Khi đó,

Bổ đề 4.2 Cho {X n ; n ≥ 1} là dãy biến ngẫu nhiên đôi một độc lập với E(X n ) = 0 and E(X n 2 ) < ∞ Khi đó,

Chứng minh Để chứng minh a) ta sử dụng bất đẳng thức

Bây giờ ta chứng minh b) Ta có hằng đẳng thức n

Để chứng minh điều cần thiết, ta sử dụng kì vọng của hai vế và tính chất độc lập Định lý 4.7 chỉ ra rằng với 1 < r < 2 và 0 < p ≤ r, dãy biến ngẫu nhiên {X, X n ; n ≥ 1} là độc lập và có cùng phân phối xác suất với kì vọng 0 Hơn nữa, xác suất P (|X| > x) tỷ lệ thuận với x −r ℓ(x), trong đó ℓ(x) là hàm biến đổi chậm ở vô cực, thỏa mãn điều kiện ℓ(n 1/p ) = o(n r/p−1 ).

{a ni ; 1 ≤ i ≤ n, n ≥ 1} là mảng các số thực sao cho n

Chứng minh Để thuận tiện trong trình bày chứng minh, các hằng số dương C không nhất thiết giống nhau trong mỗi lần xuất hiện Với mỗi n ≥ 1 và 1 ≤ i ≤ n, đặt

Trong bài viết này, chúng ta xem xét các dãy biến ngẫu nhiên độc lập {Y ni ; 1 ≤ i ≤ n} và {Z ni ; 1 ≤ i ≤ n} với cùng một phân phối xác suất Hơn nữa, tổng Pn i=1 a ni X i được biểu diễn dưới dạng S n + S n ′ Đối với bất kỳ ϵ > 0 và n ≥ 1, các kết quả liên quan sẽ được phân tích.

Tiếp theo ta chứng minh I 2 → 0 khi n → ∞ Áp dụng bất đẳng thức Cauchy- Schwarz và (4.3) ta có n

≤ Cℓ(n 1/p ) ϵn r/p−1 → 0 khi n → ∞. Định lí được chứng minh □

Sau đây ta sẽ xét một ứng dụng của Định lí 4.7 trong ước lượng mô hình hồi quy phi tham số.

Xét mô hình hồi quy phi tham số:

Trong mô hình hồi quy đa biến, công thức Y ni = f (x ni ) + ε ni (1 ≤ i ≤ n) thể hiện mối quan hệ giữa biến phụ thuộc Y ni và các điểm thiết kế x ni trên tập hợp compact A ⊂ R m Hàm f (x) đại diện cho hàm hồi quy xác định trên A, trong khi ε i là các sai số ngẫu nhiên Một ước lượng cho hàm f(x) được đưa ra dưới dạng f ˆ n (x) = n.

Trong bài viết này, chúng tôi sẽ thảo luận về ước lượng W ni (x) = W (x, x n1 , x nn ) với các hàm trọng số, được giới thiệu lần đầu bởi Stone và sau đó được Georgiev nghiên cứu trong trường hợp thiết kế cố định Nhiều tác giả khác, như Georgiev và Greblicki, Georgiev, và Muller, cũng đã nghiên cứu vấn đề này với sai số ngẫu nhiên độc lập Chúng tôi sẽ tập trung vào ước lượng với sai số ngẫu nhiên đôi một độc lập và có xác suất đuôi nặng.

Với x ∈ A, sau đây là một số giả thiết đối với các hàm trọng số

(A3)Pn i=1 |W ni (x)||f (x ni ) − f (x)|I(∥x ni − x∥ > a) = o(1) với mọi a > 0.

Định lý 4.8 khẳng định rằng với điều kiện 1 < r < 2 và 0 < p ≤ r, trong mô hình (4.4), nếu (ε i ; 1 ≤ i ≤ n) là một dãy các sai số ngẫu nhiên độc lập và đồng phân phối với biến ngẫu nhiên ε có kỳ vọng bằng 0, thì

P (|ε| > x) ≍ x −r ℓ(x), (4.6) trong đó ℓ(x) là hàm biến đổi chậm ở vô cực thỏa mãn ℓ(n 1/p ) = o(n r/p−1 ) Nếu n

W ni 2 (x) = O(n 1−2/p ), (4.7) thì với mọi x ∈ c(f ), f ˆ n (x) − P → f(x) khi n → ∞,trong đó c(f ) là tâp các điểm liên tục của hàm f (x) trên tập A.

Chứng minh Với x ∈ c(f), ta có f ˆ n (x) − f (x) = n

W ni (x)ε nj + [E( ˆ f n (x)) − f (x)]. Áp dụng Định lí 4.7 với a ni = n 1/p W ni (x), ta có n

Do đó, để hoàn thành chứng minh định lí ta cần chỉ ra rằng

Vì x ∈ c(f ), nên với ϵ > 0 tùy ý, tồn tại δ > 0 sao cho với mọi x ′ ∈ A thỏa mãn

∥x ′ − x∥ < δ ta đều có |f(x ′ ) − f (x)| < ϵ Nếu ta chọn a ∈ (0, δ), thì khi đó

|f(x)| → 0 khi n → ∞ tiếp sau đó cho ϵ → 0.

Chúng ta thừa nhận định lý 4.9 mà không cần chứng minh, trong đó có các điều kiện 1 ≤ p < α < 2, β > α, và 1/α + 1/β = 1/p Hàm ℓ(x) là hàm biến đổi chậm ở vô cực Xét dãy biến ngẫu nhiên (X, X_n; n ≥ 1) là các biến ngẫu nhiên độc lập và cùng phân phối xác suất với kỳ vọng bằng 0 Đồng thời, (a_ni; 1 ≤ i ≤ n, n ≥ 1) là mảng các số thực thỏa mãn n.

▷ 4.1 Cho {X n ; n ≥ 1} là dãy biến ngẫu nhiên độc lập, có cùng phân phối xác suất với hàm mật độ xác suất chung f(x) =

0 nếu x ≤ 0. Đặt Y n = min{X 1 , , X n } Chứng minh

▷ 4.2 Cho dãy biến ngẫu nhiên rời rạc {X n ; n ≥ 1} với

▷ 4.3 Cho dãy biến ngẫu nhiên liên tục {X n ; n ≥ 1} với hàm mật độ xác suất của

▷ 4.4 Cho dãy biến ngẫu nhiên liên tục {X n ; n ≥ 2} với hàm mật độ xác suất của

▷ 4.5 Cho X ∼ N (0; 1), biến ngẫu nhiên X n được xác định bởi

Giả sử{X, X n ; n ≥ 1}là dãy biến ngẫu nhiên độc lập Đặt Y n = X.X n Chứng minh

▷ 4.6 Cho {X n ; n ≥ 1} là dãy biến ngẫu nhiên độc lập, có cùng phân phối xác suất với kỡ vọng chung à và phương sai chung σ 2 hữu hạn Đặt

▷ 4.7 Cho {X n ; n ≥ 1} là dãy biến ngẫu nhiên dương, độc lập, có cùng phân phối xác suất và 0 < E(ln(X i )) = γ < ∞ Đặt

▷ 4.8 Cho {X n ; n ≥ 2} là dãy biến ngẫu nhiên với hàm phân phối xác suất của

 e nx +xe n e nx + ( n+1 n ) e n 0 ≤ x ≤ 1, e nx +e n e nx + ( n+1 n ) e n x > 1.

▷ 4.9 Cho {X n , n ≥ 1} là một dãy các biến ngẫu nhiên độc lập cùng phân phối, E(X) = à và V (X) = σ 2 Với x ∈R tớnh giới hạn: n→∞ lim P (X 1 + X 2 + + X n < x).

Tuổi thọ của một bóng đèn, được ký hiệu là biến ngẫu nhiên X, có kỳ vọng E(X) = 250 giờ và độ lệch chuẩn SD(X) = 250 giờ Để đảm bảo cửa hàng duy trì ánh sáng liên tục trong ít nhất 8750 giờ (tương đương khoảng 1 năm), ta áp dụng định lý giới hạn trung tâm để tính xác suất cho 30 bóng đèn được mua Ngoài ra, để xác định số lượng bóng đèn cần mua nhằm duy trì ánh sáng liên tục ít nhất 8750 giờ với xác suất lớn hơn 0,9772, chúng ta cũng sử dụng định lý giới hạn trung tâm trong bài toán này.

▷ 4.11 Tuổi thọ của một loại van điện lắp trong một thiết bị là biến ngẫu nhiên

X (nghìn giờ) được phân bố theo mũ với kỳ vọng E(X) = 10 (nghìn giờ) Để tính xác suất xấp xỉ cho việc lắp 36 van điện vào thiết bị mà có ít nhất 20 van bị thay thế trước 5 ngàn giờ, ta cần lưu ý rằng tuổi thọ của các van điện là độc lập nhau.

Để đảm bảo đủ chỗ cho 1000 khách vào ăn trưa với xác suất lớn hơn hoặc bằng 0,99, nhà ăn cần tính toán số lượng chỗ ngồi tối thiểu dựa trên xác suất mỗi người chọn một trong hai đợt ăn trưa là như nhau Áp dụng định lý giới hạn trung tâm, có thể xác định rằng số lượng chỗ ngồi cần thiết sẽ phụ thuộc vào phân phối số lượng khách trong mỗi đợt Việc này giúp nhà ăn chuẩn bị đủ chỗ ngồi, tránh tình trạng thiếu chỗ cho khách.

▷ 4.13 Tuổi thọ (năm) của một thiết bị điện tử là một biến ngẫu nhiên X có hàm mật độ xác suất: f(x) =

Cửa hàng A nhập 10.000 thiết bị để bán, với lợi nhuận 15.000 đồng cho mỗi thiết bị không cần bảo hành và lỗ 5.000 đồng cho thiết bị phải bảo hành Thời gian bảo hành là 6 tháng Để cửa hàng A đạt lãi ít nhất 125 triệu đồng, cần tính xác suất cho việc bán hết 10.000 thiết bị.

▷ 4.14 Thời gian (phút) phục vụ mỗi khách hàng tại một cửa hàng A là biến ngẫu nhiên X có phân phối mũ với trung bình là 0, 2 phút Quan sát ngẫu nhiên

35khách hàng vào chờ mua hàng ở cửa hàng đó Tính xấp xỉ xác suất để thời gian phục vụ trung bình của 35 khách hàng đó lớn hơn 0, 3 phút.

Một hộp chứa 50 viên pin loại A và 50 viên pin loại B, trong đó pin loại A có tuổi thọ trung bình 500 giờ với độ lệch chuẩn 15 giờ, còn pin loại B có tuổi thọ trung bình 400 giờ với độ lệch chuẩn 6 giờ Cần tính xác suất tổng tuổi thọ của 100 viên pin này lớn hơn 45.200 giờ.

Trọng lượng của các viên thuốc chữa bệnh B tại một xí nghiệp tuân theo phân phối chuẩn với trọng lượng trung bình là 25mg và độ lệch chuẩn là 9mg Mỗi vỉ thuốc chứa 10 viên và được coi là đạt tiêu chuẩn nếu tổng trọng lượng nằm trong khoảng từ 2470mg đến 2530mg Khi chọn ngẫu nhiên 100 vỉ thuốc để kiểm tra, cần tính xác suất để có ít nhất 80 vỉ đạt tiêu chuẩn.

Tuổi thọ của bóng đèn được mô hình hóa bằng phân phối mũ với giá trị trung bình là 1500 giờ Bóng đèn được phân loại A nếu tuổi thọ của nó vượt quá 1600 giờ Mỗi hộp chứa 3 bóng đèn và được coi là đạt tiêu chuẩn khi có ít nhất 2 bóng loại A Trong một nghiên cứu, 40 hộp bóng đèn được chọn ngẫu nhiên để kiểm tra Mục tiêu là tính toán xác suất để có tối đa 10 hộp đèn đạt tiêu chuẩn.

▷ 4.18 Tuổi thọ (năm) của một loại thiết bị là biến ngẫu nhiên có phân bố mũ với hàm phân phối xác suất

Phải chọn ngẫu nhiên bao nhiêu thiết bị để có ít nhất 100 thiết bị có tuổi thọ lớn hơn 7 (năm) với xác suất lớn hơn 0, 95?

Một công ty bảo hiểm bán phí bảo hiểm xe máy với giá 125.000 đồng mỗi năm và trung bình bồi thường 5 triệu đồng khi xảy ra tai nạn giao thông Tỉ lệ tai nạn xe máy trong một năm là 0,015, trong khi các chi phí khác chiếm 20% phí bảo hiểm Để xác suất lỗ thấp hơn 0,001, công ty cần xác định số lượng bảo hiểm tối thiểu phải bán trong một năm.

▷ 4.20 Số khách hàng vào mua hàng ở 1cửa hàng trong 1ngày là biến ngẫu nhiên

X có phân bố Poisson với số khách trung bình E(X) = 50 Giả sử hàm doanh thu

Y (triệu đồng) được xác định bởi Y = 3X Chọn ngẫu nhiên bao nhiêu ngày để doanh thu trung bình những ngày này lớn hơn 145 triệu đồng có xác suất lớn hơn

0, 95 Biết doanh thu mỗi ngày độc lập với nhau.

XÍCH MARKOV

Tính Markov

Trong Chương 4, chúng ta đã nghiên cứu các định lý giới hạn liên quan đến dãy biến ngẫu nhiên độc lập Tuy nhiên, thực tế cho thấy nhiều dãy quan sát không độc lập theo thời gian, như nhiệt độ không khí hàng sáng, dân số một quốc gia qua các năm, hay giá vàng theo giờ Nếu giá trị tương lai của một dãy quan sát chỉ phụ thuộc vào giá trị hiện tại mà không liên quan đến giá trị quá khứ, thì dãy quan sát đó được gọi là dãy có tính Markov.

Dân số của nước ta trong năm tới có thể được dự đoán dựa trên dân số hiện tại, mà không phụ thuộc vào dân số của các năm trước.

Xét một hệ thống quan sát tại các thời điểm rời rạc 0, 1, 2, , với các quan sát được ký hiệu là X0, X1, X2, Từ đó, ta có một dãy biến ngẫu nhiên {Xn; n ≥ 0}, trong đó Xn thể hiện trạng thái của hệ tại thời điểm n Giả thiết rằng Xn là biến ngẫu nhiên rời rạc cho mọi n Ký hiệu E là tập hợp tất cả các giá trị của {Xn; n ≥ 0}, được gọi là không gian trạng thái của hệ, với E có thể là tập hữu hạn hoặc vô hạn đếm được, và các phần tử của E được ký hiệu là i, j, k,

Giá trị P(X n+1 = k|X n = i), với i, k ∈ E và n ≥ 1, thể hiện xác suất chuyển một bước của hệ thống, tức là xác suất hệ ở trạng thái k tại thời điểm n + 1 khi biết rằng tại thời điểm n, hệ ở trạng thái i Nếu xác suất này chỉ phụ thuộc vào i và k, không phụ thuộc vào n, thì hệ thống được gọi là thuần nhất Trong giáo trình này, chúng ta chỉ xem xét các hệ thuần nhất Định nghĩa 5.1 cho biết rằng dãy các biến ngẫu nhiên rời rạc {X n; n ≥ 0} được coi là một xích Markov nếu với mọi n ≥ 1 và mọi k, i, i0, in−1 ∈ E, đều thỏa mãn điều kiện xác định của xích Markov.

Vì ta chỉ xét xích Markov thuần nhất nên:

Ta có (5.1) tương đương với

Ví dụ 5.1 Cho {X n ; n ≥ 0} là các biến ngẫu nhiên độc lập và có cùng phân phối xác suất với

Xác suất P(Xn = -1) = 1 - P(Xn = 1) = p, với 0 < p < 1 Đặt Sn = X0 + + Xn cho n ≥ 1 Ta cần chứng minh rằng {Sn; n ≥ 0} là một chuỗi Markov với không gian trạng thái là Z Dãy Sn còn được gọi là bước đi ngẫu nhiên đơn giản Điều này xảy ra vì Xn+1 độc lập với S0, S1, , Sn-1, do đó, tính chất Markov được thỏa mãn.

Ví dụ 5.2 Cho{X n ; n ≥ 0}là một xích Markov ĐặtY n = X 2n , khi đó{Y n ; n ≥ 0} cũng là một xích Markov.

Kí hiệu p ik = P (X n+1 = k|X n = i) = P (X 1 = k|X 0 = i), p ik (n) = P (X m+n = k|X m = i) = P (X n = k|X 0 = i). Định lí 5.1 (Phương trình C-K (Chapman-Kolmogorov)). p ik (n + m) = X j∈E p ik (n)p jk (m).

Chứng minh Theo công thức xác suất toàn phần và tính Markov ta có: p ij (n + m) = P (X n+m = j |X 0 = i)

□Trong phạm vi giáo trình này chúng ta chỉ xét các xích Markov có không gian trạng thái hữu hạn.

Xích Markov có không gian trạng thái hữu hạn

5.2.1 Ma trận xác suất chuyển và sơ đồ chuyển trạng thái

Xét xích Markov có không gian trạng thái hữu hạn E = {1, 2, , d} Đặt p ik = P (X 1 = k|X 0 = i), i, k ∈ E.

Ma trận xác suất chuyển trạng thái (sau 1 bước) được sử dụng để mô tả quá trình chuyển đổi trong xích Markov Để minh họa một cách trực quan cho xích Markov, chúng ta thường sử dụng Sơ đồ chuyển trạng thái Ví dụ, xem xét xích Markov {X n ; n ≥ 1} với không gian trạng thái.

E = {1, 2, 3} và ma trận xác suất chuyển

 Khi đó ta vẽ sơ đồ chuyển trạng thái như sau:

Ví dụ 5.3 Cho xích Markov có không gian trạng thái E = {1, 2, 3} và ma trận xác suất chuyển

 a) Tính P (X 4 = 3|X 3 = 2). b) Tính P (X 3 = 1|X 2 = 1). c) Biết P (X 0 = 1) = 1 3 , tính P (X 0 = 1, X 1 = 2). d) Biết P (X 0 = 1) = 1 3 , tính P (X 0 = 1, X 1 = 2, X 2 = 3).

Cho xích Markov {X n ; n ≥ 0}, giả sử ta đã biết phân phối xác suất của X 0 : x 1 2 d p(x) P (X 0 = 1) P (X 0 = 2) P (X 0 = d)

Kí hiệuU = U (0) = [P (X 0 = 1), P (X 0 = 2), , P (X 0 = d)] là vectơ mô tả phân phối xác suất của X 0

Tương tự, kí hiệu U(n) = [P (X n = 1), P (X n = 2), , P (X n = d)] là vectơ mô tả phân phối xác suất của X n Đặt p ij (n) = P (X n = j |X 0 = i).

 được gọi là ma trận xác suất chuyển sau n bước.

Từ Định lí 5.1 ta có Định lí 5.2.

Trong ví dụ 5.4, biến ngẫu nhiên X n đại diện cho chất lượng của chi tiết tại công đoạn thứ n trong dây chuyền sản xuất, trong đó X n = 0 biểu thị chất lượng tốt và X n = 1 biểu thị chất lượng xấu Hệ thống {X n ; n ≥ 0} được mô tả là một chuỗi Markov với ma trận xác suất chuyển.

#. a) Vẽ sơ đồ chuyển trạng thái. b) Tính P (3), từ đó tìm P (X 4 = 1|X 1 = 1).

Giải a) Sơ đồ chuyển trạng thái:

Ví dụ 5.5 Cho xích Markov{X n ; n ≥ 0}với không gian trạng tháiE = {0, 1, 2} và ma trận xác suất chuyển

 a) Vẽ sơ đồ chuyển trạng thái. b) Tính P (3), từ đó tìm P (X 3 = 1|X 1 = 1), P (X 3 = 1|X 0 = 0).

Giải a) Sơ đồ chuyển trạng thái:

Ví dụ 5.6 Cho xích Markov{X n ; n ≥ 0}với không gian trạng tháiE = {0, 1, 2} và ma trận xác suất chuyển

 a) Vẽ sơ đồ chuyển trạng thái. b) Tính P (X 2 = 1|X 0 = 0), P (X 3 = 0|X 0 = 0).

Giải a) Sơ đồ chuyển trạng thái:

Ví dụ 5.7 Cho xích Markov{X n ; n ≥ 0}với không gian trạng tháiE = {0, 1, 2} và ma trận xác suất chuyển

Biết phân phối ban đầu của X 0 là U = [0, 3; 0, 4; 0, 3] Tính

Giải Theo Định lí 2.2 ta có

Trong ví dụ 5.8, một bức điện chứa các tín hiệu 0 và 1 được truyền qua kênh với nhiều trạm, mỗi trạm nhận tín hiệu với xác suất a Kí hiệu X0 đại diện cho tín hiệu truyền đi, trong khi Xn là tín hiệu nhận được tại trạm n Các tín hiệu (Xn) tạo thành một chuỗi Markov với ma trận xác suất chuyển.

Giả sử tín hiệu truyền đi là X0 = 0 Để tính xác suất không nhận sai tín hiệu cho tới trạm thứ 2, ta cần xem xét các yếu tố liên quan đến độ tin cậy của tín hiệu Tiếp theo, xác suất nhận đúng tín hiệu của trạm thứ 2 cũng cần được tính toán dựa trên các điều kiện đã cho Cuối cùng, xác suất nhận đúng tín hiệu của trạm thứ 5 sẽ được xác định, phản ánh khả năng duy trì độ chính xác trong quá trình truyền tải tín hiệu qua nhiều trạm.

Giải a) Xác suất để không nhận sai tín hiệu cho tới trạm thứ 2:

= p 00 p 00 = a 2 b) Xác suất để nhận đúng tín hiệu của trạm thứ 2:

Với ma trận xác suất chuyển sau 2 bước P(2):

# c) Xác suất để nhận đúng tín hiệu của trạm thứ 5:

Với ma trận xác suất chuyển sau 5 bước P(5):

Trong nghiên cứu về vấn đề nghiện hút tại địa phương A, trạng thái 0 biểu thị cho người không nghiện và trạng thái 1 cho người nghiện, với đơn vị thời gian được tính theo quý (3 tháng) Dữ liệu thống kê nhiều năm cho thấy xác suất một người không nghiện vẫn không nghiện sau 1 quý là 0,99, trong khi xác suất để một người nghiện tiếp tục nghiện sau 1 quý là 0,88 Những thông tin này giúp mô tả trạng thái nghiện của cá nhân một cách rõ ràng.

1 xích Markov với không gian trạng thái E = {0, 1} và ma trận xác suất chuyển P

Giả sử ban đầu có 17% số người nghiện, ta cần xác định phân phối số người nghiện và không nghiện sau 1 quý và 2 quý Sau 1 quý, tỷ lệ người nghiện và không nghiện sẽ được tính toán dựa trên các yếu tố như tỷ lệ hồi phục và tỷ lệ gia tăng nghiện Tương tự, sau 2 quý, phân phối này sẽ tiếp tục thay đổi theo các biến số trên, cho phép chúng ta có cái nhìn tổng quan về tình hình nghiện trong cộng đồng.

Giải Phân phối ban đầu của X 0 là U (0) = [0, 83; 0, 17]. a) Phân phối số người nghiện và không nghiện sau 1 quý là:

0, 8421 0, 1579 i b) Phân phối số người nghiện và không nghiện sau 2 quý:

Trong ví dụ 5.10, có 3 cửa hàng cùng cung cấp một loại sản phẩm, và khách hàng chọn mua sản phẩm tại một trong ba cửa hàng này dựa trên sở thích cá nhân Mỗi tháng, khách hàng không thay đổi cửa hàng mua sắm, với X₀ đại diện cho cửa hàng mà khách hàng chọn trong tháng thứ n Đây được coi là một quá trình Markov với 3 trạng thái E = {1, 2, 3} Xác suất chuyển pₐₗ là xác suất mà khách hàng hiện tại tại cửa hàng i sẽ chuyển sang mua hàng tại cửa hàng j trong tháng tiếp theo, và được mô tả bằng ma trận xác suất chuyển.

 và phân phối khách hàng ở tháng thứ nhất của cửa hàng 1 chiếm 20%, cửa hàng

2 chiếm 50%, cửa háng 3 chiếm 30% Tìm phân phối khách hàng của 3 cửa hàng ở tháng thứ 12.

Giải Phân phối khách hàng ở tháng thứ nhất: U (1) = [0, 2; 0, 5; 0, 3]

Ma trận xác suất chuyển sau 11 bước là:

 Phân phối khách hàng của 3 cửa hàng ở tháng thứ 11:

Phân phối dừng và phân phối giới hạn

Định nghĩa 5.2 Phân phối Π = [π i ] 1×d được gọi là phân phối dừng của xích Markov {X n ; n ≥ 0} với ma trận xác suất chuyển P nếu Π.P = Π.

Ví dụ 5.11 Cho {X n ; n ≥ 0} là một xích Markov có không gian trạng thái

E = {1, 2, 3} và ma trận xác suất chuyển

Hãy tìm phân phối dừng.

Giải Đặt Π = [x; y; z] Khi đó Π là phân phối dừng khi và chỉ khi x,y,z là nghiệm không âm của hệ sau:

Giải hệ phương trình trên ta được phân phối dừng Π = [6/25, 2/5, 9/25] □ Định nghĩa 5.3 Cho xích Markov {X n ; n ≥ 0} có không gian trạng thái

E = {1, 2, , d} Giả sử với mọi i, j ∈ E, tồn tại giới hạn lim P(X_n = j | X_0 = i) = π_j, và giới hạn này không phụ thuộc vào j, với tổng Pd_j=1 π_j = 1 Khi đó, π = [π_1, π_2, , π_d] được gọi là phân phối giới hạn của xích Markov {X_n; n ≥ 0} Theo Định lý 5.3, nếu xích Markov {X_n; n ≥ 0} có phân phối giới hạn π = [π_1, , π_d], thì đây là phân phối dừng duy nhất.

Chứng minh Giả sử U = [u 1 , , u d ] là phân phối dừng Theo Định lí 5.1 ta có u j =X k∈E u k p kj (n).

Vì chuỗi hội tụ đều với n nên u j =X k∈E u k lim n→∞ P kj (n) = X k∈E u k π j = π j

Định lý 5.4 chỉ ra rằng xích Markov {X n; n ≥ 0} với không gian trạng thái hữu hạn E sẽ có phân phối giới hạn duy nhất π = [π 1, , π d] nếu và chỉ nếu mọi thành phần π j đều lớn hơn 0 Điều này xảy ra khi xích Markov là chính quy, tức là tồn tại một số nguyên n 0 sao cho xác suất P(X n 0 = j|X 0 = i) lớn hơn 0 cho mọi i, j.

Chứng minh Giả thiết {X n ; n ≥ 0} là xích chính quy Ta cố định j và đặt m j (n) = min i∈E p ij (n),

Ta có p ij (n + 1) =X k p ik p kj (n) ≥X k p ik m j (n) = m j (n).

Dãy (m j (n)) với n = 1, 2, là dãy tăng và bị chặn trên bởi 1, do đó tồn tại giới hạn lim n m j (n) = a j Tương tự, dãy (M j (n)) với n = 1, 2, là dãy giảm và bị chặn bởi 0, dẫn đến giới hạn lim n M j (n) = A j.

Ta cóm j (n) ≤ P ij (n) ≤ M j (n)do đó định lí được chứng minh nếu ta chỉ ra a j = A j

Ký hiệur = min i,j P ij (n 0 ) > 0 Ta có P ik (n 0 ) ≥ r.1 ≥ P jk (n)nênP ik (n 0 ) ≥ rP jk (n) ∀i, thành thử p ij (n 0 + n) =X k p ik (n 0 )p kj (n)

(P ik (n 0 ) − rP jk (n))p kj (n) + rX k p jk (n)p kj (n)

(p ik (n 0 ) − rp jk (n)) + rp jj (2n)

Vì bất đẳng thức này đúng với mọi i nên ta có m j (n 0 + n) ≥ m j (n)(1 − r) + rP jj (2n).

Ta chứng minh quy nạp rằng với mọi k

M j (kn 0 + 1) − m j (kn 0 + 1) ≤ (1 − r) k (M j (1) − m j (1)) (5.3) Thật vậy với k = 1 đúng ( cho n = 1 ở (5.2)) Giả sử đúng với k ta có

Cho k → ∞ trong (5.3) ta nhận được A j − a j ≤ 0 Vì A j − a j ≥ nên ta kết luận

A j = a j Đảo lại giả sử với mọi i, j ∈ E tồn tại lim n p ij (n) = π j ≥ 0 Khi đó tồn tại n 0 (i, j) sao cho P ij (n) > 0 ∀n > n 0 (i, j) Đặt n 0 = max i,j n 0 (i, j) ta có P ij (n) > 0 ∀i, j ∈ E

Ví dụ 5.12 Cho xích Markov {X n ; n ≥ 0} có ma trận xác suất chuyển

VìP (2) có các phần tử đều dương nên {X n ; n ≥ 0} là xích Markov chính quy.

Trong một vùng, mỗi người dân có thể thuộc vào ba tầng lớp: giàu (kí hiệu 1), trung lưu (kí hiệu 2) và nghèo (kí hiệu 3) Con cái của họ cũng có khả năng thuộc vào một trong ba tầng lớp này, với xác suất khác nhau dựa trên tầng lớp của cha mẹ Theo thống kê, ma trận xác suất chuyển đổi giữa các tầng lớp đã được xác định.

 Xích Markov này là chính quy nên có phân phối dừng duy nhất Tìm phân phối dừng đó.

Giải Đặt Π = [x; y; z] Khi đó Π là phân phối dừng khi và chỉ khi x,y,z là nghiệm không âm của hệ sau:

Giải hệ phương trình trên ta được phân phối dừng Π = [0, 0672; 0, 6240; 0, 3088] □

Ví dụ 5.14 Cho xích Markov{X n ; n ≥ 0}có không gian trạng tháiE = {1, 2, 3} và ma trận xác suất chuyển

Phân phối ban đầu là U = [0, 7; 0, 2; 0, 1]. a) Lập bảng phân phối xác suất của X 2. b) Tính P (X 0 = 1, X 1 = 3, X 2 = 3, X 3 = 2). c) Tìm phân phối dừng.

Giải a) Phân phối xác suất của X 2 là:

Bảng phân phối xác suất của X 2 là: x 1 2 3 p(x) 0, 385 0, 336 0, 279 b) Ta có:

P (X 0 = 1, X 1 = 3, X 2 = 3, X 3 = 2) = u 1 p 13 p 33 p 32 = 0, 7.0, 4.0, 3.0, 4 = 0, 0336. c) Đặt Π = [x; y; z] Khi đó Π là phân phối dừng khi và chỉ khi x,y,z là nghiệm không âm của hệ sau:

0, 4x + 0, 2y + 0, 3z = z x + y + z = 1Giải hệ phương trình trên ta được phân phối dừng Π = [16/47; 17/47; 14/47] □

Trong một ví dụ với ba cửa hàng A, B và C cung cấp cùng một loại sản phẩm, khách hàng có quyền lựa chọn mua hàng từ một trong ba cửa hàng này dựa trên sở thích cá nhân Mỗi tháng, họ sẽ không thay đổi địa điểm mua sắm của mình Thống kê cho thấy có một ma trận xác suất chuyển giữa các cửa hàng này.

Tìm phân phối giới hạn.

Xích Markov này là chính quy, do đó tồn tại một phân phối giới hạn π = [x, y, z] Phân phối này là phân phối dừng duy nhất và có thể được xác định bằng cách giải hệ phương trình tương ứng.

Giải hệ ta tìm được x = 0, 36, y = 0, 15, z = 0, 49 Điều này có nghĩa là khi thời gian đủ dài số khách hàng vào các cửa hàng A, B và C lần lượt là 36%, 15% và

Trong thị trấn N, mỗi người dân có 1 trong 3 nghề A, B, C, với xác suất con cái nối tiếp nghề của cha là 3/5, 2/3, và 1/4 tương ứng Nếu không theo nghề của cha, con cái sẽ chọn một trong hai nghề còn lại với xác suất như nhau Hiện tại, 20% dân số theo nghề A, 30% theo nghề B, và 50% theo nghề C Cần tìm phân phối nghề nghiệp ở thế hệ tiếp theo và phân phối giới hạn theo nghề nghiệp của cư dân trong tương lai xa.

Trong thị trấn N, sự thay đổi trạng thái của một gia đình qua các thế hệ có thể được mô tả bằng một xích Markov ba trạng thái, bao gồm nghề A, nghề B và nghề C, với ma trận xác suất chuyển thể hiện mối quan hệ giữa các nghề này.

Phân phối ban đầu là U = [0, 2; 0, 3; 0, 5]. a) Phân phối nghề nghiệp ở thế hệ tiếp theo là:

Trong thế hệ tiếp theo, tỷ lệ người theo nghề A là 36%, nghề B là 43% và nghề C là 21% Hệ thống Xích Markov này là chính quy, do đó tồn tại phân phối giới hạn π = [x, y, z] Phân phối này chính là phân phối dừng duy nhất, được xác định bằng cách giải hệ phương trình π.P = π.

Kết quả giải bài toán cho thấy x = 0,37; y = 0,44; z = 0,19 Dự báo phân phối nghề nghiệp của dân cư thị trấn trong tương lai sẽ là: 37% dân cư theo nghề A, 44% theo nghề B và 19% theo nghề C.

Trong một hệ thống điện kỹ thuật, các thiết bị được phân loại theo các trạng thái: vừa mới thay, còn tốt, vẫn sử dụng được và đã bị hỏng Dựa trên số liệu thống kê, ma trận xác suất chuyển trạng thái theo tuần được xác định như sau:

Sau mỗi tuần, tỷ lệ các thiết bị mới chuyển sang trạng thái khác nhau được ghi nhận là 0% cho tình trạng mới thay, 80% cho tình trạng còn tốt, 20% cho tình trạng vẫn dùng được và 0% cho tình trạng đã bị hỏng.

Ta tìm được phân phối dừng Π = [1/6, 1/3, 1/3, 1/6].

Nếu chi phí thay mới một thiết bị là 25 nghìn đồng và thất thu khi thiết bị hỏng là 18,5 nghìn đồng, thì trung bình mỗi tuần hệ thống phải chi 7,25 nghìn đồng cho mỗi thiết bị.

Ta xét phương án thứ hai cho việc thay thế vật tư thiết bị với ma trận xác suất chuyển trạng thái sau đây

Chính sách mới về thay thế vật tư thiết bị yêu cầu thay thế mỗi thiết bị khi kiểm tra và phát hiện thiết bị vẫn còn sử dụng được Điều này giúp giảm thiểu thất thu do thiết bị hỏng Theo ma trận P, phân phối dừng Π = [1/4, 1/2, 1/4], hệ thống phải chi trung bình 6,25 nghìn đồng cho mỗi thiết bị mỗi tuần Nhờ chính sách này, hệ thống tiết kiệm được 1 nghìn đồng mỗi thiết bị mỗi tuần Với 2000 thiết bị, tổng tiết kiệm hàng tuần đạt 2 triệu đồng.

Phân lớp trạng thái xích Markov

Để hiểu rõ về xích Markov và giải quyết bài toán về sự tồn tại của phân bố dừng, chúng ta sẽ phân lớp trạng thái của xích Markov Theo định nghĩa, trạng thái i được gọi là đến được trạng thái j, ký hiệu là i → j, nếu tồn tại n ≥ 0 sao cho p_ij(n) > 0, và chúng ta quy ước p_ii(0) = 1.

Hai trạng thái i và j được gọi là liên lạc được nếu i → j và j → i Khi đó ta viết i ↔ j.

Quan hệ liên lạc i ↔ j là một quan hệ tương đương, giúp phân hoạch không gian trạng thái thành các lớp rời nhau Các trạng thái trong cùng một lớp có khả năng liên lạc với nhau, trong khi các trạng thái thuộc các lớp khác nhau thì không thể liên lạc.

Ví dụ 5.18 Giả sử xích Markov {X n ; n ≥ 0} có sơ đồ chuyển trạng thái như Hình 5.1 Tìm các lớp tương đương của xích Markov này.

Nốt 1 và nốt 2 được kết nối với nhau, thuộc về Lớp 1 Tương tự, nốt 3 và nốt 4 cũng liên lạc được, tạo thành Lớp 2 Nốt 6, nốt 7 và các nốt khác tiếp tục có mối liên hệ trong hệ thống.

Xích Markov được phân chia thành 4 lớp trạng thái: Lớp 1 gồm {1, 2}, Lớp 2 gồm {3, 4}, Lớp 3 gồm {6, 7, 8}, và Lớp 4 chỉ có {5} Trong đó, 8 trạng thái liên lạc được với nhau thuộc Lớp 3, trong khi 5 trạng thái còn lại thuộc Lớp 4 Theo định nghĩa, xích Markov được coi là tối giản khi tất cả các trạng thái trong hệ thống đều liên lạc được với nhau.

Hình 5.1: Sơ đồ chuyển trạng thái Ví dụ 5.18

Như vậy một xích Markov là tối giản thì không gian trạng thái không thể phân hoạch thành các lớp con nhỏ hơn.

Theo sơ đồ chuyển trạng thái của Ví dụ 5.18, khi xích Markov vào Lớp 3, nó sẽ luôn ở lại trong lớp này Ngược lại, Lớp 1 không có tính chất tương tự; ví dụ, nếu tại thời điểm ban đầu X0 = 1, xích Markov có thể ở lại Lớp 1 một thời gian, nhưng nếu nó rời khỏi Lớp 1, nó sẽ không quay lại nữa.

Trong lý thuyết xác suất, trạng thái 3 được gọi là hồi quy, trong khi các trạng thái ở lớp 1 được xem là không hồi quy Để định nghĩa rõ hơn, với trạng thái i, ta có thể xác định f ii (n) = P (X n = i, X n−1 ̸= i, , X 1 ̸= i|X 0 = i) Ký hiệu f ii ∗ được sử dụng để biểu thị khái niệm này.

Xác suất để hệ quay trở lại trạng thái i sau một số bước hữu hạn được ký hiệu là f ii (n) với n=1 Nếu f ii ∗ = 1, trạng thái i được gọi là hồi quy; ngược lại, nếu f ii ∗ < 1, trạng thái này được xem là không hồi quy.

Trạng thỏi hồi quy i được phân loại thành hai loại: trạng thỏi hồi quy dương khi à i < ∞ và trạng thỏi hồi quy khụng khi à i = ∞ Theo định lý 5.5, với xích Markov tối giản {X n ; n ≥ 1}, ta có hai kết luận quan trọng: a) xích Markov sở hữu phân phối dừng duy nhất và b) chỉ tồn tại một số khả năng nhất định.

Mọi trạng thái của E là không hồi quy;

Mọi trạng thái của E là hồi quy không;

Mọi trạng thái của E là hồi quy dương.

▷ 5.1 Cho xích Markov {X n ; n ≥ 0} có P (X 1 = 3) = 1/3 và sơ đồ chuyển trạng thái:

0, 25 a) Tìm ma trận xác suất chuyển trạng thái. b) Tìm P (X 1 = 3, X 2 = 2, X 3 = 1). c) Tìm P (X 1 = 3, X 3 = 1).

▷ 5.2 Cho {X n ; n ≥ 0} là một xích Markov Chứng minh rằng với mọi m ≥ 1, ta có

Ngược lại, nếu {X n ; n ≥ 0} thỏa mãn điều kiện (5.4) với mọi m ≥ 1 thì {X n ; n ≥ 0} là một xích Markov.

▷ 5.3 Cho {X n ; n ≥ 0} là dãy biến ngẫu nhiên rời rạc, độc lập và có cùng phân phối xác suất với

Trong các dãy trên, dãy nào là xích Markov Trong trường hợp xích Markov, tìm ma trận xác suất chuyển.

▷ 5.4 Cho {X n ; n ≥ 0} là một xích Markov với không gian trạng thái E = {0, 1} và ma trận xác suất chuyển

▷ 5.5 Cho {X n ; n ≥ 0} là một xích Markov Đặt

Trong các dãy trên, dãy nào là xích Markov Trong trường hợp xích Markov, tìm ma trận xác suất chuyển.

▷ 5.6 Cho{X n ; n ≥ 0} là một xích Markov Chứng minh rằng với dãy {X n ; n ≥ 0} với điều kiện X m = r cũng là một xích Markov.

Cho X₀ = 0, Xₙ là số mặt sấp xuất hiện khi tung một đồng xu cân đối n lần Đặt Yₙ ≡ Xₙ (mod 10), và chứng minh rằng (Yₙ; n ≥ 0) là một chuỗi Markov Cần tìm ma trận xác suất chuyển và phân phối dừng cho chuỗi này.

▷ 5.8 Cho (S n ; n ≥ 0) là đi dạo ngẫu nhiên đơn giản với S 0 = 0 (xem Ví dụ 5.1). Đặt Y n = |S n | Chứng minh (Y n ; n ≥ 0) là một xích Markov.

▷ 5.9 Cho {X n ; n ≥ 0} là xích Markov với X 0 = 0 (h.c.c.), không gian trạng thái

E = {0, 1, 2} và ma trận xác suất chuyển

Chứng minh rằng {Y n ; n ≥ 0} cũng là xích Markov Tìm ma trận xác suất chuyển của{Y n ; n ≥ 0}.

▷ 5.10 Cho {X n ; n ≥ 0} là xích Markov với ma trận xác suất chuyển

Xích Markov trên có phân phối dừng không Nếu có hãy tìm phân phối dừng đó.

▷ 5.11 Cho xích Markov {X n ; n ≥ 0} có sơ đồ chuyển trạng thái:

1 2 a) Đây có phải là xích Markov tối giản không? b) Tìm phân phối dừng. c) Phân phối dừng của xích Markov này có phải là phân phối giới hạn không?

Hồ Minh Châu, Lê Văn Dũng và Lương Thị Mỹ Hạnh (2018) đã nghiên cứu về luật số lớn đối với tổng ngẫu nhiên có trọng số của các biến ngẫu nhiên độc lập đôi một với mô men cấp vô hạn Nghiên cứu này được công bố trong Tạp chí Khoa học Trường Đại học Sư phạm - ĐH Đà Nẵng, số 30(04), trang 66–72.

[2] Nguyễn Viết Phú và Nguyễn Duy Tiến (2004), Cơ sở lý thuyết xác suất, Nhà xuất bản ĐHQG Hà Nội.

[3] Nguyễn Hải Thanh (2008), Vận trù học, Trường Đại học Nông nghiệp Hà Nội.

[4] Đặng Hùng Thắng (2006),Quá trình ngẫu nhiên và tính toán ngẫu nhiên, Nhà xuất bản ĐHQG Hà Nội.

[5] Đặng Hùng Thắng (2009), Mở đầu về lý thuyết xác suất và các ứng dụng, Nhà Xuất bản Giáo dục.

[6] Đặng Hùng Thắng (2009), Bài tập xác suất, Nhà Xuất bản Giáo dục.

[7] Nguyễn Duy Tiến (2005), Các mô hình xác suất và ứng dụng (Phần I - Xích Markov và ứng dụng), Nhà xuất bản ĐHQG Hà Nội.

[8] Nguyễn Duy Tiến và Vũ Viết Yên (2009), Lý thuyết xác suất, Nhà Xuất bản Giáo dục.

[9] Vũ Tiến Việt và Phạm Thị Hằng (2020), Xác suất thống kê và quá trình ngẫu nhiên, Nhà xuất bản ĐHQG Hà Nội.

[10] Vũ Viết Yên (2006), Bài tập lý thuyết xác suất, Nhà xuất bản Đại học Sư phạm.

[11] N Bingham, C Goldie, J Teugels (1989),Regular Variation, Cambridge Uni- versity Press.

[12] Jay L Devore (2010), Probability and Statistics for Engineering and the Sci- ences, 8th Edition, Brooks/Cole.

[13] L.V Dung , T.C Son, N.T Hai Yen (2018), Weak laws of large numbers for sequences of random variables with infinite rth moments, Acta Mathematica Hungarica, 156, 408–423.

[14] A A Georgiev , W Greblicki (1986), Nonparametric function recovering from noisy observations, J Stat Plan Inference, 13(1), 1–14.

[15] A A Georgiev (1988), Consistent nonparametric multiple regression: the fixed design case, Journal of Multivariate Analysis 25(1), 100–110.

[16] A Gut (2013),Probability: A Graduate Course, second ed., Springer.

[17] H.G M¨uller (1987), Weak and universal consistency of moving weighted av- erages, Periodica Mathematica Hungarica,18(3), 241–250.

[18] H Pishro-Nik (2014), Introduction to probability, statistics and random pro- cesses, Kappa Research, LLC.

Ngày đăng: 03/11/2023, 18:08

TỪ KHÓA LIÊN QUAN