Định nghĩa 1.21. Cho c là một hằng số ta định nghĩa biến ngẫu nhiên cX cho tương ứng với mỗi x với số cX(u) = c(X(u)) với mọi u∈Ω.
Với định nghĩa tổng, tích của hai biến ngẫu nhiên, tích của một số với biến ngẫu nhiên chúng ta chứng minh được.
Định lý 1.9. Cho c là một số thực, X, Y là hai biến ngẫu nhiên trên không gian Ω. Khi đó
E(X+Y) =E(X) +E(Y);E(c.X) = cE(X). Nói một cách khác kì vọng có tính chất tuyến tính.
Bài toán 1.25. Cho p = p1p2...pn là một hoán vị của tập {1,2, ..., n}, n ≥ 2. Khi đó trung bình mỗi hoán vị của 1,2, ..., n sẽ có (n−2)/3 số pi thỏa mãn pi > pi−1 và pi > pi+1 với i = 2, n−1 .
Lời giải.
GọiΩ là tập tất cả các hoán vị của tập1,2,3, ..., n. Trên Ωta định nghĩa n−2biến ngẫu nhiên Yi, i =2, n−1 cho tương ứng với p∈Ω.
Yi(p) = 1 nếu p(i) thỏa mãn pi > pi−1 và pi> pi+ 1; Y(p) = 0 nếu pi không thỏa mãn điều kiện trên.
Ta có với mỗi bộ ba số pi−1, pi, pi+1 xác suất để pi nhỏ nhất là 1/3, xác suất để số pi không nhỏ nhất là 2/3. Do đó
E(Yi) = 1/3.1 + 23.0 = 1/3
Xét biến ngẫu nhiên Y =
n−1
P
i=2
Yi . Khi đó với mỗi p ∈Ω cho tương ứng với Y(p) là số các pi thỏa mãn pi < pi−1 và pi > pi+1. Ta có E(Y) = E( n−1 X i=2 Yi) = n−1 X i=2 E(Yi) = (n−2)E(Y1) = n−2 3 .
Bài toán 1.26. Cho p=p1p2...pn là một hoán vị của tập {1, 2, ..., n}, i được gọi là điểm cố định nếu pi = i. Hỏi trung bình mỗi hoán vị có bao nhiêu điểm cố định.
Lời giải. Gọi Ω là tập tất cả các hoán vị của 1,2, ..., n.
Xét n biến ngẫu nhiên Xi trên Ω, cho tương ứng mỗi p = p1, p2, ..., pn ∈ Ω với Xi(p) = 1 nếu pi = i, Xi(p) = 0 nếu pi 6=i.
Khi đó xác suất để pi = i là 1/n, xác suất để pi 6=i là (n−1)/n. Nên E(Xi) = 1/n+n−1
n .0 = 1/n Xét biến ngẫu nhiên X =
n
P
i=1
Xi, cho tương ứng p∈ Ω với X(p) là số các điểm cố định của p. Khi đó E(X) = n X i=1 E(Xi) = nE(X1) = n.1 n = 1. Vậy trung bình mỗi hoán vị có một điểm cố định.
Chương 2. Ứng dụng phương pháp xác suất trong giải toán trung học phổ thông
Trong chương này trình bày việc áp dụng tính chất đặc trưng xác suất, kỳ vọng để giải toán đại số như chứng minh sự tồn tại, chứng minh đẳng thức, bất đẳng thức, tính toán tổ hợp...Tài liệu tham khảo chính trong phần này là các cuốn [1],[3],[9],[10].
2.1 Áp dụng xác suất và kì vọng vào một số bài toán thi học
sinh giỏi
Bài toán 2.1 (IMO 1970). Trên mặt phẳng cho 100 điểm, trong đó không có 3 điểm nào thẳng hàng. Xét tất cả các tam giác có đỉnh tại các điểm đã cho. Chứng minh rằng không quá 70%các tam giác này là tam giác nhọn.
Lời giải. Trước hết ta chứng minh:"với 5 điểm bất kì trên mặt phẳng" trong đó không có ba điểm nào thẳng hàng thì có ít nhất ba tam giác với đỉnh lấy từ năm đỉnh trên không phải là tam giác nhọn.
Thật vậy ta xét 3 trường hợp
Trường hợp 1: Cho tam giác ABC và hai điểm D, E nằm trong ∆ABC, khi đó có ít nhất hai trong ba tam giác ∆ADB,∆ADC,∆DBC tù tại D, ít nhất hai trong ba tam giác ∆AEB, ∆AEC, ∆EBC tù tại E, do đó có ít nhất bốn tam giác không nhọn trong tổng số các tam giác được tạo nên từ 5 điểm A, B, C, D, E.
tứ giác ABCD có ít nhất một đỉnh trong bốn đỉnh A, B, C, D không nhọn. Giả sử là góc A thì có một tam giác không nhọn là ABC. E nằm trong tam giác ABC hoặc ∆BCD, khi đó nó sẽ tạo ra hai tam giác tù.
Trường hợp 3: Với ngũ giác lồi ABCDE có ít nhất hai góc không nhọn, giả sử là hai góc A, B. Khi đó∆ABC,∆ABE là hai tam giác không nhọn và tứ giác BCDE có ít nhất một góc không nhọn, ta lại có thêm một tam giác không nhọn.
Bây giờ ta thấy số cách chọn 5 điểm trong 100 điểm là C1005 . Với mỗi cách lấy 5 điểm đó có ít nhất 3 tam giác không nhọn. Nhưng mỗi đỉnh của tam giác được đếmC972 lần, do đó số tam giác không nhọn ít nhất là 3.C1005 C972 (với các đỉnh được lấy từ 100 điểm trên). Khi đó xác suất để có một tam giác nhọn nhiều nhất là
1−3.C1005 /(C972 C1003 ) = 0,7. Tức ta có không quá 70% tam giác nhọn.
Bài toán 2.2 (MOP test 2007). Trong bảng n×n mỗi một trong số các số 1, 2, ..., n xuất hiện đúng n lần. Chứng minh rằng tồn tại ít nhất một hàng hoặc một cột với ít nhất √n số phân biệt.
Lời giải.
Ta sẽ đi chứng minh với một hàng hay một cột bất kì, trung bình số phân tử khác nhau là √n.
Thật vậy số cách chọn một hàng hoặc một cột trong bảng là 2n. Gọi X là số phần tử khác nhau trên một hàng hoặc cột đã chọn Xi ∈ {0,1}, Xi = 1 nếu i có mặt trong hàng hoặc cột đã chọn. Xi = 0 nếu i không có mặt trong hàng hoặc cột đã chọn. Khi đó X = n P i=1 Xi mà E(Xi) = n P i=1 Xi.p(Xi= 1) =p(Xi = 1).
Mặt khác số i xuất hiện trên ít hàng hay ít cột nhất khi số i xuất hiện trong một ô vuông nhỏ kích thước √n.√ n nên: E(Xi = 1)≥ 2 √ n 2n = 1 √ n Do tính tuyến tính của kì vọng: E(X) = n X i=1 E(Xi)≥n.E(Xi) =n.√1 n = √ n.
Mà E(X) là giá trị trung bình của số các phần tử khác nhau trên một hàng hoặc một cột nên tồn tại hàng hoặc cột sao cho số phần tử khác nhau lớn hơn √n, tức ít nhất có √n phần tử khác nhau.
Bài toán 2.3 (Bulgaria MO 1984). Cho xi, yi (i= 1,2, . . . , n) là 2n số thực dương sao cho xi+yi= 1. Chứng minh rằng
(1−x1x2. . . xn)m+ (1−ym1 )(1−y2m). . .(1−ynm)≥1 với mọi số nguyên dương m và n.
Nhận xét 2.3. Có nhiều lời giải cho bài toán này, trong đó có cách giải thuần túy đại số. Tuy nhiên, các cách giải đó đều khá phức tạp. Lời giải dưới đây của Pierre Bornsztein đăng trên website mathlinks.ro thật đẹp đẽ và thanh thoát.
Lời giải. Xét thí nghiệm xác suất sau đây:
Xét c(1), c(2), . . . , c(n) là các đồng xu sao cho với mỗi i, xác suất để c(i) ra mặt ngửa là xi. Ta tung các xu này một cách độc lập m lần. Khi đó (1−x1. . . xn)m là xác suấtp(A) của biến cố: "với mỗi một trongm lần tung, có ít nhất một đồng xu ra mặt ngửa ".
Chú ý rằng A=B∪C, trong đó B là "tồn tại một đồng xu ra mặt ngửa ở mỗi một trong m lần tung ", và C là "có ít nhất một đồng xu ra mặt ngửa ở mỗi lần tung, nhưng đồng xu này không giống nhau qua mỗi lần tung".
Hơn nữa B∩C =∅, do đó p(A) =p(B) +p(C).
Mặt khác, ta có (1−ym1 )(1−y2m). . .(1−ymn) là xác suất của biến cố ứng với mỗi một đồng xu ít nhất một lần không ra mặt ngửa trong m lần tung bằng p( ¯B), trong đó B¯ là biến cố đối lập với biến cố B.
Như vậy vế trái của bất đẳng thức đã cho là
p(A) +p( ¯B) =p(B) +p( ¯B) +p(C) = 1 +p(C)≥1. Chú ý rằng đẳng thức xảy ra khi và chỉ khi n = 1.
Trong bài toán trên, biểu thức vế trái và đặc biệt là điều kiện xi+yi= 1 gợi ý ta đến ý tưởng sử dụng xác suất.
Bài toán 2.4 (Putnam 2000). Cho aj, bj, cj, 1≤j ≤N là các số nguyên.
Giả sử rằng với mỗi j, trong ba số aj, bj, cj có ít nhất một số lẻ. Chứng minh rằng tồn tại các số nguyên r, s, t sao cho raj+sbj+tcj là lẻ với ít nhất 4N
7 giá trị của j, 1≤j ≤N.
Lời giải. Cách 1. (Manjul Bhargava, Kiran Kedlaya và Lenny).
Xét 7 bộ ba (a, b, c) với a, b, c ∈ {0,1}, không phải tất cả đều bằng 0. Vì rằng rj, sj, tj không phải tất cả đều chẵn, nên 4 trong các tổng arj + bsj +ctj với a, b, c∈ {0,1} là chẵn và 4 là lẻ. Tất nhiên là tổng với a = b = c = 0 là chẵn, do đó ít nhất 4 trong 7 tổng với a, b, c không đồng thời bằng 0 có tổng lẻ. Nói cách khác, có ít nhất 4N trong các bộ (a, b, c, j) cho tổng lẻ. Theo nguyên lý Dirichlet, tồn tại một bộ (a, b, c) với ít nhất 4N
7 tổng là lẻ.
Cách 2. Bài toán trên đây được sử dụng lại tại kỳ thi Olympic Toán Singapore năm 2012 (SMO 2012) và trên Mathlinks giới thiệu lời giải xác suất thú vị sau. Ta xét tất cả theo modul 2, vì trong bài ta chỉ quan tâm đến tính chẵn lẻ.
Ta có 7 cách chọn cho bộ (r, s, t) với r, s, t không đồng thời bằng 0; với mỗi bộ (a, b, c), có đúng 4 trong 7 bộ sao cho ra+sb+tc≡1.
Suy ra, với (ai, bi, ci) đã cho nếu ta chọn ngẫu nhiên (r, s, t)6= (0,0,0) thì giá trị kỳ vọng của số các biểu thức lẻ là 4N
7 . Nhưng nếu đây là số trung bình thì phải có ít nhất một bộ (r, s, t) có số này lớn hơn hay bằng 4N
7 .
Nhận xét 2.4. Lời giải trên đây đã sử dụng một nguyên lý rất đơn giản (giả thiết Karramata): Nếu trung bình của một số số là A thì sẽ có ít nhất một trong các số đó ≥A và ít nhất một trong các số đó ≤A. Nếu áp dụng vào xác suất thì giá trị trung bình sẽ tương ứng với giá trị kỳ vọng. Đây là một nguyên lý rất hữu hiệu mà ta sẽ còn nhắc tới ở những phần sau.
Bài toán 2.5 (APMO 1998). Cho F là tập hợp tất cả các bộ (A1, A2, . . . , An) trong đó mỗi Ai, i= 1,2, . . . , n là tập con của {1,2, . . . ,1998}. Giả sử |A| ký hiệu số phần tử của tập hợp A, hãy tìm
X
(A1,A2,...,An)∈F
|A1∪A2∪ · · · ∪An|.
hay không chọn một phần tử vào tập con. Vì thế có tất cả 21998n số hạng trong tổng trên.
Bây giờ ta tính giá trị trung bình của mỗi số hạng. Với mỗi i = 1,2, . . . ,1998. i là phần tử của A1∪A2∪ · · · ∪An nếu và chỉ nếu nó là phần tử của ít nhất một trong các A1, A2, . . . , An.
Xác suất của biến cố này là 1−2−n. Do đó, giá trị trung bình của mỗi số hạng trong tổng là 1998(1−2−n), và như thế đáp số là 21998n.1998(1−2−n).
Bổ đề sau đây là chìa khóa cho nhiều bài toán giải bằng phương pháp xác suất. Bổ đề 2.1. Cho X là biến ngẫu nhiên. Khi đó tồn tại điểm nào đó của không gian xác suất mà X ≥E[X], và tồn tại điểm bào đó của không gian xác suất mà X ≤E[X].
Bài toán 2.6 (Iran TST 2008). Giả sử rằng 799 đội bóng chuyền tham gia vào một giải đấu mà trong đó hai đội bất kỳ đấu với nhau đúng một lần. Chứng minh rằng tồn tại hai nhóm A và B rời nhau, mỗi nhóm có 7 đội sao cho mỗi đội bóng của nhóm A đều thua các động bóng của nhóm B.
Lời giải.
Xét giải đấu như một đồ thị có hướng đầy đủ. Ta xét A là một tập ngẫu nhiên có 7 phần tử. Gọi X là số đội thắng tất cả các đội của A. Gọi d(v−) là bậc vào của v, ta có E(X) = P vCd7(v−) C7997 . Nhưng P
vd(v−) = C7992 , nghĩa là bậc trong trung bình của một đỉnh đúng bằng 399. Theo tính lồi của hàm Cx7, ta có
E(X)≥ 799C 7 399 C7997 ≈800.1 2 7 ≈6.25,
nhưng điều này là đủ vì X là số nguyên. Chọn 7 đội bóng của B từ nhóm đội thắng tất cả các đội của A ta có điều cần tìm.
Bài toán 2.7 (Russia MO 1996). Trong viện Duma quốc gia có 1600 đại biểu, lập thành 1600 tiểu ban, mỗi tiểu ban có 80 người. Chứng minh rằng ta có thể tìm được hai tiểu ban có ít nhất 4 thành viên chung.
Lời giải.
Chọn ngẫu nhiên một cặp tiểu ban (tức là lấy một cách ngẫu nhiên một cặp trong C160002 cặp). Gọi X là số người có trong cả hai tiểu ban được chọn. Chú ý rằng X =X1+· · ·+X1600, trong đó mỗi Xi là biến ngẫu nhiên {0,1} chỉ ra rằng người thứ i có mặt trong cả hai tiểu ban hay không. Theo tính tuyến tính của kỳ vọng, ta có
E[X] =E[X1] +· · ·+E[X1600]. Ta thấy các E[Xi] có thể tính dễ dàng.
Gọi ni là số tiểu ban mà người thứ i thuộc vào tiểu ban đó. Khi đó E[Xi] =P[người thứ i được chọn vào cả hai tiểu ban] = C
2
ni
C160002 . Thông tin mà ta biết về {ni} là tổng của chúng P
ini= 16000.80.
Điều này gợi cho ta sử dụng tính lồi để đánh giá E[X]thông qua giá trị trung bình của {ni}, được ký hiệu là n và bằng n= (16000.80)/1600 = 800. Ta có
E(X)≥ 1600C 2 n C160002 = 1600C8002 C160002 = 1600 800.799 16000.15999 = 3.995.
Theo Bổ đề 2.1, ta biết rằng sẽ có một kết quả nào đó cho ta X ≥3.995. Vì X luôn là số nguyên, kết quả này thực sự phải có X ≥4.
Nói riêng, ta kết luận rằng có một cặp hai tiểu ban có ≥4 thành viên chung. Bài toán 2.8 (MOP Test 2008). Giả sử a, b, c là các số thực dương sao cho với mọi n nguyên
[an] + [bn] = [cn].
Chứng minh rằng ít nhất một trong ba số a, b, c nguyên.
Nhận xét 2.5. Bạn có thể sử dụng kết quả lý thuyết số quen thuộc sau đây: nếu x là số vô tỷ thì phần phân của các bội số của x phân bố đều trên đoạn [0, 1].
Nói riêng, nếu ta chọn nmột cách ngẫu nhiên trong{1,2, . . . , N}thìE[xn]→1/2 khi N → ∞.
Lời giải.
Giả sử rằng không có số nào trong a, b, c là số nguyên. Chia hai vế cho n và cho n dần đến vô cùng, ta được a+b =c.
Từ đó, suy ra
{an}+{bn}={cn}. (1) Nếu xvô tỷ thì {xn} phân bố đều trên đoạn [0,1]. Nói riêng, nếu ta chọnn một cách ngẫu nhiên trong {1,2, . . . , N} thì E[{xn}]→1/2 khi N → ∞.
Mặt khác, nếu x là số hữu tỷ có dạng tối giản là p/q thì {xn} có kỳ vọng tiến đến q−1
2q = 1 2 − 1
2q. Như vậy nó nằm trong khoảng h1 4,
1 2
. Kết luận: với số không nguyên x, E[{xn}]→t, trong đó t ∈h1
4, 1 2
i
.
Lấy kỳ vọng hai vế của (1), và cho n dần đến vô cùng, ta thấy rằng cách duy nhất để có đẳng thức là E[{an}] và E[{bn}] phải tiến đến 1
4, và E[{cn}]→ 1
2. Nhưng cách duy nhất để có kỳ vọng 1
4 là khi a, b hữu tỷ, còn cách duy nhất để có kỳ vọng 1
2 làc vô tỷ. Nhưng doa+b =c nên ta không thể có hai số hữu tỷ cộng lại ra số vô tỷ, mâu thuẫn.
Phương pháp xác suất có ứng dụng hiệu quả trong việc chứng minh sự tồn tại của một cấu trúc.
Ta biết rằng trong 6 người bất kỳ tồn tại 3 người đôi một quen nhau hoặc ba người đôi một không quen nhau. Khi 6 được thay bở 5 thì điều này không còn đúng nữa và ta có thể chứng tỏ điều này bằng cách chỉ ra phản ví dụ.
Khi các con số là lớn, việc xây dựng phản ví dụ trở nên khó khăn. Trong những trường hợp như thế phương pháp xác suất tỏ ra hữu dụng.
Bài toán 2.9. Chứng minh rằng giữa 2100 người, không nhất thiết phải có 200 người đôi một quen nhau hoặc 200 người đôi một không quen nhau.
Lời giải.
Ta sẽ cho một cặp 2 người bất kỳ quen nhau hoặc không quen nhau bằng cách tung một đồng xu đối xứng. Trong một nhóm 200 người, xác suất để họ đôi một