2.2 Xác suất có điều kiện
2.2.4 Độc lập có điều kiện
Định nghĩa 2.31. Cho (Ω,Σ, P) là một không gian xác suất, {B,Bα, α ∈ I} là một họ σ-đại số con của Σ. Ta nói Bα, α∈ I là độc lập điều kiện với B nếu với mỗi tập hữu hạn phân biệt α1, ..., αn của I (n ≥ 2) và bất kỳ Aαi ∈ Bαi. Ta có hệ phương trình PB( ∩n i=1Aαi) = n Y i=1 PB(A αi) h.c.c, n ≥ 2. (2.62) Tương tự, họ các biến ngẫu nhiên {Xα, α ∈ I} là độc lập có điều kiện (tương hỗ) với B nếu σ-đại số Bα = σ(Xα) có tính chất trên. Nếu B = {∅,Ω}
⇒ PB = P ⇒ độc lập (khơng có điều kiện).
Mệnh đề 2.32. Cho B, B1, B2 là các σ-đại số con từ khơng gian xác suất (Ω,Σ, P). Khi đó các khẳng định sau là tương đương:
(i) B1, B2 là độc lập có điều kiện với B;
(ii) P(B1|σ(B∪B2)) =P(B1|B) h.c.c, B1 ∈B1; (iii) P(B2|σ(B∪B1)) =P(B2|B) h.c.c, B2 ∈B2;
(iv) Với mọi X : Ω →R+ là B1-đo được:
E(X|σ(B∪B2)) = E(X|B) h.c.c.
Chứng minh. (i) ⇒ (ii) : Nếu B ∈ B, B2 ∈ B2 thì B∩B2 ∈ σ(B∪B2) và nó là phần tử sinh của σ-đại số cuối cùng. Do đó, nó là đủ để chứng minh phương
trình (ii). Vậy Z B∩B2 P(B1|σ(B∪B2))dP = Z B∩B2 E(χB1|σ(B∪B2))dP = Z B∩B2 χB1dP = Z B χB1∩B2dP = Z B EB(χ B1∩B2)dPB = Z B PB(B 1∩B2)dPB = Z B PB(B 1)·PB(B 2)dPB (vì (i)) = Z B EB(χ B2PB(B 1))dPB (vì tính chất trung bình của EB) = Z B χB2PB(B 1)dP = Z B∩B2 PB(B 1)dP.
Từ đó, các hàm tích phân là trùng nhau h.c.c trên σ(B∪B2), ta có (ii). (ii)⇒(i) : Vì B⊂ σ(B∪B2) từ đó
EB =EBEσ(B∪B2), (ii) đúng cho hầu hết w,
PB(B 1∩B2) = EB(Eσ(B∪B2)(χB1χB2)) = EB(χ B2Eσ(B∪B2)(χB1)) (vì B2 ⊂ σ(B∪B2)) = EB(χ B2P(B1|σ(B∪B2))) = EB(χ
B2P(B1|B)) (do giả thiết) = PB(B
2)·PB(B
1) h.c.c vì PB(B
1) là B-đo được ⇒ (i). Tương tự, ta có (i)⇔(iii). (iv)⇒(ii) hiển nhiên.
vọng có điều kiện. Vì mỗi B1-đo được X ≥ 0 đều là giới hạn của một dãy tăng các hàm bậc thang trong B1 và tiêu chuẩn hội tụ đơn điệu đúng với mọi toán tử, suy ra (iv) đúng với mọi X.
Sử dụng định lý (π, λ)-lớp như trong trường hợp khơng có điều kiện. Ta nhận được kết quả sau:
Bổ đề 2.33. Cho X1, ..., Xn là các biến ngẫu nhiên trên (Ω,Σ, P) và B ⊂ Σ là một σ-đại số. Khi đó, tập {X1, ..., Xn} là độc lập có điều kiện (tương hỗ) khi và chỉ khi PB m ∩ i=1[Xi < xi]= m Y i=1 PB([X i < xi]) h.c.c, x∈ R, 1 < m≤ n. (2.63) Bổ đề 2.34. Cho B1, B2 là các σ-đại số độc lập từ (Ω,Σ, P). Nếu B là một σ-đại số con của B1 (hoặc B2) thì B1 và B2 là độc lập có điều kiện với B, do đó PB(A∩B) = PB(A)·PB(B) = PB(A)·P(B) h.c.c, A ∈ B1, B ∈ B2, B ⊂B1. Chứng minh. Với bất kỳ C ∈ B, B ⊂B1. Ta có Z C PB(A∩B)dP B = P(A∩B ∩C) = P(A∩C)P(B) (vì B1,B2 độc lập và A∩C ∈ B1) = P(B)·E(χA∩C) = Z C χA·P(B)dP = Z C EB(χ A)P(B)dPB = Z C PB(B)·PB(A)dP B (do PB(B) =P(B) vì B và B độc lập). Từ đó PB(A∩B) = PB(A)·PB(B) h.c.c. Tương tự nếu B⊂ B2.
Mệnh đề 2.35. Nếu {Xn, n ≥ 1}là một dãy các biến ngẫu nhiên trên (Ω,Σ, P) độc lập có điều kiện với σ-đại số B⊂ Σ.
T = ∞∩
k=1σ(Xn, n ≥k)
là σ-đại số đi của nó. Khi đó B và T là tương đương. (Theo nghĩa với mỗi A ∈T, tồn tại B ∈B sao cho A= B h.c.c).
Chứng minh. Do Bổ đề trên, ta có với mỗi n, các σ-đại số σ(X1, ..., Xn) và σ(Xk, k ≥ n + 1) là độc lập có điều kiện với B. Từ đó σ(Xk, k ≥ 1) và T là độc lập có điều kiện với B. Vì T ⊂ σ(Xk, k ≥ 1), nghĩa là T là độc lập có điều kiện của chính nó với B. Vậy A ∈ T ⇒ PB(A∩A) = PB(A)· PB(A) suy ra
PB(A) = 0 hoặc PB(A) = 1, và nó là hàm chỉ tiêu B-đo được. Vậy B ∈ B: PB(A) = χ
B h.c.c. Vì cả hai đạo hàm Radon-Nikodym của P tương ứng PB,
suy ra A= B h.c.c.
Vì trong trường hợp khơng có điều kiện B ={∅,Ω}. Ta có: nếu {Xn, n ≥ 1} là độc lập tương hỗ, T và {∅,Ω} là tương đương, đó là luật 0-1 Kolmogorov.
NếuXn, n ≥ 1là độc lập và cùng phân phối, Plà σ-đại số của những biến cố hoán vị với {Xn, n ≥1}, do định nghĩa hoán vị, ta có thể nói rằng {Xn, n ≥ 1} là độc lập có điều kiện với P. Do định nghĩa (2.42) chỉ có một số hữu hạn Xn xuất hiện tại mỗi thời điểm. Từ Mệnh đề trên, ta có P và T tương đương. (Vì mỗi biến cố của T có xác suất là 0 hoặc 1, như mỗi biến cố củaP. Vậy mỗi biến cố hốn vị xác định bởi tính độc lập của Xn với cùng phân phối có xác suất bằng 0 hoặc 1 (Luật Hewitt-Savage).
Chương 3
Sự phụ thuộc Markov
Sử dụng những khái niệm được nêu ở chương 2, chúng ta xét những lớp khác nhau của họ ngẫu nhiên phụ thuộc. Trong chương này và chương sau ta sẽ giới thiệu hai lớp phụ thuộc cơ bản là: Markovian và martingale. Trước tiên ta xét lớp Markovian, lớp này được A.A. Markov giới thiệu vào năm 1906 cho trường hợp dãy của mỗi biến ngẫu nhiên là một tập hợp hữu hạn sao cho xác suất có điều kiện khơng ảnh hưởng gì. Sau này trường hợp tổng quát được nghiên cứu bởi Kolmogorov, P. Levy, Doob, Feller, ...
Khái niệm phụ thuộc Markovian là một sự mở rộng của sự độc lập mà ta thường biết.
Định nghĩa 3.1. Cho (Ω,Σ, P) là một không gian xác suất, I là một tập có thứ tự. Nếu {Bα, α ∈ I} là một lưới các σ-đại số con của Σ. Xét hai σ-đại số
Gα = σ(Bγ, γ ≤ α) quá khứ
Gα
= σ(Bγ0, γ0 ≥ α) tương lai.
Khi đó lưới này được gọi là Markovian nếu: với mỗi α ∈ I (nghĩa là "hiện tại") thì các σ-đại số Gα, Gα là độc lập có điều kiện với Bα, do đó
Đặc biệt nếu{Xα, α ∈ I}là một tập các biến ngẫu nhiên trên Ω thì nó được gọi là Markovian nếu các σ-đại số {σ(Xα), α ∈ I} lập nên họ Markovian theo định nghĩa ở trên.
Nếu I ⊂ R thì {Xα, α ∈I} được gọi là quá trình Markov.
Nếu I ⊂ Rn thì {Xα, α ∈I} được gọi là trường Markov ngẫu nhiên.
Như vậy các σ-đại số {Bα, α ∈ I} hoặc là các biến ngẫu nhiên {Xα, α ∈ I} có dạng họ Markovian nếu quá khứ và tương lai là độc lập có điều kiện với hiện tại.
Mệnh đề 3.2. Cho {Xt, t ∈T} là một họ các biến ngẫu nhiên trên (Ω,Σ, P), T ⊂ R, Bt = σ(Xt), t ∈T. Khi đó các khẳng định sau là tương đương:
(i) Họ {Xt, t ∈T} là Markovian.
(ii) Với mỗi t1 < t2 < · · · < tn+1, ti ∈ T, n ≥ 1, nếu τn = {t1, ..., tn},
Gτn = σ(Xt1, ..., Xtn) thì
P(A|Gτn) = P(A|Btn) h.c.c, A ∈Btn+1. (iii) Nếu t1 < t2, Gt1 =σ(Xt, t≤ t1, t∈T), ti ∈ T, i= 1,2 thì
P(A|Gt1) = P(A|Bt1) h.c.c, A ∈Bt2. (iv) Nếu Gt = σ(Xs, s≥ t, s∈ T), t∈ T, Gt như trong (iii) thì
P(A|Gt) = P(A|Bt) h.c.c, A ∈ Gt.
(v) Nếu Gt, Gt như trên, Z là một hàm Gt-đo được bị chặn bất kỳ thì EGt(Z) =EBt(Z) h.c.c.
Chú ý 3.3. • Nếu {Xt, t ∈ T} là Markovian thì {X−t, t ∈ T} cũng là Markovian nếu T ⊂ R hoặc T là tập đối xứng. (Nói chung T là tập chỉ số).
• Nếu T1 ⊂ R, α : T1 → T là ánh xạ bảo tồn thứ tự và {Xt, t ∈ T} là Markovian thì {Xα(i), i ∈ T1} là Markovian. Họ con của họ Markovian là Markovian.
• Nếu gt : R → R là ánh xạ lên 1-1 sao cho gt−1(R) = R, R là σ-đại số Borel của R và {Xt, t ∈ R} là Markovian thì {Yt = gt(Xt), t ∈ R} là Markovian. (vì σ(Yt) = Yt−1(R) =Xt−1(gt−1(R)) =σ(Xt)).
Chứng minh mệnh đề 3.2. (i)⇒(ii) : Lấy I = T ⊂ R trong định nghĩa 3.1, với mỗi tn ∈ T, Gtn, Gtn là độc lập có điều kiện với Btn. Vì Btn+1 ⊂ Gtn
suy ra Gtn và Btn+1 cũng độc lập điều kiện với Btn. Do Mệnh đề 2.32ii, ta có P(A|Gtn) =P(A|Btn) h.c.c, A∈Btn+1. (3.2) Xét τn ={t1, ..., tn}. Rõ ràng Gτn ⊂ Gtn, Btn ⊂Bτn. Áp dụng toán tử EGτn
cho cả hai vế của (3.2) (vì vế phải của (3.2) là Btn đo được), chú ýEBτn =EGtn,
EGτnEGtn =EGτn. Ta được
P(A|Gτn) =EGτn(χ
A) = EGτn(EGtn(χ
A))
=EGτn(P(A|Btn)) = P(A|Btn) h.c.c, A ∈Btn+1 (do (3.2)). (ii)⇒(iii) : Nếu F= {α: α={u1, ..., un} ⊂ T1, 1≤n < ∞},
T1 = {t∈ T, t≤ t1} thì Gt1 = σ ∪ α∈FGα, Gα = σ(Xt, t ∈α). Vì Gα ⊂ Gt1, α∈ F⇒σ( ∪ α∈FGα)⊂ Gt1. Hơn nữa Gt1 = σ( ∪ t∈T1Bt), Bt ⊂Gα với α∈ F. Do vậy Gt1 ⊂ σ( ∪ α∈FGα).
Do Mệnh đề 2.32iii, từ (ii) suy ra Gα và Bt2 là độc lập có điều kiện với Bt1
với mỗi α ∈ F. Như trong trường hợp các biến cố độc lập, áp dụng mệnh đề 2.32ii, ta xét hai học các tập E và D như sau: D là lớp tất cả giao hữu hạn của những biến cố thuộc Gα, α ∈ F suy ra Gα ⊂ D, α∈ F, Gt1 ⊂ D. Nó đủ để chỉ ra rằng Bt2 và σ(D) là độc lập có điều kiện với Bt1. Xét lớp
Vì D và Bt2 là độc lập có điều kiện nên suy ra D⊂ E. Như trường hợp độc lập, dễ dàng thử lại rằng D là một π-lớp, E là một λ-lớp. Từ đó σ(D)⊂ E. Vì
E và Bt2 là độc lập có điều kiện với Bt1, suy ra Gt1 và Bt2 là độc lập có điều kiện với Bt1, tức là (iii) đúng.
(iii) ⇒ (iv) : Viết t thay cho t1 trong (iii), ta có Gt và Bt2 là độc lập có điều kiện với Bt với bất kỳ t2 ∈ T, t2 > t. Do Mệnh đề 2.32ii, suy ra Gt và σ(Xti : i= 1, ..., n, ti > t, ti ∈T)là độc lập có điều kiện với Bt. Từ chứng minh trên (phần (ii) ⇒ (iii)) suy ra Gt và Gt là độc lập có điều kiện với Bt (đó là (iv)).
(iv) ⇒ (v) : Hiển nhiên đúng nếu Z = χA, A ∈ Gt. Do tính tuyến tính suy ra kết quả đúng nếu Z = n X i=1 ai·χAi, Ai ∈ Gt.
Nếu Z ≥ 0và là Gt-đo được thì kết quả đúng (do tiêu chuẩn hội tụ đơn điệu có điều kiện). Với Z là hàm Gt-đo được bị chặn bất kỳ, vì Z = Z+ − Z− mà Z+, Z− ≥0 và là Gt-đo được, suy ra kết quả đúng.
(v)⇒(iv) : Hiển nhiên. Vậy mệnh đề được chứng minh. Nếu{Xt, t∈ T},T ⊂ Rlà một họ các biến ngẫu nhiên độc lập trên(Ω,Σ, P) thì nó là Markovian. Thật vậy nếu Bt ⊂ Bt0, t < t0 và Gt, Gt0 là các σ-đại số cảm sinh bởi {Bs, s∈ T, s≤ t}, {Bα, α ∈T, α ≥ t} thì Gt ⊂ Bt ⊂ Gt. Do đó với bất kỳ A ∈Gt, B ∈ Gt, ta có PBt(A∩B) = EBt(χ AχB) = χAEBt(χ B) = EBt(χ A)·EBt(χ B) =PBt(A)·PBt(B) h.c.c.
Ví dụ 3.4. Cho{Xn, n ≥ 1} là một dãy biến ngẫu nhiên độc lập trên(Ω,Σ, P), Yn =
n
P
k=1
Xk. Khi đó {Yn, n ≥ 1} là Markovian. Thật vậy, đặt Bn = σ(Yn), χn =σ(Xn) thì χ1 = B1,
Nếu Gn = σ(B1 ∪ · · · ∪Bn), Gn = σ( ∪
k≥nBk) thì Gn = σ(Bn ∪ ∪
k≥n+1χk). Cũng vậy χk là độc lập với Bn, k ≥ n+ 1. Hơn nữa, nếu D là lớp của những biến cố
D ={C1∩C2 : C1 ∈ Bn, C2 ∈σ( ∪
k≥n+1χk)}
thì D là một π-lớp cảm sinh bởi Gn. Từ đó ta khẳng định (3.1) đúng với mọi A ∈ Gn, B = C1 ∩C2 ∈ D (do mệnh đề trên, phần chứng minh (ii) ⇔ (iii)). Vậy ta có PBn(A∩B) = EBn(χ AχC1χC2) = EB(χ AχC1)·E(χC2) (vì C2 là độc lập với Bn và Gn, áp dụng Bổ đề 2.34.) = EBn(χ A)·χC1 ·E(χC2) (vì C1 ∈Bn) = EBn(χ A)·EBn(χ C1)·EBn(χ C2) h.c.c = EBn(χ A)·EBn(χ C1χC2) (áp dụng Bổ đề 2.34 và vì C1 ∈Gn, C2 ∈σ( ∪ k≥n+1χk),Bn ⊂Gn) = EBn(χ A)·EBn(χ B) = PBn(A)·PBn(B) h.c.c.
Ta đã chứng minh tính Markovian của {Yn, n ≥ 1}.
NếuB =σ(X), Y khả tích thìEB(Y) := E(Y|X) (=P(A|X) nếu Y =χ
A). Do đó tính chất Markovian trong Mệnh đề 3.2 được phát biểu lại như sau: Lớp
{Xt, t ∈ T}, T ⊂ R là một quá trình Markov khi và chỉ khi một trong những khẳng định sau được thỏa mãn:
(i) Với bất kỳ s < t, s, t∈ T, A là tập Borel ⊂R:
P([Xt ∈ A]|Xr, r ≤s) = P([Xt ∈A|Xs]) h.c.c. (3.3) (ii) Với t1 < t2 < · · ·< tn trong T, A là tập Borel ⊂ R:
(iii) Với s1 < s2 < · · · < sn < t1 < t2 < · · · < tm trong T, Ai ∈ R, Bj ∈R là các tập Borel. P n ∩ i=1[Xsi ∈ Ai]∩ m∩ j=1[Xtj ∈ Bj]|Xt = P ∩n i=1[Xsi ∈Ai]|Xt·P m∩ j=1[Xtj ∈Bj]|Xt h.c.c. (3.5)
Mệnh đề 3.5. Nếu {Xt, t∈ T ⊂ R} là một quá trình Markov trên không gian xác suất (Ω,Σ, P); r < s < t; r, s, t ∈ T. Khi đó ta có phương trình Chapman- Kolmogrov
P([Xt < λ]|Xr) =E(P([Xt < λ]|Xs)|Xr), h.c.c, λ∈R. (3.6) Nếu một bản sao của phân phối điều kiện chính qui P([Xt ∈A]|Xs)(w) được ký hiệu là Qs,t(A, Xs(w)) thì (3.6) có thể được biểu diễn như sau:
Qr,t(A, Xr(w)) = Z
R
Qs,t(A, y)Qr,s(dy, Xr(w)), A⊂ R là tập Borel, (3.7)
với hầu hết w∈ Ω ngoại trừ tập rỗng phụ thuộc vào r, s, t, A.
(Thường thì Qs,t(A, Xs(w)) được viết là p(Xs(w), s;A, t) trong (3.7), nó là xác suất của chuyển động của phần tử w từ thời điểm s với trạng thái Xs(w) tới vị trí của tập A tại thời điểm t > s).
Chứng minh. Xét quá trình {Xu, r ≤ u ≤ s < t, Xt;r, u, s, t ∈ T}. Khi đó, từ
(3.3) ta có
P([Xt < λ]|Xu, r ≤ u≤ s) = P([Xt < λ]|Xs) h.c.c. (3.8) Vì σ(Xr)⊂σ(Xu, r ≤ u≤ s) và Mệnh đề 2.4, áp dụng toán tử E(·|Xr) cho cả hai vế của (3.8), ta được
Đây là phương trình Chapman-Kolmogrov. Vì P([Xt < λ]|Xs) là σ(Xs)-đo được và E(Y|Xr)(w) = Z R yQr,s(dy, Xr(w)), hầu hết w,
với Y là σ(Xs) tương thích và bị chặn. Từ đó cùng với (3.6) ta suy ra (3.7). Để tiện sử dụng, ta gọi không gian giá trị của một quá trình Markov (hoặc họ bất kỳ các biến ngẫu nhiên) là khơng gian trạng thái của q trình.
Nếu miền là đếm được thì q trình Markov được gọi là xích Markov. Nếu miền là một tập hữu hạn thì q trình Markov được gọi là xích Markov hữu hạn.
Mệnh đề trên nói rằng: Họ những hàm xác suất điều kiện
{p(·, s;·, t), s < t trong T}
của mọi quá trình Markov đều phải thỏa mãn (3.6), (3.7). Sẽ rất tốt nếu một q trình Markov có thể được đặc trưng bởi tính chất này, trong trường hợp đó chỉ có những hàm xác suất điều kiện thỏa (3.6), (3.7) là được cho bởi quá trình Markov. Điều này khơng đúng, sau đây là một phản ví dụ.
Phản ví dụ: Ta giới thiệu một q trình khơng phải Markov nhưng xác suất điều kiện của nó thỏa mãn (3.7). Cho khơng gian trạng thái {1,2,3}. Xét không gian xác suất Ω ={wi : 1≤ i≤ 9}, wi ∈ R3,
w1 = (1,2,3), w2 = (1,3,2), w3 = (3,1,2), w4 = (3,2,1), w5 = (2,1,3), w6 = (2,3,1), w7 = (1,1,1), w8 = (2,2,2), w9 = (3,3,3),
Cho Σ là tập lực lượng của Ω, P(wi) = 1
Trên(Ω,Σ, P)ta xét một quá trình X1, X2, X3, trong đó Xi(w)=tọa độ thứ i của w. Khi đó Xi : Ω → {1,2,3} và P[Xi = n] = 1 3; i= 1,2,3;n= 1,2,3, ... P([Xi =m, Xj = n]) = 1/9 nếu i 6=j, 1≤i, j, m, n ≤3, 1/3 nếu i =j, m= n, 0 nếu i =j, m6= n. Với mọi cặp (i, j); (m, n), ta có
Qi,j(m, n) = P([Xj = m]|Xi = n) = P(Xj = m, Xi =n) P(Xi= n) = 1/3 nếu i6= j, 1 nếu i= j, m=n, 0 nếu i= j, m6=n.
Cũng vậy {X1, X2, X3} từng đôi một độc lập. {X1, X2, X3} khơng phải là Markov vì
P([X3 = 2]|X1 = 1, X2 = 1) = 06= P([X3 = 2]|X2 = 1).
(Nghĩa là tương lai phụ thuộc vào cả hiện tại và quá khứ). Nhưng với 1≤ i, j ≤ 3 thì Qi,j(·,·) thỏa mãn (3.7) vì
Q1,2(m, n) = 3 X l=1 Q1,1(m, l)Q1,2(l, n) = 1· 1 3 + 0 = 1 3, Q1,3(m, n) = 3 X l=1 Q1,2(m, l)Q2,3(l, n) = 1 3 · 1 3 + 1 3 · 1 3 + 1 3 · 1 3 = 1 3.
Tương tự đối với các tổ hợp khác. Chú ý là (3.7) được thỏa mãn đồng nhất chứ không phải h.c.c.
Chú ý 3.6. Xét tính chất (v) trong Mệnh đề 2.4 với e
A ⊂R là tập Borel:
Qn(A, Xn) = Qn+1,n(A, Xn)
và tính chất Markov của {Xn, n ≥ 1} suy ra E(f(X)) = Z R e Q1(dx1) Z