MÔ HÌNH XICH MAKOV
Trang 1KHÁI QUÁT CHUNG VỀ MÔ HÌNH
XÍCH MARKOV
Trang 2I Các khái niệm cơ bản
1 Tính Markov
a Khái niệm về tính Markov
Giả thiết ta nghiên cứu sự tiến triển theo thời gian của một hệ vật lí hoặc sinh thái nào đó (có thể là phân tử, hạt cơ bản, người hoặc một sinh vật nào đó, ) Kí hiệu X(t) là vị trí của hệ tại thời điểm t Tập hợp các vị trí có thể có của hệ được gọi là không gian trạng thái Giả sử trước thời điểm s hệ ở trạng thái nào đó, còn ở thời điểm s hệ ở trạng thái i Ta cần biết tại thời điểm t trong tương lai (t > s) hệ ở trạng thái j với xác suất là bao nhiêu? Nếu xác suất này chỉ phụ thuộc vào s, t, i, j thì điều này có nghĩa là: sự tiến triển của hệ trong tương lai chỉ phụ thuộc vào hiện tại và độc lập với quá khứ Đó là tính Markov Hệ có tính chất này được gọi là quá trình Markov
Chẳng hạn, nếu gọi X(t) là dân số tại thời điểm t (trong tương lai) thì có thể xem X(t) chỉ phụ thuộc vào dân số hiện tại và độc lập với quá khứ Nói chung, các hệ (sinh thái, vật lí hoặc cơ học, vv) không có trí nhớ hoặc sức ì là những hệ có tính Markov
Ta kí hiệu E là tập gồm các giá trị của X(t) và gọi E là không gian trạng thái của X(t) Nếu X(t) có tính Markov và E đánh số được (đếm được) thì X(t) được gọi là xích Markov Thêm vào đó, nếu t = 0, 1, 2, thì ta có khái niệm xích Markov với thời gian rời rạc, còn nếu t0, thì ta có khái niệm xích Markov với thời gian liên tục
Về phương diện toán học, tính Markov có thể định nghĩa như sau:
b Định nghĩa
Ta nói rằng quá trình ngẫu nhiên X(t) có tính Markov nếu:
P X t j X t i , , X t i , X t i
= P X t n 1 j X t n i
Với bất kì t0 t1 tn tn 1 và i , i , , i0 1 n 1, i, j E
Ta xem t là hiện tại, n tn 1 là tương lai, t , t , , t0 1 n 1 là quá khứ Vì thế biểu
Trang 3thức trên chính là tính Markov của X(t)
Đặt p s, i, t, j P X t j X s i , s t Đó là xác suất có điều kiện để
hệ (hay quá trình) tại thời điểm s ở trạng thái i, đến thời điểm t chuyển sang trạng thái j Vì thế ta gọi p(s, i, t, j) là xác suất chuyển của hệ (hay quá trình)
Nếu xác suất chuyển này chỉ phụ thuộc vào (t - s), có nghĩa là
p(s, i, t, j) = p(s + h, i, t + h, j) thì ta nói hệ (hay quá trình) là thuần nhất theo thời gian
2 Xích Markov rời rạc và thuần nhất
a Ma trận xác suất chuyển
Giả sử X ; nn 0, 1, 2, là xích Markov với không gian trạng thái là E (các phần tử của E thông thường được kí hiệu là i, j, k, có chỉ số hoặc không) Khi đó tính Markov và thuần nhất của X ; nn 0, 1, 2, có nghĩa là:
p P X j X i P X j X i , , X i , X i
không phụ thuộc vào n
Khi đó P = pij được gọi là ma trận xác suất chuyển sau một bước
pij là xác suất có điều kiện để hệ tại thời điểm n (hiện tại) ở trạng thái i chuyển sang trạng thái j tại thời điểm n + 1 (tương lai)
Nếu đặt các biến cố:
A X j ; B X i ; C X i , , X i thì tính Markov có
nghĩa là P A B P A BC
Từ đó suy ra
P ABC P BC P A BC P B P C B P A B
P AC B
= P C B P A B
Tức là quá khứ và tương lai độc lập với nhau khi cho trước hiện tại
Chú ý rằng từ công thức xác suất đày đủ suy ra ma trận P = (pij) có tính chất:
Trang 4ij ij
i, j E
0 p 1 i, j E; p 1
Ma trận có tính chất như thế được gọi là ma trận ngẫu nhiên
b Ma trận xác suất chuyển sau n bước
Xác suất chuyển sau n bước được định nghĩa theo công thức:
p P X j X i P X j X i
Đây là xác suất để hệ tại thời điểm ban đầu ở trạng thái i, sau n bước chuyển
sang trạng thái j Rõ ràng p ij1 pij Ta qui ước
0 ij
1, i j p
0, i j
Khi đó P (n)= n
ij
p được gọi là ma trận xác suất chuyển sau n bước
c Phương trình Chapman - Kolmogorov
Từ công thức xác suất đầy đủ và từ tính Markov ta có:
n 1 n
k E
, n 0, 1, (1.1)
n 1 n
k E
, n 0, 1, (1.2)
Ta gọi (1.1) là phương trình ngược, (1.2) là phương trình thuận Tổng quát hơn
ta có phương trình Chapman - Kolmogorov:
n m n m
k E
p p p , m, n 0, 1,
(1.3) Phân phối hữu hạn chiều của quá trình Markov được tính theo công thức sau:
0
0 0 1 n 1
P X i , X i , , X i , X i p p p
d Phân phối ban đầu
- Định nghĩa: Phân phối của hệ tại thời điểm n được cho bởi công thức sau:
n
p P X j ; n0, 1, 2, ; j E Đặt n n
j
p , j E
và gọi 0 là phân phối ban đầu của hệ
Ta qui ước viết n n
j
p , j E
là véc tơ hàng Ta có các tính chất sau:
Trang 5- Tính chất: Ta có các tính chất sau:
n
P(n)
n 1 n
n 1 1
P(n)
n m n
P(m)
- Phân phối dừng: Phân phối ban đầu được gọi là dừng, nếu n không phụ thuộc vào n, tức là n hay P
Như vậy, mô hình của một xích Markov rời rạc và thuần nhất là bộ ba (X ,n ,P), trong đó:
Xn là dãy các đại lượng ngẫu nhiên rời rạc
là phân phối ban đầu
P là ma trận xác suất chuyển
II Xích Markov có hữu hạn trạng thái
1 Xích Markov có hai trạng thái
Bây giờ ta xét trường hợp đơn giản nhất của xích Markov: Không gian trạng thái E của xích Xn gồm hai phần tử Ta kí hiệu E0, 1
Giả sử ma trận xác suất chuyển của xích là P = 1 a a
b 1 b
với 0<a, b <1
Nếu giả thiết rằng P X 0 0b, P X 0 1a, thì a = 1 - b khi và chỉ khi
X , X , là các đại lượng ngẫu nhiên độc lập cùng phân phối với P X n 0b,
P X 1 a Do đó khi a 1 b thìXn là dãy phụ thuộc, nhưng có tính Markov
Thực hiện phép nhân ma trận ta được:
2 2
2
1 a ab a 1 a 1 b
b 1 a 1 b 1 b ab
Bằng phương pháp qui nạp toán học ta nhận được
Pn 1 b a 1 a bn a a
a b b a a b b b
Trang 6Từ đó suy ra nếu 1 a b 1, thì
n
Lim
Pn
b a
a b a b
b a
a b a b
Điều này nói lên rằng, trong tương lai hệ sẽ rơi vào trạng thái 0 với xác suất b
ab và rơi vào trạng thái 1 với xác suất
a
ab
2 Định lí Ergodic
Tính ergodic của xích Markov được hiểu theo nghĩa sau:
Tồn tại các giới hạn j ij n
n
Lim p
không phụ thuộc vào i sao cho:
j E
0 j E; 1
Định lí: Giả sử P = pij là ma trận xác suất chuyển của xích Markov Xn có không gian trạng thái hữu hạn E1, 2, , N Khi đó:
- Nếu P chính qui theo nghĩa sau: tồn tại n sao cho 0
n 0
ij
i, j
min p 0 (1.4) thì tồn tại các số 1, 2, , N sao cho:
j E
0; 1
(1.5)
và mỗi j E , ta có
n
n
Lim p
(1.6)
- Ngược lại, nếu tồn tại các số 1, 2, , N thoả mãn điều kiện (1.5) và (1.6) thì tồn tại số n thoả mãn điều kiện (1.5) 0
- Nếu điều kiện (1.5) được thoả mãn, thì các số 1, 2, , N là nghiệm của hệ phương trình
k E
x x p ; j E
(1.7)
Trang 7và đó là nghiệm duy nhất thoả mãn điều kiện
j E
x 0 j E; x 1
3 Phân phối dừng
a Định nghĩa
Nghiệm không âm 1, 2, , N của phương trình (1.7) sao cho j 1
được gọi là phân phối dừng (hay bất biến) của xích Markov với ma trận xác suất chuyển P = pij
b Ý nghĩa của phân phối dừng
Nếu ta lấy 1, 2, , N là phân phối ban đầu của xích Markov, tức là
j P X0 j ; j 1, 2, , N
k
Tổng quát ta có:
n
Có nghĩa là X , X , , X , 0 1 n có phân phối xác suất như nhau
Ta có thể chứng minh phân phối đồng thời của các đại lượng ngẫu nhiên
X , X , , X không phụ thuộc vào k đối với mọi m Quá trình có tính chất như vậy được gọi là quá trình dừng Viết dưới dạng ma trận thì phân phối dừng là vđc tơ cột bất biến đối với ma trận chuyển vị của P, có nghĩa là:
p p p
p p p
p p p
4 Phân phối giới hạn và phân phối ergodic
a Định nghĩa
- Ta nói rằng xích Markov có phân phối giới hạn, nếu j 1, 2, , N tồn tại các
giới hạn j ijn
n
lim p
không phụ thuộc vào i và thoả mãn các điều kiện: j 0,
Trang 8j 1
Trong trường hợp đó ta gọi 1, 2, , N là phân phối giới hạn
- Ta nói xích Markov có tính ergodic, nếu j 1, 2, , N tồn tại giới hạn
n
n
lim p
không phụ thuộc vào i và thoả mãn các điều kiện: j 0, j 1 Trong trường hợp đó ta gọi 1, 2, , N là phân phối ergodic
Theo phần (iii) của định lí ergodic, thì phân phối giới hạn (và phân phối ergodic) là phân phối dừng Điều ngược lại không đúng, tức là có những quá trình có phân phối dừng, nhưng không có phân phối giới hạn Chẳng hạn
P = 0 1
1 0
thì P2n = 0 1
1 0
và P2n 1 = 1 0
0 1
Do đó không tồn tại giới hạn ij n
n
lim p
Tuy nhiên hệ phương trình
0 1
; 1; 0, 0
1 0
có nghiệm duy nhất
1
2
1 2 1 2
và đó là phân phối dừng duy nhất
b) Định lí
Nếu tồn tại phân phối giới hạn, thì đó là phân phối dừng duy nhất
5 Nguyên lí phản xạ
a) Bài toán bầu cử
Giả sử có hai ứng cử viên X và Y X có x người ủng hộ, Y có y người ủng hộ (x > y) Tuy nhiên ta không biết trước ai ủng hộ X, ai ủng hộ Y Vì vậy ta tiến hành thăm dò từng người một Ai ủng hộ X ta ghi số 1, ai ủng hộ Y ta ghi số -1
Kí hiệu n 1
1
Đặt S0 0; S1 1; ; Sn 1 2 n
Đường gấp khúc nối các điểm 0, 0 ; 1, S ; ; x 1 y, Sx y được gọi là một quỹ đạo của việc thăm dò Điểm đầu của đường gấp khúc này là (0, 0), các điểm
Nếu người thứ n ủng hộ X Nếu người thứ n ủng hộ Y
Trang 9trung gian là n, Sn và điểm cuối là xy, xy (vì Sx y xy) Lẽ đương nhiên, ứng cử viên X thích những quỹ đạo luôn luôn nằm trên trục hoành (vì điều đó
có nghĩa là X luôn luôn chiếm đa số: S1 0, S2 0, Sn 0, , Sx y xy0)
Chẳng hạn với xy , x = 2, y = 1 thì tất cả có 3 quỹ đạo: 3
Rõ ràng là ứng cử viên X thích quỹ đạo thứ nhất hơn cả
Trong trường hợp tổng quát, tổng số các quỹ đạo được tính bởi công thức:
x y x y
x y !
C C
x!y!
(số cách chọn x người ủng hộ X hoặc số cách chọn y người ủng hộ Y trong
xy người)
Tuy nhiên, để tính được số các quỹ đạo luôn luôn nằm trên trục hoành ta phải
sử dụng nguyên lí phản xạ Theo nguyên lí phản xạ (ta sẽ trình bày dưới đây) thì số này là:
x
x y
x y C
Từ đó suy ra, xác suất để X luôn luôn chiếm đa số là x y
x y
b Nguyên lí phản xạ
Giả sử Aa, ; Bb, là hai điểm trên mặt phẳng với các toạ độ thoả
mãn điều kiện ba 0; 0; Điểm 0 A 'a, được gọi là điểm phản xạ
xủa A qua trục Ox
Định lí (nguyên lí phản xạ): Số quỹ đạo nối A với B mà cắt hoặc tiếp xúc với
trục Ox bằng số quỹ đạo nối A ' với B
Áp dụng vào bài toán bầu cử:
Giả sử S , S , , S0 1 x y là quỹ đạo nằm trên trục hoành Khi đó S1 Từ đó 1
0 1 2 3 0 1 2 3 0 1 2 3
Trang 10suy ra số quỹ đạo nằm trên trục hoành bằng D - E
Trong đó D là số quỹ đạo nối điểm (1, 1) với điểm (x + y, x - y) Cụ thể là
x 1
x y 1
x y 1 !
x 1 !y!
Còn E là số quỹ đạo nối (1, 1) với (x + y, x - y) mà cắt hoặc tiếp xúc với Ox Theo nguyên lí phản xạ E bằng số quỹ đạo nối điểm (1, -1) với (x + y, x - y) Do vậy
ta có:
y 1
x y 1
x y 1 !
x! y 1 !
Vậy số quỹ đạo nằm trên trục hoành là
D - E =
x
x y
C
x 1 !y! x! y 1 ! x 1 ! y 1 ! y x x y