Nghiên cứu xác định hòa hợp HLA giữa bệnh nhân và người hiến bằng kỹ thuật PCR SSO để định hướng ghép tế bào gốc trong điều trị bệnh Thalassemia Nghiên cứu xác định hòa hợp HLA giữa bệnh nhân và người hiến bằng kỹ thuật PCR SSO để định hướng ghép tế bào gốc trong điều trị bệnh Thalassemia luận văn tốt nghiệp thạc sĩ
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN NGUYỄN THỊ PHI DOAN THUẬT TOÁN METROPOLIS VÀ ỨNG DỤNG LUẬN VĂN THẠC SỸ Chuyên ngành : LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN HỌC Mã số : 60 460 106 Giáo viên hướng dẫn: TS TRẦN MẠNH CƯỜNG HÀ NỘI, 2014 Mục lục LỜI MỞ ĐẦU BẢNG KÝ HIỆU KIẾN THỨC CHUẨN BỊ 1.1 Các phương pháp mô biến ngẫu nhiên 1.1.1 Phương pháp lấy mẫu ngược 1.1.2 Phương pháp lấy mẫu loại trừ 1.2 Ước lượng mô 1.2.1 Lấy mẫu quan trọng (Importance Sampling) 1.3 Xích Markov 1.3.1 Giới thiệu xích Markov 1.3.2 Phân bố dừng 1.3.3 Phân bố giới hạn 1.3.4 Xích tối giản khơng có chu kì 1.3.5 Xích khả nghịch 7 10 11 13 14 18 20 24 27 THUẬT TOÁN METROPOLIS-HASTINGS 28 2.1 Giới thiệu MCMC 28 2.2 Thuật toán Metropolis-Hastings 29 ÁP 3.1 3.2 3.3 DỤNG THUẬT TOÁN METROPOLIS 46 Giới thiệu R 46 Mơ hình lõi cứng (hard-core model) 47 Thuật toán chương trình 48 Tài liệu tham khảo 53 LỜI CẢM ƠN Luận văn em hoàn thành hướng dẫn tận tình nghiêm khắc TS Trần Mạnh Cường Thầy dành nhiều thời gian quý báu để hướng dẫn giải đáp thắc mắc em suốt trình làm luận văn Em muốn tỏ lòng biết ơn chân thành sâu sắc tới Thầy Em muốn gửi tới tồn thể Thầy Cơ Khoa Tốn - Cơ - Tin học trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội, Thầy Cô đảm nhận việc giảng dạy khóa Cao học 2011 - 2013 từ lúc chúng em ôn thi đầu vào trình học Khoa, đặc biệt Thầy Cơ tham gia giảng dạy nhóm Xác suất thống kê 2011 - 2013 lời cám ơn chân thành cơng lao dạy dỗ chúng em suốt thời gian khóa học Vì thời gian kiến thức em nhiều hạn chế nên khơng tránh khỏi thiếu sót Kính mong Thầy, Cô nhận xét cho em lời nhận xét góp ý để luận văn em hồn thiện Và góp ý quý giá mở hướng cho em q trình học tập, nghiên cứu sau Tôi xin cám ơn gia đình, bạn bè, đồng nghiệp anh chị em nhóm Xác suất thống kê 2011 - 2013 quan tâm, giúp đỡ, tạo điều kiện động viên tinh thần để tơi hồn thành khóa học LỜI MỞ ĐẦU Đầu kỷ XX, nhà vật lý bác học tiếng người Nga A.A.Markov đưa mơ hình tốn học để mơ tả chuyển động phân tử chất lỏng bình kín Sau mơ hình Markov phát triển mang tên: Q trình Markov Xích Markov trường hợp riêng q trình Markov ta đánh số trạng thái Chúng ta biết vai trò quan trọng thuyết Monte Carlo việc ước lượng số nguyên mô q trình ngẫu nhiên Bước có tính định việc phát triển lý thuyết Monte Carlo hiệu ước lượng (lấy mẫu) từ phân bố xác suất thích hợp π(x) Ta khơng thể trực tiếp tạo thành mẫu độc lập từ π(x), chọn cách lấy mẫu quan trọng, mẫu ngẫu nhiên lấy từ phân bố thử dạng khác (nhưng gần giống) với phân bố mục tiêu sau đánh giá dựa vào tỉ số quan trọng; xây dựng mẫu xác suất độc lập dựa ý tưởng lấy mẫu Markov Chain Monte Carlo Cho π(x) = Z −1 exp(−h(x)) phân bố mục tiêu dựa vào kết nghiên cứu (có thể tất hàm phân phối xác suất viết dạng này), mà số chuẩn hóa hay hàm phân bố Z mà thường Về mặt lý thuyết, Z = exp (−h(x))dx tính khơng dễ dàng (và thường khó) vấn đề ban đầu mơ từ π Được thúc đẩy vấn đề tính tốn xác suất vật lý, Metropolis giới thiệu ý tưởng việc phát triển trình Markov để đạt việc lấy mẫu π Ý tưởng sau phát triển thành thuyết Metropolis dù đơn giản hữu ích sử dụng rộng rãi nhà nghiên cứu nhiều lĩnh vực khoa học khác sinh học, hóa học, khoa học máy tính, kinh tế học, ngành kỹ thuật, khoa học vật liệu nhiều lĩnh vực khác Luận văn gồm có chương: Chương 1: Kiến thức sở- Xích Markov: Ở phần đầu em trình bày phương pháp để mô biến (mẫu) ngẫu nhiên phương pháp ngược, phương pháp lấy mẫu quan trọng, phương pháp lấy mẫu loại trừ Tiếp theo ước lượng mô Phần chương I lý thuyết xích Markov Mỗi phần có ví dụ minh họa để việc tiếp cận vấn đề trở nên dễ dàng Chương 2: Thuật toán Metropolis-Hastings: Cũng phần luận văn Trong chương này, em đề cập tới kiến thức để xây dựng thuật toán Metropolis Em giới thiệu phương pháp MCMC nêu thuật tốn Metropolis ví dụ cụ thể áp dụng thuật toán Chương 3: Áp dụng thuật toán Metropolis: Trong chương em giới thiệu ngơn ngữ lập trình R tính Tiếp em ứng dụng vào tốn mơ hình lõi cứng (hard-core model) để viết đoạn chương trình áp dụng ngơn ngữ R cho kết cụ thể Trong chương em nêu thuật toán chương trình áp dụng máy tính Hà Nội, tháng 05 năm 2014 Học viên Nguyễn Thị Phi Doan BẢNG KÝ HIỆU MCMC: Markov Chain Monte Carlo : điều phải chứng minh BNN: biến ngẫu nhiên E(X): Kỳ vọng Var(X): Phương sai ⊗ : Kết thúc ví dụ F(x): hàm phân phối tích lũy f(x): hàm mật độ Chương KIẾN THỨC CHUẨN BỊ 1.1 1.1.1 Các phương pháp mô biến ngẫu nhiên Phương pháp lấy mẫu ngược Định lý 1.1 Cho hàm phân phối tích lũy F(x) với F −1 hàm ngược F xác định sau: F −1 (u) = min{x|F (x) ≥ u} với u ∈ (0, 1] Cho U BNN có phân phối U(0,1) đặt X = F −1 (U ) hàm phân phối X F(x) Ví dụ 1.1 Mơ biến ngẫu nhiên có phân phối mũ với tham số λ Hàm phân phối mũ có dạng: F (x) = − exp(−λx) với x ≥ Cho U ∼ U (0, 1) đặt Y = − log(1 − U ) λ Khi Y có phân phối mũ với tham số λ Hơn thế, U ∼ U (0, 1) − U có phân phối U (0, 1) đặt Y = − log(U ) có phân phối mũ với tham số λ ⊗ λ Ví dụ 1.2 Phân phối Becnoulli phân phối nhị thức B(n, p) Cho U ∼ U (0, 1) Nếu: X= U < p trường hợp khác Thì X phân phối Becnoulli với xác suất thành công p Cho n X1 , Xn BNN độc lập phân phối Becnoulli Y = Xi i=1 phân phối nhị thức B(n, p) ⊗ Ví dụ 1.3 Mơ biến ngẫu nhiên có phân phối hình học (Geo(p)) Giả sử X nhận giá trị thuộc tập N P (X = j) = Pj Khi n F −1 (u) = min{j ∈ N |u ≤ pi } i=1 Nếu X có phân phối hình học X ∼ Geo(p) P (X > j) = (1 − p)j điều có nghĩa là: n pi = − (1 − p)j ≥ u ⇔ j i=1 Kí hiệu [a]: phần nguyên a, X = [ học 1.1.2 log(1 − U ) log(1 − p) log(U ) ] có phân phối hình log(1 − p) ⊗ Phương pháp lấy mẫu loại trừ Giả sử ta có BNN X với hàm mật độ f (x) Ta chưa mô X ta mơ Y với hàm mật độ cho biết trước g(y) mà f (x) ≤ M với ∀x giá f tập giá g g(x) Sau ta sử dụng mẫu Y để tìm mẫu X Lặp lại bước sau tới cho kết Bước 1: Mô Y = y từ g(x) U = u từ phân phối U (0, 1) Chuyển sang bước 2, Bước 2: Nếu u f (y) đặt X = y Ngược lại quay bước M.g(y) Mệnh đề 1.1 Biến ngẫu nhiên X lấy dựa phương pháp loại trừ có hàm mật độ f (x) Câu hỏi đặt ta cần phép lặp thuật toán này? Trong f (Y ) phép lặp ta xây dựng mẫu với xác suất P (U )= M.g(Y ) M Vậy trung bình số phép lặp M Chú ý 1, M nhỏ có lợi q trình tính tốn số bước lặp Vậy ta nên tìm hàm mật độ g gần với hàm f 2, Nếu giá hàm f khơng bị chặn để tìm M ta xác định hàm mật độ g có nặng f Ví dụ 1.4 Giả sử ta tìm mẫu |X| mà X BNN có phân phối chuẩn tắc hàm mật độ |Z| là: x2 f (x) = exp(− ) với x ∈ R+ π Ta biết cách xây dựng mẫu có phân phối mũ Vì ta chọn hàm g hàm mật độ phân phối mũ với tham số có: f (x) = g(x) x2 − 2x exp(− )= π 2e (x − 1)2 exp(− )≤ π 2e π 2e f (x) (x − 1)2 Đặt M = Khi = exp(− ) π M.g(x) Theo phương pháp lấy mẫu loại trừ ta thực theo bước sau: Bước 1: Đặt Y = y từ phân bố mũ với tham số U = u từ phân phối chuẩn U (0, 1) (y − 1)2 ) Bước 2: Nếu u ≤ exp(− ) trở lại X = y Ngược lại quay Bước ⊗ Ví dụ 1.5 Cho biến ngẫu nhiên Y với hàm mật độ g(x) xây dựng không gian S Giả sử A ⊂ S ta lấy mẫu biến ngẫu nhiên có điều kiện X = (Y |Y ∈ A) với không gian xác định A Trong trường hợp lấy mẫu phương pháp loại trừ ta thực việc lấy mẫu X lặp lại mẫu ta cần thuộc A Chính g(x) xác hơn, X có hàm mật độ f (x) = với x ∈ A P (Y ∈ A) f (x) f (x) Vậy ≤ = M = 1[x∈A] g(x) P (Y ∈ A) M.g(x) Giả sử U phân phối khoảng (0,1) Khi P (U ≤ f (Y ) )= M.g(Y ) nếu Y ∈A Y ∈ / A Với phương pháp lấy mẫu loại trừ ta chấp nhận giá trị Y ∈ A ngược lại ta loại bỏ Nếu việc đánh giá hàm f khơng khó khăn, ngồi việc đánh giá cận Mg(x) cho f(x) ta đánh giá cận h(x) ta có phương pháp lấy mẫu loại bỏ cải biên sau: Lấy Y = y từ g(y) U = u từ U (0, 1) h(y) Chấp nhận u ≤ nhận X = y mẫu Ngược lại M.g(y) chuyển sang bước f (y) nhận X = y mẫu Ngược lại Chấp nhận u ≤ M.g(y) quay bước 1 Sẽ có lợi nhiều trung bình ta cần lần M h(x)dx thay hàm h Hàm h tìm nhờ khai triển Taylor 1.2 Ước lượng mơ Trong phần trước, ta tìm cách lấy mẫu phân bố mục tiêu (target density) dựa việc lấy mẫu phân bố đề xuất (proposal density) Phần này, dựa mẫu phân bố đề xuất ta tìm ước lượng khơng chệch cho đặc trưng phân bố mục tiêu 10 Tuy nhiên khơng có biểu thức dạng hiệu cho hệ số chuẩn hóa phân bố hậu nghiệm ta dùng phương pháp trực tiếp để mô phân bố Chú ý rằng: + ) Nếu đặt điều kiện lên τ phân bố có điều kiện µ phân bố chuẩn với kỳ vọng (nyτ +ms−2 ) (nτ +s−2 ) độ xác ( = 1/ phương sai ) nτ + s−2 y trung bình mẫu + ) Nếu đặt điều kiện lên µ phân bố có điều kiện τ phân bố n n (Gamma(α + ; β + (yi − µn )2 )) Ta dùng phân bố 2 i=1 phân bố đề xuất Thuật toán thực sau: Chọn trạng thái bắt đầu X0 = (µ0 , τ0 ) thuộc không gian trạng thái Giả sử Xn = (µn , τn ) ta sinh Xn+1 theo bước sau: n.yτn + m.s−2 Sinh µ ∼ N( , (nτn + s−2 )−1 ) U ∼ U nif orm(0, 1) n.τn + s−2 Nếu U ≤ α((τn , µn ), (τn , µ)) đặt µn+1 = µ Ngược lại đặt µn+1 = µn , n n Sinh τ theo phân bố (Gamma(α + ; β + (yi − µn )2 ) 2 i=1 U ∼ U nif orm(0, 1), Nếu U ≤ α((τn , µn+1 ), (τ, µn+1 )) đặt τn+1 = τ Ngược lại đặt τn+1 = τn Đặt Xn+1 = (µn+1 , τn+1 ) Chú ý rằng: + ) Hằng số chuẩn hóa phân bố hậu nghiệm chưa biết khơng ảnh hưởng đến việc mơ bị triệt tiêu tính xác suất chấp nhận + ) Như chứng minh xác suất chấp nhận α((τn , µn ), (τn+1 , µn+1 ) ln Vì thuật tốn đơn giản là: Sinh µn+1 từ phân bố chuẩn N(µ, σ ) Sinh τn+1 từ phân bố Gamma(α + n2 , β + 21 ni=1 (yi − µn+1 )2 ) Đặt Xn+1 = (µn+1 , τn+1 ) Ví dụ 2.5 Thủ tục lấy mẫu Gibbs cho mơ hình Ising Giả sử ta muốn mơ mơ hình Ising cách sử dụng mẫu Gibbs Trước tiên ta cần xác định phân bố có điều kiện đầy đủ Ta có: 39 π(x(1) , , x(m) ) = exp(J z x(i) x(k) ) (i,k)∈ε ε = {(i, k) : i ∼ j} lớp cặp điểm kề Đặt εj = {(i, k) : i ∼ j, j ∈ {i, k}} tập cặp điểm kề mà hai điểm j Ta có: (i) π(x|x , i = j) = π(x(1) , x(j−1) , x, x(j+1) , x(m) ) π(x(1) , x(j−1) , z, x(j+1) , x(m) ) z∈{−1,1} exp(J z = z∈{−1,1} x(j) z + J i∼j exp(J z (i,k)∈ε\εj x(i) z + J i∼j x(i) x(k) ) (i,k)∈ε\εj x(i) x) exp(J exp(J i∼j = x(i) x(k) ) x(i) x(k) ) (i,k)∈ε\εj x(i) x) exp(J exp(J i∼j z∈{−1,1} x(i) x(k) ) (i,k)∈ε\εj x(i) x) exp(J i∼j = x(i) z) exp(J i∼j z∈{−1,1} x(i) x) exp(J i∼j = x(i) ) + exp(J exp(−J i∼j i∼j Do đó: πj (1|x(i) , i = j) = x(i) ) exp(−2J (i) i∼j x ) + Như vậy, thủ tục lấy mẫu Gibbs cho mơ hình Ising thực sau: 40 + ) Chọn ngẫu nhiên điểm j (hoặc lấy thứ tự) + ) Đặt (x(j) = 1) với xác suất − + exp(−2J (i) (x(j) = −1) x ) i∼j với xác suất 1 Chú ý xác suất chấp nhận không phụ thuộc vào số chuẩn hóa Z mà phụ thuộc vào giá trị điểm kề với điểm j ⊗ Có thể sử dụng điều kiện cân để phân bố giới hạn xích thủ tục lấy mẫu Gibbs π Bổ đề 2.3 Mật độ chuyển p(x, y) thủ tục lấy mẫu Gibbs thỏa mãn điều kiện cân π Chứng minh: Cho x = (x(1) x(d)) y = (x(1) x(j − 1), z, x(j + 1), ) Cho p(x, y): hàm mật độ chuyển Mẫu Gibbs Sau có: π(x)p(x, y) = π(x) π(y) π(x) = π(y) (−j) π(x ) π(x(−j) ) = π(y)πj (x(j) |x(i) , i = j) = π(y)p(y, x) Và điều kiện cân chi tiết đảm bảo Thuyết xích mẫu Gibbs phân phối bất biến mà ta tìm Do vậy, xích có tính ergodic phân bố trung bình tiến tới π Bổ đề sau phát triển điều kiện đảm bảo tính khơng tối giản Vậy xích ergodic xích hội tụ đến phân bố mục tiêu π Bổ đề sau cho ta điều kiện để có xích tối giản Bổ đề 2.4 Cho (X (1) , X (d) ) véc tơ ngẫu nhiên với mật độ π(x(1) , , x(d) ) Gọi πi (x) hàm mật độ biên duyên X (i) Nếu từ giả thiết πi (x(i) ) > với ∀i ∈ {1, , d} suy π(x(1) , , x(d) ) > xích thủ tục lấy mẫu Gibbs tối giản 41 Ví dụ 2.6 Xét hàm mật độ véc tơ chiều (X,Y) sau: 1 π(x, y) = 1[0≤x≤1,0≤y≤1] + 1[−1≤x≤0,−1≤y≤0] 2 Các mật độ có điều kiện là: 1[x∈(0,1)] π(x|y) = 1[x∈(−1,0)] π(y|x) = y ∈ (0, 1) y ∈ (−1, 0) 1[y∈(0,1)] x ∈ (0, 1) 1[y∈(−1,0)] x ∈ (−1, 0) Vì ngun tắc ta dùng thủ tục lấy mẫu Gibbs Tuy nhiên xích thủ tục khơng tối giản ta xuất phát từ hình vng (0, 1) × (0, 1) ta khơng thể đến vùng (−1, 0) × (−1, 0) Nếu tìm hàm mật độ biên duyên ta được: 1 πx (x) = 1[0≤x≤1] + 1[−1≤x≤0] 2 1 πy (y) = 1[0≤y≤1] + 1[−1≤y≤0] 2 chúng không thỏa mãn điều kiện bổ đề πx (−0, 5) > πy (0, 5) > π(−0, 5; 0, 5) = ⊗ b,Lấy mẫu độc lập (Independence Sampler): Cách lấy mẫu đưa trạng thái độc lập với trạng thái xích tức là: q(x, y) = f (y) , ∀x ∈ S f hàm mật độ (hoặc hàm tập trung xác suất) Khi xác suất chấp nhận cho thủ tục là: π(y)f (x) α(x, y) = min{1, } π(x)f (y) Ví dụ 2.7 Xét phân bố mục tiêu có hàm mật độ: π(x) = , x ∈ R π(1 + x2 ) 42 ⊗ Nếu ta dùng phân bố đề xuất phân bố chuẩn X với kỳ vọng độ lệch tiêu chuẩn q mật độ đề xuất là: y2 q(x, y)α exp{− } 32 xác suất chấp nhận là: α(x, y) = min{1, exp(−x2 /32)(1 + x2 ) } exp(−y /32)(1 + y ) Trong thực hành việc lấy mẫu theo thủ tục hoạt động không tốt song sử dụng công cụ lý thuyết đổi người ta chứng minh tính chất lý thuyết Ví dụ, ta xích Markov thủ tục ergodic miền giá trị π tập miền giá trị f Thủ tục lấy mẫu độc lập giống với lấy mẫu loại bỏ Hãy so sánh xác suất chấp nhận thủ tục lấy mẫu loại bỏ giá trị trung bình xác suất chấp nhận thủ tục lấy mẫu độc lập Với phương pháp loại bỏ để áp dụng ta giả sử π(x) ≤ M f (x) Khi Y biến ngẫu nhiên có mật độ f X biến ngẫu nhiên có mật độ π ta có: E(min{1, π(Y )f (X) }) = π(X)f (Y ) 1[π(y)f (x)≥π(x)f (y)] π(x)f (y)dxdy π(y)f (x) 1[π(y)f (x)p(x,y)} ≤ (1 − ) M π(y)dy ≤ (1 − ) M {y:π(y)>p(x,y)} bất đẳng thức có (1) Tương tự: p2 (x, y)−π(y)dy = A p(u, y)−π(y)dy)(p(x, u)−π(u))du ≤ (1− ( A A Bằng quy nạp ta rằng: ||P n (x, ) − π|| ≤ (1 − 44 n ) M n ) M ( ||.|| khoảng cách biến phân.) ⊗ Điều chứng tỏ π(x) ≤ M f (x) thủ tục độc lập cho ta xích Markov ergodic theo định nghĩa sau: Định nghĩa 2.3 Xích Markov với phân bố bất biến π ergodic hình học tồn hàm không âm M với Eπ [M (X)] < ∞ số dương r < cho: ||P n (x, ) − π|| ≤ M (x).rn với x n Nếu M bị chặn nghĩa tồn số K > cho M(x) < K với x xích gọi ergodic c,Lấy mẫu Metropolis-Hastings theo du động ngẫu nhiên (Random Walk Metropolis) Trong thủ tục ta chọn q(x, y) = f (y − x) với f mật độ xác suất (hàm tập trung xác suất) Thủ tục có tên giá trị đề xuất y tạo theo du động ngẫu nhiên nghĩa y = x + z z sinh từ hàm mật độ f Xác suất chấp nhận là: α(x, y) = min{1, π(y)f (x) } π(x)f (y) Nếu f đối xứng thủ tục gọi thủ tục Metropolis 45 Chương ÁP DỤNG THUẬT TOÁN METROPOLIS Chương áp dụng thuật tốn Metropolis-Hastings cho tốn mơ lõi cứng (hard-core model) Ta sử dụng phần mềm R 3.1 Giới thiệu R R ngơn ngữ lập trình mơi trường phần mềm dành cho tính tốn đồ họa thống kê Thật chất, R ngơn ngữ máy tính đa năng, sử dụng cho nhiều mục tiêu khác nhau, từ tính tốn đơn giản, tính tốn ma trận, đến phân tích thống kê phức tạp Đây thực ngơn ngữ lập trình S xuất vào năm 1993 thiết kế hai tác giả Ross Ihaka Robert Gentleman, công tác Đại học Auckland, New Zealand Đến ngôn ngữ chịu trách nhiệm phát triển R Development Core Team Ngôn ngữ R trở thành tiêu chuẩn thực tế nhà thống kê cho thấy phát triển phần mềm thống kê, sử dụng rộng rãi để phát triển phần mềm thống kê phân tích liệu R có chứa nhiều loại kỹ thuật thống kê (mơ hình hóa tuyến tính phi tuyến, kiểm thử thống kê cổ điển, phân tích chuỗi thời gian, phân loại, phân nhóm v.v.Ngơn ngữ cho phép người dùng thêm tính bổ sung cách định nghĩa hàm Để thực cơng việc chun tính tốn, R liên kết với ngơn ngữ C,C++ Fortran để gọi thông số chạy Người dùng thơng thạo 46 viết mã C để xử lý trực tiếp đối tượng R 3.2 Mô hình lõi cứng (hard-core model) Xét đồ thị vơ hướng G = (V, E) với |V | = N Mỗi đỉnh hai trạng thái "0" "1" + ) Hai đỉnh u,v gọi kề (u, v) ∈ E + ) Một cấu hình G tập tất trạng thái đỉnh + ) Các cấu hình ξ chấp nhận ("feasible") đỉnh v ∈ V "1" đỉnh kề với trạng thái "0" + ) Mơ hình lõi cứng xích Markov mà khơng gian trạng thái gồm tất cấu hình chấp nhận G Tại bước, ta chọn ngẫu nhiên đỉnh chuyển trạng thái đỉnh từ "0" sang "1" ngược lại Kích thước khơng gian trạng thái phụ thuộc vào số cạnh |E| Đối với đồ thị hoàn tồn liên thơng tức đỉnh nối với (|E| = G2n ) số cấu hình chấp nhận N+1 ( cấu hình gồm tồn trạng thái "0" N cấu hình có trạng thái "1") Tuy nhiên, số cạnh giảm số cấu hình chấp nhận tăng Trường hợp xấu |E|=0 tức cạnh đồ thị G có 2N cấu hình chấp nhận Trên tập cấu hình chấp nhận G ta xây dựng độ đo theo phân bố đều: µ(ξ) = ZG với ξ cấu hình chấp nhận G ZG tổng số cấu hình chấp nhận G Câu hỏi đặt trung bình có điểm có trạng thái "1" cấu hình chấp nhận G Gọi n(X) số trạng thái "1" cấu hình chấp nhận được chọn ngẫu nhiên theo phân bố µ Khi đó: 47 E[n(X)] = n(ξ).µG (ξ) = ξ -chấp nhận ZG n(ξ) ξ -chấp nhận Việc tính E[n(X)] khả thi với đồ thị nhỏ Với đồ thị lớn số cấu hình chấp nhận tăng lên nhanh, theo hàm mũ Ví dụ |E|= ta có 2N cấu hình chấp nhận Khi việc tính E[n(X)] khó khăn Dưới ta áp dụng kỹ thuật mô trình bày chương để tính xấp xỉ E[n(X)] 3.3 Thuật tốn chương trình + ) Đầu vào: - Đồ thị G =(V,E) với |V|= N - T: số phép lặp + ) Đầu ra: Véc tơ B với Bi số trạng thái "1" cấu hình chấp nhận bước thứ i Dùng véc tơ B để vẽ biểu đồ hình cột ước lượng E[n(X)] + ) Thuật toán: - Trước hết ta tạo véc tơ A cỡ N đặt Ai = với ∀i tức tất đỉnh trạng thái "0" Ở bước sau giá trị Ai (0 1) trạng thái đỉnh i - Với t = 1, 2, , N (bước t) ta làm sau: + ) Sinh số ngẫu nhiên có phân bố {1, , N } lưu vào biến v + ) Sinh biến ngẫu nhiên có phân bố (0,1) lưu vào biến c + ) Nếu c > khơng có đỉnh kề v trạng thái "1" ta đăt Av = Nếu c ≤ đặt Av = + ) Đếm số số "1" véc tơ A lưu vào Bt Xích Markov xây dựng theo thuật tốn với trường hợp lưới vng G kích cỡ 10x10 tối giản khơng có chu kỳ 48 + ) Tính tối giản: Xích tối giản từ cấu hình δ với xác suất dương quay cấu hình gồm tồn trạng thái "0" Điều xảy đỉnh trạng thái "1" chọn sinh giá trị c c ≤ Từ cấu hình (mọi đỉnh trạng thái "0") đến cấu hình δ , chấp nhận Điều xảy đỉnh có trạng thái "1" δ , chọn sinh c c > + ) Tính khơng có chu kỳ: Xích khơng có chu kỳ biến với xác suất dương cấu hình khơng thay đổi Trong ví dụ đồ thị G có kích thước 10x10 hình vẽ số ta có N = 100 đỉnh Ta dùng ma trận Mij (i, j = 1, 2, , 100) để lưu đồ thị này: Mij = (i,j) kề (có cạnh nối i, j) ngược lại Mij = Hình 3.1: Hình vẽ cho trường hợp đỉnh trạng thái "0" + ) Chương trình: + ) Kết quả: - Vẽ histogram - Giá trị ước lượng cho E[n(X)] 23.2945 49 50 Hình 3.2: Biểu đồ biểu diễn phân phối trạng thái "1" 51 KẾT LUẬN Như vậy, luận văn trên, em trình bày kiến thức phương pháp mô biến ngẫu nhiên như: phương pháp lấy mẫu ngược, phương pháp lấy mẫu loại trừ Trong chương I luận văn trình bày ước lượng mơ kiến thức xích Markov với phân bố dừng phân bố giới hạn, kiến thức xích tối giản khơng có chu kỳ, xích khả nghịch Trong chương từ điều nêu xích Markov ta nâng cấp lên thành thuật tốn MCMC-Markov Chain Monte Carlo Nhờ tính Ergodic xích Markov nêu định lý Ergodic ta có: Giả sử ta muốn biết kỳ vọng BNN mà có Y hàm phân phối với hàm mật độ tương ứng Tuy vậy, ta tính được, may ta xây dựng xích Markov có tính Ergodic mà hàm phân phối ban đầu có hàm mật độ π Sau ta cho X tới số giá trị theo thời gian - giá trị lớn N h(Xn ) Đây ý tưởng ta đặt N ước lượng Eh(Y ) N n=1 thuật toán MCMC Và luận văn giới thiệu vài chế sinh (sampler) xích Markov vậỵ, thuật tốn Metropolis-Hastings Chương III luận văn nêu áp dụng thuyết Metropolis thông qua ngôn ngữ R cách nêu tốn : Xích Markov xây dựng theo thuật toán với G lưới 10x10 tối giản khơng có chu kỳ Chương trình cho ta kết biểu đồ biểu diễn phân phối trạng thái "1" Luận văn kết thúc đoạn chương trình kết ước lượng 52 Tài liệu tham khảo [1] Đặng Hùng Thắng, Xác suất nâng cao, NXB Đại học Quốc gia Hà nội, 2012 [2] Nguyễn Duy Tiến, Vũ Viết Yên, Lý thuyết xác suất, NXB Giáo dục, 2009 [3] Đặng Hùng Thắng, Q trình ngẫu nhiên tính tốn ngẫu nhiên, NXB Đại học Quốc gia Hà nội, 2012 [4] Gareth Robert ST911 Fundamentals of Statistical Inference Part III, University of Warwick [5] Jun S.Liu Strategies In Scientific Computing , Department of Statistics Harvard University, June 13,2001 53 ... π(x).π(y)/π(x(−j) Chú ý phân bố có điều kiện đầy đủ khơng giống phân bố biên duyên chỗ chúng xác định phân bố đồng thời Điều Hammersley-Clifford Định lý phát biểu cho trường hợp chiều 37 Định lý 2.1 Hammersley-Clifford... 1) với xác suất − + exp(−2J (i) (x(j) = −1) x ) i∼j với xác suất 1 Chú ý xác suất chấp nhận không phụ thuộc vào số chuẩn hóa Z mà phụ thuộc vào giá trị điểm kề với điểm j ⊗ Có thể sử dụng điều. .. biến ngẫu nhiên có điều kiện X = (Y |Y ∈ A) với không gian xác định A Trong trường hợp lấy mẫu phương pháp loại trừ ta thực việc lấy mẫu X lặp lại mẫu ta cần thuộc A Chính g(x) xác hơn, X có hàm