ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN -PHẠM THỊ THU HẰNG MỘT SỐ MÔ HÌNH XÁC SUẤT TRONG KHOA HỌC MÁY TÍNH Chuyên ngành: Lý thuyết Xác suất và Thống kê toán học TÓM TẮT
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-PHẠM THỊ THU HẰNG
MỘT SỐ MÔ HÌNH XÁC SUẤT TRONG KHOA HỌC MÁY TÍNH
Chuyên ngành: Lý thuyết Xác suất và Thống kê toán học
TÓM TẮT LUẬN VĂN THẠC SĨ KHOA HỌC
Hà Nội - Năm 2016
Trang 2Lời nói đầu 4
1 Xác suất trong lý thuyết tổ hợp và đồ thị 6 1.1 Các ví dụ 6
1.1.1 Đồ thị ngẫu nhiên 6
1.1.2 Thuật toán Tìm kiếm và Sắp xếp nhanh 7
1.1.3 Mô hình danh sách tự tổ chức 8
1.1.4 Sinh hoán vị ngẫu nhiên 9
1.2 Phương pháp xác suất 9
1.2.1 Lời giới thiệu 9
1.2.2 Ứng dụng xác suất để chứng minh sự tồn tại 10
1.2.3 Xác định cận từ kỳ vọng 10
1.2.4 Bài toán tập hợp độc lập có trọng số tối đa: Thuật toán cận biên và ngẫu nhiên 10
1.2.5 Bài toán phủ tập hợp 11
1.2.6 Phản xích 11
1.2.7 Bổ đề rút gọn Lovasz 12
1.2.8 Thuật toán ngẫu nhiên để tính phân hoạch cực tiểu của một đồ thị 12
2 Xích Markov và mô phỏng MCMC 13 2.1 Xích Markov 13
2.1.1 Giới thiệu 13
2.1.2 Phương trình Chapman-Kolmogorov 13
2.1.3 Phân loại trạng thái 14
2.1.4 Xác suất giới hạn và xác suất dừng 14
2.1.5 Ứng dụng 15
Trang 3Luận văn tốt nghiệp Phạm Thị Thu Hằng
2.1.6 Xích Markov với thời gian đảo ngược 16
2.2 Mô phỏng 17
2.2.1 Mô phỏng Monte Carlo 17
2.2.2 Tạo các biến ngẫu nhiên rời rạc 18
2.2.3 Tạo các biến ngẫu nhiên liên tục: Phương pháp biến đổi nghịch 18
2.3 Mô phỏng MCMC 19
3 Quá trình Poisson 21 3.1 Quá trình Poisson không dừng 21
3.2 Quá trình Poisson dừng 22
3.3 Một số tính toán quá trình Poisson 22
3.4 Phân loại biến cố của một quá trình Poisson không dừng 22
3.5 Phân phối có điều kiện của các thời điểm đến 22
Trang 4Công trình được hoàn thành tại: Trường Đại học Khoa hoc Tự nhiên - Đạihọc Quốc gia Hà Nội
Người hướng dẫn khoa học: GS.TSKH Đặng Hùng Thắng
Hội đồng chấm luận văn:
• Chủ tịch: PGS.TS Trần Hùng Thao - Viện Toán học - Viện Hàn lâm KH
và CN Việt Nam
• Phản biện 1: TS Nguyễn Thịnh - Đại học Khoa học Tự Nhiên - ĐHQGHN
• Phản biện 2: TS Ngô Hoàng Long - Đại học Sư phạm Hà Nội
• Thư ký: TS Lê Vỹ - Đại học Khoa học Tự Nhiên - ĐHQGHN
• Ủy viên: TS Trần Mạnh Cường - Đại học Khoa học Tự Nhiên - ĐHQGHN
Luận văn đã được bảo vệ trước Hội đồng chấm luận văn thạc sĩ họp tại: KhoaToán-Cơ-Tin học Trường Đại học Khoa học Tự nhiên (ĐHQGHN) vào 15h giờ
30 ngày 28 tháng 12 năm 2016
Có thể tìm đọc luận văn tại: - Trung tâm thư viện Đại học Quốc gia Hà Nội
Trang 5LỜI NÓI ĐẦU
Trong những năm gần đây, xác suất đã phát triển đa dạng và có nhiều ứngdụng quan trọng trong lĩnh vực khoa học máy tính Ví dụ, các chủ đề liên quanđến thuật toán như thuật toán ngẫu nhiên, thuật toán ước lượng và phân tíchxác suất của thuật toán đều sử dụng phương pháp xác suất
Trong luận văn này, tôi muốn giới thiệu các loại mô hình và phân tích xácsuất hữu dụng nhất trong khoa học máy tính Giả sử với một hàm mở đầu trongxác suất, tôi trình bày một số đề tài quan trọng như phương pháp xác suất,xích Markov, mô phỏng MCMC và quá trình Poisson không dừng Luận văn nàycung cấp nhiều ví dụ và bài tập mô tả các đề tài như thuật toán sắp xếp, thuậttoán tìm kiếm và biểu đồ ngẫu nhiên, bài toán tự sắp xếp theo danh sách, phảnxích, phân hoạch cực đại và cực tiểu trong đồ thị và nhiều đề tài khác
Cấu trúc luận văn được chia làm 3 chương chính:
• Chương 1 đưa ra các ví dụ hay trong khoa học máy tính, đồng thời trìnhbày phương pháp xác suất và một số cách ứng dụng phương pháp này
• Chương 2 viết về xích Markov trên không gian trạng thái rời rạc, phươngpháp Monte Carlo và xích Markov Monte Carlo (MCMC)
• Chương 3 giới thiệu một số lớp quá trình Poisson, từ đó nghiên cứu bàitoán phân loại biến cố của một quá trình Poisson không dừng và bài toánxác định phân phối có điều kiện của thời điểm đến
Trong khuôn khổ của luận văn này, do sự hạn hẹp về thời gian cũng nhưnăng lực của bản thân, vì vậy không thể tránh khỏi những hạn chế về nội dungcũng như việc trình bầy Tôi nhận thấy xác suất trong khoa học máy tính cònrất nhiều điều thú vị khác nữa và tôi rất mong có dịp trình bầy đầy đủ hơn.Luận văn được hoàn thành dưới sự hướng dẫn tận tâm của GS.TSKH ĐặngHùng Thắng Tôi xin được bày tỏ lòng biết ơn và kính trọng sâu sắc của mìnhđến thầy Qua đây tôi xin chân thành gửi lời cảm ơn tới các thầy cô trong Tổ
Trang 6bộ môn Xác suất thống kê và Ban Chủ nhiệm khoa Toán - Cơ - Tin học TrườngĐại học Khoa học Tự nhiên - Đại học Quốc gia Hà Nội đã chỉ bảo và hướngdẫn tận tình giúp tôi hoàn thành luận văn này!
Rất mong nhận được ý kiến đóng góp của các thầy cô và các bạn!
Hà Nội, tháng 11/2015Phạm Thị Thu Hằng
Trang 7Giờ hãy xem xét đồ thị với tập hợp đỉnh V = {1, 2, , n} và tập hợp cạnh
A = {(i, X(i)), i = 1, , n} trong đó X(i) là các biến ngẫu nhiên độc lập thỏamãn
Đồ thị vừa xây dựng là một đồ thị ngẫu nhiên
Chúng ta sẽ tính xác suất để đồ thị ngẫu nhiên này là đồ thị liên thông Đểtìm được xác suất này, ta chọn một đỉnh, giả sử đỉnh 1 và lần theo chuỗi cácđỉnh 1, X(1), X2(1), , trong đó Xn(1) = X(Xn−1(1)) để xác định giá trị củabiến ngẫu nhiên N là chỉ số k nhỏ nhất sao cho Xk(1) không là một đỉnh mới.Tức là,
Trang 8P {đồ thị liên thông} = Q0.
Mệnh đề 1.1.1 P{đồ thị liên thông} = E[W]
Trường hợp đặc biệt trong đó cạnh xuất phát từ mỗi đỉnh có thể đến mọiđỉnh của đồ thị với cùng xác suất
Hệ quả 1.1.2 Với n lớn, P {đồ thị là liên thông}vpπ/2n
1.1.2 Thuật toán Tìm kiếm và Sắp xếp nhanh
Gọi X là số phép so sánh cần sử dụng Để tính E[X], trước hết ta biểu diễn
X thành tổng các biến ngẫu nhiên khác theo cách sau Đầu tiên, ta đánh dấucho các giá trị được sắp xếp: 1 biểu thị giá trị nhỏ nhất, 2 biểu thị giá trị nhỏnhì, cứ như vậy cho tới hết Khi đó, với 1 ≤ i < j ≤ n, lấy I(i, j) bằng 1, nếu i
và j được so sánh trực tiếp và bằng 0 nếu i và j không được so sánh trực tiếp.Tính tổng các biến này với i < j cho ta tổng số phép so sánh Đó là
Trang 9Luận văn tốt nghiệp Phạm Thị Thu Hằng
Chúng ta sẽ xác định vị trí kỳ vọng của phần tử được yêu cầu với giả thiếtquá trình này diễn ra trong thời gian dài Đặt R là vị trí phần tử được yêu cầu,
ta sẽ tìm E[R] phần tử được chọn bằng cách kiểm tra điều kiện với Y Ta có
P (ej | ei hoặc ej) = Pj
P i + P j
Trang 101.1.4 Sinh hoán vị ngẫu nhiên
Ta nói rằng vec-tơ X(1), , X(n) ngẫu nhiên là hoán vị ngẫu nhiên của giátrị 1, , n nếu
1.2.1 Lời giới thiệu
Phương pháp xác suất là một kỹ thuật phân tích thuộc tính của phần tửtrong một tập hợp bằng cách đưa ra một không gian xác suất cho tập hợp này
và khảo sát một phần tử ngẫu nhiên Phương pháp này chủ yếu được ứng dụng
để giải quyết các bài toán lý thuyết tổ hợp và đồ thị
Trang 11Luận văn tốt nghiệp Phạm Thị Thu Hằng
1.2.2 Ứng dụng xác suất để chứng minh sự tồn tại
Giả sử chúng ta muốn chứng minh một phần tử của tập hợp S có một tínhchất nào đó Ta có thể nghiên cứu một phần tử ngẫu nhiên X trong tập hợp S
rồi chứng minh xác suất của biến cố đối ,biến cố mà X không có tính chất này,nhỏ hơn 1
Bất đẳng thức mạnh nếu f (X) là một đại lượng ngẫu nhiên không đổi
1.2.4 Bài toán tập hợp độc lập có trọng số tối đa: Thuật toán
cận biên và ngẫu nhiên
Giả sử mỗi đỉnh i, i = 1, , n có trọng số wi dương liên hợp với nó Với mỗitập hợp đỉnh A thì
Trang 12Thuật toán ước lượng ngẫu nhiên hóa
1 Đặt λi= (wi/d(i))b với tất cả các đỉnh i trong tập hợp đỉnh V
2 Tạo giá trị cho mỗi biến ngẫu nhiên I theo
P {I = j} = Xλj
i∈V
λi, j ∈ V
3 Đặt đỉnh I vào tập hợp độc lập, loại bỏ I và các đỉnh kề nó khỏi tập hợpđỉnh của đồ thị Tính lại bậc của các đỉnh còn lại rồi quay lại bước 1.Lặp lại các bước này thu được tập hợp độc lập có trọng số lớn nhất là mộtước lượng của tập hợp độc lập có trọng số tối đa Ta có thể chạy lại thuật toánvới cùng giá trị của b hoặc thay giá trị khác sau mỗi lần chạy
1.2.5 Bài toán phủ tập hợp
Gọi Si, i = 1, , m, là tập con của S = {1, 2, , s}, Gọi ni là số tập hợp conchứai, và giả sửn i > 0 với mỗi i = 1, , s Bài toán phủ tập hợp là bài toán tìm
số tập con nhỏ nhất có thể hợp lại thành tập S Gọi r là số tập con nhỏ nhất,
sử dụng phương pháp xác suất, chứng minh rằng với mỗi số nguyên k
số tập hợp lớn nhất trong một phản xích là [n/2]n trong đó [n/2] là số nguyênlớn nhất nhỏ hơn hoặc bằng n/2 Do đó, tập hợp tất cả các tập hợp con của
{1, 2, , n} kích thước [n/2] tạo thành phản xích lớn nhất
Trang 13Luận văn tốt nghiệp Phạm Thị Thu Hằng
1.2.7 Bổ đề rút gọn Lovasz
Xem xét tập hợp các biến cố {Ai, i = 1, , n} với 0 < P (Ai) < 1, giả sử tamuốn chứng minh không biến cố nào có thể xảy ra Rõ ràng đây là trường hợpcác biến cố độc lập với nhau nhưng ngay cả khi chúng không độc lập thì kết quảnày cũng có thể xảy ra khi mỗi biến cố “độc lập lẫn nhau” với mỗi tập hợp conchứa hầu hết các biến cố khác như định nghĩa sau đây
Định nghĩa 1.2.1 Biến cố A độc lập lẫn nhau với tập hợp các biến cố
{B1, , Br} nếu xác suất có điều kiện của A, với điều kiện để Bi xảy ra, bằngxác suất không điều kiện P (A)
Bổ đề 1.2.1 Bổ đề rút gọn Lovasz Cho các biến cố A1, , An, nếu với mỗi
i, i = 1, , n, Ai độc lập lẫn nhau với một tập hợp chứa tất cả các biến cố ngoạitrừ nhiều nhất d biến cố Aj khác, j 6= i và
thì bài toán trở thành tìm m 0 cùng với một phân hoạch sức chứa m 0
Với X0, X0c là một phân hoạch có sức chứa nhỏ nhất Xây dựng một thuậttoán xác suất để cho ra một phân hoạch mà sức chứa của nó bằng c(X0, X0c) vớixác suất lớn hơn hoặc bằng 2/n2 Thuật toán này còn có thể cho ta một phânhoạch cực tiểu với xác suất cao tùy ý
Trang 14P i,0 P i,1 P i,j
Trang 15Luận văn tốt nghiệp Phạm Thị Thu Hằng
2.1.3 Phân loại trạng thái
Ta nói trạng thái i đến được trạng thái j nếu tồn tại Pi,jn > 0 với n ≥ 0,
kí hiệu i → j
Hai trạng thái i và j được gọi là liên thông nếu i → j và j → i, kí hiệu i ↔ j
Quan hệ liên thông là quan hệ tương đương Một Xích Markov được gọi là tốigiản nếu hai trạng thái bất kỳ đều liên thông với nhau Với mỗi trạng thái i,gọi fi là xác suất để bắt đầu từ trạng thái i, quá trình sẽ trở lại trạng thái đó.Trạng thái i được gọi là hồi quy nếufi= 1 và trạng thái i được gọi là trans nếu
2.1.4 Xác suất giới hạn và xác suất dừng
Nếu trạng thái i hồi quy thì nó được gọi là hồi quy dương nếu bắt đầu từ
i, kỳ vọng thời gian đến khi quá trình quay lại trạng thái i là hữu hạn Trạngthái hồi quy dương không tuần hoàn được gọi là giả thiết ergodic
Định lí 2.1.1 Với một xích Markov tối giản ergodic, tồn tại lim
n→∞ Pi,jn và độclập với i Gọi
Mệnh đề 2.1.2 Gọi {X n , n ≥ 1} là xích Markov tối giản với xác suất dừng π j
và gọi r là hàm giới hạn không gian trạng thái Khi đó, với xác suất 1,
lim
N →∞
PN n=1 r(Xn)
X
j
r(j)πj
Trang 162.1.5 Ứng dụng
Mô hình cho hiệu suất thuật toán
Bài toán tối ưu hóa sau đây được gọi là quy hoạch tuyến tính:
cực tiểu biểu thức cx
với điều kiện: Ax = b, x ≥ 0
trong đó A là một ma trận hằng có kích thước m × n, c = (c 1 , , c n ) và
b = (b1, , bm) là các véc tơ hằng cố định và x = (x1, , xn) ∈R+n được chọn đểtối tiểu hóa cx = Pn
Xem xét một xích Markov trong đó P1,1= 1, và với i > 1
Pi,j = 1
i − 1, j = 1, , i − 1
Gọi Ti là số lần chuyển tiếp cần thiết để đi từ trạng thái i đến trạng thái
1 Ta viết được hàm đệ quy choE[Ti]bằng cách lấy xác suất điều kiện với trạngthái ban đầu:
Trang 17Luận văn tốt nghiệp Phạm Thị Thu Hằng
Mệnh đề 2.1.3 Dãy biến ngẫu nhiên I1, , IN −1 là độc lập, và
2.1.6 Xích Markov với thời gian đảo ngược
Xem xét một xích Markov dừng có xác suất chuyển tiếp là Pi,j và xác suấtdừng πi Giả sử bắt đầu từ thời điểm n, ta thấy xích trạng thái quay ngược lạitrình tự trước đó Tức là với một xích các trạng thái Xn, Xn−1, Xn−2, bảnthân xích này là một xích Markov với xác suất chuyển tiếp Q i,j trong đó
Qi,jπjPj,i
π i
Nếu Qi,j = Pi,j thì xích Markov được gọi là đảo ngược thời gian
Trang 18Định lí 2.1.2 Điều kiện Kolmogorov để đảo ngược thời gian Một xíchMarkov có Pi,j = 0 khi Pj,i = 0 có tính đảo ngược thời gian nếu bắt đầu từ trạngtháii, bất cứ đường đi từ i nào đều có cùng xác suất với đường đi từ hướng ngượclại Tức là xích có tính đảo ngược thời gian nếu
Pi,i1Pi1,i2 Pik,i= Pi,ikPik,ik−1 Pi1,i (2.3)với mọi k và trạng thái i, i1, , ik.
Khái niệm xích nghịch đảo khá hữu dụng ngay cả khi xích Markov ban đầukhông có tính đảo ngược thời gian Để mô tả điều này, ta cần sử dụng Mệnh đềsau
Mệnh đề 2.1.5 Xem xét một xích Markov tối giản có xác suất chuyển tiếp
Pi,j Nếu có thể tìm được các số dương πi, i ≥ 0 có tổng bằng 1 và ma trận xácsuất chuyển tiếp Q = [Q i,j ] thỏa mãn
thì Qi,j là xác suất chuyển tiếp của xích nghịch đảo và πi là xác suất dừng của
cả xích ban đầu và xích nghịch đảo
2.2.1 Mô phỏng Monte Carlo
Đặt X = (X1, , Xn) là véc tơ ngẫu nhiên có hàm mật độ chung là
Để ước lượng θ bằng phương pháp mô phỏng, trước hết ta tạo một vec tơngẫu nhiênX(1) có hàm mật độ f, và tìm giá trịY1= g(X(1)) Sau đó tạo ra mộtthứ ngẫu nhiên vector X(2), độc lập đầu tiên, cũng với mật độ f, và sau đó tính
Y2 = g(X(2)) Tiếp tục như vậy cho đến khi bạn có tạo ra các giá trị của r, một
Trang 19Luận văn tốt nghiệp Phạm Thị Thu Hằng
số được xác định trước, của các biến ngẫu nhiên Yi = g(X(i)), i = 1, , r Theoluật số lớn mạnh ta có:
2.2.2 Tạo các biến ngẫu nhiên rời rạc
Giả sử ta cần tạo giá trị của một biến ngẫu nhiên X có hàm phân bố xácsuất
Mệnh đề 2.2.1 Gọi U là biến ngẫu nhiên đều (0, 1) Với bất kỳ hàm phân phốiliện tục F, biến ngẫu nhiên X được xác định như sau
X = F−1(U )
Có phân phối F trong đó F−1(u) là giá trị của x thỏa mãn F (x) = u
Trang 202.3 Mô phỏng MCMC
Gọi X là véc tơ ngẫu nhiên rời rạc có tập hợp các giá trị là x j , j ≥ 1
Đặt P {X = xj}, j ≥ 1 là hàm phân bố xác suất của X và giả sử ta cần tính
để tạo ra một dãy các véc tơ ngẫu nhiên độc lập {X 1 , X 2 , , X n } có cùng phân
bố P {X = xj} Theo luật mạnh số lớn
lim
n→∞
Pn i=1 h(Xi)
chỉ được biết sai khác một hằng số nhân, tức là hàm được cho theo dạng
P {X = x j } = Cb j , j ≥ 1
trong đó bj được cho trước nhưng phải tính C Tuy nhiên, vẫn có một phươngpháp khác bên cạnh phương pháp Monte Carlo thông thường là sử dụng môphỏng để ước lượng θ Bằng cách tạo ra một xích không phải gồm các véc tơngẫu nhiên độc lập mà là các trạng thái liên tiếp của một xích Markov manggiá trị véc tơ Xn, n ≥ 1,ở đó xác suất dừng là P {X = xj}, j ≥ 1 Khi điều nàyđược thực hiện, ta có thể áp dụng Mệnh đề 2.1.2 và sử dụng Pn
i=1 h(Xi)/n đểước lượng θ
Để hiểu cách tạo một xích Markov với xác suất dừng ngẫu nhiên chỉ đượccho dưới dạng một hàm hệ số bội, gọi b(j), j ≥ 1, là các số dương có tổng
B = P∞j=1b(j) hữu hạn Thuật toán sau đây, được gọi là thuật toán HastingsMetropolis, được sử dụng để tạo ra một xích Markov đảo ngược thời gian có xácsuất dừng:
π(j) = b(j)/B, j ≥ 1.
Trang 21Luận văn tốt nghiệp Phạm Thị Thu Hằng
Gọi Q ma trận xác suất chuyển của xích Markov tối giản có không gian trạngthái là tập các số nguyên, với q(i, j) biểu diễn giá trị ở hàng i cột j Giờ ta sẽxác định xích Markov {Xn} như sau: Khi Xn = i, tạo một biến Y ngẫu nhiênsao cho P {Y = j} = q(i, j) Nếu Y = j thì đặt X n+1 bằng j với xác suất α(i, j)vàđặt bằng i với xác suất 1 − α(i, j), trong đó giá trị của α(i, j) sẽ được cho dướiđây Với những điều kiện này, dãy các trạng thái là một xích Markov có xác suấtchuyển tiếp Pi,j thỏa mãn cho bởi
Pi,j = q(i, j)α(i, j), j 6= i
Pi,i = q(i, i) +X
k6=i
q(i, k)[1 − α(i, k)]
xích Markov này có tính khôi phục ngươc thời gian và có xác suất dừngπ(j)nếu
π(i)Pi,j = π(j)Pj,i
điều này tương đương với
π(i)q(i, j)α(i, j) = π(j)q(j, i)α(j, i) (2.5)
Tuy nhiên, nếu ta chọn π(j) = b(j)/B và đặt
α(i, j) = min π(j)q(j, i)
π(i)q(i, j), 1
(2.6)
thì đẳng thức (2.5) dễ dàng được thỏa mãn (vì nếu π(j)q(j, i)/π(i)q(i, j) ≤ 1 thì
α(i, j) bằng tỉ lệ này và α(j, i) bằng 1; với một kết quả nghịch đảo nếu tỉ lệ nàylớn hơn 1.) Do vậy, xích Markov là khả nghịch với xác suất dừng π(j) = b(j)/B.Hơn nữa, từ đẳng thức (2.6) ta thấy