1. Trang chủ
  2. » Luận Văn - Báo Cáo

MỘT SỐ MÔ HÌNH XÁC SUẤT TRONG KHOA HỌC MÁY TÍNH

25 423 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 25
Dung lượng 284,27 KB

Nội dung

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN -PHẠM THỊ THU HẰNG MỘT SỐ MÔ HÌNH XÁC SUẤT TRONG KHOA HỌC MÁY TÍNH Chuyên ngành: Lý thuyết Xác suất và Thống kê toán học TÓM TẮT

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

-PHẠM THỊ THU HẰNG

MỘT SỐ MÔ HÌNH XÁC SUẤT TRONG KHOA HỌC MÁY TÍNH

Chuyên ngành: Lý thuyết Xác suất và Thống kê toán học

TÓM TẮT LUẬN VĂN THẠC SĨ KHOA HỌC

Hà Nội - Năm 2016

Trang 2

Lời nói đầu 4

1 Xác suất trong lý thuyết tổ hợp và đồ thị 6 1.1 Các ví dụ 6

1.1.1 Đồ thị ngẫu nhiên 6

1.1.2 Thuật toán Tìm kiếm và Sắp xếp nhanh 7

1.1.3 Mô hình danh sách tự tổ chức 8

1.1.4 Sinh hoán vị ngẫu nhiên 9

1.2 Phương pháp xác suất 9

1.2.1 Lời giới thiệu 9

1.2.2 Ứng dụng xác suất để chứng minh sự tồn tại 10

1.2.3 Xác định cận từ kỳ vọng 10

1.2.4 Bài toán tập hợp độc lập có trọng số tối đa: Thuật toán cận biên và ngẫu nhiên 10

1.2.5 Bài toán phủ tập hợp 11

1.2.6 Phản xích 11

1.2.7 Bổ đề rút gọn Lovasz 12

1.2.8 Thuật toán ngẫu nhiên để tính phân hoạch cực tiểu của một đồ thị 12

2 Xích Markov và mô phỏng MCMC 13 2.1 Xích Markov 13

2.1.1 Giới thiệu 13

2.1.2 Phương trình Chapman-Kolmogorov 13

2.1.3 Phân loại trạng thái 14

2.1.4 Xác suất giới hạn và xác suất dừng 14

2.1.5 Ứng dụng 15

Trang 3

Luận văn tốt nghiệp Phạm Thị Thu Hằng

2.1.6 Xích Markov với thời gian đảo ngược 16

2.2 Mô phỏng 17

2.2.1 Mô phỏng Monte Carlo 17

2.2.2 Tạo các biến ngẫu nhiên rời rạc 18

2.2.3 Tạo các biến ngẫu nhiên liên tục: Phương pháp biến đổi nghịch 18

2.3 Mô phỏng MCMC 19

3 Quá trình Poisson 21 3.1 Quá trình Poisson không dừng 21

3.2 Quá trình Poisson dừng 22

3.3 Một số tính toán quá trình Poisson 22

3.4 Phân loại biến cố của một quá trình Poisson không dừng 22

3.5 Phân phối có điều kiện của các thời điểm đến 22

Trang 4

Công trình được hoàn thành tại: Trường Đại học Khoa hoc Tự nhiên - Đạihọc Quốc gia Hà Nội

Người hướng dẫn khoa học: GS.TSKH Đặng Hùng Thắng

Hội đồng chấm luận văn:

• Chủ tịch: PGS.TS Trần Hùng Thao - Viện Toán học - Viện Hàn lâm KH

và CN Việt Nam

• Phản biện 1: TS Nguyễn Thịnh - Đại học Khoa học Tự Nhiên - ĐHQGHN

• Phản biện 2: TS Ngô Hoàng Long - Đại học Sư phạm Hà Nội

• Thư ký: TS Lê Vỹ - Đại học Khoa học Tự Nhiên - ĐHQGHN

• Ủy viên: TS Trần Mạnh Cường - Đại học Khoa học Tự Nhiên - ĐHQGHN

Luận văn đã được bảo vệ trước Hội đồng chấm luận văn thạc sĩ họp tại: KhoaToán-Cơ-Tin học Trường Đại học Khoa học Tự nhiên (ĐHQGHN) vào 15h giờ

30 ngày 28 tháng 12 năm 2016

Có thể tìm đọc luận văn tại: - Trung tâm thư viện Đại học Quốc gia Hà Nội

Trang 5

LỜI NÓI ĐẦU

Trong những năm gần đây, xác suất đã phát triển đa dạng và có nhiều ứngdụng quan trọng trong lĩnh vực khoa học máy tính Ví dụ, các chủ đề liên quanđến thuật toán như thuật toán ngẫu nhiên, thuật toán ước lượng và phân tíchxác suất của thuật toán đều sử dụng phương pháp xác suất

Trong luận văn này, tôi muốn giới thiệu các loại mô hình và phân tích xácsuất hữu dụng nhất trong khoa học máy tính Giả sử với một hàm mở đầu trongxác suất, tôi trình bày một số đề tài quan trọng như phương pháp xác suất,xích Markov, mô phỏng MCMC và quá trình Poisson không dừng Luận văn nàycung cấp nhiều ví dụ và bài tập mô tả các đề tài như thuật toán sắp xếp, thuậttoán tìm kiếm và biểu đồ ngẫu nhiên, bài toán tự sắp xếp theo danh sách, phảnxích, phân hoạch cực đại và cực tiểu trong đồ thị và nhiều đề tài khác

Cấu trúc luận văn được chia làm 3 chương chính:

• Chương 1 đưa ra các ví dụ hay trong khoa học máy tính, đồng thời trìnhbày phương pháp xác suất và một số cách ứng dụng phương pháp này

• Chương 2 viết về xích Markov trên không gian trạng thái rời rạc, phươngpháp Monte Carlo và xích Markov Monte Carlo (MCMC)

• Chương 3 giới thiệu một số lớp quá trình Poisson, từ đó nghiên cứu bàitoán phân loại biến cố của một quá trình Poisson không dừng và bài toánxác định phân phối có điều kiện của thời điểm đến

Trong khuôn khổ của luận văn này, do sự hạn hẹp về thời gian cũng nhưnăng lực của bản thân, vì vậy không thể tránh khỏi những hạn chế về nội dungcũng như việc trình bầy Tôi nhận thấy xác suất trong khoa học máy tính cònrất nhiều điều thú vị khác nữa và tôi rất mong có dịp trình bầy đầy đủ hơn.Luận văn được hoàn thành dưới sự hướng dẫn tận tâm của GS.TSKH ĐặngHùng Thắng Tôi xin được bày tỏ lòng biết ơn và kính trọng sâu sắc của mìnhđến thầy Qua đây tôi xin chân thành gửi lời cảm ơn tới các thầy cô trong Tổ

Trang 6

bộ môn Xác suất thống kê và Ban Chủ nhiệm khoa Toán - Cơ - Tin học TrườngĐại học Khoa học Tự nhiên - Đại học Quốc gia Hà Nội đã chỉ bảo và hướngdẫn tận tình giúp tôi hoàn thành luận văn này!

Rất mong nhận được ý kiến đóng góp của các thầy cô và các bạn!

Hà Nội, tháng 11/2015Phạm Thị Thu Hằng

Trang 7

Giờ hãy xem xét đồ thị với tập hợp đỉnh V = {1, 2, , n} và tập hợp cạnh

A = {(i, X(i)), i = 1, , n} trong đó X(i) là các biến ngẫu nhiên độc lập thỏamãn

Đồ thị vừa xây dựng là một đồ thị ngẫu nhiên

Chúng ta sẽ tính xác suất để đồ thị ngẫu nhiên này là đồ thị liên thông Đểtìm được xác suất này, ta chọn một đỉnh, giả sử đỉnh 1 và lần theo chuỗi cácđỉnh 1, X(1), X2(1), , trong đó Xn(1) = X(Xn−1(1)) để xác định giá trị củabiến ngẫu nhiên N là chỉ số k nhỏ nhất sao cho Xk(1) không là một đỉnh mới.Tức là,

Trang 8

P {đồ thị liên thông} = Q0.

Mệnh đề 1.1.1 P{đồ thị liên thông} = E[W]

Trường hợp đặc biệt trong đó cạnh xuất phát từ mỗi đỉnh có thể đến mọiđỉnh của đồ thị với cùng xác suất

Hệ quả 1.1.2 Với n lớn, P {đồ thị là liên thông}vpπ/2n

1.1.2 Thuật toán Tìm kiếm và Sắp xếp nhanh

Gọi X là số phép so sánh cần sử dụng Để tính E[X], trước hết ta biểu diễn

X thành tổng các biến ngẫu nhiên khác theo cách sau Đầu tiên, ta đánh dấucho các giá trị được sắp xếp: 1 biểu thị giá trị nhỏ nhất, 2 biểu thị giá trị nhỏnhì, cứ như vậy cho tới hết Khi đó, với 1 ≤ i < j ≤ n, lấy I(i, j) bằng 1, nếu i

và j được so sánh trực tiếp và bằng 0 nếu i và j không được so sánh trực tiếp.Tính tổng các biến này với i < j cho ta tổng số phép so sánh Đó là

Trang 9

Luận văn tốt nghiệp Phạm Thị Thu Hằng

Chúng ta sẽ xác định vị trí kỳ vọng của phần tử được yêu cầu với giả thiếtquá trình này diễn ra trong thời gian dài Đặt R là vị trí phần tử được yêu cầu,

ta sẽ tìm E[R] phần tử được chọn bằng cách kiểm tra điều kiện với Y Ta có

P (ej | ei hoặc ej) = Pj

P i + P j

Trang 10

1.1.4 Sinh hoán vị ngẫu nhiên

Ta nói rằng vec-tơ X(1), , X(n) ngẫu nhiên là hoán vị ngẫu nhiên của giátrị 1, , n nếu

1.2.1 Lời giới thiệu

Phương pháp xác suất là một kỹ thuật phân tích thuộc tính của phần tửtrong một tập hợp bằng cách đưa ra một không gian xác suất cho tập hợp này

và khảo sát một phần tử ngẫu nhiên Phương pháp này chủ yếu được ứng dụng

để giải quyết các bài toán lý thuyết tổ hợp và đồ thị

Trang 11

Luận văn tốt nghiệp Phạm Thị Thu Hằng

1.2.2 Ứng dụng xác suất để chứng minh sự tồn tại

Giả sử chúng ta muốn chứng minh một phần tử của tập hợp S có một tínhchất nào đó Ta có thể nghiên cứu một phần tử ngẫu nhiên X trong tập hợp S

rồi chứng minh xác suất của biến cố đối ,biến cố mà X không có tính chất này,nhỏ hơn 1

Bất đẳng thức mạnh nếu f (X) là một đại lượng ngẫu nhiên không đổi

1.2.4 Bài toán tập hợp độc lập có trọng số tối đa: Thuật toán

cận biên và ngẫu nhiên

Giả sử mỗi đỉnh i, i = 1, , n có trọng số wi dương liên hợp với nó Với mỗitập hợp đỉnh A thì

Trang 12

Thuật toán ước lượng ngẫu nhiên hóa

1 Đặt λi= (wi/d(i))b với tất cả các đỉnh i trong tập hợp đỉnh V

2 Tạo giá trị cho mỗi biến ngẫu nhiên I theo

P {I = j} = Xλj

i∈V

λi, j ∈ V

3 Đặt đỉnh I vào tập hợp độc lập, loại bỏ I và các đỉnh kề nó khỏi tập hợpđỉnh của đồ thị Tính lại bậc của các đỉnh còn lại rồi quay lại bước 1.Lặp lại các bước này thu được tập hợp độc lập có trọng số lớn nhất là mộtước lượng của tập hợp độc lập có trọng số tối đa Ta có thể chạy lại thuật toánvới cùng giá trị của b hoặc thay giá trị khác sau mỗi lần chạy

1.2.5 Bài toán phủ tập hợp

Gọi Si, i = 1, , m, là tập con của S = {1, 2, , s}, Gọi ni là số tập hợp conchứai, và giả sửn i > 0 với mỗi i = 1, , s Bài toán phủ tập hợp là bài toán tìm

số tập con nhỏ nhất có thể hợp lại thành tập S Gọi r là số tập con nhỏ nhất,

sử dụng phương pháp xác suất, chứng minh rằng với mỗi số nguyên k

số tập hợp lớn nhất trong một phản xích là [n/2]n  trong đó [n/2] là số nguyênlớn nhất nhỏ hơn hoặc bằng n/2 Do đó, tập hợp tất cả các tập hợp con của

{1, 2, , n} kích thước [n/2] tạo thành phản xích lớn nhất

Trang 13

Luận văn tốt nghiệp Phạm Thị Thu Hằng

1.2.7 Bổ đề rút gọn Lovasz

Xem xét tập hợp các biến cố {Ai, i = 1, , n} với 0 < P (Ai) < 1, giả sử tamuốn chứng minh không biến cố nào có thể xảy ra Rõ ràng đây là trường hợpcác biến cố độc lập với nhau nhưng ngay cả khi chúng không độc lập thì kết quảnày cũng có thể xảy ra khi mỗi biến cố “độc lập lẫn nhau” với mỗi tập hợp conchứa hầu hết các biến cố khác như định nghĩa sau đây

Định nghĩa 1.2.1 Biến cố A độc lập lẫn nhau với tập hợp các biến cố

{B1, , Br} nếu xác suất có điều kiện của A, với điều kiện để Bi xảy ra, bằngxác suất không điều kiện P (A)

Bổ đề 1.2.1 Bổ đề rút gọn Lovasz Cho các biến cố A1, , An, nếu với mỗi

i, i = 1, , n, Ai độc lập lẫn nhau với một tập hợp chứa tất cả các biến cố ngoạitrừ nhiều nhất d biến cố Aj khác, j 6= i và

thì bài toán trở thành tìm m 0 cùng với một phân hoạch sức chứa m 0

Với X0, X0c là một phân hoạch có sức chứa nhỏ nhất Xây dựng một thuậttoán xác suất để cho ra một phân hoạch mà sức chứa của nó bằng c(X0, X0c) vớixác suất lớn hơn hoặc bằng 2/n2 Thuật toán này còn có thể cho ta một phânhoạch cực tiểu với xác suất cao tùy ý

Trang 14

P i,0 P i,1 P i,j

Trang 15

Luận văn tốt nghiệp Phạm Thị Thu Hằng

2.1.3 Phân loại trạng thái

Ta nói trạng thái i đến được trạng thái j nếu tồn tại Pi,jn > 0 với n ≥ 0,

kí hiệu i → j

Hai trạng thái i và j được gọi là liên thông nếu i → j và j → i, kí hiệu i ↔ j

Quan hệ liên thông là quan hệ tương đương Một Xích Markov được gọi là tốigiản nếu hai trạng thái bất kỳ đều liên thông với nhau Với mỗi trạng thái i,gọi fi là xác suất để bắt đầu từ trạng thái i, quá trình sẽ trở lại trạng thái đó.Trạng thái i được gọi là hồi quy nếufi= 1 và trạng thái i được gọi là trans nếu

2.1.4 Xác suất giới hạn và xác suất dừng

Nếu trạng thái i hồi quy thì nó được gọi là hồi quy dương nếu bắt đầu từ

i, kỳ vọng thời gian đến khi quá trình quay lại trạng thái i là hữu hạn Trạngthái hồi quy dương không tuần hoàn được gọi là giả thiết ergodic

Định lí 2.1.1 Với một xích Markov tối giản ergodic, tồn tại lim

n→∞ Pi,jn và độclập với i Gọi

Mệnh đề 2.1.2 Gọi {X n , n ≥ 1} là xích Markov tối giản với xác suất dừng π j

và gọi r là hàm giới hạn không gian trạng thái Khi đó, với xác suất 1,

lim

N →∞

PN n=1 r(Xn)

X

j

r(j)πj

Trang 16

2.1.5 Ứng dụng

Mô hình cho hiệu suất thuật toán

Bài toán tối ưu hóa sau đây được gọi là quy hoạch tuyến tính:

cực tiểu biểu thức cx

với điều kiện: Ax = b, x ≥ 0

trong đó A là một ma trận hằng có kích thước m × n, c = (c 1 , , c n ) và

b = (b1, , bm) là các véc tơ hằng cố định và x = (x1, , xn) ∈R+n được chọn đểtối tiểu hóa cx = Pn

Xem xét một xích Markov trong đó P1,1= 1, và với i > 1

Pi,j = 1

i − 1, j = 1, , i − 1

Gọi Ti là số lần chuyển tiếp cần thiết để đi từ trạng thái i đến trạng thái

1 Ta viết được hàm đệ quy choE[Ti]bằng cách lấy xác suất điều kiện với trạngthái ban đầu:

Trang 17

Luận văn tốt nghiệp Phạm Thị Thu Hằng

Mệnh đề 2.1.3 Dãy biến ngẫu nhiên I1, , IN −1 là độc lập, và

2.1.6 Xích Markov với thời gian đảo ngược

Xem xét một xích Markov dừng có xác suất chuyển tiếp là Pi,j và xác suấtdừng πi Giả sử bắt đầu từ thời điểm n, ta thấy xích trạng thái quay ngược lạitrình tự trước đó Tức là với một xích các trạng thái Xn, Xn−1, Xn−2, bảnthân xích này là một xích Markov với xác suất chuyển tiếp Q i,j trong đó

Qi,jπjPj,i

π i

Nếu Qi,j = Pi,j thì xích Markov được gọi là đảo ngược thời gian

Trang 18

Định lí 2.1.2 Điều kiện Kolmogorov để đảo ngược thời gian Một xíchMarkov có Pi,j = 0 khi Pj,i = 0 có tính đảo ngược thời gian nếu bắt đầu từ trạngtháii, bất cứ đường đi từ i nào đều có cùng xác suất với đường đi từ hướng ngượclại Tức là xích có tính đảo ngược thời gian nếu

Pi,i1Pi1,i2 Pik,i= Pi,ikPik,ik−1 Pi1,i (2.3)với mọi k và trạng thái i, i1, , ik.

Khái niệm xích nghịch đảo khá hữu dụng ngay cả khi xích Markov ban đầukhông có tính đảo ngược thời gian Để mô tả điều này, ta cần sử dụng Mệnh đềsau

Mệnh đề 2.1.5 Xem xét một xích Markov tối giản có xác suất chuyển tiếp

Pi,j Nếu có thể tìm được các số dương πi, i ≥ 0 có tổng bằng 1 và ma trận xácsuất chuyển tiếp Q = [Q i,j ] thỏa mãn

thì Qi,j là xác suất chuyển tiếp của xích nghịch đảo và πi là xác suất dừng của

cả xích ban đầu và xích nghịch đảo

2.2.1 Mô phỏng Monte Carlo

Đặt X = (X1, , Xn) là véc tơ ngẫu nhiên có hàm mật độ chung là

Để ước lượng θ bằng phương pháp mô phỏng, trước hết ta tạo một vec tơngẫu nhiênX(1) có hàm mật độ f, và tìm giá trịY1= g(X(1)) Sau đó tạo ra mộtthứ ngẫu nhiên vector X(2), độc lập đầu tiên, cũng với mật độ f, và sau đó tính

Y2 = g(X(2)) Tiếp tục như vậy cho đến khi bạn có tạo ra các giá trị của r, một

Trang 19

Luận văn tốt nghiệp Phạm Thị Thu Hằng

số được xác định trước, của các biến ngẫu nhiên Yi = g(X(i)), i = 1, , r Theoluật số lớn mạnh ta có:

2.2.2 Tạo các biến ngẫu nhiên rời rạc

Giả sử ta cần tạo giá trị của một biến ngẫu nhiên X có hàm phân bố xácsuất

Mệnh đề 2.2.1 Gọi U là biến ngẫu nhiên đều (0, 1) Với bất kỳ hàm phân phốiliện tục F, biến ngẫu nhiên X được xác định như sau

X = F−1(U )

Có phân phối F trong đó F−1(u) là giá trị của x thỏa mãn F (x) = u

Trang 20

2.3 Mô phỏng MCMC

Gọi X là véc tơ ngẫu nhiên rời rạc có tập hợp các giá trị là x j , j ≥ 1

Đặt P {X = xj}, j ≥ 1 là hàm phân bố xác suất của X và giả sử ta cần tính

để tạo ra một dãy các véc tơ ngẫu nhiên độc lập {X 1 , X 2 , , X n } có cùng phân

bố P {X = xj} Theo luật mạnh số lớn

lim

n→∞

Pn i=1 h(Xi)

chỉ được biết sai khác một hằng số nhân, tức là hàm được cho theo dạng

P {X = x j } = Cb j , j ≥ 1

trong đó bj được cho trước nhưng phải tính C Tuy nhiên, vẫn có một phươngpháp khác bên cạnh phương pháp Monte Carlo thông thường là sử dụng môphỏng để ước lượng θ Bằng cách tạo ra một xích không phải gồm các véc tơngẫu nhiên độc lập mà là các trạng thái liên tiếp của một xích Markov manggiá trị véc tơ Xn, n ≥ 1,ở đó xác suất dừng là P {X = xj}, j ≥ 1 Khi điều nàyđược thực hiện, ta có thể áp dụng Mệnh đề 2.1.2 và sử dụng Pn

i=1 h(Xi)/n đểước lượng θ

Để hiểu cách tạo một xích Markov với xác suất dừng ngẫu nhiên chỉ đượccho dưới dạng một hàm hệ số bội, gọi b(j), j ≥ 1, là các số dương có tổng

B = P∞j=1b(j) hữu hạn Thuật toán sau đây, được gọi là thuật toán HastingsMetropolis, được sử dụng để tạo ra một xích Markov đảo ngược thời gian có xácsuất dừng:

π(j) = b(j)/B, j ≥ 1.

Trang 21

Luận văn tốt nghiệp Phạm Thị Thu Hằng

Gọi Q ma trận xác suất chuyển của xích Markov tối giản có không gian trạngthái là tập các số nguyên, với q(i, j) biểu diễn giá trị ở hàng i cột j Giờ ta sẽxác định xích Markov {Xn} như sau: Khi Xn = i, tạo một biến Y ngẫu nhiênsao cho P {Y = j} = q(i, j) Nếu Y = j thì đặt X n+1 bằng j với xác suất α(i, j)vàđặt bằng i với xác suất 1 − α(i, j), trong đó giá trị của α(i, j) sẽ được cho dướiđây Với những điều kiện này, dãy các trạng thái là một xích Markov có xác suấtchuyển tiếp Pi,j thỏa mãn cho bởi

Pi,j = q(i, j)α(i, j), j 6= i

Pi,i = q(i, i) +X

k6=i

q(i, k)[1 − α(i, k)]

xích Markov này có tính khôi phục ngươc thời gian và có xác suất dừngπ(j)nếu

π(i)Pi,j = π(j)Pj,i

điều này tương đương với

π(i)q(i, j)α(i, j) = π(j)q(j, i)α(j, i) (2.5)

Tuy nhiên, nếu ta chọn π(j) = b(j)/B và đặt

α(i, j) = min π(j)q(j, i)

π(i)q(i, j), 1



(2.6)

thì đẳng thức (2.5) dễ dàng được thỏa mãn (vì nếu π(j)q(j, i)/π(i)q(i, j) ≤ 1 thì

α(i, j) bằng tỉ lệ này và α(j, i) bằng 1; với một kết quả nghịch đảo nếu tỉ lệ nàylớn hơn 1.) Do vậy, xích Markov là khả nghịch với xác suất dừng π(j) = b(j)/B.Hơn nữa, từ đẳng thức (2.6) ta thấy

Ngày đăng: 18/06/2016, 08:43

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w