Cơ sở thống kê bayes trong lý thuyết tìm kiếm

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA NGUYỄN MAI HƯNG CƠ SỞ THỐNG KÊ BAYES TRONG LÝ THUYẾT TÌM KIẾM Chuyên ngành : TOÁN ỨNG DỤNG Mã ngành : 60.46.36 LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, 01/ 2010 CƠNG TRÌNH ĐƯỢC HÌNH THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH Cán hướng dẫn khoa học: Thầy NGUYỄN VĂN THU Giáo Sư - Tiến Sĩ Khoa Học Cán chấm nhận xét 1: TS TÔ ANH DŨNG Cán chấm nhận xét 2: TS NGUYỄN BÁ THI Luận văn Thạc sĩ bảo vệ HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN THẠC SĨ TRƯỜNG ĐẠI HỌC BÁCH KHOA, ngày 04 tháng 02 năm 2010 TRƯỜNG ĐH BÁCH KHOA TP HCM PHỊNG ĐÀO TẠO SĐH CỘNG HỒ XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc U U Tp HCM, ngày 04 tháng 02 năm 2010 NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: Nguyễn Mai Hưng Phái: Nam Ngày, tháng, năm sinh: 15/01/1983 Nơi sinh: Đăk Lăk Chuyên ngành : Toán ứng dụng MSHV: 02407159 I- TÊN ĐỀ TÀI CƠ SỞ THỐNG KÊ BAYES TRONG LÝ THUYẾT TÌM KIẾM II - NHIỆM VỤ VÀ NỘI DUNG Đọc tài liệu xác suất, thống kê Bayes, lý thuyết tìm kiếm kiến thức liên quan Chương 1: Xác suất chủ quan Chương 2: Hàm tiện ích Chương 3: Thống kê định Chương 4: Bài toán định liên tiếp III - NGÀY GIAO NHIỆM VỤ: Ngày 08 tháng 12 năm 2008 IV- NGÀY HOÀN THÀNH NHIỆM VỤ: Ngày 15 tháng 01 năm 2010 V - CÁN BỘ HƯỚNG DẪN: Giáo sư - Tiến sĩ khoa học Nguyễn Văn Thu CN BỘ MÔN QL CHUYÊN NGÀNH CÁN BỘ HƯỚNG DẪN GS - TSKH NGUYỄN VĂN THU PGS -TS NGUYỄN ĐÌNH HUY CÁN BỘ PHẢN BIỆN 1: TS TÔ ANH DŨNG CÁN BỘ PHẢN BIỆN 2: TS NGUYỄN BÁ THI LỜI CẢM ƠN Lời tơi trân trọng kính gửi đến Thầy hướng dẫn, GS.TSKH.Nguyễn Văn Thu, người Thầy hết lòng học trị, lịng biết ơn chân thành sâu sắc Thầy ân cần tận tình hướng dẫn, giúp đỡ nắm bước nghiên cứu giải đáp thắc mắc gặp phải Từ Thầy, hiểu thêm ý nghĩa, hứng thú lòng say mê việc nghiên cứu Tốn học tưởng chừng khơ khan ứng dụng Tôi xin khắc ghi lời dạy, bảo ân cần Thầy suốt trình học tập hồn thành luận văn Tơi xin bày tỏ lòng biết ơn sâu sắc đến quý Thầy, Cơ ngồi mơn Tốn học trường Đại học Bách Khoa TP Hồ Chí Minh tận tình truyền đạt kiến thức, kinh nghiệm quý báu cho suốt thời gian học tập trường Chân thành cảm ơn Ban chủ nhiệm khoa khoa học ứng dụng, q Thầy, Cơ thuộc Phịng Quản lý Sau Đại học, thư viện trường Đại học Bách Khoa TP Hồ Chí Minh tạo điều kiện thuận lợi để tơi hồn thành chương trình học q trình làm thủ tục bảo vệ luận văn tốt nghiệp Xin cảm ơn anh chị lớp Cao học Toán Ứng Dụng Khóa 2007, anh chị nhóm seminar Thầy Mẫn tổ chức động viên nhiệt tình giúp đỡ suốt thời gian qua Tôi khơng qn gửi lời biết ơn đến gia đình tơi, người hết lịng lo lắng ln bên tơi lúc khó khăn Sau cùng, kiến thức thân cịn hạn chế nên luận văn khó tránh khỏi thiếu xót Tơi mong bảo q Thầy, Cơ góp ý chân thành bạn bè đồng nghiệp Tôi xin chân thành cảm ơn Thành phố Hồ Chí Minh, tháng 01 năm 2010 Nguyễn Mai Hưng TÓM TẮT Luận văn nêu sở lý thuyết thống kê Bayes dựa khái niệm: Xác suất chủ quan Hàm tiện ích Thống kê định Từ đó, luận văn vào nghiên cứu tốn định liên tiếp nhằm áp dụng xây dựng mơ hình tìm kiếm tối ưu MỤC LỤC Trang TỔNG QUAN ĐỀ TÀI CHƯƠNG 0: CÁC KÍ HIỆU VÀ ĐẶC TRƯNG CƠNG VIỆC TÌM KIẾM 10 0.1 Biến ngẫu nhiên phân phối 10 0.2 Định lý Bayes 11 0.3 Sơ lược lý thuyết tìm kiếm Bayes 11 CHƯƠNG 1: XÁC SUẤT CHỦ QUAN 13 1.1 Mở đầu 13 1.2 Sự hợp lý tương đối 13 1.3 Kinh nghiệm bổ trợ 16 1.4 Cấu trúc phân phối xác suất 17 1.5 Kiểm tra tính chất phân phối xác suất 19 1.6 Hợp lý có điều kiện 21 CHƯƠNG 2: HÀM TIỆN ÍCH 22 2.1 Lời mở đầu 22 2.2 Các khái niệm có liên quan 22 2.3 Định nghĩa hàm tiện ích 23 2.4 Tính chất hàm tiện ích 26 2.5 Tiền đề phát triển tính tiện ích 32 2.6 Cấu trúc hàm tiện ích 35 2.7 Kiểm tra tính chất hàm tiện ích 38 CHƯƠNG 3: THỐNG KÊ QUYẾT ĐỊNH 42 3.1 Những thành phần vấn đề định 42 3.2 Rủi ro Bayes định Bayes 44 3.3 Hàm tổn thất khơng âm 46 3.4 Tính lõm rủi ro Bayes 46 3.5 Sự ngẫu nhiên hóa định hỗn hợp 48 3.6 Tập lồi 50 3.7 Bài toán định Ω D hữu hạn 51 3.8 Bài toán định có quan sát 55 3.9 Cấu trúc hàm định Bayes 56 3.10 Chi phí quan sát 60 3.11 Bài toán định Ω d chứa hai điểm 65 3.12 Tính tốn phân phối hậu nghiệm quan sát thực 67 nhiều bước CHƯƠNG 4: QUYẾT ĐỊNH LIÊN TIẾP 69 4.1 Lợi ích việc lấy mẫu liên tiếp 69 4.2 Quá trình định liên tiếp 73 4.3 Rủi ro trình định liên tiếp 76 4.4 Quy nạp lùi 78 4.5 Quá trình định liên tiếp bị chặn tối ưu 79 4.6 Bài tốn tìm kiếm 82 4.7 Bài tốn tìm kiếm với chi phí 86 HƯỚNG PHÁT TRIỂN – KẾT LUẬN 89 TÀI LIỆU THAM KHẢO 90 TỔNG QUAN ĐỀ TÀI Tính cấp thiết đề tài Khoa học thống kê đề cập đến phát triển lý thuyết kỹ thuật để suy diễn hợp lý điều kiện khơng chắn Các tốn thống kê phụ thuộc chủ yếu vào công thức mô hình xác suất, phương pháp thu thập phân tích số liệu Lý thuyết định xem xét lớp tốn thống kê nhà thống kê phải nhận thông tin tham số đó, để đưa định có hiệu tình mà kết định dựa giá trị tham số Trong kĩ thuật, kinh tế có nhiều kết quan trọng thực dựa lý thuyết tìm kiếm Việc nghiên cứu ứng dụng lý thuyết có ý nghĩa phát triển khoa học ứng dụng thực tiễn Việt Nam Xác định vấn đề nghiên cứu Thống kê Bayes phương pháp thống kê phát triển có nhiều ứng dụng thực tiễn Luận văn đưa sở lý thuyết thống kê Bayes nhằm ứng dụng vào lý thuyết tìm kiếm Đối với tốn tìm kiếm chưa biết thơng tin xác đối tượng tìm kiếm, khái niệm xác suất chủ quan sử dụng, cụ thể phương pháp hợp lý tương đối Hàm tiện ích cách xác định ưu tiên sở thích liên quan đến phần thưởng phân phối xác suất Trong phần này, luận văn thảo luận phát triển tính chất cần có hàm tiện ích phân phối xác suất có phương pháp xây dựng hàm tiện ích Tiếp theo, luận văn trình bày vấn đề liên quan đến thống kê định Nhiều ví dụ cụ thể trình bày để làm rõ khái niệm phần Phần cuối luận văn trình phương pháp tìm trình tối ưu toán định liên tiếp trường hợp số quan sát hữu hạn, trình bày mơ hình tìm kiếm lý thuyết Luận văn trình bày với chương sau đây: Chương trình bày ký hiệu, kiến thức lý thuyết xác suất đặc trưng cơng việc tìm kiếm Chương trình bày phương pháp xây dựng xác suất chủ quan Chương khảo sát tính chất hàm tiện ích Chương trình bày khái niệm tốn thống kê định, xem xét ví dụ làm rõ khái niệm Chương thảo luận toán định liên tiếp Hướng phát triển luận văn trình bày phần kết luận Cuối phần tài liệu tham khảo 10 Chương 0: CÁC KÍ HIỆU VÀ ĐẶC TRƯNG CƠNG VIỆC TÌM KIẾM 0.1 Biến ngẫu nhiên phân phối Xét ( S , Q , P) khơng gian xác xuất, đó: S : khơng gian mẫu Q : σ − đại số S P : phân phối xác suất ( S , Q ) Với biến cố A bất kì, Pr( A) : xác suất xảy biến cố A Một biến ngẫu nhiên X hàm thực, Q -đo xác định ∀s ∈ S Mọi biến ngẫu nhiên X sinh phân phối xác suất PX đường thẳng thực Mọi tập Borel B ⊂ , xác suất PX ( B) xác định sau: PX ( B ) = Pr( X ∈ B ) = P {s : X ( s ) ∈ B} Hàm phân phối (df) F biến ngẫu nhiên X : F: → [0,1] t F (t ) = Pr( X ≤ t ) Hàm mật độ xác suất f X trường hợp X biến ngẫu nhiên rời rạc (p.f): f ( x) = Pr( X = x) Với tập Borel B ⊂ ta có: PX ( B) = ∑ {i:xi∈B} f ( xi ) Hàm mật độ xác suất f X trường hợp X biến ngẫu nhiên liên tục (p.d.f) hàm không âm cho với tập Borel B ⊂ ta có: PX ( B) = ∫ f ( x)dx B Hàm mật độ xác suất f rời rạc liên tục, ta sử dụng thuật ngữ hàm mật độ xác suất tổng quát (g.p.d.f) Ta kí hiệu: ∫B g ( x) f ( x)d μ ( x) thay cho hai kí hiệu sau: g ( x) f ( x) ∑ x∈B X biến ngẫu nhiên rời rạc 78 thể là, ξ g.p.d.f tiên nghiệm W g.p.d.f hậu nghiệm W X = x1 , , X n = xn ξ ( x1 , , xn ) Với g.p.d.f φ W , đặt ρ (φ ) xác định sau: ρ (φ ) = inf ∫ L(ω , d )φ (ω )dv(ω ) d∈D Ω (4.3.3) Nói cách khác, ρ (φ ) rủi ro thấp từ định tức mà khơng có thêm quan sát g.p.d.f W φ Ta tiếp tục giả sử g.p.d.f φ xuất suốt q trình lấy mẫu, có định Bayes D thực đem lại rủi ro thấp ρ (φ ) Một trình định liên tiếp Bayes ( hay trình định liên tiếp tối ưu) q trình δ có rủi ro ρ (ξ , δ ) nhỏ Khi ta tìm kiếm trình định liên tiếp Bayes, ta cần xét q trình có hàm định δ n (n = 1,2,…) xác định định Bayes D Nói cách khác, việc lấy mẫu kết thúc sau giá trị x1 , , xn quan sát định δ n ( x1 , , xn ) chọn Bayes g.p.d.f hậu nghiệm ξ ( x1 , , xn ) W Giả sử q trình định liên tiếp δ khơng phải đưa đến định Bayes việc lấy mẫu kết thúc Thì q trình δ * có luật dừng δ dẫn đến định Bayes có tính chất sau: ρ (ξ , δ * ) ≤ ρ (ξ , δ ) Như trình bày chủ đề trước, ta giả sử trình bày sau cho trình định liên tiếp xét Khi định chọn sau việc lấy mẫu kết thúc, định định Bayes phân phối hậu nghiệm W Vì thế, thảo luận trình bất kì, ta khơng đề cập cách xác đến luật định Với trình δ xác định quan sát thực hiện, ta có phương trình sau: ρ (ξ , δ ) = E {ρ0 [ξ ( X , , X N )] + c1 + + cN } (4.3.4) Với trình δ xác định định tức thời chọn mà khơng có quan sát nào, ta có phương trình sau: ρ (ξ , δ ) = ρ0 (ξ ) 79 4.4 Quy nạp lùi Định nghĩa: trình định liên tiếp δ gọi bị chặn tồn số nguyên dương n thỏa Pr( N ≤ n) = Trong phần này, ta xét tốn có chặn cho số lần quan sát thực Nói cách khác, ta hạn chế toán định liên tiếp có số lần quan sát nhiều n Khi ta tận dụng kĩ thuật quy nạp lùi trình bày phần sau để tìm trình định liên tiếp bị chặn tối ưu, ta bắt đầu cách xét bước quan sát cuối sau ta thực ngược lại bước quan sát Lý sử dụng kĩ thuật mô tả cách dễ dàng Để định dù ta chọn định D mà không quan sát tất hay ta quan sát giá trị X , ta phải hiểu cách sử dụng X quan sát Câu hỏi ta xét đến là: ngưng lấy mẫu sau X quan sát hay tiếp tục quan sát X Câu trả lời dựa lợi ích nhận quan sát X Câu trả lời dẫn đến câu hỏi tiếp theo: X quan sát việc lấy mẫu ngưng sau hay tiếp tục quan sát X ? Tiếp tục theo cách dẫn ta đến câu hỏi cuối cùng: giá trị X , , X n−1 quan sát việc lấy mẫu kết thúc hay tiếp tục quan sát X n ? Thơng thường, khơng khó trả lời câu hỏi cuối Nếu X n quan sát số quan sát giới hạn xác định bắt buộc phải ngưng việc lấy mẫu phải chọn định D Do đó, việc lấy mẫu không kết thúc sớm hơn, ta phải xác định bước cuối dù lựa chọn định D dựa giá trị X , , X n−1 hay thực thêm quan sát chọn định D Quyết định tối ưu thường dựa giá trị X , , X n−1 quan sát Sau định, với tập giá trị quan sát X , , X n−1 , dù quan trọng để thực quan sát cuối X n , ta bắt đầu làm ngược lại Hiểu biết giá trị X , , X n−2 bước kế cuối, ta định dù quan trọng để 80 thực quan sát X n−1 Với giá trị X n−1 , ta biết trình tối ưu cho điểm đó, ta so sánh rủi ro từ việc thực định mà thêm quan sát với rủi ro X n−1 quan sát Bằng việc lùi lại theo cách đến bước đầu tiên, với giá trị X có thể, ta xác định liên tục tối ưu suốt bước cịn lại Ta đánh giá rủi ro từ quan sát X , sau tiếp tục dạng tối ưu so sánh rủi ro với rủi ro từ lựa chọn tức thời định D mà quan sát Từ so sánh này, ta xác định trình định liên tiếp tối ưu Cấu trúc trình tối ưu cách quy nạp lùi minh họa Bellman gọi nguyên lý tối ưu phát biểu sau: Quá trình định liên tiếp tối ưu phải thỏa yêu cầu: bước trình, giá trị X = x1 , , X j = x j ( j < n) quan sát, liên tục trình phải trình định liên tiếp tối ưu cho tốn có phân phối tiên nghiệm W ξ ( x1 , , x j ) số lần quan sát nhiều n − j 4.5 Quá trình định liên tiếp bị chặn tối ưu Ta trình bày phát triển mặt tốn học dựa kĩ thuật quy nạp lùi Giả sử chi phí cho quan sát giá trị c xác định Nếu φ g.p.d.f W định nghĩa (4.3.3) kì vọng E {ρ0 [φ ( X )]} là: E {ρ [φ ( X )]} = ∫ ρ [φ ( X )] dF j ( x φ ) S (4.5.1) X = x1 , , X n−1 = xn−1 giá trị quan sát ta phải định dù chọn định D mà khơng có quan sát khác hay thực thêm quan sát Xn Nếu ξ n−1 = ξ ( x1 , , xn−1 ) g.p.d.f hậu nghiệm W rủi ro việc chọn định D mà quan sát khác ρ (ξ n−1 ) Nếu giá trị X n = x quan sát định D chọn sau rủi ro ρ [ξ n−1 ( x) ] Do đó, tổng rủi ro kì vọng từ việc quan sát X n sau chọn định 81 D E { ρ0 [ξ n −1 ( X ) ]} + c Ở đây, chi phí c cộng vào tổn thất kì vọng từ định Bayes Vì thế, giá trị X = x1 , , X n−1 = xn−1 quan sát, lựa chọn cuối trình tối ưu là: Nếu ρ0 (ξ n−1 ) < E { ρ [ξ n−1 ( X ) ]} + c (4.5.2) việc lấy mẫu nên kết thúc X n không nên quan sát Nếu ρ0 (ξ n−1 ) > E { ρ0 [ξ n−1 ( X )]} + c nên thực thêm quan sát X n Nếu ρ0 (ξ n−1 ) = E { ρ0 [ξ n−1 ( X )]} + c việc quan sát thêm hay khơng có rủi ro Để thuận tiện, ta kết thúc việc quan sát trường hợp Đặt ρ1 (φ ) : rủi ro trình tối ưu khơng có thêm quan sát thực g.p.d.f W φ ρ1 (φ ) = {ρ (φ ), E {ρ [φ ( X )]} + c} (4.5.3) Đặc biệt, theo thảo luận trước ρ1 (ξ n −1 ) rủi ro trình tối ưu sau giá trị X = x1 , , X n−1 = xn−1 quan sát Quay lại bước trước đó, giả sử giá trị X = x1 , , X n− = xn− quan sát ξ n− = ξ ( x1 , , xn− ) g.p.d.f hậu nghiệm W Rủi ro định D mà không thực thêm quan sát ρ [ξ n− ( x) ] Nói cách khác, X n− quan sát có giá trị x phân phối hậu nghiệm trở thành ξ n− ( x) rủi ro trình tối ưu ρ1 [ξ n− ( x) ] Khi chi phí c thêm vào tổng rủi ro quan sát giá trị dạng tối ưu E { ρ1 [ξ n− ( X )]} + c Vì sau giá trị X = x1 , , X n− = xn− quan sát, trình tối ưu mô tả sau: Nếu ρ (ξ n−2 ) ≤ E { ρ1 [ξ n− ( X )]} + c (4.5.4) việc lấy mẫu nên kết thúc X n−1 không nên quan sát Nếu ρ (ξ n−2 ) > E { ρ1 [ξ n− ( X )]} + c nên thực thêm quan sát X n−1 82 Đặt ρ (φ ) : rủi ro trình tối ưu khơng có thêm quan sát thực g.p.d.f W φ Ta có: ρ (φ ) = {ρ (φ ), E {ρ1 [φ ( X )]} + c} (4.5.5) Theo thảo luận trước ρ (ξ n− ) rủi ro trình tối ưu sau giá trị X = x1 , , X n− = xn− quan sát Một cách tổng quát, với g.p.d.f φ W , ρ (φ ) định nghĩa theo (4.3.3) ρ1 (φ ), ρ (φ ), , ρ n (φ ) xác định cách đệ quy sau: { } ρ j +1 (φ ) = ρ (φ ), E {ρ j [φ ( X )]} + c j = 1, n − (4.5.6) Giả sử, E {ρ j [φ ( X ) ]} tồn ∀j = 1, n − Một kết quan trọng trình bày định lý sau: Định lý 4.5.1: Nếu g.f.d.f tiên nghiệm W ξ ρ n (ξ ) tổng rủi ro trình định liên tiếp tối ưu khơng có nhiều n lần quan sát thực Hơn nữa, với j = 1, n − , sau giá trị X = x1 , , X n− j = xn− j quan sát phân phối hậu nghiệm W ξ n− j , rủi ro trình tối ưu ρ n− j (ξ n− j ) Định lý 4.5.2: Trong toán định liên tiếp có khơng q n lần quan sát thực hiện, trình sau tối ưu: Nếu ρ (ξ ) ≤ ρ n (ξ ) định D chọn mà khơng cần quan sát Ngược lại, X quan sát Hơn nữa, với j = 1, n − , giả sử giá trị X = x1 , , X j = x j quan sát g.p.d.f hậu nghiệm W ξ j Nếu ρ (ξ j ) ≤ ρ n− j (ξ j ) định D chọn mà khơng có thêm quan sát Ngược lại, X j +1 quan sát Nếu q trình lấy mẫu khơng thể kết thúc sớm hơn, sau X n quan sát phải kết thúc 83 Q trình tối ưu mơ tả định lý 4.5.2 tóm tắt sau: Ở bước cho trước trình lấy mẫu, ta khơng phép thực nhiều j lần quan sát g.p.d.f thời W bước φ Thì quan sát nên thực ρ j (φ ) < ρ0 (φ ) 4.6 Bài tốn tìm kiếm Giả sử: Một vật bị tích địa điểm r khu vực tìm kiếm (r ≥ 2) pi : xác suất tiên nghiệm vật tích khu vực i r pi > 0(i = 1, r ), ∑ pi = i =1 Khi tìm kiếm ta tìm kiếm khu vực thời điểm Do đó, ta phải tìm cách thực trình tìm kiếm liên tiếp xác định khu vực chắn r khu vực để tìm kiếm giai đoạn Ta giả sử khu vực vật bị xác tìm kiếm giai đoạn có xác suất vật cần tìm khơng tìm thấy lần tìm kiếm α i : xác suất khơng tìm thấy vật bị thất lạc khu vực i ta tìm kiếm khu vực này( ≤ α i < ) Nếu < α i < ta khơng tìm thấy vật bị thất lạc khu vực vài lần xác suất hậu nghiệm mà vật bị thất lạc thực khu vực nhỏ Nếu α i = ta khơng tìm kiếm nhiều lần khu vực Một q trình tổng quát mô tả sau: Trong giai đoạn tìm kiếm, đặt pi : xác suất tiên nghiệm vật thất lạc khu vực i (i = 1, r ) , Giả sử khu vực j tìm kiếm khơng thấy vật bị thất lạc Khi đó, xác suất hậu nghiệm vật thất lạc khu vực i (i = 1, r ) pi* xác định sau: 84 p jα j ⎧ * ⎪ pj = p jα j + − p j ⎪ ⎨ pi ⎪ p* = i≠ j i ⎪ piα i + − pi ⎩ (4.6.1) ci : chi phí tìm kiếm khu vực i ( ci > (i = 1, r ) ) Dĩ nhiên ta phải tìm trình cho tổng chi phí tìm kiếm thấp L( p1, , pr ) : tổng chi phí kì vọng trình tìm kiếm Giả sử, ta tìm kiếm khu vực j , xác suất tìm thấy vật thất lạc p j (1 − α j ) , trình tìm kiếm kết thúc tìm vật bị thất lạc xác suất khơng tìm thấy vật thất lạc p jα j + − p j Nếu khơng tìm thấy vật thất lạc xác suất hậu nghiệm tính lại theo cơng thức (4.6.1) chi phí thêm vào q trình tìm kiếm tối ưu L( p1* , , pr* ) Khi tổng chi phí tìm kiếm tối ưu là: c j + ( p jα j + − p j ) L( p1* , , pr* ) Vì r khu vực tìm kiếm nên L( p1, , pr ) phải thỏa: L( p1, , pr ) = ⎡⎣c j + ( p jα j + − p j ) L( p1* , , pr* ) ⎤⎦ j =1, ,r (4.6.2) Vì L( p1, , pr ) khơng thể lớn q trình ta tìm kiếm từ khu vực đến khu vực r lặp lặp lại đến vật thất lạc tìm thấy Ta nhận giới hạn cho chi phí trung bình q trình Giả sử vật thất lạc nằm khu vực i kì vọng việc tìm kiếm − αi khu vực i cần thiết để tìm thấy vật thất lạc Do đó, chi phí trung bình để tìm thấy vật khơng thể lớn c1 + + cr tổng chi phí trung bình khơng thể lớn − αi r pi i =1 − α i (c1 + + cr )∑ Vì thế, giá trị cận L( p1, , pr ) Theo [1], phương trình hàm (4.6.2) khó giải (4.6.3) 85 Trong q trình liên tiếp bất kì, với i = 1, r j = 1, 2,… Đặt Π ij = piα i j −1 (1 − α i ) (4.6.4) Trong giai đoạn n(n = 1,2, ) , trình tìm kiếm xác định khu vực r khu vực tìm kiếm chưa tìm vật bị thất lạc Với trình δ cho trước bất kỳ, đặt: γ n : chi phí cho việc tìm kiếm giai đoạn thứ n λn : xác suất tìm thấy vật bị thất lạc giai đoạn thứ n Ví dụ là, δ xác định khu vực i tìm kiếm lần thứ j giai đoạn thứ n γ n = ci λn = Π ij N : số lần tìm kiếm cần thiết để tìm thấy vật thất lạc p(δ ) : tổng chi phí trung bình cho việc tìm kiếm ∞ ⎛ n ⎞ p(δ ) = ∑ ⎜ ∑ γ m ⎟ λn n=1 ⎝ m=1 ⎠ ∞ ∞ ⎛ ⎞ = ∑ ⎜ ∑ λn ⎟γ m m=1 ⎝ n=m ⎠ (4.6.5) ∞ = ∑ γ m Pr( N ≥ m) m=1 = γ + γ (1 − λ1 ) + γ (1 − λ1 − λ2 ) + Theo kết (4.6.5) p(δ ) vơ hạn Ta trình tối ưu xác định việc tìm kiếm thực để quan hệ sau thỏa mãn: λ1 λ2 λ ≥ ≥ ≥ n ≥ γ1 γ γn Nói cách khác, ∀i, ∀j tỉ số (4.6.6) Π ij xếp theo thứ tự giảm dần thứ ci tự dãy mà việc tìm kiếm nên làm theo Cụ thể là, tỉ số Π ij giá trị lớn ci thứ n thứ tự lần tìm kiếm thứ j khu vực i nên thực giai đoạn thứ n 86 Trước tiến tới việc rút gọn tính tối ưu cho trình này, ta kiểm tra lại thực tế sau: Quá trình khả thi theo cảm giác khơng xác định rõ Ví dụ: ta thực việc tìm kiếm lần thứ tư khu vực trước xác định việc tìm kiếm lần thứ ba khu vực Theo (4.6.4) trình khả thi vì, với khu vực i , xác suất Π ij giảm j tăng lên ci cố định Thật vậy, thực tế bảo đảm ta ln xếp giá trị Π ij thành dãy ci không tăng Giả sử, δ trình, ∃n : λn λn+1 < γ n γ n+1 (4.6.7) Giả sử δ xác định khu vực i tìm kiếm giai đoạn thứ n khu vực k tìm kiếm giai đoạn thứ n + Theo (4.6.7) ta có i ≠ k δ * trình xác định khu vực k tìm kiếm giai đoạn thứ n, khu vực i tìm kiếm giai đoạn thứ n + giống δ giai đoạn khác Đặt γ m* , λm* chi phí xác suất tìm thấy vật thất lạc trình δ * cho việc tìm kiếm giai đoạn thứ m Ta có: γ n* = γ n+1, λn* = λn+1; γ n*+1 = γ n , λn*+1 = λn ; γ m* = γ m , λm* = λm ∀ m ≠ n, m ≠ n + (4.6.8) Theo (4.6.5), (4.6.7) (4.6.8) ta có: p(δ ) − p(δ * ) = γ n (1 − λ1 − − λn−1 ) + γ n+1 (1 − λ1 − − λn−1 − λn ) − γ n+1 (1 − λ1 − − λn−1 ) − γ n (1 − λ1 − − λn−1 − λn+1 ) = γ nλn+1 − γ n+1λn > Do đó, tổng chi phí trung bình q trình δ * thấp trình δ (4.6.9) 87 Chúng ta vừa rằng, q trình tìm kiếm khơng thỏa (4.6.6) tổng chi phí trung bình giảm Vì thế, q trình khơng phải tối ưu Bây giờ, ta kết luận việc tìm kiếm thực phù hợp với (4.6.6) phải tối ưu Nếu giai đoạn bất kì, hai hay nhiều tỉ số Π ij ta có ci thể xếp chúng cách tùy tiện Phương pháp mà ta vừa sử dụng để có q trình tối ưu khác so với phương pháp mà ta sử dụng phần đầu chương Điểm biến động không xem xét đến khơng có cập nhật phân phối hậu nghiệm trình xem xảy lúc liên tiếp Tuy nhiên, theo (4.6.1) (4.6.4), q trình tối ưu nhận có biểu diễn điểm biến động cách đơn giản đầy thuyết phục Ở giai đoạn cho trước trình: Đặt pi* (i = 1, r ) : xác suất hậu nghiệm thời mà vật thất lạc khu vực i Thì bước tìm kiếm nên thực khu vực mà giá trị pi* (1 − α i ) cực ci đại Vì pi* (1 − α i ) xác suất tìm thấy vật thất lạc khu vực i trình riêng lẻ, trình tối ưu giai đoạn đơn giản cho việc tìm kiếm khu vực có xác suất cao 4.7 Bài tốn tìm kiếm với chi phí Trong phần này, ta tiếp tục giả sử chi phí tìm kiếm khu vực ( ci = c j ∀j = 1, r; i = 1, r ) Hơn nữa, ta xét tốn tìm kiếm có khả vật thất lạc khơng nằm khu vực tìm kiếm Do đó, pi xác suất vật thất lạc khu vực i(i = 1, r ) pi > 0(i = 1, r ) r pi ≤ Nếu có xác suất ∑ i =1 dương vật thất lạc khơng nằm r khu vực tìm kiếm r pi < Tuy nhiên, ta ∑ i =1 88 chấp nhận tính xác suất hậu nghiệm p1* , , pr* theo (4.6.1) xác suất tìm thấy vật thất lạc lần tìm kiếm thứ j khu vực i : Π ij theo (4.6.4) Ta tìm trình tìm kiếm tối ưu xác suất tìm thấy vật thất lạc phạm vi số lần tìm kiếm n xác định cực đại Vì Π ij xác suất tìm thấy vật thất lạc lần tìm kiếm thứ j khu vực i nên trình tối ưu đơn giản thực n lần tìm kiếm cho tương ứng với n giá trị lớn Π ij Vì trình tìm kiếm tiến hành giai đoạn lần, ta trở lại biểu diễn điểm biến động trình bày cuối phần trước Ở đây, trình đặc biệt đơn giản thảo luận sau tính tối ưu thật mạnh Ở giai đoạn cho trước trình, với p1* , , pr* xác suất vật thất lạc r khu vực thời Thì giai đoạn tìm kiếm tiến hành khu vực mà giá trị pi* (1 − α i ) lớn Vì giá trị xác suất tìm thấy vật thất lạc giai đoạn tìm kiếm việc tìm kiếm thực khu vực i nên trình tối ưu trình sau: Ở giai đoạn, ta nên tìm kiếm khu vực có xác suất tìm thấy vật thất lạc cao Nếu vật thất lạc thật nằm r khu vực tìm kiếm ta tìm kiếm đến tìm thấy nó, trình bày phần ta thấy q trình cực tiểu hóa số lần tìm kiếm kì vọng Tiếp theo, ta giả sử vật thất lạc khơng nằm r khu vực tìm kiếm Ta xét tốn ta cho phép ngưng trình tìm kiếm giai đoạn trước tìm thấy vật thất lạc ta phải trả chi phí cộng thêm Ta giả sử: chi phí cho lần tìm kiếm ci (i = 1, r ) đơn vị chi phí cộng thêm ngưng q trình mà chưa tìm thấy vật thất lạc c Quá trình tối ưu q trình có tổng chi phí kì vọng nhỏ Trong tốn này, khơng ta phải tìm trình tìm kiếm để xác định khu vực cần tìm giai đoạn mà phải xác định luật dừng (tức xác định trình tìm kiếm nên ngưng lại chưa tìm vật thất lạc) Do đó, ta giả sử q trình tìm kiếm δ 89 dãy hữu hạn Ta rằng: ta tiếp tục việc tìm kiếm, ta nên tuân theo trình tối ưu trình bày phần Giả sử rằng, ta định sử dụng trình tìm kiếm δ cho trước ngưng tìm kiếm vật thất lạc khơng tìm thấy sau n giai đoạn Đặt N số lần tìm kiếm yêu cầu để tìm vật thất lạc q trình δ khơng dừng, vật thất lạc khơng tìm thấy N = ∞ Khi đó, tổng chi phí rủi ro kì vọng ρ (δ , n) tính sau: n ρ (δ , n) = ∑ m Pr( N = m) + (n + c) Pr( N > n) m=1 n = ∑ Pr( N ≥ m) + c Pr( N > n) (4.7.1) m=1 Với giá trị xác định n, q trình tối ưu mơ tả phần đầu phần cực tiểu hóa đồng thời xác suất Pr( N ≥ m) ( m = 1, n ) Pr( N > n) Theo (4.7.1), không quan tâm đến luật dừng, ta nên tuân theo trình tối ưu ta tiếp tục việc tìm kiếm Do đó, giai đoạn, việc tìm kiếm nên thực khu vực có xác suất tìm thấy vật thất lạc giai đoạn cao 90 KẾT LUẬN Tính đề tài: Thống kê Bayes lý thuyết tìm kiếm hai lý thuyết tương đối có nhiều phát triển có nhiều ứng dụng rộng rãi giới Tuy nhiên, Việt Nam chưa có nhiều nhà toán học nghiên cứu ứng dụng vào thực tiễn Vì việc nghiên cứu ứng dụng lý thuyết vào thực tiễn phát triển khoa học, kinh tế, kỹ thuật vấn đề xã hội cần thiết Hạn chế đề tài: Do phạm vi nghiên cứu thời gian thực có giới hạn nên đề tài chưa thể nêu lên phân tích hết nội dung liên quan đến vấn đề nghiên cứu Do thời gian hạn chế hạn chế số liệu nên chưa thể thực mơ hình tìm kiếm cụ thể Vẫn cịn số lỗi ngơn từ chưa chuẩn hóa theo ngơn ngữ tiếng Việt Hướng hồn thiện: Với kết đạt hạn chế trên, hướng hoàn thiện đề tài thể nội dung sau: − Bổ sung số vấn đề liên quan thống kê Bayes để có ứng dụng rộng − Xây dựng mô hình tìm kiếm cụ thể dựa mơ hình lý thuyết xây dựng 91 Tài liệu tham khảo [1] De Groot, Morris H., Optimal Statistical Decisions,Wiley Classic Library, 2004 [2] Heny R.Richardson Search Theory, Center for Naval Analyses (1986) [3] Herman Chernoff & Lincoln E Moses, Elementary Decision Theory, Dover Publication, 1959 [4] Iida, Koji Studies on the Optimal Search Plan, Vol 70, Lecture Notes in Statistics, Springer_Verlag, (1992) [5] James O.Berger, Statistical Decision Theory And Bayesian Analysis, Springer_Verlag, 1985 [6] J.M.Bernardo, Bayesian Statistic [7] Koopman, B.O Search and Screening, Operation Research Evaluation Group Report, Center for Naval Analyses, Alexandria Virginia, 1946 [8] Stone, L.D (1989) Theory of Optimal Search (2nd) Lithicum: Informs 92 CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc Lập - Tự - Hạnh phúc U LÝ LỊCH TRÍCH NGANG I LÝ LỊCH SƠ LƯỢC Họ tên : NGUYỄN MAI HƯNG Nam, nữ: Nam Ngày tháng năm sinh : 15/01/1983 Tại: ĐẮC LẮK Mã số học viên : 02407159 Khoa : Khoa học ứng dụng Ngành học : Toán ứng dụng Địa chỉ: 2/5 Thống Nhất, Phường 16, Quận Gò Vấp, Tp HCM II QÚA TRÌNH ĐÀO TẠO ĐẠI HỌC: Chế độ học : Chính quy Thời gian học: Từ 09/2001 đến 08/2006 Nơi học : Trường Đại Học Sư Phạm TP Hồ Chí Minh Ngành học : Sư Phạm Tốn TRÊN ĐẠI HỌC: Đang học cao học ngành toán ứng dụng trường Đại Học Bách Khoa TP HCM khóa 2007 III Q TRÌNH CƠNG TÁC Từ 2007 đến 2008 dạy toán trường THPT Nguyễn An Ninh Quận TP Hồ Chí Minh Ngày 01 tháng 03 năm 2010 Người Khai NGUYỄN MAI HƯNG ... dụng MSHV: 02407159 I- TÊN ĐỀ TÀI CƠ SỞ THỐNG KÊ BAYES TRONG LÝ THUYẾT TÌM KIẾM II - NHIỆM VỤ VÀ NỘI DUNG Đọc tài liệu xác suất, thống kê Bayes, lý thuyết tìm kiếm kiến thức liên quan Chương 1:... nghiên cứu Thống kê Bayes phương pháp thống kê phát triển có nhiều ứng dụng thực tiễn Luận văn đưa sở lý thuyết thống kê Bayes nhằm ứng dụng vào lý thuyết tìm kiếm Đối với tốn tìm kiếm chưa biết... ĐẶC TRƯNG CƠNG VIỆC TÌM KIẾM 10 0.1 Biến ngẫu nhiên phân phối 10 0.2 Định lý Bayes 11 0.3 Sơ lược lý thuyết tìm kiếm Bayes 11 CHƯƠNG 1: XÁC SUẤT CHỦ QUAN 13 1.1 Mở đầu 13 1.2 Sự hợp lý tương đối

Định dạng
Số trang	92
Dung lượng	802,14 KB