Cơ sở toán học của giải thuật di truyền

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KHOA HỌC VŨ THỊ THU HÀ CƠ SỞ TOÁN HỌC CỦA GIẢI THUẬT DI TRUYỀN LUẬN VĂN THẠC SỸ TOÁN HỌC THÁI NGUYÊN - NĂM 2010 Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KHOA HỌC VŨ THỊ THU HÀ CƠ SỞ TOÁN HỌC CỦA GIẢI THUẬT DI TRUYỀN Chuyên ngành: TOÁN ỨNG DỤNG Mã số: 60.46.36 LUẬN VĂN THẠC SĨ TOÁN HỌC Người hướng dẫn khoa học: TS VŨ MẠNH XUÂN THÁI NGUYÊN - NĂM 2010 Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn i Mục lục Mở đầu 1 Tổng quan giải thuật di truyền 1.1 Khái quát chung 1.2 Các vấn đề giải thuật di truyền 1.2.1 Mã hố - mơ tả di truyền cho lời giải toán 1.2.2 Tạo lập lời giải ban đầu (khởi tạo quần thể) 1.2.3 Xây dựng hàm phù hợp 1.2.4 Các toán tử di truyền 1.3 Giải thuật di truyền kinh điển 1.3.1 Mã hoá - Biểu diễn biến véc tơ nhị phân 1.3.2 Toán tử chọn lọc 1.3.3 Toán tử lai ghép 1.3.4 Toán tử đột biến 1.3.5 Hàm phù hợp 1.3.6 Giải thuật di truyền cổ điển 1.4 Giải thuật di truyền mã hóa số thực (RCGA) 1.4.1 Giới thiệu RCGA 1.4.2 Các toán tử RCGA 1.4.3 Một số mơ hình tiến hóa 3 8 9 11 11 12 14 16 16 18 20 20 20 23 Cơ sở toán học giải thuật di truyền 2.1 Định lý sơ đồ Holland 2.1.1 Một số khái niệm 26 27 27 Số hóa Trung tâm Học liệu - Đại học Thái Ngun http://www.lrc-tnu.edu.vn ii 2.2 Mơ hình Markov giải thuật di truyền 2.2.1 Tính Markov 2.2.2 Một số kết 2.2.3 Xích Markov GA 2.3 Một số vấn đề khác 2.3.1 Dạng biểu diễn ma trận toán tử lai ghép RCGA 2.3.2 Điều kiện thành công toán tử lai ghép 2.3.3 Toán tử lai ghép SBX Kết luận Tài liệu tham khảo Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 31 32 35 36 40 40 44 45 48 49 Mở đầu Ngày phát triển mạnh vũ bão máy tính điện tử làm thay đổi sâu sắc đến nhiều lĩnh vực sống, với tốc độ tính tốn nhanh xác, nhiều tốn tính tốn phức tạp trước giải trọn vẹn Hơn nữa, nhiều kỹ thuật tính tốn dựa mơ hoạt động tự nhiên hay bắt chước suy nghĩ người phát triển tạo nhiều công cụ tính tốn có hiệu cao Giải thuật di truyền (GA – Genetic Algorithm) công cụ hệ thống tính tốn mềm hay cịn gọi trí tuệ tính tốn GA đề xuất từ khoảng năm 70 kỷ trước dựa mơ q trình tiến hố tự nhiên GA chủ yếu giải vấn đề tìm nghiệm lớp tốn tối ưu có độ phức tạp tính tốn lớn GA tìm kiếm lời giải toán dựa quần thể hiểu tập lời giải tiến hố quần thể dựa toán tử di truyền chọn lọc, lai ghép, đột biến Sau giới thiệu, GA nhà toán học tin học nghiên cứu phát triển nhanh, nhiều dạng biến thể vấn đề cải tiến toán tử đề xuất kết thử nghiệm cho thấy tính hiệu rõ rệt giải thuật Tuy vậy, GA giải thuật xác suất, hầu hết đưa lời giải chấp nhận thời gian ngắn mà chưa đạt lời giải tối ưu Kết q trình tiến hố để chọn lời giải tốt phụ thuộc vào nhiều yếu tố ngẫu nhiên: quần thể khởi tạo ngẫu nhiên, chọn cá thể để tiến hoá ngẫu nhiên, việc sinh cá thể ngẫu nhiên, Vì việc nghiên cứu sở tốn học giải thuật để đảm Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn bảo chắn đạt lời giải tối ưu toàn cục tốn việc làm khó khăn điều hợp với quy luật tự nhiên thử nghiệm cho kết tốt Cho tới người ta đạt số kết sơ hội tụ giải thuật chủ yếu dựa định lý sơ đồ Hollan dựa mơ hình Markov Đề tài nhằm tập trung nghiên cứu sở toán học GA, tìm hiểu trình bày cách có hệ thống số kết nghiên cứu mơ hình tốn học GA đánh giá hội tụ giải thuật Do điều kiện nghiên cứu khả lập trình cịn hạn chế nên chưa đặt việc thử nghiệm toán cụ thể Đề tài gồm nội dung sau: Chương trình bày vấn đề tổng quan giải thuật di truyền, nguyên lý chung, giải thuật di truyền kinh điển dựa mã hoá nhị phân giải thuật di truyền mã hố số thực Mơ tả tường minh giải thuật số dạng toán tử di truyền tiêu biểu Chương trình bày vấn đề nghiên cứu sở toán giải thuật bao gồm định lý sơ đồ Hollan, mơ hình Markov giải thuật số phân tích tốn học toán tử Như nêu trên, GA thuật tốn xác suất khơng tiền định nên việc phân tích mơ hình tốn học khó khăn Luận văn đặt mục tiêu tìm hiểu trình bày lại cách hệ thống nội dung nêu Dù cố gắng song nhiều hạn chế thời gian, kiến thức, nên luận văn khơng tránh khỏi thiếu sót Em mong góp ý thầy bạn học viên để hoàn thiện thác triển tiếp đề tài Trong suốt trình làm đề tài em nhận giúp đỡ nhiều thầy cô giáo Đại học Thái Nguyên bạn học viên lớp CHTK2, đặc biệt hướng dẫn tận tình thầy giáo TS.Vũ Mạnh Xuân Em xin chân thành cảm ơn Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Chương Tổng quan giải thuật di truyền 1.1 Khái quát chung Giải thuật di truyền (Gennetic algorithims - GA) kỹ thuật chung giúp giải vấn đề - toán cách mơ tiến hố người hay sinh vật nói chung điều kiện quy định sẵn môi trường Giải thuật di truyền thuật tốn tiến hố nói chung hình thành dựa quan niệm cho rằng, q trình tiến hố tự nhiên q trình hồn hảo nhất, hợp lý tự mang tính tối ưu Quan niệm xem tiên đề khơng chứng minh phù hợp với thực tế khách quan Q trình tiến hố thể tính tối ưu chỗ, hệ sau tốt (phát triển hơn, hoàn thiện hơn) hệ trước Tiến hố tự nhiên trì nhờ q trình bản: sinh sản chọn lọc tự nhiên Xuyên suốt q trình tiến hố tự nhiên hệ sinh để bổ sung, thay thế hệ cũ Cá thể khơng thích ứng với môi trường bị đào thải Sự thay đổi mơi trường động lực thúc đẩy q trình tiến hoá Ngược lại, tiến hoá tác động trở lại góp phần làm thay đổi mơi trường Các cá thể sinh q trình tiến hố nhờ lai ghép hệ cha mẹ Một cá thể mang tính trạng cha mẹ (di Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn truyền), mang tính trạng hồn tồn khác (đột biến) Di truyền đột biến chế có vai trị quan trọng q trình tiến hố Dù đột biến xảy xác suất nhỏ nhiều so với tượng di truyền Giải thuật di truyền sử dụng thuật ngữ vay mượn di truyền học Ta nói cá thể (hay kiểu gen, cấu trúc) quần thể, cá thể gọi chuỗi hay Nhiễm sắc thể (NST) Trong GA, ta nói cá thể có NST; NST tạo thành từ đơn vị - gen - biểu diễn chuỗi tuyến tính, gen kiểm soát (số) đặc trưng Gen với đặc trưng định có vị trí định NST Bất đặc trưng cá thể tự biểu cách phân biệt, gen nhận số giá trị khác (các giá trị tính năng) Một vấn đề - tốn đặt mã hoá thành chuỗi bit với chiều dài cố định Nói cách xác thơng số tốn chuyển đổi biểu lại dạng chuỗi bit Các thơng số biến hàm hệ số biểu thức toán học Người ta gọi chuỗi bit mã genome (gen) ứng với cá thể, gen có chiều dài Nói ngắn gọn, lời giải biểu diễn chuỗi bit giống cá thể quy định gen cá thể Đối với thuật giải di truyền cá thể có gen gen phục vụ cho cá thể Mỗi kiểu (nhóm) gen (ta gọi 1NST) biểu diễn lời giải toán giải (ý nghĩa NST cụ thể người sử dụng xác định trước), tiến trình tiến hoá thực quần thể NST tương ứng với trình tìm kiếm lời giải khơng gian lời giải Tìm kiếm cần cân đối hai mục tiêu (có vẻ mâu thuẫn nhau) Khai thác lời giải tốt khảo sát không gian tìm kiếm GA phương pháp tìm kiếm (độc lập miền) tạo cân đối đáng kể việc khai thác khảo sát khơng gian tìm kiếm Thực ra, GA thuộc lớp giải thuật xác suất, lại khác Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn giải thuật ngẫu nhiên chúng kết hợp phần tử tìm kiếm trực tiếp ngẫu nhiên Khác biệt quan trọng tìm kiếm GA phương pháp tìm kiếm khác GA trì xử lý tập lời giải (ta gọi quần thể) - tất phương pháp khác phần lớn xử lý điểm khơng gian tìm kiếm Chính vậy, GA mạnh phương pháp tìm kiếm có nhiều GA thực tiến trình tìm kiếm lời giải tối ưu theo nhiều hướng cách trì quần thể lời giải thúc đẩy thành hình trao đổi thơng tin hướng Quần thể trải qua tiến trình tiến hoá, hệ lại tái sinh lời giải tương đối "tốt"; lời giải tương đối "xấu" chết Để phân biệt lời giải khác nhau; hàm mục tiêu dùng để đóng vai trị mơi trường Các thuật tốn, có điểm khác biệt, mơ q trình bản: lai ghép, đột biến, sinh sản chọn lọc tự nhiên * Quá trình lai ghép (Crossover): Phép lai trình hình thành nhiễm sắc thể sở nhiễm sắc thể cha - mẹ, cách ghép hay nhiều đoạn gen, hai (hay nhiều) nhiễm sắc thể cha - mẹ với Phép lai xảy xác suất Pc mơ sau: • Chọn ngẫu nhiên hai (hay nhiều) cá thể quần thể Giả sử nhiễm sắc thể cha - mẹ có m gen • Tạo số ngẫu nhiên khoảng từ đến m − (ta gọi điểm lai) Điểm lai chứa chuỗi cha - mẹ dài m thành hai nhóm chuỗi dài m1 m2 Hai chuỗi nhiễm sắc thể m11 + m22 m21 + m12 • Đưa hai cá thể vào quần thể để tham gia trình tiến hố * Q trình đột biến (Mutation) Đột biến tượng cá thể mang (số) tính trạng khơng có mã di truyền cha - mẹ Phép đột biến xảy với xác suất Pm , nhỏ nhiều so với xác suất lai Pc Phép đột biến mơ sau: Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn • Chọn ngẫu nhiên cá thể cha - mẹ quần thể • Tạo số ngẫu nhiên k khoảng từ đến m, ≤ k ≤ m • Thay đổi gen thứ k trả cá thể quần thể để tham gia trình tiến hố * Q trình sinh sản chọn lọc (Selection) Phép tái sinh q trình đó, cá thể chép sở độ thích nghi Độ thích nghi hàm gán giá trị thực cho cá thể quần thể Q trình mơ sau: • Tính độ thích nghi cá thể quần thể hành, lập bảng cộng dồn giá trị thích nghi (theo số thứ tự gán cho cá thể) Giả sử quần thể có n cá thể Gọi độ thích nghi cá thể thứ i Fi, tổng dồn thứ i Fti , tổng độ thích nghi tồn quần thể Fm • Tạo số ngẫu nhiên F đoạn từ đến Fm • Chọn cá thể thứ k thoả mãn F ≥ Ftk đưa vào quần thể hệ Phép chọn trình loại bỏ cá thể xấu quần thể để giữ lại quần thể cá thể tốt Phép chọn mơ sau: • Sắp xếp quần thể theo thứ tự độ thích nghi giảm dần • Loại bỏ cá thể cuối dãy để giữ lại n cá thể tốt (Ta giả sử quần thể có kích thước cố định n) Một giải thuật di truyền, giải toán cho phải có thành phần sau: + Một cấu trúc liệu I biểu diễn không gian lời giải toán + Phương pháp khởi tạo quần thể ban đầu P (0) + Hàm định nghĩa độ thích nghi eval (.) đóng vai trị mơi trường + Các phép tốn di truyền mơ + Và tham số giải thuật di tryền sử dụng (kích thước quần thể, xác suất lai, đột biến, ) * Cấu trúc giải thuật di truyền tổng quát Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 35 a − gene A − gene tương ứng 2N (1 + s)j (2N − j) 2N 2N + sj 2N + sj Tỷ số cỡ lồi trung bình a − gene A − gene hệ thứ (n + 1) là: j 1+s 1+s × = 2N − j số a-gene hệ thứ n số A-gene hệ thứ n Điều giải thích ý nghĩa chọn lọc 2.2.2 Một số kết - Phân phối hệ thời điểm n cho công thức (n) pj = P (Xn = j); n = 0, 1, 2, ; j ∈ E (n) Đặt Π(n) = {pj }; j ∈ E) gọi Π = Π(0) phân phối ban đầu hệ - Phân phối ban đầu gọi dừng Π(n) không phụ thuộc vào n nghĩa Π = Π(n) - Một mơ hình xích Markov rời rạc ba (Xn, Π, P ) Xn dãy đại lượng ngẫu nhiên rời rạc; Π phân phối ban đầu; P ma trận xác suất chuyển - Định nghĩa phân phối dừng: Giả sử P = (pij ) ma trận chuyển xích Markov (Xn) có khơng gian trạng thái hữu hạn E = {1, 2, , N }, nghiệm không âm (π1 , , πN ) phương trình: xJ = xk pkj , j ∈ E k∈E cho πj = gọi phân phối dừng (hay bất biến) xích Markov với ma trận xác suất chuyển P = (pij ) Ý nghĩa: Nếu ta lấy (π1 , , πN ) phân phối ban đầu xích Markov, (1) tức πj = P (X0 = j); j = 1, 2, , N Khi đó: πj = P (X1 = j) = πk pkj = πj k Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 36 (n) Tổng quát ta có: πj P (Xn = j) = πj , tức là: X0 , X1, , Xn, có phân phối xác suất nhau, ta chứng minh phân phối đồng thời biến ngẫu nhiên Xk , Xk+1, , Xk+m không phụ thuộc vào k m Q trình có tính chất gọi q trình dừng Viết dạng ma trận phân phối dừng véctơ cột bất biến ma trận chuyển vị P , nghĩa là:      π1 π1 p11 p21 · · · pN       p12 p22 · · · pN   π2   π2        · · · · · · · · · · · ·  · · ·  =  · · ·       πN πN p1N p2N · · · pN N 2.2.3 Xích Markov GA Xét tốn: Cho hàm f : J → R+ JL tập rời rạc hóa J Cần tìm phần tử i ∈ JL cho f (i) = max{f (j)|j ∈ JL } Gọi r số cá thể hợp lệ r = |JL | = αL , α số phần tử bảng ký hiệu sử dụng rời rạc hóa Chẳng hạn với mã hóa nhị phân α = Gọi tập tất quần thể hợp lệ S giả thiết ta xét quần thể với kích cỡ cố định M (M = |k| với k ∈ S) Khi số quần thể hợp lệ là: r−1 N = |S| = CM +r−1 (số tổ hợp chập r − M + r − 1) Ta xét giải thuật di truyền đơn giản với toán tử sau: - Toán tử chọn lọc tỷ lệ, chọn cá thể i quần thể k với xác suất: pik = f (i)∗Z(i, k) r ∗ h=0 f (h) Z(h, k) Z(i, k) biến cố xảy cá thể i thuộc vào quần thể k - Toán tử lai ghép điểm - Toán tử đột biến phép đảo bit vị trí đột biến Với giải thuật này, GA mơ hình hóa xích Markov Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 37 thời gian rời rạc, quần thể xem trạng thái xích Rõ ràng trạng thái phụ thuộc vào trạng thái trước nó, ký hiệu Xn quần thể lần tạo sinh thứ n với n = 1, 2, ta có: P (Xn = k|X0 = k0 , X1 = k1 , , Xn−1 = kn−1) = P (Xn = k|Xn−1 = kn−1) nghĩa Xn thỏa tính chất xích Markov Ký hiệu ma trận chuyển xích Markov Q Rudolph giải thuật di truyền đơn giản không hội tụ đến tối ưu toàn cục Sự hội tụ giải thuật di truyền định nghĩa theo Rudolph sau: Định nghĩa 2.1 Giả sử Bt = max{f (i)|Z(i, Xi) = 0, i = 0, 1, , r − 1} chuỗi biến ngẫu nhiên độ thích nghi cao quần thể biểu diễn trạng thái Xt bước thứ t Giải thuật di truyền hội tụ đến tối ưu toàn cục lim P (Bt = f ∗) = 1, t→∞ f = max{f (j)|j ∈ JL} lời giải tối ưu toán nêu Do toán tử GA độc lập với nên biểu diễn ma trận chuyển Q = SCM S, C, M theo thứ tự ma trận chuyển phép chọn lọc, lai ghép đột biến ∗ Định nghĩa 2.2 Khoảng cách Hamming hai chuỗi bit số vị trí bit khơng trùng hai chuỗi (chẳng hạn H(‘0100 , ‘0001 ) = 2) Đặt Hij tổng khoảng cách Hamming cá thể quần thể i j: M −1 Hij = H(ih , jh ) h=0 ih cá thể quần thể i, jh cá thể quần thể j với h = 0, , M − 1; i, j = 1, , N H(ih , jh) khoảng cách Hamming ih jh Định nghĩa 2.3 Ma trận A gọi nguyên sơ tồn số tự nhiên k cho ma trận Ak ma trận dương (ma trận mà phần tử số dương) Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 38 Bổ đề 2.1 Ma trận chuyển giải thuật di truyền đơn giản với xác suất đột biến pm ∈ (0, 1), sử dụng lai ghép chọn lọc tỷ lệ ma trận nguyên sơ Từ ký hiệu kết Rudolph chứng minh kết sau: giả sử hàm thích nghi khơng ấn định giá trị thích nghi cho cá thể, giải thuật di truyền đơn giản với giả thiết bổ đề không hội tụ đến lời giải tối ưu Tuy nhiên để tăng hiệu lực GA, De Jong đề xuất chiến lược ưu tú, Suzuki chứng minh hội tụ đến lời giải toàn cục GA với chiến lược ưu tú sửa đổi Cụ thể sau: Giả sử số cá thể M quần thể số lẻ, i∗ cá thể có giá trị thích nghi cao quần thể Chiến lược ưu tú sửa đổi là: quần thể chứa i∗ Với chiến lược này, tốn tử tạo sinh phần tử i∗ ln thực bước trình Sau M − cá thể cịn lại sinh theo tốn tử di truyền thơng thường Dưới ta giả thiết tốn có lời giải tối ưu toàn cục Với quần thể k(k = 1, 2, , N ), ký hiệu i∗ (k) cá thể có độ thích nghi cao quần thể Đặt N (i) số quần thể mà quần thể đó, i cá thể có độ thích nghi cao (i = 0, 1, , r − 1) Ta gán nhãn cho cá thể i = 0, 1, , r − theo thứ tự f (i) giảm dần sử dụng quy tắc luân phiên tiền định cá thể có độ thích nghi Ta gán nhãn cho quần thể k = 1, 2, , N theo thứ tự giảm dần i∗ (k) theo quy tắc luân phiên tiền định cho quần thể có i∗ (k) Giả sử trạng thái tập K = {1, 2, , N (0)} trạng thái tối ưu toàn cục Với ký hiệu trên, điều kiện hội tụ GA phát biểu là: Giải thuật di truyền hội tụ tới tối ưu toàn cục lim Xt ∈ t→∞ K Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 39 Ma trận chuyển Q+  Q0  0    chiến lược ưu tú sửa đổi sau:  0  Q1 0    ···  0 Qr−1 Q+ gồm r ma trận Q0, Q1, , Qr−1, ma trận có phần đường chéo Kích cỡ Qi N (i) × N (i) Có thể thấy N (i) tính số tổ hợp chập (r − i − 1) (r − i + M − 2) Dựa ký hiệu trên, Suzuki đưa cơng thức tính xác suất chuyển từ trạng thái k đến trạng thái v là:  r−1  (M − 1)! r(j, k)Y (j,v) i∗(k) ≤ i∗(v) j=0 Y (j, v)! qkv =  0 i∗(k) > i∗(v) Y (j, k) =  Z(j, k) Z(j, k) − j = i∗(k) j = i∗(k) ỏ Z(j, k) xác suất để cá thể j thuộc vào quần thể k; r(j, k) xác suất để cá thể j tạo lập toán tử di truyền từ quần thể k Nếu pm > r(j, k) > Bởi qkv > với k, v ∈ K i∗ (k) = i∗ (v) Điều có nghĩa Q0 ma trận dương nguyên sơ Tuy nhiên cấu trúc ma trận suy nhờ trực giác nghiên cứu toán tử di truyền Tốn tử chọn lọc khơng thể tạo cá thể làm tăng i∗ (k) Toán tử lai ghép đột biến tạo cá thể có xác suất dương chuyển đến quần thể có cá thể cao i∗ (k) Định lí 2.3 Giải thuật di truyền với chiến lược ưu tú sửa đổi pm ∈ (0, 1) hội tụ đến tối ưu toàn cục Chứng minh Từ phân tích trên, ta có Q+ khơng phân ly Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 40 Q0 ma trận nguyên sơ Theo lý thuyết xích Markov, ta có Q+ ∞ + k = lim (Q ) = k→∞ lim Qk0 k→∞ ∞ R R∞ ma trận ngẫu nhiên chứa xác suất chuyển từ trạng thái khơng tối ưu tồn cục đến trạng thái tối ưu toàn cục Điều cho thấy xác suất sống sót trạng thái khơng tối ưu tồn cục có khuynh hướng giảm dần đến cịn xác suất sống sót trạng thái tối ưu tồn cục hội tụ Như vậy, định lý cho thấy giải thuật di truyền có khả hội tụ tối ưu tồn cục sau q trình tiến hố Việc mơ hình GA qua xích Markov có ý nghĩa quan trọng Nó vừa chứng tỏ hội tụ giải thuật cách xác, vừa mơ hình tốn học để tính tốn chi tiết yếu tố ảnh hưởng đến khả tốc độ hội tụ giải thuật Tuy nhiên, thực thuật tốn qua xích Markov gặp khó khăn lớn không gian trạng thái cần xét đến lớn Vì mơ hình thường phát triển phương diện lý luận 2.3 2.3.1 Một số vấn đề khác Dạng biểu diễn ma trận tốn tử lai ghép RCGA Để phân tích tác động toán tử lai ghép, ta biểu diễn dạng khác toán tử lai ghép kinh điển phép toán đại số, cụ thể sau: Mỗi cá thể mã hóa véc tơ thực n chiều; giả sử cặp cá thể cha mẹ chọn để lai ghép X = (x1, x2, , xn) Y = (y1, y2, , yn); hai cá thể tạo sau lai ghép X = (x1, x2, , xn) Y = (y1, y2, , yn) Khi quan hệ (X , Y ) (X, Y ) biểu Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 41 diễn phép nhân ma trận sau: a) Lai ghép điểm Toán tử lai ghép điểm với điểm lai ghép k biểu diễn phép nhân ma trận: (X , Y ) = (X, Y ) × M (X, Y ) véctơ thuộc R2n ; M ma trận vuông cấp 2n: A I −A I −A A  1 i = 1, , k A ma trận chéo cấp n với aii = 0 i = k + 1, , n b) Lai ghép đa điểm Tốn tử lai ghép đa điểm có dạng biểu diễn ma trận : M= (X , Y ) = (X, Y ) × M (X, Y ) véctơ thuộc R2n; M ma trận vuông cấp 2n: M= A I −A I −A A A ma trận chéo cấp n với aii = đoạn [j2t , j2t+1], t = 0, , [k/2] aii = khác (k số điểm lai ghép) c) Lai ghép mặt nạ Toán tử biểu diễn qua phép nhân ma trận: (X , Y ) = (X, Y ) × M Với M ma trận vng cấp 2n lập sau: M= A I −A I −A A Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 42 A ma trận chéo cấp n với aii =  1 i ∈ {i1, , ik } i ∈ {i1, , ik } 0 d) Lai ghép số học Toán tử biểu diễn qua phép nhân ma trận: (X , Y ) = (X, Y ) × M Với M ma trận vuông cấp 2n lập sau: M= A I −A I −A A A ma trận chéo cấp n với aii = a; i = 1, , n e) Lai ghép Heuristic Toán tử tạo X từ cặp cha mẹ (X, Y ) Dạng biểu diễn ma trận X = (X, Y ) × M, với M ma trận chữ nhật cấp (2n × n) lập sau: M= A I −A A ma trận chéo cấp n với aii = a + 1; i = 1, , n Nhận xét Nói chung việc biểu diễn dạng lai ghép "tuyến tính" qua phép nhân ma trận trình bày mơ tả sau: Với ký hiệu X, Y X , Y nêu trên, biểu diễn tổng quát quan hệ thành phần xi, yi qua xi yi bởi: xi = xi + (1 − )yi; yi = (1 − bi)xi + bi yi; (a, b) = (a1 , , an, b1, , bn) ∈ R2n véc tơ hệ số với hàm phân phối s(a, b) (hàm tùy ý cần thoả mãn s(a, b) = s(b, a)) Cơng thức biểu diễn : (X , Y ) = (X, Y ).F (a, b) F (a, b) = A I −B I −A B Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 43 với A B ma trận đường chéo cấp n với phần tử đường chéo tương ứng thành phần bi véc tơ hệ số (a, b) nêu Từ dễ dàng tính F (a, b)−1 theo công thức: F (a, b)−1 = A I −B I −A B A B ma trận đường chéo cấp m với phần tử đường chéo tương ứng bi đó: bi ai = bi = + bi − + bi − Với cách biểu diễn trên, tính xác suất để cặp phần tử (X , Y ) sinh từ (X, Y ) thuộc tập M không gian R2n sau phép lai ghép công thức: P ((X , Y ) ∈ M) = P ((X, Y ).F (a, b) ∈ M&(a, b) ∈ R2n ) = P ((X, Y ) ∈ M.F (a, b)−1&(a, b) ∈ R2n &s(a, b) = 0) Nếu gọi pXY (x, y) hàm mật độ quần thể cha mẹ trước lai ghép pX Y (x, y) hàm mật độ quần thể cháu sau lai ghép mối quan hệ chúng biểu diễn bởi: pXY (x, y)F (a, b)−1 s(a, b)dadb |F (a, b)| pX Y (x, y) = Λ s(a, b) = {(a, b) ∈ R2n |s(a, b) = 0} Từ ta tính thay đổi mật độ quần thể sau lai ghép p(x) dựa vào mật độ trước lai ghép q(x) sau: s(a, b) |F (a, b)| p(x) = q(xA + y(I − A ))q(x(I − B ) + yB )dy dadb Rm Λ Dựa vào biểu diễn tính giá trị trung bình hàm mục tiêu f : Rn → R với mật độ quần thể p theo công thức: E(f, p) = s(a, b) Λ f (xA + y(I − A))q(x)q(y)dxdy dadb R2m Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 44 q(x) mật độ quần thể trước lai ghép Trong công thức trên, thay f xi ta có: E(xi, p) = s(a, b)(aiE(xi, q) + (1 − )E(xi, q))dadb = E(xi, q) Λ Do ta có kết luận: Giá trị trung bình mật độ quần thể khơng thay đổi qua phép lai ghép dạng "tuyến tính" nêu Sử dụng cách biểu diễn này, Tatsuya Nomura chứng minh rằng: Với i, j ∈ {1, , m}, biến đổi toạ độ thứ i thứ j mật độ quần thể sau lai ghép tích trước lai ghép với số: P Cij = E(2aiaj − − aj , s) + Giá trị P Cij biểu thị tính chất đa dạng toán tử lai ghép Như vậy, việc biểu diễn toán tử lai ghép qua mơ hình tốn học tạo thuận lợi để phát triển tiếp tục sở lý thuyết thuật toán di truyền Kết hợp với toán tử khác thuật toán di truyền đầy đủ, hy vọng tìm phối hợp toán tử di truyền cách hợp lý cho tốn 2.3.2 Điều kiện thành cơng tốn tử lai ghép Giả sử FZ hàm phân phối biến ngẫu nhiên Z với trung vị Theo định lý giá trị trung bình, xác suất để biến ngẫu nhiên Z chuyển từ điểm đến lân cận (z − δ, z + δ) điểm z tính bởi: P {0 → (z − δ, z + δ)} = P {z − δ < Z < z + δ} = FZ (z + δ) − FZ (Z − δ) = 2∗ δ ∗ fZ (z − δ + θ∗2∗ δ) d FZ (x) dx Do z > δ > nên xác suất chuyển gộp lại sau: < θ < fZ (x) = 2∗δ ∗ fZ (z + δ) ≤ P {0 → (z − δ, z + δ)} ≤ 2∗ δ ∗ fZ (z − δ) Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 45 Như vậy, xác suất lai ghép thành công (tạo có xu hướng chuyển từ tối ưu cục đến tối ưu toàn cục) bước thứ k là: pk = P {0 → (z − δ, z + δ) bước k} ≥ qk = 2∗δ ∗ fZ (z + δ) Do đó, xác suất chuyển đến lân cận (z − δ, z + δ) z sau t bước lặp (t ≥ 0) là: t 1− t (1 − pk ) ≥ − k=1 (1 − qk ) k=1 hay điều kiện để lai ghép thành công là: t t (1 − qk ) → ⇔ k=1 log( k=1 ) → ∞ t → ∞ − qk (2.5) Như vậy, điều kiện (2.5) thoả, thuật toán tiến hoá đạt đến lân cận (z − δ, z + δ) z sau số hữu hạn bước với xác suất Công thức (2.5) cho ta ước lượng điều kiện hội tụ thuật toán với toán tử lai ghép chọn 2.3.3 Toán tử lai ghép SBX Toán tử SBX (Simulated Binary Crossover) toán tử lai ghép áp dụng cho giải thuật di truyền mã hóa số thực (RCGA), tạo hai cá thể từ cặp cá thể cha mẹ chọn SBX Deb Agrawal giới thiệu năm 1995 chọn làm toán tử tạo sinh nhiều nghiên cứu khác Giải thuật trình bày chi tiết sau: Giả sử x = (x1, x2, xn) y = (y1, y2, , yn) hai cá thể cha mẹ chọn để tạo sinh Khi hai cá thể c1 = (c11 , , c1n) c2 = (c21 , , c2n) sinh theo công thức: c1i = 0.5∗((1 + β)∗xi + (1 − β)∗yi ) (2.6) c2i = 0.5∗((1 − β)∗xi + (1 + β)∗yi ) (2.7) Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 46 β tính cơng thức:   (2∗u) 1+η 1 1+η   ∗ (1 − u) if u ≤ 0.5 otherwise (2.8) với u số ngẫu nhiên [0, 1]; β tham số điều khiển Tốn tử SBX mơ tả vắn tắt là: Bước Chọn ngẫu nhiên số thực u ∈ [0, 1] Bước Tính β theo cơng thức (2.8) Bước Tính c1 c2 theo công thức (2.6) (2.7) Lưu ý tính thành phần cá thể với giá trị β với i, tính β ứng với thành phần thứ i cách độc lập Khi nghiên cứu tốn tử này, ta có số nhận xét: a) SBX biểu diễn nhiều dạng tốn tử lai ghép khác Có thể thấy công thức (2.6) (2.7), cách gán cho β giá trị thích hợp nhận dạng khác quen thuộc toán tử lai ghép lai ghép điểm, lai ghép nhiều điểm, lai ghép mặt nạ (lai ghép đều), lai ghép số học, lai ghép Heuristic BLX-α Thật vậy: + Lai ghép điểm với điểm lai ghép t (1 ≤ t ≤ n − 1) ứng với cách chọn βk = −1 với < k < t βk = với t < k < n + Lai ghép nhiều điểm ứng với cách đặt βk = −1 đoạn [1, n] βk = đoạn lại + Lai ghép mặt nạ ứng với cách đặt βk = −1 βk = với xác suất giá trị k ∈ [1, n] + Lai ghép trung bình ứng với cách đặt βk = với k + Lai ghép số học ứng với cách đặt βk = 2∗ r˘1 r số ngẫu nhiên với phân phối (0, 1) + Lai ghép heuristic: giả sử x cá thể tốt y(f (x) < f (y) với tốn tìm f (x) > f (y) với tốn tìm max Bằng cách đặt βk = + 2∗d d số ngẫu nhiên [0, 1], ta tính cá thể với thành phần cho bởi: ck = xk + d∗(xk ˘yk ) Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 47 + Toán tử lai ghép BLX-α ứng với cách đặt βk = 2∗r˘1, r số ngẫu nhiên lấy [−α, + α] Dạng biểu diễn thông thường BLX-α là: Mỗi thành phần zi cá thể chọn theo phân phối ngẫu nhiên khoảng [mink − I.α, maxk + I.α] mink = min(xk , yk ); maxk = max(xk , yk ); I = maxk − mink Tham số α thường chọn 0.5 b) Ý nghĩa tham số β Từ công thức (2.6) (2.7), ta thấy khoảng cách thành phần cá thể sinh tỷ lệ với khoảng cách tương ứng cha mẹ chúng Thật trừ theo vế (2.6) (2.7) ta được: c1i − c2i = β ∗ (xi − yi ) Kết quan trọng quan tâm đến việc cá thể sinh gần hay xa nhằm đảm bảo tính đa dạng quần thể Giá trị β tính theo tham số điều khiển η, ví dụ với η = khoảng 99% tỷ lệ β ∈ [0.215, 4.64] Chẳng hạn với cặp cha mẹ x = y = 5, với η = có 1.464, cịn với η = có 1.911 so với cha mẹ x = (với số ngẫu nhiên u) Như tốn tử SBX có hai tính chất quan trọng: i) Phạm vi cá thể sinh tỷ lệ với cha mẹ chúng theo hệ số β ii) Các gần với cha mẹ có khuynh hướng chọn nhiều xa cha mẹ Việc điều chỉnh tham số khoảng cách làm cho giải thuật mềm dẻo, tăng tính đa dạng quần thể tỏ hiệu giải thuật kinh điển hầu hết thử nghiệm Hơn nữa, đưa dạng khác toán tử biểu thức toán học làm cho việc phân tích thiết kế chương trình thuận lợi dễ dàng Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 48 Kết luận Với mục tiêu tìm hiểu sở tốn học giải thuật di truyền, kỹ thuật tính tốn mềm, luận văn thu kết sau: - Tìm hiểu, mơ tả tường minh cấu trúc chung giải thuật di truyền, toán tử cụ thể giải thuật di truyền mã hoá nhị phân giải thuật di truyền mã hoá số thực - Phân tích sở tốn học giải thuật thông qua định lý sơ đồ Hollan mơ hình xích Markov giải thuật - Phân tích mơ hình tốn học tốn tử lai ghép, toán tử giải thuật di truyền nhằm đánh giá độ hội tụ giải thuật Do hạn chế thời gian, điều kiện nghiên cứu khả lập trình nên luận văn dừng việc tìm hiểu, trình bày nội dung mà chưa đặt việc lập trình minh hoạ hay ứng dụng cụ thể Nghiên cứu sở tốn học giải thuật di truyền khó giải thuật xác suất không tiền định, phát triển theo hướng phân tích tốn tử di truyền tích hợp tốn tử theo trình tự để đạt hiệu suất tính tốn cao Cũng phát triển theo hướng chọn toán tử phù hợp với dạng toán hay tìm mơ hình ứng dụng giải thuật hướng phát triển nghiên cứu luận văn Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 49 Tài liệu tham khảo Tiếng Việt [1] Hoàng Kiếm, Lê Hoàng Thái (2000), Giải thuật di truyền, cách giải tự nhiên tốn máy tính, NXB GD [2] Hồng Kiếm (2003), Giải tốn máy tính nào, (Tập 2), NXB Giáo Dục [3] Nguyễn Hoàng Phương, Nadipuram R.Prasad, Lê Linh Phong (2002), Nhập mơn trí tuệ tính tốn, NXB KH&KT [4] Lê Hồng Thái (2004), Xây dựng, phát triển, ứng dụng mộ số mơ hình kết hợp mạng nơron(NN), logic mờ (FL) thuật giải di truyền (GA), Luận án tiến sĩ, ĐH Quốc gia TP Hồ Chí Minh [5] Nguyễn Đình Thúc (2001), Lập trình tiến hố, NXB GD Tiếng Anh [6] Alden H Wright, Yong Zhao, (1999), Markov Chain Models of Genetic Algorithms, GECCO-99 [7] Joe Suzuki, (1996), A Further Result on the Markov Chain Model of Genetic Algorithms and Its Application to a Simulated Annealinglike Strategy, FOGA, 53-72 Số hóa Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ...ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KHOA HỌC VŨ THỊ THU HÀ CƠ SỞ TOÁN HỌC CỦA GIẢI THUẬT DI TRUYỀN Chuyên ngành: TOÁN ỨNG DỤNG Mã số: 60.46.36 LUẬN VĂN THẠC SĨ TOÁN HỌC Người hướng dẫn khoa học: ... chung, giải thuật di truyền kinh điển dựa mã hoá nhị phân giải thuật di truyền mã hố số thực Mơ tả tường minh giải thuật số dạng tốn tử di truyền tiêu biểu Chương trình bày vấn đề nghiên cứu sở toán. .. dạng toán tử lai ghép Như vậy, việc biểu di? ??n tốn tử lai ghép qua mơ hình toán học tạo thuận lợi để phát triển tiếp tục sở lý thuyết thuật toán di truyền Kết hợp với toán tử khác thuật tốn di truyền

Định dạng
Số trang	53
Dung lượng	357,73 KB