Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 26 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
26
Dung lượng
616,85 KB
Nội dung
Lời nói đầu Những năm gần đây, cùng với sự phát triển của khoa học kỹ thuật, người ta đã giảiquyết được nhiều bàitoán hóc búa bằng máy tính. Nhưng bên cạnh đó, vẫn còn khá nhiều các bàitoán vẫn chưa tìm được giải thuật phù hợp đểgiải nó, đó là các bàitoán tối ưu, trí tuệ nhân tạo và các bàitoán xuất phát từ thực tế cuộc sống như bàitoán lập lịch, bàitoán điều khiển Robot, bàitoán người du lịch, Đây là các bàitoán có khá nhiều ràng buộc phức tạp, không rõ ràng, ko gian tìm kiếm lớn. Do đó các phươngpháp truyền thống như quay lui vét cạn, leo đồi, mô phỏng luyện thép… tỏ ra ít hiệu quả, và người ta đã sửdụng một phươngpháp khá tối ưu đó là phươngphápCHC và sửdụng trong môhìnhsong song. Trong bàinghiêncứu này nhóm tác giả nghiêncứuvềphươngphápCHCsửdụngmôhìnhsongsongđểgiảiquyếtbàitoán MAXSAT. Chúng ta sẽ thấy được sự độ tối ưu khi sửdụngmôhìnhsongsong so với môhình tuần tự về thời gian, độ thích nghi … Trong tương lai nhóm sẽ tiếp tục phát triển đề tài nghiêncứu bằng cách sửdụng thuật toánđểgiảiquyết một số bàitoán khác. Nhóm tác giả xin chân thành cảm ơn sự giúp đỡ tận tình của thầy giáo Đỗ Trung Kiên đã giúp cho nhóm trong quá trình thực hiện. Cuối cùng xin chúc hội nghị nghiêncứu khoa học của chúng ta thành công rực rỡ. Hà Nội, tháng 04 năm 2008. Nhóm tác giả. 1 MỤC LỤC [2]. Sushil J. Louis, A Genetic Algorithm 25 [3]. Helmut Pekari and Robert Clariso, MALLBA: instantiating SAT and MAXCUT 25 [4]. M.B Menai Département d’informatique, ‘Extremal Optimization’ for Max - SAT. 25 BÁO CÁO KHOA HỌC Đề tài:: PHƯƠNGPHÁPCHCSONGSONG Chương I: Tổng quan vềphươngphápCHC I. Tìm hiểu chung về thuật toán di truyền Giải thuật di truyền là kĩ thuật giúp giảiquyếtbàitoán bằng cách mô phỏng theo sự tiến hoá và đấu tranh sinhh tồn của sinh vật trong tự nhiên theo thuyết tiến hoá muôn loài của Darwin. Mục tiêu của giải thuật di truyền: giải thuật di truyền không đưa ra lời giải tối ưu mà là đưa ra lời giải gần đúng (tương đối tối ưu). Bản chất của thuật toán di truyền là bàitoán tìm kiếm dựa theo qui luật của quá trình tiến hoá tự nhiên. Thuật toán di truyền kết hợp sựsống sót của cấu trúc khoẻ nhất trong số các cấu trúc biểu diễn các nhiễm sắc thể (NST) với sự trao đổi thông tin được lựa chọn ngẫu nhiên để tạo thành một thuật toán tìm kiếm. Thuật toán di truyền sửdụng các biểu diễn nhị phân kết hợp với sơ đồ đểmôhình hoá sự chọn lọc, lai ghép và đột biến. Ứng dụng của thuật toán di truyền: + Trong tin học: xây dựng chương trình tin học đặc biệt như trí tuệ nhân tạo để hướng dẫn người sửdụng trong lĩnh vực giáo dục, quản trị. + Trong các công việc khác: Ứng dụnggiảibàitoán sắp xếp thời khoá biểu, điều khiển robot, bàitoán vận tải, bàitoán đồ thị… 2 II. Tổng quan vềphươngphápCHC 1. Khái niệm CHC là giải thuật di truyền phi truyền thống kết hợp chiến lược chọn lọc (dựa trên những cá thể đơn lẻ tốt nhất) để đưa ra con lai tốt nhất khác với cả cha và mẹ. 2. Tư tưởng của thuật toánCHCCHC là từ viết tắt của cross – generational selection, Heterogeneous recombination, and Cat – aclysmic mutation. Giải thuật CHC được phát triển bởi Eshelman (1991) được trình bày như hình vẽ: CHC lựa chọn một trang của quần thể có kích cỡ µ (µ =50) nhưng thay vì chọn những cha mẹ tốt để tái kết hợp giống cách làm của giải thuật gi truyền, cha mẹ được chọn một cách ngẫu 3 nhiên một cặp duy nhất và điều kiện để sinh ra con chung. Giải thuật sau đó sẽ chọn tập cá thể tốt nhất từ cha mẹ được kết hợp và quần thể con được sinh ra ở thế hệ tiếp theo. Vì vậy giải thuật CHC sẽ duy trì được quần thể tốt nhất mà được bắt gặp qua quá trình tìm kiếm. Cha mẹ không được phép giao phối nếu như chúng không có sự khác biệt thích đáng như được xác định bởi ngưỡng giao phối liên tục giảm. Toán tử chéo (crossover) được sửdụng bởi CHC là toán tử HUX, với HUX là đại diện cho crossover một nửa không đổi. Toán tử HUX đảm bảo chính xác một nửa của số bit khác nhau giữa cha mẹ được trao đổi để sản sinh ra con cái. CHC không được sửdụng các toán tử đột biến trong trường hợp thông thường, và thực tế cùng với những quần thể nhỏ trong CHC và sự lựa chọn thế hệ giao làm cho quần thể được hội tụ nhanh chóng. Khi quần thể được hội tụ, CHC sẽ được khởi động lại từng phần bởi việc sao chép bởi thành viên tốt nhất của quần thể hiện tại sang một quần thể mới và sinh ra phần còn lại của quần thể mới với những phiên bản được biến đổi ồ ạt (35% của các bit) của thành viên tốt nhất của quần thể hiện tại. 3. Sự Chọn lọc Elitist Trong suốt sự chọn lọc cho việc sinh sản thay vì sự thiên về chọn lọc C(t) cho việc sinh sản hơn vì lợi ích của những thành viên thực hiện tốt hơn trong quần thể cha mẹ P(t-1). Mỗi thành viên của P(t-1) được sao chép thành C(t) và được ghép đôi một cách ngẫu nhiên. (Nói cách khác, C(t) đồng nhất với P(t-1) ngoại trừ khi trật tự của các cấu trúc đã bị thay đổi). Mặt khác, trong suốt giai đoạn chọn lọc sinh tồn thay vì thay thế quần thể cha mẹ cũ P(t-1) bằng quần thể con C’(t) đểhình thành P(t), thế hệ con mới được tạo ra phải được cạnh tranh với các thành viên của quần thể cha mẹ P(t-1) cho sự sinh tồn - ví dụ cạnh tranh chính là thế hệ lai. Cụ thể hơn, các thành viên của P(t-1) và C’(t) được hoà trộn và được xếp hạng theo sự thích hợp, và P(t) được tạo ra bằng việc chọn lọc M tốt nhất (trong đó M là kích thước quần thể), các thành viên của quần thể được hoà trộn. (Trong các trường hợp mà một thành viên của P(t-1) và một thành việc của C’(t) có sự thích hợp giống nhau, thành viên của P(t-1) được xếp hạng cao hơn). Ta sẽ gọi thủ tục giữ lại các thành viên được xếp hạng tốt nhất của các quần thể con và quần thể cha mẹ 4 được xáo trộn là sự chọn lọc elitist bởi vì nó đảm bảo rằng các cá thể M tốt nhất sẽ luôn sống sót. Một vài sự chọn lọc sinh tồn thiên về tính thích hợp sửdụng của giải thuật di truyền khác - Whitley’s GENITOR (1989), Syswerda’s Steady State GA (SSSGA(1989), và Ackley’s Iterated Generic Search(IGS) (1987). CHC khác với tất cả ba loại giải thuật này trong đó việc cạnh tranh sinh tồn là thế hệ lai-thế hệ con chỉ thay thế một thành viên của quần thể cha mẹ nếu nó tốt hơn. Hơn nữa, không giống như ba giải thuât này, CHC vận hành trong các chu kỳ thế hệ với rất nhiều bạn đời chứ không phải chỉ một bạn đời cho mỗi chu kỳ. Sự tin cậy duy nhất đối với sự chọn lọc sinh tồn cho sự thiên lệch của nó vì lợi ích của những cá nhân thực thi tốt hơn hơn và cũng phân biệt nó với GENITOR và SSSGA nhưng không phải là IGS. Cuối cùng, phươngpháp được dựa trên sự xếp hạng tất yếu của việc thực hiện sự chọn lọc phân biệt nó với SSGA Và IGS nhưng không phải là GENITOR. 4. Tránh sự giao phối gần Sự tăng trưởng theo số mũ của các trường hợp lược đồ tốt thì có giá trị ít hơn nếu nó dẫn đến sự quy tụ còn non. Một trong những hậu quả của phép lai một nửa bit khác nhau giữa các thế hệ cha mẹ đó là sự nguy có của sự hội tụ còn non sẽ giảm đi. Thậm chí ở mỗi thế hệ thì thế hệ con cháu gần đây nhất giao phối với một trong những tổ tiên đầu tiên (con giống nhau trong mỗi lần). Nó sẽ mang các thế hệ log 2 h để quy tụ (trong vòng 1 bit) đến tổ tiên đầu tiên ở đó h là khoảng cách tín hiệu giữa các thế hệ cha mẹ đầu tiên. Mặc khác, trong trường hợp của phép lai hai điểm hai thế hệ con sẽ khác so với thế hệ cha mẹ gần nhất của nó (được đo bởi khoảng cách tín hiệu) bằng số lượng dao động từ 1 bit cho đến không quá một nửa chiều dài của chuỗi L. Chính vì vậy, thời gian dài nhất mà nó có thể tạo ra sự quy tụ trong vòng 1 bit của tổ tiên của nó là các thế hệ log 2 h và thời gian ngắn nhất là một thế hệ. Tất nhiên, thế hệ con không được giao phối lại với một trong những tổ tiên xa của nó nhưng bởi vì các cá thể tốt hơn sẽ có nhiều hậu duệ hơn. Vì vậy, sẽ rất hợp lý khi một cá thế được giao phối với một trong những họ hàng gần nhất 5 của nó. Cho đến bây giờ, điều này dẫn đến việc lai các cá thể mà chia sẻ rất nhiều Alen, sự thông dò đối với sự tái tổ hợp nhanh chóng thoái hoá. Mặc dù luôn luôn lai một nửa những sự khác nhau (sử dụng HUX) sẽ làm chậm đi quá trình này nhưng đôi khi các cá thể được ghép đôi lại có một vài sự khác biệt. Nếu một hay hai thế hệ con sống sót đối với sự giao phối này thì nó chắc chắn sự việc như vậy cũng sẽ xảy ra ở thế hệ kế tiếp. CHC có một cơ chế bổ sung để làm chậm lại tốc độ của sự quy tụ- một cơ chế để giúp tránh sự giao phối gần. Trong suốt thời kỳ sinh sản, mỗi thành viên của quần thể cha mẹ được chọn một cách ngẫu nhiên mà không thay thế và được ghép đôi cho việc giao phối. Tuy nhiên, trước khi giao phối thì khoảng cách tín hiệu giữa các thế hệ cha mẹ tiềm năng được tính toán, và nếu một nửa khoảng cách đó (khoảng cách tín hiệu của các thế hệ con được mong đợi từ các thế hệ cha mẹ) sẽ không vượt quá ngưỡng khác nhau. Chúng không được giao phối và bị loại ra từ quần thể con. (ngưỡng khác nhau được thiết lập ở phần bắt đầu cho đến L/4). Chính vì vậy, chỉ một phần quần thể được giao phối để tạo ra thế hệ con mới trong bất kỳ thế hệ nào. Không có thế hệ con nào được chấp nhận vào quần thể cha mẹ (hoặc là bởi vì không có bạn giao phối tiềm năng hay bởi vì không một thế hệ con nào tốt hơn quần thể cha mẹ), thì ngưỡng khác nhau sẽ bị giảm đi. Hậu quả của cơ chế này đó là chỉ có các quần thể cha mẹ tiềm năng và đa dạng hơn được giao phối nhưng sự đa dạng được đòi hỏi bằng ngưỡng khác nhau tự động giảm khi quần thể quy tụ một cách tự nhiên. Số lượng những con sống sót cho mỗi thế hệ sẽ được xem là thích hợp nhất trong suốt quá trình tìm kiếm bởi vì khi CHC gặp khó khăn trong việc tăng tiến trình thì ngưỡng khác nhau sẽ giảm xuống nhanh hơn khoảng cách tín hiệu trung bình để có nhiều cá nhân hơn được đánh giá. Ngược lại, khi CHC được xem là dễ dàng để tạo ra thế hệ con mà sống sót thì ngưỡng khác nhau sẽ giảm ở tỷ lệ thấp hơn và số lượng các con giao phối cũng sẽ giảm. Chương II: Xây dựng khung thuật toánCHC 6 Việc xây dựng khung thuật toán có ý nghĩa rất quan trọng trong quá trình lập trinh. Nó cho phép nhiều người dùng khai thác hiệu quả nhất những giải thuật cũng như cơ sở dữ liệu nhờ những khung thuật toán có sẵn. Một số tiểu ứng dụng của khung thuật toán: • Hỗ trợ thiết kế tối đa và khả năng tái sửdụng code: Khung phải cung cấp cho người dùngtoàn bộ kiến trúc của phươngphápgiảiquyếtbàitoán của họ. Hơn nữa các lập trình viên có thể tái sựdụng các đoạn code đã có. Do đó người dùng chỉ cần phát triển một đoạn code nhất định cho vấn đề đó. • Tiện ích và khả năng mở rộng: Khung phải cho phép người dùng đi qua một số lượng lớn các giải thuật đã được giả quyết, các vấn đề, các môhìnhsongsong đã được đưa ra. Nó có khả năng cho phép người dùngdễ dàng thêm hoặc thay đổi các đặc tính/ giải thuật mà ko cần liên quan đến các thành phần khác. Giúp cho người sau thử nghiệm baitoán trên môi trường song song. • Tính linh động: Khung hỗ trợ nhiều kiến trúc phần cứng và phần mềm khác nhau nên đáp ứng được một số lượng lớn người dùng. I.Thiết kế khung thuật toánCHC Cấu trúc chung của thuật toán CHC: 1 t = 0 2 initialize P(t) 3 evaluate structures in P(t) 4 while not end do 5 t = t + 1 6 select: C(t) = P(t-1) 7 recombine: C'(t) = 'incest prevention' + HUX(C'(t)) 8 evaluate structures in C'(t) 9 replace P(t) from C''(t) and P(t-1) 7 10 if convergence(P(t)) 11 diverge P(t) Khung thuật toán gồm hai phần cơ bản là Provides và Requires. Lớp Provided thực thi phía bên trong khung bao hàm các thủ tục chung cho các bàitoángiải bằng giải thuật di truyền. Thông thường đối với mỗi giải thuật thì thường có một số giải pháp, tất cả các môhình tuần tự được nhóm vào lớp Solver_Seq. Các môhìnhsongsong được nhóm vào các lớp Solver_Lan và Solver_Wan. Lớp Required chỉ định thông tin liên quan đến vấn đề (bài toán). Để cho toàn bộ khung hoạt động thì các lớp này phải được bổ xung thông tin vềbàitoán phụ thuộc . 1. Các lớp đòi hỏi (Requires) Các lớp đòi hỏi được sửdụngđể lưu trữ dữ liệu cơ bản của thuật toán. Ta có thể hìnhdung các lớp Requre được xây dựng giống như một cái sườn, cái mẫu, và đối với từng bàitoán cụ thể lại phải đắp thêm những thông tin riêng của bàitoán đó cho hoàn chỉnh. Nhóm các lớp Requires bao gồm các lớp sau: • Lớp bàitoán (Problem) Diễn tả thông tin bàitoán cần giải quyết. Dưới đây là các thủ tục chính trong lớp bàitoán Trong đó: - Toán tử chồng cout: Đưa ra các thông số của bàitoán pbm theo luồng os. - Toán tử chồng cin: nhận vào các thông số của bàitoán pbm từ luồng is. • Lớp lời giải (Solution) Lớp lời giải diễn tả lời giải của bài toán, trong quá trình tiến hoá, chúng ta luôn duy trì một quần thể các lời giải có thể của bàitoán và áp dụng các thao tác của quá trình tiến hoá lời giải trên quần thể để tìm ra lời giải tối ưu cho bài toán. Dưới đây là các thủ tục chính trong lớp lời giải: Trong đó - operator<< đưa ra các thông số của một lời giải theo os. - operator>> nhận vào các thông số của một lời giải theo luồng is. 8 - char *to_String(): Chuyển nhiễm sắc thể biểu diễn lời giải thành một xâu ký tự - to_Solution(char *_cadena_): Hàm tạo ra một đối tượng lời giải từ một xâu ký tự. - initialize(): Hàm khởi tạo bộ giá trị ngẫu nhiên cho các phần tử trong lời giải - fitness (): Hàm tính độ thích nghi làm cơ sở đánh giá lời giải. • Lớp toán tử người sửdụng (Uer_Operator) Thừa kế từ lớp Intra_Operator. • Lớp kiểm tra điều kiện dừng (StopCondition) Để xác định điều kiện dừng của bài toán, trong từng bàitoán thì điều kiện dừng sẽ khác nhau, thường căn cứ vào một hoặc một vài tham số như số thế hệ, thời gian chạy, các điều kiện đặc thù của bàitoán 2. Các lớp cung cấp (Provided) Bao gồm các thủ tục chung cho các bàitoángiải bằng giải thuật CHC. Ta có thể hìnhdung các lớp loại provide giống như một thư viện, và khi giải các bàitoán chỉ việc gọi nó ra. • Lớp thiết lập tham số đầu vào (SetUpParams) Lớp này chứa các thủ tục để thiết đặt các tham số cho bàitoán như đã nêu trên và cho các toán tử của giải thuật từ 1 file đầu vào: o independent_runs: số lần thực hiện quá trình tiến hóa trong một lần thực hiện chương trình o population_size: kích thước quần thể o nb_evolution_steps: số bước tiến hóa o select_parents: phương thức lựa chọn cha o select_offsprings: phương thức lựa chọn con o combine: có kết hợp quần thể cũ hay chỉ lựa chọn từ quần thể mới. o Hàm istream& operator>> (istream& is, SetUpParams& setup) có nhiệm vụ thiết đặt các tham số cho bài toán. Cụ thể, nó nhận vào các thông số cấu hình từ một file dữ liệu (file này sẽ được gọi là file cấu hình), dựa vào các thông số nhận vào này mà chương trình sẽ chọn phươngpháp lựa chọn dùng trong bàitoán 9 (trong 5 phươngpháp lựa chọn đã kể trên), tham số lựa chọn dấu hiệu dừng của thuật toán, làm cơ sở cho cấu hình của giải thuật giảibài toán. • Lớp quần thể (Population) Lớp này lưu trữ các thông tin về quần thể các nhiễm sắc thể. Dưới đây là các thủ tục chính trong lớp quần thể. Trong đó: o Evaluate(Solution *sol, struct individual &_f): tạo ra cá thể _f (độ thích nghi, vị trí ) tương ứng với nhiễm sắc thể sol. o initialize(): Sinh ra một tập các cá thể mới trong quần thể o evolution(): Tiến hóa quần thể bằng các phương pháp: lụa chọn, lai ghép, đột biến. o evaluate_parents(): Tạo ra một mảng chứa đựng độ thích nghi của tất cả các cá thể và vị trí của nó trong quần thể. Cùng với việc đánh giá độ thích nghi của cha tốt nhất, cha tồi nhất và giá trị trung bình o evaluate_offsprings(): Tạo ra một mảng chứa đựng độ thích nghi của tất cả các cá thể và các con cùng vị trí của nó trong quần thể. o select_parents(): Lựa chọn cha để tiến hành lai ghép, sửdụng một trong 5 phươngphápđể tiến hành lựa chọn. o select_offsprings(): Lựa chọn các cá thể cho quần thể mới. Có hai phươngpháp hoặc là chỉ lựa chọn từ quần thể mới (combine = 0) hoặc là lựa chọn từ quần thể mới và quần thể cũ (combine = 1) Hàm quan trọng nhất trong lớp này là hàm evolution(), nó để thực hiện công việc tiến hoá quần thể hay sinh quần thể mới qua các phép chọn lọc, lai ghep, đột biến như trên đã tìm hiểu. • Lớp lựa chọn (Selection) Để thực hiện việc chọn lọc các cá thể có độ thích nghi cao để cho vào bể lai ghép để thực hiện các phép biến đổi cho ra một quần thể mới có độ thích nghi cao hơn. Dưới đây là các thủ tục chính trong lớp lựa chọn. Trong đó: o prepare: thực hiện việc chuẩn bị các điều kiện cho việc tiến hành chuẩn bị, ở mỗi phươngpháp chọn lựa thì yêu cầu chuẩn bị này sẽ khác nhau. 10 . hình song song. Trong bài nghiên cứu này nhóm tác giả nghiên cứu về phương pháp CHC sử dụng mô hình song song để giải quyết bài toán MAXSAT. Chúng ta sẽ thấy được sự độ tối ưu khi sử dụng mô hình. HỌC Đề tài:: PHƯƠNG PHÁP CHC SONG SONG Chương I: Tổng quan về phương pháp CHC I. Tìm hiểu chung về thuật toán di truyền Giải thuật di truyền là kĩ thuật giúp giải quyết bài toán bằng cách mô phỏng. đồng bộ 1 // khoảng phát sinh để chọn giải pháp từ quần thể khác II. Sử dụng khung thuật toán giải quyết bai toán MAXSAT Để giải quyết một bài toán bất kì trên khung CHC của bộ Mallba thì chúng