Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 27 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
27
Dung lượng
294,49 KB
Nội dung
1 ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG - ĐẶNG THỊ MINH PHƢƠNG BIỂU DIỄN NHIỄM SẮC THỂ TRONG GIẢI THUẬT DI TRUYỀN VÀ CÁC TOÁN TỬ DI TRUYỀN CHUYÊN BIỆT Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên - 2012 LỜI NÓI ĐẦU Đặt vấn đề Cho đến có nhiều thuật toán tìm lời giải tối ưu cho nhiều lĩnh vực toán, ví dụ toán tìm kiếm danh sách, cây, đồ thị nhà khoa học đưa thuật toán tìm kiếm quay lui, vét cạn Các thuật toán tìm nghiệm tối ưu áp dụng cho toán có không gian tìm kiếm nhỏ Để khắc phục hạn chế nhà khoa học đưa thuật toán tìm kiếm heurictics, thuật toán có sử dụng tri thức lĩnh vực toán để nhằm giảm thời gian tìm kiếm Tuy nhiên thuật toán lại vấp phải vấn đề tri thức thường kinh nghiệm người, chưa xác, đầy đủ điều dẫn tới chệch hướng trình tìm kiếm Giải thuật di truyền kỹ thuật tìm kiếm tối ưu giúp ta giải vấn đề đặt trên, cho phép ta tìm kiếm lời giải tối ưu không gian lớn, nguyên tắc giải thuật di truyền mô trình chọn lọc tự nhiên Cho đến lĩnh vực nghiên cứu giải thuật di truyền thu nhiều thành tựu, giải thuật di truyền ứng dụng nhiều lĩnh vực phức tạp, vấn đề khó giải phương pháp thông thường Với khả tiềm tàng giải thuật di truyền động lực lý để tác giả chọn đề tài “Biểu diễn nhiễm sắc thể giải thuật di truyền toán tử di truyền chuyên biệt” Mục tiêu đề tài - Nghiên cứu khái niệm giải thuật di truyền - Nghiên cứu số phương pháp biểu diễn nhiễm sắc thể giải thuật di truyền toán tử di truyền tương ứng - Nghiên cứu lựa chọn số toán tối ưu ứng dụng giải thuật di truyền để giải toán Phạm vi đề tài - Nghiên cứu khái niệm giải thuật di truyền - Nghiên cứu giải thuật di truyền sử dụng phương pháp biểu diễn nhiễm sắc thể mã hóa nhị phân toán tử di truyền tương ứng - Nghiên cứu giải thuật di truyền sử dụng phương pháp biểu diễn nhiễm sắc thể mã hóa số thực toán tử di truyền tương ứng - Nghiên cứu phương pháp biểu diễn nhiễm sắc thể hoán vị tập hợp - Ứng dụng giải thuật di truyền sử dụng mã hóa nhị phân giải thuật di truyền sử dụng mã hóa số thực để xác định độ rộng tập mờ toán xấp xỉ mô hình mờ Cao-Kandel Chƣơng CÁC KHÁI NIỆM CƠ BẢN VỀ GIẢI THUẬT DI TRUYỀN 1.1 Mở đầu Giải thuật di truyền (Gennetic Algorithm) giải thuật tìm kiếm, chọn lựa giải pháp tối ưu để giải toán khác dựa chế chọn lọc tự nhiên ngành di truyền học Trong thể sinh vật, gen liên kết với theo cấu trúc dạng chuỗi gọi nhiễm sắc thể, đặc trưng cho loài định sống thể Một loài muốn tồn phải thích nghi với môi trường, thể sống thích nghi với môi trường tồn sinh sản với số lượng ngày nhiều hơn, trái lại loài không thích nghi với môi trường bị diệt chủng Môi trường tự nhiên biến đổi, nên cấu trúc nhiễm sắc thể thay đổi để thích nghi với môi trường hệ sau có độ thích nghi cao hệ trước Cấu trúc có nhờ vào trao đổi thông tin ngẫu nhiên với môi trường bên hay chúng với Dựa vào nhà khoa học máy tính xây dựng nên giải thuật tìm kiếm tinh tế dựa sở chọn lọc tự nhiên quy luật tiến hóa gọi giải thuật di truyền Các nguyên lý giải thuật tác giả Holland đề xuất lần đầu vào năm 1962 Nền tảng toán học giải thuật GA tác giả công bố sách “Sự thích nghi hệ thống tự nhiên nhân tạo” xuất năm 1975 Giải thuật GA xem phương pháp tìm kiếm có bước chuyển ngẫu nhiên mang tính tổng quát để giải toán tối ưu hoá [1, 2] 1.2 Các khái niệm giải thuật di truyền 1.2.1 Giới thiệu chung Giải thuật GA thuộc lớp giải thuật tìm kiếm tiến hoá Khác với phần lớn giải thuật khác tìm kiếm theo điểm, giải thuật GA thực tìm kiếm song song tập gọi quần thể lời giải Thông qua việc áp dụng toán tử di truyền, giải thuật GA tráo đổi thông tin cực trị làm giảm thiểu khả kết thúc giải thuật cực trị địa phương Trong thực tế, giải thuật GA áp dụng thành công nhiều lĩnh vực Giải thuật GA lần đầu tác giả Holland giới thiệu vào năm 1962 Giải thuật GA mô trình tồn cá thể có độ phù hợp tốt thông qua trình chọn lọc tự nhiên, cho giải thuật thực thi, quần thể lời giải tiến hoá tiến dần tới lời giải mong muốn Giải thuật GA trì quần thể lời giải toán tối ưu hoá Thông thường, lời giải mã hoá dạng chuỗi gien Giá trị gien có chuỗi lấy từ bảng ký tự định nghĩa trước Mỗi chuỗi gien liên kết với giá trị gọi độ phù hợp Độ phù hợp dùng trình chọn lọc Cơ chế chọn lọc đảm bảo cá thể có độ phù hợp tốt có xác suất lựa chọn cao Quá trình chọn lọc chép cá thể có độ phù hợp tốt vào quần thể tạm thời gọi quần thể bố mẹ Các cá thể quần thể bố mẹ ghép đôi cách ngẫu nhiên tiến hành lai ghép tạo cá thể Sau tiến hành trình lai ghép, giải thuật GA mô trình khác tự nhiên trình đột biến, gien cá thể tự thay đổi giá trị với xác suất nhỏ [1, 2] Tóm lại, có khía cạnh cần xem xét, trước áp dụng giải thuật GA để giải toán, cụ thể là: - Mã hoá lời giải thành cá thể dạng chuỗi - Hàm xác định giá trị độ phù hợp - Sơ đồ chọn lọc cá thể bố mẹ - Toán tử lai ghép - Toán tử đột biến - Chiến lược thay hay gọi toán tử tái tạo Có nhiều lựa chọn khác cho vấn đề Phần đưa cách lựa chọn theo J.H Holland thiết kế phiên giải thuật GA Giải thuật gọi giải thuật di truyền đơn giản (SGA) 1.2.2 Giải thuật di truyền đơn giản [1, 2, 3] Trong giải thuật di truyền J H Holland sử dụng mã hoá nhị phân để biểu diễn cá thể, lý phần lớn toán tối ưu hoá mã hoá thành chuỗi nhị phân đơn giản Hàm mục tiêu, hàm cần tối ưu, chọn làm sở để tính độ phù hợp chuỗi cá thể Giá trị độ phù hợp cá thể sau dùng để tính toán xác suất chọn lọc Sơ đồ chọn lọc giải thuật SGA sơ đồ chọn lọc tỷ lệ Trong sơ đồ chọn lọc này, cá thể có độ phù hợp f i có xác suất chọn lựa pi fi / N j f j , N số cá thể có quần thể Toán tử lai ghép giải thuật SGA toán tử lai ghép điểm cắt Giả sử chuỗi cá thể có độ dài L (có L bít), toán tử lai ghép tiến hành qua hai giai đoạn là: Hai cá thể bố mẹ Hai cá thể 0 1 1 1 0 1 1 0 0 1 1 0 0 1 1 Vị trí lai ghép Hình 1.1 Sơ đồ lai ghép điểm cắt - Hai cá thể quần thể bố mẹ chọn cách ngẫu nhiên với phân bố xác suất - Sinh số ngẫu nhiên j khoảng [1, L - 1] Hai cá thể tạo việc chép ký tự từ đến j tráo đổi ký tự từ j + đến L Quá trình minh hoạ hình Điều đáng lưu ý giải thuật GA không yêu cầu toán tử lai ghép xảy hai cá thể bố mẹ chọn Sự lai ghép xảy số ngẫu nhiên tương ứng với cặp cá thể bố mẹ sinh khoảng [0, 1] Không lớn tham số pc (gọi xác suất lai ghép) Nếu số ngẫu nhiên lớn pc, toán tử lai ghép không xảy Khi hai cá thể trực tiếp hai cá thể bố mẹ Tiếp theo, J H Holland xây dựng toán tử đột biến cho giải thuật SGA Toán tử gọi toán tử đột biến chuẩn Toán tử đột biến duyệt gien cá thể sinh sau tiến hành toán tử lai ghép tiến hành biến đổi giá trị từ sang ngược lại với xác suất pm gọi xác suất đột biến Cuối chiến lược thay hay gọi toán tử tái tạo Trong giải thuật SGA, quần thể sinh từ quần thể thông qua toán tử chọn lọc, lai ghép đột biến thay hoàn toàn quần thể trở thành quần thể hệ Sơ đồ tổng thể giải thuật SGA thể qua thủ tục GSA() trình bày Thủ tục SGA () /* Giải toán tối ưu */ { k = 0; // Khởi tạo quần thể P0 cách ngẫu nhiên khởi_tạo (Pk); // Tính giá trị hàm mục tiêu cho cá thể tính_hàm_mục_tiêu (Pk); // Đặt lời giải giải thuật cá thể có giá trị hàm mục tiêu tốt Xbest = tốt_nhất (Pk); { // Chuyển đổi giá trị hàm mục tiêu thành giá trị độ phù hợp // tiến hành chọn lọc tạo quần thể bố mẹ Pparent Pparent = chọn_lọc (Pk ); // Tiến hành lai ghép đột biến tạo quần thể cá thể Pchild Pchild = đột_biến (lai_ghép (Pparent)); // Thay quần thể quần thể cá thể k = k + 1; Pk = Pchild; tính_hàm_mục_tiêu (Pk); // Nếu giá trị hàm mục tiêu obj cá thể tốt X quần // thể Pk lớn giá trị hàm mục tiêu Xbest thay lời giải X = tốt_nhất (Pk); if ( obj (X) > obj (Xbest) ) Xbest = X; } while ( k < G); /* Tiến hành G hệ */ 10 return (Xbest); /* Trả lời giải giải thuật GA*/ } Giải thuật di truyền phụ thuộc vào (N, pc, pm, G), đó: N - số cá thể quần thể; pc - xác suất lai ghép; pm - xác suất đột biến; G - số hệ cần tiến hoá Đó tham số điều khiển giải thuật SGA Cá thể có giá trị hàm mục tiêu tốt hệ lời giải cuối giải thuật SGA Quần thể khởi tạo cách ngẫu nhiên Ví dụ: xét toán tìm max hàm f(x) = x2 với x số nguyên đoạn [0, 31] Để sử dụng giải thuật di truyền ta mã hóa số nguyên x đoạn [0, 31] số nhị phân có độ dài 5, chẳng hạn chuỗi 11000 mã số nguyên 24 Hàm thích nghi xác định hàm f(x)=x2 Quần thể ban đầu gồm cá thể (kích thước quần thể n=4) Thực trình chọn lọc ta có bảng sau, bảng ta thấy cá thể có độ thích nghi cao nên chọn lần, cá thể có độ thích nghi thấp không chọn lần nào, cá thể chọn lần Số hiệu Quần thể Độ thích nghi Số lần cá thể ban đầu f(x)=x2 đƣợc chọn 01101 13 169 11000 24 576 01000 64 10011 19 361 x data error !!! can't not read data error !!! can't not read data error !!! can't not read data error !!! can't not read data error !!! can't not read data error !!! can't not read data error !!! can't not read data error !!! can't not read data error !!! can't not read data error !!! can't not read data error !!! can't not read data error !!! can't not read data error !!! can't not read data error !!! can't not read data error !!! can't not read data error !!! can't not read ... niệm giải thuật di truyền - Nghiên cứu số phương pháp biểu di n nhiễm sắc thể giải thuật di truyền toán tử di truyền tương ứng - Nghiên cứu lựa chọn số toán tối ưu ứng dụng giải thuật di truyền. .. cứu giải thuật di truyền sử dụng phương pháp biểu di n nhiễm sắc thể mã hóa số thực toán tử di truyền tương ứng - Nghiên cứu phương pháp biểu di n nhiễm sắc thể hoán vị tập hợp - Ứng dụng giải thuật. .. vấn đề khó giải phương pháp thông thường Với khả tiềm tàng giải thuật di truyền động lực lý để tác giả chọn đề tài Biểu di n nhiễm sắc thể giải thuật di truyền toán tử di truyền chuyên biệt Mục