Bài viết tìm hiểu về vấn đề trùng lặp cá thể trong các quần thể của lập trình di truyền bị tác động khi kích cỡ quần thể thay đổi; nguyên nhân chính dẫn đến trùng lặp; cách thức giải quyết vấn đề trùng lặp trong lập trình di truyền và hiệu quả của giải pháp đề xuất. Mời các bạn cùng tham khảo bài viết!
TNU Journal of Science and Technology 225(09): 61 - 68 TRÙNG LẶP CÁ THỂ TRONG LẬP TRÌNH DI TRUYỀN Phạm Thị Thương1*, Nguyễn Xn Hồi2, Nguyễn Thị Hiền3, Ngơ Văn Mạnh4 1Trường Đại học Công nghệ thông tin & truyền thơng - ĐH Thái Ngun, 2Viện trí tuệ nhân tạo Việt Nam, 3Học viện Kỹ thuật quân sự, 4Trung tâm Thơng tin Dữ liệu Khí tượng thủy văn TĨM TẮT Trong thực tế, cá thể xuất giới tự nhiên Chúng kế thừa đặc tính di truyền từ cha mẹ, đồng thời mang nét đặc trưng riêng biệt mà không giống cá thể tồn (Adam Rutherford, 2018) Lập trình di truyền (GP) cách tiếp cận mô tiến hóa tự nhiên áp dụng thành công nhiều lĩnh vực Vậy, (1) Vấn đề trùng lặp giải GP? (2) Việc lặp cá thể có phụ thuộc vào kích cỡ quần thể khơng? Nó tác động đến hiệu GP? (3) Nguyên nhân gây trùng lặp gì? (4) Làm để giải vấn đề trùng lăp? Để trả lời câu hỏi nghiên cứu này, tiến hành thực nghiêm Kết cho thấy, trùng lặp cá thể khơng bị tác động nhiều kích cỡ quần thể đa phần toán thử nghiệm; giải vấn đề trùng lặp giúp cải tiến cách đáng kể hiệu suất GP nói riêng cách tiếp cận dựa GP nói chung Từ khóa: Lập trình di truyền; giải thuật tiến hóa; máy học; hệ gen; lặp cá thể Ngày nhận bài: 05/5/2020; Ngày hoàn thiện: 29/8/2020; Ngày đăng: 31/8/2020 INDIVIDUAL DUPLICATION IN GENETIC PROGRAMMING Pham Thi Thuong1*, Nguyen Xuan Hoai2, Nguyen Thi Hien3, Ngo Van Manh4 1TNU - University of Information and Communication Technology 2AI Academy, VietNam, 3LeQuyDon Technical University 4Center for Hydro-Meteorological Data and Information ABSTRACT In reality, each individual that appears in the natural world is unique They inherit genetic meterials from their parents, and carry distinct traits that not resemble any existing and existed individuals (Adam Rutherford, 2018) Genetic programming (GP) is one of the approaches to simulate the natural evolution that has been successfully applied in many fields So, (1) How is the problem of individual duplication solved in GP? (2) Does this depend on the population size? How does it affect the GP? (3) What are the causes of duplication? and (4) How to solve this problem? In order to answer these questions, we have run experiments The results show that individual duplication not be effected by the population size with the most tested problems Solving this problem will significantly improve the performance of GPs in particular and GP-based approaches in general Keywords: Genetic programming; evolutionary algorithms; machine learning; genome; duplicate individuals Received: 05/5/2020; Revised: 29/8/2020; Published: 31/8/2020 * Corresponding author Email: ptthuong@ictu.edu.vn http://jst.tnu.edu.vn; Email: jst@tnu.edu.vn 61 Phạm Thị Thương Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ ĐHTN Giới thiệu Trong giới tự nhiên, cá thể xuất Mỗi cá thể kế thừa đặc tính di truyền từ cha mẹ, đồng thời mang nét đặc trưng riêng biệt mà không giống cá thể tồn [1] Lập trình di truyền (GP) cách tiếp cận mô hành vi tiến hóa giới tự nhiên phát triển Koza [2] năm 1992 Nó dựa quan sát hệ thống sinh học sử dụng chế lựa chọn tự nhiên Darwins để tiến hóa quần thể giải pháp cho toán cần giải GP cách tiếp cận hiệu để giải toán thuộc nhiều lĩnh vực khác nhau, học máy nhiệm vụ [3] Việc đảm bảo tính giải pháp quần thể tiến hóa GP phản ánh tự nhiên vấn đề đáng quan tâm Lặp cá thể quần thể nguyên nhân dẫn đến lãng phí tài nguyên tính tốn làm giảm tính đa dạng quần thể [2] Một số nghiên cứu gần GP tập trung giải vấn đề trùng lặp cá thể [4]-[7] Tuy nhiên nghiên cứu này, tác giả xem vấn đề trùng lặp cá thể nguyên nhân gây lãng phí tài ngun tính tốn Do vậy, cách tiếp cận đề xuất họ nhằm hướng tới việc giảm bớt tính tốn gây trùng lặp cá thể; hướng tới khắc phục vấn đề trùng lặp trình khởi tạo quần thể mà khơng nghiên cứu cách có hệ thống ngun nhân gây trùng lặp gì, khơng xem việc khắc phục trùng lặp thật hiển nhiên giới tự nhiên điều tác động trực tiếp đến hiệu GP Trong [8], Miguel Nicolau cộng nghiên cứu tần suất tác động lặp cá thể hai hệ thống GP văn phạm gồm Hệ thống tiến hóa văn phạm (Grammatical Evolution, GE) Hệ thống GP văn phạm phi ngữ cảnh (Context-Free Grammar GP, CFGGP) Để quản lý vấn đề trùng lặp, nhóm tác giả chạy thực nghiệm ba toán chuẩn, sử dụng bốn cách tiếp cận: (1) Không sử dụng Tabu list – cho phép lặp cá thể 62 225(09): 61 - 68 quần thể; (2) Tabu list dị tìm fitness - cho phép lặp cá thể không đánh giá cá thể lặp lại để tiết kiệm thời gian; (3) Tabu list danh sách phạt – cho phép lặp cá thể, cá thể lặp bị phạt gán giá trị fitness tồi để hạn chế bị lựa chọn q trình tiến hóa; (4) Tabu list danh sách ép buộc – không cho phép lặp cá thể, lặp làm lại Tuy nhiên, tương tự nghiên cứu trước đó, nhóm tác giả không xem việc khắc phục trùng lặp thật hiển nhiên giới tự nhiên Mặc dù cách tiếp cận (4) nhóm tác giả không cho phép trùng lặp diễn tập trung vào trùng lặp xảy khởi tạo quần thể cách, phát cá thể tạo trùng với cá thể tồn tạo lại Trong phạm vi báo này, tập trung trả lời câu hỏi nghiên cứu sau: Vấn đề trùng lặp cá thể quần thể GP bị tác động kích cỡ quần thể thay đổi? Những ngun nhân dẫn đến trùng lặp gì? Điều ảnh hưởng đến hiệu GP? Cách thức giải vấn đề trùng lặp GP hiệu giải pháp đề xuất gì? Chúng tơi tiến hành chạy thực nghiệm để trả lời câu hỏi nghiên cứu Kết cho thấy: (1) Hiện có trùng lặp cá thể (chrom) mặt ngữ nghĩa (fitness) quần thể GP Khi tăng kích cỡ quần thể GP lên 500, 1000, 1500, kết cho thấy, số lượng cá thể trùng lặp không bị ảnh hưởng đáng kể kích cỡ quần thể với đa phần toán thử nghiệm, ngoại trừ số tốn có xu hướng giảm trùng lặp kích cỡ quần thể tăng (2) Qua phân tích, chúng tơi xác định ngun nhân gây trùng lặp tác động yếu tố ngẫu nhiên khởi tạo quần thể, trình lựa chọn lai ghép để tiến hóa giải pháp (3) Giải vấn đề trùng lặp giúp nâng cao khả khái quát hóa GP với đa phần toán thử nghiệm http://jst.tnu.edu.vn; Email: jst@tnu.edu.vn Phạm Thị Thương Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ ĐHTN Phần cịn lại báo tổ chức sau: Trong phần 2, trình bày ngắn gọn cách tiếp cận sử dụng để giải câu hỏi nghiên cứu thiết lập thực nghiệm sử dụng nghiên cứu Tiếp theo, phần kết thảo luận Cuối cùng, báo kết thúc phần kết luận hướng nghiên cứu tương lai Phương pháp nghiên cứu 2.1 Lập trình di truyền yếu tố ngẫu nhiên Lập trình di truyền (GP) xem phương pháp máy học, mục đích tối ưu quần thể giải pháp/ chương trình biểu diễn nhiệm vụ tính tốn cho trước GP gồm bước sau: Bước 0: Khởi tạo quần thể ban đầu, P(0) Lặp: Bước 1: Đánh giá độ thích nghi/ độ tốt lời giải quần thể hệ t, P(t) Bước 2: Lựa chọn lời giải cha quần thể P(t) dựa độ thích nghi chúng Bước 3: Thực thao tác di truyền (lai ghép, đột biến, tái tạo) để thu quần thể P(t+1) Lặp đến tận điều kiện dừng thỏa mãn (tìm giải pháp tối ưu/ đạt đến số hệ cho trước) Độ thích nghi lời giải thay hàm lỗi RMSE (xem bảng 2) Mục đích GP tiến hóa quần thể tìm giải pháp có độ thích nghi cao hay giá trị lỗi nhỏ Qua phân tích nhận thấy trùng lặp cá thể quần thể GP phần nhiều liên quan đến yếu tố ngẫu nhiên Có thể nói, với GP ngẫu nhiên đóng vai trị định Nó góp phần quan trọng việc tăng tính đa dạng quần thể GP – đa dạng hai đặc tính quan trọng (tính đa dạng, tính hội tụ) ảnh hưởng trực tiếp tới hiệu GP nói riêng giải thuật tiến hóa (EA) nói chung [9], [10] Để đảm bảo tính đa dạng, GP thường bắt đầu quần thể với giải pháp sinh ngẫu nhiên Việc tiến hóa quần thể qua hệ thực cách lựa chọn ngẫu nhiên cá thể để tái tạo, lai ghép, đột biến với xu hướng cá thể tốt có xác http://jst.tnu.edu.vn; Email: jst@tnu.edu.vn 225(09): 61 - 68 suất lựa chọn ưu tiên nhiều cá thể khác Tương tự, việc lựa chọn điểm lai ghép cặp cá thể cha - mẹ trình lai ghép diễn thường ngẫu nhiên Trong trình đột biến, thông thường điểm đột biến xác định cách ngẫu nhiên Đột biến thực cách thay phần ngẫu nhiên chương trình/ cá thể với phần ngẫu nhiên khác nó, phần chương trình sinh ngẫu nhiên điểm đột biến xác định Các cặp cha – mẹ lai ghép khơng thành cơng chép từ hệ cũ đến hệ Có thể nói, với GP, ngẫu nhiên đóng vai trị quan trọng định tính đa dạng quần thể tiến hóa Tuy nhiên, dự đốn nguyên nhân dẫn đến trùng lặp cá thể quần thể GP 2.2 Kiểm tra tính cá thể quần thể hệ Cấu trúc giải pháp quần thể GP thường biểu diễn sử dụng cấu trúc Nhiễm sắc thể (chrome) cá thể đại diện cho cấu trúc giải pháp ảnh hưởng trực tiếp đến ngữ nghĩa chương trình Chrome mang nét đặc trưng riêng, đại diện cho hệ gen cá thể theo tiến hóa tự nhiên, phải Để kiểm tra tính cá thể quần thể hệ, tiến hành theo bước sau: - Tại hệ, chuyển chrome dạng tree cá thể thành xâu (String), lưu xâu chuyển đổi tương ứng vào mảng - Sắp xếp mảng tăng dần, đếm số lần lặp xâu cộng dồn Kết thu tổng số cá thể có trùng lặp quần thể hệ - Lấy trung bình phần trăm tổng số cá thể bị trùng lặp qua 31 lần chạy ta thu đồ thị biểu diễn trùng lặp qua hệ q trình tiến hóa 2.3 Phân tích tác động kích cỡ quần thể lên vấn đề trùng lặp cá thể Để phân tích tác động kích cỡ quần thể lên số lượng cá thể trùng lặp, tiến hành ba thực nghiệm với kích cỡ quần 63 Phạm Thị Thương Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ ĐHTN thể tăng 500, 1000, 1500 giữ nguyên thiết lập thực nghiệm khác Sau đó, với thực nghiệm, thống kê trung bình % cá thể lặp hệ q trình tiến hóa qua 31 lần chạy 2.4 Phân tích xác định nguyên nhân gây trùng lặp cá thể Như phân tích mục 2.1, nguyên nhân dẫn đến trùng lặp cá thể GP dự đoán tác động yếu tố ngẫu nhiên Trong giới tự nhiên, thứ tồn tại, sinh xếp theo trật tự định, trật tự cân hoàn hảo vận hành theo thể thống vũ trụ, người hoa, trái vũ trụ Trật tự tối ưu tiến hóa qua hàng trăm ngàn năm tồn tại, tương tự hệ gen ngẫu nhiên đóng vai trò thứ yếu Tuy nhiên, GP, ngẫu nhiên lại mang tính chủ đạo việc tăng tính đa dạng quần thể gây vấn đề trùng lặp cá thể, điều dẫn đến vi phạm quy luật tự nhiên – sống, cá thể nhất, không giống ai, tương tự hệ gen, vân tay người Để xác định tác động ngẫu nhiên lên số lượng cá thể trùng lặp, chúng phân tích thành phần GP có kết hợp sử dụng yếu tố ngẫu nhiên gồm: (1) khởi tạo quần thể; (2) lựa chọn cặp cha - mẹ lai ghép, trình lai ghép; (3) đột biến, tái tạo Một cách tương ứng thống kê ba đại lượng: (1) số lượng cá thể trùng lặp khởi tạo quần thể ngẫu nhiên; (2) số cá thể bị trùng lặp sau lai ghép, tái tạo hệ; (3) số lượng cá thể bị trùng lặp nguyên nhân khác Tất đại lượng thống kê lấy trung bình qua 31 lần chạy 2.5 Giải vấn đề trùng lặp cá thể quần thể hệ Trong báo đơn giản giải vấn đề trùng lặp cá thể cách hạn chế tối đa việc trùng lặp diễn tác động yếu tố ngẫu nhiên trình GP học, cụ thể sau: Khởi tạo quần thể ngẫu nhiên? 64 225(09): 61 - 68 Để hạn chế vấn đề trùng lặp cá thể (chrome) khởi tạo quần thể, sinh cá thể thay sinh lần, cố gắng sinh lặp lại nhiều lần Cụ thể, cá thể sinh không trùng lặp (so khớp chrome) với cá thể tạo trước thêm vào quần thể cá thể mới; ngược lại sinh lại cá thể mới, công việc thực với số lần lặp tối đa MAXATEMPT lần Lựa chọn cặp cá thể để lai ghép, tái tạo? Khi lựa chọn cặp cha - mẹ lai ghép, hai cá thể cha, mẹ không phép trùng Nếu chọn trùng phải chọn lại, cố gắng thực lặp lại MAXATEMPT lần - Khi lai ghép, lai ghép khơng thành cơng (ví dụ tạo có size vượt q kích cỡ cho phép) GP áp dụng tái tạo, tức chép cặp cha - mẹ vào hệ sau, điều dẫn đến chép lặp lại cha, mẹ chúng chọn ghép cặp lai ghép nhiều lần dẫn đến trùng lặp Để hạn chế trùng lặp, cha, mẹ chọn tối đa lần ghép cặp Lựa chọn điểm lai ghép cha - mẹ thực lai ghép? Luật: gồm ; đó: intf, intm cha, mẹ crossPoint1, crossPoint2 hai điểm lai ghép cha, mẹ tương ứng Bộ giá trị không cho phép chọn lặp lại q trình tiến hóa quần thể để tránh trùng lặp 2.6 Thiết lập thực nghiệm 2.6.1 Các toán thử nghiệm Bảng liệt kê toán sử dụng thử nghiệm nghiên cứu Trong UCI tệp liệu sử dụng phổ biến nghiên cứu GP Ngồi ra, chúng tơi thử nghiệm thêm với tệp liệu mưa lấy từ trạm: Tam Đảo (Rain_1) Cửa Ông (Rain_2) Các tệp liệu đo lượng mưa tích lũy thời điểm 0h 12h ngày Ban đầu liệu dạng chuỗi thời gian, sau biến đổi thành liệu thời điểm phục vụ cho việc học máy Mục đích việc học dự đoán lượng mưa thời điểm xác định (t), với giả thiết lượng mưa thời điểm (t) phụ thuộc vào lượng mưa 10 ngày trước Như vậy, 19 thuộc tính tệp liệu lượng mưa thời điểm 0h http://jst.tnu.edu.vn; Email: jst@tnu.edu.vn Phạm Thị Thương Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ ĐHTN 12h 10 ngày, thuộc tính cịn lại xem biến phụ thuộc (hay lượng mưa cần dự đốn) phụ thuộc vào 19 giá trị biến trước Dữ liệu tập huấn luyện lấy từ năm 2014 đến năm 2018, liệu kiểm thử liệu năm 2019 Việc dự báo lượng mưa thời điểm xác định quan trọng việc hỗ trợ dự báo cảnh báo số tượng khí tượng thủy văn nguy hiểm bối cảnh biến đổi khí hậu Việt Nam Bảng Các bái toán thử nghiệm ID Bài toán UCI_1 UCI_2 UCI_3 UCI_4 UCI_5 UCI_6 Rain_1 Rain_2 Abalone Housing Bupa Census6 No2 Ozone 48_52 48836 Kích cỡ tập huấn luyện 332 336 100 100 100 140 3633 3633 Kích cỡ tệp kiểm tra 167 170 245 300 400 63 730 730 Số lượng biến 13 6 12 19 19 225(09): 61 - 68 3.1 Trùng lặp cá thể tác động kích cỡ quần thể lên vấn đề Sử dụng giải pháp đề xuất mục 2.3 hình trung bình % tổng số cá thể bị trùng lặp qua hệ (qua 31 lần chạy) q trình tiến hóa kích cỡ quần thể tăng 500, 1000 1500 Với kết nhận thấy (1) tượng trùng lặp cá thể tồn quần thể GP; (2) kích cỡ quần thể khơng tác động nhiều đến số lượng thể trùng lặp với đa phần toán (5/8 bài: Abalone, Housing, Bupa, No2, Ozon), nhiên (Census6, 48_52và 48836) số lượng cá thể trùng lặp có xu hướng giảm kích cỡ quần thể tăng 2.6.2 Cấu hình hệ thống Bảng thiết lập tham số tiến hóa GP chúng tơi sử dụng thực nghiệm nghiên cứu báo Bảng Các tham số tiến hóa Tham số EA Function set Terminal set #Generations Population size Tour size Tree creation Max tree depth Crossover rate Mutation rate #Runs Fitness function #Maxatempt GP Elitist, generational, tree expression +, -, *, / (PD) Regression variables; one random constant [0, 1] 300 500 Ramped half-and-half (depths of to 6) 15 0,9 0,1 31 RMSE 20 Kết quả thảo luận Ở mục chúng tơi trình bày kết thu từ thực nghiệm nhằm trả lời câu hỏi nghiên cứu đặt http://jst.tnu.edu.vn; Email: jst@tnu.edu.vn Hình Trung bình % số lượng cá thể lặp qua hệ tương ứng với tốn UCI kích cỡ quần thể tăng 500, 1000, 1500 65 Phạm Thị Thương Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ ĐHTN 225(09): 61 - 68 3.3 Đánh giá giải pháp đề xuất Trong nghiên cứu đơn giản giải vấn đề trùng lặp cách cố gắng hạn chế cách tối đa trùng lặp cá thể xảy tác động ngẫu nhiên Với giải pháp đề xuất kết ta khắc phục hoàn toàn vấn đề trùng lặp xảy quần thể khởi tạo Trùng lặp xảy lựa chọn, lai ghép, tái tạo giảm cách đáng kể với đa phần toán thử nghiệm bảng Bảng Trung bình số lượng cá thể có trùng lặp trước khắc phục sau khắc phục trùng lặp lai ghép Bài toán UCI_1 UCI_2 UCI_3 UCI_4 UCI_5 UCI_6 Rain_1 Rain_2 Hình (Tiếp) 3.2 Nguyên nhân gây trùng lặp cá thể Chúng tiến hành thực nghiệm để thống kê cá thể có trùng lặp xảy khởi tạo quần thể ngẫu nhiên, xảy lai ghép, xảy đột biến nguyên nhân khác Bảng kết thống kê thực với kích cỡ quần thể 500 Bảng Trung bình số lượng cá thể có trùng lặp khởi tạo, lai ghép nguyên nhân khác Trung bình số cá thể có trùng lặp Bài tốn Khởi tạo Lai ghép Khác UCI_1 36,68 10,18 10,87 UCI_2 25,90 10,24 43,50 UCI_3 39,94 10,11 23,39 UCI_4 39,94 9,47 130,75 UCI_5 39,00 10,29 22,51 UCI_6 28,39 10,25 25,80 Rain_1 18,45 9,39 182,72 Rain_2 18,45 9,47 183,35 66 Trung bình số cá thể có trùng lặp Trước Sau 10,18 2,38 10,24 2,39 10,11 2,34 9,47 2,38 10,30 2,38 10,25 2,36 9,39 6,73 9,47 6,89 Khi số lượng cá thể có trùng lặp giảm, góp phần đáng kể việc nâng cao khả khái quát hóa GP hầu hết toán thử nghiệm Bảng trình bày giá trị p values đạt so sánh trung bình lỗi tập test giải pháp tốt mà GP học trước giải vấn đề trùng lặp sau giải vấn đề trùng lặp Từ kết này, thấy 5/8 toán (UCI_1, UCI_3, UCI_4, UCI_5, UCI_6), p values có khác biệt đáng kể khả khái quát hóa GP cải thiện cách đáng kể sau khắc phục vấn đề trùng lặp Một điểm thú vị cần hạn chế trùng lặp gây lai ghép mà khả khái quát hóa GP tăng lên cách rõ rệt với toán Tuy nhiên, với 3/8 lại (UCI_1, Rain_1 Rain_2) khơng có khác biệt đáng kể khả khái quát hóa GP sau giải vấn đề trùng lặp so với trước giải Một nguyên nhân dự đoán số http://jst.tnu.edu.vn; Email: jst@tnu.edu.vn Phạm Thị Thương Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ ĐHTN lượng cá thể trùng lặp cá thể với toán lớn, giải pháp mà đưa khắc phục phần nhỏ số lượng cá thể trùng lặp với toán Bảng p-values, trung bình lỗi tập test giải pháp tốt học GP trước so với sau khắc phục trùng lặp, sử dụng kiểm thử thống kê Mann-Whitney U-test với độ tin cậy 95% Dòng đậm khác biệt đáng kể (1) lỗi test trước so với sau khắc phục trùng lặp lai ghép; (2) trước so với sau khắc phục trùng lặp khởi tạo quần thể lai ghép; (3) trước khắc phục trùng lặp; (4) sau khắc phục trùng lặp lai ghép; (5) sau khắc phục trùng lặp khởi tạo quần thể lai ghép Bài toán UCI_1 UCI_2 UCI_3 UCI_4 UCI_5 UCI_6 Rain_1 Rain_2 p value (1) (2) 0,00 0,02 0,48 0,29 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,26 0,86 0,97 0,19 Fittest (median) (3) (4) (5) 63,58 4,54 4,18 6,26 6,99 6,99 1,36 0,50 0,50 1,21 0,20 0,20 1,98 0,70 0,71 111,2 73,65 75,8 13,07 13,06 13,1 10,03 10,10 10,3 Kết luận Trong nghiên cứu chúng tơi xác định ngun nhân gây trùng lặp, từ đề xuất số giải pháp ban đầu để khắc phục vấn đề Kết cải tiến cách đáng kể khả khái qt hóa GP Nếu gọi n kích thước quần thể; O(f(n)), O(g(n)) độ phức tạp thời gian, khơng gian GP sau khắc phục vấn đề trùng lặp cá thể độ phức tạp không gian thời gian giải pháp đề xuất không đổi n → ∞ Cụ thể, gọi m số lần cá thể trùng lặp q trình tiến hóa, maxatempt số lần cố gắng thực lại phát trùng lặp, m < n MAXATEMPT số, đồng thời nhỏ so với n, m* MAXATEMPT < n n → ∞ Từ đó, ta có O(f(n+m*MAXATEMPT)) = O(f(n)) n → ∞ Tương tự, g(n) hàm xác định số ô nhớ lưu trữ quần thể GP trình kiếm tra khắc phục trùng lặp sử dụng thêm danh sách có kích cỡ n để chứa tần suất cá thể lựa chọn lặp lại, độ phức tạp không http://jst.tnu.edu.vn; Email: jst@tnu.edu.vn 225(09): 61 - 68 gian giải pháp đề xuất O(g(2n) = O(g(n)) n → ∞ Giải vấn đề trùng lặp, đồng thời đảm bảo tính đa dạng quần thể GP thách thức Loại bỏ yếu tố ngẫu nhiên, thay vào quy luật có trật tự tối ưu phản ánh giới tự nhiên, đồng thời đảm bảo tính đa dạng quần thể lại thách thức lớn nhiều đặt nghiên cứu tương lai GP nói riêng cách tiếp cận dựa tính tốn tiến hóa nói chung Lời cám ơn Nghiên cứu hỗ trợ đề tài “Nghiên cứu sở khoa học giải pháp ứng dụng trí tuệ nhân tạo để nhận dạng, hỗ trợ dự báo cảnh báo số tượng khí tượng thủy văn nguy hiểm bối cảnh biến đổi khí hậu Việt Nam”, mã số BĐKH.34/16-20.” TÀI LIỆU THAM KHẢO/ REFERENCES [1] A Rutherford, A Brief History of Everyone Who Ever Lived: The Human Story Retold Through Our Genes, The Experiment, 2018 [2] R John, and Koza, Genetic programming: on the programming of computers by means of natural selection, MIT press, 1992 [3] Poli, Riccardo, Langdon, B William, McPhee, F Nicholas, Koza, and R John, A field guide to genetic programming, Lulu com, 2008 [4] Keijzer, and Maarten, "Alternatives in subtree caching for genetic programming," in European Conference on Genetic Programming, Springer, 2004 [5] Wong, Phillip, Zhang, and Mengjie, "SCHEME: Caching subtrees in genetic programming," in 2008 IEEE Congress on Evolutionary Computation (IEEE World Congress on Computational Intelligence), 2008 [6] W B Langdon, B Y H Lam, J Petke, and M Harman, "Improving CUDA DNA analysis software with genetic programming," in Proceedings of the 2015 Annual Conference on Genetic and Evolutionary Computation, 2015 [7] E Hemberg, L Ho, M O'Neill, and H Claussen, "A symbolic regression approach to manage femtocell coverage using 67 Phạm Thị Thương Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ ĐHTN grammatical genetic programming," in Proceedings of the 13th annual conference companion on Genetic and evolutionary computation, 2011 [8] M Nicolau, and M Fenton, "Managing repetition in grammar-based genetic programming," in Proceedings of the Genetic and Evolutionary Computation Conference 2016, 2016 68 225(09): 61 - 68 [9] D Yagyasen, M Darbari, P K Shukla, and V Kumar, "Diversity and convergence issues in evolutionary multiobjective optimization: application to agriculture science," IERI Procedia, vol 5, pp 81-86, 2013 [10] M M OUVÊA JR, and A F R.ARAÚJO, "Diversity - based adaptive evolutionary algorithms," New Achievements in Evolutionary Computation, pp 318-334, 2010 http://jst.tnu.edu.vn; Email: jst@tnu.edu.vn ... đề trùng lặp cá thể quần thể hệ Trong báo đơn giản giải vấn đề trùng lặp cá thể cách hạn chế tối đa việc trùng lặp di? ??n tác động yếu tố ngẫu nhiên trình GP học, cụ thể sau: Khởi tạo quần thể. .. phục trùng lặp thật hiển nhiên giới tự nhiên Mặc dù cách tiếp cận (4) nhóm tác giả không cho phép trùng lặp di? ??n tập trung vào trùng lặp xảy khởi tạo quần thể cách, phát cá thể tạo trùng với cá thể. .. hạn chế vấn đề trùng lặp cá thể (chrome) khởi tạo quần thể, sinh cá thể thay sinh lần, cố gắng sinh lặp lại nhiều lần Cụ thể, cá thể sinh không trùng lặp (so khớp chrome) với cá thể tạo trước