Để thực hiện đánh giá kết quả của toán tử lai ghép dựa trên ngữ nghĩa, luận án tiến hành thử nghiệm như sau:
a. Tập hợp bài toán
62 lai ghép thông thường và các hệ GP khác, mười bài toán hồi quy ký hiệu với giá trị thực được sử dụng để làm thử nghiệm.
Những bài toán này được chia thành ba nhóm: học hàm đa thức; hàm lượng giác, logarit và căn; và hàm hai biến. Hầu hết các hàm này được lấy từ các nghiên cứu của Hoài và cộng sự [61] và Keijzer [73]. Đây là các bài toán được sử dụng rộng rãi trong việc đánh giá hiệu quả các hệ thống GP.
Nhiệm vụ của TAG3P là học hàm dạng biểu thức để tìm kiếm được mô hình phù hợp nhất trên cơ sở tập dữ liệu mẫu hữu hạn. Tập dữ liệu mẫu này được gọi là tập dữ liệu học.
Tập dữ liệu học trong thử nghiệm này là 20 giá trị ngẫu nhiên với hàm một biến và 100 cặp giá trị ngẫu nhiên với hàm hai biến trong một khoảng giá trị. Những hàm và tập dữ liệu được thể hiện trong bảng sau.
Hàm số Tập dữ liệu học
F1 = x3 + x2 + x 20 giá trị ngẫu nhiên trong đoạn [-1;1] F2 = x4 + x3 + x2 + x 20 giá trị ngẫu nhiên trong đoạn [-1;1] F3 = x5 + x4 + x3 + x2 + x 20 giá trị ngẫu nhiên trong đoạn [-1;1] F4 = x6 + x5 + x4 + x3 + x2 + x 20 giá trị ngẫu nhiên trong đoạn [-1;1] F5 = sin(x2)cos(x) - 1 20 giá trị ngẫu nhiên trong đoạn [-1;1] F6 = sin(x) + sin(x + x2) 20 giá trị ngẫu nhiên trong đoạn [-1;1] F7 = log (x + 1) + log(x2+ 1) 20 giá trị ngẫu nhiên trong đoạn [0;2]
F8=√ 20 giá trị ngẫu nhiên trong đoạn [0;4]
F9 = sin(x) + sin(y2) 100 cặp giá trị ngẫu nhiên trong đoạn [-1;1]x[-1;1]
F10 = 2sin(x)cos(y) 100 cặp giá trị ngẫu nhiên trong đoạn [-1;1]x[-1;1]
63
b. Cấu hình tham số
Thử nghiệm được thiết lập thông số cấu hình như bảng sau để tiến hành học các hàm số ở trên.
Tham số Giá trị
Số cá thể 500
Số thế hệ 50
Phương pháp lựa chọn Cạnh tranh
Kích cỡ lựa chọn 3
Xác xuất các toán tử Lai ghép = 0.9, Đột biến = 0.1
Kích thước tối đa 40
Ký hiệu không kết +, -, *, /
sin, cos, exp, log Ký hiệu kết x, 1 với hàm một biến
x, y với hàm hai biến Độ tốt Tổng các lỗi tuyệt đối trên tất cả
các dữ liệu học
Điều kiện đạt Khi một cá thể có lỗi tuyệt đối nhỏ hơn 0.01 trên tất cả các dữ liệu học Lần chạy thành công Khi một cá thể có điều kiện đạt trên tất
cả các dữ liệu học Số cặp cây con lựa chọn để tính
ngữ nghĩa (N) 10
Số lần chạy thử nghiệm Một trăm lần chạy thử nghiệm
Bảng 3.2 Cấu hình thử nghiệm c. Kết quả
Để so sánh kết quả của các toán tử lai ghép dựa trên ngữ nghĩa so với toán tử lai ghép thông thường trên hệ TAG3P, các thử nghiệm học hàm dựa trên cấu hình trong mục a,b ở trên được tiến hành.
64 Với mỗi thử nghiệm ở trên sẽ thực hiện lưu trữ các kết quả sau để so sánh: 1. Tỷ lệ số lần chạy thành công/100 lần chạy thử nghiệm. (điều kiện
thành công được mô tả trong bảng 3.2)
2. Trung bình độ tốt của 100 lần chạy thử nghiệm
3. Trung bình của sự thay đổi độ tốt sau khi thực hiện lai ghép. Các kết quả thử nghiệm thu được như sau:
Thử nghiệm F1 F2 F3 F4 F5 F6 F7 F8 F9 F10 TAG3P 100 92 82 50 23 30 35 10 12 20 TAG3P_BG_RD 93 83 78 57 19 28 32 11 8 19 TAG3P_GG_RD 96 83 82 53 24 28 28 10 10 22 TAG3P_GG_MAX 93 84 85 56 21 30 27 9 9 21 TAG3P_GG_MIN 95 87 82 52 22 32 31 11 9 18 TAG3P_BB_RD 100 100 89 72 32 40 49 25 22 36 TAG3P_BB_MAX 100 100 95 80 42 53 54 28 30 47 TAG3P_BB_MIN 100 100 90 70 34 43 48 26 25 39
Bảng 3.3. Số lần chạy thử nghiệm thành công
Đánh giá kết quả:
- Khi thực hiện lai ghép những cây con có ngữ nghĩa là âm (cây con ảnh hưởng tốt) với nhau hoặc giữa cây con có ngữ nghĩa với giá trị âm với cây con có ngữ nghĩa với giá trị dương (cây con ảnh hưởng tốt lai ghép với cây con có ảnh hưởng xấu) như TAG3P_GG_RD, TAG3P_GG_MAX, TAG3P_GG_MIN, TAG3P_BG_RD, kết quả thu được thường xấp xỉ như kết quả TAG3P (không có qui luật rõ ràng, lúc kết quả tốt hơn, lúc kết quả xấu hơn). Như vậy có thể thấy khi thực hiện toán tử lai ghép mà tiến hành lai ghép ở những vị trí cây con có ngữ nghĩa như vậy sẽ không có cải tiến về kết quả.
- Khi thực hiện lai ghép những cây con có ảnh hưởng xấu với nhau (TAG3P_BB_RD, TAG3P_BB_MAX, TAG3P_BB_MIN) thì kết quả thu được tốt hơn TAG3P, đặc biệt là những hàm F1-F4. Trong đó, TAG3P_BB_MAX có kết quả tốt hơn cả. Như vậy có thể thấy nếu tiến hành lai ghép ở 2 vị trí cây con
65 có ảnh hưởng xấu (ngữ nghĩa dương) thì thu được kết quả cải tiến đáng kể, đặc biệt với trường hợp lai ghép ở vị trí mà tổng giá trị ngữ nghĩa của hai cây con đó là lớn nhất. Thử nghiệm F1 F2 F3 F4 F5 F6 F7 F8 F9 F10 TAG3P 0.12 0.21 0.29 0.33 0.19 0.21 0.23 0.25 5.22 2.13 TAG3P_BG 0.27 0.32 0.36 0.52 0.25 0.19 0.22 0.24 5.33 2.39 TAG3P_GG_RD 0.27 0.29 0.35 0.43 0.23 0.22 0.24 0.31 5.15 2 TAG3P_GG_MAX 0.18 0.34 0.3 0.47 0.22 0.2 0.21 0.21 4.97 2.21 TAG3P_GG_MIN 0.21 0.22 0.34 0.42 0.2 0.23 0.23 0.24 5.03 2.37 TAG3P_BB_RD 0.11 0.19 0.22 0.32 0.18 0.14 0.13 0.22 4.19 2.15 TAG3P_BB_MAX 0.1 0.18 0.21 0.31 0.12 0.1 0.11 0.17 4.01 1.98 TAG3P_BB_MIN 0.12 0.2 0.25 0.33 0.15 0.13 0.13 0.2 4.23 2.03
Bảng 3.4. Trung bình độ tốt của 100 lần chạy thử nghiệm
Đánh giá kết quả:
- Khi thực hiện lai ghép những cây con có ngữ nghĩa là âm (cây con ảnh hưởng tốt) với nhau hoặc giữa cây con có ngữ nghĩa với giá trị âm với cây con có ngữ nghĩa với giá trị dương (cây con ảnh hưởng tốt lai ghép với cây con có ảnh hưởng xấu) như TAG3P_GG_RD, TAG3P_GG_MAX, TAG3P_GG_MIN, TAG3P_BG_RD, kết quả thu được thường xấp xỉ như kết quả TAG3P (không có qui luật rõ ràng, lúc kết quả tốt hơn, lúc kết quả xấu hơn). Như vậy có thể thấy khi thực hiện toán tử lai ghép mà tiến hành lai ghép ở những vị trí cây con có ngữ nghĩa thế này sẽ không có cải tiến về kết quả.
- Khi thực hiện lai ghép những cây con có ảnh hưởng xấu với nhau (TAG3P_BB_RD, TAG3P_BB_MAX, TAG3P_BB_MIN) thì kết quả thu được tốt hơn TAG3P. Trong đó, TAG3P_BB_MAX có kết quả tốt nhất. Như vậy có thể thấy nếu tiến hành lai ghép ở 2 vị trí cây con có ảnh hưởng xấu thì thu được kết quả cải tiến, đặc biệt với trường hợp lai ghép ở vị trí mà tổng giá trị ngữ nghĩa của hai cây con đó là lớn nhất.
66 Thử nghiệm F1 F2 F3 F4 F5 F6 F7 F8 F9 F10 TAG3P 9.23 10.22 7.78 8.78 7.58 7.22 8.13 9.11 23.32 20.06 TAG3P_BG 9.41 9.3 10.11 10.87 7.12 7.47 8.34 9.39 23.18 22.12 TAG3P_GG_RD 9.28 10.11 10.02 11.07 8.09 7.83 8.17 9.43 24.47 21.04 TAG3P_GG_MAX 9.73 9.41 10.32 11.32 7.27 8.18 8.27 9.13 24.17 21.78 TAG3P_GG_MIN 9.42 10.05 11.03 10.33 7.74 7.83 8.12 8.67 23.88 20.23 TAG3P_BB_RD 8.24 8.09 8.23 8.22 6.96 6.23 7.23 8.02 20.22 18.01 TAG3P_BB_MAX 7.25 7.39 8.89 7.69 6.56 6.43 6.78 7.11 19.01 17.66 TAG3P_BB_MIN 8.21 8.19 8.43 8.52 6.18 6.31 7.13 8.37 21.43 18.26
Bảng 3.5. Trung bình thay đổi độ tốt sau khi thực hiện lai ghép
Đánh giá kết quả:
- Khi thực hiện lai ghép những cây con có ngữ nghĩa là âm (cây con ảnh hưởng tốt) với nhau hoặc giữa cây con có ngữ nghĩa với giá trị âm với cây con có ngữ nghĩa với giá trị dương (cây con ảnh hưởng tốt lai ghép với cây con có ảnh hưởng xấu) như TAG3P_GG_RD, TAG3P_GG_MAX, TAG3P_GG_MIN, TAG3P_BG, kết quả thu được thường xấp xỉ như kết quả TAG3P. Như vậy có thể thấy khi thực hiện toán tử lai ghép mà tiến hành lai ghép ở những vị trí cây con có ngữ nghĩa như vậy sẽ không có cải tiến về kết quả.
- Khi thực hiện lai ghép những cây con có ảnh hưởng xấu với nhau (TAG3P_BB_MRD, TAG3P_BB_MAX, TAG3P_BB_MIN) thì kết quả thu được tốt hơn TAG3P.
Kết luận: Với các kết quả thu được ở trên, có thể rút ra kết luận là tiến hành lai ghép ở hai vị trí cây con có ngữ nghĩa dương (cây con có ảnh hưởng xấu) sẽ thu được kết quả tốt, trong đó, đặc biệt khi vị trí lai ghép là hai cây con có ảnh hưởng xấu mà tổng giá trị ngữ nghĩa của hai cây con đó là lớn nhất thì thu được kết quả tốt hơn cả.
67