Bài toán phân lớp hạt giống lúa mì được các nhà khoa học tại viện Agrophysics của Viện hàn lâm Khoa học Ba Lan tại Lublin nghiên cứu. Bài toán gồm có 7 thuộc tính là các tính chất hình học của 3 loại hạt lúa mì: Kama, Rosa và Canadian, các thuộc tính bao gồm: area(A), Perimeter(chu vi hạt - P), Compactness (Độ chặt - C), length of kernel (Chiều dài của nhân - LK), width of kernel (Chiều rộng của nhân - WK), asymmetry coefficient (hệ số không đối xứng - AC) và length of kernel groove (Chiều dài rãnh của nhân - LKG). Giá trị của các thuộc tính này đều là các giá trị thực. Tập dữ liệu gồm 210 mẫu với 3 lớp gồm Kama(0), Rosa(1) và Canadian(2). Tỷ lệ số mẫu trong mỗi lớp tương ứng là: 70/0, 70/1, 70/2.
Sơ đồ phân bố các dữ liệu mẫu theo từng cặp thuộc tính trên 3 lớp được thể hiện trên hình 3.1, thuộc tính width of kernel (WK) được thể hiện trên cả hai hình 3.1c và 3.1d bởi vì thuộc tính lẻ ra cần được kết hợp để thể hiện dưới dạng sơ đồ hai chiều.
(3.1a)
(3.1c)
(3.1d)
Hình 3.1 Sơ đồ phân bố dữ liệu giữa các lớp của bài toán Seeds
Chúng ta sẽ chạy thuật toán FPO-SGA tối ưu tham số mờ gia tử cho bài toán. Các tham số chạy thuật toán tối ưu gồm: kích thước quần thể Np=30 cá thể, số thế hệ tiến hóa là Gmax = 30, ràng buộc các tham số là 0.1≤ fm(c-),
µ(L)≤ 0.9, k≤ 3, trọng số các hàm fitness là wp = 0.99, wn = 0.01.
Với bộ tham số mờ chưa được tối ưu tức là tất cả các giá trị fmj(c-) = 0.5, µj(L) = 0.5, mức phân hoạch kj = 1, số luật sinh sinh ra gồm 21 luật, số lỗi phân lớp là 21/210 mẫu dữ liệu, tỉ lệ phân lớp đúng là 90%.
Với bộ tham số mờ được tinh chỉnh bằng trực quan (bảng 3.1) thì hệ luật sinh ra gồm 139 luật, số lỗi phân lớp là 5/210 mẫu dữ liệu, tỉ lệ phân lớp đúng là 97.62%.
Kết quả tối ưu bộ tham số mờ cùng mức phân hoạch được thể hiện trong bảng 3.2, hệ luật sinh ra gồm 177 luật, số lỗi phân lớp là 0/210 mẫu dữ liệu, hiệu quả phân lớp đạt 100%.
Bảng 3.1 Các tham số gia tử tinh chỉnh bằng trực quan của bài toán Seeds
Thuộc tính fmj(c-) fmj(c+) µj(L) µj(V) kj A 0.778 0.222 0. 127 0.873 1 P 0. 63 0.37 0. 585 0.415 3 C 0. 573 0.427 0. 598 0.402 3 LK 0. 559 0.441 0. 853 0.147 2 WK 0. 884 0.116 0. 318 0.692 3 AC 0.611 0.389 0. 437 0.563 3 LKG 0. 104 0.896 0. 637 0.363 2 Bảng 3.2 Các tham số gia tử tối ưu bằng thuật toán FBO-SGA cho bài toán Seeds Thuộc tính fmj(c-) fmj(c+) µj(L) µj(V) kj A 0.682 0.318 0.672 0.328 3 P 0.31 0.69 0.315 0.685 3 C 0.268 0.732 0.469 0.531 3 LK 0.184 0.816 0.777 0.223 2 WK 0.13 0.87 0.505 0.495 3 AC 0.36 0.64 0.566 0.434 3 LKG 0.28 0.72 0.688 0.312 2
Bảng 3.3 So sánh về số lỗi và tỉ lệ phân lớp giữa các bộ tham số
Phương pháp tinh chỉnh bộ tham số Số lỗi Tỉ lệ phân lớp
Mặc định 21 90%
Trực quan 5 97.63%
Tự động 0 100%