4.2 Bài toán phân lớp các loại ho a IRIS
4.2.1 Áp dụng thuật toán sinh luật IFRG1
Với thuật tốn IFRG1 khơng hạn chế về số gia tử, chúng ta sử dụng ĐSGT
gồm 4 gia tử H-
= {L, P} và H+ = {M, V}. Bài tốn IRIS có 4 thuộc tính nên bộ
tham số cần tối ưu sẽ là PAR = {fmj(L), µj(P), µj(L), µj(M), µj(V), kj : j = 1,...,4 }.
Áp dụng thuật tốn FPO-SGA để tìm kiếm tối ưu bộ tham số này, đặt trọng số hàm
fitness là wp = 0.7, wn = 0.3 và wa = 0 (chọn wa = 0 vì thuật tốn IFRG1 sinh hệ luật
có độ dài như nhau và bằng số thuộc tính), ngưỡng hợp các luật là θitg = 0.1. Giới hạn các tham số gồm 0.1 < fmj(L), µj(P), µj(L), µj(M), µj(V) < 0.9 và 1 ≤ kj ≤ 5. Kích thước quần thể trong mỗi thế hệ là Np = 500, số thế hệ tiến hóa Gmax = 150. Kết quả bộ tham số thu được trong Bảng 4.1, hệ luật sinh gồm 7 luật (Bảng 4.2) với tỷ lệ
phân lớp đúng đạt 100%. Ở đây không áp dụng trọng số luật (tức là CF0
= 1) và phương pháp lập luận là single-winner-rule.
Bảng 4.1: Các tham số gia tử tối ưu của thuật toán FPO-SGA cho bài toán IRIS
Sepal length Sepal width Petal length Petal width fm(c-) 0.825 0.869 0.671 0.279 fm(c+) 0.175 0.131 0.329 0.721 µ(L) 0.295 0.141 0.172 0.106 µ(P) 0.188 0.278 0.252 0.138 µ(M) 0.281 0.369 0.259 0.325 µ(V) 0.236 0.212 0.317 0.431 kj 3 3 4 3
115
Bảng 4.2: Danh sách các luật kết quả của thuật toán FPO-SGA cho bài toán IRIS
R1 if SL is short, SW is short, PL is V.short, and PW is short then Setosa
(0, 0.427, 0.825) (0, 0.505, 0.869) (0, 0.123, 0.213) (0, 0.211, 0.279) c = 1, s = 0.056
R2 if SL is M.short, SW is long, PL is VMV.short, and PW is short then Setosa
(0.195, 0.315, 0.427) (0.869, 0.924, 1) (0.067, 0.077, 0.085) (0, 0.211, 0.279)
c = 1, s = 0.001
R3 if SL is short, SW is short, PL is short, and PW is long then Versicolor
(0,0.427,0.825) (0,0.505,0.869) (0,0.386,0.671) (0.279,0.455,1) c=0.867, s=0.097
R4 if SL is short, SW is M.short, PL is PP.long, and PW is PL.long then Versicolor
(0,0.427,0.825) (0.184,0.371,0.505) (0.671,0.685,0.704) (0.59,0.614,0.691)
c=0.819, s=0.003
R5 if SL is short, SW is short, PL is long, and PW is long then Virginica
(0,0.427,0.825) (0,0.505,0.869) (0.671,0.81,1) (0.279,0.455,1) c=0.895, s=0.052
R6 if SL is long, SW is short, PL is long, and PW is long then Virginica
(0.825,0.91,1) (0,0.505,0.869) (0.671,0.81,1) (0.279,0.455,1) c=1, s=0.009
R7 if SL is short, SW is M.short, PL is P.short, and PW is L.long then Virginica
(0,0.427,0.825)(0.184,0.371,0.505)(0.556,0.622,0.671)(0.59,0.647,0.824) c=0.615, s=0.01
Tiếp theo sử dụng bộ tham số đã tối ưu ở trên để ứng dụng thử nghiệm bài
toán trong ba trường hợp LV1, CV10 và CV50. Đối với LV1, kết quả hệ luật tại mỗi lần chạy đều có 7 luật, số lỗi phân lớp trên tập sinh luật là 0 và trên tập kiểm tra là 2 tại hai mẫu kiểm tra (mẫu 77 và 83). Chạy 10 lần CV10, hệ luật trong các lần chạy từ 6 đến 7 luật, số lỗi trên tập sinh luật là 0 và trên tập kiểm tra từ 0 đến 2. Trong
CV50 chạy 50 lần, các lần chạy với hệ luật từ 5 đến 7 luật, số lỗi trên tập sinh luật từ
0 đến 3 và số lỗi trên tập kiểm tra từ 0 đến 8. Đánh giá trung bình các kết quả thể hiện trong Bảng 4.3 (dấu “/” khơng có kết quả) và so sánh với các phương pháp khác thì thuật tốn IFRG1 đạt hiệu quả phân lớp khá tốt trên tập kiểm tra. Chẳng
hạn, trong LV1 cao hơn các phương pháp và bằng [50], đối với CV50 bằng [43],
thấp hơn [17], [56] và cao hơn [60], [50].
Bảng 4.3: Kết quả của thuật toán IFRG1 và so sánh với các phương pháp FRBCS
khác trên bài toán IRIS
Phương pháp PNr PTr (%) PTe (%)
Leave-one-out (LV1)
116
M. Grabisch, F. Dispot [26] / / 94.33
Bayes Classifier / / 97.33
X.G. Chang, J.H. Lilly [16] 4.75 / 98
A. Khotanzad, E. Zhou [50] 5.4 / 98.67
Thuật toán IFRG1 7 100 98.67
10 folds cross-validation (CV10)
Thuật toán IFRG1 6.96 100 98.67
2 folds cross-validation (CV50) E. G. Mansoori và cộng sự [60] 9 / 77.87 A. Khotanzad, E. Zhou [50] 3.5 / 95.5 C.C. Chen [17] 4.73 / 96.8 H. Ishibuchi, T. Yamamoto [43] 3 / 96.4 C.Y. Lee và cộng sự [56] / / 98.0
Thuật toán IFRG1 6.59 99.65 96.39