Trong nhúm giải phỏp này, điểm khỏc đặc biệt với nhúm giải phỏp thứ nhất là ở chỗ FB (Fuzzy Base) khụng cố định một lần khi xõy dựng hệ luật mờ mà luụn thay đổi với mong muốn cú thể tỡm ra mặt Pareto tốt nhất. Giải thuật thƣờng dựng ở đõy là giải thuật đồng tiến húa (coevolutionary approach), một dạng tổng quỏt của GA. Trong giải thuật này, một nhiễm sắc thể đƣợc mó húa gồm 2 phần riờng biệt: một phần chứa mó liờn quan đến FB (số miền mờ đƣợc phõn chia cho từng thuộc tớnh và tham số của tam giỏc là đồ thị hàm thuộc tƣơng ứng của từng miền mờ), một phần chứa mó liờn quan đến hệ luật mờ, gọi tắt là RB (rule base) gồm cú số luật, cỏc thành phần tham gia vào mỗi luật. Hàm tuơng thớch Fitness = Fitness = k1R1 + k2R2 nhƣ đó nờu ở trờn
Sau khi khởi tạo, tiến hành xõy dựng một FB. Với FB này, dựng giải thuật kiểu GA để tạo ra một lời giải Pareto RB. Sau đú lại quay lại thay đổi FB để từ
37
Số húa bởi Trung tõm Học liệu http://www.lrc-tnu.edu.vn/
đú tạo ra một lời giải Pareto RB khỏc. Với bài toỏn hồi quy, mỗi RB là lời giải Pareto, ngoài số đếm về tổng số luật cú trong RB và số thuộc tớnh tham gia trong mỗi luật, ta sẽ tớnh sai số của mụ hỡnh theo độ lệch trung bỡnh bỡnh phƣơng MSE (Mean squared error).
trong đú là kớch thƣớc tập dữ liệu, là đầu ra nhận đƣợc từ hệ luật với đầu vào là mẫu kiểm tra thứ l cũn là giỏ trị đầu ra thực sự của mẫu kiểm tra này. Quỏ trỡnh này sẽ kộo dài đến khi quỏ trỡnh tiến húa khụng sinh ra thờm lời giải Pareto cú sai số nhỏ hơn sai số của cỏc lời giải trƣớc ( hoặc khỏc biệt nhỏ hơn một ngƣỡng cho trƣớc) hoặc số vũng tiến húa lớn hơn một ngƣỡng xỏc định.
Ta thấy, với sự thay đổi FB, khả năng tạo ra cỏc RB tốt là lớn hơn so với việc ta cố định FB từ đầu, dự FB đú cú là tối ƣu theo một nghĩa nào đú. Tuy nhiờn, cỏi giỏ phải trả là khối lƣợng tớnh toỏn, bộ nhớ sử dụng cũng là rất lớn. Do đú, thụng thƣờng với nhúm giải phỏp này, ngƣời ta phải cú một số hạn chế nhất định đối với thuật toỏn, chẳng hạn nhƣ thay đổi FB chỉ trong giới hạn rất nhỏ, hay việc kiểm tra đỏnh giỏ sai số sẽ tiến hành trờn một phần chọn ra của tập mẫu (CSDL ban đầu)... Dự sao, cựng với sự tăng tiến khụng ngừng của nguồn lực CNTT, cỏc giải phỏp này dần đƣợc sử dụng rộng rói, mang lại những kết quả đỏng khớch lệ trong lĩnh vực khai phỏ dữ liệu.
38
Số húa bởi Trung tõm Học liệu http://www.lrc-tnu.edu.vn/
Chƣơng 3:
CHƢƠNG TRèNH THỬ NGHIỆM
Trong phần này, tỏc giả trỡnh bày giải thuật tối ƣu hệ luật mờ từ một hệ luật mờ đó cú ban đầu với mục tiờu là xõy dựng một hệ luật mờ tối giản nhƣng vẫn đảm bảo sai số mộ hỡnh là ở ngƣỡng chấp nhận đƣợc. Thực chất, GA sẽ cho ra một mặt Pareto gồm một tập cỏc lời giải Pareto. Ngƣời dựng cú thể lựa chọn lời giải thớch hợp nhất cho riờng mỡnh. Vỡ hạn chế về thời gian làm luận văn, ở đõy tỏc giả chỉ giới hạn chƣơng trỡnh là tiến hành tối ưu hệ luật mờ từ một hệ luật
mờ ban đầu cú đƣợc do cỏc tập mờ tam giỏc tự chọn, khụng tiến hành xõy dựng
chương trỡnh tối ưu cỏc tham số của tập mờ.