tiến tính diễn giải được của mô hình mờ kết quả. Đạt được điều này bằng
cách giàm số lượng luật thông qua một chương trìn tối ưu cấu trúc và bằng cách ép những ràng buộc trên những hàm liên thuộc ngõ vào thông qua tinh chỉnh thông số cục bộ.
Toàn bộ chương trình học được thể hiện ở hình 3.2. Mỗi khối biểu đồ thể
3.5 Khởi đầu thông số và cấu trúc
Trong pha học đầu tiên, một cơ sở lậu mờ ban đầu được tạo tự động từ dữ liệu đã cho. Vì thế, pha này có mục đích là tìm đồng thời số luật ( và số lượng tập
mờ ngõ vào được dùng để phân chia những miền ngõ vào) và những thông số định nghĩa phần giả thiết và kết luận của mỗi luật.
3.5.1 Phân chia không gian ngõ vào
Bước đầu tiên của phương pháp là phân chia không gian ngõ vào thành những
miền con. Chiếu những miền này dọc theo những chiều ngõ vào khác nhau sẽ
nhận được những hàm liên thuộc trong phần giả thiết của mỗi luật. Vì thế, cả số lượng luật và những thông số giả thiết của chúng có trực tiếp từ quá trình phân chia.
Để tìm được phân chia thích hợp không gian ngõ vào, chúng ta định nghĩa ba phương pháp mà sẽ được trình bày chi tiết trong phần sau.
3.5.1.1 Cây K-D mờ thích nghi
Trong phương pháp đầu tiên này sẽ đề xuất thuật toán cây K-D mờ thích nghi.
Những cây K-D ban đầu được phát triển như là một cơ cấu lưu trữ dữ liệu hiệu
quả (Orenstein J.A., 1982; Overmans M.H. and Leeuwen J.V., 1982), là một
giải thuật nổi tiếng để phân chia cục bộ không gian ngõ vào thành những tập
con. Thuật giải cây K-D sẽ lặp lại việc phân chia không gian nhiều chiều thành những siêu hình chữ nhật bằng cách chia cắt liên tục các trục trực giao. Mỗi lần
chia cắt sẽ được thực hiện qua toàn bộ miền của một miền đang có và tạo ra hai
miền mới mà chính chúng cũng lại được chia cắt sau đó. Một cấu trúc cây xác định được tạo ra mà những lá của nó thể hiện những vùng cục bộ của không
gian ngõ vào. Hình 3.3 mô tả bốn vòng lặp đầu tiên của một cây giải thuật k-d. Những ý tưởng gần đây nhất đã mở rộng để tạo ra những cây k-d mờ để nhận
dạng thông số những hàm liên thuộc mờ hình thang cho những mô hình mờ TS.
Trong những trường hợp như thế, những giá trị liên thuộc được liên kết với mỗi
phần chia có được từ việc phân chia để mà mỗi siêu hình chữ nhật có thể được xem như phần của những tập mờ nhiều biến. Chính xác hơn, tâm của mỗi hình chữ nhật chính là tâm của mỗi hàm liên thuộc Gauss. Độ rộng của hàm này
được chọn tỉ lệ với kích thước của siêu hình chữ nhật.
Theo sau những ý tưởng này, chúng ta sẽ phát triển một thuật toán cây k-d mờ thích nghi mà lặp lại việc phân chia không gian ngõ vào thành những vùng con siêu hình chữ nhật, với mỗi vùng con thể hiện phần giả thiết của luật mờ.
Thuật toán làm việc như sau. Tại mỗi lần lặp, một vùng con được phân chia
thành hai nữa vùng con. Khi bắt đầu bước thứ K, không gian ngõ vào được
cho một trong những siêu hình chữ nhật để phân chia toàn bộ vùng thành K+1 phần.
Hình 3.2. Sơ đồ học ba pha
Hình 3.3. Phân chia không gian hai chiều bằng cây k-d
Có rất nhiều cách để quyết định miền nào được phân chia và nơi phân chia tại
thức đơn giản nhất là phân chia vùng mà dữ liệu huấn luyện liên quan với vùng này là rộng nhất và chia nó tại điểm giữa của những mẫu ttrong miền. Và một
tiêu chuẩn dựa trên khái niệm độ lợi thông tin trong những cây quyết định có
thể được áp dụng. Trong phần này, chiến lược quyết định miền nào sẽ được phân chia và nơi phân chia tại mỗi bước dựa trên hai hàm mục tiêu cụm mờ: đo
mật độ JDvà đo độ đặc trưng JT. Chúng được định nghĩa như sau:
(3.17) (3.18) với ck=(c1k,…,cnk) là tâm của siêu hình chữ nhật thứ k, dE(.,.) là khoảng cách
Eclit và tk là giá trị hàm liên thuộc của véctơ ngõ vào x(t) của siêu hình chữ
nhật thứ k, được định nghĩa như sau:
(3.19)
với các thông số aik và cik được tính toán phụ thuộc vào những siêu hình chữ
nhật có được từ việc phân chia.
Việc dùng hai hàm đối tượng này cho phép tìm một cấu trúc có nghĩa cho
việc phân chia mờ ngõ vào. Giả sử cơ bản của phương pháp này là những luật
mờ tốt thường được thể hiện bởi một miền con mà có tâm và độ rộng phụ thuộc
vào mẫu. Việc đo mật độ và tính đặc trưng liên quan đến độ hổ trợ (khoảng giá
trị liên thuộc lớn hơn không) và lõi (khoảng giá trị liên thuộc đầy đủ). Để đạt được những tập mờ với độ hổ trợ mạnh (JD nhỏ) và lõi đại diện(JT nhỏ), ta chọn
tổng của hai hàm này là hàm mục tiêu cho quá trình phân chia:
J(K)=JD(K)+JT(K) K=1,2,… (3.20) Tại mỗi bước, sẽ kiểm tra việc phân chia trong tất cả các chiều cho hàm đối tượng, điều đó có nghĩa là giá trị của J() được tính với những phân vùng mờ có được từ tất cả những chia cắt có thể có và sẽ chọn ra một phân vùng với giá trị
nhỏ nhất của J() để tiếp tục quá trình phân chia.
Thực ra ta không cần phải tìm phân vùng rất nhỏ của không gian ngõ vào vì
điều đó sẽ làm cho việc tính toán phức tạp, ta chỉ cần tìm một phân vùng thoả
mãn mà sẽ tạo ra một xấp xỉ đầu tiên của cơ sở luật mờ (và sẽ được cải tiến
trong pha học thứ hai). Theo đó, thuật toán phân chia sẽ dừng ngay khi điều
kiện sau thoả mãn:
K J K1
JT T (3.21) với là một ngưỡng nhỏ nào đó. Theo cách này sẽ đạt được K vùng siêu hình