Thiết kế phân hoạch mờ là bài toán đầu tiên cần giải quyết khi thực hiện giải bài toán dựa trên hệ luật mờ. Việc thiết kế phân hoạch mờ là công việc quan trọng, nó quyết định đến việc thiết kế thuật toán sinh luật và quá trình tìm kiếm tối ưu hệ luật mờ.
Khi thiết kế phân hoạch chúng ta phải lựa chọn dạng phân hoạch, dạng tập mờ, tham số tập mờ, số tập mờ sử dụng. Hầu hết các thuật toán đã đề xuất theo lý thuyết tập mờ đều sử dụng phân hoạch dạng đơn thể hạt [10-14], [38-43]. Việc sử dụng phân hoạch mờ đơn thể hạt nhằm giảm bớt không gian luật ứng cử được sinh ra do các luật được sinh ra dựa trên tổ hợp của tất cả khả năng có thể của các tập mờ dùng để phân hoạch các thuộc tính. Theo cách sinh luật này thì số luật phải xem xét là hàm mũ theo số thuộc tính của bài toán. Sử dụng phân hoạch đơn hạt cũng nhằm làm giảm số tham số cần điều chỉnh khi thực hiện điều chỉnh tập mờ do số tập mờ dùng để xây dựng phân hoạch thường ít hơn nhiều so với sử dụng đa thể hạt, và ngoài ra nó còn làm
tăng tính dễ giải nghĩa của hệ luật. Tuy nhiên nó lại làm giảm độ chính xác của hệ luật.
Phân hoạch mờ dạng đa thể hạt là sử dụng nhiều phân hoạch mờ đơn thể hạt trên một thuộc tính. Thông thường các phân hoạch mờ đơn thể hạt được sử dụng trong phân hoạch mờ dạng đa thể hạt được thiết kế với các từ ngôn ngữ từ khái quát đến đặc tả. Sử dụng phân hoạch mờ đa thể hạt có tiềm năng nâng cao độ chính xác của hệ luật. Các tiếp cận theo lý thuyết tập mờ cho rằng, phân hoạch mờ đa thể hạt gây khó hiểu với người dùng, tức tính giải nghĩa được kém đồng thời làm tăng độ phức tạp trong quá trình tối ưu hệ luật [16-17], [37]. Do số lượng từ ngôn ngữ được sử dụng trên một thuộc tính nhiều dẫn đến số lượng tham số lớn nếu phải học điều chỉnh tham số tập mờ. Vì lý do này mà không nhiều đề xuất sử dụng phân hoạch đa thể hạt.
02 Vc- Lc- Lc+ Vc+ 12
01 c- W c+ 11
Hình 2.1. Thiết kế phân hoạch đa thể hạt dựa trên ĐSGT trong [59]
02 Vc- Lc- Lc+ Vc+ 12
01 c- c+ 11
00 W 10
Hình 2.2. Một thiết kế phân hoạch mờ đa thể hạt với độ dài tối đa của từ là 2 trong [62] ĐSGT khai thác thứ tự ngữ nghĩa dựa trên ngữ nghĩa vốn có của các từ trong miền giá trị ngôn ngữ của một biến ngôn ngữ để hình thành một cơ sở hình thức toán học, thực hiện ánh xạ ngữ nghĩa vốn có của từ thành ngữ nghĩa định lượng của nó
dạng điểm hoặc khoảng (ĐSGT tuyến tính mở rộng). Dựa trên ngữ nghĩa định lượng, ngữ nghĩa dựa trên tập mờ của từ được xây dựng. Trong [59], [61-63] các tác giả đã áp dụng ĐSGT để xây dựng các phân hoạch mờ cho các biến ngôn ngữ với tập mờ dạng tam giác hoặc hình thang cho các hệ phân lớp, hồi quy dựa trên luật mờ. Các hệ luật mờ thu được đều cho kết quả tốt so với các phương pháp dựa trên lý thuyết tập mờ.
02 Vc- Lc- Lc+ Vc+ 12
01 c- W c+ 11
Hình 2.3. Một thiết kế phân hoạch mờ đa thể hạt với hàm thuộc hình thang trong [61] Trong [61] Nguyễn Cát Hồ và cộng sự chứng tỏ rằng, tập mờ dạng hình thang cho kết quả tốt hơn tập mờ dạng tam giác. Tam giác chỉ là trường hợp riêng của hình
thang khi đáy trên của nó là một điểm, do đó nó biểu diễn ngữ nghĩa của từ tốt hơn tam giác là điều dễ hiểu. Thực tế chúng ta thấy rằng cả 2 dạng tập mờ này đều vẫn còn hạn chế bởi cả hai dạng tập mờ này đều có 2 cạnh bên được biểu diễn bằng hàm tuyến tính nên chưa thật mềm dẻo và phù hợp với tính mờ của từ ngôn ngữ. Luận án đề xuất một phương pháp thiết kế ngữ nghĩa tính toán dựa trên tập mờ được thiết kế dựa trên việc kết hợp hàm S và ngữ nghĩa khoảng được sinh bởi ĐSGT mở rộng cho các hệ phân lớp và hồi quy. Do hàm S là hàm phi tuyến nên nó sẽ phù hợp với sự biến thiên về ngữ nghĩa vốn có của các từ ngôn ngữ.
Mặt khác, khi thiết kế các phân hoạch mờ để đảm bảo tính giải nghĩa được ở mức phân hoạch thì ngữ nghĩa dạng tập mờ của từ phải đảm bảo được tính khái quát
– đặc tả, tính bao hàm ngữ nghĩa vốn có của từ ngôn ngữ. Cụ thể, một từ ngôn ngữ hx
được sinh ra từ từ ngôn ngữ x bởi thêm gia tử h vào từ x có ngữ nghĩa đặc tả hơn từ x
nhưng vẫn giữ nguyên ngữ nghĩa gốc của x. Ví dụ, từ “rất trẻ” được sinh ra từ từ
“trẻ” bởi thêm gia tử “rất” vào từ “trẻ” thì nó có ngữ nghĩa đặc tả hơn ngữ nghĩa của từ “trẻ” nhưng vẫn giữ được ngữ nghĩa gốc của “trẻ” và ngữ nghĩa của nó phải được bao hàm trong ngữ nghĩa của từ trẻ. Vì vậy, khi thiết kế phân hoạch đòi hỏi phải đảm
bảo tính bao hàm ngữ nghĩa, do đó trong cấu trúc phân hoạch mờ thì độ hỗ trợ của
tập mờ ứng với từ ngôn ngữ hx phải nằm trọn trong độ hỗ trợ của tập mờ của từ
ngôn ngữ x. Nguyễn Cát Hồ và cộng sự cũng đã đưa ra các ràng buộc trên ngữ
nghĩa tính toán của các từ ngôn ngữ để đảm bảo tính chất trên trong [63].
2.1.1.1. Thiết kế tập mờ
Mỗi ĐSGT mở rộng được xây dựng cho một biến thứ j của tập dữ liệu cảm sinh ra tập từ ngôn ngữ( ) (tập từ có độ dài không lớn hơn kj). ĐSGT mở rộng xác
định ngữ nghĩa định lượng của từ là các khoảng v(xj,i) = (h0xj,i) (xj,i) biểu thị lõi ngữ nghĩa của từ ngôn ngữ xj,i( )
Ký kiệu L(•) và R(•) lần lượt là điểm mút trái và mút phải của một khoảng bất kỳ. Giả sử đặt a = R(v(xj,i-1)), c = L(v(xj,i)), d = R(v(xj,i)), g = L(v(xj,i+1)), khi đó b, e
là các điểm uốn thỏa mãn a < b < c và d < e < g và x là giá trị trên miền xác định của biến thứ j. Ta có hàm biểu diễn độ thuộc của x vào nửa trái của hàm S, Sleft như sau: 0, 0 ≤ x ≤ a ( x − a)2 , a ≤ x ≤ b (b − a )( c − a) Sleft = ( x − c)2 1 − , ( c − b )( c − a) b ≤ x ≤ c 1, x ≥ c
và hàm biểu diễn độ thuộc của v vào nửa phải của hàm S như sau:
1, 0 ≤ x ≤ d ( x − d )2 1 − , d ≤ x ≤ e ( d − e )( d − g ) Sright = ( x − g )2 , e ≤ x ≤ e ( e − d )( g − d ) 0, x ≥ g
Tập mờ dạng hàm S được biểu diễn như Hình 2.4
(2.1)
(2.2)
a b c d e g
2.1.1.2. Thiết kế phân hoạch mờ
Sử dụng tập mờ được thiết kế ở phần trên với các điểm uốn được lựa chọn dựa trên thực nghiệm b = a + (c – a)/4, e = d + (g – d)/4, luận án thiết kế một phân hoạch dạng đa thể hạt được đề xuất trong [62] (Hình 2.2). Theo phương pháp thiết kế này, các từ hằng bao gồm 0_0, W và 1_0 sẽ lập thành một phân hoạch được gọi là mức 0, các từ có cùng độ dài l kj cùng với các từ hằng ở mức tương ứng 0_l và 1_l
lập thành một phần hoạch mức l.
Một ví dụ Hình 2.5 mô tả thiết kế phân hoạch mờ dựa trên ĐSGT mở rộng và hàm S, với các tham số mờ của ĐSGT mở rộng fm(0) = 0.006352412, f ( j−) = 0.4404566, fm(wj) = 0.0004077147, f ( j+) = 0.4801931, fm(1) = 0.07259017, µL = 0.6891874, h0 = 0.001883381, k = 2.
Hình 2.5. Một ví dụ phân hoạch đa thể hạt với tập mờ S-Function
Để chứng tỏ tính hiệu quả của phương pháp thiết kế ngữ nghĩa tập mờ của từ dựa trên ĐSGT mở rộng và hàm S, luận án áp dụng phương pháp thiết kế này vào xây dựng hệ mờ giải bài toán hồi quy, phân lớp và được trình bày trong các Mục 2.1.2 và 2.1.3.