Trong chương này đã trình bày về khái niệm mờ, vấn đề mô hình hóa toán học cho khái niệm mờ chính là các tập mờ, và khái niệm biến ngôn ngữ. Trong lý thuyết tập mờ và lôgíc mờ, mô hình hệ mờ dạng luật (fuzzy rule-based systems) và các
49
cứu phát triển và ứng dụng trong các bài toán thực tế. Luận án đã tóm tắt phương pháp lập luận dựa trên quy tắc modus ponens tổng quát hóa và qua đó thấy rằng có rất nhiều cách chọn các phép toán lôgíc mờ áp dụng vào lập luận. Mỗi cách chọn sẽ
cho một kết quả lập luận khác nhau và không thể khẳng định chắc chắn chọn như
thế nào thì sẽ có một phương pháp lập luận tốt. Điều này phụ thuộc vào từng tình huống ứng dụng cụ thể và được kiểm chứng qua kết quả thực nghiệm.
Tiếp theo, trong Mục 1.2 trình bày các khái niệm cơ bản về đại số gia tử, vấn
đề định lượng ngữ nghĩa và khái niệm về khoảng tính mờ của các giá trị ngôn ngữ. Trên cơ sở đó một số tác giảđã đề xuất các phương pháp lập luận xấp xỉ theo tiếp cận ĐSGT và ứng dụng thành công. Bước đầu nghiên cứu trong luận án đã giới thiệu một phương pháp lập luận bằng nội suy trực tiếp trên siêu mặt SR,n+1 sử dụng mạng nơron truyền tới đa lớp và ứng dụng cho kết quả tốt. Điều này cho thấy tiềm năng và thế mạnh của các phương pháp lập luận theo tiếp cận ĐSGT.
Trong Mục 1.3 trình bày về bài toán phân lớp và các phương pháp tiếp cận giải bài toán dựa trên mô hình hệ các luật mờ của nhiều tác giả. Tuy nhiên các phương pháp này gặp trở ngại là số luật sinh ra có thể rất lớn do vậy đòi hỏi một khối lượng tính toán khổng lồ, hoặc các hàm thuộc của các giá trị ngôn ngữ có thể
gần nhưđồng nhất với nhau khi sử dụng các biện pháp điều chỉnh tham số.
Từ những nghiên cứu về ĐSGT và các phương pháp lập luận, trong luận án này tập trung nghiên cứu và phát triển phương pháp xây dựng hệ mờ dạng luật với ngữ nghĩa dựa trên ĐSGT và ứng dụng vào bài toán phân lớp trong khai phá dữ
liệu, một bài toán đang được nghiên cứu khá mạnh mẽ. Trong chương tiếp theo sẽ đi sâu nghiên cứu, đề xuất phương pháp xây dựng hệ mờ dạng luật với ngữ nghĩa dựa trên ĐSGT.
50
CHƯƠNG 2
PHƯƠNG PHÁP SINH LUẬT MỜ VỚI NGỮ
NGHĨA CÁC TỪ NGÔN NGỮ DỰA TRÊN ĐSGT
Chương 1 đã trình bày phương pháp xây dựng hệ mờ dạng luật dựa trên phân hoạch bởi các tập mờ. Tuy nhiên, tồn tại trong đó một sự tách biệt giữa cú pháp của các giá trị ngôn ngữ và ngữ nghĩa của chúng biểu diễn bằng tập mờ. Điều này dẫn
đến các quá trình sinh hệ luật mờ và tối ưu tham số tập mờ làm biến dạng ngữ nghĩa của các giá trị ngôn ngữ, hay các tập mờ khó phản ánh bản chất ngữ nghĩa của các giá trị ngôn ngữ. Chẳng hạn các tác giả trong [10], [50] sử dụng phương pháp điều chỉnh tham số tập mờ nhưng với khoảng cách này thì các tập mờ kết quả (Hình 3.1) rất khó nhận biết ngữ nghĩa cũng như giá trị ngôn ngữ mà chúng phản ánh. Một tập mờ có thể gần như nằm bên trong một tập mờ khác. Các luật mờ kết quả không trực quan, khó hiểu đối với người dùng trong khi người dùng cần đến các tri thức này để
phán đoán, ra quyết định trong ứng dụng thực tế.
Mặt khác, một số tác giả trong [42]-[47], [23],[53],[60] chọn cố định tập các giá trị ngôn ngữ cùng với tập mờ biểu diễn ngữ nghĩa của chúng sẽ rất khó phù hợp
đối với ngữ cảnh của các bài toán khác nhau. Tuy nhiên, sử dụng ngữ nghĩa để xác
định tập các giá trị ngôn ngữ tương ứng với các tập mờ này cũng rất khó khăn. Chẳng hạn trong [43] sử dụng tập mờ dạng µS2(x) = 1-x trên miền [0,1], trực quan rất khó xác định giá trị ngôn ngữ với ngữ nghĩa của tập mờ này.
Đại số gia tử với những đặc trưng của mình giúp giữ mối liên kết về cú pháp của các giá trị ngôn ngữ và ngữ nghĩa của chúng biểu diễn bằng các tập mờ, tạo ra những ràng buộc nhất định để ngữ nghĩa của các giá trị ngôn ngữ không bị biến dạng trong các quá trình xử lý. Như vậy, việc sử dụng ĐSGT trong quá trình xây dựng hệ mờ dạng luật sẽ giúp khắc phục được những hạn chếđã đề cập ở trên. Kết quả hệ luật mờ sẽ phản ánh đúng bản chất của ngôn ngữ, qua đó người dùng có thể
51
Trước hết, trong phần tiếp theo sẽ thiết kế phương pháp xây dựng hệ luật mờ
từ tập dữ liệu mẫu của bài toán với ngữ nghĩa dựa trên ĐSGT.