VÀ NHỮNG ỨNG DỤNG CỦA CHÚNG TRONG ĐIỀU KHIỂN QUÁ TRÌNH
2.7.5 Tính diễn giải được và độ chính xác của những mô hình neuro-mờ
Như chúng ta có thể thấy trong những phần trước, những hệ neuro-mờ về bản
chất là những hệ mờ mà có khả năng học của mạng nơron. Những hệ mờ kết
nối những lợi ích của những phương pháp mô hình hoá hướng dự đoán và những phương pháp mô hình hoá hướng hiểu được, cung cấp những mô hình phù hợp cho cả dự đoán và hiểu. Vì thế chúng ta cần xem xét khả năng những
lợi ích của những hệ mờ đối với mô hình dự đoán được giữ gìn khi chúng được
chuyển cho những hệ neuro-mờ.
Bảng 2.2. Tính diễn giải được và độ chính xác trong những hệ mờ
Tính diễn giải được Độ chính xác
Ít thông số Nhiều thông số
Ít luật Nhiều luật
Mô hình Mamdani Mô hình TS
Hai mặt của những hệ mờ dẫn đến một sự cân bằng giữa tính đọc được và độ chính xác như trong bảng 1. Chúng ta có thể buộc những hệ mờ có được những
dự đoán chính xác bất kỳ, nhưng sẽ mất đi tính diễn giải được. Để đạt được sự
chính xác, một hệ mờ cấn có không gian dữ liệu tốt và nhiều luật mờ. Điều hiển
nhiên rằng khi số luật mờ càng trở nên lớn thì càng ít đi tính diễn giải được.
Nếu chúng ta muốn giữ cho mô hình đơn giản, thì sự dự đoán càng ít chính xác.
Để giải quyết sự cân bằng này , tính diễn giải được (cũng có nghĩa là tính đơn
giản) của một hệ mờ cần được xem như là lợi ích chính và vì thế nó cần được theo đuổi nhiều hơn độ chính xác. Sự thật thì những hệ mờ không phải là những
bộ xấp xỉ hàm hay bộ phân loại tốt hơn những phương pháp khác. Nếu chúng ta
thích thú với dự đoán chính xác thì thường chúng ta sẽ không để ý nhiều đến
tính diễn giải được của bài toán. Trong trường hợp này, chúng ta chỉ dùng một đặc tính của những hệ mờ: sự kết hợp tiện lợi của những mô hình cục bộ cho
một cách giải toàn cục. Với vấn đề này, mô hình loại Sugeno phù hợp hơn mô
hình loại Mamdani bởi vì chúng thường linh hoạt hơn trong những kết quả của
luật. Tuy nhiên, nếu hiệu suất tối ưu là mục tiêu chính, chúng ta nên xem xét nếu một hệ mờ là một phương pháp phù hợp nhất và có được sự so sánh ở mọi
khía cạnh và chuyên sâu với những phương pháp liên quan khác (những phương pháp cục bộ và những phương pháp cục bộ được tổng quát hoá), khi đề
cập đến hiệu suất, sự tính toán và tính khả thi. Tóm lại, những hệ mờ nên được
dùng cho mô hình dự đoán nếu một mô hình có thể diễn giải được là cần thiết
Vấn đề về tính diễn giải được của những hệ mờ được thảo luận trong (Bersini
H. and Bontempi G., 1997a; Nauck D. and Kruse R., 1998a; Nauck D. and Kruse R., 1998b; Nauck D., 2000) với việc xem xét vấn đề cân bằng giữa tính
diễn giải được của mô hình và độ chính xác. Tính diễn giải được của một mô
hình mờ không có nghĩa là có một kết hợp chính xác giữa mô tả ngôn ngữ của
mô hình và những thông số mô hình. Tính diễn giải được có nghĩa là những người dùng mô hình có thể chấp nhận sự thể hiện của những thuật ngữ ngôn
ngữ, nhiều hay ít hơn. Sự thể hiện này nên tương ứng rõ ràng với hiểu biết trực
giác của họ với những thuật ngữ ngôn ngữ. Vì thế, tính diễn giải được không có
nghĩa là bất kỳ người nào cũng có thể hiểu được mô hình mờ. Nó có nghĩa là những người dùng có ít nhất những kiến thức chuyên gia trong khu vực mà mô hình dự đoán diễn ra có thể hiểu được mô hình.
Vì chính tính diễn giải được cũng là một khái niệm mờ và chủ quan, thật khó để tìm thấy một danh sách rõ ràng và thấu đáo những điều kiện, khi bị vi phạm,
tạo cho mô hình mờ mất đi khả năng đọc của nó. Chúng ta sẽ tóm tắt những hệ
số chính mà tác động đến tính diễn giải được của một hệ mờ:
Chọn lựa loại mô hình mờ: Những hệ mờ loại Mamdani được ưa
chuộng hơn loại TS, bởi vì những kết quả của luật bao gồm những tập
mờ có thể diễn giải được.
Số lượng luật mờ:một hệ mờ với cơ sở luật lớn thì ít đi tính diễn giải so
với một hệ mờ chỉ cần vài luật.
Số lượng biến ngõ vào:mỗi luật chỉ nên sử dụng vài biến như có thể.
Số lượng tập mờ trên biến:Chỉ một lượng trung bình những tập mờ được dùng để phân chia một biến. Khi có quá nhiều nhãn ngôn ngữ thì sẽ
tạo nên những khó khăn cho việc đọc được mô hình mờ, vì thế cần phải tránh trường hợp này.
Thể hiện rõ ràng những toán hạng ngôn ngữ:mỗi toán hạng ngôn ngữ nên được thể hiện chỉ với một tập mờ. Những luật khác nhau dùng cùng một diễn giải ngôn ngữ (ví dụ x là nhỏ) có thể không thể hiện toán hạng
ngôn ngữ tương ứng (ví dụ nhỏ) bởi những tập mờ khác.
Đặc tính của những luật mờ:những luật mờ phải đầy đủ ví dụ với bất
kỳ ngõ vào nào, hệ mờ có thể tạo ra được câu trả lời. Tập mờ cũng cần
nhất quán, ví dụ không có những luật mâu thuẫn mà có cùng tiền đề nhưng khác kết luận. Chỉ những không nhất quán riêng phần là được
chấp nhận. Và bất kỳ dạng dư thừa nào cũng cần phải tránh,ví dụ không
có những luật mà tiền đề là một tập con của tiền đề của một luật khác, và không có luật nào xuất hiện nhiều hơn một lần trong cơ sở luật.
Đặc tính của những tập mờ:những tập mờ nên có thể diễn giải được với người dùng hệ mờ. Điều này có nghĩa là những hàm liên thuộc nên bình
thường, lồi và chúng nên bảo đảm một độ bao phủ hoàn toàn miền ngõ
thuật ngữ ngôn ngữ. Cũng cần tránh quá nhiều sự chồng nhau giữa những
hàm liên thuộc để có những tập mờ phân biệt.
Những kỹ thuật mô hình neuro-mờ truyền thống và trong những phương
pháp dựa trên dữ liệu để học những luật mờ từ dữ liệu, được hổ trợ để tối ưu độ
chính xác dự đoán cho mô hình mờ. Tuy nhiên,trong khi cải tiến độ chính xác
thì tính thông suốt của mô hình sau khi học có thể bị mất. Sự chồng nhau của
những hàm liên thuộc tăng và những tình huống kỳ lạ có thể xảy ra, khi một vài hàm liên thuộc có thể chứa trong những hàm khác hay những hàm liên thuộc
chuyển đổi vị trí của chúng. Điều này cản trở tính diễn giải được của mô hình cuối cùng. Với mục đích là tính diễn giải được, chương trình học nên nhận ngữ
nghĩa học của mô hình mờ mong muốn là những đối số và bám vào những ràng buộc nào đó, để mà nó không thể ứng dụng tất cả những sự hiệu chỉnh tiềm tàng cho những thông số của hệ mờ. Ví dụ những thuật toán học nên bị ràng buộc để
mà những hàm liên thuộc kế cận không thay đổi vị trí, không di chuyển từ phần dương sang phần âm của miền hay ngược lại, có một độ chồng nhau nào đó.
Trong (de Oliveira J.V., 1999) một tập bao quát những đặc tính ngữ nghĩa học
mà những hàm liên thuộc cần có để duy trì tính diễn giải được được quy định và thêm vào một tập những ràng buộc được dùng trong một sơ đồ tối ưu có thể
thoả mãn những đặc tính này.
Một yêu cầu quan trọng khác để đạt được tính diễn giải là làm cho cơ sở luật
nhỏ. Một mô hình mờ với những hàm liên thuộc diễn giải được nhưng có số lượng luật lớn sẽ xa rời tính diễn giải được. Bằng cách làm giảm độ phức tạp,
ví dụ số lượng thông số của một mô hình mờ không chỉ quản lý được cơ sở luật
mà còn cung cấp mô tả quá trình dễ đọc hơn. Và việc dùng cơ sở luật đơn giản sẽ làm giảm overfitting, vì thế cải tiến sự tổng quát hoá.
Gần đây, vài phương pháp học luật mờ dựa trên dữ liệu đã hỗ trợ việc cải tiến
tính diễn giải được của những mô hình mờ ở cả cơ sở luật nhỏ và những tập mờ
dễ đọc hơn. Những ví dụ được cho trong (Chao C.T. et al., 1996; Setnes M. et al., 1998; Y. Jin et al., 1999; Y. Jin, 2000).
2.8 Kết luận
Những mô hình mờ được xem như là những chuyển đổi ngôn ngữ của một
ánh xạ số và như là phương pháp mô hình hoá cục bộ mạnh. Hai mặt này của
những hệ mờ đã dẫn đến việc phát triển những kỹ thuật mô hình hoá neuro-mờ như là một phương pháp phá vỡ sự thiếu hụt của kiến thức chuyên gia và khai thác những dữ liệu thực nghiệm để chiết xuất được mô hình trong định dạng
của những luật mờ. Những hệ neuro-mờ về cơ bản là những hệ mờ với khả năng-dựa trên những dữ liệu phù hợp- để bù cho những thiếu sót của kiến thức con người bằng cách trích tự động những luật mờ từ dữ liệu dựa trên học thích nghi được dùng trong mạng nơron.
Lợi ích của mô hình hoá neuro-mờ là khả năng sử dụng cả kiến thức định
xử của quá trình, trong khi kiến thức số là những dữ liệu quan sát được dùng để
thực hiện mô hình dự đoán. Mô hình kết quả mô tả những liên hệ quan trọng
giữa dữ liệu ở cả định tính thông qua những luật mờ và định lượng qua những
liên hệ đại số từng phần đơn giản.
Hai điều trên có thể không tương thích ở một vài phạm vi, ví dụ việc tìm kiếm
cho một mô hình có thể diễn giải được có thể được thực hiện mà phải trả giá
bằng tổn hao hiệu suất trong xấp xỉ dữ liệu thực. Vì thế cẩn phải lấp đầy khe hở
giữa hai vấn đề trên. Một hệ neuro-mờ hỗ trợ người dùng trong việc tìm kiếm
những hệ mờ mong muốn dựa trên dữ liệu huấn luyện, nhưng nó không thể làm tất cả mọi việc. Những vấn đề ngữ nghĩa học sẽ xảy ra nếu những hệ mờ không
có những cơ cấu để bảo đảm tất cả những thay đổi gây ra bởi chương trình học
có thể diễn giải được trong ngôn ngữ của những luật mờ. Khi kiến thức ưu tiên
duy trì tính dễ đọc, thì những ràng buộc thêm vào về cấu trúc và thông số là cần
thiết. Vì vậy, đầu tiên dùng bất kỳ thuật toán tối ưu để tinh chỉnh tự động cấu
trúc và những thông số của mô hình mờ, việc định nghĩa rõ ràng mức độ dễ đọc
của mô hình mờ cần được cho. Khi được cung cấp định nghĩa này, việc duy trì tính diễn giải được yêu cầu hoặc là giảm bậc tự do của mô hình hoặc/và sử
dụng một phương pháp tối ưu có ràng buộc mà bù cho tất cả những giải pháp
mà không diễn giải được.
Từ những giới hạn được thảo luận ở đây, chúng ta thấy rõ rằng những phương pháp neuro-mờ cho phép xây dựng những mô hình mờ có thể diễn giải được và tinh giản nhất. Đây cũng là động lực chính của luận án này mà những điểm chính là việc phát triển một phương pháp dựa trên dữ liệu để nhận dạng
những mô hình mờ mà đảm bảo được độ chính xác và tính diễn giải được, vì thế
chúng có thể được dùng để khám phá và thể hiện những mối liên hệ cơ bản
trong dữ liệu. Trong chương tiếp theo sẽ mô tả phương pháp luận chi tiết cho
CHƯƠNG 3.