Hiện nay các nhà nghiên cứu quan tâm đến hai mục tiêu của FRBSs là:
Tính diễn giải được là tính chất phụ thuộc vào cấu trúc của mô hình (càng đơn giản càng tốt), số luật (càng nhỏ càng tốt), số điều kiện trong phần tiền đề của luật (càng ít càng tốt), số nhãn cho mỗi biến là tối ưu, dạng của hàm thuộc,…
Tính chính xác cao: sai số nhỏ khi ứng dụng.
Tính diễn giải được là khả năng biểu diễn các hệ thống thuộc thế giới thực theo cách mà con người có thể hiểu được, giải thích được và có thể sử dụng các luật của hệ thống một cách dễ dàng. Do đó tính diễn giải được của một hệ thống là một tính chất mang tính chủ quan, nên cho tới hiện nay người ta vẫn chưa đưa ra được một độ đo cho tính chất nàymà được chấp nhận bởi nhiều nhà nghiên cứu [3]. Đây là một vấn đề vẫn đang được nghiên cứu [1, 2]. Vì vậy các nhà nghiên cứu thường chỉ đề cập đến vài yếu tố đặc trưng cho tính diễn giải được của hệ thống như đã đưa ra ở trên trong các nghiên cứu của mình [1, 2, 3]. Đây cũng là cách tiếp cận của đề tài về tính diễn giải được nên luận án sẽ quan tâm đến một số yếu tố đặc trưng của tính diễn giải được. Cụ thể là luận án đưa ra cách thiết kế các FRBSs có tính chính xác cao nhưng lại có cấu trúc đơn giản thể hiện qua bộ luật gọn nhẹ nhưng hiệu quả (số luật ít, số điều kiện trong phần tiền đề của luật ít), số nhãn cho mỗi biến là tối ưu, dạng của hàm thuộc thống nhất. Điều này được thể hiện qua sáu mô hình của luận án.
Ngoài ra, hai tính chất này thường mâu thuẫn nhau, nghĩa là nếu tính chính xác của FRBSs tăng lên thì tính diễn giải được sẽ bị giảm đi và ngược lại. Do đó, vấn đề là ta cần tìm một thỏa hiệp tốt nhất giữa hai tính chất này. Nói một cách khác, ta cần tìm một thỏa hiệp (ranh giới) tối ưu cho hai tính chất này cho mỗi FRBS cụ thể; trong đó tính chất chính xác và tính diễn giải được đều cùng tương đối tối ưu.
- Vào đầu thập niên 70-80 [3], các hệ thống mờ được thiết kế bởi các chuyên gia, thường là các hệ dựa trên luật dùng ngôn ngữ tự nhiên, có tính diễn giải được cao nhưng có tính chính xác không cao.
- Vào đầu những năm 90 [3], các hệ thống mờ được thiết kế tự động từ dữ liệu số, có tính chính xác cao nhưng có tính diễn giải được thấp. Các nhà nghiên cứu đã đề xuất các phương pháp thiết kế các hệ thống mờ bằng mạng nơron, GA, v.v…
- Vào cuối những năm 90 và đến hiện nay [3], các nhà nghiên cứu đã đề cập các hệ thống mờ đa mục tiêu và hai mục tiêu chủ yếu cần đạt được là tính diễn giải được cao và tính chính xác cao. Tuy nhiên hai mục tiêu này là mâu thuẫn nhau, do đó cần tìm một thỏa hiệp (ranh giới) tối ưu cho hai mục tiêu này trong một hệ thống mờ. Cụ thể là làm thế nào để tìm được ngưỡng tối đa e0 của tính chính xác mà không làm giảm tính diễn giải được và tìm được ngưỡng tối đa i0 của tính diễn giải được mà không làm giảm tính chính xác. Khi đó cặp (e0, i0) sẽ là ranh giới tối ưu cần tìm.
Hình 1.11. Các giai đoạn thiết kế các hệ thống mờ.
Hệ thống mờ có tính diễn giải cao Hệ thống mờ có tính chính xác cao
Xây dựng và huấn luyện hệ thống mờ có tính chính xác cao vào đầu những năm 90s
thấp tính chính xác cao th ấp tín h d iễ n g iả i ca
o Xây dựng hệ thống mờ đa mục tiêu
vào cuối những năm 90s-đến nay Hệ thống mờ có tính diễn giải cao
được tạo ra và được hiệu chỉnh thủ công
Để thực hiện điều này, đầu tiên ta cần cụ thể hóa tính chính xác qua một tiêu chuấn cụ thể nào đó. Giả sử có hai mô hình, ký hiệu lần lượt MH1, MH2, lần lượt có độ chính xác tương ứng là e1 và e2. Ta nói e1 là cao hơn hay bằng e2, ký hiệu e1 ≥ e2 nếu và chỉ nếu sai số của MH1 nhỏ hơn hay bằng sai số của MH2 khi ứng dụng lên tập dữ kiểm nghiệm (test data). Giá trị sai số của một mô hình trong các thực nghiệm của luận án là một trong các giá trị MSE, NDEI hay PI tùy thuộc yêu cầu của bài toán đó. Tiếp theo, ta cần cụ thể hóa tính diễn giải được qua một tiêu chuẩn cụ thể nào đó để dễ đánh giá vì như đã đề cập ở trên tính diễn giải được phụ thuộc nhiều yếu tố. Giả sử hai mô hình MH1, MH2 có tính diễn giải được thể hiện qua hai giá trị tương ứng là i1 = #R1 và i2 = #R2 trong đó #R1, #R2 lần lượt là số luật của mô hình MH1 và MH2. Ta nói i1 cao hơn hay bằng i2,ký hiệu i1 ≥ i2 nếu và chỉ nếu #R2 ≥ #R1. Nói cách khác số luật thấp hơn thì tính diễn giải sẽ cao hơn.
Trong thực tế [3], mỗi bài toán đa mục tiêu thường tồn tại nhiều cặp tối ưu (e, i). Điều này được lý giải như sau nhờ một quan hệ được định nghĩa sau: cặp (e1, i1) tốt hơn hay bằng cặp (e2, i2), ký hiệu là (e1, i1) ≥ (e2, i2) nếu và chỉ nếu e1 ≥ e2 và i1 ≥ i2. Có thể kiểm tra quan hệ này là một quan hệ thứ tự bộ phận. Lưu ý rằng về mặt lý thuyết, trong quan hệ thứ tự bộ phận thì có nhiều cặp (e1, i1) và (e2, i2) là không so sánh được với nhau nếu (e1 > e2 mà i2 > i1)hoặc (e2 > e1 mà i1 > i2). Hơn nữa, theo tính chất của một quan hệ thứ tự bộ phận thì nếu (e0, i0) là một cặp tối ưu cần tìm thì nó cũng chính là phần tử tối đại của quan hệ đó. Ngoài ra trong một quan hệ thứ tự bộ phận thì có thể có nhiều phần tối đại (nếu tồn tại) nên cũng sẽ có nhiều ranh giới tối ưu (e, i) cần tìm. Tuy nhiên vì không gian tìm kiếm củ a các bài toán đa mục tiêu thường rất lớn nên hoàn toàn không dễ gì tìm kiếm một cặp (i, e) tối ưu. Do đó nhà các nhà nghiên cứu đưa ra các phương pháp sử dụng GA, mạng nơron, v.v…để tìm một cặp (i, e) xấp xỉ tối ưu.
Đây cũng là hướng tiếp cận của luận án, luận án đã đề xuất sáu mô hình để giải quyết vấn đề này. Việc so sánh tính diễn giải được và tính chính xác của sáu mô hình đề xuất với các kết quả của các tác giả khác sẽ được thuyết minh chi tiết trong các thực nghiệm trong chương 2 và chương 3.
Các kỹ thuật tính toán thông minh như mạng nơron nhân tạo (Artificial Neural Networks, ANNs)[105], logic mờ (Fuzzy Logic, FL) [106], các thuật giải di truyền (Genetic Algorithms, GAs) [17, 107] là những đề tài đang được nghiên cứu rất phổ biến hiện nay. Các kỹ thuật này được nghiên cứu rất nhiều vì cho phép giải được các bài toán phức tạp mà thông thường không giải được bằng các phương pháp cổ điển [18].
Gần đây, các nhà nghiên cứu các kỹ thuật tính toán thông minh đang quan tâm đến các hướng tiếp cận “lai”. Một trong các hướng này là sự kết hợp giữa FL và GAs dẫn đến sự ra đời của các hệ thống di truyền mờ (Genetic Fuzzy Systems, GFSs) [11, 58]. Hệ thống mờ (Fuzzy Systems, FSs) là một ứng dụng quan trọng nhất của LF. FSs là một công cụ quan trọng để mô hình hóa những bài toán thực tế có tính phức tạp và không chính xác cao mà không thể mô hình hóa bằng các phương pháp cổ điển. FSs là các hệ thống dựa trên các luật mờ (Fuzzy Rule-Based Systems, FRBSs). FRBSs là sự mở rộng của các hệ thống dựa trên luật cổ điển. FRBSs gồm các luật
“IF-THEN” mà phần tiên đề và phần kết luận của luật sử dụng logic mờ. FRBSs đã chứng tỏ có thể giúp giải quyết các bài toán về điều khiển [108], mô hình hóa [43], phân lớp, khai thác dữ liệu ([19, 20]). GAs đã và đang được sử dụng rộng rãi và phổ biến như là một kỹ thuật tìm kiếm toàn cục. GAs cho phép tìm kiếm lời giải thích hợp trong những không gian tìm kiếm lớn, phức tạp nhưng GAs chỉ cần một hàm thích nghi (Fitness function) để tối ưu hóa tìm kiếm.
Do đó, gần đây GAs được sử dụng trong quá trình học và hiệu chỉnh các thành phần của một FRBS. Một hệ thống như vậy gọi là hệ thống dựa trên luật mờ di truyền (Genetic Fuzzy Rule-Based Systems, GFRBSs) [11].
Điều này cho phép xây dựng các GFRBSs vừa tinh giản, vừa hiệu quả để giải các bài toán thực tế trong các hệ thống có tính chất phức tạp và không chắc chắn. Đây cũng chính là mục tiêu của luận án, sẽ đề cập chi tiết hơn ở mục tiếp sau đây.
1.6 Mục tiêu và phạm vi nghiên cứu
FRBSs cung cấp một công cụ hiệu quả để mô tả và xử lý vấn đề trong thế giới thực có tính chất không chắc chắn và không chính xác. Do đó các FRBSs được áp dụng vào các vấn đề điều khiển, phân lớp và mô hình hóa. Thành phần quan trọng
nhất của FRBSs là Cơ sở Tri thức (KB). KB bao gồm hai bộ phận: Cơ sở Dữ Liệu (DB) và Cơ sở Luật (RB). DB bao gồm tập các nhãn ngôn ngữ và các hàm thuộc xác định ý nghĩa của chúng. RB bao gồm tập các luật mờ “IF-THEN” với tiền đề và kết luận được biểu diễn bằng ngôn ngữ tự nhiên, và các luật này kết nối bằng toán tử "also". Điều đó có nghĩa là những các luật sẽ được kích hoạt đồng thời với cùng một dữ liệu đầu vào. Nhiều phương pháp đã được đề xuất để xây dựng tự động KB ban đầu từ dữ liệu số.
Các hướng nghiên cứu đầu tiên tập trung vào việc học RB từ một DB được xác định trước [21, 72]. Hiệu quả hoạt động của FRBS chịu ảnh hưởng rất nhiều từ DB được xác định trước.
Các hướng nghiên cứu thứ hai tập trung vào việc cải thiện hiệu suất của FRBS bằng cách tinh chỉnh DB ban đầu sau khi RB đã được tạo ra [58, 109]. Quá trình này chỉ điều chỉnh các tham số của các hàm thuộc nhưng không thay đổi số lượng về các nhãn ngôn ngữ trong mỗi phân hoạch mờ nên RB sẽ không bị thay đổi.
Các hướng nghiên cứu thứ ba tập trung vào việc học để tạo ra các thành phần khác nhau cho KB ban đầu từ dữ liệu số [15, 98].
Mỗi phương pháp đều có ưu, nhược điểm thể hiện bằng những công trình nghiên cứu và các thực nghiệm liên quan. Từ việc khảo sát phân tích những phương pháp này, dựa trên những giải pháp khả thi đã được công bố trên thế giới, hướng tiếp cận chính của luận án là xây dựng một hệ suy diễn mờ tinh giản nhưng vẫn có tính hiệu quả cao.
Để luận án mang tính khả thi cả về lý thuyết lẫn thực tiễn và mang lại kết quả như mong muốn, tác giả đã thực hiện:
1) Nghiên cứu và phát triển Cơ sở lý thuyết cho việc xây dựng một hệ suy diễn mờ, cụ thể là một hệ thống dựa trên luật mờ di truyền (GFRBSs) với cấu trúc tinh giản nhưng vẫn hiệu quả cao trong ứng dụng thực tế. Nói cách khác, hệ thống này thỏa mãn hai mục tiêu là có tính diễn giải cao và có độ chính xác cao.
2) Nghiên cứu đề xuất xây dựng cấu trúc tổng quát cho GFRBSs cùng các giải pháp huấn luyện nhằm kiểm chứng kết quả nghiên cứu ở 1) và có thể triển khai trong thực tế để mang lại kết quả ứng dụng tốt hơn.
Như định hướng nêu trên, phạm vi nghiên cứu của luận án được thể hiện trong hình 1.12 dưới đây.
Mô hình được mô tả trong Hình 1.12 ở trên minh họa phạm vi của đề tài là nghiên cứu và đề xuất mô hình mới để xây dựng GFRBSs với Cơ sở luật tinh giản, nhưng hiệu quả trong ứng dụng. Luận án đã đề xuất một hướng tiếp cận mới, trong đó một phương pháp đơn giản, được gọi là phương pháp TMH (được viết tắt theo Tên+Chữ đệm+Họ của nghiên cứu sinh) đã được công bố trong các hội nghị và tạp chí quốc tế [i]-[iv], được sử dụng để tự động tạo ra FRBS dạng Mamdani từ dữ liệu số và sau đó
Bộ Suy Diễn Bộ Giải Mờ Tỷ lệ hóa đầu ra Bộ Mờ Hóa Tỷ lệ hóa đầu vào Xử lý mờ Phương Pháp TMH
Cơ sở tri thức (KB) Hàm tỷ lệ Luật mờ Hàm thuộc Thi ết k ế d i tru y ền Khởi tạo
áp dụng giải thuật di truyền nhiều giai đoạn để tinh giản, tinh chỉnh các thành phần khác nhau của KB.
Từ những trình bày trên, các bài toán chính cần giải quyết trong phạm vi luận án bao gồm:
Bài toán 1 – Thiết kế và xây dựng một hệ suy diễn mờ
Nghiên cứu Cơ sở lý thuyết và phát triển một phương pháp xây dựng một mô hình tổng quát của hệ suy diễn mờ. Luận án đề xuất một phương pháp mới TMH để xây dựng môt hệ suy diễn mờ ban đầu bao gồm KB, bộ Mờ hóa, bộ Suy diễn, bộ Giải mờ. Phương pháp TMH (sẽ được đề cập chi tiết trong mục 2.2, chương 2) cho phép xây dựng tự động một FRBS từ các dữ liệu số. KB gồm hai thành phần chính là RB và DB. RB gồm các luật dạng “IF-THEN” có phần tiền đề và phần kết luận sử dụng ngôn ngữ tự nhiên. Ngoài tính chính xác của FRBS, hiện nay các nhà nghiên cứu còn đang quan tâm đến tính diễn giải được của FRBS. Điều này được thể hiện qua việc các luật chỉ sử dụng ngôn ngữ tự nhiên và kích thước nhỏ của bộ luật và số điều kiện trong phần tiền đề của luật ít [22, 110]. DB bao gồm các hàm thuộc có một trong các dạng: hàm Gauss, hàm tam giác, hàm hình thang, hàm dạng hình chuông tổng quát cùng với các nhãn ngôn ngữ tương ứng. Luận án đề xuất dạng biểu diễn thống nhất cho các hàm thuộc (vẫn không làm mất tính tổng quát) để có thể được sử áp dụng trong bài toán 2 sau đây [iv].
Hàm tỷ lệ (hình 1.12) được sử dụng trong chương 2 và 3 của luận án thường là hàm tuyến tính hoặc hàm đồng nhất (không dùng hàm gì cả) nhằm mục đích chuẩn hóa giá trị dữ liệu vào từ đoạn [a, b] (của miền giá trị đầu vào) về đoạn [0, 1] hay biến đổi giá trị dữ liệu sau khi tính toán từ [0, 1] về đoạn [c, d] (của miền giá trị đầu ra). Các hàm tỷ lệ này phải là các song ánh để bảo đảm tính duy nhất và có thể biến đổi ngược lại được. Mục đích của việc chuẩn hóa dữ liệu về [0, 1] là để việc tính toán dễ dàng hơn trong trường hợp độ dài đoạn [a, b] quá lớn.
Các dạng hàm tỷ lệ được dùng trong luận án như sau:
f: [a, b] → [0, 1] (1.10)
g: [0, 1] → [c, d] (1.11)
x → (d – c)x+c
id: [a, b] → [a, b] (1.12)
x → x
Bài toán 2 – Tinh giản, tinh chỉnh hệ suy diễn mờ
Với hệ suy diễn mờ đã có (xây dựng từ bài toán 1 hay các phương pháp khác), luận án đã đề xuất các phương pháp sử dụng GAs tinh giản và tinh chỉnh hệ thống trên theo nhiều giai đoạn. Mục tiêu của việc này là tinh giản, tinh chỉnh hệ suy diễn nhưng vẫn đảm bảo tính hiệu quả khi ứng dụng, cụ thể là:
Tối ưu số nhãn ngôn ngữ cho mỗi biến đầu vào và đầu ra.
Tối ưu số luật: rút gọn số luật nhưng vẫn đảm bảo tính chính xác và hiệu quả cao trong ứng dụng.
Tối ưu số phần tiền đề của mỗi luật: số các điều kiện trong phần tiền đề được giảm đi tối ưu mà vẫn đảm bảo hiệu quả cao khi ứng dụng.
Tinh chỉnh các tham số của các hàm thuộc để hệ thống đạt được tính chính xác cao hơn
Với hệ suy diễn mờ đã được tinh giản và tinh chỉnh, luận án đã đề xuất:
Cơ chế thích hợp cho bộ Mờ hóa, bộ Suy diễn, bộ Giải mờ cho FRBS đã được xây dựng.
1.7 Cấu trúc của luận án
Luận án bao gồm bốn chương.
Chương 1: trình bày cơ sở lý thuyết của hệ suy diễn mờ cùng các hướng nghiên cứu hiện tại có liên quan. Ngoài ra, nêu lên mục tiêu và phạm vi, cuối cùng giới thiệu cấu trúc của luận án.
Chương 2: trình bày cơ sở lý thuyết của mô hình GFRBSs cùng một số đề xuất về lý thuyết liên quan đến hướng nghiên cứu của luận án. Những đề xuất