Động cơ nghiên cứu - Tinh giản các luật trong hệ- 123docz.net

Hiện nay các nhà nghiên cứu quan tâm đến hai mục tiêu của FRBSs là:

 Tính diễn giải được là tính chất phụ thuộc vào cấu trúc của mô hình (càng đơn giản càng tốt), số luật (càng nhỏ càng tốt), số điều kiện trong phần tiền đề của luật (càng ít càng tốt), số nhãn cho mỗi biến là tối ưu, dạng của hàm thuộc,…

 Tính chính xác cao: sai số nhỏ khi ứng dụng.

Tính diễn giải được là khả năng biểu diễn các hệ thống thuộc thế giới thực theo cách mà con người có thể hiểu được, giải thích được và có thể sử dụng các luật của hệ thống một cách dễ dàng. Do đó tính diễn giải được của một hệ thống là một tính chất mang tính chủ quan, nên cho tới hiện nay người ta vẫn chưa đưa ra được một độ đo cho tính chất nàymà được chấp nhận bởi nhiều nhà nghiên cứu [3]. Đây là một vấn đề vẫn đang được nghiên cứu [1, 2]. Vì vậy các nhà nghiên cứu thường chỉ đề cập đến vài yếu tố đặc trưng cho tính diễn giải được của hệ thống như đã đưa ra ở trên trong các nghiên cứu của mình [1, 2, 3]. Đây cũng là cách tiếp cận của đề tài về tính diễn giải được nên luận án sẽ quan tâm đến một số yếu tố đặc trưng của tính diễn giải được. Cụ thể là luận án đưa ra cách thiết kế các FRBSs có tính chính xác cao nhưng lại có cấu trúc đơn giản thể hiện qua bộ luật gọn nhẹ nhưng hiệu quả (số luật ít, số điều kiện trong phần tiền đề của luật ít), số nhãn cho mỗi biến là tối ưu, dạng của hàm thuộc thống nhất. Điều này được thể hiện qua sáu mô hình của luận án.

Ngoài ra, hai tính chất này thường mâu thuẫn nhau, nghĩa là nếu tính chính xác của FRBSs tăng lên thì tính diễn giải được sẽ bị giảm đi và ngược lại. Do đó, vấn đề là ta cần tìm một thỏa hiệp tốt nhất giữa hai tính chất này. Nói một cách khác, ta cần tìm một thỏa hiệp (ranh giới) tối ưu cho hai tính chất này cho mỗi FRBS cụ thể; trong đó tính chất chính xác và tính diễn giải được đều cùng tương đối tối ưu.

- Vào đầu thập niên 70-80 [3], các hệ thống mờ được thiết kế bởi các chuyên gia, thường là các hệ dựa trên luật dùng ngôn ngữ tự nhiên, có tính diễn giải được cao nhưng có tính chính xác không cao.

- Vào đầu những năm 90 [3], các hệ thống mờ được thiết kế tự động từ dữ liệu số, có tính chính xác cao nhưng có tính diễn giải được thấp. Các nhà nghiên cứu đã đề xuất các phương pháp thiết kế các hệ thống mờ bằng mạng nơron, GA, v.v…

- Vào cuối những năm 90 và đến hiện nay [3], các nhà nghiên cứu đã đề cập các hệ thống mờ đa mục tiêu và hai mục tiêu chủ yếu cần đạt được là tính diễn giải được cao và tính chính xác cao. Tuy nhiên hai mục tiêu này là mâu thuẫn nhau, do đó cần tìm một thỏa hiệp (ranh giới) tối ưu cho hai mục tiêu này trong một hệ thống mờ. Cụ thể là làm thế nào để tìm được ngưỡng tối đa e0 của tính chính xác mà không làm giảm tính diễn giải được và tìm được ngưỡng tối đa i0 của tính diễn giải được mà không làm giảm tính chính xác. Khi đó cặp (e0, i0) sẽ là ranh giới tối ưu cần tìm.

Hình 1.11. Các giai đoạn thiết kế các hệ thống mờ.

Hệ thống mờ có tính diễn giải cao Hệ thống mờ có tính chính xác cao

Xây dựng và huấn luyện hệ thống mờ có tính chính xác cao vào đầu những năm 90s

thấp tính chính xác cao th ấp tín h d iễ n g iả i ca

o Xây dựng hệ thống mờ đa mục tiêu

vào cuối những năm 90s-đến nay Hệ thống mờ có tính diễn giải cao

được tạo ra và được hiệu chỉnh thủ công

Để thực hiện điều này, đầu tiên ta cần cụ thể hóa tính chính xác qua một tiêu chuấn cụ thể nào đó. Giả sử có hai mô hình, ký hiệu lần lượt MH1, MH2, lần lượt có độ chính xác tương ứng là e1 và e2. Ta nói e1 là cao hơn hay bằng e2, ký hiệu e1 ≥ e2 nếu và chỉ nếu sai số của MH1 nhỏ hơn hay bằng sai số của MH2 khi ứng dụng lên tập dữ kiểm nghiệm (test data). Giá trị sai số của một mô hình trong các thực nghiệm của luận án là một trong các giá trị MSE, NDEI hay PI tùy thuộc yêu cầu của bài toán đó. Tiếp theo, ta cần cụ thể hóa tính diễn giải được qua một tiêu chuẩn cụ thể nào đó để dễ đánh giá vì như đã đề cập ở trên tính diễn giải được phụ thuộc nhiều yếu tố. Giả sử hai mô hình MH1, MH2 có tính diễn giải được thể hiện qua hai giá trị tương ứng là i1 = #R1 và i2 = #R2 trong đó #R1, #R2 lần lượt là số luật của mô hình MH1 và MH2. Ta nói i1 cao hơn hay bằng i2,ký hiệu i1 ≥ i2 nếu và chỉ nếu #R2 ≥ #R1. Nói cách khác số luật thấp hơn thì tính diễn giải sẽ cao hơn.

Trong thực tế [3], mỗi bài toán đa mục tiêu thường tồn tại nhiều cặp tối ưu (e, i). Điều này được lý giải như sau nhờ một quan hệ được định nghĩa sau: cặp (e1, i1) tốt hơn hay bằng cặp (e2, i2), ký hiệu là (e1, i1) ≥ (e2, i2) nếu và chỉ nếu e1 ≥ e2 và i1 ≥ i2. Có thể kiểm tra quan hệ này là một quan hệ thứ tự bộ phận. Lưu ý rằng về mặt lý thuyết, trong quan hệ thứ tự bộ phận thì có nhiều cặp (e1, i1) và (e2, i2) là không so sánh được với nhau nếu (e1 > e2 mà i2 > i1)hoặc (e2 > e1 mà i1 > i2). Hơn nữa, theo tính chất của một quan hệ thứ tự bộ phận thì nếu (e0, i0) là một cặp tối ưu cần tìm thì nó cũng chính là phần tử tối đại của quan hệ đó. Ngoài ra trong một quan hệ thứ tự bộ phận thì có thể có nhiều phần tối đại (nếu tồn tại) nên cũng sẽ có nhiều ranh giới tối ưu (e, i) cần tìm. Tuy nhiên vì không gian tìm kiếm củ a các bài toán đa mục tiêu thường rất lớn nên hoàn toàn không dễ gì tìm kiếm một cặp (i, e) tối ưu. Do đó nhà các nhà nghiên cứu đưa ra các phương pháp sử dụng GA, mạng nơron, v.v…để tìm một cặp (i, e) xấp xỉ tối ưu.

Đây cũng là hướng tiếp cận của luận án, luận án đã đề xuất sáu mô hình để giải quyết vấn đề này. Việc so sánh tính diễn giải được và tính chính xác của sáu mô hình đề xuất với các kết quả của các tác giả khác sẽ được thuyết minh chi tiết trong các thực nghiệm trong chương 2 và chương 3.

Các kỹ thuật tính toán thông minh như mạng nơron nhân tạo (Artificial Neural Networks, ANNs)[105], logic mờ (Fuzzy Logic, FL) [106], các thuật giải di truyền (Genetic Algorithms, GAs) [17, 107] là những đề tài đang được nghiên cứu rất phổ biến hiện nay. Các kỹ thuật này được nghiên cứu rất nhiều vì cho phép giải được các bài toán phức tạp mà thông thường không giải được bằng các phương pháp cổ điển [18].

Gần đây, các nhà nghiên cứu các kỹ thuật tính toán thông minh đang quan tâm đến các hướng tiếp cận “lai”. Một trong các hướng này là sự kết hợp giữa FL và GAs dẫn đến sự ra đời của các hệ thống di truyền mờ (Genetic Fuzzy Systems, GFSs) [11, 58]. Hệ thống mờ (Fuzzy Systems, FSs) là một ứng dụng quan trọng nhất của LF. FSs là một công cụ quan trọng để mô hình hóa những bài toán thực tế có tính phức tạp và không chính xác cao mà không thể mô hình hóa bằng các phương pháp cổ điển. FSs là các hệ thống dựa trên các luật mờ (Fuzzy Rule-Based Systems, FRBSs). FRBSs là sự mở rộng của các hệ thống dựa trên luật cổ điển. FRBSs gồm các luật

“IF-THEN” mà phần tiên đề và phần kết luận của luật sử dụng logic mờ. FRBSs đã chứng tỏ có thể giúp giải quyết các bài toán về điều khiển [108], mô hình hóa [43], phân lớp, khai thác dữ liệu ([19, 20]). GAs đã và đang được sử dụng rộng rãi và phổ biến như là một kỹ thuật tìm kiếm toàn cục. GAs cho phép tìm kiếm lời giải thích hợp trong những không gian tìm kiếm lớn, phức tạp nhưng GAs chỉ cần một hàm thích nghi (Fitness function) để tối ưu hóa tìm kiếm.

Do đó, gần đây GAs được sử dụng trong quá trình học và hiệu chỉnh các thành phần của một FRBS. Một hệ thống như vậy gọi là hệ thống dựa trên luật mờ di truyền (Genetic Fuzzy Rule-Based Systems, GFRBSs) [11].

Điều này cho phép xây dựng các GFRBSs vừa tinh giản, vừa hiệu quả để giải các bài toán thực tế trong các hệ thống có tính chất phức tạp và không chắc chắn. Đây cũng chính là mục tiêu của luận án, sẽ đề cập chi tiết hơn ở mục tiếp sau đây.

1.6 Mục tiêu và phạm vi nghiên cứu

FRBSs cung cấp một công cụ hiệu quả để mô tả và xử lý vấn đề trong thế giới thực có tính chất không chắc chắn và không chính xác. Do đó các FRBSs được áp dụng vào các vấn đề điều khiển, phân lớp và mô hình hóa. Thành phần quan trọng

nhất của FRBSs là Cơ sở Tri thức (KB). KB bao gồm hai bộ phận: Cơ sở Dữ Liệu (DB) và Cơ sở Luật (RB). DB bao gồm tập các nhãn ngôn ngữ và các hàm thuộc xác định ý nghĩa của chúng. RB bao gồm tập các luật mờ “IF-THEN” với tiền đề và kết luận được biểu diễn bằng ngôn ngữ tự nhiên, và các luật này kết nối bằng toán tử "also". Điều đó có nghĩa là những các luật sẽ được kích hoạt đồng thời với cùng một dữ liệu đầu vào. Nhiều phương pháp đã được đề xuất để xây dựng tự động KB ban đầu từ dữ liệu số.

 Các hướng nghiên cứu đầu tiên tập trung vào việc học RB từ một DB được xác định trước [21, 72]. Hiệu quả hoạt động của FRBS chịu ảnh hưởng rất nhiều từ DB được xác định trước.

 Các hướng nghiên cứu thứ hai tập trung vào việc cải thiện hiệu suất của FRBS bằng cách tinh chỉnh DB ban đầu sau khi RB đã được tạo ra [58, 109]. Quá trình này chỉ điều chỉnh các tham số của các hàm thuộc nhưng không thay đổi số lượng về các nhãn ngôn ngữ trong mỗi phân hoạch mờ nên RB sẽ không bị thay đổi.

 Các hướng nghiên cứu thứ ba tập trung vào việc học để tạo ra các thành phần khác nhau cho KB ban đầu từ dữ liệu số [15, 98].

Mỗi phương pháp đều có ưu, nhược điểm thể hiện bằng những công trình nghiên cứu và các thực nghiệm liên quan. Từ việc khảo sát phân tích những phương pháp này, dựa trên những giải pháp khả thi đã được công bố trên thế giới, hướng tiếp cận chính của luận án là xây dựng một hệ suy diễn mờ tinh giản nhưng vẫn có tính hiệu quả cao.

Để luận án mang tính khả thi cả về lý thuyết lẫn thực tiễn và mang lại kết quả như mong muốn, tác giả đã thực hiện:

1) Nghiên cứu và phát triển Cơ sở lý thuyết cho việc xây dựng một hệ suy diễn mờ, cụ thể là một hệ thống dựa trên luật mờ di truyền (GFRBSs) với cấu trúc tinh giản nhưng vẫn hiệu quả cao trong ứng dụng thực tế. Nói cách khác, hệ thống này thỏa mãn hai mục tiêu là có tính diễn giải cao và có độ chính xác cao.

2) Nghiên cứu đề xuất xây dựng cấu trúc tổng quát cho GFRBSs cùng các giải pháp huấn luyện nhằm kiểm chứng kết quả nghiên cứu ở 1) và có thể triển khai trong thực tế để mang lại kết quả ứng dụng tốt hơn.

Như định hướng nêu trên, phạm vi nghiên cứu của luận án được thể hiện trong hình 1.12 dưới đây.

Mô hình được mô tả trong Hình 1.12 ở trên minh họa phạm vi của đề tài là nghiên cứu và đề xuất mô hình mới để xây dựng GFRBSs với Cơ sở luật tinh giản, nhưng hiệu quả trong ứng dụng. Luận án đã đề xuất một hướng tiếp cận mới, trong đó một phương pháp đơn giản, được gọi là phương pháp TMH (được viết tắt theo Tên+Chữ đệm+Họ của nghiên cứu sinh) đã được công bố trong các hội nghị và tạp chí quốc tế [i]-[iv], được sử dụng để tự động tạo ra FRBS dạng Mamdani từ dữ liệu số và sau đó

Bộ Suy Diễn Bộ Giải Mờ Tỷ lệ hóa đầu ra Bộ Mờ Hóa Tỷ lệ hóa đầu vào Xử lý mờ Phương Pháp TMH

Cơ sở tri thức (KB) Hàm tỷ lệ Luật mờ Hàm thuộc Thi ết k ế d i tru y ền Khởi tạo

áp dụng giải thuật di truyền nhiều giai đoạn để tinh giản, tinh chỉnh các thành phần khác nhau của KB.

Từ những trình bày trên, các bài toán chính cần giải quyết trong phạm vi luận án bao gồm:

Bài toán 1 – Thiết kế và xây dựng một hệ suy diễn mờ

Nghiên cứu Cơ sở lý thuyết và phát triển một phương pháp xây dựng một mô hình tổng quát của hệ suy diễn mờ. Luận án đề xuất một phương pháp mới TMH để xây dựng môt hệ suy diễn mờ ban đầu bao gồm KB, bộ Mờ hóa, bộ Suy diễn, bộ Giải mờ. Phương pháp TMH (sẽ được đề cập chi tiết trong mục 2.2, chương 2) cho phép xây dựng tự động một FRBS từ các dữ liệu số. KB gồm hai thành phần chính là RB và DB. RB gồm các luật dạng “IF-THEN” có phần tiền đề và phần kết luận sử dụng ngôn ngữ tự nhiên. Ngoài tính chính xác của FRBS, hiện nay các nhà nghiên cứu còn đang quan tâm đến tính diễn giải được của FRBS. Điều này được thể hiện qua việc các luật chỉ sử dụng ngôn ngữ tự nhiên và kích thước nhỏ của bộ luật và số điều kiện trong phần tiền đề của luật ít [22, 110]. DB bao gồm các hàm thuộc có một trong các dạng: hàm Gauss, hàm tam giác, hàm hình thang, hàm dạng hình chuông tổng quát cùng với các nhãn ngôn ngữ tương ứng. Luận án đề xuất dạng biểu diễn thống nhất cho các hàm thuộc (vẫn không làm mất tính tổng quát) để có thể được sử áp dụng trong bài toán 2 sau đây [iv].

Hàm tỷ lệ (hình 1.12) được sử dụng trong chương 2 và 3 của luận án thường là hàm tuyến tính hoặc hàm đồng nhất (không dùng hàm gì cả) nhằm mục đích chuẩn hóa giá trị dữ liệu vào từ đoạn [a, b] (của miền giá trị đầu vào) về đoạn [0, 1] hay biến đổi giá trị dữ liệu sau khi tính toán từ [0, 1] về đoạn [c, d] (của miền giá trị đầu ra). Các hàm tỷ lệ này phải là các song ánh để bảo đảm tính duy nhất và có thể biến đổi ngược lại được. Mục đích của việc chuẩn hóa dữ liệu về [0, 1] là để việc tính toán dễ dàng hơn trong trường hợp độ dài đoạn [a, b] quá lớn.

Các dạng hàm tỷ lệ được dùng trong luận án như sau:

f: [a, b] → [0, 1] (1.10)

g: [0, 1] → [c, d] (1.11)

x → (d – c)x+c

id: [a, b] → [a, b] (1.12)

x → x

Bài toán 2 – Tinh giản, tinh chỉnh hệ suy diễn mờ

Với hệ suy diễn mờ đã có (xây dựng từ bài toán 1 hay các phương pháp khác), luận án đã đề xuất các phương pháp sử dụng GAs tinh giản và tinh chỉnh hệ thống trên theo nhiều giai đoạn. Mục tiêu của việc này là tinh giản, tinh chỉnh hệ suy diễn nhưng vẫn đảm bảo tính hiệu quả khi ứng dụng, cụ thể là:

 Tối ưu số nhãn ngôn ngữ cho mỗi biến đầu vào và đầu ra.

 Tối ưu số luật: rút gọn số luật nhưng vẫn đảm bảo tính chính xác và hiệu quả cao trong ứng dụng.

 Tối ưu số phần tiền đề của mỗi luật: số các điều kiện trong phần tiền đề được giảm đi tối ưu mà vẫn đảm bảo hiệu quả cao khi ứng dụng.

 Tinh chỉnh các tham số của các hàm thuộc để hệ thống đạt được tính chính xác cao hơn

Với hệ suy diễn mờ đã được tinh giản và tinh chỉnh, luận án đã đề xuất:

 Cơ chế thích hợp cho bộ Mờ hóa, bộ Suy diễn, bộ Giải mờ cho FRBS đã được xây dựng.

1.7 Cấu trúc của luận án

Luận án bao gồm bốn chương.

 Chương 1: trình bày cơ sở lý thuyết của hệ suy diễn mờ cùng các hướng nghiên cứu hiện tại có liên quan. Ngoài ra, nêu lên mục tiêu và phạm vi, cuối cùng giới thiệu cấu trúc của luận án.

 Chương 2: trình bày cơ sở lý thuyết của mô hình GFRBSs cùng một số đề xuất về lý thuyết liên quan đến hướng nghiên cứu của luận án. Những đề xuất