Luật mờ là một phát biểu có điều kiện dưới dạng if A then B, trong đó các phần if
và then lần lượt là tiền đề (điều kiện) và kết luận của luật. Các hệ dựa trên luật mờ (gọi tắt là hệ luật mờ) có tên gọi và cấu trúc khác nhau tùy thuộc vào lĩnh vực ứng
dụng của chúng. Tuy nhiên, về cơ bản một hệ dựa trên luật mờ có cấu trúc gồm các thành phần: cơ sở dữ liệu (Database), cơ sở luật mờ (Fuzzy Rule-based - FRB) và phương pháp lập luận xấp xỉ:
+ Cơ sở dữ liệu bao gồm các hàm thuộc của các tập mờ biểu diễn ngữ nghĩa của các nhãn ngôn ngữ và các tập nhãn ngôn ngữ . Các tập mờ được sử dụng để phân
hoạch miền tham chiếu Uj R (tập số thực) của biến , (j=1, .., n+1) của bài toán n
đầu vào 1 đầu ra. Các hàm thuộc của các tập mờ được xác định bởi các chuyên gia hoặc là kết quả của quá trình học từ dữ liệu.
+ Cơ sở luật bao gồm một tập luật mờ biểu diễn tri thức liên quan đến bài toán cần giải quyết. Mỗi luật mờ có cấu trúc như sau:
rq: IfA1 is xrq,1 & … &An is xrq,n ThenAn + 1 is xrq,n + 1 q=1,..,M (1.11)
trong đó, Aj thuộc tính thứ j, là xrq,j là các nhãn ngôn ngữ trong biến ngôn ngữ ứng với thuộc tính Aj. Có hai loại luật mờ được ứng dụng nhiều trong các ứng dụng thực tiễn là Takagi- sugeno và Mamdani. Với cấu trúc (1.11), trường hợp An+1 là biến ngôn ngữ thì đó là luật mờ Mamdani, An+1 là biến thực thì đó là luật mờ Takagi-sugeno. Để hệ dựa trên luật mờ đơn giản và dễ hiểu, các luật mờ cần được rút ngắn độ dài. Do đó, giá trị “Don’tcare” có giá trị hàm thuộc đồng nhất bằng 1 được bổ sung vào tập giá trị ngôn ngữ của mỗi biến (j=1, ..., n). Mỗi
luật rq dạng (1.11) có thể được viết gọn lại như sau: Để thuận tiện cho việc trình bày sau này, phần tiền đề của rq được kí kí hiệu là xrq và kết luận là yrq, khi đó luật rq có thể viết gọn thành:
rq =xrqyrq. (1.12)
trong đó,x rq là tiền đề và yrq là kết luật của luật rq.
Ví dụ hai loại luật mờ: * Luật mờ Mamdani:
IfA1 is Don’tcare & A2 is Very Low &A3 is HighThenA4 is Good
* Luật mờ Takagi-Sugeno:
IfPetalWidth is Large & PetalLength is Don’tcare Then Iris-virginica - Phương pháp lập luận xấp xỉ dựa trên các luật và các giá trị đầu vào để đưa ra giá trị dự đoán đầu ra. Trên cơ sở lý thuyết tập mờ và logic mờ, các phương pháp lập luận xấp xỉ dựa trên FRBS đã được đề xuất và được ứng dụng vào giải quyết nhiều bài toán phi tuyến phức tạp. Một số hướng lập luận xấp xỉ:
+ Lập luận xấp xỉ dựa trên quan hệ mờ
+ Lập luận dựa trên độ đốt cháy luật
Với hướng nghiên cứu của luận án tập trung vào việc trích rút hệ luật mờ cho bài toán phân lớp và hồi quy nên mục này chỉ trình bày một số phương pháp lập luận xấp xỉ dựa trên hệ luật mờ giải hai bài toán trên.
Hệ luật mờ được sử dụng để giải bài toán phân lớp được gọi là hệ luật mờ phân lớp. Dạng luật mờ được sử dụng trong bài toán phân lớp thường là luật mờ Takagi-Sugeno do không cần thực hiện quá trình giải mờ để thu được giá trị đầu ra rõ. Hai phương pháp lập luận phân lớp được nhóm tác giả Ishibuchi đề xuất là
single-winner rule hoặc weighted vote [40-42]. Để lập luận phân lớp cho mẫu dữ liệu dp = (ap,1, ap,2,…, ap,n) của tập dữ liệu D, khi đó:
+ Phương pháp lập luận single-winner rule: phân lớp tương ứng với nhãn lớp của luật có độ đốt cháy đối với mẫu dữ liệu dp lớn nhất. Nếu nhiều luật có cùng độ đốt cháy lớn nhất đối với dp thì chọn ngẫu nhiên một luật trong số đó. Công thức lập luận phân lớp như sau:
= { ( )| ⇒ =1,…, } (1.13)
∗ ,
trong đó,( ) = ∏ =1 , ( , ) là độ đốt cháy luật rq đối với mẫu dữ liệu dp và , là hàm thuộc của tập mờ ứng với nhãn ngôn ngữ , . + Phương pháp lập luận weighted vote: chọn lớp có tổng độ đốt cháy (vote) lớn nhất đối với mẫu dữ liệu dp của các luật có cùng lớp kết luận. Công thức lập luận phân lớp như sau:
C
rq* = arg max{VCh ( d p )} , (1.14)
Ch C
trong đó,VCh ( d p ) là tổng độ đốt cháy của các luật có lớp kết luận Ch đối với mẫu dữ liệu dp.
Với bài toán hồi quy, do biến đầu ra là biến ngôn ngữ nên phương pháp trung bình trọng tâm thường được sử dụng để suy diễn giá trị đầu ra. Đây là phương pháp suy diễn đơn giản và hiệu quả đã được áp dụng trong [7], [19], [22], [25], [34], [49], [62-63], [71-72]. Với mẫu dữ liệu đầu vào dp = (ap,1, ap,2, …, ap,n), giá trị đầu ra được suy diễn theo công thức sau:
M Aq ( d p ) xrq ,( n+1) yˆp =q =1 M p = 1..M (1.15) Fq ( d p ) q=1
trong đó ( ) = ∏ =1 , ( , ) là độ đốt cháy luật thứ q đối với mẫu dữ liệu dp, xrq ,( n+1) là giá trị giải mờ của tập mờ có nhãn tập mờxrq,(n+1) và , (. ) là hàm thuộc của tập mờ tương ứng với nhãn ngôn ngữxrq,j . Tiếp cận dựa trên lý thuyết ĐSGT thì
xrq ,( n+1) là giá trị định lượng của từ ngôn ngữ xrq,(n+1) , tiếp cận dựa trên lý thuyết tập mờ thìxrq ,( n+1) là giá trị tại điểm trọng tâm của tập mờ tương ứng với nhãnxrq,(n+1) .
NếuqM=1Fq ( d p ) = 0 , có nghĩa là điểm dữ liệu dp không bị phủ bởi luật nào, hay nó không đốt cháy luật nào thì được xác định theo phương pháp lập luận của Alcalá và cộng sự đề xuất trong [12] như sau: xác định hai luật gần điểm dp nhất theo khoảng cách Euclid,
giả sử hai luật đó là r1, r2, trong đó r1 gần dp hơn r2. Nếu khoảng hỗ trợ của 2 tập mờ vế phải của 2 luật giao nhau ở mức độ nào đó ( 10%) thì
suy diễn theo phương pháp trọng tâm trên luật r1. Ngược lại thực hiện suy diễn trên điểm dữ liệu′ được hình thành từ điểm dữ liệu dp như sau: giả sử
apj là một tọa độ của dp, điều kiện tiền đề thứ j của luật r1 là tập mờ được xác định bởi 3 tham số ( 1 ,1 ,1 ) với1 là chân bên trái, 1 là lõi và1
là chân bên phải của tập mờ tam giác, và điều kiện thứ j của luật r2 là tập mờ với ba tham số (2 ,2 ,2 ). Khi đó giá trị′ của điểm′ sẽ được tính như sau: 1 + ( 1 − 1 ) ∗ 0.1, ế 2 < 1 ′ = { 1 − ( 1 − 1 ) ∗ 0.1, ế 2 > 1 (1.16) ế 2 = 1
Sau đó thực hiện suy diễn điểm dữ liệu mới ′trên toàn hệ luật.