Luật mờ là một phát biểu có điều kiện dưới dạng if A then B, trong đó các phần
if và then lần lượt là tiền đề (điều kiện) và kết luận của luật. Các hệ dựa trên luật mờ (gọi tắt là hệ luật mờ) có tên gọi và cấu trúc khác nhau tùy thuộc vào lĩnh vực ứng
dụng của chúng. Tuy nhiên, về cơ bản một hệ dựa trên luật mờ có cấu trúc gồm các thành phần: cơ sở dữ liệu (Database), cơ sở luật mờ (Fuzzy Rule-based - FRB) và phương pháp lập luận xấp xỉ:
+ Cơ sở dữ liệu bao gồm các hàm thuộc của các tập mờ biểu diễn ngữ nghĩa của các nhãn ngôn ngữ và các tập nhãn ngôn ngữ 𝑋𝐴𝑗. Các tập mờ được sử dụng để phân hoạch miền tham chiếu Uj R (tập số thực) của biến 𝐴𝑗, (j=1, .., n+1) của bài toán n đầu vào 1 đầu ra. Các hàm thuộc của các tập mờ được xác định bởi các chuyên gia hoặc là kết quả của quá trình học từ dữ liệu.
+ Cơ sở luật bao gồm một tập luật mờ biểu diễn tri thức liên quan đến bài toán cần giải quyết. Mỗi luật mờ có cấu trúc như sau:
rq: IfA1 is xrq,1 & … & An is xrq,n Then An + 1 is xrq,n + 1 q=1,..,M (1.11) trong đó, Aj thuộc tính thứ j, là xrq,j là các nhãn ngôn ngữ trong biến ngôn ngữ 𝑋𝐴𝑗
ứng với thuộc tínhAj. Có hai loại luật mờ được ứng dụng nhiều trong các ứng dụng
thực tiễn là Takagi-sugeno và Mamdani. Với cấu trúc (1.11), trường hợp An+1 là biến ngôn ngữ thì đó là luật mờ Mamdani, An+1 là biến thực thì đó là luật mờ Takagi- sugeno. Để hệ dựa trên luật mờ đơn giản và dễ hiểu, các luật mờ cần được rút ngắn độ dài. Do đó, giá trị “Don’tcare” có giá trị hàm thuộc đồng nhất bằng 1 được bổ sung vào tập giá trị ngôn ngữ của mỗi biến 𝑋𝐴𝑗 (j=1, ..., n). Mỗi luật rq dạng (1.11) có thể được viết gọn lại như sau: Để thuận tiện cho việc trình bày sau này, phần tiền đề của rq được kí kí hiệu là xrq và kết luận là yrq, khi đó luật rq có thể viết gọn thành:
rq = xrq yrq. (1.12)
trong đó, xrq là tiền đề và yrq là kết luật của luật rq.
Ví dụ hai loại luật mờ: * Luật mờ Mamdani:
If A1 is Don’tcare & A2 is Very Low & A3 is High Then A4 is Good * Luật mờ Takagi-Sugeno:
If PetalWidth is Large & PetalLength is Don’tcare Then Iris-virginica - Phương pháp lập luận xấp xỉ dựa trên các luật và các giá trị đầu vào để đưa ra giá trị dự đoán đầu ra. Trên cơ sở lý thuyết tập mờ và logic mờ, các phương pháp lập luận xấp xỉ dựa trên FRBS đã được đề xuất và được ứng dụng vào giải quyết nhiều bài toán phi tuyến phức tạp. Một số hướng lập luận xấp xỉ:
+ Lập luận xấp xỉ dựa trên quan hệ mờ
+ Lập luận dựa trên độ đốt cháy luật
Với hướng nghiên cứu của luận án tập trung vào việc trích rút hệ luật mờ cho bài toán phân lớp và hồi quy nên mục này chỉ trình bày một số phương pháp lập luận xấp xỉ dựa trên hệ luật mờ giải hai bài toán trên.
Hệ luật mờ được sử dụng để giải bài toán phân lớp được gọi là hệ luật mờ phân lớp. Dạng luật mờ được sử dụng trong bài toán phân lớp thường là luật mờ Takagi- Sugeno do không cần thực hiện quá trình giải mờ để thu được giá trị đầu ra rõ. Hai phương pháp lập luận phân lớp được nhóm tác giả Ishibuchi đề xuất là single-winner
rule hoặc weighted vote [40-42]. Để lập luận phân lớp cho mẫu dữ liệu dp= (ap,1, ap,2, …, ap,n) của tập dữ liệu D, khi đó:
+ Phương pháp lập luận single-winner rule: phân lớp tương ứng với nhãn lớp của luật có độ đốt cháy đối với mẫu dữ liệu dp lớn nhất. Nếu nhiều luật có cùng độ đốt cháy lớn nhất đối với dp thì chọn ngẫu nhiên một luật trong số đó. Công thức lập luận phân lớp như sau:
𝐶𝑟
𝑞∗=𝑎𝑟𝑔𝑚𝑎𝑥{𝜇𝐹(𝑑𝑝)|𝐴𝑞⇒𝐶𝑞, 𝑞=1,…,𝑀} (1.13)
trong đó, 𝜇𝐹(𝑑𝑝) = ∏𝑛𝑗=1𝜇𝑥𝑟𝑞,𝑗(𝑎𝑝,𝑗) là độ đốt cháy luật rq đối với mẫu dữ liệu dp và
𝜇𝑥𝑟𝑞,𝑗 là hàm thuộc của tập mờ ứng với nhãn ngôn ngữ 𝑥𝑟𝑞,𝑗.
+ Phương pháp lập luận weighted vote: chọn lớp có tổng độ đốt cháy (vote) lớn nhất đối với mẫu dữ liệu dp của các luật có cùng lớp kết luận. Công thức lập luận phân lớp như sau:
* arg max{ ( )} q h h r C p C C C V d = , (1.14) trong đó, ( ) h C p
V d là tổng độ đốt cháy của các luật có lớp kết luận Ch đối với mẫu dữ liệu dp.
Với bài toán hồi quy, do biến đầu ra là biến ngôn ngữ nên phương pháp trung bình trọng tâm thường được sử dụng để suy diễn giá trị đầu ra. Đây là phương pháp suy diễn đơn giản và hiệu quả đã được áp dụng trong [7], [19], [22], [25], [34], [49], [62-63], [71-72]. Với mẫu dữ liệu đầu vào dp= (ap,1, ap,2, …, ap,n), giá trị đầu ra 𝑦̂𝑝
được suy diễn theo công thức sau:
,( 1) 1 1 ( ) ˆ 1.. ( ) q q M rq n A p q p M F p q d x y p M d + = = = = (1.15)
trong đó 𝜇𝐹𝑞(𝑑𝑝) = ∏𝑛𝑗=1𝜇𝑥𝑟𝑞,𝑗(𝑎𝑝,𝑗) là độ đốt cháy luật thứ q đối với mẫu dữ liệu dp,
,( 1)
rq n
x + là giá trị giải mờ của tập mờ có nhãn tập mờxrq n,( +1)và 𝜇𝑥𝑟𝑞,𝑗(. ) là hàm thuộc của tập mờ tương ứng với nhãn ngôn ngữ xrq j, . Tiếp cận dựa trên lý thuyết ĐSGT thì
,( 1)
rq n
x + là giá trị định lượng của từ ngôn ngữ xrq,(n+1), tiếp cận dựa trên lý thuyết tập mờ thì xrq n,( +1)là giá trị tại điểm trọng tâm của tập mờ tương ứng với nhãn xrq,(n+1).
Nếu 1 ( ) 0 q M F p q= d =
, có nghĩa là điểm dữ liệu dp không bị phủ bởi luật nào, hay nó không đốt cháy luật nào thì 𝑦̂𝑖 được xác định theo phương pháp lập luận của Alcalá và cộng sự đề xuất trong [12] như sau: xác định hai luật gần điểm dp nhất theo khoảng cách Euclid, giả sử hai luật đó là r1, r2, trong đó r1 gần dp hơn r2. Nếu khoảng hỗ trợ của 2 tập mờ vế phải của 2 luật giao nhau ở mức độ nào đó (10%) thì suy diễn 𝑦̂𝑖 theo phương pháp trọng tâm trên luật r1. Ngược lại thực hiện suy diễn 𝑦̂𝑖
trên điểm dữ liệu 𝑝𝑖′ được hình thành từ điểm dữ liệu dp như sau: giả sử apj là một tọa độ của dp, điều kiện tiền đề thứ j của luật r1 là tập mờ được xác định bởi 3 tham số (𝑥𝑗1𝑠𝑡, 𝑦𝑗1𝑠𝑡, 𝑧𝑗1𝑠𝑡) với 𝑥𝑗1𝑠𝑡 là chân bên trái, 𝑦𝑗1𝑠𝑡 là lõi và 𝑧𝑗1𝑠𝑡 là chân bên phải của tập mờ tam giác, và điều kiện thứ j của luật r2 là tập mờ với ba tham số (𝑥𝑗2𝑛𝑑, 𝑦𝑗2𝑛𝑑, 𝑧𝑗2𝑛𝑑). Khi đó giá trị 𝑥𝑝𝑗′ của điểm 𝑑𝑝′ sẽ được tính như sau:
𝑥𝑝𝑗′ = {
𝑥𝑗1𝑠𝑡 + (𝑧𝑗1𝑠𝑡 − 𝑧𝑗1𝑠𝑡) ∗ 0.1, 𝑛ế𝑢 𝑦𝑗2𝑛𝑑 < 𝑦𝑗1𝑠𝑡 𝑧𝑗1𝑠𝑡 − (𝑧𝑗1𝑠𝑡 − 𝑥𝑗1𝑠𝑡) ∗ 0.1, 𝑛ế𝑢 𝑦𝑗2𝑛𝑑 > 𝑦𝑗1𝑠𝑡 𝑥𝑝𝑗 𝑛ế𝑢 𝑦𝑗2𝑛𝑑 = 𝑦𝑗1𝑠𝑡
(1.16) Sau đó thực hiện suy diễn điểm dữ liệu mới 𝑑𝑝′ trên toàn hệ luật.