Các thành phần của hệ mờ

Một phần của tài liệu Phát triển phương pháp luận trích rút hệ luật ngôn ngữ mờ giải bài toán phân lớp, hồi quy dựa trên đại số gia tử (Trang 34 - 38)

lượng IVQM fen,fm(x), nó chỉ là khoảng tính mờ của h0x, fen,fm(x) = (h0x), có thể được định vị dựa trên khoảng tính mờ của các từ được sắp xếp trên mức (k + 1). Do đó, điểm bên trái của fen,fm(x), ký hiệu là Lft(fen,fm(x)), được tính theo công thức sau với một thay đổi nhỏ (k + 1 được sử dụng thay vì k trong công thức (27) trong [61]):

���(�en,��(�)) = ∑�∈�en, + 1) (� & < � �

��(�) (1.10)

Ví dụ, với x = Lc, chúng ta có k = |x| = 2, và �� = {y ∈ �� : y < Lc} ={0,

�� ��,(3)

VVc, h0Vc, LVc, h0c, LLc}, được sắp xếp theo thứ tự tuyến tính. Như vậy, theo (1.8), chúng ta đạt được

Lft(fen,fm(Lc)) = Lft((h0Lc)) = |(0)| + |(VVc)| + |(h0Vc)| + |(LVc)| + |(h0c)| + |(LLc)|.

Một công thức đệ quy chung để tính toán giá trị IVQM fen,fm(x) trong [55] được thiết lập như sau:

Định lý 1.2 [61]. Cho một EnHA � � với H+ = {hj : 1 ≤ j p} và H = {hj : 1 ≤ j ≤ q}, và đặt � = ∑� �(ℎ ) và � = ∑−� �(ℎ ). Vì vậy + �

+ �(ℎ ) = 1.

=1

� � �=−1 � 0

Công thức đệ quy sau có thể tính toán IVQM fen,fm cảm sinh bởi m:

1) Với x G C, ���(�en,��(()) = 0; ���(�en,��(�−)) = �(�) + �. ��(�−); ���(�en,��(�)) = ��() +( �� (�−); ���(�en,��(�+)) = ���(�en,��(�)) + ��(�) + �. ��(�+) và ���(�en,��(�)) = 1 −( ��((�) . 2) Với y = hjx, x XA: đặt ( ) 1 ( )[ ( ) + ����(ℎ ℎ ) � (� − �)]}, chúng ta có: 2 �0 �� ���(� (ℎ )) = � ���(� (�)) + ���� � ��(�(ℎ ). ){1 (1 + en,�� � en,�� � 2 (ℎ )) ���� � (ℎ ) + ∑ �(ℎ ) − (�)�(ℎ )}. � 0 �=����(�) � �

1.3. Hệ dựa trên luật mờ

1.3.1. Các thành phần của hệ mờ � � � � � � � = {1 + ���� ℎ �� ℎ

Luật mờ là một phát biểu có điều kiện dưới dạng if A then B, trong đó các phần if then lần lượt là tiền đề (điều kiện) và kết luận của luật. Các hệ dựa trên luật mờ (gọi tắt là hệ luật mờ) có tên gọi và cấu trúc khác nhau tùy thuộc vào lĩnh vực ứng

dụng của chúng. Tuy nhiên, về cơ bản một hệ dựa trên luật mờ có cấu trúc gồm các thành phần: cơ sở dữ liệu (Database), cơ sở luật mờ (Fuzzy Rule-based - FRB) và phương pháp lập luận xấp xỉ:

+ Cơ sở dữ liệu bao gồm các hàm thuộc của các tập mờ biểu diễn ngữ nghĩa của các nhãn ngôn ngữ và các tập nhãn ngôn ngữ ��

��. Các tập mờ được sử dụng để phân hoạch miền tham chiếu Uj R (tập số thực) của biến ��, (j=1,

.., n+1) của bài toán n đầu vào 1 đầu ra. Các hàm thuộc của các tập mờ được xác định bởi các chuyên

gia hoặc là kết quả của quá trình học từ dữ liệu.

+ Cơ sở luật bao gồm một tập luật mờ biểu diễn tri thức liên quan đến bài toán cần giải quyết. Mỗi luật mờ có cấu trúc như sau:

rq: If A1 is xrq,1 & … & An is xrq,n Then An + 1 is xrq,n + 1 q=1,..,M (1.11) trong đó, Aj thuộc tính thứ j, là xrq,j là các nhãn ngôn ngữ trong biến ngôn ngữ ���

ứng với thuộc tính Aj. Có hai loại luật mờ được ứng dụng nhiều trong các ứng dụng thực tiễn là Takagi-sugeno và Mamdani. Với cấu trúc (1.11), trường hợp An+1 là biến ngôn ngữ thì đó là luật mờ Mamdani, An+1 là biến thực thì đó là luật mờ Takagi- sugeno. Để hệ dựa trên luật mờ đơn giản và dễ hiểu, các luật mờ cần được rút ngắn độ dài. Do đó, giá trị “Don’tcare” có giá trị hàm thuộc đồng nhất bằng 1 được bổ sung vào tập giá trị ngôn ngữ của mỗi biến ��� (j=1, ..., n). Mỗi luật rq dạng (1.11) có thể được viết gọn lại như sau: Để thuận tiện cho việc trình bày sau này, phần tiền đề của rq được kí kí hiệu là xrq và kết luận là yrq, khi đó luật rq có thể viết gọn thành:

rq = xrq yrq. (1.12)

trong đó, xrq là tiền đề và yrq là kết luật của luật rq. Ví dụ hai loại luật mờ:

* Luật mờ Mamdani:

If A1 is Don’tcare & A2 is Very Low & A3 is High Then A4 is Good

* Luật mờ Takagi-Sugeno:

If PetalWidth is Large & PetalLength is Don’tcare Then Iris-virginica - Phương pháp lập luận xấp xỉ dựa trên các luật và các giá trị đầu vào để đưa ra giá trị dự đoán đầu ra. Trên cơ sở lý thuyết tập mờ và logic mờ, các phương pháp lập luận xấp xỉ dựa trên FRBS đã được đề xuất và được ứng dụng vào giải quyết nhiều bài toán phi tuyến phức tạp. Một số hướng lập luận xấp xỉ:

+ Lập luận xấp xỉ dựa trên quan hệ mờ

+ Lập luận dựa trên độ đốt cháy luật

Với hướng nghiên cứu của luận án tập trung vào việc trích rút hệ luật mờ cho bài toán phân lớp và hồi quy nên mục này chỉ trình bày một số phương pháp lập luận xấp xỉ dựa trên hệ luật mờ giải hai bài toán trên.

Hệ luật mờ được sử dụng để giải bài toán phân lớp được gọi là hệ luật mờ phân lớp. Dạng luật mờ được sử dụng trong bài toán phân lớp thường là luật mờ Takagi- Sugeno do không cần thực hiện quá trình giải mờ để thu được giá trị đầu ra rõ. Hai phương pháp lập luận phân lớp được nhóm tác giả Ishibuchi đề xuất là

single-winner rule hoặc weighted vote [40-42]. Để lập luận phân lớp cho mẫu dữ liệu dp = (ap,1, ap,2,

…, ap,n) của tập dữ liệu D, khi đó:

+ Phương pháp lập luận single-winner rule: phân lớp tương ứng với nhãn lớp của luật có độ đốt cháy đối với mẫu dữ liệu dp lớn nhất. Nếu nhiều luật có cùng độ đốt cháy lớn nhất đối với dp thì chọn ngẫu nhiên một luật trong số đó. Công thức lập luận phân lớp như sau:

�� ∗ � =������{��(��)|��⇒��, =1,…� ,�} (1.13) trong đó, �(��) = ∏ ��� ��,� (��, �

) là độ đốt cháy luật rq đối với mẫu dữ liệu dp và ����,�là hàm thuộc của tập mờ ứng với nhãn ngôn ngữ ���,�.

+ Phương pháp lập luận weighted vote: chọn lớp có tổng độ đốt cháy (vote) lớn nhất đối với mẫu dữ liệu dp của các luật có cùng lớp kết luận. Công thức lập luận phân lớp như sau:

Cr  arg

max{VC (d p )} , (1.14)

q* h

Ch C

trong đó, VC (dp ) là tổng độ đốt cháy của các luật có lớp kết luận Ch đối với mẫu dữ liệu dp.

Với bài toán hồi quy, do biến đầu ra là biến ngôn ngữ nên phương pháp trung bình trọng tâm thường được sử dụng để suy diễn giá trị đầu ra. Đây là phương pháp suy diễn đơn giản và hiệu quả đã được áp dụng trong [7], [19], [22], [25], [34], [49], [62-63], [71-72]. Với mẫu dữ liệu đầu vào dp = (ap,1, ap,2, …, ap,n), giá trị đầu ra �̂�

được suy diễn theo công thức sau:

M Aq (dp )xrq,(n1) yˆ q1  F q (dp ) q1 p  1..M (1.15) = � 1 hp

trong đó �(��) = ∏

� (� ) là độ đốt cháy luật thứ q đối với mẫu dữ liệu dp,

� =1 � , �� � �,�

xrq,(n1) là giá trị giải mờ của tập mờ có nhãn tập mờ xrq,( n1) và ����,�(. ) là hàm thuộc của tập mờ tương ứng với nhãn ngôn

ngữ

xrq, j . Tiếp cận dựa trên lý thuyết ĐSGT thì

xrq,(n1) là giá trị định lượng của từ ngôn ngữ x

rq,( n1) , tiếp cận dựa trên lý thuyết tập mờ thì xrq,(n1) là giá trị tại điểm trọng tâm của tập mờ tương ứng với nhãn x

rq,( n1) . Nếu

M  (d

q )  0 , có nghĩa là điểm dữ liệu dp không bị phủ bởi luật nào, hay nó không đốt cháy luật nào thì �̂� được xác định theo phương pháp lập luận của Alcalá và cộng sự đề xuất trong [12] như sau: xác định hai luật gần điểm dp nhất theo khoảng cách Euclid, giả sử hai luật đó là r1, r2, trong đó r1 gần dp hơn r2. Nếu khoảng hỗ trợ của 2 tập mờ vế phải của 2 luật giao nhau ở mức độ nào đó (10%) thì suy diễn �̂� theo phương pháp trọng tâm trên luật r1. Ngược lại thực hiện suy diễn

�̂ � trên điểm dữ liệu �� �

′ được hình thành từ điểm dữ liệu dp như sau: giả sử apj là một tọa độ của dp, điều kiện tiền đề thứ j

của luật r1 là tập mờ được xác định bởi 3 tham số

(�1��, �1��, �1��) với �1�� là chân bên trái, �1�� là lõi và �1�� là chân bên phải của tập

� � � � � �

mờ tam giác, và điều kiện thứ j của luật r2 là tập mờ với ba tham số (�2��, �2��, �2��). Khi đó giá trị �′ của điểm �′ sẽ được tính như sau: � � �

�� � �1�� + (�1�� − �1��) ∗ 0.1, �ế� �2�� < �� � � � � �1�� ′ = { �1�� − (�1�� − �1��) ∗ 0.1, �ế� �2�� > �1�� (1.16) �� � � � � � ��� �ế� � 2�� = �1�� � �

Sau đó thực hiện suy diễn điểm dữ liệu mới �′trên toàn hệ luật.

Một phần của tài liệu Phát triển phương pháp luận trích rút hệ luật ngôn ngữ mờ giải bài toán phân lớp, hồi quy dựa trên đại số gia tử (Trang 34 - 38)

Tải bản đầy đủ (DOC)

(156 trang)
w