Các luậtkếthợp mờ [3] [11]

Một phần của tài liệu Khai phá dữ liệu luật kết hợp mờ và ứng dụng cho bài toán khai phá dữ liệu cước internet (Trang 60)

Cho I = . .,in} là tập n thuộc tính, iu là thuộc tính thứ u trong I. T = {ti,t2,...,tm} là tập m bản ghi, ty là bản ghi thứ V trong T.

tv[ i j cho biết giá trị của thuộc tính iu tại bản ghi ty.

Áp dụng phương pháp mờ hóa thuộc tính ờ phẩn trên, gắn thuộc tính iu với một tập các tập mờ như sau: Fi„= Luật kết hợp mờ có dạng: X is A => Y is B Trong đó: X,Y c I là các tập mục (tập thuộc tính). x = {xi,x2,...,xp} X j* X j( n ế u i* j) Y = {yi,y2,...,yq} y i* y j( n ế u i* j)

A = { f x i , f x 2 , - - - , f x p } , B = { f y l , f y2, . . - , f y q } l à t ậ p c á c t ậ p m ờ t ư ơ n g ứ n g với các thuộc tính trong X và Y. fxi 6 Fxj và fyk e Fyk.

Có thể viết lại luật kết hợp mờ ở một trong hai dạng sau:

X = {xj, x2,...,xp} is A = {fxi, f*2,—»f*p} => Y = {yj, y2,...,yq} is B = {fyi, fy2,...,fyq}

(Xi is fxi) AND ... AND (Xp is fXp) => (yi is fyl) AND ... AND (yp is fyp)

Một tập thuộc tính mờ trong luật kết hợp mờ là một cặp <X,A> với A là tập các tập mờ tương ứng với các thuộc tính trong X v à X c I .

Độ hỗ ừợ (Fuzzy support) của tập mục <X,A> ký hiệu là fs(<X,A>) được xác định theo công thức:

f (<x A>) = £ í í i a*r(/,[*,])}

Trong đó:

- |T| (Lực lượng của T) là số bản ghi trong T và bằng m.

- X = {xi,x2,.. .,X p }: Tập các thuộc tính, Xi là thuộc tính thứ i trong X. - T = {ti,t2,...,tm}: Tập các giao tác, ty là giao tác thứ V trong T

- a xu(tv[xu]) được xác định theo công thức

u r Tk = í m *> D n e u m *‘ [*i ] )

a*i(tv[Xi]) = r . .

[0 neunguoclai

V ớ i: mxi là hàm ứiuộc của tập mờ fXj gắn vớ i ứiuộc tính Xj

wxi là ngưỡng (xác định bởi người dùng) của hàm thuộc mxi.

- ® là toán từ T-norm (T-chuẩn). Trong lý thuyết logic mờ, nó có vai trò giống như phép toán AND ứong logic cổ điển. Có nhiều cách lựa chọn phép toán T-norm như:

Phép lấy min: a ® b = min(a,b) Tích đại số: a ® b = ab Tích bị chặn: a ® b = max(0,a+b-l) Tích Drastic: a ® b = a (neu b - 1) b (neu a - 1) 0 {neu a,b< 1)

Phép giao: a <8> b = 1- min [l,((l-a)w + (l-b)w)1/w] (với w >0)

Phép lấy min và phép tính đại số là hai phép toán phù hợp nhất vì nó thuận tiện cho việc tính toán và thể hiện được mối liên hệ chặt chẽ giữa các thuộc tính trong các tập phổ biến.

Khi chọn phép lấy min cho toán tử T-norm, công thức trở thành dạng:

ơ, K ], « , 2 ơv [* 2])>-><*,p ơ* [ x p] }

f S < X , A > = — --- --- --- --- --- — | f |

Khi chọn phép tích đại số cho toán tử T-norm, công thức trở thành công thức sau:

fs<X,A>= — -i-i--- |r|

Một lý do khác để sử dụng hai phép toán lấy min và phép tích đại số cho toán từ T-norm lại liên quan đến ngữ nghĩa của luật kết hợp mờ. Trong logic cổ điển, phép kéo theo (—*■) của p —> Q liên kết hai mệnh đề p và Q với nội dung ngữ nghĩa là “nếu p thì Q”. Đây là một liên kết logic khá phức tạp, nhằm diễn tả một quan hệ nhân quả, tức là chỉ trong trường hợp p và Q có quan hệ phụ thuộc nhân quả với nhau. Nhưng khi hình thức hóa, người ta gán cho p —* Q một giá trị chân lý như là hàm của các giá trị chân lý của p và Q nên dễ khập khiễng về mặt giải thích ngữ nghĩa.

Trong logic mờ, phép kéo theo cho ta các mệnh đề phức dạng “ Nếu u là p thì V là Q ” , trong đó p , Q là hai tập mờ, ta có thể xem “ nếu u là p thì V là Q ” tương đương

với việ c (u ,v ) thuộc tập mờ nào đó trên tập không gian u X V , ta k í hiệu tập mờ đó (adsbygoogle = window.adsbygoogle || []).push({});

là p —> Q. Định nghĩa quan hệ kéo theo trong logic mờ có nghĩa là định nghĩa tập mờ p —► Q (hay xác định hàm thuộc mp_^q) từ các tập mờ p và Q (hay từ hàm thuộc mp của p và mq của Q). Một số cách xác định mp_q từ mp và mq như:

Theo logic cổ điển: V(u,v) e u X V: mp_-q(u,v) = ®(l-mp,mq)

Trong đó ® là toán tử S-norm (hay còn gọi là T-đối chuẩn). Nếu ® là phép lẩy max ta có mp^ q(u,v) = max(l-mp,mq) (dienes) Nếu ® là tổng xác suất ta có mp_ q(u,v) = 1-rrip + mp*mq (mizumoto) Nếu ® là phép lấy min ta có mp_ q(u,v) = min(mp,mq) (Mamdani) Nếu ® là phép lấy tích đại số ta có mp^q(u,v) = mp*mq (Mamdani)

Luật kết hợp mờ cũng là một trong những dạng luật kéo theo mờ, do đó nó cũng phải “tuân thủ” về mặt ngữ nghĩa của dạng luật này.

Tập phổ biến: một tập thuộc tính mờ <X,A> là phổ biến nếu độ hỗ ữợ của nó lớn hom hoặc bằng độ hỗ trợ tối thiểu fminsupp (fuzzy minimum support) do người dùng nhập vào: fs(<X,A>) > fminsup

Độ hỗ trợ của một luật mờ được tính theo công thức sau: fs(<x is A => Y is B>) = fs(<x u Y, A uB>)

Độ tin cậy của một luật kết hợp được xác định theo công thức sau: fc(<x is A =>Y is B>) = fs(<x is A => Y is B>)/fs(<X,A>)

M ột luật được gọi là phổ biến nếu độ hỗ trợ của nó lớn hơn hoặc bằng fminsupp, có nghĩa là fs(<x is A => Y is B>) > fminsupp

Một luật được xem là tin cậy nếu độ tin cậy của nó lớn hơn hoặc bằng độ tin cậy tối thiểu fminconf. fc(<x is A =>Y is B>) > fminconf. fminconf (fuzzy minimum confidence) được xác định bởi người dùng.

Một phần của tài liệu Khai phá dữ liệu luật kết hợp mờ và ứng dụng cho bài toán khai phá dữ liệu cước internet (Trang 60)