Khai phá luật mờ

Cho I = { i1, i2, …, in } là tập n thuộc tính, iu là thuộc tính thứ u trong I. T = { t1, t2, …, tm } là tập m bản ghi, tv là bản ghi thứ v trong T.

tv[iu] cho biết giá trị của thuộc tính iu tại bản ghi tv .

Áp dụng phƣơng pháp mờ hóa thuộc tính ở phần trên, chúng ta gắn thuộc tính iu với một tập các tập mờ nhƣ sau :

Luật kết hợp mờ có dạng: X is A => Y is B Trong đó : • X, Y ⊆ I là các tập mục (tập thuộc tính). X = {x1, x2,. . . , xp} xi ≠ xj (nếu i ≠ j ) Y = {y1, y2,. . . , yq} yi ≠ yj (nếu i ≠ j ) A = {fx1,fx2,…,fxp} , B={fy1, fy2, …, fyp}

là tập các tập mờ tƣơng ứng với các thuộc tính trong X và Y. fxi Fxi và fyk Fyk Chúng ta có thể viết lại luật kết hợp mờ ở một trong hai dạng sau :

Một tập thuộc tính mờ trong luật kết hợp mờ là một cặp <X, A> với A là tập các tập mờ tƣơng ứng với các thuộc tính trong X và X ⊆ I .

Độ hỗ trợ mờ (Fuzzy support) của tập mục <X, A> ký hiệu là fs(<X, A>) đƣợc xác định theo công thức :

Trong đó:

X = {x1, x2,. . . , xp}: tập các thuộc tính, xi là thuộc tính thứ i trong X. T = {t1, t2,. . . , tm}: tập các bản ghi (giao tác), tv là bản ghi thứ v trong T

xi(tv[xi]) đƣợc xác định theo công thức:

Với xi là hàm thuộc tập mờ fxi gắn với thuộc tính xi

Wxi là ngƣỡng (do ngƣời dùng xác định) của hàm thuộc xi

|T| (lực lƣợng của tập T) là số bản ghi trong T và bằng m

 toán tử T-norm (T-chuẩn). Trong lý thuyết logic mờ, nó có vai trò giống nhƣ phép toán logic AND trong logic cổ điển. Có nhiều cách chọn phép T-norm nhƣ:

Thực tế, phép lấy min và phép tính tích đại số là hai phép toán phù hợp nhất vì nó thuận tiện cho việc tính toán và thể hiện đƣợc mối liên hệ chặt chẽ giữa các thuộc tính trong các tập phổ biến.

Khi chọn phép lấy min cho toán tử T-norm, công thức(*) trở thành công thức:

Khi chọn phép tính tích đại số cho toán tử T-norm, công thức (*) trở thành:

Tập mục phổ biến: tập thuộc tính mờ <X, A> gọi là phổ biến nếu độ hỗ trợ của nó lớn hơn độ hỗ trợ tối thiểu do ngƣời dùng nhập vào fminsup: fs(<X,A>) >= fminsup

Độ hỗ trợ của luật mờ đƣợc tính theo công thức sau: fs(<X is A => Y is B>) = fx(<X U Y, A U B>)

Một luật đƣợc gọi là phổ biến nếu độ hỗ trợ của nó lớn hơn hoặc bằng độ hỗ trợ tối thiểu do ngƣời dùng định nghĩa:

Fs(<X is A => Y is B>) >= fminsup

Độ tin cậy của một luật mờ đƣợc tính theo công thức:

Fc(<X is A => Y is B>) = fs(<X is A => Y is B>) / fs(<X,A>)

Một luật đƣợc coi là tin cậy nếu độ tin cậy của nó không nhỏ hơn độ tin cậy tối thiểu cho trƣớc

Fc(<X is A => Y is B>) >= fminconf

Thuật toán tìm luật kết hợp Apriori:

Thuật toán khai phá luật kết hợp mờ