Tính chất của luật kết hợp

Một phần của tài liệu (LUẬN văn THẠC sĩ) áp dụng luật kết hợp trong khai phá dữ liệu cho dữ liệu ngân hàng đầu tư và phát triển việt nam luận văn ths công nghệ thông tin 1 01 10 (Trang 30 - 31)

2.2.1 Tính chất của tập mục phổ biến.

Giả sử A và B là các tập mục phổ biến, các tính chất của tập mục phổ biến như sau:

+ Tính chất 1: Nếu A B thì supp(A)supp(B)

Vì tất cả các tác vụ trong D hỗ trợ B thì cũng hỗ trợ A.

+ Tính chất 2: Một tập chứa một tập không phổ biến thì cũng là tập không phổ biến(nếu A không phổ biến thì B cũng là không phổ biến)

Chứng minh: Nếu A B , với A, B là các tập mục thì supp(A)supp(B) (theo tính chất 1) mà supp(A)<minsupp thì supp(B)<minsupp.

+Tính chất 3: Các tập con của một tập phổ biến cũng là tập phổ biến(nếu B phổ biến thì A cũng phổ biến)

Nếu tập B là một tập phổ biến trong D, tức là supp(B)>minsuppp, mọi tập con A của B cũng phổ biến trong D bởi vì supp(A) supp(B)  minsupp (theo tính chất 2). Trường hợp đặc biệt, nếu tập A={i1,i2,....,im} thì mọi tập con(m-1) mục của nó cũng là phổ biến nhưng điều ngược lại không đúng.

2.2.2 Các tính chất của luật kết hợp

+Tính chất 1: Không hợp các luật kết hợp

Nếu X=>Z và Y =>Z trong D thì không nhất thiết (XY)=>Z là đúng

Ví dụ: xét trường hợp XY=, các tác vụ trong D hỗ trợ Z nếu và chỉ nếu chúng hỗ trợ mỗi X hoặc Y, khi đó luật XY=>Z có độ tin cậy 0%

+Tính chất 2: Không tách luật

Nếu XY=>Z thì X=>Y và Y=>Z chưa chắc xảy ra. Nhưng nếu X=>YZ thì kéo theo X=>YX=>Z

Ví dụ: trường hợp Z có mặt trong một tác vụ khi và chỉ khi cả hai X và Y cũng có mặt, tức là supp(XY)=supp(Z). Nếu độ hỗ trợ của X và Y đủ lớn hơn supp(XY), tức là supp(X)>supp(XY) và supp(Y)>supp(XY) thì hai luật riêng biệt sẽ không đủ độ tin cậy.

+Tính chất 3: Các luật không có tính bắc cầu Nếu X=>Y và Y=>Z thì không thể suy ra X=>Z

+Tính chất 4: Nếu luật A=>(L-A) không thoả mãn độ tin cậy cực tiểu thì luật B =>(L-B) cũng không thoả mãn, với các tập mục L, A, B và B  A L.

Vì supp(B)supp(A)(theo tính chất 1) ta có:

conf(B=>(L-B))=(supp(L)/supp(B))(supp(L)/supp(A))minconf

+Tính chất 5: Nếu có luật (L-C)=>C thì cũng có luật (L-D)=>D với CD và D.

Bởi vì DC nên (L-D)(L-C), do đó supp(L-D) supp(L-D) Suy ra(supp(L)/supp(L-D))(supp(L)/supp(L-C)) minconf

Một phần của tài liệu (LUẬN văn THẠC sĩ) áp dụng luật kết hợp trong khai phá dữ liệu cho dữ liệu ngân hàng đầu tư và phát triển việt nam luận văn ths công nghệ thông tin 1 01 10 (Trang 30 - 31)

Tải bản đầy đủ (PDF)

(88 trang)