Một số tớnh chất của tập mục phổ biến và luật kết hợp

Một phần của tài liệu (LUẬN văn THẠC sĩ) khai phá dữ liệu sử dụng luật kết hợp (Trang 41 - 44)

2.8.10 .Giải thuật di truyền

3.1. Luật kết hợp

3.1.3. Một số tớnh chất của tập mục phổ biến và luật kết hợp

Một số tớnh chất của tập mục phổ biến và luật kết hợp

Tớnh chất 1: Nếu A  B, với A, B là cỏc tập mục thỡ supp(A) ≥ supp(B) Điều này là rừ ràng vỡ tất cả cỏc tỏc vụ trong D hỗ trợ B thỡ cũng hỗ trợ A.

Tớnh chất 2: Một tập chứa một tập khụng phổ biến thỡ cũng là tập khụng phổ biến.

Nếu A  B, với A, B là cỏc tập mục thỡ supp(A) supp(B)(theo tớnh chất 1)

supp(A)< minsup thỡ suy ra supp(B) < minsup.

Tớnh chất 3: Cỏc tập con của một tập phổ biến cũng là một tập phổ biến. Nếu tập B là một tập phổ biến trong D, tức là: supp(B) minsup, mọi tập con A của B cũng là phổ biến trong D bởi vỡ supp(A) supp(B)minsup theo tớnh chất

Hỡnh 3.3 Độ hỗ trợ của cỏc tập mục

Outlook

Outlook

Hỡnh 3.4 Độ tin cậy của cỏc luật Outlook

1. Trƣờng hợp đặc biệt, nếu tập A ={ i1, i2, …, im} thỡ mọi tập con của cú (m-1) mục của nú cũng là phổ biến. Nhƣng ngƣợc lại khụng đỳng.

Với luật kết hợp ta cú 4 tớnh chất sau:

Tớnh chất 4: khụng hợp cỏc luật kết hợp

Nếu X  Y và Y  Z thỡ khụng nhất thiết là X  Y  Z là đỳng.

Vớ dụ: xột trƣờng hợp XY = , cỏc tỏc vụ trong D hỗ trợ Z nếu và chỉ nếu

chỳng hỗ trợ mỗi X hoặc Y, khi đú luật X  Y  Z cú độ tin cậy 0%.

Tƣơng tự X  Y và X  Z thỡ khụng nhất thiết X  Y  Z

Tớnh chất 5: Khụng tỏch luật

Nếu X  Y  Z thỡ X  Z và Y  Z chƣa chắc chắn xảy ra.

Vớ dụ trƣờng hợp Z cú mặt trong một tỏc vụ khi và chỉ khi cả hai X và Y cũng cú mặt, tức là supp(XY) = supp(Z). Nếu độ hỗ trợ của của X và Y đủ lớn hơn supp(XY), tức là supp(X) > supp(XY) và supp(Y) > supp(XY) thỡ hai luật riờng biệt sẽ khụng đủ độ tin cõy.

Tuy nhiờn đảo lại: X  Y  Z thỡ X  Y và X  Z

Tớnh chất 6: Cỏc luật kết hợp khụng cú tớnh bắc cầu Nếu X  Y và Y  Z thỡ chỳng ta khụng thể suy ra X  Z

Tớnh chất 7: Nếu luật A  (L-A) khụng thỏa món độ tin cậy cực tiểu thỡ luật B  (L-B) cũng khụng thỏa món, với cỏc tập mục L, A, B và B  A  L. Vỡ supp(B) ≥ supp(A) (theo tớnh chất 1) chỳng ta cú:

Conf(B(L-B)) = (supp(L)/supp(B))  (supp(L)/supp(A))  minconf

Cũng nhƣ vậy nếu cú luật:

(L-C) C thỡ ta cũng cú luật (L - D) D với C D và D 

suy ra: (supp(L)/supp(L-D))  (supp(L)/supp(L-C)) ≥ minconf Cỏc luật kết hợp cú thể cú cỏc dạng khỏc nhau dựa trờn cơ sở sau:

Dựa trờn cỏc kiểu của cỏc giỏ trị trong luật: Nếu luật quan tõm đến sự cú mặt hoặc khụng cú mặt của cỏc mục thỡ nú là luật kết hợp Boolean.

Vớ dụ: ―Mỏy tớnh => Phần mềm quản lý tài chớnh‖

Nếu luật miờu tả sự quan hệ giữa cỏc thuộc tớnh hoặc cỏc mục định lƣợng thỡ nú là luật kết hợp định lƣợng. Trong cỏc luật này, cỏc giỏ trị định lƣợng của cỏc mục hoặc cỏc thuộc tớnh là đƣợc phõn chia thành cỏc khoảng. Luật sau là vớ dụ luật kết hợp định lƣợng, ở đú X là biến biểu diễn khỏch hàng:

Tuổi (X, ―30..39‖)  ThuNhập (X, ―42K..48K‖)  Mua (X, ―Cú xe mỏy‖)

Dựa trờn chiều của dữ liệu chứa trong luật:

Nếu cỏc mục hoặc cỏc thuộc tớnh trong luật kết hợp tham chiếu chỉ đến một chiều của dữ liệu thỡ nú là luật kết hợp đơn chiều (single-dimensional association rule ).

Vớ dụ: Mua(X, ‗Mỏy tớnh‘)Mua(X, ‗Phần mềm quản lý‘)

Nếu luật tham chiếu đến hơn một chiều nhƣ là Mua, Loại Khỏch Hàng … thỡ gọi là luật đa chiều (mult-idimensional association rule )

Dựa trờn mức trừu tƣợng chứa trong luật: Một số phƣơng phỏp khai phỏ luật kết hợp cú thể tỡm cỏc luật với cỏc mức trừu tƣợng khỏc nhau. Vớ dụ:

Tuổi ( X, ―30…39‖)  Mua ( X, ―Mỏy tớnh xỏch tay‖) Tuổi ( X, ―30…39‖)  Mua ( X, ―Mỏy tớnh‖)

Ở đõy ―Mỏy tớnh‖ và ―Mỏy tớnh xỏch tay‖ cú cỏc mức trừu tƣợng khỏc nhau. Khai phỏ luật kết hợp cú thể mở rộng để phõn tớch sự tƣơng quan, ở đú sự cú mặt hoặc khụng cú mặt của mối tƣơng quan cỏc mục cú thể là xỏc định. Nú cú thể mở rộng để khai phỏ cỏc mẫu phổ biến cực đại và cỏc tập mục phổ biến đúng. Mẫu

phổ biến cực đại là mẫu phổ biến mà bất kỳ tập mục phổ biến nào chứa nú và lớn hơn nú đều khụng phải là phổ biến.

Một phần của tài liệu (LUẬN văn THẠC sĩ) khai phá dữ liệu sử dụng luật kết hợp (Trang 41 - 44)

Tải bản đầy đủ (PDF)

(107 trang)