Một số tính chất của luật kết hợp [6]

Một phần của tài liệu Ứng dụng khai phá dữ liệu trong khai thác cơ sở dữ liệu tích hợp nghành giao thông vận tải (Trang 37)

1. Lý thuyết về luật kết hợp

1.2. Một số tính chất của luật kết hợp [6]

Trƣớc hết ta phải giả sử rằng với luật X  Y, X có thể là rỗng, còn Y phải luôn khác rỗng và X  Y vì nếu không thì: confidence(XY)

= 1

support(X) Y)

support(X 

Ta có các tính chất sau :

1) Nếu X  Z và YZ là thoả trên D , thì không nhất thiết là XYX.

Để ý đến trƣờng hợp X  Y =  và các giao dịch trên D hỗ trợ Z nếu và chỉ nếu chúng hỗ trợ X hoặc hỗ trợ Y. Khi đó support(X Y) = 0 và

Tƣơng tự ta cũng có : Nếu XY và ZZ không thể suy ra XYZ. 2) Nếu luật XYZ là thoả trên D thì XZ và YZ có thể không thoả trên D.

Chẳng hạn, khi Z là có mặt trong một giao dịch chỉ nếu cả X và Y đều có mặt trong giao dịch đó, nghĩa là support(XY)=support(Z). Nếu support cho X và Y lớn hơn support(XY), thì 2 luật trên sẽ không có confidence yêu cầu. Tuy nhiên, nếu XYZ là thoả trên D thì có thể suy ra XY và XZ cũng thoả trên D Vì support(XY) ≥ support(XYZ) và support(XZ) ≥ support(XYZ).

3) Nếu XY và YZ là thoả trên D thì không thể khẳng định rằng XZ cũng giữ đƣợc trên D.

Giả sử T(X)T(Y)  T(Z) và confidence(XY) = confidence(YZ) = minconf. Khi đó ta có confidence(XZ) = minconf < minconf vì minconf <1, nghĩa là luật XZ không có cofidence tối thiểu.

4) Nếu luật A (L-A) không có confidence tối thiểu thì cũng không có luật nào trong các luật B (L-B) có confidence tối thiểu trong đó L-A.B là các intemset và BA.

Thật vậy, theo tính chất TC1, vì BA. Nên support(B) ≥ support(A) và theo định nghĩa của confidence, ta có :

confidence(B (L-B)) =  ) ( sup ) ( sup B port L port ) ( sup ) ( sup A port L port <minconf.

Cũng vậy, nếu luật (L-C) C là thoả trên D, thì các luật (L-K) K với KC và K cũng thoả trên D.

Bài toán khai phá luật kết hợp:

Có thể diễn đạt một bài toán khai phá luật kết hợp nhƣ sau[2][3][8]: Cho một tập các item I, một cơ sở dữ liệu giao dịch D, ngƣỡng support tối thiểu minsup, ngƣỡng confidence tối thiểu minconf, tìm tất cả các luật kết hợp XY trên D sao cho: support(XY) minsup và confidence(XY)

minconf.

Một phần của tài liệu Ứng dụng khai phá dữ liệu trong khai thác cơ sở dữ liệu tích hợp nghành giao thông vận tải (Trang 37)

Tải bản đầy đủ (PDF)

(81 trang)