Khái niệm tập thƣờng xuyên đóng

Một phần của tài liệu Khai phá tập mục thường xuyên đóng trên dòng dữ liệu (Trang 28 - 29)

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/

Định nghĩa 2.2.1 (toán tử đóng) :

Cho T là tập con của tập các giao tác D, T D, Y là tập con của tập các mục dữ liệu I, Y I. Khái niệm tập mục đóng dựa trên hai hàm f và g sau:

(T) = {i I t T ,i t}

hàm f trên tập giao tác T trả về tập mục dữ liệu chứa trong mọi giao tác của T.

(Y) = {t D i Y ,i t}

hàm g trên tập mục Y trả về tập các giao tác chứa Y.

Hàm C= x g là hàm hợp của f và g, đƣợc gọi là toán tử đóng.

Định nghĩa 2.2.2 (tập mục đóng) :

Một tập mục X đƣợc gọi là tập mục đóng nếu và chỉ nếu:

C= x g(X)= ( g(X))=X

C(X) đƣợc gọi là bao đóng của X. Định nghĩa 2.2 trên đã chỉ ra rằng: một tập mục X đƣợc gọi là đóng nếu và chỉ nếu X bằng với bao đóng C(X) của nó, ngƣợc lại X không phải tập đóng.

Ví dụ: Xét cở sở dữ liệu giao tác cho trong bảng 2.2.

Bảng 2.2: Cơ sở dữ liệu giao tác

TID Giao tác t1 C, D t2 A, B t3 A, B, C t4 A, B, C t5 A,C,D Ta có: g(B) = { t2, t3 ,t4} vì các giao tác t2, t3 ,t4 là chứa B Xét tập T= { t2, t3 ,t4} ta có f(T)= AB ABC ABC = AB.

C(B) =f(g(B)) =f(t2, t3 ,t4)=AB B, do đó B không phải tập mục đóng

Định nghĩa 2.2.3 (tập mục thƣờng xuyên đóng):

Tập mục X đƣợc gọi là tập mục thƣờng xuyên đóng nếu và chỉ nếu X=C(X) và độ hỗ trợ của nó không nhỏ hơn độ hỗ trợ tối thiểu minsup.

Một phần của tài liệu Khai phá tập mục thường xuyên đóng trên dòng dữ liệu (Trang 28 - 29)