Định nghĩa 2.4 : Cho CSDL giao tác DB trên tập các mục I và độ hỗ trợ tối thiểu minsup, X I là tập mục thường xuyên theo độ hỗ trợ minsup. Ta nĩi X là tập mục thường xuyên đĩng nếu X = X+
= f(X).
Nghĩa là, X là tập mục thường xuyên đĩng trong DB nếu X là tập mục thường xuyên và X là tập đĩng trong DB.
Nhận xét: Một tập mục X đĩng trong cơ sở dữ liệu DB nếu khơng tồn tại tập cha
thực sự Y nào cĩ cùng độ hỗ trợ với X.
Ví dụ: Với CSDL giao tác cho bảng 2.1, ta cĩ:
- C, CD là các tập mục thường xuyên đĩng thỏa ngưỡng minsup = 50% vì f(C) = C, f(CD) = CD và Supp(C) = 100%, Supp(CD) = 66%.
- CDE khơng là tập mục thường xuyên đĩng thỏa mãn ngưỡng minsup = 50% vì
f(CDE) = CDE nhưng Supp(CDE) = 33% < minsup.
Các tính chất của tập mục thường xuyên đĩng :
Tính chất 1: Nếu Y = f(X), thì supp (X) = supp (Y).
Tính chất 2: Nếu Y = f(X), thì Y là tập mục thường xuyên đĩng nhỏ nhất cĩ chứa X, X Y
Tính chất 3: Nếu supp(X) >supp(Y), Y là tập cha bất kỳ của X, Y X, thì X = f(X).
Ý nghĩa của tập mục thường xuyên đĩng
Trong những CSDL lớn, số lượng tập thường xuyên đĩng ít hơn rất nhiều so với số lượng tập thường xuyên thơng thường. Do đĩ, để giảm thời gian trong cơng đoạn 1 trong khai thác luật kết hợp, chúng ta cĩ thể đi tìm các tập thường xuyên đĩng thay cho các tập thường xuyên, và thực hiện rút trích luật kết hợp trên các tập thường xuyên đĩng.
Số hóa bởi Trung tâm Học liệu http://lrc.tnu.edu.vn/