Thuật toán Apriori

Một phần của tài liệu Kỹ thuật khai phá dữ liệu và ứng dụng xây dựng cơ sở tri thức (Trang 44 - 46)

Bước thứ nhất của thuật toán đơn giản là đếm số lần xuất hiện của các phần tử để xác định các tập 1 phần tử. Bước tiếp theo, gọi là bước k, bao gồm hai giai đoạn. Thứ nhất, tập các phần tử lớn Lk-1 thu được từ bước thứ (k-1) được dùng sinh ra các tập phần tử ứng cử Ck , sử dụng hàm Apriori- gen, hàm này sẽ được mô tả trong phần 4.2.1. Tiếp theo, cơ sở dữ liệu được xem xét và tính độ hỗ trợ của các ứng cử trong Ck. Để việc tính toán nhanh chóng, cần xác định có hiệu quả số các ứng cử trong Ck có trong một giao dịch cho trước [2]

Nguyễn Tiến Thành – Công nghệ phần mềm K44 44

Kỹ thuật khai phá dữ liệu và ứng dụng xây dựng cơ sở tri thức Bảng 4.1 dưới đây mô tả các ký hiệu dùng trong thuật toán.

k-itemset Tập các phần tử có k phần tử

Lk Tập của các tập k phần tử đầy đủ (những phần tử này với sự hỗ trợ nhỏ nhất).Với bộ phận của tập này có hai trường 1.Tập các phần tử, 2.Tổng số sự hỗ trợ

Ck Tập của các tập phần tử k được duyệt (tiềm năng các tập phần tử đầy đủ). Với bộ phận của tập này có hai trường 1.Tập các phần tử, 2.Tổng số sự hỗ trợ

Ck

Tập của các tập phần tử k được kiểm tra khi TIDs của các thực hiện tạo ra là tuân theo sự kết hợp với các phần được kiểm tra

Bảng 4.1 Chú thích cho thuật toán Apriori Dưới đây là các bước của thuật toán Apriori

{ ---Thuật toán apriori ---}

1) L1 = { large 1-itemsets };

2) For ( k=2 ; Lk-1 # 0; k++ ) do begin

3) Ck = apriori – gen( Lk-1 ); // Các phần được kiểm tra mới 4) Forall Các thực hiện t ∈ D do begin

5) Ct = subset ( Ck , t ); // Bao gồm các phần được kiểm tra trong t 6) forall các phần kiểm tra c ∈ Ct

do c.count++ 7) end

8) Lk = { c ∈ Ck | c.count>=minsup } 9) Kết quả = UkLk ;

Với n là số giao dịch, m là số phần tử (mặt hàng), độ phức tạp của thuật toán Apriori là O(nm2m).

Dưới đây là chi tiết về các hàm được sử dụng trong thuật toán : hàm apriori-gen và hàm subset.

Một phần của tài liệu Kỹ thuật khai phá dữ liệu và ứng dụng xây dựng cơ sở tri thức (Trang 44 - 46)