Như đã đề cập ở trên, bài toán đặt ra là phải tìm tất cả các tập mục thoả ngưỡng minsupp. Với việc duyệt tất cả các tập con của I sẽ hoàn toàn thất bại vì không gian tìm kiếm quá lớn. Trên thực tế, các mục tăng tuyến tính số lượng bản ghi kéo theo sự tăng theo cấp luỹ thừa các tập mục cần xem xét. Với trường hợp đặc biệt I={1,2,3,4}, ta có thể biểu diễn không gian tìm kiếm thành một lưới như trong hình sau:
Hình 2.1 Dàn cho tập I={1,2,3,4}
Các tập phổ biến nằm trong phần trên của hình trong khi những tập không phổ biến lại nằm trong phần dưới. Mặc dù không chỉ ra một cách tường minh các giá trị hỗ trợ cho mỗi tập mục nhưng giả sử rằng đường biên đậm trong hình trên phân chia các tập phổ biến và tập không phổ biến. Sự tồn tại của đường biên như vậy không phụ thuộc vào bất kỳ CSDL D và ngưỡng hỗ trợ minsupp nào mà sự tồn tại của nó chỉ đơn thuần được đảm bảo bởi tính chặn dưới của tập mục thoả ngưỡng hỗ trợ minsupp.
Nguyên lý cơ bản của các thuật toán thông thường là sử dụng đường biên này để thu hẹp không gian tìm kiếm một cách hiệu quả. Khi đường biên được tìm thấy, có thể giới hạn việc xác định các giá trị hỗ trợ của các tập mục phía trên đường biên và bỏ qua các tập mục phía dưới đường biên.
Giả sử ánh xạ f:I{1,...,|I|} là một phép ánh xạ từ các phần tử xI ánh xạ 1- 1 vào các số tự nhiên. Trong đó các phần tử có thể được xem có thứ tự hoàn toàn
{1} {2} {3} {4} {1,2} {1,3} {1,4} {2,3} {2,4} {3,4} {1,2,3} {1,2,4} {1,3,4} {2,3,4} {2,3,4}
Mặt khác, với XI, cho X.item:{1,..,|X|}I:nX.itemn là một ánh xạ, trong đó X.itemn là phần tử thứ n của các phần tử x X sắp xếp tăng dần trên quan hệ “<” của n- tiền tố của một tập mục X với n |X| được định nghĩa bởi P={X.itemm | 1 m
n}.
Cho các lớp E(p), PI với E(P)={XI:|X|=|P|+1 và P là một tiền tố của X} là các nút của một cây. Hai nút sẽ được nối với nhau bằng một cạnh nếu tất cả các tập mục của lớp E có thể được phát sinh bằng cách kết hợp hai tập mục của lớp cha E‟.
Cùng với tính chặn dưới của tập mục thoả ngưỡng minsupp, điều này suy ra: nếu lớp cha E‟ của lớp E không có tối thiểu hai tập phổ biến thì E cũng phải không chứa bất kỳ một tập phổ biến nào. Nếu gặp một lớp E‟ như vậy trong quá trình duyệt cây từ trên xuống thì đã tiến đến đường biên phân chia giữa tập phổ biến và không phổ biến. Do đó không cần phải tìm tiếp phần sau đường biên này, tức là đã loại bỏ E và các lớp con của E trong không gian tìm kiếm.
Tiếp theo cần giới hạn một cách có hiệu quả số lượng các tập mục cần phải duyệt. Chỉ cần xác định các giá trị độ hỗ trợ của các tập mục mà đã duyệt qua trong quá trình tìm kiếm đường biên giữa tập phổ biến và tập không phổ biến.
Cuối cùng, chiến lược tiếp cận phổ biến hiện nay sử dụng cả tìm kiếm ưu tiên bề rộng(BFS) lẫn tìm kiếm ưu tiên chiều sâu (DFS). Với BFS, giá trị hỗ trợ của tất cả (k-1) itemset được xác định trước khi tính giá trị hỗ trợ của k-itemset. Ngược lại, DFS duyệt đệ quy theo cấu trúc cây mô tả ở trên.