Khai thác tập hữu ích cao thực hiện tìm kiếm các tập mục được bán ra mang lại mức lãi cao hơn một ngưỡng cho trước. Việc tìm ra các tập hữu ích cao giúp gợi ý các mặt hàng liên quan trên các trang thương mại điện tử và đưa ra các chính sách bán hàng hiệu quả. Các hệ thống gợi ý thường hiện thêm khoảng 5 đến 7 sản phẩm tương tự hoặc có liên quan để giúp người dùng lựa chọn các sản phẩm cần mua. Trong các nghiên cứu trước đây, việc tìm các tập hữu ích cao thường tốn thời gian do xét nhiều tổ hợp các mục hàng trong một giao dịch. Trong bài báo này, chúng tôi đưa ra một thuật toán nhanh cho khai thác các tập hữu ích cao chứa k mục. Một cấu trúc danh sách nhỏ gọn được dùng để lưu thông tin về các tập mục chứa k mục xuất hiện trong cơ sở dữ liệu giao dịch. Đầu tiên, thực hiện phân mảnh dọc cơ sở dữ liệu giao dịch để sinh ra các phân mảnh con. Tiếp theo, khai thác các tập hữu ích cao trên từng phân mảnh dọc bằng cách thống kê các tập mục và tính số tiền lãi của tập mục đó. Các thực nghiệm được làm trên các cơ sở dữ liệu chuẩn. Kết quả thực nghiệm cho thấy cách tiếp cận đề xuất giảm đáng kể cả bộ nhớ và thời gian tính toán. Hơn nữa, thuật toán đề xuất còn tốt hơn thuật toán được so sánh.
TNU Journal of Science and Technology 226(11): 185 - 190 A FAST ALGORITHM FOR MINING K-ITEM HIGH UTILITY ITEMSETS Nong Thi Hoa1*, Nguyen Van Tao2, Nguyen Thi Tan Tien3 1Duy Tan University, 2TNU - University of Information Technology and Communication - University of Medicine and Pharmacy 3TNU ARTICLE INFO ABSTRACT Received: 23/6/2021 High utility itemset mining performs to find sold item sets whose profit overcomes a given threshold Finding high utility itemsets helps to suggest related items on e-commerce sites and makes effective policies of sales Recommender systems usually introduct from to related products to help users choose products In previous studies, finding high utility itemsets often consume the time because many combinations of items were considered In this paper, we present a fast algorithm for mining k-item high utility itemsets A compact list structure is used to store information about the itemsets appearing from the curent database First, the proposed algorithm perform a vertical segmentation of the transaction database to obtain subpartitions Next, mine high utility itemsets on each subpartiton by listing k-itemsets and its utility Experiments were performed on brenchmark databases Experimental results show that the proposed approach significantly reduces both memory and computation time Moreover, it is better than the compared algorithm Revised: 31/7/2021 Published: 02/8/2021 KEYWORDS High utility set High utility set mining k-item high utility set Vertical segmentation Data mining MỘT THUẬT TOÁN NHANH CHO KHAI THÁC CÁC TẬP HỮU ÍCH CAO CHỨA K MỤC Nông Thị Hoa1*, Nguyễn Văn Tảo2, Nguyễn Thị Tân Tiến3 1Trường 3Trường Đại học Duy Tân, 2Trường Đại học Công nghệ thông tin truyền thông - ĐH Thái Nguyên Đại học Y Dược - ĐH Thái Nguyên THƠNG TIN BÀI BÁO Ngày nhận bài: 23/6/2021 Ngày hồn thiện: 31/7/2021 Ngày đăng: 02/8/2021 TỪ KHĨA Tập hữu ích cao Khai thác tập hữu ích cao Tập hữu ích cao chứa k mục Phân đoạn dọc Khai phá liệu TĨM TẮT Khai thác tập hữu ích cao thực tìm kiếm tập mục bán mang lại mức lãi cao ngưỡng cho trước Việc tìm tập hữu ích cao giúp gợi ý mặt hàng liên quan trang thương mại điện tử đưa sách bán hàng hiệu Các hệ thống gợi ý thường thêm khoảng đến sản phẩm tương tự có liên quan để giúp người dùng lựa chọn sản phẩm cần mua Trong nghiên cứu trước đây, việc tìm tập hữu ích cao thường tốn thời gian xét nhiều tổ hợp mục hàng giao dịch Trong báo này, đưa thuật toán nhanh cho khai thác tập hữu ích cao chứa k mục Một cấu trúc danh sách nhỏ gọn dùng để lưu thông tin tập mục chứa k mục xuất sở liệu giao dịch Đầu tiên, thực phân mảnh dọc sở liệu giao dịch để sinh phân mảnh Tiếp theo, khai thác tập hữu ích cao phân mảnh dọc cách thống kê tập mục tính số tiền lãi tập mục Các thực nghiệm làm sở liệu chuẩn Kết thực nghiệm cho thấy cách tiếp cận đề xuất giảm đáng kể nhớ thời gian tính tốn Hơn nữa, thuật tốn đề xuất cịn tốt thuật tốn so sánh DOI: https://doi.org/10.34238/tnu-jst.4691 * Corresponding author Email: nongthihoa@duytan.edu.vn http://jst.tnu.edu.vn 185 Email: jst@tnu.edu.vn TNU Journal of Science and Technology 226(11): 185 - 190 Giới thiệu Ngày nay, nhiều sở liệu khổng lồ từ tập đoàn kinh doanh, phủ tổ chức xây dựng Thơng tin có giá trị sở liệu cần khai thác để hỗ trợ cho việc định Các quy tắc kết hợp chứa sở liệu giao dịch trình bày mối quan hệ mục Các quy tắc dùng để lập kế hoạch kinh doanh phát triển hệ thống gợi ý Tập hữu ích cao tập mục bán mang lại mức lãi cao ngưỡng cho trước Do đó, khai thác tập hữu ích cao tìm tập mục tạo nhiều lợi nhuận Để giảm thời gian nhớ cho việc tính tốn, số thuật tốn nhanh đề xuất để khám phá tập hữu ích cao chứa tối đa số lượng mục định Các phương pháp sử dụng cấu trúc danh sách để lưu trữ thông tin sở liệu Cấu trúc tái cấu trúc áp dụng chiến lược cắt nhánh để giảm bớt số tập mục ứng cử [1][2][3] Cấu trúc danh sách tạo tập mục ứng cử có triển vọng ước tính lãi tập mục mà không cần quét lại sở liệu [4][5][6][7] Tuy nhiên, nghiên cứu trước tốn nhiều thời gian nhớ chúng xử lý tất mục giao dịch Hơn nữa, người định lập kế hoạch kinh doanh hiệu với tập hữu ích cao có chứa số lượng mục thích hợp Tập hữu ích cao với số mục không đủ thông tin tập hữu ích cao có nhiều mục lại yêu cầu người định xem xét mức độ quan trọng mục Trong báo này, đề xuất danh sách nhỏ gọn thuật toán nhanh cho khai thác tập hữu ích cao chứa k mục để đáp ứng nhu cầu người định giảm đồng thời thời gian nhớ cho việc tính tốn Danh sách đề xuất lưu trữ tập mục tiền lãi tập mục xuất sở liệu Mỗi dòng gồm mục, tiền lãi tập mục Danh sách lưu trữ thơng tin q trình duyệt sở liệu khai thác tập hữu ích cao chứa k mục Danh sách cập nhật thêm sau phát tập mục xuất giao dịch liền kề Chúng trình bày thuật tốn nhanh hiệu để khai thác tập hữu ích cao chứa k mục Đầu tiên, sở liệu phân đoạn theo chiều dọc tạo thành phân đoạn Mọi dòng phân đoạn chứa k mục Đối với phân đoạn con, tập mục xuất giao dịch khai thác lưu trữ danh sách chung Từ danh sách chung này, xuất tập hữu ích cao chứa k mục dựa vào tiền lãi tập mục có lớn ngưỡng lãi cho trước Cách tiếp cận có hai ưu điểm mạnh bao gồm khơng tạo tập mục ứng cử, không duyệt lại sở liệu để tìm tập hữu ích cao thay đổi ngưỡng lãi Các thử nghiệm tiến hành sở liệu chuẩn với đủ đa dạng số lượng mẫu, tổng số mục số mục dài giao dịch Chúng đánh giá hiệu suất thuật toán đề xuất thời gian nhớ Kết cho thấy, cách tiếp cận hiệu khai thác sở liệu thực tốt thuật toán so sánh Phần lại báo tổ chức sau: phần II, chúng tơi trình bày thuật toán đề xuất cho khai thác nhanh tập hữu ích cao chứa k mục Phần III trình bày kết thực nghiệm tập liệu chuẩn Cuối cùng, số kết luận hướng phát triển nêu phần IV Thuật toán đề xuất cho khai thác tập hữu ích cao chứa k mục Chúng nhận thấy sở liệu giao dịch chứa phần lớn tập hữu ích cao chứa số mục chứa tập hữu ích cao chứa nhiều mục Hơn nữa, việc lập kế hoạch bán hàng hay gợi ý mặt hàng liên quan thực hiệu dựa tập hữu ích cao chứa số mục Do đó, chúng tơi đề xuất thuật toán nhanh hiệu để khai thác tập hữu ích cao chứa k mục 2.1 Ngun tắc tìm tập hữu ích cao chứa k mục Phát biểu toán: Cho sở liệu giao dịch, số mục phải có tập hữu ích cao ngưỡng lãi, tìm tập mục xuất sở liệu mà có mức lãi lớn http://jst.tnu.edu.vn 186 Email: jst@tnu.edu.vn TNU Journal of Science and Technology 226(11): 185 - 190 ngưỡng lãi Một sở liệu giao dịch gồm số lượng mục hàng mua giao dịch bảng kê lãi mặt hàng Đầu tiên, thực phân đoạn sở liệu theo chiều dọc để tạo thành phân đoạn Mỗi dịng phân đoạn chứa k mục Hình mô tả việc phân đoạn dọc sở liệu với k=5 Tiếp theo, khai thác tập hữu ích cao chứa k mục từ phân đoạn Để tiết kiệm nhớ, danh sách với cấu trúc đơn giản dùng để lưu trữ thông tin tập mục trình duyệt sở liệu Mỗi dịng chứa thơng tin tập mục chứa k mục xuất phân đoạn Cấu trúc danh sách có hai phần gồm mục tiền lãi tập mục So sánh tiền lãi với ngưỡng lãi để đưa tập hữu ích cao Đối với giao dịch có số mục không chia hết cho k mục đánh số từ 1, 2, , n, thực thêm mục vào cuối để đạt đủ k mục Hình Phân đoạn dọc sở liệu với k=5 Danh sách cập nhật hay thêm trình duyệt sở liệu Xét phân đoạn con, duyệt giao dịch từ xuống Nếu tập mục xuất giao dịch liền kề thực tính lãi tập mục giao dịch liền kề vừa xét Kiểm tra tập mục danh sách Nếu tập mục chưa có thêm dịng vào danh sách Nếu tập mục tồn cập nhật tiền lãi tập mục tiền lãi cũ cộng với tiền lãi giao dịch liền kề vừa xét Sau duyệt hết sở liệu, đưa tập hữu ích cao chứa k mục từ danh sách 2.2 Thuật toán khai thác tập hữu ích cao chứa k mục Các thông tin vào, thông tin bước thuật tốn mơ tả chi tiết sau: Input: • DB sở liệu giao dịch • min_util ngưỡng lãi • k số mục có tập hữu ích cao Output: Các tập hữu ích cao chứa k mục Danh sách biến • L danh sách lưu tập mục xuất sở liệu • P phân đoạn sở liệu • T giao dịch • I tập mục xét • e tập mục giao dịch xét Nội dung thuật tốn mơ tả chi tiết sau: Bước 1: Phân đoạn DB theo chiều dọc để dòng P chứa k mục Thực thêm vào mục với dịng chưa có đủ k mục Bước 2: Thực duyệt giao dịch từ xuống cho phân đoạn P Bước 2.1: Đặt I tập mục giao dịch P xét Bước 2.2: Với giao dịch T P, thực kiểm tra: Nếu e = I cộng dồn lãi cũ I với lãi I T http://jst.tnu.edu.vn 187 Email: jst@tnu.edu.vn TNU Journal of Science and Technology 226(11): 185 - 190 Nếu e ≠ I duyệt L để kiểm tra I có L hay chưa Nếu I có L cập nhật tiền lãi I L Nếu I chưa có L thêm dịng vào L để lưu thông tin I Bước 3: Đưa tập mục L có tiền lãi lơn ngưỡng min_util Các ưu điểm thuật toán đề xuất gồm: • Không tạo tập mục ứng cử • Khi thay đổi min_util khai thác tập hữu ích cao mà khơng cần qt lại sở liệu • Chỉ duyệt sở liệu lần • Cung cấp danh sách nhỏ gọn để tổng hợp tất thông tin trình khai thác tập hữu ích cao • Dễ hiểu dễ thực Kết thực nghiệm Các thực nghiệm làm sở liệu chuẩn có số mục giao dịch (cơ sở liệu dày đặc) Ba sở liệu dày đặc sử dụng gồm mushroom (8124 giao dịch, có 119 mục có 23 mục giao dịch), chess (3196 giao dịch, có 75 mục có 39 mục giao dịch), connect (67557 giao dịch, có 129 mục có 43 mục giao dịch) Chúng tải xuống từ FIMI Repository [8] Hầu hết sở liệu không cung cấp danh sách lãi mục số lượng mục giao dịch Giống số nghiên cứu trước [4], tiền lãi mục tạo từ 0,01 đến 10 cách sử dụng phân phối chuẩn log số lượng mục giao dịch tạo ngẫu nhiên khoảng từ đến 10 Chúng tiến hành thử nghiệm máy tính trang bị Bộ xử lý Intel 64 bit, Core i3 3,8 GHz, nhớ 32 GB chạy Windows 10 Chúng tơi làm thực nghiệm với ngưỡng lãi thay đổi ứng với ba giá trị k 5, 6, Chúng chọn ngưỡng lãi nhỏ giúp sinh nhiều tập hữu ích cao Vì vậy, thời gian chạy nhớ lớn Điều giúp đánh giá hiệu hiệu suất thuật toán đề xuất Chúng chọn phần mushroom (từ giao dịch 2000 đến giao dịch 8124), phần chess (từ giao dịch 1000 đến giao dịch 3196) phần connect (từ giao dịch 60000 đến giao dịch 67557) để giới hạn thời gian chạy Các giao dịch phía cuối chọn giao dịch sau mang tính thời giao dịch trước 3.1 Phân tích kết thực nghiệm theo tập liệu Bảng thể số liệu thu khai thác tập hữu ích cao từ mushroom Bảng cho thấy k=7 giá trị tốt cho khai thác tập hữu ích cao từ mushroom thời gian tốn nhất, số lượng tập hữu ích cao thu dung lượng nhớ sử dụng tương tự với k=6 Dữ liệu thu khai thác tập hữu ích cao từ chess trình bày Bảng Chúng tơi nhận thấy k=7 giá trị thích hợp cho khai thác tập hữu ích cao từ chess So với kết k=6 thời gian giảm nhanh giảm ngưỡng lãi, nhớ sử dụng tăng lên (khoảng 0,3 MB) số lượng tập hữu ích cao cao (nhiều khoảng 1380 tập hữu ích cao) Bảng Kết thu từ mushroom Ngưỡng lãi 500 400 300 200 100 k=5 237,2 200,0 200,2 143,6 97,0 http://jst.tnu.edu.vn Thời gian (ms) k=6 k=7 156,2 140,2 140,4 143,6 137,6 122,1 119,0 93,8 59,2 52,8 k=5 0,353 0,353 0,353 0,353 0,353 Bộ nhớ (MB) k=6 0,353 0,353 0,353 0,353 0,353 188 k=7 0,353 0,353 0,353 0,353 0,353 Số tập hữu ích cao k=5 k=6 k=7 92 591 106 226 820 266 598 1265 643 1722 2512 2104 6561 6747 6224 Email: jst@tnu.edu.vn TNU Journal of Science and Technology 226(11): 185 - 190 Bảng Kết thu từ chess Ngưỡng lãi 500 400 300 200 100 k=5 631,4 659,6 668,6 524,8 387,6 Thời gian (ms) k=6 k=7 927,8 968,2 893,8 1024,8 806,2 953,2 797,0 775,0 531,4 484,4 k=5 0,820 1,053 1,053 0,596 0,879 Bộ nhớ (MB) k=6 0,353 0,353 0,353 0,353 0,353 k=7 0,353 0,353 0,353 0,353 0,681 Số tập hữu ích cao k=5 k=6 k=7 708 993 1023 929 1439 1552 1364 2266 2522 2155 3926 4485 4239 7989 9326 Dữ liệu Bảng thể kết thu khai thác tập hữu ích cao từ connect Đây sở liệu lớn, phức tạp Với k=7, thời gian xử lý nhiều lại giảm nhanh so với k=6 giảm ngưỡng lãi Hơn nữa, nhớ sử dụng giảm nhanh giảm ngưỡng lãi k=6 lại tăng nhớ sử dụng Ngồi ra, số tập hữu ích cao tìm mức ngưỡng thấp lại nhiều k=6 khoảng 1000 tập hữu ích cao Bảng Kết thu từ connect Ngưỡng lãi 500 400 300 200 100 Thời gian (ms) k=5 k=6 k=7 762,4 896,8 2074,4 784,4 915,6 1837,0 656,0 893,2 1540,4 577,8 840,6 1212,0 797,0 634,8 853,0 k=5 0,354 0,354 0,354 0,354 5,845 Bộ nhớ (MB) k=6 k=7 0,354 28,005 0,354 28,005 0,354 28,005 11,337 11,414 11,477 5,954 Số tập hữu ích cao k=5 k=6 k=7 3666 4618 4554 4612 5805 5844 6000 7579 7703 8260 10428 10653 12318 15468 16504 Qua phân tích kết thực nghiệm trên, chọn k=7 giá trị thích hợp cho ba sở liệu Với ngưỡng lãi thấp (100) khai thác từ connect, thời gian tính tốn 853 (ms) nhớ dùng gần MB Vì vậy, thuật tốn đề xuất khai thác hiệu sở liệu lớn 3.2 So sánh với nghiên cứu liên quan Chúng tơi so sánh thuật tốn chúng tơi với EFIM-Closed [1] EFIM-Closed thực tìm tập hữu ích đóng có thời gian thực nhanh Kết EFIM-Closed lấy từ chương trình nằm thư viện SPMF Error! Reference source not found Các thực nghiệm làm tập mushroom để hạn chế thời gian tính tốn Do ngưỡng lãi thấp thời gian chạy nhiều Chúng tơi chọn ngưỡng lãi EFIM-Closed cao 100 lần ngưỡng lãi dùng thuật toán đề xuất để so sánh Nghĩa là, thuật toán đề xuất chạy nhiều thời gian nhiều lần so với EFIM-Closed Chúng chọn k=7 để chạy với mushroom Bảng thể thời gian xử lý nhớ thuật toán đề xuất dùng cho mushroom với k=7 Các mức ngưỡng lãi chọn 50, 100, 150, 200, 250 Số tập hữu ích cao chứa mục khai thác từ 106 tập đến 6224 tập Thời gian xử lý từ 52,8 (ms) đến 143,6 (ms) nhớ ổn định mức 0,35 MB Bảng thể thời gian xử lý nhớ thuật toán EFIM-Closed dùng cho mushroom Các mức ngưỡng lãi chọn 5000, 10000, 15000, 20000, 25000 Số tập hữu ích cao đóng khai thác từ 21772 tập đến 75248 tập Thời gian xử lý từ 5277,3 (ms) đến 8628,0 (ms) Bộ nhớ thay đổi từ 181,27 MB đến 242,21 MB Bảng Thời gian xử lý nhớ thuật toán đề xuất dùng cho mushroom với k=7 Ngưỡng lãi Số tập hữu ích cao chứa mục Thời gian (ms) Bộ nhớ (MB) 250 106 140,2 0,35309 200 266 143,6 0,35323 150 643 122,1 0,35301 100 2104 93,8 0,35291 50 6224 52,8 0,35330 http://jst.tnu.edu.vn 189 Email: jst@tnu.edu.vn TNU Journal of Science and Technology 226(11): 185 - 190 Bảng Thời gian xử lý nhớ thuật toán EFIM-Closed dùng cho mushroom với k=7 Ngưỡng lãi 25000 20000 15000 10000 5000 Số tập hữu ích cao đóng 21772 27591 35186 48855 75248 Thời gian (ms) 5277,3 5816,3 6516,7 7378,3 8628,0 Bộ nhớ (MB) 181,272 212,261 242,218 194,346 216,416 Dữ liệu từ Bảng cho thấy, thời gian tính tốn EFIM-Closed cao 37 lần so với thuật toán đề xuất dung lượng nhớ EFIM-Closed cao 513 lần so với thuật toán đề xuất Nghĩa là, thực thuật toán đề xuất tốt thuật toán EFIM-Closed nhớ thời gian tính tốn Kết luận Trong báo này, đề xuất danh sách nhỏ gọn thuật toán nhanh để khai thác tập hữu ích cao chứa k mục Một danh sách dùng để lưu trữ thông tin tập mục xuất trình duyệt sở liệu Các tập hữu ích cao chứa k mục trích xuất từ danh sách dựa vào so sánh tiền lãi với ngưỡng lãi cho trước Đầu tiên, phân đoạn dọc thực sở liệu để tạo thành phân đoạn Tiếp theo, tập hữu ích cao chứa k mục khai thác từ phân đoạn Cách tiếp cận đề xuất có ưu điểm mạnh gồm không tạo tập mục ứng cử, không cần duyệt lại sở liệu thay đổi ngưỡng lãi Các thử nghiệm thực ba sở liệu dày đặc chuẩn Thuật toán đề xuất tiêu tốn khoảng thời gian nhỏ (tối đa khoảng 2s) chiếm nhớ nhỏ (tối đa khoảng 28 MB) Kết thực nghiệm cho thấy cách tiếp cận phù hợp với ứng dụng thực tốt thuật toán so sánh Chúng tiếp tục nghiên cứu để giảm dung lượng nhớ tiến hành thử nghiệm sở liệu lớn tương lai TÀI LIỆU THAM KHẢO/ REFERENCES [1] P Fournier-Viger, S Zida, J C.-W Lin, C.-W Wu, V S Tseng, "EFIM-Closed: Fast and memory efficient discovery of closed high-utility itemsets," In: Proceedings of MLDM 2016, LNCS, Springer, USA, 2016, vol 9729, pp 199-213 [2] Y Unil, K Donggyu, Y Eunchul, F Hamido, "Damped window based high average utility pattern mining over data streams," Knowledge-Based Systems, vol 144, pp 188-205, 2018 [3] K Donggyu and Y Unil, "Efficient algorithm for mining high average-utility itemsets in in-cremental transaction databases," Applied Intelligence, vol 47, no 1, pp 114-131, 2017 [4] C W Wu, P Fournier-Viger, J Y Gu, V S Tseng, "Mining closed high utility itemsets without candidate generation," In: Proceeding of Technologies and Applications of Artificial Intelligence (TAAI), Taiwan, 2015, pp 187-194 [5] P Fournier-Viger, J Lin, R Nkambou, B Vo, V S Tseng, "Mining Compact High Utility Itemsets Without Candidate Generation," High-Utility Pattern Mining: Theory, Algorithms and Applications, vol 51, pp 282-307, 2019 [6] L T Dam, R Heri, N Kjetil, and H Q Duong, "Towards efficiently mining closed high utility itemsets from incremental databases," Knowledge-Based Systems, vol 165, pp 13-29, 2019 [7] Y Until, K Donggyu, "Mining of high average-utility itemsets using novel list structure and pruning strategy," Future Generation Computer Systems, vol 68, pp 346-360, 2017 [8] Frequent Itemset Mining Dataset Repository, 2012 [Online] Available: http://fimi.uantwerpen.be/ [Accessed May 25, 2021] [9] P Fournier-Viger, A Gomariz, A Soltani, H Lam, and T Gueniche, "Spmf: Open-source data mining platform," 2014 [Online] Available: http://www.philippe-fournier-viger.com/spmf/ [Accessed May 15, 2021] http://jst.tnu.edu.vn 190 Email: jst@tnu.edu.vn ... hiệu dựa tập hữu ích cao chứa số mục Do đó, chúng tơi đề xuất thuật tốn nhanh hiệu để khai thác tập hữu ích cao chứa k mục 2.1 Nguyên tắc tìm tập hữu ích cao chứa k mục Phát biểu toán: Cho sở liệu... xuất cho khai thác tập hữu ích cao chứa k mục Chúng nhận thấy sở liệu giao dịch chứa phần lớn tập hữu ích cao chứa số mục chứa tập hữu ích cao chứa nhiều mục Hơn nữa, việc lập k? ?? hoạch bán hàng... tất mục giao dịch Hơn nữa, người định lập k? ?? hoạch kinh doanh hiệu với tập hữu ích cao có chứa số lượng mục thích hợp Tập hữu ích cao với số mục khơng đủ thơng tin tập hữu ích cao có nhiều mục