- Mô hình trượt cửa sổ (Sliding Window):
Thuật toán 2 Phân Cấp CFI – Trừ Bớt
3.3. Kết quả thực nghiệm
Chạy file: Mở file chạy Clostream.exe - Nhấn nút “chọn File dữ liệu”
- Tim đƣờng dẫn đến file excel (hoặc tích chọn một số mục trong “mục dữ liệu” để thêm giao tác).
- Chọn “Thêm giao tác”
- Nhập ngƣỡng độ hỗ trợ tối thiểu vào ô tƣơng ứng
- Nhấp nút “Tìm tập mục thƣờng xuyên đóng”, chƣơng trình sẽ tính toán và đƣa ra kết quả các tập mục thƣờng xuyên đóng vào “Tìm tập mục thƣờng xuyên đóng” tƣơng ứng
- Ngƣời dùng có thể tiếp tục thêm giao tác và thực hiện khai phá tiếp theo. Chƣơng trình sẽ hiển thị các tập mục thƣờng xuyên đóng thỏa ngƣỡng độ hỗ trợ tối thiểu mà ta vừa nhập.
Ví dụ 3.1: Khi thực hiện trên tệp SuperMarketData20x300.xls tìm các tập mục thƣờng xuyên đóng với độ hỗ trợ tối thiểu minsupp= 30%. Chƣơng trình tìm đƣợc tập mục thƣờng xuyên đóng nhƣ sau:
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
Hình 3.1: Kết quả khai phá với minsup = 30% trên tệp SuperMarketData20x300.xls
Tại thời điểm sau đó, giả sử cơ sở dữ liệu nhập vào gồm: Laptop, Chuột MT, Tivi, Bàn ghế, điều hòa, Dây điện. Nhập ngƣỡng độ hỗ trợ tối thiểu là 10%. Chƣơng trình sẽ bổ sung cơ sở dữ liệu (giao tác thứ 301) tìm đƣợc tập mục thƣờng xuyên đóng nhƣ sau:
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
Ví dụ 3.2: Khi thực hiện trên tệp SuperMarketData9x1040.xls tìm các tập mục thƣờng xuyên đóng với độ hỗ trợ tối thiểu minsupp= 20%. Chƣơng trình tìm đƣợc tập mục thƣờng xuyên đóng nhƣ sau:
Hình 3.3: Kết quả khai phá với minsup = 20% trên tệp SuperMarketData9x1040.xls
3.4 Nhận xét
Qua kết quả thực nghiệm thuật toán cho thấy: Thuật toán CloStream tìm các tập mục thƣờng xuyên đóng trên dòng dữ liệu nhanh và hiệu quả. Kết quả khai thác đúng với mô tả của thuật toán và mô hình dữ liệu mà thuật toán sử dụng. Nếu chỉ muốn khai thác trên khối dữ liệu mới xuất hiện, ta cần đặt lại điểm mốc bằng cách đƣa khối giao tác đó vào lần đầu.
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/