4.1 Cài đặt thuật toán
Thuật toán được cài đặt trong chương trình là thuật toán Apriori, nội dung thuật toán đã được trình bày ở chương trước, trong chương này thể hiện cách cài đặt thuật toán, thuật toán được xây dựng theo các lớp, mỗi lớp có 1 file có đuôi (.cs), cụ thể có các lớp:
- CONNECT.cs : Kết nối tới CSDL - MatHang.cs : Thêm mặt hàng.
- TapMatHang.cs : Chứa các mặt hàng, kiểm tra mặt hàng có tồn tại trong tập mặt hàng không.
- TapGiaoDich.cs : Chứa các tập mặt hàng, kiểm tra mặt hàng có tồn tại trong tập giao dịch không từ đó tính độ hỗ trợ của mặt hàng đó.
- ThamSo.cs : Thiết lập các giá trị support, confidence. - TimLuat.cs : Tìm các tập phổ biến và tìm luật của bài toán.
4.2 Chạy thuật toán với bộ CSDL
4.2.1 Xử lý dữ liệu
Dữ liệu lưu trữ trong CSDL SQL Server dưới dạng bảng, tập các mặt hàng I = {A, B, C, D, E, F} . Mỗi dòng là một giao dịch có thế chứa hoặc không các mặt hàng trên. Nếu một mặt hàng có trong giao dịch nào đó thì giá trị của nó bằng 1, ngược lại bằng 0.
CSDL được chia làm 2 loại, phân tán và không phân tán. CSDL không phân tán là bảng chứa 100 000 giao dịch. CSDL phân tán là từ bảng trên phân rã thành 2 bảng, mỗi bảng 50 000 giao dịch
2.2 Thiết kế giao diện
Giao diện chính của chương trình
Hình 4.1 Giao diện chính
Trong giao diện này được chia làm 2 phần để khai phá luật và tính thời gian cho CSDL không phân tán và CSDL phân tán. Dữ liệu được load vào các DataGridView. Sau khi click vào Debug, chương trình sẽ tính toán tìm ra luật và tính thời gian thực hiện cho cả CSDL không phân tán và CSDL phân tán từ đó đưa ra kết luận so sánh thời gian khai phá luật trên các CSDL này.
KẾT LUẬN
Trong thời gian nghiên cứu, thực hiện những kết quả mà đồ án đã đạt được là:
- Nắm bắt và đưa ra được những nội dung khái quát nhất, cơ bản nhất, nêu bật được ý nghĩa, tầm quan trọng của việc luật kết hợp trong khai phá dữ liệu.
- Trình bày tương đối đầy đủ, chi tiết được những thuật toán từ đơn giản đến phức tạp để tìm luật kết hợp.
- Cài đặt thuật toán Apriori chạy với dữ liệu thực.
- Phân tích, đánh giá các kết quả tìm được và khả năng ứng dụng của luật trong thực tế.
Những kết quả đạt được trên đây là những chức năng cơ bản của hệ thống, để có được một chương trình chạy tốt, hiệu quả hơn hệ thống cần có thời gian chỉnh sửa, bổ sung, hoàn thiện một cách chi tiết và đầy đủ.