Mô tả chương trình chạy

Một phần của tài liệu Một số phương pháp khai phá luật kết hợp trên cơ sở dữ liệu gia tăng (Trang 55 - 58)

Học viên sử dụng ngôn Java trên IDE Netbean cài đặt hai thuật toán Apriori và Gia tăng 1.

Chương trình chạy thuật toán Gia tăng 1đọc dữ liệu từ file .txt và kết quả được ghi ra file .txt. Những file đầu vào gồm:

File config.txt cho biết số mục dữ liệu và số giao tác. Đây là file bắt buộc phải

có.

File transa.txt chứa cơ sở dữ liệu giao tác dưới dạng ma trận giao tác. Đây là

file bắt buộc phải có.

File transa_comp chứa cơ sở dữ liệu tăng thêm. File này không bắt buộc phải

có.

File outputtsc chứa tập SC. File này không bắt buộc phải có.

File outputtn chứa những giá trị của các ngưỡng hỗ trợ tối thiểu đã khai thác.

File này không bắt buộc phải có.

S0 là ngưỡng hỗ trợ tối thiểu do người dùng chọn lựa. Sau khi chạy sẽ ghi ra các file:

File outputtn chứa những giá trị của các ngưỡng hỗ trợ tối thiểu đã khai thác

File outputtsc chứa tập SC

File output chứa các tập mục dữ liệu thường xuyên theo ngưỡng hỗ trợ tối

Chạy chương trình với S0 =5, file config.txt, file transa.txt

Kết quả như sau với tập ứng viên SC và tập ngưỡng FSup như sau:

Hình 3-1: Kết quả chạy thử nghiệm ban đầu của Gia tăng 1

Chạy thử nghiệm Apriori và Gia tăng 1:file dữ liệu giao tác ban đầu như hình 3.2, ngưỡng S0=3:

Hình 3-2: Cơ sở dữ liệu test cho Apriori và Gia tăng 1

Hình 3-3: Kết quả chạy Apriori và Gia tăng 1dữ liệu ban đầu hình 3.2

Sau đó chạy hai thuật toán khi dữ liệu tăng thêm như trong hình:

Hình 3-4: Dữ liệu tăng thêm T’

Hình 3-5: Kết quả chạy Apriori và Gia tăng 1 trên T+T’

Cả hai thuật toán đều cho ra kết quả tập mục thường xuyên Lk là giống nhau, tập ứng viên Ck khác nhau. Điều này là phù hợp với lý thuyết vì thứ tự sắp xếp các tập mục dữ liệu trong Lk của hai thuật toán khác nhau nên khi ghép nối có thể sẽ dẫn đến Ck khác nhau.

Một phần của tài liệu Một số phương pháp khai phá luật kết hợp trên cơ sở dữ liệu gia tăng (Trang 55 - 58)