1 Nguyễn Lan Anh Nữ 5 TN x 2 Lê Nhật Minh Nam 35 TN x x x x
KẾT LUẬN 1 Kết quả đạt đƣợc trong luận văn
1. Kết quả đạt đƣợc trong luận văn
Luận văn đã nghiên cứu bài tốn quan trọng trong khai phá dữ liệu đĩ là bài tốn tìm tập mục thường xuyên đĩng. Từ khi bài tốn này được giới thiệu cho đến nay cĩ khá nhiều thuật tốn của nhiều nhĩm nghiên cứu trên thế giới đề xuất. Vì vậy cần phải lựa chọn và nghiên cứu những thuật tốn hiệu quả nhất một cách sâu sắc để gĩp phần hệ thống lại các kiến thức cơ bản trong lĩnh vực khám phá tri thức và khai phá dữ liệu. Mục tiêu của luận văn cũng muốn giúp cho những người mới nghiên cứu cĩ thể tiếp cận nhanh những kiến thức cập nhật của thế giới trong lĩnh vực này. Luận văn đã khái quát vấn đề về khai phá dữ liệu và tập mục thường xuyên đĩng, trình bày những khái niệm cơ bản và các cách tiếp cận để khai phá tập mục thường xuyên đĩng. Đồng thời trình bày chi tiết hai thuật tốn điển hình tìm tập mục thường xuyên đĩng: Thuật tốn CHARM và CLOSET+.
Khái niệm ánh xạ đĩng, tập đĩng và bao đĩng của tập mục dữ liệu đã được trình bày chi tiết để làm cơ sở cho khai phá tập mục thường xuyên đĩng. Luận văn đã trình bày rõ cấu trúc cây tìm kiếm IT-tree, FP-tree là cấu trúc dữ liệu sử dụng trong thuật tốn CHARM và CLOSET+ cùng các bước thực hiện của thuật tốn. Đề tài được làm sáng tỏ hơn qua thực nghiệm cài đặt thuật tốn CHARM ứng dụng cho khai phá trên dữ liệu y tế, kết quả khai phá cho thấy số lượng tập mục thường xuyên đĩng nhỏ hơn nhiều so với số tập mục thường xuyên và số luật kết hợp sinh ra cũng ít dư thừa hơn.