Khai phá dữ liệu nói chung và khai phá dữ liệu bằng cây quyết định nói riêng hiện nay vẫn là vấn đề nghiên cứu và triển khai mang tính thời sự. Những vấn đề dưới đây sẽ là nội dung nghiên cứu tiếp theo của luận văn này:
- Nghiên cứu để cải tiến thuật toán cây quyết định nhằm nâng cao hơn nữa độ chính xác của mô hình và tốc độ khai phá. Mở rộng nghiên cứu một số phương pháp khai phá dữ liệu khác, kết hợp với thuật toán cây quyết định để nâng cao hiệu quả khai phá.
90
- Triển khai ứng dụng vào thực tế, tập trung phát triển các ứng dụng có sử dụng công nghệ khai phá dữ liệu phục vụ công tác quản lý xuất nhập cảnh nói riêng và ngành Công an nói chung.
91
Tài liệu tham khảo
Tiếng Việt
1. Bùi Thế Hồng (2002): “Về các thuật toán xây dựng cây quyết định và rút gọn tập luật”. Tạp trí Tin học và Điều khiển, trang 323-332.
Tiếng Anh
2. Charlie Berger (An Oracle White Paper September 2005): “Oracle Data Mining 10g Release 2 - Know More, Do More, Spend Less”.
3. Ho Tu Bao (2000): “Introduction to knowledge discovery and data mining”.
4. Jiawei Han and Micheline Kamber. Simon Fraser University (2001): “Data Mining Concept and Techniques”. Academi Press
5. Jin Huang, Jingjing Lu, Charles X. Ling. Department of Computer Science The University of Western Ontario London, Ontario, Canada (2003): “Comparing
Naive Bayes, Decision Trees, and SVM with AUC and Accuracy”, Proceedings of
the Third IEEE International Conference on Data Mining (ICDM’03) 0-7695-1978- 4/03 © 2003 IEEE.
6. Kwok-Wa Lam, Victor C. S. Lee. Department of Computer Science, City University of Hong Kong (2004): “Building Decision Trees Using Functional
Dependencies”, Proceedings of the International Conference on Information
Technology: Coding and Computing (ITCC’04)0-7695-2108-8/04 © 2004 IEEE.
7. Micheline Kamber, Lara Winstone, Wan Gong, Shan Cheng and Jiawei Han. Database Systems Research Laboratory School of Computing Science, Simon Fraser University, B.C., Canada (1997): “Generalization and decision tree induction- efficient classification in data mining”, 0-8186-7849-6197 © 1997 IEEE.
8. Oracle (June 2005): Oracle® Data Mining Concepts, 10g Release 2 (10.2)
9. Oracle (June 2005): Oracle® Data Mining Application Developer’s Guide, 10g
Release 2 (10.2)
10.Oracle (November 2005): Oracle® Data Mining Administrator's Guide, 10g Release 2 (10.2)
11.Yangdong Ye, Xiao-Yan Lv, Guo-Qiang Cai, Li-Min Jia. Department of Computer Science Zhengzhou University, Zhengzhou,China (2003): “Train ticket predictive
analysis based on decision tree induction”, Proceedings of the Second International
Conference on Machine Learning and Cybernetics 0-7803-7865-2/03 © 2003 IEEE.