Kết luận:
Với mục đích là học tập và nghiên cứu về lĩnh vực khai phá dữ liệu, trong luận văn này tôi đã trình bày những kết quả tìm hiểu của mình trong lĩnh vực này. Các nội dung tìm hiểu đó là:
Trình bày tổng quan về khai phá dữ liệu, các khái niệm cơ bản, các bước thực hiện, các chức năng, kỹ thuật khai phá dữ liệu, và ứng dụng của khai phá dữ liệu trong các lĩnh vực.
Trình bày các khái niệm về cây quyết định, các kiểu cây quyết định và các kỹ thuật khai phá dữ liệu bằng cây quyết định và một số thuật toán khai phá dữ liệu bằng cây quyết định gồm CLS, ID3, C4.5, SLIQ, SPRINT.
Trình bày bài toán ra quyết định khen thưởng trong ngành giáo dục, các quy trình xét duyệt và ra quyết định khen thưởng, đồng thời lựa chọn thuật toán để xây xây dựng hệ hỗ trợ quyết định khen thưởng trong công tác quản lý thi đua khen thưởng của Bộ Giáo dục và Đào tạo.
Luận văn đã giải quyết tốt các nội dung và yêu cầu nghiên cứu đã đặt ra. Trên cơ sở lý thuyết tôi đã sử dụng thuật toán SLIQ để cài đặt ứng dụng Hệ hỗ trợ quyết định. Qua đó tôi đã hiểu và lĩnh hội được nhiều kiến thức về lĩnh vực khai phá dữ liệu, đặc biệt là cây quyết định và các kỹ thuật khai phá dữ liệu bằng cây quyết định. Song, trong thực tế khai phá dữ liệu, phát hiện tri thức vẫn còn nhiều nội dung mà cá nhân tôi cần phải tiếp tục nghiên cứu, tìm hiểu thêm các kỹ thuật khai phá dữ liệu khác mà trong luận văn này chưa đề cập đến như: Phân cụm, mạng Nơron, Luật kết hợp,...
Hướng phát triển tiếp của đề tài:
Về lý thuyết, đề tài có thể được tiếp tục nghiên cứu và cài đặt thêm các thuật toán khai phá dữ liệu bằng cây quyết định khác như: C5,...
78
Về chương trình, cần nâng cấp, xây dựng và hoàn thiện thêm một số chức năng khác nhằm hỗ trợ tốt nhất có thể việc ra quyết định khen thưởng trong công tác quản lý Thi đua, Khen thưởng của Bộ Giáo dục và Đào tạo.
79
TÀI LIỆU THAM KHẢO
Tài liệu tiếng Việt
1. Đỗ Phúc (2007), Bài giảng khai thác dữ liệu, NXB Đại học Quốc gia TP.Hồ Chí Minh.
2. Võ Huỳnh Trâm, Trần Ngân Bình (2006), Giáo trình trí tuệ nhân tạo, Chương 9 Học máy, NXB Đại học Cần Thơ.
3. Ngô Quốc Tạo (2011), “Bài giảng môn Khai phá dữ liệu”, Lớp CHK9A - Đại học Thái Nguyên 2010 -2012.
4. NƯỚC CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM (2004), Luật thi
đua khen thưởng số 15/2003/QH11, Khóa XI, kỳ họp 4, hiệu lực từ ngày 01/7/2004.
5. Nghị định 42/2010/NĐ-CP, “Quy định chi tiết thi hành một số điều của Luật Thi đua - Khen thưởng và Luật sửa đổi bổ sung một sốđiều của Luật Thi đua, Khen thưởng”, hiệu lực từ ngày 15/04/2010.
6. Thông tư số 02/2011/TT-BNV, “Thông tư hướng dẫn thự hiện nghị định 42/2010/NĐ-CP thi hành một số điểu của Luật Thi đua, Khen thưởng và Luật sửa đổi, bổ sung một số điều của Luật Thi đua, khen thưởng”, hiệu lực từ ngày 24/10/2011.
7. Thông tư số 12/2010/TT-BGDĐT, “Thông tư hướng dẫn công tác thi đua, khen thưởng trong ngành Giáo dục”, hiệu lực từ ngày 03/4/2012.
Tài liệu tiếng Anh
8. Anurag Srivastava, Eui- Hong Han, Vipin Kumar, Vieet Singh (1999),
Parallel Formulations of Decision-Tree Classification Algorithm.
9. G.piatetsky - Shapiro and W.J. Frawley (1991), Knowledge Discovery in Databases, AAAI/MIT Press.
10. Jaiwei Han and Micheline Kamber (2001), Data Mining: Concepts and Techniques, ISBN 1-55860-489-8.
11. John Shafer, Rakesh Agrawal, Manish Mehta (1996), SPRINT- A Scalable Paralllel Classifier for Data mining. In Predeeings of the 22nd International Conference on Very Large Database, India.
80
12. Mohammed J. Zaki, Ching-Tien Ho, Rekesh Agrawal (1999), Parallel Classification for Data Mining on Shared-Memory Multiprocessors. IVM Almaden Research Center, San Jose, CA 95120.
13. Ron Kohavi, J. Ross Quinlan (1999), Decision Tree Discovery.
14. Amos Storkey (2004), “Slide Learning from Data: Decision trees”, School of Informatics university of Edinburgh.
15. Emily Thomas (2004), “Data mining: Definittions and decision tree examples”, In he Association for Institutional Research and Planing Officers (AIRPO).
Website tham khảo
16. Wikipedia, Bách khoa toàn thư mở - Cây quyết định http://en.wikipedia.org/wiki/Decision_tree/.
17. Knowledge Discovery Nuggets: http://www.kdnuggets.com/.
18. Ho Tu Bao (2000), “Introduction to Knowledge Discovery and Data Mining, Institute of Information Technology National Center for Natural Science and Technology”, http://www.jaist.ac.jp/~bao/.