Định hƣớng của đề tài là sẽ khắc phục một số hạn chế đã nêu ở trên và tiếp tục hoàn thành các thuật toán còn lại để có thể áp dụng vào thực tế. Cụ thể:
- Các module tiền xử lý dữ liệu sẽ đƣợc chỉnh sửa, bổ sung để tinh chỉnh dữ liệu trƣớc khi phân cụm.
- Tiếp tục hoàn thành module thực hiện thuật toán Fuzzy K-means và Sequential, từ đó so sánh và chọn ra thuật toán phù hợp nhất cho các loại hình dữ liệu.
- Khắc phục hạn chế của số lƣợng phần tử trong mảng bằng giải pháp tách thành các mảng con và tổ chức đƣa vào cơ sở dữ liệu.
- Nghiên cứu và đƣa thêm các thuộc tính của dữ liệu ATM để phát hiện thêm các thuộc tính về khách hàng.
Đầu ra của chƣơng trình sẽ đƣợc bổ sung chức năng mô hình hoá và đồ hoạ, giúp hiển thị kết quả một cách trực quan và tƣờng minh.
Một số chƣơng trình phân cụm dữ liệu nhƣ Mineset [8] sẽ đƣợc nghiên cứu để có thể bổ sung các tính năng phù hợp cho chƣơng trình.
TÀI LIỆU THAM KHẢO Tiếng Việt:
- [1] Bùi Công Cƣờng (2005): “Một số hướng mới trong công nghệ tri thức và khai phá dữ liệu”. Viện toán học, Trƣờng thu “Hệ mờ và ứng dụng” lần thứ 4.
- [2] Bùi Công Cƣờng, Nguyễn Doãn Phƣớc (2001): “Hệ mờ, hệ Nơron và ứng dụng”, Nhà xuất bản KHKT.
Tiếng Anh:
- [3] Sergios Theodoridis, Konstantinos Koutroumbas: “Pattern Recognition”, Academic Press, CA, 1999.
- [4] Spath H: “Clustring Analysis Algorithms”, Ellis Horwood, 1980.
- [5] MacQuenn J.B: “Some methods for classification and Analysis of multivariate observations”. Processings of the Symposium on Mathematical Statistics and Probability, 5th Beckley, Vol. 1 University of California Press.
- [6] Mataras R.L., Aguilar-Martin J: “Self-learning pattern classification using a sequential clusstering technique”, Pattern Recognition, Vol 18, 1985.
- [7] Nan-Chen Hsieh (2004): “An integrated data mining and behavioral scoring model for analyzing Bank customers”. Expert System with Application 27 (2004)
Một số trang WEB: - [8] http://www.purpleinsight.com - [9] http://bonsa1.ims.u-tokyo.ac.jp/~mdehoon/software/cluster/ - [10] http://rana.lbl.gov/EisenPublications.htm - [11] http://people.revoledu.com/kardi/tutorial/index.html - [12] http://sourceforge.net/project/showfiles.php?group_id=72667
PHỤ LỤC 1: MÃ NGUỒN CHƢƠNG TRÌNH
Chƣơng trình thực hiện bằng ngôn ngữ Visual Basic 6.0.
'*********************************************************************** ' CHUONG TRINH PHAN CUM DU LIEU „
' TAC GIA: Nguyen Doan Hien „
' Hoc Vien lớp K10T3CN - Cao hoc CNTT - Dai hoc Cong nghe – DHQHN „ '***********************************************************************