Bài toán nhận dạng chính là quá trình phân loại các đối tƣợng đƣợc biểu diễn theo một mô hình nào đó và gán cho chúng vào một lớp dựa theo các quy luật và các mẫu chuẩn. Nhận dạng có rất nhiều ứng dụng, đƣợc áp dụng vào rất nhiều lĩnh vực, chẳng hạn nhƣ nhận dạng vân tay, nhận dạng chữ viết, nhận dạng ảnh… Và phân cụm màu là một bƣớc rất quan trọng trong quá trình nhận dạng ảnh.
Do số lƣợng điểm ảnh là rất lớn, thƣờng trên 80.000 điểm ảnh và số lƣợng màu của mẫu dữ liệu ảnh là phụ thuộc vào độ sắc nét của ảnh. Nếu ảnh có chất lƣợng càng tốt thì số lƣợng màu càng lớn, nhƣng dù ảnh có chất lƣợng nhƣ thế nào đi nữa thì số lƣợng màu vẫn lớn. Mặt khác, trong nhận dạng ảnh, chúng ta chỉ quan tâm tới một số yếu tố nhất định, chẳng hạn nhƣ mắt, lông mày, miệng và da,... nên số lƣợng màu mà ta quan tâm cũng không lớn lắm, vì vậy áp dụng thuật toán FCM-Cải tiến vào việc phân cụm màu trong nhận dạng ảnh là một ứng dụng rất cần thiết trong bài toán này.
Quá trình ứng dụng của thuật toán FCM-Cải tiến đƣợc mô phỏng thông qua giao diện của chƣơng trình với Hình 5.3, Hình 5.4 và Hình 5.5 dƣới đây:
Ngôn ngữ sử dụng là Visual C++ 6.0
Tham số ban đầu: Khai báo mảng lƣu trữ số lƣợng màu của ảnh, mảng lƣu trữ số trung tâm của cụm, số lƣợng cụm, tham số mũ.
Dữ liệu đầu vào là một File ảnh màu(Bitmap)
Dữ liệu đầu ra là một ảnh màu đã đƣợc nhận dạng với số cụm màu đã đƣợc thuật toán FCM-Cải tiến thực hiện phân cụm.
Hình 5.3: Giao diện của chƣơng trình khi khởi động
Khi chƣơng trình khởi động xong, ta chọn một ảnh nguồn để thực hiện bằng cách ấn vào nút “Mở File Ảnh” và chọn một ảnh cần thực hiện nhƣ Hình 5.4 dƣới đây:
Hình 5.4: Giao diện của chƣơng trình khi chọn ảnh để phân cụm
Sau khi chọn xong, ta ấn vào nút “Thực hiện phân cụm”. Chƣơng trình sẽ thực hiện quá trình nhận dạng và phân cụm màu theo thuật toán FCM-Cải tiến và hiển thị kết quả ở khung “Ảnh Đích” nhƣ Hình 5.5 dƣới đây.
KẾT LUẬN
Trong quá trình tìm hiểu và hoàn thành luận văn tốt nghiệp với đề tài
“Nghiên cứu một số phương pháp phân cụm mờ và ứng dụng”, dù đã đạt
đƣợc những kiến thức nhất định, nhƣng em nhận thấy phân cụm dữ liệu trong KPDL nói chung và phân cụm dữ liệu mờ nói riêng là một lĩnh vực nghiên cứu rộng lớn, nhiều triển vọng. Đề tài đã cố gắng tập trung tìm hiểu, nghiên cứu và trình bày đƣợc một số kỹ thuật và thuật toán phân cụm dữ liệu phổ biến, một số kỹ thuật phân cụm mờ và mô hình mạng nơron đa khớp dùng cho phân cụm mờ trong KPDL hiện nay, trình bày một số cải tiến của thuật toán phân cụm mờ(FCM-Cải tiến) dựa trên các phƣơng pháp đã có, cài đặt thử nghiệm thuật toán phân cụm mờ(FCM) với ứng dụng phân cụm các điểm màu và thực hiện cài đặt ứng dụng của thuật toán FCM-Cải tiến đối với việc phân cụm màu trong bài toán nhận dạng ảnh màu.
Tuy nhiên, do những hạn chế về tài liệu và thời gian nên em mới chỉ tìm hiểu đƣợc một số kỹ thuật điển hình trong phân cụm và đặc biệt là phân cụm mờ, cài đặt và thử nghiệm một số thuật toán ứng dụng .... nhƣng còn một số kỹ thuật khác vẫn chƣa đƣợc tìm hiểu và khai thác, cài đặt thử nghiệm chƣa áp dụng đƣợc cho bài toán phân cụm tổng quát....
Trong thời gian tới em sẽ tiếp tục nghiện cứu thêm một số kỹ thuật phân cụm và đặc biệt là các thuật toán phân cụm mờ kết hợp song song ứng dụng vào một số bài toán thực tế ở Việt Nam hiện nay và hy vọng sẽ dần đƣa những kiến thức đã có từ đề tài này sớm trở thành thực tế, phục vụ cho cuộc sống con ngƣời chúng ta.
Học viên thực hiện
TÀI LIỆU THAM KHẢO
Tài liệu Tiếng Việt:
1. Phan Đình Diệu (1999), “Lô Gích trong Các Hệ Tri Thức”, NXB Đại học Quốc gia Hà Nội, Hà Nội.
2. Nguyễn Trọng Thuần, “Điều khiển Logic và ứng dụng”, Nhà xuất bản Khoa học và Kỹ thuật, 2004.
3. Bùi Công Cƣờng và Nguyễn Doãn Phƣớc, “Hệ mờ, mạng nơron và ứng dụng ”, NXB Khoa học và kỹ thuật, 2006.
4. Vũ Thanh Nguyên, “Ứng dụng logic mờ, mạng nơron mờ, hệ các luật mờ phân tích dự báo các mặt hàng chiến lược”, Hội thảo khoa học Hệ mờ, mạng nơron và ứng dụng, lần 1, Hà nội 8-9/11/2006. 5. Ngô Quốc Tạo, “Giáo trình Xử Lý Ảnh”, Lớp CHCLC-ĐH Công
Nghệ-ĐHQG Hà Nội 2001-2002.
6. Ngô Quốc Tạo, “Bài giảng môn Data Mining”, Lớp CHK5-ĐH Thái Nguyên 2006-2008.
7. Ngô Quốc Tạo, “Bài giảng môn Xử Lý Ảnh”, Lớp CHK5-ĐH Thái Nguyên 2006-2008.
Tài liệu Tiếng Anh:
8. Daniel T. Larose, “Discovering Knowledge in Data: An Introduction toData Mining”, ISBN 0-471-66657-2 CopyrightC 2005 John Wiley & Sons, Inc.
9. A. Arning, R. Agrawal, and P. Raghavan. Alinear method for deviation detection in larger databases, “In Proc. 1996 Int. Conf. Data Mining and Knowledge Discovery (KDD-96)”, Portland, Oregon, August 1996.
10. P.S. Bradley, U. Fayyad, C. Reina, Scaling Clustering Algorithms to Large Databases, “In Proc of 4th International conference on Knowledge Discovery and Dala Mining (Kdd-98)”, New York. 1998. 11. D. Fisher, “Knowledge acquisition via incremental conceptual
clustering, In Machine Learning”, 2 pp. 139-/72, 1987.
12. D. Gibson, J. Kleinberg, P. Raghavan, “Clustering Categorical Data: An Approach Based on Dynamical Systems”, VLDB Journal 8 (3-4) pp. 222-236, 2000.
13. J. Han, M. Kamber, “Data Mining Concepts and Techniques”, Morgan Kaufmann Publishers, 2001.
14. A.K. Jain, R.C. Dubes, “Algorithms for clustering data”, Ptentice Hall, Englewood Cliffs, NJ, 1988.
15. R.A. Jarvis, E.A. Patrick, “Clustering using a similarity measure based on shared near neighbors”, IEEE Transactions on Computers C22, pp. 1025-1034, 1973.
16. M. Manago, Y. Kodratoff, “Inđuction of Decision Trees from Complex Structuted Data, In Knowledge Discovery in Databases”, AAAI/Th MIT press, pp. 289-306, 1991.
17. J.C.Bezdek, “Pattern Recognition with fuzzy Objective Function Algorithms”, New York, Plenum, 1981.
18. W.Pedrycz, “Algorithms of fuzzy clustering with partial supervision”, Pattern Recognition, vol. 23, pp.121-146, 1990.
19. M.P.Windham, “Cluster validity for fuzzy clustering algorithms”, “Fuzzy Sets and System”, vol. 3, pp. 177-183, 1981.
20. W.Pedrycz, “Algorithms of fuzzy clustering with partial supervision”, Pattern Recognition, vol. 23, pp.121-146, 1990.
21. G.Bueno, R.Gonzalez, J.Gonzalez, and M.Garcia-Rojo, “Fuzzy colour C-means clustering for pattern segmentation in histological images”, The 3rd European Medical and Biological Engineering Conference, 2005.
22. Chih-Hsiu Wei, Chin - Shyurng Fahn, “The multisynapse neural network and its application to fuzzy clustering”.
23. J.H.Wang and C.Y.Peng, “Optimal clustering using neural network”, in Proc. IEEE Int. Conf. Syst., Man, Cybern., vol.2, 1998, pp.1625-1630.
24. Y.Guo, X.Yin, and W.Gong, “ART2 neural network clustering for hierarchical simulation”, in Proc. SPIE Int. Soc.Opt.Eng., vol. 2.1998, pp.35-48.
25. M.F.Augusteijn and U.J.Steck, “Supervised adaptive clustering: A hybrid neural network clustering algorithm”, neural Comput.Applicat., vol.7,no. 1, pp.78-89, 1998.
26. E. C. Tsao, J. C. Bezdek, and N. R. Pal, “Fuzzy Kohonen clustering network”, Patterm recognition, vol.27, no.5, pp.757-764, 1994.
27. J. Lin, K. Cheng, and C.Mao, “A fuzzy Hopfield neural network for medical image segmentation”, IEEE Trans. Nuclear Sci., vol.43, 1996.
28. Hathaway R.J and Bezdek J.CNTT (2000), “Generalized fuzzy c-means clustering Strategies using LP Norm Distances”, IEEE Trans.Fuzzy Syst, No 5, pp.576-582.
29. J.E.Steck and S.N.Balakrishnan, “Use of Hopfield newral networks in optimal guidance”, IEEE Trans. Aerosp.Electron. Syst., vol.30, no.1, pp 287-293, Jan.1994.