1. Tên đềtài NCKH: PHÂNCỤMMÀUTRONGXỬ LÝ ẢNH SỐ 2. Thời gian thực hiện: Bắt đầu: Tháng 11 năm 2011. Kết thúc: Tháng 4 năm 2012. 3. Cơ quan quản lý: Trường Đại học Hùng Vương 4. Cơ quan chủ trì: Trường Đại học Hùng Vương 5. Người thực hiện: Vũ Thị Thu Thủy – Bùi Nam Tuyển Sinh viên lớp K7– ĐH Tin học 6. Giảng viên hướng dẫn: ThS. Nguyễn Kim Anh Giảng viên bộ môn tin chuyên ngành Khoa Toán - Công nghệ Trường Đại Học Hùng Vương 7. Lý do chọn đề tài: Trong vài thập niên gần đây,cùng với sự thay đổi và phát triển không ngừng của ngành công nghệ thông tin nói chung và các ngành công nghệ phần mềm,phần cứng, truyền thông và các ứng dụng công nghệ thông tin trong các lĩnh vực kinh tế - chính trị,văn hóa-xã hội nói riêng. Cùng với yêu cầu ngày càng cao của con người luôn đòi hỏi việc áp dụng các phương tiện công nghệ thông tin máy móc vào trong mọi lĩnh vực của đời sống. Hơn thế nữa, khi đời sống phát triển thì kèm theo là nhu cầu tinh thần cũng càng cao. Mọi người muốn giữ lại những kí ức, những kỉ niệm đẹp về tuổi thơ,gia đình hay về những người thân yêu qua những tấm ảnh cũ. Tuy nhiên những tấm ảnh đó qua thời gian sẽ bị phai nhạt và mờ dần. Từ đó một nhu cầu mới phát sinh là làm thế nào để có thể khôi phục lại những tấm ảnh đó để nó trở nên rõ nét mà không ảnh hưởng đến nội dung bức ảnh. Cũng xuất phát từ thực tế đời sống về nhu cầu phân chia dữ liệu ra thành các nhóm có nét tương đồng về các thuộc tính đểdễ quản lí thì người ta đã đưa ra phương pháp phâncụm dữ liệu và đặc biệt là phương pháp phâncụm dữ liệu nửa giám sát k-means. Nó đã góp phần không nhỏ trong việc quản lí lượng dữ liệu lớn như là quản lí khách hàng, quản lí thư viện… Dựa trên ứng dụng của thuật toán phâncụm k-means và nhu cầu xửlí ảnh. Chúng em đã mạnh dạn tìm hiểu,phân tích và tiến hành nghiên cứu về vấn đề: “phân cụmmàutrongxửlíảnh số” và chọn nó làm đềtài nghiên cứu của mình. 8. Mục tiêu đề tài: - Nghiên cứu thuật toán phâncụm K-means và áp dụng với bài toán phâncụmmàutrongảnh số. - Viết chương trình phâncụmmàutrongxử lý ảnh số bằng ngôn ngữ lập trình C# 9. Nhiệm vụ nghiên cứu: - Nghiên cứu thuật toán phâncụm K-means và viết chương trình thực nghiệm. -Đọc ảnh và xây dựng ma trận điểm ảnh cho một bức ảnh với hai hệ tọa độ Đecac và hệ tọa độ màu RGB. -Áp dụng thuật toán K-means đểphâncụmmàu cho bức ảnh. -Xử límàu cho mỗi cụmmàu đã được phân cụm. - Viết chương trình phâncụmmàu bằng ngôn ngữ lập trình C# 10.Phương pháp nghiên cứu: -Phương pháp nghiên cứu tài liệu: Trước khi tìm hiểu tài liệu thì phải đề ra những vấn đề, những ý chính mà ta cần tìm hiểu.Thông qua những tài liệu tham khảo có thể hệ thống lại một cách tổng quát những ý chính mà ta đề ra trước đó. Từ đó tìm hiểu phântích và nghiên cứu chi tiết cụ thể về vấn đề đó. Tìm hiểu qua nhiều nguồn tài liệu để rút ra kết luận chính xác và hiệu quả nhất cho vấn đề mình nghiên cứu. -Phương pháp tham khảo ý kiến chuyên gia:Từ những vấn đề mà đã tìm hiểu nghiên cứu qua tài liệu, hỏi trực tiếp giảng viên hướng dẫn và các giảng viên trong bộ môn tin để hoàn thiện hơn vềcả hình thức và nội dung. Những vấn đề chưa định hướng được thì hỏi ý kiến của giảng viên để từ đó đưa ra định hướng cho vấn đề. 11. Đối tượng và phạm vi nghiên cứu: - Đối tượng nghiên cứu: Thuật toán phâncụm k-means và cấu trúc bức ảnh trên máy tính PC. - Phạm vi nghiên cứu: Thuật toán k-means với bài toán phâncụmmàutrongảnh số và phương pháp xử lý màu cho các cụmmàu đã phân. 12. Nội dung nghiên cứu: - Nghiên cứu thuật toán phâncụm K-means và cấu trúc bức ảnh hiển thị trên máy tính. - Viết chương trình áp dụng thuật toán K-means đểphâncụmmàu cho bức ảnh số. -Viết chương trình xử lý màu cho các cụmmàu đã được phâncụm của bức ảnh. 13. Bố cục của đề tài: Ngoài phần mở đầu, phần phụ lục, kết luận, đề tài: “Phân cụmmàutrongxử lý ảnh số” gồm 2 chương: CHƯƠNG 1: THUẬT TOÁN PHÂNCỤM DỮ LIỆU I.Nghiên cứu về bài toán phâncụm dữ liệu II. Thuật toán phâncụm K-means với bài toán phâncụm dữliệu 1. Thuật toán k-means 2. Bài toán minh họa 3. Nhận xét chung 3.1. Độ phức tạp thuật toán 3.2. Ưu nhược điểm của thuật toán CHƯƠNG 2: PHÂNCỤMMÀUẢNHTRONGXỬ LÝ ẢNH SỐ I. Nghiên cứu về cấu trúc một bức ảnhtrong máy tính II. Đọc ảnh và xây dựng ma trận điểm ảnh III. Phâncụmmàuảnh IV. Xửlíảnh 14. Ý nghĩa khoa học và thực tiễn: 14.1. Ý nghĩa khoa học: Đềtài nghiên cứu và phântích về thuật toán phâncụm dữ liệu, đưa ra chương trình áp dụng thuật toán phâncụm dữ liệu K- means đểphâncụmmàu bức ảnh và qua đó tiến hành xử lý màu cho bức ảnh. 14.2. Ý nghĩa thực tiễn: Đềtài là một chương trình hoàn thiện về phâncụmmàutrongxử lý ảnh số. Nó là chương trình ứng dụng cho những ai quan tâm đến lĩnh vực nhiếp ảnh và những ai có nhu cầu khôi phục những bức ảnh cũ bị phai mờ qua thời gian để giữ lại những khoảnh khắc đẹp của quá khứ 15. Tài liệu tham khảo [1] J. B. MacQueen (1967): "Some Methods for classification and Analysis of Multivariate Observations, Proceedings of 5-th Berkeley Symposium on Mathematical Statistics and Probability", Berkeley, University of California Press, 1:281-297. [2]. T. Kanungo, D. M. Mount, N. Netanyahu, C. Piatko, R. Silverman, and A. Y. Wu, “An efficient k-means clustering algorithm”, IEEE Trans. Pattern Analysis and Machine Intelligence, 24 (2002), 881-892. . “Phân cụm màu trong xử lý ảnh số” gồm 2 chương: CHƯƠNG 1: THUẬT TOÁN PHÂN CỤM DỮ LI U I.Nghiên cứu về bài toán phân cụm dữ li u II. Thuật toán phân cụm K-means với bài toán phân cụm d li u 1. Thuật. phân cụm dữ li u và đặc biệt là phương pháp phân cụm dữ li u nửa giám sát k-means. Nó đã góp phần không nhỏ trong việc quản lí lượng dữ li u lớn như là quản lí khách hàng, quản lí thư viện… Dựa. nghiên cứu: -Phương pháp nghiên cứu tài li u: Trước khi tìm hiểu tài li u thì phải đề ra những vấn đề, những ý chính mà ta cần tìm hiểu.Thông qua những tài li u tham khảo có thể hệ thống lại một