Nghiên cứu và xây dựng hệ thống phân đoạn ảnh màu sử dụng thuật toán jseg
TRƯỜNG ĐẠI HỌC ĐIỆN LỰC KHOA CÔNG NGHỆ THÔNG TIN BÁO CÁO THỰC TẬP HỆ THỐNG THÔNG TIN QUẢN LÝ ĐỀ TÀI: NGHIÊN CỨU XÂY DỰNG HỆ THỐNG PHÂN ĐOẠN ẢNH MÀU SỬ DỤNG THUẬT TOÁN JSEG Giảng viên hướng dẫn : TS. NGUYỄN HỮU QUỲNH Sinh viên thực hiện : PHƯƠNG VĂN CẢNH Chuyên ngành : CÔNG NGHỆ PHẦN MỀM Lớp : D4-CNTT Hà Nội - 2013 LỜI CẢM ƠN Trong quá trình thực tập này, em luôn nhận được sự hướng dẫn, chỉ bảo tận tình của TS. Nguyễn Hữu Quỳnh, giảng viên công nghệ thông tin trường Đại học Điện Lực, thầy đã giành nhiều thời gian hướng dẫn, giúp đỡ tận tình cho em trong quá trình thực tập. Em xin chân thành cảm ơn sâu sắc tới các thầy cô giáo trong trường Đại học Điện Lực và đặc biệt các thầy cô trong khoa Công Nghệ Thông Tin, những người thầy, cô đã tận tình giảng dạy và truyền đạt cho em những kiến thức, những kinh nghiệm quý báu trong suốt những năm học tập và rèn luyện ở trường Đại học Điện Lực. Xin chân thành cảm ơn các bạn sinh viên lớp Đại Học Đ4 - CNTT - trường Đại học Điện Lực đã luôn động viên, giúp đỡ và nhiệt tình chia sẻ những kinh nghiệm học tập trong suốt quá trình học tập ở trường. Em xin được bày tỏ lòng biết ơn sâu sắc tới những người thân trong gia đình và người thân xung quanh đã luôn động viên, khích lệ và tạo điều kiện tốt nhất cho em trong suốt quá trình học tập và trong quá trình thực tập. Hà nội, ngày 14 tháng 06 năm 2013 Sinh viên thực hiện Phương Văn Cảnh NHẬN XÉT (Của cán bộ hướng dẫn) Cán bộ hướng dẫn: TS. Nguyễn Hữu Quỳnh. Hiện công tác tại: Khoa Công Nghệ Thông Tin – Trường Đại Học Điện Lực. Nhận hướng dẫn sinh viên: Phương Văn Cảnh. Ngành: Công nghệ thông tin. Hệ: Đại học chính quy. Trong thời gian hướng dẫn sinh viên thực tập, tôi có một số ý kiến nhận xét như sau: ………………. Hà Nội, ngày 17 tháng 06 năm 2013. CÁN BỘ HƯỚNG DẪN TS. Nguyễn Hữu Quỳnh MỤC LỤC LỜI CẢM ƠN 2 NHẬN XÉT 3 DANH MỤC CÁC HÌNH 5 DANH MỤC CÁC BẢNG 6 LỜI NÓI ĐẦU 1 CHƯƠNG 1: TỔNG QUAN VỀ PHÂN ĐOẠN ẢNH MÀU 2 1.1 GIỚI THIỆU PHÂN ĐOẠN ẢNH 2 1.2 CÁC HƯỚNG TIẾP CẬN PHÂN ĐOẠN ẢNH 2 1.2.1 Các phương pháp dựa trên không gian đặc trưng 3 1.2.2 Các phương pháp dựa trên không gian ảnh 3 1.2.3 Các phương pháp dựa trên mô hình vật lý 4 1.3 KẾT LUẬN CHƯƠNG 1 5 CHƯƠNG 2: PHÂN ĐOẠN ẢNH MÀU SỬ DỤNG JSEG 8 2.1 GIỚI THIỆU VỀ JSEG 8 2.2 TIÊU CHÍ ĐỂ PHÂN ĐOẠN 9 2.3 J-IMAGES 13 2.4 THUẬT TOÁN PHÂN ĐOẠN KHÔNG GIAN 15 2.4.1 Xác định thung lũng 17 2.4.2 Phát triển thung lũng 17 2.4.3 Hợp nhất vùng 18 2.5 KẾT LUẬN CHƯƠNG 2 18 CHƯƠNG 3: CÀI ĐẶT VÀ ĐÁNH GIÁ HỆ THỐNG 19 3.1 CÀI ĐẶT HỆ THỐNG 19 3.1.1 Nền tảng công nghệ 19 3.1.2 Lượng hóa màu – Color Quantization 20 3.1.3 J-Image 22 3.2 ĐÁNH GIÁ HỆ THỐNG 24 3.3 KẾT LUẬN CHƯƠNG 3 25 KẾT LUẬN 26 TÀI LIỆU THAM KHẢO 27 DANH MỤC CÁC HÌNH DANH MỤC CÁC BẢNG Báo cáo thực tập LỜI NÓI ĐẦU Trong vài năm trở lại đây, chúng ta đã thấy cùng với sự bùng nổ của các ứng dụng Internet là sự tăng nhanh lượng dữ liệu ảnh. Khi số lượng ảnh còn ít, việc nhận diện một bức ảnh hay so sánh giữa các bức ảnh có thể thực hiện được bằng mắt thường, tuy nhiên khi có số lượng rất lớn dữ liệu ảnh thì việc nhận diện bằng mắt thường sẽ trở nên khó khăn, Vì vậy, vấn đề đặt ra là phải có những phương pháp tổ chức cơ sở dữ liệu ảnh tốt cùng với những kỹ thuật tìm kiếm, tra cứu ảnh hiệu quả, có độ chính xác cao và hiệu năng tốt. Lý do chọn đề tài: Vấn đề tra cứu ảnh và quản trị cơ sở dữ liệu ảnh được cộng đồng nghiên cứu quan tâm đến từ năm 1970 [9]. Với sự tăng nhanh về tốc độ máy tính và giảm chi phí bộ nhớ, các cơ sở dữ liệu ảnh chứa hàng nghìn thậm chí hàng triệu ảnh được sử dụng trong nhiều lĩnh vực ứng dụng khác nhau như y học, ảnh vệ tinh, các cơ sở dữ liệu ảnh sinh học Các ứng dụng này đòi hỏi độ chính xác tra cứu cao. Với sự tăng nhanh về số lượng ảnh, cách tiếp cận tra cứu ảnh dựa vào chú thích ảnh thủ công trở nên không khả thi về cả thời gian và chi phí. Tra cứu ảnh dựa vào nội dung (Content Base Image Retrieval - CBIR) là một công cụ mạnh do nó tìm kiếm cơ sở dữ liệu ảnh bằng việc sử dụng dấu hiệu trực quan. Các hệ thống tra cứu ảnh dựa vào nội dung trích rút các đặc trưng từ bản thân các ảnh thô và tính toán độ đo kết hợp giữa ảnh truy vấn và các ảnh cơ sở dữ liệu dựa trên các đặc trưng này. Phân đoạn ảnh là một thao tác ở mức thấp trong toàn bộ quá trình xử lý ảnh. Quá trình này thực hiện việc phân vùng ảnh thành các vùng rời rạc và đồng nhất với nhau hay nói cách khác là xác định các biên của các vùng ảnh đó. Các vùng ảnh đồng nhất này thông thường sẽ tương ứng với toàn bộ hay từng phần của các đối tượng thật sự bên trong ảnh. Chính vì vậy việc phân đoạn ảnh bước tiền xử lý đầu tiên trong toàn bộ quá trình trước khi thực hiện các thao tác khác ở mức cao hơn như nhận dạng đối tượng, biểu diễn đối tượng, nén ảnh dựa trên đối tượng, hay truy vấn ảnh dựa vào nội dung … Vì vậy, đề tài tra phân đoạn ảnh được đưa ra để tìm hiểu, nghiên cứu và ứng dụng. Tên đề tài : “Nghiên cứu và xây dựng hệ thống phân đoạn ảnh màu sử dụng thuật toán JSEG” Đối tượng nghiên cứu: ảnh màu. Phương Văn Cảnh – D4CNTT Page 1 Báo cáo thực tập CHƯƠNG 1: TỔNG QUAN VỀ PHÂN ĐOẠN ẢNH MÀU 1.1 GIỚI THIỆU PHÂN ĐOẠN ẢNH Phân đoạn ảnh là một thao tác ở mức thấp trong toàn bộ quá trình xử lý ảnh. Quá trình này thực hiện việc phân vùng ảnh thành các vùng rời rạc và đồng nhất với nhau hay nói cách khác là xác định các biên của các vùng ảnh đó. Các vùng ảnh đồng nhất này thông thường sẽ tương ứng với toàn bộ hay từng phần của các đối tượng thật sự bên trong ảnh. Vì thế, trong hầu hết các ứng dụng của lĩnh vực xử lý ảnh (image processing), thị giác máy tính, phân đoạn ảnh luôn đóng một vai trò cơ bản và thường là bước tiền xử lý đầu tiên trong toàn bộ quá trình trước khi thực hiện các thao tác khác ở mức cao hơn như nhận dạng đối tượng, biểu diễn đối tượng, nén ảnh dựa trên đối tượng, hay truy vấn ảnh dựa vào nội dung … Vào những thời gian đầu, các phương pháp phân vùng ảnh được đưa ra chủ yếu làm việc trên các ảnh mức xám do các hạn chế về phương tiện thu thập và lưu trữ. Ngày nay, cùng với sự phát triển về các phương tiện thu nhận và biểu diễn ảnh , các ảnh màu đã hầu như thay thế hoàn toàn các ảnh mức xám trong việc biểu diễn và lưu trữ thông tin do các ưu thế vượt trội hơn hẳn so với ảnh mức xám. Do đó, các kỹ thuật, thuật giải mới thực hiện việc phân vùng ảnh trên các loại ảnh màu liên tục được phát triển để đáp ứng các nhu cầu mới. Các thuật giải, kỹ thuật này thường được phát triển dựa trên nền tảng các thuật giải phân vùng ảnh mức xám đã có sẵn. 1.2 CÁC HƯỚNG TIẾP CẬN PHÂN ĐOẠN ẢNH Phân đoạn ảnh là chia ảnh thành các vùng không trùng lắp. Mỗi vùng gồm một nhóm pixel liên thông và đồng nhất theo một tiêu chí nào đó [1]. Tiêu chí này phụ thuộc vào mục tiêu của quá trình phân đoạn. Ví dụ như đồng nhất về màu sắc, mức xám, kết cấu, độ sâu của các layer… Sau khi phân đoạn mỗi pixel chỉ thuộc về một vùng duy nhất. Để đánh giá chất lượng của quá trình phân đoạn là rất khó. Vì vậy trước khi phân đoạn ảnh cần xác định rõ mục tiêu của quá trình phân đoạn là gì. Xét một cách tổng quát, ta có thể chia các hướng tiếp cận phân đoạn ảnh thành ba nhóm chính như sau: • Các kỹ thuật phân đoạn ảnh dựa trên không gian đặc trưng. • Các kỹ thuật dựa trên không gian ảnh. • Các kỹ thuật dựa trên các mô hình vật lý. Phương Văn Cảnh – D4CNTT Page 2 Báo cáo thực tập 1.2.1 Các phương pháp dựa trên không gian đặc trưng Nếu chúng ta giả định màu sắc bề mặt của các đối tượng trong ảnh là một thuộc tính bất biến và các màu sắc đó được ánh xạ vào một không gian màu nào đó, vậy thì chúng ta sẽ có một cái nhìn đối với mỗi đối tượng trong ảnh như là một cụm (cluster) các điểm trong không gian màu đó. Mức độ phân tán của các điểm trong trong một cụm được xác định chủ yếu bởi sự khác biệt về màu sắc. Một cách khác, thay vì ánh xạ các pixel trong ảnh vào một không gian màu cụ thể, ta xây dựng một histogram dựa trên các đặc trưng màu dạng ad-hoc cho ảnh đó (ví dụ như Hue), và thông thường, các đối tượng trong ảnh sẽ xuất hiện như các giá trị đỉnh trong histogram đó. Do đó, việc phân vùng các đối tượng trong ảnh tương ứng với việc xác định các cụm – đối với cách biểu diễn thứ nhất – hoặc xác định các vùng cực trị của histogram – đối với cách biểu diễn thứ hai. Các phương pháp tiếp cận này chỉ làm việc trên một không gian màu xác định chẳng hạn phương pháp của Park áp dụng trên không gian màu RGB, còn phương pháp của Weeks và Hague thì áp dụng trên không gian màu HIS. Dựa trên không gian đặc trưng, ta có các phương pháp phân đoạn: phương pháp phân nhóm đối tượng không giám sát, phương pháp phân lớp trung bình-k thích nghi, phương pháp lấy ngưỡng histogram. 1.2.2 Các phương pháp dựa trên không gian ảnh Hầu hết những phương pháp được đề cập trong phần trên đều hoạt động dựa trên các không gian đặc trưng của ảnh(thông thường là màu sắc). Do đó, các vùng ảnh kết quả là đồng nhất tương ứng với các đặc trưng đã chọn cho từng không gian. Tuy nhiên, không có gì đảm bảo rằng tất cả các vùng này thể hiển một sự cô đọng (compactness) về nội dung xét theo ý nghĩa không gian ảnh (ý nghĩa các vùng theo sự cảm nhận của hệ thần kinh con người). Mà đặc tính này là quan trọng thứ hai sau đặc tính về sự thuần nhất của các vùng ảnh. Do các phương pháp gom cụm cũng như xác định ngưỡng histogram đã nêu đều bỏ qua thông tin về vị trí của các pixel trong ảnh. Trong các báo cáo khoa học về phân vùng ảnh mức xám, có khá nhiều kỹ thuật cố thực hiện việc thoả mãn cùng lúc cả hai tiêu chí về tính đồng nhất trong không gian đặc trưng của ảnh và tính cô đọng về nội dung ảnh. Tuỳ theo các kỹ thuật mà các thuật giải này áp dụng, chúng được phân thành các nhóm sau: Các thuật giải áp dụng kỹ thuật chia và trộn vùng. Phương Văn Cảnh – D4CNTT Page 3 [...]... trình bày một số kỹ thuật nền tảng của các hệ thống phân đoạn ảnh màu bao gồm không gian đặc trưng, không gian ảnh, mô hình vật lý, trong đó nhấn mạnh vào các kỹ thuật phân đoạn ảnh sử dụng đặc trưng màu và khoảng cách Những vấn đề đã được giải quyết trong đồ án: o Giới thiệu tổng quan về phân đoạn ảnh màu o Nghiên cứu và tiến hành cài đặt phương pháp phân đoạn ảnh màu theo thuật toán JSeg Những vấn đề... toán khá cao Phương Văn Cảnh – D4CNTT Page 7 Báo cáo thực tập CHƯƠNG 2: PHÂN ĐOẠN ẢNH MÀU SỬ DỤNG JSEG 2.1 GIỚI THIỆU VỀ JSEG Phân đoạn ảnh màu rất hữu ích trong nhiều ứng dụng Từ các kết quả phân đoạn, nó có thể xác định các khu vực quan tâm và đối tượng trong cảnh, nó rất có lợi cho việc phân tích hình ảnh tiếp theo hoặc chú thích Công việc gần đây bao gồm một loạt các kỹ thuật: ví dụ, các cách tiếp... được các kết quả phân đoạn cuối cùng 2.5 KẾT LUẬN CHƯƠNG 2 Trong phần này, một cách tiếp cận mới cho phân vùng ảnh màu hoàn toàn tự động, được gọi là JSEG, được trình bày Các phân đoạn bao gồm các lượng tử màu và phân đoạn không gian Một tiêu chí cho phân đoạn "tốt" được đề xuất Áp dụng tiêu chuẩn cho các cửa sổ hình ảnh địa phương kết quả trong J-Images, có thể được phân đoạn sử dụng một phương pháp... hình ảnh xám có giá trị điểm ảnh là những giá trị J tính toán trên các cửa sổ địa phương tập trung vào các điểm ảnh Tính toán J tại từng pixel của ảnh màu thông qua một mặt phù hợp, ta được ảnh J-Image của ảnh màu Kết quả thu được như Hình 3.3 sau: Phương Văn Cảnh – D4CNTT Page 23 Báo cáo thực tập Hinh 3 3: Kết quả Lượng hóa màu và ảnh J-Image của ảnh màu 3.2 ĐÁNH GIÁ HỆ THỐNG Hinh 3 4: Kết quả tính toán. .. Phương Văn Cảnh – D4CNTT Page 14 Báo cáo thực tập 2.4 THUẬT TOÁN PHÂN ĐOẠN KHÔNG GIAN Các đặc tính của J-Images cho phép chúng ta sử dụng một phương pháp tăng trưởng vùng để phân đoạn hình ảnh Hình 2.5 cho thấy một biểu đồ luồng của các bước trong thuật toán phân đoạn không gian Xem xét các toàn hình ảnh như một khu vực ban đầu Các thuật toán bắt đầu phân đoạn tất cả các khu vực trong hình ảnh ở một... tiềm năng Một thuật toán phân chia không gian sau đó được mô tả trong phần 5, trong đó phát triển vùng từ thung lũng của J-hình ảnh để đạt được phân đoạn Hình 2.1 cho thấy một sơ đồ của thuật toán JSEG Hinh 2 1: Sơ đồ thuật toán JSeg 2.2 TIÊU CHÍ ĐỂ PHÂN ĐOẠN Đầu tiên, màu sắc trong bức ảnh được lượng tử thô mà không làm giảm đáng kể chất lượng màu sắc Mục đích là để trích xuất một vài màu sắc đại diện... được sử dụng để phân biệt các vùng lân cận trong hình ảnh Thông thường, 10-20 màu sắc là cần thiết trong những hình ảnh của cảnh quan thiên nhiên Một lượng tử màu sắc tốt quan trọng đối với quá trình phân đoạn sau này Phương Văn Cảnh – D4CNTT Page 9 Báo cáo thực tập Sau khi lượng tử hóa, màu sắc lượng tử được gán nhãn Một lớp màu là tập hợp các điểm ảnh của hình ảnh đã lượng tử có cùng màu Các pixel màu. .. liệu nghiên cứu đồ họa máy tính; còn trong các ứng dụng sử dụng các thuật ngữ như tối ưu dành cho thế hệ bảng màu, thế hệ bảng màu tối ưu, hoặc giảm độ sâu màu Một số trong số này là sai lầm, như các bảng màu được tạo ra bởi các thuật toán tiêu chuẩn không nhất thiết phải là tốt nhất có thể Trong xử lý ảnh, lượng hóa màu đóng một vai trò cực kỳ quan trọng, nó giúp co bớt độ lớn của không gian màu sắc,... tự như thể hình ảnh ban đầu Các thuật toán máy tính để thực hiện lượng tử hóa màu sắc trên ảnh bitmap đã được nghiên cứu từ những năm 1970 Màu lượng tử hóa là rất quan trọng để hiển thị hình ảnh với nhiều màu sắc trên các thiết bị mà chỉ có thể hiển thị một số hạn chế về màu sắc, thường là do giới hạn bộ nhớ, và cho phép nén hiệu quả của một số loại hình ảnh Tên "lượng hóa màu" được sử dụng chủ yếu trong... kéo theo việc sử dụng không gian dữ liệu lớn và tốc độ xử lý chậm hơn kể cả đã đưa vào sử dụng đa luồng đánh đổi không gian dữ liệu lấy thời gian xử lý 3.3 KẾT LUẬN CHƯƠNG 3 o Đánh giá kết quả tính toán chính xác theo yêu cầu, từng bước tiến tới phân đoạn hình ảnh, ứng dụng trong tra cứu ảnh o Cần phải tối ưu hóa thuật toán để cải thiện tốc độ cũng như không gian dữ liệu Phương Văn Cảnh – D4CNTT Page . đoạn ảnh màu sử dụng thuật toán JSEG Đối tượng nghiên cứu: ảnh màu. Phương Văn Cảnh – D4CNTT Page 1 Báo cáo thực tập CHƯƠNG 1: TỔNG QUAN VỀ PHÂN ĐOẠN ẢNH MÀU 1.1 GIỚI THIỆU PHÂN ĐOẠN ẢNH Phân. nén ảnh dựa trên đối tượng, hay truy vấn ảnh dựa vào nội dung … Vì vậy, đề tài tra phân đoạn ảnh được đưa ra để tìm hiểu, nghiên cứu và ứng dụng. Tên đề tài : Nghiên cứu và xây dựng hệ thống phân. ĐẠI HỌC ĐIỆN LỰC KHOA CÔNG NGHỆ THÔNG TIN BÁO CÁO THỰC TẬP HỆ THỐNG THÔNG TIN QUẢN LÝ ĐỀ TÀI: NGHIÊN CỨU XÂY DỰNG HỆ THỐNG PHÂN ĐOẠN ẢNH MÀU SỬ DỤNG THUẬT TOÁN JSEG Giảng viên hướng dẫn : TS.