Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 72 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
72
Dung lượng
1,4 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI - Kiều Huy Thắng ỨNG DỤNG THUẬT TOÁN PHÂN CỤM TRONG XÂY DỰNG ẢNH CHỈ SỐ LUẬN VĂN THẠC SỸ KHOA HỌC Ngành: Tốn Cơng nghệ NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS PHAN TRUNG HUY Hà Nội – 2010 MỤC LỤC LỜI MỞ ĐẦU LỜI CẢM ƠN CHƯƠNG I TỔNG QUAN VỀ ẢNH SỐ Lý thuyết ảnh màu, ảnh kỹ thuật số Các định dạng ảnh ảnh số 10 Đầu tệp Dữ liệu nén Bảng màu Qui trình đọc tệp ảnh Định dạng JPEG Định dạng RAW Định dạng PNG Định dạng TIFF Định dạng PSD CHƯƠNG II LÝ THUYẾT VỀ PHÂN CỤM ẢNH 22 Lý thuyết nén ảnh 22 Các thuật toán lập bảng số 23 Các thuật toán phân cụm màu cho toán rút gọn màu 27 * Thuật toán K-mean……………………………………………….34 * Thuật toán C-mean……………………………………………….39 Các ứng dụng phân cụm màu 49 CHƯƠNG III CHƯƠNG TRÌNH VÀ CÁC KẾT QUẢ ĐẠT ĐƯỢC………….51 Sơ đồ thuật toán 51 Giả mã 53 Giao diện chương trình 60 NHẬN XÉT, ĐÁNH GIÁ…………………………………………………… 62 KẾT LUẬN …………………………………………………………………68 TÀI LIỆU THAM KHẢO.………………………………………………………69 TÓM TẮT………………………………………………………………………70 LỜI MỞ ĐẦU Việc tạo hình ảnh lịch sử lồi người khởi đầu việc khắc hình đá, sau vẽ giấy, lụa, sơn mài, sử dụng máy chụp hình… Khi máy tính kỹ thuật số đời với thiết bị đồ họa chuyên dụng khác, người có thêm cơng cụ để tạo lập, lưu trữ xử lý liệu ảnh Với có mặt internet, với phát triển nhanh chóng máy ảnh số, ảnh ngày trở nên thơng dụng tồn giới Việc xử lý ảnh số cần thiết để đạt ảnh nhằm phục vụ mục đích người sử dụng Xử lý ảnh số lĩnh vực quan tâm trở thành môn học chuyên ngành sinh viên hệ kỹ sư, hệ cử nhân ngành Công Nghệ Thông Tin, số ngành kỹ thuật khác trường Đại học kỹ thuật Xử lý ảnh có liên quan đến nhiều ngành khác như: hệ thống tin học, lý thuyết thơng tin, thơng tin liên lạc, trí tuệ nhân tạo, nhận dạng, v.v Phân cụm ảnh trình xử lý ảnh Phân cụm ảnh ứng dụng nhiều thực tế: để xử lý ảnh, rút gọn màu, xác định đường viền ảnh…qua lại tiếp tục ứng dụng vào mục đích khác như: tạo màu suốt, giấu tin file ảnh, áp dụng chuẩn đốn hình ảnh y học, dự đoán thị trường, nén ảnh (đây ứng dụng quan trọng trình phân cụm), … Có nhiều thuật tốn cho q trình phân cụm thuật tốn đóng vai trị quan trọng việc phân cụm Với yêu cầu đó, luận văn đưa chương trình phân cụm ảnh sử dụng ngôn ngữ Java Chương trình nhằm đạt số yêu cầu: đọc ảnh đầu vào, đưa số cụm cho trước, tìm điểm màu có số đưa vào cụm… Các mục tiêu luận văn là: • Tìm hiểu lý thuyết ảnh kỹ thuật số, cách biểu diễn ảnh số máy tính • Tìm hiểu lý thuyết phân cụm, tìm hiểu thuật toán phân cụm ứng dụng rút gọn ảnh màu • Viết chương trình dựa thuật tốn cụ thể Kết cấu luận văn gồm ba phần chính: - Chương I: Tổng quan ảnh số Trong phần này, luận văn nêu khái niệm ảnh màu, ảnh kỹ thuật số, pixel, dải màu… - Chương II: Lý thuyết phân cụm ảnh ứng dụng Trong chương này, khái niệm phân cụm, thuật toán phân cụm, dạng phân cụm…sẽ nêu - Chương III: Xây dựng chương trình phân cụm Chương trình bày sơ qua chương trình phân cụm viết ngơn ngữ Java dựa hai thuật tốn cụ thể Đã có nhiều chương trình, viết phân cụm ảnh với nhiều thuật toán khác Tuy nhiên, việc tiếp tục thực chương trình phân cụm màu mang lại nhiều ưu điểm khác biệt với chương trình có như: + Vấn đề quyền: việc chủ động trình phân cụm ảnh giúp người sử dụng chủ động việc áp dụng vào ứng dụng khác + Vấn đề công nghệ: chương trình viết có ưu điểm riêng biệt thích hợp với người sử dụng, theo ngơn ngữ lập trình cụ thể + Khả đánh giá: chương trình viết tăng thêm khả đánh giá thuật toán phân cụm Đánh giá tốc độ chất lượng Mỗi thuật tốn có ưu điểm riêng Có thuật toán chạy với tốc độ nhanh chất lượng lại khơng tốt Có thuật tốn chạy với tốc độ chậm cho kết cao LỜI CẢM ƠN Tôi muốn gửi lời cảm ơn sâu sắc đền thầy tôi: PGS.TS Phan Trung Huy, người tận tình hướng dẫn tơi suốt q trình làm luận văn Tôi xin chân thành cảm ơn thầy, khoa Tốn Tin Ứng Dụng Trường Đại học Bách Khoa Hà Nội tận tình dạy dỗ, truyền đạt kiến thức để tơi hiểu kiến thức khoa học Xin cảm ơn tất bạn bè, đồng nghiệp giúp đỡ tơi suốt q trình làm luận văn CHƯƠNG I TỔNG QUAN VỀ ẢNH SỐ Lý thuyết ảnh màu, ảnh kỹ thuật số Tổ chức quốc tế chuẩn hoá màu CIE (Commision Internationale d’Eclairage) đưa số chuẩn để biểu diễn màu Các hệ có chuẩn riêng Hệ chuẩn màu CIE- RGB dùng màu bản: đỏ (Red), xanh lục (Green), xanh lơ (Blue) ký hiệu RGBCIE để phân biệt với chuẩn khác Mỗi màu tổ hợp màu theo tỷ lệ định Ảnh thực chất tập hợp điểm màu liên tiếp xếp liền nhau, tập hợp đường hình học nhằm miêu tả phong cảnh, vật hay chủ đề Trên máy tính, ảnh lưu file nhị phân, theo định dạng nhà sản xuất quy định Ảnh màu ảnh tổ hợp từ màu bản: đỏ, xanh lục, xanh lơ thường thu nhận giải băng tần khác Một pixel ảnh màu gồm thành phần màu Mỗi màu phân thành K cấp khác (K thường 256) Do vậy, để lưu trữ ảnh màu, người ta lưu trữ mặt màu riêng biệt, màu lưu trữ ảnh đa cấp xám Do đó, khơng gian nhớ dành cho ảnh màu lớn gấp lần ảnh đa cấp xám kích thước Tín hiệu số biểu diễn ảnh số * Pixel Ảnh thực tế ảnh liên tục không gian giá trị độ sáng Để xử lý ảnh máy tính cần thiết phải tiến hành số hố ảnh Trong q trình số hố, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thơng qua q trình lấy mẫu (rời rạc hố khơng gian) lượng hố thành phần giá trị (rời rác hoá biên độ giá trị) mà mắt thường không phân biệt hai mức kề Trong trình này, người ta sử dụng khái niệm Picture Element mà quen gọi Pixel- phần tử ảnh Mỗi pixel gồm cặp toạ độ x, y giá trị màu Như vậy, ảnh tập hợp điểm ảnh Khi số hố, thường biểu diễn bảng hai chiều I(n,p): n dòng p cột Ta nói ảnh gồm n x p pixels Ta ký hiệu I(x,y) để pixel Nhìn chung xem hàm hai biến chứa thơng tin biểu diễn ảnh Các tín hiệu liên tục theo thời gian qua trình số hóa ta thu tín hiệu rời rạc (tín hiệu số) Ảnh số ảnh xử lý máy tính thu từ ảnh liên tục q trình số hoá (lấy mẫu lượng hoá), giá trị I(x,y) biểu diễn cường độ sang mã hoá điểm ảnh (x,y) Giá trị cịn gọi mức xám, ta coi giá trị I(x,y) nguyên: I(x,y) ∈ {0,1, , L − 1} Trong đó: L mức xám tối đa dùng để biểu diễn Để giảm độ phức tạp tính tốn, giá trị (x,y) thường chọn hữu hạn, thường 512, cịn L thường chọn 256 Ảnh có nhiều mức xám gọi ảnh đa cấp xám Ảnh có mức xám gọi ảnh nhị phân Với cách biểu diễn trên, ảnh số phần tín hiệu số khơng gian hai chiều Và cách biểu diễn ảnh số thông dụng dùng bảng hai chiều thường gọi ma trận ảnh hay đồ ảnh Hệ thống số hệ thống tiếp nhận tín hiệu số đầu vào, xử lý tín hiệu theo quy trình liệu đầu tín hiệu số Vì ảnh số phần tín hiệu số nên hệ thống xử lý ảnh số có đặc thù hệ thống số cộng thêm số tính chất riêng Nếu gọi tín hiệu đầu vào X(m,n), tín hiệu đầu Y(m,n), đặc trưng hệ thống H, ta có biểu diễn sau: Y(m,n)= H [X(m,n)] Phần lớn hệ thống số tuyến tính bất biến Các kênh (chanels) Kết trình xử lý liệu tệp RAW để nội suy giá trị thiếu(hoặc máy ảnh, máy tính) mảng chữ nhật điểm ảnh, điểm ảnh có ba giá trị Nhìn trực diện hình ảnh thu bao gồm ba lớp, lớp tương ứng với màu đỏ, xanh lục, xanh lơ Các lớp thường gọi kênh, hay đơi cịn gọi dải Do hình ảnh ta tạo ba kênh Các kênh tách rời xem hình ảnh độc lập Ảnh đơn sắc hay ảnh đa mức xám trường hợp đặc biệt ba kênh đồng với Mỗi điểm ảnh có mức sáng mức xám cố định Các bit kênh Màu sử dụng thang chia từ 0-255 cho kênh Là trường hợp cho ảnh 8-bit màu, chẳng hạn lưu ảnh JPEG Đó 28 = 256 (=1 byte), 8-bit đủ để lưu 256 giá trị riêng lẻ Số lượng màu lớn ảnh 16 triệu màu (tương đương với 2563 ) Người ta rằng, ta làm với ảnh RAW mà chứa tới 4096 giá trị cho kênh 4096 = 212 , ta có 12-bit kênh Các máy ảnh dân dụng thường phát số lượng bit kênh ảnh chụp 12-bit byte rưỡi, tệp lưu với giá trị liệu toàn byte Bởi để chứa hình ảnh này, phần lưu trữ định byte hay 16bit cho kênh với điểm ảnh Điều có nghĩa số phần lưu trữ bị lãng phí, lại khơng gian nhớ cho ta thao tác với ảnh Hàm tính tốn lại tâm thành viên viết sau: Procedure calculateClusterCentersFromMFs() { For(int b = 0; b