Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 72 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
72
Dung lượng
1,28 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI - Kiều Huy Thắng ỨNGDỤNGTHUẬTTOÁNPHÂNCỤMTRONGXÂYDỰNGẢNHCHỈSỐ LUẬN VĂN THẠC SỸ KHOA HỌC Ngành: Toán Công nghệ NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS PHAN TRUNG HUY Hà Nội – 2010 MỤC LỤC LỜI MỞ ĐẦU LỜI CẢM ƠN CHƯƠNG I TỔNG QUAN VỀ ẢNHSỐ Lý thuyết ảnh màu, ảnh kỹ thuậtsố Các định dạng ảnhảnhsố 10 Đầu tệp Dữ liệu nén Bảng màu Qui trình đọc tệp ảnh Định dạng JPEG Định dạng RAW Định dạng PNG Định dạng TIFF Định dạng PSD CHƯƠNG II LÝ THUYẾT VỀ PHÂNCỤMẢNH 22 Lý thuyết nén ảnh 22 Các thuậttoán lập bảng số 23 Các thuậttoánphâncụm màu cho toán rút gọn màu 27 * Thuậttoán K-mean……………………………………………….34 * Thuậttoán C-mean……………………………………………….39 Các ứngdụngphâncụm màu 49 CHƯƠNG III CHƯƠNG TRÌNH VÀ CÁC KẾT QUẢ ĐẠT ĐƯỢC………….51 Sơ đồ thuậttoán 51 Giả mã 53 Giao diện chương trình 60 NHẬN XÉT, ĐÁNH GIÁ…………………………………………………… 62 KẾT LUẬN …………………………………………………………………68 TÀI LIỆU THAM KHẢO.………………………………………………………69 TÓM TẮT………………………………………………………………………70 LỜI MỞ ĐẦU Việc tạo hình ảnh lịch sử loài người khởi đầu việc khắc hình đá, sau vẽ giấy, lụa, sơn mài, sử dụng máy chụp hình… Khi máy tính kỹ thuậtsố đời với thiết bị đồ họa chuyên dụng khác, người có thêm công cụ để tạo lập, lưu trữ xử lý liệu ảnh Với có mặt internet, với phát triển nhanh chóng máy ảnh số, ảnh ngày trở nên thông dụngtoàn giới Việc xử lý ảnhsố cần thiết để đạt ảnh nhằm phục vụ mục đích người sử dụng Xử lý ảnhsố lĩnh vực quan tâm trở thành môn học chuyên ngành sinh viên hệ kỹ sư, hệ cử nhân ngành Công Nghệ Thông Tin, số ngành kỹ thuật khác trường Đại học kỹ thuật Xử lý ảnh có liên quan đến nhiều ngành khác như: hệ thống tin học, lý thuyết thông tin, thông tin liên lạc, trí tuệ nhân tạo, nhận dạng, v.v Phâncụmảnh trình xử lý ảnhPhâncụmảnhứngdụng nhiều thực tế: để xử lý ảnh, rút gọn màu, xác định đường viền ảnh…qua lại tiếp tục ứngdụng vào mục đích khác như: tạo màu suốt, giấu tin file ảnh, áp dụng chuẩn đoán hình ảnh y học, dự đoán thị trường, nén ảnh (đây ứngdụng quan trọng trình phân cụm), … Có nhiều thuậttoán cho trình phâncụmthuậttoán đóng vai trò quan trọng việc phâncụm Với yêu cầu đó, luận văn đưa chương trình phâncụmảnh sử dụng ngôn ngữ Java Chương trình nhằm đạt số yêu cầu: đọc ảnh đầu vào, đưa sốcụm cho trước, tìm điểm màu có số đưa vào cụm… Các mục tiêu luận văn là: • Tìm hiểu lý thuyết ảnh kỹ thuật số, cách biểu diễn ảnhsố máy tính • Tìm hiểu lý thuyết phân cụm, tìm hiểu thuậttoánphâncụmứngdụng rút gọn ảnh màu • Viết chương trình dựa thuậttoán cụ thể Kết cấu luận văn gồm ba phần chính: - Chương I: Tổng quan ảnhsốTrongphần này, luận văn nêu khái niệm ảnh màu, ảnh kỹ thuật số, pixel, dải màu… - Chương II: Lý thuyết phâncụmảnhứngdụngTrong chương này, khái niệm phân cụm, thuậttoánphân cụm, dạng phân cụm…sẽ nêu - Chương III: Xâydựng chương trình phâncụm Chương trình bày sơ qua chương trình phâncụm viết ngôn ngữ Java dựa hai thuậttoán cụ thể Đã có nhiều chương trình, viết phâncụmảnh với nhiều thuậttoán khác Tuy nhiên, việc tiếp tục thực chương trình phâncụm màu mang lại nhiều ưu điểm khác biệt với chương trình có như: + Vấn đề quyền: việc chủ động trình phâncụmảnh giúp người sử dụng chủ động việc áp dụng vào ứngdụng khác + Vấn đề công nghệ: chương trình viết có ưu điểm riêng biệt thích hợp với người sử dụng, theo ngôn ngữ lập trình cụ thể + Khả đánh giá: chương trình viết tăng thêm khả đánh giá thuậttoánphâncụm Đánh giá tốc độ chất lượng Mỗi thuậttoán có ưu điểm riêng Có thuậttoán chạy với tốc độ nhanh chất lượng lại không tốt Có thuậttoán chạy với tốc độ chậm cho kết cao LỜI CẢM ƠN Tôi muốn gửi lời cảm ơn sâu sắc đền thầy tôi: PGS.TS Phan Trung Huy, người tận tình hướng dẫn suốt trình làm luận văn Tôi xin chân thành cảm ơn thầy, cô khoa Toán Tin ỨngDụng Trường Đại học Bách Khoa Hà Nội tận tình dạy dỗ, truyền đạt kiến thức để hiểu kiến thức khoa học Xin cảm ơn tất bạn bè, đồng nghiệp giúp đỡ suốt trình làm luận văn CHƯƠNG I TỔNG QUAN VỀ ẢNHSỐ Lý thuyết ảnh màu, ảnh kỹ thuậtsố Tổ chức quốc tế chuẩn hoá màu CIE (Commision Internationale d’Eclairage) đưa số chuẩn để biểu diễn màu Các hệ có chuẩn riêng Hệ chuẩn màu CIE- RGB dùng màu bản: đỏ (Red), xanh lục (Green), xanh lơ (Blue) ký hiệu RGBCIE để phân biệt với chuẩn khác Mỗi màu tổ hợp màu theo tỷ lệ định Ảnh thực chất tập hợp điểm màu liên tiếp xếp liền nhau, tập hợp đường hình học nhằm miêu tả phong cảnh, vật hay chủ đề Trên máy tính, ảnh lưu file nhị phân, theo định dạng nhà sản xuất quy định Ảnh màu ảnh tổ hợp từ màu bản: đỏ, xanh lục, xanh lơ thường thu nhận giải băng tần khác Một pixel ảnh màu gồm thành phần màu Mỗi màu phân thành K cấp khác (K thường 256) Do vậy, để lưu trữ ảnh màu, người ta lưu trữ mặt màu riêng biệt, màu lưu trữ ảnh đa cấp xám Do đó, không gian nhớ dành cho ảnh màu lớn gấp lần ảnh đa cấp xám kích thước Tín hiệu số biểu diễn ảnhsố * Pixel Ảnh thực tế ảnh liên tục không gian giá trị độ sáng Để xử lý ảnh máy tính cần thiết phải tiến hành số hoá ảnhTrong trình số hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua trình lấy mẫu (rời rạc hoá không gian) lượng hoá thành phần giá trị (rời rác hoá biên độ giá trị) mà mắt thường không phân biệt hai mức kề Trong trình này, người ta sử dụng khái niệm Picture Element mà quen gọi Pixel- phần tử ảnh Mỗi pixel gồm cặp toạ độ x, y giá trị màu Như vậy, ảnh tập hợp điểm ảnh Khi số hoá, thường biểu diễn bảng hai chiều I(n,p): n dòng p cột Ta nói ảnh gồm n x p pixels Ta ký hiệu I(x,y) để pixel Nhìn chung xem hàm hai biến chứa thông tin biểu diễn ảnh Các tín hiệu liên tục theo thời gian qua trình số hóa ta thu tín hiệu rời rạc (tín hiệu số) Ảnhsốảnh xử lý máy tính thu từ ảnh liên tục trình số hoá (lấy mẫu lượng hoá), giá trị I(x,y) biểu diễn cường độ sang mã hoá điểm ảnh (x,y) Giá trị gọi mức xám, ta coi giá trị I(x,y) nguyên: I(x,y) ∈ {0,1, , L − 1} Trong đó: L mức xám tối đa dùng để biểu diễn Để giảm độ phức tạp tính toán, giá trị (x,y) thường chọn hữu hạn, thường 512, L thường chọn 256 Ảnh có nhiều mức xám gọi ảnh đa cấp xám Ảnh có mức xám gọi ảnh nhị phân Với cách biểu diễn trên, ảnhsốphần tín hiệu số không gian hai chiều Và cách biểu diễn ảnhsố thông dụngdùng bảng hai chiều thường gọi ma trận ảnh hay đồ ảnh Hệ thống số hệ thống tiếp nhận tín hiệu số đầu vào, xử lý tín hiệu theo quy trình liệu đầu tín hiệu số Vì ảnhsốphần tín hiệu số nên hệ thống xử lý ảnhsố có đặc thù hệ thống số cộng thêm số tính chất riêng Nếu gọi tín hiệu đầu vào X(m,n), tín hiệu đầu Y(m,n), đặc trưng hệ thống H, ta có biểu diễn sau: Y(m,n)= H [X(m,n)] Phần lớn hệ thống số tuyến tính bất biến Các kênh (chanels) Kết trình xử lý liệu tệp RAW để nội suy giá trị thiếu(hoặc máy ảnh, máy tính) mảng chữ nhật điểm ảnh, điểm ảnh có ba giá trị Nhìn trực diện hình ảnh thu bao gồm ba lớp, lớp tương ứng với màu đỏ, xanh lục, xanh lơ Các lớp thường gọi kênh, hay gọi dải Do hình ảnh ta tạo ba kênh Các kênh tách rời xem hình ảnh độc lập Ảnh đơn sắc hay ảnh đa mức xám trường hợp đặc biệt ba kênh đồng với Mỗi điểm ảnh có mức sáng mức xám cố định Các bit kênh Màu sử dụng thang chia từ 0-255 cho kênh Là trường hợp cho ảnh 8-bit màu, chẳng hạn lưu ảnh JPEG Đó 28 = 256 (=1 byte), 8-bit đủ để lưu 256 giá trị riêng lẻ Số lượng màu lớn ảnh 16 triệu màu (tương đương với 2563 ) Người ta rằng, ta làm với ảnh RAW mà chứa tới 4096 giá trị cho kênh 4096 = 212 , ta có 12-bit kênh Các máy ảnh dân dụng thường phát số lượng bit kênh ảnh chụp 12-bit byte rưỡi, tệp lưu với giá trị liệu toàn byte Bởi để chứa hình ảnh này, phần lưu trữ định byte hay 16bit cho kênh với điểm ảnh Điều có nghĩa sốphần lưu trữ bị lãng phí, lại không gian nhớ cho ta thao tác với ảnh Hàm tính toán lại tâm thành viên viết sau: Procedure calculateClusterCentersFromMFs() { For(int b = 0; b