Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 119 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
119
Dung lượng
1,31 MB
Nội dung
HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG XỬ LÝ ẢNH (Dùng cho sinh viên hệ đào tạo đại học từ xa) Lưu hành nội HÀ NỘI - 2006 HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG XỬ LÝ ẢNH Biên soạn : PGS.TS NGUYỄN QUANG HOAN LỜI NÓI ĐẦU Trong trường đại học, cao đẳng, xử lý ảnh trở thành môn học chuyên ngành sinh viên ngành Công nghệ Thông tin, Viễn thông Giáo trình tài liệu lĩnh vực nước ta hạn chế Để đáp ứng kịp thời cho đào tạo từ xa, Học viện Công nghệ Bưu Viễn thơng cố gắng kịp thời biên soạn tài liệu cho sinh viên, đặc biệt hệ Đào tạo từ xa học tập Trong trình biên soạn, chúng tơi có tham khảo tài liệu Đại học Bách khoa Hà nội [1] giáo trình gần gũi tính cơng nghệ với Học viện Một số giáo trình khác Đại học Quốc gia thành phố Hồ Chí Minh [2], tài liệu mạng tài liệu nước tiếng Anh [5, 6, 7] tham khảo giới thiệu để sinh viên đào tạo từ xa đọc thêm Tài liệu nhằm hướng dẫn giới thiệu kiến thức bản, khái niệm, định nghĩa tóm tắt Một số thuật ngữ giải tiếng Anh để học viên đọc tiếng Anh dễ dàng, tránh hiểu nhầm chuyển sang tiếng Việt Tài liệu gồm chương sau: - Chương Nhập môn xử lý ảnh - Chương Thu nhận ảnh - Chương Xử lý nâng cao chất lượng ảnh - Chương Các phương pháp phát biên ảnh - Chương Phân vùng ảnh - Chương Nhận dạng ảnh - Chương Nén liệu ảnh Còn nhiều vấn đề khác cơng cụ toán học, kỹ thuật biến đổi ảnh, truyền ảnh, phần mềm xử lý v.v… chưa đề cập phạm vi tài liệu Đề nghị bạn đọc tìm hiểu thêm sau có kiến thức Tuy có tham gia giảng dạy môn xử lý ảnh cấp Đại học số năm, nhiều lớp có trình độ khác nhau; chủ nhiệm số đề tài nghiên cứu Cơ Nhà nước, đề tài cấp Bộ liên quan “Xử lý ảnh” mơn học có kết hợp nhiều nhiều lĩnh vực khoa học cơng nghệ nên coi mơn học khó Nhiều cố gắng để cập nhật kiến thức thời gian, điều kiện, khả có hạn nên tài liệu chắn nhiều thiếu sót Chúng tơi mong nhận nhiều ý kiến đóng góp để tài liệu hồn thiện cho lần tái sau Hà Nội, tháng 12 năm 2006 Tác giả Chương 1: Nhập môn xử lý ảnh CHƯƠNG 1: NHẬP MÔN XỬ LÝ ẢNH Học xong phần sinh viên nắm được: Ý nghĩa, mục đích mơn học; ứng dụng xử lý ảnh công nghiệp, đời sống Các thành phần: xử lý phân tích ảnh Các khối chức năng, ý nghĩa quy trình xử lý phân tích ảnh Các khái niệm, định nghĩa ảnh số hóa Tổng quan biểu diễn ảnh Một số công cụ xử lý ảnh Các vấn đề đặt với xử lý ảnh 1.1 GIỚI THIỆU VỀ HỆ THỐNG XỬ LÝ ẢNH Xử lý ảnh lĩnh vực mang tính khoa học cơng nghệ Nó ngành khoa học mẻ so với nhiều ngành khoa học khác tốc độ phát triển nhanh, kích thích trung tâm nghiên cứu, ứng dụng, đặc biệt máy tính chun dụng riêng cho Xử lý ảnh đưa vào giảng dạy bậc đại học nước ta khoảng chục năm Nó môn học liên quan đến nhiều lĩnh vực cần nhiều kiến thức sở khác Đầu tiên phải kể đến Xử lý tín hiệu số mơn học cho xử lý tín hiệu chung, khái niệm tích chập, biến đổi Fourier, biến đổi Laplace, lọc hữu hạn… Thứ hai, cơng cụ tốn Đại số tuyến tính, Sác xuất, thống kê Một số kiến thứ cần thiết Trí tuệ nhân tao, Mạng nơ ron nhân tạo đề cập q trình phân tích nhận dạng ảnh Các phương pháp xử lý ảnh ứng dụng chính: nâng cao chất lượng ảnh phân tích ảnh Ứng dụng biết đến nâng cao chất lượng ảnh báo truyền qua cáp từ Luân đôn đến New York từ năm 1920 Vấn đề nâng cao chất lượng ảnh có liên quan tới phân bố mức sáng độ phân giải ảnh Việc nâng cao chất lượng ảnh phát triển vào khoảng năm 1955 Điều giải thích sau chiến thứ hai, máy tính phát triển nhanh tạo điều kiện cho q trình xử lý ảnh sơ thuận lợi Năm 1964, máy tính có khả xử lý nâng cao chất lượng ảnh từ mặt trăng vệ tinh Ranger Mỹ bao gồm: làm đường biên, lưu ảnh Từ năm 1964 đến nay, phương tiện xử lý, nâng cao chất lượng, nhận dạng ảnh phát triển không ngừng Các phương pháp tri thức nhân tạo mạng nơ ron nhân tạo, thuật toán xử lý đại cải tiến, công cụ nén ảnh ngày áp dụng rộng rãi thu nhiều kết khả quan Để dễ tưởng tượng, xét bước cần thiết xử lý ảnh Đầu tiên, ảnh tự nhiên từ giới thu nhận qua thiết bị thu (như Camera, máy chụp ảnh) Trước đây, ảnh thu qua Camera ảnh tương tự (loại Camera ống kiểu CCIR) Gần đây, với phát triển công nghệ, ảnh màu đen trắng lấy từ Camera, sau chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý (Máy ảnh số thí dụ gần gũi) Mặt khác, ảnh tiếp nhận từ vệ tinh; quét từ ảnh chụp máy qt ảnh Hình 1.1 mơ tả bước xử lý ảnh Chương 1: Nhập môn xử lý ảnh Thu nhận ảnh Tiền xử lý ảnh Phân đoạn ảnh Biểu diễn mô tả Nhận dạng nội suy Cơ sở tri thức Hình 1.1 Các bước xử lý ảnh Sơ đồ bao gồm thành phần sau: a) Phần thu nhận ảnh (Image Acquisition) Ảnh nhận qua camera màu đen trắng Thường ảnh nhận qua camera ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, ảnh 25 dòng), có loại camera số hố (như loại CCD – Change Coupled Device) loại photodiot tạo cường độ sáng điểm ảnh Camera thường dùng loại quét dòng ; ảnh tạo có dạng hai chiều Chất lượng ảnh thu nhận phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh) b) Tiền xử lý (Image Processing) Sau thu nhận, ảnh nhiễu độ tương phản thấp nên cần đưa vào tiền xử lý để nâng cao chất lượng Chức tiền xử lý lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét c) Phân đoạn (Segmentation) hay phân vùng ảnh Phân vùng ảnh tách ảnh đầu vào thành vùng thành phần để biểu diễn phân tích, nhận dạng ảnh Ví dụ: để nhận dạng chữ (hoặc mã vạch) phong bì thư cho mục đích phân loại bưu phẩm, cần chia câu, chữ địa tên người thành từ, chữ, số (hoặc vạch) riêng biệt để nhận dạng Đây phần phức tạp khó khăn xử lý ảnh dễ gây lỗi, làm độ xác ảnh Kết nhận dạng ảnh phụ thuộc nhiều vào công đoạn d) Biểu diễn ảnh (Image Representation) Đầu ảnh sau phân đoạn chứa điểm ảnh vùng ảnh (ảnh phân đoạn) cộng với mã liên kết với vùng lận cận Việc biến đổi số liệu thành dạng thích hợp cần thiết cho xử lý máy tính Việc chọn tính chất để thể ảnh gọi trích chọn đặc trưng (Feature Selection) gắn với việc tách đặc tính ảnh dạng thơng tin định lượng làm sở để phân biệt lớp đối tượng với đối tượng khác phạm vi ảnh nhận Ví dụ: nhận dạng ký tự phong bì thư, miêu tả đặc trưng ký tự giúp phân biệt ký tự với ký tự khác e) Nhận dạng nội suy ảnh (Image Recognition and Interpretation) Chương 1: Nhập môn xử lý ảnh Nhận dạng ảnh trình xác định ảnh Quá trình thường thu cách so sánh với mẫu chuẩn học (hoặc lưu) từ trước Nội suy phán đoán theo ý nghĩa sở nhận dạng Ví dụ: loạt chữ số nét gạch ngang phong bì thư nội suy thành mã điện thoại Có nhiều cách phân loai ảnh khác ảnh Theo lý thuyết nhận dạng, mơ hình tốn học ảnh phân theo hai loại nhận dạng ảnh bản: - Nhận dạng theo tham số - Nhận dạng theo cấu trúc Một số đối tượng nhận dạng phổ biến áp dụng khoa học công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử), nhận dạng văn (Text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt người… f) Cơ sở tri thức (Knowledge Base) Như nói trên, ảnh đối tượng phức tạp đường nét, độ sáng tối, dung lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu Trong nhiều khâu xử lý phân tích ảnh ngồi việc đơn giản hóa phương pháp tốn học đảm bảo tiện lợi cho xử lý, người ta mong muốn bắt chước quy trình tiếp nhận xử lý ảnh theo cách người Trong bước xử lý đó, nhiều khâu xử lý theo phương pháp trí tuệ người Vì vậy, sở tri thức phát huy Trong tài liệu, chương nhận dạng ảnh có nêu vài ví dụ cách sử dụng sở tri thức g) Mơ tả (biểu diễn ảnh) Từ Hình 1.1, ảnh sau số hoá lưu vào nhớ, chuyển sang khâu để phân tích Nếu lưu trữ ảnh trực tiếp từ ảnh thô, đòi hỏi dung lượng nhớ cực lớn khơng hiệu theo quan điểm ứng dụng công nghệ Thơng thường, ảnh thơ đặc tả (biểu diễn) lại (hay đơn giản mã hoá) theo đặc điểm ảnh gọi đặc trưng ảnh (Image Features) như: biên ảnh (Boundary), vùng ảnh (Region) Một số phương pháp biểu diễn thường dùng: • Biểu diễn mã chạy (Run-Length Code) • Biểu diễn mã xích (Chaine -Code) • Biểu diễn mã tứ phân (Quad-Tree Code) Biểu diễn mã chạy Phương pháp thường biểu diễn cho vùng ảnh áp dụng cho ảnh nhị phân Một vùng ảnh R mã hoá đơn giản nhờ ma trận nhị phân: U(m, n) = (m, n) thuộc R U( m, n) = (m, n) không thuộc R Trong đó: U(m, n) hàm mơ tả mức xám ảnh tọa độ (m, n) Với cách biểu diễn trên, vùng ảnh mô tả tập chuỗi số Giả sử mô tả ảnh nhị phân vùng ảnh thể theo toạ độ (x, y) theo chiều đặc tả giá trị “1” dạng mơ tả là: (x, y)r; (x, y) toạ độ, r số lượng bit có giá trị “1” liên tục theo chiều ngang dọc Biểu diễn mã xích Chương 1: Nhập môn xử lý ảnh Phương pháp thường dùng để biểu diễn đường biên ảnh Một đường chia thành đoạn nhỏ Nối điểm chia, ta có đoạn thẳng gán hướng cho đoạn thẳng tạo thành dây xích gồm đoạn Các hướng chọn 4, 8, 12, 24,… hướng mã hoá theo số thập phân số nhị phân thành mã hướng Biểu diễn mã tứ phân Phương pháp mã tứ phân dùng để mã hoá cho vùng ảnh Vùng ảnh chia làm bốn phần thường Nếu vùng đồng (chứa toàn điểm đen (1) hay trắng (0)), gán cho vùng mã không chia tiếp Các vùng không đồng chia tiếp làm bốn phần theo thủ tục tất vùng đồng Các mã phân chia thành vùng tạo thành phân chia vùng đồng Trên thành phần khâu xử lý ảnh Trong thực tế, trình sử dụng ảnh số không thiết phải qua hết khâu tùy theo đặc điểm ứng dụng Hình 1.2 cho sơ đồ phân tích xử lý ảnh lưu đồ thông tin khối cách đầy đủ Anh sau số hóa nén, luuw lai để truyền cho hệ thống khác sử dụng để xử lý Mặt khác, ảnh sau số hóa bỏ qua cơng đoạn nâng cao chất lượng (khi ảnh đủ chất lượng theo yêu cầu đó) để chuyển tới khâu phân đoạn bỏ tiếp khâu phân đoạn chuyển trực tiếp tới khâu trích chọn đặc trưng Hình 1.2 chia nhánh song song như: nâng cao chất lượng ảnh có hai nhánh phân biệt: nâng cao chất lượng ảnh (tăng độ sáng, độ tương phản, lọc nhiễu) khôi phục ảnh (hồi phục lại ảnh thật ảnh nhận bị méo) v.v… Cảnh quan (Scene) Nén ảnh Lưu ảnh Truyền ảnh Nâng chất lượng ảnh Thu ảnh Phân đoạn Số hóa Ảnh tương tự Ảnh cải tiến Trích chọn đặc trưng Ảnh số Thu nhận ảnh Khơi phục ảnh Phân tích thống kê / cấu trúc Mơ tả nội suy Trích chọn quan hệ Hình 1.2 Sơ đồ phân tích xử lý ảnh lưu đồ thông tin khối 1.2 NHỮNG VẤN ĐỀ CƠ BẢN TRONG HỆ THỐNG XỬ LÝ ẢNH 1.2.1 Điểm ảnh (Picture Element) Gốc ảnh (ảnh tự nhiên) ảnh liên tục không gian độ sáng Để xử lý máy tính (số), ảnh cần phải số hoá Số hoá ảnh biến đổi gần ảnh liên tục thành tập điểm phù hợp với ảnh thật vị trí (khơng gian) độ sáng (mức xám) Khoảng cách điểm ảnh thiết lập cho mắt người khơng phân biệt ranh giới Chương 1: Nhập môn xử lý ảnh chúng Mỗi điểm gọi điểm ảnh (PEL: Picture Element) hay gọi tắt Pixel Trong khuôn khổ ảnh hai chiều, pixel ứng với cặp tọa độ (x, y) Định nghĩa: Điểm ảnh (Pixel) phần tử ảnh số toạ độ (x, y) với độ xám màu định Kích thước khoảng cách điểm ảnh chọn thích hợp cho mắt người cảm nhận liên tục không gian mức xám (hoặc màu) ảnh số gần ảnh thật Mỗi phần tử ma trận gọi phần tử ảnh 1.2.2 Độ phân giải ảnh Định nghĩa: Độ phân giải (Resolution) ảnh mật độ điểm ảnh ấn định ảnh số hiển thị Theo định nghĩa, khoảng cách điểm ảnh phải chọn cho mắt người thấy liên tục ảnh Việc lựa chọn khoảng cách thích hợp tạo nên mật độ phân bổ, độ phân giải phân bố theo trục x y khơng gian hai chiều Ví dụ: Độ phân giải ảnh hình CGA (Color Graphic Adaptor) lưới điểm theo chiều ngang hình: 320 điểm chiều dọc * 200 điểm ảnh (320*200) Rõ ràng, hình CGA 12” ta nhận thấy mịn hình CGA 17” độ phân giải 320*200 Lý do: mật độ (độ phân giải) diện tích hình rộng độ mịn (liên tục điểm) 1.2.3 Mức xám ảnh Một điểm ảnh (pixel) có hai đặc trưng vị trí (x, y) điểm ảnh độ xám Dưới xem xét số khái niệm thuật ngữ thường dùng xử lý ảnh a) Định nghĩa: Mức xám điểm ảnh cường độ sáng gán giá trị số điểm b) Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức 256 mức phổ dụng Lý do: từ kỹ thuật máy tính dùng byte (8 bit) để biểu diễn mức xám: Mức xám dùng byte biểu diễn: 28=256 mức, tức từ đến 255) c) Ảnh đen trắng: ảnh có hai màu đen, trắng (khơng chứa màu khác) với mức xám điểm ảnh khác d) Ảnh nhị phân: ảnh có mức đen trắng phân biệt tức dùng bit mơ tả 21 mức khác Nói cách khác: điểm ảnh ảnh nhị phân e) Ảnh màu: khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo nên giới màu, người ta thường dùng byte để mơ tả mức màu, giá trị màu: 28*3=224≈ 16,7 triệu màu Chúng ta cầ đọc thêm sách tham khảo để có thêm thơng tin khái niệm 1.2.4 Định nghĩa ảnh số Ảnh số tập hợp điểm ảnh với mức xám phù hợp dùng để mô tả ảnh gần với ảnh thật 1.2.5 Quan hệ điểm ảnh Chương 1: Nhập môn xử lý ảnh Một ảnh số giả sử biểu diễn hàm f(x, y) Tập điểm ảnh S; cặp điểm ảnh có quan hệ với ký hiệu p, q Chúng ta nêu số khái niệm sau a) Các lân cận điểm ảnh (Image Neighbors) * Giả sử có điểm ảnh p toạ độ (x, y) p có điểm lân cận gần theo chiều đứng ngang (có thể coi lân cận hướng chính: Đơng, Tây, Nam, Bắc) {(x-1, y); (x, y-1); (x, y+1); (x+1, y)} = N4(p) đó: số giá trị logic; N4(p) tập điểm lân cận p Đông Tây x Nam (x -1, y-1) (x, y-1) (x+1, y-1) y (x -1, y) (x, y) (x+1, y) Bắc (x-1, y+1) (x, y+1) (x+1, y+1) Hình 1.3 Lân cận điểm ảnh tọa độ (x,y) * Các lân cận chéo: Các điểm lân cận chéo NP(p) (Có thể coi lân cận chéo la hướng: Đông-Nam, Đông-Bắc, Tây-Nam, Tây-Bắc) Np(p) = { (x+1, y+1); (x+1, y-1); (x-1, y+1); (x-1, y-1)} * Tập kết hợp: N8(p) = N4(p) + NP(p) tập hợp lân cận điểm ảnh p * Chú ý: Nếu (x, y) nằm biên (mép) ảnh; số điểm nằm ảnh b) Các mối liên kết điểm ảnh Các mối liên kết sử dụng để xác định giới hạn (Boundaries) đối tượng vật thể xác định vùng ảnh Một liên kết đặc trưng tính liền kề điểm mức xám chúng Giả sử V tập giá trị mức xám Một ảnh có giá trị cường độ sáng từ thang mức xám từ 32 đến 64 mô tả sau : V={32, 33, … , 63, 64} Có loại liên kết * Liên kết 4: Hai điểm ảnh p q nói liên kết với giá trị cường độ sáng V q nằm lân cận p, tức q thuộc N4(p) * Liên kết 8: Hai điểm ảnh p q nằm lân cận p, tức q thuộc N8(p) * Liên kết m (liên kết hỗn hợp): Hai điểm ảnh p q với giá trị cường độ sáng V nói liên kết m q thuộc N4(p) q thuộc NP(p) c) Đo khoảng cách điểm ảnh Chương 1: Nhập môn xử lý ảnh Định nghĩa: Khoảng cách D(p, q) hai điểm ảnh p toạ độ (x, y), q toạ độ (s, t) hàm khoảng cách (Distance) Metric nếu: D(p,q) ≥ (Với D(p,q)=0 p=q) D(p,q) = D(q,p) D(p,z) ≤ D(p,q) + D(q,z); z điểm ảnh khác Khoảng cách Euclide: Khoảng cách Euclide hai điểm ảnh p(x, y) q(s, t) định nghĩa sau: De(p, q) = [(x - s)2 + (y - t)2]1/2 Khoảng cách khối: Khoảng cách D4(p, q) gọi khoảng cách khối đồ thị (CityBlock Distance) xác định sau: D4(p,q) = | x - s | + | y - t | Giá trị khoảng cách điểm ảnh r: giá trị bán kính r điểm ảnh từ tâm điểm ảnh đến tâm điểm ảnh q khác Ví dụ: Màn hình CGA 12” (12”*2,54cm = 30,48cm=304,8mm) độ phân giải 320*200; tỷ lệ 4/3 (Chiều dài/Chiều rộng) Theo định lý Pitago tam giác vuông, đường chéo lấy tỷ lệ phần (5/4/3: đường chéo/chiều dài/chiều rộng hình); độ dài thật (305/244/183) chiều rộng hình 183mm ứng với hình CGA 200 điểm ảnh theo chiều dọc Như vậy, khoảng cách điểm ảnh lân cận CGA 12” ≈ 1mm Khoảng cách D8(p, q) gọi khoảng cách bàn cờ (Chess-Board Distance) điểm ảnh p, q xác định sau: D8(p,q) = max (| x-s | , | y-t |) 1.2.6 Các thành phần hệ thống xử lý ảnh Bộ nhớ Đầu đo Bộ số hóa Máy tính số Bộ hiển thị Hình 1.3 Các thành phần hệ thống xử lý ảnh Theo quan điểm quy trình xử lý, thể khối Hình 1.1, khối chi tiết luồng thơng tin Hình 1.2 Theo quan điểm hệ thống xử lý máy tính số, hệ thống gồm đầu đo (thu nhận ảnh); số hóa ; máy tính số; Bộ hiển thị; Bộ nhớ Các thành phần khơng nhắc lại (đọc thêm giáo trình cấu trúc máy tính) Một hệ thống xử lý ảnh gồm: máy tính cá nhân kèm theo vỉ mạch chuyển đổi đồ hoạ VGA SVGA, đĩa chứa ảnh dùng để kiểm tra thuật tốn hình có hỗ trợ VGA SVGA Nếu điều kiện cho phép, nên có hệ thống Hình 1.4 bao gồm Chương 7: Nén liệu ảnh phép biến đổi Cosin ngược rời rạc x' (k1, n2 ) với k1 biến số n2 tham số Như vậy, muốn khơi phục lại ảnh ban đầu từ ma trận hệ số biến đổi biến đổi nhanh Cosin ngược rời rạc chiều hệ số theo hàng, sau đem biến đổi nhanh Cosin rời rạc chiều theo cột kết trung gian vừa tính c Biến đổi Cosin chuẩn nén JPEG JPEG viết tắt Joint Photographic Expert Group ( nhóm chuyên gia phát triển ảnh này) Chuẩn JPEG công nhận chuẩn ảnh quốc tế năm 1990 phục vụ ứng dụng truyền ảnh cho lĩnh vực y học, khoa học, kỹ thuật, ảnh nghệ thuật… Chuẩn JPEG sử dụng để mã hóa ảnh đa mức xám, ảnh màu Nó khơng cho kết ổn định với ảnh đen trắng Chuẩn JPEG cung cấp giải thuật cho hai loại nén nén không mát thông tin nén mát thông tin Trong phần đây, chúng tơi trình bày chi tiết dạng nén biến đổi chấp nhận mát thông tin dùng biến đổi Cosin chuẩn JPEG: Biến đổi Cosin ( Sequential DTC - based) Biến đổi Cosin kỹ thuật đơn giản dùng phổ biến đáp ứng hầu hết đặc tính cần thiết cho phần lớn ứng dụng Mã hóa JPEG bao gồm nhiều cơng , sSơ đồ thuật tốn nén giải nén mô tả P h â n Ảnh gốc 8x8 DCT Lượng tử hóa Mã hóa Ảnh nén 8x8 khối x k h ố i 8x8 Bảng lượng tử Bảng mã Hình 7.5 Sơ đồ thuật tốn nén JPEG Q trình giải nén làm ngược lại, người ta giải mã phần ảnh nén tương ứng với phương pháp nén sử dụng phần nén nhờ thông tin liên quan ghi phần header file nén Kết thu hệ số lượng tử Các hệ số khôi phục giá trị trước lượng tử hóa tương tự hóa Tiếp đem biến đổi Cosin ngược ta ảnh ban đầu với độ trung thực định 104 Chương 7: Nén liệu ảnh Ảnh nén Giải mã Tương tự hóa Bảng mã DCT ngược Ảnh giải nén Bảng lượng tử Hình 7.5 Sơ đồ thuật toán giải nén JPEG Bảng mã bảng lượng tử sơ đồ giải nén dựng lên nhờ thông tin ghi phần cấu trúc đầu tệp ( Header) tệp ảnh nén Quá trình nén chịu trách nhiệm tạo ghi lại thơng tin Phần phân tích tác dụng khối sơ đồ + Phần khối Chuẩn nén JPEG phân ảnh khối 8x8 Công đoạn biến đổi nhanh Cosin hai chiều cho khối 8x8 tỏ hiệu Biến đổi Cosin cho khối có kích thước giảm phần tính tốn chung việc tính hệ số C ij cho tầng (8 = 23), số hệ số là: +2 + = Nếu với ảnh 1024 x 1024, phép biến đổi nhanh Cosin chiều theo hàng ngang hàng dọc ta phải qua 10 tầng (1024 = 210) Số hệ số C ij là: 512 + 256 + 128 + 64 + + + + = 1021 Thời gian tính tốn hệ số C ij với toàn ảnh 1024 x 1024 lớn gấp 150 lần so với thời gian tính tốn hệ số cho khối Biến đổi Cosin khối có kích thước nhỏ làm tăng độ xác tính tốn với số dấu phẩy tĩnh, giảm thiểu sai số làm tròn sinh Do điểm ảnh hàng xóm có độ tương quan cao hơn, phép biến đổi Cosin cho khối nhỏ tập trung lượng số hệ số biến đổi Việc loại bớt số hệ số lượng thấp khối tạo mát thông tin cục giúp nâng cao chất lượng ảnh Ảnh chia làm B khối: ⎛ M '⎞ ⎛ N'⎞ B=⎜ ⎟×⎜ ⎟ = M B × NB ⎝ k ⎠ ⎝ l ⎠ Các khối xác định số (m,n) với m = [0…MB-1] n = [0…NB-1], m thứ tự khối theo chiều rộng, n thứ tự khối theo chiều dài Phân tích khối thực chất xác định tương quan tọa độ riêng khối với tọa độ thực điểm ảnh ảnh ban đầu Nếu ảnh ban đầu kí hiệu Image[i,j] ma trận biểu diễn khối (m,n) x[u, v] tính: x[u,v] = Image[mk + u,nl + v] 105 Chương 7: Nén liệu ảnh + Biến đổi Biến đổi công đoạn lớn phương pháp nén sử dụng phép biến đổi Nhiệm vụ công đoạn biến đổi tập trung lượng vào số hệ số biến đổi Cơng thức biến đổi cho khối là: X ( k1 , k ) = ε k1ε k 7 ∑ ∑ x(n , n n1= n = )Cos (2n1 + 1)k1Π (2n2 + 1)k Π Cos 16 16 (7.29) Trong đó: ⎧ ⎪ εk1 = ⎨ ⎪0 ⎩ εk k1 = < k1 < ⎧ ⎪ =⎨ ⎪0 ⎩ k = < k < Thuật toán biến đổi nhanh Cosin hai chiều cho khối trường hợp bao gồm 16 phép biến đổi nhanh Cosin chiều Đầu tiên, người ta biến đổi nhanh Cosin chiều cho dãy điểm ảnh hàng Lần lượt thực cho hàng Sau đem biến đổi nhanh Cosin chiều theo cột ma trận vừa thu sau phép biến đổi Cũng thực cho cột Ma trận cuối ma trận hệ số biến đổi khối tương ứng Trong sơ đồ giải nén ta phải dùng phép biến đổi Cosin ngược Công thức biến đổi ngược cho khối 8x8: x(n1 ,n2 ) = ε1ε2 7 ∑ ∑ X(kn ,k k1=0 k1=0 )Cos (2n2 + 1)k Π (2n1 + 1)k1 Π Cos 16 16 (8.30) đó: ⎧ ⎪ εk1 = ⎨ ⎪0 ⎩ εk k1 = < k1 < ⎧ ⎪ =⎨ ⎪0 ⎩ k = < k < + LƯỢNG TỬ HĨA Khối lượng tử hóa sơ đồ nén đóng vai trò quan định tỉ lệ nén chuẩn nén j Đầu vào khối lượng tử hóa ma trận hệ số biến đổi Cosin khối điểm ảnh 106 Chương 7: Nén liệu ảnh Để giảm số lượng tử, người ta tìm cách quy hệ số khối khoảng phân bố Chuẩn nén j sử dụng lượng tử hóa Giả sử hệ số có hàm tính xác suất xuất Chúng ta chỉnh lại hệ số yj phép gán: yj = yj - μ j σj Với μ j trung bình cộng hệ số thứ j σ j độ lệch hệ số thư j Như đồng mức định mức tạo lại cho tất hệ số Do đó, hệ số biểu diễn số lượng bit Có nhiều cách tiếp cận để tính mức định mức tạo lại Lloyd – Max đưa giải thuật sau: Bước 1: Chọn giá trị khởi tạo: d0 = yL dN = yH r0 = d0 N mức lượng tử Bước 2: Cho i biến thiên từ i đến N-1 thực cơng việc sau: a Tính di theo công thức: di ri −1 = ∫ y p( y)dy d i −1 ∫ di p ( y )dy d i −1 b Tính ri theo cơng thức: ri = 2di - ri −1 Bước 3: Tính dN rt = ∫ ∫ d N −1 y p ( y )dy dN p ( y )dy d N −1 Bước 4: Nếu rN-1 ≠ r’ điều chỉnh lại r0 lặp lại từ bước đến bước Trong trình cài đặt tạo lượng tử hóa, Lloyd Max có nhiều cải tiến để tính tốn dễ dàng Xác định d1 công thức bước 2a tiến hành theo phương pháp Newton-Raphson Sau bước mơ tả tồn cơng việc khối lượng từ hóa tác động lên hệ số biến đổi Cosin: Bước 1: Tính trung bình cộng µ độ lệch σ cho hệ số vị trí khối σj = ∑y i n 107 Chương 7: Nén liệu ảnh n∑ y 2j − (∑ y j ) σi = n(n − 1) Với yj hệ số thứ j, n số khối Bước 2: Lựa chọn tỉ lệ số hệ số giữ lại khối Bước 3: Giữ lại hệ số có độ lệch lớn Bước 4: Lập ma trận T cho: Tij =1 hệ số (i,j) giữ lại Bước 5: Căn chỉnh lại giá trị hệ số xoay chiều giữ lại khối: C ij = C ij − μ ij σ ij Bước 6: Tính phân bố giá trị xoay chiều chỉnh Bước 7: Tính độ lệch σj phân bố vừa tính Bước 8: Lượng tử hóa hệ số xoay chiều cách sử dụng lượng tử LloydMax sau điều chỉnh mức định mức tạo lại theo cách sau: di ⇐ di × σ s ri ⇐ ri × σ s dN = -d0 Thành phần chiều khơng lượng tử hóa Đến đây, ta chuyển sang bước nén + Nén liệu Đầu vào khối nén gồm hai thành phần: thành phần hệ số chiều thành phần hệ số xoay chiều Thành phần hệ số chiều Ci(0, 0) với i = 0,1,…,63 chứa phần lớn lượng tín hiệu hình ảnh Người ta khơng nén trực tiếp giá trị Ci(0, 0) mà xác định độ lệch Ci(0, 0): di = Ci+1(0, 0) – Ci(0, 0) di có giá trị nhở nhiều so với Ci nên biểu diễn dấu phẩy động theo chuẩn IEE754 thường chưa nhiều chuỗi bit nên cho hiệu suất nén cao Giá trị C0(0, 0) độ lệch d1, ghi tệp tạm Tệp nén phương pháp nén Huffman Thành phần hệ số xoay chiều C1(m, n) với 1≤m≤7, 1≤n≤7 chứa thông tin chi tiết ảnh Để nâng cao hiệu nén cho hệ số khối, người ta xếp chúng lại theo thứ tự ZigZag Tác dụng xếp lại theo thứ tự ZigZag tạo nhiều loại hệ số giống Chúng ta biết lượng khối hệ số giảm dần từ góc bên trái xuống góc bên phải nên việc xếp lại hệ số theo thứ tự ZigZag tạo điều kiện cho hệ số xấp xỉ (cùng mức lượng tử) nằm dòng Mỗi khối ZigZag mã hóa theo phương pháp RLE Cuối khối đầu RLE, ta đặt dấu kết thúc khối EOB (End Of Block) Sau đó, khối dồn lại mã hóa lần phương pháp mã Huffman Nhờ có dấu kết thúc khối nên phân biệt hai khối cạnh giải mã Huffman Hai bảng mã Huffman cho hai thành phần hệ số tất nhiên khác 108 Chương 7: Nén liệu ảnh Để giải nén được, phải ghi lại thơng tin như: kích thước ảnh, kích thước khối, ma trận Y, độ lệch tiêu chuẩn, mức tạo lại, hai bảng mã Huffman, kích thước khối nén chiều, kích thước khối nén xoay chiều… ghi nối tiếp vào hai file nén thành phần hệ số Cài đặt giải thuật cho nén thực phức tạp Chúng ta phải nắm kiến thức nén RLE, Huffman, biến đổi Cosin, xây dựng lượng tử hóa Lloyd-Max…Nén giải nén j chậm bù lại, thời gian truyền mạng nhanh kích thước tệp nén nhỏ Với ưu điểm ISO chấp nhận chuẩn ảnh quốc tế biết đến mã số ISO 10918-1 7.4 PHƯƠNG PHÁP MÃ HĨA THẾ HỆ THỨ HAI Phương pháp mã hóa dựa vào biến đổi hệ thứ hai, nói phần giới thiệu chung, phân thành hai lớp nhỏ: Lớp phương pháp sử dụng phép toán cục để tổ hợp đầu theo cách thức hợp lý lớp phương pháp sử dụng biểu diễn ảnh Dưới đây, lớp phương pháp thứ xem xét phương pháp có tên gọi “Kim tự tháp Laplace”; lớp phương pháp thứ hai đề cập phương pháp vùng gia tăng phương pháp tách-hợp 7.4.1 Phương pháp Kim tự tháp Laplace (Pyramide Laplace) Phương pháp tổ hợp hai phương pháp: Mã hóa thích nghi biến đổi Tỷ số nén cao, thường 10/1 Về nguyên tắc, phương pháp dựa vào mơ hình phân cấp quan sát người Bắt đầu từ ảnh gốc x(m, n) qua lọc dải thấp ta thu tín hiệu x1(m, n) Bộ lọc thiết kế để tính trung bình cục dựa vào đáp ứng xung chiều gần với đường cong Gauss Bộ lọc đòng vai trò “dự đốn” với sai số e1(m, n) tính bởi: e1(m, n) = x(m, n) – x1(m, n) (7.31) Như mã hóa x1(m, n) e1(m, n) tương đương với mã hóa x(m, n) Với cách biến đổi e1(m, n) thuộc loại dải cao Vì mắt người cảm nhận tín hiệu với tần số cao nên ta dùng lượng bit để mã hóa cho Mặt khác tín hiệu x1(m, n) thuộc loại dải thấp, nên theo lý thuyết lấy mẫu số mẫu Q trình lặp lại cách dùng lọc thấp khác ta thu f tín hiệu xi(m, n), i=1,2,… Với lần lặp kích thước ảnh giảm lượng i f i +1 Theo cách này, ta có cấu trúc xếp chồng tự cấu trúc Kim tự tháp mà kích thước giảm dần từ gốc đến đỉnh Nhân chập Gauss dùng có kích thước 5x5 Các tín hiệu sau lượng hóa mẫu hóa Theo kết cơng bố [6] với lọc giải thấp chiều tách với trọng số: g(0) = 0,7, g(-1) = g(1) = 0,25 g(-2) = g(2) = 0,1 Tỉ số nén dao động từ 6/1 đến 32/1 Tuy nhiên, tỉ số nén cao ảnh kết có biến dạng 7.4.2 Phương pháp mã hóa dựa vào biểu diễn ảnh 109 Chương 7: Nén liệu ảnh Như biết, xử lý ảnh tùy theo ứng dụng mà ta cần toàn ảnh hay đặc tính quan trọng ảnh Các phương pháp phân vùng ảnh chương sáu hợp vùng, tách, tách hợp hữu ích để nén ảnh Có thể có nhiều phương pháp khác, song đề cập đến hai phương pháp: vùng gia tăng phương pháp tách hợp a Mã hóa dựa vào vùng gia tăng Kỹ thuật vùng gia tăng thực chất hợp vùng có tính chất Kết ảnh phân đoạn giống trò xếp chữ (Puzzle) Tuy nhiên, cần lưu ý tất đường bao thu không tạo nên ảnh giống ảnh gốc Việc xác định tính chất miền đồng xác định độ phức tạp phương pháp Để đơn giản, tiêu chuẩn chọn khoảng mức xám Như vậy, miền đồng tập hợp điểm ảnh có mức xám thuộc khoảng chọn Cũng cần lưu ý thêm rằng, ảnh gốc có đường bao kết cấu (Texture) Trong miền texture, độ xám biến đổi chậm Do vậy, không ý chia ảnh thành nhiều miền gây nên bao giả Giải pháp để khắc phục tượng ta dùng lọc thích hợp hay lọc trung vị Sau giai đoạn này, ta thu ảnh phân đoạn với đường viền kín, độ rộng pixel Để loại bỏ đường bao giả, ta dùng phương pháp gradient (xem chương năm) Sau thu đường bao đúng, người ta tiến hành mã hóa (xấp xỉ) đường bao đường cong hình học, thí dụ đoạn thẳng hay đường cong Nếu ảnh gốc có độ phân giải khơng thích hợp, người ta dùng khoảng 1,3 bit cho điểm biên Phương pháp thể ưu điểm: mơ hình tham số Các tham số số vùng, độ xác mô tả Tuy nhiên, tham số khoảng mức xám quan trọng có ảnh hưởng đến tỉ số nén Một tham số không phần quan trọng số điểm đường bao bị coi giả Thường số điểm không vượt 20 điểm b Phương pháp tách – hợp Cũng chương sáu, phương pháp tách – hợp khắc phục số nhược điểm phương pháp phân vùng dựa vào tách vùng hay hợp vùng Trong phương pháp mã hóa này, người ta thay tiêu chuẩn chọn vùng đơn giản tiêu chuẩn khác hiệu Nguyên tắc chung phương pháp mơ hình biên – texture Nhìn chung đường biên dễ nhạy cảm với mắt người, texture nhạy cảm Người ta mong muốn đường phân ranh vùng đồng với đường bao Lưu ý cần định phân vùng phần ảnh cho khơng vắt chéo đường bao Đây tiêu chuẩn kiểm tra quan trọng Các đường bao thường nhận lọc thơng cao, đẳng hướng Để quản lý điểm thuộc vùng tốt hơn, tiêu chuẩn kiểm tra thứ hai xem xét dấu: “các điểm nằm phía đường bao có dấu” Nhìn chung, phương pháp gồm hai giai đoạn giai đoạn đầu thực việc tách vùng, giai đoạn sau thực việc hợp vùng Quá trình tách thực trước Người ta chia ảnh gốc thành vùng nhỏ kích thước 9x9 Tiếp theo, tiến hành xấp xỉ vùng ảnh đa thức có bậc nhỏ Sau q trình tách ta thu số vùng ảnh hình vuông liên tiếp chúng tạo nên miền gốc lớn không thiết vuông Như vậy, trường hợp phải xấp xỉ nhiều 110 Chương 7: Nén liệu ảnh đa thức giống Rõ dàng việc mã hóa riêng biệt đa thức điều kiện hiệu người nghĩ đến hợp vùng để giảm độ dư thừa Quá trình hợp tiến hành sau: hai vùng xấp xỉ đa thức tương tự, người ta hợp chúng làm dùng đa thức xấp xỉ Nếu mức độ thay đổi thấp, ta có nhiều cặp vùng tương tự Để nhận kết khơng phụ thuộc vào lần hợp đầu, người ta xây dựng đồ thị “vùng kế cận” Các nút đồ thị vùng liên hệ biểu diễn mối không tương đồng Sự liên hệ với mức không tương đồng thấp hai vùng cần hợp lại Sau bước hợp này, đồ thị cập nhật lại trình hợp lặp lại tiêu chuẩn thỏa mãn Q trình hợp dừng định chất lượng ảnh nén hay tiêu chuẩn khác Ta thấy phương pháp phức tạp song bù lại cho tỉ số nén cao 60 [6] 7.5 KẾT LUẬN Mỗi phương pháp nén có ưu điểm nhược điểm Tính hiệu phương pháp khơng phụ thuộc vào tỉ số nén mà vào nhiều tiêu khác như: độ phức tạp tính tốn, nhạy cảm với nhiễu, chất lượng, kiểu ảnh, v.v… Nén vấn đề lớn quan tâm nhiều có liên quan đến nhiều lĩnh vực khác Chúng ta khơng hi vọng trình bầy tất chương Song dù sao, chương cung cấp số khái niệm phương pháp khả dụng số phương pháp nén liệu nén ảnh Bảng tổng kết cung cấp cho cách nhìn tương đối toàn diện phương pháp nén Bảng so sánh kết số phương pháp nén Phương pháp Tỷ số nén Độ phức tạp Chất lượng Nhạy cảm với nhiễu Kiểu ảnh RLC 10 Đơn giản Rất tốt Lớn Nhị phân Dự đoán 2-4 Đơn giản Rất tốt Trung bình Mọi ảnh Biến đổi 10-15 Phức tạp Tốt Rất Đa cấp xám Pyramide Laplace 5-10 Trung bình Tốt Lớn Đa cấp xám Vùng gia tăng 20-30 Phức tạp Trung bình Rất lớn Đa cấp xám Tách hợp 60-70 Rất phức tạp Trung bình Rất lớn Đa cấp xám CÂU HỎI ƠN TẬP Viết chương trình nén giải nén theo phương pháp RLC (đơn giản, dọc, ngang, hay kết hợp) 111 Chương 7: Nén liệu ảnh Viết chương trình nén giải nén theo phương pháp Huffman Viết chương trình nén giải nén theo phương pháp LZW Viết thủ tục thực biến đổi Cosin thuận Viết thủ tục thực biến đổi Cosin ngược Viết thủ tục thực lượng tử hóa theo thuật tốn Lloyd – Max 112 Tài liệu tham khảo TÀI LIỆU THAM KHẢO [1] Lương Mạnh Bá, Nguyễn Thanh Thuỷ Nhập môn xử lý ảnh số Nhà xuất Nhà xuất Khoa học Kỹ thuật, 2003 [2] Võ Đức Khánh, Hồng Văn Kiếm Giáo trình xử lý ảnh số Nhà xuất Đại học Quốc gia Thành phố Hồ Chi Minh [3] Nguyễn Kim Sách Xử lý ảnh Video số Nhà xuất Khoa học Kỹ thuật, 1997 [4] Nguyễn Quốc Trung Xử lý tín hiệu lọc số Nhà xuất Khoa học Kỹ thuật, 2004 [5] Bhabatosh Chanda, Dwijesh Dutta Mạumder Digital Imge Processing and Analysis Prentice Hall of India, 2001 [6] Thomas Braunl, S Feyer, W Rapt, M Reinhardt Parallel Image Processing Springer, 2000 [7] Willam K Pratt Digital Image Processing: PIKS inside, Third Edition 2001, John Wiley & Sons, Inc 113 Giải thích từ thuật ngữ viết tắt GIẢI THÍCH TỪ VÀ THUẬT NGỮ VIẾT TẮT ACF : AutoCorrelation Function : Hàm tự tương quan ADALINE : ADAptive LINear Element ART : Adaptive Resonance Networks BMP : Bit MaP, BP : Back Propagation CCD : Charge-Coupled Devices: thiết bị gộp CIE : Commission Internationale d’Eclairage : Một tổ chuẩn màu quốc tế dpi : dot per inch EP : Evolutionary Programming: Lập trình tiến hóa FIR : Finite Impulsse Response : Bộ lọc đáp ứng xung hữu hạn GA : Genetic Algorithm: Giải thuật di truyền, áp dụng nhằm tói ưu tồn cục theo xác suất GIF : Graphics Interchanger Format hãng ComputerServer Incorporated (Mỹ) đề xuất năm 1990 JPEG : Joint Phograph Expert Group : Tên nhóm nghiên cứu chuẩn nén cho ảnh, thành lập năm 1982 Tên cũ IOS Năm 1986, JPEG thức thành lập KL : Karhumen Loeve, Tên phép biến đổi ảnh dùng xử lý ảnh PLD : Picture Language Description: Mô tả ngôn ngữ ảnh PC : Personal Computer: Máy tính cá nhân PSF : Point-Spread Function: Hàm trải điểm SOM : (Self-Organization Map) 114 Mục lục MỤC LỤC LỜI NÓI ĐẦU CHƯƠNG 1: NHẬP MÔN XỬ LÝ ẢNH 1.1 GIỚI THIỆU VỀ HỆ THỐNG XỬ LÝ ẢNH 1.2 NHỮNG VẤN ĐỀ CƠ BẢN TRONG HỆ THỐNG XỬ LÝ ẢNH 1.2.1 Điểm ảnh (Picture Element) 1.2.2 Độ phân giải ảnh 1.2.3 Mức xám ảnh 1.2.4 Định nghĩa ảnh số 1.2.5 Quan hệ điểm ảnh 1.2.6 Các thành phần hệ thống xử lý ảnh 1.3 NHỮNG VẤN ĐỀ KHÁC TRONG XỬ LÝ ẢNH 10 1.3.1 Biến đổi ảnh (Image Transform) 10 1.3.2 Nén ảnh 11 CÂU HỎI ÔN TẬP 11 CHƯƠNG 2: THU NHẬN ẢNH 12 2.1 CÁC THIẾT BỊ THU NHẬN ẢNH 12 2.1.1 Bộ cảm biến ảnh 12 2.1.2 Hệ tọa độ màu 13 2.2 LẤY MẪU VÀ LƯỢNG TỬ HÓA 15 2.2.1 Giới thiệu 15 2.2.2 Lấy mẫu 15 2.2.3 Lượng tử hóa 17 2.3 MỘT SỐ PHƯƠNG PHÁP BIỂU DIỄN ẢNH 18 2.3.1 Mã loạt dài 18 2.3.2 Mã xích 18 2.3.3 Mã tứ phân 19 2.4 CÁC ĐỊNH DẠNG ẢNH CƠ BẢN 19 2.4.1 Khái niệm chung 19 2.4.2 Quy trình đọc tệp ảnh 19 2.5 CÁC KỸ THUẬT TÁI HIỆN ẢNH 20 2.5.1 Kỹ thuật chụp ảnh 20 2.5.2 Kỹ thuật in ảnh 20 2.6 KHÁI NIỆM ẢNH ĐEN TRẮNG VÀ ẢNH MÀU 22 2.6.1 Ảnh đen trắng 22 2.6.2 Ảnh màu 23 CÂU HỎI ÔN TẬP 23 CHƯƠNG : XỬ LÝ NÂNG CAO CHẤT LƯỢNG ẢNH 24 115 Mục lục 3.1 CẢI THIỆN ẢNH SỬ DỤNG CÁC TOÁN TỬ ĐIỂM 24 3.1.1 Tăng độ tương phản (Stretching Contrast) 25 3.1.2 Tách nhiễu phân ngưỡng .26 3.1.4 Cắt theo mức (Intensity Level Slicing) 27 3.1.5 Trích chọn bit (Bit Extraction) 27 3.1.6 Trừ ảnh 28 3.1.7 Nén dải độ sáng 28 3.1.8 Mô hình hóa biến đổi lược đồ xám 28 3.2 CẢI THIỆN ẢNH DÙNG TỐN TỬ KHƠNG GIAN 28 3.2.1 Làm trơn nhiễu lọc tuyến tính: lọc trung bình lọc dải thơng thấp 29 3.2.2 Làm trơn nhiễu lọc phi tuyến 31 3.2.3 Mặt nạ gờ sai phân làm nhẵn 32 3.2.4 Lọc thông thấp, thông cao lọc dải thông 33 3.2.5 Khuyếch đại nội suy ảnh 33 3.2.6 Một số kỹ thuật cải thiện ảnh nhị phân .34 3.3 KHÔI PHỤC ẢNH .35 3.3.1 Các mơ hình quan sát tạo ảnh 36 3.3.2 Các lọc 38 CÂU HỎI ÔN TẬP CHƯƠNG 39 CHƯƠNG 4: CÁC PHƯƠNG PHÁP PHÁT HIỆN BIÊN 40 4.1 GIỚI THIỆU BIÊN VÀ KỸ THUẬT PHÁT HIỆN BIÊN .40 4.1.1 Một số khái niệm 40 4.1.2 Phân loại kỹ thuật phát biên 41 4.1.3 Quy trình phát biên 41 4.2 PHƯƠNG PHÁP PHÁT HIỆN BIÊN CỤC BỘ .42 4.2.1 Phương pháp Gradient 42 4.2.2 Dò biên theo quy hoạch động .47 4.2.3 Một số phương pháp khác 49 CÂU HỎI VÀ BÀI ÔN TẬP 51 CHƯƠNG 5: PHÂN VÙNG ẢNH .52 5.1 GIỚI THIỆU .52 5.2 PHÂN VÙNG ẢNH THEO NGƯỠNG BIÊN ĐỘ 52 5.3 PHÂN VÙNG ẢNH THEO MIỀN ĐỒNG NHẤT 53 5.3.1 Phương pháp tách tứ phân 53 5.3.2 Phương pháp cục 55 5.3.3 Phương pháp tổng hợp .55 5.4 PHÂN VÙNG ẢNH THEO KẾT CẤU BỀ MẶT 56 5.4.1 Phương pháp thống kê 56 5.4.2 Phương pháp cấu trúc 58 5.4.3 Tiếp cận theo tính kết cấu 59 CÂU HỎI ÔN TẬP CHƯƠNG 59 116 Mục lục CHƯƠNG 6: NHẬN DẠNG ẢNH 60 6.1 GIỚI THIỆU 60 6.1.1 Không gian biểu diễn đối tượng, không gian diễn dịch 60 6.1.2 Mơ hình chất trình nhận dạng 61 6.2 NHẬN DẠNG DỰA THEO MIỀN KHÔNG GIAN 63 6.2.1 Phân hoạch không gian 63 6.2.2 Hàm phân lớp hay hàm định 63 6.2.3 Nhận dạng theo phương pháp thống kê 64 6.2.4 Thuật toán nhận dạng dựa vào khoảng cách 65 6.3 NHẬN DẠNG DỰA THEO CẤU TRÚC 65 6.3.1 Biểu diễn định tính 65 6.3.2 Các bước nhận dạng 67 6.4 NHẬN DẠNG DỰA THEO MẠNG NƠRON 67 6.4.1 Giới thiệu mạng nơron 67 6.4.2 Nhận dạng ảnh hình khối 79 6.4.3 Nhận dạng ảnh mã vạch 81 CÂU HỎI VÀ BÀI TÂP 86 CHƯƠNG 7: NÉN DỮ LIỆU ẢNH 87 7.1 TỔNG QUAN VỀ NÉN DỮ LIỆU ẢNH 87 7.1.1 Một số khái niệm 87 7.1.2 Các loại dư thừa liệu 87 7.1.3 Phân loại phương pháp nén 88 7.2 CÁC PHƯƠNG PHÁP NÉN THẾ HỆ THỨ NHẤT 89 7.2.1 Phương pháp mã hóa loạt dài 89 7.2.2 Phương pháp mã hóa Huffman 89 7.2.3 Phương pháp LZW 91 7.2.4 Phương pháp mã hóa khối 95 7.2.5 Phương pháp thích nghi 97 7.3 PHƯƠNG PHÁP MÃ HÓA DỰA VÀO BIẾN ĐỔI THẾ HỆ THỨ NHẤT: 97 7.3.1 Nguyên tắc chung 97 7.3.2 Thuật tốn mã hóa dùng biến đổi chiều 98 7.3.3 Mã hóa dùng biến đổi Cosin chuẩn JPEG 99 7.4 PHƯƠNG PHÁP MÃ HÓA THẾ HỆ THỨ HAI 109 7.4.1 Phương pháp Kim tự tháp Laplace (Pyramide Laplace) 109 7.4.2 Phương pháp mã hóa dựa vào biểu diễn ảnh 109 7.5 KẾT LUẬN 111 CÂU HỎI ÔN TẬP 111 TÀI LIỆU THAM KHẢO 113 GIẢI THÍCH TỪ VÀ THUẬT NGỮ VIẾT TẮT 114 MỤC LỤC 115 117 XỬ LÝ ẢNH Mã số: 412XLA450 Chịu trách nhiệm thảo TRUNG TÂM ÐÀO TẠO BƯU CHÍNH VIỄN THÔNG