Tổng quan về nén ảnh

Một phần của tài liệu Tim hieu mo hinh nen anh su dung bien doi wavelet (Trang 36 - 39)

3.1.1. Giới thiệu chung về nén ảnh

Nén ảnh số là một đề tài nghiên cứu rất phổ biến trong lĩnh vực xử lý dữ liệu đa phương tiện. Mục đích là làm thế nào để lưu trữ bức ảnh dưới dạng có kích thước nhỏ hơn hay dưới dạng biểu diễn mà chỉ yêu cầu số bít mã hoá ít hơn so với bức ảnh gốc. Nén ảnh thực hiện được là do một thực tế: thông tin trong bức ảnh không phải là ngẫu nhiên mà có trật tự, có tổ chức. Do đó, nếu bóc tách được tính trật tự, cấu trúc đó thì sẽ biết được phần thông tin nào quan trọng nhất trong bức ảnh để biểu diễn và truyền đi với số lượng bít ít hơn so với ảnh gốc mà vẫn đảm bảo tính đầy đủ thông tin. Ở phía thu, quá trình giải mã sẽ tổ chức, sắp xếp lại được bức ảnh xấp xỉ gần chính xác so với ảnh gốc nhưng vẫn thoả mãn chất lượng yêu cầu, đảm bảo đủ thông tin cần thiết.

Tóm lại, tín hiệu ảnh, video hay audio đều có thể nén lại bởi chúng có những tính chất như sau:

• Có sự tương quan dẫn đến dư thừa thông tin theo không gian: Trong phạm vi một bức ảnh hay một khung video tồn tại sự dư thừa đáng kể do mối tương quan giữa các điểm ảnh lân cận.

• Có sự tương quan dẫn đến dư thừa thông tin theo phổ: Các dữ liệu thu được từ các bộ cảm biến của thiết bị thu nhận ảnh tồn tại sự tương quan đáng kể giữa các mẫu thu, đây chính là nguyên nhân dẫn đến dư thừa theo phổ.

• Có sự tương quan dẫn đến dư thừa thông tin theo thời gian: Trong một chuỗi ảnh video, tồn tại sự tương quan giữa các điểm ảnh của các khung video, điều này cho thấy có sự dư thừa thông tin theo thời gian.

Trong hình 3.1, bộ mã hoá dữ liệu thực hiện quá trình nén bằng cách giảm kích thước dữ liệu ảnh gốc đến một mức phù hợp với việc lưu trữ và

truyền dẫn trên kênh. Tỉ lệ bít đầu ra của bộ mã hoá được tính là số bít cho một mẫu (điểm ảnh). Bộ mã hoá kênh thực hiện việc chuyển đổi luồng bít đã được nén thành dạng tín hiệu phù hợp cả cho việc lưu trữ và truyền dẫn, thường bộ mã hoá kênh sử dụng các kỹ thuật: mã hoá có độ dài thay đổi – RLC (Run Length Coding), mã hoá Huffman, mã hoá số học. Bộ giải mã thực hiện quá trình ngược lại so với bộ mã hoá.

Trong các hệ thống nén, tỉ lệ nén chính là tham số quan trọng đánh giá khả năng nén của hệ thống, công thức được tính như sau:

Tỉ lệ nén = Kích thước dữ liệu gốc / Kích thước dữ liệu nén

Đối với ảnh tĩnh, kích thước chính là số bít để biểu diễn toàn bộ bức ảnh.

Đối với ảnh video, kích thước chính là số bít để biểu diễn một đoạn khung hình video.

3.1.2. Phân loại các kỹ thuật nén

Các kỹ thuật nén chủ yếu được phân loại như sau: nén tổn hao và không tổn hao, mã hoá dự đoán và mã hoá dựa trên phép biến đổi, mã hoá băng con.

3.1.2.1. Nén tổn hao và không tổn hao

Trong các kỹ thuật nén không tổn hao (losses compression), ảnh khôi phục giống hoàn toàn so với ảnh gốc. Tuy nhiên, nén không tổn hao chỉ đạt được hiệu quả nén rất nhỏ. Trái lại, các kỹ thuật nén có tổn hao (lossy compression) có thể đạt được hiệu quả nén cao hơn rất nhiều mà ở điều kiện cảm nhận hình ảnh thông thường sự mất mát thông tin không cảm nhận được và vì thế vẫn đảm bảo chất lượng ảnh. Một số kỹ thuật nén có tổn hao gồm:

điều xung mã vi sai – DPCM, điều xung mã – PCM, lượng tử hoá véctơ – VQ, mã hoá biến đổi và băng con. Ảnh khôi phục trong hệ thống nén có tổn hao luôn có sự suy giảm thông tin so với ảnh gốc bởi vì: phương pháp nén này đã loại bỏ những thông tin dư thừa không cần thiết.

3.1.2.2. Mã hoá dự đoán và mã hoá dựa trên phép biến đổi

Đối với mã hoá dự đoán (predictive coding) các giá trị mang thông tin đã được gửi hay đang sẵn có sẽ được sử dụng để dự đoán các giá trị khác, và chỉ mã hoá sự sai lệch giữa chúng. Phương pháp này đơn giản và rất phù hợp với việc khai thác các đặc tính cục bộ của bức ảnh. Kỹ thuật DPCM chính là một ví dụ điển hình của phương pháp này. Trong khi đó, mã hoá dựa trên phép biến đổi (transform based coding) thì lại thực hiện như sau:

- Trước tiên thực hiện phép biến đổi với ảnh để chuyển sự biểu diễn ảnh từ miền không gian sang một miền biểu diễn khác. Các phép biến đổi thường dùng là: DCT - biến đổi Cosine rời rạc, DWT - biến đổi Wavelet rời rạc, LT - biến đổi trồng (lapped).

- Tiếp đó thực hiện mã hoá đối với các hệ số biến đổi. Phương pháp này có hiệu suất nén cao hơn rất nhiều so với phương pháp nén dự đoán bởi vì chính các phép biến đổi (sử dụng các thuộc tính nén năng lượng của mình) đã gói gọn toàn bộ năng lượng bức ảnh chỉ bằng một số ít các hệ số, số lớn các hệ số còn lại ít có ý nghĩa hơn sẽ bị loại bỏ sau khi lượng tử hoá và như vậy lượng dữ liệu phải truyền nhỏ đi rất nhiều. Trong phương pháp mã hoá dự đoán, sai lệch giữa ảnh gốc và ảnh dự đoán vẫn có ý nghĩa (còn sử dụng ở bước tiếp theo) sau khi lượng tử hoá, chính điều này làm cho phương pháp mã hoá dự đoán có nhiều dữ liệu được truyền đi hơn so với phương pháp mã hoá biến đổi.

3.1.3. Tiêu chuẩn đánh giá chất lượng mã hoá ảnh

Để đánh giá chất lượng của bức ảnh (hay khung ảnh video) ở đầu ra của bộ mã hoá, người ta thường sử dụng hai tham số:

• Sai số bình phương trung bình – MSE (mean square error).

• Tỉ số tín hiệu trên nhiễu đỉnh – PSNR (peak to signal to noise ratio).

MSE thường được gọi là phương sai lượng tử - σq2 (quantization error variance). MSE giữa ảnh gốc và ảnh khôi phục được tính như sau:

[ ] [ ]

( )2

2 1 , ,

∑ −

=

=

jk

q f j k g j k

MSE σ N (3.1)

Trong đó tổng lấy theo j, k tính cho tổng tất cả các điểm ảnh trong ảnh và N là số điểm ảnh trong ảnh. Còn PSNR giữa hai ảnh (b bít cho mỗi điểm ảnh, RMSE là căn bậc 2 của MSE) được tính theo công thức dB như sau:

1 log 2

20 10

− −

=

b

PSNR RMSE (3.2)

Thông thường, nếu PSNR ≥ 40dB thì hệ thống mắt người gần như không phân biệt được giữa ảnh gốc và ảnh khôi phục.

Một tham số khác hay sử dụng trong các hệ thông viễn thông đó là tỉ số tín hiệu trên nhiễu - SNR, tuy vậy SNR sử dụng cho một hệ thống nén ảnh cũng có công thức dB như sau:

energy Noise

utenergy Endoderinp

SNR =10log10 (3.3)

Một phần của tài liệu Tim hieu mo hinh nen anh su dung bien doi wavelet (Trang 36 - 39)

Tải bản đầy đủ (DOC)

(75 trang)
w