a. Khái niệm và công thức
3.3.1.1. Nguyên tắc cơ bản
Phần tử nén ảnh dữ liệu ám chỉ đến quá trình giám lượng số liệu dư thừa số liệu cần thiết để biểu diễn cùng một lượng thông tin cho trước. Cần phải phân biệt giữa số liệu và thông tin. Thực tế số liệu và thông tin không đồng nghĩa với nhau. Số liệu (và do đó tín hiệu) chỉ là phương tiện dùng để truyền tải thông tin. Cùng một lượng thông tin cho trước có thể biểu diễn bằng các lượng số liệu khác nhau. Ví dụ, trong một trường hợp cụ
thể một câu chuyện dài được tóm lược thành câu chuyện ngắn hơn. Ở đây, thông tin cần quan tâm là câu chuyện, các câu từ là dữ liệu được sử dụng để tóm lược thông tin. Nếu sử
dụng 2 cách riêng biệt với các từ ngữ khác nhau để cùng kể câu chuyện trên, ta sẽ tạo
được 2 phiên bản của câu chuyện và sẽ có một cái kém nhất sẽ chứa dữ liệu không cần thiết. Đó là, nó bao gồm dữ liệu (các từ) chúng cung cấp không liên quan đến thông tin hay đơn giản là trình bày lại cái đã biết. Và do đó, nó bao gồm dữ liệu dư thừa.
Độ dư thừa số liệu là vấn đề trung tâm trong nén ảnh số. Đánh giá cho quá trình thực hiện giải thuật nén là tỉ lệ nén ( ) được xác định như sau: Nếu và là lượng số
liệu trong hai tập hợp số liệu cùng được dùng để biễu diễn lượng thông tin cho trước thì
độ dư thừa số liệu tương đối của tập số liệu thứ nhất so với tập số liệu thứ hai có thể được định nghĩa như sau:
(3.30) trong đó:
(3.31) Trong trường hợp thì và có nghĩa là so với tập số liệu thứ hai thì tập số liệu thứ nhất không chứa số liệu dư thừa. Khi thì tiến tới vô cùng và tiến tới một, có nghĩa là độ dư thừa số liệu tương đối của tập số liệu thứ nhất là khá lớn hay tập số liệu thứ hai đã được nén khá nhỏ.
Ở đây có sự kết hợp giữa tỉ lệ nén và chất lượng hình ảnh. Tỉ lệ nén càng cao sẽ
làm giảm chất lượng hình ảnh và ngược lại. Chất lượng và quá trình nén có thể thay đổi tùy theo đặc điểm của hình ảnh nguồn và nội dung ảnh. Đánh giá chất lượng ảnh được đề
86
nghị tính số bit cho một điểm trong ảnh nén ( ). Nó được xác định là tổng số bit ở ảnh nén chia cho tổng sốđiểm:
= Số bit nén/Sốđiểm (3.32)
Trong nén ảnh số, ba loại dư thừa số liệu có thểđược nhận dạng và phân biệt. • Dư thừa mã (Coding Redundancy)
Nếu các mức của tín hiệu video được mã hóa bằng càc symbol nhiều hơn cần thiết (tuyệt đối) thì kết quả là có độ dư thừa mã. Để giảm độ dư thừa mã, trong nén ảnh thường sử dụng các mã VLC như mã Huffman, mã RLC v.v... Lượng thông tin về hình ảnh có xác suất thấp hơn.
• Dư thừa trong pixel (Interpixel Redundancy)
Vì giá trị của bất kỳ một pixel nào đó, cũng có thểđược dự báo từ giá trị của các lân cận của nó, nên thông tin từ các pixels riêng là tương đối nhỏ. Sự tham gia của một pixel riêng vào một ảnh là dư thừa. Nhiều tên (bao gồm: dư thừa không gian, dư thừa hình học, dư thừa trong ảnh) được đặt ra để phân biệt sự phụ thuộc này của các pixels. Ta dùng độ dư thừa trong pixel để chỉ tất cả các tên trên. Để giảm độ dư thừa trong pixel của một ảnh, dãy pixel hai chiều dùng cho việc nhìn và nội suy, phải được biến đổi thành một dạng có hiệu quả hơn. Trong các phương pháp nén ảnh được trình bày, ta dùng phép biến
đổi cosin rời rạc (DCT) biến đổi pixel từ miền không gian sang miền tần số, bằng cách này sẽ giảm được độ dư thừa số liệu trong pixel ở miền tần số cao.
• Dư thừa tâm sinh lý
Bằng trực quan ta thấy, sự thu nhận cường độ sáng thay đổi chỉ giới trong một phạm vi nhất định. Hiện tượng này xuất phát từ sự thật là mắt không đáp ứng với cùng độ
nhậy của tất cả các thông tin nhìn thấy. Thông tin đơn giản có tầm quan trọng ít hơn thông tin khác trong vùng nhìn thấy. Thông tin này được gọi là độ dư thừa tâm lý nhìn. Nó có thểđược loại bỏ mà không ảnh hưởng đáng kểđến chất lượng thu nhận ảnh. Khác với độ dư thừa mã và dư thừa trong pixel, độ dư thừa tâm sinh lý có liên quan đến thông tin theo định lượng, nó có quan hệ tới việc lượng tử hóa. Điều đó có nghĩa là ánh xạ một khoảng rộng các giá trịđầu vào lên một số hữu hạn các giá trịđầu ra. Đó là toán tử không
đảo ngược (mất thông tin) cho kết quả nén số liệu có tổn hao.