Các bước chính khi cài đặt hệ thống nén ảnh biến đổi
+ Chọn loại biến đổi. Biến đổi tốt nhất thỏa mãn thỏa hiệp giữa phi tƣơng quan và khả năng tập trung năng lƣợng với thực tế cài đặt. DCT đƣợc áp dụng rộng rãi.
+ Chọn kích thƣớc khối ảnh và áp dụng biến đổi trên chúng. Nếu khối ảnh quá nhỏ thì tƣơng quan giữa các điểm ảnh láng giềng không đƣợc khai thác hết. Mặt khác, nếu khối ảnh quá lớn thì làm tăng độ phức tạp cài đặt phần cứng và gây khó chịu khi quan sát biên của các khối. Kích thƣớc khối ảnh lựa chọn tốt nhất là 8x8.
+ Lƣợng tử hóa các hằng số biến đổi để giảm dung lƣợng lƣu trữ hay truyền tin.
+ Nén các hằng số đã lƣợng tử hóa bằng phƣơng pháp Huffman và/hoặc RLE.
- Lượng tử hóa véctơ (VQ)
Lƣợng tử hóa đƣợc thực hiện trên từng mẫu giá trị thực của dạng sóng hay các pixel ảnh. Mã hóa biến đổi thực hiện lƣợng tử hóa nhƣ sau: trƣớc hết biến đổi blốc điểm ảnh sau đó mã hóa riêng rẽ các hệ số biến đổi. Mã hóa dự báo thực hiện việc này bằng lƣợng tử hóa giá trị lỗi (là hiệu số giữa mẫu mới và dự báo mẫu mới trên cơ sở đầu ra mã hóa trƣớc đó).
Bộ lƣợng tử hóa véctơ đƣợc định nghĩa nhƣ ánh xạ Q của các véctơ K chiều trong không gian Euclid RK vào tập con hữu hạn các véctơ Y của RK
, Q: RK Y, trong đó, Y = (x’i; i = 1, 2, ...N), x’i là véctơ thứ i trong Y và đƣợc gọi là
codevector hay codeword.
Với mỗi codeword có một vùng láng giềng gần nhất liên quan (vùng Voronoi): Biên độ
x R x y x y For all j i
Vi K : i j ,
Tập các codewords đƣợc gọi là VQ codebook hay VQ table. N là tổng số véctơ trong Y. Trong bộ mã hóa, mỗi véctơ dữ liệu x thuộc RK là phù hợp hay xấp xỉ với từ mã trong codebook, và địa chỉ hay chỉ số của từ mã đƣợc truyền đi thay cho dữ liệu véctơ. Tại bộ giải mã, chỉ mục đƣợc ánh xạ trở lại từ mã và nó đƣợc sử dụng để biểu diễn véctơ dữ liệu gốc. Bộ mã hóa và bộ giải mã sử dụng cùng
codebook, đầu vào của chúng chứa tổ hợp các pixel trong blốc. Giả sử rằng kích thƣớc blốc ảnh là (n x n) pixel và mỗi pixel đƣợc biểu diễn bởi m bít, về lý thuyết thì có thể (2m)nxn loại blốc. Tuy nhiên trong thực tế, chỉ có giới hạn các tổ hợp thƣờng xuyên xuất hiện, nó làm giảm đáng kể kích thƣớc của codebook. Đó là cơ sở của lƣợng tử hóa véctơ. Nếu sử dụng cả các đặc tính cảm nhận của con ngƣời thì kích thƣớc này còn giảm nữa và chỉ cần ít bít để biểu diễn chỉ mục đầu vào
codebook.
Ta nhận thấy nguyên tắc lƣợng tử hóa véctơ tƣơng tự thuật toán LZW: sử dụng chỉ mục để biểu diễn blốc dữ liệu.
- Mã hóa ảnh fractal
Fractal: hiểu đơn giản fractal là ảnh texture hoặc hình dạng biểu diễn bởi một hay nhiều công thức toán học.
Hình học fractal: dạng hình học mà chi tiết không đều của nó tái diễn với kích thƣớc và góc khác nhau, nó có thể biểu diễn bởi biến đổi affine hay fractal (công thức).
Trong lịch sử, fractal đƣợc sử dụng để phát sinh ảnh ứng dụng trong các cảnh mô phỏng bay và các hiệu ứng đặc biệt của ảnh chuyển động. Các công thức ảnh fractal đƣợc sử dụng để mô tả hầu hết các ảnh thế giới thực.
Nén ảnh fractal: là ngƣợc lại của sinh ảnh fractal. Sinh ảnh hay hình fractal từ công thức cho trƣớc, nén ảnh fractal tìm kiếm tập fractal trong ảnh số mà nó mô tả và biểu diễn toàn bộ ảnh. Một khi tập fractal phù hợp đƣợc xác định, nó đƣợc nén thành mã hay công thức fractal đầy đủ. Các mã là qui luật sinh ra tập fractal khác
nhau để tái tạo toàn bộ ảnh. Do các mã biến đổi fractal đòi hỏi rất ít dữ liệu để biểu diễn và lƣu trữ nhƣ công thức, cho nên nén fractal có tỷ lệ nén rất cao.
- Nén Wavelet
Nguyên lý của nén Wavelet tƣơng tự nén trên cơ sở DCT:
Biến đổi tín hiệu từ miền thời gian sang miền mới trong đó phần cơ bản của tín hiệu đƣợc lƣu trữ và mã hóa để đạt đƣợc nén dữ liệu.
- Các hệ thống mã hóa trong thực tế
Thƣờng kết hợp một vài kỹ thuật trên đây để nâng cao hiệu quả nén: tỷ lệ và chất lƣợng ảnh chấp nhận đƣợc. Có rất nhiều tổ hợp cho các ứng dụng khác nhau. Một lƣợc đồ quan trọng đƣợc sử dụng để mã hóa dữ liệu video theo các bƣớc sau:
+ Subsampling không gian và thời gian + DPCM trên cơ sở đánh giá và bồi thƣờng + DCT hai chiều
+ Mã hóa Huffman + Mã hóa RLE
Lƣợc đồ lai này là nền tảng hình thành các chuẩn quốc tế về nén.
- Chuẩn nén ảnh JPEG
JPEG là chuẩn nén ảnh số quốc tế đầu tiên cho cả ảnh màu và ảnh đa mức xám.
JPEG đƣợc sử dụng rộng rãi, đƣợc cài đặt cả bằng phần cứng và phần mềm. Ban đầu chuẩn dành cho ảnh tĩnh sau đó đƣợc phát triển cho cả video và gọi chúng là motion JPEG (MJPEG).
JPEG đặc tả bốn mode thao tác sau:
+ Nén trên cơ sở DCT trình tự mất mát thông tin: Các thành phần ảnh đƣợc nén theo đƣờng quét từ trái sang phải và từ trên xuống dƣới. Đây là mode cơ sở và mọi cài đặt JPEG phải hỗ trợ.
+ Nén trên cơ sở DCT mất mát thông tin mở rộng: Ảnh đƣợc mã hóa theo nhiều đƣờng quét để phát sinh nhanh ảnh nén, thô dành cho truyền tin với băng thông chậm.
+ Mã hóa không mất mát thông tin: Đảm bảo ảnh giải mã đúng nhƣ gốc. + Mã hóa phân cấp: Ảnh đƣợc mã hóa trong đa mật độ
Mode cơ sở đƣợc sử dụng rộng rãi. Dữ liệu ảnh nguồn đƣợc biến đổi sang thành phần luminanceY (độ chói) và hai thành phần chrominance U và V (màu tinh khiết và độ bão hòa). U và V thƣờng đƣợc lấy mẫu không gian theo cả hai hƣớng ngang và dọc và factor 2 để có lợi thế là mắt ngƣời ít nhạy cảm với các tín hiệu
chrominance.
Các giá trị mẫu gốc trong dải [0, 2b
-1], với giả sử rằng sử dụng b bít cho mỗi mẫu. Các giá trị này đƣợc dịch chuyển sang dải [-2b-1, 2b-1-1], tâm là 0. Dải giá trị