Hình ảnh được chia thành một chuẩn dạng lưới gồm các khối 8x8, mỗi khối đều độc lập với nhau, phổ tần số của khối được tính bằng cách sử dụng phép biến đổi Cosin rời rạc. Sau đĩ 64 hệ số phổ của mỗi khối được lượng tử hĩa thành một bảng lượng tử hĩa. Kích thước của bảng này sẽ xác định tỷ lệ nén cuối cùng của bức ảnh. Các hệ số của tần số cao thể hiện cho "độ sắc nét" của hình ảnh, sẽ bị giảm nhiều nhất trong bước này. Trong khi giải nén các giá trị tần số cao này sẽ được xấp xỉ bằng giá trị tính tốn [4].
a. Các bước xử lý cho mã hĩa dựa trên DCT
Hình 2.6 và 2.7 cho thấy các bước xử lý chính của các chế độ mã hĩa DCT. Những hình ảnh này minh họa trường hợp đặc biệt nén ảnh đơn thành phần (ảnh thang đo xám). Quá trình nén ảnh DCT là nén một khối mẫu 8x8 ảnh thang đo xám, do vậy việc nén ảnh màu cĩ thể được coi là nén của nhiều ảnh thang độ xám, chúng
cĩ thể được nén hồn tồn một lần hoặc được nén bằng cách xen kẽ các khối mẫu 8x8 lần lượt [4].
Hình 2. 6: Các bước xử lý bộ mã hĩa DCT [4]
Hình 2. 7: Các bước xử lý bộ giải mã DCT [4] b. 8x8 FDCT và IDCT
Tại đầu vào cho bộ mã hĩa, các mẫu hình ảnh được nhĩm thành các khối 8x8 (bằng cách chuyển các số nguyên khơng dấu trong phạm vi [0, 2P - 1] thành các số nguyên trong phạm vi [-2P-1, 2P-1-1]) và đưa vào bộ biến đổi DCT thuận (FDCT). Tại đầu ra của bộ giải mã, phép biến đổi DCT nghịch đảo (IDCT) xuất ra các khối mẫu 8x8 để tạo thành hình ảnh được nén. Các phương trình sau đây là các định nghĩa tốn học lý tưởng của 2 phép biến đổi 8x8 FDCT và 8x8 IDCT [4]:
(2.3) (2.4)
Trong đĩ:
Phép biến đổi DCT liên quan đến Biến đổi Fourier rời rạc (DFT). Mỗi khối 8x8 của hình ảnh mẫu là một tín hiệu rời rạc 64 điểm, là một hàm của hai giá trị x và y. Phép biến đổi DCT thuân (FDCT) lấy tín hiệu đầu vào của nĩ và phân tách thành 64 tín hiệu cơ sở trực giao. Đầu ra của phép biến đổi DCT thuận (FDCT) là
bộ 64 biên độ tín hiệu cơ sở hoặc “hệ số DCT” cĩ giá trị duy nhất được xác định bởi 64 điểm tín hiệu đầu vào.
Do đĩ, các hệ số DCT cĩ thể được coi là giá trị tương đối của các tần số khơng gian 2D của tín hiệu 64 điểm đầu vào. Hệ số khơng chứa tần số trong cả hai chiều (F(0,0)) được gọi là “hệ số DC” và 63 hệ số cịn lại được gọi là “hệ số AC”. Bởi vì các giá trị mẫu thường thay đổi chậm từ điểm này sang điểm khác, bước xử lý DCT thuận (FDCT) đặt nền tảng cho việc nén dữ liệu bằng cách tập trung hầu hết tín hiệu vào các tần số thấp hơn. Đối với một khối mẫu 8x8 từ một hình ảnh nguồn, hầu hết các tần số khơng gian cĩ biên độ bằng khơng hoặc gần bằng khơng và khơng cần mã hĩa.
Tại bộ giải mã, phép biến đổi DCT ngược (IDCT) đảo ngược so với FDCT. Sử dụng 64 hệ số DCT (mà tại thời điểm đĩ đã được lượng tử hĩa) và tái tạo 64 điểm tín hiệu hình ảnh đầu ra bằng cách tổng hợp các tín hiệu cơ bản. Về mặt tốn học, DCT là phép biến đổi một-một chuyển đổi qua lại giữa 64 điểm ảnh trong miền hình ảnh với 64 điểm tần trong tần số. Nếu FDCT và IDCT cĩ thể được tính tốn với độ chính xác hồn hảo và các hệ số DCT khơng được lượng tử như trong mơ tả sau, tín hiệu 64 điểm ảnh ban đầu cĩ thể được khơi phục chính xác. Về nguyên tắc, DCT khơng làm sự mất mát dữ liệu các mẫu hình ảnh nguồn, nĩ chỉ biến đổi chúng về miền mà chúng cĩ thể được mã hố hiệu quả hơn.
c. Lượng tử hĩa
Sau khi biến đổi DCT thuận, mỗi hệ số DCT được lượng tử hĩa đều kết hợp với Bảng định lượng 64 phần tử để đưa vào bộ mã hĩa. Mỗi phần tử cĩ thể là bất kỳ giá trị số nguyên nào từ 1 đến 255, xác định kích thước bậc của bộ lượng tử hĩa cho hệ số DCT tương ứng. Mục đích của việc lượng tử hĩa là để hình ảnh được nén thêm bằng cách cho hệ số nén DCT cĩ độ chính xác cần thiết để đạt được chất lượng hình ảnh mong muốn. Nĩi cách khác, mục tiêu của bước xử lý này là loại bỏ thơng tin khơng quan trọng trong ảnh. Đây là bước xử lý gây mất mát chính trong bộ mã hĩa DCT. Lượng tử hĩa được định nghĩa là phân chia của mỗi hệ số DCT theo kích thước bậc lượng tử tương ứng của nĩ, tiếp theo là làm trịn đến số nguyên gần nhất [4]:
Giá trị đầu ra này được chuẩn hĩa bởi kích thước bậc lượng tử. Dequantization là hàm nghịch đảo để loại bỏ lượng tử hĩa bằng cách nhân các hệ số với kích thước bậc, kết quả trả về là các hệ số thích hợp cho đầu vào cho IDCT [4]:
(2.6)
d. Mã hĩa DC và trình tự Zig-Zag
Sau khi lượng tử hĩa, hệ số DC được xử lý riêng biệt so với 63 hệ số AC. Hệ số DC là thang đo giá trị trung bình của 64 điểm ảnh, chiếm phần lớn của tổng dung lượng để tái tạo hình ảnh. Ta luơn cĩ mối tương quan chặt chẽ giữa các hệ số DC của các khối 8x8 liền kề, các hệ số DC lượng tử hĩa được mã hĩa bằng sự khác biệt so với hệ số DC của khối trước đĩ theo thứ tự mã hĩa (được định nghĩa như trong Hình 3).
Cuối cùng, tất cả các hệ số lượng tử hĩa được sắp xếp theo trình tự “zig- zag”, cũng được thể hiện trong Hình 2. 8 Thứ tự này giúp mã hĩa entropy được dễ dàng hơn khi đĩ ta đặt các hệ số tần số thấp (cĩ nhiều khả năng là nonzero) trước tần số cao hệ số.
Hình 2. 8: Hệ số lượng tử cho mã hĩa Entropy [4] e. Chất lượng nén và hình ảnh
Đối với hình ảnh màu cĩ cảnh phức tạp vừa phải, mã hĩa DCT thường tạo ra các mức chất lượng hình ảnh dưới đây với giới hạn nén được chỉ định. Các mức này chỉ mang tính tương đối, chất lượng và nén cĩ thể thay đổi tùy theo đặc điểm hình ảnh và nội dung ảnh. (Các đơn vị "bit/pixel" ở đây cĩ nghĩa là tổng số bit trong hình ảnh nén - bao gồm các thành phần màu sắc/chia cho số lượng mẫu trong thành phần độ sáng).
• 0,25-0,5 bit/pixel: vừa phải đến chất lượng tốt, đủ cho một số ứng dụng; • 0,5-0,75 bit/pixel: tốt cho chất lượng rất tốt, đủ cho nhiều ứng dụng; • 0,75-1/5 bit / pixel: chất lượng tuyệt vời, đủ cho hầu hết các ứng dụng; • 1,5-2,0 bit/pixel: thường khơng thể phân biệt được với bản gốc, đủ cho ứng dụng khĩ tính nhất.