Phương pháp nén ảnh JPEG

f Fr Rg Gb B′ +′ (2.1.9)

2.3.2 Phương pháp nén ảnh JPEG

JPEG ( Joint Photographic Expert Group ) là tên của một tổ chức nghiên cứu về các chuẩn nén ảnh (trước đây là ISO) được thành lập vào năm 1982. Năm 1986, JPEG chính thức

được thiết lập nhờ sự kết hợp giữa nhĩm ISO/IEC và ITV. Tiêu chuẩn này cĩ thểđược ứng dụng trong nhiều lĩnh vực : lưu trữảnh, Fax màu, truyền ảnh báo chí, ảnh cho y học, camera số v.v...

Tiêu chuẩn JPEG được định ra cho nén ảnh tĩnh đơn sắc và màu. Tuy nhiên cũng được sử dụng cho nhiều ứng dụng với ảnh động bởi vì nĩ cho chất lượng ảnh khơi phục khá tốt và ít tính tốn hơn so với nén MPEG. Nén JPEG cĩ thể thực hiện bởi bốn mode mã hĩa đĩ là:

a) Mã tuần tự (sequential DCT-based) : ảnh được mã hĩa theo kiểu quét từ trái qua phải, từ trên xuống dưới dựa trên khối DCT.

b) Mã hĩa lũy tiến (progressive DCT-based) : ảnh được mã hĩa bằng kiểu quét phức hợp theo chếđộ phân giải khơng gian cho các ứng dụng trên kiểu băng hẹp và do đĩ thời gian truyền dẫn cĩ dài.

c) Mã hĩa khơng tổn thất (lossless) : ảnh được đảm bảo khơi phục chính xác cho mỗi giá trị mẫu của nguồn. Thơng tin khơng cần thiết sẽ mới cắt bỏ cho nên hiệu quả nén thấp hơn so với phương pháp cĩ tổn thất.

d) Mã hĩa phân cấp (hierarchical) : ảnh được mã hĩa ở chếđộ phân giải khơng gian phức hợp, để cho những ảnh cĩ độ phân giải thấp cĩ thể được truy xuất và hiển thị mà khơng cần giải nén như những ảnh cĩ độ phân giải trong khơng gian cao hơn.

Mã hĩa khơng tổn thất khơng sử dụng cho video động bởi vì nĩ cung cấp một tỉ lệ nén khơng đủ cao. Tỉ lệ nén ảnh tĩnh cĩ thể đạt từ 1/10 đến 1/50 mà khơng làm ảnh hưởng đến chất lượng hiển thị của ảnh. Khai triển DCT được chọn là kỹ thuật then chốt trong JPEG vì nĩ cho ảnh nén chất lượng tốt nhất tại tốc độ bit thấp và giải thuật chuyển đổi nhanh và dễ dàng thực hiện bằng phần cứng. Trên Hình 2.4.3 là sơđồ mã hố tiêu biểu của JPEG.

Kỹ thuật nén ảnh JPEG cho phép sử dụng hoặc mành (field) hoặc ảnh (frame) như một

ảnh gốc. Nếu kỹ thuật nén dùng mành thì nén trong ảnh sẽ tạo ra hai ảnh trong mỗi ảnh truyền hình. Vì vậy, khi bàn về nén, thuật ngữ “ảnh” khơng luơn luơn đồng nghĩa với thuật ngữảnh trong lĩnh vực truyền hình.

Trước khi đưa vào chuyển đổi DCT, ảnh gốc phải được xử lý để nén dải tần tín hiệu hiệu màu và chia ảnh thành các block. Việc nén phổ tín hiệu hiệu màu làm giảm độ dư thừa tâm sinh lý. Kỹ thuật này dựa vào đặc trưng hệ thống thị giác của con người (HVS: human visual system). Mắt người kém nhậy với sự thay đổi tín hiệu màu hơn sự thay đổi tín hiệu

chĩi. Vì vậy, ta khơng cần thiết truyền đi thơng tin của tín hiệu màu với tần số như truyền thơng tin tín hiệu chĩi.

Nhưđã giới thiệu ở trên, theo khuyến cáo CCIR 601-2, cĩ rất nhiều phương pháp lấy mẫu thơng tin tín hiệu hiệu màu. Tỷ lệ lấy mẫu thơng dụng là 4:2:2 và 4:1:1. Định dạng 4:2:2 nghĩa là cứ 4 mẫu tín hiệu chĩi thì cĩ 2 mẫu cho mỗi loại tín hiệu hiệu màu. Nĩi cách khác, cứ 2 mẫu tín hiệu chĩi cĩ 1 mẫu tín hiệu hiệu màu. Định dạng 4:1:1 nghĩa là cứ 4 mẫu tín hiệu chĩi thì cĩ 1 mẫu cho mỗi loại tín hiệu hiệu màu. Giả sử tín hiệu hiệu màu chỉđược lấy mẫu theo chiều dọc và mỗi mẫu cĩ 8 bit, số bit trung bình trên một pixel theo tỷ lệ lấy mẫu 4:2:2 là 8×4/2, hay 16 bit/pixel. Theo tỷ lệ 4:1:1 là 8×6/4, 12bit/pixel. Kỹ thuật lấy mẫu tín hiệu hiệu màu được áp dụng cả hai chiều ngang và dọc. Dĩ nhiên, điều này làm giảm hơn nữa lượng thơng tin về tín hiệu hiệu màu.

Trước khi thực hiện biến đổi DCT, cảảnh được chia thành các khối lớn riêng biệt khơng chồng nhau (MB-Marco Block). Mỗi MB bao gồm 4 block các tín hiệu chĩi (Y) và 2,4 hoặc 8 block các mẫu tín hiệu hiệu màu (Cr,Cb). Số các block của tín hiệu hiệu màu phụ thuộc vào tiêu chuẩn lấy mẫu của tín hiệu video: 4:2:2, 4:1:1 hay 4:2:0 v.v.

Tất cả các block cĩ cùng kích thước và mỗi block là một ma trận điểm ảnh 8×8 pixel

được lấy từ một ảnh màn hình theo chiều từ trái sang phải, từ trên xuống dưới. Kích thước block là 8×8 được chọn bởi hai lý do sau:

a) Thứ nhất, qua việc nghiên cứu cho thấy hàm tương quan suy giảm rất nhanh khi khoảng cách giữa các pixel vượt quá 8.

b) Thứ hai, là sự tiện lợi cho việc tính tốn và thiết kế phần cứng. Nĩi chung, độ

phức tạp về tính tốn sẽ tăng nếu kích thước block tăng.

Ví dụ về việc chia thành các block của hình ảnh đối với hệ PAL. Phần tích cực của tín hiệu video với độ phân giải 576×720 sẽđược chia làm 72×90 block tín hiệu chĩi. Và như vậy sẽ cĩ 36×45 MB.

Cấu trúc của MB cũng phụ thuộc vào loại ảnh quét. Nếu quét liên tục thì các block bao gồm các mẫu từ các dịng liên tục (lúc này nén ảnh theo-frame). Ngược lại, trong trường hợp quét xen kẽ, trong một block chỉ cĩ các mẫu của một nửa ảnh (nén ảnh theo-mành). Tĩm lại, việc chia hình ảnh thành các ảnh con (block, MB) sẽ thực sự cĩ ý nghĩa cho bước chuyển vị

tiếp theo.

Mơ hình xử lý tín hiệu thoạ

Các phương pháp mã hố