TIÊU CHUẨN NÉN HÌNH ẢNH NHỊ PHÂN

Một phần của tài liệu tiểu luận xử lý ảnh số nén tổn hao (Trang 42 - 64)

Hai trong số các tiêu chuẩn nén hình ảnh được sử dụng rộng rãi nhất đó là CCTTT 3 và 4 tiêu chuẩn nén hình ảnh nhị phân. Mặc dù hiện tại họ đang sử dụng một loạt các ứng dụng máy tính, như fax (FAX) phương pháp để truyền các tài liệu qua mạng mã hóa điện thoại. Tiêu chuẩn nhóm 3 áp dụng một kỹ thuật mã hóa

của tiêu chuẩn nhóm 3 trong đó chỉ cho phép mã hóa 2-D. Cả hai đều sử dụng cùng một phương pháp tiếp cận. Phương pháp này là khá giống với mã hóa tương đối (RAC) kỹ thuật được mô tả trong mục 8.4.2.

Trong sự phát triển của các tiêu chuẩn thử nghiệm CCITT 8 các tài liệu đã được lựa chọn và sử dụng như một cơ sở cho việc đánh giá lựa chọn thay thế nén nhị phân khác nhau . Tập đoàn hiện có 3 và 4 tiêu chuẩn nén, trong đó bao gồm cả văn bản đánh máy và viết tay

( với nhiều ngôn ngữ ) cũng như một vài bản vẽ. Vì nhóm 3 và 4 tiêu chuẩn này được dựa trên kỹ thuật không thích ứng, tuy nhiên đôi khi dẫn đến việc mở rộng dữ liệu. Để khắc phục điều này và vấn đề liên quan . Tập đoàn hình ảnh (JBIG ) - một ủy ban hỗn hợp của CCITT và ISO - được đề xuất và đã thông qua một số tiêu chuẩn nén nhị phân khác. Chúng bao gồm JBIGl một số kỹ thuật nén thích hợp và nén nhị phân có sẵn hiện nay.

Nén một chiều

Trong CCITT nhóm phương pháp nén 1-D. Mỗi dòng của một hình ảnh được mã hóa từ mã chiều dài thay đổi và chạy đến máy quét từ trái sang phải của dòng. Có hai loại mã chính đó là. Nếu chiều dài chạy ít hơn 63, một mã chấm dứt từ mã phương pháp Hufman được sử dụng trong bảng 8.14. Nếu chạy dài lớn hơn 63 mã trang vị trí có thể vượt quá chiều dài chạy .

Bảng 8.15 được sử dụng kết hợp với một mã chấm dứt đại diện cho sự khác biệt giữa các mã và thời gian thực tế.

Tiêu chuẩn này yêu cầu mỗi dòng bắt đầu với một thời gian từ mã chạy dài, có thể trong thực tế là 00110101, mã trắng có độ dài bằng không.

chính hoặc thay đổi các yếu tố a0 , a1 , a2, b1 và b2.Một yếu tố thay đổi được định nghĩa là một vị trí ảnh có giá trị khác so với các vị trí ảnh trước đó trên cùng một

dòng. Yếu tố quan trọng nhất thay đổi là a0 (yếu tố tham khảo) được thiết lập ở vị

trí của một yếu tố thay đổi tưởng tượng màu trắng bên trái của các vị trí ảnh đầu tiên của mỗi dòng mã hóa mới hoặc xác định từ chế độ mã hóa trước đó. Sau khi

a0 được xác định là vị vị trí của các yếu tố thay đổi tiếp theo ở bên phải của a0

trên dòng mã hóa hiện tại .lúc này a2 được xem như các yếu tố thay đổi tiếp theo ở

bên phải của a0, b2 như các yếu tố thay đổi của giá trị đối diện (của a0) và bên

phải của (b1) và b2 là phần tử thay đổi tiếp theo ở bên phải của b1 trên đường

tham chiếu. Nếu một trong những yếu tố thay đổi không được phát hiện, chúng được đặt vào vị trí của một vị trí ảnh tưởng tượng ở bên phải của các vị trí ảnh cuối cùng trên dòng thích hợp. Hình 8.45 cung cấp hai hình ảnh minh họa của các mối quan hệ chung giữa các yếu tố thay đổi khác nhau.

tương ứng với các vị trí chi nhánh đầu tiên trong biểu đồ hình 8.44 ,ta so sánh vị

vị trí của b2. Thử nghiệm thứ hai tương ứng với các vị trí nhánh thứ hai trong

hình 8.44 tính toán khoảng cách (tính bằng vị trí ) giữa các địa vị trí của a1 và b1

và so sánh nó với 3. Tùy thuộc vào kết quả của các thử nghiệm này, một trong ba khối mã vạch của hình 8.44 đã được nhập và các thủ tục mã hóa thích hợp được thực hiện. Một yếu tố tham chiếu mới được thành lập sau đó theo biểu đồ để chuẩn bị cho phiên mã hóa tiếp theo .

Bảng 8.16 xác định mã số cụ thể có thể sử dụng cho một trong ba chế độ mã hóa. Trong chế độ vượt qua, trong đó đặc biệt không bao gồm các trường hợp b2 là trực tiếp trên a1 . chỉ có vượt qua chế độ mã từ 0001. Như hình 8.45 ( a) cho thấy chế độ này xác định màu trắng hoặc đen chạy đường tham chiếu mà không chồng chéo các mã chạy dòng màu trắng hoặc đen hiện tại. Trong chế độ mã hóa ngang ,

khoảng cách từ a0 đến a1 , a2 phải được mã hóa phù hợp và vị trí mã của bảng 8.14

và 8.15 và sau đó nối vào chế độ nằm ngang từ mã 001. Điều này được thể hiện

Ví dụ 8.27: Chế độ thẳng đứng CCITT ví dụ mã hóa.

Mặc dù hình 8.45 (b) được chú thích với các thông số cho cả hai chế độ mã hóa chiều ngang và dọc, điều kiện được mô tả trong thực tế là một trường hợp cho chế

độ thẳng đứng mã hóa. Đó là b2 ở bên phải của a1 (hoặc chế độ vượt qua) thử

nghiệm đầu tiên trong hình 8.44. Thử nghiệm thứ hai trong đó xác định xem chế độ mã hóa theo chiều dọc hoặc ngang được nhập vào, chỉ ra rằng chế độ thẳng

đứng mã hóa nên được sử dụng. Bởi vì khoảng cách từ a1 để b1 ít hơn 3. Theo

Bảng 8.16 từ mã thích hợp là 000.010. ngụ ý rằng a1 là hai vị trí ảnh còn lại. Để

chuẩn bị cho phiên mã hóa tiếp theo a0 được di chuyển đến vị trí của a1

BẢNG 8.16 CCITT bảng mã hai chiều

CCITT và ISO đã xác định một số tiêu chuẩn nén hình ảnh liên tục (như trái

ngược với nhị phân). Các tiêu chuẩn đó là trong giai đoạn khác nhau của quá trình giải quyết cả hai hình ảnh nén đơn sắc và đa sắc. Trái ngược với các tiêu chuẩn nén nhị phân được mô tả trong mục 8.6.1 tiêu chuẩn giai đoạn liên tục được chủ yếu dựa trên các tổn hao biến đổi kỹ thuật của phần mã hóa 8.5.2 và 8.5.3. Phát triển các tiêu chuẩn CCITT và các ủy ban ISO trưng cầu khuyến nghị thuật toán từ một số lượng lớn các công ty, trường đại học và phòng thí nghiệm nghiên cứu . Đã được lựa chọn tốt nhất của những người gửi đến trên cơ sở chất lượng hình ảnh và hiệu suất nén . Các tiêu chuẩn trong đó bao gồm các tiêu chuẩn ban đầu DCT dựa trên JPEG, tiêu chuẩn wavelet dựa trên JPEG 2000 đề xuất gần đây và các tiêu chuẩn JPEG - LS .

JPEG

Một trong những tiêu chuẩn nén liên tục phổ biến nhất và toàn diện là tiêu chuẩn JPEG. Nó xác định ba hệ thống mã hóa khác nhau :(1) một hệ thống tổn hao mã hóa cơ bản là dựa trên DCT là đủ cho hầu hết các ứng dụng nén. (2) Một hệ thống mã hóa mở rộng hơn, độ chính xác cao hơn và (3) một hệ thống mã hóa độc lập không tổn hao nén đảo ngược.

JPEG tương thích một sản phẩm hoặc hệ thống bao gồm hỗ trợ cho hệ thống đường cơ sở. Không có định dạng tập tin đặc biệt, độ phân giải không gian hoặc mô hình không gian màu được ghi rõ.

Trong các hệ thống cơ bản thường được gọi là hệ thống cơ sở liên tục, đầu vào và độ chính xác dữ liệu đầu ra được giới hạn 8 bit , trong khi lượng tử hóa DCT giá trị hạn chế 11 bit . Nén được thực hiện trong ba bước tuần tự là tính toán DCT, lượng tử hóa và thay đổi mã chiều dài. Đầu tiên hình ảnh được chia thành các khối ảnh kích thước 8X8 , được biến đổi từ trái sang phải, trên xuống dưới. Như mỗi khối 8X8 mức độ chuyển bằng cách trừ đi 2.Và 2 là mức màu xám tối đa

mã hóa sử dụng một mã chiều dài thay đổi xác định giá trị của hệ số và số lượng. Hệ số DC là sự khác biệt được mã hóa liên quan đến các hệ số DC. JPEG đề xuất mảng sáng lượng tử được đưa ra trong hình 8.37 ( b ) và có thể được mở rộng để cung cấp một loạt các mức độ nén . Mặc dù mặc định mã hóa bảng và mảng lượng tử đã được chứng minh được cung cấp cho cả hai độ sáng và biến đổi, người sử dụng tùy chỉnh lại bảng. Có thể trong thực tế thích nghi với các đặc tính của hình ảnh được nén.

Ví dụ 8.28: Cơ sở JPEG mã hóa và giải mã

Xem xét nén và sửa đổicủa 8x8 sau đây với các tiêu chuẩn JPEG đường cơ sở

Hình ảnh ban đầu có thể bao gồm 256 cấp độ màu xám. Vì vậy quá trình mã hóa bắt đầu bằng mức độ chuyển dịch các vị trí ảnh ban đầu bởi -128 mức màu xám, kết quả là

khi chuyển đổi phù hợp với DCT ,biểu thức (8.5-24) và (8.5-32) cho N = 8, trở thành.

Nếu JPEG đề xuất mảng bình thường hóa hình 8.37 (b) được sử dụng để lượng tử hóa các mảng chuyển đổi, với mục đích phù hợp với phương trình 8.5-40

Lưu ý rằng sự chuyển đổi và bình thường hóa quá trình sản xuất một số lượng lớn các hệ số không có giá trị . Khi các hệ số được sắp xếp lại phù hợp với mô hình của hình 8.36 ( d ). Trình tự hệ số 1- D kết quả là

[ -26 -3 1 -3-2-62-41 -41 1 50200-1 200000-1 -1 EOB ]

nơi biểu tượng EOB biểu thị tình trạng cuối cùng của khối . Phần còn lại của các hệ số trong một chuỗi sắp xếp là số 0.

Việc sửa các mã JPEG mặc định cho trình tự sắp xếp lại hệ số bắt đầu với việc tính toán sự khác biệt giữa các hệ số DC hiện tại và của mã hóa trước đó. Lấy từ hình . 8.23 và hệ số DC của biến đổi và lượng tử hóa ngay bên trái của nó là -17 . Sự khác biệt DPCM là [ -26 - ( -17 ) ] hoặc -9 . Trong DC khác biệt loại 4 của bảng 8.17 . Theo mặc định bảng 8.18 , mã cơ sở thích hợp cho một sự khác biệt loại 4 là 101(một mã 3 -bit) , trong khi tổng chiều dài " của một thể loại 4 hệ số hoàn toàn được mã hóa là 7 bit . Còn lại 4 bit phải được tạo ra từ các bit ít quan trọng nhất (LSBs ) của giá trị chênh lệch . Đối với một thể loại khác nhau DC nói chung (thể loại K ) , một bit K thêm là cần thiết và tính toán như một trong hai LSBs K của sự khác biệt tích cực hoặcK . LSBs của sự khác biệt tiêu cực trừ đi 1 đối với một sự khác biệt là -9 và hoàn thành mã DPCM đang DC từ là 1.010.110 .

Các hệ số AC khác 0 của mảng được sắp xếp lại được mã hóa tương tự từ bảng 8.17 và 8.19 . Sự khác biệt chính là mỗi AC mặc định phương pháp Hufman từ mã phụ thuộc vào số lượng các hệ số không có giá trị trước các hệ số khác 0 được mã hóa . cũng như tầm quan trọng của các hệ số khác 0. Do đó, đầu tiên hệ số AC khác 0 của

100101 11100110 110110 0110 11110100 000 1010

không gian đã được đưa vào chỉ để có thể đọc. Mặc dù nó không cần thiết trong ví dụ này, mã JPEG mặc định chứa từ một mã số đặc biệt cho một chuỗi 15 số không theo sau bởi một số 0 (trong bảng 8.19).

Tổng số bit trong mảng sắp xếp lại mã hóa hoàn toàn (và do đó số bit cần thiết để đại diện cho toàn bộ 8x8 là 8-bit ( của ví dụ này) là tỉ lệ nén là 92, với tỉ lệ 512/92. Để giải nén ảnh JPEG, các bộ giải mã đầu tiên phải tạo lại các hệ số biến đổi bình thường dẫn đến các dòng bit nén. Bởi vì phương pháp Hufman một chuỗi mã nhị phân là giải mã tức thời và duy nhất. Bước này có thể dễ dàng thực hiện bằng cách tra cứu bảng. Mảng tái sinh của hệ lượng tử

sau khi chọn bộ giải mã phù hợp với phương trình (8,5-42) mảng trở thành.

ở ví dụ này hệ số DC được tính như

Kết quả thu được bằng cách lấy nghịch đảo DC theo biểu thức (8.5-25) và (8.5-32) để có được.

và mức độ chuyển dịch mỗi vị trí ảnh chuyển ngược bởi 27 bit (hoặc 128) mang lại

Bất kỳ sự khác biệt giữa các dữ liệu góc và tái tạo là kết quả của tính chất suy hao của nén JPEG và quá trình giải nén. Trong ví dụ này các lỗi nằm trong khoảng từ -14 đến 11 và được phân phối như sau:

Dữ liệu góc trung bình lỗi vuông của nén tổng thể và quá trình sửa đổi là khoảng 5.9 mức màu xám.

Các tái tạo trong ví dụ trên là vào vị trí khoảng trung tâm của mắt phải của người phụ nữ trong hình 8.38 (a). Lưu ý rằng cả ban đầu và kết quả tái tạo chứa một đỉnh cao trong cấp màu xám ở hàng thứ tư và cột thứ năm, nơi mà ánh sáng được phản ánh của người phụ nữ. Điều này gây ra lỗi góc hình vuông của tái tạo vượt quá đáng kể các lỗi tổng thể của hình ảnh giải nén hoàn toàn. Vì lý do là nhiều hình ảnh ban

đầu là gần như không đổi và có thể biểu diễn với rất ít biến dạng. Hình 8.38 (b) cung cấp một kết quả JPEG nén cơ sở.

JPEG 2000

Mặc dù chưa được thông qua chính thức. JPEG 2000 mở rộng tiêu chuẩn JPEG ban đầu để cung cấp sự linh hoạt trong cả hai giai đoạn nén hình ảnh liên tục và truy cập vào các dữ liệu nén.

Ví dụ các phần của JPEG 2000 hình ảnh nén có thể khai thác truyền lại và chỉnh sửa. Tiêu chuẩn này dựa trên các kỹ thuật mã hóa wavelet mục 8.5.3. Hệ số lượng tử là thích nghi với quy mô và các hệ số được lượng tử số học được mã hóa trên cơ sở bit (xem Phần 8.4). Sử dụng một hình ảnh được mã hóa của các tiêu chuẩn như sau (theo tiêu chuẩn ISO / IEC [2000]).

Bước đầu tiên của quá trình giải mã là mức chuyển các mẫu DC của hình ảnh dấu S siz-bit được mã hóa bằng cách trừ .Nếu hình ảnh có nhiều hơn một thành phần , mỗi thành phần được chuyển riêng. Nếu có đúng ba thành phần, ta có thể được tùy chọn bộ giải mã sử dụng một sự kết hợp tuyến tính đảo ngược hoặc không lọc được các thành phần. Các thành phần không thể đảo, biến đổi ngược của các tiêu chuẩn, ví dụ

Ở đây I0. I1 và I2 là những thành phần cấp độ dịch chuyển đầu vào, Y0. Y1 và Y2 .

là những thành phần bóc tách tương ứng. Mục đích của việc chuyển đổi là để nâng

cao hiệu quả nén. Các thành phần chuyển Y1 và Y2 là những hình ảnh khác biệt có

biểu đồ rất cao, lên đến đỉnh vị trí xung quanh .

rộng quy mô và hệ số wavelet (Le Gall and Tabatabai [1988]). Một thủ tục làm tròn được định nghĩa cho hệ số biến đổi có giá trị không nguyên. Trong các ứng dụng tổn hao, 9-7 hệ số wavelet nhân rộng (Antonini Barlaud Mathieu và Daubechies [1992]) được sử dụng. Trong cả hai trường hợp, biến đổi được tính bằng cách sử dụng

wavelet nhanh chóng chuyển đổi mục 7.4 hoặc thông qua một phương pháp tiếp cận dựa trên (Mallat [1999]). Các hệ số cần thiết để sửa FWT lọc 9-7 phân tích được đưa ra trong Bảng 8.20.

Ở đây X là thành phần tấm được chuyển đổi. Y là kết quả biến đổi. I0 và I1 xác định

vị trí của các thành phần tấm trong một thành phần. Biến n giả định giá trị dựa trên

I0. I1 và một trong sáu hoạt động đang được hình thành. Nếu n < i0 hoặc n> i1. X {n) thu được bằng cách đối xứng mở rộng X.

Ví dụ. X (i0-l) = X (i0 + l). X (i0 - 2) =X (i0 +2). X (i1) = X (i1 - 2) và X (i1 +l) = X

(i1-3).

Việc chuyển đổi chỉ được mô tả sản xuất bốn băng con tương đương độ phân giải thấp của các thành phần và tấm ngang, dọc, chéo và đặc tính tần số của thành phần.

Việc chuyển đổi lặp đi lặp lại NL lần. Quy mô liền kề có liên quan về mặt không

Một phần của tài liệu tiểu luận xử lý ảnh số nén tổn hao (Trang 42 - 64)