Mã hóa phân đoạn mặt phẳng bit (Fractional bit plane coding)

Một phần của tài liệu tìm hiểu mô hình nén ảnh sử dụng biến đổi wavelet (Trang 59 - 68)

Các hệ số lƣợng tử hoá trong một khối mã đƣợc mã hóa mặt phẳng bit

độc lập của các khối mã khác trong băng con. Thay vì mã hóa toàn bộ các mặt phẳng bit trong một bƣớc, mỗi mặt phẳng bit đƣợc mã hóa trong ba bƣớc mặt

phẳng bit con, gọi là mã hóa phân đoạn mặt phẳng bit (fractional bit plane

coding). Lý do là để có thể cắt xén dòng bit vào cuối mỗi bƣớc là tạo ra một dòng bit gần tối ƣu. Điều này cũng đƣợc biết đến nhƣ bổ sung tỷ lệ nén biến dạng (post compression rate distortion - PCRD) tối ƣu hoá . Ở đây, kết quả bƣớc đó trong việc giảm lớn nhất trong biến dạng tăng nhỏ nhất cho tốc độ bit đƣợc mã hoá đầu tiên.

Mục đích và lợi ích của việc mã hoá phân đoạn mặt phẳng bit có thể

đƣợc hiểu với sự hỗ trợ của hình 3.8. Giả sử (R1, D1) và (R2, D2) có tỷ lệ biến dạng tƣơng ứng với hai cặp mặt phẳng bit kề p1p2. Ngoài ra, giả sử trong mã hóa của từng bƣớc đó tăng tốc độ bit và giảm biến dạng theo các đặc điểm nhận dạng bởi nhãn A, B và C. Nhƣ chúng ta thấy, trong mã hóa toàn bộ mặt phẳng bit, đó là đi từ điểm X1 đến điểm X2, bất kể đó là theo con đƣờng, tỷ lệ bit cuối cùng là tăng từ R1 đến R2, và biến dạng đƣợc giảm từ D1 đến D2. Nhƣng nếu do sự giới hạn trong ngăn sách tỷ lệ bit, tỷ lệ bit đã đƣợc rút ngắn giữa R1 và R2, R1 ≤ R ≤ R2, sau đó nó đƣợc tốt hơn để đi vào thực hiện theo các trình tự ABC chứ không phải là CBA.

51

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Hình 3.8. Tác động của thứ tự mã hoá phân đoạn mặt phẳng bit trong giảm biến dạng

Sắp xếp mã hoá phân đoạn mặt phẳng bit là một phƣơng pháp tối ƣu hoá tỷ lệ biến dạng các đƣờng cong trong thực tế, với mục đích tạo ra một dòng bit nhúng trơn (mịn), đƣợc gọi là bổ sung tỷ lệ nén biến dạng (PCRD) tối ƣu hoá trong EBCOT. Hình 3.9 so sánh tỷ lệ biến dạng tối ƣu biến dạng

đƣợc kết hợp với mã hóa mặt phẳng bit versus so mã hóa mặt phẳng bit thông

thƣờng. Những dấu chấm liền nét biểu diễn cho các cặp tỷ lệ biến dạng ở cuối mỗi mặt phẳng bit, và dòng đƣờng liền nét là tỷ lệ biến dạng cong mà ta có thể mong đợi để có đƣợc bằng cách cắt bỏ dòng bit sinh ra bằng phƣơng pháp này với một tốc độ bit tùy ý. Mặt khác, các điểm kết thúc liên kết với nhau qua các mã hoá phân đoạn mặt phẳng bit đƣợc hiển thị với hình tròn trắng và dòng nét đứt minh hoạ đƣờng cong tỷ lệ biến dạng của nó. Vì rằng mã hóa bƣớc ban đầu thƣờng có tỷ lệ biến dạng độ dốc sƣờn dốc hơn (steeper rate distortion slopes), điểm kết thúc cho từng bƣớc mã nằm dƣới phép nội suy lồi của điểm cuối. Vì vậy, kết quả mã hóa phân đoạn mặt phẳng bit trong một hiệu suất mã hóa gần tối ƣu so với mã hóa mặt phẳng bit đơn.

52

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Hình 3.9. Tỷ lệ biến dạng với phân đoạn tối ƣu

Nói chung, trong mã hóa một hệ số giảm lớn nhất trong biến dạng xảy ra khi hệ số này là không đáng kể, nhƣng nó là nhiều khả năng trở thành quan trọng (đáng kể) trong mã hóa. Giảm biến dạng vừa phải khi đã là hệ số quan trọng và mã hóa làm mịn nó. Cuối cùng, giảm ít nhất là trong biến dạng là khi các hệ số không đáng kể sau khi mã hóa có khả năng vẫn không đáng kể. Đây là trong thực tế, các hệ số còn lại không mã hóa trong hai trƣờng hợp trƣớc đây. Vì vậy nó là hợp lý để phân chia mặt phẳng bit mã hóa thành ba bƣớc, và mã hóa từng bƣớc theo thứ tự mã trên. Trong JPEG2000, phân đoạn mặt phẳng bit đƣợc thực hiện trong ba bƣớc. Vai trò của từng bƣớc mã hoá, và thứ tự của chúng có tầm quan trọng trong việc tạo một dòng bit tối ƣu, đƣợc đƣa ra dƣới đây.

3.5.3.1. Bước lan truyền quan trọng (Significance propagation pass)

Đây là bƣớc đầu tiên của mã hóa phân đoạn mặt phẳng bit cho rằng việc giảm lớn nhất trong mã hóa biến dạng. Trong bƣớc này, các bit của một hệ số trong một mặt phẳng bit đƣợc mã hoá khi và chỉ khi trƣớc bƣớc này, trạng thái hệ số đã đƣợc không đáng kể, nhƣng ít nhất một trong tám lân cận

53

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

tức thời của nó đã có các trạng thái quan trọng. Nếu hệ số nào sẽ đƣợc mã hoá, độ lớn của các bit của nó, 0 hay 1, là mã hoá số học với một mô hình xác suất xuất phát từ bối cảnh tám lân cận tức thời của nó, thể hiện trong hình 3.6. Xác suất đƣợc chỉ định cho bit 0 là bổ sung cho các xác suất đƣợc chỉ định cho bit 1. Việc lựa chọn bối cảnh là dựa trên ý nghĩa của của mẫu tám lân cận tức thời, đƣợc nhóm lại trong ba loại.

                1 1 i( , ) ( , ) d : ChÐo ) 1 , ( ) 1 , ( ) , ( : Däc ) , 1 ( ) , 1 ( ) , ( : Ngang m n i i i i i i i n v m u v u v u v u v u v v u v u v u h      (3.9)

Trong đó hi(u, v), vi(u, v)di(u, v) là lân cận ngang, dọc và chéo, cho i

hệ số tại tọa độ (u, v), và σi(u, v) là trạng thái quan trọng (ý nghĩa) của một hệ số tại các tọa độ này. Lân cận mà nằm ngoài khối mã đƣợc hiểu là không đáng kể với mục đích xây dựng ba đại lƣợng. Để tối ƣu hoá cả giá trị mô hình thích nghi phức tạp và độ phức tạp thực hiện, cấu hình 256 khu vực lân cận có thể đƣợc ánh xạ tới chín bối cảnh riêng biệt mã hóa dựa trên (3.9), nhƣ thể hiện trong bảng 3.1.

Bảng 3.1. Phân công chín bối cảnh dựa trên ý nghĩa khu vực lân cận

LL, LH and HL bands HH band

HH band vi(u, v) di(u, v) context di(u, v) hi(u, v) + vi(u, v) context

0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 >1 2 0 >1 2 0 1 X 3 1 0 3 0 2 X 4 1 1 4 1 0 0 5 1 >1 5 1 0 >0 6 2 0 6 1 >0 X 7 2 >0 7 2 X X 8 >2 X 8

54

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Để thực hiện chuyển nhƣợng bối cảnh đồng nhất cho băng tần LH và HL, các khối mã của băng con HL đƣợc chuyển vị trƣớc khi mã hóa. Các băng con LH đáp ứng mạnh mẽ nhất để cạnh ngang trong ảnh gốc, do đó, lập ánh xạ bối cảnh cho sự nhấn mạnh nhiều hơn về lân cận ngang.

Lƣu ý rằng bƣớc lan truyền quan trọng bao gồm những bit của hệ số đó là không đáng kể trƣớc bƣớc này và có một bối cảnh khác không. Nếu bit của các hệ số là 1 (hệ số trở nên quan trọng cho lần đầu tiên), sau đó trạng thái quan trọng, σ, đƣợc thay đổi thành 1, để ảnh hƣởng đến bối cảnh của lân cận theo sau của nó. Vì vậy, trạng thái lan truyền quan trọng trong cả hệ số mã hóa, và vì thế mà có tên đặt cho bƣớc này là bƣớc lan truyền quan trọng. Cũng lƣu ý rằng nếu một mẫu có vị trí ranh giới của một khối, sau đó chỉ là lân cận tức thời có đƣợc coi là trạng thái quan trọng của lân cận khuyết (missing neighbours) là bằng không.

Cuối cùng, nếu một hệ số đƣợc tìm thấy là quan trọng, dấu của nó cũng là mã hoá số học. Vì rằng bit dấu từ các mẫu kế cận biểu hiện thực chất thống kê phụ thuộc, chúng có thể đƣợc khai thác có hiệu quả để nâng mã hóa cao số học hiệu quả. Ví dụ, các hệ số Wavelet của các cạnh ngang và dọc có nhiều khả năng đƣợc trong cùng một phân cực. Những phần sau và trƣớc cạnh chủ yếu là các cực đối diện. Trong thuật toán EBCOT, các mã số học của một bit dấu sử dụng năm bối cảnh. Bối cảnh đƣợc thiết kế dựa trên mẫu tức thời có liên quan của lân cận ngang và dọc, mỗi lân cận có thể đƣợc ở một trong ba trạng thái: quan trọng và dấu dƣơng, quan trọng và dấu âm, không quan trọng. Có 34

= 81 cấu hình khu vực lân cận duy nhất. Các chi tiết của các cấu hình đối xứng và xấp xỉ ánh xạ từ 81 cấu hình đến một trong năm cấp độ bối cảnh có thể đƣợc tìm thấy.

55

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 3.5.3.2. Độ lớn bước làm mịn (Magnitude refinement pass)

Độ lớn bƣớc làm mịn là bƣớc mã hóa hiệu quả thứ hai. Trong toàn bộ

bƣớc, độ lớn các bit của một hệ số đó đã trở thành quan trọng trƣớc một mặt phẳng bit đƣợc mã hoá số học. Độ lớn bƣớc làm mịn bao gồm các bit từ các hệ số đó đã đƣợc quan trọng, ngoại trừ những bit chỉ trở thành quan trọng trong tức thời ngay trƣớc bƣớc lan truyền quan trọng. Có ba bối cảnh cho mã hoá số học, đƣợc xuất phát từ tổng kết trạng thái quan trọng của lân cận ngang, dọc và chéo. Đây là những trạng thái nhƣ hiện thời đƣợc biết để giải mã và các trạng thái này không đƣợc sử dụng trƣớc bƣớc giải mã quan trọng. Hơn nữa, nó phụ thuộc vào bit làm mịn đầu tiên (bit ngay sau bit quan trọng và bit dấu) đƣợc hay không.

Nói chung, các bit làm mịn có một sự phân bố đồng đều, trừ khi các hệ số là chỉ trở thành quan trọng trƣớc trong mặt phẳng bit (tức là độ lớn bit để đƣợc mã hoá là bit làm mịn đầu tiên). Đây là điều kiện đầu tiên đƣợc thử nghiệm, và nếu nó đƣợc thoả mãn, các bit, độ lớn bit đƣợc mã hóa bằng cách sử dụng hai bối cảnh, dựa trên ý nghĩa của tám lân cận tức thời (xem hình 3.6). Nếu không, nó đƣợc mã hóa với một bối cảnh duy nhất không phụ thuộc vào các giá trị lân cận.

3.5.3.3. Bước làm sạch (Clean up pass)

Tất cả các bit không mã hóa trong bƣớc lan truyền quan trọng và làm mịn đƣợc mã hoá trong bƣớc làm sạch. Đó là hệ số là không quan trọng và bối cảnh có giá trị không (không có tám lân cận tức thời đã đƣợc quan trọng) trong bƣớc lan truyền quan trọng. Nói chung, các hệ số mã hóa trong bƣớc này có xác suất rất nhỏ đang đƣợc quan trọng và vì thế dự kiến sẽ vẫn không quan trọng. Thành ra, một chế độ đặc biệt, gọi là chế độ thực hiện (run mode), đƣợc sử dụng để gộp chung hệ số không quan trọng còn lại . Một chế độ thực hiện đƣợc nhập nếu tất cả bốn mẫu trong một cột dọc của dải trong hình 3.7

56

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

có lân cận không quan trọng. Cụ thể, chế độ thực hiện đƣợc chạy khi từng điều kiện sau nắm giữ:

- Tất cả bốn mẫu liên tiếp phải là không quan trọng, tức là

σi(u+m,v)=0, với 0 ≤ m ≤ 3

- Các mẫu phải có lân cận không quan trọng, nghĩa là

hi(u+m,v)=vi(u+m,v) = di(u + m, v) = 0, với 0 ≤ m ≤ 3

- Mẫu phải thƣờng trú trong cùng một khối con.

- Chỉ số ngang của mẫu đầu tiên, u, phải đƣợc làm bằng.

Trong chế độ thực hiện một ký hiệu nhị phân là mã hoá số học với một bối cảnh đơn để xác định xem tất cả bốn mẫu trong cột dọc vẫn không quan trọng. Ký hiệu 0 có nghĩa rằng tất cả bốn mẫu là không quan trọng và ký hiệu 1 có nghĩa rằng ít nhất một trong bốn mẫu trở nên quan trọng trong mặt phẳng bit hiện hành. Nếu ký hiệu là 1, sau đó thêm hai bit mã hóa số học đƣợc sử dụng để xác định vị trí của hệ số đầu tiên khác 0 trong cột dọc.

Vì có khả năng rằng bất kỳ một trong bốn mẫu trong cột là mẫu khác 0 đầu tiên, sau đó là mã số học sử dụng một bối cảnh thống nhất. Vì vậy, chế độ thực hiện có một vai trò không đáng kể trong hiệu quả mã hóa. Nó là chủ yếu đƣợc sử dụng để cải thiện thông qua các bộ mã hóa số học thông qua các ký hiệu phép gộp (symbol aggregation).

Sau khi xác định vị trí của các ký hiệu khác 0 đầu tiên trong thực hiện, các mẫu còn lại trong cột dọc đƣợc mã hoá theo cách thức tƣơng tự nhƣ trong việc bƣớc lan truyền quan trọng và sử dụng cùng chín bối cảnh. Tƣơng tự, nếu ít nhất một trong bốn hệ số trong cột dọc có một lân cận quan trọng, chế độ thực hiện bị tắt và tất cả các hệ số trong cột đó một lần nữa đƣợc mã hoá với các thủ tục đƣợc sử dụng cho bƣớc lan truyền quan trọng.

Đối với mỗi khối mã, số lƣợng MSB của mặt phẳng là 0 hoàn toàn có báo hiệu trong dòng bit (entirely zero is signalled in the bit stream). Từ đó

57

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

trạng thái quan trọng của tất cả các hệ số trong MSB khác 0 đầu tiên là 0, mặt phẳng này chỉ sử dụng bƣớc làm sạch và hai bƣớc khác không đƣợc sử dụng.

Ví dụ

Làm thế nào để hiển thị các hệ số Wavelet trong một mặt phẳng bit phân đoạn đƣợc mã hoá. Hình 3.10 minh họa một biểu diễn đồ họa của mã hóa từng nấc từ mặt phẳng bit đến mặt phẳng bit và từ bƣớc đến bƣớc.

Hình 3.10. Một minh hoạ của mã hóa phân đoạn mặt phẳng bit

Hình ảnh Barbara có kích thƣớc 256 x 256 điểm ảnh với hai cấp của phân giải Wavelet tạo ra bảy ảnh con (subimages), nhƣ trong hình 3.10. Ngoại trừ các băng tần thấp nhất, độ lớn của tất cả các băng tần khác đƣợc phóng đại do một trong bốn hệ số, để minh họa tốt hơn các chi tiết hình ảnh. Kích thƣớc

58

Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

khối mã đƣợc giả định là một mảng vuông 64 x 64 hệ số. Do đó, mỗi băng tần cao LH1, HL1 và HH1 đƣợc mã hóa trong bốn khối mã, và các băng tần còn lại của LL2, LH2, HL2 và HH2 mã từng khối một. Tức là, toàn bộ ảnh đƣợc mã hoá trong 16 khối mã. Dòng bit tạo ra bởi mỗi bƣớc trong mọi mặt phẳng ảnh cũng đƣợc thể hiện trong các hộp vuông với kết cấu khác nhau.

Trƣớc khi bắt đầu mã hóa, trạng thái quan trọng của tất cả các khối mã

đƣợc khởi tạo bằng 0. Đối với mỗi khối mã mã hóa bắt đầu từ mặt phẳng bit quan trọng nhất. Từ đó băng tần LL2 có một năng lƣợng cao hơn (hệ số Wavelet lớn hơn) so với các băng tần khác, trong ví dụ này chỉ có một số MSB của khối mã của băng tần này là rất lớn ở mặt phẳng bit đầu tiên đƣợc lấy mẫu, PB1. Trong các mặt phẳng bit của MSB không có khối mã khác là quan trọng (chúng là hoàn toàn bằng không), và không có mã nào cả.

Từ đó khối mã của băng tần LL2 trong BP1 đƣợc mã hoá cho lần đầu

tiên (các trạng thái quan trọng của tất cả các hệ số đƣợc khởi tạo bằng không), sau đó là bit MSB của mỗi hệ số có một lân cận không quan trọng và do đó không thể đƣợc mã hoá tại bƣớc lan truyền quan trọng. Ngoài ra, không ai trong số các bit đƣợc mã hoá tại bƣớc làm mịn, bởi vì các hệ số đã không đƣợc mã hoá trong mặt phẳng bit trƣớc đó. Vì vậy, tất cả các bit phía trái đƣợc mã hoá trong bƣớc làm sạch, và chúng tạo thành các dòng bit của bƣớc này.

Tại mặt phẳng thứ hai, BP2, một vài hệ số trong khối mã HL2 và HH2

trở nên quan trọng cho lần đầu tiên. Do đó, nhƣ đã đƣợc giải thích trƣớc đó, chúng đƣợc mã hoá chỉ ở bƣớc làm sạch, nhƣ trong hình này. Đối với khối mã của LL2, vì rằng hệ số với độ lớn quan trọng của khối mã này đã đƣợc mã hoá tại bƣớc làm sạch của BP1, khối sử dụng tất cả ba bƣớc. Những hệ số của mặt

Một phần của tài liệu tìm hiểu mô hình nén ảnh sử dụng biến đổi wavelet (Trang 59 - 68)

Tải bản đầy đủ (PDF)

(75 trang)