Một kỹ thuật hiệu quả để giảm interpixel dư thừa của hình ảnh là quá trình mã hóa bit plane của hình ảnh cá nhân Kỹ thuật này được gọi là mã hóa bit - plane, được dựa trên khái niệm về phân hủy một hình ảnh đa cấp ( đơn sắc hoặc màu ) vào một loạt các hình ảnh nhị phân và nén mỗi hình ảnh nhị phân thông qua một trong những phương pháp nén nhị phân nổi tiếng . Trong phần này, chúng tôi mô tả các phương pháp phân hủy phổ biến nhất và xem xét một số các phương pháp nén thường được sử dụng .
Phân hủy Bit-plane
Mức xám của một m-bit hình ảnh màu xám quy mô có thể được biểu diễn dưới dạng của các cơ sở 2 đa thức:
Dựa trên tính năng này, một phương pháp đơn giản để phân hủy hình ảnh vào một bộ các hình ảnh nhị phân là để tách các hệ số m của đa thức thành m 1-bit bit plane . Như đã nêu trong Chương 3.Bit plan thứ không được tạo ra
bằng cách thu a0 bit của mỗi điểm ảnh , trong khi bitplane thứ ( m - 1 ) chứa am-1 bit hoặc hệ số, Nhìn chung , mỗi bit plane được đánh số từ 0 đến m - 1 và được xây dựng bằng thiết lập pixel của nó bằng với giá trị của các bit thích hợp hoặc hệ số đa thức từ mỗi điểm ảnh m hình ảnh ban đầu . nhược điểm cố hữu của phương pháp này là những thay đổi nhỏ trong mức độ màu xám có thể có một tác động đáng kể đến sự phức tạp của những chiếc máy bay chút . Nếu một pixel của cường độ 127 ( 01111111 ) tiếp giáp với một điểm ảnh của cường độ 128 ( 10000000 ) , ví dụ, tất cả các bit plane sẽ có một
chuyển đổi tương ứng 0-1 ( hoặc 1-0 ). Ví dụ , như các bit quan trọng nhất của hai mã nhị phân cho 127 và 128 là khác nhau, máy bay bit 7 sẽ có một điểm ảnh không có giá trị bên cạnh một điểm ảnh có giá trị 1 , tạo ra một quá trình chuyển đổi 0-1 ( hoặc 1-0 ) tại điểm đó .
Một cách tiếp cận phân hủy thay thế ( làm giảm tác động biến đổi mức xám có giá trị nhỏ) là đầu tiên biểu diễn hình ảnh bằng một mức màu xám m-bit . M- bit mã màu xám gm-1…g2g1g0 tương ứng với đa thức trong phương trình . ( 8,4-2 ) có thể được tính từ
Đây biểu thị phép OR loại trừ. Mã này có đặc tính duy nhất mà từ mã khác nhau trong chỉ có trong vị trí một bít.Nhưng , những thay đổi nhỏ trong mức độ màu xám là ít có khả năng ảnh hưởng đến tất cả các bit plane m . Ví dụ, khi mức độ xám 127 và 128 liền kề , chỉ có bit plane 7 sẽ có một quá trình chuyển đổi 0-1 , bởi vì các mã màu xám tương ứng với 127 và 128 là 11.000.000 và 01.000.000 , tương ứng .
Các hình ảnh 1024 X 1024 thể hiện trong hình 8.14 ( a) và (b) được sử dụng để minh họa các kỹ thuật nén được mô tả trong phần còn lại của phần này . 8 -bit hình ảnh đơn sắc của một đứa trẻ được tạo ra với một máy ảnh CCD độ phân giải cao . Hình ảnh nhị phân của một hành động bảo hành của Tổng thống Andrew Jackson chuẩn bị vào năm 1796 được sản xuất trên một máy quét tài liệu phẳng. Hình 8.15 và 8.16 cho thấy nhị phân tám mã bit-plane của hình ảnh của đứa trẻ
Lưu ý rằng những bit plane bậc cao là ít phức tạp hơn so với thứ tự thấp của chúng . Có nghĩa là, chúng có khu vực thống nhất lớn của các chi tiết ít hơn đáng kể , sự bận rộn , hoặc ngẫu nhiên . Ngoài ra, những bit plane màu xám mã ít phức tạp hơn so với những bit plane nhị phân tương ứng.
Khu vực mã hóa hằng số
Một phương pháp đơn giản nhưng hiệu quả của quá trình nén hình ảnh nhị phân hoặc bit plane là sử dụng các từ mã đặc biệt để xác định khu vực rộng lớn tiếp giáp l's hoặc 0’s. Trong một cách tiếp cận như vậy , được gọi là mã hóa khu vực hằng số (CAC ) , hình ảnh được chia thành các khối có kích thước p ×q điểm ảnh, được phân loại như tất cả các màu trắng , tất cả các màu đen, hoặc hỗn hợp cố ý dạng sinh . Các thể loại có thể xảy ra nhất hoặc thường xuyên xảy ra sau đó được giao từ mã bít 0, và hai 2 -bit loại khác được giao mã số 10 và 11. Nén được thực hiện vì các bit pq mà thông thường sẽ được sử dụng để đại diện cho mỗi khu vực liên tục được thay thế bằng một 1- bit hoặc 2 -bit từ mã. Tất nhiên, các mã bổ nhiệm vào ngạch cường độ hỗn hợp được sử dụng như một tiền tố, tiếp theo là mô hình PQ -bit của khối.
Khi một vùng ảnh chủ yếu là màu trắng đang được nén , một cách tiếp cận hơi đơn giản là mã vùng màu trắng như 0 và tất cả các khối khác (bao gồm cả các khối màu đen ) bằng 1 tuân theo là mẫu bit của khối. Cách tiếp cận này , được gọi là khối màu trắng bỏ qua ( WBS ) , lợi dụng những khuynh hướng cấu trúc dự kiến của hình ảnh được nén. Như vài khu vực đen rắn dự kiến , bị ghép chung với các vùng cường độ hỗn hợp , cho phép một từ mã 1-bit được sử dụng cho các khối màu trắng rất có thể xảy ra . Một sự thay đổi đặc biệt hiệu quả của phương pháp này ( với các khối có kích thước 1 X q ) là mã dòng màu trắng như 0 và tất cả các dòng khác với 1 tiếp theo là WBS chuỗi mã bình thường . Một cách khác là sử dụng một phương pháp tiếp cận trong đó hình ảnh nhị phân hoặc máy bay hơi bị phân hủy thành khối con liên tục lặp đi lặp lại nhỏ hơn và nhỏ hơn . Cho khối 2-D , một hình ảnh chất rắn màu trắng được mã hoá là 0 , và tất cả các hình ảnh khác được chia thành những khối con được giao một tiền tố của 1 và mã hoá tương tự. Có nghĩa là, nếu một khối con là màu trắng, nó được đại diện bởi các tiền tố 1 , chỉ ra rằng nó là một subblock lặp đầu tiên , theo sau là một 0 , chỉ ra rằng nó là chất rắn màu trắng . Nếu khối con không phải là màu trắng , quá trình phân hủy được lặp đi lặp lại cho đến khi một kích thước khối con được xác định trước là đạt và mã hóa như hoặc là 0 ( nếu đó là tất cả màu trắng ) hoặc 1 tiếp theo là mẫu bit khối .
Mã hóa chạy theo chiều dài
Một sự thay thế hiệu quả để mã hóa khu vực liên tục là đại diện cho mỗi hàng của một hình ảnh hoặc bit plane của một chuỗi có độ dài mô tả chạy tiếp của các điểm ảnh màu đen và trắng . Kỹ thuật này , được gọi là chạy dài mã hóa, được phát triển trong những năm 1950 và đã trở thành , cùng với phần mở rộng 2-D của nó, là phương pháp nén tiêu chuẩn trong mã hóa bản fax ( FAX ). Các khái niệm cơ bản là mã mỗi nhóm tiếp giáp từ
0’s hoặc l's gặp phải trong một trái sang phải quét một hàng theo chiều dài của nó và thiết lập một quy ước để xác định giá trị chạy. Các phương pháp phổ biến nhất để xác định giá trị của một hoạt động là: (1 ) để xác định giá trị của thời gian đầu tiên của mỗi hàng, hoặc (2) cho rằng mỗi hàng bắt đầu với một hoạt động trắng , có chiều dài chạy có thể trong thực tế có thể không.
Mặc dù sản lượng, độ mã hóa trong chính nó là một phương pháp hiệu quả năng nén hình ảnh (xem ví dụ trong mục 8.1.2 ) , nén bổ sung thường có thể được thực hiện bằng chiều dài thay đổi mã hóa chiều dài chạy tự . Trong thực tế , độ dài chạy màu đen và trắng có thể được mã hóa độc lập sử dụng mã chiều dài thay đổi được thiết kế đặc biệt để thống kê riêng của họ. Ví dụ , để biểu tượng một } đại diện cho một hoạt động đen dài / , chúng ta có thể ước tính xác suất mà một biểu tượng được phát ra bởi một màu đen nguồn chạy dài tưởng tượng bằng cách chia số có độ dài chạy màu đen có độ dài j trong toàn bộ hình ảnh của tổng số chạy đen . Ước tính entropy của nguồn chạy dài đen này , ký hiệu H0 sau bằng cách thay thế các xác suất vào phương trình . ( 8,3-3 ) . Một lập luận tương tự như giữ cho entropy của chạy trắng , ký hiệu H1 . Các ước tính entropy của hình ảnh là
Nơi mà các biến L0 và L1 là giá trị trung bình của độ dài chạy màu đen và trắng , tương ứng . Phương trình ( 8,4-4 ) cung cấp một ước tính số trung bình của các bit cho mỗi điểm ảnh cần thiết để mã dài chạy trong một hình ảnh nhị phân sử dụng một mã chiều dài thay đổi .
Mã hóa chạy theo chiều dài 2 chiều:
Khái niệm một chiều chạy dài mã hóa được dễ dàng mở rộng để tạo ra nhiều loại 2-D mã hóa các thủ tục . Một trong những kết quả tốt hơn được gọi là địa chỉ mã hóa tương đối ( RAC) , mà là dựa trên nguyên tắc theo dõi quá trình chuyển đổi nhị phân bắt đầu và kết thúc mỗi lần chạy màu đen và trắng . Hình 8.17 (a ) minh họa một thực hiện phương pháp này. Lưu ý rằng ec là khoảng cách từ quá trình chuyển đổi hiện tại c để quá trình chuyển đổi cuối cùng của dòng hiện tại e , trong khi cc ' là khoảng cách từ c để là người đầu tiên tương tự ( trong cùng một hướng ) chuyển tiếp qua e , ký hiệu là c’ trên các dòng trước đó . Nếu ec < cc’, RAC mã hóa khoảng cách d được thiết lập bằng ec và được sử dụng để đại diện cho quá trình chuyển đổi hiện tại c . Nhưng nếu cc ' < ec , d được thiết lập bằng cc '
Như mã hóa chạy theo chiều dài, địa chỉ tương đối mã hóa đòi hỏi phải áp dụng một quy ước để xác định giá trị chạy . Ngoài ra, quá trình chuyển đổi tưởng tượng ở đầu và cuối mỗi dòng , cũng như một dòng bắt đầu tưởng tượng (nói, một dòng toàn màu trắng ) , phải được giả định cho rằng ranh giới hình ảnh có thể được xử lý đúng cách . Cuối cùng, vì sự phân bố xác suất của các khoảng cách RAC của hầu hết các hình ảnh không thống nhất trong thực tế (xem mục 8.3.1 ) , bước cuối cùng của quá trình RAC là mã khoảng cách RAC chọn (có nghĩa là , ngắn nhất ) và khoảng cách của nó , d bằng cách sử dụng một mã chiều dài thay đổi phù hợp . Như hình . 8 17 ( b ) cho thấy, một mã tương tự như một Brcode có thể được sử dụng . Khoảng cách nhỏ nhất được giao từ mã ngắn nhất, và tất cả các khoảng cách khác được mã hóa bằng cách sử dụng một tiền tố để chỉ ra khoảng cách ngắn nhất RAC , một tiền tố thứ hai mà chỉ định d để một phạm vi cụ thể của
khoảng cách , và biểu diễn nhị phân [ ký hiệu xxx .. x trong hình . 8.17 (b)] d trừ đi khoảng cách cơ bản của phạm vi của chính nó. Nếu ec và cc là 8 và 4 , như trong hình . 8.17 ( a) , các mã từ RAC đúng là 1100011 . Cuối cùng, nếu d = 0 , c là trực tiếp dưới đây c’ trong khi đó nếu d = 1 , các bộ giải mã có thể phải xác định các điểm chuyển tiếp gần nhất, bởi vì mã 100 không ghi rõ hình đo lường liên quan đến các hàng hiện tại hoặc trước đó hàng .
tìm và mã hóa đường viền
Tương đối địa chỉ mã hóa là một trong những cách tiếp cận để đại diện cho quá trình chuyển đổi cường độ tạo nên những đường nét trong một hình ảnh nhị phân . Một cách khác là đại diện cho mỗi đường viền của một tập các điểm ranh giới hoặc một điểm ranh giới duy nhất và một bộ thứ hai directionals.Tlhe đôi khi được gọi là đường viền trực tiếp truy tìm Trong phần này, chúng tôi mô tả nhưng phương pháp khác , được gọi là lượng tử khác biệt giữa các tiên đoán ( PDQ ) , mà thể hiện những đặc điểm cơ bản của cả hai phương pháp . nó là một đường viền quét iine hướng truy tìm thủ tục .
8.18 ) của từng đối tượng trong một hình được bắt nguồn từ cùng một lúc để tạo ra một chuỗi các cặp ( ∆’, ∆’’). Thuật ngữ ∆, là sự khác biệt giữa các tọa độ bắt đầu của các đường viền phía trước trên đường liền kề , và A " là sự khác biệt giữa phía trước ' độ dài đường viền - hack. Những khác biệt này , cùng với những thông điệp đặc biệt mà chỉ ra sự bắt đầu của đường nét mới ( thông điệp khởi đầu mới ) và kết thúc của đường nét cũ ( thông điệp hợp nhất ) , đại diện cho từng đối tượng. Nếu ∆" được thay thế bằng
Sự khác biệt giữa các đường viền lại phối hợp dòng liền kề oi , ký hiệu là A '" kỹ thuật này được gọi là đôi della mã hóa ( DDC)
Sự khởi đầu mới và hợp nhất thông điệp cho phép ( ∆', ∆") hoặc ( ∆’’. ∆'" ) cặp được tạo ra trên cơ sở dòng quét được liên kết đúng với các cặp tương ứng trong các hàng trước và sau Nếu không có những tin nhắn , các bộ giải mã sẽ được bỏ có thể tham khảo một cặp khác biệt khác hoặc vị trí một cách chính xác các đường viền trong hình ảnh để tránh mã hóa cả các hàng và cột cooi dinates của mỗi khởi đầu mới và hợp nhất các tin nhắn, một mã duy nhất thường được sử dụng để xác định quét các dòng không chứa đối tượng pixels.The bước cuối cùng trong cả hai PDQ và DDC được mã hóa để repiesent ∆', ∆"hoặc ∆’" , và tọa độ của sự bắt đầu mới và sáp nhập với một mã chiều dài thay đổi phù hợp .
Chúng tôi kết thúc phần này bằng cách so sánh các kỹ thuật nén nhị phân mô tả trước đây cách tiếp cận Bạch đã được sử dụng để nén những hình ảnh của Hình 8 14 . Tỷ lệ mã kết quả và tỷ lệ nén được cung cấp m Bảng 8 8 và 8,9 . Khi giải thích những kết quả này , lưu ý rằng ước tính bậc nhất (xem phần 8.3.4 ) của entropies của độ dài chạy RLC và PDQ và DDC khoảng cách được tính toán và sử dụng như một xấp xỉ của hiệu suất nén có thể đạt được theo biến chiều dài mã hóa phương pháp tiếp cận mục 8.4.1 .
Kết quả trong bảng 8.8 và 8,9 cho thấy tất cả các kỹ thuật đã có thể loại bỏ một số lượng interpixel dự phòng. Đó là , tỷ lệ mã kết quả
ít hơn so với ước tính dữ liệu ngẫu nhiên thứ tự đầu tiên của mỗi ảnh. Sản lượng, độ mã hóa được chứng minh là phương pháp mã hóa tốt nhất cho các bit - plane hình ảnh mã hóa , trong khi các kỹ thuật 2-D ( như PDQ , DDC, RAC) thực hiện tốt hơn khi nén hình ảnh nhị phân . Hơn nữa, các thủ tục tương đối đơn giản của Gray mã hóa hình ảnh của hình . 8.14 ( a) cải thiện hiệu suất mã hóa có thể đạt được khoảng 1 bit / pixel . Cuối cùng, lưu ý rằng năm phương pháp nén có thể để nén hình ảnh đơn sắc chỉ với hệ số 1-2 , trong khi nén hình ảnh nhị phân của hình . 8.14 ( b ) theo hệ số 2-5 . Như Bảng 8,8 cho thấy , lý do cho sự khác biệt hiệu suất này là các thuật toán không thể nén những chiếc máy bay thấp hơn để bit của bit - plane hình ảnh được mã hóa . Trong thực tế, các mục tiêu tan của bảng cho trường hợp m mà các thuật toán do mở rộng dữ liệu , fn những trường hợp này , các dữ liệu thô được sử dụng để đại diện cho các máy bay chút , và chỉ có 1 bit / pixel đã được thêm vào tổng số tỷ lệ mã.