chơng 4: mã hoá ảnh 167 Chơng 4 Mã HOá ảNH Mở đầu. Mục tiêu chính của mã hoá ảnh là làm sao trìng bầy ảnh với số bít càng nhỏ càng tốt trong khi vẫn giữ đợc mức chất lợng và độ dễ hiểu ở mức chất lợng vừa đủ với một ứng dụng đã cho. Có hai lĩnh vực ứng dụng: Một là giảm bề rộng băng tần cần thiết cho hệ truyền ảnh. Ví dụ truyền hình số, hội nghị video, fax ứng dụng thứ hai là giảm bớt yêu cầu về lu trữ. Ví dụ giảm lu trữ số liệu ảnh trong các chơng trình vũ trụ và số liệu video trong máy ghi hình số. Tuỳ theo tính chất của ứng dụng, mức độ chất lợng ảnh và độ dễ hiểu có thể biến đổi trong một phạm vi rộng. Trong lu trữ ảnh của chơng trình vũ trụ hay lu trữ ảnh lịch sử (không thể có lại đợc) phải lu trữ lại toàn bộ t liệu số của nguyên bản để sử dụng về sau. Những kỹ thuật không làm mất tí thông tin nào và cho phép phục hồi chính xác t liệu số ban đầu, gọi là kỹ thuật có tính bảo tồn thông tin. Trong truyền hình số thì bộ mã hoá không cần phải là loại bảo tồn thông tin nh vậy. ở đây chất lợng cao là quan trọng, nhng có thể bỏ qua một số thông tin từ t liệu gốc, trong phạm vi mà tín hiệu giải mã ra và hiện lên màn hình vẫn vừa mắt ngời xem. Trong ứng dụng về điều khiển con tàu từ xa, độ dễ hiểu của ảnh là quan trọng nhất, nhng có thể hi sinh một phần chất lợng. Càng giảm yêu cầu về chất lợng và độ dễ hiểu, thì tốc độ bit càng hạ. Mã hoá ảnh liên quan đến cải thiện ảnh và phục chế ảnh. nếu ta có thể cải thiện cảm quan thị giác của ảnh đợc lập lại hay nếu ta có thể giảm sự xuống cấp do algorit mã hoá hình gây ra (ví dụ nh tạp âm lợng tử hoá ) thì ta có thể giảm bớt số lợng bit cần thiết để biểu diễn một ảnh ở mức độ chất lợng và độ dễ hiểu đã cho, hay có thể giữ nguyên số bit mà cải thiện chất lợng và độ dễ hiểu . Môi trờng điển hình về mã hoá ảnh nh trên hình 4.1. ảnh digital đợc mã hoá ảnh mã hoá. Bộ mã hoá này gọi là bộ mã hoá nguồn. Đầu ra bộ mã hoá này là một chuỗi bit gọi là ảnh gốc. Cỏc bc n gin mó húa hỡnh nh Ngun:www.ketnoibanbe.org chơng 4: mã hoá ảnh 168 Bộ mã hoá kênh biến chuỗi bit này ra một dạng thích hợp cho việc truyền qua một kênh thông tin, thôn g qua một dạng điều chế nào đó. Tín hiệu đã điều chế đợc truyền qua kênh thông tin. Kênh thông tin sẽ đa vào một ít nhiễu và trong bộ mã hoá kênh phải trữ liệu một biện pháp sửa lỗi để khắc phục tạp âm kênh này. ở đầu thu, tín hiệu nhận đợc qua giải điề u chế và hoàn nguyên thành chuỗi bit nhờ bộ giải mã kênh. Bộ giải mã ảnh đem chuỗi bít hoàn nguyên thành ảnh cho hiện lên màn hình và in ra. Khác với môi trờng truyền tin ở hình 4.1, trong những ứng dụng mã hoá ảnh để giảm lu trữ, không có kênh thông tin . ở đây chuỗi bit ở đầu ra bộ mã hoá ảnh đợc lu trữ vào môi trờng lu trữ chờ sau lấy ra dùng. Bộ mã hoá ảnh ở hình 4.1 có ba phần tử cơ bản (Hình 4.2). Hình 4.2. Ba thành phần chính trong mã hoá ảnh. Phần tử đầu tiên và quan trọng nhất làm biến đ ổi ảnh vào một không gian (miền) thích hợp nhất cho việc lợng tử hoá và gán từ mã. Về thực chất phần tử này quyết định xem cái gì phải đem mã hoá. Algorit mã hoá ảnh chia làm ba loại chính, tuỳ theo đặc trng nào của ảnh đợc mã hoá. Loại thứ nhất gọi là bộ mã hoá dạng sóng, cờng độ ảnh Bộ mã hoá ảnh Bộ mã hoá kênh Bộ giải mã ảnh Bộ giải mã kênh Kênh truyền ảnh phục hồi ảnh gốc Hình 4.1. Môi trờng điển hình về mã hoá ảnh. ảnh gốc Biến đổi Lợng tử hóa Gán từ mã Chuỗi bit chơng 4: mã hoá ảnh 169 hay một biến thiên của cờng độ ảnh, ví dụ cờng độ của hai pixel kề nhau, đợc mã hoá. Loại thứ hai, gọi là bộ mã hoá hệ số biến đổi (hay hàm biến đổi) , ảnh đợc biến đổi sang không gian khác, chẳng hạn biến đổi Fourier hoặc biến đổi Cosin, nh vậy là sang một miền (domain) khác với miền cờng độ, và các hệ số biến đổi đợc mã hoá. Loại thứ ba gọi là bộ mã hoá mô hình (model) tín hiệu, ngời ta mô hình hoá ảnh hoặc một mảnh nào đó của ảnh và các thông số của mô hình đợc mã hoá. Sau đó ảnh đợc tổng hợp từ các thông số mô hình đã mã hoá. Phần tử thứ hai là để lợng tử hoá. Để biểu diễn một ảnh với một số bít hữu hạn, thì cờng độ ảnh, hệ số biến đổi hay thông số mô hình phải đợc lợng tử hoá. Việc lợng tử hoá bao gồm vi ệc gán mức lợng tử và các biên quyết định. Phần tử thứ ba để gán từ mã tức là chuỗi bít biểu diễn các mức lợng tử. Mỗi phần tử đều nhằm để khai thác sự d thừa trong ảnh gốc và những giới hạn của thiết bị hiện hình cũng nh của hệ thị giác con ngời . Vì vậy ba phần tử liên quan chặt chẽ với nhau. Chẳng hạn nếu phần tử biến đổi trong bộ mã hoá làm cho các số liệu giảm sự tơng quan đủ mức thì u thế của lợng tử hóa vectơ so với lợng tử hoá vô hớng giảm đi. Nếu các mức lợng tử trong bộ lợng tử hoá đợc chọn sao cho mỗi mức đợc sử dụng với xác suất nh nhau thì u thế của từ mã có độ dài biến đổi so với từ mã có độ dài cố định giảm đi. 1. Lợng tử hoá. 1.1. Lợng tử hoá vô hớng. Gọi f là một lợng vô hớng liên tục, có thể đại biểu cờng độ một pixel hoặc một hệ số biến đổi hay một thông số của mô hình ảnh. Để biểu diễn f bằng một số lợng bit hữu hạn, ta chỉ dùng một số lợng hữu hạn mức lợng tử. Giả sử có L mức đợc dùng để biễu f. Quá trình gán một giá trị f cho một trong L mức g ọi là lợng tử hoá biên độ hay gọi tắt là lợng tử hoá. Nếu mỗi đại lợng vô hớng đợc lợng tử hoá một cách độc lập thì quá trình gọi là lợng tử hoá vô hớng. Nếu hai hoặc trên hai đại lợng vô hớng kết hợp cùng lợng tử hoá thì quá trình gọi là lợng tử hoá vectơ hay lợng tử hoá khối. Gọi f là f đã đợc lợng tử hoá. i rfQf ; ii dfd 1 (4.1) Q=thuật toán lợng tử hoá. chơng 4: mã hoá ảnh 170 r i = với 1 i L là L mức lợng tử. d i = với 0 i L là L mức quyết định hay L bờ quyết định. Theo (4.1) thì nếu f rơi vào giữa d i-1 và d i thì nó đợc ánh xạ vào mức lợng tử r i . Nếu ta đã xác định các mức quyết định và mức lợng tử thì quá trình lợng tử hoá f là một quá trình xác định. Cũng có thể biểu diễn : Q effQf (4.2) Trong đó e Q là sai số lợng tử tính theo : ffe Q (4.3) Sai số lợng tử hoá e Q còn gọi là tạp âm lợng tử . Đại lợng e Q 2 coi nh trờng hợp đặc biệt của độ đo độ méo ffd , là một độ đo khoảng cách giữa f và f . Những ví dụ khác của ffd , bao gồm ff và p p ff . Các mức lợng tử và mức quyết định thờng đợc xác định bằng cách tối thiểu hoá một tiêu chuẩn sa i số nào đó dựa trên ffd , chẳng hạn nh độ méo trung bình D : 0 0 0 0 , , dffp f ffdffdED f (4.4) Phơng pháp lợng tử hoá chân phơng nhất là lợng tử hoá đều trong đó các mức lợng tử (và mức quyết định) cách đều nhau. Li1 1 ii dd (4.5a) Li1 2 1 i i dd r i (4.5b) là kích thớc bớc nhảy bằng khoảng c ách giữa hai mức lợng tử kề nhau hay hai mức quyết định kề nhau. Ví dụ về lợng tử hoá đều với L=4 và f giả thiết gồm giữa 0 và 1 đợc trình bày ở hình 4.3. Tạp âm lợng tử e Q thờng phụ thuộc tín hiệu. Chẳng hạn tạp âm lợng tử e Q của bộ lợng tử hoá đều (trong hình 4.3) đợc biểu diễn ở hình 4.4. Từ hình này thấy rằng e Q là hàm của f và do đó nó phụ thuộc tín hiệu. Có thể làm cho tạp âm lợng tử e Q trong bộ lợng tử hoá đều trở thành không tơng quan bằng cách dùng kỹ chơng 4: mã hoá ảnh 171 thuật giả tạp âm của Robert . Nh sẽ thấy trong tiết 3 phép giải tơng quan của nhiễu lợng tử hoá sẽ hữu dụng trong việc cải thiện chất lợng hệ mã hoá ảnh. Nó làm thay đổi đặc tính của sự xuống cấp ảnh mã hoá. Ngoài ra có thể làm giảm tạp âm lợng tử đã giải tơng quan bằng cách dùng algori t phục hồi ảnh nh chơng 3. Hình 4.3 : Ví dụ về bộ lợng tử hoá đều. Số mức lợng tử là 4, f nằm giữa 0 và 1, f là f đã lợng tử hoá. Các mức lợng tử và bờ quyết định đợc ký hiệu là r i và d i . Tuy lợng tử hoá đều là các h tiếp cận tự nhiên nhất, nhng nó không phải là tối u. Giả sử f tập trung ở một vùng nào đó nhiều hơn ở các vùng khác. Nh vậy gán nhiều mức lợng tử cho vùng đó nhiều hơn các vùng khác là hợp lý. Ta xem lại ví dụ ở hình 4.3. Nếu f ít khi rơi vào giữa d 0 và d 1 thì mức lợng tử r 1 ít dợc sử dụng. Sắp xếp các mức lợng tử r 1 , r 2 , r 3 , và r 4 sao cho chúng đều nằm giữa d 1 và d 4 sẽ có ý nghĩa hơn. Lợng tử hoá mà các mức lợng tử và mức quyết định không cách đều gọi là lợng tử hoá không đều. Việc xác định tối u r i và d i phụ thuộc vào tiêu chuẩn sai sốđợc sử dụng. Tiêu chuẩn thờng dùng nhất là sai số quân phơng tối thiểu MMSE*_ giả thiết f là một biến ngẫu nhiên có hàm mật độ xác suất là p f (f 0 ). Dùng tiêu chuẩn MMSE ta xác định r k và d k bằng cách tối thiểu hoá độ méo trung bình D, với : 4 8 7 r 2 8 3 r 3 8 5 r 1 8 1 r Bộ lợng tử hoá đều f f f f 0 0d 1 4 1 d 2 2 1 d 3 4 3 d 4 1d chơng 4: mã hoá ảnh 172 0 2 0 0 2 2 0 dffp ffEeEffdED ff f f Q (4.6) Lu ý rằng f là một trong L mức lợng tử tính theo (4.1), ta có thể đem (4.6) viết ra : 0 2 0 1 0 10 dffrfpD i L i d df f i i (4.7) Để tìm cực tiểu D : L k d d L D r D 0 k 1k10 d Lk10 (4.8) Từ (4.7) và (4.8) : Lk dffp dffpf r k k k k d d o f f d df f k 1, 1 1 00 000 0 (4.9a) 11, 2 1 Lk rr d kk (4.9b) 0 d (4.9c) L d (4.9d) chơng 4: mã hoá ảnh 173 Phơng trình đầu trong (4.9) nói lên rằng mức lợng tử r k là tâm quay (centroid) của p f (f 0 ) trong khoảng d k-1 f d k . Những phơng trình còn lại nói lên rằng mứ c quyết định d k (trừ d 0 và d L ) là điểm chính giữa hai mức lợng tử r k và r k+1 . Phơng trình (4.9) là bộ phơng trình cần cho lời giải tối u. Với một số hàm mật độ xác suất, trong đó có các mật độ : đều, Gauss, và Laplace, thì (4.9) cũng là bộ phơng trình đủ. Giải (4.9) là một bài toán phi tuyến. Bài toán phi tuyến đã đợc giải cho một số hàm mật độ xác suất. Các lời giải khi p f (f 0 ) là : đều, Gauss, Laplace, nh trên bảng 1. Bộ lợng tử hoá dựa trên tiêu chuẩn MMSE đợc gọi là bộ lợng tử hoá Lloyd_Max. Theo bảng 1, bộ lợng tử hoá đều là bộ lợng tử hoá MMSE tối u khi p f (f 0 ) là hàm mật độ xác suất đều. Với những mật độ xác suất khác, lời giải tối u là một bộ lợng tử hoá không đều. Hình 4.5 biểu diễn các mức lợng tử và mức quyết định tối u ứng với hàm mật độ xác suất Gauss có phơng sai là 1 và L=4. Cần đánh giá mức độ cải thiện mà bộ lợng tử hoá MMSE tối u đem lại so với bộ lợng tử hoá đều. Chẳng hạn xét một hàm độ xác suất Gauss có giá trị trung bình là 0 và phơng sai là 1. Hình 4.4 : Minh hoạ về sự phụ thuộc của tạp âm lợng tử vào tín hiệu. Hình 4.6 biểu diễn méo trung bình D theo hàm của số mức lợng tử, đờng liền nét ứng với bộ lợng tử hoá MMSE tối u, đờng vẽ chấm ứng với bộ lợng tử hoá đều, trong đó các mức lợng tử r i đợc chọn đối xứng đối với gốc toạ độ, các mức quyết định cực tiểu và cực đại giả thiết là - và , bớc lợng tử đợc chọn để độ méo trung bình D là cực tiểu. ff e Q 1/8 1/8 f 1 3/4 1/2 1/4 chơng 4: mã hoá ảnh 174 Bảng 4.1 . Vị trí của các mức lợng tử và quyết định đối với bộ lợng tử hoá Lloyd_Max. Với hàm mật độ xá c suất đều, giả thiết p f (f 0 ) đều giữa 1 và 1. Với hàm mật độ xác suất Gauss giả thiết trung vị bằng 0 và phơng sai bằng 1. Với hàm mật độ xác suất Laplace p f (f 0 )= 0 2 2 2 f e với = 1 Đều Gauss Laplace Bit r i d i r i d i r i d i 1 2 3 4 -0.5000 -1.0000 0.5000 0.0000 1.0000 -0.7500 -1.0000 -0.2500 -0.5000 0.2500 0.0000 0.7500 0.5000 1.0000 0.8750 -1.0000 -0.6250 -0.7500 -0.3750 -0.5000 -0.1250 -0.2500 0.1250 0.0000 0.3750 0.2500 0.6250 0.5000 0.8750 0.7500 1.0000 -0.9375 -1.0000 -0.8125 -0.8750 -0.6875 -0.7500 -0.5625 -0.6250 -0.4375 -0.5000 -0.3125 -0.3750 -0.1875 -0.2500 -0.0625 -0.1250 0.0625 0.0000 0.1875 0.1250 0.3125 0.2500 0.4375 0.3750 0.5625 0.5000 0.6875 0.6250 0.8125 0.7500 0.9375 0.8750 1.0000 -0.7979 - 0.7979 0.0000 -1.5104 - -0.4528 -0.9816 0.4528 0.0000 1.5104 0.9816 -2.1519 - -1.3439 -1.7479 -0.7560 -1.0500 -0.2451 -0.5005 0.2451 0.0000 0.7560 0.5005 1.3439 1.0500 2.1519 1.7479 -2.7326 - -2.0690 -2.4008 -1.6180 -1.8435 -1.2562 -1.4371 -0.9423 -1.0993 -0.6568 -0.7995 -0.3880 -0.5224 -0.1284 -0.2582 0.1284 0.0000 0.3880 0.2582 0.6568 0.5224 0.9423 0.7995 1.2562 1.0993 1.6180 1.4371 2.0690 1.8435 2.7326 2.4008 -0.7071 - 0.7071 0.0000 -1.8304 - -0.4198 -1.1269 0.4198 0.0000 1.8340 1.1269 -3.0867 - -1.6725 -2.3796 -0.8330 -1.2527 -0.2334 -0.5332 0.2334 0.0000 0.8330 0.5332 1.6725 1.2527 3.0867 2.3769 -4.4311 - -3.0169 3.7240 -2.1773 -2.5971 -1.5778 -1.8776 -1.1110 -1.3444 -0.7287 -0.9198 -0.4048 -0.5667 -0.1240 -0.2664 0.1240 0.0000 0.4048 0.2644 0.7287 0.5667 1.1110 0.9198 1.5778 1.3444 2.1773 1.8776 3.0169 2.5971 4.4311 3.7240 chơng 4: mã hoá ảnh 175 Hình 4.5. Ví dụ về bộ lợng tử hoá Lloyd_Max. Số mức lợng tử là 4, hàm mật độ xác suất là Gauss với trung vị bằng 0 và phơng sai bằng 1. Hình 4.6. So sánh độ méo trung bình D =E[( f -f) 2 ] theo hàm của số mức lợng tử L trong 2 trờng hợp : Đờng liền nét : bộ lợng tử hoá Lloyd_Max (khi hàm mật độ xác suất là Gauss, trung vị bằng 0 và phơng sai bằng 1). Đờng vẽ chấm : bộ lợng tử hoá đều. Trục tung tính theo 10 log 10 D. Bộ lợng tử hoá không đều 1.5104 0.9816 -0.9816 0.4528 -0.4528 -1.5104 f f f f 10 log 10 D Lợng tử hoá đều Lợng tử hoá Lloyd_Max 2 4 8 16 32 64 128 L (1bit) (2bit) (3bit) (4bit) (5bit) (6bit) (7bit) 0 -10 -20 -30 -40 . 0.7995 1. 2562 1. 0993 1. 618 0 1. 43 71 2.0690 1. 8435 2.7326 2.4008 -0.70 71 - 0.70 71 0.0000 -1. 8304 - -0. 419 8 -1. 1269 0. 419 8 0.0000 1. 8340 1. 1269 -3.0867 - -1. 6725 -2.3796 -0.8330 -1. 2527 -0.2334. cờng độ ảnh Bộ mã hoá ảnh Bộ mã hoá kênh Bộ giải mã ảnh Bộ giải mã kênh Kênh truyền ảnh phục hồi ảnh gốc Hình 4 .1. Môi trờng điển hình về mã hoá ảnh. ảnh gốc Biến đổi Lợng tử hóa Gán từ mã Chuỗi. 0.0000 0.8330 0.5332 1. 6725 1. 2527 3.0867 2.3769 -4.4 311 - -3. 016 9 3.7240 -2 .17 73 -2.59 71 -1. 5778 -1. 8776 -1. 111 0 -1. 3444 -0.7287 -0. 919 8 -0.4048 -0.5667 -0 .12 40 -0.2664 0 .12 40 0.0000 0.4048