So sánh thực nghiệm và phân tích đánh giá

Một phần của tài liệu Nghiên cứu phát triển một số giải pháp nén ảnh tiên tiến cho màn hình tinh thể lỏng (Trang 149)

Dễ thấy rằng ARAIC và WLT-MAIC là hai giải pháp nén tiêu biểu cho hai hướng tiếp cận mà luận án đã thực hiện. ARAIC là kết quả cuối cùng thu được sau một chuỗi các đề xuất có tính kế thừa và phát triển, theo hướng tiếp cận thứ nhất áp dụng mã hóa khối và biến đổi không gian màu, nhằm từng bước nâng cao chất lượng ảnh nén và cải thiện độ phức tạp tính toán. Trong khi đó, WLT-MAIC lại là kết quả của những nỗ lực nghiên cứu theo hướng tiếp cận thứ hai, dựa trên phép biến đổi wavelet và lựa chọn thích nghi. Vấn đề đặt ra trong phần này là cần so sánh và đánh giá để thấy rõ những ưu và khuyết điểm của mỗi giải pháp trên mỗi hướng tiếp cận, từ đó có thể đưa ra những nhận định hay khuyến nghị cần thiết khi nhà sản xuất cần phải chọn lựa giải pháp nén áp dụng cho hệ thống tăng tốc của màn hình tinh thể lỏng.

Trên phương diện độ phức tạp tính toán hay kiến trúc thực thi, thì rõ ràng giải pháp ARAIC thể hiện ưu điểm vượt trội hơn WLT-MAIC với một kiến trúc hợp nhất dùng để mã hóa cho cả ba thành phần màu Y, Cb và Cr. ARAIC chỉ sử dụng duy nhất bộ mã hóa MMAUQC tính trên trường số nguyên 8bit, cùng bộ phân phối bit với yêu cầu tính toán khá đơn giản như đã được trình bày chi tiết trong chương trước. Trong khi đó WLT-MAIC đòi hỏi có bộ biến đổi wavelet lifting, và một bộ mã hóa chọn lựa thích nghi khá cồng kềnh do yêu cầu đến 7 bộ mã hóa tương ứng với 7 mode mã hóa khác nhau.

Trên phương diện chất lượng ảnh nén, để đánh giá được khái quát và đầy đủ chất lượng ảnh nén của ARAIC và WLT-MAIC, cũng như hai giải pháp gốc của chúng là AHIC và DAMS, luận án đã tiến hành các bước sau:

 Thứ nhất, đánh giá thực nghiệm trên tập dữ liệu ảnh lấy từ “LIVE image quality assessment database release 2” (nguồn [6]). Kết quả thể hiện qua Hình 4.19, trong đó cho thấy sự vượt trội của giải pháp nén WLT-MAIC so với ARAIC cũng như với DAMS và AHIC trong hầu hết các tình huống. Sự vượt trội thể hiện rõ nét qua chất lượng ảnh nén của các bức ảnh như: Caps, LightHouse, Sailing2, Ocean, và Plane.

Hình 4.19. So sánh hiệu năng của các giải pháp nén thuộc hai hướng tiếp cận – Thực nghiệm trên 19 ảnh trong [6].

Các bức ảnh nói trên đều có chung một đặc điểm là diện tích những vùng ảnh đơn giản, với ít chi tiết và độ tương phản thấp chiếm một tỷ lệ cao trong ảnh, cụ thể như những vùng ảnh thể hiện cảnh nền trời xanh với vài đám mây trắng, hay cảnh nước biển xanh với những gợn sóng lăn tăn,… Đặc điểm này giúp giải pháp WLT-MAIC có thể mã hóa những vùng ảnh đó với số lượng bit ít hơn chỉ số bit trung bình (chỉ số trung bình là 4bit/pixel để đạt được tỷ số nén CR=6:1) nhưng vẫn đảm bảo đạt được chất lượng cao, đồng thời bộ điều khiển ngưỡng thích nghi cũng được kích hoạt để nâng cao giá trị ngưỡng nhằm tăng cao hơn nữa chất lượng ảnh cho những vùng đơn giải này so với kỹ thuật ngưỡng cố định. Số bit dư dôi được tích lũy lại khi mã hóa những vùng ảnh đơn giản sẽ được sử dụng ở những vùng ảnh nhiều chi tiết với độ tương phản cao, nhằm nâng cao chất lượng ảnh cho những vùng này. Từ đó đưa đến chất lượng ảnh nén cao xét trên tổng thể toàn bộ bức ảnh. Đây là đặc điểm ưu việt của WLT-MAIC so với ARAIC, nó cho thấy khả năng điều chỉnh giá trị ngưỡng cùng số bit dùng để mã hóa một cách thích nghi theo từng vùng ảnh đã mang lại khả năng tối ưu hóa trên toàn bộ bức ảnh.

Trong khi đó ARAIC chỉ có khả năng phân phối bit tối ưu trong một khối ảnh kích thước (K*8) cột × 4 dòng, chứ không có khả năng san sẻ bit giữa các vùng ảnh khác nhau. Điểm khác biệt chính yếu này được thể hiện rõ qua ảnh sai số của ARAIC và WLT-MAIC trong Hình 4.20 (d) và (e) khi mã hóa ảnh Caps. Ảnh (d) cho thấy giải pháp ARAIC vẫn còn để lại sai số tại những vùng cạnh có độ tương phản cao như vùng viền của những chiếc mũ trong ảnh. Trong khi đó trên ảnh (e), là ảnh sai số của giải pháp WLT-MAIC, cho thấy sai số tại những vùng cạnh đã không còn đáng kể, nhìn chung là sai số rất ít và đồng đều trên toàn bộ bức ảnh, điều này minh chứng cho khả năng đa thích nghi của WLT-MAIC vượt trội hơn so với ARAIC.

Hình 4.20 (i) và (j) lần lượt là ảnh sai số của ARAIC và WLT-MAIC khi mã hóa ảnh Bikes, một ảnh có khá nhiều chi tiết với độ tương phản cao, chúng cho thấy WLT- MAIC vẫn giảm thiểu được sai số một cách đáng kể so với ARAIC.

(a) Ảnh gốc (tỷ lệ hiển thị 35%)

(b) Sai số của AHIC (tỷ lệ hiển thị 35%) (c) Sai số của DAMS (tỷ lệ hiển thị 35%)

(f) Ảnh gốc (tỷ lệ hiển thị 50%)

(g) Sai số của AHIC (tỷ lệ hiển thị 35%) (h) Sai số của DAMS (tỷ lệ hiển thị 35%)

(i) Sai số của ARAIC (tỷ lệ hiển thị 35%) (j) Sai số của WLT-MAIC (tỷ lệ hiển thị 35%)

Hình 4.20. So sánh trực quan sai số giữa một số giải pháp nén thuộc hai hướng tiếp cận. Trị tuyệt đối sai số được khuếch đại lên 12 lần rồi biến đổi âm bản.

Trái lại, Hình 4.20 (g) và (h) lần lượt là ảnh sai số của hai giải pháp gốc AHIC và DAMS. Chúng thể hiện sai số lớn ở những vùng đường nét có độ tương phản cao. Đặc biệt Hình 4.20 (h) cho thấy giải pháp DAMS mắc phải sai số lớn dạng khối 8×16 (do sai số khi mã hóa khối 4×8, sau đó qua quá trình biết đổi ngược 2D-DWT tạo ảnh hưởng lên khối 8×16), với mật độ cao. Điều đó cho thấy khả năng thích nghi kém của DAMS đối với những ảnh có độ nét và độ tương phản cao, khiến cho khả năng tích lũy bit của nó mất tác dụng, và cơ chế ngưỡng cố định gây ra kết quả tiêu cực vì vẫn giữ giá trị ngưỡng cố định để đòi hỏi mã hóa chất lượng cao với những vùng ảnh có nhiều chi tiết và độ tương phản cao, và khi số bit dưa thừa không còn để bổ sung thì bộ lựa chọn thích nghi của DAMS sẽ hạ mode mã hóa lượng tử cho các khối theo trật tự ưu

tiên từ Cr đến Cb và cuối cùng mới đến Y. Sự hạ mode mã hóa lượng tử đột ngột cho các khối màu Cr và Cb sẽ tác động mạnh đến chất lượng ảnh khôi phục với những vùng ảnh có độ nét và độ tương phản cao, mà ảnh Bikes là một trong số đó.

 Thứ hai, đánh giá thực nghiệm trên tập dữ liệu video có nhiều chi tiết với độ nét cao, tổng số gồm 8765 hình ảnh (nguồn [33] và [34]). Kết quả thực nghiệm thể hiện trong Hình 4.21 và Hình 4.22.

Hình 4.21. So sánh hiệu năng của các giải pháp nén thuộc hai hướng tiếp cận – Thực nghiệm trên 25 chuỗi khung hình với tổng số 8765 hình ảnh.

Hình 4.22. Giá trị PSNR trung bình của các giải pháp nén khi đánh giá trên 25 chuỗi khung hình với tổng số 8765 hình ảnh.

Trong đó, Hình 4.22 cho thấy giải pháp nén ARAIC khi áp dụng với tham số K=1 thì cho chất lượng ảnh thấp hơn WLT-MAIC đến gần 1dB. Nhưng khi ARAIC được áp dụng với tham số K=11, có nghĩ là kích thước vùng ảnh đầu vào xử lý mỗi lượt là (11*8 cột × 4 dòng) = 4 dòng ảnh định dạng CIF, đã cho giá trị chất lượng ảnh trung

23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 PS N R ( dB ) Các chuỗi hình ảnh (định dạng CIF) AHIC ARAIC (K=1) ARAIC (K=11) DAMS WLT-MAIC

bình cao hơn giải pháp WLT-MAIC đến 0.2dB. Hình 4.21 cho hình ảnh chi tiết hơn về chất lượng nén của các giải pháp trên từng chuỗi khung hình. Có thể thấy hầu hết các giải pháp đều cho chất lượng ảnh khá thấp với các chuỗi khung hình MobileCalendar, Cheerleaders, FlowerGarden, và FlamingoHilton. Nguyên nhân của sự sụt giảm chất lượng ảnh nén trên các chuỗi khung hình này có thể được lý giải một phần qua giá trị độ đo entropy trung bình của các chuỗi khung hình trên ở mức cao, như thể hiện trong Hình 4.23, cho thấy mật độ thông tin lớn chứa trong các chuỗi khung hình này. Về mặt trực quan, có thể thấy đây là các chuỗi khung hình có mật độ các chi tiết rất cao cả về màu sắc lẫn độ chói, các chi tiết khá sắc nét thể hiện hình ảnh có độ tương phản cao. Từ đó có thể thấy ảnh sẽ được chia khối và qua các quá trình biến đổi tùy theo mỗi giải pháp, nhưng nhìn chung là các khối điểm ảnh đầu vào cho quá trình lượng tử sẽ có miền giới hạn R = Max(khối) – Min(khối) lớn, dẫn đến sai số lượng tử hóa tăng lên, làm chất lượng ảnh khôi phục suy giảm.

Cũng với các chuỗi khung hình MobileCalendar, Cheerleaders,… có giá trị entropy cao này, chất lượng ảnh nén của WLT-MAIC đã sụt giảm nhiều so với giải pháp ARAIC. Trái lại, với các chuỗi khung hình có giá trị entropy trung bình không cao như BetesPasBetes, 3inrow, Coastguard, 5inrow,… thì giải pháp WLT-MAIC lại cho chất lượng vượt trội hơn so với ARAIC.

Vậy có thể thấy WLT-MAIC có khả năng thích nghi cao và cho chất lượng ảnh nén vượt trội so với các giải pháp còn lại khi ảnh không có quá nhiều chi tiết có độ tương phản cao, hay nhìn theo khía cạnh khác là các hình ảnh có độ đo entropy không quá cao. Ngược lại, khi độ đo entropy của ảnh quá cao, tất nhiên là so với mức mã hóa 4bit/pixel hay CR = 6:1, thì giải pháp WLT-MAIC giảm khả năng thích nghi do khả năng tích lũy bit bị hạn chế hay mất tác dụng, nên WLT-MAIC không còn thể hiện được tính ưu việt hơn so với ARAIC. Mặt khác, ARAIC sử dụng mã hóa lượng tử đa mức (các mức lượng tử có thể là 0bit/pixel, 1bit/pixel, 2bit/pixel,…) nhưng không cần gửi chuỗi bit thông điệp ghi nhận tỷ số bit/pixel đã áp dụng để lượng tử hóa đến bộ giải mã (decoder), vì cả ở bộ mã hóa (encoder) và bộ giải mã đều có bộ tính toán giá trị phân phối bit cho mỗi khối dựa trên giá trị giới hạn R, vì thế bộ giải mã không cần chuỗi bit nhận diện. Trong khi đó WLT-MAIC cũng như DAMS phải sử dụng chuỗi 3bit nhận diện chế độ lượng tử, chuỗi bit này được gọi là “Mode Bit”, và kỹ thuật này làm giảm đi số bit thực sự sử dụng để lượng tử hóa các khối điểm ảnh. Tuy nhiên, nếu giải pháp nén WLT-MAIC được áp dụng với tỷ lệ nén thấp hơn, chẳng hạn CR = 4:1, thì số bit được sử dụng làm “Mode Bit” sẽ chiếm tỷ trọng không đáng kể so với tổng số

bit được cấp phát để mã hóa 6 macroblock, cụ thể sẽ là ( ) ( ) hay chỉ chiếm 4.6% quỹ bit.

Hình 4.23.Giá trị Entropy trung bình của mỗi chuỗi khung hình.

Hình 4.24 thể hiện chất lượng ảnh khôi phục trên từng khung hình của chuỗi khung hình MobileCalendar, được đánh giá theo độ đo PSNR. Nó cho thấy sự vượt trội của ARAIC so với WLT-MAIC trên mọi khung hình. Và Hình 4.25 cho phép chúng ta đánh giá trực quan chất lượng ảnh khôi phục của các giải pháp nén trên một khung hình của chuỗi MobileCalendar. Cả hai giải pháp gốc của hai hướng tiếp cận là AHIC và DAMS đều cho ảnh chất lượng thấp với sai lệch (hay sai số) lớn trên ảnh khôi phục mà chúng ta có thể nhận thấy rõ bằng mắt thường. Trong khi đó WLT-MAIC và ARAIC cho chất lượng tốt hơn hẳn, và dễ thấy ARAIC cho chất lượng tốt nhất và khó có thể nhận thấy sai lệch trên ảnh khôi phục của ARAIC bằng mắt thường trong tình huống này.

Hình 4.24. So sánh chất lượng ảnh của các giải pháp nén trên chuỗi CIF MobileCalendar.

0 50 100 150 200 250 300 350 400 21 22 23 24 25 26 27 28 29 30 Frame number P S N R ( d B ) AHIC DAMS ARAIC (K=1) WLT-MAIC

(a) Một ảnh trong chuỗi khung hình MobileCalendar (tỷ lệ hiển thị 100%)

(b) Ảnh khôi phục của AHIC (c) Ảnh khôi phục của DAMS

(f) Ảnh sai số của AHIC (g) Ảnh sai số của DAMS

(h) Ảnh sai số của ARAIC (i) Ảnh sai số của WLT-MAIC

Hình 4.25. So sánh trực quan sai số giữa một số giải pháp nén thuộc hai hướng tiếp cận. Trị tuyệt đối sai số được khuếch đại lên 12 lần rồi biến đổi âm bản.

Trên cơ sở những so sánh thực nghiệm và phân tích đánh giá đối với hai giải pháp, phần tiếp theo đây sẽ trình bày cô đọng và đúc kết nên các khuyến nghị đối với nhà sản xuất khi phải chọn lựa và triển khai giải pháp.

Một phần của tài liệu Nghiên cứu phát triển một số giải pháp nén ảnh tiên tiến cho màn hình tinh thể lỏng (Trang 149)