Khái quát về các giải pháp nén ảnh cho hệ thống overdrive

Một phần của tài liệu Nghiên cứu phát triển một số giải pháp nén ảnh tiên tiến cho màn hình tinh thể lỏng (Trang 57)

Đã có khá nhiều giải pháp nén ảnh cho hệ thống overdrive của màn hình tinh thể lỏng được đề xuất. Các giải pháp này sử dụng nhiều kỹ thuật mã hóa khối, nhiều kỹ thuật biến đổi đa dạng, có giải pháp khá đơn giản song cũng có giải pháp khá phức tạp về mặt sơ đồ cấu trúc. Nhưng nhìn chung chúng ta có thể chia chúng ra làm hai hướng chính: 1. Hướng

áp dụng kỹ thuật mã hóa khối và biến đổi không gian màu; 2. Hướng áp dụng phép biến đổi ảnh kết hợp các kỹ thuật mã hóa khối và biến đổi không gian màu.

Sau đây chúng tôi xin được trình bày sơ lược cho phần lớn các giải pháp nén tiêu biểu trong số các giải pháp đã được đề xuất:

2.6.1.1. Các giải pháp nén ảnh áp dụng kỹ thuật mã hóa khối và biến đổi không

gian màu

(1) Giải pháp nén sử dụng biến đổi không gian màu (color space conversion) được đề xuất bởi J. K. Sung, C. G. Kim, J. K. An, M. H. Park và S. D. Yeo vào tháng 5 năm 2005 [10]. Giải pháp này thực hiện chuyển đổi dữ liệu ảnh đầu vào màn hình từ RGB sang không gian màu YCbCr (YCbCr là chuẩn định dạng màu dựa trên một thành phần tín hiệu độ chói (Luminance) Y và hai thành phần tín hiệu màu (Chrominance) là Cb và Cr), sau đó lợi dụng đặt tính thị giác của con người là rất nhạy cảm với thành phần tín hiệu độ chói Y và kém nhạy cảm với các thành phần màu Cb và Cr, để từ đó áp dụng mã hóa khối cho thành phần độ chói Y với tỷ số thấp nhằm tránh mất mát nhiều thông tin, và áp dụng mã hóa khối với Cb và Cr với tỷ số nén cao hơn. Kết quả mang lại khả năng cải thiện sai số có dạng hiệu ứng khối (blocking effect) trong ảnh giải nén, tỷ số nén đạt được ở mức 3:1 [19].

(2) Giải pháp nén với mô hình lai HIC (Hybrid Image Coding) được đề xuất bởi J. Wang, K. Y. Min và J. W. Chong vào tháng 9 năm 2007 [17]. Giải pháp này thực hiện chuyển đổi không gian màu RGB về YCbCr và tiếp đến giảm số mẫu trên hai thành phần màu Cb và Cr theo cấu trúc lấy mẫu YCbCr 4:2:0. Sau đó nén thành phần độ chói Y bởi kỹ thuật mã hóa lượng tử thích nghi có tên gọi AQC với tỷ số nén thấp nhằm bảo toàn phần lớn lượng thông tin độ chói, trong khi đó hai thành phần màu Cb và Cr được nén bởi kỹ thuật nén BTC để cho tỷ số nén rất cao. Tỷ số nén mà giải pháp đạt được với chất lượng ảnh giải nén khá tốt là 3.31:1. Cũng chính nhóm tác giả này sau đó đã có những cải tiến cho HIC được trình bày chi tiết trong [18] và [19].

(3) Giải pháp nén sử dụng phép lượng tử hóa vector trên các khối điểm ảnh màu RGB với tên gọi VQ-BTC (Vector Quantizer based Block Truncation Coding), tiếp đến là quá trình chuyển đổi sang không gian màu HSI để tinh chế tăng cường bảo toàn các cạnh cho các khối. Giải pháp này được đề xuất bởi J. W. Han, M.C. Hwang và S.J. Ko vào tháng 11 năm 2008 [24]. Giải pháp này đã mang lại những cải thiện đáng kể so với các giải pháp mã hóa thông thường như BTC hay Basic VQ-BTC. Song theo đánh giá trong nghiên cứu mới hơn sau đó của Jun Wang và các đồng sự, thì giải

pháp mới của họ là SBB-BTC luôn cho kết quả tốt hơn VQ-BTC. Cũng có thể nói giải pháp SBB-BTC phần nào đó đã kế thừa ý tưởng lượng tử hóa vector của giải pháp VQ-BTC song theo một cách rất sáng tạo và khá hiệu quả.

(4) Giải pháp nén có tỷ số nén cao HCRIC (High Compression Ratio Image Coding) một cải tiến của HIC với tỷ số nén đạt được là 6:1, nó được đề xuất bởi J. Wang, K. Y. Min và J. W. Chong vào năm 2008 [18]. Đây thực chất là một phiên bản nâng cấp của HIC để nâng cao tỷ số nén. Bằng cách giảm số mẫu trên hai thành phần màu Cb và Cr xuống 4 lần theo cả hai chiều (tức là giảm đến 16 lần), cộng với một tích hợp nhỏ trên mô-đul nén thành phần Y. Tỷ số nén cuối cùng mà HCRIC đạt được là khoảng 6:1.

(5) Giải pháp nén AHIC (Advanced Hybrid Image Codec), một cải tiến nhỏ của HCRIC, được để xuất bởi J. Wang và J. W. Chong vào tháng 2 năm 2009 [19]. Có thể nói AHIC là một giải pháp nén cho tỷ số nén khá cao khi so sánh với các giải pháp tương đương ứng dụng cho overdrive. Chất lượng mà AHIC đạt được khá tốt trong phần lớn các tình huống kiểm nghiệm trên ảnh, nhất là các ảnh ghi lại cảnh thiên nhiên với độ nét không cao và màu sắc không sắc nét (thể hiện trong phần đánh giá thực nghiệm của [19]). Một ưu điểm nữa của AHIC là cấu trúc khá đơn giản, điều này mang lại khả năng ứng dụng cao trong thực tiễn. Song giải pháp này còn mắc phải một nhược điểm là dễ bị mắc phải hiện tượng nhiễu khối (blocking effect). Chúng ta sẽ đề cập chi tiết về AHIC và vấn đề nhiễu khối mà nó có thể mắc phải ở phần tiếp theo của chương này.

(6) Giải pháp nén sử dụng kỹ thuật mã hóa dựa trên thu gọn khối ảnh BTC song chỉ dùng một mặt phẳng bit cho cả 3 thành phần màu R, G và B, nó có tên gọi là SBB- BTC (Single Bit Plane based Block Truncation Coding) được đề xuất bởi Jun Wang, Lin-bo Luo, Kyeong-yuk Min, Yeun-Cheul Jeung và Jong-wha Chong vào tháng 1 năm 2010 [20]. Dựa trên ý tưởng rằng các khối ảnh màu RGB có thể được mã hóa với kỹ thuật BTC nhưng thay vì sử dụng 3 mặt phẳng bit (bit plane) để mã hóa cho 3 thành phần màu R, G và B như thông thường thì giải pháp này chỉ sử dụng một mặt phẳng bit chung cho cả 3 màu R, G, và B. Mặt phẳng bit chung đó được sinh ra từ việc phân ngưỡng thành phần độ chói của khối ảnh [20]. Bằng cách này thuật toán trở nên đơn giản hơn so với phương pháp VQ-BTC. Qua thực nghiệm để đánh giá kết quả cho thấy SBB-BTC cho kết quả tốt hơn giải pháp chỉ áp dụng BTC hay VQ- BTC.

(7) Giải pháp nén sử dụng kỹ thuật mã hóa BTC 2 mức hoặc 4 mức một cách thích nghi với tên gọi AM-BTC (Adaptive Multi-level Block Truncation Coding), được J.

Wang và J. W. Chong đề xuất vào tháng 5 năm 2010 [21]. Đây là một cải tiến của SBB-BTC bằng cách kết hợp song song hai bộ mã hóa SBB-BTC-2-level và SBB- BTC-4-level, đầu ra tốt nhất của một trong hai bộ mã hóa trên sẽ được chọn lựa. Bằng cách này sẽ cải thiện được hơn nữa chất lượng ảnh so với giải pháp SBB- BTC, song kiến trúc của nó cũng phức tạp hơn nhiều so với SBB-BTC bởi phải bổ sung thêm một bộ nén và giải nén cho SBB-BTC-4-level, một bộ chọn lựa để chọn lựa một trong hai kết quả đầu ra của hai bộ mã hóa trên. Chúng ta cũng sẽ đi sâu phân tích giải pháp này ở phần tiếp theo của chương này.

2.6.1.2. Các giải pháp nén ảnh áp dụng phép biến đổi ảnh kết hợp các kỹ thuật mã hóa khối và biến đổi không gian màu

(1) Giải pháp nén sử dụng biến đổi DCT có thể mở rộng (scalable DCT-base) được đề xuất bởi R. H. M. Wubben và G. J. Hekstra vào tháng 5 năm 2004 [28]. Quy trình xử lý của giải pháp này theo tác giả là gần giống với quy trình xử lý của chuẩn nén JPEG, điểm khác biệt chính là không áp dụng phương pháp mã hóa entropy và kích thước khối . Giải pháp này có thể cho tỷ số nén cao tuy nhiên độ phức tạp tính toán của nó cao hơn nhiều khi so sánh với những kỹ thuật mã hóa thông thường như BTC. Với biến đổi DCT hai chiều thì năng lượng của tín hiệu có xu hướng tập trung miền tần số thấp (gần gốc của hệ trục tần số), vì vậy các hệ số càng gần gốc thì yêu cầu số lượng bit để lưu trữ và xử lý càng lớn, quan trọng nhất là thành phần DC (thành phần hệ số chính ứng với cả hai tần số đều bằng zero). Chẳng hạn nếu giải pháp sử dụng biến đổi DCT kích thước 8x8 thì khi đó hệ số DC sẽ có dung lượng là 8+log2(8x8) = 14 bít, khi đó các quy trình xử lý sau đó sẽ phải xử lý trên dữ liệu 14 bít, đồng thời với sự tăng kích thước bộ đệm dòng lên 8-line, khiến kiến trúc thực thi của hệ thống nén trở nên phức tạp và giá thành cao.

(2) Giải pháp nén sử dụng biến đổi nhanh wavelet rời rạc (fast discrete wavelet transform) được đề xuất bởi I. J. Chun, H. Mun, J. H. Sung, S. Y. Park và B. G. Kim vào tháng 7 năm 2006 [9]. Đây là một nỗ lực tốt, song rất tiết nó chỉ đạt được tỷ số nén Cr=2.66:1. Hơn thế nữa, giải pháp này đòi hỏi phải sử dụng một bộ đệm dòng có kích thước 8-line cũng là một yếu điểm so với phần lớn các giải pháp khác. (3) Giải pháp nén thực hiện trên nền tảng biến đổi wavelet rời rạc kết hợp mô hình chọn

lựa phương thức mã hóa thích nghi, có tên gọi DWT-based Adaptive Mode Selection (DAMS), được đề xuất bởi Haksub Kim và Sanghoon Lee năm 2011 [5]. Giải pháp này sử dụng biến đổi wavelet hai chiều cho 8 dòng ảnh, do đó đòi hỏi sử dụng một bộ đệm 8-line, dùng bộ lọc Daubechies 4/4 - hệ số định dạng số thực. Sau đó ảnh trên các băng tần LL, LH, HL, HH được chia vào các khối có kích thước 4x8

và được sắp xếp theo một trật tự ưu tiên đã định trước. Tiếp đến là áp dụng mô hình nén song song nhiều chế độ (mode) để sau đó chọn lựa ra chế độ mã hóa tốt nhất mà vẫn đảm bảo dung lượng bit nén được kiểm soát chặt, mang lại tỷ số nén ổn định là 6:1. Các kết quả thực nghiệm chỉ ra rằng DAMS cho kết quả khá cao so với các giải pháp SBTC, VQ-BTC và AHIC khi đánh giá theo độ đo PSNR. Tuy nhiêu, cũng qua thực nghiệm cho thấy, rất nhiều tình huống chất lượng ảnh nén bởi DAMS bị hiệu ứng khối (blocking effect) trên thành phần màu sắc một cách nặng nề khó chấp nhận. Lỗi này thường xảy ra trên những vùng ảnh có màu sắc thay đổi mượt (hay tín hiệu màu thay đổi chậm). Kiến trúc khá phức tạp, đòi hỏi đến 6 bộ mã hóa khác nhau tương ứng với 6 cách mã hóa cũng là một nhược điểm nữa của DAMS. Chúng ta sẽ phân tích chi tiết về DAMS trong phần tiếp theo của chương này.

Trên cơ sở các đặc điểm kỹ thuật của các giải pháp nén, chúng tôi đã xây dựng nên biểu đồ cây thừa kế thể hiện qua Hình 2.24 (xem ở trang 47). Trong đó mỗi phần tử là một bản tóm tắt sơ lược cho một giải pháp nén với các thông tin cơ bản nhất.

Tóm lại, đã có khá nhiều giải pháp nén được nghiên cứu đề xuất áp dụng cho màn hình tinh thể lỏng, với nhiều cách tiếp cận và xử lý khá khác nhau và hiệu năng mà mỗi giải pháp đạt được cũng mỗi khác. Xu hướng thông thường là giải pháp nén có tỷ số nén càng cao thì độ phức tạp tính toán sẽ tăng lên và ngược lại. Điều này khiến cho việc so sánh đánh giá giữa những giải pháp nén có tỷ số nén khác nhau trở nên khó khả thi hay phiến diện. Bên cạnh đó, việc đi sâu vào phân tích đánh giá khiến trúc phần cứng thực thi không nằm trong phạm vi của luận án này. Do đó các phân tích so sánh giữa các giải pháp chỉ thực hiện trên các giải pháp gần tương đương nhau về tỷ số nén hoặc độ phức tạp kiến trúc thực thi.

2.6.2. Một số hƣớng tiếp cận các giải pháp nén và định hƣớng nghiên cứu

Trong phần này luận án tập trung phân tích đánh giá ưu và nhược điểm của một số giải pháp nén tiên tiến và nổi bật về mặt hiệu năng áp dụng cho màn hình tinh thể lỏng, trên cơ sở kết hợp các phương pháp nén ảnh cơ sở và các phương pháp nén ảnh tiên tiến. Các giải pháp được đưa ra phân tích đánh giá qua hai hướng tiếp cận:

- Mã hóa khối và biến đổi không gian màu: Gồm hai giải pháp nén được đề xuất bởi cùng một nhóm tác giải J. Wang và J. W. Chong đó là các giải pháp AHIC [19] (đề xuất năm 2009) và AM-BTC [21] (đề xuất năm 2010). Cả hai giải pháp này đều cho chất lượng ảnh nén khá cao khi so sánh với các giải pháp nén ảnh áp dụng cho màn hình tinh thể lỏng cùng giai đoạn được đề xuất trở về trước, cộng với một kiến trúc không quá phức tạp.

Hình 2.24. Những giải pháp nén đã được đề xuất áp dụng trong hệ thống overdrive của màn hình tinh thể lỏng. Những đặc điểm chính và tính kế thừa trong một số giải pháp.

Sơ lược về các giải pháp nén ảnh cho màn hình tinh thể lỏng và sự kế thừa

Giải pháp VQ-BTC trong [23]

 Sử dụng kỹ thuật mã hóa VQ-TBC

 Biến đổi từ không gian màu RGB sang HSI để tinh chỉnh

 CR=6

11/2008 (adsbygoogle = window.adsbygoogle || []).push({});

Giải pháp “fast discrete wavelet” trong [8]

 Sử dụng biến đổi nhanh wavelet rời rạc

 Tỷ số nén CR = 2.66 7/2006

Giải pháp DAMS trong [4]

 Sử dụng phép biến đổi không gian màu RGB sang YCbCr, cùng với biến đổi wavelet rời rạc 2 chiều (DWT)

 Sử dụng mã hóa hỗn hợp song song nhiều kỹ thuật khác nhau như: Mean, BTC, AQC-4Level, AQC- 8Level, AQC-16Level  CR=6 5/2011 SBB-BTC trong [19]  Sử dụng kỹ thuật mã hóa BTC với chỉ một mặt phẳng bít biểu diễn bản đồ mã cho cả 3 thành phần R,G,B  CR=6 1/2010 AM-BTC trong [20]  Kế thừa SBB-BTC song tích hợp đến 2 bộ mã hóa TBC- 2level và BTC-4level và chọn lựa kết quả đầu ra một cách thích nghi

 CR=6 5/2010

Giải pháp lai (HIC) trong [16]

 Sử dụng phép biến đổi không gian màu RGB 4:4:4 sang YCbCr 4:2:0

 Sử dụng kỹ thuật mã hóa thích nghi (AQC) cho thành phần độ chói (Y), và kỹ thuật BTC cho màu (Cb&Cr)

 CR=3.31 9/2007

Giải pháp HCRIC trong [17]  Biến đổi RGB sang YCbCr rồi Downsampling 4↓1 với hai thành phần U&V

 Sử dụng kỹ thuật AQC cho thành phần Y, và BTC cho màu (Cb&Cr)

 CR=6 2008

Giải pháp AHIC trong [18]

 Kế thừa gần như hoàn toàn HCRIC với một khác biệt nhỏ ở bộ giảm mẫu.

 CR=6 2/2009

Giải pháp “Scalable DCT- based” trong [26]

 Sử dụng biến đổi Scalable DCT-based.

 Sử dụng mã hóa Run- length coding,… (Like JPEG, not use entropy coding)

 CR = 12, 16, 20 tùy theo kích thước block được sử dụng

5/2004

Giải pháp biến đổi không gian màu trong [9]

 Sử dụng phép biến đổi không gian màu RGB sang YCbCr.

 Kỹ thuật mã hóa không được tác giả đề xuất cụ thể

 CR=3 5/2005

Giải pháp đơn giản trong [12]

 Sử dụng phép biến đổi không gian màu

 Sử dụng kỹ thuật mã hóa BTC

 Tỷ số nén CR=3.0 đến 3.42 phụ thuộc vào kích thước block được sử dụng (adsbygoogle = window.adsbygoogle || []).push({});

5/2003

Giải pháp SAMS trong [11]

 Kế thừa của DAMS với sự cải tiến cơ chế ngưỡng cố định bằng cơ chế ngưỡng động dựa trên độ đo SSIM

 CR=6 11/2012

Giải pháp LTC trong [22]

 Sử dụng biến đổi không gian màu RGB sang YCbCr, cùng với các phép biến đổi “lapped transform” và “hadamard transform”. Với cơ chế mã hóa các hệ số của phép biến đổi hadamard theo mặt phẳng bit

 CR = 6 8/2011

Nhóm các giải pháp nén có kiến trúc đơn giản hay không quá phức tạp. Chủ yếu áp dụng phép biến đổi không gian màu và mã hóa khối

Nhóm các giải pháp nén có kiến trúc đơn giản hay không quá phức tạp. Chủ yếu áp dụng phép biến đổi không gian màu và mã hóa khối

Nhóm các giải pháp nén có kiến trúc phức tạp. Chủ yếu áp dụng các phép biến đổi không gian và các phép biến đổi sang miền tần số như biến đổi

DCT hay biến đổi Wavelet.

Nhóm các giải pháp nén có kiến trúc phức tạp. Chủ yếu áp dụng các phép biến đổi không gian và các phép biến đổi sang miền tần số như biến đổi

- Mã hóa dựa trên biến đổi DWT và lựa chọn thích nghi: Một giải pháp nén được đề xuất bởi nhóm tác giải Haksub Kim và Sanghoon Lee là giải pháp DAMS [5] (đề xuất 2011). Giải pháp này cho chất lượng ảnh nén vượt trội khi so sánh với các giải pháp nén ảnh áp dụng cho màn hình tinh thể lỏng cùng giai đoạn được đề xuất trở về

Một phần của tài liệu Nghiên cứu phát triển một số giải pháp nén ảnh tiên tiến cho màn hình tinh thể lỏng (Trang 57)