nổi bật trong thời gian gần đây
Thời gian gần đây, đã xuất hiện hai đề xuất cải tiến mới đáng chú ý. Giải pháp thứ nhất có tên gọi LTC (lapped transform-based codec), đã được J. Wang và các đồng tác giả đề xuất trong [22], nó là giải pháp nén ảnh dựa căn bản trên sự dự đoán để ra quyết định chọn 1 hướng thực hiện biến đổi “hadamard transform” trong 8 hướng căn bản rồi sau đó mã hóa các hệ số biến đổi theo các mặt phẳng bit (hay “bit-plane coding” [22]). Giải pháp này đã áp dụng một số phép biến đổi như: Biến đổi không gian màu RGB sang YCbCr, biến đổi “lapped transform” nhằm hạn chế hiệu ứng nhiễu khối, và biến đổi “hadamard transform”. Giải pháp thứ hai có tên gọi là SAMS (SSIM-based adaptive mode selection) được J. Park và S. Lee đề xuất trong [11]. Đây là phiên bản cải tiến của DAMS, trong đó kỹ thuật lựa chọn thích nghi dựa trên giá trị ngưỡng cố định Rth = 4.5 được thay bằng giá trị ngưỡng Sth được tính toán dựa trên độ đo hiệu năng SSIM (structural similarity), và kỹ thuật lựa chọn thích nghi mới được thực hiện nhằm đạt đến giá trị độ đo SSIM cực đại [11].
ARAIC và WLT-MAIC với hai kết quả mới nhất của những tác giả trên thế giới là LTC (nguồn [22]) và SAMS (nguồn [11]). So sánh giữa Hình 4.26 (a) và (b) cho thấy hai giải pháp của luận án là ARAIC và WLT-MAIC đều cho kết quả vượt trội hơn giải pháp LTC. Trong khi đó nếu xét về độ phức tạp tính toán thì LTC là một giải pháp khá phức tạp khi so với ARAIC (hay WLT-MAIC) bởi nó đòi hỏi biến đổi qua nhiều công đoạn với các phép biến đổi có độ phức tạp tính toán cao như biến đổi “lapped” và biến đổi “hadamard” cùng một cơ chế dự đoán có cấu trúc không đơn giản.
(a) Đánh giá hiệu năng của hai giải pháp ARAIC và WLT-MAIC trên chuỗi khung hình CIF Foreman
(b) Đánh giá hiệu năng của giải pháp LTC trên chuỗi khung hình CIF Foreman (nguồn [22])
(c) Đánh giá hiệu năng của giải pháp LTC trên 19 ảnh thuộc tập “LIVE image quality assessment database release 2” (nguồn [22])
(d) Đánh giá hiệu năng của giải pháp WLT-MAIC trên 19 ảnh thuộc tập “LIVE image quality assessment database release 2”.
Hình 4.26. So sánh hiệu năng nén của 4 giải pháp ARAIC, WLT-MAIC, LTC (nguồn [22]) và SAMS (nguồn [11])
Hình 4.26 (c) và (d) lại cho thấy kết quả vượt trội của WLT-MAIC so với SAMS khi cả hai phương pháp này đều có nguồn gốc kế thừa là DAMS. Song về độ phức tạp tính toán thì dễ thấy SAMS có độ phức tạp tính toán khá cao khi mỗi khối ảnh đầu vào cho quá trình chọn lọc thích nghi đều cần phải tính toán giá trị độ đo SSIM theo công thức sau:
0 50 100 150 200 250 300 30 32 34 36 38 40 42 Frame number P S N R ( d B ) AHIC DAMS ARAIC (K=1) WLT-MAIC
(4.9) Trong đó: X và Y được xem là các khối trước và sau mã hóa, là giá trị trung
bình của khối, và là giá trị phương sai của khối (nguồn [11]).
Rõ ràng việc tính toán giá trị độ đo SSIM theo công thức (4.9) trong bộ chọn lựa thích nghi của SAMS, có độ phức tạp cao hơn nhiều so với công thức tính giá trị độ đo MSE được sử dụng trong WLT-MAIC.
Từ những so sánh và đánh giá trên, có thể nhận định rằng hai kết quả tốt nhất của luận án ARAIC và WLT-MAIC khá vượt trội so với những giải pháp mới và tốt nhất được đã được đề xuất trên thế giới hiện nay.
4.5. Kết luận chƣơng 4
Trong chương này đã trình bày hai giải pháp nén ảnh là DBMAIC và WLT-MAIC. Chúng là hai giải pháp kế thừa và cải tiến từng bước giải pháp nén DAMS. Thông qua đề xuất tích hợp kỹ thuật mới cho phép điều khiển giá trị ngưỡng một cách thích nghi đã hình thành nên giải pháp DBMAIC với chất lượng ảnh vượt trội. Cải tiến tiếp theo là giảm độ phức tạp tính toán thông qua đề xuất tích hợp kỹ thuật biến đổi wavelet số nguyên một chiều, thay thế cho kỹ thuật wavelet số thực hai chiều vốn có độ phức tạp cao trong giải pháp DAMS và DBMAIC, đề xuất này giúp hình thành nên giải pháp WLT-MAIC vượt trội so với giải pháp gốc DAMS về mặt chất lượng nén, và đơn giản hơn về mặt kiến trúc thực thi hay độ phức tạp tính toán khi so sánh với DAMS và DBMAIC. Những ưu điểm đó mang lại cho giải pháp WLT-MAIC tính ứng dụng thực tiễn cao.
Ngoài ta trong chương này cũng đã tiến hành so sánh đánh giá giữa hai kết quả tốt nhất của hai hướng tiếp cận là ARAIC và WLT-MAIC, những so sánh và phân tích chỉ ra rằng mỗi giải pháp có những ưu và khuyết điểm riêng, và khó có thể phủ nhận lẫn nhau trong thực tiễn. Đồng thời luận án cũng đã thực hiện so sánh với hai giải pháp nén nổi bật mới được đề xuất gần đây là LTC và SAMS. Các so sánh trên thực nghiệm và những đánh giá phân tích về mặt cấu trúc thực hiện giải pháp phần nào cho thấy rằng ARAIC và WLT- MAIC là những giải pháp cho hiệu năng vượt trội tính đến thời điểm hiện nay.
CHƢƠNG 5: KẾT LUẬN
5.1. Tóm tắt nội dung nghiên cứu và kết quả mới của luận án
5.1.1. Những nội dung nghiên cứu chính của luận án
Luận án đã tiến hành nghiên cứu những nội dung chính sau đây:
Nghiên cứu cơ sở lý thuyết tổng quan về nén ảnh, các kỹ thuật biến đổi và kỹ thuật lượng tử cùng cách thức áp dụng vào các giải pháp nén.
Nghiên cứu phân tích từ lý thuyết đến thực nghiệm để xác định được nguyên nhân của các tồn tại trong một số giải pháp nén tiên tiến. Trên cơ sở đó đề ra định hướng nghiên cứu cải tiến
Nghiên cứu phát triển một số các kỹ thuật như: kỹ thuật lượng tử hóa, kỹ thuật biến đổi ảnh, kỹ thuật phân phối bit,… làm cơ sở xây dựng nên các giải pháp nén cải tiến, và là nền tảng cốt lõi để phát triển nên các giải pháp đề xuất mới.
Nghiên cứu phát triển các giải pháp nén cải tiến cải thiện hiệu năng.
Nghiên cứu phân tích và tổng hợp những ưu điểm trên các giải pháp nén hiện có và những đề xuất cải tiến của luận án, để từ đó nghiên cứu đề xuất một số giải pháp nén mới với hiệu năng cao hơn và hạn chế các khuyết điểm của những giải pháp đi trước.
Luận án đã triển khai nghiên cứu và phát triển theo hai hướng (xem Hình 5.1):
(1) Hướng thứ nhất: Áp dụng mã hóa khối và biến đổi không gian màu, kết hợp với các kỹ thuật trao đổi hay phân phối bít tối ưu để từng bước hình thành nên những giải pháp cải tiến có tính kế thừa từng bước một theo trật tự MAIC, AAIC, AHAIC, ACAIC, RAIC, và ARAIC. Những phân tích và đánh giá về mặt lý thuyết lẫn thực nghiệm đã cho thấy kết quả sau cùng mà luận án đạt được, giải pháp ARAIC, là một giải pháp tiên tiến về hiện năng.
(2) Hướng thứ hai: Áp dụng biến đổi wavelet và lựa chọn thích nghi, từ đó từng bước phát triển nên các giải pháp cải tiến DBMAIC và WLT-MAIC trên cơ sở giải pháp gốc DAMS. Giải pháp WLT-MAIC có tính kế thừa từ cả hai giải pháp DAMS và DBMAIC cùng kỹ thuật lượng tử MMAUQC được đề xuất trong giai đoạn phát triển giải pháp RAIC. Những phân tích và đánh giá về mặt lý thuyết lẫn thực nghiệm cũng cho thấy WLT-MAIC là một giải pháp tiên tiến về hiện năng.
Hình 5.1. Sơ đồ quá trình đề xuất cải tiến và phát triển các giải pháp nén ảnh của luận án trên cơ sở kế thừa hai giải pháp AHIC và DAMS cùng một số lý thuyết nền tảng. Các giải pháp MAIC, AAIC, AHAIC, ACAIC, RAIC, DBMAIC là những kết quả trung gian và đã được trình bày trong các bài báo từ 1 đến 7 trong danh mục các công trình đã công bố của luận án. Hai giải pháp đề xuất chính yếu của luận án là ARAIC và WLT-MAIC.
5.1.2. Các kết quả mới của luận án
Dưới đây là những kết quả mới mà luận án đã đạt được:
A. Đề xuất được 2 giải pháp nén ảnh cho màn hình tinh thể lỏng theo hai hướng tiếp cận là:
1. Giải pháp nén ARAIC (Advanced Robust Adaptive Image Coding).
2. Giải pháp nén WLT-MAIC (Wavelet Lifting Transform Base Multi-Adaptive Image Coding).
Những so sánh và đánh giá giữa hai giải pháp nén ARAIC và WLT-MAIC với những giải pháp tốt nhất mới được đề xuất gần đây trên thế giới cho thấy tính vượt
Giải pháp nén ảnh cho màn hình tinh thể lỏng AHIC DAMS MAIC AHAIC AAIC ACAIC RAIC ARAIC DBMAIC WLT-MAIC Tích hợp kỹ thuật ngưỡng thích nghi Tích hợp biến đổi Wavelet Lifting integer to integer
Cải tiến hàm phân phối CBBDT dựa trên giá trị
Max(Bloc)
Đề xuất hàm phân phối RBBDT, Hàm lượng tử MMAUQC, và mô
hình mã hóa MAQC
Áp dụng mô hình đa thích nghi đồng bộ cho cả ba thành phần Y, Cb, và Cr dựa trên cải tiến MAQC
Cá c k ết q u ả tru n g g ia n c ủ a l u ận á n
trội về hiệu năng của ARAIC và WLT-MAIC. Đồng thời những so sánh đánh giá giữa ARAIC và WLT-MAIC cho thấy hai giải pháp theo hai hướng tiếp cận này có những ưu điểm riêng và không thể phủ định lẫn nhau.
B. Đề xuất cải tiến một số kỹ thuật lượng tử hóa, kỹ thuật trao đổi hay phân phối bit tối ưu cho màn hình và có thể áp dụng vào lĩnh vực xử lý tín hiệu số:
1. Các kỹ thuật lượng tử MUQ (Midrise Uniform Quantizer), MMAUQC (Min- Max Adaptive Uniform Quantization Coding)
2. Các kỹ thuật trao đổi hay phân phối bit gồm: Kỹ thuật trao đổi bit CBBET (Content-based Bit Exchange Techniques), kỹ thuật phân phối bit dựa trên bước lượng tử Qstep hoặc dựa trên giá trị cực đại trị tuyệt đối của các khối CBBDT (Content-based Bit Distribution Techniques), và kỹ thuật phân phối bit dựa trên giá trị phạm vi của khối RBBDT (Range-based Bit Distribution Techniques) có độ phức tạp tính toán thấp.
Đặc biệt, giải pháp nén WLT-MAIC đã được Qualcomm Canada xem xét và đánh giá cao như một giải pháp cho phép “nén ảnh và video với hiệu năng bảo tồn thị giác (visual lossless quality)”, chi tiết xin xem phần phụ lục.
5.2. Hƣớng phát triển
Bài toán nén ảnh giảm bộ nhớ khung hình (Frame Memory) có nhiều áp dụng trong nhiều lĩnh vực, và áp dụng cho hệ thống Overdrive của LCD chỉ là một trong số đó. Một áp dụng khác hiện đang được nhiều nhà khoa học trên thế giới quan tâm là áp dụng vào vi xử lý video để giảm yêu cầu về dung lượng và băng thông của bộ nhớ khung hình cho chíp xử lý hiển thị video [31]. Bởi vi xử lý video các loại thường có phần bộ nhớ khung hình phục vụ cho việc tham chiếu dữ liệu hình ảnh trong các giải pháp nén hay giải nén video, nâng cao chất lượng hình ảnh video hay tạo hiệu ứng 3D,… Yêu cầu về dung lượng và tốc độ truy xuất dữ liệu bộ nhớ khung hình sẽ bị đẩy lên mức rất cao khi áp dụng các chuẩn UHD 2K/4K/8K. Từ đó việc áp dụng nén ảnh vào trong chíp vi xử lý video sẽ giúp giảm yêu cầu về băng thông và dung lượng của bộ nhớ khung hình. Đây sẽ là hướng nghiên cứu phát triển tiếp theo của luận án.
TÀI LIỆU THAM KHẢO
[1] A. K. Jain (1989). Fundamentals of digital image processing. Prentice-Hall. [2] C.T. Le Dinh (2003). Traitement Vidéo. University of Sherbrooke, Notes de cours. [3] C.T. Le Dinh (2010). Private Communication. University of Sherbrooke.
[4] H. Kawamoto (2002). The History of Liquid-Crystal Displays. Proceedings of the IEEE, vol. 90, no. 4, pp. 460-500.
[5] H. S. Kim, S. H. Lee (2011). Implementation of DWT-Based Adaptive Mode Selection for LCD Overdrive. IEEE Transactions on Consumer Electronics, vol. 57, No. 2, pp. 771-778.
[6] H. Sheikh, Z. Wang, L. Cormack, A. Bovik (2012). LIVE image quality assessment database release 2.
[7] I. Daubechies (1990). The Wavelet Transform, Time-Frequency Localization and Signal Analysis. IEEE Trans. on Inform. Theory, Vol. 36, No. 5 , pp. 961-1005.
[8] I. Daubechies (1992). Ten Lectures on Wavelets. SIAM, CBMS series, Philadelphia. [9] I. J. Chun, H. Mun, J. H. Sung, S. Y. Park, B. G. Kim (2006). Overdrive frame memory
reduction using a fast discrete wavelet transform. Proc. of 21st Int. Technical Conf. on Circuits/Systems, Computer and Communications (ITC-CSCC’06), Chiang Mai, Thailand, pp. 161-164.
[10]J. K. Sung, C. G. Kim, J. K. An, M. H. Park, S. D. Yeo (2005). A new method for improvement of response time by data compression using color space conversion. SID Symposium Digest of Technical Papers, vol. 36, no.1, pp. 474-477.
[11]J. Park, S. Lee (2012). Structural Similarity based Image Compression for LCD Overdrive. IEEE Transactions on Consumer Electronics, vol. 58, no. 4, pp. 1276- 1284. [12]J. Someya, M. Yamakawa, E. Gofuku (2002). Reduction of memory capacity in feedforward driving by image compression. SID Symposium Digest of Technical Papers, vol. 33, no.1, pp. 72-75.
[13]J. Someya, N. Okuda, H. Tachibana (2003). A new LCD controller for improvement of response time by compression FFD. SID Symposium Digest of Technical Papers, vol. 34, no.1, pp. 1346-1349.
[14]J. Someya, N. Okuda, M. Yamakawa (2003). The motion adaptive CODEC feedforward driving (macFFD) for HDTV. SID Symposium Digest of Technical Papers, vol. 34, no.1, pp. 149-151.
[15]J. Someya, N. Okuda (2004). A study of motion adaptive CODEC feedforward driving without SDRAM. SID Symposium Digest of Technical Papers, vol. 35, no.1, pp. 417- 419.
[16]J. S. Lim (1990). Two-Dimensional Signal and Image processing. Prentice-Hall. [17]J. Wang, K. Y. Min, J. W. Chong (2007). A hybrid image coding in overdrive for
motion blur reduction in LCD. Proc. of 6th Int. Computer Entertainment Computing (ICEC’07), Shanghai, China, pp. 263-270.
[18]J. Wang, K. Y. Min, J. W. Chong (2008). A High compression ratio image coding for frame memory reduction in LCD Overdrive. The 23rd International Technical Conference on Circuits/Systems, Computers and Communications (ITC-CSCC 2008), vol. 55 , No. 1.
[19]J. Wang, J. W. Chong (2009). High Performance Overdrive Using Improved Motion Adaptive Codec in LCD. IEEE Transactions on Consumer Electronics, vol. 55, No. 1, pp. 20-26.
[20]J. Wang, L. B. Luo, K. Y. Min, Y. C. Jeung, J. W. Chong (2010). Single Bit Plane Based Block Truncation Coding for Color Image Compression in LCD Overdrive. Consumer Electronics (ICCE), 2010 Digest of Technical Papers International Conference, pp. 53-54.
[21]J. Wang, J. W. Chong (2010). Adaptive Multi-level Block Truncation Coding for Frame Memory Reduction in LCD Overdrive. IEEE Transactions on Consumer Electronics, Vol. 56, No. 2.
[22]Jun Wang, Bormin Huang, Jiaji Wu, Jong-Wha Chong (2011). Lapped transform- based codec for frame-memory reduction in super-quality LCD overdrive. Journal of the Society for Information Display, vol. 19, Iss. 8, pp. 551-560.
[23]J. W. Chong (2009). Image and Video Signal Processing Technology. Seminar document, Waseda University.
[24]J. W. Han, M. C. Hwang, S. J. Ko (2008). Vector quantizer based block truncation coding for color image compression in LCD overdrive. IEEE Transactions on Consumer Electronics, vol. 54, no. 4, pp. 1839-1845.
[25]K. Nakanishi, S. Takahashi, H. Oura, T. Matsumura, S. Miyake, K. Kobayashi, K. Oda, S. Tahata, A. Yuuki, J. Someya, M. Yamakawa (2001). Fast Response 15-in. XGA TFT-LCD with Feedforward Driving (FFD) Technology for Multimedia Applications. SID ’01 Digest, pp. 488-491.
[26]Mauro Barni (2006). Document and Image Compression. Taylor & Francis.
[27]Mary Bellis, “Liquid Crystal Display (LCD) - Invention and History – Inventors”, Link: http://inventors.about.com/od/lstartinventions/a/LCD.htm
[28]R. H. M. Wubben, G. J. Hekstra (2004). LCD overdrive frame memory reduction using scalable DCT-based compression. SID Symposium Digest of Technical Papers, vol. 35, no.1, pp. 1348-1351.
[29]S. Mallat (1989). A Theory for Multiresolution Signal Decomposition: The Wavelet Representation. IEEE Trans. on Pattern Analysis and Machine Intelligence, Vol. 11, No. 7, pp. 674-693.
[30]T. Acharya, P.S. Tsai (2005). JPEG2000 Standard for Image Compression. John Wiley & Sons.
[31]Vladimir Lachine, Chon-Tam Le Dinh, Dinh Kha Le, Jeffrey Wong (2014). Fixed tile rate codec for bandwidth saving in video processors. Proc. SPIE 9030, Mobile Devices and Multimedia: Enabling Technologies, Algorithms, and Applications 2014.
[32]Z. Wang, A. C. Bovik, H. R. Sheikh, E. P. Simoncelli (2004). Image quality assessment: From error visibility to structural similarity. IEEE Transactions on Image Processing, vol. 13, no. 4, pp. 600-612.
[33]http://trace.eas.asu.edu/yuv/index.html [34]ftp://vqeg.its.bldrdoc.gov/MM/cif/
DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ CỦA LUẬN ÁN
1. Tai Nguyen Huu, Hoang-Lan Nguyen Thi, Chon-Tam Le Dinh (2011). Content- based Bit Exchange Techniques for Frame Delay Memory Application. Proceeding of the 6th IEEE Conference on Industrial Electronics and Applications, pp 107-112, Beijing, China, ISBN: 978-1-4244-8756-7, DOI: 10.1109/ICIEA.2011.5975559. 2. Tai Nguyen Huu, Hoang-Lan Nguyen Thi, Chon-Tam Le Dinh (2011). Advanced
Content-Adaptive Image Coding for Frame Memory Reduction in LCD Overdrive. Proceeding of the Conference on ICT Celebrating the 55th Anniversary of Hanoi University of Science and Technology – colocated with the Short Paper Track of SoICT October 2011, pp 12-16, ISBN: 978-604-911-032-0.
3. Nguyễn Hữu Tài, Nguyễn Thị Hoàng Lan (2012). Nghiên cứu cải tiến chất lượng nén ảnh trong LCD. Tạp chí Tin học và Điều khiển học, trang 215-233, T.28, S.3, ISSN 1813-9663.
4. Tai Nguyen Huu, Hoang-Lan Nguyen Thi (2012). Avanced High-Adaptive Image Coding for Frame Memory Reduction in LCD overdrive. Proceeding of the 2012 IEEE-RIVF International Conference on Computing and Communication Technologies - Research, Innavation and Vision for the Future, HCM City, Vietnam, pp 260-265, IEEE Catalog Number: CFP1256A-PRT, ISBN: 978-4673-