Hình 2.7. Mô hình một hệ thống overdrive có sử dụng kỹ thuật nén ảnh nhằm giảm yêu cầu về dung lượng và tốc độ truy xuất dữ liệu của bộ nhớ khung hình.
Mô hình của một hệ thống overdrive trong màn hình tinh thể lỏng có sử dụng kỹ thuật nén ảnh nhằm giảm yêu cầu về dung lượng và tốc độ trao đổi dữ liệu của bộ nhớ khung hình được thể hiện qua Hình 2.7. Trong đó, dữ liệu của ảnh khung hình hiện tại (Fn) được nén lại bởi bộ nén (frame encoder) để giảm dung lượng trước khi chuyển vào frame memory, đồng thời bộ giải nén (frame decoder) sẽ đọc dữ liệu nén trong frame memory để
Overdrive
(LUT)
Dữ liệu khôi phục của khung hình thời điểm trước
Overdriven Frame Dữ liệu khung hình hiện tại
Fn Frame memory Dữ liệu khung hình Frame encoder Frame decoder 𝐹 𝑛−1 Codec module
khôi phục lại dữ liệu ảnh khung hình ở thời điểm trước đó (Fn-1) cung cấp cho bộ overdrive, nhằm phối hợp với dữ liệu của ảnh khung hình hiện tại để tìm ra điện áp tăng tốc.
Hình 2.8. thể hiện phạm vi áp dụng của bài toán nén ảnh khung hình cho màn hình tinh thể lỏng là ở khâu tái tạo và hiển thị.
Hình 2.8. Phạm vi áp dụng của bài toán nén ảnh khung hình cho màn hình tinh thể lỏng độ phân giải cao.
Ở đây có một số khái niệm cần làm rõ:
+ Ảnh khung hình trong hệ thống overdrive, chính là một ảnh để có thể hiện thị đầy đủ trên màn hình tinh thể lỏng, có số điểm ảnh tương ứng với độ phân giải màn hình được xác định bởi nhà sản xuất. Do đó ảnh khung hình của màn hình tinh thể lỏng độ phân giải cao sẽ có số điểm ảnh rất lớn, và đòi hỏi cao về dung lượng frame memory để lưu trữ.
+ Tốc độ hiển thị khung hình của màn hình tinh thể lỏng được xác định bởi nhà sản xuất chứ không phụ thuộc vào định dạng video cần hiển thị. Hiện nay hầu hết các nhà sản xuất đều đã cho ra đời các sản phẩm màn hình có tốc độ khung hình là 120fps, độ phân giải siêu cao (4K đến 8K), các sản phẩm này thường có bộ chuyển đổi cho phép chuyển đổi độ phân giải và tốc độ khung hình của nguồn dữ liệu đầu vào cho phù hợp với các thông số của màn hình trước khi được chuyển đến hệ thống hiện thị.
Vấn đề đặt ra cho bài toán nén ảnh khung hình cho màn hình tinh thể lỏng độ phân giải cao là:
- Đầu vào là ảnh khung hình có độ phân giải cao, với rất nhiều điểm ảnh cần xử lý. - Đầu ra để phục vụ cho khâu hiện thị ảnh trên màn hình.
chụp, quay
(camera) Nén dữ liệu
Quan sát không gian đối tượng
File ảnh/video
Giải nén dữ liệu Tái tạo và hiển thị trên
màn hình tinh thể lỏng Tr u yề n tr ự c t iế p q u a cá c k ên h : v ệ t in h , c áp ,.. . Vấn đề nén ảnh cho màn hình tinh thể lỏng phục vụ cho khâu
tái tạo và hiển thị
Áp dụng các chuẩn nén ảnh/video thông dụng: JPEG, MPEG, AVI,...
- Bộ nén (codec) phải thực hiện đồng thời hai nhiệm vụ nén dữ liệu (encode) và giải nén dữ liệu (decode) với khối lượng dữ liệu lớn trong một khoảng thời gian ngắn, ví dụ với màn hình có tốc độ 120fps thì khoảng thời gian chỉ ở mức 1/120 giây. Vì vậy bộ nén phải đảm bảo tốc độ xử lý cao.
- Chất lượng ảnh phải cao để đảm bảo độ trung thực cho hệ thống hiển thị.
- Tỷ số nén lớn và độ phức tạp tính toán không cao để đảm bảo tính thực tiễn khi triển khai áp dụng thực tiễn.
Với những yêu cầu trên, có thể thấy giải quyết bài toán nén ảnh khung hình cho màn hình tinh thể lỏng độ phân giải cao là một nhiệm vụ không đơn giản. Cần có những nghiên cứu để có thể đưa ra được các giải pháp nén phù hợp với những yêu cầu nói trên. Để có thể triển khai áp dụng vào thực tiễn nhằm giảm giá thành cho hệ thống overdrive.
2.3.3. Các đặc trƣng của phƣơng pháp nén ảnh áp dụng cho hệ thống Overdrive
Từ bối cảnh thực tế của bài toán nén ảnh khung hình và mô hình hệ thống overdrive có áp dụng các khối nén và giải nén ở trên, có thể rút ra một số đặt trưng của phương pháp nén ảnh áp dụng cho hệ thống Overdrive như sau:
1. Bài toán nén ảnh khung hình trong màn hình tinh thể lỏng là nhằm mục đích giảm yêu cầu về dung lượng và tốc độ trao đổi dữ liệu (hay băng thông) của bộ nhớ khung hình trong hệ thống overdrive, giúp giảm giá thành chế tạo hệ thống overdrive tiến đến giảm giá thành sản phẩm. Khác với phần lớn các phương pháp nén ảnh hay video thông thường vốn nhằm mục đích giảm dung lượng lưu trữ trên các thiết bị nhớ hoặc giảm băng thông trên đường truyền mạng.
2. Tỷ số nén đạt được phải có tính ổn định, ví dụ Cr = 2, 3, 4, hay 6, để các nhà sản xuất có thể xác định được chính xác thông số cần chế tạo. Đây cũng là điểm khác biệt so với các phương pháp nén ảnh thông thường nhằm giảm dung lượng lưu trữ như chuẩn JPEG hay JPEG2000, với tỷ số nén phụ thuộc phần lớn vào nội dung của ảnh và mức độ tổn hao mà người dùng chọn lựa.
3. Sự tổn hao do nén phải ở mức thấp để giảm thiểu ảnh hưởng (gián tiếp qua hệ thống overdrive) đến chất lượng hiện thị hình ảnh trên màn hình. Từ đó yêu cầu đặt ra cho các giải pháp nén ảnh khung hình là chất lượng ảnh khôi phục phải cao. Đồng thời hình ảnh hiện thị trên màn hình phải đảm bảo tính trung thực về thị giác trong bối cảnh các hình ảnh được hiển thị liên tục (60fps hay 120fps), tránh hay giảm thiểu các hiện tượng nhiễu (noise), rung (vibrate effect), khối (blocking effect) vốn rất nhạy cảm với mắt người xem khi quan sát chuỗi hình ảnh liên tục. Đây là điểm khác biệt so với các chuẩn nén ảnh JPEG hay JPEG2000. Bối cảnh áp dụng thông thường của JPEG hay JPEG2000 là nén các bức ảnh rời rạc (không thể hiện tính liên tục của chuyển động như trong video), các hình ảnh giải nén sau đó thường được in ấn hay hiển thị rời rạc, do đó một số khiếm khuyết về đường nét chi tiết trên ảnh nén cũng khó được người xem nhận ra khi quan sát thông thường.
Đây chính là một trong các yêu tố giúp những chuẩn nén ảnh như JPEG hay JPEG2000 nâng tỷ số nén lên rất cao, đổi lại bằng sự suy giảm chất lượng ảnh khôi phục, nhưng vẫn dễ dàng nhận được sự chấp nhận của người dùng.
4. Đảm bảo khả năng thực hiện theo thời gian thực (real time), hay nói cách khác là tốc độ xử lý phải đảm bảo sự đồng bộ giữa các bộ phận trong hệ thống overdrive theo đúng tốc độ được đặt ra cho toàn bộ hệ thống. Đồng thời yêu cầu độ phức tạp tính toán và kiến trúc thực thi cho giải pháp phải ở mức chấp nhận được theo nghĩa: không yêu cầu một kiến trúc phần cứng cồng kềnh phức tạp, năng lực xử lý mạnh (High-Powered Processors), vì như thế sẽ làm cho giá thành của hệ thống overdrive tăng lên, làm giảm hay mất đi tính khả thi về mặt kinh tế. Đây cũng là điểm khác biệt so với các giải pháp nén ảnh thông thường, vốn chỉ nén các bức ảnh rời rạc để lưu trữ nên chủ yếu đặt nặng vấn đề tỷ số nén, không đòi hỏi quá cao về mặt tốc độ, và có thể chấp nhận các thuật toán khá phức tạp vì không đòi hỏi sự đồng bộ khắc khe.
2.4. Mô hình hệ thống nén ảnh dùng cho hệ thống overdrive
2.4.1. Hệ thống nén ảnh khung hình
Từ các đặc trưng của giải pháp nén ảnh áp dụng cho hệ thống overdrive là phải có tỷ số nén ổn định, theo nghĩa phải đạt được tỷ số nén luôn nhỏ hơn hoặc bằng một hằng số. Và hơn thế nữa là một tỷ số nén cao nhằm tối đa hóa hiệu xuất cải thiện dung lượng bộ nhớ và băng thông, vì vậy các giải pháp nén ảnh đề xuất áp dụng cho hệ thống overdrive nói chung đều ở dạng có mất mát thông tin (lossy) hoặc mất mát rất ít thông tin (near-lossless), thường áp dụng kỹ thuật mã hóa với độ dài từ mã cố định (Fixed-Length Codeword) để luôn đạt được một tỷ số nén ở mức đáng kể và có tính ổn định, có thể áp dụng lên phần cứng (hardware).
Dựa trên mô hình áp dụng cho các giải pháp nén ảnh trong truyền thông nói chung với ba thành phần chính gồm: Biến đổi, Lƣợng tử hóa, và Mã hóa (Hình 2.9). Cùng với sự phân tích các đặc trưng riêng mà một giải pháp nén áp dụng cho hệ thống overdrive cần có. Chúng tôi đề nghị mô hình khái quát chung với ít nhiều chi tiết dễ hiểu cho giải pháp nén ảnh áp dụng vào hệ thống overdrive như thể hiện trong Hình 2.10 sau đây:
Hình 2.9. Mô hình với ba thành phần chính trong một hệ thống nén ảnh áp dụng trong truyền thông. Dữ liệu ảnh nguồn (Image source) Biến đổi (Transformation) Lượng tử hóa (Quantization) Mã hóa (Encode) Dữ liệu nén (Data coded)
Hình 2.10. Mô hình khái quát với bốn thành phần chính trong một hệ thống nén ảnh áp dụng cho overdrive trong màn hình tinh thể lỏng.
Về mặt nguyên lý, mô hình chung giải pháp nén ảnh áp dụng cho hệ thống overdrive trong màn hình tinh thể lỏng sử dụng ba thành phần chính như đã nêu trong mô hình chung của giải pháp nén cho truyền thông. Tuy nhiên có một số điểm khác sau:
- Mã hóa: có hai kỹ thuật mã hóa chính là gán từ mã có cùng độ dài (uniform-length hay fixed-length) vốn rất đơn giản và sẽ cho ra một tỷ số nén cố định. và gán từ mã với độ dài biến đổi (variable-length) dựa trên số liệu thống kê hay độ đo entropy của thông tin với độ phức tạp tính toán khá cao và không đảm bảo một tỷ số nén ổn định cần thiết cho mô hình nén trong hệ thống overdrive. Qua nghiên cứu các giải pháp nén ảnh cho màn hình tinh thể lỏng đã được đề xuất, tất cả đều sử dụng kỹ thuật gán từ mã cố định. Đó chính là lý do cho đề xuất chỉ sử dụng dạng uniform-length codeword assignment
trong luận án này.
- Bộ đệm dòng: để nhấn mạnh số dòng cần tích lũy (không thể là toàn bộ bức ảnh) trước khi thực hiện các công đoạn biến đổi hay lượng tử, được xem xét như một phần của sự phức tạp trong kiến trúc thực thi của giải pháp nén.
Một số tính chất sau cũng cần được đảm bảo khi nghiên cứu đề xuất một giải pháp nén ảnh cho hệ thống ovedrive trong màn hình tinh thể lỏng:
Các phép biến đổi và lượng tử hóa xử lý với dữ liệu đầu vào là các dòng ảnh (line image) hoặc khối ảnh (block image), và việc lựa chọn kích thước của dòng ảnh hay khối ảnh luôn cần được cân nhắc và đánh giá, bởi ngoài mối liên hệ đến chất lượng và tỷ số nén nó còn liên quan đến kích thước bộ đệm dòng (N-line buffer), vốn được thiết kế bởi SRAM nhằm đảm bảo tốc độ liên kết giữa memory (cache) và bộ xử lý ảnh được đồng bộ. Vì vậy việc xem xét đánh giá hay nghiên cứu đề xuất các giải pháp nén ảnh cho overdrive rất cần xem xét đến yếu tố kích thước bộ đệm dòng như là một phần chủ đề của sự phức tạp cho phần cứng.
Để tăng hiệu quả của giải pháp nén ảnh, thông thường người ta có xu hướng sử dụng kết hợp một vài phép biến đổi với nhau, song trong lựa chọn này nhất thiết phải chú ý đến độ phức tạp tính toán và khả năng thực hiện thời gian thực.
Việc chọn lựa giải pháp mã hóa cũng cần có chú ý tương tự. Để đảm bảo độ phức tạp tính toán chung của cả giải pháp nén, và khả năng thực hiện thời gian thực. Như đã được đề cập ở trên, rõ ràng phương pháp nén ảnh áp dụng cho hệ thống overdrive có những đặc trưng riêng, chuyên biệt cho bài toán nén nhằm giảm dung lượng
Biến đổi (Transformation) Lượng tử hóa (Quantization) Dữ liệu ảnh đầu vào cho LCD (dạng tuần tự) Bộ đệm dòng (N-Line buffer) Gán từ mã có cùng độ dài (Uniform-Length Codeword Assignment ) Dữ liệu nén (Data coded)
cũng như tốc độ truyền tải dữ liệu của bộ nhớ khung hình. Trong phần tiếp theo luận án sẽ trình bày chi tiết về một số độ đo hiệu năng giải pháp nén ảnh khung hình làm công cụ cho việc xem xét và đánh giá các giải pháp nén ảnh khung hình.
2.4.2. Các độ đo hiệu năng giải pháp nén ảnh khung hình
2.4.2.1. Tỷ số nén
Tỷ số nén ảnh là một số đo dung lượng (DL) của ảnh gốc (ảnh chưa nén) chia cho dung lượng ảnh đã được nén (hay mã hóa) và được kí hiệu là Cr (Compression Ratio):
( 𝑛 𝑛 𝑛) ( 𝑛 𝑛 𝑛) (2.1) Đối với phần lớn các giải pháp nén ảnh cho màn hình tinh thể lỏng sử dụng phương pháp mã hóa khối ảnh, có nghĩa là ảnh được chia ra theo các khối bằng nhau rồi lần lượt mã hóa từng khối theo thứ tự, với đầu vào bằng nhau sẽ luôn tạo đầu ra là dòng bit dữ liệu đã được mã hóa có kích thước giống nhau, vì thế tỷ số nén còn được tính bởi công thức:
( 𝑛 𝑛) ( 𝑛 𝑛) (2.1 c) Ví dụ: Trên một ti-vi LCD chuẩn full HD, thì ảnh khung hình của nó sẽ là một ảnh màu có kích thước 1920×1080 với 3 kênh màu RGB-24bit. Khi được áp dụng giải pháp nén theo khối với kích thước khối là 32×4 sẽ được chia ra làm 16200 khối. Giả sử mỗi khối đầu vào sẽ được nén lại với 512bit dữ liệu mã hóa, thì tỷ số nén sẽ được tính là:
( ) ( )
Trong một số trường hợp, khi mà kích thước của ảnh khung hình không phải là bội số của kích thước khối ảnh (block), thì người ta thường sử dụng phương án bổ sung thêm các dòng ảnh hoặc cột ảnh (hoặc cả hai) để sau đó ảnh có thể chia thành các khối đồng kích thước.
2.4.2.2. Chất lƣợng nén - Các độ đo sai số
Để đánh giá sự khác biệt của ảnh khôi phục sau khi nén so với ảnh gốc qua một đại lượng đo lường thể hiện bằng một con số, giúp dễ dàng đánh giá và so sánh đối chiếu, người ta thường sử dụng một số độ đo sau:
Sai số trung bình bình phương (Mean Squared Error -MSE)
Tỷ số tín hiệu mức đỉnh /nhiễu (Peak Signal-to-Noise Ratio - PSNR)
Gọi 𝐹 và 𝐹 lần lượt là các ma trận dữ liệu ảnh gốc và dữ liệu ảnh khôi phục sau khi nén. Trong không gian màu RGB ảnh được biểu diễn bởi ba ảnh đơn sắc tương ứng với ba thành phần màu Red, Green và Blue, vì vậy 𝐹 (𝐹 𝐹 𝐹 ) và 𝐹 (𝐹 𝐹 𝐹 ) trong đó
mỗi thành phần là một ma trận hai chiều có kích thước M dòng và N cột tương ứng với kích thước của ảnh. Gọi L là giá trị mức đỉnh của tín hiệu ảnh, với ảnh màu RGB-24bit hay 8bit cho mỗi kênh màu thì L = 28 – 1 = 255. Các độ đo MSE và PSNR cho mỗi thành phần ảnh đơn sắc cũng như ảnh màu RGB được tính theo các công thức sau:
( ∑ ∑ (𝐹 ( 𝑛) − 𝐹 ( 𝑛)) ) (2.2) ( ∑ ∑ (𝐹 ( 𝑛) − 𝐹 ( 𝑛)) ) (2.3) ( ∑ ∑ (𝐹 ( 𝑛) − 𝐹 ( 𝑛)) ) (2.4) ( ) (2.5) ( ) (2.6) ( ) (2.7) ( ) (2.8) ( ) (2.9)
Trong hai độ đo trên, độ đo PSNR được sử dụng phổ biến hơn cả trong lĩnh vực nén ảnh nhờ tính dễ hiểu và dễ so sánh hợp lý của nó so với MSE. Có thể nói độ đo PSNR được sử dụng trong hầu hết các đánh giá khoa học về chất lượng nén ảnh. Có thể lý giải điều này qua đồ thị biến thiên của PSNR theo MSE như Hình 2.11 dưới đây:
Hình 2.11. Đồ thị biến thiên của PSNR theo MSE (với L=255).
Có thể nói PSNR chính là một phiên bản đảo chiều của MSE và kéo giãn những giá trị MSE rất bé (hay ứng với ảnh nén chất lượng cao, hình đẹp) ra trên một khoảng rộng để dễ bề so sánh đánh giá, và ngược lại những giá trị MSE lớn (hay ứng với ảnh nén chất lượng
0 2000 4000 6000 8000 0 20 40 60 80 100 MSE P S N R ( d B ) PSNR function
thấp, hình xấu) sẽ được nén lại trên một khoảng hẹp. Theo các chuyên gia, với thang đo PSNR thì ảnh khoảng từ 30dB trở lên có thể xem là có chất lượng; dưới 30dB, chất lượng