1.3 Video kỹ thuật số
1.3.3 Cấu trỳc mó húa video
1.3.3.1 Nộn video
Hỡnh 1.4a [52] là mó húa của một khung hỡnh riờng rẽ. Đõy được gọi là mó húa đơn khung hay mó húa khụng gian (spatial compress). Một lợi điểm của việc nộn trong khung hỡnh là cú thể biờn tập trực tiếp từng khung hỡnh một khụng cần liờn quan tới cỏc khung hỡnh khỏc trong chuỗi.
Một số chuẩn nộn sử dụng nộn trong ảnh là Digital Betacam, DVC, D-9. Chuẩn ISO JPEG là một trong cỏc chuẩn nộn kiểu này. Ứng dụng của chuẩn JPEG trong truyền hỡnh là ‘Motion JPEG’.
Hệ số nộn cao hơn thu được bằng cỏch giảm lượng dư thừa thụng tin từ ảnh này so với ảnh trước đú. Nộn theo cỏch này là nộn theo trục thời gian. Được gọi là nộn liờn khung hay inter- coding compress. Nộn kiểu này cho hệ số nộn cao nhưng cú một nhược điểm là một ảnh chỉ cú được bằng cỏch cú ảnh trước đú cộng thờm với phần sai khỏc. Việc can thiệp vào một ảnh riờng lẻ trong dũng bit MPEG là khụng thể và sự sai lệch của một ảnh cú thể kộo theo sự khụi phục khụng chớnh xỏc cho cỏc ảnh tiếp theo đú.
Hỡnh 1.4 (a) Nộn trong khung hỡnh chỉ làm việc trờn 1 khung hỡnh đơn duy nhất.
(b) Nộn liờn khung hỡnh làm việc với một chuỗi cỏc khung hỡnh.
1.3.3.2 Nộn trong khung hỡnh.
Đõy là loại nộn làm giảm độ dư thừa trong miền khụng gian, chỉ thực hiện nộn trờn dữ liệu của một ảnh, khụng sử dụng thụng tin của cỏc ảnh trước hoặc sau đú.
Phõn tớch hỡnh ảnh TV thụng thường chỉ ra rằng cỏc thành phần tần số cao thể hiện chi tiết của hỡnh ảnh và chỉ cú phần nhỏ năng lượng là của cỏc thành phần này. Trong hỡnh ảnh cũng tồn tại những vựng mà trong đú cỏc điểm là tương tự giống nhau, những điểm như thế này nằm ở vựng tần số thấp. Vựng cú độ sỏng như nhau nằm ở tần số bằng 0. Việc bỏ qua những vựng cú tần số cao là khụng thể được bởi nú tạo nờn độ rừ ràng, mềm mại của hỡnh ảnh.
Tuy vậy cỏc thành phần tần số cao chỉ chiếm một phần nhỏ năng lượng nờn cần ớt bit để mó húa hơn, đồng thời sai số ở những vựng cú tần số cao thỡ con người cũng khú nhận biết hơn. Nhờ sử dụng đặc điểm này mà việc nộn trở nờn cú hiệu quả.
(a) Nộn trong khung hỡnh, loại bỏ phần dư
thừa của khung hỡnh.
(b) Nộn liờn khung,
loại bỏ phần dư thừa
14
1.3.3.3 Nộn liờn khung hỡnh.
Dữ liệu video được tạo thành từ cỏc khung hỡnh video. Nộn liờn ảnh sử dụng tớnh chất tương tự giữa cỏc ảnh kế tiếp. Trong trường hợp đơn giản nhất, mỗi khung hỡnh video lưu trữ một hỡnh ảnh được hiển thị trong thời gian phỏt khung hỡnh (bằng nghịch đảo của tốc độ khung hỡnh) trờn màn hỡnh. Tuy nhiờn, cú một sự tương quan mạnh mẽ giữa cỏc khung hỡnh ảnh liờn tiếp bởi vỡ những cảnh – scence - thường thay đổi chậm theo thời gian. Vỡ vậy, truyền mỗi khung hỡnh độc lập với tất cả cỏc khung lõn cận của nú rất lóng phớ – cỏc khung hỡnh kế tiếp mang nhiều thụng tin dư thừa khụng cần thiết. Bộ mó hoỏ video hiệu quả sẽ loại bỏ sự dư thừa này và làm giảm kớch thước (số byte) của video. Với phương phỏp mó hoỏ liờn khung hỡnh một chuỗi video cú 3 kiểu khung hỡnh: khung hỡnh I (khung chớnh), P (khung hỡnh dự đoỏn) hoặc B (hai chiều) trong đú:
Khung hỡnh I (Intra-picture): là khung hỡnh chỉ sử dụng nộn trong ảnh, mang thụng tin về một khung hỡnh hoàn chỉnh. Khung hỡnh I cho phộp truy cập ngẫu nhiờn, cú độ nộn thấp nhất. Khung hỡnh P (Predicted-picture): khung hỡnh dự đoỏn trước, là khung hỡnh được mó húa cú bự chuyển động từ khung I hoặc khung P trước đú.
Khung hỡnh B (Bi-directional predicted picture): khung hỡnh dự đoỏn hai chiều, là khung hỡnh được mó húa sử dụng bự chuyển động từ cỏc khung hỡnh I hoặc P trước và sau. Cỏc khung hỡnh B cho hệ số nộn là cao nhất.
Trật tự xỏc định và tần số xuất hiện của cỏc khung I, P, B trong cỏc tập tin video. I-frame, xuất hiện đều đặn tại cỏc đoạn, phõn chia cỏc đoạn video thành "Nhúm cỏc hỡnh ảnh" hay GOP mụ tả trong hỡnh 1.5. Khung hỡnh I được mó húa một cỏch độc lập với cỏc khung hỡnh khỏc và vỡ vậy nú cú thể được giải mó một cỏch độc lập. Khung P-frame được mó húa bằng cỏch lưu trữ delta giữa khung hỡnh trước và khung hỡnh đang được mó húa, bởi vậy việc giải mó một khung hỡnh P phụ thuộc vào sự chớnh xỏc trong việc giải mó cỏc khung hỡnh trước đú. Một khung hỡnh B-frame được mó húa dựa trờn cỏc khung I và P đó mó húa thành cụng trước đú, do đú việc giải mó một khung hỡnh B (B-frame) bắt buộcyờu cầu khung hỡnh I hoặc P phải được giải mó một cỏch chớnh xỏc. Trong một GoP khoảng cỏch giữa 2 khung hỡnh I là N, khoảng cỏch giữa I và khung hỡnh P là M. Nếu N lớn thỡ sẽ dẫn tới suy giảm chất lượng hỡnh ảnh mặc dự đũi hỏi ớt băng thụng mạng, cũn nếu N nhỏ thỡ chất lượng khung hỡnh nhận được tốt hơn nhưng lại đũi hỏi tiờu tốn nhiều băng thụng mạng. Trong hỡnh 1.5 trỡnh bày cấu trỳc mó húa của một GoP.
). 1 ( and , 1 1, NI M M N N M N NP B (1.1) B B P B B P B B P B B I B B P B B P B B P B B I ... GoP GoP Hỡnh 1.5 Cấu trỳc GoP
Chỳ ý: khung hỡnh B thường cú tỷ lệ nộn nhiều nhất, tiếp theo là khung hỡnh P. Kớch thước khung hỡnh I lớn hơn nhiều so với cỏc khung hỡnh P và B. Khung hỡnh I là quan trọng nhất vỡ chỳng sửa lỗi tạm thời và cú thể truyền từ frame đến frame trong khi giải mó khung hỡnh P hoặc B. Khung hỡnh I cũng được gọi là khung "neo" vỡ một bộ giải mó video cú thể định vị và sau đú bắt đầu phỏt lại video bắt đầu từ khung hỡnh I.
Từ cấu trỳc mó húa phõn cấp của MPEG, một khung hỡnh video cú thể được coi khụng giải mó được (undecodable) trực tiếp hoặc giỏn tiếp. Undecodable trực tiếp của một khung cho
15
biết/chỉ ra rằng khụng cú đủ cỏc gúi dữ liệu của khung hỡnh video nhận được để giải mó cỏc khung hỡnh đú. Mặt khỏc, undecodable giỏn tiếp một khung hỡnh video sẽ xảy ra khi một khung được xem là undecodable bởi vỡ một số khung nú phụ thuộc vào trực tiếp undecodable. Sự phụ thuộc của khung hỡnh P và B vào cỏc khung hỡnh khỏc khi giải mó cú nghĩa là nếu cú bất kỳ khung hỡnh nào mà khung P hoặc B phụ thuộc vào, mà khụng được giải mó bởi bờn nhận, thỡ khi đú nú khung P hoặc B này cũng sẽ khụng thể giải mó. Vớ dụ, nếu khung I bị mất, thỡ khi đú tất cả cỏc khung khỏc trong GOP cũng khụng được giải mó. Khung phụ thuộc sẽ đúng một vai trũ quan trọng khi thiết kế bộ giải mó giả để phõn tớch chất lượng video. Ảnh hưởng của sự phụ thuộc khung, I P và B được minh họa trong hỡnh 1.6 [34]; việc mất đi một khung hỡnh I hay P sẽ gõy ảnh hưởng trong toàn bộ GoP. Do vậy mặc dự tỷ lệ mất gúi tin thấp 5.% vẫn cú thể gõy ra một tỷ lệ tổn thất lớn đến xấp xỉ 30% trờn cỏc khung hỡnh [19]. Chỳng tụi đó nghiờn cứu kỹ vấn đề này và đề xuất một số giải phỏp khắc phục trong cỏc chương 3 và 4.
I B B P B B P B B P Mất khung I I B B P B B P B B P Mất khung P I B B P B B P B B P Mất khung B = khụng giải mó được
Hỡnh 1.6 Sự phụ thuộc khung hỡnh trong mó húa video