Ưu thế nổi trội của kỹ thuật số được thể hiện khi mà tớn hiệu Video số chưa được nộn, điều mà với kỹ thuật tương tự khụng thể thực hiện được. Tuy nhiờn với điều kiện tiờu chuẩn thỡ sẽ tạo ra tớn hiệu cú tốc độ bit lớn hơn 200Mbit/s. Với tốc độ bit này, nú sẽ yờu cầu một bộ nhớ cú dung lượng rất lớn và một đường truyền cú độ rộng băng tần cũng rất lớn. Video số chỉ cú thể được sử dụng rộng rói khi nú yờu cầu khụng lớn về bộ nhớ cũng như dung lượng đường truyền; Đõy chớnh là nguyờn nhõn cần phải nộn Video số hay cũn gọi là mó húa Video số.
Nộn chớnh là một cỏch biểu diễn tớn hiệu Video bằng số lượng số liệu nhỏ hơn. Điều này tạo ra được những lợi điểm sau:
- Số lượng bộ nhớ cho một nguồn tớn hiệu đầu vào sẽ nhỏ đi. Với cỏc thiết bị ghi mật độ cao như băng từ, nộn cho phộp thu nhỏ kớch thước cho cỏc thiết bị dõn dụng và cỏc thiết bị làm tin ENG.
- Khi làm việc trong điều kiện thời gian thực, nộn cho phộp giảm nhỏ yờu cầu về độ rộng băng tần truyền dẫn. Hơn nữa, nộn cho phộp truyền tải thụng tin nhanh hơn thời gian thực giữa cỏc phương tiện giao tiếp, vớ dụ như giữa băng và đĩa.
phộp chế tạo ra cỏc mỏy ghi hỡnh ớt chịu ảnh hưởng của tỏc động mụi trường.
Như vậy nộn Video số là tiến trỡnh mó húa chuỗi khung ảnh Video thành một chuỗi bit cú số lượng bit nhỏ hơn.
Cú hai kỹ thuật mó húa cơ bản cú thể ỏp dụng để giảm bớt số lượng số liệu truyền tải nội dung thụng tin. Về cơ bản cỏc hệ thống mó húa là sự kết hợp của hai nguyờn lý này nhưng với nhiều cỏch thực hiện khỏc nhau.
Kỹ thuật thứ nhất là cải thiện hiệu quả mó hoỏ. Cú rất nhiều phương phỏp để mó hoỏ một lượng thụng tin cú sẵn, và hầu hết cỏc số liệu Video đơn giản đều chứa phần dư thừa. Khỏi niệm Entropy sẽ được đề cập ở phần sau.
Cú nhiều phương phỏp được sử dụng để loại bỏ phần dư thừa; như hệ thống mó (run-length coding) và mó hoỏ cú độ dài thay đổi như mó Huffman. Khi được sử dụng hợp lý, kỹ thuật này cho phộp chuyển đổi ngược một cỏch hoàn hảo để sao cho sau khi phõn tớch, dữ liệu nhận được giống như dữ liệu gốc đưa vào hệ thống. Đõy là loại nộn khụng tổn hao. Cỏc chương trỡnh lưu trữ mỏy tớnh như PKZip sử dụng nộn khụng tổn hao.
Rừ ràng, nộn khụng tổn hao là lý tưởng, nhưng nú khụng thể đỏp ứng được mức độ nộn mà cỏc thiết bị Audio và Video yờu cầu. Tuy nhiờn vỡ nú là nộn khụng tổn hao nờn người ta cú thể bố trớ nú tại bất cứ điểm nào trong hệ thống, và thực tế chỳng hay được lắp ở tầng cuối của hệ thống nộn cú tổn hao.
Nếu như việc loại bỏ phần dư thừa khụng làm giảm đỏng kể như yờu cầu đặt ra thỡ cú thể bỏ đi một phần thụng tin cú ớch. Hệ thống nộn cú tổn hao loại bỏ số liệu bằng cỏch bớt đi những thụng tin khụng liờn quan hoặc ớt liờn quan. Đõy khụng phải là kỹ thuật chung cú thể cung cấp cho mọi dũng dữ liệu; việc đỏnh giỏ tớnh liờn quan cú thể chỉ được tạo ra bởi tỡnh huống cụ thể của từng ứng dụng, với sự hiểu biết về loại số liệu cụ thể hay mục đớch sử dụng chỳng.
Một số thụng tin trong tớn hiệu Video sẽ khụng thể cảm nhận được bằng hệ thống mắt người, do vậy đõy thực sự là thụng tin rất quan trọng để loại bỏ phần dư thừa sinh lý này cho hệ thống. Một hệ thống nộn loại bỏ phần thụng tin hỡnh ảnh khụng liờn quan được hiểu như một hệ thống nộn khụng tổn hao.
Hầu hết cỏc phương phỏp mó húa đều khai thỏc cả sự dư thừa về khụng gian lẫn sự dư thừa về thời gian. Trong miền thời gian thường cú sự tương quan cao giữa cỏc khung ảnh Video thu được gần nhau. Cỏc khung liền kề về thời gian thường cú tương quan cao, đặc biệt với tốc độ lấy mẫu theo thời gian lớn. Trong miền khụng gian, thường cú sự tương quan cao giữa cỏc điểm ảnh gần nhau với cỏc giỏ trị của cỏc mẫu gần nhau thường rất giống nhau. Khai thỏc cỏc đặc điểm trờn cỏc bộ mó húa thường cú cấu trỳc logic như sau:
Mụ hỡnh thời gian Mụ hỡnh khụng gian Mó húa entropy Bộđệm Frames Encoded Output Video Input Hỡnh 18.Cấu trỳc logic của cỏc bộ mó húa
Một bộ mó húa bao gồm 3 thành phần chức năng chớnh như sau: khối mụ hỡnh thời gian, khối mụ hỡnh khụng gian và mó húa entropy. Đầu vào của khối mụ hỡnh thời gian là chuỗi cỏc hỡnh Video chưa được nộn và cỏc hỡnh đó được mó húa và lưu lại làm tham chiếu cho dự đoỏn chuyển động. Đầu ra của khối mụ hỡnh thời gian là một bức ảnh dư thừa sau khi trừ bức ảnh hiện tại ở đầu vào với bức ảnh đó được mó húa trước đú (đó được bự chuyển động khi ước lượng chuyển động giữa hỡnh hiện tại và hỡnh tham chiếu đó được mó húa trước đú) và một tập cỏc tham số mụ hỡnh thời gian như vector chuyển động (cú được khi thực hiện ước lượng chuyển động của cỏc vựng nhỏ trong bức ảnh thường là một khối 16x16 điểm ảnh hay cũn gọi là block). Hỡnh dư thừa tạo ra từ mụ hỡnh thời gian được đưa vào khối mụ hỡnh khụng gian để thực hiện loại trừ cỏc dư thừa dữ liệu về mặt khụng gian giữa cỏc giỏ trị lấy của cỏc điểm ảnh gần nhau (loại bỏ sự tương quan về mặt khụng gian). Để thực hiện việc này thường cỏc khối khụng gian sử dụng một bộ chuyển đổi (transform) cho cỏc giỏ trị dư thừa vừa tạo ra và lượng tử húa kết quả tạo ra. Bộ
chuyển đổi biến đổi cỏc giỏ trị của mẫu sang một miền khụng gian khỏc mà trong miền đú chỳng được biểu diễn bởi cỏc hệ số chuyển đổi. Cỏc hệ số chuyển đổi đú được lượng tử húa để loại bỏ cỏc thành phần khụng mấy quan trọng tạo ra một số lượng nhỏ hơn cỏc hệ số quan trọng cung cấp cho việc nộn dữ liệu. Đầu ra của khối mụ hỡnh khụng gian là một tập cỏc hệ số lượng tử được đưa vào đầu vào khối mó húa entropy. Khối này thực hiện loại bỏ cỏc dư thừa về mặt thống kờ của dữ liệu đầu vào để tạo ra dũng dữ liệu Video nộn để truyền đi hoặc ghi thành file nộn để lưu trữ.
+ Khối mụ hỡnh thời gian
Mục tiờu của khối mụ hỡnh thời gian là loại bỏ cỏc dữ liệu tương quan giữa cỏc ảnh trong chuỗi anh video. Để làm việc này, khối mụ hỡnh thời gian trừ cỏc giỏ trị của ảnh hiện tại (đang mó húa) với một ảnh tham chiếu (được tạo ra sau khi dự đoỏn chuyển động và bự chuyển động). Trong quỏ trỡnh dự đoỏn chuyển động của ảnh hiện tại so với ảnh đó được mó húa thường thực hiện với cỏc Macroblock 16x16 hoặc cỏc block nhỏ hơn là 8x8 hoặc 4x4, núi chung block dựng để dự đoỏn càng nhỏ thỡ càng giảm được dữ liệu dư thừa do tương quan và do đú làm cho bộ mó húa càng trở nờn hiệu quả. Tuy nhiờn điều này lại dẫn tới khối lượng xử lý để thực hiện ước lượng tăng lờn rất nhiều lần làm cho việc tớnh toỏn mất rất nhiều thời gian, đồng thời số lượng cỏc tham số sử dụng cho mụ hỡnh thời gian cũng tăng lờn. Do vậy, để đảm bảo hiệu quả nộn thỡ thường cỏc bộ mó húa khụng sử dụng 1 loại block cho dự đoỏn chuyển động mà thường sử dụng một số loại block khỏc nhau để tận dụng cỏc vựng cú tương quan theo thời gian khỏc nhau.
Việc chuyển động của cỏc khối theo thời gian khụng phải là theo số chẵn của block dựng để ước lượng chuyển động, do đú cỏc kỹ thuật ước lượng chuyển động sub-pixel và quarter-pixel được sử dụng để đảm bảo tỡm ra được sự tương quan cao nhất theo thời gian của cỏc block dựng để ước lượng chuyển động. Việc ước lượng sub-pixel và quarter-pixel được thực hiện sau khi thực hiện ước lượng block bằng cỏch tớnh nội suy để tạo ra cỏc giỏ trị sub-pixel và quarter-pixel. Ước lượng sub- pixel và quarter-pixel tạo ra khả năng loại bỏ sự tương quan cao hơn và do đú tạo
ảnh hiệu sau đầu ra của khối thời gian cú sự dư thừa nhỏ hơn. Tuy nhiờn, cỏc kỹ thuật này làm tăng tớnh phức tạp của mó húa.
Cỏc đối tượng chuyển động trong một cảnh video thường cú hỡnh dạng
khụng theo quy tắc nào và chỳng cú thể thay đổi hỡnh dạng giữa cỏc khung, do vậy rất khú để cú thể tỡm được cỏc block phự hợp nhất và vỡ thế, người ta đó đưa ra một phương phỏp bự chuyển động theo vựng và theo đối tượng để tăng khả năng loại trừ tương quan giữa cỏc ảnh của khối mụ hỡnh khụng gian, tuy nhiờn phương phỏp này rất phức tạp và thường được sử dụng cho cỏc ứng dụng cụ thể.
+ Khối mụ hỡnh khụng gian
Khối mụ hỡnh khụng gian núi chung bao gồm 3 thành phần chớnh: khối chuyển đổi Transform (loại bỏ tương quan và nộn dữ liệu), khối lượng tử (giảm độ chớnh xỏc của chuyển đổi) và khối sắp xếp lại (sắp xếp lại dữ liệu thu được để nhúm cỏc giỏ trị quan trọng với nhau)
Mục đich của khối chuyển đổi là thực hiện chuyển đổi cỏc dữ liệu hỡnh hoặc cỏc dữ liệu được tạo ra sau khi thực hiện loại bỏ dư thừa bằng ước lượng và bự chuyển động sang miền khụng gian khỏc (miền khụng gian này phải đảm bảo loại bỏ tương quan và cụ động năng lượng của dữ liệu đó được chuyển đổi tập trung vào một số lượng nhỏ cỏc giỏ trị và cú thể chuyển đổi theo 2 chiều một cỏch dễ dàng) theo phương trỡnh ma trận như sau: Y=AXAT và X=ATXA, trong đú X là ma trận dữ liệu nguồn, Y là ma trận dữ liệu chuyển đổi, A là ma trận chuyển đổi. Cú nhiều bộ chuyển đổi và chủ yếu được phõn làm 2 loại chớnh là: chuyển đổi dựa trờn toàn bộ hỡnh (vớ dụ DWT) hoặc dựa trờn cỏc block (DCT, SVD, KLT, Hadamard)
Mục đớch của bộ lượng tử là ỏnh xạ một dải cỏc giỏ trị tớn hiệu đầu vào sang một tớn hiệu được lượng tử với ớt vựng giỏ trị hơn. Do đú cú thể biểu diễn tớn hiệu lượng tử với ớt bit hơn tớn hiệu nguồn. Cú thể chia làm 2 loại bộ lượng tử là bộ lượng tử vụ hướng và bộ lượng tử vector. Lượng tử vụ hướng ỏnh xạ một giỏ trị đầu vào thành một giỏ trị lượng tử đầu ra theo cụng thức Y=QP.round(X/QP) trong đú X là giỏ trị đầu vào bộ lượng tử, Y là giỏ trị đầu ra bộ lượng tử, QP là bước lượng tử. Lượng tử vector ỏnh xạ một nhúm cỏc giỏ trị đầu vào dạng vector thành cỏc giỏ
trị đầu ra đó được lượng tử.
Đầu ra của bộ lượng tử là một dóy chứa một lượng nhỏ cỏc hệ số khỏc 0 và một lượng lớn cỏc hệ số cú giỏ trị là 0. Do vậy việc sắp xếp lại (nhúm cỏc hệ số khỏc 0 lại với nhau) và biểu diễn hiệu quả cỏc hệ số cú giỏ trị 0 được sử dụng trước khi thực hiện mó húa entropy.
+ Mó húa entropy
Mó húa entropy chuyển đổi một chuỗi cỏc phần tử biểu diễn chuỗi video thành dũng bit được nộn phự hợp với ứng dụng truyền dẫn và lưu trữ. Cỏc phần tử biểu diễn chuỗi video cú thể bao gồm cỏc hệ số chuyển đối lượng tử, cỏc vector chuyển động, cỏc dấu phõn cỏch (là mó chỉ một điểm đồng bộ lại trong chuỗi), cỏc thụng tin header (header MB, header ảnh, header chuỗi, …) và cỏc thụng tin bổ xung.