3.5.1. Nguyờn lý
Nộn trong ảnh nhằm giảm bớt thụng tin dư thừa trong miền khụng gian. Sử dụng cả hai quỏ trỡnh nộn cú tổn hao và nộn khụng tổn hao. Khụng sử dụng thụng tin của cỏc ảnh trước và sau ảnh đang xột.
Hỡnh 3.4. Nộn trong ảnh (Intra Frame Compression)
Sử dụng phương phỏp biến đổi DCT. Phương phỏp chuyển đổi tối ưu là chuyển đổi KL (Karhunen - Loeve). Chuyển đổi này thụng qua một ma trận chuyển đổi làm giảm trật tự tương qua của một quỏ trỡnh xử lý ngẫu nhiờn liờn tiếp dưới dạng đường chộo. Sử dụng phương phỏp chuyển đổi KL khụng thụng dụng cho tất cả cỏc ứng dụng của nộn ảnh số. Vỡ vậy, thay thế nú là phương phỏp DCT (Discrete Cosine Transfrom) - ụ cú nhiều thuật toỏn biến đổi nhanh cho việc tớnh toỏn.
3.5.2. Tiền xử lý
Tiền
xử lý thuậnDCT Lượng tử húa entropy Mó húa Mạch trộn đại đệmkhuếch Nguồn
ảnh Tớn hiệu ảnh nộn
Bảng lượng tử Điều khiển tốc độ bit
Trước khi thực hiện biến đổi DCT, cả ảnh được chia thành cỏc khối lớn riờng biệt khụng chồng lờn nhau (MB - Macro Block). Mỗi MB bao gồm 4 block cỏc mẫu tớn hiệu chúi UY và 2; 4 hoặc 8 block cỏc mẫu tớn hiệu số màu (CR, CB). Số cỏc block của tớn hiệu màu phụ thuộc vào tiờu chuẩn của tớn hiệu video.
Cỏc block cú cựng kớch thước, mỗi block là một ma trận điểm ảnh 8x8 được lấy từ màn hỡnh từ trỏi sang phải, trờn xuống dưới.
Vớ dụ: Chia thành cỏc block của hỡnh ảnh hệ PAL. Phần tớch cực của tớn hiệu video với độ phõn giải 576 x 720 được chia làm 72x90 block. Như vậy sẽ cú 36x45MB nếu tiờu chuẩn lấy mẫu là 4:2:0 hoặc 4:1:1.
Cấu trỳc MB phụ thuộc vào loại quột ảnh. Nếu quột liờn tục thỡ cỏc block bao gồm cỏc mẫu từ cỏc dũng liờn tục (nộn theo ảnh - frame). Ngược lại trong trường hợp quột xen kẽ, trong một block chỉ cú cỏc mẫu của một nửa ảnh trờn (nộn theo mành - field).
3.5.3. Quỏ trỡnh biến đổi Cosin rời rạc
Biến đổi Cosin rời rạc (DCT) xử lý cỏc giỏ trị của khối cỏc điểm ảnh dưới một khối cỏc hệ số trong miền tần số.
Quỏ trỡnh mó húa DCT một chiều gồm 8 điểm ảnh biểu diễn tớn hiệu chúi trong tiờu chuẩn lấy mẫu 4:2:2. Sự thay đổi độ dọc theo 8 bit trong phạm vi dải tần số tự 0 đến fem/2 = 6,75 MHz. Mó húa DCT chia phổ này thành 8 dải băng nhỏ hơn. Tương ứng với mỗi giải băng tần cú một hệ số đặc trưng cho năng lượng của tớn hiệu trong dải băng tần đú.
Giỏ trị đầu tiờn bờn trỏi đặc trưng cho mức giỏ trị thành phần một chiều của tớn hiệu gọi là hệ số DC. Từ trỏi sang phải, cỏc hệ số lần lượt biểu diễn cỏc thành phần tần số cao hơn trong tớn hiệu ban đầu, gọi là hệ số AC.
Phộp biến đổi DCT hai chiều cho mức giải tương quan bức ảnh cao hơn, cho phộp biến đổi cho khối 8 x 8 giỏ trị cỏc điểm chúi.
F(u,v) = ( ) ( )∑ ∑ ( ) ( ) ( ) = = π + π + 7 0 j 7 0 i 16 v 1 j 2 Cos 16 u 1 i 2 Cos j ,i f 4 v C u C
trong đú: f(i,j) là cỏc hàm mẫu ban đầu trong khối 8 x 8 điểm chúi F(u,v) là cỏc hệ số biến đổi DCT khối 8 x 8
u là tần số chuẩn húa theo chiều ngang (0 < u < 7) v là tần số chuẩn húa theo chiều đứng (0 < v < 7) (Cu, Cv) = 12 (u, v) = 0 (Cu, Cv) = 1 u = 1,2,… 7 Hệ số DC được tớnh: F(0,0) = ∑ ∑ ( ) = = 7 0 k 7 0 j k , j j 8 1
Biến đổi DCT ỏp dụng cho cỏc tớn hiệu video số thành phần UY, CR, CB. Cỏc tớn hiệu này cú biờn độ cực đại là 12,8 tớn hiệu chúi cú biờn độ từ 0 ữ 255.
Bộ biến đổi A/B 8 bit được sử dụng để tạp ra cỏc khối tớn hiệu chúi UY với giỏ trị nhị phõn từ - 128 đến +127. Khi giải mó mức 128 được cộng vào để thu được tớn hiệu chúi ban đầu.
Trước khi biến đổi ngược DTC sử dụng bộ lọc thụng thấp loại bỏ cỏc hệ số thành phần tần số cao.
Quỏ trỡnh biến đổi DTC khụng giảm tốc độ dũng số liệu và tớnh chất đảo ngược (Inverse DTC) tỏi tạo lại chớnh xỏc giỏ trị điểm ảnh ban đầu nếu cỏc hệ số DCT giữ nguyờn.
3.5.4. Lượng tử húa khối DCT
Quỏ trỡnh lượng tử húa khối DCT đúng vai trũ quan trọng trong thiết kế hệ thống nến video vỡ nú ảnh hưởng trực tiếp đến việc tỏi tạo lại hỡnh ảnh.
Bảng trọng số Bảng Huffman VLC RLC Quột zig-zag Lượng tử húa DTC Định dạng khối và cấu trỳc khối Bộ đệm Lựa chọn tốc độ dũng bit ra Dũng tớn hiệu nộn Phõn lớp năng lượng khối
Hỡnh 3.5. Nộn trong ảnh
Bộ lượng tử húa chia mỗi hệ số DCT cho một số lớn hơn 1 để tạo ra cỏc số cú giỏ trị 0 hoặc gần bằng 0 cú thể làm trũn hoặc bỏ qua trong quỏ trỡnh tiếp theo. Cỏc hệ số cú năng lượng thấp đặc trưng cho sự biến đổi ớt giữa cỏc điểm ảnh cú thể loại bỏ mà khụng ảnh hưởng đến sự cảm thụ chất lượng ảnh của mắt người.
Thành phần DC và tần số thấp là cỏc thụng số cú ý nghĩa nhất của khối điểm ảnh ban đầu. Hệ số DC được lượng tử với độ chớnh xỏc 12 bit để trỏnh cỏc nhiễu xuất hiện giữa cỏc khối điểm ảnh. Trong khi hệ số tương ứng với thành phần tần số cao được lượng tử với độ chớnh xỏc 2 bit (do khả năng cảm nhận ở tần số cao của mắt người giảm).
Hệ số băng lượng tử húa thuận được xỏc định theo biểu thức:
Fq (u, v) = (F(u,v)/ Q(u,v)) = giỏ trị nguyờn gần nhất (F(u,v) + Q(u,v)/2/Q(u,v)) ảnh càng chi tiết thỡ hệ số thành phần tần số cao càng lớn, cú thể tràn bộ nhớ đệm nếu hệ số trong bảng lượng tử quỏ thấp.
Với cấu trỳc gồm 4 khối điểm chúi, cỏc chi tiết ảnh cú thể được tập trung năng lượng cao vào 1 trong 4 khối. Tạo ra lượng tử húa thụ cũng như xuất hiện lỗi lượng tử lớn. Để trỏnh hiện tượng này, năng lượnt trong khối được đỏnh giỏ bằng cỏch xem xột hệ số AC cú ý nghĩa nhất trong tất cả cỏc khối.
3.5.5. Mó húa entropy
Giỏ trị lượng tử húa cú thể chỉ biểu diễn nhờ cỏc từ mó cú độ dài cố định, tức là cỏc giỏ trị lượng tử húa biểu diễn bằng cựng một số bit tuy nhiờn hiệu quả khụng cao. Để hiệu quả hơn người ta dựng mó húa entropy, dựng đặc
tớnh thống kờ của tớn hiệu được mó húa. Từ mó ớt xảy ra sẽ nhiều thụng tin hơn từ mó hay xảy ra.
Mó húa entropy làm tăng độ phức tạp, yờu cầu bộ nhớ lơn hơn so với mó cú độ dài cố định và tốc độ bit thay đổi theo thời gian.
Khi phõn bố xỏc xuất càng lệch khỏi phõn bố đều thỡ xuất hiện càng tăng nhờ mó húa entropy.
Cỏc hệ số AC biểu diễn với cỏc từ mó RLC được mó húa bằng mó Huffman nhờ cỏc bảng tỡm kiếm. Nhúm đầu tiờn được lấy ra phối hợp với giỏ trị số động để tạo ra một số nhị phõn Huffman biểu diễn hệ số AC tương ứng.
3.5.6. Bộ nhớ đệm
Cỏc từ mó VLC tạo ra dũng số liệu với tốc độ biến đổi, phụ thuộc vào độ phức tạp của ảnh được mó húa. Số liệu này được ghi vào bộ nhớ đệm, cỏc bit số liệu sẽ được đọc ra từ bộ nhớ đệm này với một tốc độ cố định theo bộ mó húa. Bộ nhớ đệm khụng được tràn, rỗng. quỏ trỡnh điều khiển được thực hiện nhờ hệ số cõn bằng cho bảng trọng số. Nếu bộ nhớ đệm đầy quỏ trỡnh lượng tử húa được thực hiện với mức biểu diễn bit ớt hơn nhằm tạo ra tốc độ dũng bit nhỏ lại bằng cỏch tăng hệ số cõn bằng của bộ lượng tử.
3.5.7. Giải mó DCT
Quỏ trỡnh lượng tử húa ngược Rq(u,v) được tiến hành theo biểu thức: Rq(u,v) = Fq(u,v) Q(u,v)
Cỏc hệ số sẽ được biến đổi ngược (IDCT) bằng quỏ trỡnh f(j,k) để tạo lại khối giỏ trị cỏc điểm ban đầu theo biểu thức).
f*(j,k) = ∑ ∑ ( ) = = 7 0 v u 7 0 u C 4 1 F(u,v)Cos( ) ( ) 16 v 1 k 2 Cos 16 u 1 j 2 + π + π Bảng mó Huffman Bảng lượng tử VLC RLC (Zig-zag)-1 Lượng tử húa IDCT Tỏch khối và cấu trỳc khối Video nộn YC B C
Hỡnh 3.6. Giải mó DCT
Biểu thức biểu diễn quỏ trỡnh biến đổi DCT và IDCT là tương tự nhau. Hệ thống nộn và giải nộn cú thể dựng chung một thiết bị phần cứng, sai lệch giữa khối ban đầu và cỏc giỏ trị tạo lại nguyờn nhõn do cỏc lỗi xuất hiện trong quỏ trỡnh nộn. Lỗi được biểu diễn:
e(j,k) = f(i, k) - f*(j, k)
3.6. Kỹ thuật nộn liờn ảnh (Inter Frame Compression)
3.6.1. Mụ hỡnh
Với một chuỗi ảnh liờn tục, lượng thụng tin chứa trong mỗi ảnh rất ớt từ ảnh này sang ảnh khỏc. Tớnh toỏn dự định chuyển vị trớ của nội dung ảnh được ỏp dụng trong kỹ thuật nộn ảnh.
Hỡnh 3.7. Mụ hỡnh nộn ảnh
3.6.2. Kỹ thuật dự đoỏn bự chuyển động
Thay đổi về cường độ ỏnh sỏng từ frame này đến frame kế tiếp là do chuyển động của đối tượng. Trong mó bự chuyển động frame hiện hành được dự bỏo từ frame trước bằng cỏch xấp xỉ chuyển động giữa hai frame và bự chuyển động đú. Sự khỏc nhau giữa frame hiện hành và dự bỏo của frame đú gọi là phần dư thừa của bự chuyển động sẽ được mó húa phần năng lượng dư thừa thấp hơn nhiều so với năng lượnt trong tớn hiệu gốc do loại bỏ những thành phần dư thừa tạm thời. Mó húa phần dư thừa thay vỡ mó húa video giỳp đảm bảo thụng tin dư thừa tạm thời khụng phải mó húa lặp lại.
Xỏc định phần ảnh chuyển động là (xấp xỉ chuyển động) khụi phục một ảnh bằng cỏch dựng cỏc phần tử ảnh trước cựng với thụng tin về chuyển động là "bự chuyển động".
Bự chuyển động Nộn trong ảnh ảnh nộn
Phương phỏp dự đoỏn để tỡm ra cỏc chi tiết ảnh thay thế giữa hai khung hỡnh liền nhau và từ đú tạo ra một vectơ chuyển động ghi rừ vị trớ mới của chi tiết ảnh trong khung hỡnh sau. Vectơ chuyển động phối hợp tất cả cỏc khối được nộn trong khung hỡnh trước đú mà khối cỏc điểm này được lặp lại một vị trớ mới. Phương phỏp này được gọi là dự đoỏn bự chuyển động giữa cỏc khung hỡnh.
Dự đoỏn chuyển động được thực hiện bằng cỏch sử dụng cấu trỳc khối cho cỏc điểm cho cỏc vectơ chuyển động và cỏc mó húa DCT khỏc nhau của cấu trỳc khối hiện tại và cấu trỳc khối tham chiếu được truyền đi.
Khối số liệu điểm ảnh được chọn gọi là tham chiếu, trong khung hỡnh hiện tại chuyển động trong phạm vi tỡm kiếm ở khung hỡnh trước đú, cỏc giỏ trị khối DCT tham chiếu được so sỏnh với cỏc giỏ trị khối 8x8 điểm trong vựng tỡm kiếm để tỡm ra khối thớch hợp với sự sai khỏc nhỏ nhất. Thụng tin số liệu về vectơ chuyển động được truyền tới bộ giải mó cựng với hệ số DCT sai lệch.
Cỏc khối phối hợp trong số cỏc khối của khung hỡnh trước sử dụng như thành phần dự đoỏn sai số ớt thụng tin.
Vựng tỡm kiếm cú kớch thước 16x16 điểm. Để đơn giản húa quỏ trỡnh tớnh toỏn, độ phõn giải của ảnh được giảm xuống cả theo hai chiều ngang và đứng. Vớ dụ một ảnh với độ phõn giải đầy đủ là 720 x 240 cú thể sử dụng cho vựng dự đoỏn lớn hơn. Đầu tiờn một dự đoỏn gần đỳng được thực hiện trờn cỏc ảnh cú độ phõn giải thấp. Sau đú một phộp dự đoỏn vectơ chuyển động chớnh xỏc sẽ thực hiện tớnh toỏn vị trớ thay thế của đối tượng giữ hai khung hỡnh.
3.6.3. ảnh dự đoỏn trước
Phương phỏp mó húa nhờ ảnh dự đoỏn trước sử dụng xỏc xuất cỏc ảnh liờn tục trong chuỗi ảnh. Nhờ xỏc xuất này, phần lớn cỏc ảnh trong chuỗi cú thể nhận biết gần giống nhau trờn cơ sở thụng tin chứa trong ảnh. Phương
này chỉ cần truyền ảnh đầu trờn là đủ. Khi xuất hiện vật thể chuyển động nào đú phải xỏc định vật thể này và biểu diễn đặc trưng về sự thay đổi vị trớ của nú.
Hỡnh 3.8. Nộn liờn ảnh (ảnh dự đoỏn trước)
Cỏc chuyển động ngoài vựng tỡm kiếm khụng thể thực hiện dự đoỏn bự chuyển động từ khung hỡnh trước. Trường hợp này sẽ được mó húa bằng phương phỏp nộn trong ảnh.
Trong khối xỏc định vectơ chuyển động. Vectơ chuyển động tớnh toỏn sao cho ảnh hiện tại và ảnh dự bỏo cho ra ảnh khỏc biệt ở đầu ra. Số liệu về vectơ chuyển động và ảnh khỏc biệt sẽ được truyền đi. Hạn chế của mụ hỡnh này là khụng biểu diễn phần lớn cỏc chuyển động cú thể coi như cỏc chuyển động quay, giảm hoặc tăng lờn và cỏc chuyển động phức tạp khỏc.
3.6.4. ảnh dự đoỏn hai chiều
Dự đoỏn hai chiều theo thời gian, cũn gọi là nội suy bự chuyển động sử dụng thụng tin trong một khung hỡnh cho trước và một khung hỡnh hiện tại để dự đoỏn.
Mụ hỡnh này cho khả năng nộn số liệu cao hơn. Hiệu ứng nhiễu trong khung hỡnh hiện tại giảm bằng mức nhiễu trung bỡnh của khung hỡnh trước và khung hỡnh sau, cú khả năng dự đoỏn ngoài phạm vi của vựng tỡm kiếm nhờ cỏc hỡnh tiếp theo.
Σ
Σ
Ăn trước đú (ảnh so sỏnh)
Tạo ảnh hiện tại để sử dụng cho dự đoỏn ảnh tiếp theo
ảnh khỏc biệt
ảnh dự đoỏn
Xỏc định vector
chuyển động Vector chuyển động ảnh hiện tại +
- ảnh dự đoỏn + +
∑
ảnh hiện tại ảnh hiện tại
ảnh dự đoỏn ∑ ảnh trước ảnh sau + - + + ảnh dự đoỏn
Hỡnh 3.9. Nộn liờn ảnh (ảnh dự đoỏn hai chiều)
Sự khỏc nhau cơ bản giữa hai mạch, mạch tạo ảnh dự đoỏn trước và mạch tạo ảnh dự đoỏn hai chiều là nhờ bộ so sỏnh. Để tạo ảnh dự bỏo trước chỉ cần nhớ ảnh trước đú. Để tạo ảnh dự đoỏn hai chiều phải nhớ cả hai ảnh trước và sau anh đang xột.
ảnh dự đoỏn hai chiều là kết quả nội suy giữa hai ảnh để xỏc định chuẩn của nú, nờn sẽ làm hay đổi thứ tự truyền ảnh. Bộ mó hoỏ ảnh đầu tiờn phải truyền cả hai ảnh chuẩn, sau đú mới truyền đến ảnh dự đoỏn hai chiều.
Quỏ trỡnh sắp xếp lại khi mó hoỏ và giải mó tạo ra một thời gian trễ phụ thuộc vào khung hỡnh giữa hai khung tham chiếu. Cú thể cú nhiều hơn một khung hỡnh được dự đoỏn giữa hai khung hỡnh tham chiếu xuất hiện trước và sau nú. Khi số cỏc khung hỡnh dự đoỏn tăng lờn quan hệ giữa chỳng và khung tham chiếu giảm xuống do vậy số bịt để mó hoỏ khung dự đoỏn tăng lờn.
Mó hoỏ dự đoỏn giữa cỏc khung hỡnh ỏp dụng cho cỏc chương trỡnh cú ớt chuyờn động hoặc chuyờn động chậm.
3.7. Kỹ thuật nộn Audio
Kỹ thuật mó hoỏ nguồn sử dựng nhằm làm giảm lượng thụng tin dư thừa trong tớn hiệu audio. Loại bỏ cỏc thành phần tần số khụng nghe thấy.
Cỏc tớn hiệu nộn số liệu nộn audio chớnh bao gồm:
• Mó hoỏ dự đoỏn trong miền thời gian: phương phỏp này sử dụng mó hoỏ sai số giữa cỏc mó liền nhau. Thụng tin audio được biểu diễn và truyền đi
• Mó hoỏ trong miền tần số: kỹ thuật này sử dụng cỏc khối mẫu audio PCM tuyến tớnh từ miền thời gian sang cỏc giải băng tần khỏc nhau trong miền tần số.
3.7.1 Phương phỏp nộn khụng mất thụng tin
Nộn khụng mất thụng tin cho phộp phục hồi lại cỏc tớn hiệu nh ban đầu sau khi giải nộn. Phương phỏp này loại bỏ dư thừa thống kờ bằng cỏch dự đoỏn trước giỏ trị tớn hiệu từ cỏc mẫu trước.
Nộn khụng mất thụng tin chủ yếu dựa vào cỏc kỹ thuật mó hoỏ dự đoỏn trong miền thời gian: cỏc kỹ thuật DCPM hay ADPCM, mó hoỏ entropy... Ngoài ra nộn audio cũn sử dụng khối cỏc hệ thống điển lu động.
Trong hệ thống này cỏc giỏ trị nhị phõn từ quỏ trỡnh A/D được nhúm thành từng khối số liệu trong cả miền thời gian và miền tần số. Mỗi giỏ trị được biểu diễn bằng một phần định trị chớnh là cỏc giỏ trị mẫu và một hệ số mũ thớch hợp với biờn độ mẫu. Đõy là quỏ trỡnh lượng tử hoỏ khụng đều trong