00 FF FF TT MM LL
2.2. 3/ Nộn trong ảnh (Intra-frame Compression).
Nộn trong ảnh là loại nộn nhằm giảm bớt thụng tin dư thừa trong miền khụng gian, nú bao gồm cả hai quỏ trỡnh cú và khụng tổn hao để giảm bớt dữ liệu trong một ảnh.Quỏ trỡnh này khụng sử dụng thụng tin của cỏc ảnh trước và sau ảnh đang xột.
Thuật ngữ ảnh ở đõy cần được hiểu một cỏch chớnh xỏc bởi lẽ trong kĩ thuật nộn ảnh cho phộp sử dụng mành (field) hoặc ảnh (frame) như một ảnh gốc. Nếu kĩ thuật nộn dựng mành thỡ nộn trong ảnh sẽ tạo ra hai ảnh trong một ảnh. Vỡ vậy, khi bàn về nộn, thuật ngữ ”ảnh” khụng luụn luụn đồng nghĩa với thuật ngữ ảnh trong lĩnh vực truyền hỡnh.
Hỡnh 2.20 : Nộn theo ảnh (Frame).
Sơ đồ nguyờn lý chung của quỏ trỡnh nộn trong ảnh như sau:
Hỡnh 2.22 : Nộn trong ảnh (Intra-frame Compression)
Tiền xử lý.
Trước khi thực hiện DCT cả ảnh được chia thành cỏc khối lớn MB (Macro Block) riờng biệt khụng chồng nhau. Mỗi MB bao gồm 4 block cỏc mẫu tớn hiệu chúi và một số cỏc block của tớn hiệu hiệu màu phụ thuộc vào tiờu chuẩn lấy mẫu tớn hiệu video.
(a) 4:2:0 (4:1:1) (b) 4:2:2 (c) 4:4:4 Hỡnh 2.23 : Cấu tạo của MB theo cỏc chuẩn lấy mẫu
Tất cả cỏc block đều cú cựng kớch thước và là một ma trận 8*8 điểm ảnh được lấy từ một ảnh màn hỡnh theo chiều từ trỏi sang phải, từ trờn xuống dưới. Số đỏnh trờn mỗi block xỏc định thứ tự của block đú trong chuỗi gửi đến bộ mó hoỏ DCT. Kớch thước block là 8*8 được chọn bởi hai lý do:
• Từ nghiờn cứu cho thấy hàm hiệp phương sai suy giảm rất nhanh khi khoảng cỏch từ pixel mà ở đú nú được định nghió vượt quỏ 8.
DCT thuận Lượng tử hoỏ Mó hoỏ entropy Mạch trộn Khuếch đại đệm Tiền xử lý Điều khiển tốc độ bit Bảng lượng tử Nguồn ảnh Tớn hiệu ảnh nộn
• Nếu kớch thước block tăng sẽ gõy khú khăn cho việc tớnh toỏn và thiết kế mạch cứng.
Thực hiện DCT thuận.
Cụng đoạn đõu tiờn của hầu hết cỏc quỏ trỡnh nộn là xỏc định thụng tin dư thừa trong miền khụng gian của một mành hoặc một ảnh trong tớn hiệu video. Nộn khụng gian được thực hiện bởi biến đổi cosin rời rạc. DCT biến đổi dữ liệu dưới dạng biờn độ thành dữ liệu dưới dạng tần số. Mục đớch của quỏ trỡnh biến đổi là tỏch liờn kết cỏc pixel của từng ảnh con họăc gúi càng nhiều năng lượng của ảnh con vào một phần nhỏ cỏc hệ số hàm truyền. Việc mó hoỏ và truyền chỉ thực hiện với cỏc hệ số năng lượng này và cú thể cho kết quả tốt khi tạo lại tớn hiệu video cú chất lượng cao.
Hiện nay, DCT đó trở thành tiờu chuẩn quốc tế cho cỏc hệ thống mó chuyển vị bởi nú cú đặc tớnh gúi năng lượng tốt, cho kết quả là số thực và cú cỏc thuật toỏn nhanh để thể hiện chỳng.
Cỏc phộp tớnh DCT được thực hiện trong phạm vi cỏc khối đó được chia ở phần tiền xử lý. Hiệu quả của việc chia này là một trong những hướng quan trọng của mó hoỏ video cú chất lượng cao.
Lượng tử hoỏ.
Cỏc hệ số F(u,v) nhận được sau khi thực hiện DCT cú giỏ trị khỏc nhau nờn chỳng cú thể được lượng tử hoỏ bằng phương phỏp khỏc nhau. Những hệ số tương ứng với tần số thấp cú giỏ trị lớn, chứa phần lớn năng lượng chớnh của tớn hiệu được lượng tử hoỏ với độ chớnh xỏc cao. Hệ số DC đũi hỏi độ chớnh xỏc cao nhất do nú biểu thị giỏ trị độ chúi trung bỡnh của từng khối phần tử ảnh. Bất kỡ một sai sút nào trong quỏ trỡnh lượng tử hoỏ hệ số DC đều cú thể nhận biết dễ dàng bởi nú làm thay đổi mức chúi trung bỡnh của khối.
Lượng tử hoỏ được thực hiện bằng việc chia cỏc hệ số F(u,v) cho cỏc hệ số ở vị trớ tương ứng trong bảng lượng tử Q(u,v). Cỏc hệ số cú tần số thấp được chia cho cỏc giỏ trị nhỏ, cỏc hệ số ứng với tần số cao được chia cho cỏc giỏ trị lớn hơn, sau đú cỏc hệ số được làm trũn (bỏ đi phần thập phõn). Kết quả nhận được là bảng Fq(u,v) mới trong đú phần lớn cỏc hệ số tần số cao sẽ bằng 0.
Mức độ tổn hao thụng tin của quỏ trỡnh lượng tử phụ thuộc vào giỏ trị cỏc hệ số trờn bảng lượng tử. Với sự lựa chọn cỏc giỏ trị của Q(u,v) thớch hợp sự khỏc nhau giữa ảnh gốc và ảnh biểu diễn sẽ nhỏ đến mức mắt người khụng cảm nhận được.
Mó hoỏ entropy.
Khi dựng mó hoỏ entropy cú hai vấn đề được đặt ra: thứ nhất là nú làm tăng độ phức tạp và yờu cầu bộ nhớ hơn so với mó độ dài cố định, thứ hai là nú gắn liền với tớnh khụng ổn định của tớn hiệu video do đú sẽ làm tốc độ bit thay đổi theo thời gian. Bởi vậy cần cú một cơ cấu điều khiển bộ đệm khi mó hoỏ nguồn tốc độ bit biến đổi được ghộp với kờnh tốc độ bit hằng. Trong qua trỡnh mó hoỏ này mó Huffman được dựng phổ biến, ngoài ra cũn sử dụng thờm mó RLC để tăng hiệu suất nộn.
Để mó hoỏ entropy cỏc hệ số được lượng tử hoỏ, trước hết cần biến đổi mảng hai chiều cỏc hệ số thành một chuỗi số một chiều bằng cỏch quột zig-zag.
Việc xử lý 64 hệ số của khối bằng cỏch quột zig-zag làm tăng tối đa chuỗi cỏc giỏ trị 0 liờn tiếp và do vậy làm tăng hiệu quả nộn khi dựng RLC.
Sau khi thực hiện RLC, cỏc từ mó RLC cú tần suất xuất hiện cao được mó hoỏ bằng cỏc từ mó ngắn, cỏc từ mó RLC cú tần suất xuất hiện thấp được mó hoỏ bằng cỏc từ mó dài. Quỏ trỡnh này được gọi là mó hoỏ với độ dài từ mó thay đổi (VLC). Tại đầu ra VLC tất cả cỏc từ mó của cựng một khối DCT được kết hợp tạo thành một dũng tớn hiệu ra.
Điều khiển tốc độ bit.
Từ mó VLC được tạo ra với tốc độ thay đổi phụ thuộc vào độ phức tạp của ảnh và được ghi vào bộ nhớ đệm. Bit đọc ra từ bộ nhớ đệm tại một tốc độ cố định tuỳ theo thiết kế. Điều khiển bộ đệm thường là một cơ cấu hồi tiếp, cơ chế của nú là luụn đảm bảo bộ nhớ khụng trống hoặc khụng tràn bằng cỏch thay đổi hệ số thang độ dựng cho bảng trọng số (thay đổi hệ số nộn). Khi số liệu trong bộ nhớ đệm gần bằng dung lượng cực đại thỡ cỏc hệ số biến đổi DCT được lượng tử hoỏ ớt chớnh xỏc hơn (tăng tỷ số nộn). Ngược lại, khi bộ nhớ đệm gần cạn số liệu thỡ độ chớnh xỏc của việc lượng tử hoỏ cỏc hệ số sẽ tăng lờn (giảm tỷ số nộn). Quỏ trỡnh này được thực hiện khi biến đổi DCT một cỏch tự động bằng mạch phản hồi điều khiển tốc độ bit một cỏch thớch hợp.
Quỏ trỡnh giải nộn trong ảnh dựa trờn cơ sở thực hiện thuật toỏn ngược với quỏ trỡnh nộn. Cỏc bảng lượng tử và bảng mó Huffman xỏc định tại bộ mó hoỏ DCT được sử dụng để phục hồi cỏc giỏ trị hệ số DCT của khối 8*8 điểm ảnh. Sau giải nộn ta thu được ảnh khỏc biệt rất ớt so với ảnh gốc, sự khỏc nhau này khụng làm ảnh hưởng nhiều đến sự nhận biết của mắt. Tuy nhiờn việc làm giảm mức lượng tử hoỏ sẽ dẫn đến việc làm giảm lượng thụng tin của ảnh được truyền, nếu tăng mức nộn sẽ gõy ra mộo ảnh, chớnh vỡ vậy cỏc họ nộn sử dụng DCT được xếp vào nhúm cú mất thụng tin.
Như vậy cú thể khỏi quỏt quỏ trỡnh nộn trong ảnh và giải nộn trong ảnh cơ bản theo sơ đồ sau:
Hỡnh 2.25 : Quỏ trỡnh nộn trong ảnh.
Hỡnh 2.26 : Quỏ trỡnh giải nộn trong ảnh.
2.2.4 / Nộn liờn ảnh (Inter-frame Compression).
Một phương phỏp mạnh của việc giảm tốc độ bit thụng tin là dự đoỏn cỏc phần tử ảnh từ cỏc khung hỡnh trước đú, sau đú sẽ so sỏnh sự khỏc nhau giữa hỡnh ảnh thực tế và
Định dạng và cấu trỳc khối DCT Lượng tử hoỏ Quột zig-zag RLC VLC Bộ đệm Bảng trọng số Bảng Huffman Hệ số cõn bằng Mó DPCM hệ số DC Phõn lớp
năng lượng khối
Điều khiển đệm Xỏc định khối Lựa chọn tốc độ dũng bit ra Dũng tớn hiệu nộn Y CR CB Bảng Huffman VLC RLC (zig-zag)-1 Lượng tử hoỏ IDCT Tỏch khối và cấu trỳc khối Giải mó DPCM hệ số DC Bảng lượng tử Y CR CB
hỡnh ảnh dự đoỏn và truyền đi sự sai khỏc đú. Đõy chớnh là quỏ trỡnh loại bỏ thụng tin dư thừa trong miền thời gian của tớn hiệu video.
Trong hầu hết cỏc hỡnh ảnh giỏ trị khỏc nhau giữa cỏc hỡnh ảnh gần nhau là rất nhỏ như vậy việc mó truyền cỏc thụng tin sai khỏc này sẽ tốn rất ớt số bit, điều này cho phộp giảm tốc độ bit một cỏch đỏng kể. Tại bộ giải mó quỏ trỡnh dự đoỏn được làm giống như bộ mó húa, giỏ trị dự đoỏn sẽ được thờm vào giỏ trị sai khỏc được truyền để nhận được giỏ trị phần tử ảnh nguyờn gốc.
Để cải thiện quỏ trỡnh dự đoỏn, cỏc khối 16x16 điểm ảnh trong mành hiện thời được so sỏnh với cỏc khối trong vựng tỡm kiếm được xỏc định trong mành trước đú. Khối nào cú giỏ trị gần giống nhất sẽ được lựa chọn và trừ đi giỏ trị của khối hiện thời.
Quỏ trỡnh này sẽ giảm tối thiểu giỏ trị khỏc nhau được phỏt. Nú được xem như là quỏ trỡnh bự cho sự chuyển động của cỏc đối tượng trong hỡnh ảnh. Giỏ trị vộc tơ xỏc định vị trớ liờn quan đến khung phự hợp nhất với khung hiện thời về mặt khụng gian sẽ được mó hoỏ và truyền đi đến bộ giải mó.
Hỡnh 2.27 : Sự bự chuyển động. Vị trớ của khối hiện thời trong khung hỡnh n-1 Vị trớ của khối hiện thời trong khung hỡnh n-1 Vộc tơ chuyển động Cửa số tỡm kiếm
Để giảm quỏ trỡnh tớnh toỏn vector chuyển động, độ phõn giải của ảnh cú thể được giảm xuống theo cả hai chiều ngang và chiều thẳng đứng. Bằng cỏch này cú thể làm giảm số bit cần xử lý và dự đoỏn cỏc phần tử chớnh được thay thế trọng khung hỡnh. Dự bỏo bự chuyển động dựa trờn cỏc khung hỡnh trước là dự đoỏn một chiều đơn giản và thường gọi là dự đoỏn thuận. Cỏc khung hỡnh dự đoỏn được gọi là cỏc khung P (Predicted Frame).
Dự bỏo nội suy bự chuyển động là dự đoỏn hai chiều, sử dụng thụng tin trong một khung hỡnh trước và một khung hỡnh tương lai sau khung hỡnh hiện tại để dự bỏo khung hỡnh hiện tại gọi là khung hỡnh B (Bidirectionally Predicted Frame). Dự bỏo hai chiều cho khả năng nộn số liệu cao hơn dự đoỏn một chiều, tuy nhiờn dự đoỏn ngược chỉ thực hiện được khi khung hỡnh tương lai được truyền đi trước khung hỡnh hiện tại B.
Khung hỡnh I là khung hỡnh mó hoỏ dự đoỏn trong mành, khung hỡnh P là khung hỡnh dự đoỏn giữa cỏc mành, khung hỡnh B là khung hỡnh dự đoỏn hai chiều giữa khung I và khung P. Hỡnh 2.28 : Cỏc khung hỡnh I, B và P . I B B B P B B B I 1 2 3 4 5 6 7 8 1 Forward Prediction Bidirectional Prediction Dự đoỏn trước
Khung được dự đoỏn (5) nhận được từ khung I (1) đó được gửi. Trong vớ dụ này 3 khung B được gửi giữa khung P và khung I. Khung (2), (3), (4) được nội suy từ khung hỡnh trước (1) và khung hỡnh tương lai (5). Để thực hiện tỡm kiếm trong khung hỡnh tương lai tất cả cỏc khung được lưu trữ trước khi xử lý. Một điểm thuận lợi của nội suy hai chiều là khung hỡnh tiếp sau cú thể cung cấp thụng tin về cảnh thay đổi cho khung hỡnh hiện tại mà khung hỡnh trước đú khụng cung cấp. Do khung B cú thể nhận được ở bộ giải mó mà khụng cần gửi thờm nhiều thụng tin như cỏc khung hỡnh khỏc nờn tốc độ bit cú thể được giảm rất nhiều. Điểm khụng thuận lợi của việc sử dụng khung hỡnh B là yờu cầu xử lý phức tạp, yờu cầu nhiều bộ nhớ hơn, đặc biệt gớa thành của bộ giải mó sẽ đắt hơn.
Hỡnh 2.29 : Nộn liờn ảnh.
Trờn hỡnh vẽ là sơ đồ khối nguyờn lý của mạch nộn liờn ảnh (với ảnh dự đoỏn trước) và mạch nộn liờn ảnh (với ảnh dự doỏn hai chiều). Sự khỏc nhau cơ bản giữa hai mạch, mạch tạo ảnh B và mạch tạo ảnh P ở bộ nhớ ảnh so sỏnh. Để tạo ảnh P chỉ cần nhớ ảnh trước đú, trong khi đú để tạo ảnh B phải nhớ cả hai ảnh: ảnh trước và sau ảnh đang xột. Thụng thường sau quỏ trỡnh nộn liờn ảnh, để tăng hiệu quả nộn cần sử dụng kĩ thuật nộn trong ảnh để xử lý độ dư thừa khụng gian của phần thừa bự chuyển động. Sự kết
hợp giữa nộn trong ảnh và nộn liờn ảnh là cơ sở cho cụng nghệ nộn video MPEG (Motion Piture Expert Group).