Hệ thống DPCM có bù chuyển động

Bộ tạo dự báo ở bên thu có khối nhớ khung (frame memory or frame store) lưu trữ dữ liệu khung trước đó để tính toán đo đạc chuyển động bằng cách so sánh giữa khung cũ và khung mới. Từ đó tạo khung dự báo có bù chuyển động ở đầu ra bộ tạo dự báo. Việc thực hiện đo đạc chuyển động ở bên phát căn cứ vào khung hiện tại mà bên thu chưa có, bởi vậy một phép đo như vậy không thể đồng thời tiến hành ở cả bên thu và bên phát mặc dù thông tin vectơ chuyển động là cần cho bên thu để tạo lại dự báo. Cho nên thông tin về chuyển động (các vectơ chuyển động của các MB) được truyền tới kênh thu nhờ một kênh phụ.

Hệ thống DPCM có bù chuyển động là hệ thống có bộ tạo dự báo không nhân quả.

Hình 3.4: Mã hoá / Giải mã DPCM.

3.2. Nén video công nghệ: Mã hoá chuyển đổi.

Công nghệ mã hoá chuyển đổi có một vai trò vô cùng quan trọng trong nén ảnh truyền hình. Nếu công nghệ DPCM chỉ cho chất lượng ảnh chất lượng cao tại tốc độ dòng bit cao thì công nghệ nén “mã hoá chuyển đổi” (transform coding) có khả năng sử dụng cùng một thuật toán cho một dải tốc độ bit và chỉ làm giảm chất lượng ảnh phục hồi tại tốc độ dòng bit vô cùng thấp.

3.2.1. Xử lý tương hỗ trong công nghệ TC.

Trong khi cong nghệ “điều xung mã vi sai” DPCM xử lý tín hiệu trong miền thời gian thì công nghệ “mã hoá chuyển đổi” TC xử lý tín hiệu trong miền tần số.

Việc loại bỏ tính có nhớ của nguồn tín hiệu được thực hiện bằng một phép biến đổi có tính thuận nghịch chuyển một khối các điểm ảnh trong miền thời gian thành khối các hệ số trong miền tần số (mỗi hệ số đại diện cho một tần số

Σ lượng tử

hoá EntropyMã hoá

lượng tử hoá Bộ tạo dự báo Σ e P V’ eq V + - + + Kênh Video vào Giải mã Entropy Σ Kênh + Bộ tạo dự báo V’ eq + + P Đầu ra đã giải mã Bộ mã hoá DPCM Bộ giải mã DPCM

V=tín hiệu đầu vào e=V-P= sai số đầu vào eq=sai số lượng tử V’=eq+P= tín hiệu khôi phục

tín hiệu của khối) bằng phép biến đổi thuận và phục hồi các điểm ảnh từ khối các hệ số bằng phép chuyển đổi nghịch.

Phép biến đổi phù hợp nhất cho nén tín hiệu video là phép biến đổi cosin rời rạc (discrete cosin transform-DCT). Thay vì lượng tử hoá và mã hoá trực tiếp biên độ điểm ảnh, người ta sẽ lượng tử hoá và mã hoá các hệ số DCT.

3.2.2. Biến đổi cosin rời rạc (discrete cosin transform-DCT).

DCT là phép biến đổi giá trị một khối các điểm ảnh thành một khối các hệ số trong miền tần số.

Trong kỹ thuật nén ảnh số, kích cỡ khối được chọn là 8 x 8 vì các lý do sau:

• Thứ nhất, việc nghiên cứu đã chỉ ra rằng hàm hiệp phương sai (coverriance) suy giảm rất nhanh khi khoảng cách pixel mà ở đó hàm hiệp phương sai được định nghĩa vượt quá 8. Vì vậy mà phương pháp nén sử dụng việc loại bỏ các thông tin dư thừa về không gian không cần quan tâm đến các khối pixel lớn hơn 8.

• Thứ hai là tiện lợi cho việc tính toán và thiết kế mạch cứng.

Khối 8 x 8 sau đó được biến đổi tơi vùng tần số bằng biến đổi 2_D DCT. Đầu ra bộ biến đổi là 64 giá trị biểu diễn các hệ số của các thành phần tần số trong khối 8x8. Như đã nói, hầu hết các thông tin về khối nằm ở vùng tần số thấp và giá trị các hệ số tần số cao rất nhỏ do giá trị các pixel gần nhau thường giống nhau.

Bản thân DCT không nén dữ liệu, nó không làm giảm tốc độ bit. Bởi vậy, để nén dữ liệu người ta phải lượng tử hoá các hệ số DCT theo một bảng trọng số nhất định sao cho số các hệ số khác 0 ứng với lượng thông tin trong một khối là nhỏ nhất. Đồng thời, các hệ số DCT cũng được quét theo một cách đặc biệt để các hệ số 0 đi liền nhiều nhất nhằm giảm số bit cần dùng cho mã hoá hệ số DCT.

3.2.3. Lượng tử hoá các hệ số DCT.

Quá trình lượng tử hoá và mã hoá các hệ số DCT chính là các quá trình làm giảm tốc độ bit vì bản thân phép biến đổi DCT không nén thông tin. Đây là khâu nhạy cảm nhất trong một hệ thống nén vì nó quyết định trực tiếp chất lượng ảnh khôi phục.

Phương pháp lượng tử hoá các hệ số DCT đơn giản nhất là lấy mẫu theo từng vùng (zonal sampling) theo nguyên tắc như sau: loại bỏ một phần tần số cao mà mã hoá phần còn lại bằng số lượng bit cố định. Có thể hiểu đây như một bộ lượng tử chứa một bước lượng tử duy nhất. Mặc dù phương pháp này đơn giản nhưng nó có rất nhiều hạn chế:

• Không tận dụng được đặc tính thị giác của con người là không nhậy

cảm với tần số cao, cũng như không tận dụng được đặc tính khó nhận biết sai số trong vùng ảnh có độ linh hoạt cao.

• Từ mã có độ dài cố định không cho sự tối ưu trong việc giảm tốc độ

bit. Đặc biệt khi dùng đồng bộ lượng tử hoá tuyến tính. Một từ mã sẽ được truyền đi cho dù hệ số giá trị lượng tử bằng 0. Có rất nhiều hệ số DCT sau khi lượng tử trở vè giá trị 0 dẫn tới hiệu suất nén rất thấp.

3.2.3.2. Lượng tử hoá có trọng số.

Đây là phương pháp lượng tử hoá tối ưu cho nén ảnh. Trong đó sử dụng bộ lượng tử hoá tuyến tính có một dải các bước lượng tử. Mỗi hệ số DCT khác nhau sẽ quyết định theo bước lượng tử phù hợp. Bước lượng tử này được quyết định dựa trên nhiều yếu tố.

Đó là: Bảng trọng số HVS weighting table.

Đặc tính cảm nhận của mắt người chỉ nhậy cảm với tần số thấp và hướng biến đổi dọc, ngang mà không nhậy cảm với tần số cao cũng như sự thay đổi theo hướng chéo, dẫn tới mức độ quan trọng của các hệ số tuỳ thuộc vào vị trí. Những hệ số tần số cao và theo hướng chéo có thể được lượng tử hoá theo bước lượng tử thô hơn. Điều này đã được nghiên cứu và liệt kê trong một bảng trọng số gọi là HVS weighting table. Ví dụ bảng trọng số được mặc định trong tiêu chuẩn JPEG như sau:

Hình 3.5: Trọng số lượng tử hóa của JPEG cho tín hiệu chói và tín hiệu mầu.

3.2.4. Quét các hệ số DCT.

Dòng số là dòng truyền tải các bit nối tiếp theo thời gian. Do vậy cần một quá trình sắp xếp các hệ số DCT đã lượng tử trong ma trận hai chiều thành dãy một chiều nối tiếp nhau. Quá trình đó gọi là quét hệ số DCT. Theo nghiên cứu, có hai dạng thức quét cho số hệ số “0” đứng cạnh nhau lớn nhất, tạo thuận lợi cho việc giảm tốc độ bit khi mã hoá. Đó là quét “zig_zag” và quét luân phiên “alternate”. 17 18 24 47 99 99 99 99 18 21 26 66 99 99 99 99 24 26 56 99 99 99 99 99 47 66 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 99 13 11 10 16 24 40 51 56 12 12 14 19 26 58 60 65 14 13 16 24 40 57 69 58 14 17 22 29 57 87 80 62 18 22 37 56 68 109 103 77 24 35 51 64 81 104 113 92 49 64 78 87 103 121 120 101 72 92 95 98 112 100 103 99 0 7 7 i k 0 7 7 i k Bảng trọng số cho tín hiệu chói Bảng trọng số cho tín hiệu mầu

3.2.5. Mã hoá các hệ số DCT.

Sau khi quét, các hệ số DCT gồm rất nhiều hệ số 0 di liền nhau nên được mã hoá bằng loạt dài RLC (run length code) rồi tiếp tục mã hoá bằng mã Huffman VLC (varriable length code) cao cho giảm tốc độ tối thiểu được tốc độ dòng bit.

Việc mã hoá được qui định bằng các bảng mã. Ứng với mẫu đầu vào đối chiếu theo bảng mã sẽ cho từ mã đầu ra tương ứng.

3.2.6. Hệ thống nén video công nghệ mã hoá chuyển đổi.

Sơ đồ khối hệ thống nén ảnh sử dụng công nghệ “mã hoá chuyển đổi” như

sau: Các tín hiệu chói Y và màu (CR, CB) được đưa vào bộ định dạng khối

(block). Một Macroblock gồm hai khối Y và hai khối tín hiệu màu CR, CB . Đầu ra bộ định dạng khối, các mẫu điểm sẽ được sắp xếp thành các khối 8 × 8. Bốn khối (hai khối Y và hai khối màu CR, CB) tạo nên một khối Macroblock (MB). Các MB sẽ được sử lý tương tự , mã hoá độc lập với nhau. Các MB điểm ảnh được chuyển đổi sang vùng tần số cao bằng bộ chuyển đổi cosin rời rạc DCT.

Khối hệ số DCT được lượng tử hoá và mã hoá theo mã RLC và VLC. Bộ lương tử hoá sẽ chịu sự tác động của 4 yếu tố sau:

 Trọng số của bảng HVS.

 Sự phân loại năng lượng khối.

 Tín hiệu điều khiển chiếm cứ bộ nhớ.

 Khối ID.

Để cho bước lượng tử phù hợp với từng hệ số DCT. Block ID (Identification block) là các khối điểm cho phép tín hiệu chói và màu được lượng tử hoá độc lập với nhau… Do tốc độ dòng bit mã hoá thay đổi nên cần phải sử dụng bộ nhớ đệm để giữ cố định tốc độ dòng bit đầu ra.

Hình 3.7: Nén ảnh theo công nghệ Transform Coding. Khối 8x8 các điẻm chói 98 92 95 80 75 82 68 50 97 91 94 79 74 81 67 49 96 89 92 77 72 79 65 47 93 87 90 75 70 77 63 45 91 85 88 73 68 75 31 43 89 83 86 71 66 73 59 41 87 81 84 69 64 71 57 39 85 79 82 67 62 69 56 37 591 106 -18 28 -34 14 18 3 35 0 0 0 0 0 0 0 -1 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 40 10 -2 2 -1 0 0 0 3 0 0 0 0 0 0 0 -1 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 25 0. 10 0. 3 2. 2 0. 2 7. -1 EOB 1110 11001 1011 1010 01 11 11111000 01 01 01 11111001 0 1010 Các hệ số biến đổi DCT

Khối DCT được lượng

tử RLC VLC

Tạo định dạng khối và cấu trúc

khối

DCT Lượng

tử hóa zic-zắcQuét RLC VLC Bộ đệm

Bảng trọng số Bảng huffman DCT Mã DPCM hệ số DC Điều khiểnđệm Xác định khối Phân lớp năng lượngkhối Dòng tín hiệu nén Y CR CB

VLC RLC Quét zigzac ngược Giải lượng

tử hoá IDCT Giải định dạng Block và Macroblock Bảng mã Huffman Bảng trọng số HVS Giải mã DPCM hệ số DC

Hình 3.8: Giải mã DCT

3.3. Sự kết hợp các công nghệ nén.

Nếu sử dụng một cách tách biệt, không có công nghệ nén nào có khả năng tạo một quá trình nén có dòng bit ra tốc độ thấp mà vẫn đảm bảo chất lượng ảnh đạt yêu cầu. Bởi vậy mọi cách thức hiện nay đều là sự kết hợp chuẩn xác giữa các công nghệ nén. Sự kết hợp nay sau đó được chuẩn hoá trở thành các tiêu chuẩn nén: JPEG, JBIG, MPEG.

Có thể hiểu một cách đơn giản, kết hợp các công nghệ nén là tạo ra một quá trình nén nhiều bậc nhằm đạt được hiệu suất nén cao.

Tiêu chuẩn nén phổ biến hiện nay là MPEG, sử dụng kết hợp hai công nghệ nén: “điều xung mã vi sai” DPCM và “mã hóa chuyển đổi” (tranform coding).

Sự kết hợp này còn được gọi là “DPCM/DCT cân bằng” (Hybrid DPCM/DCT).

Sơ đồ khối quá trình nén như sau:

Σ1 Biến đổi DCT

Lượng

tử hoá Mã hoáVLC Ghép kênh

Giải lượng tử hoá Biến đổi DCT ngược Σ2 Trê cố định Ước lượng chuyển động Bù chuyển động VLC Khung Video vào Khung sai số dự báo Khung dự báo Vectơ chuyển động _ + +

Hình 3.9: Mã hoá DCT dự báo có bù chuyển động (Bộ mã hoá MPEG-2).

Đây chính là sơ đồ khối bộ mã hoá MPEG-2.

Quá trình nén như sau:

• Ảnh truyền đi được định dạng thành các khối 8 × 8 điểm ảnh. Các khối

này sẽ được xử lý độc lập với nhau.

• Trước tiên sử dụng công nghệ DPCM liên ảnh (interframe DPCM) có

bù chuyển động.

Như đã trình bày, trong công nghệ này thực hiện các quá trình sau:

- Sử dụng kỹ thuật tạo dự báo liên ảnh (interprediction) có bù chuyển động để tạo được khung dự báo rất tương đồng với khung hiện hành. - Tạo sai số dự báo là hiệu giữa khung hiện hành và khung dự báo có

bù chuyển động của nó. Khung sai số dự báo (predection error frame) có lượng thông tin rất thấp.

• Khung sai số dự báo sẽ được chuyển sang miền tần số bằng phép biến

đổi cosin rời rạc và tiếp tục được nén bằng công nghệ mã hoá chuyển đổi “transform coding” đã xét trong mục 2.2 và truyền sang phía thu.

• Vectơ chuyển động kết quả của quá trình ước lượng chuyển động sẽ

được ghép kênh với thông tin gửi bên thu phục vụ cho quá trình tạo dự báo cho bù chuyển động ở bên thu khi khôi phục ảnh .

• Bộ cộng ∑1 : Lấy tín hiệu giữa khung dự báo và khung hiện hành để

tạo khung sai số dự báo.

• Do quá trình ước lượng và bù chuyển động cũng như tạo dự báo cho

khung (n+1) cần sử dụng khung (n) và chính bản thân khung (n+1). Nên sai số dự báo của khung n đã chuyển đổi DCT và lượng tử hoá sẽ được khôi phục lại bằng dải lượng tử và chuyển đổi DCT ngược rồi cộng với dự báo khung n bằng bộ cộng ∑2 .

Kết quả khung n được phục hồi cùng khung n+1 đưa từ đầu Video vào được đưa tới bộ ước lượng chuyển động để so sánh, tính toán vecto chuyển động tạo khung dự báo n+1 .

• Toàn bộ phần nằm trong khối gạch rời chính là bộ dự báo (predictor) của công nghệ DPCM.

Bộ đệm dữ liệu đầu ra nhằm điều chỉnh tốc độ bit ra ổn định dù có sự biến thiên của tốc độ.

CHƯƠNG IV: NÉN VIDEO THEO TIÊU CHUẨN MPEG.

Các công nghệ nén ảnh “Điều xung mã vi sai - DPCM”, “Mã hó chuyển đổi – Transform Coding” và một số công nghệ nén khác được kết hợp với nhau nhằm tạo một cách thức nén ảnh có hiệu suất cao, chất lượng ảnh khôi phục tốt.

Sự kết hợp này được tiêu chuẩn hoá trong các tiêu chuẩn nén sử dụng hiện nay: JPEG, JBIG, MPEG.

4.1. Khái quát về các tiêu chuẩn nén.

Tại sao cần phải có các tiêu chuẩn nén?

Các tổ chức quốc tế đã tốn hàng triệu USD để phát triển các tiêu chuẩn nén. Như vậy, có thể thấy các tiêu chuẩn nén là cần thiết.

Hiểu một cách đơn giản, tiêu chuẩn nén cũng như ngôn ngữ chính thống của một đất nước. Quốc gia đó có nhiều dân tộc với nhiều ngôn ngữ khác nhau. Nhưng để thuận lợi cho giao tiếp, cần một ngôn ngữ chính thống trên toàn lãnh thổ. Như vậy, chìa khoá ở đây là sự dễ dàng trong giao tiếp. Chúng ta cần các tiêu chuẩn nén để thuận tiện trao đổi giữa các hệ thống khác nhau.

Vậy tại sao cần có nhiều tiêu chuẩn nén.

Câu trả lời thật đơn giản: Chúng ta cần có nhiều ứng dụng đòi hỏi nhiều tiêu chuẩn khác nhau. Không có bất cứ một tiêu chuẩn nén nào có thể đáp ứng được tất cả các yêu cầu ứng dụng đó.

Các tiêu chuẩn nén gồm hai mức: Mức quốc gia và mức quốc tế.

• Ở mức quốc gia có: ANSI (American National Standard Institute)

AIIM (Associantion of Image and Information) tại Canada có nhiều tổ chức tiêu chuẩn của Canada.

• Ở mức quốc tể có: ISO (Inernational Standards Organization)

IEC (International Electrotecchnical Commission) ITU (Iternational Teleccommunication Union) Và một số tổ chức khác.

Các tiêu chuẩn nén với ứng dụng của chúng được khái quát trong bảng sau đây:

Bảng khái quát các tiêu chuẩn nén.

Chuẩn Phạm vi ứng dụng CCITT T.4 CCITT T.6 JPEG JBIG CCITT H.261 MPEG - 1 MPEG - 2

Chọn tần số lấy mẫu:

Các thông số lấy mẫu tối ưu