Lý thuyết thông ti n entropy

Một phần của tài liệu Nghiên cứu công nghệ truyền hình số (Trang 37)

Thông tin chứa trong một chi tiết ảnh tỷ lệ nghịch với khả năng xuất hiện của nó, sự kiện ít xảy ra chứa đựng nhiều thông tin hơn sự kiện có nhiều khả năng xảy ra.

Entrropy đo giá trị thông tin trung bình chứa trong một bức ảnh, theo lý thuyết thông tin, lượng thông tin của phần tử ảnh được định nghĩa là logarit cơ số 2 của nghịch đảo xác xuất xuất hiện của phần tử ảnh đó:

I(x) = log2

 xi

P 1

= -log2P(xi) (2.1)

trong đó: I(x) là lượng thông tin của phần tử ảnh xi (tính bằng bit) P(xi) là xác xuất xuất hiện của phần tử ảnh.

Gọi lượng thông tin trung bình của hình ảnh là H(x) (entropy của ảnh), ta có:

H(x) =              n 1 i i 2 i n 1 i i i I X P X log P X X P (2.2)

Độ dài trung bình của một từ mã là giá trị trung bình thống kê của tất cả các từ mã trong một bộ mã nó không thể nhỏ hơn entropy của nguồn số liệu được mã hóa.

Entropy của ảnh có ý nghĩa quan trọng vì nó xác định số lượng bit trung bình tối thiểu cần thiết để biểu diễn một phần tử ảnh.

Trong công nghệ nén không tổn hao. Entropy giới hạn dưới của tỷ số bit/pixel. Nếu tín hiệu video được nén với tỷ số bit/ phần tử nhỏ hơn entropy, hình ảnh sẽ bị mất thông tin và quá trình nén sẽ có tổn hao

2.4. Các phƣơng pháp nén tín hiệu Video

Nhiều các kỹ thuật nén mất và không mất thông tin đã được phát triển trong nhiều năm qua. Chỉ có một số ít trong chúng có thể áp dụng cho nén video số. Hình 2.2 mô tả các kỹ thuật nén được sử dụng để tạo thành các tín hiệu nén JPEG ( joint photographic export group) và MPEG ( moving picture export group) .

Hình 2.2. Sự phối hợp các kỹ thuật trong JPEG và MPEG

2.4.1. Nén không mất thông tin

Nén không mất thông tin cho phép hồi phục đúng tín hiệu ban đầu sau khi giải nén. Đây là một quá trình mã hóa có tính thuận nghịch. Hệ số nén không mất thông tin nhỏ hơn 2:1. Các kỹ thuật nén không mất thông tin bao gồm:

2.4.1.1. Mã hóa với độ dài từ mã thay đổi VLC

Đây là phương pháp mã hóa Huffman và mã hóa entropy dựa trên khả năng xuất hiện của các biên độ trùng hợp trong một bức ảnh, thiết lập một từ mã ngắn cho các giá trị có tần suất xuất hiện cao nhất và từ mã dài cho các giá trị còn lại. Khi giải nén sử dụng các băng tìm kiếm.

2.4.1.2. Mã hóa với độ dài từ mã động RLC

Phương pháp này dựa trên sự lặp đi lặp lại của từng giá trị mẫu để tạo ra các mã đặc biệt biểu diễn sự bắt đầu và kết thúc của giá trị được lặp lại. Chỉ các mẫu có giá trị khác không mới được mã hóa. Các mẫu có giá trị bằng không được truyền đi theo cùng dòng quét. Các chuỗi 0 được tạo ra bằng quá trình giải tương quan như phương pháp DCT hay DPCM.

2.4.1.3. Sử dụng khoảng xóa dòng và xóa mành

2.4.1.4. Biến đổi Cosin rời rạc DCT

Quá trình DCT thuận nghịch được coi là không mất thông tin nếu độ dài từ mã hệ số là 13 hoặc 14 băng tần số đối với dòng video số sử dụng 8 bít biểu diễn mẫu. Nếu độ dài từ mã hệ số của phép biến đổi DTC nhỏ hơn, quá trình này sẽ bị mất thông tin.

2.4.2. Nén mất thông tin

Sau khi nén một số thông tin sẽ bị mất chất lượng hình ảnh giảm do quá trình làm tròn và loại bỏ giá trị trong phạm vi khung hình hay giữa các khung hình. Nếu nén nằm trong giới hạn sự cảm nhận của mắt người thì chất lượng suy hao không nghiêm trọng. Với việc nén có tổn hao này, nén tín hiệu mới thật sự có ý nghĩa đối với truyền hình.

Nén mất thông tin đạt tới hệ số nén 100/1. Các kỹ thuật nén không mất thông tin bao gồm:

2.4.2.1. Lấy mẫu con (Sub Sampling)

Đây là phương pháp nén có hiệu quả cao, song độ phân giải của ảnh sau khi giải nén giảm so với ảnh ban đầu. Kỹ thuật lấy mẫu con không áp dụng cho tín hiệu chói. Cấu trúc lấy mẫu 4:1:1 dùng trong ứng dụng ghi, cấu trúc 4:2:0 dùng trong các ứng dụng sản xuất và truyền dẫn chương trình MPEG.

2.4.2.2. Điều xung mã vi sai (DPCM)

Phương pháp mã dự đoán hay còn gọi là điều xung mã vi sai (DPCM – Differental pulse code modulation) không mã hoá thông tin có biên độ ở mỗi mẫu, mà chỉ mã hoá thông tin có biên độ vi sai ( biên độ chênh lệch )giữa mẫu đã cho và trị dự báo (được tạo từ các mẫu trước đó).

Phương pháp DPCM còn sử dụng đặc điểm của mắt người (kém nhạy với mức lượng tử có chênh lệch về độ chói giữa các điểm ảnh gần nhau, so với mức lượng tử hoá chênh lệch nhỏ ) và cho phép dùng đặc trưng phi tuyến về lượng tử hoá.

Trong đó : V – Tín hiệu màu ;

e = V*p (p hệ số dự đoán )= Sai số dự báo eq = Sai số lượng tử ;

V‟ = eq + p =Tín hiệu tạo lại

Giải mã DPCM

Hình 2.3. Sơ đồ khối bộ mã hoá và giải mã DPCM.

Nhằm tránh các lỗi có thể xuất hiện trong khi truyền, một mẫu đầy đủ được gửi đi theo chu kỳ nhất định, cho phép cập nhận được các giá trị chính xác.

2.4.2.3. Lượng tử hóa và mã hóa VLC các hệ số DCT

Phối hợp các kỹ thuật này cho phép biểu diễn một khối các điểm ảnh bằng số ít các bit, do vậy hiệu quả nén cao.

2.4.3. Các mã dùng trong kỹ thuật nén 2.4.3.1. Mã RLC

Phương pháp RLC (Run Length Coding) được xây dựng trên cơ sở của sự lặp đi lặp lại các điểm ảnh. RLC tách chuỗi các giá trị giống nhau và biểu diễn như một tổng. Kỹ thuật này chỉ có thể áp dụng cho các chuỗi Symbol tuyến tính, hình ảnh

Các cách mã hóa RLC:

 Tạo ra những từ mã cho mỗi độ dài chạy và kết hợp với Symbol nguồn.

 Sử dụng một số độ dài chạy và một Symbol nguồn, nếu Symbol nguồn không phải là một số hay một ký tự đặc biệt để chỉ ra cho mỗi Symbol nguồn.

Một loại cải biến của mã RLC là mã có độ dài thay đổi VLC (Variable Length Code), dùng để biểu diễn các giá trị symbols cũng như độ dài chạy. Đây là sự kết hợp của RLC với mã hóa thống kê.

RLC không thích hợp trực tiếp cho các ảnh tự nhiên có tông ảnh liên tục được mã hóa bằng quá trình số hóa tuyến tính

RLC kết hợp với kỹ thuật nén JPEG, MPEG cho kết quả tốt.

2.4.3.2. Mã hóa Shannon - Fano

Tỷ lệ nén tốt nhất có thể đạt được là entropy nguồn. Dựa trên xác suất xuất hiện của những Symbol nguồn trong một lượng thông tin, phương pháp này sử dụng những từ mã có độ dài thay đổi để mã hóa các Symbol nguồn thông qua xác xuất của chúng. Với những Symbol có xác suất xuất hiện càng lớn thì từ mã dùng để mã hóa chúng càng ngắn.

Các bước mã Shannon-Fano:

 Bước 1: Sắp xếp các Symbol nguồn với xác suất xuất hiện của chúng theo thứ tự giảm dần.

 Bước 2: Chia tập đó thành hai phần sao cho tổng xác xuất xuất hiện của các Symbol ở mỗi phần xấp xỉ bằng nhau.

 Bước 3: Mã sử dụng bit 0 để mã hóa cho các Symbol trong phần 1 và bit 1 mã hóa cho các Symbol trong phần 2.

Hình 2.4. Ví dụ mã Shannon - Fano

Ví dụ: Một ảnh có 8 Symbol (S0, S1,…, S7) với xác xuất xuất hiện lần lượt (0,1; 0,19; 0,21; 0,3; 0,07; 0,05; 0.05; 0,03). Áp dụng phương pháp mã hóa với các bước trên ta có kết quả hình 2.4.

Phương pháp Shannon - Fanon nén với độ dài trung bình của từ mã CL đạt được khoảng H < CL + H + 1 (H là lượng entropy của nguồn tin).

2.4.3.3. Mã Huffmans

Với mỗi nguồn tin tồn tại một cách mã hóa với độ dài trung bình của mỗi từ mã gần với lượng entropy của nguồn tin.

Mã Huffman tạo ra độ dài trung bình của từ mã ngắn nhất đối với tập Symbol nguồn và kết hợp với xác xuất của chúng. Mã Huffman thuộc loại mã entropy hoặc mã thống kê. Mã Huffman dùng VLC, sử dụng ít bit để mã hóa các giá trị ít xảy ra, do đó tốc độ bit giảm đáng kể.

Độ dài trung bình của từ Mã Huffman giới hạn trên bởi: H + P + log(

e e log

2 ) = H + P + 0,086 (2.3) trong đó: H là lượng entropy nguồn

P là xác xuất của tất cả các Symbol nguồn Các bước mã hóa Huffman

Bước1: Liệt kê các xác xuất symbol của nguồn và tạo ra các tập nút bằng

cách cho các xác suất này thành các nhánh của cây nhị phân. 0,3 0,51 0,21 0,3 0,21 0,19 0,1 0,07 0,05 0,05 0,03 0,03 0,05 0,05 0,07 0,08 0,12 0,1 0,19 0,29 0,49 1 0 1 1 0,2 0 1 1 1 1 0 0 0 0 S3 S2 S1 S0 S4 S5 S6 S7 00 01 100 101 1100 1101 1110 1111

bằng tổng xác xuất của xác xuất đó.

Bước3: Tạo ra một mức mẹ với xác suất mới và đánh dấu 1 nút con ở trên và

dấu 0 nút cho nút con ở dưới

Bước4: tạo tiếp tập nút bằng cách thay thế 2 nút với xác xuất nhỏ nhất cho

nút mới nếu tập nút chỉ chứa 1 nút thì kết thúc ngược lại quay lại với bước 2

Ví dụ: Một ảnh có 8 Symbol (S0, S1,…, S7) với xác xuất xuất hiện lần lượt (0,1; 0,19; 0,21; 0,3; 0,05; 0,05; 0,07; 0,03). Áp dụng phương pháp với các bước trên ta có kết quả hình 2.4

Hình 2.5. Ví dụ mã Huffman

2.5. Kỹ thuật tín hiệu Video

2.5.1. Kỹ thuật nén trong ảnh

2.5.1.1. Nguyên lý nén trong ảnh

Nén trong ảnh là loại nén nhằm giảm bớt thông tin dư thừa trong miền không gian. Nén trong ảnh sử dụng cả hai quá trình có tổn hao và không có tổn hao để giảm bớt dữ liệu trong ảnh. Quá trình này không sử dụng thông tin của các ảnh trước và sau ảnh đang xét. Nếu kỹ thuật nén dùng mành thì nén trong ảnh sẽ tạo ra hai ảnh trong mỗi ảnh.

P(s0)= 0,1 1,0 0,31 0 0 0,61 1 0 0,08 0 1 0,12 1 0,18 1 0,4 0 1 0011 11 10 01 0001 00101 0000 00100 P(s1)= 0,19 0 1 P(s6)= 0,07 P(s2)= 0,21 P(s3)= 0,3 P(s5)= 0,05 P(s4)= 0,05 P(s7)= 0,03 1

Hình 2.6 Nén trong ảnh (intraframe compression)

Trong sơ đồ nguyên lý ta thấy sử dụng phương pháp biến đổi DCT (Discrete Cosine Transfrom). Phương pháp chuyển đổi tối ưu cho mã chuyển vị là phương pháp mà đạt được bình phương của lỗi trong quá trình xây dựng lại ảnh với một số bit đã cho là nhỏ nhất, là phương pháp thông dụng nhất .Thay vì lượng tử hóa và mã hóa trực tiếp biên độ điểm ảnh, người ta lượng tử hóa và mã hóa các hệ số DCT.

2.5.1.2. Tiền xử lý

Trước khi thực hiện biến đổi DCT, cả ảnh được chia thành các khối lớn riêng biệt không chồng nhau ( MB - Macro Block). Mỗi MB bao gồm 4 block các mẫu tín hiệu chói (UY)và 2 hoặc 8 block các mẫu tín hiệu số màu (CR, CB). Số các block của tín hiệu hiệu màu phụ thuộc vào tiêu chuẩn của tín hiệu video.

Hình 2.7.Cấu tạo của Macro Block

Tất cả các block có cùng kích thước và mỗi block là một ma trận điểm ảnh 8x8 được lấy từ một ảnh màn hình theo chiều từ trái sang phải, từ trên xuống dưới.

Cấu trúc của MB cũng phục thuộc vào loại quét ảnh. Nếu quét liên tục thì các block bao gồm các mẫu từ các dòng liên tục (lúc này là nén theo ảnh – frame. Ngược lại, trong trường hợp quét xen kẽ, trong một block chỉ có các mẫu của một nửa ảnh (nén theo mành – field)

2.5.1.3. Biến đổi cosin rời rạc DCT

Biến đổi Cosin rời rạc (DCT) xử lý các giá trị của khối các điểm ảnh dưới một khối các hệ số trong miền tần số.

Quá trình mã hóa DCT một chiều gồm 8 điểm ảnh biểu diễn tín hiệu chói trong tiêu chuẩn lấy mẫu 4:2:2. Sự thay đổi độ dọc theo 8 bit trong phạm vi dải tần số tự 0 đến flm/2 = 6,75 MHz. Mã hóa DCT chia phổ này thành 8 dải băng nhỏ hơn. Tương ứng với mỗi giải băng tần có một hệ số đặc trưng cho năng lượng của tín hiệu trong dải băng tần đó.

Giá trị đầu tiên bên trái đặc trưng cho mức giá trị thành phần một chiều của tín hiệu gọi là hệ số DC. Từ trái sang phải, các hệ số lần lượt biểu diễn các thành phần tần số cao hơn trong tín hiệu ban đầu, gọi là hệ số AC.

Phép biến đổi DCT hai chiều cho mức giải tương quan bức ảnh cao hơn, cho phép biến đổi cho khối 8 x 8 giá trị các điểm chói. Việc biến đổi DCT hai chiều dựa trên cơ sở xắp xếp các mẫu f(i,j); ở đây i= 0,1,..,7; j=0.1,..,7; của bảng hệ số F(u,v); u=0,1,..,7;v=0,1,..,7 cho mỗi block , thoã mãn công thức sau :

F(u,v) =                  7 0 j 7 0 i 16 v 1 j 2 Cos 16 u 1 i 2 Cos j , i f 4 v C u C (2.4) trong đó: f(i,j) là các hàm mẫu ban đầu trong khối 8 x 8 điểm chói

F(u,v) là các hệ số biến đổi DCT khối 8 x 8

u là tần số chuẩn hóa theo chiều ngang (0 < u < 7) v là tần số chuẩn hóa theo chiều đứng (0 < v < 7) (Cu, Cv) = 2 1 (u, v) = 0 (Cu, Cv) = 1 u = 1,2,… 7 Hệ số DC được tính: F(0,0) =       7 0 k 7 0 j k , j j 8 1 (2.5) Biến đổi DCT áp dụng cho các tín hiệu video số thành phần UY, CR, CB. Các tín hiệu này có biên độ cực đại là 128 tín hiệu chói có biên độ từ 0  255.

Bộ biến đổi A/D 8 bit được sử dụng để tạo ra các khối tín hiệu chói UY với giá trị nhị phân từ - 128 đến +127. Khi giải mã mức 128 được cộng vào để thu được tín hiệu chói ban đầu.Trước khi biến đổi ngược DCT sử dụng bộ lọc thông thấp loại bỏ các hệ số thành phần tần số cao. Quá trình biến đổi DCT không giảm tốc độ dòng số liệu và tính chất đảo ngược (Inverse DCT) tái tạo lại chính xác giá trị điểm ảnh ban đầu nếu các hệ số DCT giữ nguyên

Hình 2.8 cho một ví dụ các khối DCT hai chiều của một khối block 8x8 các điểm ảnh từ một ảnh thực. Khi biến đổi DCT áp dụng cho các tín hiệu video số thành phần Y ,CR, CB các tín hiệu màu CR, CB có biên độ cực đại là ±128 giá trị nhị phân trong hệ thống sử dụng 8 bit biểu diễn mẫu và tín hiệu chói Y có biên độ từ 0 đến 225.

Để đơn giản cho việc thiết kế các bộ mã hoá DCT, tín hiệu chói Y được dịch chuyển xuống mức ngang bằng với mức tín hiệu CR, CB. Và như vậy, khi giải mã DCT, giá trị 128 sẽ được cộng với từng giá trị điểm ảnh để thu được tín hiệu Y ban đầu.

2.5.1.4. Lượng tử hoá

Bước tiếp theo của quá trình nén trong ảnh là lượng tử hoá các hệ số F(u,v) sao cho làm đơn giản được số lượng bit cần thiết.

Hình 2.9. Lượng tử hoá có trọng số

Lượng tử hoá thực hiện bằng việc chia các hệ số F(u,v) cho các hệ số ở các vị trí tương ứng trong bảng lượng tử (Q(u,v) để biểu diễn số lần nhỏ hơn các giá trị cho phép của hệ số DCT. Các hệ số có tần số thấp được chia cho các giá trị nhỏ, các hệ số ứng với tần số cao được chia cho các giá trị lớn hơn. Sau đó hệ thống được làm tròn.

Để thực hiện việc chia cho các hệ số trên, các hệ số DCT được phân vùng theo một ví dụ trong bảng

Hình 2.10. Bảng chia vùng lượng tử

Theo bảng 2.10 ta thấy có 4 vùng. Khi áp “ số lượng tử hoá “ QN04 tức số có cấu trúc 0:2:2:4 thì vùng 0 sẽ được để nguyên, hệ số vùng 1 sẽ bị chia 2, vùng 2 cũng bị chia 2, vùng 3 được chia 4. Sau khi chia các hệ số DCT sẽ được làm tròn,

Một phần của tài liệu Nghiên cứu công nghệ truyền hình số (Trang 37)

Tải bản đầy đủ (PDF)

(117 trang)