00 FF FF TT MM LL
2.2 Nén tín hiệu video.
Nén tín hiệu video về cơ bản là quá trình trong đó lợng số liệu biểu diễn thông tin của ảnh đợc giảm bớt bằng cách loại bỏ những số liệu d thừa trong tín hiệu video. Thực tế số liệu và thông tin không đồng nghĩa với nhau, cần phải phân biệt giữa chúng. Số liệu là chỉ phơng tiện dùng để truyền tải thông tin. Với cùng một lợng thông tin cho tr- ớc có thể biểu diễn bằng các loại số liệu khác nhau. Độ d thừa số liệu là vấn đề trung tâm trong nén ảnh số. Trong quá trình nén luôn có sự quan hệ giữa tỉ lệ nén và chất l- ợng hình ảnh sau khôi phục. Nói chung tỉ lệ nén càng cao chất lợng ảnh khôi phục càng giảm và ngợc lại. Chất lợng và quá trình nén có thể thay đổi tuỳ thuộc vào đặc điểm của hình ảnh nguồn và nội dung ảnh.
Trong nén ảnh số có các loại d thừa sau:
• D thừa dữ liệu theo thống kê: gần nh tất cả các ảnh đều chứa một số lợng lớn các giá trị dữ liệu thông tin giống nhau. D thừa dữ liệu tồn tại trong các vùng rộng của một ảnh (d thừa không gian) và giữa một chuỗi các ảnh liên tiếp (d thừa thời
gian). Các hệ thống nén sử dụng yếu tố dữ liệu giống nhau không cần phải lặp lại và không cần truyền hết mà chỉ mã hoá một dữ liệu đó và lặp lại toàn bộ ở phần giải mã. Quá trình nhận dạng sự giống nhau đó đợc gọi là giải tơng quan dữ liệu.
• D thừa tâm sinh lý: giá trị của các mẫu trong cùng một ảnh đợc hệ thống nhìn của mắt ngời HVS (Human Visual System) tiếp nhận không đều nhau. Hiện tợng này xuất phát từ sự thật là HVS không đáp ứng đợc với cùng độ nhậy của tất cả các thông tin nhìn thấy. Nếu HVS không thể nhận thấy một sai số thì sai số này không tác động lên chất lợng thu nhận của ảnh khôi phục. Do đó, một số giá trị có thể đ- ợc thay đổi hoặc loại bỏ mà không ảnh hởng đến độ dung sai về giảm chất lợng ảnh.
Để xác định dung lợng tối thiểu cần sử dụng cho miêu tả, truyền tải thông tin hình ảnh trớc hết cần đánh giá lợng thông tin chứa đựng trong hình ảnh. Lợng thông tin chứa trong một hình ảnh tỷ lệ nghịch với khả năng xuất hiện của hình ảnh. Nói cách khác, một sự kiện ít xảy ra sẽ chứ đựng nhiều thông tin hơn một sự kiện có nhiều khả năng xảy ra hơn. Đối với hình ảnh, lợng thông tin của một hình ảnh bằng tổng số lợng thông tin của từng phần tử ảnh. Lợng thông tin của một phần tử ảnh đợc định nghĩa bằng:
I (xi) = - Log2P(x) Trong đó : I (xi) là lợng thông tin của phần tử ảnh xi.
P(xi) là xác suất xuất hiện của phần tử ảnh xi.
Lợng tin tức bình quân của cả tập hợp các phần tử ảnh trong hình ảnh đợc gọi là entropy và tính theo công thức:
H(x) = ∑ = N i 1 P(xi) I(xi) = - ∑ = N i 1 P(xi) Log2P(xi)
Entropy cuả hình ảnh là một giá trị có ý nghĩa quan trọng, nó xác định số lợng bit trung bình tối thiểu cần thiết để biểu diễn một phần tử ảnh. Trong công nghệ nén không tổn hao, entropy là giới hạn dới của tỷ số bit / pixel. Nếu tín hiệu video đợc nén
với tỷ số bit / pixel nhỏ hơn entropy thì hình ảnh khôi phục sẽ bị mất thông tin và quá trình nén sẽ có tổn hao.
Các hệ thống nén dữ liệu là sự phối hợp của nhiều kĩ thuật xử lý nhằm làm giảm tốc độ bit của các tín hiệu số xuống một giá trị dung hoà đợc với mức chất lợng của ảnh trong các ứng dụng.
Nhiều kĩ thuật nén có tổn thất và không có tổn thất đã đợc đề xuất trong những năm vừa qua tuy nhiên chỉ có một số là thích hợp cho các ứng dụng video. Ngoài ra còn nhiều kĩ thuật khác vẫn còn tiếp tục đợc nghiên cứu hoặc khó thực hiện nh: biến đổi KLT (Karhuren-Loève Transform), WHT(Walsh-Hadamard Transform), lợng tử hoá vector, wavelets, fractal...Riêng lẻ từng kĩ thuật giảm dữ liệu không có ứng dụng đáng kể trong thực tế. Tuy nhiên khi phối hợp một số các kĩ thuật này sẽ mang lại những hệ thống nén rất hiệu quả nh JPEG,MPEG-1, MPEG-2...
JPEG, MPEG-1, MPEG-2
Hình 2.14 : Sự phối hợp các kĩ thuật nén
Trong kĩ thuật nén video cần phân biệt 2 nhóm đó là nén có tổn thất và nén không có tổn thất.
Nén không tổn thất.
Dữ liệu video
Nén không tổn hao Nén có tổn hao
DCT VLC RLC Bỏ khoảng
xoá
Mẫu con
DPCM Lượng tử hoá
Nén không tổn thất cho phép khôi phục lại thông tin nh ban đầu sau khi đã giải nén. Đó là một quá trình mã hoá đảo ngợc đợc. Nén không tổn thất đối với ảnh có chất lợng truyền hình sẽ không cho tỷ lệ nén cao (nhỏ hơn 2:1). Hệ số nén phụ thuộc vào chi tiết ảnh đợc nén. Các kĩ thuật nén không tổn thất bao gồm:
• Mã hoá chiều dài thay đổi (VLC : Variable Length Coding): trên thực tế một vài giá trị nhất định sẽ xảy ra thờng xuyên hơn các giá trị khác sau khi khung hình đợc mã hoá dự đoán, chuyển dạng DCT và lợng tử hoá. VLC sử dụng đặc điểm này để thực hiện mã hoá, các giá trị xảy ra thờng xuyên đợc gán với các từ mã ngắn, các giá trị ít xảy ra sẽ đợc gán với các từ mã dài. Khi thực hiện giải nén, các thiết lập mã trùng hợp sẽ đợc sử dụng để tạo lại giá trị ban đầu. Mã hoá VLC đợc xem nh là mã hoá entropy và mã hoá Huffman. Mã hoá và giải mã Huffman đợc thực hiện một cách dễ dàng bằng cách sử dụng các bảng tìm kiếm trong phần cứng.
• Mã hóa chiều dài động (RLC : Run Length Coding): kĩ thuật này dựa vào sự lặp lại cùng giá trị mẫu dữ liệu để tạo ra các mã đặc biệt chỉ thị sự bắt đầu và kết thúc một giá trị đợc lặp lại. Chỉ các mẫu có giá trị khác không mới đợc mã hoá theo số chạy. Số mẫu có giá trị bằng không sẽ đợc truyền đi dọc theo cùng dòng quét. Các chuỗi 0 đợc tạo ra bằng quá trình giải tơng quan nh phơng pháp DCT hay DPCM.
• Sử dụng khoảng xoá dòng và mành: vùng xoá dòng và mành của tín hiệu video sẽ không đợc ghi và truyền.
• Mã hóa chuyển dạng cosin rời rạc (DCT: Discrete Cosine Transfom): DCT sẽ chuyển các khối 8x8 điểm ảnh từ miền không gian hai chiều sang miền tần số. Các giá trị tần số gia tăng theo trục hoành từ trái sang phải, các giá trị tần số theo trục tung tăng từ trên xuống dới. Do vậy góc trái trên cùng sẽ đại diện cho tần số 0 hay một chiều DC, góc phải phía dới sẽ là tần số cao nhất.Chú ý rằng, quá trình chuyển
dạng không làm giảm tốc độ bít, bởi vì cùng một số giá trị bít trên một hệ số đ ợc yêu cầu cho khối đợc chuyển dạng. Điểm mấu chốt của quá trình này là các hệ số tần số đợc chuyển dạng sẽ phù hợp hơn cho kỹ thuật giảm tốc độ bit. Đặc biệt là ở chỗ các khối hình ảnh đợc chuyển dạng có chứa các giá trị hệ số bằng 0 và gần bằng 0. Thực tế trong bộ mã hoá tín hiệu video MPEG, DCT đợc áp dụng cho khung hình sau khi nó đợc đa đến mã hoá dự đoán giữa các khung hình. Do vậy các giá trị biên độ thờng là nhỏ điều này dẫn đến khối đợc chuyển dạng có chứa nhiều giá trị nhỏ.
Nén có tổn thất.
Nén có tổn thất đợc thực hiện bằng cách liên kết 2 hoặc nhiều kĩ thuật xử lý để biểu diễn tín hiệu hình. Nén có tổn thất có thể đạt tỷ lệ nén cao từ 2:1 đến 100:1. Tỉ số nén phụ thuộc vào nội dung ảnh đợc dùng trong các ứng dụng. Chất lợng ảnh khôi phục không đợc nh ban đầu vì có sự làm tròn và giảm dữ liệu trong một frame và giữa các frame. Kĩ thuật nén có tổn thất bao gồm:
• Lấy mẫu băng tần con: đây là phơng pháp giảm tốc độ dữ liệu rất có hiệu quả nhng sự tổn thất độ phân giải ảnh và các thanh phần chồng phổ sẽ làm giảm chất l- ợng nội dung ảnh gốc. Vì lý do này nên ngời ta không dùng lấy mẫu băng tần con cho tín hiệu chói. Các phơng pháp lấy mẫu băng tần con tín hiệu hiệu màu trong các định dạng 4:2:0 và 4:1:1 hiện đợc sử dụng trong các ứng dụng ghi.
• Mã hoá dự báo DPCM (Defferencial Pulse Code Modulation): chỉ truyền phần chênh lệch giữa các mẫu mà không truyền giá trị mẫu đầy đủ. Phần chênh lệch đợc cộng vào giá trị mẫu đã giải mã và tại đầu cuối giải mã tạo một giá trị mẫu đã khôi phục lại. Quá trình nén đợc thực hiện bằng cách lợng tử hoá thô tín hiệu vi sai và dùng kĩ thuật VLC cho tín hiệu kết quả. Để loại bỏ sai số truyền, sẽ truyền một giá trị mẫu đầy đủ theo chu kì nhất định.
• Lợng tử hoá và thực hiện VLC cho các hệ số DCT: kết hợp ba quá trình này sẽ cho phép biểu diễn một khối các byte của pixel bằng một số lợng nhỏ brt và tạo đ- ợc kĩ thuật nén hiệu quả và kinh tế nhất.
Để có sự nhìn nhận trực quan hơn về nén tín hiệu video, dới đây em xin trình bày cụ thể một số kĩ thuật và hệ thống nén thông dụng.
2:2:1 / Mã hoá dự báo DPCM.
Trên thực tế mã hoá DPCM cũng sử dụng kết hợp với các kĩ thuật dự đoán và lợng tử hoá thích nghi để hoàn thiện thêm kĩ thuật nén này, tuy nhiên thì độ phức tạp có tăng lên. Sơ đồ khối bộ mã hóa và giải mã DPCM nh sau:
Hình 2.15 : Mã hoá DPCM
Hình 2.16 : Giải mã DPCM
Có thể phân biệt 2 phơng pháp DPCM trong mành và DPCM liên mành
∑ Bộ lượngtử hoá ∑ ∑ Mã hoá entropy Bộ dự đoán Tín hiệu video số + + + - Kênh ∑ Bộ lượngtử hoá ∑ Mã hoá entropy Bộ dự đoán Tín hiệu video số + + + - Kênh Giải mã entropy Bộ dự đoán ∑
Kênh tín hiệu Đầu ra giải mã
+