Nộn tớn hiệu video.

Một phần của tài liệu Luan van chuyen de 186101 xu ly tin hieu video bao gom so hoa va chuan (Trang 27 - 37)

00 FF FF TT MM LL

2.2 Nộn tớn hiệu video.

Nộn tớn hiệu video về cơ bản là quỏ trỡnh trong đú lượng số liệu biểu diễn thụng tin của ảnh được giảm bớt bằng cỏch loại bỏ những số liệu dư thừa trong tớn hiệu video. Thực tế số liệu và thụng tin khụng đồng nghĩa với nhau, cần phải phõn biệt giữa chỳng. Số liệu là chỉ phương tiện dựng để truyền tải thụng tin. Với cựng một lượng thụng tin cho trước cú thể biểu diễn bằng cỏc loại số liệu khỏc nhau. Độ dư thừa số liệu là vấn đề trung tõm trong nộn ảnh số. Trong quỏ trỡnh nộn luụn cú sự quan hệ giữa tỉ lệ nộn và chất lượng hỡnh ảnh sau khụi phục. Núi chung tỉ lệ nộn càng cao chất lượng ảnh khụi phục càng giảm và ngược lại. Chất lượng và quỏ trỡnh nộn cú thể thay đổi tuỳ thuộc vào đặc điểm của hỡnh ảnh nguồn và nội dung ảnh.

Trong nộn ảnh số cú cỏc loại dư thừa sau:

• Dư thừa dữ liệu theo thống kờ: gần như tất cả cỏc ảnh đều chứa một số lượng lớn cỏc giỏ trị dữ liệu thụng tin giống nhau. Dư thừa dữ liệu tồn tại trong cỏc vựng

rộng của một ảnh (dư thừa khụng gian) và giữa một chuỗi cỏc ảnh liờn tiếp (dư thừa thời gian). Cỏc hệ thống nộn sử dụng yếu tố dữ liệu giống nhau khụng cần phải lặp lại và khụng cần truyền hết mà chỉ mó hoỏ một dữ liệu đú và lặp lại toàn bộ ở phần giải mó. Quỏ trỡnh nhận dạng sự giống nhau đú được gọi là giải tương quan dữ liệu.

• Dư thừa tõm sinh lý: giỏ trị của cỏc mẫu trong cựng một ảnh được hệ thống nhỡn của mắt người HVS (Human Visual System) tiếp nhận khụng đều nhau. Hiện tượng này xuất phỏt từ sự thật là HVS khụng đỏp ứng được với cựng độ nhậy của tất cả cỏc thụng tin nhỡn thấy. Nếu HVS khụng thể nhận thấy một sai số thỡ sai số này khụng tỏc động lờn chất lượng thu nhận của ảnh khụi phục. Do đú, một số giỏ trị cú thể được thay đổi hoặc loại bỏ mà khụng ảnh hưởng đến độ dung sai về giảm chất lượng ảnh.

Để xỏc định dung lượng tối thiểu cần sử dụng cho miờu tả, truyền tải thụng tin hỡnh ảnh trước hết cần đỏnh giỏ lượng thụng tin chứa đựng trong hỡnh ảnh. Lượng thụng tin chứa trong một hỡnh ảnh tỷ lệ nghịch với khả năng xuất hiện của hỡnh ảnh. Núi cỏch khỏc, một sự kiện ít xảy ra sẽ chứ đựng nhiều thụng tin hơn một sự kiện cú nhiều khả năng xảy ra hơn. Đối với hỡnh ảnh, lượng thụng tin của một hỡnh ảnh bằng tổng số lượng thụng tin của từng phần tử ảnh. Lượng thụng tin của một phần tử ảnh được định nghĩa bằng:

I (xi) = - Log2P(x) Trong đú : I (xi) là lượng thụng tin của phần tử ảnh xi.

P(xi) là xỏc suất xuất hiện của phần tử ảnh xi.

Lượng tin tức bỡnh quõn của cả tập hợp cỏc phần tử ảnh trong hỡnh ảnh được gọi là entropy và tớnh theo cụng thức: H(x) = ∑ = N i 1 P(xi) I(xi) = - ∑ = N i 1 P(xi) Log2P(xi) 28

Entropy cuả hỡnh ảnh là một giỏ trị cú ý nghĩa quan trọng, nú xỏc định số lượng bit trung bỡnh tối thiểu cần thiết để biểu diễn một phần tử ảnh. Trong cụng nghệ nộn khụng tổn hao, entropy là giới hạn dưới của tỷ số bit / pixel. Nếu tớn hiệu video được nộn với tỷ số bit / pixel nhỏ hơn entropy thỡ hỡnh ảnh khụi phục sẽ bị mất thụng tin và quỏ trỡnh nộn sẽ cú tổn hao.

Cỏc hệ thống nộn dữ liệu là sự phối hợp của nhiều kĩ thuật xử lý nhằm làm giảm tốc độ bit của cỏc tớn hiệu số xuống một giỏ trị dung hoà được với mức chất lượng của ảnh trong cỏc ứng dụng.

Nhiều kĩ thuật nộn cú tổn thất và khụng cú tổn thất đó được đề xuất trong những năm vừa qua tuy nhiờn chỉ cú một số là thớch hợp cho cỏc ứng dụng video. Ngoài ra cũn nhiều kĩ thuật khỏc vẫn cũn tiếp tục được nghiờn cứu hoặc khú thực hiện như: biến đổi KLT (Karhuren-Loốve Transform), WHT(Walsh-Hadamard Transform), lượng tử hoỏ vector, wavelets, fractal...Riờng lẻ từng kĩ thuật giảm dữ liệu khụng cú ứng dụng đỏng kể trong thực tế. Tuy nhiờn khi phối hợp một số cỏc kĩ thuật này sẽ mang lại những hệ thống nộn rất hiệu quả như JPEG,MPEG-1, MPEG-2...

JPEG, MPEG-1, MPEG-2

Hỡnh 2.14 : Sự phối hợp cỏc kĩ thuật nộn

Dữ liệu video

Nén không tổn hao Nén có tổn hao

DCT VLC RLC Bỏ khoảng

xoá

Mẫu con

DPCM Lượng tử hoá

Trong kĩ thuật nộn video cần phõn biệt 2 nhúm đú là nộn cú tổn thất và nộn khụng cú tổn thất.

Nộn khụng tổn thất.

Nộn khụng tổn thất cho phộp khụi phục lại thụng tin như ban đầu sau khi đó giải nộn. Đú là một quỏ trỡnh mó hoỏ đảo ngược được. Nộn khụng tổn thất đối với ảnh cú chất lượng truyền hỡnh sẽ khụng cho tỷ lệ nộn cao (nhỏ hơn 2:1). Hệ số nộn phụ thuộc vào chi tiết ảnh được nộn. Cỏc kĩ thuật nộn khụng tổn thất bao gồm:

• Mó hoỏ chiều dài thay đổi (VLC : Variable Length Coding): trờn thực tế một vài giỏ trị nhất định sẽ xảy ra thường xuyờn hơn cỏc giỏ trị khỏc sau khi khung hỡnh được mó hoỏ dự đoỏn, chuyển dạng DCT và lượng tử hoỏ. VLC sử dụng đặc điểm này để thực hiện mó hoỏ, cỏc giỏ trị xảy ra thường xuyờn được gỏn với cỏc từ mó ngắn, cỏc giỏ trị ít xảy ra sẽ được gỏn với cỏc từ mó dài. Khi thực hiện giải nộn, cỏc thiết lập mó trựng hợp sẽ được sử dụng để tạo lại giỏ trị ban đầu. Mó hoỏ VLC được xem như là mó hoỏ entropy và mó hoỏ Huffman. Mó hoỏ và giải mó Huffman được thực hiện một cỏch dễ dàng bằng cỏch sử dụng cỏc bảng tỡm kiếm trong phần cứng.

• Mó húa chiều dài động (RLC : Run Length Coding): kĩ thuật này dựa vào sự lặp lại cựng giỏ trị mẫu dữ liệu để tạo ra cỏc mó đặc biệt chỉ thị sự bắt đầu và kết thỳc một giỏ trị được lặp lại. Chỉ cỏc mẫu cú giỏ trị khỏc khụng mới được mó hoỏ theo số chạy. Số mẫu cú giỏ trị bằng khụng sẽ được truyền đi dọc theo cựng dũng quột. Cỏc chuỗi 0 được tạo ra bằng quỏ trỡnh giải tương quan như phương phỏp DCT hay DPCM.

• Sử dụng khoảng xoỏ dũng và mành: vựng xoỏ dũng và mành của tớn hiệu video sẽ khụng được ghi và truyền.

• Mó húa chuyển dạng cosin rời rạc (DCT: Discrete Cosine Transfom): DCT sẽ chuyển cỏc khối 8x8 điểm ảnh từ miền khụng gian hai chiều sang miền tần số. Cỏc giỏ trị tần số gia tăng theo trục hoành từ trỏi sang phải, cỏc giỏ trị tần số theo trục tung tăng từ trờn xuống dưới. Do vậy gúc trỏi trờn cựng sẽ đại diện cho tần số 0 hay một chiều DC, gúc phải phớa dưới sẽ là tần số cao nhất.Chỳ ý rằng, quỏ trỡnh chuyển dạng khụng làm giảm tốc độ bớt, bởi vỡ cựng một số giỏ trị bớt trờn một hệ số được yờu cầu cho khối được chuyển dạng. Điểm mấu chốt của quỏ trỡnh này là cỏc hệ số tần số được chuyển dạng sẽ phự hợp hơn cho kỹ thuật giảm tốc độ bit. Đặc biệt là ở chỗ cỏc khối hỡnh ảnh được chuyển dạng cú chứa cỏc giỏ trị hệ số bằng 0 và gần bằng 0. Thực tế trong bộ mó hoỏ tớn hiệu video MPEG, DCT được ỏp dụng cho khung hỡnh sau khi nú được đưa đến mó hoỏ dự đoỏn giữa cỏc khung hỡnh. Do vậy cỏc giỏ trị biờn độ thường là nhỏ điều này dẫn đến khối được chuyển dạng cú chứa nhiều giỏ trị nhỏ.

Nộn cú tổn thất.

Nộn cú tổn thất được thực hiện bằng cỏch liờn kết 2 hoặc nhiều kĩ thuật xử lý để biểu diễn tớn hiệu hỡnh. Nộn cú tổn thất cú thể đạt tỷ lệ nộn cao từ 2:1 đến 100:1. Tỉ số nộn phụ thuộc vào nội dung ảnh được dựng trong cỏc ứng dụng. Chất lượng ảnh khụi phục khụng được như ban đầu vỡ cú sự làm trũn và giảm dữ liệu trong một frame và giữa cỏc frame. Kĩ thuật nộn cú tổn thất bao gồm:

• Lấy mẫu băng tần con: đõy là phương phỏp giảm tốc độ dữ liệu rất cú hiệu quả nhưng sự tổn thất độ phõn giải ảnh và cỏc thanh phần chồng phổ sẽ làm giảm chất lượng nội dung ảnh gốc. Vỡ lý do này nờn người ta khụng dựng lấy mẫu băng tần con cho tớn hiệu chúi. Cỏc phương phỏp lấy mẫu băng tần con tớn hiệu hiệu màu trong cỏc định dạng 4:2:0 và 4:1:1 hiện được sử dụng trong cỏc ứng dụng ghi.

• Mó hoỏ dự bỏo DPCM (Defferencial Pulse Code Modulation): chỉ truyền phần chờnh lệch giữa cỏc mẫu mà khụng truyền giỏ trị mẫu đầy đủ. Phần chờnh lệch được cộng vào giỏ trị mẫu đó giải mó và tại đầu cuối giải mó tạo một giỏ trị mẫu đó khụi phục lại. Quỏ trỡnh nộn được thực hiện bằng cỏch lượng tử hoỏ thụ tớn hiệu vi sai và dựng kĩ thuật VLC cho tớn hiệu kết quả. Để loại bỏ sai số truyền, sẽ truyền một giỏ trị mẫu đầy đủ theo chu kỡ nhất định.

• Lượng tử hoỏ và thực hiện VLC cho cỏc hệ số DCT: kết hợp ba quỏ trỡnh này sẽ cho phộp biểu diễn một khối cỏc byte của pixel bằng một số lượng nhỏ brt và tạo được kĩ thuật nộn hiệu quả và kinh tế nhất.

Để cú sự nhỡn nhận trực quan hơn về nộn tớn hiệu video, dưới đõy em xin trỡnh bày cụ thể một số kĩ thuật và hệ thống nộn thụng dụng.

2:2:1 / Mó hoỏ dự bỏo DPCM.

Trờn thực tế mó hoỏ DPCM cũng sử dụng kết hợp với cỏc kĩ thuật dự đoỏn và lượng tử hoỏ thớch nghi để hoàn thiện thờm kĩ thuật nộn này, tuy nhiờn thỡ độ phức tạp cú tăng lờn. Sơ đồ khối bộ mó húa và giải mó DPCM như sau:

Hỡnh 2.15 : Mó hoỏ DPCM 32 ∑ Bộ lượngtử hoá ∑ Mã hoá entropy Bộ dự đoán Tín hiệu video số + + + - Kênh ∑ Bộ lượngtử hoá ∑ Mã hoá entropy Bộ dự đoán Tín hiệu video số + + + - Kênh Giải mã entropy Bộ dự ∑

Kênh tín hiệu Đầu ra giải mã

+

Hỡnh 2.16 : Giải mó DPCM

Cú thể phõn biệt 2 phương phỏp DPCM trong mành và DPCM liờn mành

DPCM trong mành (Intraframe DPCM).

Tớn hiệu dự bỏo được tạo từ cỏc mẫu nằm trong cựng một mành, cỏc mẫu được biến đổi nằm trờn cựng một dũng quột (mó giữa cỏc pixel) và cựng với cỏc dũng quột lõn cận (mó giữa cỏc dũng). Tớn hiệu dự bỏo sử dụng cho tớn hiệu video là tớn hiệu tuyến tớnh. Cú hai phương phỏp tạo tớn hiệu dự bỏo:

• Dự bỏo cố định hay cũn gọi là dự bỏo độc lập với ảnh truyền hỡnh.

• Dự bỏo thớch nghi hay cũn gọi là dự bỏo phụ thuộc ảnh truyền hỡnh.

Việc chọn thuật toỏn tối ưu tạo tớn hiệu dự bỏo phụ thuộc vào hệ truyền hỡnh đang sử dụng.

Bước tiếp theo của DPCM là chọn phương phỏp lượng tử hoỏ tối ưu. Dựa trờn đặc điểm của mắt người ta cú thể sử dụng đặc trưng lượng tử hoỏ tuyến tớnh lẫn phi tuyến. Đặc tuyến cần lựa chọn sao cho khi mó hoỏ tớn hiệu bằng số bớt nhỏ nhất mà mộo lượng tử vẫn cú thể ở mức chấp nhận được. Trong DPCM, ngoài mộo lượng tử tớnh chất của PCM cũn xuất hiện mộo đặc trưng đối với cỏc phương phỏp vi sai như: nộn đường biờn (stope over-load), nhiễu hạt (granular noise), nhiễu chuyển động đường biờn (edge busyness).

Cũng giống như việc tạo dự bỏo, đặc trưng của lượng tử trong DPCM cú thể là cố định độc lập với ảnh lượng tử hay phụ thuộc vào tớn hiệu lượng tử hoỏ.

Tớn hiệu dự bỏo được tạo trờn cơ sở cỏc mẫu nằm ở cỏc mành kề trước đú. Phương phỏp này tận dụng quan hệ chặt chẽ giữa cỏc mành kế nhau của ảnh và đặc trưng của mắt(nhạy với mộo trong ảnh tĩnh hơn ảnh động).Nghiờn cứu thống kờ về cấu trỳc ảnh và tớn hiệu video cho thấy rằng sự khỏc nhau giữa cỏc ảnh là khụng lớn. Để tạo lại cỏc ảnh một cỏch trung thực chỉ cần truyền cỏc điểm ảnh làm biến đổi và khụi phục lại tại phớa thu tất cả cỏc điểm ảnh cũn lại từ mành trước hoặc ảnh trước trong bộ nhớ.

Phương phỏp cơ bản của DPCM giữa cỏc mành là mó hoỏ trực tiếp vi sai giữa cỏc mành kề nhau. Nguyờn tắc hoạt động được trỡnh bày như trong sơ đồ sau:

Hỡnh 2.17 : Sơ đồ khối DPCM liờn mành.

Trong nhiều biến thể của DPCM giữa cỏc mành, cú thể thực hiện việc mó hoỏ tiết kiệm. Nú dựa trờn đặc điểm của mắt người, cho phộp giảm độ phõn giải đối với ảnh chuyển động nhiều hơn so với ảnh tĩnh. Phương phỏp này chỉ truyền cỏc điểm ảnh cần thiết và ở phớa thu khụi phục tất cả cỏc điểm ảnh cũn lại bằng phương phỏp nội suy. Đối với tớn hiệu video thường sử dụng hàm nội suy tuyến tớnh.

2:2:2 / Mó chuyển vị (Transform Coding).

Việc mó hoỏ riờng rẽ cỏc điểm ảnh sẽ khụng tận dụng được mối quan hệ giữa cỏc khối điểm trong ảnh số. Mó chuyển vị là một cỏch cú hiệu quả trong việc mó hoỏ khối điểm thụng qua biến đổi tuyến tớnh cỏc điểm này thành cỏc hệ số chuyển vị và thực hiện mó

34Mạch Mạch trừ Lượng tử hoá m mức Kênh truyền Cộng Trễ mành Cộng Trễ mành Tín hiệu video vào Tín hiệu video ra Tín hiệu dự báo

hoỏ cỏc hệ số chuyển vị đú. Phương phỏp này tập trung vào một số ít cỏc hệ số chuyển vị chứ khụng phải là cỏc điểm ảnh của ảnh gốc, trong khi đú lượng thụng tin chỉ cú trong một số ít cỏc hệ số chuyển vị. như vậy số bit dựng cho quỏ trỡnh mó hoỏ sẽ ít đi. Một lý do nữa là HVS khụng thể nhận biết được hoàn toàn cỏc chi tiết của ảnh khi những chi tiết đú biến đổi nhanh so với cỏc biến đổi chậm, bởi vậy để mó hoỏ cỏc hệ số chuyển vị ở tần số cao ta chỉ cần một số ít bit mà chất lượng hỡnh ảnh cảm nhận được gần như khụng thay đổi.

Với biến đổi một chiều (1D), thực hiện theo: Y = T . X

T: ma trận thuận n * n với cỏc hệ số aij (i, j trong khoảng 1ữ n). n: số mẫu trờn dũng quột.

X: xỏc định n vector.

T phải thoả món là ma trận trực giao.

Với biến đổi 2D cỏc khối điểm n * n mẫu được biểu diễn dưới dạng ma trận X cú cỏc phần tử xij . Ma trận Y với cỏc phần tử ykl được xỏc định theo cụng thức:

ykl = ∑ ∑= = = n j n k 1 1 aklijxij

Biến đổi ngược:

xij = ∑ ∑= = = n j n k 1 1 bijkl ykl

Biến đổi ảnh 2D tiểu ảnh X thành ma trận Y được thực hiện như sau: X = ∑ ∑ = = n l n k 1 1 ykl akl

Trong hệ thống mó chuyển vị hai chiều cho ảnh số, trước tiờn một ảnh số được chia ra làm nhiều khối hỡnh chữ nhật, sau đú cỏc khối này được chuyển vị. Trong mó chuyển vị bước đầu tiờn là phải chọn một chuyển đổi thớch hợp để giảm sự đối lập giữa cỏc điểm

trong khối một cỏch hiệu quả. Quỏ trỡnh chuyển đổi thành mó chuyển vị khụng làm nộn dữ liệu mà nú chỉ là bước chuẩn bị cho việc giảm dữ liệu trong quỏ trỡnh lượng tử hoỏ. Phương phỏp chuyển đổi tối ưu cho mó chuyển vị là phương phỏp mà đạt được bỡnh phương của lỗi trong quỏ trỡnh xõy dựng lại ảnh (với một số bit đó cho) là nhỏ nhất. Theo nghiờn cứu người ta thấy rằng phương phỏp chuyển đổi tối ưu là chuyển đổi KL nhưng nú khụng cú một thuật toỏn biến đổi nhanh tổng quỏt. Do đú phương phỏp này khụng phổ biến. Người ta đó nghiờn cứu và đưa ra cỏc phương phỏp chuyển đổi gần tối ưu để thay thế, phương phỏp thụng dụng nhất là biến đổi DCT (Discrete Cosine Trasform). DCT được đưa ra vào năm 1974, từ đú tới nay đó cú rất nhiều thuật toỏn biến đổi nhanh cho việc tớnh toỏn DCT và ta sẽ xem xột dưới đõy.

DCT một chiều.

DCT một chiều biến đổi một bảng số biểu diễn cỏc biờn độ tớn hiệu của cỏc điểm khỏc nhau theo thời gian hoặc theo khụng gian thành một bảng khỏc của cỏc số, mỗi số biểu

Một phần của tài liệu Luan van chuyen de 186101 xu ly tin hieu video bao gom so hoa va chuan (Trang 27 - 37)

Tải bản đầy đủ (DOC)

(126 trang)
w