Nguyên lý nén trong ảnh

V. Nén trong ảnh

1. Nguyên lý nén trong ảnh

H23. Sơ đồ nguyên lý quá trình nén trong ảnh

Điều khiển tốc độ Bảng điện tử Tín hiệu Nguồn nén ảnh ảnh T i ề n x ữ l ý K h u y ế c h đ ạ i đ ệ m D C T t h u ậ n M ạ c h t r ộ n M ã h o á e n t r o p y L−ợ n g t ử h o á

Nén trong ảnh lμ loại nén nhằm lμm giảm bớt thông tin d− thừa trong miền không

gian. Nén trong ảnh sử dụng cả hai quá trình nén có tổn hao vμ nén không tổn hao để giảm bớt dữ liệu trong một ảnh. Quá trình nμy không sử dụng của các ảnh tr−ớc vμ sau ảnh đang xét.

Thuật ngữ ảnh ở cần đ−ợc hiểu một cách chính xác, bởi vì trong kỹ thuật nén ảnh cho phép sử dụng hoặc mμnh (fied) hoặc ảnh (frame) nh− một ảnh gốc. Nếu kỹ thuật nén dùng mμnh thì nén trong ảnh sẽ tạo ra hai ảnh trong mỗi ảnh.

2.Tiền xử lý

Tr−ớc khi thực hiện biến đổi DCT, cả ảnh đ−ợc chia thμnh các khối lớn riêng biệt không trồng nhau(khối MB).Mỗi MD bao gồm bốn block các mẫu tín hiệu chói(Y)vμ 2:4 hoặc tám block các mẫu tín hiệu số mầu(CR, CB). Số các block phụ thuộc vμo các chuẩn Videọ

0 1 0 1 4 5 0 1 4 8 5 9 2 3 2 3 6 7 2 3 6 10 7 11 ạ4:2:0 b.4:2:2 c.4:4:4

ạCấu trúc blocok tín hiệu chói (quét liên tuc)

b.Cấu trúc blocok tín hiệu chói (quét xen kẽ)

Tất cả các blok có cùng kích th−ớc vμ mỗi blok lμ một ma trận điểm ảnh 8x8 đ−ợc lấy từ một ảnh mμn hình theo chiều từ trái sang phải, từ trên xuống d−ớị Kích th−ớc block lμ 8x8 đ−ợc chọn bởi hai lý do sau:

• Thứ nhất: lμ việc nghiên cức đã chỉ ra rằng hμm hiệp ph−ơng sai suy giảm rất nhanh khi khoảng cách từ pixel mμ ở đó hμm hiệp ph−ơng sai đ−ợc định nghĩa v−ợt quá 8. Chính vì vậy mμ ph−ơng pháp nén sử dụng loại bỏ các thông tin d− thừa về không gian không cần quan tâm tới các khối pixel có kích th−ớc lớn hơn 8x8.

• Thứ hai: lμ sự tiện lợi cho việc tính toán vμ thiết kế mạch cứng. Nói chung, cả mức nén lẫn độ phức tạp về tính toán sẽ tăng nếu kích th−ớc block tăng.

VD: về việc chia thμnh các block của hình đối với hệ PAL. Phân tích cực của tín hiệu Video đối với phân giải 576x720 sẽ đ−ợc chia thμnh 72x92 block. Vμ nh− vậy sẽ có 36x45 MB nếu tiêu chuẩn lấy mẫu lμ 4:2:0 hoặc 4:1:1.

Cấu trúc của MB cũng phụ thuộc vμo loại quét ảnh. Nếu quét liên tục thì các block bao gồm các mẫu từ các dòng liên tục (lúc nμy lμ nén theo ảnh –frame) ở hình saụ Ngựơc lại trong tr−ờng hợp quét sen kẽ, trong một block, chỉ các mẫu của một nửa ảnh (nén theo mμnh-fised). Tóm lại, việc chia hình ảnh thμnh các ảnh con(block,MB) sẽ thực sự có ý nghĩa tiếp theo

3. Biến bổi cosin rời rạc(DCT)

Công đoạn đầu tiên của hầu hết các quá trình nén lμ xác định các thông tin d− thừa trong miền không gian của một mμnh hoặc một ảnh của tín hiệu VideọNén không gian đ−ợc thực hiện bởi phép biến đổi DCT(Discrete Cosine Transfrom). DCT biến đổi dữ liệu d−ới dạng biên độ thμnh dữ liệu tần số. Mục đích của quá trình biến đổi lμ tách liên kết của từng ảnh con, hoặc gói cμng nhiều năng l−ợng của ảnh con vμo một phần nhỏ các hệ số hμm truyền. Việc mã háo vμ truyền chỉ thực hiện đối với các hiệusố năng l−ợng nμy, vμ có thể cho kết quả tốt khi tạo lại tín hiệu Video có chất l−ợng caọ

DCT đã trở thμnh tiêu chuẩn quốc tế cho các hệ thống mã chuyển vị bởi nó có đặc tính gói năng l−ợng tốt, cho kết quả lμ số thực vμ có thuật toán nhanh để thực hiện chúng.

Các phép tính DCT đ−ợc thực hiện trong phạm vi các khối 8x8 mẫu tín hiệu chói Y vμ các khối t−ơng ứng của tín hiệu mầụ Việc chia hình ảnh thμnh các block đã đ−ợc thực hiện ở khối tiền xử lý. Hiệu quả của việc chia nμy rất dễ thấy vμ đó lμ một trong các phím quan trọng của mã hoá có chất l−ợng caọ

Nếu tính toán DCT trên toμn bộ frame thì ta xem toμn bộ frame có độ d− thừa lμ nh− nhaụ Nhờ đặc tính thay đổi của các ảnh khác nhau vμ các phần khác nhau của cùng một ảnh, ta có thể cải thiện một cách đáng kể việc mã hoá nếu biết tận dụng. Vì vậy để sử dụng các đặc tính thay đổi của các phần tử d− thừa trên cơ sở mở rộng không gian cuả ảnh, DCT đ−ợc tính trên các MB vμ mổi MB đ−ợc sử lý riêng biệt. Để hiểu biết ứng dụng của DCT trong nén ảnh, ta tìm hiểu thuật toán biến đổi cosin rời rạc. DCT lμ toán tử dùng để tính các thμnh phần tần số của một tín hiệu đ−ợc lấy mẫu tại một tốc độ lấy mẫụ

4. L−ợng tử hoá.

B−ớc tiếp theo của quá trình nén lμ l−ợng tử hoá các hệ số F(u, v) sao cho giảm đ−ợc số l−ợng bit cần thiết. Vì các hệ số có giá trị khác nhau, cho nên các hệ số riêng có thể tính bâừng các ph−ơng pháp khác nhaụ Các hệ số t−ơng ứng với tần số thấp có giá trị lớn hơn, vμ nh− vậy nó chứa phần năng chính của tín hiệu, do đó phải l−ợng tử hoá với độ chính xác cao nhất, vì nó biểu hiện độ chói trung bình của từng khối phần tử ảnh. Q(u,v)

F(u,v) Fq(u,v)

Hình25

Bất kỳ một sự sai sót nμo trong quá trình l−ơng tử hoá, hệ số một chiều đều có khả năng nhận biết dễ dμng, vì nó lμm thay đổi độ chói trung bình của khốị Ng−ợc lại với các hệ số t−ơng ứng với tần số cao vμ có giá trị nhỏ, thì biểu hiện bằng tập các giá trị nhỏ hơn hẳn các giá trị cho phép. Quá trình nμy có thể thực hiện đ−ợc bằng cho những khoảng cách giữa các b−ớc l−ợng tử hoá thay đổi theo hệ số.

L−ợng tử hoá đ−ợc thực hiện bằng việc chia các hệ số F(u,v) cho các hệ số ở vị trí t−ơng ứng trong bảnh l−ợng tử Q(u,v) để biểu diễn số lần nhỏ hơn các giá trị cho

B ả n g l−ợ n g t ử 8 x 8 l−ợ n g t ử h á o t h e o t r ọ n g s ố

phép của hệ số DCT. Các hệ số có tần số thấp đ−ợc chia cho các giá trị nhỏ, các hệ số ứng với tần số cao đ−ợc chia cho các giá trị lớn hơn.Sau đó các hệ số đ−ợc lμm tròn (bỏ đi các phần thập phân )

Các giá trị F(u,v) sẽ đ−ợc mã hoá trong các công đoạn tiếp theọ Cần phải xác định lμ trong quá trình l−ợng tử có trọng số có xảy ra mất thông tin, gây tổn haọ Đây lμ b−ớc gây tổn hao duy nhất trong kỷ thuật nén. Mức độ tổn hao phụ thuộc vμo giá trị các hệ số trên bảng l−ợng tử. Nhiễu l−ơng tử đối với tín hiệu mầu khó nhìn thấy hơn đối với tín hiệu chói, cho nén có thể thực hiện l−ợng tử hoá thông tin hiệu mầụ

Nh− vậy, khối l−ợng tử DCT đóng vai trò quan trọng trong quá trình l−ợng tử hoá khi thiết kế hệ thống nén Video vì nó ảnh h−ởng trực tiếp đến việc khôi phục chất l−ợng hình ảnh tốt hay xấụ Việc dùng các mã biến sao cho thu đ−ợc kết quả tốt tuỳ thuộc vμo thμnh phần tần số biến đổi chi tiết ảnh sáng từng vungf trong miền không gian ảnh. Các ảnh cμng chi tiết thì hệ số thμnh phần tần số cao cμng lớn, nếu hệ số trong các bảng l−ợng tử t−ơng ứng quá thấp có thể dẫn đến bộ đệm. Một thông tin hồi tiếp về bộ đệm cho phép điều khiển một hệ số cân bằng, qua đó điều khiển tối −u trạng thái của bộ đệm. Hệ số cân bằng nμy chỉ đ−a vμo các thμnh phần AC mμ thôị Hệ số cân bằng lμ một hằng số trong một cấu trúc khối cơ bản chứa đựng hai khối mầu vμ một số thay đổi về khối chói phụ thuộc vμo cấu trúc ảnh ban đầụ

5.Mã hoá entropỵ

l−ợng tử hoá vμ gán từ mã có sự t−ơng quan gần gủi mμ không cần phải tách biệt rõ rμng. Nói một cách khác, liên kết tối −u của l−ợng tử hoá Các giá trị l−ợng tử hoá có thể chỉ biểu diễn nhờ các từ mã có tốc độ dμi cố định hay đồng đều, tức lμ các giá trị l−ợng tử hoá biểu diễn bâừng cùng một số bit. Tuy nhiên hiệu quả của việc mã hoá không caọ Để cải tiến hiệu quả ng−ời ta dùng mã hoá entropỵ Mã hoá entropy dùng những đặc tính thống kê của tín hiệu đ−ợc mã hoá.

Mã hoá entropy có hai vấn đề đ−ợc đặt rạ

• Thứ nhất :Mã hoá entropy lμm tăng độ phức tạp vμ yêu cầu bộ nhớ lớn hơn so với mã độ dμi cố định. ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ + = ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ = ) , ( 2 ) , ( ) , ( ) , ( ) , ( ) , ( v u Q v u Q v u F v u Q v u F v u Fq

• Thứ hai : mã hoá entropy gắn liền với tính không ổn định của tín hiệu Video sẽ lμm tốc độ bit thay đổi theo thời gian. Do đó cần có cơ cấu điều khiển bộ đệm khi mã hoá guồn tốc độ bit biến đổi đ−ợc ghép với kênh tốc độ không đổị VỊ Nén liên ảnh.

1. Mô hình.

Một tính chất của tín hiệu Video lμ chứa thông tin d− thừa trong miền thời gian. Có nghĩa lμ, trong một chuổi ảnh liên tục, l−ợng thông tin chứa trong mỗi ảnh sẽ thay đổi rất ít từ ảnh nμy sang ảnh khác. Tính toán sự dịch chuyển vị trí của nội dung hình ảnh lμ một phần rất quan trọng trong kỹ thuật nén liên ảnh. Mô hình nén liên ảnh nh− sau:

Nguồn ảnh ảnh nén

Hình26.

Một chuỗi Video lμ một chuỗi ảnh tỉnh đ−ợc hiện ra với tốc độ nhanh sẽ cho cảm giác chuyển động liên tục. Mặc dù các frame có sự khác nhau, cần thiết phải có một tốc độ frame cao để đạy đ−ợc cảm giác chuyển động thực sự. Từ đó tạo ra nhiều độ d− thừa tạn thời giữa các frame kề nhau, sự bù chuyển động chính lμ để loại bỏ phần d− thừa nμỵ Sau quá trình bù chuyển động, để tăng hiệu quả nén cấn sử dụng kỹ thuật nén trong ảnh để sử lý độ d− thừa trong không gian trong phần d− thừa của bù chuyển động.

2. Xấp xỉ và bù chuyển động.

Nhiều thay đổi về c−ờng độ ánh sáng từ frame kế tiếp lμ do chuyển động của đối t−ợng. Trong mã bù chuyển động, frame hiện tại đ−ợc dự báo từ frame tr−ớc đó bằng cách xấp xỉ chuyển động giữa hai frame vμ bù chuyển động đó. Sự khác nhau giữa frame hiện tại vμ frame tr−ớc đó gọi lμ phần d− thừa của bù chuyển động vμ phần d− thừa nμy sẽ đ−ợc mã hoá.

Đối với một chuỗi Video bình th−ờng, đặc tr−ng về năng l−ợng của phần d− thừa thấp hơn rất nhiều so năng l−ợng trong tín hiệu Video gốc do loại bỏ thμnh phần d− thừa tạm thờị Mã hoá phần d− thừa thay vì mã hoá Video giúp đảm bảo thông tin d− thừa tạm thời không bị mã hoá lặp lạị

Nh− vậy, việc xác định phần ảnh rộng lμ “xấp xỉ chuyển động”. Quá trình khôi phục một ảnh bằng cách dùng các phần tử ảnh tr−ớc cùng với thông tin về chuyển

B ù c h u y ể n đ ộ n g

N é n t r o n g ả n h

động chính lμ bù chuyển động. Sự dánh giá chuyển động có thể lμ toμn framẹ Để thực hiện tối −u, chia mỗi frame thμnh các khối (8x8 pixel) sau đó mới đánh giá chuyển động cho từng khốị

Việc đánh giá chuyển động frame sẽ gây ra hai vấn đề sau:

• Thời gian dùng để theo dõi một vùng ảnh rộng của ảnh cho vector chuyển động đ−ợc tính toán.

• Các khối chuyển động dẫn đến việc xác định cái gì để đặt vμo không gian trống (do khối chuyển động ).

Sử dụng xấp xỉ vμ bù chuyển động lμ để thay thế hai yêu cầu trong hệ thống mã /giải mã. Đầu tiên bộ giải mã phải l−u ảnh tr−ớc trong khi tạo ảnh tiếp theọ Sau đó, bộ mã hoá phải tạo lại mổi ảnh sau khi mã hoá nó để dự báo cho bộ giải mã tạo ảnh nh− thế nμọ Điều nμy cần thiết vì bộ giải mã không có bất kỳ một ảnh gốc nμo có thể tạo lại khối bù chuyển động.

Một ph−ơng pháp dự đoán để tìm ra các chi tiết ảnh thay thế giữa hai khung hình nhìn nhau vμ tạo ra một vector chuyển động ở vị trí của chi tiết ảnh nμy trong khung hình t−ơng ứng. Theođó, vector chuyển động sẽ phối hợp với tất cả các khối đ−ợc nén trong khung hình tr−ớc đó mμ khối cacs điểm ảnh nμy đ−ợc lặp lại tại một vị trí mớị

Vị trí khối8x8 pixel Vị trí vùng tìm kiếm

Vị trí khối tr−ớc đó

véctor chuyển động

Vị trí khối hiện tại H27. Vector chuyển động hai khung hình liền nhau

Có nhiều ph−ơng pháp khác nhau để xác định vector thay thế, một trong số các ph−ơng pháp nμy có tên gọi lμ phối hợp các khối (block matching). Khối số liệu điểm ảnh đ−ợc lựa chọn, gọi lμ khối tham chiếu, trong khung hình hiện tại chuyển động trong khung hình tr−ớc đó. Các giá trị DCT tham chiếu đ−ợc so sánh với các giá trị 8x8 điểm trong vùng tìm kiếm để tìm ra khối thích hợp nhất, t−ơng ứng khi sự sai khác lμ nhỏ nhất. Khi đó vector xác định khoảng cách của vị trí tham chiếu

vμ vị trí phối hợp đã tìm thấy để tạo rạ Thông tin số liệu về vector chuyển động đ−ợc truyền tới cùng với khối hệ số DCT sai lệch.

Để giảm quá trình tính toán vector chuyển động, độ phân giải của ảnh có thể đ−ợc giảm xuống theo cả hai chiều ngang vμ chiều đứng. Bằng cách nμy có thể giảm số bít cần xử lý vμ dự đoán các phần chính đ−ợc thay thế trong khung hình. Ví dụ một ảnh với độ phân giải đầy đủ lμ 720x480 có thể giảm đến mức 360x240. ảnh với độ phân giải thấp có thể dùng cho vùng dự đoán lớn hơn. Đầu tiên, một dự đoán chuyển động gần đúng sẽ đ−ợc tiến hμnh trên các ảnh có độ phân giải thấp nμỵ Sau đó, một phép dự đoán vector chuyển động chính xác sẽ thực hiện tính toán vị trí thay thế chính xác của đối t−ợng giữa hai khung hình. Quá trình dự báo sẽ thực hiện qua nhiều b−ớc để thu đ−ợc dự báo chính xác cuối cùng.

Đối với các đối t−ợng chuyển động nhỏ có thể bỏ qua trong giai đoạn dự đoán chuyển động gần đúng, do đó vector dự đoán sẽ mang sai số. Tr−ờng hợp nμy sẽ sử dụng các khối nhỏ hơn. Với một vùng thay thế có kích th−ớc lớn, sai số trong quá trình phối hợp sẽ trở nên lớn hơn giữa các khối có cùng mức xám song không có liên hệ về chuyển động. Hơn nữa, nhiều những kiểu chuyển động trong bức ảnh có thể tạo ra sự xung đột trong vùng tìm kiếm. Để giải quyết vấn đề nμy có sự phân chia trong việc phối hợp các khốị

3. Tốc độ truyền sau khi nén.

Ta có mối quan hệ giữa tốc độ truyền C băng tần kênh truyền W. W≥C (W:MHz; C: Mbit/s)

D−ới đây thống kê tốc độ truyền của các loại ảnh.

• ảnh tĩnh:1,2 ữ 9,6 kbit/s.

• ảnh chuyển động chậm :12 ữ 40 kbit/s

• Truyền hình thoại: 58 ữ 2000kbit/s.

• Truyền hình đen trắng: 70 ữ 108 Mb/s.

• Truyền hình mầu: 216Mb/s

• Truyền hình HĐTV: 1,1 ữ 2,3Gb/s

Sau khi sử dụng các thuật toán nén Video, thì tốc độ truyền của tín hiệu hình đ−ợc giảm đi đánh kể, có nghĩa lμ độ rộng dải thông

giảm đị

• C=2 ữ 13Mb/s

Nh− vậy do −u điểm cho nên việc truyền tín hiệu truyền hình số có nén Video hiện đang đ−ợc sử dụng rộng rãi cho hiệu quả kinh tế vμ kỹ thuật caọ Cất l−ơng đ−ờng truyền cao, tiếc kiệm băng tần.

VIỊ Các chuẩn MPEG.

1. Giới thiệu chung về chuẩn MPEG.

Chuẩn MPEG (Moving Picture expert Groug) lμ chuổi Video với mục đích lμ mã hoá tín hiệu hình ảnh vμ âm thanh cho DSM(Digital storage Media) tốc độ từ 1,5 đến 50Mbit/svμ đ−ợc biết đến nh− lμ MPEG-1, MPEG-2, MPEG-4,...Các chuẩn MPEG tiến tới tối −u hoá cho các ứng dụng videođộng vμ các đặc điểm của nó cũng bao gồm một thuật toán cho việc nén dự liệu Audio với tỷ lệ lμ 5:1 cho tới 10:1.

Trong chuẩn MPEG, ng−ời ta định nghĩa các loại ảnh khác nhau cho phép sự

giới thiệu chung về chuẩn MPEG

Đồng bộ giữa các tín hiệu audio số