Tổng quan về chuẩn nén

Một phần của tài liệu (LUẬN văn THẠC sĩ) cách nén video trong hệ thống hội nghị truyền hình ứng dụng trong việc họp giao ban trực tuyến, tập huấn, đào tạo cán bộ trong ngành giáo dục tỉnh quảng ninh​ (Trang 29 - 44)

GIỚI THIỆU VỀ LỊCH SỬ PHÁT TRIỂN CỦA KỸ THUẬT MPEG

Thuật ngữ MPEG viết tắt của cụm từ Moving Picture Experts Group là 1 nhĩm chuyên nghiên cứu phát triển các tiêu chuẩn về hình ảnh số và nén âm thanh theo chuẩn ISO/IEC từ năm 1988. Cho đến nay nhĩm làm việc MPEG đã phát triển và phát hành nhiều tiêu chuẩn nén cho các loại ứng dụng khác nhau, nhƣng nổi bật là các chuẩn MPEG-1, MPEG-2, MPEG-4, và H.264/AVC. MPEG chỉ là một tên riêng, tên chính thức của nĩ là: ISO/IEC JTC1 SC29 WG11.

TIÊU CHUẨN MPEG-1

Chuẩn MPEG-1 xuất hiện vào 11/1992 là chuẩn khởi đầu cho việc nén các ảnh động và đây cũng là nền tảng phát triển cho các chuẩn nén khác trong họ MPEG, nĩ đƣợc mệnh danh là chuẩn “khởi động thiết bị số“. MPEG-1 định nghĩa một tiêu chuẩn chuẩn mã hố video và âm thanh lƣu trữ trong CD-ROM, đĩa Winchester với tốc độ vào khoảng 1,5Mbit/s, độ phân giải hình ảnh là 352 x

1993 1995 1997 1999 2000 2001 2003 2005 MPEG-1 (11/1992) MPEG-4 H.264 (2003) MPEG-4 v1 (1998/99) MPEG-4 v2 (1999/00) MPEG-4 v3 (2001) MPEG-2 (H.262) (1994/95)

240 (30 frame/s) hay 352x288 (25 frame/s). Chuẩn MPEG-1 đƣợc ứng dụng trong các phần mềm huấn luyện bằng máy tính, các game hành động, video chất lƣợng VHS, Karaoke..

Tín hiệu video số MPEG-1 bao gồm một tín hiệu chĩi Y và 2 tín hiệu màu Cr, Cb với tỷ số lấy mẫu là 2:1. Trƣớc khi mã hĩa các ảnh cĩ thể đƣợc sắp xếp lại theo trật tự giải mã mới vì bộ giải mã chỉ cĩ thể giải mã đƣợc ảnh B sau khi đã giải mã ảnh P và I. Sau quá trình giải mã, các ảnh đƣợc sẽ đƣợc sắp xếp lại nhƣ cũ.

Sau khi chọn kiểu ảnh, bộ mã hố sẽ đánh giá chuyển động cho mỗi khối MB và tạo ra một vector chuyển động cho một ảnh P và 2 vector chuyển động cho ảnh B.

Tùy thuộc kiểu ảnh mà tín hiệu sai số đƣợc phát hiện bằng cách tìm ra sai số giữa dự đốn bù chuyển động và dữ liệu hiện tại trong mỗi MB. Tín hiệu sai số dự đốn đƣợc chuyển đến khối DCT 8x8 và bộ lƣợng tử để tạo hệ số lƣợng tử. Một bộ điều khiển tốc độ bit cĩ nhiệm vụ điều chỉnh dữ liệu ngõ ra thơng qua điều chỉnh bƣớc lƣợng tử. Các hệ số này đƣợc quét theo ma trận Zig-Zag và mã hố bằng mã Entropy rồi mới đƣa ra kênh truyền.

Các đặc điểm của tiêu chuẩn MPEG-1

 Cấu trúc lấy mẫu 4:2:0

 Chỉ cĩ khả năng quét liên tiếp.

 Biểu diễn mẫu bằng từ mã 8 bits, độ chính xác của quá trình lƣợng tử và biến đổi DCT là 9 bits.

 Sử dụng phƣơng pháp DPCM để lƣợng tử hĩa cho hệ số DC. Bù chuyển động cho các MB 16x16 trong cùng một khung hình hoặc giữa các khung với nhau.

 Độ chính xác dự đốn chuyển động là 1 pixel.

 Chuẩn MPEG-1 cĩ 4 kiểu ảnh đĩ là Intra, Predicted, Bidirectional và ảnh D (DC coded picture). Nĩ gần giống ảnh I nhƣng chỉ cĩ thành phần một chiều ở đầu ra DCT đƣợc thể hiện. Nĩ cho phép dị nhanh nhƣng cho chất lƣợng ảnh thấp.

Cấu trúc dịng bit của MPEG-1

Chuẩn MPEG-1 định nghĩa một kiểu phân cấp cấu trúc trong dữ liệu Video và đây cũng là cấu trúc dữ liệu chung cho cả chuẩn MPEG về sau. Cấu trúc dữ liệu nhƣ sau:

+ Khối (Block) gồm 8x8 pixels tín hiệu chĩi và màu đƣợc định nghĩa dùng cho nén DCT.

+ Tổ hợp khối (Macroblock) gồm các khối Y, Cb và Cr tƣơng ứng với nội dung thơng tin của một khối 16x16 pixel của thành phần chĩi hoặc khối 8x8 của 2 thành phần màu trong hình ảnh gốc. Một MB bao gồm 6 khối trong đĩ cĩ 4 khối Y, 1 khối Cb và 1 Cr nhƣ hình vẽ, các khối sẽ đƣợc đánh số thứ tự bắt đầu bằng 1

+ Mảng (Slice) gồm nhiều MB. Kích thƣớc slice lớn nhất là 1 ảnh, nhỏ nhất là 1 MB Thứ tự các MB bên trong slice đƣợc xác định từ trái qua phải, trên xuống dƣới. Phần header của slice chứa thơng tin về vị trí của mảng trong tồn bộ ảnh và hệ số của bộ lƣợng tử. Slice rất quan trọng trong việc định lỗi, nếu dịng dữ liệu cĩ chứa lỗi, bộ giải mã cĩ thể bỏ qua và tiếp tục ở slice kế tiếp. Nhiều slice trên dịng dữ liệu cho phép che giấu lỗi tốt hơn và đƣợc dùng để cải thiện chất lƣợng hình ảnh.

+ Ảnh (Picture): gồm nhiều slice cho phép bộ giải mã xác định loại mã hĩa khung. Thơng tin header để chỉ thứ tự truyền khung để bộ giải mã sắp xếp lại các ảnh đúng thứ tự, ngồi ra thơng tin header cịn chứa các thơng tin về đồng bộ, độ phân giải, phạm vị của vector chuyển động …

+ Nhĩm ảnh (GOP): gồm nhiều ảnh bắt đầu từ ảnh I. Chỉ báo điểm bắt đầu cho việc biên tập và việc tìm kiếm. Phần header chứa mã điều khiển và mã thời gian 25 bit cho thơng tin định thời.Cấu trúc của một GOP đƣợc mơ tả bằng 2 tham số:

Hình II.2. Cấu trúc chuỗi video MPEG

- M: là khoảng cách giữa các ảnh P-pictures. Ví dụ: Ta cĩ 1 GOP nhƣ sau :

B1 B2 I3 B4 B5 B7 B8 P9 B10 B11 P12. Tức N = 12 và M = 3.

+ Chuỗi ảnh (Sequence): bắt đầu là một Sequence Header, 1 hay nhiều GOP và 1 mã kết thúc chuỗi End-of-Sequence. Thơng tin header chứa kích thƣớc mỗi chiều của bức ảnh, kích thƣớc điểm ảnh, tốc độ bit của dịng video số, tần số ảnh, bộ đệm tối thiểu cần cĩ. Chuỗi ảnh và thơng tin header cịn đƣợc gọi chung là dịng cơ bản ES.

Tiêu chuẩn nén MPEG-1 cho phép truy cập các khung hình ngẫu nhiên video, tìm kiếm thuận nghịch trên dịnh tín hiệu nén biên tập và phát lại trên dịng tín hiệu nén. Các cơng cụ của nĩ đều cĩ trong các tiêu chuẩn MPEG-2, nên MPEG-2 vẫn cĩ thể giải mã các dịng tín hiệu MPEG-1.

TIÊU CHUẨN MPEG-2

Các đặc điểm của tiêu chuẩn MPEG-2

Kỹ thuật nén MPEG-2 xuất hiện vào 1995, định nghĩa cho một tiêu chuẩn kỹ thuật “truyền hình số”. MPEG-2 cĩ thể tạo hình ảnh lớn gấp 4 lần MPEG-1 với độ nét cao hơn và rõ hơn (720 x 480 và 1280 x 720) cho phép mã hố ở nhiều mức độ phân giải khác nhau đáp ứng cho nhiều ứng dụng nhƣ ứng dụng 2-5Mbps trong SDTV và 6-8Mbps trong DVD, 20Mbps trong HDTV, đặc biệt đƣợc ứng dụng trong truyền hình số mặt đất với mỗi thiết bị khác nhau, sẽ cĩ các bộ mã hố và giải mã khác nhau nhằm giảm băng thơng đƣờng truyền. Những cải tiến của nĩ nhƣ sau:

 Chuẩn nén MPEG-2 cĩ tốc độ bit > 4 Mbit/s.

 Cấu trúc lấy mẫu 4:4:4, 4:2:2, 4:2:0.

 Các giá trị hệ số DCT cĩ thể biểu thị với mức độ chính xác cao.

 Các ma trận lƣợng tử cĩ thể thay đổi theo mức frame, thành phần màu.

 Cĩ khả năng quét xen kẽ và liên tục, cho phép xấp xỉ bù chuyển động, xây dựng cơ sở dự báo trên cơ sở mành.

 Khả năng tách lỗi và giảm độ nhạy tín hiệu nén đối với các lỗi truyền, nếu tỷ số nén cao bị ảnh hƣởng.

 Độ chính xác mẫu vào là 10 bit. Dùng lƣợng tử DPCM chính xác cho các hệ số DC.

 Cĩ tính tƣơng hợp và co dãn cao theo khơng gian, thời gian.

 Độ phân giải ƣớc lƣợng chuyển động là ½ pixel, 1 pixel.

MPEG-2 định nghĩa các profile và các level khác nhau cho phù hợp với nhiều loại ứng dụng. Cĩ 5 định nghĩa profile và 4 level nhƣ sau.

Simple Main SNR Spatially High

Low 4:2:0, 352 x 288 4Mbps 4:2:0, 352 x 288 4Mbps, I, P ,B Main 4:2:0 720 x 576 15 Mbps, I, P 4:2:0 720 x 576 15 Mbps, I, P, B 4:2:0 720 x 576 15 Mbps, I, P, B 4:2:0 720 x 576 20Mbps, I, P, B High 1440 4:2:0 1440 x 1152 60 Mbps, I, P, B 4:2:0 1440 x 1152, 60 Mbps, I, P, B 4:2:0, 4:2:2 1440 x 1152 80 Mbps, I, P, B High 4:2:0 1192 x 1152 80 Mbps, I, P, B 4:2:0, 4:2:2 1192 x 1152 100 Mbps I P, B

Sự khác nhau chính giữa MPEG-1 và MPEG-2

MPEG-1 MPEG-2

Băng thơng ở mức trung bình (tối đa

1.5 Mbits/sec) Băng thơng lớn (tối đa 40 Mbits/sec) 1.25 Mbits/sec video 352 x 240 x 30

Hz Kích thƣớc khổ rộng.

2 kênh âm thanh 250 Kbits/sec Lên đến 5 kênh âm thanh (nhƣ surround sound)

Khơng quét xen kẽ. Cĩ thể quét xen kẽ.

Thích hợp cho lƣu trữ CD. Cĩ thể dùng trong truyền hình phân giải cao HDTV

TIÊU CHUẨN MPEG-4

Phiên bản đầu tiên của MPEG-4 xuất hiện vào 2/1999. Cuối 1999 MPEG-4 v2 ra đời và trở thành tiêu chuẩn quốc tế vào đầu năm 2000. So với MPEG-1, MPEG-2 thì MPEG-4 cĩ nhiều nổi bật hơn nhƣ hiệu suất nén cao, vận hành trên cơ sở nội dung…và rõ ràng cĩ nhiều ứng dụng hơn. MPEG-4 định nghĩa một tiêu chuẩn cho các ứng dụng truyền thơng đa phƣơng tiện, các hình ảnh, âm thanh và dữ liệu đồ hoạ và việc tái hợp chúng trên thiết bị thu, hay nĩi cách khác nĩ là sự hội ngộ giữa truyền hình và Web. Đặc điểm chính của MPEG-4 là mã hĩa video và audio ở tốc độ bit rất thấp. Thực tế tiêu chuẩn này tối ƣu ở ba ngƣỡng tốc độ bit sau:

 Dƣới 64kbps|

 Từ 64 đến 384 kbps|

 Từ 384 đến 4Mbps|

Hơn nữa một đặc điểm quan trọng của MPEG-4 là cho phép khơi phục lỗi tại phía thu nên rất thích hợp cho các ứng dụng truyền qua mơi trƣờng sẽ xảy ra lỗi nhƣ moblie, wireless…Chuẩn MPEG-4 là chuẩn quốc tế đầu tiên định nghĩa các VOP mà trong đĩ các phần của một cảnh cĩ thể đƣợc thao tác riêng rẽ trong

khi những phần khác vẫn khơng đổi. Những profile và level khác nhau trong MPEG-4 cho phép sử dụng tốc độ bit lên đến 38.4Mbps và việc xử lý chất lƣợng studio lên đến 1.2Gbps. MPEG-4 đạt yêu cầu ứng dụng cho các dịch vụ nội dung video cĩ tính tƣơng tác và các dịch vụ truyền thơng video trực tiếp hay lƣu trữ.

Các đối tƣợng khác nhau trong ảnh gốc đƣợc mã hĩa và truyền đi một cách riêng biệt, nhƣ ta đã biết khơng cĩ một phƣơng pháp mã hĩa nào là tối ƣu hồn tồn. DCT và phép lƣợng tử chỉ tối ƣu với các ứng dụng cĩ băng thơng hạn chế, các ảnh cĩ độ chĩi ít thay đổi, nhƣng với ảnh nhiều chi tiết, cĩ kích thƣớc nhỏ thì khơng tối ƣu. Lấy ví dụ nếu một cảnh cĩ chứa các dịng text, nếu mã hĩa bằng MPEG-1, MPEG-2 thì sẽ khơng hiệu quả vì nĩ chỉ xem đĩ nhƣ là chi tiết ảnh thơng thƣờng.

Trái lại, MPEG-4 cho phép giải mã luồng text kết hợp với video và các thơng tin trong luồng bit cĩ thể hiện thị nhiều dạng khác nhau tùy thuộc vào lựa chọn của ngƣời sử dụng ví dụ nhƣ tùy chọn ngơn ngữ... nên mang lại hiệu suất cao hơn.

Tuy nhiên MPEG-4 cũng cĩ một số nhƣợc điểm là bộ giải mã phải cĩ khả năng giải mã hết tất cả các luồng bit mà nĩ hỗ trợ và cĩ khả năng kết hợp. Do đĩ phần cứng bộ giải mã MPEG-4 phức tạp hơn MPEG-2 rất nhiều. Cũng chính vì vậy mà các nhà nghiên cứu luơn nỗ lực tìm tịi, phát minh những cơng cụ mã hĩa tối ƣu hơn.

SO SÁNH ĐẶC ĐIỂM NỔI BẬT CỦA CÁC CHUẨN NÉN

Trong tiến trình phát triển của chuẩn nén MPEG, các chuẩn nén sau ra đời là sự kế thừa và phát triển của chuẩn trƣớc, chính vì vậy các chuẩn nén tiên tiến hơn phải cĩ sự phân cấp, mềm dẻo để cĩ thể đáp ứng các ứng dụng của chuẩn nén cũ. Bảng sau so sánh sự khác biệt và sự tối ƣu giữa các chuẩn nén thuộc họ MPEG.

Hình II.3. So sánh sự tối ưu giữa các chuẩn nén

Standard MPEG-1 MPEG-2 MPEG-4 H.264

MB size 16 x 16 16 x 16 16 x 16 16 x 16

Block size 8 x 8 8 x 8 16 x 16, 8 x 8 16x16, 16x8, 8x16 8x8,8x4,4x8,4x4

Transform DCT DCT DCT, DWT 4x4 Int transform

Entropy

coding VLC VLC VLC

VLC, CAVLC, CABAC

ME, MC Yes Yes Yes 41 MVs/MB

Pixel

accuracy ½ pixel ½ pixel ½ pixel ¼ pixel

Reference

frames 1 frame 1 frame 1 frame 5 frame

Picture type I, P, B I, P, B I, P, B I, P, B

Transmission

rate 1.5 Mbps 2-15Mbps 64kbps-2Mbps 64kbps-150Mbps

Từ các bộ mã hố đơn giản, hoạt động tốt nhƣng đơi khi cĩ một số hình ảnh mà nĩ khơng thể nén đƣợc, điều này đã thúc đẩy các nhà thiết kế phát triển các cơng cụ nén mới dựa trên nền của các chuẩn trƣớc, trong đĩ hiệu quả mã

hĩa là vấn đề đƣợc quan tâm nhất, vì thế MPEG-4 ra đời là điều tất yếu trong tiến trình phát triển. Sự phát triển của MPEG-4 H.264/AVC trải qua nhiều giai đoạn nhƣ: MPEG-4 part 2 đƣợc ISO cơng bố vào 1999, nĩ là tiêu chuẩn cho những ứng dụng truyền thơng đa phƣơng tiện với tốc độ bit thấp và cho ứng dụng truyền hình quảng bá trong tƣơng lai. Tuy nhiên chất lƣợng của nĩ vẫn chƣa đạt đƣợc nhƣ mong muốn, chính vì vậy mà ISO/IEC (MPEG) và ITU đã cùng nhau hợp tác và thành lập nhĩm Joint Video Team (JVT), để nghiên cứu phát triển chuẩn mã hĩa tiên tiến là Advanced Video Coding (AVC). Và đến 2003 đã cho ra đời chuẩn MPEG-4 part 10, tên theo tiêu chuẩn ISO/IEC 14496-10 và H.246 AVC trong ITU hay cịn gọi là MPEG-4 H.264/AVC, gọi tắt là H.264/AVC.

Phiên bản thứ 2 đƣợc tổ chức JVT phát triển mở rộng và phổ biến với tên gọi Fidelity Range Extensions (FRExt) cĩ độ phân giải video mang tính trung thực cao đƣợc cơng bố vào tháng 3/2005 với các đặc tính nhƣ:

Coding Tools High High 10 High 4:2:2 High 4:4:4

Main Profile Tools X X X X

4:2:0 Chroma Format X X X X

8 Bit Sample Bit Depth X X X X

8x8 vs. 4x4 Transform Adaptivity X X X X

Quantization Scaling Matrices X X X X

Separate Cb and Cr QP control X X X X

Monochrome video format X X X X

9 and 10 Bit Sample Bit Depth X X X

4:2:2 Chroma Format X X

11 and 12 Bit Sample Bit Depth X

4:4:4 Chroma Format X

Residual Color Transform X

Predictive Lossless Coding X

Bảng II.1. Những cơng cụ mới trong H.264/AVC FRExt.

Sự mở rộng này cho phép mã hố chất lƣợng hình ảnh cao hơn bằng việc tăng độ chính xác chiều sâu bit lấy mẫu và thơng tin độ phân giải màu, bao gồm

các cấu trúc lấy mẫu nhƣ YUV 4:2:2 và YUV 4:4:4. Ngồi ra cịn bổ sung một số đặc tính nhƣ chuyển mạch thích nghi giữa phép biến đổi nguyên 4x4 và 8x8, bộ mã hố theo giác quan dựa trên ma trận lƣợng tử, kỹ thuật mã hố tổn hao trong khối và kỹ thuật lọc tách khối.

CÁC PROFLIES VÀ LEVELS TRONG H.264/AVC

Để tạo điều kiện cho ngƣời sử dụng lựa chọn cơng cụ H.264/AVC, các thiết bị đƣợc chia thành các nhĩm cơng cụ (profile). Mỗi profile lại cĩ các mức levels khác nhau thể hiện mức độ phức tạp xử lý tính tốn dữ liệu của cơng cụ đĩ (thơng qua việc xác định tốc độ bit, con số tối đa của các đối tƣợng trong frame, độ phức tạp của quá trình giải mã audio..).

CÁC PROFILES

H.264/AVC định nghĩa 4 profiles nhƣ sau

H.264/AVC Profiles

BASELINE

(Video Conferencing & Wireless) EXTENDED (Streaming) MAIN (Broadcast) HIGH

I Slices I Slices I Slices I Slices

P Slices P Slices P Slices P Slices

CAVLC CAVLC CAVLC CAVLC

4x4 Transform 4x4 Transform 4x4 Transform 4x4 Transform

Weighted Prediction Weighted

Prediction

Weighted Prediction

B Slices B Slices B Slices

CABAC CABAC Quantization Matrix 8x8 Transform ASO ASO FMO FMO

Redundant Slices Redundant Slices

Data Partitioning SP Slices, SI Slices

CÁC LEVELS

Trong H.264/AVC định nghĩa 16 level xác định các giới hạn trên cho kích thƣớc ảnh, tốc độ xử lý, kích thƣớc vùng nhớ đệm, tốc độ bit video… Level number Max MB/s Max frame

Một phần của tài liệu (LUẬN văn THẠC sĩ) cách nén video trong hệ thống hội nghị truyền hình ứng dụng trong việc họp giao ban trực tuyến, tập huấn, đào tạo cán bộ trong ngành giáo dục tỉnh quảng ninh​ (Trang 29 - 44)

Tải bản đầy đủ (PDF)

(89 trang)