Sơ lược các chuẩn mã hoá video hiện nay

Một phần của tài liệu Nghiên cứu điều khiển tốc độ video h264 thích ứng ở các mạng có băng thông hạn chế (Trang 27 - 31)

Việc gia tăng nhu cầu trong lưu trữ và truyền phát các thông tin hình ảnh đã thúc

đẩy việc phát triển các chuẩn mã hóa hình. Hiện nay có một số chuẩn mã hóa được xậy dựng từ 2 tổ chức chính là ISO với các chuẩn MPGE-1, MPEG-2, MPEG-4 và ITU-T với các chuẩn H261, H263 và H264. Tất cả các chuẩn đó đều dựa vào phương pháp mã hóa lai ghép dựa vào block giữa việc sử dụng mã hóa nội khung sử dụng chuyển đổi DCT và mã hóa liên khung sử dụng ME/MC. Các thuật toán mã hóa chủ yếu chuẩn hoá bộ giải mã, có nghĩa rằng các chuẩn này không định nghĩa chi tiết các tiến trình mã hóa

mà chỉ có cú pháp của dòng bit và tiến trình giải mã cú pháp đó được đưa ra. Các

chuẩn này cũng phụ thuộc vào ứng dụng riêng và do đó chúng chủ yếu được cung một tập các công cụ và tùy thuộc vào người dùng quyết định sử dụng công cụ nào cho phù hợp

MPEG-1:

Từ năm 1988 tổ chức ISO đã thành lập nhóm MPEG (Moving Picture Experts Group) để chuẩn hóa thuật toán mã hóa cho việc lưu trữ video (các ứng dụng CD-ROM đa phương tiên) với tốc độ khoảng 1.5Mb/s. Bản draft đầu tiên cho MPEG-1 được trình bày 1991 và phiên bản MPEG-1 ra đời vào năm 1992. Mặc dù ban đầu các tham số của nó được tối ưu cho việc lưu trữ số các multimedia nhưng sau đó thuật toán nay đã trở nên phổ biến với và được kế thừa sang các chuẩn MPEG sau đó.

Một khung video MPEG-1 có thể được mã hóa thành 3 kiểu: kiểu khung mã hóa dự

đoán dư thừa không gian (kiểu khung I) mã hóa dự đoán dư thừa về thời gian một

chiều (kiểu khung P) và mã dự đoán dư thừa thời gian 2 chiều (kiểu khung B). Các

Mai Gia Hà  Page 27  Khung I được mã hóa độc lập không liên quan gì tới các khung khác. Mỗi block trong khung I của MPEG-1 đầu tiên được chuyển đổi không gian sử dụng DCT thành một khối các hệ số chuyển đổi biểu diễn thành phần tần số không gian trong block ban đầu. Hầu hết năng lượng của block này được nén thành các thành phần hệ số DCT trong băng tần thấp. Sau đó các hệ số DCT được lượng tử bởi một ma trận lượng tử

8x8 có chứa bước lượng tử được sử dụng cho việc mã hoá mỗi hệ số. Hệ số được

lượng tử sau đó được quét zigzag và mã hoá để tạo ra khả năng nén cao hơn. Sau khi mã hoá khung I được giải mã để sử dụng làm khung tham chiếu cho các khung tiếp theo.

Khung P được mã hoá với khung tham chiếu là các khung I và khung P trước đó. Một MB trong khung P có thể được mã hoá kiểu intra (giống khung I) hoặc inter.

Trong chế độ mã hoá inter bộ mã hoá sẽ tìm MB phù hợp nhất (trong khung tham

chiếu) với MB đang được mã hoá, quá trình này được gọi là quá trình ước lượng

chuyển động. SAD (sum absoluted diffirence) được sử dụng làm tiêu chí cho việc ước

lượng chuyển động. Trong trường hợp chuyển động nhỏ hơn 1 pixel thì bù chuyển

động sẽ thực hiện bằng phương pháp nội suy. Sau đó hiệu của MB dự đoán (trong

khung hiện tại) với MB được dự đoán (trong khung tham chiếu) sẽ được chuyển đổi

DCT lượng tử, mã hoá giống như trong khung I. Nếu MB có vector chuyển động là 0 và hiệu các hệ số trên cũng bằng 0 thì MB đó sẽ được sử dựng kiểu skip.

Khung B được mã hoá inter như khung P nhưng sử dụng các khung tham chiếu cả quá khứ và tương lai.

Các kiểu khung đó được sắp sếp theo một trật tự nhất định tạo thành GoP

(Group of Picture). Và cấu trúc này được sử dụng thống nhất cho toàn bộ quá trình mã hoá.

Mai Gia Hà  Page 28 

H261: H261 được phát triển bởi ITU-T vào năm 1993 với mục tiêu là cho các ứng dụng videoconference và videophone hoạt động với tốc độ từ 64kbit/s và 2 Mbit/s (bởi vì nó sử dụng hạ tầng ISDN). Sự khác biệt chính của H261 với MPEG-1 là:

- H261 chỉ hỗ trợ khung I và khung P do yêu cầu của thời gian thực.

- Ước lượng chuyển động của H261 chỉ được thực hiện theo khung trước.

- H261 không hỗ trợ bù chuyển động ½ pixel.

- Để cải thiện dự đoán H261 cho phép một bộ lọc vòng được áp dụng cho việc dự đoán MB, việc này làm giảm lỗi dự đoán.

- H261 chỉ hỗ trợ 2 độ phân giải là QCIF và CIF.

MPEG-2: MPEG-2 được phát triển bởi cả ISO/IEC và ITU-T và được hoàn thành vào cuối năm 1994. MPEG-2 hợp nhất rất nhiều đặc tính từ H261 và MPEG-1. Tất cả các bộ giải mã của MPEG-2 có thể giải mã được chuỗi bit được tạo ra bởi MPEG-1. Các cải tiến chính của MPEG-2 so với MPEG-1 là:

- MPEG-2 hỗ trợ các chuỗi video đan xen và độ phân giải cao hơn.

- MPEG-2 sử dụng phương pháp ước lượng chuyển động phức tạp hơn (hỗ trợ cả

ước lượng chuyển động theo khung và theo trường), để cải thiện độ chính xác của việc ước lượng chuyển động cho các chuỗi đan xen (bù chuyển động với các block 16x8 pixel)

- MPEG-2 bổ xung các mẫu scan và các chế độ DCT cho các chuỗi đan xen.

- MPEG-2 bổ xung các kỹ thuật để cải thiện cho hiệu quả mã hoá video bao gồm

lượng tử hoá với 10 bit, lượng tử hoá không tuyến tính và bảng VLC tốt hơn.

- MPEG-2 hỗ trợ rất nhiều các chế độ mở rộng: không gian, thời gian và mở rộng

SNR.

- MPEG-2 có rất nhiều profile và level cho phép kết hợp thành nhiều ứng dụng

Mai Gia Hà  Page 29 

H263: Được phát triển năm 1996 là một cải thiện cho H261 với mục tiêu là cải thiện chất lượng cho việc truyền thong video tốc độ thấp. H263 có thể cho phép videophone qua đường truyền dialup của điện thoại (28.8 kbps). Cải thiện chính của H263 so với H261 là:

- Bù chuyển động ½ pixel với phạm vi chuyển động lớn hơn, không giới hạn MV

ở các block biên. Dự đoán chuyển động với kích cỡ thay đổi (16x16 và 8x8).

- Cải thiện mã hoá VLC với các bản mã được tối ưu cho tốc độ bit thấp.

- H263 hỗ trợ 5 độ phân giải QCIF, CIF, SQCIF, 4CIF và 16CIF.

- Để cải thiện cho việc truyền video H263 trên các mạng không tin cậy, một tập các công cụ được phát triển cho việc chống lỗi.

MPEG-4: Được thiết kế cho các yêu cầu ứng dụng tương tác đa phương tiên trong khi đồng thời hỗ trợ các ứng dụng truyền thống. Tốc độ bit đặt ra từ 5-64 kbit/s cho các ứng dụng video di động và PSTN và lên tới 2 Mbit/s cho các ứng dụng TV/Film. Do đó MPEG-4 bao trùm cả MPEG-1 và MPEG-2 với hầu hết các ứng dụng. Trong

MPEG-4 các đối tượng video (VOP) tương ứng với các thực thể trong dòng bit cho

phép một user có thể truy cập và điều khiển. Một cảnh bao gồm nhiều VOP với hình dáng khác nhau, các VOP có thể được tác động chỉnh sửa và thay thế. Khi chuỗi bit chỉ có một VOP hình chữ nhật với kích cỡ cố định được sử dụng thì nó tương ứng với kỹ thuật mã hoá dựa trên khung. Video MPEG-4 dựa trên khung tương tự như H263

nhưng hỗ trợ một số đặc tính cải thiện hiệu quả mã hoá. MPEG-4 hỗ trợ 2 phương

pháp lượng tử vô hương khác nhau là dạng MPEG và dạng H263. Trong dạng lượng tử MPEG (MPEG-2) cấp phát một bộ lượng tử cho mỗi hệ số trong một block trong khi phương pháp H263 sử dụng cùng một bộ lượng tử cho tất cả các hệ số AC. Lượng tử các hệ số DC sử dụng thang phi tuyến đặc biệt là một hàm của tham số lượng tử. Các hệ số lượng tử sau đó được quết zigzag và được cấp phát các mã run-length như trong H263. MPEG4 có rất nhiều các profile

Mai Gia Hà  Page 30 

CHƯƠNG III: MÃ HÓA H264

Mục tiêu ban đầu của H264 là cung cấp các chức năng tương tự như của MPEG4 và H263+ nhưng H264 phải đảm bảo thực hiện được độ nén dữ liệu cao hơn và tăng cường khả năng hỗ trợ tương thích với các ứng dụng truyền trên lớp mạng trong các hệ thống mạng. Chương này trình bày các vấn đề đặt ra và thiết kế của mã H264

Một phần của tài liệu Nghiên cứu điều khiển tốc độ video h264 thích ứng ở các mạng có băng thông hạn chế (Trang 27 - 31)