Quan hệ giữa các phiên bản MPEG-4

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Xây dựng ứng dụng truyền video trên thiết bị cầm tay (PDA) qua môi trường mạng không dây Luận văn ThS. Công nghệ thông tin 1.01.10 (Trang 33 - 37)

Lớp Hệ thống (System) của các phiên bản sau tƣơng thích với tất cả phiên bản trƣớc đó. Trong phạm vi của Hệ thống, Âm thanh và Trực quan, các phiên bản mới chỉ thêm các Hồ sơ mà không thay đổi các Hồ sơ trƣớc đó.

1.2.3.4 Các tính năng chính của MPEG-4

Giao vận

Theo lý thuyết, MPEG-4 không định nghĩa các tầng giao vận. Tuy nhiên, trong một số trƣờng hợp đặc biệt thì tầng giao vận đƣợc định nghĩa

 Chuyển vận MPEG-2 qua dòng chuyển vận (đây là một sửa đổi của các hệ thống MPEG-2)

 Chuyển vận qua IP (Khi phối hợp với IETF - Internet Engineering Task Force)

DMIF

DMIF là một Khung công việc tích hợp truyền nhận đa phƣơng tiện (Delivery Multimedia Integration Framework) và là giao diện giữa tầng ứng dụng và tầng chuyển vận bảm đảm cho những ngƣời phát triển ứng dụng MPEG-4 không phải lo lắng gì về việc chuyển vận. Một ứng dụng đơn có thể chạy trên nhiều tầng chuyển vận khác nhau khi đƣợc đƣợc hỗ trợ bởi quyền DMIF cụ thể.

MPEG-4 DMIF hỗ trợ các tính năng sau:

 Giao diện ứng dụng MPEG-4 DMIF trong suốt bất kể thiết bị tƣơng tác là ở xa, thiết bị lƣu trữ nội bộ hay quảng bá.

 Kiểm soát việc thiết lập các kênh FlexMux.

 Sử dụng các mạng đồng nhất giữa các máy tƣơng tác: IP, ATM, điện thoại di động, PSTN, ISDN băng thông hẹp.

 Hỗ trợ cho các mạng di dộng đƣợc phát triển cùng với ITU-T.

 Các câu lệnh ngƣời dùng với các thông điệp báo nhận.

 Quản lý thông tin đồng bộ tầng MPEG-4.

Hệ thống

Nhƣ đã mô tả ở phần trên, MPEG-4 định nghĩa một loạt các công cụ cho các thuật toán nén âm thanh và thông tin video, hình ảnh tiên tiến. Các dòng dữ liệu (Dòng cơ sở) là kết quả của quá trình nén có thể đƣợc truyền hoặc lƣu trữ một cách riêng rẽ cũng nhƣ có thể sử dụng để biên soạn hoặc trình diễn đa phƣơng tiện tại phía ngƣời nhận.

Phần hệ thống của MPEG-4 chỉ ra mô tả về mối quan hệ giữa các thành phần nghe nhìn cấu thành của một cảnh. Mối quan hệ này có thể đƣợc mô tả theo 2 mức độ chính sau:

 Định dạng nhị phân (BIFS) mô tả cách thức sắp sếp không gian – thời gian của các đối tƣợng trong một cảnh. Ngƣời quan sát có thể có khả năng tƣơng tác với các đối tƣợng này. Ví dụ, có thể sắp xếp lại các đối tƣợng trong một cảnh hoặc thay đổi điểm quan sát trong một môi trƣờng 3 chiều ảo.

 Ở mức thấp hơn, Các Bộ mô tả đối tƣợng (OD – Object Descriptor) định nghĩa mối quan hệ giữa các Dòng cơ sở thích ứng với từng đối tƣợng (Ví dụ, dòng âm thanh và video của một điểm trong hội nghị truyền hình). OD cũng đƣa ra các thông tin khác nhƣ địa chỉ URL cần thiết để truy cập vào các

Dòng cơ sở, thuộc tính của các bộ giải mã cần thiết để so sánh, thông tin quyền sở hữu và một số thông tin khác.

Một số các vấn đề khác đƣợc chỉ ra bởi hệ thống MPEG-4:

 Một định dạng file chuẩn hỗ trợ cho việc trao đổi và xác thực quyền tác giả của dữ liệu MPEG-4

 Tính tƣơng tác, bao gồm: tƣơng tác máy khách và máy chủ; mô hình sự kiện chung cho các sự kiện khởi tạo hoặc các hoạt động ngƣời dùng định tuyến; kiểm soát sự kiện chung và định tuyến giữa các đối tƣợng trong một cảnh..

 Java (MPEG-J) đƣợc sử dụng để cho phép truy xuất tới đầu cuối cũng nhƣ môi trƣờng ứng dụng Java để mã hóa 'MPEGlets'.

 Công cụ sử dụng cho việc chèn nhiều dòng vào một dòng, bao gồm các thông tin về thời gian (Công cụ FlexMux).

 Công cụ hỗ trợ cho việc lƣu trữ dữ liệu MPEG-4 trong một file (Định dạng file MPEG-4, „MP4‟)

 Khởi tạo và duy trì quản lý dữ liệu nhận đƣợc trong bộ đệm của đầu cuối.

 Xác định thời gian, các cơ chế đồng bộ và khôi phục.

 Cung cấp các tập dữ liệu cho việc xác định quyền tác giả liên quan tới các đối tƣợng media.

Âm thanh

MPEG-4 hỗ trợ tốt các ứng dụng âm thanh trong phạm vi rộng (từ âm thanh tự nhiên đến tổng hợp, các kênh truyền thông chất lƣợng cao, …). Đặc biệt nó có thể hỗ trợ trình diễn các đối tƣợng âm thanh với hiệu quả rất cao.

Dữ liệu trực quan

Chuẩn MPEG-4 cho phép lai ghép mã hóa các hình ảnh tự nhiên và video cùng vớu các ảnh tổng hợp (sinh ra bởi máy tính). Ví dụ, sự hiện diện ảo của những ngƣời

tham gia hội nghị truyền hình. Ngoài ra, chuẩn còn bao gồm các công cụ và thuật toán hỗ trợ cho việc mã hóa các hình ảnh tĩnh tự nhiên và video cũng nhƣ các công cụ hỗ trợ việc nén dữ liệu 2 chiều và 3 chiều.

1.2.4 H.261

H.261 là một chuẩn đƣợc sử dụng rộng rãi nhất trên thế giới hiện nay cho việc nén video. Nó định nghĩa các thuật toán mã hóa và giải mã video cho cả CIF và QCIF.

Tổ chức khung hình

Trong chuẩn H.261, các khung hình video đƣợc xử lý bởi việc chia hình ảnh thành các phần nhỏ hơn hoặc là các khối. Một khối đƣợc định nghĩa nhƣ một vùng với kích thƣớc 8 x 8 pixel.

Một ảnh CIF có thể đƣợc định nghĩa có kích thƣớc là 44 x 36 khối. Các khối thuộc về một nhóm lớn hơn đƣợc gọi là các khối chuỗi (macroblock). Một khối chuỗi bao gồm sáu khối, bốn khối cho thông tin độ chói Y, một khối cho thông tin về thành phần màu Cr và thông tin Cb số trung bình của khối lớn hơn. Ba mƣơi ba mẫu khối chuỗi trên một khối lớn hơn đƣợc gọi là GOB (Group of Block) hoặc là Nhóm khối. Một ảnh CIF sẽ có kích thƣớc là 6 x 2 GOB [17].

Nén và mã hóa H.261

Thuật toán nén H.261 dựa trên Hàm chuyển cosin rời rạc – DCT, giống với MPEG ở một góc độ nào đó. Đây là phƣơng thức phổ biến và hiệu quả khi sử dụng Mã độ dài RLE. DCT truyền một khối các điểm ảnh cƣờng độ mạnh vào một khối các hệ số chuyển tuần tự. Hàm chuyển sau đó lại đƣợc áp dụng cho các khối mới cho đến khi toàn bộ ảnh đƣợc truyền. Mã Huffman/RLE sau này có thể đƣợc sử dụng cho các dữ liệu đã đƣợc xử lý.

Một điểm khác biệt chính giữa H.261 và MPEG là giá trị lƣợng tử đƣợc sử dụng là biến đổi và đƣợc xác định bởi tổng số dữ liệu giảm yêu cầu để phù hợp với băng thông video cho phép. H.261 điều khiển tốc độ tƣơng ứng với băng thông video cho phép.

Tiến trình mã hóa H.261 sử dụng các khung hình đã nhận trƣớc để mã hóa các trạng thái khác nhau, cũng giống nhƣ cách thức của MPEG. Không giống nhƣ MPEG, H.261 chỉ có hai kiểu khung hình là các khung hình mã hóa trong (intra-coded) và mã hóa ngoài (Inter-coded). Trong khi MPEG có ba loại khung hình là I-Frame, khung hình dự báo và khung hình định hƣớng (Bi-Frame). H.261 chỉ sử dụng hai khung hình trƣớc đó để tham chiếu cho thuật toán ƣớc lƣợng chuyển động trong khi MPEG sử dụng các khung hình I hoặc P có trƣớc gần nhất và tiếp theo để tham chiếu. Các khung hình mã hóa trong là các khung hình đƣợc mã hóa hoàn toàn mà không có tham chiếu. Các khung hình mã hóa ngoài là các khung hình mà việc mã hóa dựa vào các khung hình trƣớc đó. Chuẩn H.261 chỉ ra rằng, mỗi khối chuỗi phải có ít nhất 123 khung hình mã hóa trong để đảm bảo tránh lỗi khi gom. Các đầu cuối có thể yêu cầu một cập nhật hình ảnh hoàn chỉnh chỉ khi một khung hình mã hóa trong đƣợc gửi.

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Xây dựng ứng dụng truyền video trên thiết bị cầm tay (PDA) qua môi trường mạng không dây Luận văn ThS. Công nghệ thông tin 1.01.10 (Trang 33 - 37)

Tải bản đầy đủ (PDF)

(98 trang)