Nguyờn tắc mó hoỏ và giải mó MPEG-

Một phần của tài liệu Tổng quan về truyền hình số (Trang 46 - 50)

d. Thứ tự truyền dẫn vμ thứ tự hiển thị ảnh.

2.3.3.2.Nguyờn tắc mó hoỏ và giải mó MPEG-

MPEG-4 là sản phẩm của nhúm MPEG được thành lập thỏng 1/1988 với nhiệm vụ phỏt triển cỏc chuẩn xử lý, mó hoỏ và hiển thị cỏc ảnh động, audio và cỏc tổ hợp của chỳng. Sản phẩm đầu tiờn của nhúm này là MPEG-1 được sử dụng cho việc mó hoỏ cỏc dữ liệu nghe nhỡn với tốc độ 1,5 Mbps. Sản phẩm thứ hai của nhúm là MPEG-2 nổi tiếng hiện nay, mang tớnh tổng quỏt hơn và đang được ỏp dụng cho một loạt cỏc ứng dụng nghe nhỡn trong phạm vi tốc độ từ 3 – 40 Mbps.

Khụng giống cỏc chuẩn MPEG trước đú, vớ dụ như trong MPEG-2, nơi mà nội dung được tạo ra từ nhiều nguồn như video ảnh động, đồ hoạ, văn bản… và được tổ hợp thành chuỗi cỏc khung hỡnh phẳng, mỗi khung hỡnh (bao gồm cỏc đối tượng như người, đồ vật, õm thanh, nền khung hỡnh…) được chia thành cỏc phần tử ảnh pixels và xử lý đồng thời, giống như cảm nhận của con người thụng qua cỏc giỏc quan trong thực tế. Cỏc pixels này được mó hoỏ như thể tất cả chỳng đều là cỏc phần tử ảnh video ảnh động. Tại phớa thu của người sử dụng, quỏ trỡnh giải mó diễn ra ngược lại với quỏ trỡnh mó hoỏ khụng khú khăn. Vỡ vậy cú thể coi MPEG-2 là một cụng cụ hiển thị tĩnh, và nếu một nhà truyền thụng phỏt lại chương trỡnh của

một nhà truyền thụng khỏc về một sự kiện, thỡ logo của nhà sản xuất chương trỡnh này khụng thể loại bỏ được. Với MPEG-2, bạn cú thể bổ xung thờm cỏc phần tử đồ hoạ và văn bản vào chương trỡnh hiển thị cuối cựng (theo phương thức chồng lớp), nhưng khụng thể xoỏ bớt cỏc đồ hoạ và văn bản cú trong chương trỡnh gốc.

Chuẩn MPEG-4 khắc phục được hạn chế này và là một chuẩn động dễ thay đổi. Với MPEG-4, cỏc đối tượng khỏc nhau trong một khung hỡnh cú thể được mụ tả, mó hoỏ và truyền đi một cỏch riờng biệt đến bộ giải mó trong cỏc dũng cơ bản ES (Elementary Stream) khỏc nhau. Cũng như xỏc định, tỏch và xử lý riờng cỏc đối tượng (như nhạc nền, õm thanh xa gần, đồ vật, đối tượng ảnh video như con người hay động vật, nền khung hỡnh…), nờn người sử dụng cú thể loại bỏ riờng từng đối tượng khỏi khuụn hỡnh. Sự tổ hợp lại thành khung hỡnh chỉ được thực hiện sau khi giải mó cỏc đối tượng này.

Trờn hỡnh 2.12 thể hiện một trường hợp điển hỡnh của tổ hợp khuụn hỡnh MPEG-4, cho thấy nhiều đối tượng (bàn, quả cầu, bảng đen, người hướng dẫn và audio) được đặt vào một hệ thống toạ độ khụng gian 3 chiều (3-D) đối với vị trớ người xem giả định.

Cỏc thiết bị mó hoỏ và giải mó video đều ỏp dụng sơ đồ mó hoỏ như nhau cho mối đối tượng video VO (Video Object) riờng biệt (hỡnh 2.13), nhờ vậy người sử dụng cú thể thực hiện cỏc hoạt động tương tỏc riờng với từng đối tượng (thay đổi, di chuyển, kết nối, loại bỏ, bổ xung cỏc đối tượng…) ngay tại vị trớ giải mó hay mó hoỏ.

Hỡnh 2.13: Cấu trỳc bộ mó hoỏ và giải mó video MPEG-4

Cỏc bộ phận chức năng chớnh trong thiết bị MPEG-4 tại đầu thu bao gồm:

• Bộ mó hoỏ hỡnh dạng ngoài Shape Coder dựng để nộn đoạn thụng tin, giỳp xỏc định khu vực và đường viền bao quanh đối tượng trong khung hỡnh scene.

• Bộ dự đoỏn và tổng hợp động để giảm thụng tin dư thừa theo thời gian.

• Bộ mó kết cấu mặt ngoài Texture coder dựng để xử lý dữ liệu bờn trong và cỏc dữ liệu cũn lại sau khi đó bự chuyển động.

Video Information Video Object Composition Video Object Formation VO 0 Coding VO 1 Coding VO n Coding M U X VO 0 Decoding VO 1 Decoding VO n Decoding D M U X User Interaction Video Output User Interaction Bitstream

Hỡnh 2.14. Nguyờn lý giải mó video MPEG-4 tại đầu thu

Hỡnh 2.14 là một vớ dụ về tổng hợp khung hỡnh video sử dụng trong MPEG-4. Nhiều đối tượng như người, bản đồ, bản tin, được tỏch ra khỏi video đầu vào. Mỗi đối tượng video sau đú được mó hoỏ bởi bộ mó hoỏ đối tượng video VO (Video Object) và sau đú được truyền đi trờn mạng. Tại vị trớ thu, những đối tượng này được giải mó riờng nhờ bộ giải mó riờng VO và gửi khung hỡnh gốc, hay để xử lý cỏc đối tượng tạo ra một khung hỡnh khỏc. Ngoài ra, người sử dụng cú thể download cỏc đối tượng khỏc từ cỏc thư viện cơ sở cú sẵn dữ liệu để chốn thờm vào hay thay thế cỏc đối tượng cú trong khuụn hỡnh gốc.

Để cú thể tổ hợp khung hỡnh, MPEG-4 sử dụng một ngụn ngữ mụ tả khung hỡnh riờng, được gọi là định dạng nhị phõn cho khung hỡnh BiFS (Binary Format for Scenes). BiFS khụng chỉ mụ tả ở đõu và khi nào cỏc đối tượng xuất hiện trong khung hỡnh, nú cũng mụ tả cỏch thức hoạt động của đối tượng và cả điều kiện hoạt động đối tượng và tạo cho MPEG-4 cú khả Bitstream Video Out Shape Decoding Motion Decoding Texture Decoding Motion Compensation VOP Memory Reconstructed VOP Compositor D E M U L T I P L E X E R Shape Information

năng tương tỏc. Trong MPEG-4 tất cả cỏc đối tượng cú thể được mó hoỏ với sơ đồ mó hoỏ riờng của nú – video được mó hoỏ theo kiểu video, text được mó hoỏ theo kiểu text, cỏc đồ hoạ được mó hoỏ theo đồ hoạ - thay vỡ việc xử lý tất cả cỏc phần tử ảnh pixels như là mó hoỏ video ảnh động. Do cỏc quỏ trỡnh mó hoỏ đó được tối ưu hoỏ cho từng loại dữ liệu thớch hợp, nờn chuẩn MPEG-4 sẽ cho phộp mó hoỏ với hiệu quả cao tớn hiệu ảnh video, audio và cả cỏc nội dung tổng hợp như cỏc bộ mặt và cơ thể hoạt hỡnh.

Một phần của tài liệu Tổng quan về truyền hình số (Trang 46 - 50)