Tiểu luận công nghệ MPEG4 tìm HIỂU về CÔNG NGHỆ MPEG4
Tiểu luận công nghệ MPEG4 TÌM HIỂU VỀ CÔNG NGHỆ MPEG4 I.Lời nói đầu Với sự phát triển của công nghệ thông tin, và cùng với đó là sự phát triển ngày càng mạnh mẽ của các ứng dụng truyền thông đa phương tiện , đòi hỏi con người không ngừng tìm tòi sáng tạo để đáp ứng kịp với xu thế phát triển ấy. Nhờ vào sự phát triển của các ứng dụng truyền thông đa phương tiện mà chúng ta có thể đưa âm thanh, hình ảnh, hay các đoạn video đi xa một cách nhanh chóng và thuận tiện. Song với việc truyền tải một đoạn video có dung lượng lớn đi xa gặp khá nhiều khó khăn bởi khả năng có hạn của kênh dẫn.Vì vậy các nhà sản xuất đã áp dụng một số kỹ thuật nén để giúp tối ưu hóa các đoạn video trên, làm giảm dung lượng phải truyền đi mà chất lượng hình ảnh tương đương với hình ảnh gốc. Một trong các kỹ thuật nén được sử dụng rộng rãi đó là kỹ thuật nén chuyển động mà tiêu biểu là chuẩn nén MPEG. Qua quá trình nghiên cứu các chuyên gia đã cho ra đời chuẩn nén MPEG-4 với nhiều tính năng ưu việt và nó đã nhanh chóng được ứng dụng rộng rãi trong hệ thống thông tin video nén. MPEG-4 sử dụng một phương pháp mã hóa video theo từng đối tượng thay vì mã hóa toàn bộ cả một đoạn video, vì vậy dung lượng video được giảm đi đáng kể mà chất lượng lại không có nhiều thay đổi . II. Tổng quan về MPEG4 Tại sao chúng ta cần phải nén video ? Để xem được 1 đoạn video có chất lượng cao mà dung lượng không quá lớn là 1 điều rất quan trọng và cần thiết. Đó chính là lí do cần phải sử dụng 1 công cụ nén video nhằm giảm tối đa dung lượng của đoạn video mà chất lượng vẫn đáp ứng được yêu cầu Nhu cầu truyền phát các dịch vụ Multimedia mới trên hạ tầng kỹ thuật mạng Internet đã làm nảy sinh các yêu cầu chức năng không có trong các chuẩn MPEG- 1, MPEG-2,H.26X và các chuẩn nén video trước đó. Sự xuất hiện của chuẩn MPEG-4 (10/1998) và H264 đã tạo ra một phương thức thiết lập và tương tác mới 1 Tiểu luận công nghệ MPEG4 với truyền thông nghe nhìn trên mạng internet, tạo ra một phương thức sản xuất, cung cấp và ứng dụng mới các nội dung video trên cơ sở nội dung và hướng đối tượng (content/object-based). Đây chính là một công nghệ trình diễn truyền thông đa phương tiện phức hợp, có khả năng truyền thông trong các môi trường băng thông rất khác nhau nhờ kết hợp tốt 3 môi trường: Truyền hình số, đồ hoạ tương tác và World Wide Web ** Nhược điểm của MPEG2 Tiêu chuẩn video MPEG-2 bị hạn chế bởi hai yếu tố trong định nghĩa ban đầu (original definition) của nó: * Tốc độ bit nhắm tới của video được nén là khoảng 2–15 Mb/s (đối với main profile ở mail level). Tiêu chuẩn này không chứa giới hạn tốc độ bit thấp hơn bất kỳ vì điều này không được yêu cầu trong định nghĩa của bộ mã hóa tương thích. Hiển nhiên MPEG-2 cũng không hiệu quả với tốc độ bit thấp hơn. * Silicon cho thực hiện MPEG-2 đã bị giới hạn đến trình độ công nghệ của những ngày đó. Điều này có nghĩa là trong năm 1994 ASIC (application Specific Integrated Circuit) được sử dụng trong thiết kế bộ giải mã với mật độ 120.000 gate/chip với kích thước gate 0.5 - 1 m. Trong khi đó công nghệ tiên tiến ngày nay đã đạt 25.000.000 gate/ASIC với kích thước gate nhỏ hơn 0.1 m. Như vậy các kỹ thuật dựa trên MPEG-2 đã bị hạn chế trong việc thực hiện thực tế trong công nghệ ngày hôm nay. * Hạn chế đối với mạng băng thông thấp (tốn nhiều băng thông) 1.Khái niệm và đặc điểm của MPEG4 Hiệp hội viễn thông quốc tế (ITU) và tổ chức tiêu chuẩn quốc tế/ Uỷ ban kỹ thuật điện tử quốc tế (ISO/IEC) là hai tổ chức phát triển các tiêu chuẩn mã hoá Video. Theo ITU-T, các tiêu chuẩn mã hoá Video được coi là các khuyến nghị gọi tắt là chuẩn H.26x (H.261, H.262, H.263 và H.264). Với tiêu chuẩn ISO/IEC, chúng được gọi là MPEG-x (như MPEG-1, MPEG-2 và MPEG-4). 2 Tiểu luận công nghệ MPEG4 MPEG-4 là sản phẩm của nhóm MPEG (Moving Picture Expert Group) được thành lập tháng 01/1988 với nhiệm vụ phát triển các chuẩn xử lý, mã hoá và hiển thị các ảnh động, audio và các tổ hợp của chúng Mpeg-4 là chuẩn cho các ứng dụng MultiMedia. Mpeg-4 trở thành một tiêu chuẩn cho nén ảnh kỹ thuật truyền hình số, các ứng dụng về đồ hoạ và Video tương tác hai chiều(Games,Videoconferencing) và các ứng dụng Multimedia tương tác hai chiều (World Wide Web hoặc các ứng dụng nhằm phân phát dữ liệu Video như truyền hình cáp, Internet Video ). Mpeg-4 đã trở thành một tiêu chuẩn công nghệ trong quá trình sản xuất, phân phối và truy cập vào các hệ thống Video. Nó đã góp phần giải quyết vấn đề về dung lượng cho các thiết bị lưu trữ, giải quyết vấn đề về băng thông của đường truyền tín hiệu Video hoặc kết hợp cả hai vấn đề trên. Với MPEG-4, các đối tượng khác nhau trong một khung hình có thể được mô tả, mã hoá và truyền đi một cách riêng biệt đến bộ giải mã trong các dòng cơ bản ES (Elementary Stream) khác nhau. Cũng nhờ xác định, tách và xử lý riêng các đối tượng (như nhạc nền, âm thanh xa gần, đồ vật, đối tượng ảnh video như con người hay động vật, nền khung hình …), nên người sử dụng có thể loại bỏ riêng từng đối tượng khỏi khuôn hình. Sự tổ hợp lại thành khung hình chỉ được thực hiện sau khi giải mã các đối tượng này. H.264 ( MPEG-4 AVC hay MPEG-4 part 10), hiện đang là phương thức tiên tiến nhất trong lĩnh vực nén video. H.264 cho chất lượng hình ảnh tốt nhất khi có cùng dung lượng so với các chuẩn nén khác. H.264 cũng được ứng dụng như thuật nén chính trong video độ phân giải cao (HD) Mục tiêu chính của chuẩn nén H.264 đang phát triển nhằm cung cấp Video có chất lượng tốt hơn nhiều so với những chuẩn nén Video trước đây. Điều này có thể đạt được nhờ sự kế thừa các lợi điểm của các chuẩn nén Video trước đây. Không chỉ thế, chuẩn nén H.264 còn kế thừa phần lớn lợi điểm của các tiêu chuẩn trước đó là H.263 và MPEG-4. 3 Tiểu luận công nghệ MPEG4 2.Ưu điểm Kĩ thuật mã hóa video nén theo hướng đối tượng MPEG-4 mà hiện nay đang đuợc sử dụng rất nhiều như 1 công cụ mã hóa với nhiều tính năng ưu việt. a. Tính mềm dẻo và có khả năng nâng cấp. Các nhà thiết kế bộ mã hoá MPEG phải đối mặt với rất nhiều vấn đề, nhưng vấn đề quan trọng nhất là làm sao thiết kế được một thuật toán nén mềm dẻo và có khả năng nâng cấp được trong tương lai. Họ thường mong muốn có được các bộ mã hoá MPEG thích hợp cho nhiều ứng dụng, từ TV màn ảnh rộng, chất lượng cao tới các hệ thống nhỏ, tín hiệu video đen trắng cho các hệ thống camera an ninh. Hiển nhiên là một hệ thống nén thiết kế dành cho các phim màn ảnh rộng phải có phần cứng mạnh, bộ nhớ lớn hơn là một hệ thống được thiết kế cho hệ thống camera dành cho mục đích an ninh. Các nhà thiết kế giải quyết vấn đề này bằng cách định nghĩa "Level" và "Profile" cho hệ thống. Các "Level" xác định giới hạn năng lực xử lý của phần cứng và bộ nhớ cần thiết để mã hoá tín hiệu. Các "Profile" xác định độ phức tạp của quá trình mã hoá và giải mã. Đối với MPEG-4 thì có 19 profile (nhưng đối với H.264 chỉ có 3 profile). Về khả năng nâng cấp của bộ mã hoá MPEG, họ thiết kế theo hai bước. Bước thứ nhất là thay cho xác định chỉ tiêu của bộ mã hoá và giải mã, họ xác định loại tín hiệu nằm giữa hai thiết bị này. Bước thứ hai là thực hiện các cải tiến trong bộ mã hoá và giải mã mới sao cho nó tương thích với các chuẩn cũ (backward compatible).Chuẩn MPEG có các qui tắc và giao thức cho tín hiệu truyền giữa bộ mã hoá và giải mã. Các quy tắc này, thực chất giống như là một loại ngôn ngữ dành riêng cho bộ mã hoá và giải mã. Các bộ mã hoá tương thích phải có khả năng “nói” được ngôn ngữ này. Các bộ giải mã tương thích phải có khả năng hiểu được toàn bộ các "từ vựng" mà bộ mã hoá đã phát ra trong một ngữ cảnh nhất định.MPEG-4 thực hiện điều này bằng cách tạo ra một bộ các công cụ dùng để nén tín hiệu trong các trường hợp khác nhau. Một trong các công cụ này, chuyển đổi cosine rời rạc (DCT - discrete cosine transform), có nhiệm vụ chuyển đổi một khối 8x8 pixel thành một tập các hệ số 4 Tiểu luận công nghệ MPEG4 b. MPEG-4 đem lại công cụ nén mới. Ta hãy xem xét các cộng cụ nén mới mà chuẩn MPEG-4 mang tới lĩnh vực nén ảnh. Hình 1 so sánh các công cụ của chuẩn MPEG-2 và MPEG-4. Hình 2.1: công cụ nén mới của MPEG-4 so với MPEG-2. Chuẩn MPEG-4 đi xa hơn, theo hình 2, nó có thể dự đoán hệ số của toàn bộ các khối trên một hàng hay hệ số của các khối ở cột bên trái từ một khối đầu tiên. Hình 2.2: MPEG4 có thể dự đoán các tham số trên 1 hàng, hay các thông số của cột bên trái từ một khối đầu tiên. 5 Tiểu luận công nghệ MPEG4 Việc dự đoán các hệ số của hàng hay của cột dựa trên nội dung của hình ảnh. Ví dụ, một ảnh chứa một vật thể theo chiều đứng như cái cọc chẳng hạn. Khi đó quét ảnh này theo chiều ngang sẽ tạo ra sự thay đổi lớn trong các hệ số sau DCT khi gặp hình ảnh cái cọc này. Trái lại, khi quét theo chiều đứng thì các khối nằm trong một cột có các hệ số DCT gần giống nhau, từ đó có thể nén với tỉ lệ nén cao hơn. MPEG-4 mở rộng cách dự đoán vector chuyển động. MPEG-4 có thể dự đoán vector cho một macroblock từ các macroblock ở trên hay ở bên trái, và nó chỉ gửi đi sự sai khác so với các vector cũ mà thôi. Do đó giảm đi dữ liệu cần thiết dùng để mã hoá một vector, cho phép có thể dùng một vector cho mỗi khối DCT. Việc dự đoán chuyển động sẽ tốt hơn với 4 vector, giảm nhỏ lỗi khi dự đoán. Chất lượng hình ảnh có thể được cải thiện đáng kể bằng cách dùng tỉ lệ nén dữ liệu lớn hơn mà không cần thay đổi độ phân giải. Mpeg không phải là một công cụ nén đơn lẻ mà ưu điểm của nén Mpeg chính là ở chỗ nó có một tập hợp các công cụ mã hoá chuẩn, chúng có thể được kết hợp với nhau một cách linh động để phục vụ cho một loạt các ứng dụng khác nhau, khả năng truyền dẫn tốt trong môi trường truyền dẫn khắc nhiệt. c. Tiềm năng của chuẩn MPEG-4. Trong khi các chuẩn MPEG-1 và MPEG-2 thao tác với một ảnh toàn vẹn, thì chuẩn MPEG-4 có thể làm việc được với các hình ảnh được tạo ra, hay đã được máy tính xử lý và đó là một thế mạnh của chuẩn MPEG-4. So với chuẩn MPEG-2 thì MPEG-4 có những ưu thế hơn về xử lý đồ họa trực tiếp. 6 Tiểu luận công nghệ MPEG4 Hình 2.3.a : Đầu vào của bộ mã hóa MPEG-2 là một ảnh hoàn chỉnh được lặp lại theo tần số ảnh (frame rate) Hình 2.3.b : Bộ mã hóa MPEG-4 có thể xử lý các lệnh đồ họa một cách trực tiếp , do đó công cụ biểu diễn hình ảnh thực sự nằm trong bộ giải mã MPEG-4 Hình 2.3 : so sánh giữa chuẩn MPEG-2 và MPEG-4 về xử lý đồ họa Chuẩn MPEG-4 có thể làm việc được với 4 loại đối tượng, như trên hình 2.4. Hình 2.4 cho thấy chuẩn MPEG-4 đã chuẩn hoá phương pháp truyền các đối tượng 3 chiều nhờ các đối tượng lưới (mesh object), cùng với các phương tiện ánh xạ bề mặt vật thể lên các đối tượng này, chuẩn này có thể xử lý các đối tượng có hình dạng bất kỳ 7 Tiểu luận công nghệ MPEG4 Hình 2.4: MPEG4 đã chuẩn hóa phương pháp truyền các đối tượng 3 chiều nhờ các đối tượng lưới. d. Audio, video và tất cả các đối tượng khác có thể được đồng bộ chặt chẽ với độ chính xác cao và có khả năng tương tác. Truyền thông multimedia theo dòng (Multimedia stream), trong đó dòng audio và video sẽ được biến đổi thích nghi với yêu cầu băng thông và chất lượng hình nhờ loại bỏ những đối tượng (hình ảnh, âm thanh) không cần thiết khỏi dòng dữ liệu và đồng bộ các thông tin được nhúng trong dòng dữ liệu đó. Thêm vào đó, MPEG-4 sẽ cho phép người sử dụng khả năng tương tác trực tiếp với dòng dữ liệu (dừng tiến hay lùi nhanh, kích chuột để kích hoạt các tuỳ chọn video và audio…) Lưu giữ và phục hồi dữ liệu audio và video: do MPEG-4 phân chia các khung hình thành các đối tượng, việc trình duyệt Browser trên cơ sở nội dung (đối tượng) mong muốn sẽ được thực hiện một cách dễ dàng và nhờ vậy, các ứng dụng lưu giữ hay phục hồi thông tin trên cơ sở nội dung MPEG-4 sẽ được thuận lợi hơn. 8 Tiểu luận công nghệ MPEG4 Truyền thông báo đa phương tiện: các thông báo dưới dạng text, audio và video MPEG-4 sẽ được truyền đi với yêu cầu băng thông ít hơn, và có khả năng tự điều chỉnh chất lượng cho phù hợp với khả năng băng thông của thiết bị giải mã. Thông tin giải trí: những sự trình diễn nghe nhìn tương tác (thế giới ảo, trò chơi tương tác …) có thể được triển khai trên cơ sở chuẩn MPEG-4 sẽ làm giảm yêu cầu về băng thông và làm cho thế giới ảo trở nên sinh động và giống như thực tế trên các trang web 3.Nhược điểm Tuy nhiên cũng có một số nhược điểm là bộ giải mã phải có khả năng giải mã hết tất cả các luồng bit mà nó hổ trợ và có khả năng kết hợp. Do đó phần cứng của bộ giải mã MPEG-4 phức tạp hơn so với bộ giải mã MPEG-2. Và ngày nay thì càng có nhiều bộ mã thực hiện giải mã bằng phần mềm nhưng bộ giải mã bằng phần cứng có thể bị hạn chế về khả năng linh hoạt 9 Tiểu luận công nghệ MPEG4 III. Công nghệ mã hóa video trong MPEG-4 MPEG-4 là sản phẩm của nhóm MPEG (Moving Picture Expert Group) được thành lập tháng 1/1988 với nhiệm vụ phát triển các chuẩn xử lý, mã hoá và hiển thị các ảnh động, audio và các tổ hợp của chúng. Sản phẩm đầu tiên của nhóm này là MPEG-1 được sử dụng cho việc mã hoá các dữ liệu nghe nhìn với tốc độ 1,5 Mbps. Sản phẩm thứ hai của nhóm là chuẩn MPEG-2 nổi tiếng hiện nay, mang tính tổng quát hơn và đang được áp dụng cho một loạt các ứng dụng nghe nhìn trong phạm vi tốc độ từ 3-40 Mbps. Không giống các chuẩn MPEG trước đó, ví dụ như trong MPEG-2, nơi mà nội dung được tạo ra từ nhiều nguồn như video ảnh động, đồ họa, văn bản… và được tổ hợp thành chuỗi các khung hình phẳng, mỗi khung hình (bao gồm các đối tượng như người, đồ vật, âm thanh, nền khung hình…) được chia thành các phần tử ảnh pixels và xử lý đồng thời, giống như cảm nhận của con người thông qua các giác quan trong thực tế. Các pixels này được mã hoá như thể tất cả chúng đều là các phần tử ảnh video ảnh động. Tại phía thu của người sử dụng, quá trình giải mã diễn ra ngược với quá trình mã hoá không khó khăn. Vì vậy có thể coi MPEG-2 là một công cụ hiển thị tĩnh, và nếu một nhà truyền thông truyền phát lại chương trình của một nhà truyền thông khác về một sự kiện, thì logo của nhà sản xuất chương trình này không thể loại bỏ được. Với MPEG-2, bạn có thể bổ xung thêm các phần tử đồ hoạ và văn bản vào chương trình hiển thị cuối cùng (theo phương thức chồng lớp), nhưng không thể xoá bớt các đồ hoạ và văn bản có trong chương trình gốc. Chuẩn MPEG-4 khắc phục được hạn chế này và là một chuẩn động dễ thay đổi. Với MPEG-4, các đối tượng khác nhau trong một khung hình có thể được mô tả, mã hoá và truyền đi một cách riêng biệt đến bộ giải mã trong các dòng cơ bản ES (Elementary Stream) khác nhau. Cũng nhờ xác định, tách và xử lý riêng các 10 [...]... những khung hình trước, sau đó dùng phương pháp nén về không gian để loại bỏ sự dư thừa về không gian trong chính khung hình sai khác này Trong MPEG-4 là yếu tố ít có sự thay đổi nhất, các bước mã hóa khung hình cũng tương tư như mã hóa ảnh Thuật toán mã hoá biến đổi gồm các bước: +Biến đổi Cosine rời rạc (DCT) +Lượng tử hoá +Mã hóa 13 Tiểu luận công nghệ MPEG4 ... thường chúng ta có thể phân biệt sự thay đổi về độ sáng của ảnh tốt hơn so với sự thay đổi về màu Do đó trước hết các sơ đồ nén Mpeg sẽ tiến hành chia khung hình thành các thành phần độ sáng Y và thành phần độ màu Cb, Cr (một thành phần về độ sáng và hai thành phần về độ màu) Một khung hình sẽ gồm có 3 ma trận ứng với các thành phần về độ sáng (Y) và hai thành phần về độ màu Cb và Cr Các bộ lọc tiền xử lý... gian - Bộ mã kết cấu mặt ngoài Texture coder dùng để xử lý dữ liệu bên trong và các dữ liệu còn lại sau khi đã bù chuyển động 11 Tiểu luận công nghệ MPEG4 Hình 3.2 Sơ đồ cấu trúc giải mã video MPEG-4 Hình 3.2 là một ví dụ về tổng hợp khung hình video sử dụng trong MPEG-4 Nhiều đối tượng được tách ra khỏi video đầu vào Mỗi đối tượng video sau đó được... phía thu 15 Tiểu luận công nghệ MPEG4 Phía bên thu tức bộ giải mã đã lưu trữ sẵn những thông tin mà không thay đổi từ khung hình này tới khung hình khác trong bộ nhớ đệm của nó và chúng được dùng để điền thêm một cách đều đặn vào các vị trí trống trong ảnh được khôi phục Nén tín hiệu Video được thực hiện nhờ việc loại bỏ cả sự dư thừa về không gian... được khôi phục thu được bởi sự kết hợp về hình dáng, kết cấu và thông tin di động Sự giống nhau của kỹ thuật giải mã là áp dụng khi tất cả các VOPs là của một phiên bản Các VOPs khôi phục trộn lẫn với nhau sau đó được sắp xếp lại theo trình tự quy định của VOP, các thành phần được tổng hợp lại để xây dựng lên video khung tổng hợp của các chuỗi 16 Tiểu luận công nghệ MPEG4 ... tổng hợp động Mỗi lớp video bao gồm các đối tượng riêng rẽ Mỗi đối tượng riêng rẽ ấy gọi là VOP Khi 1 VOP được tách ra,VOP đó sẽ được đưa vào bộ mã hóa và được thực hiện mã hóa như sau : 14 Tiểu luận công nghệ MPEG4 Hình 3.6 Cấu trúc mã hóa một VOP 3.3.1 Ước lượng chuyển động Nén Mpeg là sự kết hợp hài hoà của bốn kỹ thuật cơ bản: Tiền xử lý (Preprocessing),.. .Tiểu luận công nghệ MPEG4 đối tượng (như nhạc nền, âm thanh xa gần, đồ vật, đối tượng ảnh video như con người hay động vật, nền khung hình …), nên người sử... tả cách thức hoạt động của đối tượng (làm cho một đối tượng xoay tròn hay chồng mờ hai đối tượng lên nhau) và cả điều kiện hoạt động đối tượng và tạo cho MPEG-4 có khả năng tương tác Trong 12 Tiểu luận công nghệ MPEG4 MPEG-4 tất cả các đối tượng có thể được mã hoá với sơ đồ mã hoá riêng của nó video được mã hoá theo kiểu video, text được mã hoá theo... với giới hạn băng thông của các kênh hoặc sự nghẽn mạng khi quá trình truyền bit thấp, các lớp tăng cường có thể bỏ qua mà không gây thiệt hại nghiêm trọng đến khôi phục chất lượng hình ảnh 17 Tiểu luận công nghệ MPEG4 3.6 Đánh giá hiệu quả Như ta đã biết , MPEG-4 mã hóa video theo định hướng đối tượng, mỗi VOP được phát hiện trong một khung xem như... MPEG-4 tại tốc độ 128 kbit / s (a )baseline MPEG-4 (b) H263 IV.Chuẩn nén MPEG4- AVC Mục tiêu chính của chuẩn nén MPEG4- AVC đang phát triển nhằm cung cấp Video có chất lượng tốt hơn nhiều so với những chuẩn nén Video trước đây Điều này có thể đạt được nhờ sự kế thừa các lợi điểm của các chuẩn nén Video trước đây Không chỉ thế, chuẩn nén MPEG4- AVC 64 còn kế thừa phần lớn lợi điểm của các tiêu chuẩn trước đó . Tiểu luận công nghệ MPEG4 TÌM HIỂU VỀ CÔNG NGHỆ MPEG4 I.Lời nói đầu Với sự phát triển của công nghệ thông tin, và cùng với đó là sự phát triển. bằng phần mềm nhưng bộ giải mã bằng phần cứng có thể bị hạn chế về khả năng linh hoạt 9 Tiểu luận công nghệ MPEG4 III. Công nghệ mã hóa video trong MPEG-4 MPEG-4 là sản phẩm của nhóm MPEG. công cụ này, chuyển đổi cosine rời rạc (DCT - discrete cosine transform), có nhiệm vụ chuyển đổi một khối 8x8 pixel thành một tập các hệ số 4 Tiểu luận công nghệ MPEG4 b. MPEG-4 đem lại công