MPEG - Thành tựu và công nghệ potx

7 234 1
MPEG - Thành tựu và công nghệ potx

Đang tải... (xem toàn văn)

Thông tin tài liệu

MPEG: THÀNH TỰU VÀ KỲ VỌNG 16.05.2007 16:38 Th.S. Nguyễn Đức Hoàng Có lẽ bạn đã quá quen thuộc với cụm từ “MPEG”, và bạn muốn có một cái nhìn mang tính tổng hợp về các chuẩn ứng dụng của MPEG với những thành tựu và triển vọng phát triển thì bài viết này có thể giúp bạn điều đó. Bài viết này được lược dịch từ bài viết “MPEG: achievements and future projects” của tác giả Leonardo Chiariglione. Mục tiêu của bài viết này không nhằm vào việc trình bày các chuẩn MPEG mà hướng đến việc phân tích thời cơ hình thành chuẩn, một số ưu điểm về đặc tính kỹ thuật, những thành tựu đạt được cũng như dự đoán sự phát triển trong tương lai của MPEG. 4 chuẩn ứng dụng quan trọng nhất của MPEG được quan tâm là: • MPEG-1 và MPEG-2 – bước chuyển đổi từ analog vào digital và các ứng dụng phát triển theo đó; • MPEG-4 – quá trình phát triển và các lĩnh vực ứng dụng; • MPEG-7 – chiến lược phát triển công nghệ multimedia. 1. Giới thiệu. Việc chuyển đổi công nghệ nghe nhìn từ analog đến digital là một bước ngoặc phát triển mà công đầu thuộc về một nhóm các chuẩn được xây dựng từ một phân ban của ISO. Hội nghị đầu tiên về MPEG vào tháng 5/1988 chỉ có 15 người tham dự và chỉ tổ chức trong một buổi duy nhất. Trong khi đó, ngày nay các hội nghị về MPEG thu hút rất nhiều người tham gia và phải tổ chức trong nhiều buổi. Các chuẩn MPEG đã mở đường cho sự xuất hiện của các thiết bị như: Video CD, set top boxes,… và các dịch vụ số như: phát sóng audio số, truyền tải hình ảnh, âm thanh trên Web, … Sự thành công của MPEG dựa trên nhiều yếu tố, nhưng có lẽ yếu tố quan trọng đầu tiên là sự xuất hiện đúng thời điểm. MPEG đã xuất hiện vào thời điểm mà công nghệ vi xử lý có thể tạo ra các chip xử lý có độ phức tạp đạt yêu cầu để thực hiện được các giải thuật mã hóa audio và video. Hơn nữa, MPEG đã thành công nhờ thu hút được sự hợp tác của tất cả các công nghệ mới có liên quan và sự hỗ trợ của các chuyên gia kỹ thuật trong ngành công nghiệp nghe-nhìn. Mục tiêu của MPEG là sử dụng được cho nhiều ứng dụng nghe nhìn khác nhau tùy theo hệ thống phân phối. Một yếu tố thành công khác phải xét đến là MPEG cung cấp giải pháp chuẩn hóa làm nền tảng cho nhà sản xuất có thể tung những sản phẩm audio và video số ra thị trường. 2. Đường đến MPEG. Bắt đầu từ cuối năm 1980, vấn đề mã hóa audio và video số đã có một số bước khởi động như sau: • CCITT giới thiệu chuẩn mã hóa video H.261 có tốc độ px64 kbit/s (p = 1 ( 30); • Trung tâm nghiên cứu David Sarnoff (David Sarnoff Research Center) giới thiệu DVI (Digital Video Interactive), hệ thống lưu trữ video, audio tương tác và dữ liệu trên CD-ROM; • Philips đưa ra thiết bị có chức năng tương tự: FMV (Full-Motion Video) cho CD-I (Compact Disc Interactive); • CMTT đang tìm cách để có thể mã hóa tín hiệu truyền hình ở tốc độ 34/45 Mbit/s cho mục tiêu phân phối. • RAI (hãng truyền hình Ý), và Telettra phát triển mã hóa số cho việc phân phối HDTV bằng vệ tinh; • Dự án châu Âu EU 147 – DAB (Digital Audio Broadcasting) được khởi động để đưa ra hệ thống mới cho việc phát sóng radio âm nhạc chất lượng Compact-disc. • MPEG là từ viết tắt của Moving Picture Experts Group gồm nhóm các chuyên gia nghiên cứu đã đề ra một số vấn đề phải giải quyết đối với video, audio như sau: - Audio và video không đơn giản chỉ là hai tín hiệu, chúng xảy ra đồng thời và có mối quan hệ chặt chẽ về thời gian nên phải bảo toàn được mối quan hệ này khi chuyển từ analog sang digital. - Chuẩn chung để mã hóa audio và video phải ứng dụng được trong nhiều công nghệ khác nhau, chú ý đến những vấn đề có thể nảy sinh đối với những công nghệ cũ có thể sẽ không còn tồn tại lâu dài. - Để các công nghệ khác nhau có thể sử dụng được, chuẩn đạt được chỉ cần đáp ứng được yêu cầu tối thiểu về giao tiếp để làm việc với nhau. - Nội dung nghe-nhìn phải được hiểu giữa các công nghệ mà không gặp rào cản nào từ vấn đề kỹ thuật. 3. MPEG-1, khởi động thiết bị số. Đề án của chuẩn MPEG-1 có tên là: “Mã hóa ảnh động kết hợp audio cho việc lưu trữ số ở tốc độ khoảng 1.5 Mbit/s”. Mục tiêu là cung cấp giải pháp cho công nghệ điện tử dân dụng (tương tác video trên đĩa compact disc) có tham chiếu đến kỹ thuật mà CCITT đã đưa ra là H261 (phương pháp nén video dùng cho video hội nghị – videoconferencing, videotelephone – truyền trên băng thông 64 kbps), và tìm giải pháp nén âm thanh chất lượng cao cho phát sóng. Sau hơn 4 năm làm việc tập trung, chuẩn MPEG-1 được công bố gồm 5 phần: Phần 1 xác định cách thức mã hóa nhiều dòng audio và video cùng với nhau, Phần 2 cách thức mã hóa 1 dòng video, Phần 3 cách thức mã hóa 1 dòng audio, Phần 4 cách thức giải mã dòng bit được thực hiện mã hóa từ 3 phần đầu, Phần 5 là phần mềm hoàn chỉnh viết bằng ngôn ngữ C để thực hiện mã hóa và giải mã. MPEG-1 đã tập hợp được nhiều yếu tố “đầu tiên” như sau: • Đây là chuẩn tích hợp nghe-nhìn đầu tiên. • Chuẩn đầu tiên định nghĩa cho bên thu chứ không phải cho bên phát. Quá trình hiểu nhau chuẩn hóa bên thu chứ không phải từ bên phát. • Nó là chuẩn đầu tiên có thể thực hiện mã hóa tín hiệu video mà không phụ thuộc vào định dạng video (NTSC/PAL/SECAM). • Đây là chuẩn đầu tiên phát triển với sự tham gia của tất cả các ngành công nghiệp trong lĩnh vực nghe-nhìn. • Đây cũng là chuẩn đầu tiên phát triển hoàn toàn trên phần mềm (sản phẩm phần mềm cho chuẩn). • Đây là chuẩn đầu tiên có mức chất lượng được công nhận (cho audio). Từ thời điểm chuẩn được công nhận vào 11/1992. MPEG-1 đã đạt được chuỗi thành công: • Ứng dụng MPEG-1 lưu trữ phim trên Video CD với chất lượng VHS và âm thanh audio rõ; • MPEG-1 là định dạng video và audio chuẩn dùng trong PC. Từ Windows 95 cho đến các phiên bản sau này đều có phần mềm giải mã MPEG-1; • Audio của MPEG-1 đã được sử dụng rông rãi trên Web, đặc biệt là phiên bản MP3 (MPEG-1 Audio Layer III); • Các camera cầm tay dùng chuẩn MPEG-1 chỉ có trọng lượng vài trăm gram. 4. MPEG-2, truyền hình số. MPEG-1 là chuẩn mã hóa nghe nhìn đầu tiên của nhóm MPEG nên mức độ ứng dụng còn hạn chế. Để ứng dụng cho lĩnh vực truyền hình, cần có chuẩn cải tiến phù hợp hơn về công nghệ và nhiều loại dịch vụ đặc thù. Một số yêu cầu cần giải quyết đối với ứng dụng truyền hình số như sau: • Kỹ thuật video MPEG-1 thực hiện mã hóa ảnh theo cơ chế quét liên tục (non-interlaced còn gọi là progressive). Tuy nhiên, chương trình truyền hình mà hàng tỷ người đang xem trên TV có cơ chế quét xen kẽ (interlaced). (Ảnh truyền hình thực hiện quét xen kẽ theo hai dạng là 625/50 hoặc 525/59,94.) • Các hệ thống MPEG-1 cung cấp giao tiếp audio và video ghép kênh số khá lý tưởng nhằm đạt hiệu quả cao và không lỗi. Với hệ thống phân phối dùng cho phát sóng truyền hình thì không đạt được những đặc tính lý tưởng về giao tiếp như trong hệ thống MPEG-1. • Truyền hình số đòi hỏi nhiều loại audio, điều này có nghĩa là phải hỗ trợ đa kênh audio. • Một số thành viên của MPEG lại mong muốn có sự hỗ trợ tương tác cho truyền hình ở một mức độ nào đó, do vậy cần phải có một protocol tương tác. • Một khác biệt chính của truyền hình số so với truyền hình analog là chất lượng. Truyền hình số luôn đạt được hình ảnh chất lượng cao và ít bị nhiễu. Một chuẩn truyền hình số phải hỗ trợ phương pháp bảo vệ nội dung, ngăn cấm những người sử dụng không có bản quyền. Tên của đề án giải quyết các yêu cầu trên là: “Mã hóa chung cho ảnh động và audio kết hợp” còn gọi là MPEG-2. Sau hơn 4 năm bắt đầu từ 7/1990 đến 11/1994, chuẩn MPEG-2 đã được hoàn thành. Về cấu trúc, MPEG-2 tương tự MPEG-1 nhưng có thêm một số phần mới. Phần 1 định nghĩa 2 loại ghép kênh. Loại đầu tiên gọi là “Program Stream” tương tự hệ thống MPEG-1. Loại thứ hai gọi là “Transport Stream” định nghĩa lớp truyền nằm ở giao diện của các hệ thống tương tự-số (mạng cáp, vệ tinh, mặt đất,…). Phần này cũng bao gồm cả cấu trúc về độ ưu tiên khi truy cập vào hệ thống điều khiển. Phần 2 nâng cấp từ MPEG-1 bằng cách hỗ trợ công cụ mã hóa video quét xen kẽ. Phần 3 nâng cấp MPEG-1 từ âm thanh stereo thành âm thanh đa kênh có khả năng tương thích ngược (nghĩa là bộ giải mã MPEG-1 có thể lấy được thông tin âm thanh stereo từ dòng bit audio của MPEG-2). Phần 4 và 5 tương tự những phần tương ứng trong MPEG-1. Phần 6 có tên “Digital Storage Media Command and Control – DMS-CC” hỗ trợ nghi thức để điều khiển các dòng thông tin nghe-nhìn nhằm thiết lập các chương trình nghe-nhìn trên mạng và phát sóng. Phần 7 có tên là “Advanced Audio Coding - ACC”, không tương thích với MPEG-1 theo cách mã hóa stereo và audio đa kênh. Với ACC, chỉ cần ½ tốc độ bit như mã hóa audio MPEG-1 Layer II cũng có thể đạt được chất lượng tương đương. Phần 9 có tên là “Real Time Interface for System Decoders - RTI”, xác định mức jitter (trượt) mà hệ thống giải mã có thể chấp nhận. MPEG-2 cũng đã đạt được nhiều thành công. Trong 4 năm đầu kể từ khi chuẩn được công nhận, thế giới nghe-nhìn đã thay đổi hoàn toàn: • Khoảng 20 triệu đầu giải mã (set top boxs) cho vệ tinh và cáp đã được bán ra. • Khoảng 2 triệu đầu DVD cũng đã được bán. • Các dịch vụ truyền hình mặt đất MPEG-2 được bắt đầu ở Mỹ (HDTV) và Anh (TV thông thường). • Profile 4:2:2 dùng trong studio truyền hình và dựng với chất lượng cao. Profile 4:2:2 là một profile quan trọng cho các ứng dụng chất lượng cao của MPEG-2. Ngoài profile 4:2:2 có một vài profile khác như sau: Simple (không có nội suy frame), Main và 3 profile (SNR, Spatial, High). Ngoài ra còn có Multiview Profile – MVP là profile cộng thêm sử dụng công cụ mã hóa video MPEG-2 để mã hóa hiệu quả 2 chuỗi video từ 2 camera quay cùng 1 cảnh nhưng khác nhau một góc quay nhỏ. Bổ sung cho các profile là các “Levels” ứng với độ phân giải của ảnh (TV/HDTV). MPEG-2 được chấp nhập bởi hai lý cho chính. Trước tiên là video đạt được chất lượng cao. Người ta kiểm tra và thấy rằng ở tốc độ nén 6 Mbit/s chất lượng tương đương composite video (NTSC/PAL/SECAM), ở tốc độ 9 Mbit/s chất lượng tương đương component video (Y, R-Y, B- Y). Thứ hai là chuẩn được hỗ trợ từ nhiều ngành công nghiệp bao gồm công nghiệp vi điện tử, chế tạo set top boxes (thiết bị chuyển dòng MPEG-2 thành tín hiệu truyền hình analog đưa đến TV),… Truyền hình số cung cấp hình ảnh sắc nét rất phù hợp cho các môi trường truyền như vệ tinh, cáp. Một transponder vệ tinh trước đây chỉ mang một chương trình truyền hình thì nay có thể mang nhiều chương trình truyền hình hơn nên sẽ rất kinh tế. MPEG-2 có khả năng hỗ trợ nhiều loại dịch vụ truyền hình. Hệ thống MPEG-2 cung cấp 2 loại thông điệp: Entitlement Control Messages – ECM, và Entitlement Manegement Messages – EMM. Các thông điệp này được gởi các khóa đến bộ giải mã để cấp phát quyền thu các chương trình có mã (scramble). 5. MPEG-4, hội ngộ giữa truyền hình và web. Trong vài năm trở lại đây, một số ứng dụng được sử dụng nhiều nhất là: • Ảnh động và audio (truyền hình); • Hyperlink, các kết nối trong thế giới ảo (liên kết web); • Tương tác trong thế giới ảo (game, chat trên mạng). Với ứng dụng này, người ta có thể tìm được những thông tin cá nhân về người khác, nói chuyện, chơi với họ trên không gian ảo. Chuẩn kỹ thuật có thể cung cấp tích hợp những ứng dụng này được nhóm MPEG khởi công nghiên cứu từ 6/1993 với tên gọi của đề án là “Mã hóa đối tượng nghe-nhìn (audio-visual objects)” còn gọi là MPEG-4. Các đặc điểm thiết kế của chuẩn MPEG-4 có thể tóm tắt như sau: • Tín hiệu video được mã hóa rất hiệu quả, đặc biệt tốc độ bit thấp để có thể truyền trên kênh thoại, Internet, các kênh điện thoại di động. • Sử dụng giải thuật mã hóa video có khả năng nâng cấp để có thể mã hóa video với tốc độ bit cao hơn (chất lượng hơn) sử dụng cho các mục đích phát sóng, truyền trên băng thông rộng. • Mã hóa tín hiệu audio, tiếng nói (speech), âm nhạc với tốc độ bit khác nhau. • Cung cấp mức độ lỗi khác nhau trong giải thuật mã hóa, hướng đến ứng dụng cho điện thoại di động. • Dữ liệu video được mã hóa tách riêng đối tượng (người, xe chạy,…) và phần nền của ảnh video. • Biểu diễn âm nhạc tổng hợp vượt chất lượng MIDI. • Có hiệu ứng không gian 3D audio. • Có thể tổng hợp các đối tượng nghe-nhìn trong một không gian 3D để biểu diễn hình theo 2D và âm thanh 3D. • Cung cấp nghi thức phục vụ cho việc tương tác. • Dùng 1 định dạng file thống nhất để trao đổi giữa người sử dụng và server hoặc client. • Mở rộng định dạng URL của Web để hoàn thiện các nghi thức dùng cho lưu trữ, phân phối dữ liệu nghe nhìn trong thời gian thực. • Bảo vệ nội dung chỉ những người có bản quyền mới được truy cập. Những đặc điểm ấn tượng này được xây dựng bởi đóng góp trí tuệ của 300 chuyên gia từ 200 công ty của 20 quốc gia thực hiện trong 5.5 năm cho thấy sự bao hàm của nhiều công nghệ và mức độ hội tụ kỹ thuật. Kết quả cuối cùng là chuẩn MPEG-4 hay ISO/IEC 14496 gồm 6 phần với chức năng mỗi phần được nâng cấp từ các phần tương ứng của MPEG-2. Có thể xem MPEG-4 là một tập của các kỹ thuật đã được chuẩn hóa và có thể dùng để thực hiện các ứng dụng mới hoặc nâng cấp những ứng dụng cũ. Một số ứng dụng dựa trên MPEG-4 như sau: • Audio on Demand trên Web. Audio MPEG-4 16 Kbit/s cho chất lượng khá tốt dùng cho những ứng dụng thương mại phù hợp tốc độ bit trên mạng Web hiện nay. • Phát sóng radio số trên kênh băng hẹp, ví dụ: radio AM. Dịch vụ phát sóng này sử dụng băng thông 6 KHz có thể truyền ở tốc độ 24 Kbit/s và cung cấp thêm nhiều dịch vụ số mới. • Các dịch vụ video trên Web. Khả năng tổng hợp các các ảnh 2D cho mục tiêu quảng cáo, giới thiệu văn hóa, … • Multimedia tương tác trên điện thoại di động. Các dịch vụ video và audio MPEG-4 với mức độ chất lượng nhúng khác nhau có thể sử dụng hiệu quả trên các kênh điện thoại di động. • Phát sóng multimedia số. Các trạm phát sóng theo DAB ở châu Âu/Canada có thể được sử dụng để phát sóng multimedia tương tác. Các trạm khác có thể phát triển dễ dàng bằng vệ tinh để cung cấp dịch vụ cho người đang di chuyển. • Hướng dẫn chương trình điện tử EPG (Electronic Program Guides). Khả năng tổng hợp hình 2D khi dùng cho mục tiêu EPG có thể đạt được nhiều ưu điểm vượt trội. • Các thực nghiệm thực tế ảo (Virtual Reality) trên Web. Khả năng nén cao của MPEG-4 và khả năng chỉ download dữ liệu cần thiết khiến cho MPEG-4 là công cụ hiệu quả để gia nhập vào thế giới ảo sử dụng các dòng truyền có tốc độ bit phù hợp với tốc độ truyền tải trên Web hiện nay. • Không gian ảo trên Web. Khả năng tổng hợp của MPEG-4 có thể tạo ra những không gian ảo cho những thực nghiệm thú vị trên Web. • Tương tác multimedia cục bộ. Các thế giới ảo có thể lưu trữ trên CD-ROM hoặc DVD-ROM, có thể cập nhật online từ Web hoặc kênh phát sóng. 6. MPEG-7, mô tả thông tin multimedia. Việc thiết lập kho thông tin với những thông tin dùng để xác định, truy tìm đã được quan tâm từ lâu. Trong thế giới của truyền hình số cũng đòi hỏi các phương pháp đặc thù để xác định thông tin mong muốn. Đặc tính kỹ thuật SI (Service Information) cung cấp thông tin về “sự kiện” được phát sóng trên dòng ghép kênh MPEG-2 như: • Nhà cung cấp nội dung và dịch vụ, • Mô tả nội dung (phân loại và text), • Loại dịch vụ (TV, radio, teletext, NVOD), • Mô tả phân loại phân cấp, • Vị trí không gian / thời gian của sự kiện, • Loại thành phần thông tin (audio, video,…) - Loại thành phần (16/9 video, stereo audio,…) - Mô tả văn bản của thành phần. Nội dung được phân thành 16 loại như sau: Mỗi loại trên có thể phân thêm thành 16 loại nhỏ, ví dụ: “Sở thích lúc rảnh rỗi” có thể phân thêm như sau: MPEG-4 sử dụng thông tin nội dung đối tượng OCI (Object content information) để mô tả thông tin về các đối tượng nghe-nhìn. Các mô tả về nội dung thường là: mô tả phân loại nội dung, mô tả từ khóa, mô tả thể loại, mô tả ngôn ngữ, mô tả văn bản, và mô tả về việc tạo ra nội dung. Các mô tả OCI có thể chứa trong các bộ mô tả đối tượng liên quan hoặc bộ mô tả dòng thành phần, hoặc có thể truyền trong chính dòng thành phần. Một dòng OCI được sắp xếp theo chuỗi các sự kiện chứa một tập các mô tả OCI. Thường các mô tả theo dạng văn bản, nhưng đối với audio và video việc mô tả không đơn giản như thế mà phức tạp hơn nhiều. MPEG-7 nhắm đến mục tiêu mô tả được nội dung audio và video. MPEG-7 dùng “Giao diện mô tả nội dung multimedia” (Multimedia Content Description Interface) bao gồm một tập chuẩn của các bộ mô tả cho nhiều loại thông tin mutimedia khác nhau. Ngôn ngữ chuẩn hóa dùng để mô tả trong MPEG-7 là ngôn ngữ DDL – Description Definition Language. Các dữ liệu nghe-nhìn như ảnh tĩnh, đồ họa, mô hình 3D, audio, video,… được kết hợp trong một biễu diễn multimedia giúp cho việc đánh dấu, tìm kiếm dễ dàng. 7. Kết luận. MPEG là một câu chuyện thành công. Nó đã được phát triển từ nhiều thành phần khác nhau của công nghệ multimedia và được tổng hợp để trở thành các chuẩn ứng dụng mạnh đúng thời điểm. Các chuẩn MPEG là sản phẩm từ tham vọng của hàng trăm nhà nghiên cứu khắp thế giới và hiện nay vẫn còn đang được tiếp tục nghiên cứu nhằm đưa ra chuẩn ứng dụng phù hợp với nhu cầu phát triển ngày càng cao của con người và công nghệ. Ngày nay, những kỹ thuật được phát triển trong phòng thí nghiệm đã được đưa ra thành các sản phẩm và dịch vụ. Sự phát triển của các chuẩn MPEG đã mang lại nhiều lợi ích cho tất cả ngành công nghiệp ứng dụng, triển khai nó. . tương lai của MPEG. 4 chuẩn ứng dụng quan trọng nhất của MPEG được quan tâm là: • MPEG- 1 và MPEG- 2 – bước chuyển đổi từ analog vào digital và các ứng dụng phát triển theo đó; • MPEG- 4 – quá trình. lượng được công nhận (cho audio). Từ thời điểm chuẩn được công nhận vào 11/1992. MPEG- 1 đã đạt được chuỗi thành công: • Ứng dụng MPEG- 1 lưu trữ phim trên Video CD với chất lượng VHS và âm thanh. MP3 (MPEG- 1 Audio Layer III); • Các camera cầm tay dùng chuẩn MPEG- 1 chỉ có trọng lượng vài trăm gram. 4. MPEG- 2, truyền hình số. MPEG- 1 là chuẩn mã hóa nghe nhìn đầu tiên của nhóm MPEG

Ngày đăng: 09/07/2014, 20:20

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan