Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 25 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
25
Dung lượng
638,5 KB
Nội dung
BỘ THÔNG TIN VÀ TRUYỀN THÔNG HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THƠNG - TÀI LIỆU TIÊU CHUẨN, TÀI LIỆU KỸ THUẬT MÃ HÓA CÁC ĐỐI TƯỢNG HÌNH ẢNH ÂM THANH – TƯƠNG TÁC GIỮA ÂM THANH VÀ CÁC HỆ THỐNG HÀ NỘI, 2016 MỤC LỤC 1.Tên gọi ký hiệu Tiêu chuẩn Việt Nam 2.Đặt vấn đề 1.1 Tình hình phát triển 1.2 Tình hình sử dụng 12 3.Sở xây dựng yêu cầu kỹ thuật 13 1.3 Tình hình tiêu chuẩn định dạng âm tương tác âm 13 1.4 Tình hình chuẩn hóa nước 13 1.5 Phân tích lựa chọn sở 13 1.5.1 Tiêu chuẩn quốc tế 13 1.5.2 Hình thức xây dựng 14 4.Nội dung tiêu chuẩn kỹ thuật .14 5.Bảng đối chiếu tiêu chuẩn viện dẫn .15 6.Kết luận 16 CÁC TỪ VIẾT TẮT Từ viết tắt AAC ETSI IEC ISO ITU HE-ACC SBR Tiếng Anh Advanced Audio Coding European Telecommunications Standards Institute International Electrotechnical Commission International Organization for Standardization International Telecommunication Union High Efficiency-ACC Spectral Band Replication Parametric Stereo PS QMF MDCT VRML Quadrature Mirror Filter Modified Discrete Cosine Transform Virtual Reality Modeling Language Tiếng Việt Chuẩn mã hóa âm tiên tiến Viện Tiêu chuẩn Viễn thông Châu Âu Ủy ban Kỹ thuật Điện tử Quốc tế Tổ chức tiêu chuẩn hóa quốc tế Liên minh Viễn thơng quốc tế Chuẩn mã hóa âm nâng cao hiệu Kỹ thuật tái tạo dải phổ âm Tham số kênh dùng nén giải nén âm stereo ->mono ngược lại Các lọc cầu phương Chuyển đổi cosine rời rạc sửa đổi Ngôn ngữ mơ hình thực ảo Tên gọi ký hiệu Tiêu chuẩn Việt Nam Tên dự thảo Tiêu chuẩn quốc gia: “Mã hóa đối tượng hình ảnh âm – Tương tác âm hệ thống” Mã số: Đặt vấn đề Các chuẩn nén âm hình ảnh tổ chức ISO IEC ban hành rộng rãi giới thường xuyên có cập nhật MPEG-4 cịn có tên nhóm tiêu chuẩn ISO/IEC 14496 chuẩn nén cơng bố gần có chất lượng nén cao âm hình ảnh Đây chuẩn nén hỗ trợ nhiều đặc tính cơng nghệ nén 3D, hướng đối tượng, hỗ trợ nén nhiều thành phần liệu tệp tin liệu âm thanh, video, VRML (Virtual Reality Modeling Language) Việt Nam thời điểm chưa có tiêu chuẩn nén giải nén liệu chất lượng cao tương đương chuẩn MPEG-4 Do vậy, Việt Nam xây dựng tiêu chuẩn MPEG-4 Trước mắt chưa có nhiều nghiên cứu kinh nghiệm lĩnh vực nên việc xây dựng tiêu chuẩn chấp thuận nguyên vẹn tiêu chuẩn quốc tế có bổ sung cho phù hợp với tình hình Việt Nam Đề tài xây dựng tiêu chuẩn “Tương tác âm hệ thống” nằm nhóm tiêu chuẩn “ Mã hóa đối tượng âm – hình ảnh” xây dựng dựa chuẩn ISO/IEC 14496 phần 24 Về nguyên tắc xây dựng tiêu chuẩn chấp thuận nguyên vẹn có bổ sung phù hợp với tình hình Việt nam Chuẩn MPEG-4 chia thành nhóm, nhóm chịu tránh nhiệm nghiên cứu vấn đề liên quan đến xử lý truyền liệu âm thanh, hình ảnh Một đặc trưng chuẩn MPEG-4 khơng đóng mà ln cập nhật bổ sung mở rộng Cụ thể, chuẩn MPEG-4 vào năm 2008 có 24 nhóm phụ trách 24 phần (từ part 1- part 24) thời điểm mở rộng đến part thứ 31, chi tiết phần mà nhóm MPEG-4 nghiên cứu mơ tả phần 2.1 Về chuẩn MPEG-4 tập trung mô tả vào cấu trúc hệ thống MPEG-4, định dạng liệu, quy định phương thức hoạt động đối tượng bên hệ thống MPEG-4, bên cạnh MPEG-4 đưa tiêu chuẩn dạng tài liệu kỹ thuật (technical report) nhằm góp phần giúp mơ tả chi tiết hơn, giải thích cụ thể chuẩn ban hành Chuẩn ISO/IEC 14496 – phần 24 chuẩn dạng Chuẩn ISO/IEC 14496 – phần 24 tập trung mô tả hoạt động bên hệ thống MPEG-4 cụ thể tương tác hệ thống với liệu âm nén chất lượng cao AAC HE-AAC Dựa chuẩn ISO/IEC 14496, nhóm xây tiêu chuẩn nhằm cung cấp kiến thức cụ thể phương thức nén giải nén liệu âm theo AAC HE-AAC hệ thống MPEG-4 Mục đích việc xây dựng tiêu chuẩn giúp nhà nghiên cứu, nhà sản xuất hiểu rõ hoạt động nén giải nén âm hệ thống MPEG-4 để từ nghiên cứu, phát triển sản phẩm phần cứng, phần mềm liên quan đến hệ thống MPEG-4 Trong chuẩn có ví dụ minh họa câu lệnh cụ thể để tham khảo Tiêu chuẩn chuẩn tham chiếu dùng đơn vị nghiên cứu lĩnh vực xử lý đa phương tiện, nhà sản xuất thiết bị giải trí setop box, hd box, đầu dvd,….hoặc nhà sản xuất lĩnh vực phát truyền hình 1.1 Tình hình phát triển MPEG nhóm chun gia hình ảnh động hình thành ISO IEC nhằm thiết lập chuẩn nén, truyền âm hình ảnh MPEG thành lập năm 1988 Hiroshi Yasuda Leonardo Chiariglione MPEG họp năm 1988 Ottawa Canada Vào năm 2005 MPEG phát triển xấp xỉ 350 thành viên từ nhiều lĩnh vực công nghiệp, trường đại học, viện nghiên cứu Các chuẩn: - - - MPEG-1 (1993): Được biết chuẩn ISO/IEC 11172 - Chuẩn nén âm hình ảnh phục vụ cho việc lưu trữ với bit rate đến 1.5Mbit/s Nó sở cho việc phát triển việc lưu trữ âm hình đĩa CD VCD MPEG-2 (1995): Được biết chuẩn ISO/IEC 13818 - Thông tin nén âm hình ảnh dùng để truyền mạng băng rộng Chuẩn MPEG-2 hỗ trợ nén liệu hình ảnh xen kẽ độ nét cao (hd – high definition) Nó dùng để nén liệu cho truyền hình số DVB, vệ tinh Lưu trữ đĩa SVCD hay DVD MPEG-3: Giải vấn đề đồng nén đa phân giải dự kiến cho HDTV MPEG-4 (1998): Được biết chuẩn ISO/IEC 14496 -Mã hóa đối tượng âm hình ảnh Chuẩn dùng cơng cụ mã hóa phức tạp cho hệ số nén cao MPEG-2 Đặc biệt hiệu với video MPEG-4 gần với ứng dụng đồ họa máy tính Các giải mã MPEG-4 hiệu cho việc xuất phim (render) nén luồng bít mô tả không gian chiều bề mặt đối tượng giúp việc nén 3D hiệu Ngồi hỗ trợ MPEG-J giúp hỗ trợ viết ứng dụng đa phương tiện tương tác môi trường Java với hàm - Java API Các chuẩn video hiệu mô tả MPEG-4 part MPEG-4 part 10 MPEG-4 part 10 dùng nhiều hệ thống HD DVD Blu-ray MPEG-7 (2002): Giao diện mô tả nội dung đa phương tiện (ISO/IEC 15938) MPEG-21(2001): Khung đa phương tiện (ISO/IEC 21000) Trong chuẩn MPEG MPEG - nhiều nước quan tâm cung cấp phương thức nén hiệu ứng dụng phổ biến Cụ thể, MPEG-4 cung cấp chức sau: - Cải tiến hiệu mã hóa MPEG2 Khả trộn nhiều liệu (đa phương tiện: âm thanh, hình ảnh, tiếng nói, video) Khả tương tác với liệu âm hình ảnh thiết bị nhận Ngồi ra, MPEG-4 cung cấp kỹ thuật hỗ trợ cho nhà phát triển người dùng như: - - - Cho phép nhà phát triển phần cứng phần mềm tạo việc xử lý đối tượng đa phương tiện tốt khả thích ứng linh hoạt để cải tiến chất lượng công nghệ dịch vụ truyền hình số, đồ họa động, ứng dụng web, Các nhà cung cấp mạng liệu dùng MPEG-4 cho việc truyền liệu Dữ liệu MPEG-4 chuyển đổi sang dạng liệu khác tương thích với mạng internet Định dạng MPEG-4 cung cấp cho người dùng cuối khả tương tác với đối tượng động Ghép kênh đồng liệu gắn với đối tượng liệu đa phương tiện để tăng hiệu truyền MPEG-4 chuẩn mở rộng đánh số cho phần khác Từ phần phần 31 Phần quan trọng MPEG-4 tập trung vào phần (MPEG-4 part 2) bao gồm codec DivX, Nero Digital 3ivx… phần 10 (MPEG-4 part 10) mã hóa video AVC/H.264 Phần nén âm MPEG-4 part mở rộng MPEG-4 part 26 Bảng nhóm MPEG-4 đến thời điểm Phần Thời Thời gian gian Sửa đổi Đánh số công bố công bố cuối cuối Phần ISO/IEC 1999 14496-1 Phần ISO/IEC 1999 14496-2 Phần ISO/IEC 1999 14496-3 Phần ISO/IEC 2000 14496-4 Phần Phần ISO/IEC 2000 14496-5 ISO/IEC 1999 14496-6 2010 2004 2010 2009 Tiêu đề Mô tả Systems Mô tả ghép kênh đồng liệu âm hình ảnh Chuẩn mơ tả cấu trúc chung phân lớp hệ thống MPEG-4 Visual Định dạng nén cho liệu hình ảnh (video,ảnh, ) Audio Một định dạng nén cho mã hóa liệu âm bao gồm vài loại AAC (Avanced Audio Coding, ALS (Audio Lossless Coding), SLS (Scalable Lossless Coding),… 2009 2010 2004 Mô tả thủ tục cho việc 2010 Conformance kiểm tra hiệu với (2011) testing phần khác chuẩn 2001 2000 2010 Reference (2011) software Cung cấp phần mềm tham chiếu cho việc giải thích thẩm định phần khác chuẩn Delivery Multimedia Khung tích hợp liệu Integration đa phương tiện cho việc Framework (D truyền MIF) Phần Phần Phần Phần Thời Thời gian gian Sửa đổi Đánh số công bố công bố cuối cuối ISO/IEC TR 2002 14496-7 ISO/IEC 2004 14496-8 ISO/IEC TR 2004 14496-9 Tiêu đề Mô tả Tài liệu kỹ thuật cung cấp ví dụ tham khảo cho việc xây dựng phần mềm mã hóa đối tượng âm hình ảnh Tài liệu làm rõ nội dung phần 2004 Optimized reference software for coding of audio-visual objects 2004 Mô tả cách thức truyền nội dung MPEG-4 Carriage of mạng IP Bao gồm ISO/IEC 14496 hướng dẫn thiết kết contents over định dạng gói tin RTP IP networks dùng chế SDP cho việc truyền nhận 2009 Mô tả cơng cụ mã hóa video phần cứng biểu diễn dạng ngôn ngữ HDL hay dùng với phần khác chuẩn Reference hardware description 2012 Advanced Mô tả định dạng tín hiệu (2010) Video video giống định Coding (AVC) dạng chuẩn ITU-T H.264 ISO/IEC 2005 14496-11 2005 2009 Scene Nó mơ tả cấp độ hệ thống description and ứng dụng application định dạng (BIFS - Binary engine Format for Scene) Phần 12 ISO/IEC 2004 2012] 2009(20 ISO base ISO/IEC Phần 10 2003 14496-10 Phần 11 Mô tả cấu trúc định dạng Phần Thời Thời gian gian Sửa đổi Đánh số công bố công bố cuối cuối 14496-12 Phần 13 Phần 14 Phần 15 ISO/IEC 2004 14496-13 ISO/IEC 2003 14496-14 ISO/IEC 2004 14496-15 Phần 16 ISO/IEC 2004 14496-16 10) Tiêu đề media file format Mô tả tệp lưu liệu đa phương tiện 2004 Mô tả đuôi mở rộng, cú pháp ngữ nghĩa Intellectual IPMP hỗ trợ xác thực Property công cụ IPMP Management IPMP với đầu and Protection cuối (IPMP) Mô tả cú pháp, ngữ nghĩa Extensions công cụ IPMP luồng bít,… 2003 (2010) Mơ tả định dạng tệp MP4 từ chuẩn ISO/IEC 1449612 Nó sửa lại thay hồn tồn điều 13 ISO/IEC 14496-1 2010 Mơ tả luồng liệu video lưu tệp ISO Advanced với định đạng khác 2008 Video Coding bao gồm AVC(2010) (AVC) file advanced Video Coding, format SVC-Scalable Video Coding, MVC-Multiview Video Coding 2011 MP4 file format (2010) Animation Framework eXtension (AFX) Mơ tả mơ hình AFXAnimation Framework eXtension cho việc trình diễn mã hóa đồ họa 3D tích hợp Phần Thời Thời gian gian Sửa đổi Đánh số công bố công bố cuối cuối Tiêu đề Mơ tả trình diễn đa phương tiện tương tác Phần 17 ISO/IEC 2006 14496-17 ISO/IEC Phần 18 2004 14496-18 Phần 19 Phần 20 ISO/IEC 2004 14496-19 ISO/IEC 2006 14496-20 Phần 21 ISO/IEC 2006 14496-21 2006 Mơ tả phương thức mã hóa ký tự chế độ bít thấp Streaming text thành phần đa phương format tiện hệ thống âm hình ảnh 2004 Font Mô tả định dạng phông compression mở phần 22 (part and streaming 22) 2004 Các luồng liệu bề mặt đồng dùng Synthesized cho việc tạo đoạn video texture stream đồng tốc độ bit thấp 2008 Lightweight Application Scene Representation (LASeR) and Simple Aggregation Format (SAF) Mô tả định dạng LASeR – Lightweight Application Scene Representation định dạng kết hợp phù hợp cho việc biểu diễn phân phối dịch vụ đa phương tiện tới thiết bị điện thoại di động MPEG-J Graphics Framework eXtensions (GFX) Mô tả mơi trường lập trình lightweight cho phát triển ứng dụng đa phương tiện tương tác MPEG-J môi trường 2006 2009 Phần Thời Thời gian gian Sửa đổi Đánh số công bố công bố cuối cuối Tiêu đề Mô tả ứng dung Java với hàm JAVA API Phần 22 Phần 23 ISO/IEC 2007 14496-22 ISO/IEC 2008 14496-23 ISO/IEC Phần 24 TR 2008 14496-24 ISO/IEC Phần 25 2009 14496-25 Mô tả định dạng OFFSOpen Font Format Specification cho việc trao đổi thông tin phông chữ số ứng dụng đa phương tiện khác 2009 Open Font Format 2008 Mô tả SMR để phát triển ứng dụng giải trí, giáo dục,… SMR Symbolic dủng để mơ tả Music nhiều loại nhạc đặc trưng Representation bao gồm thể loại khác (SMR) nhạc thánh ca, nhạc phục hứng, nhạc cổ điển, trữ tình,… 2008 Audio and systems interaction Mơ tả cách thức hoạt động tương tác hệ thống MPEG-4 với liệu âm 3D Graphics Compression Model Mơ tả mơ hình kết nối công cụ nén đồ họa 3D chuẩn MPEG-4 với thành phần đồ họa xác định chuẩn hay tài liệu khác 2009 10 Phần Phần 26 Phần 27 Phần 28 Thời Thời gian gian Sửa đổi Đánh số công bố công bố cuối cuối ISO/IEC 2010 14496-26 ISO/IEC 2009 14496-27 ISO/IEC 2012 14496-28 ISO/IEC Under Phần 29 DIS developm 14496-29 ent Phần 30 ISO/IEC 2016 14496-30 Phần 31 ISO/IEC Under NP developm Tiêu đề Mô tả Mô tả cách kiểm tra để xác định liệu nén Audio giải mã có đáp ứng Conformance yêu cầu theo ISO/IEC 14496 – part không? 2010 (2010) 3D Graphics conformance Mô tả cách kiểm tra để xác định liệu nén (ví dụ bitstream) giải mã đồ họa 3D ISO/IEC 14496-11:2005, ISO/IEC 14496-16:2006, ISO/IEC 14496-21:2006, ISO/IEC 14496-25:2009 không? Mô tả phông tổ hợp định dạng XML Composite font định nghĩa đối representation tượng CFR (Composite Front Representation) Web video coding Mô tả mã hóa video web Timed text and other visual Mơ tả định dạng lưu trữ overlays in ISO tương thích với base media file chuẩn định dạng ISO format Video Coding Mơ tả mã hóa video dùng cho trình duyệt – Ký 11 Phần Thời Thời gian gian Sửa đổi Đánh số công bố công bố cuối cuối 14496-31 ent Tiêu đề for Browsers Mơ tả thuật nén video dùng bên trình duyệt web 1.2 Tình hình sử dụng Các tiêu chuẩn nén MPEG-4 sử dụng nhiều giới số nước dựa vào ban hành như: Canada với CAN/CSA – ISO/IEC 14496, Hàn quốc KS X ISO/IEC 14496,… Tuy nhiên chuẩn MPEG-4 14496 part 24 chuẩn không bắt buộc nước thường dùng chuẩn quốc tế mà không ban hành chuẩn Riêng Canada ban hành CAN/CSA – ISO/IEC 14496-24-08(R2013) Mặc dù chuẩn khơng bắt buộc xong để phát triển sản phẩm thị trường quốc tế nhà sản xuất phải tham khảo chuẩn Điều khơng hồn tồn phụ thuộc việc ban hành chuẩn quốc gia Chính vậy, tiêu chuẩn có lẽ khơng tách thành tiêu chuẩn TCVN độc lập mà nên ghép với chuẩn TCVN khác phụ lục hay phần bổ sung chuẩn mã hóa đối tượng âm hình ảnh Tiêu chuẩn khơng mang tính bắt buộc mang tính tham khảo tham chiếu Nếu nhà sản xuất khơng dùng MPEG - khơng cần quan tâm đến chuẩn Mặt khác để hiểu chuẩn đòi hỏi phải tham chiếu thêm đến các chuẩn thuộc phần 1, phần 3, phần 12 ISO/IEC 14496 để nắm hệ thống MPEG-4, liệu âm nén AAC MPEG-4 tệp tin ISO Chuẩn thường nhà sản xuất thiết bị đầu đĩa DVD, thiết bị SETOP BOX, HD BOX hay nhà phát triển phần mềm phát video mạng Internet FLV player, MPC – Media Player Classic,…cũng tham chiếu Ngồi ra, hãng truyền hình, nhà cung cấp dịch vụ Internet quan tâm đến chuẩn Với Việt nam xây dựng chuẩn MPEG-4 cần phải xây dựng chuẩn chuẩn MPEG-4 thực đầy đủ hoàn chỉnh Tuy nhiên, nói phần trước chuẩn không thiết phải ban hành thành chuẩn riêng mà 12 coi phần phụ lục cho chuẩn MPEG-4 Nó hỗ trợ làm rõ yếu tố kỹ thuật liên quan đến hệ thống MPEG-4 Sở xây dựng yêu cầu kỹ thuật 1.3 Tình hình tiêu chuẩn định dạng âm tương tác âm Các định dạng âm MPEG mở rộng từ âm nén liệu mp3 đến âm nén chất lượng cao AAC hay HE-AAC (phụ lục 1) Tuy nhiên chuẩn đề cập đến âm hệ thống MPEG-4 gồm chuẩn ISO đây: • ISO/IEC 13818-7:2006 (Information technology – Generic coding of moving pictures and associated audio information – Part 7: Advanced Audio Coding): tiêu chuẩn rõ việc mã hóa âm tiên tiến đa kênh chất lượng cao tương thích ngược với MPEG-1 • ISO/IEC 14496-3:2009 (Information technology Coding of audiovisual objects Part 3: Audio): tiêu chuẩn rõ mã hóa nhiều loại âm khác từ âm tự nhiên đến âm tổng hợp, mã hóa liệu, tiếng nói, âm nhạc, • ISO/IEC 14496-24:2008 (Information technology Coding of audiovisual objects Part 24: Audio and systems interaction): tiêu chuẩn rõ tương tác âm hệ thống MPEG-4 Nhận xét: Trong số tiêu chuẩn liên quan đến khuôn dạng file media nêu ISO ISO/IEC 14496-24:2008 (Information technology Coding of audiovisual objects Part 24: Audio and Systems interaction) tiêu chuẩn phù hợp với yêu cầu đặt đề tài vụ 1.4 Tình hình chuẩn hóa nước Theo thơng tin cơng bố website Bộ thơng tin truyền thơng tổng số 73 tiêu chuẩn 54 dự thảo tiêu chuẩn chưa có tiêu chuẩn hay dự thảo tiêu chuẩn đề cập đến tương tác âm hệ thống MPEG-4 Tương tự vậy, tổng số 84 quy chuẩn kỹ thuật 82 dự thảo quy chuẩn chưa có quy chuẩn kỹ thuật đề cập đến tương tác âm hệ thống MPEG-4 Chính việc xây dựng dự thảo tiêu chuẩn tương tác âm hệ thống MPEG-4 thực cần thiết 1.5 Phân tích lựa chọn sở 1.5.1 Tiêu chuẩn quốc tế 13 Các tiêu chuẩn nén MPEG-4 sử dụng nhiều giới số nước dựa vào ban hành như: Canada với CAN/CSA – ISO/IEC 14496, Hàn quốc KS X ISO/IEC 14496,… Tuy nhiên chuẩn MPEG-4 14496 part 24 chuẩn không bắt buộc nước thường dùng chuẩn quốc tế mà không ban hành chuẩn Riêng Canada ban hành CAN/CSA – ISO/IEC 14496-24-08(R2013) 1.5.2 Hình thức xây dựng Bản dự thảo tiêu chuẩn xây dựng theo phương pháp chấp thuận nguyên vẹn tiêu chuẩn quốc tế Việc áp dụng tiêu chuẩn quốc tế Việt Nam hồn tồn khả thi bởi: • Nhu cầu sử dụng phương tiện truyền thông với hình thức nghiên cứu, học tập, giải trí, có liên quan đến hệ thống MPEG-4 Việt nam ngày nhiều • Việc phát triển phần mềm, phần cứng liên quan đến mã hóa giải mã MPEG-4 cần so sánh, đánh giá, kiểm tra • Hiện Việt Nam chưa có tiêu chuẩn tương tác âm hệ thống MPEG-4 để làm tài liệu nghiên cứu, tham khảo tham chiếu Khn mẫu, bố cục cách trình bày tiêu chuẩn kỹ thuật tuân thủ theo quy định thông tư số 03/2011/TT-BTTTT ngày 04/01/2011 Bộ Thông tin Truyền thông Quy định hoạt động xây dựng quy chuẩn kỹ thuật quốc gia tiêu chuẩn quốc gia thuộc Bộ Thông tin Truyền thông Nội dung tiêu chuẩn kỹ thuật Phạm vi áp dụng Tài liệu viện dẫn Thuật ngữ, định nghĩa, danh mục từ viết tắt Xử lý nhãn hiệu thời gian vị trí âm Hoạt động mã hóa/giải mã AAC Các vấn đề luồng liệu Phụ lục A - Cú pháp định dạng tệp tin đa phương tiện dựa ISO 14 Bảng đối chiếu tiêu chuẩn viện dẫn Tiêu chuẩn Việt Nam TCVNxxx:2016/BTTTT Tiêu chuẩn viện dẫn Ghi Sửa đổi, bổ sung ISO/IEC 14496-24: 2008-1 Chấp thuận Scope nguyên vẹn Bổ sung Theo quy Tài liệu viện dẫn định tài liệu TCVN Bổ sung Theo quy Thuật ngữ, định định tài nghĩa, danh mục từ liệu TCVN viết tắt Phạm vi áp dụng Xử lý nhãn hiệu thời ISO/IEC 14496-24: 2008– Motivating audio gian vị trí âm composition time stamp handling Hoạt động mã ISO/IEC 14496-24: 2008–3 AAC Encoder/Decoder hóa/ giải mã AAC Behavior Các vấn đề luồng ISO/IEC 14496-24: 2008– Streaming Consideration liệu Phụ lục A: Cú pháp định dạng tệp đa phương tiện dựa ISO Chấp thuận nguyên vẹn Chấp thuận nguyên vẹn Chấp thuận nguyên vẹn ISO/IEC 14496-24: 2008– Chấp thuận 5.Annex A: Relevant ISO nguyên vẹn Base Media File Format Syntax Bảng 5-1 Đối chiếu chuẩn viện dẫn 15 Kết luận Hiện thiết bị giải trí truyền thông ngày ứng dụng chuẩn nén/giải nén MPEG-4 tính nén chất lượng cao liệu âm hình ảnh Để góp phần cho hoạt động nghiên cứu, chế tạo phát triển sản phẩm cần phải có tài liệu kỹ thuật nhằm cung cấp kiến thức sâu phương thức hoạt động chuẩn này, đặc biệt hoạt động tương tác âm bên hệ thống mã hóa/ giải mã Chính việc xây dựng dự thảo tiêu chuẩn liên quan đến tương tác liệu âm hệ thống MPEG-4 hoạt động cần thiết nhằm tạo hệ thống tiêu chuẩn liên quan đến mã hóa / giải mã đối tượng âm hình ảnh, áp dụng Việt nam Khuyến nghị nên đổi tên tiêu chuẩn cho rõ nghĩa hơn: - Tên cũ “Công nghệ thông tin – mã hóa đối tượng hình ảnh âm - tương tác âm với hệ thống” - Tên “Tương tác âm hệ thống MPEG-4” 16 Phụ lục Các định dạng âm Định dạng âm số Định dạng âm số ban đầu có dạng liệu thơ phổ biến định dạng Wave có phần mở rộng WAV (*.wav) Wave sử dụng kỹ thuật điều chế xung mã –PCM (Pulse Code Modulation) để chuyển đổi lưu trữ liệu Cơ phương pháp PCM thực qua bước lấy mẫu, lượng tử mã hóa hình vẽ Hình 1: Lấy mẫu, lượng tử mã hóa Lấy mẫu rời rạc hố tín hiệu tương tự mặt thời gian theo quy luật định Về ý nghĩa vật lý lấy mẫu lấy giá trị tức thời tín hiệu tương tự vào thời điểm cách Tín hiệu sau lấy mẫu dãy xung có biên độ điều chế theo tín hiệu gốc, dãy xung gọi dãy xung PAM (Pulse Amplitude Modulation) Lượng tử hoá nghĩa chia biên độ tín hiệu thành khoảng không đều, khoảng bước lượng tử, biên độ tín hiệu ứng với đầu cuối bước lượng tử gọi mức lượng tử Sau có mức lượng tử biên độ xung mẫu làm tròn đến mức gần Thực chất lượng tử hóa q trình làm trịn giá trị biên độ xung PAM 17 Quá trình mã hố tín hiệu kỹ thuật PCM thực việc chuyển đổi mẫu tín hiệu lượng tử hố thành mã nhị phân bit Khuôn dạng từ mã PCM sau: X = P ABC DEGH ; X thể từ mã, P bít dấu, ABC bit thị phân đoạn, DEGH bit thị mức lưu lượng đoạn Trong thực tế, q trình lượng tử mã hóa thực đồng thời chip vi xử lý theo luật A luật µ Tuy nhiên, định dạng WAVE có nhược điểm khơng gian lưu trữ thường lớn, dung lượng tín hiệu thường tỷ lệ với chất lượng tín hiệu Tín hiệu chất lượng cao (tần số lấy mẫu lớn, bít mã hóa cao) dung lượng cao Ví dụ định dạng phổ biến ghi đĩa CD thường kênh, tần số lấy mẫu 44100 mẫu/giây mã hóa 16 bít Vậy dung lượng đĩa CD khoảng 60 phút là: 44100 mẫu x kênh x byte (16 bit) x 60 (giây) x (60 phút) = 635Mb Với dung lượng khơng thể truyền mạng chiếm băng thông, nhiều thời gian Do vậy, người ta nghĩ đến việc nén tín hiệu Các kỹ thuật nén ban đầu nhằm thu nhỏ kích thước tối đa giữ chất lượng âm mức chấp nhận Nổi bật kỹ thuật nén liệu định dạng MP3 tổ chức MPEG đưa năm 1991 Chuẩn nén MP3: Ban đầu MP3 hay gọi MPEG-1 Audio Layer III (MPEG âm lớp 3) Tổ chức MPEG (Moving Picture Experts Group) thiết kế phần tiêu chuẩn MPEG-1 (tiêu chuẩn nén tổn thất âm hình ảnh), sau mở rộng tiêu chuẩn MPEG-2 MPEG-1 Audio (MPEG-1 Phần 3), bao gồm MPEG-1 Audio Lớp I, II III phê duyệt thành dự thảo tiêu chuẩn ISO/IEC vào năm 1991, hồn thành vào năm 1992 cơng bố vào năm 1993 (xem ISO/IEC 11172-3:1993) Sau vào năm 1995, ISO/IEC công bố sửa đổi MP3 bổ sung khả tương thích với MPEG-2 Audio (MPEG-2 Phần 3) tốc độ bít tỷ lệ mẫu (xem ISO/IEC 13818-3:1995, sau sửa đổi thành ISO/IEC 13818-3:1998) Một phần mở rộng bổ sung cho MPEG-2 gọi MPEG-2.5 Audio MPEG-3 có ý nghĩa khác Phần mở rộng phát triển tổ chức Fraunhofer Institute for Integrated Circuits (Fraunhofer IIS), nơi đăng ký sở hữu sáng chế MP3 Giống MPEG-2, MPEG-2.5 bổ sung 50% tỷ lệ lấy mẫu tương thích với MPEG-2 mở rộng phạm vi MP3 để ứng dụng giọng nói người ứng dụng khác yêu cầu 25% tần số sinh MPEG-1 Mặc dù không công nhận tiêu chuẩn ISO MPEG-2.5 hỗ trợ rộng rãi nhà sản xuất máy nghe nhạc kỹ thuật số có thương hiệu khơng thương hiệu phần mềm máy tính dựa mã hóa giải mã MP3 MPEG2.5 không phát triển MPEG chưa chấp nhận tiêu 18 chuẩn quốc tế, MPEG-2.5 phần mở rộng khơng thức độc quyền định dạng MP3 MPEG-1 Audio Lớp I II mã hóa băng phụ (subband coder) hoạt động tốc độ bít khoảng 32-448 kb/s hỗ trợ tần số mẫu 32; 44,1 48 kHz Tốc độ bít điển hình cho Lớp II khoảng 128-256 kb/s 384 kb/s cho ứng dụng yêu cầu tốc độ cao MPEG-1 Lớp I II (MP1 MP2) mã hóa âm điển hình cho nội dung âm kênh Lớp I thiết kế cho ứng dụng yêu cầu mã hóa giải mã có độ phức tạp thấp Lớp II cho hiệu nén cao với độ phức tạp cao chút Sử dụng MPEG-1 Lớp I, nén liệu CD (Compact Disc định dạng lưu trữ liệu đĩa quang kỹ thuật số, chế tạo chất dẻo, đường kính 4,75 inch hay 120 mm, lưu trữ khoảng 80 phút âm khoảng 700 MB liệu) âm với chất lượng cao với tốc độ bít trung bình 384 kb/s bảo đảm chất lượng âm cao sau giải mã Lớp II địi hỏi tốc độ bít khoảng 192 -256 kb/s cho chất lượng gần CD Một giải mã Lớp II giải mã liệu Lớp I MP3 giải mã nhận biết âm kênh cho chất lượng nén tín hiệu âm nhạc (music signal) xuất sắc So với Lớp Lớp 2, MP3 cung cấp hiệu suất nén cao Thơng thường, MP3 nén liệu CD âm chất lượng cao theo hệ số 12 có chất lượng âm cao Nói chung, MP3 thích hợp cho ứng dụng liên quan đến lưu trữ truyền tải âm nhạc mono (Âm mono âm thu phát từ nguồn âm từ địa điểm cố định) hay stereo (Âm stereo âm từ nhiều nguồn âm phân bổ từ phải sang trái ngược lại) tín hiệu âm khác MPEG-1 Lớp chuẩn hóa cho tốc độ lấy mẫu cao 32; 44,1 48 kHz MPEG-1 vào năm 1992 Về cấu trúc tập tin âm MPEG xây dựng từ phần nhỏ gọi khung (frame) Nhìn chung frame độc lập với Mỗi frame có header riêng thơng tin âm riêng Vì khơng có header tập tin nên cắt tập tin MPEG chơi xác Tuy nhiên với lớp khơng hồn tồn xác Vì tổ chức liệu bên tập tin MPEG lớp có frame phụ thuộc lẫn chúng cắt Khi muốn đọc thông tin tập tin MPEG, thường phải tìm frame đầu tiên, đọc tiêu đề (header) thực khung khác theo frame đầu Nhưng điều khác Tập tin MPEG có tốc độ bít thay đổi dùng chuyển mạch tốc độ độ bit thay đổi theo nội dung frame Tốc độ bít thấp dùng frame đề giảm chất lượng cho phép nén tốt Tiêu đề frame gồm byte liên tiếp khung 11-12 bit đầu đồng khung (sync frame) gọi khung đồng Khi đọc toàn header kiểm tra, giá trị thấy bảng giải nghĩa xác bít 19 header Mỗi giá trị rõ dùng, không dùng, xấu, khơng hiển thị,… Các khung có kiểm tra CRC CRC dài 16 bít, tồn theo header khung Sau CRC liệu âm Chúng ta tính CRC khung so sánh với giá trị đọc từ tập tin Như trình bày, tập tin MP3 tạo từ nhiều khung MP3, khung bao gồm khối header khối liệu Chuỗi khung gọi luồng sở Các khung không thành phần độc lập thường tách khung cách tùy tiện Các khối liệu MP3 chứa thông tin âm biên độ tần số Sơ đồ cho thấy Header MP3 bao gồm phần đồng từ (sync word) dùng để xác định điểm đầu khung Tiếp theo bít hiển thị chuẩn MPEG bít hiển thị lớp 3, có tên chuẩn âm MPEG-1 lớp MP3 Sau này, giá trị khác phụ thuộc vào file MP3 Chuẩn ISO/IEC 11172-3 xác định phạm vi giá trị phần chiều dài header cho header đặc biệt Phần lớn file MP3 ngày chứa thông tin ID3 metadata trước sau khung MP3 hình vẽ ID3 metadata nhãn “tag” file âm phần file chứa thông tin metadata tiêu đề ,nhạc sỹ, album, số thông tin khác file Các chuẩn MP3 không định nghĩa tag cho file MP3, định dạng chuẩn hỗ trợ cho metadata xóa bỏ tính cần thiết tag Tuy nhiên, vài chuẩn thực tế có tồn tag Như năm 2010, phổ biến tag ID3v1 ID3v2 gần APEv2 Những nhãn thường nhúng phần đầu hay cuối file MP3, phân chia khung liệu MP3 Các giải mã MP3 thường đọc thông tin từ tag bỏ qua (ID3v1- ID cho MP3 version gồm 128 byte) 20 Hình 2: Cấu trúc tệp tin âm MP3 Định dạng âm AAC Mặc dù định dạng âm MP3 tiếng sử dụng nhiều nay, nhiên hệ thống MPEG-4 MP3 khơng sử dụng âm đơn kênh kênh tần số lấy mẫu bị giới hạn từ 16kHz-48kHz, mà hệ thống MPEG-4 thường sử dụng nhiều kênh tần số lấy mẫu đòi hỏi cao để âm tốt Ví dụ âm lập thể đa kênh cho phim Do vậy, năm 1997 nhóm MPEG-2 part giới thiệu chuẩn nén âm AAC –Advanced Audio Coding biết ISO/IEC 13818:1997 chủ yếu dùng hệ thống MPEG-4 Đây chuẩn nén âm đa kênh, có liệu có chất lượng cao MP3 AAC tích hợp lên đến 48 kênh với tần số lấy mẫu lên đến 96kHz Chuẩn AAC tiếp tục bổ sung, sửa đổi chuẩn ISO/IEC 14496-3:1999 năm 1999, ISO/IEC 14496-3:2006 năm 2006 ISO/IEC 14496-3:2009 Phiên 2009 mở rộng việc nén tương thích với nhiều loại âm khác Trong trình phát triển đó, chuẩn ISO/IEC 14496-3:1999 cập nhật năm 2000 xây dựng chuẩn AAC –LD (Advanced Audio Coding – Low Delay) Và chuẩn ISO/IEC 14496-3:2001 cập nhật năm 2003 xây dựng chuẩn HE-AAC (High Efficiency-AAC) thực chất chuẩn AAC-LD có phần xử lý tái tạo băng tần phổ SBR – Spectral band Replication Phiên chuẩn HE-ACC có thêm phần xử lý PS- Parametric Stereo Chuẩn nén âm AAC ứng dụng hệ thống MPEG-4 thiết bị giải trí Apple, Sony,…hay thiết bị setop box,… Sơ đồ nén giải nén âm AAC: 21 Hình 3: Sơ đồ nén giải nén âm chuẩn AAC Định dạng âm HE-AAC phiên phiên Hình 4: Cấu trúc nén âm HE-AAC ver1 ver2 Sơ đồ xử lý PS: 22 Hình 5: Nguyên lý xử lý PS Để hỗ trợ nhà phát triển ứng dụng hãng sản xuất thiết bị theo chuẩn MPEG-4, tài liệu kỹ thuật mô tả cách thức hoạt động nén giải nén âm AAC HE-AAC hệ thống công bố vào năm 2008 biết đến chuẩn ISO/IEC 14496-24:2008 Tài liệu đưa sau thu thập đủ liệu từ nguồn khác việc nén giải nén chuẩn âm AAC HE-AAC hệ thống MPEG-4 Chuẩn tài liệu tham khảo khơng có tính chất bắt buộc cho nhà phát triển sản phẩm MPEG-4 có tính phí Cho đến thời điểm chưa có cập nhật ngồi tài liệu cơng bố năm 2008 23 Các tài liệu phần chủ yếu tài liệu kỹ thuật với mục đích làm rõ chuẩn công bố Cụ thể mô tả chi tiết kỹ thuật cách thức nén giải nén âm AAC HE-AAC hệ thống MPEG-4 Chính tài liệu loại thường khơng cung cấp miễn phí mà phải trả phí Một điều tài liệu kỹ thuật thường dùng làm tài liệu tham khảo hay tham chiếu nhiều làm tiêu chuẩn gắn với chuẩn nén cụ thể Ví dụ nhà sản xuất, người dùng khơng dùng chuẩn nén khơng thiết phải tham khảo tài liệu Tài liệu thường xuyên cập nhật theo thời gian loại tài liệu dạng thứ loại tài liệu kỹ thuật ISO/IEC Thông thường trừ trường hợp đặc biệt, tài liệu kỹ thuật loại: Loại 1: loại tài liệu mà phần chuẩn công bố không hỗ trợ Loại loại tài liệu mà đối tượng giai đoạn phát triển, hay lý chưa có thỏa thuận thành chuẩn quốc tế Loại loại tài liệu mà ủy ban kỹ thuật thu thập đủ liệu khác công bố tiêu chuẩn 24