Tiêu chuẩn MP3 - Định dạng âm nén MP3 Tổng quan MP3 Tiêu chuẩn Moving Picture Experts Group-1 Audio Layer III – Định dạng âm nén MP3 tiêu chuẩn ISO/IEC (International Organization for Standardization/International Electrotechnical Commission) – Tổ chức tiêu chuẩn hóa quốc tế/Ủy ban kỹ thuật Điện quốc tế phát hành Ban đầu MP3 hay gọi MPEG-1 Audio Layer III (MPEG âm lớp 3) Tổ chức MPEG (Moving Picture Experts Group) thiết kế phần tiêu chuẩn MPEG-1 (tiêu chuẩn nén tổn thất âm hình ảnh), sau mở rộng tiêu chuẩn MPEG-2 MPEG-1 Audio (MPEG-1 Phần 3), bao gồm MPEG-1 Audio Lớp I, II III phê duyệt thành dự thảo tiêu chuẩn ISO/IEC vào năm 1991, hồn thành vào năm 1992 cơng bố vào năm 1993 (xem ISO/IEC 11172-3:1993) Sau vào năm 1995, ISO/IEC công bố sửa đổi MP3 bổ sung khả tương thích với MPEG-2 Audio (MPEG-2 Phần 3) tốc độ bít tỷ lệ mẫu (xem ISO/IEC 13818-3:1995, sau sửa đổi thành ISO/IEC 13818-3:1998) Một phần mở rộng bổ sung cho MPEG-2 gọi MPEG-2.5 Audio MPEG-3 có ý nghĩa khác Phần mở rộng phát triển tổ chức Fraunhofer Institute for Integrated Circuits (Fraunhofer IIS), nơi đăng ký sở hữu sáng chế MP3 Giống MPEG-2, MPEG-2.5 bổ sung 50% tỷ lệ lấy mẫu tương thích với MPEG-2 mở rộng phạm vi MP3 để ứng dụng giọng nói người ứng dụng khác yêu cầu 25% tần số sinh MPEG-1 Mặc dù không công nhận tiêu chuẩn ISO MPEG-2.5 hỗ trợ rộng rãi nhà sản xuất máy nghe nhạc kỹ thuật số có thương hiệu không thương hiệu phần mềm máy tính dựa mã hóa giải mã MP3 MPEG-2.5 không phát triển MPEG chưa chấp nhận tiêu chuẩn quốc tế, MPEG-2.5 phần mở rộng khơng thức độc quyền định dạng MP3 Các đặc điểm MP3 MPEG-1 Audio Lớp I II mã hóa băng phụ (subband coder) hoạt động tốc độ bít khoảng 32-448 kb/s hỗ trợ tần số mẫu 32; 44,1 48 kHz Tốc độ bít điển hình cho Lớp II khoảng 128-256 kb/s 384 kb/s cho ứng dụng yêu cầu tốc độ cao MPEG-1 Lớp I II (MP1 MP2) mã hóa âm điển hình cho nội dung âm kênh Lớp I thiết kế cho ứng dụng yêu cầu mã hóa giải mã có độ phức tạp thấp Lớp II cho hiệu nén cao với độ phức tạp cao chút Sử dụng MPEG-1 Lớp I, nén liệu CD (Compact Disc định dạng lưu trữ liệu đĩa quang kỹ thuật số, chế tạo chất dẻo, đường kính 4,75 inch hay 120 mm, lưu trữ khoảng 80 phút âm khoảng 700 MB liệu) âm với chất lượng cao với tốc độ bít trung bình 384 kb/s bảo đảm chất lượng âm cao sau giải mã Lớp II địi hỏi tốc độ bít khoảng 192 -256 kb/s cho chất lượng gần CD Một giải mã Lớp II giải mã liệu Lớp I MP3 giải mã nhận biết âm kênh cho chất lượng nén tín hiệu âm nhạc (music signal) xuất sắc So với Lớp Lớp 2, MP3 cung cấp hiệu suất nén cao Thông thường, MP3 nén liệu CD âm chất lượng cao theo hệ số 12 có chất lượng âm cao Nói chung, MP3 thích hợp cho ứng dụng liên quan đến lưu trữ truyền tải âm nhạc mono (Âm mono âm thu phát từ nguồn âm từ địa điểm cố định) hay stereo (Âm stereo âm từ nhiều nguồn âm phân bổ từ phải sang trái ngược lại) tín hiệu âm khác MPEG-1 Lớp chuẩn hóa cho tốc độ lấy mẫu cao 32; 44,1 48 kHz MPEG-1 vào năm 1992 Một thiết bị giải mã MP3 thực nhanh chóng giải mã MP3 cách thực rút gọn ngược nhanh chóng liệu mã Huffman (Huffman thuật tốn mã hóa rút gọn dùng để nén liệu Rút gọn (Quantization) q trình ánh xạ tập giá trị lớn thành tập giá trị nhỏ hơn)), bao gồm phần luồng liệu phân tách để giải nén luồng liệu MP3 đầu vào thành khối thông tin bao gồm thơng tin phân bổ bít thơng tin bảng Huffman, hệ số liệu mã Huffman Sơ đồ mơ tả thuật tốn giải mã MP3 mơ tả Hình bên dưới: Hình 1: Sơ đồ mơ tả thuật tốn giải mã MP3 (Nguồn: MPEG-1 Audio, The Moving Picture Experts Group) Bộ lọc (Filterbank) Bộ lọc sử dụng MP3 lọc lai, bao gồm lọc nhiều pha biến đổi cosin rời rạc hiệu chỉnh (Modified Discrete Cosine Transform – MDCT, thuật tốn nén ảnh) Hình thức lai chọn cho kích thước khung hình tương tự Lớp Lớp Mô hình thụ cảm (Perceptual Model) Các mơ hình thụ cảm chủ yếu xác định chất lượng trình mã hóa định Nó sử dụng lọc riêng biệt kết hợp tính tốn giá trị lượng (energy values) (tạo tính tốn che - masking calculations) lọc Đầu mơ hình thụ cảm bao gồm giá trị cho ngưỡng che nhiễu cho phép phân vùng mã hóa Nếu nhiễu rút gọn giữ ngưỡng che kết nén khơng thể phân biệt tín hiệu ban đầu Âm kết hợp (Joint Stereo) Mã hóa âm tận dụng ưu điểm hai kênh cặp kênh âm chứa thông tin tương tự phía xa Những bất cập dư thừa âm khai thác để giảm tổng số tốc độ bít Âm kết hợp sử dụng trường hợp có tốc độ bít thấp có sẵn tín hiệu âm thỏa mãn Rút gọn mã hóa (Quantization and Coding) Một hệ thống hai vòng lặp lồng giải pháp phổ biến để làm trịn mã hóa mã hóa MP3 Q trình làm trịn thực thông qua hệ số nén dạng lũy thừa Bằng cách này, giá trị lớn tự động mã hóa với độ xác vài dạng nhiễu (noise shaping) tạo trình rút gọn Các giá trị rút gọn mã hóa mã hóa Huffman gọi mã hóa khơng nhiễu âm (noiseless coding) nhiễu âm khơng thêm vào tín hiệu âm Q trình để tìm lợi ích tối ưu hệ số cho khối định, tốc độ bít đầu từ mơ hình thụ cảm thường thực hai vòng lặp lồng theo phương pháp phân tích tổng hợp sau: - Vịng lặp bên (vòng lặp tốc độ) (Inner iteration loop (rate loop)) Các bảng mã hóa Huffman gán mã ngắn (thường xuyên hơn) cho giá trị hệ số nhỏ Nếu số lượng bít kết từ hoạt động mã hóa vượt q số lượng bít có sẵn để mã hóa khối liệu định, việc thay đổi cách điều chỉnh lợi ích tổng thể cho phép kích thước bước nhảy rút gọn lớn hơn, dẫn đến giá trị rút gọn nhỏ Hoạt động lặp lặp lại với kích thước bước nhảy rút gọn khác bít u cầu cho mã hóa Huffman đủ nhỏ Vòng lặp gọi vòng lặp tốc độ thay đổi tốc độ bít mã hóa thuộc vào phạm vi cho phép - Vịng lặp bên ngồi (kiểm sốt nhiễu/biến dạng vòng lặp) (Outer iteration loop (noise control/distortion loop)) Để tạo nhiễu rút gọn cho ngưỡng che, hệ số áp dụng cho băng tần hệ số Các hệ thống bắt đầu với hệ số mặc định 1,0 cho băng tần Nếu phát nhiễu rút gọn băng tần cho trước vượt ngưỡng che (nhiễu cho phép) cung cấp mô hình thụ cảm, hệ số cho băng tần điều chỉnh để giảm nhiễu rút gọn Để thu nhiễu rút gọn nhỏ hơn, đòi hỏi số bước nhảy rút gọn lớn tốc độ bít cao hơn, tốc độ điều chỉnh vòng lặp phải lặp lặp lại hệ số sử dụng Nói cách khác, tốc độ vịng lặp lồng vịng lặp kiểm sốt nhiễu Vịng lặp bên ngồi (kiểm sốt nhiễu) thực nhiễu thực tế (tính từ giá trị phổ ban đầu trừ giá trị phổ rút gọn khác nhau) ngưỡng che cho băng tần hệ số (tức băng tần quan trọng) Ứng dụng Định dạng mp3 định dạng âm phổ biến để lưu trữ âm nhạc tảng máy vi tính truyền tải âm nhạc qua Internet MP3 tạo tên cho thiết bị điện tử tiêu dùng đặt tên theo nó, máy nghe nhạc mp3 MP3 ứng dụng hầu hết đĩa CD DVD (Digital Versatile Disc Digital Video Disc định dạng lưu trữ liệu đĩa quang kỹ thuật số, có đường kính 12 cm cho loại tiêu chuẩn, hay cm cho loại nhỏ DVD có cách lưu liệu khác với CD, với cách nén liệu lớp quang học có khả chứa nhiều liệu CD) hệ thống âm xe ô tô thiết bị âm mạng máy chủ âm nhạc Ngoài ra, MP3 ứng dụng rộng rãi truyền hình vệ tinh phát sóng âm kỹ thuật số điện thoại di động Trong Thông tư 01/2011/TT-BTTTT ngày 04/01/2011 Bộ trưởng Bộ Thông tin Truyền thông Công bố Danh mục tiêu chuẩn kỹ thuật ứng dụng công nghệ thông tin quan nhà nước quy định Khuyến nghị áp dụng tiêu chuẩn MP3 xếp vào nhóm Tiêu chuẩn truy cập thông tin Trần Việt Cường – Cục Ứng dụng công nghệ thông tin ... Định dạng mp3 định dạng âm phổ biến để lưu trữ âm nhạc tảng máy vi tính truyền tải âm nhạc qua Internet MP3 tạo tên cho thiết bị điện tử tiêu dùng đặt tên theo nó, máy nghe nhạc mp3 MP3 ứng dụng... giải mã liệu Lớp I MP3 giải mã nhận biết âm kênh cho chất lượng nén tín hiệu âm nhạc (music signal) xuất sắc So với Lớp Lớp 2, MP3 cung cấp hiệu suất nén cao Thông thường, MP3 nén liệu CD âm... hóa cho tốc độ lấy mẫu cao 32; 44,1 48 kHz MPEG-1 vào năm 1992 Một thiết bị giải mã MP3 thực nhanh chóng giải mã MP3 cách thực rút gọn ngược nhanh chóng liệu mã Huffman (Huffman thuật tốn mã hóa