Các chuẩn mã hóa âm thanh ISO/MPEG

Một phần của tài liệu BÀI GIẢNG XỬ LÝ ÂM THANH VÀ HÌNH ẢNH docx (Trang 129 - 130)

(f t) [x () ( tw t) ]e dtXjπ f

4.2.1. Các chuẩn mã hóa âm thanh ISO/MPEG

Từ năm 1988, Tổ chức ISO/MPEG đảm trách việc tiêu chuẩn hóa các kỹ thuật nén âm thanh và hình ảnh. Nội dung nghiên cứu chính của việc chuẩn hóa là mã hóa âm thanh và hình ảnh cho các phương tiện lưu trữ số bao gồm CD-ROM, DAT, đĩa quang từ

MO và ổ cứng máy tính.

MPEG, viết tắt của cụm từ “Moving Picture Experts Group”, là một nhóm chuyên nghiên cứu phát triển các tiêu chuẩn về hình ảnh số và nén âm thanh theo chuẩn ISO/IEC. Ngày nay, nhóm làm việc MPEG đã phát triển và phát hành các tiêu chuẩn MPEG-1, MPEG-2 và MPEG-4…MPEG chỉ là một tên riêng, tên chính thức của nó là: ISO/IEC JTC1 SC29 WG11

ISO : International Organization for Standardization IEC : International Electro-technical Commission JTC1 : Joint Technical Committee 1

SC29 : Sub-committee 29

WG11: Work Group 11 (moving picture with audio).

MPEG mô tả nén tín hiệu âm thanh sử dụng các mô hình nén theo nhận thức, đưa ra một hệ với ba mô hình nén âm thanh đơn giản là Layer I, Layer II và Layer III theo mức độ tăng lên của độ phức tạp và khả năng thực hiện (chất lượng âm thanh theo dòng bít) của bộ mã hóa. Ba bộ mã hóa này tương thích với nhau theo cách có thứ tự, có nghĩa là bộ giải mã Layer N có khả năng giải mã dòng dữ liệu được mã hóa trong Layer N và tất cả các Layer thấp hơn N.

Đối với mỗi Layer, tiêu chuẩn nêu chuẩn dòng bít và bộ giải mã. Tất cả các Layer sử dụng cùng cấu trúc. Mô hình mã hóa có thể được mô tả như định dạng nhiễu nhận thức hay chuyển đổi mã hóa băng phụ theo nhận thức. Bộ mã hóa phân tích thành phần phổ của tín hiệu âm thanh bằng cách tính dải lọc và áp dụng mô hình âm thanh cảm nhận

để xác định mức nhiễu có thể nghe thấy. Trong giai đoạn lượng tử hóa và mã hóa, bộ mã hóa sẽ cố gắng để chỉ rõ số bít dữ liệu cần để đáp ứng cả yêu cầu dòng bít và hiện tượng che lấp. Bộ giải mã đơn giản hơn, nhiệm vụ chính là tổng hợp tín hiệu âm thanh từ các thành phần phổđược mã hóa.

Tất cả các Layer:

• Dùng chung cấu trúc bộ lọc dải- filerband.

• Dùng chung thông tin của phần đầu- header information trong dòng dữ liệu • Đều có khả năng nhạy đối với lỗi bít tương tự nhau, sử dụng cùng cấu trúc

dòng bít với các phần nhạy với lỗi bite (“header”, “bit location”, “scale factor”, “side information”) và các phần ít nhạy hơn (dữ liệu về các thành phần phổ “data of spectral components”).

124

• Hỗ trợ khả năng chèn các thông tin về chương trình vào dòng dữ liệu âm thanh.

• Có thể sử dụng tần số lấy mẫu là 32,44.1 hoặc 48 kHz. • Cho phép hoạt động với các dòng bít giống nhau

Danh sách các chun MPEG:

- MPEG-1(IS 11172,10,92): Mã hóa các ảnh chuyển động và âm thanh kèm theo các phương tiện lưu trữ số với tốc độđến khoảng 1.5 Mbit/s.

• Ba phần đầu được chuẩn hóa từ năm 1992.

• IS-11172-1 (“Hệ thống”) mô tả đồng bộ và ghép kênh của các tín hiệu video và âm thanh

• IS-11172-2 (“Video”) mô tả nén các tín hiệu video, chú trọng vào các tín hiệu progressive scan video, chủ yếu cho các ứng dụng “Video on CD”

• IS-11172-3 (“Âm thanh”) mô tả hệ mã hóa âm thanh chung, với các thành viên tương thích theo kiểu cấu trúc thứ tự (Layer I, II, III)

• IS-11172-4 mô tả các quá trình xác định các thông số của dòng dữ liệu

được mã hóa và quá trình dải mã và cho sự thích ứng với yêu cầu thử nghiệm theo yêu cầu đặt ra trong các phần khác

• DTR-11172-5 báo cáo kỹ thuật về phần mềm ứng dụng của ba phần MPEG -1.

-MPEG-2 (IS 13818, 11-97): đặc điểm chung của mã hóa hình ảnh chuyển động và âm thanh theo, chú trọng đến chuẩn video chung, các phần âm thanh mở rộng.

-MPEG-2 AAC: nén một tín hiệu âm thanh kênh 5.1 vào trong một tốc độ tối thiểu là 320 Kbps. Định dạng 5.1 đề cập đến năm kênh tín hiệu âm thanh cùng với tác dụng của một kênh tăng cường tần số thấp có băng thông giảm.

-MPEG-4 (CD – 14496, 11-97): mã hóa các đối tượng nghe nhìn, chú trọng đến các nội dung linh hoạt và mở rộng- là cơ sở cho các chương trình nghe nhìn tương hỗ.

4.2.2. Doby AC-3

Doby AC-3 (Doby Digital Audio Coding) là chuẩn nén âm thanh được sử dụng trong nhiều bộ phim ở rạp hát, ở nhà, và trong truyền hình chất lượng cao HDTV ở nước Mỹ. AC-3 mã hoá một tín hiệu âm thanh kênh 5.1 vào thành luồng bit 384 Kbps. Giai

đoạn đầu tiên của bộ giải mã hoá AC-3 là lấy 512 mẫu đầu vào và áp dụng biến đổi MDCT. Để tiết kiệm dải động, thì sau đó nó chia các thành phần tần sốđầu ra thành các hàm loga và hàm mũ. Các giá trị này sau đó được lượng tử hoá được kết hợp với các kênh khác và được đóng thành các khung để truyền đi.

Một phần của tài liệu BÀI GIẢNG XỬ LÝ ÂM THANH VÀ HÌNH ẢNH docx (Trang 129 - 130)

Tải bản đầy đủ (PDF)

(151 trang)