Mỹ hạt công cụ khả năng mở rộng

Một phần của tài liệu mã hóa âm thanh tiên tiến mpeg (Trang 31)

1) Tập điện mã hiệu dụng (VCB1 Từ mục 7.2.7, chúng ta biết rằng tập điện mã Huffman # 11 được sử dụng để mã những vân giao thoa quy mô yếu tố có chứa hệ

7.3.6.2. Mỹ hạt công cụ khả năng mở rộng

Các bước lớn có khả năng mở rộng khoảng âm thanh là một con chip có khả năng mở rộng cấu hình nếu chỉ có một vài lớp tăng cường tham gia. Công cụ mã hóa luân phiên cho kết quả với hiệu suất tốt trong âm thanh MPEG-4 được thiết lập trong phiên bản 2 [59]. Những mã mới được gọi là BSAC [75, 98]. Nó được xây dựng dựa trên phiên bản sửa đổi của MPEG-4 AAC với một công cụ lượng tử hóa và chương trình mã hóa tiếng ồn mới.

Tính năng mới trong MPEG-4 AAC:

BSAC có khả năng mở rộng đưa ra các dòng bit trong khoảng 1 kbps mỗi kênh âm thanh. Vì thông tin bên lề cần được bao gồm trong mỗi lớp chọn lọc, việc sử dụng các bước nhỏ thực sự làm giảm các mã hóa tổng thể nếu tỷ lệ bit đầy đủ cần được cung cấp. BSAC xử lý vấn đề này bằng cách đặt lại các lượng tử ban đầu của AAC và mã hóa mô-đun Huffman với các chức năng quét bit-plane và mã hóa số học. Khi làm việc ở tốc độ bit cao (khoảng 48-64 kbps/ch), BSAC FGS đạt được hiệu suất tương đương với một coder AAC không mở rộng với chỉ một sự mất mát biên. Ở tốc độ bit thấp, hiệu suất của BSAC giảm dần.

Hình 7.16 cho thấy sự khác biệt giữa quá trình quét thông thường và quét bit-plane. Theo truyền thống, hệ số được xử lí theo thứ tự, nghĩa là sẽ không có thông tin về hệ số tiếp theo nều như các hệ số trước đó chưa hoàn thành. Trong xử lí quét bit-plane, hệ số của Bit được tách ra để phân chia theo nhóm, nghĩa là tất cả các Bit trọng yếu nhất vào một nhóm và các bit ít quan trong hơn vào một nhóm..v..v.

Theo cách này các hệ số biên độ có thể được tái tạo nhiều hơn và chính xác hơn khi ngày càng nhiều lớp là triểnmã hóa. Nếu chúng ta gọi là phương pháp quét thông thường như quét ngang quá trình, sau đó chúng ta có thể gọi các bit-plane phương pháp quét là quét dọc quá trình. Mỗi đường bit trong quá trình quét ngang, bit được quét theo thứ tự của bit-plane. Trong quá trình quét dọc, mỗi đường quét bit được xử lí theo trình tự. Do đó, mã hóa bit-plane là một phương pháp xử lý tương tự như mã hóa thông thường.

Trong BSAC, một định dạng dấu hiệu / độ lớn được sử dụng cho mỗi hệ số phổ lượng tử. Một chiều dài tối đa là 13 bit có thể được sử dụng để đại diện cho số thực nhị phân của bất kỳ độ lớn (giá trị tuyệt đối). Bắt đầu với các bit quan trọng nhất và sau đó là các bit còn lại. Độ lớn của bit được xử lí trong lớp theo tầm quan trọng trong BSAC. Các bit dấu hiệu của một hệ số xuất hiện ngay sau bit “1”.

Một coder số học dựa trên tình huống được thông qua để mã hóa theo chiều quét dọc bit. Trong tình huống dựa trên coder số học, mã hóa các mô hình khác với bảng xác suất được cung cấp. Theo thống kê của mỗi mảng bit, các mô hình phù hợp nhất mã hóa được chọn để dự phòng một dòng bit tối thiểu có thể được sản xuất.

Các thông tin phụ, các yếu tố quy mô, các lát bit đầu tiên và dữ liệu quang phổ tương ứng với một dải tần số nhất định được bao gồm trong các cơ sở lớp BSAC. Tùy thuộc vào tốc độ bit của lớp cơ sở, lớp tái tạo âm thanh cơ sở có thể có băng thông khác. khi ngày càng nhiều số lượng các lớp nâng caođược nhận bởi bộ giải mã, dữ liệu quang phổ lượng tử lại được xác định bởi nhiều hơn và nhiều hơn nữa. LSB thông tin, đó là một mảng thêm. Trong khi đó, băng thông của âm thanh tái thiết được tăng lên là yếu tố quy mô hơn và bit dữ liệu quang phổ trong dải tần số trở thành có sẵn cho các bộ giải mã còn cao. Bằng hoạt động này bộ giải mã có thể ngừng giải mã gần như tại bất kỳ bit trong một dòng bit .

Một số nhị phân tùy chọn mã hóa được cung cấp trong MPEG-4 âm thanh để cải thiện khả năng đàn hồi lỗi BSAC. Trong lối BSAC đàn hồi, toàn bộ dòng bit được sáng tác bởi một vài phân đoạn và để giảm chi phí, mỗi đoạn chứa dữ liệu từ lớp nâng cao. Các coder số học được đứa vào đầu của mỗi đoạn và chấm dứt vào cuối của nó. Bằng cách này, các lỗi tiềm năng có thể có hạn chế trong phạm vi của một phân khúc và sẽ không lan truyền qua ranh giới phân khúc.

Một phần của tài liệu mã hóa âm thanh tiên tiến mpeg (Trang 31)

Tải bản đầy đủ (DOCX)

(39 trang)
w