1. Trang chủ
  2. » Luận Văn - Báo Cáo

mã hóa âm thanh tiên tiến mpeg

39 668 7

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Cấu trúc

  • 7. Mã hóa âm thanh tiên tiến MPEG.

    • 7.1 Giới thiệu về mã hóa hóa âm thanh tiên tiến.

    • 7.2 MPEG-2 AAC.

      • 7.2.1 Tổng quan về MPEG-2 AAC.

        • 7.2.2.1 Profile:

        • 7.2.1.2 Sơ đồ khối bậc cao.

      • 7.2.2 Mô hình âm lý học.

      • 7.2.3 Điều chỉnh khuếch đại.

      • 7.2.4 Biến đổi.

        • 7.2.4.1 Biến đổi cosin rời rạc.

        • 7.2.4.2 Cửa sổ chức năng:

        • 7.2.4.3 Loại khối và khối chuyển đổi.

      • 7.2.5: Xử lý quang phổ.

        • 7.2.5.1. Định dạng nhiễu theo thời gian.

        • 7.2.5.2. Mã hóa âm thanh stereo.

        • 7.2.5.3. Sự dự báo.

      • 7.2.6. Lượng tử hóa.

      • 7.2.7. Mã hóa entropy.

        • 7.2.7.1. Sự phân chia.

        • 7.2.7.2. Mã hóa Huffman.

        • 7.2.7.3. Nhóm và Xen kẽ.

    • 7.3. Các tính năng mới trong MPEG-4 AAC

      • 7.3.1. Thay thế tiếng ồn nhận thức.

      • 7.3.2. Dự đoán dài hạn (LTP)

      • 7.3.3 TwinVQ

        • 7.3.3.1 Chuẩn hóa hệ số quang phổ

        • 7.3.3.2 trọng số cảm giác VQ

      • 7.3.4 Trễ thấp AAC

      • 7.3.5. Lỗi – công cụ đàn hồi

      • 7.3.6 MPEG-4 khả năng mở rộng các công cụ mã hóa âm thanh

        • 7.3.6.1. Công cụ phân định thô mơ rộng

        • 7.3.6.2. Mỹ hạt công cụ khả năng mở rộng

    • 7.4. MPEG-4 AAC hiệu quả cao.

      • 7.4.1. Bối cảnh của công nghệ SBR.

      • 7.4.2. Nguyên tắc cơ bản của công nghệ SBR.

      • 7.4.3. Thêm các chi tiết kỹ thuật về hiệu suất cao AAC.

Nội dung

MÃ HÓA ÂM THANH TIÊN TIẾN MPEG Mục Lục: Nhóm 4-Lớp D11VT1 Page 1 MÃ HÓA ÂM THANH TIÊN TIẾN MPEG Một số từ viết tắt chuyên ngành được sử dụng: AAC: advanced audio coding. NBC: non-backward compatible. FGS: fine-grain scalable. HE-AAC: high-eficiency AAC. AAC-LC: AAC low-complexity. AAC SSR: AAC sampling rate. TNS: temporal noise shaping. PQF: polyphase quadrature filter. IPQF: inverse polyphase quadrature filter. MDCT: modified discrete osine transform. IMDCT: inverse modified discrete osine transform. TDAC: time-domain aliasing cancellation. KBD: Kaiser-Besel-derived window. IS: intensity stereo. M/S: mid/side. LPC: linear predictive coding. LTP: long-term predicton. PNS: perceptual noise substitute. LD: low delay. MSB: Most significant bits. Bit quan trọng nhất LSB: Least significant bits. Bit ít quan trọng nhất SBA: Segment binary arithmetic. Số học nhị phân phân đoạn BSCA: SBR: spectral band replication: nhân rộng băng tần MP3: MPEG Layer-3. QMF: Quadratic mirror filterbank: ngân hàng bộ lọc gương bậc hai. Nhóm 4-Lớp D11VT1 Page 2 MÃ HÓA ÂM THANH TIÊN TIẾN MPEG 7. Mã hóa âm thanh tiên tiến MPEG. Mã hóa âm thanh tiên tiến MPEG (AAC) và kế thừa của nó hiện nay là hầu hết các thành viên ưu tú trong gia đình MPEG với chất lượng cao, đa kênh,kĩ thuật nén âm thanh số. MPEG AAC cung cấp các lựa chọn khác nhau của chế độ hoạt động và cấu hình, và do đó hỗ trợ một loạt các ứng dụng từ âm thanh internet tốc độ bit thấp để đa kênh các dịch vụ quảng bá. Trong phần này chúng tôi sẽ giới thiệu các tính năng chính của hệ thống mã hóa đa kênh AAC. 7.1 Giới thiệu về mã hóa hóa âm thanh tiên tiến. Là một phần của tiêu chuẩn MPEG-2 (ISO/IEC 13818-7), MPEG-2 AAC đã được hoàn thành vào năm 1997. Ban đầu MPEG-2 AAC được gọi là mã hóa MPEG-2 khả năng tương thích không theo hướng nghịch (NBC). Chuẩn mã hóa của MPEG-2 NBC bắt đầu sau khi hoàn tất của chuẩn MPEG-2 đa kênh âm thanh năm 1994. Thời gian đó, các nhóm âm thanh MPEG mong muốn phát triển một tiêu chuẩn mã hóa đa kênh mới để cho phép chất lượng cao hơn tiêu chuẩn đa kênh âm thanh MPEG-2 đầu tiên, đó là tương thích ngược với MPEG-1. Mục tiêu phát triển của thuật toán mã hóa âm thanh đa kênh là đạt được chất lượng không thể phân biệt theo định nghĩa EBU ở tốc độ bit 384kbps hoặc thấp hơn cho 5 kênh tín hiệu băng thông full mà không có bất kỳ khả năng tương thích ngược ràng buộc. MPEG-4 AAC cũng được gọi là mã âm thanh chung MPEG-4, thêm một số tiện ích mới trên nền tảng của MPEG-2 AAC. Một số tiện ích mới mượn ý tưởng từ mã hóa âm thanh (speech coding) để giảm tốc độ bit mã hóa trong khi vẫn đảm bảo được chất lượng âm thanh tương tự. Những sửa đổi khác theo mã hóa khối MPEG-2 AAC để cho phép một vài tính năng mong muốn và cung cấp thêm các chức năng. Với một tỷ lệ bit điển hình của 64 kbps cho mỗi kênh, MPEG-4 AAC có thể đạt được mã hóa gần như trong suốt cho chất lượng âm thanh đầu vào CD ban đầu. ngay cả ở bit rất thấp tốc độ xuống đến 16kbps, MPEG-4 AAC vẫn thể hiện được đặc trưng tuyệt vời. Một tiêu chuẩn mã hóa âm thanh mở rộng cũng được bao gồm trong âm thanh MPEG-4. MPEG-4 phiên bản 1 cung cấp bước lớn khả năng mở rộng, cái mà được tích hợp nhiều trong các chương trình mã hóa âm thanh MPEG-4 hiện tại để cung cấp một khả năng mở rộng dòng bit âm thanh. AAC được thông qua như là một phần của bước lớn khả năng mở rộng kiến trúc mã hóa âm thanh để cung cấp lớp tăng cường dòng bit. Một khả năng mở rộng frame hạt nhỏ (FGS) âm thanh được phát triển trong âm thanh MPEG-4 phiên bản 2. Nhóm 4-Lớp D11VT1 Page 3 MÃ HÓA ÂM THANH TIÊN TIẾN MPEG Hình 7.1: 3 profile MPEG-2 ACC. Phần mềm nén audio FGS mới được gọi là mã hóa số học các bit (BSAC). Nó thay thế lượng tử của AAC và mã hóa entropy để cho phép các bộ giải mã tái tạo lại nhiều tín hiệu âm thanh hơn và chính xác hơn. MPEG-4 hiệu quả cao AAC (HE AAC) là thế hệ tiếp theo của chuẩn AAC, trong đó sử dụng AAC là bộ mã hóa cốt lõi và mở rộng các thành phần tần số cao hơn và thông tin âm thanh stereo với sự giúp đỡ của một số các thông số giới hạn. Từ thuật toán này là một phần mở rộng tham số đến AAC, nó tiếp tục giảm tốc độ bit và có khả năng tái tạo chất lượng âm thanh CD stereo tại 24kbps, đó là nhỏ hơn so với file gốc 64 lần. Note: âm thanh stereo là âm thanh từ nhiều nguồn âm và được phân bổ từ phải sang trái và ngược lại. Trong phần này, công cụ âm thanh trong tất cả các tiêu chuẩn AAC-liên kết bao gồm MPEG-2 AAC, MPEG-4 AAC, MPEG-4 BSAC, và MPEG-4 HEAAC sẽ được thảo luận chi tiết. 7.2 MPEG-2 AAC. 7.2.1 Tổng quan về MPEG-2 AAC. 7.2.2.1 Profile: MPEG-2 AAC cung cấp 3 profile có thể được lựa chọn bởi người dùng cuối theo độ phức tạp và chất lượng yêu cầu mong muốn của họ. Ba profiles này là: profile chính,profile độ phức tạp thấp và profile tốc độ lấy mẫu mở rộng và quan hệ của chúng được biểu diễn như hình 7.1. (1) Profile chính: AAC Profile chính, viết tắt là AAC chính, cung cấp chất lượng âm thanh tốt nhất tại bất kì tốc độ bit nào trong cả 3 profile. Tất cả các công cụ Nhóm 4-Lớp D11VT1 Page 4 MÃ HÓA ÂM THANH TIÊN TIẾN MPEG mã hóa được kích hoạt trong AAC chính (ngoại trừ điều khiển). Do vậy, cả 2 yêu cầu bộ nhớ và tính toán phức tạp của profile này là cao hơn so với hai profile khác. Tuy nhiên, các bộ giải mã AAC profile chính có nhiều ưu việt và có khả năng để giải mã một dòng bit được tạo ra từ một bộ mã hóa AAC độ phức tạp thấp. (2) Profile độ phức tạp thấp: AAC profile độ phức tạp thấp, viết tắt là AAC LC, không sử dụng điều khiển khuếch đại hay các công cụ dự đoán. Hơn nữa, bộ lọc định dạng nhiễu theo thời gian (TNS) có một thứ tự thấp hơn so với các bộ mã hóa-giải mã AAC chính. Với profile này, giải mã AAC chiếm bộ nhớ thấp hơn đáng kể và xử lý các yêu cầu tối ưu. Tuy nhiên, sự suy giảm của tái tạo chất lượng âm thanh không rõ ràng. Trên thực tế, trong tất cả 3 profile, AAC LC được áp dụng phổ biến nhất trong ngành công nghiệp. Được sử dụng trong hệ thống mua bán nhạc trực tuyến, hoặc được cài sẵn trong phần cứng. (3) Profile khả năng mở rộng tốc độ lấy mẫu: Profile khả năng mở rộng tốc độ lấy mẫu AAC viết tắt là AAC SSR, có khả năng cung cấp một tín hiệu tần số mở rộng. Điều chỉnh khuếch đại được kích hoạt khi bộ mã hóa AAC hoạt động trong profile này. Ngoại trừ các mô-đun điều chỉnh khuếch đại, các công cụ âm thanh khác đang hoạt động tương tự profile AAC LC. Do đó, yêu cầu bộ nhớ và mức độ tính toán phức tạp của bộ mã hóa AAC SSR cũng thấp hơn đáng kể so với bộ mã hóa AAC chính. Dành cho "Streaming" hay "coi trực tuyến". Nó cho phép đưa lại dự liệu liên tục mà không bị vấp bằng cách giảm độ Bitrate, nếu như băng thông đường truyền không cho phép, hoặc độ băng thông cho phép bỗng nhiên giảm mạnh. Hình 7.2: Sơ đồ khối của bộ mã hóa AAC. Nhóm 4-Lớp D11VT1 Page 5 MÃ HÓA ÂM THANH TIÊN TIẾN MPEG 7.2.1.2 Sơ đồ khối bậc cao. Hình 7.2 và 7.3 là sơ đồ khối bậc cao tương ứng của mã hóa và giải mã AAC. Bên mã hóa, tín hiệu vào đầu tiên được xử lý bởi bộ tiền xử lý nếu nó là cần thiết. Tùy thuộc vào yêu cầu tốc độ bit và tần số lấy mẫu của tín hiệu vào,bộ tiền xử lý lấy mẫu tín hiệu ban đầu, do đó có thể đạt được chất lượng tốt hơn với dự kiến bit hạn chế. Nếu tín hiệu vào mà có vùng biên độ lệch, nó cũng sẽ được xử lý trong mô-đun này. Nếu mã hóa được thực hiện trong profile SSR, tín hiệu sau đó sẽ được bộ điều chỉnh khuếch đại xử lý. Nếu không, chúng sẽ đi trực tiếp đến khối chuyển đổi để ánh xạ tín hiệu miền thời gian sang miền tần số và có được dữ liệu quang phổ. Một chuỗi xử lý quang phổ được theo sau để loại bỏ thông tin không quan trọng hay không liên quan. Cuối cùng dữ liệu phổ đã xử lý sẽ được lượng tử hóa và mã hóa không nhiễu. Xuyên suốt toàn bộ quá trình mã hóa, tín hiệu đầu ra từ mô hình như loại khối và giới hạn che chắn, được sử dụng như dòng ghi chú cho mỗi khối mã hóa. Hình 7.3: Sơ đồ khối giải mã AAC Dữ liệu phổ nén cũng như thông tin tạo ra bên trong khối mã hóa đều được ghép trong luồng bit. Khi bộ giải mã nhận được một luồng bit nén, đầu tiên đầu tiên tách nó ra thành nhiều luồng. Dữ liệu quang phổ nén sau đó được giải mã bởi bộ giải mã entropy và lượng tử nghịch đảo. Thông tin lấy ra từ luồng bit sẽ được dùng để điều khiển xử lý quang phổ ngược, biến đổi ngược và điều chỉnh bộ khuếch đại ngược nếu hoạt động. Nếu âm thanh đầu vào ban đầu đến các bộ mã hóa có biên độ lệch, sau đó các mô-đun xử lý phục hồi tái tạo tín hiệu về độ rộng biên độ ban đầu của nó. Nhóm 4-Lớp D11VT1 Page 6 MÃ HÓA ÂM THANH TIÊN TIẾN MPEG 7.2.2 Mô hình âm lý học. Mô hình âm lý học đóng vai trò quan trọng trong mã hóa âm thanh cảm nhận. Đầu ra của mô hình này điều khiển hầu hết mọi khối mã hóa lớn trong mã hóa AAC. Nhiệm vụ chính của mô hình âm lý học là tính toán ngưỡng che. Mọi lượng tử hóa tiếng ồn thêm trong khối lượng tử sau này không thể cảm nhận nếu năng lượng của nó nhỏ hơn ngưỡng nghe. Lý tưởng nhất, nếu tất cả lỗi mã hóa được che bằng tín hiệu riêng của mình, dẫn đến âm thanh tái tạo về nhận thức không thể phân biệt từ đầu vào ban đầu. Tuy nhiên, nếu số lượng bit có sẵn không cho phép tất cả dữ liệu quang phổ đáp ứng ngưỡng che, mô hình âm lý học (psychoacoustic) cần gợi ý lượng tử hóa để tiếng ồn tối thiểu cảm nhận được sẽ bổ sung bằng cách mở ra các yêu cầu âm lý học. 7.2.3 Điều chỉnh khuếch đại. Khối điều chỉnh khuếch đại chỉ được kích hoạt trong SSR profile, gồm bộ lọc nhiều pha cầu phương (PQF), bộ cảm biến khuếch đại, bộ điều chỉnh khuếch đại. Các dàn bộ lọc tách tín hiệu đầu vào thành bốn băng tần bằng nhau. Ví dụ nếu âm thanh đầu vào có tốc độ lấy mẫu là 48kHz, sau đó đầu ra bốn băng tần từ bộ lọc PQF chứa tín hiệu 0-6kHz, 6-12kHz, 12-18kHz, 18-24kHz. Do đó, khả năng mở rộng băng thông có thể đạt được bằng cách loại bỏ một hoặc nhiều dải tín hiệu. Các tính năng khác biệt của cấu trúc này cho phép các bộ giải mã có thể tái tạo lại một băng thông tín hiệu với độ tính toán phức tạp thấp hơn. Bộ cảm biến khuếch đại tập hợp thông tin đầu ra của bộ lọc PQF và điều chỉnh khuếch đại để biết được cái nào trong 4 băng cần điều chỉnh biên độ và nó nên làm thế nào để thực hiện được. Các bộ điều khiển khuếch đại được đảo ngược trong bộ giải mã bao gồm bộ cân bằng và bộ lọc đa pha cầu phương ngược (IPQF). Bốn bộ cân bằng tương ứng với bốn băng tần bằng nhau được yêu cầu nếu tín hiệu băng thông đầy đủ cần được tái tạo. Mỗi bộ cân bằng khuếch đại phục hồi dữ liệu kiểm soát khuếch đại, sau đó khôi phục các trạng thái tín hiệu ban đầu. Kết quả đầu ra bộ cân bằng khuếch đại được kêt hợp và tổng hợp bởi IPQF để tạo ra dữ liệu PCM cuối cùng. 7.2.4 Biến đổi. 7.2.4.1 Biến đổi cosin rời rạc. Việc chuyển đổi giữa tín hiệu trong miền thời gian là đầu vào của các bộ mã hóa hay đầu ra của các bộ giải mã và các đại diện tần số tương ứng của chúng là một thành phần cơ bản của mã hóa âm thanh MPEG AAC. Chuyển đổi này cũng được gọi là chuyển đổi thời gian sang tần số, được thực hiện bởi một chuyển đổi cosin rời rạc biến đổi chuyển tiếp (MDCT) trong bộ mã hóa và một chuyển đổi cosin rời rạc biến đổi ngược (IMDCT) trong bộ giải mã. Trong quá trình mã hóa, mỗi khối mẫu thời gian hoặc 2048 mẫu cho các cửa sổ có độ dài bình thường hoặc 256 mẫu cho cửa sổ ngắn, bao gồm 50% tín hiệu cũ từ các khung trước và 50% tín hiệu mới từ khung hiện tại. Nhóm 4-Lớp D11VT1 Page 7 MÃ HÓA ÂM THANH TIÊN TIẾN MPEG Nói cách khác, mỗi khối của mẫu đầu vào được che bởi 50% khối ngay trước và khối sau đó. Từ biến đổi chức năng chương trình MDCT (7.1), chúng ta thấy rằng Xik là số lẻ đối xứng, nghĩa là hệ số thứ i có biên độ giống như hệ số thứ (N-i-1). Do đó sự chồng chéo sẽ không làm tăng tốc độ dữ liệu sau khi MDCT được thực hiện. Phía bên giải mã, tín hiệu quang phổ từ 2 frame liên tiếp cũng được che bởi 50% trước khi chúng được thêm vào để tái tạo lại các dữ liệu trong miền thời gian. Cả MDCT và IMDCT đều áp dụng một kỹ thuật gọi là hủy bỏ sai số lấy mẫu (TDAC) [103]. Thông tin thêm về TDAC và cửa sổ- che phủ- thêm vào có thể được tìm thấy trong [103]. Biểu thức phân tích cho MDCT được cho bởi: Biểu thức phân tích cho IMDCT là: Với: n= chỉ số mẫu. N= độ dài khối biến đổi. (7.3) I= chỉ số khối. 7.2.4.2 Cửa sổ chức năng: Trước khi MDCT được thực hiện, mỗi khối của mẫu đầu tiên được nhân với một cửa sổ chức năng thích hợp. Nói một cách khác, MDCT được áp dụng trong điều chế tín hiệu để tạo ra các dữ liệu quang phổ miền tần số. Tương tự như vậy, một cửa sổ chức năng được áp dụng trên các tín hiệu quang phổ trước khi chúng qua biến đổi MDCT ngược. Cửa sổ thực hiện trước MDCT được gọi là cửa sổ phân tích và cửa sổ thực hiện trước khi IMDCT được gọi là cửa sổ tổng hợp. Để hồi phục tốt, cửa sổ phân tích và cửa sổ tổng hợp phải đáp ứng được các điều kiện sau đây: Nhóm 4-Lớp D11VT1 Page 8 MÃ HÓA ÂM THANH TIÊN TIẾN MPEG Trong đó N là độ dài cửa sổ và M là số lượng mẫu được che. Nếu cửa sổ tống hợp bằng cửa sổ phân tích, thì các điều kiện trên có thể được đơn giản hóa để: Hai cửa sổ chức năng, cửa sổ sin và cửa sổ Kaiser-Bessel-derived (KBD), được cung cấp trong mã hóa AAC. So sánh với cửa sổ sin, các cửa sổ KBD có một tài nguyên tần số chọn lọc tốt hơn nhưng búp sóng chính rộng ra. Tùy thuộc vào đặc tính của tín hiệu đầu vào, bộ mã hóa có thể chọn hình dạng tối ưu của cửa sổ. 7.2.4.3 Loại khối và khối chuyển đổi. Cho tín hiệu cố định, các khối dài của phổ 2048 đã được xử lý tại một thời điểm. Tuy nhiên, với tín hiệu nhất thời, điều này sẽ tạo ra nhiễu đáng kể sau khi lượng tử hóa. Bởi vì lượng tử hóa phổ được thực hiện trong miền tần số, nhiễu lượng tử sẽ kéo dài hơn một vài mili giây khi phổ tín hiệu được chuyển trở lại miền thời gian. Đối với tín hiệu tức thời, lỗi lan truyền có thể không được che phủ bởi các tín hiệu gần đó và trình bày một giá trị ảo có thể cảm nhận được. Hiện tượng này gọi là hiệu ứng preecho, tín hiệu tức thời nên được mã hóa với các khối chuyển đổi ngắn hơn. Tuy nhiên, kết quả chuyển đổi độ dài ngắn không hiệu quả khi mã hóa cho tín hiệu cố định. Vì vậy để đạt được hiệu suất tốt cho tín hiệu thường và tín hiệu tức thời, một giải pháp tốt hơn là xác định chiều dài của sổ cần phải đạt được. AAC đã khắc phục vấn đề này bằng cách áp dụng hai chiều dài khối và cho phép khối chuyển đổi khi các loại tín hiệu khác nhau được thực hiện. Đối với tín hiệu có trạng thái ổn định, khối dài được sử dụng để nâng cao hiệu quả mã hóa. Khi tín hiệu tức thời xuất hiện, khối ngắn (khối có chiều dài =1/8 khối dài) sẽ được áp dụng để giảm thiểu ảnh hưởng preecho. Chuyển đổi giữa hai loại khối khác nhau cần được xử lý cẩn thận để không có sai số xuất hiện nếu không có lượng tử hóa tham gia. Hình 7.4 biểu diễn 4 loại cửa sổ khác nhau sử dụng trong AAC, (a) là cửa sổ dài, (b) là cửa sổ ngắn, (c) là cửa sổ bắt đầu dài, (d) cửa sổ kết thúc dài. Các tiêu chí để thiết kế cửa sổ chuyển tiếp đó là nửa đầu cửa sổ chuyển đổi nên luôn là giống loại của sổ trước đó. Do đó, nếu 1 cửa sổ ngắn yêu cầu sau một vài cửa sổ dài, cửa sổ cuối cùng trước khi cửa sổ ngắn bất đầu nên có một cửa sổ bắt đầu dài. Tương tự như vậy, khi cửa sổ ngắn được theo sau các cửa sổ dài, cửa sổ đầu tiên sau cửa sổ ngắn nên là cửa sổ kết thúc dài. Thiết bị chuyển cửa sổ dài sang ngắn và ngắn sang dài được minh họa trong hình 7.5. Nhóm 4-Lớp D11VT1 Page 9 MÃ HÓA ÂM THANH TIÊN TIẾN MPEG Hình 7.4: Các cửa sổ khác nhau trong AAC. (a) Cửa sổ dài. (b) Cửa sổ ngắn (c) Cửa sổ bắt đầu dài. (d) Cửa sổ kết thúc dài. Hình 7.5: chuyển đổi cửa sổ trong AAC (a) Chuyển đổi cửa sổ dài sang ngắn. (b) Chuyển đổi cửa sổ ngắn sang dài. Nhóm 4-Lớp D11VT1 Page 10 [...]... tử hóa và mã hóa không tạp âm, được thực hiện trên tín hiệu trong kênh điều chỉnh độc lập Cuối cùng bit được ghép để tạo thành dòng bit Hai kỹ thuật được bao gồm trong mã hóa stereo Một được gọi là mã hóa âm thanh mid/side (M/S) (cũng được hiểu là mã hóa tổng/khác biệt), cái khác gọi là mã hóa cường độ âm thanh stereo Tương tự như mã hóa TNS, cả 2 kỹ thuật mã hóa âm thanh Nhóm 4-Lớp D11VT1 Page 12 MÃ... thanh Nhóm 4-Lớp D11VT1 Page 12 MÃ HÓA ÂM THANH TIÊN TIẾN MPEG -stereo có thể được lựa chọn áp dụng trên vùng tần số khác nhau Giới thiệu ngắn gọn về mã hóa âm thanh stereo M/S và mã hóa cường độ âm thanh stereo sẽ được liệt kê dưới đây Hình 7.7: Minh họa bộ mã hóa âm thanh stereo đa kênh Mã hóa âm thanh stereo M/S: trong MPEG- 2 AAC, nó được áp dụng cho... suất mã hóa tổng thể, đặc biệt với tác nhân tiếng nói 7.2.5.2 Mã hóa âm thanh stereo Mã hóa âm thanh stereo đã được chứng minh là có giá trị để nén tín hiệu âm thanh chất lượng cao (hoặc đa kênh) ở tốc độ bit thấp Dựa trên lý thuyết âm lý học, công cụ mã hóa âm thanh được phát triển để làm giảm đáng kể tốc độ bit cho các tín hiệu âm thanh đa kênh thành tốc độ thấp hơn nhiều so với yêu cầu để mã hóa. .. năng mới trong MPEG- 4 AAC MPEG- 4 AAC có những công cụ riêng mới để nâng cao hiệu quả mã hóa Hình 7.8 (a) và 7.8 (b) minh họa khối xử lý quang phổ cho bộ mã hóa và giải mã hóa MPEG- 4 AAC Nhóm 4-Lớp D11VT1 Page 20 MÃ HÓA ÂM THANH TIÊN TIẾN MPEG Hình 7.9 Lượng tử hóa và mã hóa dữ liệu ngẫu nhiên mô-đun của MPEG- 4 AAC [58] Hai khối mã hóa mới, dự báo... cho các tín hiệu hạn chế băng Cả nhóm và xen kẽ tăng cường hiệu quả mã hóa cho các tín hiệu khối ngắn Nhóm 4-Lớp D11VT1 Page 18 MÃ HÓA ÂM THANH TIÊN TIẾN MPEG Hình 7.8: Khối xử lý quang phổ của MPEG- 4 AAC (a) Mã hóa (b) Giải mã [58] Nhóm 4-Lớp D11VT1 Page 19 MÃ HÓA ÂM THANH TIÊN TIẾN MPEG -Trong BSAC,... độ Nhóm 4-Lớp D11VT1 Page 27 MÃ HÓA ÂM THANH TIÊN TIẾN MPEG -này dựa trên các đoạn bit mã hóa (BSAC) đưa vào Đây là lần đầu tiên fine-grain được đưa vào MPEG- 4 audio.Trong các chuẩn MPEG trước đó nhiều mở rộng chỉ dành cho mã hóa video Khả năng mở rộng mã hóa âm thanh là thao tác thực hiện bằng các khái niệm về phân cấp mã nhúng có nghĩa là dòng bit... làm tăng chất lượng âm thanh lên.Tương tự như vậy , các bộ mã hóa # 3 ( tăng cường lớp mã hóa # 2) mã tín hiệu dư lượng kết quả từ bộ mã hóa # 1 và # 2 dòng bit phụ bổ sung này cho phép triển mã hóa để tạo ra một bản sao tốt từ âm thanh gốc Trong thực tế, nhiều bộ mã hóa có thể được bao gồm trong chương trình nhúng mã hóa phân cấp này để tạo ra các lớp nâng cao hơn và tốt hơn mã hóa khả năng mở Nhóm... được khắc phục ở MPEG- 4 audio phiên bản 2 7.3.6.1 Công cụ phân định thô mơ rộng Các kiến trúc chung của một MPEG- 4 hai lớp lớn bước âm thanh mở rộng mã hóa và giải mã được minh họa trong hình 7.14 và 7.15 , tương ứng Cấu hình của bộ mã hóa này không không chứa bất kì AAC cơ sở lớp mã hóa và lớp nâng cao dựa trên các môđun mã hóa AAC Một mã hóa âm thanh biên độ hẹp, chẳng hạn như mã MPEG- 4 CELP , có... qua mà không có T / F lớp mã cơ sơ Mã này còn gọi là mã hóa lõi và hoạt động ở tốc độ lấy mẫu thấp sau đó tiếp tục mã hóa ở lớp nâng cao.Mô tả chi tiết hơn về các công việc của mã hóa và giải mã khả năng mở rộng được liệt kê dưới đây (i) Mã hóa Nhóm 4-Lớp D11VT1 Page 29 MÃ HÓA ÂM THANH TIÊN TIẾN MPEG -1 Tín hiệu đầu vào đầu tiên được loại bỏ bớt một... cụ mã hóa luân phiên cho kết quả với hiệu suất tốt trong âm thanh MPEG- 4 được thiết lập trong phiên bản 2 [59] Những mã mới được gọi là BSAC [75, 98] Nó được xây dựng dựa trên phiên bản sửa đổi của MPEG- 4 AAC với một công cụ lượng tử hóa và chương trình mã hóa tiếng ồn mới Tính năng mới trong MPEG- 4 AAC: Hình 7.16: Quá trình quét bit thông thường Nhóm 4-Lớp D11VT1 Page 31 MÃ HÓA ÂM THANH TIÊN TIẾN MPEG . MPEG Layer-3. QMF: Quadratic mirror filterbank: ngân hàng bộ lọc gương bậc hai. Nhóm 4-Lớp D11VT1 Page 2 MÃ HÓA ÂM THANH TIÊN TIẾN MPEG 7. Mã hóa âm thanh tiên tiến MPEG. Mã hóa âm thanh tiên. hiểu là mã hóa tổng/khác biệt), cái khác gọi là mã hóa cường độ âm thanh stereo. Tương tự như mã hóa TNS, cả 2 kỹ thuật mã hóa âm thanh Nhóm 4-Lớp D11VT1 Page 12 MÃ HÓA ÂM THANH TIÊN TIẾN MPEG . gọn về mã hóa âm thanh stereo M/S và mã hóa cường độ âm thanh stereo sẽ được liệt kê dưới đây. Hình 7.7: Minh họa bộ mã hóa âm thanh stereo đa kênh. Mã hóa âm thanh stereo M/S: trong MPEG- 2 AAC,

Ngày đăng: 28/01/2015, 16:23

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w