AAC (Advanced Audio Coding)

Một phần của tài liệu Mã hóa và nén tín hiệu âm thanh ứng dụng trong phát thanh số (Trang 57)

Advanced Audio Coding (AAC) - (ISO 14496-3) là một định dạng âm thanh đa năng nén kiểu lossy được định nghĩa theo tiêu chuẩn MPEG-2 và được phát triển bởi liên minh Fraunhofer, Dolby, Sony và AT&T. AAC được phát triển nhằm thay thế cho định dạng âm thanh MP3 để tích hợp trong container MP4 (một container của MPEG- 4 tiêu chuẩn hỗ trợ đầy đủ các tính năng phụ)

Dạng định này được phát triển để xóa đi những chỗ yếu của MP3 và nâng cao phương pháp mã hóa đã có. Do vậy những tín hiệu thu của âm thanh hay tiếng động sẽ được nhận biết và mã hóa 1 cách hiệu quả hơn hoặc những vấn đề của Pre-Echo sẽ giảm xuống nhiều.

AAC có thể tích hợp tới 48 kênh âm thanh (sample rate 96KHz) cộng thêm 15 kênh âm thanh tần số thấp (Low Frequency Enhancement-LFE) giới hạn sample rate ở 120 Hz.

- Low Complexity (LC) nghĩa là “ít phức tạp”. Ở mức độ Bitrate trung bình đến cao, được sử dụng trong hệ thống nhạc trực tuyến của Apple và RealNetWorks hoặc được cài sẵn trong phần cứng.

- High Efficiency (HE) nghĩa là “hiệu quả cao”. HE-AAC cũng được hiểu theo cách khác là AACPlus, AAC+ hay AAC SBR(Spectral Band Replication)... HE-AAC được phát triển nhằm sử dụng trong việc mã hóa với bitrate thấp – đặc biệt có tác dụng với tập tin âm thanh đa kênh (multichannel).

- Low Delay (LD) nghĩa là "Thời gian trễ thấp". Được sử dụng cho thời gian trễ nhỏ (khoảng 20ms) ở mức Bitrate trung bình đến mức độ cao. Được sử dụng trong lĩnh vực liên lạc, ví dụ như trong hệ thống Video Họp.

- Main Profile - Profile chính

Scalable Sample Rate (SSR) - dành cho "Streaming" hay "coi trực tuyến". Nó cho phép đưa lại dự liệu liên tục mà không bị vấp bằng cách giảm độ Bitrate, nếu như băng thông đường truyền không cho phép, hoặc độ băng thông cho phép thay đổi giảm mạnh

AAC là dạng định nén âm có tiêu hao về chất lượng, được sử dụng rộng rãi qua các kênh nhạc trực tuyến như iTunes Store, Real Music Store, LiquidAudio được gắn kèm với hệ thống chống sao chép DRM (ví dụ như FairPlay của Apple).

Trên máy iPod của Apple hay máy điện thoại di động của Nokia, Samsung, Sony Ericsson, Siemens có thể chơi những dữ liệu dạng AAC này. AAC đem lại độ nén cao hơn so với những dạng định khác với mức nén có thể tới 1:16. Vì vậy tốc độ 64 kbit/sec thì đã đạt được mức chất lượng khá cao, ở tốc độ 128 kbit/sec thì có thể ngang với chất lượng CD

Trong hệ thống phát sóng audio vệ tinh sử dụng bộ nén audio số AC-3, có thể mã hóa từ kênh 1 đến 5.1 của nguồn tín hiệu audio tại đầu ra bộ mã hóa PCM tạo thành dòng bít nối tiếp, với tốc độ số liệu thay đổi trong phạm vi 32 đến 640kbit/s. Trong hình 2.16, một chương trình audio số kênh 5.1, được tạo thành từ bộ mã hóa PCM điển hình, với tốc độ dòng bít trên 5Mbit/s (6 kênh audio x 48 kHz x 18bit = 5,184Mbit/s). Sau khi qua bộ mã hóa AC-3 thành dòng số liệu có tốc độ 384kbit/s. Các thiết bị truyền dẫn, điều chế dòng bit này thành dạng sóng tại tần số vô tuyến, sau đó được đưa tới bộ phát đáp phát sóng lên vệ tinh. Tổng cộng công suất và dải thông trong đường truyền theo đó được giảm đi bởi hệ số nén 13 trong hệ thống nén AC-3.

Tại bên thu tín hiệu được giải điều chế để thu lại dòng bit 384 Kbit/s, sau đó cho qua bộ giải mã AC-3, ta thu được chương trình audio kênh 5.1 gốc đã phát đi bên phát.

Hình 2.16: Ứng dụng của tiêu chuẩn nén audio AC-3 trong hệ thống phát sóng audio vệ tinh.

Bộ nén audio số được ứng dụng :

Phát sóng quảng bá mặt đất tín hiệu audio.

Phân phối tín hiệu audio qua cáp kim loại hay cáp sợi quang.

Lưu trữ tín hiệu bằng từ tính, quang, chất bán dẫn hay bằng các phương tiện lưu trữ khác

Các hoạt động chi tiết của tiêu chuẩn AC-3

Hệ thống nén audio bao gồm 3 hoạt động sau :

Tín hiệu audio biểu diễn trong miền thời gian được chuyển sang miền tần số 

thu được các hệ số trong miền tần số.

Dựa trên cơ sở chế độ psychoacoustic (chia thành nhiều băng con) trong miền nghe thấy, một bit chỉ định xác định tỷ số SNR thực tế chấp nhận cho mỗi hệ số tần số riêng lẻ.

Các hệ số tần số được lượng tử hóa thô (bởi vì các tạp âm lượng tử sẽ có cùng tần số như tín hiệu audio, và tỷ số S/N sẽ đạt mức thấp được chấp nhận bởi hiện tượng che miền tần số) được định dạng thành dòng cơ sở audio.

Bộ mã hóa AC Trái Giữa Phải Surround trái Hiệu ứng tần thấp Thiết bị truyền dẫn Dòng bit 384Kbit/s Tín hiệu điều chế Anten phát Thiết bị truyền dẫn Bộ mã hóa AC Dòng bit 384Kbit/s Anten phát Trái Giữa Phải Surround trái Hiệu ứng tần thấp Surround phải Tín hiệu điều chế Tín hiệu Audio ra Tín hiệu audio vào

Hình 2.17: Tổng quát hệ thống nén audio theo chuẩn AC-3

Đơn vị cơ bản của bộ mã hóa audio là khung đồng bộ audio, gồm 1536 mẫu audio. Mỗi khung đồng bộ của tín hiệu audio là một thực thể đầy đủ độc lập của bộ mã hóa. Dòng bit cơ sở bao gồm các thông tin cần thiết cho phép bộ giải mã lấy ra và giải lượng tử hóa các hệ số tần số trong dòng bit cơ sở. Kết quả ta khôi phục lại các hệ số tần số. Bộ lọc băng tổng hợp làm việc ngược lại với bộ lọc băng phân tích, nó biến đổi các hệ số tần số khôi phục được thành tín hiệu trong miền thời gian

Các đặc tính của AC-3

Đạt được tốc độ dòng số liệu từ 32 đến 640 kbit/s.

Chu kỳ khung là 32ms cho 48 kênh kHz (384 x 4 x 20,83 = 24ms). Số băng con là 256/128.

Hệ số tỷ lệ là 4,5bit trên một băng.

Phân phối bit theo phương pháp thích ứng trước. Chế độ mono cho mã hóa kênh 5.1

Mở rộng trong các ứng dụng của người sử dụng.

Có khả năng trộn tín hiệu theo yêu cầu của người nghe.

Mức âm lượng ổn định khi chuyển kênh, chuyển giữa các chương trình, các chương trình đa kênh và stereo.

Có khả năng điều khiển dải động âm thanh, bởi vì toàn bộ hệ thống mã hóa có thể dễ dàng cung cấp đạt tới cực trị của dải động âm thanh. Khả năng này cho phép người sử dụng có thể thỏa mãn được nhu cầu của mình. Ví dụ khi nghe âm thanh nổi thì sử dụng toàn bộ dải động, còn khi sử dụng máy thu sách tay thì dải động được giới hạn

Một phần của tài liệu Mã hóa và nén tín hiệu âm thanh ứng dụng trong phát thanh số (Trang 57)