Các định dạng âm thanh có nén mất dữ liệu

Một phần của tài liệu Mã hóa và nén tín hiệu âm thanh ứng dụng trong phát thanh số (Trang 56)

2.2.3.1- WMA (Windows Media Audio)

WMA là chuẩn nén âm thanh được Microsoft phát triển, dùng cho Windows Media Player, chất lượng tương đương MP3 với bit rate thấp hơn 50% (vì vậy dung lượng file giảm hơn 50% ). Đây cũng là công nghệ nén nhạc độc quyền của công nghệ Windows Media. .Định dạng này đầu tiên được phát triển và sử dụng nhằm tránh những vấn đề giấy phép cho các sản phẩm sử dụng định dạng MP3. Tuy nhiên, nhờ những cải tiến liên tục cùng khả năng tương thích với các hệ thống kiểm duyệt quyền quản lý kĩ thuật số (DRM), WMA vẫn rất phổ biến

Ngày nay định dạng WMA đang là đối thủ cạnh tranh với MP3, Real Audio và ACC mặc dù những thiết bị cho định dạng này còn ít. MA Pro, 1 chương trình hỗ trợ nén nhạc thành WMA với những kỹ thuật codec tiên tiến, hỗ trợ nhiều kênh và âm

thanh độ phân giải cao.WMA Lossless, chuyển đổi sang WMA mà không mất dữ liệu (lossy).

2.2.3.2- MP3 (MPEG 1- Layer 3)

MPEG-1 Audio Player 3 (MP3) được học viện Fraunhofer Institute ( Đức ) phát triển vào cuối thập niên 1980. MP3 là định dạng nhạc nén “già” nhất và phổ biến nhất, gần như tất cả máy nghe nhạc đều hỗ trợ định dạng này.

MP3 là một dạng tập tin nén bằng cách loại bỏ một phần dữ liệu từ tập tin gốc (gọi là "nhạc nén"). Mục đích của việc này là để có được một tập tin nhạc có dung lượng nhỏ, có thể lưu trữ với số lượng lớn với chất lượng âm thanh có thể chấp nhận được.

Để có được file nhạc với kích thước nhỏ, MP3 sử dụng thuật toán để mã hoá và tái tạo track nhạc trên CD, loại bỏ một số âm thanh "ít quan trọng" - những âm thanh mà tai người thường không cảm thụ được (ví dụ như âm thanh nằm ngoài dải tần 20- 20.000 Hz). Các định dạng âm thanh nén khác cũng sử dụng cách thức tương tự, chỉ khác nhau về thuật toán (được gọi là "codec").

Một tập tin mp3 có nhiều bitrate khác nhau, bitrate càng cao thì chất lượng càng cao, và dung lượng lớn. Phổ biến là 32-64-128-195 kps, cao nhất của định dạng MP3 là 320 kps (kilobyte per second – số byte dữ liệu xử lý mỗi giây).

MP3PRO (.mp3pro). MP3PRO là thế hệ tiếp theo của MP3,dựa trên công nghệ của Coding Technologies (có kết hợp với Fraunhofer Institute ), có khả năng nén gấp đôi MP3 với chất lượng tương đương.

2.2.3.3- AAC (Advanced Audio Coding)

Advanced Audio Coding (AAC) - (ISO 14496-3) là một định dạng âm thanh đa năng nén kiểu lossy được định nghĩa theo tiêu chuẩn MPEG-2 và được phát triển bởi liên minh Fraunhofer, Dolby, Sony và AT&T. AAC được phát triển nhằm thay thế cho định dạng âm thanh MP3 để tích hợp trong container MP4 (một container của MPEG- 4 tiêu chuẩn hỗ trợ đầy đủ các tính năng phụ)

Dạng định này được phát triển để xóa đi những chỗ yếu của MP3 và nâng cao phương pháp mã hóa đã có. Do vậy những tín hiệu thu của âm thanh hay tiếng động sẽ được nhận biết và mã hóa 1 cách hiệu quả hơn hoặc những vấn đề của Pre-Echo sẽ giảm xuống nhiều.

AAC có thể tích hợp tới 48 kênh âm thanh (sample rate 96KHz) cộng thêm 15 kênh âm thanh tần số thấp (Low Frequency Enhancement-LFE) giới hạn sample rate ở 120 Hz.

- Low Complexity (LC) nghĩa là “ít phức tạp”. Ở mức độ Bitrate trung bình đến cao, được sử dụng trong hệ thống nhạc trực tuyến của Apple và RealNetWorks hoặc được cài sẵn trong phần cứng.

- High Efficiency (HE) nghĩa là “hiệu quả cao”. HE-AAC cũng được hiểu theo cách khác là AACPlus, AAC+ hay AAC SBR(Spectral Band Replication)... HE-AAC được phát triển nhằm sử dụng trong việc mã hóa với bitrate thấp – đặc biệt có tác dụng với tập tin âm thanh đa kênh (multichannel).

- Low Delay (LD) nghĩa là "Thời gian trễ thấp". Được sử dụng cho thời gian trễ nhỏ (khoảng 20ms) ở mức Bitrate trung bình đến mức độ cao. Được sử dụng trong lĩnh vực liên lạc, ví dụ như trong hệ thống Video Họp.

- Main Profile - Profile chính

Scalable Sample Rate (SSR) - dành cho "Streaming" hay "coi trực tuyến". Nó cho phép đưa lại dự liệu liên tục mà không bị vấp bằng cách giảm độ Bitrate, nếu như băng thông đường truyền không cho phép, hoặc độ băng thông cho phép thay đổi giảm mạnh

AAC là dạng định nén âm có tiêu hao về chất lượng, được sử dụng rộng rãi qua các kênh nhạc trực tuyến như iTunes Store, Real Music Store, LiquidAudio được gắn kèm với hệ thống chống sao chép DRM (ví dụ như FairPlay của Apple).

Trên máy iPod của Apple hay máy điện thoại di động của Nokia, Samsung, Sony Ericsson, Siemens có thể chơi những dữ liệu dạng AAC này. AAC đem lại độ nén cao hơn so với những dạng định khác với mức nén có thể tới 1:16. Vì vậy tốc độ 64 kbit/sec thì đã đạt được mức chất lượng khá cao, ở tốc độ 128 kbit/sec thì có thể ngang với chất lượng CD

Trong hệ thống phát sóng audio vệ tinh sử dụng bộ nén audio số AC-3, có thể mã hóa từ kênh 1 đến 5.1 của nguồn tín hiệu audio tại đầu ra bộ mã hóa PCM tạo thành dòng bít nối tiếp, với tốc độ số liệu thay đổi trong phạm vi 32 đến 640kbit/s. Trong hình 2.16, một chương trình audio số kênh 5.1, được tạo thành từ bộ mã hóa PCM điển hình, với tốc độ dòng bít trên 5Mbit/s (6 kênh audio x 48 kHz x 18bit = 5,184Mbit/s). Sau khi qua bộ mã hóa AC-3 thành dòng số liệu có tốc độ 384kbit/s. Các thiết bị truyền dẫn, điều chế dòng bit này thành dạng sóng tại tần số vô tuyến, sau đó được đưa tới bộ phát đáp phát sóng lên vệ tinh. Tổng cộng công suất và dải thông trong đường truyền theo đó được giảm đi bởi hệ số nén 13 trong hệ thống nén AC-3.

Tại bên thu tín hiệu được giải điều chế để thu lại dòng bit 384 Kbit/s, sau đó cho qua bộ giải mã AC-3, ta thu được chương trình audio kênh 5.1 gốc đã phát đi bên phát.

Hình 2.16: Ứng dụng của tiêu chuẩn nén audio AC-3 trong hệ thống phát sóng audio vệ tinh.

Bộ nén audio số được ứng dụng :

Phát sóng quảng bá mặt đất tín hiệu audio.

Phân phối tín hiệu audio qua cáp kim loại hay cáp sợi quang.

Lưu trữ tín hiệu bằng từ tính, quang, chất bán dẫn hay bằng các phương tiện lưu trữ khác

Các hoạt động chi tiết của tiêu chuẩn AC-3

Hệ thống nén audio bao gồm 3 hoạt động sau :

Tín hiệu audio biểu diễn trong miền thời gian được chuyển sang miền tần số 

thu được các hệ số trong miền tần số.

Dựa trên cơ sở chế độ psychoacoustic (chia thành nhiều băng con) trong miền nghe thấy, một bit chỉ định xác định tỷ số SNR thực tế chấp nhận cho mỗi hệ số tần số riêng lẻ.

Các hệ số tần số được lượng tử hóa thô (bởi vì các tạp âm lượng tử sẽ có cùng tần số như tín hiệu audio, và tỷ số S/N sẽ đạt mức thấp được chấp nhận bởi hiện tượng che miền tần số) được định dạng thành dòng cơ sở audio.

Bộ mã hóa AC Trái Giữa Phải Surround trái Hiệu ứng tần thấp Thiết bị truyền dẫn Dòng bit 384Kbit/s Tín hiệu điều chế Anten phát Thiết bị truyền dẫn Bộ mã hóa AC Dòng bit 384Kbit/s Anten phát Trái Giữa Phải Surround trái Hiệu ứng tần thấp Surround phải Tín hiệu điều chế Tín hiệu Audio ra Tín hiệu audio vào

Hình 2.17: Tổng quát hệ thống nén audio theo chuẩn AC-3

Đơn vị cơ bản của bộ mã hóa audio là khung đồng bộ audio, gồm 1536 mẫu audio. Mỗi khung đồng bộ của tín hiệu audio là một thực thể đầy đủ độc lập của bộ mã hóa. Dòng bit cơ sở bao gồm các thông tin cần thiết cho phép bộ giải mã lấy ra và giải lượng tử hóa các hệ số tần số trong dòng bit cơ sở. Kết quả ta khôi phục lại các hệ số tần số. Bộ lọc băng tổng hợp làm việc ngược lại với bộ lọc băng phân tích, nó biến đổi các hệ số tần số khôi phục được thành tín hiệu trong miền thời gian

Các đặc tính của AC-3

Đạt được tốc độ dòng số liệu từ 32 đến 640 kbit/s.

Chu kỳ khung là 32ms cho 48 kênh kHz (384 x 4 x 20,83 = 24ms). Số băng con là 256/128.

Hệ số tỷ lệ là 4,5bit trên một băng.

Phân phối bit theo phương pháp thích ứng trước. Chế độ mono cho mã hóa kênh 5.1

Mở rộng trong các ứng dụng của người sử dụng.

Có khả năng trộn tín hiệu theo yêu cầu của người nghe.

Mức âm lượng ổn định khi chuyển kênh, chuyển giữa các chương trình, các chương trình đa kênh và stereo.

Có khả năng điều khiển dải động âm thanh, bởi vì toàn bộ hệ thống mã hóa có thể dễ dàng cung cấp đạt tới cực trị của dải động âm thanh. Khả năng này cho phép người sử dụng có thể thỏa mãn được nhu cầu của mình. Ví dụ khi nghe âm thanh nổi thì sử dụng toàn bộ dải động, còn khi sử dụng máy thu sách tay thì dải động được giới hạn

2.2.4- Tìm hiểu về các chuẩn âm thanh HD-Audio

Bộ lọc băng phân tích Bit chỉ định Lượng tử hóa Tín hiệu audio nguồn Hệ số tần số Kênh truyền dẫn Bộ lọc băng tổng hợp Giải lượng tử hóa Bit chỉ định Khôi phục tín hiệu audio Khôi phục hệ số tần số

Sự xuất hiện của video HD đã nhìn thấy một bộ chuyển mạch tương ứng với HD-Audio. tiêu chuẩn cho HD-Audio, Dolby và DTS (Digital Theatre System)

Dolby kỹ thuật số (còn gọi là AC-3)

Dolby Digital là một tiêu chuẩn bắt buộc của cả Blu-Ray và DVD và định dạng HD-Audio hỗ trợ rộng rãi nhất. Đó là một định dạng “mất dữ liệu” như vậy là có chất lượng thấp hơn so ban đầu. Âm thanh vòm lên tới 5.1 kênh được hỗ trợ. Các âm thanh Dolby Digital theo dõi có thể được giải mã cho âm thanh stereo trong Media Player hoặc kỹ thuật số bitstreamed trực tiếp (passthrough) đến một bộ tiếp nhận tương thích (thông qua TOSLINK / đồng trục / HDMI) để giải mã.

Dolby Digital Plus (E-AC3)

Dolby Digital Plus là một phiên bản cải tiến của Dolby Digital cung cấp mức giá cao hơn-bit và khả năng cho âm thanh 7.1. Mặc dù chất lượng tốt hơn so với Dolby Digital, đó là một dạng mất dữ liệu. Dolby Digital Plus ít được sử dụng

Dolby TrueHD

Dolby TrueHD là một định dạng nén không giảm chất lượng cho âm thanh giống với bản thu âm nguyên bản. Có thể xử lý 14 kênh riêng biệt cho âm thanh vòm.

DTS (Digital Theatre System)

Là một tiêu chuẩn của Blu-Ray và DVD và được coi để sản xuất chất lượng âm thanh tốt hơn Dolby Digital. Lên tới 5.1 kênh âm thanh vòm được hỗ trợ. DTS là một “mất dữ liệu” tiêu chuẩn nén âm thanh như vậy có chất lượng thấp hơn so với các bản thu âm nguyên bản. Các âm thanh DTS theo dõi có thể được giải mã (downmixed) trong Media Player để âm thanh stereo hoặc kỹ thuật số bitstreamed trực tiếp (passthrough) đến một bộ tiếp nhận tương thích (thông qua TOSLINK / đồng trục / HDMI) để giải mã.

DTS-HD HR (High Resolution / DTS +)

DTS-HD High Resolution là một phiên bản nâng cao của DTS cung cấp mức giá cao hơn-bit và nén tốt hơn. Lên đến 7.1 kênh âm thanh vòm được hỗ trợ. Nó vẫn là một dạng “mất dữ liệu” và không được sử dụng rộng rãi

DTS-HD MA (Master Audio / DTS + +)

DTS-HD Master Audio là một định dạng nén không giảm chất lượng cho âm thanh giống với các bản thu âm nguyên bản. Nó hỗ trợ lên đến 8 kênh âm thanh vòm. Không giống như Dolby TrueHD, DTS-HD MA làm việc trong một cấu hình lõi + phần mở rộng để người dùng không hỗ trợ nó có thể trích xuất âm thanh DTS

Chƣơng 3: MÃ HÓA DẢI CON 5 KÊNH SBC(66644), ỨNG DỤNG TRONG THANH SỐ [1],[3],[7],[5],[8]

3.1 Giới thiệu

Trong chương này ta sẽ nghiên cứu trong bộ mã dải con đa phân giải 5 kênh SCB(66644). Bộ mã hóa dải con này dựa trên tổ hợp phân chia [6, 6, 6, 4, 4]. Nội dung chương 3 bao gồm:

Thiết kế bộ lọc trong SBC(66644) bằng phương pháp dải chuyển tiếp- cửa sổ. So sánh lỗi khôi phục giữa SBC(66644) với SBC(8842) khi cùng số bit trung bình. Ứng dụng mã hóa dải con 5 kênh SBC(66644) trong phát thanh số

Dựa trên mật độ phổ công suất ta thấy năng lượng âm thanh phân bố không đồng đều trên trục tần số[2],. Để tăng hệ số nén ta chia băng tần tín hiệu âm thanh thành nhiều dải con. Do phân bố của mật độ phổ công suất thì phổ của tín hiệu âm thanh tập trung ở miền tần số thấp vì vậy phải tăng độ phân dải ở miền tần số thấp, tức là độ rông dải con hẹp dần về phía tần thấp, luận văn lựa chọn tổ hợp phân chia [6, 6, 6, 4, 4]. Theo phương pháp phân tầng [8]. Ta lựa chọ tổ hợp phân chia [6, 6, 6, 4, 4].

Hình 3.1: Sơ đồ phương pháp phân tầng lựa chọn tổ hợp phân chia [6, 6, 6, 4, 4]

3.2- Mã hóa dải con với tổ hợp hệ số phân chia [66644] 3.2.1- Sơ đồ khối bộ SBC(66644) 3.2.1- Sơ đồ khối bộ SBC(66644)

Sơ đồ khối bộ mã hóa dải con đa phân giải tương đối 5 kênh dùng tổ hợp phân chia [6, 6, 6, 4, 4] mô tả trên hình 3.2. Bank lọc phân tích bao gồm năm bộ lọc. Bộ lọc thông thấp LPF lọc ra dải con 0, chiếm 1/6 dải tần tín hiệu vào vùng tần số thấp nhất. Tiếp theo, bộ lọc thông dải BPF1 lọc ra dải con 1, chiếm 1/6 dải tần tín hiệu vào. Bộ lọc thông dải BPF2 lọc ra dải con 2, chiếm 1/6 dải tần của tín hiệu vào. Bộ lọc thông dải BPF3 lọc ra dải con 3, chiếm 1/4 dải con của tín hiệu vào. Bộ lọc thông cao HPF lọc ra dải con 5, chiếm 1/4 dải tần tín hiệu vào vùng tần số cao nhất. Dải tần tín hiệu của các dải con phân bố như hình 3.2

2 2 3 3 3 2 2 2 x 3=6 2 x 3=6 2 x 3=6 2 x 2=4 2 x 2=4

Hình 3.2: Các dải con ứng với tổ hợp phân chia [6, 6, 6, 4, 4].

Theo hình 3.2, tần số cắt của năm bộ lọc trong bank lọc phân tích và tổng hợp của SBC(6, 6, 6, 4, 4) như sau: + Bộ lọc thông thấp LPF có tần số cắt: FcL=1/6 (3.1) + Bộ lọc thông dải BPF1 có tần số cắt: FcB11=1/6, FcB21=1/3 (3.2) + Bộ lọc thông dải BPF2 có tần số cắt: FcB12=1/3, FcB22=1/2 (3.3) + Bộ lọc thông dải BPF2 có tần số cắt: FcB13=1/2, FcB23=3/4 (3.4) + Bộ lọc thông cao HPF có tần số cắt: FcH=3/4 (3.5)

Hình 3.3: Sơ đồ khối bộ mã hóa dải con đa phân giải tuyệt đối 5 kênh dùng tổ hợp phân chia [6, 6, 6, 4, 4].

Trong hình 3.3 thì bộ LPF, BPF1, BPF2, BPF3, HPF là các bộ lọc số (tần số thấp, thông dải và tần số cao) phân tích và tổng hợp tương ứng với 5 dải con. Bộ 6,

F 1 Biên độ 1/6 1 Dải con 0 Dải con 2 Dải con 1 Dải con 3 1/2 1/3 Dải con 4 0 3/4 LPF BPF1 BPF2 6 y(n) LPF 6 BPF1 6 BPF2 6 x(n) 6 6 Q, b0 Q, b2 Q, b1 y0(n) y1(n) y2(n) v0(n) v1(n) v2(n) v0(n) v1(n) v2(n) p0(n) p1(n) p2(n) q0(n) q1(n) q2(n) BPF3 4 BPF3 4 Q, b3 y3(n) v 3(n) v3(n) p3(n) q3(n) HPF 4 HPF 4 Q, b4 v4(n) v4(n) q4(n) y4(n) p4(n)

6, 6, 4, 4 là các bộ phân chia để lấy ra tần số lấy mẫu của 5 dải con. Bộ 6, 6, 6, 4, 4 là các bộ nội suy để tổng hợp thành băng tần gốc ban đầu.

Trong mã hóa dải con hai vấn đề rất quan trọng đó là cấp phát bít cho từng dải con và tính lỗi khôi phục của toàn hệ thống. Hai vấn đề đó đã được các nhà khoa học nghiên cứu. Cụ thể như sau:

a- Số bít trung bình trên một mẫu

Khác với mã hoá PCM, trong SBC quá trình lượng tử hoá và mã hoá thực hiện theo từng dải con. Mỗi dải con được cấp phát một số bít nhất định tuỳ theo năng lượng tín hiệu trong dải con đó. Trong SBC đa phân giải M kênh, số bít trung bình trên một mẫu tín hiệu bTB (bít/mẫu) được tính theo công thức [3]:

M 1 TBi TB i 0 i b b n (3.6)

Trong đó, ni hệ số phân chia của kênh thứ i, bTBi (bít/mẫu) là số bít trung bình mã hoá cho các mẫu trong dải con thứ i, i=0, 1, …, M-1.

Trong trường hợp SBC đơn phân giải M kênh, số bít trung bình được tính theo

Một phần của tài liệu Mã hóa và nén tín hiệu âm thanh ứng dụng trong phát thanh số (Trang 56)

Tải bản đầy đủ (PDF)

(116 trang)