Nguyên lý mã hóa dải con

Các thông số kỹ thuật của mã hóa dải con

- Số kênh: SBC phân chia dải tín hiệu đầu vào tối thiểu thành 2 dải con. M càng lớn độ phân dải tần số càng cao, cấp phát bit cho dải con càng chính xác, hệ số nén tín hiệu sẽ tăng theo số kênh, do vậy số bộ lọc càng nhiều thì hệ thống càng phức tạp.

- Tổ hợp phân chia: Bộ mã hóa dải con M kênh tương ứng với M hệ số phân chia ni (i=0,1,..M-1). Nếu độ rộng dải tần là ∆f thì độ rộng dải con là ∆f/n0, ∆f/n1, ...∆f/nM-1

- Số bít trung bình trên một mẫu: Quá trình lượng tử hóa và mã hóa thực hiện theo từng dải con. Mỗi dải con được cấp phát một số bit nhất định tùy theo năng lượng tín hiệu trong dải con đó

1 M TB TB i o i b b n (2.1)

Mỗi dải con được cấp phát một số bit nhất định, với σ2

là phương sai của tín hiệu dải con thứ i, số bit trung bình trên một mẫu tín hiệu cấp cho dải con thứ i là bTbi(bit/mẫu) được xác định theo công thức [3]

2 2 1 1 2 0 1 log 2 ( ) i TBi TB M M i i b b (2.2)

Lỗi khôi phục: Méo của tín hiệu ra y(n) so với tín hiệu vào x(n) được gọi là lỗi khôi phục. Lỗi khôi phục được đánh giá qua lỗi trung bình bình phương[3]

( ) ( )

E x n y n (2.3)

Lỗi khôi phục trong mã hóa dải con M kênh [3]

1 1 2 2 0 . .2 TB i M n b i i c M (2.4)

2.1.3.3- Nén âm thanh theo chuẩn MPEG[6],[10],[2] Thuật toán nén âm thanh theo chuẩn MPEG bao gồm 3 bước: Thuật toán nén âm thanh theo chuẩn MPEG bao gồm 3 bước:

Bƣớc 1: tín hiệu audio PCM được chuyển sang miền tần số, toàn bộ dải phổ của nó được chia thành 32 băng con thông qua bộ lọc băng con

Lọc băng con: phổ của tín hiệu được chia thành các băng con có độ rộng dải thông bằng nhau (32 băng con trong mức I và II chuẩn MPEG). Tương tự như quá trình phân tích tần số của HAS (hệ thống thính giác của con người), chia phổ tín hiệu audio thành các băng giới hạn. Độ rộng của các băng tới hạn có thể thay đổi. Dưới 50Hz, độ rộng băng là 100Hz, và nó tăng tới vài kHz khi tần số tăng trên 10kHz. Dưới 500Hz, một băng con có tới vài băng tới hạn

Các bộ lọc băng con có một phần nhỏ gối lên nhau và thông thường sử dụng cho các mẫu kề nhau trong miền thời gian.

Mỗi tín hiệu băng con sau đó được lượng tử hóa đều với các bit chỉ định đặc trưng nhằm bảo vệ dải băng con bằng tỷ số tích cực masking trên tạp âm (MNR). Tỷ số này có tính tích cực khi đường cong các mức chặn ở trên mức tạp âm.

Băng chuyển đổi: thuật toán sửa đổi DCT (MDCT) thường được dụng để biến đổi tín hiệu audio từ miền thời gain sang miền tần số thành một số lượng các băng con (từ 256 đến 1024). Giống như lọc băng con, trong băng chuyển đổi các băng con nằm kề nhau.

Lọc băng ghép: là sự kết hợp giữa bộ lọc băng con và các bộ lọc băng chuyển đổi. Đầu tiên tín hiệu được chia thành 32 băng con bởi bộ lọc băng, sau đó thuật toán MDCT được áp dụng cho 18 mẫu trong từng băng con, tạo ra 576 băng hẹp (41,67 Hz tần số lấy mẫu 48 kHz). Đạt được độ phân tích về thời gian là 3,8 ms.

Bƣớc 2: Với mỗi băng con ta xác định mức biên độ tín hiệu và mức nhiễu bằng mô hình tâm sinh lý nghe. Đây là thành phần chính của bộ mã hó MPEG audio và chức năng của nó là phân tích tín hiệu vào. Mô hình tâm sinh lý nghe xác định tỷ lệ signal- mask cho mỗi băng. Tỷ lệ signal- mask được sử dụng để xác định số bit cho quá trình lượng tử hóa mỗi băng với mục đích giảm tối thiểu khả năng nghe thấy của âm thanh.

Bƣớc 3: Mỗi băng con đó được lượng tử hóa thông qua lượng tử các thành phần nghe thấy trong mỗi băng. Nó đi kèm với mã Huffman để mã hóa các giá trị phổ tín hiệu và cho nén số liệu tốt hơn và định dạng số liệu

Trong quá trình định dạng số liệu, một bộ ghép số liệu được thực hiện nhằm kết hợp các nhóm gồm 12 mẫu số liệu từ đầu ra mỗi bộ lượng tử hóa cùng với hệ số tỷ lệ tương ứng của chúng và thông tin bit chỉ định tạo thành cấu trúc một khung audio trong dòng bit mã hóa. Số liệu phụ có thể được chèn trong dòng bit này.

Bít chỉ định, dung để đánh giá ngưỡng mức chặn và chỉ định các bit trên phần cơ bản của năng lượng phổ tín hiệu audio và chế độ hình tâm sinh lý nghe. Hệ số tỷ lệ của khối được truyền trong dòng số liệu và được sử dụng tại bộ giải mã để tạo lại các giá trị số liệu trong khối.

Ngược lại bên giải mã sẽ giải mã Entropy sau đó tái tạo lại giá trị của băng đã lượng tử và chuyển giá trị các băng này thành tần số tín hiệu audio

Tín hiệu âm thanh số

Hàm lượng tử với bước lượng tử q=1