Tổng quan về mã hoá băng con (SBC)

Một phần của tài liệu Xử lý tín hiệu số và ứng dụng trong âm thanh số (Trang 30 - 33)

Mã hoá băng con (SBC) là kỹ thuật mã hóa nguồn được ứng dụng rộng rãi hiện nay, đặc biệt trong xử lý âm thanh [2]. Nó rất thuận tiện cho việc nén tín hiệu tiếng nói bởi vì đối với tín hiệu tiếng nói thông thường năng lượng của phổ tín hiệu phân bố không đều, năng lượng phổ tiếng nói chủ yếu tập trung ở miền tần số thấp, còn ở miền tần số cao năng lượng của phổ tiếng nói rất nhỏ [4].

SBC là một phương pháp thông thường và rất mạnh cho việc mã hóa tín hiệu âm thanh. SBC có thể mã hóa bất kỳ tín hiệu âm thanh từ bất kỳ nguồn nào [3]. Tai bình thường của con người rất nhạy cảm với dải rộng các tần số. Tuy nhiên, khi rất nhiều năng lượng của tín hiệu có mặt tại một tần số, tai không nghe được năng lượng thấp hơn ở tần số gần đó. Chúng ta nói rằng tần số lớn che khuất các tần số có năng lượng thấp hơn, các tần số lớn hơn được gọi là các mặt nạ che. [3] [4]

Dựa vào phân bổ phổ của tín hiệu âm thanh, khả năng nghe của tai người, kỹ thuật SBC chia toàn bộ giải tần tín hiệu thành nhiều giải con, sau đó mã hóa từng dải con với chiều dài từ mã khác nhau. Phía thu tổng hợp lại tín hiệu của các giải con để khôi phục lại tín hiệu ban đầu. Với kỹ thuật SBC, cho phép nén dữ liệu với tỷ lệ rất cao nhưng chất lượng âm thanh vẫn đảm bảo. [2]

Ý tưởng cơ bản của SBC là để tiết kiệm băng thông tín hiệu bằng cách bỏ đi các thông tin về các tần số bị mặt nạ che mất. Kết quả sẽ không giống như những tín hiệu ban đầu, nhưng nếu tính toán được thực hiện phù hợp, tai người không thể nghe thấy sự khác biệt.

Sơ đồ khối tổng quát của bộ SBC cho trên hình 2.1. Mỗi kênh có một hệ số phân chia tương ứng ni, i = 0, 1, 2, …, M-1 (ni nguyên dương) và tổ hợp [n0, n1, n2, …, nM-1] gọi là tổ hợp phân chia. [4]

Luận Văn Tốt Nghiệp

Hình 2.1. Sơ đồ mã hoá băng con tổng quát SBC M kênh

Thành phần quan trọng trong SBC là tổ hợp phân chia [n0, n1, n2, …, nM-1] lần lượt từ dải tần thấp đến dải tần cao, với M là số dải con [2] và bank lọc nhiều nhịp phân tích và tổng hợp. Trong mỗi bank lọc có một bộ lọc thông thấp LPF, một bộ lọc thông cao HPF và (M-2) bộ lọc thông dải, từ BPF1 đến BPFM-1. Bank lọc phân tích chia dải tần của tín hiệu vào thành các băng con. Bank lọc tổng hợp có nhiệm vụ khôi phục lại dải tần của tín hiệu vào từ các băng con. Trong mỗi kênh có các bộ phân chia và nội suy với các hệ số tương ứng ni.

Quá trình xử lý và truyền dẫn gồm quá trình lượng tử hoá Q và mã hoá bi. Để nén dữ liệu, SBC dùng mã hoá không đều. Tín hiệu sau mã hoá có thể truyền dẫn hoặc ghi lưu trữ. Quá trình khôi phục tín hiệu gốc thực hiện ngược lại với quá trình phân tích tín hiệu. Sau khi giải mã, các tín hiệu băng con qua bank lọc tổng hợp để khôi phục lại dải tần của tín hiệu gốc. [4]

Một vấn đề quan trọng trong SBC là chọn số bit bi (chiều dài từ mã) để mã hoá cho băng con thứ i. Quá trình đó gọi là cấp phát bit. Tín hiệu băng con có mật độ phổ công suất (PSD) trung bình càng lớn thì được mã hoá với số bit càng lớn. Ngược lại, tín hiệu băng con có PSD trung bình nhỏ thì được mã hoá với số bit ít hơn. Do đó, xét trên toàn dải tần, độ dài từ mã trung bình sẽ giảm đi so với mã hoá

Luận Văn Tốt Nghiệp

đều. [4]

Hiện nay có 3 dạng SBC là: SBC đơn phân giải – với các ni đều bằng nhau, SBC đa phân giải tương đối – với ít nhất 2 hệ số phân chia bằng nhau và SBC đa phân giải tuyệt đối - với các hệ số phân chia đều khác nhau. [2]

SBC là thuật toán đã được áp dụng trong mã hoá – nén tín hiệu âm thanh. Để nén tín hiệu âm thanh, thuật toán dùng mô hình tâm lý thính giác để lượng tử hoá thích nghi chỉ những thành phần tín hiệu tai người nghe được. Tai người nhạy cảm với tín hiệu âm thanh có tần số nằm trong khoảng 20Hz đến 20kHz, sự cảm nhận đó là phi tuyến theo tần số. Những thành phần tín hiệu dưới ngưỡng nghe tuyệt đối hoặc bị che bởi tín hiệu lớn hơn thì không được mã hoá. [4]

Tín hiệu âm thanh miền thời gian được lấy trên những khoảng ngắn liên tiếp, đưa vào bank lọc số. Bank lọc số phân chia băng tần tín hiệu thành một số băng con nhất định. Độ rộng và phân bố của các băng con càng gần với các dải tới hạn của tai người càng tốt. Đồng thời, các tín hiệu băng con lần lượt được đưa vào mô hình tâm lý – thính giác. Mô hình tâm lý – thính giác đánh giá phổ của từng băng con, sau đó so sánh với ngưỡng nghe để loại bỏ các thành phần mà tai người không nghe thấy.

Bộ SBC 24 kênh và Quá trình SBC 24 kênh mô tả như sau: [4]

Luận Văn Tốt Nghiệp

SBC 24 kênh chia băng tần của từng đoạn tín hiệu âm thanh ngắn (chẳng hạn 8ms) thành nhiều băng con.

Trong đó: Hình 2.3a, xác định mức công suất trung bình của mỗi băng con, hình 2.3.b, xác định mức che chung cho mỗi băng con và mức công suất đỉnh (gọi tắt là mức đỉnh) được xác định trong hình 2.3.

Hình 2.3. Quá trình mã hóa băng con SBC 24 kênh

Một phần của tài liệu Xử lý tín hiệu số và ứng dụng trong âm thanh số (Trang 30 - 33)

Tải bản đầy đủ (PDF)

(73 trang)