Mã hóa dạng sóng trong miền tần số

Một phần của tài liệu Bài giảng Xử lý tiếng nói: Phần 1 (Trang 81 - 84)

Việc mã hóa trực tiếp dạng sóng có thể tiếp cận trong miền tần số. Khi đó, thay vì dựa trên dạng sóng tín hiệu, các phƣơng pháp mã hóa thuộc lớp tiếp cận này dựa vào đặc trƣng phổ của tín hiệu. Lợi điểm của phƣơng pháp mã hóa trong miền tần số là có thể khai thác một cách triệt để đặc điểm của tín hiệu trong miền tần số. Thứ nhất, các thành phần tín hiệu trong miền tần số đƣợc giải tƣơng quan, tức là gần nhƣ không có sự tƣơng hỗ. Hơn nữa, với hiện tƣợng che lấp tần số đã xem xét trong chƣơng 1, chúng ta có thể thực hiện mã hóa với lƣợng thông tin ít nhất mà vẫn đảm bảo đƣợc chất lƣợng cảm nhận.

Có rất nhiều cách thực hiện việc mã hóa dạng sóng trong miền tần số, chẳng hạn nhƣ phƣơng pháp mã hóa băng con (Subband coding) sử dụng dãy mạch lọc, phƣơng pháp mã hóa chuyển đổi, …

Phƣơng pháp mã hóa băng con tận dụng đặc điểm cảm nhận tiếng nói của tai ngƣời: tai ngƣời có độ nhạy âm ở các tần số khác nhau là khác nhau, tai ngƣời cảm nhận âm chịu tác động bởi hiện trƣợng che lấ tần số. Từ đó cho phép chỉ mã hóa ở những vùng tần số mà tai ngƣời nhạy hơn, hoặc không cần mã hóa các âm bị che lấp.

Sơ đồ tổng quát của một hệ thống mã hóa băng con cho trong hình 3.15.

Hình 3.15 Sơ đồ tổng quát của phƣơng pháp mã hóa băng con

Tín hiệu thoại đầu vào đƣợc phân chia thành một số dải băng tần nhỏ hơn gọi là các băng con thông qua các bộ lọc số. Sau đó mỗi một băng con đƣợc mã hóa độc lập bằng việc sử dụng các bộ mã hóa dạng sóng nhƣ ADPCM.

Phƣơng pháp mã hóa này thực hiện việc kết hợp loại bỏ dƣ thừa dữ liệu về mặt tần số và thời gian. Do đó, nó có thể đạt đƣợc tốc độ mã hóa cỡ 16kbps nhƣng chất lƣợng tín hiệu có thể so sánh với phƣơng pháp mã hóa PCM 64kbps thông thƣờng.

Ngoài phƣơng pháp mã hóa băng con ở trên, ngƣời ta có thể thực hiện cải tiến để có đƣợc phƣơng thức mã hóa tốt hơn. Cách đơn giản nhất là mã hóa băng con với sự phân bố bít thay đổi thích nghi theo băng tần số tín hiệu (gọi là ASBC – Adaptive Subband coding). Ở đây, các băng con tƣơng ứng với phổ tần số thấp chứa hầu hết năng lƣợng của tín hiệu thoại sẽ đƣợc cấp phát với số bit mã hóa lớn, còn các băng con tƣơng ứng với các phổ tần số cao, chứa ít năng lƣợng tín hiệu sẽ

đƣợc mã hóa với số bit nhỏ hơn. Kết quả là tổng số bit dùng cho mã hóa băng con sẽ ít hơn so với trƣờng hợp mã hóa trên toàn dải phổ của tín hiệu. Tại phía thu, các tín hiệu băng con đƣợc giải mã và kết hợp lại để khôi phục lại tín hiệu thoại ban đầu (G. 722 1988).

Một ƣu điểm khác của mã hóa băng con là nhiễu trong mỗi băng con chỉ phụ thuộc vào mã hóa sử dụng trong băng con đó. Bởi vậy chúng ta có thể cấp phát nhiều bit hơn cho các băng con quan trọng sao cho nhiễu trong những vùng tần số này là nhỏ, trong khi đó ở các băng con khác, chúng ta có thể cho phép có nhiễu mã hóa cao vì nhiễu ở những tần số này có tầm quan trọng thấp hơn. Các mô hình cấp phát bit thích ứng có thể đƣợc sử dụng để khai thác thêm ý tƣởng này. Các bộ mã hóa băng con cho chất lƣợng thoại tốt trong phạm vi tốc độ từ 16 – 32 kbps.

Tuy nhiên, do phải cần đến bộ lọc, một khâu mà việc thực thi không hề đơn giản, để tách tín hiệu thoại trong các băng con nên mã hóa băng con phức tạp hơn bộ mã hóa DPCM thông thƣờng và có thêm độ trễ mã hóa. Tuy nhiên, độ phức tạp và độ trễ là tƣơng đối thấp so với các bộ mã hóa lai ghép mà chúng ta sẽ tìm hiểu trong phần sau của bài giảng.

Trong thực tế, sơ đồ mã hóa băng con đƣợc biết đến khá nhiều đó là sơ đồ MUSICAM đƣợc phát triển bởi hảng Philips. Trong sơ đồ này bộ mã hóa sử dụng một dãy gồm 32 bộ lọc. Sơ đồ này đã trở thành tiêu chuẩn mã hóa âm thanh ISO/IEC, một cơ sở của mã hóa MPEG-1,2 Layer I,II với độ trễ thấp, cỡ khoảng 10.66ms.

Hình 3.16 Sơ đồ mã hóa MUSICAM

Khác với phƣơng pháp mã hóa băng con, phƣơng pháp mã hóa chuyển đổi và chuyển đổi thích nghi xử lý và mã hóa trực tiếp mẫu ở miền tần số. Các mẫu tín hiệu đƣợc phân chia thành các nhóm gồm N mẫu. Các nhóm mẫu này đƣợc chuyển đổi sang miền tần số bằng các phép biến đổi thông thƣờng nhƣ DFT, FFT, ..Kết quả biến đổi là các hệ số sẽ đƣợc lựa chọn, mã hóa để truyền đi. Dễ dàng thực hiện mã hóa thích nghi với phƣơng

pháp mã hóa này. Chúng ta chỉ cần thay đổi số bít cho mã hóa: những thành phần phổ quan trọng sẽ dùng nhiều bít, những thành phần phổ ít quan trọng sẽ dùng ít bít.

Sơ đồ tổng quát của bộ mã hóa chuyển đổi thích nghi đƣợc minh họa trong hình 3.x. Phƣơng pháp mã hóa chuyển đổi thích nghi (ATC) cho phép kết quả mã hóa với tốc độ rất thấp, cỡ 9.6kbps với chất lƣợng khá tốt.

Một phần của tài liệu Bài giảng Xử lý tiếng nói: Phần 1 (Trang 81 - 84)