MỘT SỐ PHƢƠNG PHÁP MÃ HÓA TIẾNG NÓI TỐC ĐỘ THẤP

Một phần của tài liệu Bài giảng Xử lý tiếng nói: Phần 1 (Trang 89 - 90)

THẤP

Để thực hiện phƣơng pháp mã hóa tiếng nói tốc độ thấp, xu hƣớng tiếp cận của các phƣơng pháp là sự kết hợp giữa các phƣơng pháp mã hóa tham số cùng với một số phƣơng pháp khác.

Nhóm đầu tiên có thể kể đến là một số phƣơng pháp mã hóa lai sử dụng: bộ mã hóa kích thích đa xung - MPE (Multi – Pulse – Excited); bộ mã hóa kích thích xung đều – RPE (Regular – Pulse – Excited); bộ mã hóa dự đoán tuyến tính kích thích mã - CELP (Code - Excited – Linear – Predictive).

Trong phƣơng pháp MPE tín hiệu kích thích u(n) đƣợc xác định bằng một số lƣợng cố định các xung tƣơng ứng đối với mỗi khung tín hiệu. Do vậy thông tin cần truyền đi sẽ bao gồm thông tin về độ lớn và về vị trí của các xung này. Phƣơng pháp này cung cấp chất lƣợng thoại khá tốt tại tốc độ bit khoảng 10 Kbits/s.

Phƣơng pháp RPE tƣơng tự nhƣ MPE tuy nhiên các xung kích thích sử dụng trong phƣơng pháp này đƣợc sắp xếp cách đều nhau một khoảng cố định do đó phía phát chỉ cần truyền đi thông tin về độ lớn của các xung và vị trí của xung đầu tiên. Nhƣ vậy ở cùng một tốc độ bit cho trƣớc thì RPE sẽ có thể sử dụng nhiều xung kích thích hơn so với MPE. Điều này cho phép mã hóa RPE cung cấp chất lƣợng thoại tốt hơn so với phƣơng pháp MPE song nó lại có độ phức tạp lớn hơn. Mặc dù hai phƣơng pháp MPE và RPE có thể cung cấp chất lƣợng thoại tốt tại tốc độ bit vào khoảng 10 Kbits/s hoặc cao hơn tuy nhiên chúng lại không thích hợp cho việc sử dụng ở tốc độ bit giảm thấp hơn nữa.

Phƣơng pháp CELP khác với hai phƣơng pháp MPE và RPE ở chỗ tín hiệu kích thích đƣợc lƣợng tử hóa vector một cách hiệu quả. Các tín hiệu này đƣợc xác định bởi một mã nằm trong bộ mã lƣợng tử vector và một hệ số khuếch đại để điều khiển công suất của tín hiệu. Bộ mã lƣợng tử vector thƣờng đƣợc mã hóa bằng 10 bit và hệ số khuếch đại đƣợc mã hóa bởi 5 bit tín hiệu do đó sẽ làm giảm đáng kể tốc độ bit dùng để truyền thông tin đi. Tuy nhiên việc phải đƣa tất cả các chuỗi tín hiệu kích thích (tƣơng ứng với số lƣợng tất cả các mã trong bộ mã lƣợng tử) qua bộ lọc tổng hợp sẽ khiến cho mã hóa CELP có độ phức tạp rất cao. Những nghiên cứu gần đây nhằm cải tiến cấu trúc của bộ mã hóa lƣợng tử và những tiến bộ trong việc chế tạo các chip vi xử lý đã giúp cho việc thực hiện mã hóa CELP trong thời gian thực. Phƣơng pháp này cung cấp tín hiệu thoại chất lƣợng tốt ở tốc độ 4,8 Kbps và 16 Kbps. Các nghiên cứu trong thời gian gần đây nhằm cải tiến phƣơng pháp mã hóa CELP đã cho phép cung cấp tín hiệu thoại tại tốc độ 2,4 Kbps.

Ngoài ra, dựa trên đặc trƣng của tín hiệu tiếng nói là tổng hòa của hai thành phần với sự thay đổi chậm theo thời gian, ngƣời ta còn sử dụng phƣơng pháp mã hóa dựa trên phân tích các sóng nhỏ (wavelets)

Một phần của tài liệu Bài giảng Xử lý tiếng nói: Phần 1 (Trang 89 - 90)