PHƢƠNG PHÁP MÃ HÓA LAI GHÉP

Một phần của tài liệu Bài giảng Xử lý tiếng nói: Phần 1 (Trang 87 - 89)

Mã hóa lai cố gắng lấp khoảng cách ranh giới giữa mã hóa dạng sóng và mã hóa nguồn: đạt đƣợc tốc độ mã hóa thấp; tăng đƣợc chất lƣợng tín hiệu tiếng nói mã hóa. Các phƣơng pháp mã hóa thuộc nhóm này thƣờng đƣợc áp dụng trong các hệ thống thông tin di động.

Mặc dù có nhiều cách tiếp cận thực hiện mã hóa lai, nhƣng thành công và thƣờng đƣợc sử dụng nhiều nhất là các bộ mã hóa kết hợp trong miền thời gian “thực hiện các phép phân tích thông qua việc tổng hợp” - AbS (Analysic - by - Synthesis). Những bộ mã hóa này sử dụng mô hình bộ lọc dự đoán tuyến tính cho cơ quan phát âm nhƣ đƣợc trong các bộ mã thoại LPC. Tuy nhiên, để thay thế cho việc ứng dụng mô hình 2 trạng thái đơn giản - hữu thanh/vô thanh, mô hình này cố gắng giảm tối đa sai lệch giữa dạng sóng tín hiệu đầu vào và dạng sóng tín hiệu đƣợc xây dựng lại bằng việc tìm kiếm tín hiệu kích thích lý tƣởng. Nói cách khác, phƣơng pháp mã hóa này không sử dụng ƣớc lƣợng đơn giản là âm hữu thanh hay vô thanh.

Sơ đồ tổng quát bộ mã hóa lai ghép RELP đƣợc minh họa trong hình 3.22.

Hình 3.22 Minh họa phƣơng pháp mã hóa lai ghép RELP

Trƣớc tiên, bộ mã hóa thực hiện phân tích tín hiệu thoại đầu vào thành các khung ngắn có độ dài khoảng 10-30 ms. Các tham số của một khung sẽ xác định một bộ lọc tổng hợp tƣơng ứng với khung đó và tín hiệu kích thích tƣơng ứng cho mỗi bộ lọc này sẽ đƣợc xác định thông qua một vòng lặp. Tín hiệu kích thích phải đảm bảo rằng sai lệch giữa tín hiệu đầu vào và tín hiệu đƣợc tái tạo lại là nhỏ nhất. Cuối cùng bộ mã hóa sẽ truyền đi những thông tin liên quan đến các bộ lọc bao gồm các tham số và tín hiệu kích thích tƣơng ứng với mỗi bộ lọc gửi cho bộ giải mã. Ở bộ giải mã, tín hiệu kích thích sẽ đƣợc đƣa qua bộ lọc tổng hợp để xây dựng lại tín hiệu thoại ban đầu. Bộ lọc tổng hợp thƣờng là một bộ lọc tuyến tính, ngắn hạn nhƣng nó cũng có thể bao gồm một bộ lọc độ cao âm thanh (pitch filter) liên quan đến mô hình tuần hoàn dài hạn của tín hiệu thoại. Phƣơng pháp này cung cấp tín hiệu thoại có chất lƣợng cao tại tốc độ bit thấp. Tuy nhiên độ phức tạp của phƣơng pháp này là khá lớn bởi vì tất cả các tín hiệu kích thích có thể có đều phải đƣợc đƣa qua bộ lọc tổng hợp để tìm ra tín hiệu kích thích thích hợp nhất.

Một phần của tài liệu Bài giảng Xử lý tiếng nói: Phần 1 (Trang 87 - 89)

Tải bản đầy đủ (PDF)

(92 trang)