min Ee [n] Ex [n]
1.3.2.1 Mô hình xử lý tín hiệu thoạ
Mô hình xử lý thoại dựa vào mô hình mã hóa dự đoán tuyến tính được mô tả trong Hình 1.35. Mô hình được dựng dựa vào việc quan sát các đặc tính cơ bản của tín hiệu thoại và bắt chước kỹ thuật tạo âm thanh thoại của người. Bộ lọc tổng hợp được mô phỏng theo sự phát âm, khẩu âm của miệng người. Tín hiệu lái ngõ vào của bộ lọc hoặc tín hiệu kích thích mạch được mô phỏng theo dạng xung truyền động (âm thanh thoại) hoặc là nhiễu ngẫu nhiên (âm thanh phi thoại). Như vậy, phụ thuộc vào trạng thái âm thanh thoại hay phi thoại của tín hiệu, mạch chuyển được thiết lập ở vị trí thích hợp sao cho ngõ vào tương ứng sẽ được chọn đưa vào mạch. Mức năng lượng của tín hiệu ngõ ra đwojc điều khiển bởi thông số độ lợi.
Làm cách nào mô hình phù hợp với ngữ cảnh của mã hóa âm thoại? Xét các mẫu thoại một cách riêng lẻ ứng với từng khung tín hiệu không chồng lên nhau. Ứng với từng đoạn khung đủ ngắn, thuộc tính của tín hiệu về cơ bản là hằng số. Trong mỗi khung, các thông số của mô hình được ước lượng từ các mẫu thoại, các thông số bao gồm:
Dạng: tín hiệu thuộc khung là thoại hay phi thoại
Độ lợi: liên quan chủ yếu đến mức năng lượng của khung Hệ số lọc: định rõ đáp ứng của bộ lọc tổng hợp
Chu kỳ âm thanh: trong trường hợp đối với khung thoại, là chiều dài thời gian giữa các xung kích thích liên tiếp nhau.
Quá trình ước lượng thông số được thực hiện ứng với từng mỗi khung, các kết quả chính là các thông tin của khung. Như vậy, thay vì truyền các xung PCM, các thông số của mô hình sẽ được gửi đi. Giảm giảm thiểu nhiễu và sự méo tín hiệu, các bít truyền được cấp phát theo chỉ định ứng với từng thông số, và tỉ số nén tối ưu có thể đạt được.
Hình 1.35 Mô hình LPC tổng hợp tiếng nói
Việc ước lượng các thông số là nhiệm vụ của bộ mã hóa. Bộ giải mã sẽ sử dụng các thông số ước lượng này và dùng mô hình tạo thoại để tổng hợp âm thoại.
Hình 1.36 Hình vẽ các các khung phi thoại
Hình 1.36 mô tả một khung tín hiệu phi thoại có 180 mẫu (sử dụng bộ mã hóa FS1015). Các mẫu nguyên thủy được xử phân tích LP qua quá trình tổng hợp LPC dùng cho việc tổng hợp âm thoại dựa trên mô hình Hình 1.35. Tín hiệu của tín hiệu nguyên thủy và tín hiệu sau khi tổng hợp có vẻ giống nhau do mật độ phổ cố suất có dạng tương đương, được mô tả trong Hình 1.37.
Hình 1.37 Sơ đồ của một khung âm thanh phi thoại, Hình bên trái: tín hiệu nguyên thuỷ; Hình bên phải: tín hiệu tổng hợp. Đường nét đứt là giá trị mật độ phổ công suất dùng phương pháp dự đoán LPC.
Hình 1.38 Sơ đồ khung tín hiệu âm thanh thoại. Hình trên: tín hiệu nguyên thủy; Hình dưới: tín hiệu tổng hợp.
Hình 1.39 Sơ đồ của một khung âm thanh thoại, Hình bên trái: tín hiệu nguyên thuỷ; Hình bên phải: tín hiệu tổng hợp. Đường nét đứt là giá trị mật độ phổ công suất dùng phương pháp dự đoán LPC.