tính LPC
Trong mục này đề tài sẽ phân tích phơng pháp mã hoá dự đoán tuyến tính, các thông số và thuật toán liên quan tới phơng pháp mã hoá nội suy.
Mục này tập trung vào phân tích mã hoá dự đoán tuyến tính là một phơng pháp không thể thiếu cho nhiều thuật toán trong các bộ mã hoá và giải mã tiếng nói.
Điểm quan trọng mấu chốt của phân tích mã hoá dự đoán tuyến tính là tiếng nói đợc phân tích thành hai thành phần có tính độc lập cao đó là : các thông số của cơ quan phát âm hay các thông số dự đoán tuyến tính (LP coefficient) và sự kích thích thanh môn hay kích thích dự đoán tuyến tính (LP excitation). Hai thành phần này có những yêu cầu lợng tử khác nhau. Để tăng cờng hiệu quả mã hoá có thể sử dụng các sơ đồ lợng tử và phân tích khác nhau. Trong thập niên 80 của thế kỷ 20 nhiều sơ đồ lợng tử hiệu quả đã đợc phát triển để lợng tử các hệ số dự đoán tuyến tính. Tuy nhiên sự biểu diễn của tín hiệu kích thích vẫn còn là một vấn đề đợc đặt ra. Cuối những năm 90 một
số kỹ thuật hứa hẹn giải quyết vấn đề trên đợc đa ra, và một trong các kỹ thuật đố là sơ đồ mã hoá theo phơng pháp nội suy (WI). Trớc hết hãy tìm ra những nguyên lý còn nằm kín ở quá trình phân tích dự đoán tuyến tính LPC trong thời gian ngắn và tính toán các hệ số dự đoán tuyến tính. Sau đó đi vào biểu diễn các hệ số đó theo tần số phổ vạch vì nó cho phép đa ra quá trình lợng tử và nội suy hay xen kẽ các thành phần một cách tốt hơn.
Dự đoán tuyến tính trong mã hoá tiếng nói:
Nh đã nêu ở các phần trớc, tiếng nói đợc tạo ra do quá trình kích thích thanh môn làm kích thích cơ quan phát âm. Trong mã hoá dự đoán tuyến tính, quá trình này đợc mô hình hoá nh là tín hiệu d kích thích hay tác động một bộ lọc tuyến tính biến đổi theo thời gian nh hình vẽ sau:
H.1.5: Sơ đồ bộ lọc tổng hợp LP
Bộ lọc là mô hình toàn cực bậc N (Thay cho ký hiệu p hay dùng ở các mục trớc). Bộ lọc này tổng hợp tiếng nói. Các hệ số của bộ lọc ak với k= 1,2,3...N, là các hệ số dự đoán tuyến tính. Bộ lọc tổng hợp mô hình hoá ảnh h- ởng của cơ quan phát âm đã bị tác động mạnh mẽ của sự kích thích thanh môn, do đó đáp ứng tần số của bộ lọc tơng ứng với đờng bao phổ (tơng quan ngắn) của tín hiệu tiếng nói. Nói một cách khác, Tần số trung tâm của các khối cộng hởng của bộ lọc phải ăn khớp nhất với các vị trí đờng bao phổ của tín hiệu tiếng nói. Vì vậy bậc N của bộ lọc cần đợc chọn sao cho có một cặp các cực nằm trong mỗi đoạn đờng bao phổ. Tín hiệu tiếng nói thờng đợc lấy mẫu ở 8 kHz nên ngời ta thờng chọn N=10 là phù hợp.
Quá trình biến đổi ngợc của bộ lọc tổng hợp trên đợc gọi là bộ lọc phân tích dự đoán tuyến tính. Mục đích chính của nó là lấy ra thành phần d đã bị che kín trong tín hiệu tiếng nói. Sơ đồ khối bộ lọc phân tích dự đoán nh hình sau:
H.1.6: Sơ đồ bộ lọc phân tích dự đoán tuyến tính
Từ hai sơ đồ trên thấy rằng có thể biểu diễn quan hệ của tín hiệu tiếng nói số x(n) sau bộ lọc tổng hợp và tín hiệu d r(n) trong một phơng trình vi phân ) ( ) ( ) ( ) ( ) ( ) ( 1 1 n r k n x a n x k n x a n x n r N k k N k k + − = − − = ∑ ∑ − −
Khi hình dạng của cơ quan phát âm thay đổi theo thời gian, cả bộ lọc phân tích và tổng hợp dự đoán tuyến tính đều biến đổi theo thời gian do đó các hệ số {ak } biến đổi hay phụ thuộc vào thời gian. Tuy thế trong các bộ mã hoá thực tế các hệ số này đợc lấy xấp xỉ một lần cho mỗi khung chỉ cho các lý do về tính toán.
Chơng II: Xử lý mã hoá - Đóng gói - Truyền dẫn thoại
Trong nhiều trờng hợp, việc tạo khuôn (định dạng) và mã hoá nguồn đối với các tín liên tục (nh tiếng nói, âm nhạc hay tín hiệu truyền hình v.v )…
trong các hệ thống thông tin số đợc thực hiện trong một quá trình: biến đổi tín hiệu liên tục đến từ nguồn tín thành chuỗi tín hiệu số hiệu quả, về mặt tốc độ, gọi là quá trình mã hoá nguồn. Vai trò của mã hoá nguồn là đặc biệt quan trọng, góp phần nâng cao chất lợng liên lạc và cho phép nâng cao hiệu quả sử dụng phổ tần của hệ thống truyền dẫn.