ĐT I. GIỚI THIỆU Chúng ta xem xét phân tích sự hoạt động của bộ Mã hoá CELP với sơ đồ được giới thiệu trên hình 1. Tín hiệu kích thích U(h) được hình thành bằng cách cộng tín hiệu tỷ lệ từ sổ mã hoá thích ứng (AKK) (bổ xung thành phần trên số thời gian dài của tín hiệu tiếng nói) và tín hiệu tỷ lệ từ sổ mã cố định lớn (CKK). Tín hiệu kích động nhận được điều khiển bộ lọc tổng h ợp, nó mô phỏng hiệu ứng thiết bị tiếng nói. Trong bộ giải mã tín hiệu kích động đi qua bộ lọc tổng hợp, khi tái tạo tín hiệu tiếng nói λ(h) ta nhận thấy, đầu tiên các tham số của bộ lọc được xác định, còn sau đó là các chỉ số của sổ mã α và k. Các hệ số khuếch đại tương ứng G 1 và G 2 , các tham số của sổ mã được chọn sao cho sai lệch gây ra giữa tín hiệu tiếng nói gốc và tín hiệu tiếng nói tái tạo được cực tiểu hoá, đạt được việc truyền mỗi tế bào của sổ mã đến bộ lọc tổng hợp với mục đích xuất hiện lớn nhất các mẫu giống nhất. Tất nhiên trên thực tế đưa ra 2 sự đơn giản hoá phân tích. Đầu tiên gắn li ền với xác định tham số bộ lọc tổng hợp đặc tính của nó để đơn giản lựa chọn bộ lọc đảo dự đoán tuyến tính thời gian ngắn, được cực tiểu hoá năng lượng tín hiệu sai lệnh dự đoán. Tham số của bộ lọc tổng hợp được xác định với tính toán tín hiệu kích động U(h), tất nhiên sau đó chúng được xác định, các thay đổi nào đ ó lớn hơn của tín hiệu sẽ không được tính đến, điều đó có nghĩa là, khi xác định tham số của bộ lọc có thể các thành phần thời gian dài bị ảnh hưởng, khi đó sự mô phỏng của chúng tốt hơn cả là “dừng lại” đối với sổ mã thích ứng. Sự đơn giản hoá thứ 2 của phân tích được thực hiện khi xác định các tham số của sổ mã. Nếu thay xác định đồ ng thời tham số sổ mã (thích ứng và cố định) để cực tiến hoá sai lệch. Ban đầu xác định trễ và hệ số khuếch đại AKK, khi đó cho rằng tín hiệu CKK bằng 0, còn sau đó khi có tín hiệu AKK thì xác định tham số PHÂN TÍCH THỐNG KÊ MÃ HÓA CELP TS. TRẦN QUỐC THỊNH Bộ môn Kỹ thuật viễn thông Khoa Điện – Điện tử Trường Đại học Giao thông Vận tải Tóm tắt: Bài báo đề cập đến phương pháp đánh giá các bộ Mã hoá tiếng nói CELP, cách xử lý các tham số, để tạo ra bộ mã hoá tiếng nói CELP. Vừa bảo đảm hiệu quả kinh tế vừa bảo đảm chất lượng tiếng nói. Đây là một vấn đề thời sự trong lĩnh vực mã hoá tiếng nói trong các hệ thống thoại của mạng viễn thông, đang được các nhà nghiên cứu quan tâm. Summary: This paper presents the methods to analyse CELP encoder and deal with parameters which produce encoder CELP for ensuring both economic efficiency and quality of voice. It takes much researchers’ attention in area of voice coding of telecommunication network now. ĐT CKK. Cách giải quyết như vậy làm giảm độ phức tạp của các bộ mã hoá CELP đến mức chấp nhận được, tất nhiên dẫn đến làm giảm chất lượng tiếng nói tái tạo. Chúng ta xem xét sự ảnh hưởng của hai phương pháp đơn giản trên đến chất lượng tiếng nói tái tạo. Hình 1. Sơ đồ mã hóa CELP II. TÍNH TOÁN THAM SỐ BỘ LỌC TỔNG HỢP Như nhận xét ở trên, đặc tính đơn giản của bộ lọc tổng hợp là đảo đối với đặc tính của bộ lọc dự đoán sai lệch. A(z) = 1 - α 1 z -1 - α 2 z -2 - - α p z -p Bộ lọc này tối thiểu hoá năng lượng còn lại từ sự dự đoán tín hiệu tiếng nói vào λ(h). Ở đây P là bậc của bộ lọc. Rõ ràng điều đó còn xa thực tế xác định tham số bộ lọc tổng hợp: vì vậy khi tín hiệu kích thích λ(h) được xác định, các hệ số của bộ lọc tổng hợp có thể được tính toán kỹ với mục đích làm tăng tỉ số S/N của tiếng nói tái tạo. Chúng ta xem xét đến các phương pháp khác nhau khi tiến hành tối thiểu hoá. Một trong các phương pháp tối thiểu hoá, nó có thể được đề nghị khi phân tích bộ mã hoá với kích thích nhiều xung điện gọi là lặp theo phương pháp bình phương bé nhất. Khi có tín hiệu kích thích λ(h) và bộ hệ số bộ lọc α k = 1, 2, 3, …, P. Tín hiệu tiếng nói tái tạo có thể được tính toán với biểu thức ∑ = −λα+=λ P 1k k )kh()h(U)h( )) (1) Tối thiểu hoá E – năng lượng tín hiệu sai lệch e(h) = λ(h) - ∧ λ (h) Tối thiểu hóa sai lệch ĐT Theo chiều dài L đoạn tín hiệu - được thực hiện với sự trợ giúp của biểu thức. () () () () () ( ) 2 1L 0h P 1k k 2 1L 0h khλ ˆ αhUhλ hλ ˆ hλE ∑∑ ∑ − == − = ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ −−−= −= (2) Rõ ràng E phụ thuộc không chỉ vào hệ số bộ lọc, mà còn phụ thuộc vào tín hiệu tái tạo λ ) (h), nó cũng phụ thuộc vào hệ số của bộ lọc và kết quả không thể nhận được đạo hàm riêng ∂E/∂ αi tiến đến “0” và nhận hệ thống P phương trình tuyến tính để xác định bộ hệ số tối ưu. Với mục đích đơn giản hoá phân tích chúng ta cho phép () ( ) khλ ˆ k-hλ −≈ (3) Khi đó ta nhận được: () () ( ) 2 1L 0h P 1k k khλαhUhλE ∑∑ − == ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ −−−= (4) Bây giờ thực hiện đạo hàm ∂E/∂ αi cho bằng 0. Đối với i = 1, 2,…, P có thể nhận được P phương trình tuyến tính, khi giải nó chúng ta nhận được các hệ số lặp của bộ lọc. Cùng với điều đó sự ứng dụng phương pháp này có thể dẫn đến làm kém đi S/N. Nguyên nhân là do ta làm gần đúng ở phương trình (3). Để làm tốt hơn các S/N thành phần trong tiếng nói tái tạo, cần thiết trong mỗi đoạn xác định các tham số của bộ lọc, khi s ử dụng các hệ số gốc, cũng như hệ số lặp và đưa ra những tham số từ các hệ số trên, nó bảo đảm S/N max. Tính toán tham số kích thích Để làm giảm độ phức tạp của bộ mã hoá, bộ lọc tín hiệu sai lệch (hình 1) thường được đưa vào để tín hiệu vào λ(h) và tín hiệu tái tạo ∧ λ (h) xem xét riêng biệt trước khi tiến hành so sánh chúng và tính toán sai lệch, đối với bộ lọc tổng hợp với đặc tính H(z) = 1/A(z), ở đây A(z) = 1 - α 1 z -1 - α 2 z -2 - - α p z -p , và bộ lọc tính toán tín hiệu sai lệch A(z)/A(z/γ) ở đây γ là hằng số và thực tế bằng 0.9. Sự nối tầng đương nhiên được sử dụng bộ lọc tổng hợp tính toán 1/A(z/γ). Sai lệch trong trường hợp này e w (h) = λ w (h) - λ ∧ w (h) = λ w (h) - λ ∧ 0 (h) - G 1 [u(h - α)v(h)] - G 2 [e k (h)v(h)] (5) ở đây λ w (h) - tín hiệu vào, λ ∧ o (h) - đáp ứng bộ lọc tổng hợp đối với giá trị vào của khoảng tín hiệu trước, v(h) - đặc tính xung của bộ lọc tổng hợp. Trong quá trình của trình tự tìm kiếm các giá trị hệ số khuếch đại xuất hiện G 1 và trễ α đối với AKK, còn chỉ số k và hệ số khuếch đại G 2 đối với CKK, nó được tối thiếu hoá sai lệch bình ĐT phương trung bình E w , nhận được trong các khoảng tín hiệu có chiều dài H () ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ −= ∑ = H 0n αk 2 w Thλ H 1 E (6) ở đây T αk = 2 (G 1 R α + G 2 R k - G 1 G 2 Y αk ) - k GG ξξ α 2 1 2 1 − (7) là đại lượng, tăng lên trong quá trình tìm kiếm trong sổ mã (có nghĩa giá trị lớn nhất T αk chỉ ra được bộ tham số của số mã). () () () h ˆ hhU 0w λ−λ= - tín hiệu - dấu hiệu tìm kiếm và ξ α = ()() [] 2 1H 0h hvhu ∑ − = α− - năng lượng tín hiệu lọc AKK () ( )() [] hvhuhuR 1H 0h α−= ∑ − = α (8) là sự tương quan tín hiệu lọc AKK và tín hiệu tìm kiếm U(h). Tương tự ξ k - là năng lượng tín hiệu lọc CKK, [e k (h) v(h)], còn R k - sự tương quan giữa tín hiệu này và tín hiệu tìm kiếm. Ta có ()() [][] ∑ − = ννα−= 1H 0h kk )k()h(ehhuR (9) là tương quan giữa các tín hiệu lọc của 2 sổ mã. Ở phương pháp bình thường tìm kiếm tham số sổ mã trong (7) bắt đầu bằng giả thiết G 2 = 0. Sau đó đối với giá trị số liệu đã cho α có thể xác định hệ số khuếch đại tối ưu G 1 , nếu đưa đến ‘0’ giá trị đạo hàm riêng T αk tương ứng G 1 , kết quả chúng ta tìm được giá trị T αk đối với mỗi giá trị α và chọn giá trị trước đó nó tương ứng với giá trị lớn nhất T αk . Các tham số AKK cố định và trình tự tương tự diễn ra đối với việc xác định tham số CKK R và G 2 . Có thể đề xuất một vài phương pháp tối ưu như sau: Phương pháp A: α và k tìm được với sử dụng trình tự tìm kiếm bình thường, còn sau đó biểu thức được sử dụng để xác định giá trị tối ưu G 1 , G 2 Phương pháp B: Đề xuất G 2 = 0 trễ AKK α được xác định sau đó sử dụng giá trị này, thực hiện tìm kiếm trong CKK, từ đó giá trị G 1 , G 2 và k được xác định Phương pháp C: Các hệ số a, k, G 1 và G 2 được tính tương tự như phương pháp B, còn sau đó đối với k đã biết α được lặp, nói cách khác, đối với khả năng có thể α, G 1 , G 2 và T αk được xác định và lựa chọn giá trị α như thế, nó tương ứng với giá trị lớn nhất T αk . Chúng ta tiến hành so sánh các phương pháp tính toán lại với sự tìm kiếm liên tiếp bình thường và với sự tìm kiếm mô phỏng đồng thời trong hai số mã. Nếu lấy đạo hàm riêng T αk tương ứng với G 1 và G 2 cho đến 0, chúng ta nhận được hệ thống 2 phương trình, qua nó tìm được giá trị tối ưu của hệ số khuếch đại đối với trị số sổ mã đặt ra α và k ĐT 2 kk kkk 1 R RRR G αα αα −ξξ − ξ = (10) 2 kk kk 2 R RRR G αα ααα −ξξ − ξ = (11) Bảng 1. Đặc tính CELP Phương pháp S/N Độ phức tạp Liên tục tìm kiếm a,7 i A 10.10 1.02 B 10.3 1.3 C 10.6 1.4 Tìm kiếm đủ 10.8 60 Trình tự tìm kiếm đầy đủ, dự tính ξ α , ξ k , R α , R k và R αk đối với mỗi cặp trị số α và k, để theo chúng tìm hệ số khuếch đại G 1 và G 2 . Các hệ số khuếch đại này có thể sau đó đưa vào (7) để tính T αR max. Tối thiểu hoá nó cần thiết để lựa chọn bộ chỉ số đúng. Khó khăn chính tìm kiếm đầy đủ nảy sinh khi xác định sự tương quan liên hệ R αR đối với mỗi cặp chỉ số của sổ mã. Sử dụng sổ mã cố định. Cho phép đồng thời với ξ k và R k , xác định R αk hiệu quả hơn, khi sử dụng chỉ số trong 4 khung đặt ra. Theo bảng 1 trình bày đặc tính CELP đối với tốc độ 48kb/s các quan hệ S/N và độ phức tạp kéo theo đối với các phương pháp tìm kiếm khác nhau. Có thể nhìn thấy, tìm kiếm đầy đủ đưa ra trội hơn theo chỉ số S/N khoảng 1dB so với tìm kiếm liên tiếp, nhưng độ phức tạp của nó cao hơn gấp 60 lần. Phương pháp C làm tăng độ phức tạp của bộ mã hóa cỡ 40%, còn tỷ số S/N như của bộ mã hoá với tìm kiếm đầy đủ. Cuối cùng phương pháp A làm tăng tính phức tạp của bộ mã hoá lên 2% nhưng sự tăng S/N chỉ lên chút ít. III. KẾT LUẬN Chúng ta có thể đưa ra các phương pháp xác định các tham số và cấu trúc của bộ mã hoá tiếng nói CELP. Như trên đã phân tích việc lựa chọn các phương pháp có liên quan chặt chẽ đến chất lượng mã hoá tiếng nói, tái tạo tiếng nói, giá thành sản phẩm, những đánh giá này được dựa vào các phân tích và suy luận được trình bày ở phần trên của bài báo. Tài liệu tham khảo [1]. Bellami Đ. D, “Điện thoại số”, NXB Vô tuyến điện - thông tin liên lạc, 1986. [2]. Duain. G, “Điện thoại gọi”, NXB Vô tuyến điện - thông tin liên lạc,1988. [3]. Pintkuk, “Điện thoại IP”, NXB Vô tuyến điện - thông tin liên lạc, 2000. [4]. Smalko, “Mạng thông tin số”, NXB Vô tuyến điện - thông tin liên lạc, 2001. ĐT [5]. Oliphep, “Công nghệ và trang bị mạng IP mới”, NXB Vô tuyến điện - thông tin liên lạc, 2000. [6]. Selukhin O. I., “Gia công số và truyền tiếng nói”, NXB Vô tuyến điện - thông tin liên lạc, 2002. [7]. Lomakin, “IP- Telephone/ mobile system”,1999♦ . cho rằng tín hiệu CKK bằng 0, còn sau đó khi có tín hiệu AKK thì xác định tham số PHÂN TÍCH THỐNG KÊ MÃ HÓA CELP TS. TRẦN QUỐC THỊNH Bộ môn Kỹ thuật viễn thông Khoa Điện – Điện tử Trường. là “dừng lại” đối với sổ mã thích ứng. Sự đơn giản hoá thứ 2 của phân tích được thực hiện khi xác định các tham số của sổ mã. Nếu thay xác định đồ ng thời tham số sổ mã (thích ứng và cố định). Chúng ta xem xét phân tích sự hoạt động của bộ Mã hoá CELP với sơ đồ được giới thiệu trên hình 1. Tín hiệu kích thích U(h) được hình thành bằng cách cộng tín hiệu tỷ lệ từ sổ mã hoá thích ứng