Nguyờn lý chung của bộ mó hoỏ CELP

Một phần của tài liệu Nghiên cứu công nghệ truyền thoại qua Internet sử dụng giao thức TCP IP (VoIP) (Trang 72)

Tớn hiệu kớch thớch được phõn bố trong một danh sỏch rất lớn cỏc nguồn õm từ việc thống kờ một số lượng rất lớn cỏc giọng núi gồm người già, người trẻ, giọng nam, giọng nữ được phõn bố một cỏch ngẫu nhiờn. Tại phớa phỏt, nguồn kớch thớch được lần lượt so sỏnh với cỏc nguồn được lấy từ trong bảng mẫu để xỏc định nguồn nào là phự hợp nhất, sau đú thụng số về vị trớ của nguồn trong bảng mẫu sẽ được mó hoỏ và gửi đi. Đến nơi thu sử dụng cỏc thụng số này để kớch thớch nguồn mẫu cú cựng thứ tự trong một bảng cỏc nguồn mẫu y hệt bờn phỏt nhằm khụi phục tiếng núi. Phương phỏp này tương tự như việc

phương phỏp được sử dụng để giảm cụng việc tớnh toỏn xuống, đú là phương phỏp sử dụng cỏc bảng mó đại số ACELP (Algebraic CELP) trong đú cỏc bảng mó được tạo ra nhờ cỏc mó sửa lỗi nhị phõn đặc biệt. Để nõng cao hiệu quả rà soỏt bảng mó, người ta sử dụng cỏc bảng mó đại số cú cấu trỳc liờn kết CS – ACELP (Conjugate Structure ACELP). Đú là nguyờn tắc của khuyến nghị G729. Khuếch đại Khuếch đại u(n) + Bộ lhọợc tp ổng Trễ khung con Tiếng núi tổng hợp s*(n)

4.2.2. Nguyờn lý bộ mó hoỏ CS – ACELP Sơ đồ khối bộ mó hoỏ được mụ tả: Khối tiền xử lý Khối tổng hợp LP sự l−ợng tử hoá và nội suy Bộ lọc tổng hợp + + Bảng mã thích ứng Bảng mã cố định Bộ lọc tổng hợp độ cao Tìm bảng mã cố định Độ cảm nhận Sự l−ợng tử hoá độ khuếch đại Sự l−ợng tử hoá độ khuếch đại luồng bit phát đi LPC info LPC info tiếng nói đầu vào LPC info Gc Gp Hỡnh 4.2. Sơ đồ khối Bộ mó hoỏ

Tớn hiệu đầu vào đưa qua bộ tiền xử lý ,bộ này cú hai chức năng: lọc thụng cao và tớnh toỏn tớn hiệu. Tớn hiệu đầu ra bộ tiền xử lý là tớn hiệu đầu vào của cỏc khối tổng hợp tiếp sau. Sự tổng hợp dự bỏo tuyến tớnh (LP)được thực hiện một lần trong một khung 10ms để tớnh cỏc hệ số của bộ lọc dự bỏo tuyến tớnh (LP). Cỏc hệ số này được biến đổi thành cỏc cặp vạch phổ (LSP) và được lượng tử bằng phương phỏp lượng tử hoỏ vộctơ dự bỏo hai bước (VQ) 8 bit. Tớn hiệu kớch thớch được lựa chọn bằng cỏch cực tiểu hoỏ sai số, cú tớnh đến trọng số thụ cảm, giữa tiếng núi gốc và tiếng núi tổng hợp. Cỏc tham số kớch thớch (gồm :bảng mó cố định và bảng mó thớch ứng) được xỏc dịnh qua từng khung con 5ms (tương đương 40mẫu). Cỏc hệ số của bộ lọc LP đó được lượng tử và chưa được lượng tử được sử dụng cho phõn khung thứ 2, cũn tại phõn khung thứ nhất cỏc hệ số của bộ lọc LP đó được nội suy sẽ được sử dụng (trong cả hai trường hợp đó lượng tử và chưa lượng tử). Độ trễ bước mạch vũng hở sẽ được tớnh toỏn một lần trong một khung 10ms dựa trờn độ lớn tớn hiệu thoại. Sau đú cỏc phộp tớnh này sẽ lặp lại trong từng phõn khung tiếp theo. Tớn hiệu ban đầu x(n) được tớnh bằng cỏc lọc độ dư LP thụng qua bộ lọc tổng hợp W(z)/A(z). Trạng thỏi ban đầu của bộ lọc này là tớn hiệu lỗi giữa tớn hiờu dư LP và tớn hiệu

kớch thớch. Sự phõn tớch bước của mạch vũng đúng sẽ thực hiện sau đú (để tỡm độ trễ mó thớch ứng và độ khuếch đại) dựng tớn hiệu ban đầu x(n) và đặc tuyến xung h(n), bằng cỏch làm trũn giỏ trị độ trễ bước của mạch vũng hở. Độ trễ bước được mó hoỏ bằng mó 8 bit trong phõn khung thứ nhất, độ vi sai của độ trễ được mó hoỏ bằng mó 5 bit trong phõn khung thứ 2. Tớn hiệu x’(n) là tớn hiệu của 2 tớn hiệu: tớn hiệu ban đầu x(n) và tớn hiệu mó thớch ứng - là tớn hiệu mó cố định. Tớn hiệu này được dựng trong việc tỡm tớn hiệu kớch thớch tối ưu. Giỏ trị kớch thớch mó cố định được mó hoỏ bằng mó đại số 17 bit (trong đú: chỉ số bảng mó cố định được mó hoỏ bằng từ mó C1, C2-13 bit. Dấu bảng mó cố định được mó hoỏ bằng từ mó S1, S2-3bit). Cỏc bộ khuếch đại bảng mó cố định và bảng mó thớch ứng được lượng tử hoỏ bằng vộc tơ 7 bit (Trong đú:ở bước 1 được mó hoỏ bằng từ mó GA1,GA2 -3 bit. Ở bước 2 được mó hoỏ bằng từ mó GB1, GB2-4 bit ). Tại đõy sự dự đoỏn trung bỡnh động MA cho bộ khuếch đại mó cố định. Cuối cựng, dựa vào cỏc bộ nhớ lọc sẽ xỏc định được tớn hiệu kớch thớch. 4.2.3 Nguyờn lý bộ giải mó CS-ACELP. Sơ đồ khối của bộ giải mó được mụ tả trong hỡnh 2.4 Bảng mã cố định Bảng mã thích ứng Bộ lọc ngắn hạn bộ xử lý trạm Gc Gp Hỡnh 4.3. Sơ đồ nguyờn lý của bộ giải mó CS-ACELP

Đầu tiờn, cỏc chỉ số của cỏc tham số được trớch ra từ buồng bit thu. Cỏc chỉ số này sẽ được giải mó để thu lại cỏc tham số của bộ mó hoỏ trong 1 khung tiếng núi 10 ms. Cỏc tham số đú là: cỏc hệ số LSP, 2 phần độ trễ bước (độ trễ bước và độ vi sai của độ trễ bước), 2 vec tơ bảng mó cố định (chỉ số mó cố định và chỉ số bảng mó cố định ) và 2 tập hợp độ khuếch đại bảng mó cố định và bảng mó thớch ứng. Cỏc hệ số LSP được nội suy và được chuyển đổi thành cỏc hệ số bộ lọc LP cho mỗi phõn khung. Sau đú, cứ mỗi phõn khung thực hiện cỏc bước tiếp theo.

Giỏ trị kớch thớch được khụi phục là tổng của vộc tơ bảng mó cố định và bảng mó thớch ứng nhõn với cỏc giỏ trị khuếch đại tương ứng của chỳng.Tiếng núi được khụi phục bằng cỏch lọc giỏ trị kớch thớch này thụng qua bộ lọc tổng hợp LP.

Tớn hiệu tiếng núi khụi phục đưa qua bước xử lý trạm, bao gồm bộ lọc thớch ứng dựa trờn cơ sở cỏc bộ lọc tổng hợp ngắn hạn và dài hạn, sau đú qua bộ lọc thụng cao và bộ nõng tớn hiệu.

4.2.4. Chuẩn nộn G.729A.

G729A là thuật toỏn mó hoỏ tiếng núi tiờu chuẩn cho thoại và số liệu đồng thời số hoỏ (DSVD). G.729A là sự trao đổi luồng bit với G.729, cú nghĩa là tớn hiệu được mó hoỏ bằng thuật toỏn G.729A cú thể được giải mó thụng qua thuật toỏn G.729 và ngược lại. Giống như G.729, nú sử dụng thuật toỏn dự bỏo tuyến tớnh mó kớch thớch đại số được cấu trỳc liờn kết (CS-ACELP) với cỏc khung 10ms. Tuy nhiờn một vài thuật toỏn thay đổi sẽ được giới thiệu mà kết quả của cỏc thuật toỏn này làm giảm 50% độ phức tạp.

Nguyờn lý chung của bộ mó hoỏ và giải mó của thuật toỏn G.729A giống với G.729. Cỏc thủ tục lượng tử hoỏ và phõn tớch LP của cỏc độ khuyếch đại bảng mó cố định và thớch ứng giống như G.729. Cỏc thay đổi thuật toỏn chớnh so với G.729 sẽ tổng kết như sau: Bộ lọc trọng số thụ cảm sử dụng cỏc tham số bộ lọc LP đó lượng tử và được biểu diễn là: W(z) = ) / ( ) ( γ z A z A với γ =0,75

Cỏc tớnh toỏn phản ứng xung của bộ lọc tổng hợp trọng số W(z)/A(z) của tớn hiệu ban đầu và việc thiết lập trạng thỏi ban đầu của bộ lọc được đơn giản hoỏ bằng cỏch thay thế: W(z) = 56 ) / ( 1 y z A

Việc tỡm bảng mó thớch ứng được đơn giản hoỏ. Thay vỡ tỡm tập trung ở mạch vũng tổ ong, giải phỏp tỡm sơ đồ hỡnh cõy độ sõu trước được sử dụng.

Tại bộ giải mó, hoạ ba của bộ lọc sau sẽ được đơn giản bằng cỏch sử dụng chỉ cỏc độ trễ nguyờn.

4.2.5. Chuẩn nộn G.729B

G.729B đưa ra một nguyờn lý nộn im lặng tốc độ bit thấp được thiết kế và tối ưu hoỏ để làm việc trung được với cả G.729 và G.729A phức tạp thấp. Để đạt được việc nộn im lặng tốc độ bit thấp chất lượng tốt, một mụđun bộ dũ hoạt động thoại khung cơ bản là yếu tố cần thiết để dũ cỏc khung thoại khụng tớch cực, gọi là cỏc khung tạp õm nền hoặc khung im lặng. Đối với cỏc khung thoại khụng tớch cực đó dũ được này, mộtmụ đun truyền giỏn đoạn do sự thay đổi theo thời gian của đặc tớnh tớn hiệu thoại khụng tớch cực và quyết định xem cú một khung mụ tả thụng tin im lặng mới khụng cú thể được gửi đi để duy trỡ chất lượng tỏi tạo của tạp õm nền tại đầu cuối thu. Nếu cú một khung như thế được yờu cầu, cỏc tham số năng lượng và phổ mụ tả cỏc đặc tớnh cảm nhận được của tạp õm nền được mó hoỏ và truyền đi một cỏch hiệu quả dựng khung 15 bit/khung. Tại đầu cuối thu, mụđun tạo ra õm phự hợp sẽ tạo tạp õm nền đầu ra sử dụng tham số cập nhật đó phỏt hoặc cỏc tham số đó cú trước đú. Tạp õm nền tổng hợp đạt được bằng cỏch lọc dự bỏo tuyến tớnh tớn hiệu kớch thớch giả trắng được tạo ra trong nội bộ của mức điều khiển. Phương phỏp mó hoỏ tạp õm nền tiết kiệm tốc độ bit cho tiếng núi mó hoỏ tại tốc độ bit trung bỡnh thấp 4kbps trong cuộc đàm thoại tiếng núi bỡnh thường để duy trỡ chất lượng tỏi tạo.

Đối với cỏc ứng dụng DSVD (Digital Simultaneous Voice and Data: thoại và số liệu đồng thời số hoỏ) và độ nhạy tốc độ bit khỏc, G729B là điều kiện tối cần thiết để giảm tốc độ bit hơn nữa bằng cỏch sử dụng cụng nghệ nộn im lặng. Khi khụng cú tiếng núi, tốc độ bit cú thể giảm, giải phúng dung lượng kờnh cho cỏc ứng dụng xảy ra đồng thời, vớ dụ như cỏc đường truyền tiếng khỏc trong điện thoại tế bào đa truy nhập phõn kờnh theo mó theo thời gian (TDMA/CDMA) hoặc truyền số liệu đồng thời. Một phần đỏng kể trong cỏc cuộc đàm thoại thụng thường là im lặng, trung bỡnh lờn tới 60% của một cuộc đàm thoại hai chiều. Trong suốt quỏ trỡnh im lặng, thiết bị đầu vào tiếng vớ dụ như tai nghe, sẽ thu thụng tin từ mụi trường ồn. Mức và đặc tớnh ồn cú thể thay đổi đỏng kể, từ một phũng im lặng tới đường phố ồn ào hoặc từ một chiếc xe ụ tụ chuyển bỏnh nhanh. Tuy nhiờn, hầu hết cỏc nguồn tạp õm thường mang ớt thụng tin hơn thụng tin tiếng. Vỡ vậy trong cỏc chu kỳ khụng tớch cực tỷ số nộn sẽ cao hơn. Nhiều ứng dụng điển hỡnh, vớ dụ hệ thống toàn cầu đối với điện thoại di động GSM, sử dụng việc dũ tỡm chu kỳ im lặng và chốn tạp õm phự hợp để tạo được hiệu quả mó hoỏ cao hơn.

Xuất phỏt từ quan niệm về dũ tỡm im lặng và chốn tạp õm phự hợp dẫn tới cỏc cụng nghệ mó hoỏ tiếng mẫu kộp. Cỏc mẫu khỏc nhau bởi tớn hiệu đầu vào, được biểu thị là: thoại tớch cực đối với tiếng núi và là thoại khụng tớch cực đối với im lặng hoặc tạp õm nền, được xỏc định bởi sự phõn loại tớn hiệu. Sự phõn loại này cú thể được thực hiện bờn trong hoặc bờn ngoài bộ mó hoỏ tiếng núi. Bộ mó hoỏ tiếng toàn tốc cú thể cú tỏc dụng trong quỏ trỡnh tiếng thoại tớch cực, nhưng cú một nguyờn lý mó hoỏ khỏc được dựng đối với tớn hiệu thoại khụng tớch cực, sử dụng bit ớt hơn và tạo ra tỷ số nộn trung bỡnh cao hơn. Sự phõn loại này được gọi chung là bộ dũ hoạt động thoại (VAD: Voice Activity Detector) và đầu ra của bộ này gọi là mức hoạt động thoại. Mức hoạt động thoại là 1 khi cú mặt hoạt động thoại và là 0 khi khụng cú hoạt động thoại.

Thuật toỏn VAD và bộ mó hoỏ tiếng núi khụng tớch cực, giống với cỏc bộ mó hoỏ G.729 và G.729A, được thực hiện trờn cỏc khung của tiếng núi đó được số hoỏ. Để phự hợp, kớch thước cỏc khung giống nhau được dựng cho mọi sơ đồ và khụng cú độ trễ thờm vào nào được tạo ra bởi thuật toỏn VAD hoặc bộ mó hoỏ thoại khụng tớch cực. Đầu vào bộ mó hoỏ tiếng núi là tớn hiệu tiếng núi đến đó được số hoỏ. Với mỗi khung tiếng núi đầu vào, VAD đưa ra mức hoạt động thoại, mức này được dựng như một chuyển mạch giữa cỏc bộ mó hoỏ thoại tớch cực và thoại khụng tớch cực. Khi bộ mó hoỏ thoại tớch cực cú tỏc dụng, luồng bit thoại tớch cực sẽ gửi tới bộ giải mó tớch cực cho mỗi khung. Tuy nhiờn, trong cỏc chu kỳ khụng tớch cực, bộ mó hoỏ thoại khụng tớch cực cú thể được chọn để gửi cỏc thụng tin mới nhất gọi là bộ mụ tả việc chốn im lặng (SID: Silence Insertion Descriptor) tới bộ giải mó khụng tớch cực hoặc khụng gửi gỡ cả. Kỹ thuật này cú tờn là truyền giỏn đoạn (DTX: Discontinuous Transmission). Với mỗi khung, đầu ra của mỗi bộ giải mó được dựng làm tớn hiệu khụi phục.

4.2.6. Chuẩn nộn G.723.1

Khuyến nghị G.723.1 đưa ra một bộ mó hoỏ tiờu chuẩn dựng để nộn tớn hiệu tiếng núi hoặc cỏc tớn hiệu audio khỏc của cỏc dịch vụ đa phương tiện tại tốc độ rất thấp, giống với phần tiờu chuẩn của họ H.323.

Về tốc độ bit: Bộ mó hoỏ này cú hai tốc độ bit: 5,3 kbps và 6,3 kbps. Bộ mó hoỏ cú tốc độ cao hơn sẽ cú chất lượng tốt và, cộng thờm tớnh linh hoạt, cung cấp cho cỏc nhà thiết kế hệ thống. Bộ mó húa và giải mó bắt buộc phải cú cả hai tốc độ bit này. Chỳng cú thể chuyển mạch được giữa hai tốc độ bit tại

lựa chọn một tốc độ bit biến thiờn để truyền khụng liờn tục và điều khiển những khoảng trống.

Tớn hiệu đầu vào cú thể cú của bộ mó hoỏ này tối ưu hoỏ tớn hiệu tiếng núi với chất lượng cao tại cỏc tốc độ bit đó núi ở trờn với một độ hạn chế về độ phức tạp. Bộ mó hoỏ này dựng để mó hoỏ tiếng núi và cỏc tớn hiệu audio khỏc với cỏc khung dựng kỹ thuật mó hoỏ phõn tớch bằng tổng hợp dự bỏo tuyến tớnh. Tớn hiệu kớch thớch, đối với bộ mó hoỏ tốc độ bit cao hơn, là lượng tử hoỏ đỳng cực đại đa xung (MP-MLQ: Multipulse Maximum Likelihood Quantilization) và đối với bộ mó hoỏ cú tốc độ bit thấp hơn, là dự đoỏn tuyến tớnh kớch thớch mó đại số (ACELP). Kớch thớch khung là 30ms, cộng thờm 7,5ms look-ahead, tạo ra trễ xử lý thuật toỏn tổng cộng là 37,5ms. Toàn bộ trễ thờm vào bộ mó hoỏ là tổng của: Trễ xử lý, trễ truyền dẫn trờn cỏc đường truyền thụng tin và trễ đệm của cỏc giao thức ghộp kờnh.

Nguyờn lý bộ mó hoỏ G.723.1

Tớn hiệu PCM 64kbps đầu vào (theo luật A hoặc à) qua bộ mó hoỏ này được lấy mẫu tại tần số 8kHz, sau đú qua bộ chuyển đổi thành tớn hiệu PCM đều 16 bit đưa tới đầu vào bộ mó hoỏ. Tớn hiệu đầu ra bộ giải mó sẽ được chuyển đổi thành tớn hiệu PCM theo đỳng tớn hiệu đầu vào. Cỏc đặc tớnh đầu vào/ đầu ra khỏc, giống như của tớn hiệu PCM 64kbps (theo khuyến nghị ITU G.711), sẽ được chuyển đổi thành tớn hiệu PCM đều 16 bit tại đầu vào bộ mó hoỏ, hoặc tớn hiệu PCM đều 16 bit sẽ được chuyển đổi thành tớn hiệu ra PCM theo đỳng quy luật của tớn hiệu đầu vào ở bộ giải mó. Bộ mó hoỏ dựa trờn nguyờn lý bộ mó hoỏ phõn tớch bằng tổng hợp dự bỏo tuyến tớnh và cố gắng cực tiểu húa sai số cú tớnh trọng số thụ cảm. Bộ mó hoỏ thực hiện theo từng khung 240 mẫu. Điều này tương đương với chu kỳ khung là 30ms và tần số lấy mẫu là 8kHz. Tại mỗi khối, đầu tiờn tớn hiệu được đưa qua bộ lọc thụng cao để loại bỏ thành phần tớn hiệu một chiều DC và sau đú được chia thành 4 khung con. Với mỗi khung con sử dụng tớn hiệu đầu vào chưa xử lý để tớnh toỏn bộ lọc mó hoỏ dự bỏo tuyến tớnh bậc 10 (LPC). Bộ lọc LPC của khung con cuối cựng sẽ được lượng tử hoỏ bằng phương phỏp lượng tử hoỏ vectơ phõn chia dự bỏo (PSVQ: Predictive Split Vector Quantizer). Cỏc hệ số LPC chưa được lượng tử sẽ được

Một phần của tài liệu Nghiên cứu công nghệ truyền thoại qua Internet sử dụng giao thức TCP IP (VoIP) (Trang 72)