Nguyờn lý bộ giải mó CS-ACELP

Một phần của tài liệu Xây dựng hệ thống hội nghị truyền hình chất lượng cao trên mạng IP (Trang 42)

Đầu tiờn, cỏc chỉ số của cỏc tham số được trớch ra từ luồng bit thu. Cỏc chỉ số này sẽ được giải mó để thu lại cỏc tham số của bộ mó hoỏ trong 1 khung tiếng núi 10 ms. Cỏc tham số đú là: Cỏc hệ số LSP, 2 phần độ trễ bước (độ trễ bước và độ vi sai của độ trễ bước), 2 vectơ bảng mó cố định (chỉ số mó cố định và chỉ số bảng mó cố định), và 2 tập hợp độ khuếch đại bảng mó cố định và bảng mó thớch ứng. Cỏc hế số LSP được nội suy và được chuyển đổi thành cỏc hệ số bộ lọc LP cho mỗi phõn khung. Sau đú, cứ mỗi phõn khung thực hiện cỏc bước tiếp theo.

Hỡnh 2.4. Sơ đồ nguyờn lý của bộ giải mó CS-ACELP

 Giỏ trị kớch thớch được khụi phục là tổng của vectơ bảng mó cố định và bảng mó thớch ứng nhõn với cỏc giỏ trị khuếch đại tương ứng của chỳng.

 Tiếng núi được khụi phục bằng cỏch lọc giỏ trị kớch thớch này thụng qua bộ lọc tổng hợp LP.

 Tớn hiệu tiếng núi khụi phục đưa qua bước xử lý trạm, bao gồm bộ lọc thớch ứng dựa trờn cơ sở cỏc bộ lọc tổng hợp ngắn hạn và dài hạn, sau đú qua bộ lọc thụng cao và bộ nõng tớn hiệu.

Bảng 2.2. mụ tả chỉ số của cỏc tham số truyền. Sự sắp xếp theo thứ tự luồng bit được mụ tả trong bảng. Với mỗi tham số, bit cú ý nghĩa lớn nhất (MBS) sẽ được truyền trước.

Bảng 2.2. Cỏc tham số của bộ mó hoỏ và giải mó CS-ACLEP

Ký hiệu Mụ tả Cỏc bit

L0

L1 Chỉ số dự bỏo MA chuyển mạch của bộ lượng tử LSP Vectơ bước đầu tiờn của bộ lượng tử LSP 1 7 Bộ lọc ngắn hạn Bảng mó cố đinh Bảng mó thớch ứng Gc Gc Bộ xử lý trạm

L2

L3 Vectơ thấp bước thứ hai của bộ lượng tử LSP Vectơ cao bước thứ hai của bộ lượng tử LSP 5 5 P1 P0 S1 C1 GA1 GB1

Độ trễ lờn giọng của khung con thứ nhất Bit chẵn lẻ dành cho độ trễ lờn giọng

Dấu của cỏc xung bảng mó cố định của khung con thứ nhất Bảng mó cố định của khung con thứ nhất

Khuếch đại bảng mó (bước 1) của khung con thứ nhất Khuếch đại bảng mó (bước 2) của khung con thứ nhất

8 1 4 13 3 4 P2 S2 C2 GA2 GB2

Độ trễ lờn giọng của khung con thứ hai

Dấu của cỏc xung bảng mó cố định của khung con thứ hai Bảng mó cố định của khung con thứ hai

Khuếch đại bảng mó (bước 1) của khung con thứ hai Khuếch đại bảng mó (bước 2) của khung con thứ hai

5 4 13 3 4 2.4. Chuẩn nộn G.729A

G.729A là thuật toỏn mó hoỏ tiếng núi tiờu chuẩn cho thoại và số liệu đồng thời số hoỏ (DDSV). G.729A là sự trao đổi luồng bit với G.729, cú nghĩa là: Tớn hiệu được mó hoỏ bằng thuật toỏn G.729A cú thể được giải mó thụng qua thuật toỏn G.729 và ngược lại. Giống như G.729, nú sử dụng thuật toỏn dự bỏo tuyến tớnh mó kớch thớch đại số được cấu trỳc liờn kết *CS-ACELP) với cỏc khung 10 ms. Tuy nhiờn một vài thuật toỏn thay đổi sẽ được giới thiệu mà kết quả của cỏc thuật toỏn này làm giảm 50% độ phức tạp.

Nguyờn lý chung của bộ mó hoỏ và giải mó G.729A giống với G.729. Cỏc thủ tục lượng tử hoỏ và phõn tớch LP của cỏc bộ khuếch đại bảng mó cố định và thớch ứng giống như G.729. Cỏc thay đổi thuật toỏn chớnh so với G.729 sẽ tổng kết như sau:

 Bộ lọc trọng số thụ cảm sử dụng cỏc tham số bộ lọc LP đó lượng tử và được biểu diễn là W(z)= A(z)/A(z/) với giỏ trị cố định =0,75.

 Phõn tớch độ lờn giọng mạch vũng hở được đơn giản hoỏ bằng cỏch sử dụng phương phỏp decimation (cú nghĩa là trớch 10 lấy 1) trong khi tớnh sự tương quan của tiếng núi trọng số.

 Cỏc tớnh toỏn phản ứng xung của bộ lọc tổng hợp trọng số W(z)/A(z), của tớn hiệu ban đầu, và việc thiết lập trạng thỏi ban đầu của bộ lọc được đơn giản hoỏ bằng cỏch thay thế W(z) bằng 1/A(z/).

 Việc tỡm bảng mó thớch ứng được đơn giản hoỏ. Việc tỡm sẽ cực đại hoỏ giỏ trị tương quan giữa kớch thớch trước và tớn hiệu ban đầu lọc trước (năng lượng của kớch thớch trước lọc là khụng đỏng kể).

 Việc tỡm bảng mó cố định được đơn giản hoỏ. Thay vỡ tỡm tập trung ở mạch vũng tổ ong, giải phỏp tỡm sơ đồ hỡnh cõy độ sõu trước được sử dụng.

Cả hai bộ mó hoỏ G.729 và G.729A đó được thử nghiệm trờn vi mạch T1 TMS320C50 DSP. Trong thử nghiệm USH, thuật toỏn mó hoỏ song cụng G.729A yờu cầu 12,4 MIPS, trong khi G.729 yờu cầu 22,3 MIPS. Việc giảm độ phức tạp của cả hai bộ mó hoỏ G.729 và G.729A được đưa ra trong bảng 2.3 cho cả hai phần mó hoỏ và giải mó. Độ phức tạp ở đõy được thể hiện qua 2 số hạng; C50 MIPS và WMOPS của thuật toỏn cơ sở. Về yờu cầu bộ nhớ G.729A yờu cầu ớt hơn 2K RAM và 10K ROM trong khi G.729 yờu cầu khoảng 2K RAM và 11K ROM. Hiển nhiờn rằng: sử dụng G.729A giảm được khoảng 50% độ phức tạp so với sử dụng G.729, với việc giảm một ớt chất lượng trong trường hợp 3 bộ đụi (mó hoỏ/giải mó) và trong trường hợp cú tạp õm nền.

Bảng 2.3. Cỏc thụng số WMOPS và MIPS của G.729 và G.729A

Chức năng WMOPS C50 MểP

G.729 G.729A G.729 G.729A (adsbygoogle = window.adsbygoogle || []).push({});

Tiền xử lý Phõn tớch Lp

Lượng tử hoỏ và nội suy LSP

Biến đổi LSP thành A(z) và trọng số Lờn giọng mạch vũng hở

Lờn giọng mạch vũng đúng Bảng mó đại số

Lượng tử hoỏ cỏc độ khuếch đại Tỡm kớch thớch và cập nhật bộ nhớ 0,20 1,63 0,95 0,30 1,45 2,83 6,35 0,46 0,21 0,20 1,28 0,95 0,12 0,82 1,55 1,86 0,46 0,08 0,226 1,957 1,390 0,461 1,563 3,453 8,406 0,643 0,278 0,226 1,696 1,390 0,173 0,955 1,778 3,046 0,643 0,112 Tổng cộng (mó hoỏ) 14,38 7,32 18,377 10,019 Giải mó Bộ lọc sau Xủ lý sau 0,68 2,13 0,22 0,68 0,73 0,22 1,133 2,539 0,266 1,133 1,000 0,226 Tổng cộng (giải mó) 3,03 1,63 3,938 2,399 Tổng cộng (mó hoỏ + giải mó) 17,14 8,95 22,315 12,418 2.5. Chuẩn nộn G.729B

G.729B đưa ra một nguyờn lý nộn im lặng tốc độ bit thấp được thiết kế và tối ưu hoỏ để làm việc chung được với cả G.729 và G.729A cú độ phức tạp thấp. Để đạt được việc nộn im lặng tốc độ bit thấp chất lượng tốt, một mụđun cú bộ dũ hoạt động khung thoại cơ bản là yếu tố cần thiết để dũ cỏc khung thoại khụng tớch cực gọi là cỏc khung tạp õm nền hoặc khung im lặng. Thụng qua mođun truyền giỏn đoạn để quyết

định sự thay đổi của khung im lặng đú cần thiết hay khụng để duy trỡ chất lượng tỏi tạo của tạp õm nền tại đầu thu. Nếu mụđun truyền giỏn đoạn quyết định cú một khung được yờu cầu, cỏc tham số năng lượng và phổ mụ tả cỏc đặc tớnh cảm nhận của tạp õm nền được mó hoỏ và truyền đi một cỏch hiệu quả dựng 15b/khung. Tại đầu thu, mụđun tạo tạp õm phự hợp sẽ tạo tạp õm nền đầu ra sử dụng tham số cập nhật đó phỏt hoặc cỏc tham số cú trước đú. Tạp õm nền tổng hợp đạt được bằng cỏch lọc dự bỏo tuyến tớnh tớn hiệu kớch thớch tạp giả trắng được tạo ra trong nội bộ của mức điều khiển. Phương phỏp mó hoỏ tạp õm nền cú tốc độ 4kbit/s trong cuộc đàm thoại tiếng núi bỡnh thường để duy trỡ chất lượng tỏi tạo.

Sử dụng cụng nghệ nộn im lặng mang lại hiệu quả rất cao trong hội thoại. Theo thống kờ trong một cuộc đàm thoại thỡ thời gian im lặng chiếm đến 60%, vỡ vậy khi khụng cú tiếng núi tốc độ bớt cú thể giảm, giải phúng dung lượng kờnh cho cỏc ứng dụng xảy ra đồng thời một cỏch đỏng kể. Mức và đặc tớnh ồn cú thể thay đổi đỏng kể đến tốc độ bớt, tuy nhiờn hầu hết cỏc nguồn tạp õm thường mang ớt thụng tin hơn tiếng, vỡ vậy, trong cỏc chu kỳ khụng tớch cực tỷ số nộn sẽ cao hơn. Nhiều ứng dụng điển hỡnh. Vớ dụ hệ thống toàn cầu đối với điện thoại di động GSM, sử dụng việc dũ tỡm chu kỳ im lặng và chốn tạp õm phự hợp để tạo được hiệu quả mó hoỏ cao hơn.

Xuất phỏt từ quan niệm về dũ tỡm im lặng và chốn tạp õm phự hợp dẫn tới cỏc cụng nghệ mó hoỏ tiếng mẫu kộp. Cỏc mẫu khỏc nhau bởi tớn hiệu đầu vào, được biểu thị là: thoại tớch cực đối với tiếng núi và là thoại khụng tớch cực đối với im lặng hoặc tạp õm nền, được xỏc định bởi sự phõn loại tớn hiệu. Sự phõn loại này cú thể được thực hiện bờn trong hoặc bờn ngoài bộ mó hoỏ tiếng núi. Bộ mó hoỏ tiếng toàn tốc cú thể cú tỏc dụng trong quỏ trỡnh tiếng thoại tớch cực, sử dụng bit ớt hơn và tạo ra tỷ số nộn trung bỡnh cao hơn. Sự phõn loại này được gọi chung là bộ dũ hoạt động thoại (VAD: Voice Activity Detector) và đầu ra của bộ này gọi là mức hoạt động thoại. Mức hoạt động thoại là 1 khi cú mặt hoạt động thoại và là 0 khi khụng cú hoạt động thoại.

Thuật toỏn VAD và bộ mó hoỏ tiếng núi khụng tớch cực, giống với cỏc bộ mó hoỏ G.729 và G.729A, được thực hiện trờn cỏc khung của tiếng núi đó được số hoỏ. Để phự hợp, kớch thước cỏc khung giống nhau được dựng cho mọi sơ đồ và khụng cú độ trễ thờm vào được toạ ra bởi thuật toỏn VAD hoặc bộ mó hoỏ thoại khụng tớch cực. Sơ đồ mụ tả hệ thống thụng tin tiếng núi dựng VAD và bộ mó hoỏ khụng tớch cực đối với

tốc độ nộn cao hơn được trỡnh bày ở hỡnh 2.5. Đầu vào bộ mó hoỏ là tớn hiệu thoại đó được số hoỏ. Với mỗi khung tiếng núi đầu vào VAD đưa ra mức hoạt động thoại, cỏc mức này được dựng như một chuyển mạch giữa cỏc bộ mó hoỏ thoại tớch cực và thoại khụng tớch cực. Khi bộ mó hoỏ thoại tớch cực cú tỏc dụng, luồng bit thoại tớch cực sẽ gửi tới bộ giải mó tớch cực cho mỗi khung. Tuy nhiờn, trong cỏc chu kỳ khụng tớch cực, bộ mó hoỏ thoại khụng tớch cực cú thể được chọn để gửi cỏc thụng tin mới nhất gọi là bộ mụ tả việc chốn im lặng (SID: silence Insertion Descriptor) tới bộ giải mó khụng tớch cực hoặc khụng gửi gỡ cả. Kỹ thuật này cú tờn là truyền giỏn đoạn (DTX: Discontinuous Transmission). Với mỗi khung, đầu ra của mỗi bộ giải mó được dựng làm tớn hiệu khụi phục.

Hỡnh 2.5 Hệ thống thụng tin tiếng núi cú bộ VAD 2.6. Chuẩn nộn G.723.1

Khuyến nghị G.723.1 đưa ra một bộ mó hoỏ tiờu chuẩn dựng để nộn tớn hiệu tiếng núi hoặc cỏc tớn hiệu audio khỏc của cỏc dịch vụ đa phương tiện tại tốc độ rất thấp, giống với phần tiờu chuẩn của họ H.323.

Bộ giải mó tớn hiệu thoại khụng tớch cực Bộ giải mó tớn hiệu thoại tớch cực Kờnh thụng tin Bộ mó hoỏ tớn hiệu thoại khụng tớch cực Bộ mó hoỏ tớn hiệu thoại khụng tớch cực VAD Luồng tớn hiệu thoại tớch cực Luồng tớn hiệu thoại khụng tớch cực Tiếng núi khụi phục Luồng tớn hiệu thoại tớch cực Mức quyết định VAD Tiếng núi đầu vào

Về tốc độ bit: Bộ mó hoỏ này cú 2 tốc độ bit 5,3 kbit/s và 6,3kbit/s. Bộ mó hoỏ cú tốc độ bit cao hơn sẽ cú chất lượng cao hơn. Bộ mó hoỏ cú tốc độ bit thấp, chất lượng tốt và cộng thờm tớnh linh hoạt, cung cấp cho cỏc nhà thiết kế hệ thống. Bộ mó hoỏ và giải mó bắt buộc phải cú cả 2 tốc độ bit này. Chỳng cú thể chuyển mạch được giữa 2 tốc độ bit tại bất kỳ đường biờn nào đú của khung. Khi tớn hiệu là phi thoại thỡ cú thể lựa chọn một tốc độ bit biến thiờn để truyền khụng liờn tục và điều khiển những khoảng trống.

Tớn hiệu đầu vào của bộ mó hoỏ tối ưu hoỏ tớn hiệu với chất lượng cao tại cỏc tốc độ bit đó núi ở trờn với một độ hạn chế về độ phức tạp. Bộ mó hoỏ mó hoỏ tiếng núi và cỏc tớn hiệu audio khỏc với cỏc khung dựng kỹ thuật mó hoỏ phõn tớch bằng tổng hợp dự bỏo tuyến tớnh. Tớn hiệu kớch thớch của bộ mó hoỏ tốc tộ bit cao hơn là lượng tử hoỏ cực đại đa xung (MP-MLQ), cũn đối với bộ mó hoỏ cú tốc độ bit thấp hơn là dự đoỏn tuyến tớnh kớch thớch mó đại số (ACELP). Kớch thớch khung là 30 ms, cộng thờm 7,5 ms look-ahead, tạo ra trễ xử lý, trễ truyền dẫn trờn cỏc đường truyền thụng tin và trễ đệm của cỏc giao thức ghộp kờnh.

2.6.1. Nguyờn lý bộ mó hoỏ G.723.1

Tớn hiệu PCM 64 kbit/s đầu vào (theo quy luật A hoặc ) qua bộ mó hoỏ lấy mẫu tại tần số 8 kHz, sau đú qua bộ chuyển đổi thành tớn hiệu PCM đều 16 bit đưa tới đầu vào bộ mó hoỏ. Tớn hiệu đầu ra bộ giải mó sẽ được chuyển đổi thành tớn hiệu PCM (theo quy luật A hoặc ) theo đỳng tớn hiệu đầu vào. Cỏc đặc tớnh đầu vào/đầu ra khỏc giống như tớn hiệu PCM 64 kbit/s (theo khuyến nghị ITU G.711) sẽ được chuyển đổi thành tớn hiệu PCM đều 16 bit tại đầu vào bộ mó hoỏ, hoặc tớn hiệu PCM đều 16 bit sẽ được chuyển đổi thành tớn hiệu ra PCM theo đỳng luật của tớn hiệu đầu vào bộ giải mó sẽ được trỡnh bày chi tiết sau.

Bộ mó hoỏ dựa trờn nguyờn lý bộ mó hoỏ phõn tớch bằng tổng hợp dự bỏo tuyến tớnh và cực tiểu hoỏ sai số cú tớnh trọng số thụ cảm. Bộ mó hoỏ thực hiện theo từng khung 240 mẫu. Điều này tương đương với chu kỳ khung là 30 ms và tần số lấy mẫu là 8 kHz. Tại mỗi khối, đầu tiờn tớn hiệu được đưa qua bộ lọc thụng cao để loại bỏ thành phần tớn hiệu một chiều DC và sau đú được chia thành 4 khung con. Với mỗi khung con, sử dụng tớn hiệu đầu vào chưa xử lý để tớnh toỏn bộ lọc mó hoỏ dự bỏo tuyến tớnh

bậc 10 (LPC). Bộ lọc LPC của khung con cuối cựng sẽ được lượng tử hoỏ bằng phương phỏp lượng tử hoỏ vectơ phõn chia dự bỏo (PSVQ). Cỏc hệ số LPC chưa được lượng tử sẽ được dựng để khụi phục bộ lọc trọng số thụ cảm ngắn hạn.

Với mỗi cặp phõn khung (120 mẫu), sẽ sử dụng tớn hiệu tiếng núi trọng số để tớnh toỏn chu kỳ lờn giọng tiếng núi mạch vũng kớn LOL. Chu kỳ lờn giọng tiếng núi được tớnh trong khoảng từ 18 đến 142 mẫu. Sau đú tớn hiệu tiếng núi sẽ được xử lý theo từng phõn khung cơ bản 60 mẫu.

Sử dụng đỏnh giỏ chu kỳ lờn giọng tiếng núi trước để khụi phục bộ lọc dạng ồn nền. Phản ứng xung được tạo bởi việc đấu nối bộ lọc tổng hợp LPC, bộ lọc cú tớnh trọng số thụ cảm định dạng và bộ lọc dạng tạp õm nền. Người ta sử dụng phản ứng xung này cho cỏc phộp tớnh toỏn tiếp sau.

Bộ dự đoỏn chu kỳ lờn giọng mạch vũng kớn được tớnh toỏn bằng cỏch sử dụng đỏnh giỏ chu kỳ lờn giọng, LOL, và phản ứng xung. Người ta sử dụng bộ dự đoỏn lờn giọng bậc 5. Chu kỳ lờn giọng sẽ được tớnh là gần đỳng giỏ trị vi sai nhỏ của đỏnh giỏ lờn giọng mạch vũng hở. Thành phần thờm vào bộ dự đoỏn lờn giọng sau đú sẽ được loại bỏ khỏi vectơ ban đầu. Cả hai giỏ trị chu kỳ lờn giọng và giỏ trị vi sai của nú sẽ được truyền về phớa bộ giải mó.

Cuối cựng, cỏc thành phần khụng được dự đoỏn của tớn hiệu kớch thớch sẽ được lấy gần đỳng. Bộ mó hoỏ cú tốc độ bit cao, người ta sử dụng giỏ trị kớch thớch lượng tử hoỏ gần đỳng cực đại đa xung (MP-MLQ). Cũn đối với bộ mó hoỏ cú tốc độ bit thấp, người ta sử dụng giỏ trị kớch thớch mó đại số (ACELP).

2.6.2. Nguyờn lý bộ giải mó G.723.1

Bộ giải mó được thực hiện trờn nguyờn lý cơ bản từng khung. Đầu tiờn cỏc chỉ số của bộ lọc LPC sẽ được giải mó, sau đú bộ giải mó sẽ khụi phục bộ lọc tổng hợp LPC. Đối với mỗi phõn khung, cả hai giỏ trị kớch thớch bảng mó cố định và giỏ trị kớch

Một phần của tài liệu Xây dựng hệ thống hội nghị truyền hình chất lượng cao trên mạng IP (Trang 42)