Chuẩn nộn G.723.1

Một phần của tài liệu Nghiên cứu công nghệ truyền thoại qua Internet sử dụng giao thức TCP IP (VoIP) (Trang 78)

Khuyến nghị G.723.1 đưa ra một bộ mó hoỏ tiờu chuẩn dựng để nộn tớn hiệu tiếng núi hoặc cỏc tớn hiệu audio khỏc của cỏc dịch vụ đa phương tiện tại tốc độ rất thấp, giống với phần tiờu chuẩn của họ H.323.

Về tốc độ bit: Bộ mó hoỏ này cú hai tốc độ bit: 5,3 kbps và 6,3 kbps. Bộ mó hoỏ cú tốc độ cao hơn sẽ cú chất lượng tốt và, cộng thờm tớnh linh hoạt, cung cấp cho cỏc nhà thiết kế hệ thống. Bộ mó húa và giải mó bắt buộc phải cú cả hai tốc độ bit này. Chỳng cú thể chuyển mạch được giữa hai tốc độ bit tại

lựa chọn một tốc độ bit biến thiờn để truyền khụng liờn tục và điều khiển những khoảng trống.

Tớn hiệu đầu vào cú thể cú của bộ mó hoỏ này tối ưu hoỏ tớn hiệu tiếng núi với chất lượng cao tại cỏc tốc độ bit đó núi ở trờn với một độ hạn chế về độ phức tạp. Bộ mó hoỏ này dựng để mó hoỏ tiếng núi và cỏc tớn hiệu audio khỏc với cỏc khung dựng kỹ thuật mó hoỏ phõn tớch bằng tổng hợp dự bỏo tuyến tớnh. Tớn hiệu kớch thớch, đối với bộ mó hoỏ tốc độ bit cao hơn, là lượng tử hoỏ đỳng cực đại đa xung (MP-MLQ: Multipulse Maximum Likelihood Quantilization) và đối với bộ mó hoỏ cú tốc độ bit thấp hơn, là dự đoỏn tuyến tớnh kớch thớch mó đại số (ACELP). Kớch thớch khung là 30ms, cộng thờm 7,5ms look-ahead, tạo ra trễ xử lý thuật toỏn tổng cộng là 37,5ms. Toàn bộ trễ thờm vào bộ mó hoỏ là tổng của: Trễ xử lý, trễ truyền dẫn trờn cỏc đường truyền thụng tin và trễ đệm của cỏc giao thức ghộp kờnh.

Nguyờn lý bộ mó hoỏ G.723.1

Tớn hiệu PCM 64kbps đầu vào (theo luật A hoặc à) qua bộ mó hoỏ này được lấy mẫu tại tần số 8kHz, sau đú qua bộ chuyển đổi thành tớn hiệu PCM đều 16 bit đưa tới đầu vào bộ mó hoỏ. Tớn hiệu đầu ra bộ giải mó sẽ được chuyển đổi thành tớn hiệu PCM theo đỳng tớn hiệu đầu vào. Cỏc đặc tớnh đầu vào/ đầu ra khỏc, giống như của tớn hiệu PCM 64kbps (theo khuyến nghị ITU G.711), sẽ được chuyển đổi thành tớn hiệu PCM đều 16 bit tại đầu vào bộ mó hoỏ, hoặc tớn hiệu PCM đều 16 bit sẽ được chuyển đổi thành tớn hiệu ra PCM theo đỳng quy luật của tớn hiệu đầu vào ở bộ giải mó. Bộ mó hoỏ dựa trờn nguyờn lý bộ mó hoỏ phõn tớch bằng tổng hợp dự bỏo tuyến tớnh và cố gắng cực tiểu húa sai số cú tớnh trọng số thụ cảm. Bộ mó hoỏ thực hiện theo từng khung 240 mẫu. Điều này tương đương với chu kỳ khung là 30ms và tần số lấy mẫu là 8kHz. Tại mỗi khối, đầu tiờn tớn hiệu được đưa qua bộ lọc thụng cao để loại bỏ thành phần tớn hiệu một chiều DC và sau đú được chia thành 4 khung con. Với mỗi khung con sử dụng tớn hiệu đầu vào chưa xử lý để tớnh toỏn bộ lọc mó hoỏ dự bỏo tuyến tớnh bậc 10 (LPC). Bộ lọc LPC của khung con cuối cựng sẽ được lượng tử hoỏ bằng phương phỏp lượng tử hoỏ vectơ phõn chia dự bỏo (PSVQ: Predictive Split Vector Quantizer). Cỏc hệ số LPC chưa được lượng tử sẽ được dựng để khụi phục bộ lọc trọng số thụ cảm ngắn hạn.

Với mỗi hai phõn khung (120) mẫu, sẽ sử dụng tớn hiệu tiếng núi trọng số để tớnh toỏn chu kỳ lờn giọng tiếng núi mạch vũng kớn, LOL. Chu kỳ lờn giọng tiếng núi được tớnh trong khoảng từ 18 đến 142 mẫu.

Sau đú tớn hiệu tiếng núi sẽ được xử lý theo từng phõn khung cơ bản 60 mẫu.

Sử dụng đỏnh giỏ chu kỳ lờn giọng tiếng núi trước để khụi phục bộ lọc dạng ồn súng hài. Phản ứng xung được tạo bởi việc đấu nối bộ lọc tổng hợp LPC, bộ lọc cú tớnh trọng số thụ cảm formant và bộ lọc dạng tạp õm súng hài. Người ta sử dụng phản ứng xung này cho cỏc phộp tớnh toỏn tiếp sau.

Bộ dự đoỏn chu kỳ lờn giọng mạch vũng kớn được tớnh toỏn bằng cỏch sử dụng đỏnh giỏ chu kỳ lờn giọng, LOL và phản ứng xung. Người ta sử dụng bộ dự đoỏn lờn giọng bậc 5. Chu kỳ lờn giọng sẽ được tớnh là gần đỳng giỏ trị vi sai nhỏ của đỏnh giỏ lờn giọng mạch vũng hở. Thành phần thờm vào bộ dự đoỏn lờn giọng sau đú sẽ được loại bỏ khỏi vectơ ban đầu. Cả hai giỏ trị chu kỳ lờn giọng và giỏ trị vi sai của nú sẽ được truyền về phớa bộ giải mó.

Cuối cựng, cỏc thành phần khụng được dự đoỏn của tớn hiệu kớch thớch sẽ được lấy gần đỳng. Đối với bộ mó hoỏ cú tốc độ bớt cao, người ta sử dụng giỏ trị kớch thớch lượng tử hoỏ gần đỳng cực đại đa xung (MP-MLQ) và đối với bộ mó hoỏ cú tốc độ bit thấp, người ta sử dụng giỏ trị kớch thớch mó đại số (ACELP).

Nguyờn lý bộ giải mó G.723.1

Bộ giải mó được thực hiện trờn nguyờn lý cơ bản từng khung. Đầu tiờn cỏc chỉ số của bộ lọc LPC sẽ được giải mó, sau đú bộ giải mó sẽ khụi phục bộ lọc tổng hợp LPC. Đối với mỗi phõn khung, cả hai giỏ trị kớch thớch bản mó cố định và giỏ trị kớch thớch bảng mó thớch ứng sẽ được giải mó và đưa tới đầu vào bộ lọc tổng hợp LPC. Bộ lọc sau thớch ứng bao gồm formant và bộ lọc sau lờn giọng phớa sau-phớa trước (forward-backward). Tớn hiệu kớch thớch sẽ được đưa tới đầu vào bộ lọc sau lờn giọng, đầu ra bộ lọc sau lờn giọng được đưa tới đầu vào bộ lọc tổng hợp, và đầu ra bộ lọc tổng hợp sẽ được đưa tới đầu vào bộ lọc sau formant (formant posfilter).

4.4.7. Chuẩn nộn GSM 06.10 ( Global System for Mobile )

Đầu vào bộ nộn GSM 06.10 bao gồm cỏc khung 160 mẫu cỏc tớn hiệu PCM tuyến tớnh lấy mẫu tại tần số 8kHz. Chu kỳ mỗi khung là 20 ms, khoảng một chu kỳ thanh mụn đối với những người cú giọng núi cực thấp, và khoảng mười chu kỳ thanh mụn đối với những người cú giọng núi cực cao. Đõy là khoảng thời gian rất ngắn và trong khoảng này súng tiếng núi thay đổi khụng nhiều lắm. Độ trễ truyền dẫn thụng tin được tớnh bằng tổng thời gian xử lý và

Bộ mó hoỏ thực hiện nộn một khung tớn hiệu đầu vào 160 mẫu (20ms) vào một khung 260 bit. Như vậy một giõy nú sẽ thực hiện nộn được 13.103 bit (tương đương với 1625 byte). Do vậy để nộn một megabyte tớn hiệu chỉ cần một thời gian chưa đầy 10 phỳt.

Trung tõm của quỏ trỡnh xử lý tớn hiệu là bộ lọc. Đầu ra bộ lọc phụ thuộc rất nhiều vào giỏ trị đầu vào đơn của nú. Khi cú một dóy cỏc giỏ trị đưa qua bộ lọc thỡ dóy tớn hiệu này sẽ được dựng để kớch thớch bộ lọc. Dạng của bộ nộn GSM 06.10 dựng để nộn tớn hiệu tiếng núi bao gồm hai bộ lọc và một giỏ trị kớch thớch ban đầu. Bộ lọc ngắn hạn dự bỏo tuyến tớnh, được đặt tại tầng đầu tiờn của quỏ trỡnh nộn và tại tầng cuối cựng trong suốt quỏ trỡnh gión, được giả sử tuõn theo quy luật õm thanh của mũi và cơ quan phỏt thanh. Nú được kớch thớch bởi đầu ra của bộ lọc dự bỏo dài hạn (LTP: long-term predictor).

4.4.8. Khử tiếng vọng

Trong mạng IP đường truyền tiếng vọng là đường trũn (round –trip) và tạo ra do mạch hybrid (chuyển 2 dõy-4 dõy) ,mặt khỏc tớn hiệu sẽ tớch luỹ qua cỏc quỏ trỡnh xử lý (mó húa và giải mó ,đúng gúi và giải đú gúi ) và truyền dẫn tớn hiệu. Vỡ vậy tiếng vọng là một trong những yếu tố chủ yếu ảnh hưởng đến chất lượng cuộc thoại trờn mạng Internet .

Thụng thường việc khử tiếng vọng được thực hiện trong cỏc Gateway và khối này tuõn theo cỏc khuyến nghị G.165 và G.167. Hỡnh 1.3 sau đõy mụ tả đường truyền của tớn hiệu trờn đú cú cỏc mạch triệt tiếng vọng.

Hỡnh 4.4: Mạch triệt tiếng vọng Ec ho Canceller Speech Decoding Packe t Buffer Speech Encoding Ec ho Canceler Speech Decoding Packe t Buffer Speech Encoding Echo - + Echo - + Packet Transmission Telephone Telephone

4.3. Trễ và vấn đề giảm thiểu độ trễ

trong toàn bộ quỏ trỡnh xử lý gúi tin trong VOIP

Thứ Loại trễ

Cỏc nguồn của trễ

Về cơ bản, cú 10 bước

cú thể gõy ra trễ theo thứ tự xuất hiện của chỳng theo thời gian được liệt kờ trong bảng sau:

tự

1 Trễ ghi õm bờn truyền ( Transmitter Recording ) 2 Trễ mó hoỏ ( Encode )

3 Trễ nộn ( Compresion )

4 Trễ bộ đệm Modem ( Transmitter Modem ) 5 Trễ Internet (adsbygoogle = window.adsbygoogle || []).push({});

6 Trễ bộ đệm nhận ( Receiver buffer ) 7 Trễ Jitter ( Jitter buffer )

8 Trễ giải nộn ( Decompression ) 9 Trễ giải mó ( Decode )

10 Trễ phỏt lại ( Playback )

Trễ ghi õm bờn truyền:

oàn bộ quỏ trỡnh gửi thoại qua Internet. Khụng iống

:

hoảng 15 - 30m. Đú là bởi vỡ dữ liệu tiếng núi thường Đõy là trễ đầu tiờn trong t

g trong mạng PSTN, trong đú tớn hiệu thoại gần như tức thời vỡ cỏc gúi khụng cần phải định dạng, trong VOIP, cỏc gúi tin phải được xử lý rất cẩn thận trước khi chỳng được truyền trờn Internet. Hệ thống phải ghi õm một số lượng tớn hiệu nào đú trước khi cú thể bắt đầu làm mọi việc khỏc. Điều kiện lý tưởng khi mà số liệu ngay lập tức được xử lý, tuy nhiờn việc này gõy ra nhiều phiền toỏi, trễ này thường cỡ 20ms. Chỳng tồn tại trực tiếp trong cấu hỡnh PC - PC và tồn tại ở cỏc Gateway khi chuyển đổi từ mạng PSTN sang mạng IP trong cấu hỡnh PC - Phone.

Trễ mó hoỏ

Trễ mó hoỏ k

chiếm một khụng gian dung lượng và giải thụng cần thiết rất lớn. Do đú, chỳng cần phải được nộn lại trước khi truyền. Thực tế, tuy cú cỏc phần mềm khỏ tinh xảo hiện nay nhằm hạn chế tối đa sự trễ này nhưng thế hệ cỏc PC và cỏc hệ

Trong vài năm tới, chỳng ta hy vọng sẽ cú cỏc bộ vi xử lý riờng phục vụ cho cỏc ứng dụng này một cỏch chuyờn nghiệp hơn.

Trễ do bộ vi xử lý và do quỏ trỡnh đúng gúi cỏc số liệu:

à rất nhỏ (bit) với

n trờn Internet, chỳng cũng khụng thể ngay

cơ sở hạ tầng của mạng Internet hiện nay được sử dụng Cỏc chip vi xử lý cú đơn vị dữ liệu cú thể hiểu và xử lý l

so cỏc móu thoại (byte). Trong khi cỏc mẫu thoại được chia thành cỏc mẫu chiếm khỏ nhiều dung lượng, cỏc bộ vi xử lý này khụng thể tớnh toỏn một cỏch tức thỡ, bộ vi xử lý càng nhanh thỡ độ trễ tớnh toỏn do chỳng gõy ra càng nhỏ. Hơn nữa, trong bước này số liệu tiếng núi phải được tạo khuụn dạng để cú thể truyền đi được trờn Internet gọi là quỏ trỡnh đúng gúi dữ liệu. Cỏc dữ liệu phải được sắp xếp, đúng khung, thờm phần tiờu đề như địa chỉ đớch, địa chỉ nguồn, cỏc thụng số đường truyền và định tuyến ... Cỏc bước này cũng gõy ra trễ.

Trễ do Modem bờn truyền:

Khi dữ liệu đó sẵn sàng truyề

lập tức truyền trờn mạng được, vỡ nú cũn phụ thuộc vào tốc độ đường truyền. Tuy nhiờn, cỏc tớn hiệu mà mỏy tớnh hiểu được là khỏc với cỏc tớn hiệu được truyền trờn mạng điện thoại. Cỏc mỏy tớnh hiểu và xử lý tớn hiệu số trong khi mạng điện thoại lại chỉ cho phộp truyền cỏc tớn hiệu tương tự trờn nú. Do đú cần cú một thiết bị chuyển đổi từ cỏc tớn hiệu số sang dạng tương từ, đú chớnh là Modem (MOdulation - DEModulation). Trong giai đoạn này, modem cũng cần thực hiện cỏc tớnh toỏn để cỏc tớn hiệu số cú thể được chuyển dổi thành dạng tương tự theo cỏc quy tắc nhất định, như việc điều chế theo luật gỡ, ghộp kờnh ra sao ... Cỏc quỏ trỡnh này cũng gõy ra trễ, gọi là trễ Modem. Mặc dự cỏc trễ này khỏ thấp nhưng chỳng cũng gúp phần vào tổng độ trễ chung toàn hệ thống. Hơn nữa, cỏc trễ này khụng chỉ xảy ra một lần mà cũn xảy ra tới bốn lần trong một kết nối hai chiều ( 2 lần đi và lần về ). Tất nhiờn, trễ modem chỉ tồn tại trong cỏc cấu hỡnh cú sự tham gia của PC, vỡ trong cỏc cấu hỡnh trực tiếp với điện thoại là đầu cuối thỡ khụng cần modem vỡ chỳng cú thể được kết nối trực tiếp vào đường điện thoại và do đú khụng cú trễ. Trễ modem xảy ra ở bước này gọi là trễ modem bờn truyền để phõn biệt với trễ modem bờn nhận sau này.

Trễ Internet:

Trễ Internet do

cho tất cả cỏc loại hỡnh dịch vụ trờn cơ sở IP chứ khụng riờng cho thoại. Cỏc ứng dụng khỏc như email, Web, FTP ... cựng chia sẻ băng thụng của mạng, làm cho việc truyền cỏc gúi tin trở nờn chậm chạp. Trong một mạng cơ sở hạ tầng tốt thỡ trễ này sẽ giảm đi đỏng kể vỡ nú gõy ra khả năng sai lỗi ớt, tốc độ truyền

nhanh hơn, ớt khả năng yờu cầu phỏt lại gúi tin. hơn nữa trễ này cũn gõy ra một vấn đề rất đặc trưng trong mạng VOIP, đú là Jitter.

Trễ bộ đệm Jitter:

m để chỉ sự đến cỏch nhau khụng đồng đều về mặt ời gi

Khi dữ liệu đến bờn nhận, nú phải được

c giải nộn và mó hoỏ để tỏi tạo lại tớn hiệu

ận được dưới dạng số hoỏ cần phải được chuyển đổi thành ạng t

rong cỏc nguyờn nhõn gõy trễ trờn ta đó giả thiết nghiờn cứu một cỏch ng q (adsbygoogle = window.adsbygoogle || []).push({});

rờn Internet, chỳng cần được chặt ra itter là một khỏi niệ

th an của cỏc gúi tin IP. Đối với cỏc ứng dụng khỏc thỡ việc cỏc gúi tin đến khụng đều nhau thực sự khụng gõy ảnh hưởng nhiều đến chất lượng dịch vụ vỡ việc này chỉ gõy ra sự chậm trễ trong việc sắp xếp lại gúi tin, xử lý gúi tin. Nhưng trong VOIP, vấn đề thời gian thực sự được quan tõm hàng đầu. Cỏc gúi tin được định tuyến theo cỏc con đường khỏc nhau để đến đớch, do đú khụng cú gỡ đảm bảo chỳng đến đều nhau. Để giải quyết vấn đề này cần sử dụng bộ đệm ( Jitter buffer ). Do đú đõy cũng là một nguồn trễ, trễ bộ đệm Jitter.

Trễ bộ đệm modem bờn nhận:

Tương tự trễ modem bờn truyền.

chuyển đổi lại dạng số và việc này gõy ra trễ.

Trễ giải nộn và mó hoỏ:

Ở nơi nhận, dữ liệu cần đượ

ban đầu, việc này gõy ra một khoảng trễ nào đú.

Trễ phỏt lại:

Cỏc gúi tin nh

d ương tự để cú thể phỏt ra õm thanh đến người nghe qua loa. Sự chuyển đổi số - tương tự này được thực hiện bởi soundcard và phần mềm điều khiển (driver). Đõy là nguồn trễ cuối cựng mà hệ thống phải chịu, trễ này thường cỡ 150ms.

T

tổ uỏt cho cỏc ứng dụng VOIP với sự cú mặt của cỏc PC, cú loại trễ mang tớnh khỏch quan, cú lại trễ lại cú thể khắc phục bằng thiết kế, bằng cỏc giải thuật và cú loại trễ chỉ tồn tại trong cỏc cấu hỡnh với sự cú mặt của PC.

4.4. VẤN ĐỀ GIẢM THIỂU HOÁ NGUỒN TRỄ. 4.4.1. Tối thiểu hoỏ ghi õm bờn truyền

Cỏc tớn hiệu thoại, để cú truyền t

thành cỏc mảnh nhỏ, nộn, mó hoỏ và đúng thành cỏc khung, cỏc khung này sau đú lại được tổ chức thành cỏc gúi (thường gồm từ 2 – 4 khung). Cỏc gúi này được cộng thờm cỏc thụng tin điều khiển, chẳng hạn cỏc thụng tin về địa chỉ trạm đầu, trạm cuối, cỏc thụng tin về dịch vụ ... Cỏc thụng tin này là cần thiết

nhiờn cỏc thụng tin này khụng bao gồm thụng tin về tớn hiệu thoại. Do đú, chỳng làm giảm hiệu suất thực tế truyền dữ liệu. Cú thể giải quyết vấn đề này bằng cỏch truyền nhiều khung nhất cú thể trong một gúi tin nhưng điều đú lại làm cho việc phải đợi một lượng lớn thụng tin đến trước khi được xử lý, gõy ra trễ ghi õm bờn truyền nhiều hơn. Như đó trỡnh bày, tiếng núi được xử lý nhờ cỏc sản phẩm phần mềm gọi là bộ mó hoỏ/giải mó, trước khi được truyền trờn Internet. Do đú giải phỏp tốt nhất là sử dụng cỏc bộ mó hoỏ/giải mó cú khả năng nộn tiếng núi xuống tốc độ thấp nhất cú thể. Một đặc trưng quan trọng khỏc của cỏc bộ mó hoỏ đú là kớch thước khung nhỏ nhất cú thể được sử dụng. Việc xử lý cỏc khung càng nhỏ càng làm giảm độ trễ ghi õm vỡ yờu cầu thời

Một phần của tài liệu Nghiên cứu công nghệ truyền thoại qua Internet sử dụng giao thức TCP IP (VoIP) (Trang 78)