Để thống nhất trong việc truyền dẫn tớn hiệu núi chung và tớn hiệu thoại núi riờng, ITU - T đưa ra cỏc chuẩn mó hoỏ thoại phự hợp cho cỏc phương phỏp truyền thoại. Cỏc chuẩn này nằm trong chuỗi khuyến nghị G của ITU- T: G.711 (PCM 64kb/s), G.722 (Wideband Coder), G.723.1 (MPC-MLQ), G.726 (ADPCM), G.728 (LD-CELP), G.729/G.729A (CS-ACELP).
Mỗi phương phỏp nộn cú đặc điểm riờng và được chọn sử dụng trong những điều kiện cụ thể của mạng. Để đỏnh giỏ cỏc phương phỏp nộn này, ta xem xột chỳng theo 4 đặc điểm:
o Tốc độ bit (bit rate): Tốc độ bit là một đặc tớnh đầu tiờn được nghĩ đến khi núi về một phương phỏp nộn thoại, nú biểu hiện mức độ nộn tớn hiệu của phương phỏp. Cỏc chuẩn nộn thoại trờn cho cỏc tốc độ bit từ 6,4Kps/5,3Kbps (G.723.1) đến 64 Kbps (G.711).
o Độ trễ (Delay): Độ trễ là một đặc tớnh rất quan trọng đối với một ứng dụng truyền thụng thời gian thực. Phương phỏp nộn cho tốc độ bit thấp thường cú độ trễ cao. Để cú thể nộn tớn hiệu, dũng thoại nhất thiết phải được chia thành cỏc khung rồi tiến hành nộn thụng tin của cỏc khung theo một thuật toỏn nào đú. Phương phỏp nộn cú tỷ số nộn cao thường đũi hỏi khung thoại phải lớn. Do vậy, độ trễ là một yếu tố phụ thuộc vào tốc độ bit và kớch thước khung thoại. Khung thoại càng lớn và tốc độ bit càng thấp thỡ độ trễ càng cao.
o Độ phức tạp (Complexity): Nộn thoại được thực hiện bởi những bộ DSP (Digital Speech Proccessor) hay bởi những CPU trong mỏy tớnh. Độ phức tạp của phương phỏp nộn được thể hiện ở số phộp tớnh mà DSP hoặc CPU cần thực hiện trong một đơn vị thời gian (MIPS - Millions of Instruction per Second) và số lượng bộ nhớ cần thiết cho thuật toỏn nộn. Độ phức tạp của phương phỏp liờn quan đến giỏ thành của thiết bị.
o Chất lượng tớn hiệu (Quality): Chất lượng tớn hiệu thoại liờn quan đến tỷ số tớn hiệu trờn tạp õm S/N của tớn hiệu tương tự hay hệ số lỗi bit BER của dũng thoại số tuyến tớnh đầu vào. Với những phương phỏp nộn tớn hiệu xuống tốc độ thấp, phương phỏp mó hoỏ dựa trờn mụ hỡnh phỏt õm. Mụ hỡnh này khụng cú khả năng kết hợp tớn hiệu thoại với cỏc loại tớn hiệu khỏc (nhiễu). Kết quả là chất lượng õm thanh tạo lại giảm mạnh trong điều kiện nhiễu nền lớn.
Hiện tượng này được đặc trưng bởi độ trung thực trờn nhiễu (robustness to background noise). Hiện tượng này đều được thấy ở cỏc phương phỏp nộn tớn hiệu dưới 16Kbps.
Để so sỏnh chất lượng tớn hiệu của cỏc phương phỏp nộn tốc độ thấp, người ta thường dựng chỉ số MOS theo thang từ 0 (mức chất lượng thấp nhất) tới 5 (chất lượng lớ tưởng).
Dưới đõy là cỏc tổng kết cỏc đặc tớnh của cỏc phương phỏp nộn thoại thường được sử dụng trong cỏc hệ thống VoIP (bảng 3.1):
Tốc độ nộn (Kbps) Tài nguyờn CPU cần thiết Chất lượng tiếng núi Độ trễ thuật toỏn (ms) G.711 PCM 64 Khụng cần Rất tốt <<1 G.722 ADPCM 48/56/64 Thấp Rất tốt (64) <<2 G.723.1 MP- MLQ 6,4/5,3 Trung bỡnh Tốt (6,4) Khỏ tốt (5,3) 67-97 G.726 ADPCM 40/32/24 Thấp Khỏ tốt (24) Tốt (40) 60 G.728 LD- CELP 16 Rất cao Tốt <<2 G.729 CS- ACELP 8 Cao Tốt 25-35
Bảng 3.1. Tổng kết cỏc đặc tớnh của cỏc phƣơng phỏp nộn thoại 3.2. Cỏc biện phỏp xử lý khi gúi hoỏ thoại truyền trờn mạng IP.
Tớn hiệu thoại sau khi nộn xuống tốc độ thấp được đúng gúi lại để truyền đi trong mạng chuyển mạch gúi. Số hoỏ và gúi hoỏ thoại là hai vấn đề hoàn toàn khỏc nhau. Trong mạng PSTN hiện nay thoại đó được số hoỏ, tuy nhiờn chuyển mạch vẫn là chuyển mạch kờnh. Dữ liệu thoại chỉ được gọi là đó gúi hoỏ nếu những gúi này được chuyển tải trờn mạng chuyển mạch gúi. Chuyển đổi mạng thoại từ chuyển mạch kờnh sang chuyển mạch gúi là vấn đề hết sức khú khăn. Mạng PSTN được phỏt triển như mạng chuyển mạch kờnh để cung cấp tốt hơn cỏc dịch vụ thoại. Cỏc mạng dữ liệu như Internet là mạng chuyển mạch gúi
rất thớch hợp để trao đổi dữ liệu. Bảng 3.2 cho thấy sự khỏc biệt giữa dịch vụ thoại và dịch vụ dữ liệu.
Đặc điểm Dịch vụ thoại Dịch vụ dữ liệu
Tốc độ bớt Cố định và thấp (≤64Kbit/s) Thay đổi (cú thể lờn tới Gbit/s) Sự bựng nổ về
băng thụng
Khụng Lớn (100/1000:1)
Nhạy cảm với lỗi Đàm thoại lại nếu cú lỗi Khụng cho phộp lỗi Gửi lại thụng tin Khụng thể thực hiện được Thực hiện dễ dàng
Độ trễ Thấp và ổn định Lớn hơn và cú thể thay đổi Kiểu kết nối
Hướng kết nối Cú thể là phi kết nối
Bảng 3.2. Dịch vụ thoại và dịch vụ dữ liệu
Những nỗ lực đầu tiờn thực hiện gúi hoỏ thoại đó khụng thành cụng trờn cỏc mạng dữ liệu được thiết kế cho cỏc dịch vụ dữ liệu. Vấn đề khụng đơn giản chỉ là số hoỏ giọng núi, chuyển thành gúi và truyền qua mạng. Để gúi hoỏ thoại thành cụng cần phải xem xột cỏc tham số sau.
Trễ đúng gúi. Trễ đúng gúi xuất hiện khi cỏc mẫu thoại (được lấy với tần suất 8000 lần trong một giõy, tức 125 s một lần) được lưu lại cho đủ thành một gúi. Độ trễ này phụ thuộc vào kớch thước gúi. Chỳng ta xem xột thớ dụ sau. Mào đầu của gúi IP cú kớch thước 20 byte. Như thế thật vụ nghĩa nếu gúi chứa ớt hơn 20 mẫu thoại, mỗi mẫu 8 bớt. Trờn thực tế số lượng mẫu thoại trong một gúi IP cao hơn rất nhiều. Kớch thước mặc định của gúi IP thụng thường là 570 byte (mặc dự kớch thước tối đa của gúi IP là 64 kbyte nhưng thực tế người ta khụng sử dụng gúi lớn như vậy). Như vậy độ trễ gúi là 125 s x 570 = 71.250 s hay 71 ms. Nếu độ trễ giữa hai đầu cuối tương đối lớn thỡ cần phải thực hiện thờm thao tỏc loại bỏ tiếng vọng thậm chớ cả trong trường hợp cuộc gọi VoIP được thực hiện qua khoảng cỏch vật lý rất ngắn.
Trễ nối tiếp (jitter). Trễ nối tiếp xuất hiện khi gúi dữ liệu thoại xếp hàng
sau một số gúi dữ liệu khụng nhạy cảm lắm với độ trễ. Trễ nối tiếp xuất hiện tại tất cả cỏc bộ định tuyến mà gúi đi qua, do đú tổng trễ nối tiếp cú thể làm mộo thoại bằng nhiều cỏch khỏc nhau.
Tốc độ bớt tương đối cao của thoại. Thoại thụng thường được số hoỏ theo
tuyến kết nối cỏc bộ định tuyến cũng chỉ cú băng thụng là 64 kb/s. Như thế chỉ một kờnh thoại đó chiếm hết băng thụng của tuyến kết nối. Ngoài ra cũn phải tớnh đến mào đầu của gúi. Như vậy thực tế là một kờnh thoại (trong mạng chuyển mạch gúi) sẽ chiếm băng thụng lớn hơn 64 kb/s.
Tốc độ bớt khụng đổi của thoại. Thoại được số hoỏ theo chuẩn PCM cú
tốc độ bớt là 64 kb/s (tớnh cả hai chiều). Đặc điểm của cuộc gọi thoại là thời gian im lặng chiếm khoảng 50% tổng thời gian cuộc gọi (cũng tớnh cả hai chiều). Tuy nhiờn nếu loại bỏ hẳn cỏc mẫu thoại tương ứng với khoảng lặng, khụng đúng gúi và khụng gửi đi cỏc mẫu này thỡ người đàm thoại cú thể tưởng đường giõy thoại cú trục trặc do khụng cú độ ồn nền. Do đú việc đảm bảo độ ồn nền trong cỏc cuộc gọi VoIP là rất cần thiết.
Gửi lại gúi khi cú lỗi. Mạng IP là mạng phi kết nối và khụng xử lý lỗi ở
lớp IP. Cỏc bộ định tuyến IP chỉ đơn thuần loại bỏ cỏc gúi cú lỗi. Tuy nhiờn lớp TCP chạy trờn nền IP sẽ gửi lại tất cả cỏc gúi cú lỗi. Cú vẻ như TCP là lựa chọn tốt nhất cho VoIP, bởi vỡ TCP cũng hướng kết nối như thoại nhưng thực ra cỏc gúi chứa cỏc mẫu thoại khụng thể gửi lại được (thoại mang tớnh thời gian thực). Việc mất một số gúi trong khi đàm thoại là cú thể chấp nhận được vỡ thế UDP là giao thức phự hợp hơn. Thế nhưng UDP khụng phải là giao thức hướng kết nối và sẽ khú khăn hơn rất nhiều trong việc điều khiển cỏc kết nối VoIP.
Thật may mắn, tất cả cỏc vấn đề nờu trờn đều đó cú giải phỏp tương ứng. Những giải phỏp này kết hợp với nhau cho phộp gúi hoỏ thoại truyền trờn mạng IP đồng thời đảm bảo chất lượng thoại trong VoIP.
3.2.1. Giao thức truyền tải thời gian thực (RTP)
IP là giao thức lớp mạng. Giữa lớp mạng và lớp dịch vụ mức ứng dụng là lớp giao vận. Ở lớp này cú hai giao thức chớnh là TCP và UDP. TCP là giao thức hướng kết nối, cú vẻ thớch hợp cho dịch vụ thoại. Tuy nhiờn, giao thức TCP bao giờ cũng gửi lại cỏc gúi bị lỗi và do đú cú thể làm cho cuộc gọi VoIP khụng thực hiện được. UDP khụng gửi lại cỏc gúi bị lỗi, nhưng UDP là giao thức phi kết nối.
Giao thức thời gian thực Real-time Protocol (RTP) được ra đời nhằm giải quyết vấn đề trờn. RTP do tổ chức IETF đề xuất, nú đảm bảo cơ chế vận chuyển và giỏm sỏt phương thức truyền thụng thời gian thực trờn mạng IP. Nú cũng cung cấp cỏc thụng tin cần thiết cho quỏ trỡnh đỏnh giỏ chất lượng truyền tiếng núi trong cuộc thoại qua VoIP.
RTP cú hai thành phần:
Bản thõn RTP mang chức năng vận chuyển, cung cấp cỏc thụng tin về cỏc gúi tin tiếng núi.
Giao thức điều khiển thời gian thực RTCP (Real-time Control Protocol) mang chức năng giỏm sỏt và đỏnh giỏ chất lượng truyền tin.
Header RTP cho biết phương thức mó húa đó được sử dụng cho gúi tin này, chỉ mục gúi, nhón thời gian của nú và cỏc thụng tin quan trọng khỏc. Từ cỏc thụng tin này ta cú thể xỏc định ràng buộc giữa gúi tin với thời gian. Cỏc gúi được sắp xếp lại theo đỳng thứ tự thời gian thực ở bờn nhận rồi được giải mó và phỏt lại.
RTCP phõn tớch và xử lý cỏc thụng tin này để tổng hợp thành cỏc thụng tin trạng thỏi rồi đưa ra cỏc bản tin phản hồi đến tất cả cỏc thành viờn. Cỏc thụng tin được cung cấp gúi tin RTCP cho phộp mỗi thành viờn tham gia hội thoại giỏm sỏt được chất lượng truyền tin, số gúi tin đó gửi đi, số gúi tin nhận được, tỷ lệ gúi tin bị mất, trễ là bao nhiờu…Vỡ vậy, cỏc thụng tin này thường được cập nhật một cỏch định kỳ và chiếm khụng quỏ 5% giải thụng cuộc gọi.
3.2.2. Sử dụng cỏc gúi cú kớch thƣớc bộ
Sử dụng cỏc gúi VoIP cú kớch thước bộ là giải phỏp giảm trễ đúng gúi. Thực ra khụng cú kớch thước chuẩn cho gúi VoIP. Trong nhiều trường hợp cú thể sử dụng kớch thước mặc định của gúi IP.
3.2.3. Sử dụng gúi cú cỏc cấp ƣu tiờn khỏc nhau
Giải phỏp này cho phộp giảm thiểu độ trễ nối tiếp. Tuy nhiờn khụng cú chuẩn nào ỏp dụng cho việc định cấp ưu tiờn của gúi trong mạng IP. Cỏc nhà cung cấp bộ định tuyến IP đều cú phương phỏp phõn cấp lưu lượng của riờng mỡnh. Mặc dự trong mào đầu của gúi IP cú chứa thụng tin về cấp ưu tiờn của gúi (trường TOS, hay type of service) nhưng phần lớn bộ định tuyến khụng sử dụng trường này.
Phõn cấp lưu lượng IP cú thể đảm bảo cỏc gúi VoIP bao giờ cũng chiếm vị trớ đầu tiờn trong hàng đợi của bộ đệm. Tuy nhiờn việc phõn cấp lưu lượng khụng xử lý được tỡnh huống khi gúi VoIP đến bộ đệm nhưng một gúi dữ liệu dài cú cấp ưu tiờn thấp hơn vừa bắt đầu được gửi đi. Độ trễ nối tiếp cũng chưa được loại bỏ do khụng kiểm soỏt được cả số lượng lẫn kớch thước cỏc gúi xếp hàng đợi tại bộ đệm của cỏc bộ định tuyến trờn hành trỡnh của gúi VoIP.
3.2.4. Bộ đệm jitter
Bộ đệm jitter là giải phỏp để giảm sự thiếu ổn định của độ trễ. Bộ đệm này là miền bộ nhớ dựng để lưu cỏc gúi VoIP đến với cỏc độ trễ khỏc nhau. Cỏc mẫu thoại được lấy ra khỏi bộ đệm với tốc độ ổn định tạo ra cảm giỏc độ trễ khụng thay đổi trong suốt thời gian bộ đệm cú dữ liệu.
Chỳng ta xem xột thớ dụ sau. Giả sử cú hai gúi VoIP đến với độ trễ là 100 ms và 90 ms. Thứ tự đến của cỏc gúi khụng thay đổi (thực ra khụng phải bao giờ cũng vậy). Hai gúi này được đưa vào bộ đệm jitter và lưu trong đú tương ứng là 20 ms và 30 ms trước khi được đưa ra để chuyển thành tớn hiệu thoại tương tự. Như thế cú vẻ như là cỏc gúi đều cú độ trễ như nhau là 120 ms.
Xỏc định độ trễ chuẩn cho bộ đệm jitter là rất khú khăn. Nếu độ trễ này quỏ thấp thỡ nhiều gúi VoIP sẽ bị loại bỏ. Trong thớ dụ trờn tất cả cỏc gúi cú độ trễ lớn hơn 120 ms đều bị loại. Như thế chất lượng thoại cú thể giảm sỳt rất đỏng kể do mất nhiều gúi. Nếu độ trễ chuẩn quỏ cao thỡ bộ đệm jitter cú thể bị tràn, hơn nữa điều này gõy ra độ trễ lớn khụng cần thiết của cỏc gúi VoIP.
Một vấn đề khỏc là làm thế nào để xỏc định được độ trễ của gúi trong hành trỡnh qua mạng. Trờn thực tế cú nhiều phương phỏp xỏc định độ trễ được ỏp dụng, từ phương phỏp đơn giản nhất là đỏnh dấu thời gian, đến cỏc phương phỏp phức tạp hơn khỏc.
Bộ đệm jitter là giải phỏp thường được ỏp dụng để tăng sự ổn định của độ trễ trong cỏc mạng thoại gúi. Đơn giản và hiệu quả, giải phỏp này cũn được sử dụng trong cỏc mạng VoFR (Voice over Frame Relay) và thậm chớ trong cỏc ứng dụng VoATM (Voice over ATM).
3.2.5. Kỹ thuật nộn khoảng lặng
Trong cỏc cuộc đàm thoại thụng thường, một người núi thỡ người khi nghe. Kờnh thoại cấp cho mỗi cuộc đàm thoại vẫn là song cụng, gồm hai chiều đi và về vỡ cú thể đụi lỳc hai người cựng núi đồng thời. Nếu kể cả những khoảng ngừng ngắn giữa cỏc cõu, giữa cỏc từ và thậm chớ trong một từ dài thỡ lượng băng thụng bị lóng phớ là trờn 50%. Kĩ thuật nộn khoảng lặng (silence compression) giỳp loại bỏ cỏc khoảng im lặng trong cỏc cuộc đàm thoại nhờ đú tiết kiệm băng thụng, giảm tốc độ bit cần truyền.
Vấn đề của kĩ thuật này là phỏt hiện khi nào người núi bắt đầu núi sau mỗi khoảng im lặng. Bởi vỡ luụn cú tạp õm nền (background noise) và chỉ cú tớn hiệu
thoại thực sự mới được mó hoỏ và gửi đi. Cơ chế phỏt hiện tớch cực thoại (VAD- Voice Activation Detection) cho phộp biết khi nào cú tiếng núi thực sự, biờn độ tiếng núi tăng vượt qua mức tạp õm nền. VAD phải thớch ứng khi mà mức tạp õm nền thay đổi liờn tục và phải cú cơ chế phản ứng nhanh khi tiếng núi bắt đầu nếu khụng sẽ bị mất thụng tin.
Nếu ta đặt ngưỡng quỏ thấp thỡ người đàm thoại sẽ nghe được nhiều tớn hiệu õm thanh nhiễu khụng cần thiết. Nếu ngưỡng là quỏ cao thỡ người đàm thoại sẽ cú cảm giỏc tớn hiệu thoại bị cắt, do nhiều mẫu tương ứng với õm thanh cú ớch bị loại bỏ. Kỹ thuật nộn thoại và kỹ thuật loại bỏ cỏc mẫu tương ứng với khoảng lặng cho phộp sử dụng một tuyến kết nối 64 kb/s để phục vụ đồng thời cho thoại và cỏc dịch vụ dữ liệu khỏc.
Thoại sau khi được mó hoỏ (nộn) thành dũng bit cú tốc độ khụng đổi vớ dụ 8 kb/s. Tuy nhiờn khi sử dụng kĩ thuật nộn khoảng lặng thỡ tốc độ thực sự của tớn hiệu mó hoỏ thoại sẽ thay đổi liờn tục phụ thuộc vào tốc độ õm phỏt ra. Tớn hiệu thoại sau khi mó hoỏ được đúng vào gúi thỡ cỏc gúi sẽ được sinh ra theo từng đợt. Núi nhanh thỡ tạo ra nhiều gúi, núi chậm thỡ ớt gúi được sinh ra, nếu im lặng thỡ khụng cú gúi được phỏt ra. Đặc điểm này cũng giống cỏc loại dữ liệu được truyền trờn mạng gúi.
3.2.6. Độ ồn nền
Nếu khoảng im lặng dài thỡ người nghe dễ nghĩ rằng thụng tin bị giỏn đoạn. Do đú ở bờn thu cần tạo ra tạp õm nền thường đựơc gọi là comfort noise để tạo cảm giỏc dũng thụng tin liờn lạc. Tất nhiờn, comfort noise thực sự khụng được