CHƯCfNG 3 : ĐẶC TÍNH CỦA INTERNET VÀ IP
3.7. Giao thức truyền dẫn thời gian thực RTP (Real Time Transport
RTP là một giao thức sử dụng cho các ứng dụng thời gian thực. Trong mỗi gói RTP có hai phần thơng tin quan trọng đó là số thứ tự và time- stamp, qua số thứ tự ứng dụng có thế' biết được có xảy ra mất gói, cịn time* stamp giúp tính tốn được thời gian trì hỗn và jitter.
Định dạng phần header của RTP như sau:
p X cc liliE
PT Sequence Numb«r
Time Stdmp
Synchronization Sourc6 (SSCR) Number
Hình 3.15. Định dạng RTP header.
Các trường trong header này bao gồm:
• Version (V): chỉ ra phiên bản của giao thức RTP.
• Padding (P, Ibit): chĩ ra gói có một hay nhiều các octet thêm vào ở
phần cuối của payload. Nếu bit này được đặt lên 1 thì ở octet của payloađ sẽ chì ra có bao nhiêu octet thêm vào.
• Extension (X, Ibit): chỉ ra là phần header có phần mở rộng hay khơng. • CSRC Count (CC, 4 bit): chỉ ra số nhận dạng các nguồn phân phối, có
giá trị từ 0 đến 15.
• Marker (M, Ibit): đơi với ứng dụng khơng truyền đi các gói trong khoảng thời gian yên lặng, bit này sẽ được đặt lên 1 khi truyền đi gói đầu tiên sau khoảng thời gian yên lặng.
• Payload Type (PT, 7 bit): chỉ ra định dạng của phần payload.
• Sequence Number (16 bit): số thứ tự được tăng 1 cho mỗi gói RTP được gửi đi. Giá trị đầu của số thứ tự là một số ngẫu nhiên. Tại nơi thu trường này được dùng để phát hiện gói bị mất và thiết lập lại chuỗi thứ tự các gói.
• Timestamp (32 bit): trường này chỉ ra thời điểm mà mẫu đầu tiên được tạo ra, thời điểm này phải dược lấy ra từ một đổng hồ tự động tăng tuyến tính, từ dó các ứng dụng đầu cuối có thể đồng bộ hóa và tính tốn được giá trị jitter. Giá trị ban đầu của timestamp là ngầu nhiên. • Synchronization Source (SSRC, 32 bit): trường này chỉ ra nguồn đồng
bộ là thực thể chịu trách nhiệm cho việc thiết lập số thứ tự và giá trị timestamp.
60 Kỹ thuật thoại trên IP - VoIP Dữ liệu thoại qua các lớp tương ứng với các giao thức RTP/UDP/IP sẽ có khn dạng như hình 3.16, trong đó phần header chiếm 40 octet.
Version Type of Service
Identiỉier
Time to Li ve Prolocol
Total Length
Plags Pragment Offs©t
Source IP Ađdress Destination IP Address Source Port Length V p X cc PT Destìnatlon Port Checksum Sequence Number Time otam p
Synci*ronizatỉon Source (SSCR) Number
Payload chửa các mẵu thoại óầ được sỗ hóa
Hỉnh ;s.16. Định d ạ n g gói dữ liộu thoại.
Phần theo sau header sẽ là phần payỉoad, phần này sẽ chứa các mẫu dã dược số hóa của thoại và dữ liệu. Đối với thoại, thì số mẫu sẽ được lấy trong khoảng thời gian từ 10 ms đến 40 ms.
3.8. M â h ó a th o ạ i♦
Một trong những ưu điểm của VoIP so với mạng thoại truyền thống đó
là có thể sử dụng các phương pháp mã hóa thoại với u cầu băng thơng ít hcrn. Với mạng thoại thông thường, kỹ thuật mã hóa được sử dụng hầu hết
là theo chuẩn r r ư - T G.711, theo đó tần số lấy mẫu là 8.000 mẫu/s, mỗi
mẫu được biểu diễn bởi 8 bit, điều này dẫn đến yêu cầu băng thông trên mỗi chiều của cuộc gọi là ti4 kbps. Với mạng VoIP, hai bên đầu cuối có thể thỏa thuận sử dụng các kiẽu mã hóa khác nhau với yêu cầu băng thơng có thể là 32 kbps, 16 kbps, 8 kbps, 6,3 kbps hay 5,3 kbps. Hơn nữa, một số kỹ thuật mã hóa cịn cho phép nén các khoảng lặng, tín hiệu chỉ thực sự truyền đi khi có tiếng nói, do đó với các cuộc đàm thoại chỉ có một người nói và một người nghe ở một thời điểm thì băng thơng sẽ tiết kiệm một cách đáng kể khi không truyền đi các khoảng lặng. Với ưu điểm này, kỹ thuật mã hóa thoại được xem là một phần quan trọng của VoIP.
Có nhiều kỹ thuật mã hóa thoại khác nhau, tuy nhiên chúng đều thuộc một trong ba dạng: waveform codec, source codec và hybrid codec.
• Waveform codec: phương pháp này chỉ đơn giản lấy mẫu tín hiệu và truyền các giá trị lượng tử đến đầu cuối nhận, tại đây các tín hiệu sẽ được giải mã khôi phục lại tín hiệu tương tự ban đầu. Wavefonn codec có cơ chế đơn giản và cho chất lượng thoại tốt, tuy nhiên lại cần một lượng băng thơng lớn.
• Source codec (hay còn gọi là Vocoder codec); sử dụng một mơ hình bộ lọc dự đốn tuyến tính (linear-predictive niter model). Trong phương pháp này bản thân các tín hiệu khơng được truyền đi mà thay vào đó ỉà truyền các thơng số liên quan, từ các thông số này nơi nhận sẽ
khơi phục lại các tín hiệu ban đầu. Source codec hoạt động ồ tốc độ
thấp, tuy nhiên tiếng nói khơi phục lại không tự nhiên như ban đầu. Khi tăng tốc độ cũng không thể cải thiện châ't ỉượng. Source codec thông thường được sử dụng trong các mạng riêng và ít dùng trong mạng cơng cộng.
• Hybrid codec: phương pháp này cố gắng khắc phục hạn chế của hai phương pháp trên, nghĩa là cung cấp cơ chế mã hóa thoại với tốc độ thấp nhưHg chất lượng cao.
3.8.1. G.711
G.711 hay còn gọi là Pulse-Code Modulation (PGM) là một kỹ thuật mã hóa thoại được sử dụng rộng rãi nhất hiện nay. Đây là phương pháp waveform codec và được sử dụng cho mạng điện thoại cơng cộng trên tồn thế giới. Theo G.711, tín hiệu sau khi lấy mẫu sẽ được lượng tử hóa, G.711
khuyến nghị sử dụng lượng tử hóa phi tuyến theo luật A và luật Sau khi
lượng tử hóa các giá trị được mã hóa thành các từ mã. G.711 có tốc độ lấy mẫu là 8.000 Hz, mỗi mẫu có thể được biểu diễn bằng 12 bit hay 8 bit, tuy nhiên cách biểu diễn bằng 8 bit tạo thành ỉuổng DSO 64 kbps được ưa
chuộng và thông dụng nhất, Cả hai luật A và đều cho chất lượng mã hóa
thoại tốt, tuy nhiên có hạn chế là u cầu băng thơng cao.
3.8.2. ADPCM (Adaptỉve DPCM)
Đối với PGM các mẫu tín hiệu riêng lẻ sẽ được gửi đến đầu thu, bên thu nhận dược những tín hiệu này và khơi phục lại các tín hiệu ban đầu. Tuy nhiên có một tính chất của thoại đó là sự biến đổi chậm, các mẫu tín hiệu gần nhau sẽ có giá trị gần bằng nhau, do đó chỉ cần truyền đi sự sai biệt giữa hai tín hiệu liên tiếp N và N+1, đồng thời biết thêm một sấ thơng tin cần thiết thì đầu thu sẽ khôi phục lại dược dạng tín hiệu ban đầu. Đây chính là đặc điểm của phương pháp DPCM (DiíTerential PGM). ADPCM (Adaptive DPCM) là một phiên bản có nhiều ưu điểm của DPCM, ADPCM Chương 3: Đặc tinh của Internet và IP_____________________________ ^
sẽ dự đoán giá trị các mẫu tiếp theo dựa trên giá trị các mẫu trước đó và cách tín hiệu thoại biến đổi theo thời gian. G.721 và G.726 là hai khuyến nghị của ITƯ-T về ADPCM, trong đó G.721 là phương pháp ADPCM với tốc độ là 32 kbps còn G.726 là phương pháp ADPCM lấy thoại lượng tử hóa theo luật A và (i và chuyển đổi thành hay từ các kênh 16 kbps, 24 kbps, 32 kbps, 49 kbps.
Giông như PGM, ADPCM cũng là phương pháp waveform codec, có độ trì hỗn rất thấp, tuy nhiên hạn chế lớn nhất vẫn là cần băng thông lớn.
3.8.3. AbS codec (Analysis-by-Synthesis)
Đây là kỹ thuật mâ hóa thoại dựa trên phương pháp hybrid cođec. Một kỹ thuật hybrid codéc có thể nói là thành cơng và được sử dụng rộng rải đó là AbS (Analysis-by-Synthesis). AbS codec sử dụng mơ hình bộ lọc dự đốn tuyến tính để dự đốn thoại. Mơ hình này khơng chỉ có chức năng phát hiện có thoại hay khơng mà nó cịn cố gắng để tái tạo lại dạng tín hiệu thoại ban dầu. Một số dạng của AbS là Multi-Pulse Excited (MPE), Regiilar- Pulse Excited (RPE) và Cođe-Excited Linear Predictive (CELP). Các biến thể của CELP có thể kể dến là G.728 LD-CELP, G.723.1 ACELP và G.729.
3.8.3.1. G.728 LD-CELP
CELP codec hoạt động như là một bộ lọc với các tính chất thay đổi theo thời gian. CELP codec chứa một codebook chứa các vectơ biểu diễn thoại, mỗi vectơ là một tập hợp các phần tử biểu diễn tính chất của thoại. Các CELP codec sẽ truyền đi các thông số về bộ lọc, độ lợi và con trỏ trỏ dến vectơ biểu diễn tín hiệu. Đầu nhận cũng có bộ lọc và codebook như ở
đầu gửi, ở đây tín hiệu ban đầu sẽ được tái tạo lại.
LD-CELP (Low Delay CELP) được quy định trong ITU-T G.728 là phương pháp mã hóa thoại CELP với độ trễ thấp. Các hệ số của bộ lọc và vectơ thoại trong codebook được xác định dựa trên 5 mẫu tín hiệu bao gồm mẫu hiện tại và các mẫu trước đó. Với phương pháp này bộ mả hóa hoạt dộng trên nám mẫu một lần do đó thời gian trì hỗn thấp, nhỏ hơn 1 ms. Số vectơ trong codebook là 1.024 vectơ, do đó ta chỉ cần truyền đi một giá trị chỉ số 10 bit. Tốc độ lấy mẫu ià 8.000 mẫu/s, cho mỗi 5 mẫu G.728 chỉ cần truyền đi 10 bit, do đó tốc độ truyền của G.728 là 16 kbps. Ta thấy băng thông yêu cầu của G.728 chỉ bằng 1/4 so với G.711.
3.5.3.2. G.723.1 ACELP
ITU-T G.723.1 quy định mã hóa tiếng hoạt động ở cả 6,3 kbps và 5,3 kbps, trong dó với tơc độ cao hơn thì chất lượng sẽ cao hơn. Cả hai tô'c dộ này đều là hai phần chỉnh trong bộ mã hóa và bộ giải mã, ta có thể chuyển đổi từ kiểu tốc dộ này sang kiểu tốc độ kia trong suốt quá trình một cuộc đàm thoai.
Chương 3; Đặc tính cùa Internet và IP 63 Bộ mă hóa hoạt dộng trên từng khối hay khung 240 mẫu tại một thời điểm. Mỗi khung tương ứng với 30 ms thoại, điều này cũng có nghĩa là bộ mả hóa sẽ tự động tạo ra 30 ms trì hỗn. Ngồi ra cịn có trì hoăn look- ahead 7,5 ms, do đó mức biên trì hồn tổng cộng sẽ là 37,5 ms, tuy nhiên thực tế cịn có nhiều các trì hỗn khác phát sinh. Các khung sẽ được đi qua một bộ lọc thông thấp để giới hạn các thành phần DC và sau dó được chia làm 4 khung con. Một số các công việc dược thực hiện trên các khung con này để xác định thông số bộ lọc. Trong trường hợp tốc độ thấp 5,3 kbps thì Algebraic Code-Excited Linear Prediction (ACELP) được sử dụng, còn trong trường hợp tốc độ 6,3 kbps thì Multi-Pulse Maximum Likelihood Quantization (MP-MLQ) được dùng.
Thông tin thoại được truyền đến đầu cuối bao gồm các hệ số dự đốn tuyến tính, thơng sơ" độ lợi, giá trị chỉ số codebook. Đối với truyền dẫn tốc độ 6,3 kbps thông tin được truyền đi trên các khung có độ dài 24 octet, còn đối với truyền dẫn 5,3 kbps thông tin được truyền đi trên các khung có độ dài 20 octet, Với mỗi cuộc gọi thoại thông thường xuất hiện các khoảng lặng, G.723.1 đưa ra cơ chế để nén khoảng lặng bằng cách truyền đi các khung SID (Siỉence Insertion Description). Mỗi khung SID có chiều dài 4 octet, như vậy tốc độ truyền chỉ là 1 kbps trong khi đó đối với G.711 các khoảng lặng vẫn được truyền với tốc độ 64 kbps. Các khung G.723.1 đều có 2 bit của octet đầu tiên chỉ ra kích thước của khung và phiên bản codec được dùng.
Bảng 3.1. Các loại khung G.723.1.
Bít nghóa Kích thơơủc
khung (Octet)
00 Thoì tốc noẳ cao (6,3 kbps) 24
01 Thoi tốc fioa (hấp (5,3 kbps) 20
10 Khung SID 4
11 UỈA
G.723.1 cho chất lượng tương đối tốt so với lượng băng thơng mà nó giảm được, tuy nhiên có bất lợi chủ yếu nhất đó là độ trì hỗn tương đối cao. Đôi với cuộc gọi một chiều thì mức 37,5 ms là chấp nhận được, tuy nhiên với cuộc gọi VoIP thì ta cần phải quan tâm đến cả trì hỗn round- trip, trì hỗn xử lý, trì hỗn hàng đợi trong các router.
3.8.3.3. G.729
G.729 quy định một bộ codec phức tạp, để giảm bớt mức độ phức tạp thì một số các phương pháp được đề ra như trong G.729A và G.729B.
G.729A đưa ra các quy trình để tìm kiếm trong codebook và cơ chế để lọc trước ở bộ giải mă. G.729A sử dụng cấu trúc khung giống hệt như trong G.729, do đó cũng địi hỏi một lượng băng thơng như vậy. Bộ mâ hóa có thế'
sử dụng G.729 trong khi bộ giải mă sử dụng G.729A và ngược lại. G.729B
quy định về Voice Activity Detection (VAD), Discontinuous Transmission (DTX) và Comíort Noise Generation (CNG). VAD đơn giản chỉ là quyết
định khi nào có thoại và khi nào thì khơng có thoại ở đầu vào. Quyết định
này dựa trên phân tích một số các yếu tố của tín hiệu vào, dựa trên khung hiện tại và hai khung trước đó để bảo đảm rằng sự truyền tải xảy ra khi có xuất hiện ít nhất ỉà hai khung sau khi một người đã ngưng nói. Quyết định về DTX và CNG liên quan dến việc gửi hay không gửi khung SID. Khung SID chứa một số các thông tin cho phép bộ giải mã tạo ra một số nhiễu tương ứng với mức nhiễu nền tại đầu cuối truyền dẫn. Khung G.729B SID có độ dài 15 bit, nhỏ hơn đáng kể so với khung thoại 80 bit. Khi nhiễu nền thay đổi đáng kể, sẽ có các SID mới được truyền để tương thích với mức nhỉễư nền mới này. Quá trình thay đổi mức nhiễu này có tác dụng làm cho người nghe không bị ảnh hưởng.
Bên cạnh các phương pháp mã hóa như trèn cịn có rất nhiều các phương pháp mã hóa khác, tùy vào mỗi mạng mà cách lựa chọn phương pháp mă hóa sẽ khác nhau. Thông thường việc lựa chọn phương pháp sẽ dựa trên chất lượng và băng thông yêu cầu. Với cùng một phương pháp mă hóa thoại, nhưỉig đếỉ với mỗi mạng khác nhau sẽ có đặc tính trì hỗn khác nhau. Ngoài ra việc lựa chọn phương pháp mã hóa thoại cịn phải phụ thuộc vào khả năng của bộ xử lý tín hiệu số (DSP - Digital Signal Processor), chẳng hạn G.728 hay G.729 cần phải chạy trên bộ xử lý có tốc độ cao hơn G.726.
3.9. B ộ g ia o th ứ c V oIP
Như đã nói ở trên, trong thế giới ngày nay, hầu hết các dạng truyền
dẫn đều ở dạng số và dữ liệu được truyền qua các mạng gói như IP, ATM
và Frame Relay. Từ lúc tải dữ liệu phát triển nhanh hơn tải thoại, vân đề truyền tải thoại trên các mạng dừ liệu được xem xét. Các cơng ty đã có những giải pháp cho phép họ sử đụng dung lượng thừa trong các mạng băng rộng cho việc truyền dẫn thoại và dữ liệu, cũng như tận dụng Internet và các mạng Intranet cồng ty để thay thế cho các hệ thống đắt tiền hơn.
VoIP là khả năng thực hiện các cuộc gọi điện thoại và gửi fax trên các mạng dữ liệu trên cơ sở IP với chất lượng dịch vụ và giá cả phù hợp. Các nhà phát triển và sản xuất thiết bị thấy VoIP là một cơ hội mới dể phát triển và cạnh tranh. Thử thách đối với họ là phát triển các thiết bị cho phép ứng dụng VoIP, Đối với các ISP, việc giới thiệu giá cả thường dùng và táng dung ỉượng tái lên rất hấp dẫn. Mạt khác, các người dùng (cá nhân
Chương 3: Đặc tính của Internet và IP 65
lẫn tổ chức) rất quan tâm đến việc tích hợp các ứng dụng thoại và dừ liệu
cũng như tiết kiệm chi phí.
Việc hỗ trợ cho truyền thoại là IP, tức VoIP, trở nên hâ'p dẫn do giá thâ'p, cạnh tranh giá cả trong Internet công cộng. VoIP cho phép các router, server truy cập, các bộ tập trung đa truy cập mang và gửi lưu lượng thoại và fax trên một mạng IP. Trong VoIP, các bộ xử lý tín hiệu số chuyển các tín hiệu thoại thành các khung và lưu chúng trong các gói thoại. Những
gói này được truyền qua IP với các giao thức truyền thoại hoặc chuẩn như
H.323, Media Gateway Control Protocol (MGCP) hoặc Session Initiation Protocol (SIP).
Bảng sau trình bày mối quan hệ giừa mơ hình tham chiếu OSI và các giao thức, chức năng của các phần tử mạng VoIP.
OSI Layer Number OSI Layer Name VotP Protocols and Punctions
Application NetMeeting/Applications
Presentation Codecs
Session H.323/MGCP/S1P
Transport RTP/TCP/UDP