VoIP là gì?
Trong điện thoại thông thường, tín hiệu thoại có tần số nằm trong khoảng 0.3
Tín hiệu âm thanh 3.4 KHz được lấy mẫu với tần số 8 KHz theo quy tắc Nyquist, sau đó được lượng tử hóa với 8 bit mỗi mẫu và truyền với tốc độ 64 Kbps đến mạng chuyển mạch Tại điểm nhận, dòng dữ liệu 64 Kbps này được giải mã để tái tạo tín hiệu thoại tương tự Hình 1.1 minh họa một điện thoại thông thường.
VoIP (Voice over IP) là hình thức truyền thoại sử dụng giao thức mạng
Công nghệ thoại qua mạng IP (VoIP) không hoàn toàn khác biệt so với điện thoại truyền thống Đầu tiên, tín hiệu thoại được số hóa, sau đó được nén xuống tốc độ thấp, đóng gói và truyền qua mạng IP thay vì mạng PSTN Tại bên nhận, các gói tin được mở ra và giải nén thành các luồng PCM 64Kbps để gửi đến thuê bao Sự khác biệt chủ yếu nằm ở mạng truyền dẫn và định dạng thông tin sử dụng trong quá trình truyền tải.
Mạng gói tối ưu hóa băng tần nhưng ít chú trọng đến độ trễ, trong khi tín hiệu thoại yêu cầu thời gian thực Để đảm bảo chất lượng dịch vụ cho người dùng, cần bổ sung các phần tử mới và áp dụng giao thức phù hợp Các gói tín hiệu thoại được truyền qua mạng IP vẫn đảm bảo chất lượng cần thiết.
Điện thoại thông thường tính thời gian thực của cuộc gọi, đảm bảo tín hiệu thoại qua mạng IP đáp ứng yêu cầu về độ trễ Công nghệ VoIP đang trở thành một trong những lựa chọn viễn thông hấp dẫn nhất hiện nay, với mô hình cung cấp dịch vụ VoIP được minh họa trong Hình 1.2.
Các hình thức truyền thoại trên mạng IP
Mô hình PC to PC
Trong mô hình VoIP, mỗi máy tính được trang bị thiết bị truyền thông như microphone, sound card và speaker, kết nối trực tiếp với Internet qua giao diện NIC hoặc modem/cable modem từ nhà cung cấp dịch vụ ISP Tất cả các quá trình như lấy mẫu, nén/giải nén, mã hóa/giải mã đều diễn ra trên máy tính Người dùng kết nối với dịch vụ VoIP thông qua tài khoản và mật khẩu, từ đó thiết lập cuộc gọi và thực hiện đàm thoại Cuộc gọi giữa hai người dùng máy tính được thiết lập thông qua địa chỉ IP.
Computer Computer chỉ IP Trong mô hình này, mạng IP và mạng PSTN vẫn vận hành riêng biệt Hình 1.3 minh hoạ mô hình PC to PC
Hình 1.3 Mô hình PC to PC
Mô hình PC to Phone
Mô hình PC to Phone là một mô hình được cải tiến hơn so với mô hình
Mô hình PC to PC cho phép người dùng thực hiện cuộc gọi giữa các máy tính và mạng PSTN thông thường Trong mô hình PC to Phone, giao tiếp giữa mạng Internet và mạng PSTN được thực hiện thông qua các cổng giao tiếp (gateway) đặc biệt Đây là nền tảng quan trọng cho việc kết nối mạng Internet với mạng PSTN cũng như các mạng GSM và các dịch vụ đa dạng khác Hình 1.4 minh họa mô hình PC to Phone.
Hình 1.4 Mô hình PC to Phone
Mô hình Phone to Phone
Có hai mô hình Phone to Phone: mô hình đầu tiên kết hợp giữa mạng PSTN và mạng IP, trong khi mô hình thứ hai chỉ sử dụng mạng IP Mô hình thứ hai tương tự như mô hình PC to PC, nhưng thay vì máy tính, nó sử dụng điện thoại IP.
Mô hình thứ nhất là một phiên bản mở rộng của mô hình PC to Phone, sử dụng Internet làm phương tiện liên lạc giữa các mạng PSTN Tất cả các mạng PSTN được kết nối với Internet thông qua các cổng gateway Trong mô hình này, một mã số đặc biệt được sử dụng để kết nối giữa mạng PSTN và Internet trước khi thực hiện cuộc gọi Khi gọi điện, mạng PSTN sẽ kết nối đến gateway gần nhất, và tại đây, địa chỉ sẽ được chuyển đổi từ.
Gateway máy tính chuyển đổi tín hiệu từ PSTN sang địa chỉ IP để định tuyến gói tin đến mạng đích Gateway nguồn có nhiệm vụ chuyển đổi tín hiệu thoại tương tự thành dạng số, sau đó mã hóa, nén, đóng gói và gửi qua mạng Mạng đích kết nối với gateway, nơi địa chỉ được chuyển đổi trở lại thành PSTN, và tín hiệu được giải nén, giải mã để chuyển đổi ngược lại thành tín hiệu tương tự, gửi vào mạng PSTN đến đích Hình 1.5 minh họa mô hình Phone to Phone sử dụng điện thoại thông thường.
Hình 1.5 Mô hình Phone to Phone dùng điện thoại thường
Mô hình thứ hai Ở mô hình này, thay vì dùng PC ta dùng điện thoại IP để thực hiện cuộc gọi
Hình 1.6 minh hoạ mô hình Phone to Phone dùng IP phone
Hình 1.6 Mô hình Phone to Phone dùng IP phone
Lợi ích của điện thoại IP
Điện thoại IP được phát triển để tối ưu hóa hiệu quả của mạng truyền số liệu, đồng thời mang lại sự linh hoạt cho việc phát triển ứng dụng mới trên giao thức IP Công nghệ VoIP đã tạo ra cơ hội lớn trong việc tích hợp mạng thoại với mạng số liệu, cung cấp dịch vụ trên một nền tảng mạng thống nhất.
IP Phone IP Phone hiện được với mạng Internet và do đó tiết kiệm đáng kể các dịch vụ thoại và fax
Việc chia sẻ chi phí thiết bị và thao tác giữa người dùng thoại và dữ liệu không chỉ tăng cường hiệu quả sử dụng mạng mà còn giúp tối ưu hóa băng tần Nhờ vào kĩ thuật nén tiên tiến, tốc độ bít đã giảm từ 64Kbps xuống dưới 8Kbps, cho phép một kênh 64Kbps hỗ trợ tới 8 cuộc gọi đồng thời Điều này không chỉ tiết kiệm tài nguyên mạng mà còn giảm đáng kể chi phí vận hành.
- Tích hợp mạng thoại, mạng số liệu và mạng báo hiệu
Trong điện thoại IP, tín hiệu báo hiệu, thoại và dữ liệu được truyền tải qua cùng một mạng IP, giúp tiết kiệm chi phí đầu tư cho nhân lực và cơ sở hạ tầng so với việc xây dựng các mạng riêng biệt.
Cơ sở hạ tầng tích hợp hỗ trợ mọi hình thức thông tin, giúp chuẩn hóa hiệu quả và giảm thiểu số lượng thiết bị Hệ thống này còn tối ưu hóa băng tần động, mang lại hiệu suất cao hơn cho các ứng dụng.
Quản lý từ xa toàn bộ hệ thống hạ tầng mạng trở nên dễ dàng hơn bao giờ hết, cho phép người dùng xem xét hệ thống như một khối thống nhất thay vì các phần riêng biệt như trước Việc đơn giản hóa trong quản lý hạ tầng mạng không chỉ giảm thiểu lỗi mà còn giúp dễ dàng phát hiện sự cố và tính toán chi phí của hệ thống một cách hiệu quả.
Con người là yếu tố quan trọng nhưng cũng dễ mắc sai lầm trong mạng viễn thông, do đó, việc hợp nhất các thao tác, loại bỏ sai sót và thống nhất điểm thanh toán là rất cần thiết Trong các tổ chức kinh doanh, quản lý dựa trên SNMP (Simple Network Management Protocol) hỗ trợ cả dịch vụ thoại và dữ liệu qua VoIP Việc sử dụng giao thức IP thống nhất cho tất cả ứng dụng giúp giảm phức tạp và tăng tính linh hoạt Các ứng dụng như dịch vụ danh bạ và an ninh mạng có thể được chia sẻ một cách dễ dàng hơn.
- Kh ả năng Multimedia và đa dịch vụ
VoIP không chỉ dừng lại ở thoại và fax; nó mở ra cơ hội cho các ứng dụng đa phương tiện và dịch vụ phong phú hơn trong tương lai Trong quá trình đàm thoại, người dùng có thể đồng thời thực hiện nhiều hoạt động như truyền file, chia sẻ dữ liệu và xem hình ảnh của người đối diện, mang lại trải nghiệm giao tiếp phong phú và hiệu quả hơn.
1.4 Các nhân tố ảnh hưởng đến chất lượng VoIP
Yêu cầu cơ bản của VoIP là đảm bảo chất lượng thoại tương đương với mạng PSTN, do đó, việc đánh giá chất lượng thoại là rất quan trọng Ba yếu tố chính ảnh hưởng đến chất lượng thoại bao gồm: độ trễ, băng thông và độ ổn định của kết nối.
Độ trễ trong truyền số liệu không quan trọng, nhưng đối với truyền thoại, nó là yếu tố rất quan trọng ảnh hưởng đến chất lượng cuộc gọi Độ trễ càng thấp càng tốt, với giới hạn chấp nhận được từ 200ms đến 400ms Khi độ trễ vượt quá 400ms, chất lượng cuộc gọi trở nên không chấp nhận được Để đạt được chất lượng thoại tốt, thời gian trễ cần phải dưới 200ms.
Hình 1.7 Hoạt động của bộ đệm
Mạng Internet không đảm bảo việc chuyển giao tất cả các gói tin, vì chúng có thể bị mất do quá tải, nghẽn mạng hoặc kết nối không ổn định Tỉ lệ mất gói yêu cầu phải nhỏ hơn 10% Các giao thức truyền bảo đảm không phù hợp để xử lý vấn đề này do hạn chế về thời gian trễ Để khắc phục tình trạng mất gói, cách tiếp cận thường được sử dụng là phát lại gói cuối cùng và đồng thời gửi thông tin dư.
Các thách thức đối với việc triển khai VoIP
Nhà phát triển mục tiêu tích hợp tính năng gọi điện thoại vào mạng IP, kết nối với mạng điện thoại công cộng và cá nhân, đồng thời duy trì chất lượng thoại và các yêu cầu của người dùng Các yêu cầu chính trong phát triển VoIP bao gồm việc đảm bảo chất lượng âm thanh, độ tin cậy và tính năng bảo mật trong quá trình truyền tải.
Chất lượng thoại phải so sánh được với chất lượng thoại của mạng
PSTN và với các mạng có chất lượng phục vụ khác nhau
Mạng IP cơ bản cần đáp ứng các tiêu chí hoạt động nghiêm ngặt, bao gồm việc giảm thiểu tình trạng không chấp nhận cuộc gọi, mất gói và mất kết nối Điều này trở nên quan trọng ngay cả khi mạng bị nghẽn hoặc khi có nhiều người sử dụng tài nguyên mạng đồng thời.
Tín hiệu điều khiển gọi không làm gián đoạn hoạt động của mạng, đảm bảo rằng người dùng không nhận ra công nghệ dịch vụ mà họ đang sử dụng.
Quản lý hệ thống an toàn, địa chỉ hoá và thanh toán cần được triển khai hiệu quả, ưu tiên việc tích hợp với các hệ thống hỗ trợ hoạt động của PSTN để đảm bảo tính đồng bộ và nâng cao hiệu suất.
CÁC GIAO THỨC BÁO HIỆU TRONG VOIP
Báo hiệu cuộc gọi trong mạng IP là yếu tố quan trọng trong các giải pháp VoIP Có nhiều phương án thiết lập cuộc gọi, bắt đầu từ giao thức H.323 đến các cải tiến như giao thức SIP và MGCP Bài viết này sẽ trình bày ba giao thức báo hiệu chính trong VoIP.
• MGCP (Media Gateway Control Protocol)
Hình 2.1 Quan hệ giữa các giao thức trong mạng VoIP
Giao thức H.323 phiên bản 1 và 2 hỗ trợ H.245 và Q.931 trên nền TCP, cùng với RAS trên nền UDP Các phiên bản 3 và 4 của H.323 mở rộng hỗ trợ H.245 và Q.931 trên nền UDP Trong khi đó, giao thức SIP có khả năng hỗ trợ cả TCP và UDP.
Call Control and Signaling Signaling and
Báo hiệu theo chuẩn H.323
Khái quát về chuẩn H.323
Công nghệ VoIP đang phát triển mạnh mẽ như một giải pháp truyền thoại hiệu quả, nhưng mạng PSTN truyền thống vẫn tồn tại và được người dùng ưa chuộng Do thói quen sử dụng điện thoại thông thường, điện thoại IP không thể ngay lập tức thay thế điện thoại truyền thống Vì vậy, cần có sự kết hợp chặt chẽ giữa hai công nghệ này Chuẩn H.323 của ITU-T đã được phát triển để đáp ứng các yêu cầu này, tạo điều kiện cho sự chuyển đổi mượt mà giữa điện thoại IP và điện thoại truyền thống.
H.323 là một tập hợp các tiêu chuẩn kỹ thuật cho việc truyền tải video, âm thanh và dữ liệu qua giao thức mạng Internet IP, được quy định bởi Hiệp hội Viễn thông Quốc tế (ITU T) Tiêu đề của ITU T cho H.323 là "Hệ thống truyền thông đa phương tiện dựa trên công nghệ gói" Chuẩn H.323 bao gồm các chức năng quan trọng như báo hiệu và điều khiển cuộc gọi, quản lý truyền thông đa phương tiện, và điều khiển băng thông cho các cuộc hội nghị điểm-điểm và đa điểm Các thành phần và giao thức của chuẩn H.323 đóng vai trò thiết yếu trong việc đảm bảo chất lượng và hiệu quả của các cuộc gọi và hội nghị trực tuyến.
Bảng 2.1 Các thành phần và các giao thức của chuẩn H.323
Dịch vụ (Feature) Giao thức (Protocol)
Báo hiệu cuộc gọi (Call Signaling) H.225 Điều khiển truyền thông (Media Control) H.245
Mã hoá và giải mã Audio (Audio Codecs) G.711, G.722, G.723,
Mã hóa và giải mã Video (Video Codecs) H.261, H.263
Chia sẻ dữ liệu (Data Sharing) T.120
Giao vận truyền thông (Media Transport) RTP/RTCP
Mạng chuyển mạch gói (PBN)
Thiết bị đầu cuối Thiết bị đầu cuối
Thiết bị đầu cuối Thiết bị đầu cuối
Thiết bị đầu cuối Thiết bị đầu cuối
Chồng giao thức H.323 có cấu trúc như sau (hình 2 2):
LAN LAN LAN LAN LAN ( ( ( ( (E E E E Ettttthe he he he herne rne rne rne rnet, t, t, t, T t, T T Toke T oke oke oken R oke n R n R n R n Ring, ing, ing, ing, ing, )))))
TCP TCP TCP TCP TCP UDP UDP UDP UDP UDP
RTP RTP RTP RTP RTP
Audio code code code code codeccccc G.711 G.711 G.711 G.711
Vide ide ide ide ideo o o o o code code code code codeccccc
R A R A R A R A R A SSSSS ( K ên h điề u kh iể n R A S )
H 2 25 0 (Q 9 31 ) (Kê nh đ iề u k hiể n c uộ c g ọi) H 2 45 (K ên h đ iề u k hiể n t ru yề n t hô ng )
Data a a a a aa a aapplication pplication pplication pplication pplication
Kênh Audio Các kênh điều khiển
Cấu trúc của một hệ thống H.323 và việc thông tin giữa hệ thống H.323 với các mạng khác được chỉ ra trên hình 2.3
Hìn 2h 3 Cấu trúc hệ thống H.323
Cấu trúc H.323 bao gồm bốn thành phần chính: thiết bị đầu cuối (terminal), gateway, gatekeeper và đơn vị điều khiển đa điểm (MCU) Mỗi thiết bị trong cấu trúc này đảm nhận những chức năng cụ thể, góp phần vào việc thiết lập và quản lý các cuộc gọi đa phương tiện.
2.1.2.1 Thiết bị đầu cuối (Terminal) Đầu cuối được dùng cho truyền thông hai chiều thời gian thực Một H.323 terminal có thể là điện thoại hay một máy tính chạy ứng dụng của H.323 và các multimedia khác Nó được sử dụng cho cả tín hiệu audio, video và dữ liệu H.323 đóng vai trò quan trọng trong điện thoại IP Mục đích của H.323 là có thể liên kết hoạt động được với các thiết bị truyền thông khác H.323 tương thích với H.324 terminal của mạng chuyển mạch công cộng, với H.310 terminal trên mạng B-ISDN Cấu trúc thiết bị đầu cuối H.323 được chỉ ra trên hình 2.4
Hình 2.4 Thiết bị đầu cuối H.323 (H.323 Terminal)
H.225.0 bao gồm các thành phần chính như sau: a) Bộ mã hoá và giải mã audio: tất cả thiết bị đầu cuối H.323 phải có khả năng mã hoá và giải mã âm thanh theo chuẩn G.711, đồng thời hỗ trợ các chuẩn nén khác như G.723, G.728 và G.729 Chúng có thể hoạt động không đối xứng trên cùng một kênh tiếng, cho phép gửi tín hiệu G.711 và nhận tín hiệu G.723 b) Bộ mã hoá và giải mã video: có nhiệm vụ mã hoá và giải mã tín hiệu video theo chuẩn H.261 hoặc H.263 c) Bộ đệm nhận tín hiệu: ghi nhận tất cả các gói tin và điều khiển độ trễ trên đường truyền để đạt được sự đồng bộ d) Khối điều khiển hệ thống: giám sát và điều khiển hoạt động của thiết bị trong mạng, bao gồm ba khối điều khiển độc lập: điều khiển H.245, chức năng báo hiệu RAS và chức năng báo hiệu cuộc gọi.
Khối điều khiển theo chuẩn H.245 sử dụng kênh H.245 để truyền các bản tin điều khiển điểm - điểm, nhằm điều phối hoạt động của các phần tử H.323 trong mạng Điều này bao gồm việc trao đổi khả năng, mở và đóng các kênh logic, yêu cầu chế độ hoạt động phù hợp, điều khiển tính tuần tự của các bản tin, cũng như phát lệnh và chỉ thị cần thiết.
• Chức năng báo hiệu cuộc gọi: sử dụng báo hiệu theo khuyến nghị
H.225.0 là giao thức thiết lập kết nối giữa hai đầu cuối trong hệ thống H.323, hoạt động độc lập với kênh báo hiệu RAS và H.245 Trong các hệ thống không có Gatekeeper, kênh báo hiệu cuộc gọi được thiết lập trực tiếp giữa hai đầu cuối tham gia Ngược lại, trong hệ thống có Gatekeeper, kênh báo hiệu cuộc gọi có thể được thiết lập giữa các đầu cuối với Gatekeeper hoặc giữa hai đầu cuối với nhau, tùy thuộc vào quyết định của Gatekeeper.
Kênh báo hiệu RAS, theo khuyến nghị H.225.0, thực hiện các chức năng như đăng ký dịch vụ, thay đổi băng thông và thông báo trạng thái giữa các đầu cuối và Gatekeeper Trong mạng không có Gatekeeper, kênh RAS không tồn tại, trong khi trong mạng có Gatekeeper, kênh này được thiết lập giữa đầu cuối và Gatekeeper Lớp H.225.0 định nghĩa các kênh logic cho thông tin thoại, video và điều khiển, được quản lý theo quy trình của H.245 Các kênh logic chủ yếu là đơn hướng và độc lập, ngoại trừ một số kênh dữ liệu có thể hai hướng Mỗi kênh logic được xác định bởi một số LCN từ 0 đến 65535, và băng thông của kênh phải được giới hạn bởi giá trị cận trên dựa trên khả năng phát và thu của thiết bị đầu cuối.
Gateway là thiết bị quan trọng trong việc ánh xạ và thông dịch giữa mạng IP và mạng điện thoại, hoạt động như cầu nối trong các cuộc gọi chuyển tiếp từ mạng H.323 sang mạng phi H.323 Nó thực hiện nhiều chức năng, bao gồm chuyển đổi giữa các dạng khung truyền dẫn như H.225.0 và H.221, cũng như giữa các thủ tục giao tiếp như H.245 và H.242 Bên cạnh đó, Gateway còn chuyển đổi giữa các dạng mã hóa khác nhau của luồng tín hiệu âm thanh và hình ảnh, đồng thời có khả năng thiết lập và giải phóng cuộc gọi ở cả hai phía.
Gateway hoạt động như một thiết bị đầu cuối H.323 hoặc một MCU trong mạng LAN, đồng thời cũng có đặc điểm của một thiết bị đầu cuối trong SCN (Switch Channel Network) hoặc một MCU trong SCN Do đó, có bốn cấu hình cơ sở của Gateway được thể hiện trong hình 2.5.
Hình 2 5 Các cấu hình cơ sở của Gateway
Gatekeeper đóng vai trò quan trọng trong việc điều khiển dịch vụ cuộc gọi giữa các điểm cuối H.323 Chức năng này có thể được thực hiện bởi một Gatekeeper duy nhất hoặc nhiều Gatekeeper cùng phối hợp Các chức năng của Gatekeeper được chia thành hai loại: chức năng bắt buộc và chức năng không bắt buộc.
Các chức năng bắt buộc của Gatekeeper
Chức năng dịch địa chỉ của Gatekeeper cho phép chuyển đổi từ địa chỉ hình thức (tên gọi) của các thiết bị đầu cuối và Gateway sang địa chỉ truyền dẫn thực trong mạng, cụ thể là địa chỉ IP.
Điều khiển truy nhập - Gatekeeper sẽ chấp nhận một truy nhập mạng
LAN bằng cách sử dụng các bản tin H.225.0 là ARQ/ACF/ARJ
Biến đổi chức năng Chức năng đầu cuối
Điều khiển độ rộng băng tần - Gatekeeper hỗ trợ việc trao đổi các bản tin
H.225.0 là BRQ/BCF/BRJ để điều khiển độ rộng băng tần của một cuộc gọi
Điều khiển vùng là khái niệm chỉ tập hợp các phần tử H.323 như thiết bị đầu cuối, Gateway và MCU được đăng ký hoạt động với Gatekeeper Gatekeeper đóng vai trò quan trọng trong việc điều phối liên lạc giữa các phần tử trong cùng một vùng và giữa các vùng khác nhau.
Các chức năng không bắt buộc của Gatekeeper
Gatekeeper có hai phương thức điều khiển báo hiệu cuộc gọi: một là kết hợp kênh báo hiệu trực tiếp giữa các đầu cuối để hoàn thành quá trình báo hiệu, và hai là chỉ sử dụng các kênh báo hiệu riêng của nó để xử lý báo hiệu cuộc gọi.
Hạn chế truy nhập - Gatekeeper có thể sử dụng báo hiệu trên kênh
H.225.0 để từ chối một cuộc gọi của một thiết bị đầu cuối khi nhận thấy có lỗi trong việc đăng ký
Giám sát độ rộng băng tần là một chức năng quan trọng của Gatekeeper, cho phép hạn chế số lượng đầu cuối H.232 kết nối cùng lúc trên mạng Qua kênh báo hiệu H.225.0, Gatekeeper có thể từ chối cuộc gọi khi không đủ băng tần hoặc khi một đầu cuối đang hoạt động cần thêm băng thông Quy trình này có thể được thực hiện một cách linh hoạt, cho phép tất cả các yêu cầu truy cập được chấp nhận nếu cần thiết.
Các thủ tục báo hiệu cuộc gọi
Một cuộc gọi trong hệ thống được tiến hành theo 5 giai đoạn như sau:
Giai đoạn I - Thiết lập cuộc gọi (Call Setup): Một kết nối TCP được thiết lập để truyền các thông điệp Q.931của kênh báo hiệu cuộc gọi
Giai đoạn II - Khởi đầu truyền thông: Tại giai đoạn này, một kết nối TCP mới được thiết lập cho kênh điều khiển truyền thông H.245, trong đó diễn ra quá
Giai đoạn III - Thiết lập kênh tín hiệu media (Establish media communication): Thủ tục mở kênh logic cho tín hiệu media của kênh H.245 được thực hiện
Giai đoạn IV - Dịch vụ cuộc gọi (Call Services) cho phép người sử dụng trao đổi thông tin một cách hiệu quả Trong giai đoạn này, các dịch vụ giám sát chất lượng, điều khiển lưu lượng và các dịch vụ bổ trợ khác cũng được triển khai để đảm bảo trải nghiệm người dùng tối ưu.
Giai đoạn V - Kết thúc cuộc gọi (Call Termination)
Báo hiệu H.323 là một quá trình thực sự phức tạp Tương tác giữa các phần tử trong mạng H.323 trong quá trình báo hiệu được mô tả trong hình 2.6
Hình 2.6 Báo hiệu thiết lập cuộc gọi giữa mạng chuyển mạch gói và PSTN
H.245 messages over call control channel
H.225/Q.931 messages over call signaling channel
H.225/RAS messages over RAS channel H.225/Q.931 (optional)
H.225/RAS messages over RAS channel
Có hai kiểu báo hiệu: trực tiếp giữa các điểm cuối và gián tiếp qua gatekeeper Sự khác biệt nằm ở việc các thông điệp Q.931 được trao đổi trực tiếp giữa các điểm cuối hoặc gián tiếp qua gatekeeper Các điểm cuối có thể chia sẻ cùng một gatekeeper hoặc mỗi điểm cuối có một gatekeeper riêng.
Trong bài viết này, chúng tôi trình bày ví dụ về thiết lập cuộc gọi giữa hai điểm cuối A và B có cùng một gatekeeper trong trường hợp báo hiệu trực tiếp Đây là kịch bản cuộc gọi điểm-điểm đơn giản nhất, nơi báo hiệu cuộc gọi không được định tuyến qua gatekeeper Ngoài ra, H.323 còn hỗ trợ nhiều kịch bản thiết lập cuộc gọi phức tạp khác.
Nếu xem xét một cách chi tiết thì cuộc gọi giữa hai đầu cuối H.323 được thiết lập như sau (hình 2.7):
- Trước hết cả 2 phải đã được đăng ký tại gatekeeper
- Đầu cuối A gửi yêu cầu tới gatekeeper đề nghị thiết lập cuộc gọi
- Gatekeeper gửi cho đầu cuối A thông tin cần thiết về đầu cuối B
- Đầu cuối A gửi bản tin SETUP tới đầu cuối B
- Đầu cuối B trả lời bằng bản tin Call Proceeding và đồng thời liên lạc với gatekeeper để xác nhận quyền thiết lập cuộc gọi
- Đầu cuối B gửi bản tin Alerting và Connect
Hai đầu cuối trong quá trình trao đổi sẽ gửi một số bản tin H.245 để xác định vai trò chủ/tớ, khả năng xử lý của từng đầu cuối và thiết lập kết nối RTP giữa Điểm cuối A và Gatekeeper, cũng như giữa Điểm cuối B.
H.225 Yêu cầu kết nạp ARQ H.225Khẳng định kết nạp ACF
H.225 Yêu cầu kết nạp ARQ
H.225Khẳng định kết nạp ACF
Mở kênh TCP cho H245 Trao đổi khả năng Quyết định chủ tớ
Mở kênh logic cho thoại
Trao đổi thông tin thoại hai chiều
Hình 2.7 Báo hiệu trực tiếp - Cùng Gatekeeper
Giao thức điều khiển phiên SIP (Session Initation Protocol)
Các thành phần của SIP
Hình 2.8 chỉ ra các thành phần của SIP:
Hệ thống SIP bao gồm hai thành phần là các User Agent và các Network Server
User Agent là thiết bị đầu cuối trong mạng SIP, có thể là máy điện thoại SIP hoặc máy tính chạy phần mềm đầu cuối SIP Một thực thể người dùng bao gồm hai phần: client và server Phần client, gọi là UAC (User Agent Client), được sử dụng để khởi tạo yêu cầu, trong khi phần server, gọi là UAS (User Agent Server), nhận yêu cầu và gửi lại các phản hồi.
Các Server mạng (Network Servers):
Proxy Server là phần mềm trung gian hoạt động như cả máy chủ và máy khách, thực hiện các yêu cầu thay mặt cho các thiết bị khác Nó xử lý yêu cầu tại chỗ khi có thể, hoặc chuyển tiếp đến các máy chủ khác Nếu Proxy Server không thể đáp ứng trực tiếp, nó sẽ chuyển đổi hoặc định dạng lại yêu cầu trước khi gửi đi.
Máy chủ vị trí (Location Server) có chức năng định vị thuê bao, cung cấp thông tin về các vị trí khả thi của phía bị gọi cho các máy chủ Proxy và Redirect.
Redirect Server nhận yêu cầu SIP và chuyển đổi địa chỉ SIP sang các địa chỉ khác, sau đó gửi lại cho đầu cuối Nó xác định server tiếp theo cần chuyển yêu cầu và cung cấp địa chỉ của server đó cho client, cho phép client tự chuyển yêu cầu Khác với Proxy Server, Redirect Server không hoạt động như một đầu cuối, không gửi đi yêu cầu và cũng không nhận hay hủy cuộc gọi.
• Registrar Server (Server đăng kí) nhận các yêu cầu đăng ký
Trong nhiều trường hợp, Registrar Server không chỉ đảm nhiệm vai trò đăng ký mà còn thực hiện các chức năng an ninh như xác nhận người sử dụng Thường thì, Registrar Server được cài đặt cùng với proxy hoặc redirect server, hoặc cung cấp dịch vụ định vị thuê bao Mỗi khi thiết bị đầu cuối, như điện thoại hoặc phần mềm SIP, được bật lên, nó sẽ đăng ký lại với server Nếu thiết bị cần thông báo vị trí của mình, một bản tin REGISTER sẽ được gửi đi Các thiết bị đầu cuối thường thực hiện việc đăng ký lại một cách định kỳ.
Các bản tin SIP và mào đầu
SIP định nghĩa rất nhiều bản tin Những bản tin được dùng để trao đổi thông tin giữa Client và SIP Server bao gồm:
INVITE – Bắt đầu thiết lập cuộc gọi bằng cách gửi bản tin mời đầu cuối khác tham gia
ACK – Bản tin này khẳng định client đã nhận được bản tin trả lời bản tin INVITE
BYE – Bắt đầu kết thúc cuộc gọi
CANCEL – Huỷ yêu cầu đang nằm trong hàng đợi
REGISTER - Đầu cuối SIP sử dụng bản tin này để đăng ký với Registrar Server
OPTIONS – Sử dụng để xác định năng lực của server
INFO – Sử dụng để tải các thông tin như tone DTMF
Giao thức SIP có nhiều điểm trùng hợp với giao thức HTTP Các bản tin trả lời các bản tin SIP nêu trên gồm có:
1xx – Các bản tin chung
4xx – Yêu cầu không được đáp ứng
5xx – Sự cố của server.
6xx – Sự cố toàn mạng
Các bản tin SIP có định dạng văn bản tương tự như HTTP, với phần đầu của bản tin cũng giống như HTTP SIP hỗ trợ MIME, một số chuẩn liên quan đến email Dưới đây là một ví dụ về phần đầu của bản tin SIP.
User-Agent: Cisco IP Phone/ Rev 1/ SIP enabled
Hoạt động của SIP
Người gọi và người bị gọi trong cuộc gọi SIP được xác định qua địa chỉ SIP Để thực hiện cuộc gọi, người gọi cần chọn Server phù hợp để gửi yêu cầu Cuộc gọi có thể được thực hiện trực tiếp hoặc thông qua các Server chỉ đường Mỗi cuộc gọi được nhận diện duy nhất bởi trường call ID trong tiêu đề của thông điệp SIP.
Các trạm SIP được xác định qua địa chỉ SIP, có dạng giống như URL (Universal Resource Locator), với cấu trúc user@host Phần "user" có thể là tên người dùng hoặc số điện thoại, trong khi phần "host" có thể là tên miền hoặc địa chỉ IP Địa chỉ email cũng có thể được sử dụng làm địa chỉ SIP Ví dụ: sip:leminh@mail.hut.edu.vn hoặc sip:4085376@193.100.101.23.
Một địa chỉ SIP có thể đại diện cho một cá nhân hoặc một nhóm người
Xác định một SIP server:
Một Client có thể gửi yêu cầu trực tiếp đến Proxy Server trong cùng một vùng hoặc đến địa chỉ IP và cổng tương ứng với địa chỉ SIP Gửi yêu cầu trực tiếp là dễ dàng vì trạm cuối đã biết về Proxy Server phục vụ Ngược lại, việc gửi theo cách thứ hai phức tạp hơn, vì Client cần xác định chính xác địa chỉ IP và cổng của Server.
Mời tham gia đàm thoại:
Một lời mời thành công bao gồm thông điệp INVITE và thông điệp ACK Yêu cầu INVITE mời bên bị gọi tham gia hội nghị hoặc đối thoại hai bên, và nếu bên bị gọi đồng ý, họ sẽ gửi lại thông điệp ACK để xác nhận Yêu cầu INVITE chứa mô tả phiên, cung cấp đầy đủ thông tin cần thiết cho bên bị gọi Nếu bên bị gọi chấp nhận lời mời, họ cũng sẽ gửi một bản mô tả tương tự trong thông điệp ACK.
Xác định người bị gọi :
Bên bị gọi có khả năng thay đổi địa điểm từ trạm cuối này sang trạm cuối khác, có thể kết nối vào mạng LAN công ty hoặc truy cập từ nhà qua mạng công cộng của ISP Các vị trí này có thể được đăng ký linh hoạt với SIP Server hoặc các Server xác định vị trí bên ngoài hệ thống SIP Trong trường hợp này, các SIP Server cần lưu trữ bảng danh sách các vị trí khả dụng, trong khi một server vị trí thực sự trong hệ thống SIP sẽ tạo ra và chuyển giao các bảng danh sách này cho SIP server.
Hoạt động thiết lập cuộc gọi trong hệ thống SIP:
Các SIP server có thể hoạt động như một máy chủ Proxy hoặc máy chủ Redirect, cho phép chúng giao tiếp với một máy chủ Location bên ngoài để lấy thông tin về đường đi tới đích Máy chủ Location có thể là bất kỳ hệ thống nào lưu trữ thông tin liên quan đến thuê bao mà người dùng đang gọi.
Thiết lập và huỷ cuộc gọi SIP
Quá trình thiết lập và huỷ cuộc gọi SIP cơ bản được mô tả trong hình 2.9:
In the SIP call setup and termination process, the User Agent Client (UAC) initiates the communication by sending an INVITE request to the Proxy Server Due to the presence of multiple Proxy Servers, the initial Proxy Server forwards the INVITE to a Redirect Server to locate the intended recipient The Redirect Server then consults the Location Server to determine the recipient's address Subsequently, the Redirect Server provides a temporary address to the Proxy Server, which acknowledges receipt of the address with an ACK response.
Similarly, once the Proxy Server receives the address, it sends an INVITE message to the next Proxy Server, which then forwards the INVITE request to the Redirect Server for address inquiry Subsequently, this Proxy Server transmits the INVITE message to the User Agent Server (UAS).
Sau khi UAS phát tín hiệu bằng tiếng chuông Ringing, UAC sẽ phản hồi bằng bản tin ACK Đường truyền giữa hai bên được thiết lập thông qua giao thức thời gian thực RTP.
Khi phiên làm việc kết thúc, UAS sẽ gửi bản tin BYE đến UAC, và UAC sẽ phản hồi bằng bản tin OK để xác nhận Điều này đánh dấu sự kết thúc của phiên làm việc giữa hai bên.
Tính năng của SIP
Giao thức SIP được thiết kế với những tiêu chí sau:
• Tích hợp với các giao thức đã có của IETF
• Đơn giản và có khả năng mở rộng
• Hỗ trợ tối đa sự di động của đầu cuối
• Dễ dàng tạo tính năng mới cho dịch vụ và dịch vụ mới
Tích hợp với các giao thức đã có của IETF
Các giao thức khác của IETF có thể sử dụng để xây dựng những ứng dụng SIP SIP có thể hoạt động cùng với nhiều giao thức như
- RSVP (Resource Reservation Protocol) giao thức lưu trữ tài nguyên mạng
- RTP giao thức giao vận dữ liệu thời gian thực
- RTSP (Real Time Streaming Protocol) giao thức kiểm soát luồng dữ liệu
- SAP (Session Advertisement Protocol) giao thức quảng cáo trong phiên kết nối
- SDP (Session Description Protocol) giao thức mô tả các phiên kết nối đa phương tiện
- MIME (Multipurpose Internet Mail Extension) giao thức thư điện tử
- HTTP (Hypertext Transfer Protocol) giao thức để truy nhập trang Web
- COPS (Common Open Policy Service)
Đơn giản và có khả năng mở rộng
SIP là giao thức tối giản với ít bản tin và không có chức năng thừa, cho phép thiết lập các phiên kết nối phức tạp như hội nghị Với thiết kế đơn giản và gọn nhẹ dựa trên khuôn dạng text, SIP đã khắc phục những điểm yếu của nhiều giao thức trước đó.
Các phần mềm như Proxy Server, Registrar Server, Redirect Server và Location Server có thể hoạt động trên các máy chủ khác nhau mà không làm ảnh hưởng đến các máy chủ hiện có Điều này cho phép hệ thống chuyển mạch SIP dễ dàng nâng cấp và mở rộng.
Hỗ trợ tối đa sự di động của đầu cuối
Hệ thống sử dụng Proxy Server, Registrar Server và Redirect Server giúp xác định chính xác vị trí của thuê bao, ví dụ như thuê bao ktcm@vnpt.vn có thể nhận cuộc gọi và thông điệp từ bất kỳ đâu qua các thiết bị như máy tính để bàn, laptop hay điện thoại SIP Công nghệ SIP cũng hỗ trợ nhiều dịch vụ di động mới, bao gồm tính năng nhận diện trạng thái đầu cuối và call forking.
Dễ dàng tạo tính năng mới cho dịch vụ và dịch vụ mới
Giao thức khởi tạo phiên SIP trong mạng chuyển mạch gói cho phép phát triển nhanh chóng các tính năng và dịch vụ mới Các công cụ như Call Processing Language (CPL) và Common Gateway Interface (CGI) được sử dụng để thực hiện điều này SIP không chỉ hỗ trợ các dịch vụ thoại như chờ cuộc gọi, chuyển tiếp cuộc gọi và chặn cuộc gọi, mà còn cung cấp khả năng gửi thông điệp thống nhất.
So sánh H.323 và SIP
H.323 và SIP có nhiều điểm tương đồng, cả hai đều cho phép điều khiển, thiết lập và hủy cuộc gọi Dù hỗ trợ tất cả các dịch vụ cần thiết, nhưng vẫn tồn tại một số khác biệt giữa hai chuẩn này.
H.323 hỗ trợ hội nghị đa phương tiện phức tạp, cho phép các thành viên tham gia sử dụng các dịch vụ như bảng thông báo, trao đổi dữ liệu và hội nghị video.
• SIP hỗ trợ SIP-CGI (SIP Common Gateway Interface) và CPL (Call - Processing Language)
• SIP hỗ trợ điều khiển cuộc gọi từ một đầu cuối thứ 3 Hiện nay H.323 đang được nâng cấp để hỗ trợ chức năng này
Quan hệ kết nối Ngang cấp Ngang cấp
Khởi điểm Dựa trên mạng Internet và Web Cú pháp và bản tin tương tự như HTTP
Cơ sở là mạng thoại Giao thức báo hiệu tuân theo chuẩn ISDN Q.SIG Đầu cuối Đầu cuối thông minh SIP Đầu cuối thông minh H.323
Các server lõi SIP proxy, redirect, location, và registration servers
Giai đoạn thử nghiệm khả năng và hoạt động của thiết bị từ các nhà cung cấp khác nhau đã hoàn tất, dẫn đến sự gia tăng nhanh chóng trong sự phổ biến của SIP, hiện đã được ứng dụng rộng rãi.
Text, UTF-8 Nhị phân ASN.1 PER
Trễ thiết lập cuộc gọi
1.5 RTT (round-trip time, tức chu kỳ gửi bản tin và nhận bản tin trả lời hay xác nhận)
Giám sát trạng thái cuộc gọi
Có 2 lựa chọn: chỉ trong thời gian thiết lập cuộc gọi hoặc suốt thời gian cuộc gọi
Trong phiên bản 1 và 2, máy chủ cần giám sát liên tục trong suốt cuộc gọi và duy trì trạng thái kết nối TCP, điều này hạn chế khả năng mở rộng và giảm độ tin cậy của hệ thống.
Sử dụng các giao thức khác như RSVP, OPS, OSP để đảm bảo chất lượng dịch vụ
Gatekeeper điều khiển băng thông H.323 khuyến nghị dùng RSVP để lưu dữ tài nguyên mạng
Bảo mật Đăng ký tại registrar server, có xác nhận đầu cuối và mã hoá
Chỉ đăng ký khi trong mạng có gatekeeper, xác nhận và mã hoá theo chuẩn H.235 Định vị đầu cuối và định tuyến cuộc gọi
Sử dụng SIP URL để xác định địa chỉ và thực hiện định tuyến thông qua Redirect và Location server Đầu cuối được định vị bằng E.164 hoặc tên ảo H.323, cùng với phương pháp ánh xạ địa chỉ nếu có gatekeeper trong mạng Chức năng định tuyến được thực hiện bởi gatekeeper.
Tính năng thoại Hỗ trợ các tính năng của cuộc gọi cơ bản
Hỗ trợ các tính năng của cuộc gọi cơ bản
Hội nghị cơ sở và quản lý phân tán được thiết kế để hỗ trợ nhiều tính năng hội nghị, bao gồm thoại, hình ảnh và dữ liệu, với khả năng quản lý tập trung.
MC có thể tắc nghẽn Tạo tính năng và dịch vụ mới
Dễ dàng, sử dụng SIP- CGI và CPL H.450.1
Khả năng mở rộng Dễ dàng Hạn chế
Tích hợp với web Rất tốt, hỗ trợ click- - to dial Kém
Bảng 2.2 So sánh SIP và H.323
Báo hiệu theo giao thức MGCP
Giới thiệu chung
Nhiều phương pháp báo hiệu mới cho VoIP đã được phát triển, trong đó nổi bật là giao thức SGCP (Simple Gateway Control Protocol) và phiên bản cải tiến của nó, MGCP (Media Gateway Control Protocol).
SGCP ra đời là do những vấn đề sau:
Chuyển tiếp báo hiệu cuộc gọi từ mạng PSTN sang mạng VoIP gặp nhiều khó khăn do sự khác biệt trong nội dung của các bản tin Việc chuyển đổi các bản tin báo hiệu SS7 thành bản tin Q.931 có thể dẫn đến mất mát thông tin quan trọng.
• Thời gian thiết lập cuộc gọi trong H323 quá dài và trải qua nhiều giai đoạn
Giao thức Điều khiển Cổng Truyền Thông (MGCP) là một phương thức được sử dụng để quản lý các gateway thoại thông qua các thiết bị điều khiển cuộc gọi, thường được gọi là Bộ điều khiển Cổng Truyền Thông hoặc Đại lý Cuộc gọi Định nghĩa này được lấy từ IETF RFC 2705 về Giao thức Điều khiển Cổng Truyền Thông.
Quan hệ giữa MG và MGC (hay CA) được thể hiện qua hình 2.10, trong đó MGC thực hiện chức năng báo hiệu cuộc gọi và điều khiển MG Sự trao đổi lệnh giữa MGC và MG diễn ra thông qua giao thức MGCP.
MGCP được phát triển để tách biệt chức năng báo hiệu và thiết lập đường truyền Khi nhận yêu cầu thiết lập cuộc gọi SIP hoặc H.323, MGC/SW sử dụng giao thức MGCP để điều khiển Gateway thiết lập phiên kết nối giữa hai đầu cuối MGCP cho phép truyền tải các loại tín hiệu như thoại, dữ liệu và hình ảnh giữa các mạng.
Trong mô hình MGCP, các Gateway (MG) tập trung vào việc phiên dịch tín hiệu âm thanh, trong khi đó, Softswitch (SW) đảm nhận vai trò xử lý báo hiệu và quản lý cuộc gọi trong mạng truyền thống (PSTN).
Thiết lập cuộc gọi
Trình tự thiết lập cuộc gọi cơ sở là như sau (hình 2.11):
Call Agent or Media Gateway Controller (MGC)
Call Agent or Media Gateway Controller (MGC)
Call Agent Media Gateway Controller
Hình 2.11 Thiết lập cuộc gọi A-B
• Khi máy ĐT A được nhấc lên gateway A gửi bản tin cho MGC
• Gateway A tạo âm mời quay số và nhận số bị gọi
• Số bị gọi được gửi cho MGC
• MGC xác định định tuyến cuộc gọi như thế nào
• MGC gửi lệnh cho gateway B
• MGC gửi lệnh cho gateway A và B tạo phiên kết nối RTP/RTCP
2.3.3 So sánh MGCP, SIP và H.323
MGCP khác với SIP và H.323 ở một số điểm như sau:
• MGCP là giao thức kiểu chủ/ tớ, trong khi SIP và H.323 là giao thức ngang cấp
• MGCP được sử dụng giữa MG và MGC
MGCP được phát triển để phân tách chức năng báo hiệu và thiết lập đường truyền Khi nhận yêu cầu thiết lập cuộc gọi SIP hoặc H.323, MGC (bao gồm CA, softswitch ) sử dụng giao thức MGCP để điều khiển gateway, từ đó thiết lập phiên kết nối giữa hai đầu cuối.
Hình 2.12 H.323 Gateway và MGC + MG
Trong hình 2.12, chức năng báo hiệu được tách biệt và do MGC đảm nhiệm Chúng ta sẽ xem xét việc thiết lập cuộc gọi trong hai trường hợp khác nhau.
Hình 2.13 Báo hiệu thiết lập cuộc gọi trong hai mạng H.323 và MGCP
1 Thuê bao nhấc máy và quay số
2 Gateway phân tích định tuyến cuộc gọi
3 Hai gateway trao đổi thông tin
4 Gateway bị gọi đổ chuông ở số máy bị gọi
5 Hai gateway thiết lập phiên kết nối RTP/RTCP
1 Thuê bao nhấc máy và quay số
2 Gateway thông báo cho MGC
3 MGC phân tích số, định tuyến và gửi lệnh cho gateway bị gọi để đổ chuông ở số máy bị gọi
4 MGC gửi lệnh cho 2 gateway để thiết lập phiên kết nối RTP/RTCP
Bảng 2.3 Thiết lập cuộc gọi trong hai mạng H.323 và MGCP
Trên cơ sở MGCP một số giao thức mới được phát triển, đó là:
- Megaco do IETF phát triển
- H.248 hay H.GCP do ITU phát triển
MGCP và Megaco/H.248 là hai giao thức điều khiển MG từ MGC/SW, trong đó Megaco/H.248 là phiên bản mới hơn và đang dần thay thế MGCP Nhiều thiết bị hiện nay được sản xuất để hỗ trợ đồng thời cả hai giao thức này.
Megaco/H.248 là chuẩn quốc tế điều khiển cổng (Gateway) trong các mạng riêng, dựa trên mô hình chủ/tớ (Master/Slave) và được phát triển bởi IETF và ITU Chuẩn này nổi bật với tính đơn giản, hiệu quả cao và khả năng mở rộng, cho phép xây dựng chức năng cổng tách rời dưới lớp điều khiển cuộc gọi như H.323 và SIP Megaco/H.248 mang lại tính linh hoạt cao trong việc triển khai các dịch vụ lớn, đồng thời hỗ trợ và phát triển tốt các mạng kế thừa.
Megaco/H.248 cung cấp một phương pháp điều khiển cổng độc lập, bao trùm tất cả các ứng dụng cổng vào ra như cổng trung kế PSTN, giao diện ATM, đường dây tương tự, điện thoại Internet và nhiều ứng dụng khác Với khả năng phục vụ cho nhiều ứng dụng và các đặc tính nổi bật như đơn giản, hiệu quả, mềm dẻo và lợi nhuận cao, Megaco/H.248 đã trở thành một tiêu chuẩn hấp dẫn cho mạng thế hệ kế tiếp (NGN).
Hình 2.14 Cấu trúc giao thức điều khiển cổng Megaco/H.248
Hình 2.14 chỉ ra cấu trúc của Megaco/H.248:
Lớp MGC chứa thông tin điều khiển cuộc gọi và cung cấp các đặc trưng như hướng cuộc gọi, chuyển cuộc gọi, hội nghị và giữ cuộc gọi Nó cũng bao gồm một số giao thức ngang cấp để tương tác với các MGC khác, quản lý các đặc trưng tương thích và một số tương thích với mạng báo hiệu số 7 (SS7).
Lớp MG thực hiện kết nối phương tiện với mạng gói cơ bản (IP hoặc ATM) và tương tác với các kết nối này để chuyển tiếp tín hiệu và sự kiện đến ứng dụng Đồng thời, lớp này cũng điều khiển các đặc tính thiết bị cổng như giao diện người dùng Lớp MG không quan tâm đến các đặc tính mức cuộc gọi và hoạt động
+) Giao thức Megaco/H.248 thực hiện điều khiển chủ/tớ MG bởi MGC Nó cung cấp điều khiển kết nối, điều khiển thiết bị, và cấu hình thiết bị
Các đặc trưng của Megaco/H.248:
• Hai khái niệm chính - đầu cuốivà đối tượng
Đầu cuối cung cấp kết nối phương tiện đến hoặc từ mạng gói, cho phép tín hiệu được truyền qua các kết nối này và các sự kiện được tiếp nhận từ chúng.
- Đối tượngcung cấp cầu nối và trộn phương tiện giữa các đầu cuối
• Chỉ có 7 lệnh, hoạt động trên các đầu cuối theo cách nhất định: Add, Subtract, Move, Modify, Notify, Audit, ServiceChange
• Nhóm các lệnh vào các phiên hoạt động (transaction), sử dụng quy tắc xây dựng mềm dẻo
• Các lệnh sử dụng kí hiệu để nhóm các thành phần dữ liệu liên quan
Cơ chế mở rộng gói cung cấp một phương thức rõ ràng và đơn giản để xác định các tín hiệu, sự kiện, thuộc tính và thông số trên đầu cuối.
• Cơ chế hoạt động cấu hình định nghĩa tổ chức của MG và chỉ rõ sự lựa chọn các thành phần cho các ứng dụng riêng biệt
So sánh Megaco/H.248 và MGCP
Các vấn đề Megaco/H.248 MGCP
Tiêu chuẩn hoá Là một chuẩn thật sự mở
Vấn đề có thể được xem xét lại
Là chuẩn quốc tế độc lập từ cả IETF và ITU
Vấn đề không thể xem xét lại
Mô hình kết nối Mô hình đầu cuối đối tượng - hoàn toàn mềm dẻo, cung cấp cho tất cả các mạng
Có khả năng thực hiện những kịch bản kết nối phức tạp, trộn lẫn đa phương tiện
Có thể áp dụng cho tất cả các loại mạng gói, xây dựng các dịch vụ đồng thời cho cả mạng
Mô hình kết nối kém mềm dẻo
Không hiệu quả đối với hội nghị và các kịch bản kết nối phức tạp khác
Các dịch vụ khác nhau cung cấp cho mạng IP và ATM, làm tăng sự phức tạp, khó khăn hơn khi triển khai
Cơ chế mở rộng gói cho phép định nghĩa dễ dàng các giao diện ứng dụng mới thông qua một hệ thống định nghĩa gói hoàn toàn mở và xử lý đăng ký hiệu quả.
Các gói mới có thể được định nghĩa dựa trên các gói đã có
Cho phép định nghĩa mở rộng các gói mà không cần chuẩn giao thức cơ bản
Thời gian ngắn để tạo ra các chức năng mới, tăng cơ hội đổi mới
Rất khó mở rộng các thiết kế cố định
Cơ chế định nghĩa gói mở không rõ ràng
Không có các thuật toán để mở rộng gói dựa trên các gói đã có
Cơ chế cấu hình Cho phép định nghĩa và thoả thuận giữa MGC và MG trên các ứng dụng rõ ràng
Giảm phức tạp và tăng hiệu quả trong cả MGC và MG
Cải thiện vận hành cho các ứng dụng riêng biệt
Bảng 2.4 So sánh Megaco/H.248 và MGCP
Trong các mạng VoIP hiện nay, giao thức H.323 được sử dụng chủ yếu cho báo hiệu liên gateway, trong khi SS7 phục vụ kết nối PSTN Tuy nhiên, H.323 ít được chú trọng trong các sản phẩm mới do tính phức tạp của nó, mặc dù hỗ trợ nhiều tính năng như truyền hình hội nghị và đảm bảo hoạt động giữa các mạng khác Thủ tục báo hiệu của H.323 trải qua nhiều giai đoạn, dẫn đến thời gian thiết lập cuộc gọi dài Các nhà cung cấp thiết bị hỗ trợ H.323 chủ yếu nhằm đảm bảo tính tương thích với các mạng hiện có.
Có lẽ trong tương lai H.323 chỉ có thể đứng vững trong lĩnh vực hẹp là báo hiệu những hội nghị audio hay video đặc biệt phức tạp
SIP được phát triển để cải thiện các nhược điểm của H.323 trong môi trường mạng Internet, sử dụng mô hình Client/Server Việc thiết lập cuộc gọi qua SIP diễn ra nhanh chóng với quy trình báo hiệu đơn giản hơn và khả năng mở rộng cao Trong mạng NGN, SIP đã trở thành tiêu chuẩn cho các kết nối IP, trong khi SS7 vẫn được sử dụng để báo hiệu với mạng PSTN.
MGCP là một phương pháp báo hiệu hiện đại, cho phép tích hợp hoạt động với mạng PSTN, đặc biệt là mạng báo hiệu số 7, và có khả năng mở rộng để phát triển các tính năng mới Tuy nhiên, mô hình báo hiệu dựa trên MGCP vẫn chưa đầy đủ, nhiều tính năng vẫn phải sử dụng H323 hoặc SIP, chẳng hạn như trong trường hợp truyền thông PC tới PC hoặc hội nghị truyền hình, và chưa nhận được sự hỗ trợ rộng rãi từ các nhà sản xuất.
GIẢI PHÁP ĐẢM BẢO CHẤT LƯỢNG THOẠI TRONG
Chất lượng thoại là yếu tố quan trọng hàng đầu trong VoIP, yêu cầu mạng IP phải xử lý các yếu tố như trễ, trượt và mất gói Để truyền thoại hiệu quả qua mạng IP, cần có các giải pháp giảm thiểu các vấn đề này Nhiều giải pháp đã được áp dụng để cải thiện chất lượng tín hiệu thoại trong VoIP Để duy trì chất lượng thoại ở mức chấp nhận được, mặc dù có những nguyên nhân bất thường trong mạng, các kỹ thuật nén thoại và biện pháp xử lý gói thoại kết hợp với các phương pháp đảm bảo chất lượng dịch vụ (QoS) là rất cần thiết Dưới đây là một số giải pháp đảm bảo chất lượng thoại trong VoIP.
• Kĩ thuật nén thoại trong VoIP
• Các biện pháp xử lý khi gói hoá thoại
Các cơ chế đảm bảo chất lượng dịch vụ tại các nút mạng bao gồm các thuật toán xếp hàng (queuing), cơ chế định hình lưu lượng (traffic shaping), các phương pháp tối ưu hoá đường truyền, cũng như các thuật toán dự đoán và tránh tắc nghẽn Những yếu tố này đóng vai trò quan trọng trong việc nâng cao hiệu suất và độ tin cậy của mạng, đảm bảo rằng dữ liệu được truyền tải một cách hiệu quả và liên tục.
• Phương thức báo hiệu QoS giữa các nút mạng để phối hợp hoạt động đảm bảo chất lượng dịch vụ từ đầu cuối tới đầu cuối
3.1 Kĩ thuật nén thoại trong VoIP
Các kĩ thuật mã hoá thoại
Để truyền thoại hiệu quả, cần áp dụng các phương pháp mã hóa và nén thoại phù hợp nhằm tối ưu băng thông và chất lượng âm thanh Trong truyền thoại qua giao thức IP, việc sử dụng các phương pháp nén thoại riêng biệt giúp giảm thiểu vấn đề trễ và jitter, đồng thời nâng cao hiệu quả sử dụng băng thông Có ba phương pháp mã hóa tiếng nói chính: mã hóa dạng sóng, mã hóa nguồn và mã hóa lai ghép, tất cả đều hướng tới việc xử lý thông tin dư thừa và lặp lại trong liên lạc thoại.
Mã hoá dạng sóng (waveform encoding) là phương pháp chuyển đổi tín hiệu tiếng nói tương tự thành tín hiệu số để truyền tải Tại bộ phát, tín hiệu âm thanh được mã hóa, trong khi tại bộ thu, quá trình ngược lại diễn ra để khôi phục âm thanh Phương pháp này có ưu điểm về độ phức tạp, giá thành, độ trễ và công suất tiêu thụ thấp Một số kiểu mã hoá dạng sóng phổ biến bao gồm điều chế xung mã (PCM), điều chế delta (DM) và PCM vi sai thích nghi (ADPCM) Chất lượng thoại của PCM được đánh giá là tốt, tuy nhiên, nhược điểm của nó là không cung cấp âm thanh chất lượng cao ở tốc độ bít thấp.
Phương pháp thứ hai nhằm khắc phục nhược điểm trong việc nhận diện tiếng nói dựa trên nhận xét rằng trong khoảng thời gian ngắn (khoảng ms), sự thay đổi của tiếng nói con người là không đáng kể Điều này cho thấy âm thoại có thể được tổng hợp và dự đoán đến một mức độ nhất định Do đó, phương pháp này áp dụng nguyên tắc mô phỏng và tái tạo tiếng nói, được gọi là mã hóa nguồn phát âm (vocoding).
Phân tích tiếng nói cho phép rút ra các tham số quan trọng như tần số cơ bản (pitch), tạp âm (âm vô thanh) và thông số bộ lọc khoang miệng Những tham số này được chuyển đổi thành dòng bit để truyền tải Bên nhận sẽ sử dụng các tham số này cùng với mô hình tiếng nói tương tự bên phát để tái tạo lại âm thanh gốc Cơ sở cho quá trình phân tích và tổng hợp tiếng nói là mô hình tạo tiếng nói.
Tốc độ bit mã hóa tiếng nói thường thấp hơn nhiều so với phương pháp truyền dạng sóng, với mức trên 2kb/s Tuy nhiên, chất lượng thoại thường không cao do khó khăn trong việc tìm kiếm mô hình tiếng nói phù hợp, với ít tham số và độ phức tạp thấp Điều này xuất phát từ bản chất phức tạp của quá trình hình thành tiếng nói.
Phương pháp thứ ba kết hợp hai phương pháp trước đó, trong đó dạng sóng của tiếng nói được phân tích và các tham số chính được rút ra Thay vì truyền trực tiếp các tham số này, bộ mã hoá sử dụng chúng để tổng hợp lại mẫu tiếng nói và so sánh với dạng gốc Dựa vào sự khác biệt giữa mẫu thực và mẫu tổng hợp, bộ mã hoá điều chỉnh các tham số trước khi chuyển đổi chúng thành dòng bit để truyền đến bên thu Phương pháp này được gọi là mã hoá sai động (hybrid coding).
Trong khi vocoding chỉ tập trung vào phần hữu thanh hoặc vô thanh của tiếng nói và bỏ qua các thành phần quan trọng khác, hybrid coding khắc phục điều này bằng cách lựa chọn tín hiệu kích thích phù hợp Phương pháp này nhằm tạo ra các tham số mô tả dạng sóng nguyên thuỷ một cách chính xác nhất, mang lại chất lượng thoại tương đối tốt với tốc độ bít thấp Tuy nhiên, độ phức tạp của phương pháp này dẫn đến chi phí thiết bị cao.
Công nghệ vi điện tử đang phát triển mạnh mẽ, cho phép tạo ra các vi mạch với khả năng tính toán cao và chi phí thấp Điều này đã thúc đẩy sự phát triển của nhiều kiểu mã hoá, đặc biệt là trong lĩnh vực mã hoá tiếng nói tốc độ thấp, thường được biết đến với tên gọi nén thoại.
Một số kiểu mã hoá được dùng như : o Kích thích đa xung MPE (Multi-Pulse Excited). o Kích thích xung đều RPE (Regular-Pulse Excited)
Bộ sinh tạo tạp âm ngẫu nhiên
Chuyển mạch âm hữu thanh/ vô thanh Tiếng nói
Thông số âm cơ bản
Các tham số phổ tiếng nói
Hình 3.1 Mô hình chung tạo tiếng nói của Vocoding o Dự đoán tuyến tính, kích thích theo mã CELP(Code-Excited Linear Prediction)
Trong mạng điện thoại thông thường, tín hiệu thoại được mã hóa PCM theo luật A với tốc độ 64 kb/s Tín hiệu thoại với tốc độ thấp hơn có thể được tạo ra bằng hai cách: một là biến đổi tín hiệu thoại tương tự trực tiếp thành dòng bit tốc độ thấp, hai là lấy mẫu và mã hóa tín hiệu thoại tương tự theo phương pháp mã hóa dạng sóng trước khi nén Phương pháp dự đoán tuyến tính kích thích mã CELP hiện nay đã trở thành công nghệ chủ yếu cho mã hóa tiếng nói tốc độ thấp.
3.1.1.1 Nguyên lý chung của bộ mã hoá CELP
Bộ mã hoá CELP áp dụng kĩ thuật phân tích tổng hợp để xác định đặc điểm tín hiệu kích thích, một phần của bảng mã lớn với sự phân bố ngẫu nhiên Hình 3.2 minh họa sơ đồ nguyên lý của phương pháp tổng hợp CELP.
Hình 3.2 Sơ đồ nguyên lý phương pháp tổng hợp CELP
Tại phía phát, các tham số của bộ lọc tổng hợp, cùng với tăng ích và độ trễ của các bảng mã (bao gồm bảng mã thích ứng và bảng mã ngẫu nhiên), được truyền đi Phía thu cũng áp dụng bảng mã thích ứng và bảng mã ngẫu nhiên tương tự.
Khuếch đại Bảng mã ngẫu nhiên u(n) thế để xác định tín hiệu kích thích tại lối vào của bộ lọc tổng hợp LPC để tạo tiếng nói tổng hợp
Phương pháp CELP mặc dù hiệu quả nhưng gặp khó khăn do yêu cầu tính toán phức tạp, khiến việc thực hiện trong thời gian thực trở nên khó khăn Để khắc phục vấn đề này, phương pháp ACELP (Algebraic CELP) đã được phát triển, đơn giản hóa quy trình kiểm tra bảng mã mà vẫn đảm bảo chất lượng âm thanh ACELP sử dụng các bảng mã được tạo ra từ các mã sửa lỗi nhị phân đặc biệt, giúp nâng cao hiệu suất mà không làm giảm chất lượng tiếng nói.
Để cải thiện hiệu quả rà soát bảng mã, các bảng mã đại số với cấu trúc liên kết CS-ACELP (Conjugate Structure ACELP) được áp dụng G729 được khuyến nghị như một nguyên lý của bộ mã hóa tiếng nói, sử dụng phương pháp CS-ACELP để mã hóa tiếng nói với tốc độ 8kbps.
3.1.1.2 Nguyên lý mã hoá SC-ACELP
Tín hiệu PCM 64kbps đầu vào được mã hóa bằng thuật toán CS-ACELP và lấy mẫu ở tần số 8kHz Sau đó, tín hiệu này được chuyển đổi thành tín hiệu PCM 16 bit trước khi đưa vào bộ mã hóa Tín hiệu đầu ra từ bộ giải mã sẽ được chuyển đổi trở lại thành tín hiệu PCM tương ứng với tín hiệu đầu vào Các đặc tính đầu vào và đầu ra cũng tương đồng với tín hiệu PCM 64kbps theo khuyến nghị ITU G.711, được chuyển đổi thành tín hiệu PCM 16 bit tại đầu vào bộ mã hóa.
Bộ mã hoá CS-ACELP dựa trên cơ sở của bộ mã dự báo tuyến tính kích thích mã CELP
Bộ mã hoá CS-ACELP hoạt động trên các khung tiếng nói 10ms, tương đương 80 mẫu tại tốc độ 8000 mẫu/s Mỗi khung 10ms, tín hiệu tiếng nói được phân tích để thu thập các tham số của bộ mã CELP, bao gồm tham số bộ lọc dự báo thích ứng, chỉ số bảng mã cố định và bảng mã thích ứng cùng với các tăng ích Các tham số này sẽ được mã hoá và truyền đi.
Các chuẩn nén thoại
Để đảm bảo tính nhất quán trong việc truyền dẫn tín hiệu, đặc biệt là tín hiệu thoại, ITU-T đã phát triển các chuẩn mã hóa thoại phù hợp với các phương pháp truyền thoại Những chuẩn này thuộc chuỗi khuyến nghị G của ITU-T, bao gồm G.711 (PCM 64kb/s), G.722 (Wideband Coder), G.723.1 (MPC-MLQ), G.726 (ADPCM), G.728 (LD-CELP) và G.729/G.729A (CS-ACELP).
Mỗi phương pháp nén có đặc điểm riêng và được lựa chọn theo điều kiện mạng cụ thể Để đánh giá, ta xem xét bốn đặc điểm chính: Tốc độ bit (bit rate) là yếu tố đầu tiên, thể hiện mức độ nén tín hiệu, với các chuẩn nén thoại từ 6,4Kps/5,3Kbps (G.723.1) đến 64 Kbps (G.711) Độ trễ (Delay) là yếu tố quan trọng trong truyền thông thời gian thực, thường cao hơn với các phương pháp nén tốc độ bit thấp Để nén tín hiệu, dòng thoại cần được chia thành các khung, và phương pháp nén có tỷ số nén cao thường yêu cầu khung thoại lớn, dẫn đến độ trễ cao hơn Cuối cùng, độ phức tạp (Complexity) của quá trình nén cũng cần được xem xét, ảnh hưởng đến hiệu suất tổng thể của phương pháp nén thoại.
DSP (Bộ xử lý giọng nói kỹ thuật số) và CPU trong máy tính thực hiện nén tín hiệu với độ phức tạp thể hiện qua số phép tính cần thực hiện trong một đơn vị thời gian (MIPS) và lượng bộ nhớ cần cho thuật toán nén, ảnh hưởng đến giá thành thiết bị Chất lượng tín hiệu thoại được đánh giá qua tỷ số tín hiệu trên tạp âm (S/N) hoặc hệ số lỗi bit (BER) của dòng thoại số đầu vào Các phương pháp nén tín hiệu ở tốc độ thấp thường sử dụng mã hóa dựa trên mô hình phát âm, nhưng mô hình này không thể kết hợp tín hiệu thoại với các loại tín hiệu nhiễu khác, dẫn đến chất lượng âm thanh giảm khi có nhiễu nền lớn, được đặc trưng bởi độ trung thực trên nhiễu.
Hiện tượng độ bền với tiếng ồn nền được ghi nhận ở các phương pháp nén tín hiệu có tốc độ dưới 16Kbps Để so sánh chất lượng tín hiệu của các phương pháp nén tốc độ thấp, chỉ số MOS (Mean Opinion Score) thường được sử dụng, với thang điểm từ 0 (chất lượng thấp nhất) đến 5 (chất lượng lý tưởng).
Dưới đây là các tổng kết các đặc tính của các phương pháp nén thoại thường được sử dụng trong các hệ thống VoIP (bảng 3.1):
Tốc độ nén (Kbps) Tài nguyên
CPU cần thiết Chất lượng tiếng nói Độ trễ thuật toán (ms)
G.711 PCM 64 Không cần Rất tốt