Bước đầu chúng ta kết nối với một camera sau đó trả về kết quả là dữ liệu nhị phân và chuyển đổi nó thành các byte để chúng ta có thể dễ dàng xử lý hơn trong các bước tiếp theo.
Dữ liệu sẽ được trả về như là một định dạng nguyên do đó kích thước của nó sẽ quá lớn vì vậy điều chúng ta cần làm trước hết là mã nó sang một định dạng nén. Ví dụ như mã hóa một hình ảnh được chụp sang định dạng JPEG cũng như giọng nói có thể biến thành một định dạng Wave hay nén nó vào bất kỳ một dạng nén âm thanh nổi như G711, GSM, Speex hoặc bất kỳ định dạng tiêu chuẩn khác. Ngoài ra chúng ta cũng có thể tích hợp các video/voice với nhau bằng cách sử dụng một tiêu chuẩn đặc biệt như H.263 hoặc H.264. Đây là bước quan trọng nhất được thực hiện, nó sẽ xác định yêu cầu các băng thông của hệ thống.
Việc gửi dữ liệu nén bằng cách sử dụng một trong 2 giao thức truyền là TCP, UDP hoặc RTP/UDP. Bước này cũng khá quan trọng vì một mặt nó phụ thuộc vào tầm quan trọng của chất lượng dữ liệu được truyền, mặt khác là tầm quan trọng của
66 việc chuyển giao trong thời gian thực. Mục đích của bất cứ hệ thống nào là truyền dữ liệu trong thời gian thực và chất lượng truyền tốt nhất có thể.
Việc tiếp nhận các dữ liệu gửi qua Server có chức năng cụ thể phụ thuộc vào những gì bạn muốn từ các ứng dụng. Ví dụ trong một phần mềm chat, những dữ liệu nhận được phía Server sẽ được gửi lại cho các máy Client trong phòng chat.Thông thường nếu các phần mềm đang làm việc trên mạng Internet và các máy client nằm phí sau NAT thì Server sẽ ở trên một IP công khai. May mắn là Socket trong Silverlight đã hỗ trợ quá trình này.
Hình 3.8 Biểu đồ trình tự module video service