Đồng bộ luồng hình ảnh và âm thanh

Một phần của tài liệu IP multicast và ứng dụng (Trang 78)

4. Kết cấu của luận văn

3.3Đồng bộ luồng hình ảnh và âm thanh

Việc truyền tải hình ảnh và âm thanh qua mạng bằng các ứng dụng riêng biệt sẽ dẫn đến việc ngƣời sử dụng cảm thấy khoảng thời gian trễ giữa phần tiếng và phần hình. Một số ứng dụng có yêu cầu chất lƣợng cao, đòi hỏi thời gian trễ giữa hình và tiếng phải đủ nhỏ để đạt đƣợc hiệu quả mong muốn. Việc đồng bộ hóa hình và tiếng có thể đƣợc thực hiện bằng cách làm chậm lại việc phát tín hiệu hình hoặc tiếng để hai tín hiệu này đồng bộ với nhau về mặt thời gian.

Mạng MBone là mạng multicast bên trong mạng Internet. Các phần mềm audio cho MBone, ví dụ nhƣ Rat, Nevot và các công cụ video nhƣ Vic, Ivs không hỗ trợ đồng bộ đƣờng hình và tiếng. Bộ phần mềm gồm công cụ audio Rat (robust audio tool) và công cụ video Vic (video conference) do UCL phát triển là bộ phần mềm đầu tiên hỗ trợ đồng bộ hình tiếng. Công cụ rat và vic đều sử dụng giao thức thời gian thực RTP của IETF để hỗ trợ các tính năng cần thiết cho giao tiếp video và audio sử dụng multicast. Cơ chế đồng bộ của rat sử dụng nhãn thời gian trong gói tin RTP để xác định thời gian làm trễ gói tin.

Việc gửi tín hiệu âm thanh qua mạng chuyển mạch gói đòi hỏi khả năng bảo vệ mất gói tin và trễ end-to-end thấp. Yêu cầu trễ thấp đồng nghĩa với việc kích thƣớc gói tin phải nhỏ và tần suất gửi gói tin cao. Kích thƣớc gói tin âm thanh trong mạng Internet tƣơng đƣơng với khoảng 20 đến 80 ms.

Trong khi đó thì công cụ video thƣờng có tốc độ quét ảnh thấp, chỉ từ 2 đến 10 hình/giây, chứ không cao nhƣ trong truyền hình (tốc độ 24 hình/giây). Lý do tốc độ quyết thấp là để tiết kiêm băng thông mạng, nhất là khi có nhiều nguồn video cùng đƣợc phát một lúc. Ngoài ra, thời gian xử lý video tại thiết bị đầu cuối cũng khá lớn khiến cho thời gian trễ giữa thời điểm bắt và hiển thị hình thƣờng khá lớn. Mỗi khung hình video thƣờng đƣợc chia nhỏ trƣớc khi gửi qua mạng.

Mạng MBone là mạng chuyển mạch gói chia sẻ có hỗ trợ multicast. Các thiết bị định tuyến vẫn hoạt động trên nguyên tắc đến trƣớc phục vụ trƣớc (FIFO) và vẫn trộn lẫn lƣu lƣợng từ nhiều nguồn khác nhau thành một luồng lƣu lƣợng. Điều này gây ra trễ jitter giữa các gói tin của một luồng gói tin thời gian thực. Khi luồng tin chứa thông tin âm thanh, trễ jitter phải đƣợc loại bỏ vì nếu không thì âm thanh phát ra tại thiết bị đầu cuối sẽ trở nên khó hiểu. Kỹ thuật thƣờng đƣợc dùng để loại bỏ jitter là sử dụng một bộ đệm tái tạo âm thanh. Bộ đệm này cho phép lƣu gói tin và làm trễ thời điểm phát tiếng, do vậy có thể giảm trễ jitter giữa các gói tin ở đầu ra. Cơ chế bộ đệm này phải có khả năng thích ứng do trễ jitter trên mạng MBone có thể thay đổi tùy từng thời điểm.

Việc tính toán thời gian làm trễ gói tin phải dựa trên thời gian truyền gói tin qua mạng. Vì thời gian làm trễ gói tin và tỷ lệ gói tin đến kịp thời có liên quan đến nhau, ngƣời ta thƣờng chọn thời gian làm trễ sao cho tỷ lệ gói tin đến nơi kịp thời là 99,9%.

Trễ jitter cũng ảnh hƣởng đến các ứng dụng video (hình ảnh sẽ bị giật). Tuy nhiên, đứng trên phƣơng diện của ngƣời sử dụng, việc này không ảnh hƣởng nhiều đến chất lƣợng của ứng dụng. Các công cụ video hiện thời nhƣ vic hay ivs đều hiển thị khung hình ngay khi nhận và giải mã gói tin.

Sự khác biệt giữa trễ tiếng và hình thƣờng thay đổi khá lớn do thời gian xử lý tín hiệu audio và video khác nhau. Vì vậy để có thể đồng bộ đƣờng hình và tiếng cần phải làm trễ một trong hai đƣờng hình tiếng tại đầu nhận. Các thử nghiệm với ngƣời sử dụng cho thấy, hai luồng tín hiệu hình tiếng không nhất thiết phải đồng bộ hoàn toàn và có thể lệch nhau 80 – 100 ms mà ngƣời sử dụng vẫn cảm thấy thoải mái.

Việc làm trễ đƣờng tiếng vẫn đƣợc thực hiện với một bộ đệm. Trong khi đó, các phần mềm video thƣờng không dùng bộ đệm ở đầu ra, nhƣng với yêu cầu đồng bộ hệ thống video cũng phải sử dụng bộ đệm.

Trễ đƣờng hình thƣờng lớn hơn trễ đƣờng tiếng. Trễ đƣờng tiếng không đƣợc quá lớn để đảm bảo độ tƣơng tác của hệ thống. Vì vậy phải có sự thống nhất giữa hệ thống hình và tiếng, tức là ta phải có phƣơng thức báo hiệu giữa hai hệ thống hình và tiếng để hai đƣờng có thể đồng bộ với nhau.

Báo hiệu giữa tiến trình video và audio đƣợc thực hiện thông qua một bus báo hiệu nội bộ, ví dụ nhƣ giao thức CCC (Conference Control Channel Protocol) hay bus báo hiệu LBL. Cả hai kiến trúc này đều trao đổi thông tin thông qua kênh loopback của multicast.

Một phần của tài liệu IP multicast và ứng dụng (Trang 78)