Nén tín hiệu thoạ

Một phần của tài liệu Kiến thức về VoIP - Ebook (Trang 61 - 62)

Chơng 3 Các biện pháp đảm bảo chất l ợng dịch vụ

3.1 Nén tín hiệu thoạ

Trong mạng điện thoại thông thờng tín hiệu thoại đợc mã hoã PCM theo luật A hoặc Muy với tốc độ 64Kbps. Với cách mã hoá này cho phép khôi phục một cách tơng đối trung thực các âm thanh trong giải tần tiếng nói. Tuy nhiên trong một số ứng dụng đặc biệt yêu cầu truyền âm thanh với tốc độ thấp hơn ví dụ nh truyền tín hiệu thoại trên mạng Internet. Từ đó đã xuất hiện một số kỹ thuật mã hoá và nén tín hiệu tiếng nói xuống tốc độ thấp cụ thể nh G.723.1, G.729, G729A, và GSM. G.729 đợc ITU-T phê chuẩn vào năm 1995. Mặc dù đã đợc ITU phê chuẩn hoá, diễn đàn VoIP năm 1997 đã thoả thuận đề xuất G.723.1 thay thế cho G.729. Tổ hợp công nghiệp trong đó dẫn đầu là Intel và Microsoft đã chấp nhận hi sinh một chút chất lợng âm thanh để đạt đợc hiệu quả băng thông lớn hơn. Thật vậy, G.723.1 yêu cầu 5,3/6,3 kbps trong khi G.729 yêu cầu 8 kbps. Việc công nhận tiêu chuẩn nén và giải nén là một bớc tiến quan trọng trong việc cải thiện độ tin cậy và chất lợng âm thanh.

Về cơ bản các bộ mã hoá tiếng nói có ba loại: mã hoá dạng sóng (wave form), mã hoá nguồn (source) và mã hoá lai (hybrid) (nghĩa là kết hợp cả hai loại mã hoá dạng trên).

Nguyên lý bộ mã hoá dạng sóng là mã hoá dạng sóng của tiếng nói. Tại phía phát, bộ mã hóa sẽ nhận các tín hiệu tiếng nói tơng tự liên tục và mã thành tín hiệu số trớc khi truyền đi. Tại phía thu sẽ làm nhiệm vụ ngợc lại để khôi phục tín hiệu tiếng nói. Khi không có lỗi truyền dẫn thì dạng sóng của tiếng nói khôi phục sẽ rất giống với dạng sóng của tiếng nói gốc. Cơ sở của bộ mã hoã dạng sóng là: Nếu ng- ời nghe nhận đợc một bản sao dạng sóng của tiếng nói gốc thì chất lợng âm thanh sẽ rất tuyệt vời. Tuy nhiên, trong thực tế, quá trình mã hoá lại sinh ra tạp âm lợng tử (mà thực chất là một dạng méo dạng sóng), song tạp âm lợng tử thờng đủ nhỏ để không ảnh hởng đến chất lợng tiếng nói thu đợc. u điểm của bộ mã hoá loại này là: độ phức tạp, giá thành thiết kế, độ trễ và công suất tiêu thụ thấp. Ngời ta có thể áp dụng chúng để mã hoá các tín hiệu khác nh: tín hiệu báo hiệu, số liệu ở dải âm thanh và đăc biệt với những thiết bị ở điều kiện nhất định thì chúng còn có khả năng mã hoá đợc cả tín hiệu âm nhạc. Bộ mã hoá dạng sóng đơn giản nhất là điều xung mã (PCM), điều chế Delta (DM)... Tuy nhiên, nhợc điểm của bộ mã hoá

dạng sóng là không tạo đợc tiếng nói chất lợng cao tại tốc độ bit dới 16kbit/s, mà điều này đợc khắc phục ở bộ mã hoá nguồn.

Nguyên lý của mã hoá nguồn là mã hoá kiểu phát âm (vocoder), ví dụ nh bộ mã hoá dự báo tuyến tính (LPC). Các bộ mã hoá này có thể thực hiện đợc tại tốc độ bít cỡ 2kbps. Hạn chế chủ yếu của bộ mã hoá kiểu phát âm LPC là giả thiết rằng: tín hiệu tiếng nói bao gồm cả âm hữu thanh và âm vô thanh. Do đó với âm hữu thanh thì nguồn kích thích bộ máy phát âm sẽ là một dãy các xung, còn với các âm vô thanh thì nó sẽ là một nguồn nhiễu ngẫu nhiên. Trong thực tế có rất nhiều cách để kích thích cơ quan phát âm. Và để đơn giản hoá, ngời ta giả thiết rằng chỉ có một điểm kích thích trong toàn bộ giai đoạn lên giọng của tiếng nói, dù cho đó là âm hữu thanh.

Có rất nhiều phơng pháp mô hình hoá sự kích thích: Phơng pháp kích thích đa xung (MPE), phơng pháp kích thích xung đều (RPE), phơng pháp dự đoán tuyến tính kích thích mã (CELP). Phần này sẽ tập trung chủ yếu giới thiệu phơng pháp dự đoán tuyến tính kích thích mã CELP. Hiện nay phơng pháp này đã trở thành công nghệ chủ yếu cho mã hoá tiếng nói tốc độ thấp.

Một phần của tài liệu Kiến thức về VoIP - Ebook (Trang 61 - 62)