Các kỹ thuật nén thoại trong VoIP

4. Cấu trúc luận văn

2.3. Các kỹ thuật nén thoại trong VoIP

2.3.1.Nguyên lý chung của bộ nén CELP

Tín hiệu kích thích là một mục của một bảng mã rất lớn được phân bổ một cách ngẫu nhiên

Sơ đồ nguyên lý của phương pháp tổng hợp CELP được dưa ra trong hình sau

Hình 2.3: Sơ đồ nguyên lý của phƣơng pháp tổng hợp CELP

Tại phía phát: Các tham số của bộ lọc tổng hợp cùng tăng ích và độ trễ của các bảng mã (bao gồm bảng mã thích ứng và bảng mã ngẫu nhiên) được truyền đi.

Tại phía thu: Cũng sử dụng những bảng thích ứng và ngẫu nhiên như thế để xác định tín hiệu kích thích tại lối vào bộ lọc tổng hợp LPC để tạo tiếng nói tổng hợp. Bảng mã kích thích gồm L từ mã (là các véc tơ ngẫu nhiên) có độ dài N mẫu (thông thường L=1024, N=40 mẫu ứng với một khung kích thích 5ms). Bằng cách tìm kiếm triệt để toàn bộ bảng mã ngẫu nhiên người ta sẽ chọn được tín hiệu kích thích của một khung tiếng nói dài N mẫu. Bộ lọc tổng hợp đã tính trọng số được cho bởi:

w(z) = 1/ A(z/γ) k

z-k)

Trong đó:

γ là một phân số từ 0 đến 1.

{ak} là các tham số bộ lọc tổng hợp LPC hay còn gọi là hệ số dự đoán. P là bậc của bộ lọc tổng hợp LPC hay bậc của bộ dự đoán.

Sau khi đã xác định được các tham số của bảng mã thích ứng (bao gồm có tăng ích và độ trễ lên giọng) thì tiếng nó tổng hợp đã tính trọng số s*(n) được cho là:

s*(n) = βck(n)*h(n) + Gyα(n) + s0(n)

Trong đó:

β là hệ số tỷ lệ.

h(n) là phản ứng xung của bộ lọc tổng hợp đã tính trọng số W(z). s0*(n) là phản ứng lối vào của bộ lọc tổng hợp đã tính trọng số. G là tăng ích của bảng mã thích ứng.

yα(n) = c’α(n)*h(n) là phản ứng trạng thái không của bộ lọc tổng hợp đã tính trọng số với từ mã c’α(n) được lựa chọn từ bảng mã thích ứng.

Sai số đã tính trọng số giữa tiếng nó tổng hợp và tiếng nói gốc được cho bởi:

e_(n) = s(n) – s*(n)

Trong đó:

s*(n): Tín hiệu tiếng nói tổng hợp s(n): Tín hiệu tiếng nói gốc. ew(n): Tín hiệu sai số

Sau đó sai số này sẽ được cực tiểu hoá bằng phương pháp sai lệch bình phương trung bình (mes):

E = 2

Độ phức tạp của bộ mã hoá này tăng khi tốc độ bit giảm. Thí dụ CELP có thể cho tiếng nói tốc độ thấp tới 4.8 kbps với giá phải trả rất cao và đòi hỏi tính toán do: tín hiệu kích thích tối ưu được tìm kiếm thông qua bảng mã rất lớn (kích thước bảng mã thường gồm khoảng 1024 mục từ). Đối với bảng mã có 1024 từ mã và một khung kích thước 40 mẫu thì cần thực hiện khoảng 40.000 phép nhân để soát bảng mã.

Có thể nhận xét rằng: nhược điểm của phương pháp CELP là có một thủ tục đòi hỏi tính toán rất lớn rất khó có thể thực hiện trong thời gian thực. Vậy có một phương pháp đơn giản hoá thủ tục soát bảng mã sao cho không ảnh hưởng tới chất lượng tiếng nói. Đó là phương pháp sử dụng các bảng mã đại số ACELP (Algebraic CELP) trong đó các bảng mã được tạo ra nhờ các mã sửa lỗi nhị phân đặc biệt. Và để nâng cao hiệu quả rà soát bảng mã, người ta sử dụng các bảng mã đại số có cấu trúc liên kết CS-ACELP (Conjugate-Structure ACELP). Chuẩn ITU G.729 đưa ra nguyên lý của bộ mã hoá tiếng nói sử dụng phương pháp CS-ACELP mã hoá tiếng nói tốc độ thấp 8kbps.

Các giao thức VoIP sử dụng

Các ứng dụng của VoIP