Ch−ơng 3 Các biện pháp đảm bảo chất l−ợng dịch vụ
3.1.5 Chuẩn nén G.723
Khuyến nghị G.723.1 đ−a ra một bộ mã hoá tiêu chuẩn dùng để nén tín hiệu tiếng nói hoặc các tín hiệu audio khác của các dịch vụ đa ph−ơng tiện tại tốc độ rất thấp, giống với phần tiêu chuẩn của họ H.323.
Về tốc độ bit: Bộ mã hoá này có hai tốc độ bit: 5,3 kbps và 6,3 kbps. Bộ mã hoá có tốc độ cao hơn sẽ có chất l−ợng tốt và, cộng thêm tính linh hoạt, cung cấp cho các nhà thiết kế hệ thống. Bộ mã hóa và giải mã bắt buộc phải có cả hai tốc độ bit này. Chúng có thể chuyển mạch đ−ợc giữa hai tốc độ bit tại bất kỳ đ−ờng biên giới nào đó của khung. Khi tín hiệu là phi thoại thì có thể lựa chọn một tốc độ bit biến thiên để truyền không liên tục và điều khiển những khoảng trống.
Tín hiệu đầu vào có thể có của bộ mã hoá này tối −u hoá tín hiệu tiếng nói với chất l−ợng cao tại các tốc độ bit đã nói ở trên với một độ hạn chế về độ phức tạp. Bộ mã hoá này dùng để mã hoá tiếng nói và các tín hiệu audio khác với các khung dùng kỹ thuật mã hoá phân tích bằng tổng hợp dự báo tuyến tính. Tín hiệu kích thích, đối với bộ mã hoá tốc độ bit cao hơn, là l−ợng tử hoá đúng cực đại đa xung (MP-MLQ: Multipulse Maximum Likelihood Quantilization) và đối với bộ mã hoá có tốc độ bit thấp hơn, là dự đoán tuyến tính kích thích mã đại số (ACELP). Kích thích khung là 30ms, cộng thêm 7,5ms look-ahead, tạo ra trễ xử lý thuật toán tổng
cộng là 37,5ms. Toàn bộ trễ thêm vào bộ mã hoá là tổng của: Trễ xử lý, trễ truyền dẫn trên các đ−ờng truyền thông tin và trễ đệm của các giao thức ghép kênh.
1/Nguyên lý bộ mã hoá G.723.1
Tín hiệu PCM 64kbps đầu vào (theo luật A hoặc μ) qua bộ mã hoá này đ−ợc lấy mẫu tại tần số 8kHz, sau đó qua bộ chuyển đổi thành tín hiệu PCM đều 16 bit đ−a tới đầu vào bộ mã hoá. Tín hiệu đầu ra bộ giải mã sẽ đ−ợc chuyển đổi thành tín hiệu PCM theo đúng tín hiệu đầu vào. Các đặc tính đầu vào/ đầu ra khác, giống nh− của tín hiệu PCM 64kbps (theo khuyến nghị ITU G.711), sẽ đ−ợc chuyển đổi thành tín hiệu PCM đều 16 bit tại đầu vào bộ mã hoá, hoặc tín hiệu PCM đều 16 bit sẽ đ−ợc chuyển đổi thành tín hiệu ra PCM theo đúng quy luật của tín hiệu đầu vào ở bộ giải mã. Bộ mã hoá dựa trên nguyên lý bộ mã hoá phân tích bằng tổng hợp dự báo tuyến tính và cố gắng cực tiểu hóa sai số có tính trọng số thụ cảm. Bộ mã hoá thực hiện theo từng khung 240 mẫu. Điều này t−ơng đ−ơng với chu kỳ khung là 30ms và tần số lấy mẫu là 8kHz. Tại mỗi khối, đầu tiên tín hiệu đ−ợc đ−a qua bộ lọc thông cao để loại bỏ thành phần tín hiệu một chiều DC và sau đó đ−ợc chia thành 4 khung con. Với mỗi khung con sử dụng tín hiệu đầu vào ch−a xử lý để tính toán bộ lọc mã hoá dự báo tuyến tính bậc 10 (LPC). Bộ lọc LPC của khung con cuối cùng sẽ đ−ợc l−ợng tử hoá bằng ph−ơng pháp l−ợng tử hoá vectơ phân chia dự báo (PSVQ: Predictive Split Vector Quantizer). Các hệ số LPC ch−a đ−ợc l−ợng tử sẽ đ−ợc dùng để khôi phục bộ lọc trọng số thụ cảm ngắn hạn.
Với mỗi hai phân khung (120) mẫu, sẽ sử dụng tín hiệu tiếng nói trọng số để tính toán chu kỳ lên giọng tiếng nói mạch vòng kín, LOL. Chu kỳ lên giọng tiếng nói đ−ợc tính trong khoảng từ 18 đến 142 mẫu.
Sau đó tín hiệu tiếng nói sẽ đ−ợc xử lý theo từng phân khung cơ bản 60 mẫu. Sử dụng đánh giá chu kỳ lên giọng tiếng nói tr−ớc để khôi phục bộ lọc dạng ồn sóng hài. Phản ứng xung đ−ợc tạo bởi việc đấu nối bộ lọc tổng hợp LPC, bộ lọc có tính trọng số thụ cảm formant và bộ lọc dạng tạp âm sóng hài. Ng−ời ta sử dụng phản ứng xung này cho các phép tính toán tiếp sau.
Bộ dự đoán chu kỳ lên giọng mạch vòng kín đ−ợc tính toán bằng cách sử dụng đánh giá chu kỳ lên giọng, LOL, và phản ứng xung. Ng−ời ta xử dụng bộ dự đoán lên giọng bậc 5. Chu kỳ lên giọng sẽ đ−ợc tính là gần đúng giá trị vi sai nhỏ của đánh giá lên giọng mạch vòng hở. Thành phần thêm vào bộ dự đoán lên giọng sau đó sẽ đ−ợc loại bỏ khỏi vectơ ban đầu. Cả hai giá trị chu kỳ lên giọng và giá trị vi sai của nó sẽ đ−ợc truyền về phía bộ giải mã.
Cuối cùng, các thành phần không đ−ợc dự đoán của tín hiệu kích thích sẽ đ−ợc lấy gần đúng. Đối với bộ mã hoá có tốc độ bít cao, ng−ời ta sử dụng giá trị kích thích l−ợng tử hoá gần đúng cực đại đa xung (MP-MLQ), và đối với bộ mã hoá có tốc độ bit thấp, ng−ời ta sử dụng giá trị kích thích mã đại số (ACELP).
2/Nguyên lý bộ giải mã G.723.1
Bộ giải mã đ−ợc thực hiện trên nguyên lý cơ bản từng khung. Đầu tiên các chỉ số của bộ lọc LPC sẽ đ−ợc giải mã, sau đó bộ giải mã sẽ khôi phục bộ lọc tổng hợp LPC. Đối với mỗi phân khung, cả hai giá trị kích thích bản mã cố định và giá trị kích thích bảng mã thích ứng sẽ đ−ợc giải mã và đ−a tới đầu vào bộ lọc tổng hợp LPC. Bộ lọc sau thích ứng bao gôm formant và bộ lọc sau lên giọng phía sau-phía tr−ớc (forward-backward). Tín hiệu kích thích sẽ đ−ợc đ−a tới đầu vào bộ lọc sau lên giọng, đầu ra bộ lọc sau lên giọng đ−ợc đ−a tới đầu vào bộ lọc tổng hợp, và đầu ra bộ lọc tổng hợp sẽ đ−ợc đ−a tới đầu vào bộ lọc sau formant (formant posfilter).