x =y th tw th tw tR tw th tw tR th t
4.3.9.4 Phát hiện sự hoạt động của tiếng nó
Trong các cuộc nói chuyện điện thoại thông thường, một người nói chung sẽ nói trong khoảng 40% thời gian và còn lại là im lặng cho người khác 60%. Các mức nhiễ có thể giảm bớt và chu trình nạp lại pin MS tăng lên bằng cách tắt máy phát trong các quãng im lặng. Kĩ thuật này được gọi là phát không liên tục
(DTX) và dựa vào sự phát hiện chính xác các khoảng im lặng trong tiếng nói người dùng. Điều này đạt được bằng phát hiện tích cực tiếng nói (VAD) trong đó năng lượng của tiếng nói được tính toán đối với mỗi khối tiếng nói và thực hiện quyết định theo ngưỡng thích nghi với việc khối chứa tiếng nói hay tạp âm nền. Điều quan trọng là hệ thống phải nhận biết nhanh điểm bắt đầu nói để tránh mất các âm ban đầu. Ngoài ra, độ trễ còn dư được đưa vào cuối câu nói để tránh xén âm xảy ra. Độ trễ dư cỡ 4 khung tiếng nói (80 ms) cũng ngăn hệ thống VAD khỏi phản ứng với các quãng im lặng rất ngắn, ví dụ giữa các âm tiết hoặc trong 1 từ. Về chủ quan, các quãng im lặng hoàn toàn gây bởi quá trình DTX tại máy thu là phiền toái vì chúng tạo cảm giác rằng đường truyền bị mất. Tình trạng này có thể cải thiện bằng cách chèn “tạp âm dễ chịu” để lấp các khoảng im lặng. Tạp âm dễ chịu nhận được từ đường bao phổ của tạp âm nền sử dụng các LAR và nó được chuyên chở ở dạng khung mô tả im lặng (SID). SID có kích thước giống hệt khung tiếng nói và được cập nhật 1 lần cứ 4 đa khung, nghĩa là cứ mỗi 480 ms.