Giả thiết rằng y[n] là tín hiệu vào đã bị nhiễu, nó tổng của tín hiệu sạch x[n] và tín hiệu nhiễu d[n]:
y[n] = x[n] + d[n] (3.1)
Thực hiện biến đổi Fourier rời rạc cả 2 vế,ta được
Y (ω) =X (ω) +D(ω
)
Chúng ta có thể biểu diễn Y( ω) dưới dạng phức như sau:
Y (ω) =| Y (ω) | e jφy
(ω)
Khi đó |Y( ω)| là biên độ phổ, và φy (ω) là pha của tín hiệu đã bị nhiễu. (3.2)
(3.3)
Phổ của tín hiệu nhiễu D( ω) có thể được biểu diễn dạng biên độ và pha:
D(ω) =| D(ω) | e jφd (ω
)
(3.4) Biên độ phổ của nhiễu |D( ω)| không xác định được, nhưng có thể thay thế
bằng giá trị trung bình của nó được tính trong khi không có tiếng nói(tiếng nói bị dừng), và pha của tín hiệu nhiễu có thể thay thế bằng pha của tín hiệu bị nhiễu
2
φy (ω) , việc làm này không ảnh hưởng đến tính dễ nghe của tiếng nói [22], có thể ảnh hưởng đến chất lượng của tiếng nói là làm thay đổi pha của tiếng nói nhưng cũng chỉ vài độ.
Khi đó chúng ta có thể ước lượng được phổ của tín hiệu sạch:
∧ ∧
X (ω) = [| Y (ω) | − | D(ω) |]e jφy
(ω) (3.5)
∧
ở đây | D(ω) | là biên độ phổ ước lượng của nhiễu được tính trong khi không có tiếng nói hoạt động. Ký hiệu "∧"
để chỉ rằng giá trị đó là giá trị ước tính gần đúng. Tín hiệu tiếng nói được tăng cường có thể đạt được bằng cách rất đơn giản là biến đổi IDFT của X ∧ (ω) .
Cần chú ý rằng biên độ phổ của tín hiệu đã được tăng cường là | X (ω) | (=| Y (ω) | − | D(ω) |) , có thể bị âm do sự sai sót trong việc ước lượng phổ của nhiễu. Tuy nhiên, biên độ của phổ thì không thể âm, nên chúng cần phải đảm bảo rằng khi thực trừ hai phổ thì phổ của tín hiệu tăng cường |X( ω )| luôn luôn không âm. Giải pháp được đưa ra để khắc phục điều này là chỉnh lưu bán sóng hiệu của
phổ, nếu thành phần phổ nào mà âm thì chúng ta sẽ gán nó bằng 0: X (ω) = ^ Y (ω) − | D(ω) | , | Y (ω) | ^ > | D(ω) | (3.6) 0 , ≠
Phương pháp xử lý bằng chỉnh lưu bán sóng là một trong những cách để đảm bảo cho |X( ω)| không bị âm.