- Mở đầu
2.2.1 Định nghĩa bộ lọc Wiener
Bộ lọc Wiener có mục đích làm giảm lượng tiếng ồn trong tín hiệu bằng so sánh với một ước lượng không nhiễu mong muốn. Bộ lọc Wiener được xây dựng cho việc ánh xạ tín hiệu đầu vào thành tín hiệu kết quả sao cho gần giống với tín hiệu mong đợi nhất. Nền tảng của bộ lọc Wiener phụ thuộc vào dữ liệu tuyến tính và bình phương tối thiểu sai số bộ lọc. Đây là bộ lọc giữ vai trò quan trọng trong rất nhiều ứng dụng về xử lý tín hiệu như: dự đoán tuyến tính (Linear Prediction), loại bỏ tiếng dội (Echo Cancellation), phục hồi tín hiệu (Signal Restoration), cân bằng kênh (Channel Equalization), đồng bộ hệ thống (System Identification). Trong xử lý tín hiệu tiếng nói, bộ lọc Wiener là một bộ lọc được đề xuất bởi Norbert Wiener trong những năm 1940 đến năm 1949. Mục đích của nó là để làm giảm
lượng tiếng ồn có trong tín hiệu bằng cách so sánh với một ước lượng của tín hiệu nhiễu không mong muốn.
Điều quan trọng trong việc xây dựng bộ lọc Wiener là xác định thành công các hệ số lọc. Các hệ số này được tính toán để tối thiểu bình phương khoảng cách trung bình giữa tín hiệu đầu ra của bộ lọc và tín hiệu mong muốn. Chúng được tính lại định kỳ cho mỗi block N mẫu tín hiệu nhờ đó mà bộ lọc tự thích nghi với các đặc điểm của tín hiệu trong block và trở thành block – adapter. Chỉ có block – adapter (hay còn gọi là segment – adapter) mới có thể áp dụng được cho dữ liệu âm thanh hoặc dữ liệu hình ảnh.
Bộ lọc Wiener cổ điển được xây dựng trên lý thuyết về thời gian liên tục, bình phương sai số tối thiểu, các vấn đề về ước lượng sai số, nội suy, ngoại suy… Đến khi áp dụng cho nhận dạng tiếng nói, đã được mở rộng từ thời gian liên tục thành thời gian rời rạc. Một bộ lọc Wiener có thể được hiện thực theo IIR (Infinite- duration Impulse Response _ đáp ứng xung có chiều dài vô hạn từ 0 đến ∞) hoặc
FIR (Finite-duration Impulse Response_ đáp ứng xung có chiều dài hữu hạn từ 0 đến N-1) đây là hai cách hiện thực chủ yếu của các bộ lọc số. Tuy nhiên, có một vài khác biệt trong mỗi cách hiện thực này. IIR Wiener sử dụng thuật toán đệ quy và kết quả của nó là tập hợp các phương trình không tuyến tính. Trong khi đó, nếu xây dựng FIR Wiener thì không cần dùng đến giải thuật đệ quy và có kết quả là tập hợp các phương trình tuyến tính. Trong thực tiễn và cũng như do tính đặc thù của nhận dạng tiếng nói, người ta đã lựa chọn xây dựng bộ lọc Wiener theo FIR nhằm đạt được kết quả tốt nhất có thể. Tuy nhiên, với lựa chọn này, đặt ra cho chúng ta vấn đề là FIR Wiener cần một số lượng lớn các hệ số lọc để ước tính một phản hồi mong đợi (desired response).