Thực hiện và đánh giá thuật toán

Một phần của tài liệu Đồ án Tốt nghiệp: Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói (Trang 41 - 44)

Trong quá trình nghiên cứu và triển khai thuật toán ta nhận thấy các thông số sau ảnh hưởng lớn đến thuật toán:

NoiseMargin: Là ngưỡng để nhận biết nhiễu trong VAD. Mặc định của thuật toán NoiseMargin sẽ là 3db.

IS: Hệ số chỉ thời gian không có tiếng nói đầu tiên trong mỗi file âm thanh được dùng để tính toán nhiễu ban đầu. Do khi kiểm tra những đoạn im lặng ban đầu trong các file sạch ta nhận thấy rằng đối với từng file thì từ 0.15s đến 0.2s là những đoạn im lặng.

Gramma: Là hệ số quyết định nhiễu sẽ được trừ theo biên độ hay công suất. Ta chọn giá trị Gramma là 1 tức là thuật toán Subtraction sẽ trừ nhiễu theo biên độ còn Gramma là 2 thì sẻ trừ nhiễu theo công suất.

Chúng ta thực hiện thuật toán trừ phổ xử lý các file âm thanh bị nhiễu xung quanh tương ứng với SNR =15dB và các tham số: Hamming SP = 0.4, L = 25ms, Gamma = 1 (phổ biên độ), Gamma = 2 (phổ công suất), IS = 0.25ms, Beta = 0.03, Noisemargin = 3, Hangover =8.

Dạng sóng và phổ của tín hiệu sạch:

Hình 4.3 Dạng sóng và phổ của tín hiệu sạch

Sau khi xử lý triệt nhiễu bằng thuật toán với Gamma = 1:

Hình 4.5 Dạng sóng và phổ của tín hiệu sau khi xử lý nhiễu bằng thuật toán trừ phổ biên độ

Sau khi xử lý triệt nhiễu bằng thuật toán với Gamma = 2:

Hình 4.6 Dạng sóng và phổ của tín hiệu sau khi xử lý nhiễu bằng thuật toán trừ phổ công suất.

Chúng ta thực hiện thuật toán trừ phổ xử lý các file âm thanh bị nhiễu xung quanh tương ứng với SNR = 5dB và các tham số: Hamming SP = 0.4, L = 25ms, Gamma = 1 (phổ biên độ), Gamma = 2 (phổ công suất), IS = 0.25ms, Beta = 0.03, Noisemargi = 3, Hangover = 8.

Trước khi xử lý nhiễu:

Hình 4.8 Dạng sóng và phổ của tín hiệu bị nhiễu với SNR = 5dB

Sau khi xử lý triệt nhiễu bằng thuật toán với Gamma = 1:

Hình 4.9 Dạng sóng và phổ của tín hiệu sau khi xử lý nhiễu bằng thuật toán trừ phổ biên độ

Sau khi xử lý triệt nhiễu bằng thuật toán với Gamma = 2:

Hình 4.10 Dạng sóng và phổ của tín hiệu sau khi xử lý nhiễu bằng thuật toán trừ phổ công suất.

Nhận xét

Sau khi nghe file âm thanh của tín hiệu sạch, tín hiệu sau khi xử lý nhiễu, dựa trên dạng sóng và phổ của tín hiệu sạch, tín hiệu sau khi xử lý triệt nhiễu bằng thuật

toán SS, ta có thể đưa ra nhận xét như sau:

Thuật toán SS có thể xử lý triệt nhiễu tốt hơn ở môi trường có SNR cao hơn, ví dụ với file nhiễu có mức SNR=15dB cho ra file rất sạch còn với file nhiễu có mức SNR=5dB nhiễu còn tương đối nhiều và xử lý tốt hơn với đối với tín hiệu bị nhiễu biến đổi chậm và có phân bố đều.

Ta nhận thấy rằng đối với hệ số gamma=2 tức là trừ phổ theo công suất thì nhiễu bị nén rất ít, file đầu ra không tốt bằng hệ số gamma=1trừ phổ theo biên độ.

Có tính hiệu quả đối với nhiễu ở mức SNR thấp.

4.6 Kết luận chương

Đối với từng loại nhiễu khác nhau thì tác động của các thuật toán tăng cường là khác nhau.

Đối với từng mức nhiễu khác nhau thì thuật toán cũng tác động cũng khác nhau.

Một phần của tài liệu Đồ án Tốt nghiệp: Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói (Trang 41 - 44)