Thực hiện và đánh giá thuật toán

Một phần của tài liệu Đồ án Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói (Trang 41 - 44)

Trong quá trình nghiên cứu và triển khai thuật toán ta nhận thấy các thông số sau

ảnh hưởng lớn đến thuật toán:

NoiseMargin: Là ngưỡng để nhận biết nhiễu trong VAD. Mặc định của thuật toán NoiseMargin sẽ là 3db.

IS: Hệ số chỉ thời gian không có tiếng nói đầu tiên trong mỗi file âm thanh được

dùng để tính toán nhiễu ban đầu. Do khi kiểm tra những đoạn im lặng ban đầu trong các file sạch ta nhận thấy rằng đối với từng file thì từ0.15s đến 0.2s là những đoạn im lặng.

Gramma: Là hệ số quyết định nhiễu sẽ được trừ theo biên độ hay công suất. Ta chọn giá trị Gramma là 1 tức là thuật toán Subtraction sẽ trừ nhiễu theo biên độ còn Gramma là 2 thì sẻ trừ nhiễu theo công suất.

Chúng ta thực hiện thuật toán trừ phổ xử lý các file âm thanh bị nhiễu xung quanh tương ứng với SNR =15dB và các tham số: Hamming SP = 0.4, L = 25ms, Gamma = 1 (phổ biên độ), Gamma = 2 (phổ công suất), IS = 0.25ms, Beta = 0.03, Noisemargin = 3, Hangover =8.

Dạng sóng và phổ của tín hiệu sạch:

Hình 4.3 Dạng sóng và phổ của tín hiệu sạch

Trước khi xử lý nhiễu:

Sau khi xử lý triệt nhiễu bằng thuật toán với Gamma = 1:

Hình 4.5 Dng sóng và ph ca tín hiu sau khi x lý nhiu bng thut toán tr phbiên độ

Sau khi xử lý triệt nhiễu bằng thuật toán với Gamma = 2:

Hình 4.6 Dạng sóng và phổ của tín hiệu sau khi xử lý nhiễu bằng thuật toán trừ ph công sut.

Chúng ta thực hiện thuật toán trừ phổ xử lý các file âm thanh bị nhiễu xung

quanh tương ứng với SNR = 5dB và các tham số: Hamming SP = 0.4, L = 25ms, Gamma = 1 (phổ biên độ), Gamma = 2 (phổ công suất), IS = 0.25ms, Beta = 0.03, Noisemargi = 3, Hangover = 8.

Trước khi xử lý nhiễu:

Hình 4.8 Dạng sóng và phổ của tín hiệu bị nhiễu với SNR = 5dB

Sau khi xử lý triệt nhiễu bằng thuật toán với Gamma = 1:

Hình 4.9 Dạng sóng và phổ của tín hiệu sau khi xử lý nhiễu bằng thuật toán trừ phổ biên độ

Sau khi xử lý triệt nhiễu bằng thuật toán với Gamma = 2:

Hình 4.10 Dạng sóng và phổ của tín hiệu sau khi xử lý nhiễu bằng thuật toán trừ ph công sut.

Nhn xét

Sau khi nghe file âm thanh của tín hiệu sạch, tín hiệu sau khi xử lý nhiễu, dựa trên dạng sóng và phổ của tín hiệu sạch, tín hiệu sau khi xử lý triệt nhiễu bằng thuật

toán SS, ta có thểđưa ra nhận xét như sau:

Thuật toán SS có thể xử lý triệt nhiễu tốt hơn ởmôi trường có SNR cao hơn, ví dụ với file nhiễu có mức SNR=15dB cho ra file rất sạch còn với file nhiễu có mức SNR=5dB nhiễu còn tương đối nhiều và xử lý tốt hơn với đối với tín hiệu bị nhiễu biến đổi chậm và có phân bốđều.

Ta nhận thấy rằng đối với hệ số gamma=2 tức là trừ phổ theo công suất thì nhiễu bị nén rất ít, file đầu ra không tốt bằng hệ số gamma=1trừ phổtheo biên độ.

Có tính hiệu quảđối với nhiễu ở mức SNR thấp.

4.6 Kết luận chương

Đối với từng loại nhiễu khác nhau thì tác động của các thuật toán tăng cường là khác nhau.

Đối với từng mức nhiễu khác nhau thì thuật toán cũng tác động cũng khác

nhau.

Một phần của tài liệu Đồ án Tìm hiểu thuật toán trừ phổ trong xử lý tiếng nói (Trang 41 - 44)

Tải bản đầy đủ (PDF)

(54 trang)