Nghĩa của tiền xử lý tiếng nó

Một phần của tài liệu TÌM HIỂU VỀ CÁC HỆ THỐNG NHẬN DẠNG TIẾNG NÓI. (Trang 38)

TIỀN XỬ LÝ TÍN HIỆU – TRÍCH ĐẶC TRƢNG –XÂY DỰNG MÔ HÌNH HMM

4.1.1.nghĩa của tiền xử lý tiếng nó

Để nhận dạng tiếng nói, trƣớc tiên cần thu tiếng nói. Chất lƣợng tiếng nói thu đƣợc càng tốt thì nhận dạng càng chính xác. Tuy nhiên trên thực tế, dù là trong phòng thì nghiệm hay môi trƣờng sinh hoạt hàng ngày, ngƣời ta vẫn chỉ thu đƣợc tiếng nói kèm theo nhiều tín hiệu không mong muốn khác, bao gồm tiếng ồn (tiếng quạt máy, xe cộ, …), nhiễu (tiếng nhép môi, tiếng thở, nhiễu do điện từ…), tiếng vang,… Ngoài ra, âm thanh thu đƣợc có thể bị bóp méo do thiết bị (microphone, card âm thanh,…), âm thanh quá to, quá nhỏ, … Vì vậy, quá trình tiền xử lý tín hiệu đƣợc đƣa vào quá trình nhận dạng tiếng nói (ngay sau giai đoạn thu âm) nhằm đƣa chất lƣợng âm thanh lên cao nhất có lợi cho quá trình nhận dạng sau này (khi học mẫu, nhận dạng,…)

Về mặt kỹ thuật, quá trình tiền xử lý sẽ áp dụng các phƣơng pháp máy học, thuật giải hoặc áp dụng một hay nhiều bộ lọc lên tín hiệu tiếng nói vừa mới thu đƣợc.

Gọi:

Yi là tín hiệu thu đƣợc tại thời điểm i Xi là tín hiệu thuần tiếng nói tại thời điểm i

Ni là tín hiệu khác (nhiễu, tín hiệu làm móp tiếng…) tại thời điểm i Ta có:

i i i

Trong đó, Ni có thể là tập hợp của M nguồn tín hiệu nhiễu khác nhau:

Nhƣ vậy, đầu vào của quá trình tiền xử lý là dãy tín hiệu âm thanh thu đƣợc có chiều dài k:

Y = { Y1, Y2,..., Yk}

Và đầu ra là dãy tín hiệu tiếng nói lý tƣởng có cùng chiều dài: X = { X1, X2,..., Xk}

Thực hiện tốt quá trình tiền xử lý sẽ nâng cao đáng kể chất lƣợng nhận dạng. Tuy nhiên trên thực tế, quá trình tiền xử lý chỉ hạn chế những ảnh hƣởng không mong muốn tác động xấu đến kết quả nhận dạng chứ không thể triệt tiêu hết đƣợc chúng.

4.1.2.Một số công việc trong tiền xử lý tiếng nói 4.1.2.1. Làm nổi tín hiệu (pre – emphasis )

Một phần của tài liệu TÌM HIỂU VỀ CÁC HỆ THỐNG NHẬN DẠNG TIẾNG NÓI. (Trang 38)