Trích formant dùng CWT

Một phần của tài liệu Nhận dạng tiếng Việt sử dụng biến đổi Wavelet và mô hình Markov ẩn (Trang 86)

Biến đổi CWT của tiếng nói x(t) có thể viết như sau:

Công thức 4.29

áp dụng tính chất tuyến tính của CWT ta có

Hàm wavelet, , giới hạn tín hiệu tiếng nói trong khoảng thời gian t quanh điểm t = b. Vì tiếng nói là tín hiệu biến đổi chậm trên miền thời gian, ta có thể giả sử rằng trong khoảng thời gian đó biên độ tức thời và tần số tức thời là không đổi

Công thức 4.31

Do đó phương trình 4.30 có thể viết lại như sau:

Công thức 4.32

Ta thấy rằng tự nó là một biến đổi Fourier của hàm wavelet, tại tần số tức thời có thể viết dưới dạng

Công thức 4.33

trong đó là biến đổi Fourier của wavelet mẹ , thay 4.33 vào 4.32 được

Nếu băng thông của hàm wavelet đủ hẹp để chỉ chứa một thành phần tần số wi, chỉ thành phần tần số này sẽ tác động lên kết quả và trị tuyệt đối đạt tới giá trị cực đại tại với wo là tần số trung tâm của wavelet dùng trong biến đổi (thường là wavelet Morlet) . Do vậy mỗi thành phần tần số tức thời w1 tại t = b trong tín hiệu tiếng nói ảnh hưởng lên kết quả phân tích trong lân cận của tỉ lệ ai liên hệ với tần số tức thời wi là

Công thức 4.35

Từ tính chất định vị của wavelet mẹ trong miền Fourier, cơ bản đạt cực đại trong lân cận của scale ai gọi là ridge của CWT. Nếu Morlet wavelet được dùng, các đỉnh của ridge trong CWT sẽ ở tại vị trí của scale ai, tương ứng với thành phần tần số wi tại thời gian đang phân tích. Nếu mỗi thành phần tần số được xem như là một formant, các đỉnh của ridge sẽ tương ứng với formant trong tín hiệu tiếng nói.

Trong kết quả đã phân tích, của tín hiệu tiếng nói, x(t), các đỉnh của ridge có thể thu được nhờ vào cực đại địa phương của theo hướng scale, do đó chỉ cần tính cực đại địa phương của CWT theo hướng scale ta cũng có thể có được hình ảnh của formant.

Phối hợp tất cả các kiến thức lý thuyết trên, phương pháp đề nghị trích formant được trình bày trên hình 4.23 [15].

Hình 4.25. Phương pháp trích formant dùng CWT

Tín hiệu tiếng nói được tính CWT để tìm được các ridge tương ứng với các formant. Sau đó kết quả phân tích được tính cực đại địa phương theo hướng scale để định vị chính xác vị trí của các formant.

Cuối cùng một giải thuật thích hợp được dùng để trích biên độ theo thời gian của các formant này từ các cực đại địa phương [30, 32].

Một phần của tài liệu Nhận dạng tiếng Việt sử dụng biến đổi Wavelet và mô hình Markov ẩn (Trang 86)

Tải bản đầy đủ (PDF)

(120 trang)