Tham sốđầu tiên cần quan tâm trong phân tích tín hiệu tiếng nói trong miền thời gian đó là năng lượng ngắn hạn.
Năng lƣợng gắn với tín hiệu tiếng nói cũng là một đại lƣợng thay đổi theo thời gian. Năng lƣợng của một phân đoạn tín hiệu tiếng nói gồm N mẫu đƣợc xác định bởi công thức: N 1 0 n 2 N T s (n) E
Giá trịnày còn đƣợc gọi là năng lƣợng tổng của một phân đoạn tín hiệu
Mở rộng biểu thức trên, chúng ta có công thức tính năng lƣợng ngắn hạn nhƣ sau:
m m 2 2 n n T(n) E s (m) (s(m)w(n m)) E
Trong công thức này, chỉ số n chạy/dịch trên trục các mẫu tại những vị trí mà chúng ta quan tâm đến giá trịnăng lƣợng ngắn hạn. n có thể bằng 1, ứng với mỗi lần dịch một mẫu, hoặc có thể bằng N (bằng kích thƣớc cửa sổ phân tích), hoặc lớn hơn. Giá trị n rất nhỏ thƣờng là không cần thiết vì các mức năng lƣợng trong khoảng thời gian nhỏ gần nhƣ không thay đổi. Ngƣợc lại, nếu rất lớn (>=N), tức là các khung phân tích không có sự bao trùm nhau, có thể dẫn đến sự mất thông tin. Điều này là bởi vì sựthay đổi quan sát đƣợc có thể bắt đầu từ phần cuối của đoạn trƣớc, nhƣng bị ngắt quãng sang đến đầu khung sau. Thƣờng giá trịn đƣợc thiết lập sao cho sự bao trùm giữa các khung phân tích tín hiệu khoảng bằng ½-1/3 của khung.
CHƢƠNG 2. PHÂN TÍCH TÍN HIỆU TIẾNG NÓI
Hình 2.3: Minh họa năng lƣợng ngắn hạn của tín hiệu tiếng nói
Từ minh họa chúng ta thấy, những phân đoạn tƣơng ứng với âm hữu thành (nguyên âm), mức năng lƣợng ngắn hạn rất lớn. Ở những phân đoạn tƣơng ứng với âm vô thanh, mức năng lƣợng ngắn hạn rất nhỏ. Ở những phân đoạn tƣơng ứng với khoảng lặng, mức năng lƣợng ngắn hạn bằng không (xấp xỉ bằng không).
Nhƣ vậy, việc xác định năng lƣợng ngắn hạn của tín hiệu rất hữu ích trong việc ƣớc lƣợng các tính chất của các hàm kích thích trong mô hình mô phỏng bộ máy phát âm hay các mô hình tổng hợp tín hiệu tiếng nói. Ngoài ra, nó là một công cụ hữu ích để phát hiện một tín hiệu âm là của âm hữu thanh, âm vô thanh hay một khoảng lặng.
Cần chú ý rằng độ dài cửa sổ phân tích phải đƣợc chọn thích hợp theo nguyên tắc của phân tích ngắn hạn đã đề cập ở trên. Nó phải đủ dài để sự thay đổi của năng lƣợng tín hiệu trong một khung có thểđƣợc làm mịn. Tuy nhiên cũng không đƣợc quá dài dẫn đến luật thay đổi năng lƣợng tín hiệu từ một đoạn này sang một đoạn tín hiệu khác bị hiểu lầm.
Một nhƣợc điểm của việc sử dụng năng lƣợng trung bình của tín hiệu là với các mức tín hiệu lớn, chúng có xu thế làm lệch đáng kể giá trịƣớc lƣợng năng lƣợng toàn khung.
CHƢƠNG 2. PHÂN TÍCH TÍN HIỆU TIẾNG NÓI
43