Thuật toántrừ phổđối với phổ công suất

Một phần của tài liệu Phương pháp nâng cao chất lượng tiếng nói có nhiễu dùng học máy thống kê bằng mô hình pha trộn Gaussian (LV thạc sĩ) (Trang 36 - 39)

5. Ý nghĩa khoa học và thực tiễn

2.1.2.Thuật toántrừ phổđối với phổ công suất

Thuật toán t r ừ p hổ đối với phổ biên độ có thể được mở rộng sang miền phổ công suất. Vì trong một vài trường hợp, nó có thể làm việc tốt với

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

phổ công suất hơn là với phổ biên độ. Lấy phổ công suất của tín hiệu bị nhiễu trong một khoảng ngắn, chúng ta bình phương |Y( w)|, ta được:

2 2 2 * * | (w) | |YX(w) | |D(w) | X(w).D (w)X (w) (w)D (2.7) 2 2 * |X(w) | |D(w) | 2 Re{ (w)X D (w)}    2 * |D(w) | ,X(w).D (w) và *

X (w). (w)D không thể tính được một cách trực tiếp

mà xấp xỉ bằng 2 * {| ( ) | }, { ( ). ( )} E D w E X w D w và * { ( ). ( )} E X w D w khi đó E[.] là toán tử kỳ vọng. Bình thường thì 2 {| ( ) | }

E D w được ước lượng khi không có tiếng nói hoạt động và được biểu thị là 2

|D w( ) | . Nếu chúng ta thừa nhận [n]=0

d và không có một sự tương quan nào với tín hiệu sạch x[n],

thì *

{ ( ). ( )}

E X w D w và *

{ ( ). ( )}

E X w D w xem là 0. Khi đó phổ công suất của tín hiệu sạch có thể tính được như sau:

2 2 2

ˆ ˆ

|X(w) | | (w) |Y |D(w) | (2.8) Công thức trên biểu diễn thuật toán trừ phổ công suất. Như công thức trên, thì phổ công suất được ước lượng |X wˆ( ) |2không được đảm bảo luôn là

một số dương, nhưng có thể sử dụng phương pháp chỉnh lưu nửa sóng như đã trình bày ở trên. Tín hiệu được tăng cường sẽ thu được bằng cách tính IDFT của|X wˆ( ) |(bằng cách lấy căn bậc hai của |X wˆ( ) |2 có sử dụng pha

của tín hiệu tiếng nói bị nhiễu. Chú ý rằng, nếu chúng ta lấy IDFT cả hai vế của công thức (2.8) trên thì ta có một phương trình tương tự trong miền tự tương quan: ˆ ˆ ˆˆ r ( )xx yy( ) ( ) dd mr mr m (2.9) Khi đó r ( ),xxˆˆ yy( ), ˆ ˆ( ) dd

m r m r m là các hệ số tự tương quan của tín hiệu

sạch, tín hiệu tiếng nói bị nhiễu, và tín hiệu nhiễu đã được ước lượng [9,10] Công thức (1) có thể được viết theo dạng sau:

2 2 2

ˆ

Khi đó: 2 2 ˆ | (w) | (w) 1 | (w) | D H Y   (2.11)

Trong lý thuyết hệ thống tuyến tính,H(w)là hàm truyền đạt của hệ thống. Còn trong lý thuyết của Speech enhancement, chúng ta xem H(w) là hàm độ lợi hay hàm nén. Và H(w) là một số thực và luôn luôn dương, và có giá trị nằm trong phạm vi 0H(w)1. Nếu nó có giá trị âm là do có sai sót trong quá trình ước lượng phổ của nhiễu. H(w) được gọi là hàm nén là vì nó cho ta biết tỷ số giữa phổ công suất của tín hiệu được tăng cường với phổ công suất của tín hiệu bị nhiễu. Hình dạng của hàm nén là một đặc trưng duy nhất của mỗi thuật toán Speech enhancement.

Chính vì vậy mà chúng ta thường so sánh các thuật toán bằng cách so sánh các đáp ứng của hàm nén của chúng. Hệ số H(w) có giá trị thực nên biến đổi IDFT là h[n] đối xứng với nhau qua điểm 0 và không nhân quả. Trong miền thời gian thì h[n] được xem là một bộ lọc không nhân quả [11]. Nên sẽ có một phương pháp được đề xuất để hiệu chỉnh hàm H(w) để đáp ứng của nó trở thành bộ lọc nhân quả trong miền thời gian.

Trường hợp chung thì thuật toán trừ phổ có thể được biểu diễn:

ˆ ˆ

| X(w) |p| (w) |Y p |D(w) |p (2.12)

Trong đó p là số mũ công suất, với p = 1 là phương pháp trừ phổ biên độ điển hình, p = 2 là phương pháp trừ phổ công suất.

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn (adsbygoogle = window.adsbygoogle || []).push({});

Sơ đồ khối của thuật toán trừ phổ :

Hình 2.1: Sơ đồ khối của thuật toán trừ phổ [12]

Một phần của tài liệu Phương pháp nâng cao chất lượng tiếng nói có nhiễu dùng học máy thống kê bằng mô hình pha trộn Gaussian (LV thạc sĩ) (Trang 36 - 39)