.3 Hệ số tương quan trung bình sau bộ ICA- 123docz.net

Cự ly (m) 100 200 300 400 500

rMAX 0,854 0,775 0,702 0,617 0,529

Trên hình 2.20 và 2.21 so sánh hệ số tương quan của tín hiệu sau bộ phân

Amplitude Correlation Correlation BPF Correlation ICA

tích âm thành phần độc lập với tín hiệu khơng xử lý và tín hiệu sau bộ lọc thơng dải tại cự ly 100m và 500m. Có thể nhận thấy hệ số tương quan trong các trường

HE SO TUONG QUAN O CU LY 100M SAU BO LOC ICA

1 0.5 0 -0.5 -1 5.25 5.255 5.26 5.265 5.27 5.275 5.28 5.285 Samples 104 Hình 2.20. So sánh hệ số tương quan cự ly 100m

hợp sử dụng bộ phân tích âm thanh phần độc lập cho kết quả cao hơn so với các trường hợp còn lại.

Qua các kết quả trên, có thể kết luận, khi sử dụng bộ phân tích âm thành phần độc lập kết hợp với bộ lọc tương quan, giá trị rMAX > 0.5, điều này cho phép lựa chọn giá trị ngưỡng rng lớn, làm tăng tính chính xác và độ tin cậy trong việc phát hiện sự kiện âm thanh, ngay cả trong trường hợp cự ly định vị xa khiến SNR nhỏ. HE SO TUONG QUAN O CU LY 500M 1 0.5 0 -0.5 -1 6450 6500 6550 6600 6650 6700 6750 6800 Samples Hình 2.21. So sánh hệ số tương quan cự ly 500m

Giải pháp kết hợp tiền xử lý ICA và lọc tương quan tận dụng được việc sử dụng nhiều cảm biến âm thanh của hệ thống định vị nguồn âm theo nguyên lý TDOA, thời gian xử lý nhanh, phù hợp xây dựng hệ thống định vị nguồn âm với âm thanh cần định vị được xác định trước. Bên cạnh đó, thuật tốn ICA cho phép phân tách tín hiệu từ các nguồn âm khác nhau, là cơ sở cho phép định vị nhiều nguồn âm đồng thời trong các bước phát triển tiếp theo. Đồng thời, việc R A W D A T A B P F D A T A I C A D A T A C o rr e la tio n C o e ffi ci e n t R A W D A T A B P F D A T A I C A D A T A C o rr e la tio n C o e ff ic ie n t

sử dụng lọc tương quan có khả năng tái sử dụng khi ước tính khác biệt thời gian đến, tận dụng được năng lực của hệ thống.

2.2. Đề xuất giải pháp nâng cao độ chính xác ước tính khác biệt thời gian đến

2.2.1. Ước tính khác biệt thời gian đến sử dụng phương pháp tương quanchéo tổng quát chéo tổng quát

Ước tính thời gian khác biệt, như đã được giới thiệu trong chương 1 là bước quan trọng nhất trong hệ thống định vị nguồn âm sử dụng nguyên TDOA. Để ước tính khác biệt thời gian của tín hiệu trên hai cảm biến, những nghiên cứu trong những năm gần đây chỉ ra rằng phương pháp sử dụng tương quan chéo tổng quát (GCC) mang lại hiệu quả cao nhất [21].

Xét một cặp bao gồm hai cảm biến i và j trong không gian, nguồn âm xs phát ra tín hiệu âm thanh sk. Khi đó khác biệt thời gian đến giữa hai cảm biến được ước tính theo công thức (2.16) [16].

τˆij = argmax rxixj (τ ) (2.16) Với rxixj là hàm tương quan chéo tổng qt được tính theo cơng thức (2.17) [35].

1 2 i j ∫+∞ = (2.17) i j −∞ Trong đó: ψxixj (f ) = Φ(f )Sxixj (f ) (2.18)

Hai thành phần chính hình thành nên cơng thức (2.18) là hàm Cross

Spec- trum Sxixj (f ) và Φ(f ) là hàm trọng số trong miền tần số.

Sxixj (f ) ≜ E[Xi(f )X∗

j (f )] (2.19)

ψx x (f )

với E(·) là kỳ vọng toán học, và (·)∗ là ký hiệu liên hợp phức. Trong đó Xi

và Xj là biến đổi Fourier của tín hiệu âm thanh nhận được trên các cảm biến thứ i và thứ j theo công thức (1.1).

Xn = xn(t)e−i2πfk n = 1, 2, ...N (2.20)

Có nhiều lựa chọn khác nhau của hàm trọng số trong miền tần số Φ(f

), điều đó dẫn đến nhiều phương pháp khác nhau dựa trên tương quan

chéo tổng quát để ước tính khác biệt thời gian đến.

2.2.1.1. Tương quan chéo kinh điển

Tương quan chéo kinh điển (CCC - Classical Cross-Correlation) là phương pháp dựa trên việc chọn lựa hàm trọng số trong miền tần số Φ(f )

= 1. Khi đó, biến đổi từ cơng thức (1.2) ta có [16]:

Xn(f ) = αne−i2πf τn S(f ) + Bn(f ), n = 1, 2...N (2.21)

CCC

xixj = αiαje−i2πf τij E|S(f )|2 (2.22)

Có thể nhận thấy khi đó Φ(f )xixj phụ thuộc vào tín hiệu đến S(f ),

điều này khơng hẳn là tốt cho q trình xác định khác biệt thời gian đến, do tín hiệu âm thanh đến là khơng cố định về cả biên độ và tần số.

2.2.1.2. Biến đổi pha

Theo như công thức (2.17) có thể nhận thấy rằng thơng tin về khác

biệt thời gian đến khơng nằm trong biên độ của tín hiệu và được truyền tải trong pha. Vì vậy, có thể đơn giản loại bỏ biên độ và giữ lại pha trong q trình tính tốn, để làm được điều đó ta chọn trọng số trong miền tần số Φ(f ) theo công thức (2.23) [16].

ϕ(f ) = |Sx1 ixj (f )| (2.23) ψ(f )

x1x 2 ∫+ ∞  PHAT

xixj = e−i2πf τij (2.24)

Thay thế vào cơng thức (2.17) ta có được cơng thức GCC lý tưởng.

rPHAT (τ ) = −∞   ei2πf (τ −τij)df (2.25) =∞, τ = τij0, τ ̸= τij

Kết quả là, phương pháp biến đổi pha (Phase Tranform - PHAT) nhìn chung có hiệu quả hơn hẳn so với CCC khi ước tính khác biệt thời gian đến

[15]. Các phương pháp dựa trên GCC bao gồm cả CCC và PHAT có tính hiệu

quả khá và khả năng ứng dụng cao, thời gian tính tốn nhanh, và hoạt động hiệu quả trong môi trường lý tưởng, đặc biệt phương pháp PHAT có hiệu quả cao hơn CCC ngay cả trong mơi trường có tạp âm. Nhìn chung phương pháp ước tính khác biệt thời gian đến dựa trên tương quan chéo tổng quát đã được hoàn thiện khá đầy đủ.

Sau khi tín hiệu âm thanh được phát hiện, bước xử lý tiếp theo là ước tính khác biệt thời gian đến trên các cặp cảm biến. Cùng với tính tốn vị trí nguồn âm, đây là một trong hai bước quan trọng nhất nhằm định vị chính xác vị trí nguồn âm. Như đã giới thiệu tại chương 1, việc ước tính khác biệt thời gian đến hiện nay phần lớn dựa trên thuật toán tương quan chéo tổng quát, trong đó hiệu quả nhất là phương pháp ước tính dựa trên phương pháp biến đổi pha GCC-PHAT.

ψ(f

2.2.1.3. Khắc phục ảnh hưởng của nhiễu và tạp âm

Trên hình 2.22 thể hiện giá trị hàm rxixj giữa tín hiệu trên hai cảm biến thứ 1 và các cảm biến cịn lại. Có thể nhận thấy, trong 4 phép ước tính τij có 3 trường hợp là gần đúng, và 1 trường hợp sai số ước tính rất lớn, có thể nói khi đó giá trị hàm rxixj không đáng tin cậy để ước tính τij. Các đỉnh giả trong trường hợp sai số lớn kể trên gây ra bởi các nguồn nhiễu và tiếng vang.

Hình 2.22. Giá trị GCC-PHAT trên cảm biến thứ i và thứ j

các đỉnh giả đó. Có thể nhận thấy rằng giá trị rxixj bị ảnh hưởng bởi nhiễu và tiếng vang không thể hiện dưới dạng một đỉnh nhọn duy nhất. Do đó để xác định giá trị rxixj không tin cậy một số nghiên cứu đã phân tích hình dạng của giá trị rxixj , từ đó phân biệt các giá trị cực đại đáng tin cậy và ngược lại.

Trong [13] tác giả đề xuất sử dụng hàm trọng số (2.26) để phát hiện các giá trị GCC bị ảnh hưởng bởi nhiễu và tiếng vang.Σ

rx x (τ )2

j xi xj

∈/D

ρij ≜ τ ∈D

i r

(τ )2 (2.26)

Cụ thể, ρij là tỉ số của tổng "năng lượng" của các giá trị rxixj trong khoảng

Dij nằm xung quanh đỉnh giá trị rxixj cần xét với năng lượng của giá trị rxixj bên ngoài khoảng Dij. Khi ρij lớn hơn một giá trị ngưỡng nhất định thì giá trị

rxixj đang xem xét là đáng tin cậy. Phương pháp này tương đối hiệu quả trước ảnh hưởng của tiếng vang, tuy nhiên ở khoảng cách định vị xa, khi tác động của tạp âm lớn, các điểm cực trị không xuất hiện đơn lẻ mà nền nhiễu lớn tồn tại xuyên suốt toàn dải của hàm rxixj , khi đó hiệu quả của phương pháp không thực sự nổi bật.

Một phương pháp khả thi khác được trình bày trong nghiên cứu [52],

trong đó chỉ ra rằng tổng các giá trị khác biệt thời gian giữa một nhóm kín các cảm biến bằng khơng. Điều này là tương đối dễ hiểu, được rút ra từ khoảng việc tính tốn hiệu khoảng cách giữa các cảm biến tới nguồn âm. Như vậy giả sử rằng ta có một nhóm gồm ba cảm biến i, j và k, khi đó ta có:

τij + τjk + τki = 0 (2.27) Cơng thức này giúp cho q trình ước tính khác biệt thời gian đến trở nên hiệu quả hơn, giảm thiểu các kết quả ước tính sai trong q trình tính tốn. Tuy nhiên, giải pháp này cũng chỉ hiệu quả trong trường hợp các giá trị

τij tính tốn được có sai số nhỏ, hoặc chỉ có một giá trị trong nhóm kín có kết

quả sai. Khi sai số tính tốn τij lớn, xuất hiện trong nhiều cặp tín hiệu, giải pháp sẽ khơng

Σ F

thực sự nâng cao chất lượng ước tính khác biệt thời gian tới. Mặc dù vậy, đây vẫn là một giải pháp hiệu quả nhằm hợp lý hóa kết quả tính tốn khác biệt thời gian đến τij, sẵn sàng cho bước ước tính khác biệt thời gian đến.

2.2.2. Đề xuất giải pháp nâng cao chất lượng ước tính khác biệt thời gianđến sử dụng trọng số thích nghi đến sử dụng trọng số thích nghi

Trong bài tốn định vị tiếng nổ đầu nịng của súng AK47 nói riêng, hoặc của tiếng nổ nói chung, tiếng nổ cần định vị thơng thường là một âm thanh có dải tần tương đối rộng, như thể hiện trên hình 1.13 băng thông dải tần tiếng nổ của súng AK nằm trong dải f ∈ [0.3 ÷ 2]kHz. Việc sử dụng phương pháp GCC-PHAT trong đó loại bỏ hết hồn tồn thành phần biên độ và chỉ giữ lại pha trong q trình tính tốn bằng cách sử dụng hàm trọng số trong miền tần số theo cơng thức (2.23), đặc biệt trong trường hợp tín hiệu có dải rộng, trong đó tạp âm mạnh chiếu ưu thế trong phần lớn băng tần của tín hiệu, khiến hiệu suất của phương pháp GCC-PHAT suy giảm [32].

Để giải quyết vấn đề này một vài nghiên cứu [24] [29] đã đưa ra giải

pháp kiểm soát mức độ loại bỏ thành phần biên độ bằng cách sử dụng một biến thể

i j rx1x2(τ ) = −1 Sxixj (f ) |Sx x (f )|β Σ (2.28)

Thuật toán GCC-PHAT-β kiểm soát mức độ loại bỏ thành phần biên độ thông qua hệ số β, hay một cách đơn giản hơn có thể hiểu β là hệ số chuẩn hóa cơng suất mềm. Hệ số β khi được lựa chọn tối ưu cho phép hạn chế các thành phần nhiễu đồng thời làm giữ nguyên các thành phần tần của sự kiện âm thanh số có biên độ lớn. Khi β = 1 toàn bộ thành phần biên độ bị loại bỏ trong q trình tính tốn tương đương với thuật tốn GCC-PHAT, khi β = 0 tồn bộ thành phần biên độ được giữ lại tương ứng với phương pháp tương quan chéo kinh điển.

không phải việc dễ dàng, kết quả ước tính khác biệt thời gian tới ngồi việc phụ thuộc vào hệ số β cịn phụ thuộc vào đặc tính của tín hiệu cần định vị và tỉ lệ SNR của tín hiệu thu được trên các cảm biến.

Trên hình 2.23 thể hiện sai số khác biệt thời gian đến trong các điều kiện SNR khác nhau với từng hệ số β. Có thể nhận thấy sai số khác biệt thời gian đến không chỉ phụ thuộc vào tỉ số SNR mà còn phụ thuộc vào hệ số β, trong mỗi thời điểm với một giá trị SNR nhất định sẽ tồn tại một giá trị hệ số β tối

ưu. Việc lựa chọn hệ số này trước đây dựa vào kinh nghiệm, hệ số thường cố định với các mức SNR khác nhau và không tối ưu trong mọi thời điểm.

∗

SAI SO UOC TINH TRE THOI GIAN DEN GCC- PHAT 45 40 35 =1 =0.2 =0.8 =0.6 =0.4 30 25 20 15 10 5 0 -5.5 -5 -4.5 -4 -3.5 -3 -2.5 -2 -1.5 -1 -0.5 0 SNR(dB)

Hình 2.23. Sai số ước tính khác biệt thời gian đến với hệ số β

Do đó, bài tốn lựa chọn giá trị β tối ưu được đưa ra nhằm ước tính chính xác giá trị β thay đổi để sai số ước tính khác biệt thời gian đến nhỏ nhất được cải thiện so với trường hợp sử dụng thuật toán GCC-PHAT.

Để đánh giá mối quan hệ giữa SNR và giá trị β, theo cơng thức (2.19) ta có:

.Sx

ixj (f ). = |Xi(f )[Xj(f )] | (2.29)

. Σ | | .Sx x (f ). = |S(f )| + | B(f )| E .|S(f )| 2Σ

Giả sử rằng tác động của tạp âm tới mỗi cảm biến là độc lập, khi đó độ lớn của hàm Cross Spectrum Sxixj (f ) có thể được tính như sau:

i j

= S(f ) 2 1 + 1 (2.30)

ξ(f )

Trong đó ξ(f ) là tỉ số SNR, tỉ số này có thể được đo lường thơng qua cơng thức (2.31), bằng cách tính tỉ số năng lượng tín hiệu và tạp âm:

ξi(f ) = E , |Bi(f )| 2, (2.31)

Có thể nhận thấy, việc tính tốn tỉ số SNR là tương đối khó khăn, đặc biệt trong điều kiện tín hiệu đầu vào biến đổi liên tục. Đối với hệ thống định vị nguồn âm, khi tín hiệu cần định vị xuất hiện một cách ngẫu nhiên, với giả thiết sự kiện âm thanh được phát hiện một cách chính xác thì việc tính tốn SNR cũng hết sức khó khăn do các giả thiết tiên nghiệm về cường độ tạp âm chưa hẳn đã chính xác.

Tuy nhiên, hệ thống định vị nguồn âm được đề xuất trong luận án tập trung vào định vị một nguồn âm trong đó âm thanh cần định vị được xác định trước. Với đặc tính biết trước dạng của tín hiệu cần định vị, việc ước lượng tỉ số SNR có thể được thực hiện thơng qua hệ số tương quan giữa tín hiệu mẫu và tín hiệu thu được trên các cảm biến. Một cách đơn giản có thể hiểu rằng giá trị của hàm tương quan tỉ lệ thuận với sai khác của tín hiệu thu được với tín hiệu gốc, mà điều này được gây ra bởi cường độ của tạp âm mạnh hay yếu. Do đó sử dụng hệ số tương quan rsi nhằm xây dựng hệ số chuẩn hóa cơng suất

β là một cách tiếp cận khả thi.

Sử dụng công thức ước lượng hệ số β theo công thức sau:

ΣN N ri s i= 1 β = (2.32)

Trong đó:

ris là hệ số tương quan của tín hiệu thu được trên cảm biến thứ i với tín

hiệu mẫu;

N là số lượng các cặp cảm biến.

Như đã biết hệ số tương quan được tính tốn dựa trên cơng thức (2.3).

Khi hệ số tương quan cực trị r → 1, tín hiệu thu được trên cảm biến có tính tương quan cao với tín hiệu mẫu, từ đó có thể kết luận rằng tỉ lệ SNR lớn. Tương tự như vậy khi r → 0, tín hiệu trên cảm biến có tính tương quan thấp với tín hiệu mẫu, và tỉ lệ SNR nhỏ.

Mặt khác, với việc xây dựng công cụ phát hiện sự kiện âm thanh dựa trên hệ số tương quan, kết hợp với việc sử dụng hệ số tương quan đó để xây dựng hệ số chuẩn hóa cơng suất β, hai giải pháp nâng cao chất lượng phát hiện sự kiện âm thanh và ước lượng thời gian đến có thể được xây dựng thành một chỉnh thể thống nhất giúp đơn giản hóa q trình tính tốn, đẩy nhanh tốc độ xử lý của hệ thống định vị nguồn âm.

Trên cơ sở giải pháp ước tính khác biệt thời gian tới sử dụng thuật tốn GCC-PHAT-β với β thích nghi theo hệ số tương quan (GCC-PHAT-β-TN) đã được đề xuất, một lưu đồ thuật tốn ước tính khác biệt thời gian tới giữa một cặp cảm biến được xây dựng như trên hình 2.24. Trước hết tín hiệu chuẩn và

các tham số đầu vào của hệ thống được thiết lập, tiếp theo tín hiệu thu được

.3 Hệ số tương quan trung bình sau bộ ICA

.6 Thiết bị Bionic XS-56 Array của hãng CAE

.8 Mơ hình định vị nguồn âm