Cự ly (m) 100 200 300 400 500
rM AX 0,854 0,775 0,702 0,617 0,529
tích âm thành phần độc lập với tín hiệu khơng xử lý và tín hiệu sau bộ lọc thơng dải tại cự ly100mvà500m. Có thể nhận thấy hệ số tương quan trong các trường
5.25 5.255 5.26 5.265 5.27 5.275 5.28 5.285 Samples 104 -1 -0.5 0 0.5 1 Correlation Coefficient
HE SO TUONG QUAN O CU LY 100M SAU BO LOC ICA
RAW DATA BPF DATA ICA DATA
Hình 2.20. So sánh hệ số tương quan cự ly 100m
hợp sử dụng bộ phân tích âm thanh phần độc lập cho kết quả cao hơn so với các trường hợp còn lại.
Qua các kết quả trên, có thể kết luận, khi sử dụng bộ phân tích âm thành phần độc lập kết hợp với bộ lọc tương quan, giá trị rM AX > 0.5, điều này cho
phép lựa chọn giá trị ngưỡngrnglớn, làm tăng tính chính xác và độ tin cậy trong việc phát hiện sự kiện âm thanh, ngay cả trong trường hợp cự ly định vị xa khiến SNR nhỏ. 6450 6500 6550 6600 6650 6700 6750 6800 Samples -1 -0.5 0 0.5 1 Correlation Coefficient HE SO TUONG QUAN O CU LY 500M RAW DATA BPF DATA ICA DATA Hình 2.21. So sánh hệ số tương quan cự ly 500m
Giải pháp kết hợp tiền xử lý ICA và lọc tương quan tận dụng được việc sử dụng nhiều cảm biến âm thanh của hệ thống định vị nguồn âm theo nguyên lý TDOA, thời gian xử lý nhanh, phù hợp xây dựng hệ thống định vị nguồn âm với âm thanh cần định vị được xác định trước. Bên cạnh đó, thuật tốn ICA cho phép phân tách tín hiệu từ các nguồn âm khác nhau, là cơ sở cho phép định vị nhiều nguồn âm đồng thời trong các bước phát triển tiếp theo. Đồng thời, việc
sử dụng lọc tương quan có khả năng tái sử dụng khi ước tính khác biệt thời gian đến, tận dụng được năng lực của hệ thống.
2.2. Đề xuất giải pháp nâng cao độ chính xác ước tính khác biệt thời gian đến
2.2.1. Ước tính khác biệt thời gian đến sử dụng phương pháp tương quan chéo tổng quát
Ước tính thời gian khác biệt, như đã được giới thiệu trong chương 1 là bước quan trọng nhất trong hệ thống định vị nguồn âm sử dụng nguyên TDOA. Để ước tính khác biệt thời gian của tín hiệu trên hai cảm biến, những nghiên cứu trong những năm gần đây chỉ ra rằng phương pháp sử dụng tương quan chéo tổng quát (GCC) mang lại hiệu quả cao nhất [21].
Xét một cặp bao gồm hai cảm biến i vàj trong khơng gian, nguồn âmxs
phát ra tín hiệu âm thanh sk. Khi đó khác biệt thời gian đến giữa hai cảm biến
được ước tính theo cơng thức (2.16) [16].
ˆ
τij = argmaxrxixj(τ) (2.16)
Với rxixj là hàm tương quan chéo tổng qt được tính theo cơng thức (2.17) [35]. rx1x2(τ) ≜ F−1ψxixj(f) = +∞ Z −∞ ψxixj(f)ei2πf τdf (2.17) Trong đó: ψxixj(f) = Φ(f)Sxixj(f) (2.18)
Hai thành phần chính hình thành nên cơng thức (2.18) là hàm Cross Spec- trumSxixj(f) vàΦ(f) là hàm trọng số trong miền tần số.
vớiE(·) là kỳ vọng toán học, và (·)∗ là ký hiệu liên hợp phức. Trong đó Xi và Xj là biến đổi Fourier của tín hiệu âm thanh nhận được trên các cảm biến thứ i và thứ j theo công thức (1.1).
Xn = X
t
xn(t)e−i2πf k n= 1,2, ...N (2.20)
Có nhiều lựa chọn khác nhau của hàm trọng số trong miền tần số Φ(f),
điều đó dẫn đến nhiều phương pháp khác nhau dựa trên tương quan chéo tổng quát để ước tính khác biệt thời gian đến.
2.2.1.1. Tương quan chéo kinh điển
Tương quan chéo kinh điển (CCC - Classical Cross-Correlation) là phương pháp dựa trên việc chọn lựa hàm trọng số trong miền tần sốΦ(f) = 1. Khi đó,
biến đổi từ cơng thức (1.2) ta có [16]:
Xn(f) = αne−i2πf τnS(f) + Bn(f), n= 1,2...N (2.21)
Thay thế vào công thức (2.18) ta có: ψ(f)CCCx
ixj = αiαje−i2πf τijE|S(f)|2 (2.22)
Có thể nhận thấy khi đó Φ(f)xixj phụ thuộc vào tín hiệu đến S(f), điều
này khơng hẳn là tốt cho quá trình xác định khác biệt thời gian đến, do tín hiệu âm thanh đến là khơng cố định về cả biên độ và tần số.
2.2.1.2. Biến đổi pha
Theo như cơng thức (2.17) có thể nhận thấy rằng thông tin về khác biệt thời gian đến không nằm trong biên độ của tín hiệu và được truyền tải trong pha. Vì vậy, có thể đơn giản loại bỏ biên độ và giữ lại pha trong q trình tính tốn, để làm được điều đó ta chọn trọng số trong miền tần số Φ(f) theo cơng thức (2.23) [16].
ϕ(f) = 1
Khi đó cơng thức (2.18) sẽ trở nên rất đơn giản.
ψ(f)P HATxixj = e−i2πf τij (2.24) Thay thế vào công thức (2.17) ta có được cơng thức GCC lý tưởng.
rP HATx1x2 (τ) = +∞ Z −∞ ei2πf(τ−τij) df = ∞, τ = τij 0, τ ̸= τij (2.25)
Kết quả là, phương pháp biến đổi pha (Phase Tranform - PHAT) nhìn chung có hiệu quả hơn hẳn so với CCC khi ước tính khác biệt thời gian đến [15]. Các phương pháp dựa trên GCC bao gồm cả CCC và PHAT có tính hiệu quả khá và khả năng ứng dụng cao, thời gian tính tốn nhanh, và hoạt động hiệu quả trong môi trường lý tưởng, đặc biệt phương pháp PHAT có hiệu quả cao hơn CCC ngay cả trong mơi trường có tạp âm. Nhìn chung phương pháp ước tính khác biệt thời gian đến dựa trên tương quan chéo tổng quát đã được hoàn thiện khá đầy đủ.
Sau khi tín hiệu âm thanh được phát hiện, bước xử lý tiếp theo là ước tính khác biệt thời gian đến trên các cặp cảm biến. Cùng với tính tốn vị trí nguồn âm, đây là một trong hai bước quan trọng nhất nhằm định vị chính xác vị trí nguồn âm. Như đã giới thiệu tại chương 1, việc ước tính khác biệt thời gian đến hiện nay phần lớn dựa trên thuật tốn tương quan chéo tổng qt, trong đó hiệu quả nhất là phương pháp ước tính dựa trên phương pháp biến đổi pha GCC-PHAT.
2.2.1.3. Khắc phục ảnh hưởng của nhiễu và tạp âm
Trên hình 2.22 thể hiện giá trị hàm rxixj giữa tín hiệu trên hai cảm biến thứ 1 và các cảm biến cịn lại. Có thể nhận thấy, trong 4 phép ước tínhτij có 3 trường hợp là gần đúng, và 1 trường hợp sai số ước tính rất lớn, có thể nói khi đó giá trị hàm rxixj khơng đáng tin cậy để ước tínhτij. Các đỉnh giả trong trường hợp sai số lớn kể trên gây ra bởi các nguồn nhiễu và tiếng vang.
Hình 2.22. Giá trị GCC-PHAT trên cảm biến thứivà thứ j
các đỉnh giả đó. Có thể nhận thấy rằng giá trị rxixj bị ảnh hưởng bởi nhiễu và tiếng vang không thể hiện dưới dạng một đỉnh nhọn duy nhất. Do đó để xác định giá trị rxixj khơng tin cậy một số nghiên cứu đã phân tích hình dạng của giá trịrxixj , từ đó phân biệt các giá trị cực đại đáng tin cậy và ngược lại.
Trong [13] tác giả đề xuất sử dụng hàm trọng số (2.26) để phát hiện các giá trị GCC bị ảnh hưởng bởi nhiễu và tiếng vang.
ρij ≜ P
τ∈Drxixj(τ)2
P
τ /∈Drxixj(τ)2 (2.26) Cụ thể,ρij là tỉ số của tổng "năng lượng" của các giá trịrxixj trong khoảng
Dij nằm xung quanh đỉnh giá trịrxixj cần xét với năng lượng của giá trị rxixj bên ngoài khoảngDij. Khi ρij lớn hơn một giá trị ngưỡng nhất định thì giá trị rxixj đang xem xét là đáng tin cậy. Phương pháp này tương đối hiệu quả trước ảnh hưởng của tiếng vang, tuy nhiên ở khoảng cách định vị xa, khi tác động của tạp âm lớn, các điểm cực trị không xuất hiện đơn lẻ mà nền nhiễu lớn tồn tại xuyên suốt toàn dải của hàm rxixj, khi đó hiệu quả của phương pháp không thực sự nổi bật.
Một phương pháp khả thi khác được trình bày trong nghiên cứu [52], trong đó chỉ ra rằng tổng các giá trị khác biệt thời gian giữa một nhóm kín các cảm biến bằng khơng. Điều này là tương đối dễ hiểu, được rút ra từ khoảng việc tính tốn hiệu khoảng cách giữa các cảm biến tới nguồn âm. Như vậy giả sử rằng ta có một nhóm gồm ba cảm biếni, j vàk, khi đó ta có:
τij +τjk +τki = 0 (2.27)
Cơng thức này giúp cho q trình ước tính khác biệt thời gian đến trở nên hiệu quả hơn, giảm thiểu các kết quả ước tính sai trong q trình tính tốn. Tuy nhiên, giải pháp này cũng chỉ hiệu quả trong trường hợp các giá trịτij tính tốn được có sai số nhỏ, hoặc chỉ có một giá trị trong nhóm kín có kết quả sai. Khi sai số tính tốn τij lớn, xuất hiện trong nhiều cặp tín hiệu, giải pháp sẽ không
thực sự nâng cao chất lượng ước tính khác biệt thời gian tới. Mặc dù vậy, đây vẫn là một giải pháp hiệu quả nhằm hợp lý hóa kết quả tính tốn khác biệt thời gian đến τij, sẵn sàng cho bước ước tính khác biệt thời gian đến.
2.2.2. Đề xuất giải pháp nâng cao chất lượng ước tính khác biệt thời gian đến sử dụng trọng số thích nghi
Trong bài tốn định vị tiếng nổ đầu nịng của súng AK47 nói riêng, hoặc của tiếng nổ nói chung, tiếng nổ cần định vị thơng thường là một âm thanh có dải tần tương đối rộng, như thể hiện trên hình 1.13 băng thông dải tần tiếng nổ của súng AK nằm trong dải f ∈ [0.3 ÷ 2]kHz. Việc sử dụng phương pháp
GCC-PHAT trong đó loại bỏ hết hồn tồn thành phần biên độ và chỉ giữ lại pha trong q trình tính tốn bằng cách sử dụng hàm trọng số trong miền tần số theo công thức (2.23), đặc biệt trong trường hợp tín hiệu có dải rộng, trong đó tạp âm mạnh chiếu ưu thế trong phần lớn băng tần của tín hiệu, khiến hiệu suất của phương pháp GCC-PHAT suy giảm [32].
Để giải quyết vấn đề này một vài nghiên cứu [24] [29] đã đưa ra giải pháp kiểm soát mức độ loại bỏ thành phần biên độ bằng cách sử dụng một biến thể của thuật toán GCC-PHAT gọi là GCC-PHAT-β.
rx1x2(τ) = F−1
Sxixj(f)
|Sxixj(f)|β
(2.28) Thuật toán GCC-PHAT-β kiểm soát mức độ loại bỏ thành phần biên độ thông qua hệ số β, hay một cách đơn giản hơn có thể hiểu β là hệ số chuẩn hóa cơng suất mềm. Hệ số β khi được lựa chọn tối ưu cho phép hạn chế các thành phần nhiễu đồng thời làm giữ nguyên các thành phần tần của sự kiện âm thanh số có biên độ lớn. Khiβ = 1tồn bộ thành phần biên độ bị loại bỏ trong quá trình tính tốn tương đương với thuật tốn GCC-PHAT, khi β = 0toàn bộ thành phần biên độ được giữ lại tương ứng với phương pháp tương quan chéo kinh điển.
không phải việc dễ dàng, kết quả ước tính khác biệt thời gian tới ngồi việc phụ thuộc vào hệ số β còn phụ thuộc vào đặc tính của tín hiệu cần định vị và tỉ lệ SNR của tín hiệu thu được trên các cảm biến.
Trên hình 2.23 thể hiện sai số khác biệt thời gian đến trong các điều kiện SNR khác nhau với từng hệ số β. Có thể nhận thấy sai số khác biệt thời gian đến không chỉ phụ thuộc vào tỉ số SNR mà còn phụ thuộc vào hệ số β, trong mỗi thời điểm với một giá trị SNR nhất định sẽ tồn tại một giá trị hệ số β tối ưu. Việc lựa chọn hệ số này trước đây dựa vào kinh nghiệm, hệ số thường cố định với các mức SNR khác nhau và không tối ưu trong mọi thời điểm.
-5.5 -5 -4.5 -4 -3.5 -3 -2.5 -2 -1.5 -1 -0.5 0 SNR(dB) 0 5 10 15 20 25 30 35 40 45 (ms)
SAI SO UOC TINH TRE THOI GIAN DEN GCC-PHAT
=1 =0.2 =0.8 =0.6 =0.4
Hình 2.23. Sai số ước tính khác biệt thời gian đến với hệ sốβ
Do đó, bài tốn lựa chọn giá trị β tối ưu được đưa ra nhằm ước tính chính xác giá trị β thay đổi để sai số ước tính khác biệt thời gian đến nhỏ nhất được cải thiện so với trường hợp sử dụng thuật toán GCC-PHAT.
Để đánh giá mối quan hệ giữa SNR và giá trị β, theo công thức (2.19) ta có:
Giả sử rằng tác động của tạp âm tới mỗi cảm biến là độc lập, khi đó độ lớn của hàm Cross SpectrumSxixj(f) có thể được tính như sau:
Sxixj(f) = |S(f)|2 +|B(f)|2 = |S(f)|2 1 + 1 ξ(f) (2.30)
Trong đóξ(f)là tỉ số SNR, tỉ số này có thể được đo lường thơng qua cơng thức (2.31), bằng cách tính tỉ số năng lượng tín hiệu và tạp âm:
ξi(f) = E
|S(f)|2
En|Bi(f)|2o
(2.31) Có thể nhận thấy, việc tính tốn tỉ số SNR là tương đối khó khăn, đặc biệt trong điều kiện tín hiệu đầu vào biến đổi liên tục. Đối với hệ thống định vị nguồn âm, khi tín hiệu cần định vị xuất hiện một cách ngẫu nhiên, với giả thiết sự kiện âm thanh được phát hiện một cách chính xác thì việc tính tốn SNR cũng hết sức khó khăn do các giả thiết tiên nghiệm về cường độ tạp âm chưa hẳn đã chính xác.
Tuy nhiên, hệ thống định vị nguồn âm được đề xuất trong luận án tập trung vào định vị một nguồn âm trong đó âm thanh cần định vị được xác định trước. Với đặc tính biết trước dạng của tín hiệu cần định vị, việc ước lượng tỉ số SNR có thể được thực hiện thơng qua hệ số tương quan giữa tín hiệu mẫu và tín hiệu thu được trên các cảm biến. Một cách đơn giản có thể hiểu rằng giá trị của hàm tương quan tỉ lệ thuận với sai khác của tín hiệu thu được với tín hiệu gốc, mà điều này được gây ra bởi cường độ của tạp âm mạnh hay yếu. Do đó sử dụng hệ số tương quanrsi nhằm xây dựng hệ số chuẩn hóa cơng suất β là một cách tiếp cận khả thi.
Sử dụng công thức ước lượng hệ sốβ theo cơng thức sau:
β = N P i=1 ris N (2.32)
Trong đó:
ris là hệ số tương quan của tín hiệu thu được trên cảm biến thứ i với tín hiệu mẫu;
N là số lượng các cặp cảm biến.
Như đã biết hệ số tương quan được tính tốn dựa trên cơng thức (2.3). Khi hệ số tương quan cực trị r → 1, tín hiệu thu được trên cảm biến có tính tương
quan cao với tín hiệu mẫu, từ đó có thể kết luận rằng tỉ lệ SNR lớn. Tương tự như vậy khir → 0, tín hiệu trên cảm biến có tính tương quan thấp với tín hiệu
mẫu, và tỉ lệ SNR nhỏ.
Mặt khác, với việc xây dựng công cụ phát hiện sự kiện âm thanh dựa trên hệ số tương quan, kết hợp với việc sử dụng hệ số tương quan đó để xây dựng hệ số chuẩn hóa cơng suấtβ, hai giải pháp nâng cao chất lượng phát hiện sự kiện âm thanh và ước lượng thời gian đến có thể được xây dựng thành một chỉnh thể thống nhất giúp đơn giản hóa q trình tính tốn, đẩy nhanh tốc độ xử lý của hệ thống định vị nguồn âm.
Trên cơ sở giải pháp ước tính khác biệt thời gian tới sử dụng thuật tốn GCC-PHAT-β với β thích nghi theo hệ số tương quan (GCC-PHAT-β-TN) đã được đề xuất, một lưu đồ thuật tốn ước tính khác biệt thời gian tới giữa một cặp cảm biến được xây dựng như trên hình 2.24. Trước hết tín hiệu chuẩn và các tham số đầu vào của hệ thống được thiết lập, tiếp theo tín hiệu thu được trên hai cảm biếnxi(t)và xj(t) được tiếp nhận theo các cửa sổ tín hiệu đã định trước.
Sau đó, q trình phát hiện sự kiện âm thanh được thực hiện sử dụng giải pháp được đề xuất trong luận án kết hợp giữa tiền xử lý ICA và bộ lọc tương quan. Việc phát hiện sự kiện âm thanh được thực hiện chỉ trên 01 cảm biến, do các cảm biến được đặt gần nhau nên việc phát hiện sự kiện âm thanh ở tất cả