Bài viết Nâng cao chất lượng phát hiện sự kiện âm thanh trong bài toán định vị nguồn âm theo nguyên lý TDOA trình bày một số kết quả nghiên cứu giải pháp nâng cao chất lượng định vị nguồn âm sử dụng nguyên lý TDOA, trong trường hợp loại nguồn âm cần định vị được xác định trước. Trong đó đề xuất giải pháp cải thiện chất lượng phát hiện sự kiện âm thanh dựa trên bộ lọc tương quan kết hợp với tiền xử lý tín hiệu bằng kỹ thuật phân tích thành phần độc lập ICA.
Kỹ thuật điều khiển & Điện tử Nâng cao chất lượng phát kiện âm toán định vị nguồn âm theo nguyên lý TDOA Trần Công Thìn1, Nguyễn Trung Kiên1*, Bùi Ngọc Mỹ1, Nguyễn Huy Hồng2 Viện Khoa học Công nghệ quân sự; Học viện Kỹ thuật quân *Email: kiennt67@gmail.com Nhận bài: 28/3/2022; Hoàn thiện: 19/4/2022; Chấp nhận đăng: 01/6/2022; Xuất bản: 28/6/2022 DOI: https://doi.org/10.54939/1859-1043.j.mst.80.2022.60-70 TĨM TẮT Bài báo trình bày số kết nghiên cứu giải pháp nâng cao chất lượng định vị nguồn âm sử dụng nguyên lý TDOA, trường hợp loại nguồn âm cần định vị xác định trước Trong đề xuất giải pháp cải thiện chất lượng phát kiện âm dựa lọc tương quan kết hợp với tiền xử lý tín hiệu kỹ thuật phân tích thành phần độc lập ICA Trên sở phân tích lý thuyết tiến hành mô Monte-Carlo Matlab, kết hợp với liệu thu thập điều kiện thực tế báo đánh giá hiệu giải pháp đề xuất, qua cho phép nâng cao chất lượng định vị nguồn âm theo nguyên lý TDOA Từ khoá: Định vị nguồn âm; TDOA; ICA MỞ ĐẦU Trong hệ thống định vị nguồn âm nói chung định vị nguồn âm sử dụng nguyên lý TDOA (Time Differences of Arrival) nói riêng, phát kiện âm (PHSKAT) bước đầu tiên, ảnh hưởng lớn tới khả định vị xác nguồn âm, tránh trường hợp định vị sai nguồn âm, bỏ sót nguồn âm cần định vị Đặc biệt, với hệ thống định vị nguồn âm trời, khoảng cách định vị xa, nhiễu tạp âm tác động lớn tới tín hiệu, qua làm giảm khả phát xác kiện âm [3, 8] Hiện nay, có nhiều kỹ thuật khác sử dụng nhằm PHSKAT, chủ yếu dựa đặc trưng biên độ, tần số tín hiệu, áp dụng kỹ thuật học sâu (Deep Learning), nhiên, toán định vị nguồn âm, việc PHSKAT cần thực thời gian ngắn, sẵn sàng cho bước xử lý nhằm đảm bảo tính thời gian thực hệ thống Các cơng trình nghiên cứu kỹ thuật PHSKAT dùng hệ thống định vị nguồn âm công bố phần lớn dựa đặc trưng phổ lượng tín hiệu, thích hợp với việc phát nguồn âm có cường độ mạnh, phổ lượng tập trung vào khoảng tần số hẹp [5, 6] Với nguồn âm có khoảng cách định vị xa, tín hiệu thu cảm biến có biên độ thấp, phổ lượng tín hiệu trải dài khoảng rộng, chưa có nhiều nghiên cứu đưa phương pháp PHSKAT phù hợp [3, 6] Bài báo trình bày số kết nghiên đánh giá khả PHSKAT kỹ thuật dựa biên độ tín hiệu, lọc tương quan Trong đó, đề xuất giải pháp cải thiện hiệu PHSKAT cách sử dụng lọc tương quan kết hợp với giải pháp tiền xử lý tín hiệu dụng kỹ thuật phân tích thành phần độc lập ICA (Independent Component Analysis) Các kỹ thuật sử dụng tương đối phổ biến xử lý tín hiệu âm nói chung, nhiên kết hợp áp dụng phù hợp vào việc PHSKAT nâng cao khả phát hiện, qua góp phần nâng cao chất lượng định vị nguồn âm sử dụng nguyên lý TDOA PHÁT HIỆN SỰ KIỆN ÂM THANH TRONG BÀI TOÁN ĐỊNH VỊ NGUỒN ÂM THEO NGUYÊN LÝ TDOA 2.1 Định vị nguồn âm theo nguyên lý TDOA Phương pháp định vị nguồn âm theo nguyên lý TDOA xây dựng sở ước tính hiệu thời gian đến τij tín hiệu âm thu cảm biến [1] 60 T C Thìn, …, N H Hồng, “Nâng cao chất lượng phát … nguồn âm theo nguyên lý TDOA.” Nghiên cứu khoa học công nghệ ij i j (1) Trong đó: τi τj thời gian tín hiệu truyền từ nguồn âm tới cảm biến thứ i j Triển khai công thức hiệu thời gian đến theo khoảng cách ri, rj từ nguồn âm tới cảm biến vận tốc lan truyền âm không khí v, thu phương trình biểu diễn hyperboloid không gian chiều [1] : ri rj ‖ x s mi‖ ‖ x s m j‖ (2) v v v Với xs = [xs, ys, zs]T, mi =[xi, yi, zi]T, mj =[xj, yj, zj]T tọa độ nguồn âm tọa độ hai cảm biến thứ i, thứ j không gian Để xác định tọa độ nguồn âm xs không gian chiều, cần giao hội hyperboloid, tương ứng cần cảm biến âm (từ - 4) để tạo thành cặp cảm biến độc lập Như vậy, để định vị nguồn âm theo nguyên lý TDOA, cần thực hai bước, ước tính hiệu thời gian đến τij giải hệ phương trình để xác định tọa độ nguồn âm Tuy nhiên, trước thực hai bước trên, cần phải PHSKAT cần định vị, từ trích xuất xác cửa sổ chứa kiện âm thanh, sở cho việc ước tính τij Đặc biệt với hệ thống định vị nguồn âm âm định vị biết trước định vị điểm nổ, phát bắn tỉa,… việc PHSKAT đóng vai trị quan trọng, đảm bảo loại bỏ trường hợp định vị sai nguồn âm bỏ sót âm cần định vị [3] Trong toán định vị nguồn âm theo nguyên lý TDOA, kỹ thuật PHSKAT yêu cầu phải thực thời gian ngắn nhằm trích xuất xác cửa sổ chứa kiện âm, đảm bảo tính thời gian thực hệ thống Do đó, kỹ thuật sử dụng thường dựa đặc trưng biên độ lọc tương quan [3] Một số nghiên cứu PHSKAT dựa mạng Neural tích chập (Convolutional Neural Networks-CNN) [5, 6] mạng mạng Neural hồi tiếp (Recurrent Neural Networks-RNN) [6, 7], nhiên, hiệu kỹ thuật toán định vị nguồn âm chưa đánh giá cụ thể, đặc biệt tính thời gian thực hệ thống Bên cạnh đó, để phát kiện theo kỹ thuật đòi hỏi phải xây dựng thư viện hoàn thiện cho nhiều loại âm cần định vị 2.2 Phát kiện âm theo biên độ Phương thức đơn giản để phát kiện âm dựa vào biên độ tín hiệu, bổ đề Neyman-Pearson xác suất phát tín hiệu [9] sử dụng để tính ngưỡng phát tín hiệu theo cơng thức : ij L( z ) p z∣ Hp1 p z∣ Hp0 (3) Trong đó: L(z) tỉ lệ khả xảy kiện âm thanh; Hp0 giả thuyết khơng có kiện âm thanh; Hp1 giả thuyết có kiện âm thanh; z tập quan sát; p(z) là hàm mật độ xác suất; ngưỡng phát Theo cơng thức 3, để tín hiệu xác định tồn kiện âm tỉ lệ xảy kiện L(z) phải lớn ngưỡng phát , đó, Hp0 Hp1 giả thuyết tạp âm kiện âm Hình minh họa kiện âm tiếng nổ đầu nịng súng Tạp chí Nghiên cứu KH&CN quân sự, Số 80, - 2022 61 Kỹ thuật điều khiển & Điện tử AK47, tín hiệu kiện âm điển hình với thơng số đặc trưng bao gồm: biên độ, thời gian tồn tại, tần số Tín hiệu phân tách khỏi tạp âm ngưỡng phát Hình Phát kiện âm theo biên độ Hình Các bước phát kiện âm theo biên độ Thuật toán phát kiện dựa công thức thể hình Tồn q trình bao gồm năm giai đoạn, cụ thể sau: Bước ước tính nhiễu tín hiệu âm đầu vào để cung cấp cho bước thứ hai tính tốn ngưỡng âm dương Các ngưỡng phát không cố định mà thay đổi theo cường độ tạp âm Bước thứ ba so sánh mẫu tín hiệu với ngưỡng Các mẫu ngưỡng dương ngưỡng âm coi thành phần tín hiệu chứa kiện âm Bằng cách nhóm liên tục tín hiệu theo cửa sổ trượt thu tín hiệu kiện âm hồn chỉnh Tuy nhiên, có khả kiện âm thu kiện âm cần phát hiện, bước cuối lọc kiện âm cần thiết để loại bỏ kiện sai Một kiện tiếng nổ đầu nòng thực phải tuân theo điều kiện sau: ( A Am ) ( N Nm ) (4) Trong đó, A N biên độ thời gian trung bình kiện, Am Nm giá trị nhỏ chúng 2.3 Phát kiện âm sử dụng lọc tương quan Hệ số tương quan, ký hiệu rXY sử dụng để đo lường mức độ phụ thuộc tuyến tính hai biến ngẫu nhiên X Y tính theo cơng thức [2, 9]: rXY đó: cov( X , Y ) E (( X EX ).(Y EY )) X Y X Y (5) cov( X ,Y ) E(( X EX ).(Y EY )) hiệp phương sai X Y; X Y độ lệch chuẩn hai biến X, Y Hệ số tương quan rXY thể mức độ phụ thuộc tuyến tính hai biến ngẫu nhiên X Y, | rXY | gần tính chất phụ thuộc tuyến tính hai biến X Y chặt, | rXY | gần phụ thuộc tuyến tính lỏng lẻo, | rXY | X Y khơng tương quan Tiến hành so sánh tín hiệu chuẩn Xsn tín hiệu thu cảm biến Xin sử dụng 62 T C Thìn, …, N H Hoàng, “Nâng cao chất lượng phát … nguồn âm theo nguyên lý TDOA.” Nghiên cứu khoa học công nghệ hàm tương quan có dạng [2, 6, 9]: X N r ( m) n 1 S ( n) X S X i ( n) X i N ( X s ( n) X s ) n 1 N ( X i ( n) X i ) (6) n 1 đó: X s X i tương ứng giá trị trung bình phần tử vector tín hiệu mẫu X s tín hiệu X i thu cảm biến thứ i Khi đó, giá trị tương quan cực trị xác định theo biểu thức : rMAX arg max{r (m)} m (7) Giá trị rMAX thể mức độ tương quan tín hiệu mẫu tín hiệu thu được, đó, sử dụng rMAX để đánh giá tỉ lệ khả xảy kiện âm thông qua việc so sánh với giá trị ngưỡng rng Nếu rMAX rng đánh giá rằng, tín hiệu thu cảm biến có tồn thành phần tín hiệu truyền tới từ nguồn âm, qua đó, khẳng định vừa có kiện âm xảy ra, ngược lại rMAX rng kiện âm không tồn Giá trị ngưỡng rng [0,1] , việc chọn giá trị rng có vai trị quan trọng phụ thuộc vào môi trường khoảng cách định vị dạng tín hiệu cần định vị Để áp dụng lọc tương quan vào việc PHSKAT, mô hình bước thực xây dựng hình bao gồm bước cụ thể sau Hình Các bước phát kiện âm dùng lọc tương quan Bước 1, thiết lập cửa sổ tín hiệu thu từ cảm biến cho độ dài cửa sổ độ dài tín hiệu chuẩn Xsn Bước tính tốn giá trị tương quan tín hiệu thu tín hiệu mẫu theo cơng thức 7, sau tiến hành so sánh giá trị tương quan rMAX với giá trị ngưỡng rng Trong q trình tính tốn giá trị tương quan, có kiện âm tồn nhóm giá trị lớn mức ngưỡng, đó, bước cần thiết phải lọc kiện âm xác định liền kề để đồng thành kiện âm xác 2.4 Mơ đánh giá hiệu giải pháp Để đánh giá khả PHSKAT giải pháp nêu, chương trình mơ Monte-Carlo xây dựng Matlab có cấu trúc hình Hình Mơ phát kiện âm Tạp chí Nghiên cứu KH&CN quân sự, Số 80, - 2022 63 Kỹ thuật điều khiển & Điện tử Trong đó, tín hiệu âm chứa tiếng nổ đầu nòng súng AK47 nạp vào hệ thống, mức độ suy giảm tín hiệu tạp âm thiết lập Trên sở tín hiệu đó, thuật tốn PHSKAT theo biên độ lọc tương quan sử dụng để PHSKAT Kết tương ứng với mức SNR (Signal to Noise Ratio) khác đưa vào đánh giá xác suất PHSKAT xác định theo biểu thức: p A N (8) Trong đó: p xác suất phát kiện âm thanh; A kiện âm phát đúng; N số lượng kiện âm đưa vào mô Hình Xác suất phát kiện âm Kết mơ thể hình 5, nhận thấy, phương pháp PHSKAT theo biên độ, tỉ số SNR>3 dB, xác suất phát kiện âm p≈1 Tuy nhiên, SNR giảm, xác suất PHSKAT p giảm, SNR0.5 xác suất PHSKAT p≈1 xác suất giảm SNR-2 dB xác suất PHSKAT giải pháp p≈1, khả giải pháp suy yếu SNR