Hình 3 .15 Cấu trúc cụm trung tâm
3.5 Kết luận chương 3
Trong các hệ thống định vị nguồn âm thanh theo nguyên lý TDOA, vận tốc âm thanh là tham số quan trọng, ảnh hưởng đáng kể đến độ chính xác định vị, cần được xem xét, đánh giá tùy theo môi trường thực tế. Giải pháp định vị nguồn âm khi xem vận tốc âm thanh là một biến số cho phép cải thiện đáng kể độ chính xác định vị. Tuy nhiên, việc giải hệ phương trình phi tuyến 4 ẩn số cũng là một cơng việc khó khăn. Giải pháp chia nhỏ khơng gian định vị để tìm vị trí nguồn âm mà luận án sử dụng có tính phức tạp cao, địi hỏi số lượng phép tính lớn. Vì vậy việc xây dựng các thuật tốn cải thiện tốc độ tính tốn định vị là một trong những hướng nghiên cứu tiếp theo cần thực hiện.
Trong chương 3, luận án đã đề xuất một mơ hình hệ thống định vị nguồn âm có khả năng áp dụng trong điều kiện thực tế, dựa trên các nghiên cứu nhằm nâng cao chất lượng định vị nguồn âm đã được trình bày trong luận án. Đồng thời đã đưa ra các đề xuất và khuyến nghị, những điểm cần chú ý khi xây dựng hệ thống định vị nguồn âm trên thực tế theo mơ hình được đề xuất.
Những nội dung nghiên cứu trong chương 3, được cơng bố trong các cơng trình [CT1], [CT2] và một phần cơng trình [CT3].
KẾT LUẬN 1. Các kết quả nghiên cứu của luận án
Với mục tiêu, đối tượng, phạm vi và nội dung nghiên cứu đã được đặt ra và giải quyết trong luận án, có thể rút ra một số nhận xét sau:
•Kỹ thuật định vị nguồn âm thanh có khả năng ứng dụng cho nhiều mục đích đa dạng, trong đó kỹ thuật sử dụng nguyên lý TDOA sử dụng rộng rãi cho các ứng dụng phục vụ mục đích quân sự. Đặc biệt với các mục đích như định vị tiếng nổ, hỏa lực với mơi trường định vị ngồi trời, cự ly định vị xa, địi hỏi phải có những nghiên cứu nhằm nâng cao chất lượng định vị.
•Trên cơ sở xây dựng mơ hình hệ thống định vị nguồn âm với âm thanh cần định vị biết trước, việc phát hiện sự kiện âm thanh là yêu cầu tất yếu, đóng vai trò quan trọng tới việc giảm sai số định vị. Thuật toán sử dụng tương quan cực trị kết hợp cùng bộ tiền xử lý phân tích tín hiệu thành phần độc lập cho phép nâng cao chất lượng phát hiện sự kiện âm thanh trong điều kiện SNR thấp.
•Thuật tốn GCC-PHAT-β-TN với hệ số β thích nghi theo hệ số tương quan giữa tín hiệu thu được và tín hiệu mẫu cho phép nâng cao độ chính xác ước tính trễ thời gian tới, qua đó nâng cao chất lượng định vị nguồn âm thanh theo nguyên lý TDOA.
•Vận tốc âm thanh là một trong những yếu tố quyết định ảnh hưởng tới độ chính xác định vị nguồn âm. Việc tính tốn vị trí nguồn âm trong đó coi vận tốc âm thanh là biến số sử dụng thuật tốn chia nhỏ khơng gian định vị giúp nâng cao độ chính xác định vị nguồn âm.
•Bằng mơ phỏng thống kê trên máy tính và thử nghiệm trên dữ liệu thu được trong môi trường thực tế, luận án đã đánh giá tính hiệu quả của các kết quả
nghiên cứu, từ đó đề xuất mơ hình hệ thống định vị nguồn âm với âm thanh cần định vị đã biết. Các kết quả nghiên cứu của luận án có tính mới, tính khoa học, đóng góp thêm cơ sở cho việc tính tốn, thiết kế hệ thống định vị nguồn âm.
2. Những đóng góp mới của luận án
1. Đề xuất giải pháp kết hợp kỹ thuật phân tích thành phần độc lập và bộ lọc tương quan để nâng cao xác suất phát hiện sự kiện âm thanh, và áp dụng thuật toán biến đổi pha tương quan chéo tổng quát với hệ số loại bỏ thành phần biên độ thích nghi (GCC-PHAT-β) nhằm nâng cao độ chính xác ước lượng giá trị khác biệt thời gian đến của tín hiệu.
2. Đề xuất giải pháp chia nhỏ không gian định vị để nâng cao độ chính xác định vị nguồn âm thanh có vận tốc biến đổi trong môi trường truyền.
3.Hướng nghiên cứu tiếp theo
•Hồn thiện các giải pháp và thuật tốn mà luận án đã xây dựng, thử nghiệm với các điều kiện thực tế. Từ đó, xây dựng giải pháp định vị cụ thể có tính thống nhất và khả năng ứng dụng cao.
•Nghiên cứu nâng cao tốc độ xử lý của giải pháp chia nhỏ khơng gian định vị, hồn thiện khả năng áp dụng thực tế của giải pháp.
DANH MỤC CÁC CƠNG TRÌNH KHOA HỌC ĐÃ CƠNG BỐ
[CT1] Thin Cong Tran, My Ngoc Bui, Hoang Huy Nguyen , ”A Modified Lo- calization Technique for Pinpointing a Gunshot Event Using Acoustic Sig- nals”, Hội thảo Industrial Networks and Intelligent Systems 6th EAI Inter-
national Conference, INISCOM 20200.
[CT2] Trần Cơng Thìn, Bùi Ngọc Mỹ, Nguyễn Huy Hồng, Phạm Văn Hịa, ”Xây dựng giải pháp định vị nguồn âm theo nguyên lý TDOA trong điều kiện vận tốc âm thanh biến đổi”, Tạp chí Nghiên cứu KH&CN Quân sự, Số Đặc san hội thảo Quốc gia FEE, 10-2020.
[CT3] Trần Cơng Thìn, Nguyễn Huy Hoàng, Bùi Ngọc Mỹ, ”Giải pháp đo
lường âm thanh để xác định tọa độ FlyCam bằng phương pháp sử dụng hai hệ đo”, Hội thảo Hội nghị Khoa học kỹ thuật Đo lường tồn quốc lần
thứ 7, 2020.
[CT4] Trần Cơng Thìn, Bùi Ngọc Mỹ, Nguyễn Huy Hoàng, Phạm Văn Hòa ”Nâng cao chất lượng ước lượng trễ thời gian tới trong bài toán định vị nguồn âm theo nguyên lý TDOA”, Tạp chí Nghiên cứu KH&CN Quân sự,
Số Đặc san HNKH dành cho NCS và CBNC trẻ, 11-2021.
[CT5] Trần Cơng Thìn, Nguyễn Trung Kiên, Bùi Ngọc Mỹ, Nguyễn Huy
Hoàng ”Nâng cao chất lượng phát hiện sự kiện âm thanh trong bài toán định vị nguồn âm theo nguyên lý TDOA”, Tạp chí Nghiên cứu KH&CN
TÀI LIỆU THAM KHẢO Tiếng Việt:
[1] Phạm Văn Hòa và cộng sự, “Xây dựng hệ thống phát hiện và định vị hỏa lực bắn tỉa dựa theo ngun lý TDOA sóng âm”, Tạp chí Nghiên cứu KHCN Quân
sự, 10, tr. 88–95, 2015.
[2] Lê Bá Long, Sách hướng dẫn học tập Xác suất thống kê, Học viện Cơng nghệ Bưu chính viễn thơng, 2006.
[3] Tống Đình Quỳ, Giáo trình xác suất thống kê, NXB Đại học Quốc gia Hà Nội, 2003.
Tiếng Anh:
[4] J. Abel and J. Smith, “The spherical interpolation method for closed- form passive source localization using range difference measurements”, in: ICASSP IEEE International Conference on
Acoustics, Speech, and Signal Processing, Institute of Electrical and
Electronics Engineers, 1987.
[5] Aghil Abiri and Ali Parsayan, “The Bullet Shockwave-Based Real- Time Sniper Sound Source Localization”, IEEE Sensors Journal, 20 (13), pp. 7253–7264, 2020.
[6] S. Adavanne et al., “Sound Event Detection in Multichannel Audio Us- ing Spatial and Harmonic Features”, CoRR, abs/1706.02293, 2017.
[7] S. Adrián-Martínez et al., “Acoustic Signal Detection Through the Cross- Correlation Method in Experiments with Different Signal to Noise Ra- tio and Reverberation Conditions”, in: Ad-hoc Networks and
Wireless, Berlin, Heidelberg: Springer Berlin Heidelberg, 2015, pp. 66–
[8] S. Argentieri and Patrick Danes, “Broadband variations of the MUSIC high- resolution method for Sound Source Localization in Robotics”, in: 2007 IEEE/RSJ International Conference on Intelligent Robots and Systems, IEEE,
Oct. 2007.
[9] K. Attenborough, K.M. Li, and K. Horoshenkov, Predicting Outdoor Sound, Taylor & Francis, 2006, ISBN: 9780203088739.
[10] S. Bjorklund and Lennart Ljung, “A review of time-delay estimation techniques”, in: 42nd IEEE International Conference on Decision
and Control (IEEE Cat. No.03CH37475), IEEE.
[11] S. Bjorklund and To Ulrica, “A Survey and Comparison of Time- Delay Estimation Methods in Linear Systems”, in: 1061, Division of
Auto- matic Control, Department of Electrical Engineering, Linkoăpings Uni- versitet, 2003, pp. 15–27.
[12] D. Blatt and A.O. Hero, “Energy-based sensor network source local- ization via projection onto convex sets”, IEEE Transactions on Signal
Processing, 54 (9), pp. 3614–3619, 2006.
[13] Antonio Canclini et al., “Acoustic source localization with distributed asynchronous microphone networks”, IEEE Transactions on Acoustics, Speech, and Signal Processing, 21 (2), pp. 439–443, 2012.
[14] C. Carlemalm et al., “Algorithms for time delay estimation using a low complexity exhaustive search”, IEEE Transactions on Automatic
Con- trol, 44, 1999.
[15] G Clifford Carter, “Coherence and time delay estimation”,
Proceedings of the IEEE, 75 (2), pp. 236–255, 1987.
[16] G.C. Carter, A.H. Nuttall, and P.G. Cable, “The smoothed coherence transform”, Proceedings of the IEEE, 61 (10), pp. 1497–1498, 1973.
[17] Xianyu Chang et al., “A Surveillance System for Drone Localization and Tracking Using Acoustic Arrays”, in: 2018 IEEE 10th Sensor Ar-
ray and Multichannel Signal Processing Workshop (SAM), IEEE, July
2018.
[18] G. Chen and Yang Xu, “A Sound Source Localization Device Based on Rectangular Pyramid Structure for Mobile Robot”, Journal of Sensors, 2019, pp. 1–13, 2019.
[19] Maximo Cobos, Amparo Marti, and Jose J. Lopez, “A Modified SRP- PHAT Functional for Robust Real-Time Sound Source Localization With Scalable Spatial Sampling”, IEEE Signal Processing Letters, 18 (1), pp. 71–74, 2011.
[20] Maximo Cobos et al., “Cumulative-Sum-Based Localization of Sound Events in Low-Cost Wireless Acoustic Sensor Networks”,
IEEE/ACM Transactions on Audio, Speech, and Language Processing, 22 (12), pp. 1792–1802, 2014.
[21] Maximo Cobos et al., “A Survey of Sound Source Localization Meth- ods in Wireless Acoustic Sensor Networks”, Wireless Communications and Mobile Computing, 2017, pp. 1–24, 2017.
[22] Marco Crocco et al., “Audio Surveillance”, ACM Computing Surveys
(CSUR), 48, pp. 1 –46, 2016.
[23] Hoang Do and Harvey F. Silverman, “A Fast Microphone Array SRP- PHAT Source Location Implementation using Coarse-To-Fine Region Contraction(CFRC)”, in: 2007 IEEE Workshop on Applications of Sig- nal Processing to Audio and Acoustics, IEEE, Oct. 2007.
[24] Kevin D. Donohue, Alvin Agrinsoni, and Jens Hannemann, “Audio signal delay estimation using partial whitening”, in: Proceedings
[25] Christine Evers et al., “The LOCATA Challenge: Acoustic Source Lo- calization and Tracking”, IEEE/ACM Transactions on Audio, Speech,
and Language Processing, 28, pp. 1620–1643, 2020.
[26] Wieslaw Fiebig, “Use of Acoustic Camera for Noise Sources Localiza- tion and Noise Reduction in the Industrial Plant”, Archives
of Acous- tics, 45, pp. 111–117, 2020.
[27] M.D. Gillette and H.F. Silverman, “A Linear Closed-Form Algorithm for Source Localization From Time-Differences of Arrival”, IEEE Sig- nal Processing Letters, 15, pp. 1–4, 2008.
[28] Ludwig Houegnigan et al., “Neural Networks for High Performance Time-Delay Estimation and Acoustic Source Localization”, in: Com-
puter Science & Information Technology (CS & IT), Academy & In-
dustry Research Collaboration Center (AIRCC), Jan. 2017.
[29] Yiteng Huang, Jacob Benesty, and Jingdong Chen, “Time Delay Es- timation and Source Localization”, in: Springer Handbook of Speech
Processing, Springer Berlin Heidelberg, 2008, pp. 1043–1063.
[30] Makkay Imre, Electro-acoustic procedures for aircraft detection, vol.
26, 2, pp. 351–359, 2014.
[31] Mats Isaksson, A Comparison of Some Approaches to Time-Delay Es-
timation, 1997.
[32] Hong-Goo Kang, Michael Graczyk, and Jan Skoglund, “On pre- filtering strategies for the GCC-PHAT algorithm”, in: 2016 IEEE
International Workshop on Acoustic Signal Enhancement (IWAENC),
IEEE, Sept. 2016.
[33] Steven M. Kay, Fundamentals of Statistical Signal Processing: Esti-
[34] Volodymyr KHARCHENKO and Maryna MUKHINA, “Model of geo- physical fields representation in problems of complex correlation- extreme navigation”, Transport Problems, 10 (3), pp. 35–41, 2017. [35] C. Knapp and G. Carter, “The generalized correlation method for es-
timation of time delay”, IEEE Transactions on Acoustics, Speech, and
Signal Processing, 24 (4), pp. 320–327, 1976.
[36] Ran Lee et al., “Sound source localization based on GCC-PHAT with diffuseness mask in noisy and reverberant environments”, IEEE Ac-
cess, 8, pp. 7373–7382, 2020.
[37] D. Li and Yu Hen Hu, “Least square solutions of energy based acoustic source localization problems”, 2004.
[38] YunPeng Li, “Second-Order Approximation of Minimum Discrimina- tion Information in Independent Component Analysis”, IEEE Signal
Processing Letters, 29, pp. 334–338, 2022.
[39] Wageesha Manamperi et al., “Drone Audition: Sound Source Localiza- tion Using On-Board Microphones”, IEEE/ACM
Transactions on Au- dio, Speech, and Language Processing, 30, pp.
508–519, 2022.
[40] Barry McGuinness, “Signal Detection Theory and the Assessment of Situation Awareness”, in: Decision Making in Complex Environments, CRC Press, Sept. 2017, pp. 299–308.
[41] A. Mesaros et al., “Acoustic event detection in real life recordings”,
2010 18th European Signal Processing Conference, pp. 1267–1271,
2010.
[42] Ali Mohammad-Djafari, “Non Gaussianity and Non Stationarity mod- eled through Hidden Variables and their use in ICA and Blind Source Separation”, arXiv: Data Analysis, Statistics and Probability, 2007.
[43] M. P. Mukhina and I. V. Seden, “Analysis of modern correlation ex- treme navigation systems”, Electronics and Control Systems, 1 (39), 2014.
[44] Francesco Nesta and Maurizio Omologo, “Generalized State Coher- ence Transform for Multidimensional TDOA Estimation of Multiple Sources”, IEEE Transactions on Audio, Speech, and Language Pro-
cessing, 20 (1), pp. 246–260, 2012.
[45] Giambattista Parascandolo, Heikki Huttunen, and Tuomas Virtanen, “Recurrent Neural Networks for Polyphonic Sound Event Detection in Real Life Recordings”, CoRR, abs/1604.00861, 2016.
[46] Rasmikanta Pati et al., “Independent component analysis: A review with emphasis on commonly used algorithms and contrast function”,
Computación y Sistemas, 25 (1), pp. 97–115, 2021.
[47] Despoina Pavlidi et al., “Real-Time Multiple Sound Source Localiza- tion and Counting Using a Circular Microphone Array”, IEEE Transac- tions on Audio, Speech, and Language Processing, 21 (10),
pp. 2193– 2206, 2013.
[48] Huy Phan et al., “Robust Audio Event Recognition with 1-Max Pooling Convolutional Neural Networks”, CoRR, abs/1604.06338, 2016.
[49] Lord Rayleigh, “On Our Perception of the Direction of a Source of Sound”, Proceedings of the Musical Association, 2, pp. 75–84, 1875. [50] Lord Rayleigh, “XII. On our perception of sound direction”, The
Lon- don, Edinburgh, and Dublin Philosophical Magazine and Journal of Science, 13 (74), pp. 214–232, 1907.
[51] Richard Newton Scarth, Echoes from the sky, 2nd ed., Independent Books, Bromley, England, 2017.
[52] Jan Scheuing and Bin Yang, “Disambiguation of TDOA estimation for multiple sources in reverberant environments”, IEEE transactions on
audio, speech, and language processing, 16 (8), pp. 1479–1489,
2008.
[53] Alexander Sedunov et al., “Stevens drone detection acoustic system and experiments in acoustics UAV tracking”, in: 2019 IEEE
International Symposium on Technologies for Homeland Security (HST), IEEE, Nov. 2019.
[54] Felipe Gonc¸alves Serrenho et al., “Gunshot Airborne Surveillance with Rotary Wing UAV-Embedded Microphone Array”, Sensors, 19 (19), ISSN: 1424-8220, 2019.
[55] Samir Shaltaf, “Neural-network-based time-delay estimation”,
EURASIP Journal on Applied Signal Processing, 2004, pp. 378–385,
2004.
[56] J. Smith and J. Abel, “Closed-form least-squares source location esti- mation from range-difference measurements”, IEEE Transactions on
Acoustics, Speech, and Signal Processing, 35 (12), pp. 1661–1669,
1987.
[57] Daniel W. Stroock, Probability Theory: An Analytic View, Cambridge University Press, pp. 59–114, 2010.
[58] CEA Systems, Acoustic Camera Bionic XS-56 Array, Technical
Datasheet from CEA Systems, 2020.
[59] Silvanus P. Thompson, “L. Phenomena of binaural audition—Part II”,
The London, Edinburgh, and Dublin Philosophical Magazine and Jour- nal of Science, 6 (38), pp. 383–391, 1878.
[60] Jelmer Tiete et al., “SoundCompass: A Distributed MEMS Microphone Array-Based Sensor for Sound Source Localization”,
[61] G. T. Wang et al., “Algorithm Used to Detect Weak Signals Covered by Noise in PIND”, International Journal of Aerospace Engineering, 2019, pp. 1–10, 2019.
[62] William A. Yost, “History of sound source localization: 1850-1950”, 2017.
[63] F.-G. Zeng et al., “Speech recognition with amplitude and frequency modulations”, Proceedings of the National Academy of Sciences, 102 (7), pp. 2293–2298, 2005.
[64] Haomin Zhang, Ian McLoughlin, and Yan Song, “Robust sound event recognition using convolutional neural networks”, in: 2015 IEEE In-
ternational Conference on Acoustics, Speech and Signal Processing (ICASSP), 2015, pp. 559–563.
[65] Zilong Zhou et al., “Constrained total least squares method using TDOA measurements for jointly estimating acoustic emission source and wave velocity”, Measurement, 182, p. 109758, ISSN: 0263-2241, 2021.