Hình 3 .15 Cấu trúc cụm trung tâm
2.1 Đề xuất giải pháp phát hiện sự kiện âm thanh
2.1.1 Một số giải pháp phát hiện sự kiện âm thanh
Có nhiều giải pháp khác nhau để phát hiện sự kiện âm thanh đã được giới thiệu trong chương 1 của luận văn, để áp dụng các kỹ thuật đó vào bài tốn định vị nguồn âm địi hỏi các giải pháp phải có thời gian đáp ứng nhanh và đảm bảo được độ chính xác.
2.1.1.1. Phát hiện sự kiện âm thanh theo biên độ
Phương thức đơn giản để phát hiện một sự kiện âm thanh là dựa vào biên độ của tín hiệu, trong đó bổ đề Neyman-Pearson về xác suất phát hiện tín hiệu
Trong đó:
L(z) = p (z | Hp1)p (z | Hp0) > γ (2.1)
L(z) là tỉ lệ khả năng xảy ra sự kiện âm
thanh; Hp0 là giả thuyết khơng có sự kiện âm thanh; Hp1 là giả thuyết có sự kiện âm thanh;
γ là ngưỡng phát hiện.
Hình 2.1. Phát hiện tiếng nổ đầu nòng của súng AK47 theo biên độ Theo cơng thức (2.1), để một tín hiệu được xác định là tồn tại sự kiện
âm thanh thì tỉ lệ xảy ra sự kiện L(z) phải lớn hơn ngưỡng phát hiện γ,
trong đó Hp0 và Hp1 lần lượt là giả thuyết về tạp âm và sự kiện âm thanh. Hình 2.1 minh họa một sự kiện âm thanh là tiếng nổ đầu nòng của súng AK47, tín hiệu này là một sự kiện âm thanh điển hình với các thơng số đặc trưng chính bao gồm : biên độ, thời gian tồn tại, tần số. Tín hiệu này có thể được phân tách khỏi tạp âm nền bởi ngưỡng dương và ngưỡng âm.
Hình 2.2. Các bước phát hiện sự kiện âm thanh theo biên độ
Thuật toán phát hiện sự kiện dựa trên (2.1) được thể hiện trong hình 2.2. Tồn bộ q trình bao gồm năm giai đoạn, cụ thể như sau: Bước đầu tiên ước tính nền nhiễu của tín hiệu âm thanh đầu vào để cung cấp cho bước thứ hai là tính tốn ngưỡng âm và dương. Các ngưỡng phát hiện này là không cố định mà thay đổi theo cường độ tạp âm. Bước thứ ba so sánh các mẫu tín hiệu với các ngưỡng. Các mẫu trên ngưỡng dương hoặc dưới ngưỡng âm được coi là thành phần của một tín hiệu chứa sự kiện âm thanh. Bằng cách nhóm liên tục các tín
hiệu này theo một cửa sổ trượt có thể thu được tín hiệu của sự kiện âm thanh hồn chỉnh. Tuy nhiên, có khả năng các sự kiện âm thanh thu được không phải là sự kiện âm thanh cần phát hiện, do đó bước cuối cùng lọc sự kiện âm thanh là cần thiết để loại bỏ các sự kiện sai. Một sự kiện tiếng nổ đầu nòng thực sự phải tuân theo điều kiện sau:
(A ≥ Am) ∩ (T ≥ Tm) (2.2)
Trong đó A và T lần lượt là biên độ và thời gian trung bình của sự kiện,
Am và Tm là giá trị nhỏ nhất của chúng.
2.1.1.2. Phát hiện sự kiện âm thanh sử dụng bộ lọc tương quan
Hệ số tương quan, ký hiệu là rXY được sử dụng để đo lường mức độ phụ thuộc tuyến tính của hai biến ngẫu nhiên X và Y tính theo cơng thức [2] [3]:
rXY Trong đó: cov(X, Y ) = δX .δY = E((X − EX).(Y − EY )) δX . δY (2.3)
cov(X, Y ) = E((X − EX).(Y − EY )) là hiệp phương sai của X và Y; δX và δY lần lượt là độ lệch chuẩn của hai biến X, Y.
Biểu thức (2.3) được gọi là hệ số tương quan Pearson, hệ số này thể hiện mức độ phụ thuộc tuyến tính của hai biến ngẫu nhiên X và Y , trong đó |rXY |
∈ [0, 1]. Khi |rXY | càng gần 1 thì tính chất phụ thuộc tuyến tính giữa hai
biến X và Y càng chặt, khi |rXY | càng gần 0 thì sự phụ thuộc tuyến tính này càng lỏng lẻo, nếu|rXY | = 0 thì X và Y không tương quan. Việc xác định giá trị lớn nhất trong các giá trị tương quan |rXY | tìm được sẽ cho biết hai biến ngẫu nhiên X và Y có mức độ phụ thuộc tuyến tính nhất gọi là phương pháp tương quan cực trị [34] [43].
biến Xi(n) sử dụng hàm tương quan có dạng:
ΣN . Σ . Σ
(Xs(n) −
. (Xi(n) − Xi) m r(m) = n=1 Σ N n= XS(n) − XS 2 . Xi(n) − Xi ΣN 2 (2.4)
trong đó: Xs và Xi tương ứng là giá trị trung bình các phần tử của vector tín hiệu mẫu Xs và tín hiệu Xi thu được ở cảm biến thứ i.
Khi đó, giá trị tương quan cực trị được xác định theo biểu thức (2.5)
rMAX = arg max {r(m)} (2.5) Giá trị rMAX thể hiện mức độ tương quan giữa tín hiệu mẫu và tín
hiệu thu được, do đó có thể sử dụng rMAX để đáng giá khả năng xảy ra sự kiện âm thanh thông qua so sánh rMAX với một giá trị ngưỡng rng.
Nếu rMAX (m) ≥ rng có thể đánh giá rằng tín hiệu thu được trên cảm biến có tồn tại thành phần tín hiệu truyền tới từ nguồn âm, qua đó khẳng định vừa có sự kiện âm thanh xảy ra, ngược lại nếu rMAX (m) <
rng thì sự kiện âm thanh khơng tồn tại. Trong đó rng ∈ [0, 1], việc
chọn giá trị rng có vai trị quan trọng phụ thuộc vào môi trường và khoảng cách định vị cũng như dạng tín hiệu cần định vị.
Để áp dụng bộ lọc tương quan vào việc phát hiện sự kiện âm thanh, các bước thực hiện được thể hiện như lưu đồ thuật tốn hình 2.3.
Trước hết các dữ liệu đầu vào như độ dài cửa sổ tín hiệu N , ngưỡng
phát hiện rng được thiết lập, tiếp theo đó tín hiệu chuẩn Xs cũng được nạp vào hệ thống với độ dài cửa sổ tín hiệu giống như giá trị N đã thiết lập trước đó. Tín hiệu thu được trên các cảm biến được thu thập và phân chia thành các cửa sổ có độ dài bằng đúng độ dài của tín hiệu chuẩn Xs(n).
Bước tiếp theo tính tốn giá trị tương quan của tín hiệu thu được và tín hiệu mẫu theo cơng thức (2.4) sau đó tìm giá trị tương quan lớn nhất theo công thức (2.5). Giá trị rMAX được so sánh với ngưỡng rng, qua đó xác định
có sự
n=
kiện âm thanh xảy ra hay khơng. Nếu khơng có sự kiện âm thanh xảy ra, cửa sổ tín hiệu sẽ được trượt dọc theo trục thời gian với khoảng cách bằng 10% chiều
n=n+N/10
Hình 2.3. Lưu đồ thuật tốn phát hiện SKAT dùng lọc tương quan
BẮT ĐẦU
Nhập dữ liệu đầu vào
Đọc tín hiệu chuẩn XS, xác định chiều dài cửa sổ N
rMAX rng Đ S Dừng thu Đ KẾT THÚC
Thiết lập cửa sổ có sự kiện âm thanh n=N+N Xác định giá trị tương quan cực đại: rMAX arg max{r(m)} m n 1 n 1 i2 ( X (n) X ) 2 s i ( X (n) X ) N N s r(m) n1 Xi S i S X (n) X X (n) Tính giá trị tương quan: N
Đọc tín hiệu Xi (n) thu được trên
cảm biến; Độ dài tín hiệu n
dài của tín hiệu mẫu, điều này nhằm đảm bảo khơng có sự kiện âm thanh nào bị bỏ sót do của sổ tín hiệu cắt ngang sự kiện âm thanh. Mặt khác nếu tồn tại sự kiện âm thanh, tồn bộ độ dài của tín hiệu đã xét được bỏ qua, cửa sổ tín hiệu mới được thiết lập khơng trùng lặp với tín hiệu trước đó. Q trình này được lặp đi lặp lại cho tới khi có lệnh dừng q trình thu và xử lý tín hiệu.