Do âm thanh được phân làm 2 cụm là cụm nhạc và cụm hội thoại . Vì vậy em sử dụng 2 phương pháp để phân loại 1 âm thanh đầu vào mới. Hai phương pháp cụ thể như sau
6.1. Phương pháp sử dụng trọng tâm của từng cụm
Với các thuộc tính trích xuất được trong miền tần số của 2 cụm chúng ra sẽ tìm được trọng tâm của từng cụm. Trọng tâm của từng cụm được nhóm em tính tốn và lưu ra file tương ứng như hình sau:
Các thuộc tính trong miền tần số tương ứng với trọng tâm của 20 file âm nhạc
Bằng cách trích xuất các thuộc tính miền tần số của file âm thanh muốn phân loại rồi sử dụng cơng thức tính khoảng cách của file âm thanh muốn phân loại với trọng tâm của từng cụm sử dụng cơng thức tính khoảng cách L1-norm. Nếu khoảng cách nào nhỏ hơn thì chúng ta có thể kết luận file âm thanh đó có thể thuộc cụm âm thanh tương ứng. Hàm thực hiện cụ thể như sau:
6.2. Phương pháp tính khoảng cách
Phương pháp thứ 2 nhóm em sử dụng là tính khoảng cách từ file âm thanh muốn phân loại đến tất cả các file của từng cụm và cộng tổng các khoảng cách từ file âm thanh đến từng cụm. Sử dụng cơng thức tính khoảng cách L1-norm giữa các thuộc tính trích xuất được trong miền tần số, sau đó nếu khoảng cách đến cụm nào nhỏ hơn ta có thể kết luận file âm thanh muốn phân loại có thể thuộc cụm âm thanh tương ứng. Hàm thực hiện cụ thể như sau: