Mô hình hệ thống cơ sở dữ liệu âm thanh

Một phần của tài liệu kỹ thuật tìm kiếm âm thanh theo nội dung (Trang 50 - 52)

d, K-means đầy đủ

2.2.2.Mô hình hệ thống cơ sở dữ liệu âm thanh

Hệ thống cơ sở dự liệu âm thanh đƣợc mô tả nhƣ hình dƣới đây:

Hệ thống bao gồm 2 pha làm việc: Xây dựng cơ sở dự liệu, khai thác (tìm kiếm) âm thanh.

Trong pha xây dựng cơ sở dữ liệu, đầu vào là các tệp âm thanh. Chúng đƣợc trích trọn các đặc trƣng nhƣ: MFCC, năng lƣợng trung bình, khoảng nặng... Các tệp âm thanh và đặc trùn đƣợc lƣu trữ đồng thời trong cơ sở dữ liệu. [2]

Hình 2.21: Mô hình hệ thống CSDL âm thanh

Các đặc trƣng thông thƣờng đƣợc lƣu trữ theo một cấu trúc dữ liệu dạng cây nào đó (ví dụ: B+, cây R, ....). Trong các hệ thống thực nghiệm đơn

CSDL âm thanh CSDL đặc trưng Trích chọn đặc trưng Trích chọn các đặc trưng Các đặc trưng đã được trích chọn Truy vấn Kết quả Đo mức độ tương tự Dữ liệu âm thanh

Xây dựng CSDL âm thanh (offline)

Âm thanh truy vấn

Số hóa bởi Trung tâm Học liệu 50 http://www.lrc-tnu.edu.vn/

giản, các tệp âm thanh và đặc trƣng của chúng đƣợc lƣu trữ trong tệp hệ thống của hệ điều hành.

Pha tìm kiếm tệp âm thanh đƣợc thực hiện online. Tệp âm thanh mẫu để tìm kiếm (tệp âm thanh truy vấn) đƣợc trích trọn đặc trƣng. Các đặc trƣng này đƣợc đối sánh với các đặc trƣng có sẵn trong cơ sở dữ liệu. Những tệp âm thanh nào trong cơ sở dữ liệu có đặc trƣng tƣợng tự với đặc trƣng của tệp âm thanh trong câu truy vấn sẽ là kết quả.

Hệ thống sử dụng độ đo Minkopsky (Euclidean, Mahattan) trong đối sánh tƣơng tự giữa các đặc trƣng.

Luận văn này sử dụng mô hình trong hình 2.21 trên đây để xây dựng chƣơng trình thử nghiệm. Việc phát triển đƣợc mô tả đầy đủ trong chƣơng 3.

Số hóa bởi Trung tâm Học liệu 51 http://www.lrc-tnu.edu.vn/

Một phần của tài liệu kỹ thuật tìm kiếm âm thanh theo nội dung (Trang 50 - 52)