Giới thiệu tổng quan về âm thanh

Một phần của tài liệu Ứng dụng công nghệ nhận diện âm thanh vào nền tảng video trực tuyến (Trang 37 - 38)

- Chi phí rẻ

3.1.2. Giới thiệu tổng quan về âm thanh

Như vậy làm sao máy tính ta có thể nhận diện âm thanh được như não bộ? Đó là khi ta cần tìm hiểu việc lưu trữ dữ liệu âm thanh như thế nào trên máy tính.

Âm thanh là tín hiệu liên tục, là một dạng dữ liệu phi cấu trúc trong khi đó máy tính chỉ làm việc với các con số rời rạc. Hai đặc trưng cơ bản của âm thanh là độ lớn và tần số. Độ lớn biểu thị cho năng lượng của âm thanh phát ra còn tần số càng lớn thì cao độ càng cao hay tỉ lệ rung càng cao.

Có một điểm đặc biệt khi não bộ nhận diện âm thanh, đó là dù cho âm thanh đó có được sử dụng bằng nhạc cụ khác như guitar hay piano thì ta vẫn nhận diện được bài hát đấy. Mỗi một nhạc cụ có sự kết hợp riêng biệt và sự biến tấu của những âm bội này tạo ra những âm thanh riêng biệt. Vậy nên chúng ta có thể dễ dàng phân biệt bài hát được thực hiện bởi piano hay guitar

Để ghi lại tín hiệu âm thanh thì khơng thể lưu hết các tần số theo trục thời gian mà thay vào đó trong khoảng thời gian t người ta sẽ ghi lại tín hiệu âm thanh một lần. Kỹ thuật đó gọi là lấy mẫu âm thanh - sampling of audio data và tần số thực hiện lấy mẫu gọi là sample rate.

Tuy nhiên việc biểu diễn âm thanh theo miền thời gian rất khó trích xuất các thơng tin đặc trưng cho âm thanh đó. Vậy nên cần biểu diễn theo miền tần số để biết trong khoảng thời gian có những tần số nào và giao động như thế nào. Và để làm được điều đó người ta sử dụng Fourier Transform (biến đổi Fourier). Để đẩy nhanh tốc độ tính tốn người ta cũng hay sử dụng FFT (Fast Fourier Transform).

Kết quả ta thu được 1 phổ năng lượng âm thanh với trục y là tần số, dài màu là mức năng lượng cho tần số đó. Hay cịn gọi là spectrogram.

Một phần của tài liệu Ứng dụng công nghệ nhận diện âm thanh vào nền tảng video trực tuyến (Trang 37 - 38)

Tải bản đầy đủ (PDF)

(90 trang)