2.
2.4 Các nghiên cứu có liên quan
Nhận diện âm thanh đƣợc ứng dụng rất nhiều trong thực tế. Các cách phân loại truyền thống là Gaussian Mixture Models (GMM), Support Vector Machine (SVM) và Hidden Markov Models (HMM) đƣợc sử dụng nhiều trƣớc đây trong việc nhận diện âm thanh.
CHƢƠNG 2: CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU CÓ LIÊN QUAN
Những đặc trƣng đƣợc trích xuất nhƣ MFCC (Mel Frequency Cepstral Coefficient) hay GFCC (Gammatone Frequency Cepstral Coefficients) cần phải đƣợc xử lý trƣớc. Nhƣng những cách tiếp cận trên thƣờng không xử lý tốt khi dữ liệu âm thanh đƣợc thu âm thông qua nhiều thiết bị và môi trƣờng khác nhau, hoặc không cùng điều kiện thu âm. Ngƣợc lại giải thuật Học Máy (Machine Learning) thƣờng cho ra kết quả và độ chính xác cao hơn. Restricted Boltzmann Machine (RBM), Long-Short-Term Memory (LSTM) và Convolutional neural Network (CNN) là một trong những phƣơng pháp tiếp cận học máy đối với việc nhận diện.
Các nghiên cứu về nhận diện âm thanh ở Việt Nam:
Nhận dạng phƣơng ngữ Tiếng Việt sử dụng mạng nơ ron tích chập CNN (Nguyễn Hồng Quang, Trịnh Văn Loan, Phạm Ngọc Hƣng, Viện Công Nghệ Thông Tin và Truyền Thông, Trƣờng Đại học Sƣ Phạm Kỹ Thuật Hƣng Yên - 2017) [4].
- Nội dung nghiên cứu:
Nhận dạng tự động phƣơng ngữ (Automatic Dialect Identification, viết tắt là ADI) Tiếng Việt trên mơ hình CNN. Sự khác biệt giữa các phƣơng ngữ biểu hiện ở nhiều yếu tố nhƣ ngữ âm, từ vựng, ngữ pháp. Trong nghiên cứu này khai thác sự khác biệt về ngữ âm để nhận dạng phƣơng ngữ Tiếng Việt.
Xây dựng hệ thống tìm kiếm âm thanh theo nội dung dựa trên đặc trƣng âm thanh miền tần số - Phú Thị Quyên (Luận văn Thạc sĩ – Trƣờng Đại học dân lập Hải Phòng – 2016 ) [5].
- Nội dung nghiên cứu:
Xây dựng hệ thống thử nghiệm tìm kiếm âm thanh dựa trên trích xuất đặc trƣng âm thanh, bao gồm các đặc trƣng trong miền thời gian biên độ, trong miền biến đổi và trong miền ảnh phổ. Các thuộc tính và đặc trƣng chính của cơ sở dữ liệu
CHƢƠNG 2: CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU CÓ LIÊN QUAN
đa phƣơng tiện, phân lớp âm thanh phục vụ tìm kiếm dữ liệu âm thanh trong cơ sở dữ liệu âm thanh.
Những nghiên cứu về nhận diện âm thanh ở Nƣớc Ngoài: -