Mô hình mạng nơron tích chập phân tách giọng hát từ hỗn hợp âm nhạc

8 8 0
Mô hình mạng nơron tích chập phân tách giọng hát từ hỗn hợp âm nhạc

Đang tải... (xem toàn văn)

Thông tin tài liệu

Bài viết đề xuất một mô hình phân tách giọng hát từ nguồn hỗn hợp âm nhạc bằng mạng nơron tích chập - CNN (Convolutional Neural Network). Phép biến đổi Fourier thời gian ngắn - STFT (Short time Fourier Transform) được áp dụng để trích các đặc trưng cơ bản của tín hiệu giọng hát. Bộ dữ liệu DSD100 (Demixing Secrets Dataset 100) gồm các hỗn hợp âm nhạc của giọng hát và nhạc đệm từ các nhạc cụ như trống, bass, .v.v. được sử dụng để đánh giá hiệu suất của mô hình mạng CNN.

Ngày đăng: 12/11/2021, 15:34

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan