1. Tổng quan về mạng Nơ ron sâụ
3.4.9. Sắp xếp và huấn luyện Monophone
Tạo tập con dữ liệu cho huấn luyện monophone
Huấn luyện monophone là thành phần đầu tiền của quá trình huấn luyện, mô hình này chủ yếu sử dụng để làm mô hình khởi đầu cho huấn luyện các mô hình saụ
Chia dữ liệu thành hai phần, một phần để huấn luyện và một phần để test, sử dụng dòng lệnh sau:
cd VS/s5
local/data_split.sh --every_n $EVERY_N $DATA_ROOT $WORK/local "$LMs" "$TEST_SETS
Huấn luyện monophone
Mỗi kịch bản huấn luyện đưa ra một cấu trúc các đối số cơ bản tương tự với đối số tùy chọn trước. Một ngoại lệ là huấn luyện monophone đầu tiên, từ một mô hình chưa từng tồn tại, không có thư mục nguồn đặc biệt cho mô hình. Các đối só cần thiết là:
78 - Vị trí của dữ liệu âm thanh: data/train - Vị trí của bộ từ vựng: lang_prep/lang
- Thư mục nguồn cho mô hình: exp/x (x là mô hình huấn luyện cuối cùng) - Thư mục đích cho mô hình: exp/y (y là mô hình huấn luyện hiện tại đang thực
hiện)
Đối số --cmd “$train_cmd” được chỉ định để thực hiện xử lý huấn luyện, được thiết lập trong cmd.sh như đã nói đến ở phần trên. Đối số --nj nên bằng với số công việc đã được thiết lập chuẩn từ trước.
steps/train_monọsh --nj $njobs --cmd "$train_cmd" $WORK/train $WORK/lang $EXP/mono
Sắp xếp monophone
Thực hiện sắp xếp các tập tin âm thanh với các văn bản. Cũng giống như các kịch bản huấn luyện, các kịch bản sắp xếp cũng tuân theo cấu trúc đối số tương tự. Các đối số yêu cầu là:
- Vị trí dữ liệu ấm thanh: data/train - Vị trí của bộ từ vựng: lang_prep/lang
- Thư mục cho mô hình: exp/y (y là thư mục mô hình đang thực hiện) - Thư mục đích cho sự sắp xếp: exp/y_ali
steps/align_sịsh --nj $njobs --cmd "$train_cmd" \
$WORK/train $WORK/lang $EXP/mono $EXP/mono_ali || exit 1; Cấu trúc thư mục như sau:
VS lang_prep exp local lang train lang s5 train dict mono Mono_ali
79