1. Tổng quan về mạng Nơ ron sâụ
3.4.10. Sắp xếp và huấn luyện Triphone (Tri1)
Huấn luyện triphone dựa trên dealtạ
Huấn luyện các mô hình triphone bao gồm các đối số bổ sung số lượng lá hoặc số trạng thái HMM cho cây quyết định và số Gauss. Trong lệnh này, đối số $pdf và $gauss tương ứng là 1200 và 19200 được thiết lập trong tập tin env_voip_cs.sh, nghĩa là có 1200 trạng thái HMM và 19200 Gaussians. Con số chính xác của lá và Gausian trong cây quyết định được quyết định dựa trên Heuristics. Các con số phần lớn sẽ phụ thuộc vào số lượng dữ liệu, số lượng câu hỏi ngữ âm và mục tiêu của mô hình.
Dòng lệnh thực hiện huấn luyện triphone như sau: $ steps/train_deltas.sh --cmd "$train_cmd" \
$pdf $gauss $WORK/train $WORK/lang $EXP/mono_ali $EXP/tri1 || exit 1; Trong đó, Đối số --cmd “$train_cmd” và --nj là được thiết lập từ trước như phần trên đã đưa rạ Tham số pdf và gauss được thiết lập trong tập tin env_voip_cs.sh, trong đó:
- pdf=1200 là số các trạng thái âm vị huấn luyện. Lệnh thiết lập: export pdf=1200
- gauss là số Gauss lớn nhất sử dụng cho huấn luyện. Lệnh thiết lập: export gauss=19200
Sắp xếp triphone dựa trên Delta
Câu lệnh thực hiện:
$ steps/align_sịsh --nj $njobs --cmd "$train_cmd" \
--use-graphs true $WORK/train $WORK/lang $EXP/tri1 $EXP/tri1_ali || exit 1;
Huấn luyện triphone delta + delta-delta (tri2a)
Câu lệnh thực hiện:
steps/train_deltas.sh --cmd "$train_cmd" $pdf $gauss \ $WORK/train $WORK/lang $EXP/tri1_ali $EXP/tri2a || exit 1; Các đối số được lập như với huấn luyện tri1
Huấn luyện triphone LDA+MLLT (tri2b)
80
steps/train_lda_mllt.sh --cmd "$train_cmd" $pdf $gauss \
$WORK/train $WORK/lang $EXP/tri1_ali $EXP/tri2b || exit 1;
Sắp xếp triphone LDA-MLLT với FMLLR
Câu lệnh thực hiện:
steps/align_sịsh --nj $njobs --cmd "$train_cmd" \
--use-graphs true $WORK/train $WORK/lang $EXP/tri2b $EXP/tri2b_ali || exit 1;
Huấn luyện triphone MMI dựa trên LDA+MLLT (tri2b_mmi)
Câu lệnh thực hiện:
$ steps/make_denlats.sh --nj $njobs --cmd "$train_cmd" \ --beam $mmi_beam --lattice-beam $mmi_lat_beam \
$WORK/train $WORK/lang $EXP/tri2b $EXP/tri2b_denlats || exit 1;
steps/train_mmịsh $WORK/train $WORK/lang $EXP/tri2b_ali $EXP/tri2b_denlats $EXP/tri2b_mmi || exit 1;
Sắp xếp triphone MMI dựa trên LDA+MLLT
steps/align_fmllr.sh --cmd "$train_cmd" \ data/train data/lang exp/tri4a exp/tri4a_ali || exit 1;
Huấn luyện triphone MMI dựa trên LDA+MLLT với boosting (tri2b_mmi_b0.05)
steps/train_mmịsh --boost ${train_mmi_boost} $WORK/train $WORK/lang \
$EXP/tri2b_ali $EXP/tri2b_denlats $EXP/tri2b_mmi_b${train_mmi_boost} || exit 1;
Huấn luyện triphone MPE (tri2b_mpe)
steps/train_mpẹsh $WORK/train $WORK/lang $EXP/tri2b_ali $EXP/tri2b_denlats $EXP/tri2b_mpe || exit 1;
Huấn luyện triphone LDA+MLLT+SAT (tri3)
steps/train_sat.sh 2500 15000 $WORK/train $WORK/lang $EXP/tri2b_ali $EXP/tri3 || exit 1;
81
Sắp xếp triphone tri3
steps/align_fmllr.sh --nj $njobs --cmd "$train_cmd" \ $WORK/train $WORK/lang $EXP/tri3 $EXP/tri3_ali
Huấn luyện triphone SGMM
steps/train_ubm.sh --cmd "$train_cmd" \
400 $WORK/train $WORK/lang $EXP/tri3_ali $EXP/ubm4 steps/train_sgmm2.sh --cmd "$train_cmd" 7000 9000 \
$WORK/train $WORK/lang $EXP/tri3_ali $EXP/ubm4/final.ubm $EXP/sgmm2