Sắp xếp và huấn luyện Triphone (Tri1)

Một phần của tài liệu xây dựng hệ thống nhận dạng tiếng việt nói trên nền bộ công cụ kaldi tích hợp mạng nơ ron sâu (Trang 89 - 91)

1. Tổng quan về mạng Nơ ron sâụ

3.4.10. Sắp xếp và huấn luyện Triphone (Tri1)

Huấn luyện triphone dựa trên dealtạ

Huấn luyện các mô hình triphone bao gồm các đối số bổ sung số lượng lá hoặc số trạng thái HMM cho cây quyết định và số Gauss. Trong lệnh này, đối số $pdf và $gauss tương ứng là 1200 và 19200 được thiết lập trong tập tin env_voip_cs.sh, nghĩa là có 1200 trạng thái HMM và 19200 Gaussians. Con số chính xác của lá và Gausian trong cây quyết định được quyết định dựa trên Heuristics. Các con số phần lớn sẽ phụ thuộc vào số lượng dữ liệu, số lượng câu hỏi ngữ âm và mục tiêu của mô hình.

Dòng lệnh thực hiện huấn luyện triphone như sau: $ steps/train_deltas.sh --cmd "$train_cmd" \

$pdf $gauss $WORK/train $WORK/lang $EXP/mono_ali $EXP/tri1 || exit 1; Trong đó, Đối số --cmd “$train_cmd” và --nj là được thiết lập từ trước như phần trên đã đưa rạ Tham số pdf và gauss được thiết lập trong tập tin env_voip_cs.sh, trong đó:

- pdf=1200 là số các trạng thái âm vị huấn luyện. Lệnh thiết lập: export pdf=1200

- gauss là số Gauss lớn nhất sử dụng cho huấn luyện. Lệnh thiết lập: export gauss=19200

Sắp xếp triphone dựa trên Delta

Câu lệnh thực hiện:

$ steps/align_sịsh --nj $njobs --cmd "$train_cmd" \

--use-graphs true $WORK/train $WORK/lang $EXP/tri1 $EXP/tri1_ali || exit 1;

Huấn luyện triphone delta + delta-delta (tri2a)

Câu lệnh thực hiện:

steps/train_deltas.sh --cmd "$train_cmd" $pdf $gauss \ $WORK/train $WORK/lang $EXP/tri1_ali $EXP/tri2a || exit 1; Các đối số được lập như với huấn luyện tri1

Huấn luyện triphone LDA+MLLT (tri2b)

80

steps/train_lda_mllt.sh --cmd "$train_cmd" $pdf $gauss \

$WORK/train $WORK/lang $EXP/tri1_ali $EXP/tri2b || exit 1;

Sắp xếp triphone LDA-MLLT với FMLLR

Câu lệnh thực hiện:

steps/align_sịsh --nj $njobs --cmd "$train_cmd" \

--use-graphs true $WORK/train $WORK/lang $EXP/tri2b $EXP/tri2b_ali || exit 1;

Huấn luyện triphone MMI dựa trên LDA+MLLT (tri2b_mmi)

Câu lệnh thực hiện:

$ steps/make_denlats.sh --nj $njobs --cmd "$train_cmd" \ --beam $mmi_beam --lattice-beam $mmi_lat_beam \

$WORK/train $WORK/lang $EXP/tri2b $EXP/tri2b_denlats || exit 1;

steps/train_mmịsh $WORK/train $WORK/lang $EXP/tri2b_ali $EXP/tri2b_denlats $EXP/tri2b_mmi || exit 1;

Sắp xếp triphone MMI dựa trên LDA+MLLT

steps/align_fmllr.sh --cmd "$train_cmd" \ data/train data/lang exp/tri4a exp/tri4a_ali || exit 1;

Huấn luyện triphone MMI dựa trên LDA+MLLT với boosting (tri2b_mmi_b0.05)

steps/train_mmịsh --boost ${train_mmi_boost} $WORK/train $WORK/lang \

$EXP/tri2b_ali $EXP/tri2b_denlats $EXP/tri2b_mmi_b${train_mmi_boost} || exit 1;

Huấn luyện triphone MPE (tri2b_mpe)

steps/train_mpẹsh $WORK/train $WORK/lang $EXP/tri2b_ali $EXP/tri2b_denlats $EXP/tri2b_mpe || exit 1;

Huấn luyện triphone LDA+MLLT+SAT (tri3)

steps/train_sat.sh 2500 15000 $WORK/train $WORK/lang $EXP/tri2b_ali $EXP/tri3 || exit 1;

81

Sắp xếp triphone tri3

steps/align_fmllr.sh --nj $njobs --cmd "$train_cmd" \ $WORK/train $WORK/lang $EXP/tri3 $EXP/tri3_ali

Huấn luyện triphone SGMM

steps/train_ubm.sh --cmd "$train_cmd" \

400 $WORK/train $WORK/lang $EXP/tri3_ali $EXP/ubm4 steps/train_sgmm2.sh --cmd "$train_cmd" 7000 9000 \

$WORK/train $WORK/lang $EXP/tri3_ali $EXP/ubm4/final.ubm $EXP/sgmm2

Một phần của tài liệu xây dựng hệ thống nhận dạng tiếng việt nói trên nền bộ công cụ kaldi tích hợp mạng nơ ron sâu (Trang 89 - 91)

Tải bản đầy đủ (PDF)

(103 trang)