Sắp xếp và huấn luyện Monophone

Một phần của tài liệu xây dựng hệ thống nhận dạng tiếng việt nói trên nền bộ công cụ kaldi tích hợp mạng nơ ron sâu (Trang 87 - 89)

1. Tổng quan về mạng Nơ ron sâụ

3.4.9. Sắp xếp và huấn luyện Monophone

Tạo tập con dữ liệu cho huấn luyện monophone

Huấn luyện monophone là thành phần đầu tiền của quá trình huấn luyện, mô hình này chủ yếu sử dụng để làm mô hình khởi đầu cho huấn luyện các mô hình saụ

Chia dữ liệu thành hai phần, một phần để huấn luyện và một phần để test, sử dụng dòng lệnh sau:

cd VS/s5

local/data_split.sh --every_n $EVERY_N $DATA_ROOT $WORK/local "$LMs" "$TEST_SETS

Huấn luyện monophone

Mỗi kịch bản huấn luyện đưa ra một cấu trúc các đối số cơ bản tương tự với đối số tùy chọn trước. Một ngoại lệ là huấn luyện monophone đầu tiên, từ một mô hình chưa từng tồn tại, không có thư mục nguồn đặc biệt cho mô hình. Các đối só cần thiết là:

78 - Vị trí của dữ liệu âm thanh: data/train - Vị trí của bộ từ vựng: lang_prep/lang

- Thư mục nguồn cho mô hình: exp/x (x là mô hình huấn luyện cuối cùng) - Thư mục đích cho mô hình: exp/y (y là mô hình huấn luyện hiện tại đang thực

hiện)

Đối số --cmd “$train_cmd” được chỉ định để thực hiện xử lý huấn luyện, được thiết lập trong cmd.sh như đã nói đến ở phần trên. Đối số --nj nên bằng với số công việc đã được thiết lập chuẩn từ trước.

steps/train_monọsh --nj $njobs --cmd "$train_cmd" $WORK/train $WORK/lang $EXP/mono

Sắp xếp monophone

Thực hiện sắp xếp các tập tin âm thanh với các văn bản. Cũng giống như các kịch bản huấn luyện, các kịch bản sắp xếp cũng tuân theo cấu trúc đối số tương tự. Các đối số yêu cầu là:

- Vị trí dữ liệu ấm thanh: data/train - Vị trí của bộ từ vựng: lang_prep/lang

- Thư mục cho mô hình: exp/y (y là thư mục mô hình đang thực hiện) - Thư mục đích cho sự sắp xếp: exp/y_ali

steps/align_sịsh --nj $njobs --cmd "$train_cmd" \

$WORK/train $WORK/lang $EXP/mono $EXP/mono_ali || exit 1; Cấu trúc thư mục như sau:

VS lang_prep exp local lang train lang s5 train dict mono Mono_ali

79

Một phần của tài liệu xây dựng hệ thống nhận dạng tiếng việt nói trên nền bộ công cụ kaldi tích hợp mạng nơ ron sâu (Trang 87 - 89)