- Chức năng để tạo ra một mô hình chung nhất của tất cả các lứa tuổi người nói. Mô hình này được lựa chọn từ một số lứa tuổi người nói sau đó huấn luyện một mô hình duy nhất được gọi là mô hình nền.
- Đầu vào: file World.lst và file world.weight
+ world.weight: file trọng số, mỗi file lưu một dòng có chỉ số: 0.5. Có 4 lứa tuổi
tương ứng lưu 4 dòng. Ví dụ: 0.5 0.5 0.5 0.5
25
- World.lst: nội dung của các file này là chỉ đường dẫn đến tất cả tên file của các lứa
tuổi người nói đã được huấn luyện. Mỗi một thử nghiệm chia làm 2 tập đảo nhau (1 train và 1 test), như vậy sẽ có tất cả 6 file world.lst tương ứng.
VD: file ANam_world.lst chứa nội dung: ./lst/test1/trainAThieuNien_Nam.lst ./lst/test1/trainAThanhNien_Nam.lst ./lst/test1/trainATrungNien_Nam.lst ./lst/test1/trainANguoiGia_Nam.lst
- Đầu ra: file world_init.gmm, world_initinit.gmm trong các thư mục test chứa trong thư mục gmm
- Sử dụng câu lệnh:
TrainWorld --config ./cfg/TrainWorldInit1.cfg --inputStreamList ./lst/test1/ANam_world.lst --weightStreamList ./lst/world.weight -- outputWorldFilename test1/ANam_world_init --debug false --verbose true
- Ý nghĩa của câu lệnh như sau:
+ TrainWorld: học mô hình GMM thông qua thuật toán EM
+ Config: Thực hiện điều khiển các câu lệnh ở tệp TrainWorldInit1.cfg trong thư mục cfg
Các giá trị tùy chọn trong tệp TrainWorldInit1.cfg
Tùy chọn Giá trị Mô tả
distribType GD Xác định kiểu của thuộc tính
mixtureDistribCount 8 Xác định số thuộc tính gausion trong hỗn hợp
saveMixtureFileExtension .gmm Định dạng để lưu thuộc tính loadFeatureFileExtension .norm.prm Định dạng đầu vào của file
baggedFrameProbability 0.2 Xác định tỷ lệ giữa các khung được lựa chọn và tổng số các khung được sử dụng để huấn luyện
26
chọn và tổng số các khung được sử dụng để khởi tạo.
nbTrainIt 10 Số lần lặp của EM liên quan đến baggedFrameProbabilityInit
featureServerMask 0-18,20- 50
Được sử dụng để chọn một tập hợp các đặc trưng trong vecttor
- Kết quả sinh ra 2 file: ANam_world_init.gmm, ANam_world_initinit.gmm trong thư mục gmm