Huấn luyện mô hình tổng quát (TrainWorldInit)

Một phần của tài liệu Nhận dạng tự động lứa tuổi của tiếng việt nói (Trang 33 - 35)

- Chức năng để tạo ra một mô hình chung nhất của tất cả các lứa tuổi người nói. Mô hình này được lựa chọn từ một số lứa tuổi người nói sau đó huấn luyện một mô hình duy nhất được gọi là mô hình nền.

- Đầu vào: file World.lst và file world.weight

+ world.weight: file trọng số, mỗi file lưu một dòng có chỉ số: 0.5. Có 4 lứa tuổi

tương ứng lưu 4 dòng. Ví dụ: 0.5 0.5 0.5 0.5

25

- World.lst: nội dung của các file này là chỉ đường dẫn đến tất cả tên file của các lứa

tuổi người nói đã được huấn luyện. Mỗi một thử nghiệm chia làm 2 tập đảo nhau (1 train và 1 test), như vậy sẽ có tất cả 6 file world.lst tương ứng.

VD: file ANam_world.lst chứa nội dung: ./lst/test1/trainAThieuNien_Nam.lst ./lst/test1/trainAThanhNien_Nam.lst ./lst/test1/trainATrungNien_Nam.lst ./lst/test1/trainANguoiGia_Nam.lst

- Đầu ra: file world_init.gmm, world_initinit.gmm trong các thư mục test chứa trong thư mục gmm

- Sử dụng câu lệnh:

TrainWorld --config ./cfg/TrainWorldInit1.cfg --inputStreamList ./lst/test1/ANam_world.lst --weightStreamList ./lst/world.weight -- outputWorldFilename test1/ANam_world_init --debug false --verbose true

- Ý nghĩa của câu lệnh như sau:

+ TrainWorld: học mô hình GMM thông qua thuật toán EM

+ Config: Thực hiện điều khiển các câu lệnh ở tệp TrainWorldInit1.cfg trong thư mục cfg

Các giá trị tùy chọn trong tệp TrainWorldInit1.cfg

Tùy chọn Giá trị Mô tả

distribType GD Xác định kiểu của thuộc tính

mixtureDistribCount 8 Xác định số thuộc tính gausion trong hỗn hợp

saveMixtureFileExtension .gmm Định dạng để lưu thuộc tính loadFeatureFileExtension .norm.prm Định dạng đầu vào của file

baggedFrameProbability 0.2 Xác định tỷ lệ giữa các khung được lựa chọn và tổng số các khung được sử dụng để huấn luyện

26

chọn và tổng số các khung được sử dụng để khởi tạo.

nbTrainIt 10 Số lần lặp của EM liên quan đến baggedFrameProbabilityInit

featureServerMask 0-18,20- 50

Được sử dụng để chọn một tập hợp các đặc trưng trong vecttor

- Kết quả sinh ra 2 file: ANam_world_init.gmm, ANam_world_initinit.gmm trong thư mục gmm

Một phần của tài liệu Nhận dạng tự động lứa tuổi của tiếng việt nói (Trang 33 - 35)

Tải bản đầy đủ (PDF)

(81 trang)