Tối ưu toán tử:

Một phần của tài liệu Nghiên cứu về nhận dạng tiếng nói tiếng việt và ứng dụng thử nghiệm trong điều khiển máy tính luận văn thạc sĩ (Trang 55 - 56)

Một thực tế đơn giản cho mô phỏng xác suất là càng nhiều sự quan sát càng tốt, là cần thiết để ổn định mô hình ước lượng các tham biến. Tuy nhiên, thật ra, chỉ một số lượng hạn chế dữ liệu huấn luyện là sẵn có. Nếu dữ liệu huấn luyện bị giới hạn, điều này sẽ dẫn đến kết quả trong một vài tham biến đã huấn luyện là không thỏa đáng, và sự phân loại dựa trên các mô hình huấn luyện kém sẽ dẫn đến mức độ lỗi nhận dạng càng cao. Có nhiều giải pháp hợp lý để giải quyết vấn đề của dữ liệu huấn luyện không đầy đủ như sau:

 Ta có thể gia tăng kích thước của dữ liệu huấn luyện.

 Ta có thể giảm số tham biến tự do để được ước lượng lại. Điều này tạo nên các hạn chế của nó, vì một số các tham biến đáng kể luôn cần mô hình sự kiện.

 Ta có thể thêm vào một tập các tham biến ước lượng với một tập khác của tham biến ước lượng, theo đó đủ một lượng dữ liệu huấn luyện tồn tại. Xoá bỏ phép nội suy được đề cập ở trên, có thể được sử dụng hiệu quả. Trong HMM rời rạc, một phương pháp đơn giản là để thiết lập nền cho cả hai xác suất chuyển tiếp và xác suất đầu ra để loại bỏ khả năng ước lượng không.

 Ta có thể gom các tham biến với nhau để giảm số của tham biến tự do.  Cho HMM hỗn hợp liên tục, ta cần chú ý đến tối ưu ma trận. Có một số kỹ thuật ta có thể sử dụng:

 Ta có thể nội suy ma trận với những mẫu huấn luyện tốt hơn.

 Ta có thể gom ma trận Gaussian thông qua các thành phần hỗn hợp khác nhau hoặc qua các trạng thái Markov khác nhau.

 Ta có thể sử dụng ma trận chéo nếu tương quan giữa các hệ số đặc trưng là yếu, sẽ đúng là trường hợp này nếu ta sử dụng các đặc trưng không tương quan như MFCC.

 Ta có thể kết hợp các phương pháp này với nhau.

Trong thực tế, chúng ta có thể giảm mức độ lỗi nhận dạng tiếng nói khoảng 5-20% với các kỹ thuật tối ưu khác nhau, tùy vào lượng dữ liệu huấn luyện sẵn có.

Một phần của tài liệu Nghiên cứu về nhận dạng tiếng nói tiếng việt và ứng dụng thử nghiệm trong điều khiển máy tính luận văn thạc sĩ (Trang 55 - 56)

Tải bản đầy đủ (PDF)

(111 trang)