6 Tham khảo “The Concepts of Hidden Markov Model in Speech recognition Systems”[2] và “A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition”[12]
4.3.2. Phương pháp tính xác suất đoán nhận âm học bj(ot)
Trong mục này, tôi sẽ giới thiệu về cách tính xác suất đoán nhận âm học bj(ot) dựa vào phân phối Gauss, hay phân phối chuẩn. Phương pháp này được đề cập đến trong các tài liệu: Two Pass Hidden Markov Model for Speech Recognition[1] và
trưng chỉ có một chiều, ký hiệu giá trị duy nhất của mỗi vector đặc trưng là ot. Giá trị của ot được giả định là một phân phối Guass, và mỗi trạng thái ẩn j trong HMM có tương quan với một giá trị kỳ vọng và phương sai . Xác suất bj(ot) sẽ được tính thông qua hàm mật độ xác suất Gauss:
Như đã giới thiệu ở phần 4.2.3, phương pháp huấn luyện theo thuật toán Baum- Welch là một phương pháp lặp. Do đó, tại mỗi vòng lặp các giá trị kỳ vọng và phương sai cũng cần được điều chỉnh lại. Cũng ở phần 4.2.3, chúng ta đã tìm hiểu về xác suất
γt(i), là xác suất ở trạng thái i tại thời điểm t, và cách tính xác suất này. Công thức được đưa ra để cập nhật các tham số kỳ vọng và phương sai như sau:
Tuy nhiên, các vector đặc trưng trong bài toán nhận dạng tiếng nói thực chất là các vector đa chiều. Vì vậy chúng ta cần phải sử dụng phân phối Gauss đa chiều để tính toán giá trị bj(ot). Nếu số chiều của một vector là D, với mỗi trạng thái ta sẽ có một vector kỳ vọng D chiều và một ma trận hiệp phương sai kích thước DxD. Ma trận hiệp phương sai ở đây là một ma trận đường chéo, có giá trị hàng d cột d là phương sai của chiều thứ d của vector đặc trưng. Tương tự, vector kỳ vọng cũng được tính bằng cách tính kỳ vọng cho từng chiều của các vector đặc trưng. Cuối cùng, công thức để tính xác suất đoán nhận âm học bj(ot) sẽ là: