Mô hình HMM cho âm vị được sử dụng trong bài làm

Một phần của tài liệu Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động (Trang 46 - 48)

Với bất hệ thống nhận dạng đều phải định nghĩa các đơn vị cơ bản sẽ được mô hình hóa bởi HMM. Trong mô hình nhận dạng dựa vào âm vị, có thể chọn đồng

KHOA CNTT –

ĐH KHTN

thời cả các đơn vị phụ thuộc ngữ cảnh (context-dependency – CD) và đơn vị độc lập ngữ cảnh (context-independency – CI).

Phones (âm vị và các đơn vị cơ bản không tiếng nói) thường sử dụng đơn vị độc lập ngữ cảnh để mô hình hóa 1 âm vị người ta sử dụng mô hình HMM cho âm vị đơn.Các mô hình HMM mô hình hóa cho các âm vị độc lập ngữ cảnh gọi là monophones. Một đơn vị CI-HMM f sẽ chứa tất cả các thông tin về tất cả các thể

hiện của f trong tất cả các ngữ cảnh. Ví dụ mô hình CI-HMM λa của âm vị /a/ sẽ

chứa tất cả các thông tin của a trong tất cả các âm tiết /ba/, /bang/, /sanh/, /hoan/, … Tuy nhiên sự thay đổi tính chất của âm vị còn phụ thuộc vào ngữ cảnh (ví dụ

sựảnh hưởng của các âm vị xung quanh nó nên nếu mô hình hóa tất cả các thể hiện của 1 âm vị vào 1 monophone HMM có thể không hiệu quả. Đơn vị CD bao gồm mô hình HMM được định nghĩa cho âm vị trung tâm liên hội vói ngữ cảnh trái và ngữ cảnh phải của nó. Đơn vị phụ thuộc ngữ cảnh thường dùng là triphone. Ví dụ

thể hiện HMM triphone của âm vị ‘a’ trong 2 thể hiện ‘hoan’ và ‘hai’ là 2 mô hình HMM: mô hình triphone o-a+n cho âm vị a trong âm tiết ‘hoan’ và mô hình triphone h-a+i cho âm vị a trong âm tiết ‘hai’. Nhưng có 1 vấn đề là số lượng mô hình triphone lớn hơn rất nhiều so với mô hình dành cho phone. Như vậy, một lần nữa chúng ta lại gặp vấn đề mâu thuẫn giữa độ chính xác và độ phức tạp của hệ

thống. Trong thực tế về cơ bản chúng ta dùng mô hình monophone, trong khi đó sẽ

thêm vào 1 số các tác động ngữ cảnh sẽđược mô hình hóa, thay vì sử dụng toàn bộ

là mô hình triphone.

Trong bài làm của chứng tôi, chúng tôi kết hợp sử dụng cả mô hình monophone và triphone.

Mô hình HMM được sử dụng trong bài làm là mô hình Left-Right 5 trạng thái (xem HÌNH 6)

KHOA CNTT –

ĐH KHTN

CHƯƠNG 3 Tiền xử lý tín hiệu Tiếng nói và rút trích đặc trưng

Một phần của tài liệu Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động (Trang 46 - 48)

Tải bản đầy đủ (PDF)

(91 trang)