Tách âm vị và xác định âm vị trên chuỗi sóng âm

Một phần của tài liệu Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động (Trang 29 - 31)

Số lượng từ trong mỗi ngôn ngữđều rất lớn. Xây dựng hệ nhận dạng theo từ

có khả năng phân biệt số lượng từ lớn đó quả là một thách thức. Thay vào đó, người ta nghĩ ra cách xây dựng hệ nhận dạng dựa trên hướng tiếp cận âm vị. Theo đó, chỉ

cần nhận dạng khoảng vài chục âm vị sẽ có thể nhận dạng được toàn bộ từ của một ngôn ngữ (Theo thống kê, số âm vị trong một ngôn ngữ dao động từ khoảng 20 đến 60). Và đây cũng chính là hướng tiếp cận đúng đắn cho nhận dạng tiếng nói tiếng Việt. Tuy nhiên, người ta lại gặp một khó khăn khác, đó là tách âm vị và xác định âm vị trên chuỗi sóng âm: Cho một dãy tín hiệu tiếng nói đã thu sẵn. Nhiệm vụ của chúng ta là tìm ranh giới của tất cả các âm vị và cho biết các âm vị đó là âm vị gì. Khoan hãy nói đến khả năng thực hiện công việc đó tựđộng bằng máy. Ngay cả con người vẫn có thể bị nhầm lẫn khi tách âm vị bằng tay do ranh giới giữa các âm vị

thường mập mờ và hay chồng lấp lên nhau. Cả khi 2 âm vị thuộc 2 âm tiết khác nhau, nếu đứng kế nhau vẫn có thể xảy ra sự chồng lấp. Vì vậy, công việc tách âm vị trên chuỗi sóng âm chỉ mang tính tương đối.

KHOA CNTT –

ĐH KHTN

Khoảng chồng lấp

HÌNH 4 – Cụm từ “bốn lăm” đứng kề nhau: có một khoảng chồng lấp giữa âm vị

“n” cuối âm tiết “bốn” và âm vị “l” đầu âm tiết “lăm”

Âm vị “a” ở hình a được tách ngắn hơn so với âm vị “a” tách ra ở hình b, trong khi âm vị “h” và “i” ở hình a dài hơn ở hình b.

Cách tách âm vị nào là chính xác

hơn? Cách a hay cách b?

HÌNH 5 – Hai cách tách âm vị cho cùng một sóng âm của chữ “hai”

Trong đồ án này, một phương pháp tách và nhận dạng âm vị tự động dùng mô hình HMM kết hợp mô hình ngôn ngữ để nhận dạng âm vị triphone (âm vị

mang 3 thông tin, thông tin về nó, thông tin âm vịđứng trước và âm vịđứng sau nó)

được nêu ra. Phương pháp này về cơ bản giải quyết tốt công việc học và tách âm vị

một cách tựđộng bằng máy. Kết quả tách âm vị được dùng cho quá trình nhận dạng tiếng nói tiếng Việt và đã đạt được kết quả khả quan.

KHOA CNTT –

ĐH KHTN

CHƯƠNG 2 Mô hình HMM áp dụng vào nhận dạng âm vị

Một phần của tài liệu Nhận dạng tiếng nói tiếng việt theo hướng tiếp cận nhận dạng âm vị tự động (Trang 29 - 31)

Tải bản đầy đủ (PDF)

(91 trang)