KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

Một phần của tài liệu mô hình hóa trường độ âm tiết tiếng việt nâng cao chất lượng tổng hợp tiếng nói (Trang 65 - 66)

L NU NU NU NU NU NU NU SV CFV

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

Với việc áp dụng mô hình xác định ngữ điệu và cụ thể trong đề tài là trường độ, tác giả luận văn đã xây dựng được một bộ phát âm tiếng Việt tạo ra tiếng nói có ngữ điệu khá nhịp nhàng tự nhiên và có thể ứng dụng được trong thực tế.

Đồ án đã trình bày một số phương pháp tiếp cận đối với việc mô hình hóa trường độ. Dựa trên cơ sở sử dụng những tri thức về xử lý ngôn ngữ tự nhiên như tìm ranh giới giữa các từ, tách câu. Các thành phần của âm tiết (âm đầu, âm đệm, âm chính, âm cuối, thanh điệu). Thanh điệu của âm tiết được phân loại vào hệ thống 8 thanh điệu dựa trên việc tách đôi hai thanh sắc (5a, 5b) và thanh nặng (6a, 6b). Vector đặc trưng cho âm tiết được xây dựng với tổng cộng 14 đặc trưng đầu vào. Các đặc trưng này được huấn luyện bởi mạng neuron. Sau khi mạng Neuron đã học qua ngữ điệu của tiếng Việt, thông số của mạng sau huấn luyện được sử dụng để mô hình hóa trường độ cho một âm tiết đầu vào.

Âm thanh được tổng hợp dựa trên mô hình đã có được độ tự nhiên với sự ngắt nghỉ hợp lý.

Tuy nhiên kết quả của hệ thống vẫn còn một số hạn chế và cần được khác phục trong tương lai.

- Việc nhận dạng các âm tiết có trường độ ngắn chưa tốt, việc này có thể được cải tiến bằng việc sử dụng thêm một phần phân loại xác định xem liệu âm tiết có trường độ ngắn, dài, hay trung bình trước khi đưa qua mạng Neuron. [4].

- Tốc độ nói với âm thanh được tổng hợp dựa trên kết quả của mô hình hơi nhanh. Do đó cần nghiên cứu để giảm tốc độ nói một cách hợp lý. - Việc xác định ranh giới giữa các từ chưa thật sự tốt và có ảnh hưởng

đến kết quả phân tích vector đặc trưng. Để cải thiện, sử dụng kết quả phân tích từ, cụm từ của bộ phân tích cú pháp.

Một phần của tài liệu mô hình hóa trường độ âm tiết tiếng việt nâng cao chất lượng tổng hợp tiếng nói (Trang 65 - 66)