Mục tiêu đồ án đặt ra là đề xuất phương pháp chọn lựa đơn vị âm tối ưu cho tổng hợp tiếng nói tiếng Việt và thực thi phương pháp. Phương pháp được tác giả đề xuất và áp dụng trong đồ án là “Lựa chọn đơn vị không đồng nhất”. Tác giả cũng đã phát triển chương trình thực thi phương pháp với việc sử dụng CSDL và bộ tổng hợp mức bán âm tiết của Trung tâm nghiên cứu Mica. Điều này cho thấy sự đúng đắn trong hướng đi và cách áp dụng phương pháp đề xuất của tác giả. Mặc dù đánh giá kết quả bước đầu tương đối khả quan nhưng chương trình mới chỉ làm được những phần việc rất nhỏ trong một bộ tổng hợp tiếng nói.
Phần sau là tổng kết về những gì đã làm được trong đồ án, những điểm hạn chế và hướng đi trong tương lai của đề tài:
• Những điểm đã đạt được:
o Tìm hiểu lý thuyết về tổng hợp tiếng nói và tổng hợp mức thấp.
o Đề xuất cách áp dụng phương pháp lựa chọn đơn vị không đồng nhất cho tổng hợp tiếng nói tiếng Việt.
o Tổ chức CSDL văn bản và âm thanh thuận lợi cho việc tìm kiếm và mở rộng sau này.
o Cài đặt chương trình trên ngôn ngữ Java và C++, kết nối hai phần với nhau qua JNI.
• Những điểm còn hạn chế
o Chưa thực hiện được phần ghép nối bán âm tiết và điều khiển tham số ngữ điệu trên C++;
o Việc lựa chọn đơn vị âm tối ưu chưa thực hiện đối với bán âm tiết.
o Số lượng người tham gia bài thực nghiệm còn ít.
o Chưa dùng các tham số ngữ điệu trong tính toán hàm khoảng cách để tối ưu hóa, hiện mới chỉ dùng các tham số ngữ âm.
o Chưa áp dụng mô hình ngữ điệu về trường độ và cao độ.
• Hướng đi trong tương lai
o Xây dựng một bộ dữ liệu lớn hơn, đảm bảo độ phủ cao hơn đối với âm tiết tiếng Việt.
o Nghiên cứu kĩ hơn việc ảnh hưởng của các tham số trong hàm khoảng cách ở mức âm tiết và cụm từ.
o Áp dụng các mô hình ngữ điệu cho các loại câu khác nhau trong tiếng Việt.
o Chỉnh sửa thiết kế để chương trình có khả năng thích nghi với cơ sở dữ liệu mới.
o Giảm bớt sự phụ thuộc của việc lựa chọn đơn vị âm vào kết quả của cây phân tích cú pháp, có thể cho kết quả đúng khi cây phân tích cú pháp cho kết quả sai.
o Xem xét cách áp dụng mô hình ngôn ngữ và thống kê để lựa chọn cụm từ.