Kết quả huấn luyện mạng Neuron

Một phần của tài liệu mô hình hóa trường độ âm tiết tiếng việt nâng cao chất lượng tổng hợp tiếng nói (Trang 58 - 60)

L NU NU NU NU NU NU NU SV CFV

3.4.1Kết quả huấn luyện mạng Neuron

CHƯƠNG 3 XÂY DỰNG VÀ THỬ NGHIỆM MÔ HÌNH TRƯỜNG ĐỘ ÂM TIẾT ĐỀ XUẤT

3.4.1Kết quả huấn luyện mạng Neuron

Trong quá trình huấn luyện mạng Neuron, với việc phân chia dữ liệu huấn luyện và dữ liệu kiểm tra là 7000/2000 một cách ngẫu nhiên. Kết quả đạt được:

- Với dữ liệu huấn luyện: 84%

- Với dữ liệu kiểm tra: 82.5%Trong tập huấn luyện với 7000 âm tiết, trường độ của các âm tiết được dự đoán qua mạng tập trung nhiều

-

Hình 3-32 Biểu đồ histogram kết quả đối với dữ liệu huấn luyện

Mối qua hệ giữa trường độ của âm tiết thực tế và trường độ âm tiết được dự đoán có sự chênh lệch. Các trường độ được dự đoán với các âm tiết trong tập huấn luyện thường có độ sai lệch nằm trong dải 0-30%. Điển hình có những âm tiết sai lệch đến hơn 90% so với trường độ gốc.

Hình 3-33 Tỉ lệ giữa giá trị trường độ thực tế và trường độ dữ đoán

Qua hình trên, ta có thể thấy được mối quan hệ giữa trường độ của âm tiết thực tế với trường độ của âm tiết được dự đoán với mô hình. Các điểm trên hình dao động quanh đường thẳng y = x, tuy nhiên có nhiều nằm khá xa. Trường độ dự đoán được vớ mạng Neuron có khoảng giá trị là 100ms -> 400ms so với trường độ thực tế từ 60ms -> 500ms. Với các giá trị trường độ quá dài hoặc quá ngắn khả năng nhận dạng của mạng neuron thường không tốt.

Tuy nhiên việc sai lệch này là khó tránh khỏi, vì với cùng một âm tiết trong cơ sở dữ liệu có rất nhiều thể hiện khác nhau, và với mỗi thể hiện này trường độ của âm tiết đó cũng thay đổi rất nhiều. Ví dụ với âm tiết “có” trong cơ sở dữ liệu có tới 26 mẫu. Trường độ của mẫu ngắn nhất là 70ms và trường độ của mẫu dài nhất là 400ms. Do đó rất khó cho mạng neuron có thể nhận dạng được trường độc chính xác của các âm tiết khi mà sự biến động trong tập huấn luyện lớn đến như vậy.

Hình 3-34 Biểu đồ Histogram đối với kết quả qua tập dữ liệu kiểm thử

Biểu đồ phân bố lỗi đối với các âm tiết nằm trong tập kiểm thử không có sự khác biệt nhiều đối với trong tập huấn luyện. Phân lớn độ sai lệch nằm trong khoảng 30% và cũng có những trường hợp mà độ sai lệch lên đến hơn 90%. Và như đã phân tích

ở trên, đó là các âm tiết quá ngắn trong dữ liệu, nên một độ sai lệch nhất định (khoảng 70ms) cũng có thể gây ra sự sai lệch lên đến gần 100%.

Đối với các âm tiết trong tập kiểm thử, sự phân bố của các điểm tỉ lệ giữa trường độ thực tế và trường độ dự đoán cũng nằm phân bố xung quanh đường thẳng y = x, và xuất hiện nhiều điểm cá biệt với trường độ khác nhiều so với thực tế.

Một phần của tài liệu mô hình hóa trường độ âm tiết tiếng việt nâng cao chất lượng tổng hợp tiếng nói (Trang 58 - 60)