Đánh giá cảm nhận của người nghe.

Một phần của tài liệu mô hình hóa trường độ âm tiết tiếng việt nâng cao chất lượng tổng hợp tiếng nói (Trang 62 - 65)

L NU NU NU NU NU NU NU SV CFV

CHƯƠNG 3 XÂY DỰNG VÀ THỬ NGHIỆM MÔ HÌNH TRƯỜNG ĐỘ ÂM TIẾT ĐỀ XUẤT

3.5 Đánh giá cảm nhận của người nghe.

Để có thể đánh giá được kết quả của mô hình đối với ngữ điệu của âm thanh, một thử nghiệm được tiến hành đối với các âm thanh được tổn hợp đối với độ tự nhiên của tiếng nói tổng hợp.

Một số câu được chọn để tổng hợp với hai mô hình trường độ khác nhau. Một sử dụng mô hình mạng Neuron và một sử dụng mô hình cây phân lớp hồi qui (CART). Người nghe sẽ được yêu cầu đánh giá mức độ tự nhiên của tiếng nói tổng hợp về mặt trường độ. Độ chính xác về mặt số liệu của mô hình CART là 77% và mô hình mạng Neuron là 82%.

Kết quả của thử nghiệm được thể hiện qua hình dưới.

Hình 3-37 Đánh giá cảm nhận của người nghe đối với âm thanh

Từ kết quả trên, sự khác biệt mà người nghe đánh giá được giữa hai mô hình là không nhiều. Trong hầu hết các câu được đưa ra đánh giá, điểm số cho bởi người nghe là như nhau. Chỉ có một hai câu có sự khác biệt.

Mặc dù trường độ của hai hệ thống đưa ra đối với từng câu là khác nhau, và nhiều câu là khá rõ rệt. Nhưng người nghe gần như khó có khả năng phân biệt được về mặt trường độ giữa các câu này.

Thang điểm cho đánh giá là từ 1-5. Trong đó 1 là mức thấp nhất, chất lượng rất kém. Và 5 là mức cao nhất, ngữ điệu của câu được tổng hợp nghe giống như những câu nói tự nhiên. Điểm trung bình của 7 người thực hiện bài đánh giá đối với hai mô hình là ~3.5. Đây là một kết quả khả quan đối với bài toán mô hình hóa trường độ.

Tuy nhiên bài đánh giá này còn chịu nhiều tác động của bộ tổng hợp tiếng nói Hoa Súng66[2].. Bộ tổng hợp này sử dụng phương pháp tổng hợp ghép nối ở mức bán âm tiết nên chất lượng của nhiều câu tổng hợp được chưa cao đặc biệt là với các câu được lựa chọn bất kỳ. Đồng thời các yếu tố về cao độ, cường độ cũng ảnh hưởng đến ngữ điệu và độ tự nhiên của câu và làm ảnh hưởng đến kết quả của người đánh giá về trường độ.

Bảng 3-12 Danh sách các câu tổng hợp để đánh giá

STT Câu tổng hợp

1 Bốn trăm gam đường, và một trăm hai mươi gam bột sắn. 2 Chị cứ bỏ vào thùng thư.

3 Anh ta đứng ngay trước cửa nhà tôi.

4 Vâng chào anh.

5 Tôi tên là Hương, rất vui được làm quen. 6 Anh đã đợi em lâu lắm rồi.

7 Hôm nay trời nắng chang chang, mèo con đi học chẳng mang thứ gì. 8 Anh ấy rất đẹp trai.

9 Con đường tới trường, mùa này đẹp lắm. 10 Ông thầy búi núi gỡ?

11 Chính phủ đang tìm hướng phát triển cho đất nước. 12 Lóo dùng tiền mua vàng giắt túi.

13 Anh Hà cho biết, anh đã truy hô và kéo chiếc xe lại, nhưng không được.

14 Iu Túp mừng sinh nhật sáu tuổi, ba tỉ lượt xem mỗi ngày. 15 Thôi chào anh, tôi về.

3.6 Kết chương

Mô hình trường độ đã được cài đặt và thử nghiệm sinh trường độ đối với âm tiết trong tiếng Việt. Về mặt thống kê, kết quả dự đoán trường độ đối với các âm tiết đạt độ chính xác khá cao 82%. So với các bộ tổng hợp khác Hoa Súng (77.16%), tiếng Thái Lan (73%) Hansakumbuntheung, 2003, Tiếng Hindi (80%) Krishna 2004 và (82%) Sreenivasa 2007.

Các thông tin trường độ được sử dụng để tổng hợp âm thanh qua bộ tổng hợp tiếng nói Hoa Súng của trung tâm MICA. Âm thanh được tổng hợp với trường độ sinh bởi mô hình có độ nhịp nhàng, ngắt nghỉ hợp lý.

Một phần của tài liệu mô hình hóa trường độ âm tiết tiếng việt nâng cao chất lượng tổng hợp tiếng nói (Trang 62 - 65)

Tải bản đầy đủ (DOCX)

(68 trang)
w