Đánh giá VnVoice và một số giọng tổng hợp tiếng Việt hiện nay

Một phần của tài liệu Nghiên cứu một số phương pháp nâng cao chất lượng tổng hợp tiếng Việt và thử nghiệm cho phần mềm VnVoice (Trang 70)

Chƣơng 4: THỬ NGHIỆM CẢI TIẾN GIỌNG ĐỌCTỔNG HỢP TIẾNG VIỆT TRONG PHẦN MỀM

4.1.Đánh giá VnVoice và một số giọng tổng hợp tiếng Việt hiện nay

nay

Phần mềm VnVoice phiên bản 1.0 là phần mềm tổng hợp tiếng Việt được nghiên cứu và phát triển bởi Phòng Nhận dạng và Công nghệ tri thức, Viện Công nghệ thông tin, Viện Khoa học Việt Nam từ năm 2002. Đến nay, VnVoice được đánh giá là phần mềm có giọng đọc tiếng Việt có chất lượng khá tốt, giọng đọc rõ ràng và đây là một trong những sản phẩm quan trọng có ý nghĩa trong đời sống. Hiện nay, đã có một số ứng dụng nhúng có sử dụng VnVoice 1.0. Chẳng hạn, phần mềm tích hợp đọc văn bản cho người khiếm thị Việt Nam, ứng dụng cho cổng thoại học đường, … Tuy nhiên, để đáp ứng được nhu cầu của người dùng thì VnVoice cần phải có rất nhiều cải tiến nhằm nâng cao chất lượng giọng tổng hợp. Những hạn chế của VnVoice cũng cần đầu tư rất nhiều về mọi mặt như trang thiết bị, con người, …

Nhu cầu cần có một hệ tổng hợp chất lượng tốt đã thôi thúc các tổ chức nghiên cứu, các nhà khoa học cho ra đời những sản phẩm tổng hợp tiếng Việt. Chẳng hạn như phần mềm VnSpeech của Viện Công nghệ và Ứng dụng Hà nội, phần mềm VietVoice của Giáo sư Lê Tang Hồ (Canada), VnSpeech cho Mobile của Viện Công nghệ thông tin (Viện KHVN), … Tất cả các ứng dụng không ngoài mục đích hỗ trợ con người trong cuộc sống cũng như trong nhiều lĩnh vực khác như: thiên văn, dự báo thời tiết, các ứng dụng nhúng công nghệ cao, … Tuy nhiên, các sản phẩm đều có những ưu điểm và hạn chế riêng. Qua đây, luận văn sẽ có một số đánh giá các sản phẩm tiếng nói tổng hợp nhằm tìm ra những hạn chế để cải tiến hệ tổng hợp VnVoice1.0. Kết quả đánh giá được trình bày trong bảng 4.1 dưới đây.

Bảng 4.1: Thống kê và so sánh một số chương trình tổng hợp tiếng Việt hiện nay.

STT Sản phẩm

(dung lƣợng) Nơi phát triển PP tổng hợp Ƣu điểm/nhƣợc điểm

1 VietVoice4.0 (81MB) (81MB)

Giáo sư Lê Tang Hồ, Đại học Moscton, New Brunswick, Canada.

Diphone Nhƣợc điểm: Tổng hợp thanh điệu kém, phụ âm không rõ, đặc biệt âm mũi

Ƣu điểm: Dễ sử dụng, người dùng có thể tự phát triển dựa trên bộ mã nguồn viết cho tiếng Anh.

2 VnSpeech1.0 (317KB) (317KB)

Trung tâm Công nghệ Vi điện tử và Tin học - Viện Ứng dụng Công nghệ Hà Nội.

Formant Nhƣợc điểm: Chất lượng kém, nghe không rõ âm tiết. Giọng nói máy móc, không tự nhiên, khó cải tiến.

Ƣu điểm: CSDL nhỏ, mềm dẻo, dễ tích hợp trong các ứng dụng nhúng. 3 VnMobile Speech (800KB) Phòng Nhận dạng và Công nghệ tri thức, Viện CNTT, Viện Khoa học Việt Nam.

Tổng hợp ghép nối

Nhƣợc điểm: đọc rời rạc, chưa xử lý ngôn điệu

Ƣu điểm: CSDL nhỏ, thích hợp với các ứng dụng yêu cầu bộ nhớ nhỏ, đặc biệt là trên môi trường điện thoại di động.

4 VnVoice1.0 (6.4MB) (6.4MB)

Phòng Nhận dạng và Công nghệ tri thức, Viện CNTT, Viện Khoa học Việt Nam.

Ghép nối âm vị Nhƣợc điểm: đọc rời rạc, chưa xử lý ngôn điệu

Hình 4.1: Câu “Tôi đang học nói tiếng Việt” trong phần mềm VnSpeech 1.0. Tổng hợp Formant.

Hình 4.2: Câu “Tôi đang học nói tiếng Việt” trong phần mềm VnVoice1.0. Tổng hợp ghép nối.

Phần mềm VietVoice phát triển dựa trên nền của phần mềm tổng hợp tiếng Anh FreeTTS [35]. Phần mềm nguyên thủy của FreeTTS là hệ thống tổng hợp Festival [33] sử dụng tổng hợp ghép nối diphone. Phần mềm này chất lượng cũng còn khá hạn chế.

Phần mềm VnSpeech [33] chất lượng không tốt, nghe không rõ âm tiết. Ở Việt Nam hiện nay thì tổng hợp tiếng Việt chỉ mới đạt được ở mức độ đọc rõ ràng âm tiết. Những nghiên cứu về ngữ âm học cũng như những nghiên cứu về

nâng cao chất lượng giọng tổng hợp vẫn còn ít. Vấn đề nâng cao chất lượng tổng hợp phụ thuộc vào các yếu tố sau:

- Cơ sở dữ liệu tiếng nói và môi trường ứng dụng - Phương pháp tổng hợp

- Các quy luật về ngôn điệu, …

Như trong chương 3 của luận văn đã trình bày một số phương pháp cải tiến chất lượng giọng tổng hợp. Trong phần này, tôi thử nghiệm đồng thời một số phương pháp để cải tiến và ở các mức khác nhau.

Một phần của tài liệu Nghiên cứu một số phương pháp nâng cao chất lượng tổng hợp tiếng Việt và thử nghiệm cho phần mềm VnVoice (Trang 70)