Nhưñã ñề cập trong chương 3, ñể ñiều khiển mô hình tổng hợp tiếng nói theo phương pháp mô hình hóa bộ máy cấu âm của con người, mô hình tổng hợp DRM
ñược sử dụng ñể ñiều khiển và tạo ra hình dáng của ống thanh quản. Như vậy tổng số tham sốñểñiều khiển chương trình SMART là 12 tham số, trong ñó:
- 01 tham số (Ps) ñiều khiển năng lượng của tiếng nói - 02 than số (Ag0 và Q) ñiều khiển mô hình dây thanh quản
- 08 tham số (R1, R2, …, R8) ñiều khiển hình dáng của ống thanh quản - 01 tham số (lưỡi gà) ñiều khiển việc kết nối ống mũi với ống thanh quản. Hình 4.4. biểu diễn chương trình mô phỏng hệ thống tổng hợp tiếng nói SMART ñể tổng hợp các nguyên âm tiếng Việt.
Luận văn thạc sỹ khoa học
Đo lường và các hệ thống ñiều khiển 56 Nguyễn Thị Sim
Hình 4.4: Chương trình SMART tổng hợp các nguyên âm tiếng Việt.
Dưới ñây là kết quả thử nghiệm chương trình SMART dùng ñể tổng hợp một số nguyên âm tiếng Việt:
- Hình 4.5 và 4.6 dưới ñây biểu diễn kết quả tổng hợp 02 nguyên âm /ai/ của tiếng Việt
Luận văn thạc sỹ khoa học
Đo lường và các hệ thống ñiều khiển 57 Nguyễn Thị Sim
Hình 4.6: Tín hiệu tổng hợp và tần số formant F1, F2, F3 của hai nguyên âm /ai/ tổng hợp bằng chương trình SMART
- Hình 4.7 dưới ñây biểu diễn kết quả tổng hợp 02 nguyên âm /au/ của tiếng Việt bằng chương trình SMART
Hình 4.7: Tín hiệu tổng hợp và tần số formant F1, F2, F3 của hai nguyên âm /au/ tổng hợp bằng chương trình SMART
Luận văn thạc sỹ khoa học
Đo lường và các hệ thống ñiều khiển 58 Nguyễn Thị Sim
Hình 4.8 dưới ñây biểu diễn kết quả tổng hợp 02 nguyên âm /ui/ của tiếng Việt bằng chương trình SMART
Hình 4.8: Tín hiệu tổng hợp và tần số formant F1, F2, F3 của hai nguyên âm /ui/ tổng hợp bằng chương trình SMART
Hình 4.9 dưới ñây biểu diễn kết quả tổng hợp nguyên âm /a/ và bán nguyên âm /j/ của tiếng Việt bằng chương trình SMART
Hình 4.9: Tín hiệu tổng hợp và tần số formant F1, F2, F3 của nguyên âm /a/ và bán nguyên âm /j/ tổng hợp bằng chương trình SMART
Luận văn thạc sỹ khoa học
Đo lường và các hệ thống ñiều khiển 59 Nguyễn Thị Sim
Hình 4.10 dưới ñây biểu diễn kết quả tổng hợp nguyên âm /ă/ và nguyên âm /i/ của tiếng Việt bằng chương trình SMART
Hình 4.10: Tín hiệu tổng hợp và tần số formant F1, F2, F3 của nguyên âm /ă/ và bán nguyên âm /j/ tổng hợp bằng chương trình SMART
Luận văn thạc sỹ khoa học
Đo lường và các hệ thống ñiều khiển 60 Nguyễn Thị Sim
Chương 5:KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 5.1. Kết luận
Trong một thời gian dài nghiên cứu, tìm hiểu về phương pháp tổng hợp nguyên âm tiếng Việt bằng mô hình DRM và mô hình cấu âm ñã hoàn thành. Là tác giả của luận văn tôi xin có một vài kết luận sau:
+ Sự ghép nối giữa mô hình âm thanh và mô hình DRM rất ñơn giản. + Điều khiển toàn bộ hệ thống chỉ cần một số ít tham số (giữa 10 và 12). + Dễ dàng thay ñổi chất lượng âm thanh.
+ Dưới quan ñiểm mã hoá, bộ mã hoá có hệ thống hình thành tiếng nói này chỉ cần tốc ñộ truyền là 3.2kbits.
+ Dễ dàng nhận biết phiên bản ñược cài vào bộ mã hoá nhờ bộ xử lý DSP. + Giảm tốc ñộ truyền mã mà vẫn giữñược chất lượng tiếng nói tốt. + Có thể duy trì tiếng nói liên tục khi có hiện tượng ñồng cấu âm
Tuy nhiên do thời gian có hạn và kinh nghiệm còn hạn chế lên chi ñưa ra kết quả thử nghiêm với một số nguyên âm.
5. 2. Hướng phát triển
Với những kết quả này, trong tương lai có thể phát triển tiếp ñề tài theo những hướng nghiên cứu như tổng hợp những từ, câu dài, phụ âm và bán nguyên âm.
Luận văn thạc sỹ khoa học
Đo lường và các hệ thống ñiều khiển 61 Nguyễn Thị Sim
TÀI LIỆU THAM KHẢO
[1] Trịnh Văn Loan (1998) Các bài giảng xử lý tiếng nói, Đại học bách khoa Hà Nộị
[2] Ngô Huy Hoàng, Bài giảng xử lý tiếng nói, Phòng nhận dạng viện công nghệ
thông tin.
[3] Nguyễn Hữu Quỳnh (2007), Ngữ pháp tiếng Việt, Nhà xuất bản từ ñiển Bách Khoa Hà Nộị
[4] Đoàn Thiện Thuật (1997). Ngữ âm tiếng Việt, Nhà xuất bản ñại học và trung học chuyên nghiệp.
[5] Nguyễn Việt Sơn (2007), A speech coding method using an anthropomorphic and acoustic approach, Đại học Bách Khoa Hà Nộị
[6] Nguyễn Việt Sơn (2008), Production and perception of Vietnamese short vowels, Đại học Bách Khoa Hà Nộị
[7] Carré, R. "From acoustic tube to speech production," Speech Communication 42, 227-24, 2004
[8] Carré, R. "On the phonetic characteristics of an acoustictube: Vowel and consonant systems," (Submitted).
[9] Eric Castelli, René Carré, Production and perception of Vietnamese vowels, International Research Center Hanoi University of Technology
[10] Rene Carre, From an acoustic tube to speech production, Dept. TSI, ENST- CNRS, 46 rue Barrault, 75634 Paris Cedex 13, France Accepted 4 December 2003