4. CHƢƠNG 4: NGỮ ÂM TIẾNG VIỆT
4.1 Tổng quan về ngữ âm tiếng Việt
4.2 Các đặc điểm của âm tiết tiếng Việt 4.3 Cấu trúc của âm tiết tiếng Việt 4.4 Thanh điệu trong tiếng Việt
Việc xây dựng bộ tổng hợp tiếng nói đòi hỏi phải thấu hiểu đƣợc ngữ âm tiếng Việt để từ đó trích chọn ra các đặc trƣng ngữ âm, các quy luật ngữ điệu để thiết lập nên một bộ tham số thích hợp cho việc tổng hợp tiếng Việt.
Với mỗi phƣơng pháp tổng hợp tiếng nói yêu cầu các đặc trƣng âm học về phổ, formant, tần số cơ bản, cƣờng độ và độ dài của các âm tiết khác nhau. Một ngữ đoạn không chỉ đơn thuần là việc ghép nối các đơn vị âm một cách rời rạc mà còn cần phải có các nghiên cứu về thanh điệu và độ dài của tiếng Việt trong từng ngữ lƣu, đảm bảo tính tự nhiên của tiếng nói khi tổng hợp.
4.1 Tổng quan về ngữ âm tiếng Việt
Tiếng Việt thuộc loại đơn âm (phonologically monosyllabic) bao gồm nguyên âm V (vowel sound) và phụ âm C (consonant sound) đƣợc kết hợp thành ba hình thức CV, CVC hoặc VC:
- Hình thức CV (phụ âm + nguyên âm): ca [ca], ghe [ge], nghe [Ne]
- Hình thức CVC (phụ âm + nguyên âm + phụ âm): can [can], ghềnh [geø],
nghếch [Nec]
- Hình thức VC (nguyên âm + phụ âm): an [an], anh [aø], uyên [uIn]; ung
[uNm]
Ngữ âm tiếng Việt có vẻ rắc rối hơn về hình thức so với tiếng Anh, tiếng Pháp, nghĩa là cần phải nhớ ngay từ đầu những nguyên âm (vowel sounds), âm đôi (diphthongs), và âm ba (triphthongs). Nhƣng về lâu dài, hệ thống này trở thành đơn giản và dễ dàng cho ngƣời sử dụng hơn so với hệ thống ngữ âm tiếng Anh. Hệ thống ngữ âm của tiếng Việt là có quy tắc do đó ngƣời ta có thể suy ra một từ chƣa biết từ các từ tƣơng tự (giống với tiếng Nga) Trong khi ngƣời Anh-Mỹ suốt đời vẫn có những chữ không biết đọc. Mỗi lần nhƣ vậy họ phải dùng tự điển để tra cứu.
Tiếng Việt tƣơng đối ổn định về phƣơng diện ngữ âm (phonologically consistent), nghĩa là chữ a đọc thành âm [a] ở mọi nơi nó xuất hiện, chứ không biến đổi không theo quy luật nhƣ tiếng Anh.
Tiếng Việt có 23 âm vị là phụ âm. Tƣơng ƣ́ng với 23 âm vị phụ âm thì có 24 cách đọc (phát âm ), và đƣợc ghi lại bằng 27 chƣ̃ viết . 27 chƣ̃ viết này đƣợc hình thành từ 19 chƣ̃ cái (con chƣ̃) [8]:
Tiếng Việt có 16 âm vị là nguyên âm (trong đó có 13 nguyên âm đơn , 3 nguyên âm đôi) và 2 âm vị là bán nguyên âm *. Trong 16 âm vị nguyên âm và 2 âm vị bán nguyên âm thì có 17 cách đọc, và đƣợc ghi lại bằng 20 chƣ̃ viết. 20 chƣ̃ viết này đƣợc hình thành từ 12 chƣ̃ cái:
Các phƣơng pháp tổng hợp tiếng Việt khác nhau có các hƣớng nghiên cứu khác nhau về ngữ âm, do đó có các cách nhìn khác nhau về các thuộc tính hay các đặc trƣng của âm nhƣ phổ, formant, tần số cơ bản, cƣờng độ và độ dài của các âm tiết. Phƣơng pháp ghép nối không chỉ đơn giản là gắn kết các từ rời rạc thành một ngữ đoạn mà phải làm cho nó trở nên mịn và tự nhiên nhất. Việc nắm rõ đƣợc đặc điểm của âm tiết tiếng Việt là một công việc hết sức quan trọng trong quá trình nghiên cứu các phƣơng pháp tổng hợp tiếng Việt.