4. CHƢƠNG 4: NGỮ ÂM TIẾNG VIỆT
4.1 Tổng quan về ngữ âm tiếng Việt
4.2 Các đặc điểm của âm tiết tiếng Việt 4.3 Cấu trúc của âm tiết tiếng Việt 4.4 Thanh điệu trong tiếng Việt
Việc xây dựng bộ tổng hợp tiếng nĩi địi hỏi phải thấu hiểu đƣợc ngữ âm tiếng Việt để từ đĩ trích chọn ra các đặc trƣng ngữ âm, các quy luật ngữ điệu để thiết lập nên một bộ tham số thích hợp cho việc tổng hợp tiếng Việt.
Với mỗi phƣơng pháp tổng hợp tiếng nĩi yêu cầu các đặc trƣng âm học về phổ, formant, tần số cơ bản, cƣờng độ và độ dài của các âm tiết khác nhau. Một ngữ đoạn khơng chỉ đơn thuần là việc ghép nối các đơn vị âm một cách rời rạc mà cịn cần phải cĩ các nghiên cứu về thanh điệu và độ dài của tiếng Việt trong từng ngữ lƣu, đảm bảo tính tự nhiên của tiếng nĩi khi tổng hợp.
4.1 Tổng quan về ngữ âm tiếng Việt
Tiếng Việt thuộc loại đơn âm (phonologically monosyllabic) bao gồm nguyên âm V (vowel sound) và phụ âm C (consonant sound) đƣợc kết hợp thành ba hình thức CV, CVC hoặc VC:
- Hình thức CV (phụ âm + nguyên âm): ca [ca], ghe [ge], nghe [Ne]
- Hình thức CVC (phụ âm + nguyên âm + phụ âm): can [can], ghềnh [gè],
nghếch [Nec]
- Hình thức VC (nguyên âm + phụ âm): an [an], anh [à], uyên [uIn]; ung
[uNm]
Ngữ âm tiếng Việt cĩ vẻ rắc rối hơn về hình thức so với tiếng Anh, tiếng Pháp, nghĩa là cần phải nhớ ngay từ đầu những nguyên âm (vowel sounds), âm đơi (diphthongs), và âm ba (triphthongs). Nhƣng về lâu dài, hệ thống này trở thành đơn giản và dễ dàng cho ngƣời sử dụng hơn so với hệ thống ngữ âm tiếng Anh. Hệ thống ngữ âm của tiếng Việt là cĩ quy tắc do đĩ ngƣời ta cĩ thể suy ra một từ chƣa biết từ các từ tƣơng tự (giống với tiếng Nga) Trong khi ngƣời Anh-Mỹ suốt đời vẫn cĩ những chữ khơng biết đọc. Mỗi lần nhƣ vậy họ phải dùng tự điển để tra cứu.
Tiếng Việt tƣơng đối ổn định về phƣơng diện ngữ âm (phonologically consistent), nghĩa là chữ a đọc thành âm [a] ở mọi nơi nĩ xuất hiện, chứ khơng biến đổi khơng theo quy luật nhƣ tiếng Anh.
Tiếng Việt có 23 âm vị là phụ âm. Tƣơng ƣ́ng với 23 âm vị phụ âm thì có 24 cách đọc (phát âm ), và đƣợc ghi lại bằng 27 chƣ̃ viết . 27 chƣ̃ viết này đƣợc hình thành từ 19 chƣ̃ cái (con chƣ̃) [8]:
Tiếng Việt có 16 âm vị là nguyên âm (trong đó có 13 nguyên âm đơn , 3 nguyên âm đơi) và 2 âm vị là bán nguyên âm *. Trong 16 âm vị nguyên âm và 2 âm vị bán nguyên âm thì cĩ 17 cách đọc, và đƣợc ghi lại bằng 20 chƣ̃ viết. 20 chƣ̃ viết này đƣợc hình thành từ 12 chƣ̃ cái:
Các phƣơng pháp tổng hợp tiếng Việt khác nhau cĩ các hƣớng nghiên cứu khác nhau về ngữ âm, do đĩ cĩ các cách nhìn khác nhau về các thuộc tính hay các đặc trƣng của âm nhƣ phổ, formant, tần số cơ bản, cƣờng độ và độ dài của các âm tiết. Phƣơng pháp ghép nối khơng chỉ đơn giản là gắn kết các từ rời rạc thành một ngữ đoạn mà phải làm cho nĩ trở nên mịn và tự nhiên nhất. Việc nắm rõ đƣợc đặc điểm của âm tiết tiếng Việt là một cơng việc hết sức quan trọng trong quá trình nghiên cứu các phƣơng pháp tổng hợp tiếng Việt.