Bộ phân tích văn bản chịu trách nhiệm về tất cả vấn đề về văn bản, thực hiện sự phân tích ngữ nghĩa và cú pháp tỉ mỉ để xác định các tính chất trợ giúp cho quá trình phân tích ngữ âm hiệu quả từ đó có thể thể hiện được sự phát âm chính xác và phát sinh ngôn điệu một cách hợp lý.
Xác định cấu trúc văn bản
Chuẩn hóa văn bản
Phân tích ngôn ngữ Modul phân tích văn bản Xử lý nhập nhằng từ đồng dạng Phân tích hình thái học
Biến đổi chữ viết về dạng phát âm được (LTS) Modul phân tích ngữ âm Văn bản thô Văn bản được gán nhãn Văn bản được gán nhãn
Hình 3.1. Cấu trúc modun hóa bộ phân tích văn bản và ngữ âm Từ điển
Trong hình 3.1, phân tích văn bản cho TTS đòi hỏi 3 quá trình liên quan sau [15]:
- Xác định cấu trúc văn bản: cấu trúc văn bản là rất quan trọng nhằm cung
cấp một ngữ cảnh cho tất cả các quá trình sau đó. Một số thành phần của cấu trúc văn bản như ngắt câu và các đoạn có thể trực tiếp liên quan đến ngôn điệu.
- Chuẩn hóa văn bản: Chuẩn hóa văn bản là biến đổi từ nhiều ký hiệu khác
nhau như con số, các thực thể phi chính tả khác của văn bản thành một phiên âm chính tả nói chung phù hợp cho biến đổi thành chuỗi ngữ âm.
- Phân tích ngôn ngữ học: phân tích ngôn ngữ là xác định các điều khoản cú
pháp và các đặc trưng ngữ nghĩa về từ , cụm từ, mệnh đề và câu mà quan trọng cho cả phát âm và ngôn điệu trong các quá trình tiếp theo.
Nhiệm vụ của phân tích ngữ âm là biến đổi các ký hiệu chính tả từ vựng thành âm vị cùng với các thông tin về dấu thanh có thể có như vị trí của trọng âm. Phân tích ngữ âm thường quy về biến đổi tự vị thành âm vị. Mục đích là rõ ràng, vì các âm vị là đơn vị cơ bản của âm thanh như đã mô tả trong chương 2. Biến đổi tự vị thành âm vị là bình thường cho các ngôn ngữ mà có quan hệ đơn giản giữa chính tả và âm vị học. Có 3 dịch vụ sau cần thiết để sản sinh ra các phát âm chính xác:
- Xử lí nhập nhằng từ đồng dạng: modul này là rất quan trọng cho các ngôn
ngữ Ấn-Âu khi có nhiều từ đồng dạng nhưng phát âm có thể là khác nhau như object (/ah b jh eh k t/ là một động từ hoặc như một danh từ /â b jh eh k t/). Với tiếng Việt tỏ ra không quan trọng, bởi vì với tiếng Việt là ngôn ngữ ghi âm, viết như thế nào sẽ đọc như thế.
- Phân tích hình vị : Phân tích các hình vị cung cấp tín hiệu quan trọng để đạt
được các phát âm cho chuyển điệu và tìm ra nguồn gốc các từ. Trong tiếng Việt không có sự biến đổi về hình vị từ. Phương pháp ngữ pháp nằm ngoài từ. Phương pháp ngữ pháp chủ yếu là trật tự từ và từ hư.
- Biến đổi chữ viết về dạng phát âm: Giai đoạn cuối cùng của phân tích ngữ
âm nói chung bao gồm các quy tắc hoặc modul LTS và một từ điển để cho đầu ra là các phát âm chính xác cho bất kỳ một từ nào. Như đã nói , tiếng Việt là ngôn ngữ ghi âm , nên không khó khăn trong việc đưa từ tự vị về dạng âm vị để phát âm cho chính xác.
nói trên không phải là một tuân theo một trật tự bắt buộc mặc dù trong phần lớn các TTS hiện nay đều có quá trình xử lí như vậy. Có nghĩa là mỗi quá trình nói trên có thể phát sinh nhiều giả thuyết với hy vọng là quá trình tiếp theo sau đó có thể xử lí sự nhập nhằng các giả thuyết đó bằng cách sử dụng nhiều hơn tri thức. Ví dụ: trong modul xác định cấu trúc văn bản đôi khi có thể không phân biệt rõ ràng dấu chấm câu “.” là dấu kết thúc một câu hoặc là dấu hiệu của chữ viết tắt. Quá trình xác định cấu trúc văn bản có thể truyền các giả thuyết cho các quá trình sau và truyền cả quyết định có thể được hoãn lại cho đến khi có đủ thông tin để có một quyết định thuyết phục hơn trong các modul tiếp theo như chuẩn hóa văn bản hay phân tích ngôn ngữ. Khi phát sinh nhiều giả thuyết thì quá trình có thể gán thông tin xác xuất nếu nó bao hàm cấu trúc xác xuất cơ sở. Kiến trúc ống dẫn linh hoạt này tránh các lỗi tạo ra bởi các quá trình trước đó do không đủ tri thức cần thiết.