Đặc điểm âm tiết tiếng Việt Tính độc lập –– Âm tiết tiếng Việt được thể hiện rõ ràng, riêng Âm tiết tiếng Việt được thể hiện rõ ràng, riêng biệt với nhau.. Trong tiếng Việt không có hiệ
Trang 1Bài 6:
Tổng hợp tiếng nói tiếng Việt
Ở Việt Nam, việc nghiên cứu trong lĩnh vực
xử lý tiếng nói mới được phát triển trong thời gian gần đây
Tổng hợp tiếng nói tiếng Việt chủ yếu dựa
à h há hé ối á đ ị â
à h há hé ối á đ ị â
vào phương pháp ghép nối các đơn vị âm
Trang 2Âm tiết tiếng Việt
Âm tiết là đơn vị ngữ âm nhỏ nhất khi nói Cho dù phát âm thật chậm, thật rõ ràng thì những âm thanh tiếng nói phát ra không thể chia nhỏ ra được nữa
Âm tiết có tính toàn vẹn được tạo ra bởi
một đợt căng của bộ máy phát âm
Cá đợt ă ối tiế h t thà h ột
Cá đợt ă ối tiế h t thà h ột
Các đợt căng nối tiếp nhau tạo thành một chuỗi âm tiết
Trang 3Đặc điểm âm tiết tiếng Việt
Tính độc lập
–– Âm tiết tiếng Việt được thể hiện rõ ràng, riêng Âm tiết tiếng Việt được thể hiện rõ ràng, riêng biệt với nhau Trong tiếng Việt không có hiện tượng nối âm
Có khả năng mang ý nghĩa
Có khả năng mang ý nghĩa
–– Hầu hết các âm tiết tiếng Việt đều mang ý nghĩa Hầu hết các âm tiết tiếng Việt đều mang ý nghĩa
Trang 4 Âm tiết tiếng Việt có cấu trúc chặt chẽ Mỗi
âm tiết tiếng Việt ở dạng đầy đủ có 5 thành phần như sau:
Thanh điệu
Âm đệm Âm chính Âm cuối
Âm đệm Âm chính Âm cuối
Trang 5 Âm đầu:
–– Thường là phụ âm, có chức năng tạo ra âm sắc Thường là phụ âm, có chức năng tạo ra âm sắc
cho âm tiết lúc mở đầu Âm đầu có thể khuyết trong một số trường hợp.
Âm đệm:
Âm đệm:
–– Có chức năng làm thay đổi âm sắc của âm tiết Có chức năng làm thay đổi âm sắc của âm tiết lúc khởi đầu và làm phân biệt âm tiết này với âm p p ệ ệ y y tiết khác Âm đệm có thể khuyết trong một số trường hợp.
Trang 6 Âm chính:
–– Luôn luôn có mặt trong mọi âm tiết, có chức năng Luôn luôn có mặt trong mọi âm tiết, có chức năng
quy định âm sắc chủ yếu của âm tiết Âm chính luôn luôn là nguyên âm
Âm cuối:
Âm cuối:
–– Có thể là phụ âm hoặc bán nguyên âm, có chức Có thể là phụ âm hoặc bán nguyên âm, có chức năng là cơ sở phân chia loại hình âm tiết, để nhận g g p p ạ ạ , , ậ ậ
ra sự xuất hiện của thanh điệu
Thanh điệu:
–– luôn có mặt trong âm tiết, có chức năng phân luôn có mặt trong âm tiết, có chức năng phân
biệt âm tiết về cao độ
Trang 7Các giải pháp tổng hợp tiếng nói g g p p p p g ợp g ợp g g
tiếng Việt
Ghép tiếng nói từ những từ riêng lẻ
Ghép tiếng nói từ những đơn âm cơ bảnpp gg gg
Ghép tiếng nói theo hai phần: phụ âm đầu
và phần vần
Ghép tiếng nói từ các âm vị kép (diphone)
Trang 8Tổng hợp tiếng việt bằng cách ghép nối g ợp g ợp g ệ g ệ g g g g p p các âm vị kép (diphone)
Tiếng việt là ngôn ngữ đơn âm tiết, bất kỳ
từ nào cũng có thể được tạo thành từ hai
âm vị kép (diphone) ghép lại
Ví dụ:
ểể –– từ từ tôi có thể phân tích thành hai diphone “ tô” và
““ ôi”
Trang 9Các bước thực hiện tổng hợp tiếng nói ự ự ệ ệ g ợp g ợp g g tiếng Việt
1. Thu âm và tạo cơ sở dữ liệu diphone
2. Phân tích văn bản, xác định các diphone ,, ịị pp
cần sử dụng để tổng hợp
3. Ghép nối các diphone để tạo thành tiếng
nói tương ứng
4. Làm trơn và biến đổi thanh điệu tiếng nói
sau khi ghép nối
Trang 10Các diphone trong tiếng việt
Mỗi từ trong tiếng việt có thể được tạo
thành từ hai diphone
Từ = diphone bắt đầu + diphone kết thúc
–– Ví dụ: bạn = ba + an + thanh điệu Ví dụ: bạn = ba + an + thanh điệu
Diphone bắt đầu: một phụ âm đứng trước
và tiếp theo là nguyên âm
–– Ví dụ: ba, kha Ví dụ: ba, kha
Diphone kết thúc: một nhóm các nguyên
â đứ t ướ à tiế th là h â
â đứ t ướ à tiế th là h â
âm đứng trước và tiếp theo là phụ âm
–– Ví dụ: an, ương Ví dụ: an, ương
Trang 11 Theo thống kê, tổng số diphone cần có để tạo nên các từ trong tiếng việt là 389
diphone trong đó có 61 diphone kết thúc có dấu
XX bảbả h lh l á di há di h iếiế iệiệ
Xem bảng phụ lục các diphone tiếng việt
Trang 12Xây dựng cơ sở dữ liệu diphone y ự g y ự g ệ ệ p p
tiếng việt
Thu âm các mẫu tiếng nói
Tách các diphone từ mẫu tiếng nóipp gg
Lưu trữ dạng sóng âm thanh của diphone vào cơ sở dữ liệu
Trang 13Tổng hợp tiếng nói bằng cách ghép hai g ợp g ợp g g g g g g p p phần: phụ âm đầu và phần vần
Theo thống kê, trong tiếng Việt có 28 phụ
âm làm âm đầu và 650 vần
Xem bảng phụ lục các phụ âm đầu và vần trong tiếng Việt
Trang 14Xây dựng cơ sở dữ liệu phụ âm đầu và y ự g y ự g ệ p ụ ệ p ụ phần vần
Thu âm các mẫu tiếng nói
Tách các phụ âm đầu và phần vần từ mẫu p ụp ụ pp tiếng nói
Lưu trữ dạng sóng âm thanh của phụ âm đầu và phần vần vào cơ sở dữ liệu
Trang 15Các bước thực hiện tổng hợp tiếng nói ự ự ệ ệ g ợp g ợp g g
tiếng Việt
1. Thu âm và tạo cơ sở dữ liệu phụ âm đầu và
phần vần
2. Phân tích văn bản, xác định phụ âm đầu và
vần tạo nên từ
3. Ghép nối phụ âm đầu và phần vần tương
ứng trong CSDL để tạo thành tiếng nói
tươ ứ
tươ ứ
tương ứng
4. Làm trơn và biến đổi thanh điệu tiếng nói
sau khi ghép nối