1. Trang chủ
  2. » Kỹ Thuật - Công Nghệ

Xử lý tiếng nói - Speech Synthesis for Vietnamese

15 769 6
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 15
Dung lượng 157,7 KB

Nội dung

Đặc điểm âm tiết tiếng Việt„ Tính độc lập –– Âm tiết tiếng Việt được thể hiện rõ ràng, riêng Âm tiết tiếng Việt được thể hiện rõ ràng, riêng biệt với nhau.. Trong tiếng Việt không có hiệ

Trang 1

Bài 6:

Tổng hợp tiếng nói tiếng Việt

„ Ở Việt Nam, việc nghiên cứu trong lĩnh vực

xử lý tiếng nói mới được phát triển trong thời gian gần đây

„ Tổng hợp tiếng nói tiếng Việt chủ yếu dựa

à h há hé ối á đ ị â

à h há hé ối á đ ị â

vào phương pháp ghép nối các đơn vị âm

Trang 2

Âm tiết tiếng Việt

„ Âm tiết là đơn vị ngữ âm nhỏ nhất khi nói Cho dù phát âm thật chậm, thật rõ ràng thì những âm thanh tiếng nói phát ra không thể chia nhỏ ra được nữa

„ Âm tiết có tính toàn vẹn được tạo ra bởi

một đợt căng của bộ máy phát âm

Cá đợt ă ối tiế h t thà h ột

Cá đợt ă ối tiế h t thà h ột

„ Các đợt căng nối tiếp nhau tạo thành một chuỗi âm tiết

Trang 3

Đặc điểm âm tiết tiếng Việt

„ Tính độc lập

–– Âm tiết tiếng Việt được thể hiện rõ ràng, riêng Âm tiết tiếng Việt được thể hiện rõ ràng, riêng biệt với nhau Trong tiếng Việt không có hiện tượng nối âm

„ Có khả năng mang ý nghĩa

„ Có khả năng mang ý nghĩa

–– Hầu hết các âm tiết tiếng Việt đều mang ý nghĩa Hầu hết các âm tiết tiếng Việt đều mang ý nghĩa

Trang 4

„ Âm tiết tiếng Việt có cấu trúc chặt chẽ Mỗi

âm tiết tiếng Việt ở dạng đầy đủ có 5 thành phần như sau:

Thanh điệu

Âm đệm Âm chính Âm cuối

Âm đệm Âm chính Âm cuối

Trang 5

„ Âm đầu:

–– Thường là phụ âm, có chức năng tạo ra âm sắc Thường là phụ âm, có chức năng tạo ra âm sắc

cho âm tiết lúc mở đầu Âm đầu có thể khuyết trong một số trường hợp.

„ Âm đệm:

„ Âm đệm:

–– Có chức năng làm thay đổi âm sắc của âm tiết Có chức năng làm thay đổi âm sắc của âm tiết lúc khởi đầu và làm phân biệt âm tiết này với âm p p ệ ệ y y tiết khác Âm đệm có thể khuyết trong một số trường hợp.

Trang 6

„ Âm chính:

–– Luôn luôn có mặt trong mọi âm tiết, có chức năng Luôn luôn có mặt trong mọi âm tiết, có chức năng

quy định âm sắc chủ yếu của âm tiết Âm chính luôn luôn là nguyên âm

„ Âm cuối:

„ Âm cuối:

–– Có thể là phụ âm hoặc bán nguyên âm, có chức Có thể là phụ âm hoặc bán nguyên âm, có chức năng là cơ sở phân chia loại hình âm tiết, để nhận g g p p ạ ạ , , ậ ậ

ra sự xuất hiện của thanh điệu

„ Thanh điệu:

–– luôn có mặt trong âm tiết, có chức năng phân luôn có mặt trong âm tiết, có chức năng phân

biệt âm tiết về cao độ

Trang 7

Các giải pháp tổng hợp tiếng nói g g p p p p g ợp g ợp g g

tiếng Việt

„ Ghép tiếng nói từ những từ riêng lẻ

„ Ghép tiếng nói từ những đơn âm cơ bảnpp gg gg

„ Ghép tiếng nói theo hai phần: phụ âm đầu

và phần vần

„ Ghép tiếng nói từ các âm vị kép (diphone)

Trang 8

Tổng hợp tiếng việt bằng cách ghép nối g ợp g ợp g ệ g ệ g g g g p p các âm vị kép (diphone)

„ Tiếng việt là ngôn ngữ đơn âm tiết, bất kỳ

từ nào cũng có thể được tạo thành từ hai

âm vị kép (diphone) ghép lại

„ Ví dụ:

ểể –– từ từ tôi có thể phân tích thành hai diphone “ tô” và

““ ôi”

Trang 9

Các bước thực hiện tổng hợp tiếng nói ự ự ệ ệ g ợp g ợp g g tiếng Việt

1. Thu âm và tạo cơ sở dữ liệu diphone

2. Phân tích văn bản, xác định các diphone ,, ịị pp

cần sử dụng để tổng hợp

3. Ghép nối các diphone để tạo thành tiếng

nói tương ứng

4. Làm trơn và biến đổi thanh điệu tiếng nói

sau khi ghép nối

Trang 10

Các diphone trong tiếng việt

„ Mỗi từ trong tiếng việt có thể được tạo

thành từ hai diphone

„ Từ = diphone bắt đầu + diphone kết thúc

–– Ví dụ: bạn = ba + an + thanh điệu Ví dụ: bạn = ba + an + thanh điệu

„ Diphone bắt đầu: một phụ âm đứng trước

và tiếp theo là nguyên âm

–– Ví dụ: ba, kha Ví dụ: ba, kha

„ Diphone kết thúc: một nhóm các nguyên

â đứ t ướ à tiế th là h â

â đứ t ướ à tiế th là h â

âm đứng trước và tiếp theo là phụ âm

–– Ví dụ: an, ương Ví dụ: an, ương

Trang 11

„ Theo thống kê, tổng số diphone cần có để tạo nên các từ trong tiếng việt là 389

diphone trong đó có 61 diphone kết thúc có dấu

XX bảbả h lh l á di há di h iếiế iệiệ

„ Xem bảng phụ lục các diphone tiếng việt

Trang 12

Xây dựng cơ sở dữ liệu diphone y ự g y ự g ệ ệ p p

tiếng việt

„ Thu âm các mẫu tiếng nói

„ Tách các diphone từ mẫu tiếng nóipp gg

„ Lưu trữ dạng sóng âm thanh của diphone vào cơ sở dữ liệu

Trang 13

Tổng hợp tiếng nói bằng cách ghép hai g ợp g ợp g g g g g g p p phần: phụ âm đầu và phần vần

„ Theo thống kê, trong tiếng Việt có 28 phụ

âm làm âm đầu và 650 vần

„ Xem bảng phụ lục các phụ âm đầu và vần trong tiếng Việt

Trang 14

Xây dựng cơ sở dữ liệu phụ âm đầu và y ự g y ự g ệ p ụ ệ p ụ phần vần

„ Thu âm các mẫu tiếng nói

„ Tách các phụ âm đầu và phần vần từ mẫu p ụp ụ pp tiếng nói

„ Lưu trữ dạng sóng âm thanh của phụ âm đầu và phần vần vào cơ sở dữ liệu

Trang 15

Các bước thực hiện tổng hợp tiếng nói ự ự ệ ệ g ợp g ợp g g

tiếng Việt

1. Thu âm và tạo cơ sở dữ liệu phụ âm đầu và

phần vần

2. Phân tích văn bản, xác định phụ âm đầu và

vần tạo nên từ

3. Ghép nối phụ âm đầu và phần vần tương

ứng trong CSDL để tạo thành tiếng nói

tươ ứ

tươ ứ

tương ứng

4. Làm trơn và biến đổi thanh điệu tiếng nói

sau khi ghép nối

Ngày đăng: 07/11/2013, 07:15

TỪ KHÓA LIÊN QUAN

w