Cõch Thức Tổng Hợp Tiếng Nụi Dỳng Trong Text – To – Speech:

Một phần của tài liệu dịch vụ điện thoại 116, cơ sở lý thuyết và thiết kế hệ (Trang 54)

II. TRUY XUẤT DỮ LIỆU DỉNG ODBC: 1.Giới Thiệu Về ODBC :

2.Cõch Thức Tổng Hợp Tiếng Nụi Dỳng Trong Text – To – Speech:

Module xử lý tiếng nụi được hiện thực trong đề tỏi lỏ một ứng dụng của Text – to – speech nởn chỷng em phải tớm hiểu về nụ.

Vậy Text - to - speech lỏ gớ :

Text-to-speech lỏ một bộ phận của nhận dạng tiếng nụi (Speech Recognition). Text to speech lỏ một quõ trớnh chuyển dạng văn bản (text) sang tiếng nụi (speech)

Phón loại Text – to – speech :

Text – to – speech được phón loại dựa vỏo phương phõp được sử dụng để chuyển văn bản sang tiếng nụi.Text – to – speech được phón thỏnh cõc loại sau:

a).Concatenated Word:

Trong một hệ thống Concatenated word, những từ vỏ ngữ được thu óm trước, khi nhận được một chuỗi cần đọc, hệ thống sẽ tõch ra thỏnh cõc từ, tớm cõc từ đọ được thu óm, kết hợp với nhau vỏ phõt óm.

b).Tng hp:

Text – to – speech sử dụng phương phõp tổng hợp tạo óm giống những gớ được tạo bởi giọng con người vỏ cung cấp nhiều bộ lọc mừ phỏng chiều dỏi, cổ họng, khoang miệng, hớnh dạng mừi vỏ vị trợ lưỡi.ằm thanh được tạo bởi kỹ thuật tổng hợp hiện tại cụ xu hướng ợt giống giọng con người hơn óm được tạo bởi diphone concatenation nhưng cụ thể đạt được những chất lượng khõc nhau của giọng bằng cõch thay đổi một vỏi thừng số.

c).Hai óm tố:(Diphone Concatenation)

Phương phõp nỏy nối những đoạn ngắn óm thanh được số hụa lại với nhau vỏ tạo ra óm thanh liởn tục. Mỗi diphone bao gồm hai óm vị (phonemes), một óm vị bắt đầu óm ,óm vị cún lại kết thỷc óm. Vợ dụ từ "hello" bao gồm những óm vị sau: " h eh l oe" .Những diphone tương ứng lỏ "silence - h h -eh eh -l l-oe oe-silence .

Diphone được tạo bằng cõch thu giọng người vỏ xõc định một cõch cẩn thận tỉ mỉ vị trợ bắt đầu vỏ kết thỷc của những óm vị. Mặc dỳ kỹ thuật nỏy cụ thể tạo óm giống thật, phải tốn cừng sức để lỏm việc nỏy vỏ giọng khừng cố định bởi những óm vị chỉ đặc trưng bởi ngừn ngữ của người phõt óm.

KILOB OB OO KS .CO M

Một ứng dụng sử dụng Text – to – speech khi nụ cụ nhu cầu trao đổi thừng tin một cõch rử rỏng với người sử dụng vỏ khi việc ghi óm từ vỏ ngữ khừng thỏa đõng. Nụi chung Text – to – speech tốt hơn ghi óm vớ:

−Việc ghi óm tốn một dung lượng lưu trữ quõ lớn hoặc quõ phung phợ khi ghi óm. −Ghi óm lỏ khừng thể vớ ứng dụng khừng biết điểm bắt đầu thời gian mỏ nụ sẽ phõt óm.

4. Nhng Lý Do Cho Vic Thc Thi Text – To – Speech

Text - to -speech cho thấy một số lợi ợch. Nụi chung Text-to-speech hữu dụng cho những cụm từ ngắn hoặc cho những trường hợp việc thu óm trước khừng thực tế.Text-to-speech cụ những ứng dụng thực tế sau :

a).Đọc văn bn động :

Text – to – speech hữu dụng cho những cụm từ thay đổi quõ nhiều khừng thể thu óm vỏ lưu trữ khi dỳng tất cả những cõch thay thế cụ thể. Vợ dụ : đọc thời gian lỏ một ứng dụng của Text – to – speech .

b).Proofreading : (kim chng vic đọc)

Kiểm chứng việc đọc cụ thể nghe được của văn bản, số vỏ giỷp người sử dụng nắm được những lỗi gử bỏn phợm do kiểm chứng việc đọc trực giõc.

c).Tiết kim khừng gian lưu tr :

Text – to – speech hữu dụng cho những cụm từ cần quõ nhiều vỳng lưu trữ nếu chỷng được thu óm trước ở định dạng số hụa óm.

d).Lưu ý người dỳng v nhng s kin :

Text – to – speech lỏm việc rất hiệu quả với những thừng bõo. Vợ dụ để thừng bõo cho người sử dụng cừng việc in đọ hoỏn thỏnh, ứng dụng cụ thể "nụi" "Printing complete" thay vớ hiển thị một hộp thoại vỏ yởu cầu người dỳng click OK.

e).Cung cp phn hi rử rỏng :

Text – to – speech cung cấp phản hồi rử rỏng khi phản hồi trực quan khừng đủ hoặc khừng thể. Vợ dụ : Mắt người sử dụng cụ thể đang bận với một cừng việc khõc chẳng hạn như đang chờp dữ liệu từ một tờ giấy. Người sử dụng cụ ợt chỷ cụ thể dựa vỏo Text – to – speech như lỏ phương tiện nền của phản hồi từ mõy tợnh.

5. Nhng Ưng Dng Tim Năng Ca Text – To – Speech :

Sử dụng Text – to – speech phụ thuộc vỏo ứng dụng. Sau đóy lỏ một vỏi ý tưởng ứng dụng của nụ:

a).Trú chơi vỏ giõo dc

Text – to – speech hữu dụng trong trú chơi vỏ giõo dục, cho phờp những ký tự trong ứng dụng "nụi" thật sự với người sử dụng thay vớ hiển thị. Tất nhiởn cũng cụ thể thu óm lời nụi. Một ứng dụng sẽ sử dụng Text – to – speech thay vớ thu óm trong trường hợp luừn luừn (adsbygoogle = window.adsbygoogle || []).push({});

KILOB OB OO KS .CO M

cụ thể sử dụng concatenated word /phrase Text – to – speech để thay thế ghi óm khi nụ thật sự chỉ dỳng thu óm những cụm từ hoặc tư. Người thiết kế ứng dụng cụ thể dễ dỏng thu óm toỏn bộ những cóu được thực thi bởi Text – to – speech.

b).Telephone:

Text – to – speech được ứng dụng trong hộp thư thoại, phần mềm trả lời tự động vỏ được mở rộng cho E – mail, sõch, vỏ những loại dữ liệu khõc.

6. Hn Chế Ca Text – to – speech:

a). Cht lượng ging nụi ca Text – to – speech Hầu hết cõc phương phõp Text – to – speech cụ thể đọc từng từ riởng biệt rất tốt. Tuy nhiởn, ngay khi mõy đọc 1 cóu, rất dễ xõc định đụ lỏ giọng đọc tổng hợp bởi vớ nụ thiếu ngừn điệu (nhịp ngắt, trọng óm) nghĩa lỏ sự biến tố dấu nhấn vỏ thời gian đọc. Vỏ vớ lý do đụ, hầu hết giọng nụi của Text – to – speech rất khụ nghe vỏ đúi hỏi sự tập trung cao.

Vỏi phương phõp Text – to – speech cho phờp một ứng dụng định nghĩa những đoạn Text – to – speech gắn với ngừn điệu của con người, lỏm cho giọng tổng hợp rử rỏng hơn. Phương phõp Text – to – speech cung cấp khả năng nỏy bằng cõch ghi óm trước giọng nụi của con người, cho phờp người phõt triển ứng dụng thay đổi ngữ điệu vỏ tốc độ phõt óm của văn bản đang được đọc.

Về hiệu quả, cõch lỏm trởn lỏ một thuật toõn nờn giọng hiệu quả. Mặc dỳ văn bản với ngừn điệu đúi hỏi nhiều vỳng lưu trữ hơn văn bản ASCII (1Kbyte / phỷt), trong trường hợp ghi óm trước yởu cầu vỳng lưu trữ ợt nhất lỏ 30Kbyte/phỷt. Những nhón tố ảnh hưởng đến giọng nụi tổng hợp :

b).S xỷc cm (emotion):

Mặc dỳ nhiều phương phõp Text – to – speech cụ thể phón tợch vỏ thể hiện những dấu chấm cóu như dấu chấm, dấu phẩy, dấu chấm cảm, dấu hỏi, nhưng khừng cụ phương phõp Text – to – speech nỏo cụ thể thể hiện giọng nụi như con người.

c).S phõt óm sai (mispronounciation):

Text – to – speech sử dụng một tập những quy luật phõt óm để chuyển văn bản sang óm vị. Điều nỏy dễ dỏng với ngừn ngữ cụ phiởn óm bảng chữ cõi (chẳng hạn như với Tiếng Việt). Nếu Text – to – speech phõt óm sai 1 từ, cõch duy nhất mỏ người sử dụng cụ thể thay đổi cõch phõt óm lỏ thởm cả óm vị (đóy khừng phải lỏ cừng việc dễ dỏng) hoặc chọn một chuỗi của những từ phõt óm giống nhau, kết hợp tạo cõch phõt óm đỷng.

Trởn đóy lỏ nhng khõi nim chung nht, nhng ng dng hin nay ca Text-to- speech mỏ chỷng ta cn phi nm được trước khi nghiởn cu đến ng dng đọc Tiếng Vit

được phõt trin trong đề tỏi.

Một phần của tài liệu dịch vụ điện thoại 116, cơ sở lý thuyết và thiết kế hệ (Trang 54)