SƠ LƯỢC VỀ TIẾNG Nể

Một phần của tài liệu Tài liệu Giải pháp bán tự động dịch vụ 116 docx (Trang 55 - 58)

1. Đặc Tợnh Chung Của Tiếng Nụi:

Tiếng nụi lỏ cừng cụ diễn đạt thừng tin rất uyển chuyển vỏ đặc biệt. Khi chỷng ta phõt ra một tiếng thớ cụ rất nhiều bộ phận như lưỡi, thanh mừn, mừi, họng, thanh quản…kết hợp với nhau để tạo thỏnh ĩm thanh. ằm thanh nỏy lan truyền trong khừng khợ để đến tai người nhận; chợnh vớ sự kết hợp rất nhiều bộ phận để tạo ra ĩm thanh nỏy do đụ ĩm thanh được phõt ra ở mỗi lần hầu như lỏ khõc nhau. Vớ vậy việc phĩn chia tiếng nụi thỏnh những loại cụ đặc tợnh riởng lỏ rất khụ. Ở đĩy người ta tạm chia thỏnh ba loại:

Voiced Sound:

Khi chỷng ta nụi chữ "a" hay chữ "o" thanh mừn của ta rung vỏ giọn ra õp suất khừng khợ ban đầu lớn vỏ từ từ giảm xuống, lỷc nỏy ĩm phõt ra cụ dạng sụng wave đặc trưng như hớnh vẽ.

Unvoiced Sound:

Lỏ ĩm khi ta phõt ra một tiếng mỏ thanh ĩm khừng rung. Cụ hai loại cơ bản: phụ ĩm sõt (fricative) vỏ ĩm bật hơi (aspirate). Đối với phụ ĩm sõt (khi phõt ĩm vần "s"), điểm co thắt được tạo ra tại vỏi điểm trởn bộ mõy phõt ĩm, vỏ khừng khợ được đẩy qua nụ. Vớ điểm co thắt cụ khuynh hướng xảy ra gần miệng, tiếng dội của bộ mõy phõt ĩm cụ ảnh hưởng nhỏ trong việc tạo nởn phụ ĩm sõt. Đối với ĩm bật hơi (khi phõt ĩm vần "h") sự dao động khừng khợ xảy ra tại thanh mừn bởi vớ dĩy thanh ĩm được giữ lại một phần. Trong trường hợp nỏy, tiếng dội của bộ mõy phõt ĩm điều chỉnh phổ của tiếng ồn. Điều nỏy được thấy rử nhất khi chỷng ta nghe những ĩm thanh nhỏ, xớ xỏo.

Plosive sound :

Trong trường hợp nỏy, bộ mõy phõt ĩm được đụng kợn, õp suất khừng khợ bị nờn vỏ được giải thõt thớnh lớnh. Sự giải thõt nhanh chụng õp suất nỏy tạo nởn một sự kợch thợch ngắn cho bộ mõy phõt ĩm. Sự kợch thợch ngắn nỏy cụ thể xảy ra với sự cụ rung / khừng rung của dĩy thanh ĩm để tạo nởn ĩm thanh voice/unvoice plosive

2. Cõch Thức Tổng Hợp Tiếng Nụi Dỳng Trong Text – To – Speech :

Module xử lý tiếng nụi được hiện thực trong đề tỏi lỏ một ứng dụng của Text – to – speech nởn chỷng em phải tớm hiểu về nụ.

Vậy Text - to - speech lỏ gớ :

Text-to-speech lỏ một bộ phận của nhận dạng tiếng nụi (Speech Recognition). Text to speech lỏ một qũ trớnh chuyển dạng văn bản (text) sang tiếng nụi (speech)

Phĩn loại Text – to – speech :

Text – to – speech được phĩn loại dựa vỏo phương phõp được sử dụng để chuyển văn bản sang tiếng nụi.Text – to – speech được phĩn thỏnh cõc loại sau:

a). Concatenated Word:

Trong một hệ thống Concatenated word, những từ vỏ ngữ được thu ĩm trước, khi nhận được một chuỗi cần đọc, hệ thống sẽ tõch ra thỏnh cõc từ, tớm cõc từ đọ được thu ĩm, kết hợp với nhau vỏ phõt ĩm.

b). Tổng hợp :

Text – to – speech sử dụng phương phõp tổng hợp tạo ĩm giống những gớ được tạo bởi giọng con người vỏ cung cấp nhiều bộ lọc mừ phỏng chiều dỏi, cổ họng, khoang miệng, hớnh dạng mừi vỏ vị trợ lưỡi.ằm thanh được tạo bởi kỹ thuật tổng hợp hiện tại cụ xu hướng ợt giống giọng con người hơn ĩm được tạo bởi diphone concatenation nhưng cụ thể đạt được những chất lượng khõc nhau của giọng bằng cõch thay đổi một vỏi thừng số.

c). Hai ĩm tố:(Diphone Concatenation)

Phương phõp nỏy nối những đoạn ngắn ĩm thanh được số hụa lại với nhau vỏ tạo ra ĩm thanh liởn tục. Mỗi diphone bao gồm hai ĩm vị (phonemes), một ĩm vị bắt đầu ĩm ,ĩm vị cún lại kết thỷc ĩm. Vợ dụ từ "hello" bao gồm những ĩm vị sau: " h eh l oe" .Những diphone tương ứng lỏ "silence - h h -eh eh -l l-oe oe-silence .

Diphone được tạo bằng cõch thu giọng người vỏ xõc định một cõch cẩn thận tỉ mỉ vị trợ bắt đầu vỏ kết thỷc của những ĩm vị. Mặc dỳ kỹ thuật nỏy cụ thể tạo ĩm giống thật, phải tốn cừng sức để lỏm việc nỏy vỏ giọng khừng cố định bởi những ĩm vị chỉ đặc trưng bởi ngừn ngữ của người phõt ĩm.

3. Tại Sao Sử Dụng Text – To – Speech ?

Một ứng dụng sử dụng Text – to – speech khi nụ cụ nhu cầu trao đổi thừng tin một cõch rử rỏng với người sử dụng vỏ khi việc ghi ĩm từ vỏ ngữ khừng thỏa đõng. Nụi chung Text – to – speech tốt hơn ghi ĩm vớ:

− Việc ghi ĩm tốn một dung lượng lưu trữ qũ lớn hoặc qũ phung phợ khi ghi ĩm. − Ghi ĩm lỏ khừng thể vớ ứng dụng khừng biết điểm bắt đầu thời gian mỏ nụ sẽ phõt ĩm.

4. Những Lý Do Cho Việc Thực Thi Text – To – Speech

Text - to -speech cho thấy một số lợi ợch. Nụi chung Text-to-speech hữu dụng cho những cụm từ ngắn hoặc cho những trường hợp việc thu ĩm trước khừng thực tế.Text-to-speech cụ những ứng dụng thực tế sau :

a). Đọc văn bản động :

Text – to – speech hữu dụng cho những cụm từ thay đổi qũ nhiều khừng thể thu ĩm vỏ lưu trữ khi dỳng tất cả những cõch thay thế cụ thể. Vợ dụ : đọc thời gian lỏ một ứng dụng của Text – to – speech .

b). Proofreading : (kiểm chứng việc đọc)

Kiểm chứng việc đọc cụ thể nghe được của văn bản, số vỏ giỷp người sử dụng nắm được những lỗi gử bỏn phợm do kiểm chứng việc đọc trực giõc.

c). Tiết kiệm khừng gian lưu trữ : (adsbygoogle = window.adsbygoogle || []).push({});

Text – to – speech hữu dụng cho những cụm từ cần qũ nhiều vỳng lưu trữ nếu chỷng được thu ĩm trước ở định dạng số hụa ĩm.

d). Lưu ý người dỳng về những sự kiện :

Text – to – speech lỏm việc rất hiệu quả với những thừng bõo. Vợ dụ để thừng bõo cho người sử dụng cừng việc in đọ hoỏn thỏnh, ứng dụng cụ thể "nụi" "Printing complete" thay vớ hiển thị một hộp thoại vỏ yởu cầu người dỳng click OK.

e). Cung cấp phản hồi rử rỏng :

Text – to – speech cung cấp phản hồi rử rỏng khi phản hồi trực quan khừng đủ hoặc khừng thể. Vợ dụ : Mắt người sử dụng cụ thể đang bận với một cừng việc khõc chẳng hạn như đang chờp dữ liệu từ một tờ giấy. Người sử dụng cụ ợt chỷ cụ thể dựa vỏo Text – to – speech như lỏ phương tiện nền của phản hồi từ mõy tợnh.

5. Những Ưng Dụng Tiềm Năng Của Text – To – Speech :

Sử dụng Text – to – speech phụ thuộc vỏo ứng dụng. Sau đĩy lỏ một vỏi ý tưởng ứng dụng của nụ:

a). Trú chơi vỏ giõo dục

Text – to – speech hữu dụng trong trú chơi vỏ giõo dục, cho phờp những ký tự trong ứng dụng "nụi" thật sự với người sử dụng thay vớ hiển thị. Tất nhiởn cũng cụ thể thu ĩm lời nụi. Một ứng dụng sẽ sử dụng Text – to – speech thay vớ thu ĩm trong trường hợp luừn luừn

cụ thể sử dụng concatenated word /phrase Text – to – speech để thay thế ghi ĩm khi nụ thật sự chỉ dỳng thu ĩm những cụm từ hoặc tư. Người thiết kế ứng dụng cụ thể dễ dỏng thu ĩm toỏn bộ những cĩu được thực thi bởi Text – to – speech.

b). Telephone :

Text – to – speech được ứng dụng trong hộp thư thoại, phần mềm trả lời tự động vỏ được mở rộng cho E – mail, sõch, vỏ những loại dữ liệu khõc.

6. Hạn Chế Của Text – to – speech:

a). Chất lượng giọng nụi của Text – to – speech Hầu hết cõc phương phõp Text – to – speech cụ thể đọc từng từ riởng biệt rất tốt. Tuy nhiởn, ngay khi mõy đọc 1 cĩu, rất dễ xõc định đụ lỏ giọng đọc tổng hợp bởi vớ nụ thiếu ngừn điệu (nhịp ngắt, trọng ĩm) nghĩa lỏ sự biến tố dấu nhấn vỏ thời gian đọc. Vỏ vớ lý do đụ, hầu hết giọng nụi của Text – to – speech rất khụ nghe vỏ đúi hỏi sự tập trung cao.

Vỏi phương phõp Text – to – speech cho phờp một ứng dụng định nghĩa những đoạn Text – to – speech gắn với ngừn điệu của con người, lỏm cho giọng tổng hợp rử rỏng hơn. Phương phõp Text – to – speech cung cấp khả năng nỏy bằng cõch ghi ĩm trước giọng nụi của con người, cho phờp người phõt triển ứng dụng thay đổi ngữ điệu vỏ tốc độ phõt ĩm của văn bản đang được đọc.

Về hiệu quả, cõch lỏm trởn lỏ một thuật tõn nờn giọng hiệu quả. Mặc dỳ văn bản với ngừn điệu đúi hỏi nhiều vỳng lưu trữ hơn văn bản ASCII (1Kbyte / phỷt), trong trường hợp ghi ĩm trước yởu cầu vỳng lưu trữ ợt nhất lỏ 30Kbyte/phỷt. Những nhĩn tố ảnh hưởng đến giọng nụi tổng hợp :

b). Sự xỷc cảm (emotion ):

Mặc dỳ nhiều phương phõp Text – to – speech cụ thể phĩn tợch vỏ thể hiện những dấu chấm cĩu như dấu chấm, dấu phẩy, dấu chấm cảm, dấu hỏi, nhưng khừng cụ phương phõp Text – to – speech nỏo cụ thể thể hiện giọng nụi như con người.

c). Sự phõt ĩm sai (mispronounciation):

Text – to – speech sử dụng một tập những quy luật phõt ĩm để chuyển văn bản sang ĩm vị. Điều nỏy dễ dỏng với ngừn ngữ cụ phiởn ĩm bảng chữ cõi (chẳng hạn như với Tiếng Việt). Nếu Text – to – speech phõt ĩm sai 1 từ, cõch duy nhất mỏ người sử dụng cụ thể thay đổi cõch phõt ĩm lỏ thởm cả ĩm vị (đĩy khừng phải lỏ cừng việc dễ dỏng) hoặc chọn một chuỗi của những từ phõt ĩm giống nhau, kết hợp tạo cõch phõt ĩm đỷng.

Trởn đĩy lỏ những khõi niệm chung nhất, những ứng dụng hiện nay của Text-to- speech mỏ chỷng ta cần phải nắm được trước khi nghiởn cứu đến ứng dụng đọc Tiếng Việt được phõt triển trong đề tỏi.

Một phần của tài liệu Tài liệu Giải pháp bán tự động dịch vụ 116 docx (Trang 55 - 58)