1. Trang chủ
  2. » Luận Văn - Báo Cáo

Mô hình markov ẩn và ứng dụng vào tổng hợp tiếng nói

98 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Mô Hình Markov Ẩn Và Ứng Dụng Vào Tổng Hợp Tiếng Nói
Tác giả Nguyễn Quang Sức
Người hướng dẫn PGS.TS Trịnh Văn Loan
Trường học Trường Đại học Bách khoa Hà Nội
Chuyên ngành Kỹ thuật máy tính và truyền thông
Thể loại Luận văn thạc sỹ
Năm xuất bản 2013
Thành phố Hà Nội
Định dạng
Số trang 98
Dung lượng 4,05 MB

Cấu trúc

  • 1.1. M u (8)
  • 1.2. B máy phát âm (8)
    • 1.2.1. B máy phát âm ộ (8)
    • 1.2.2. Cơ chế phát âm (9)
    • 1.3.1. Âm h u thanh và âm vô thanh ữ (9)
    • 1.3.2. Âm v ị (10)
    • 1.3.3. Các đặ c tính khác (11)
  • 1.4. Mô hình t o ti ng nói (12)
  • 1.5. Phân tích ti ng nói (17)
    • 1.5.1. Mô hình phân tích ti ng nói ế (17)
    • 1.5.2. Phân tích ti ng nói ng n h n ế ắ ạ (18)
  • 1.6. Phân tích Mel-Cepstral (19)
    • 1.6.1. T o ti ng nói t mô hình th i gian r ạ ế ừ ờ ờ i r ạ c (19)
    • 1.6.2. Phân tích Mel-Cepstral (20)
    • 1.6.3. B l c MLSA (Mel Log Spectral Approximation) ộ ọ (0)
  • 2.1. Gi i thi u chung (27)
    • 2.2.1. Tổng hợp theo cấu trúc âm (28)
    • 2.2.2. Tổng hợp formant theo quy luật (31)
    • 2.2.3. T ng h p ghép n i ổ ợ ố (0)
  • 3.1. T ng quan h ng t ng h p ti   th     ng nói d a trên mô hình Markov n (0)
  • 3.2. T ng quan mô hình Markov (48)
    • 3.2.1. Quá trình Markov (48)
    • 3.2.2. Mô hình Markov n ẩ (0)
  • 3.4. T ng h p ti ng nói d a trên mô hình Markov n (0)
    • 3.4.1. T o thông s ng nói t ạ ố tiế ừ HMM (63)
    • 3.4.2. Ví d t o các chu i tham s ụ ạ ỗ ố (0)
    • 3.4.3. H ng t ng h ệ th ố ổ ợp văn bả n thành ti ế ng nói d a trên HMM ự (72)
  • 3.5. Mô hình hóa và t o t   n s   n b ng cách s d    ng phân b xác su   không gian (0)
    • 3.5.1. Phân b xác su ố ất đa không gian (74)
    • 3.5.2. HMM d a trên xác su t phân b ự ấ ố đa không gian (76)
    • 3.5.3. Phân c m ng c nh d a trên cây quy ụ ữ ả ự ế ị t đ nh (84)
    • 3.5.4. Mô hình hóa tân s F ố 0 s d ng MSD-HMM ử ụ (0)
    • 3.6.1. Mô hình th nghi m ử ệ (89)
    • 3.6.2. Phân tích mô hình (89)
    • 3.6.3. Festival và ng d ng t ứ ụ ổ ng h p ti ng nói ợ ế (0)

Nội dung

Trang 2 LỜI CẢM ƠNĐể hoàn thành khóa luận này, tôi xin tỏ lòng biết ơn sâu sắc đến thầy PGS.TS Trịnh Văn Loan đã tận tình hướng dẫn tôi trong suốt quá trình viết khóa luận tốt nghiệp.Tôi

M u

Ting nói là m    i thông tin c  i Ti ng nói 

 c t o ra t  i: trung tâm th n  u khi n h thông phát   âm làm vic to ra âm thanh

Tic phân bi t v i h th ng âm thanh khác b    c tính âm h c có ngu n g c t       t o ti ng nói V b n ch t,     ting nói là s  ng ca

   ng này t o thành áp l  n tai và

c tai phát hi n, phân tích và chuy n k t qu n trung khu th n kinh T      

Tín hi u ti   c t o thành b i các chu i âm v    liên ti p,s s p x   p c a các âm v   c chi ph i b i quy t c c a ngôn ng Vi c nghiên c u m t cách         chi ti t v quy t c này thu c v chuyên ngành ngôn ng       Vic phân lo i các âm v   c a ti ng nói thu c v chuyên ngành ng âm h Khi nghiên c u các mô hình toán    c  hc c  t o ting nói, vi c nghiên c u v các âm v là r t c n thi t     

B máy phát âm

B máy phát âm ộ

B máy phát âm bao g m các thành ph n riêng r     i, khí qu thanh n, qung d

- Thanh qu n ch a 2 dây thanh có th    ng t o ra âm thanh 

- Tuy n âm là  u b  u t thanh môn và k t thúc t i môi   

- u b u t môi, k t thúc b i vòm mi   dài c nh kho ng 12   i vi ln

- Vòm mi ng là các n ng

Cơ chế phát âm

Trong quá trình t o âm thanh không ph ng m , khoang 

i, dòng khí s ch   ng h  thp và dòng khí s ch   

Tuy n âm s   c kích thích b i ngu   ng chính t i thanh môn 

Ti  c t o ra do tín hi u ngu n t      y không khí có trong ph i lên t o thành dòng khí, va ch m vào hai dây thanh trong tuy n âm Hai    

   ng s t o ra c   ng,  ng âm s  c lan truy n theo  tuy  t o ra ti ng nói 

1.3 c tính âm h c c a ti ng nói Đặ ọ ủ ế

Âm h u thanh và âm vô thanh ữ

a Âm h u thanh ữ Âm h u  c tao ra t các dây thanh b   ng th i và chúng rung 

ng ch dãn khi kh   ông    ra   môn x p xu ng do không khí ch y qua   

Do s c ng c a dây thanh, sóng âm t o ra có d ng tu n hoàn ho    c gn

n hoàn Ph c a âm h u thanh có nhi u thành ph n hài t i giá tr b i s c         a t n s c  ng, còn gi là tn s  n b Âm vô thanh

Khi t o ra âm vô thanh dây thanh không c ng Âm vô thanh có 2 loi

n là âm xát và âm tc Âm xát (ví d     c t o ra khi có s co th t t   m trong tuym co th t s chuy n thành chuy   ng h n lo n t o nên kích thích gi u ng u nhiên  m co t x y ra th   g n mi ng nên s c   ng c a tuy n âm   ng rc tính c a âm 

 c t o ra Âm t c (ví d    c t o ra khi tuyi m t s m làm    cho áp xu t không khí t c git ng t, s i phóng   gi

t ng t này t o ra kích thích nh t th i c a tuy n âm S kích thích này có th x y          ra v i s c  ng ho c không c ng c a dây thanh  ng v i âm t c h u thanh ho c vô thanh  

Âm v ị

Tín hi u ti ng nói là tín hi   biu din cho thông tin v m t ngôn   ng c mô t b i các âm v    y, âm v   nh nh t c a    ngôn ng , tùy theo t ng lo i ngôn ng c mà s      th  ng âm v nhi u hay ít  

ng vào kho ng t 20 d n 30 âm v ) Các âm v      c chia làm hai lo i, nguyên  âm và ph âm  a Nguyên âm

Nguyên âm là âm h c t o ra b ng s c  ng c a dây thanh 

c thanh môn y lên, khoang mi   c t o l p thành nhi u hình  d ng nh nh t o thành các nguyên âm khác nhau S   ng các nguyên âm ph  thu c vào t ng lo i ngôn ng    nhnh

Ph  c t o ra b i các dòng khí h n lo  c phát ra gm co th t  cng d n âm thanh do cách phát âm t o ra Ph    c tính h u thanh hay  vô thanh tùy thu c vào c dây thanh  vi      t o nên c ng hay không Dòng không khí t i ch   a vòm ming t o ra ph âm t c, ph âm xát    

 c t o ra t ch co th t l n nh t     

Các đặ c tính khác

Trong khi nói, kho ng th i gian nói và ngh xen k l nhau T l % th    n   i gian nói trên t ng s i gian nói và ngh   th  c g i là t t th i gian Giá tr này  su   bii tùy thu c vào t  nói, t    th phân thành nói nhanh, nói ch m, 

ng b Hàm năng lượng th i gian ng n ờ ắ

ng th i gian ng n c a ti   c tính b ng cách chia tín  hiu nói thành nhi u khung m i khung g m N m u C     m ct a s có d

ng ng n t i m  u th mc tính theo công th c sau: 

ng có 3 lo i c a s thông d ng là: c a s hình ch nh t, c a s           Hamming, c a s      ng th i gian ng n c a âm h u thanh    

D ng sóng c a ti ng nói g m hai thành ph n: ph n g n gi ng nhi         biên  bi i ng u nhiên) và ph n có tính chu k    u g n  n hoàn) Ph n tín hi u có tính chu k    cha các thành ph n t n s có d   u hòa

T n s p nh t chính là t n s   th     chính là t n s   ng c a dây  thanh

V i ph c a tín hi u ti ng nói, m     nh   l n nh t xét trong m t

ng v i m t formant Ngoài t n s     nh b và d i thông, v m t v t lý các t n s c      ng c a tuy n âm   

ng v i các t n s c   ng c a tuy n Trong x  âm  lý ti ng nói và t ng h p    ti   mô ph ng l i tuy    i ta ph   c các tham s 

 i v i t ng lo i âm v          ng các formant r t  quan trng.

T n s formant bi  i trong m t kho ng th i gian r ng ph thu c vào gi      i tính ci nói và ph thu c vào d ng âm v     ng v i formant Formant   còn ph thu c vào các âm v    c và sau nó V c u trúc t nhiên, t n s formant      có liên h  cht ch v i hình d  c tuyng ph c a ting hi u  ting nói có kho        u tiên nh 

ng quan tr ng  c tính c a các âm v , các formant còn l  nh

  u ki n phát âm nh  nh M c dù ph m vi c a các t n s formant     

ng v i m i nguyên âm có th     trí gi a các formant 

i vì s d ch chuy n c   a các formant là song song.

Mô hình t o ti ng nói

 n hóa vi c phân tích và nghiên c u b    i ta chia b máy phát âm thành hai thành ph n: ngu n âm và h   ng

- H thng bao gm thanh môn, tuyc mô hình hóa này s d ng hàm truy  t trong bii Z

-  i v i các âm h u thanh, ngu n âm là m t d ng sóng tu    c biêt, dc mô ph ng b i   ng c a b l c thông th   m cc thc và t n s c t vào kho ng 100Hz    

Hình 1.4: Mô hình hóa ngui vi âm h u thanh 

α, β là nh ng h ng s    n âm v i  α

Ngày đăng: 18/02/2024, 11:58

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN