1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng lý thuyết phi tuyến trong xử lý và nhận dạng tiếng việt

92 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 92
Dung lượng 4,05 MB

Nội dung

39 Trang 5 v Danh mục các ký hiệu và các chữ viết tắtKý hi u ệ Tên ti ng Anh ếANN Artificial eural etwork NNASR Automatic peech ecognition SRDCT Discrete osine ransform CTDFT Discrete o

 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI - PHẠM HỮU BIÊN ỨNG DỤNG LÝ THUYẾT PHI TUYẾN TRONG XỬ LÝ VÀ NHẬN DẠNG TIẾNG VIỆT CHUYÊN NGÀNH: KỸ THUẬT ĐIỆN TỬ LUTHC K THUN T NG DN KHOA HC PGS.TS Nguyễn Tiến Dũng Hà Ni  2014 i 170809406158320f8a108-8abe-4ae8-93d2-0adbcc6d2840 17080940615839bfbfa8f-9da1-44e0-9184-38b4fec174b2 17080940615834579c49f-ac9d-4af7-b844-499b4d72c9b0  Lời cam đoan          trình nghiên cu thc s ca cá nhân tơi, c thc hii s ng dn khoa hc ca PGS.TS Nguyn Ti Các s liu, kt qu nghiên cu luc Tơi xin chu trách nhim v nghiên cu ca Hc viên Phm Hu Biên ii  MỤC LỤC L ii MC LC iii Danh mc ký hiu ch vit tt v Danh sách bng vi Danh sách hình v  th vii M U U TNG QUAN 1.1 Tng quan tình hình nghiên cu nhn dng tic th gii 1.2 Lch s nghiên cu nhn dng ting nói t ng (ASR) 1.3 Mi quan h gia ting nói h thng phi tuyn 1.4 Tng kt  X LÝ TING NĨI VÀ CÁC MƠ HÌNH NH N DNG TING NÓI  x lý tín hiu s 10 2.1.1 Phép bii tn s liên tc 10 2.1.2 Phép bii tn s ri rc 13 2.1.3 Các b lc s 15 2.2 Phân tích ph  17 2.2.1 Gii thi 17 2.2.2 H s Cepstral tn s Mel (MFCC) 19 no hàm bo hàm bc 23 2.2.4 Tng h 24 2.3 Mơ hình thng kê cho nhn dng mu 25 2.3.1 Mơ hình Gauss 25 2.3.2 Mơ hình Markov n 30 2.4 HMM toán nhn dng ting nói 39 iii  2.4.1 Xây dng mơ hình Markov n 39 2.4.2 Xây dng HMM cho nhn dng s ting Vit 39 2.5 Tng kt 40    C X LÝ TÍN HIU PHI TUYN TÍNH VÀ CÁC N TÍNH 41  lý thuynh lý ca Takens 42 c t không gian RPS 45 3.2.1 Phân b t nhiên 45 3.2.2 Thông tin qu o 47 3.2.3 Kt hc t x lý phi tuyn vect 48 3.3 K thut mơ hình hóa nhn dng 50 c RPS 50  52 3.3.3 Xây dng mơ hình nhn dng t ting Vit 53 3.4 Tng kt 55 N DNG TI KT QU 56 4.1 Phn mm 56 4.2 D liu 57 t thí nghim 58 4.3.1 La chn tham s 58 4.3.2 Xây dng thí nghim 61 4.4 Mt s kt qu 62 t qu 72 KT LUNG PHÁT TRIN 76 Tài liu tham kho 77 PH LC 80 iv  Danh mục ký hiệu chữ viết tắt Ký hiệu Tên tiếng Anh ANN Artificial Neural Network ASR Automatic Speech Recognition DCT Discrete Cosine Transform DFT Discrete Fourier Transform DTW Dynamic Time Warping EM Expectation Maximization FFT Fast Fourier Transform GMM Gaussian Mixture Model HMM Hidden Markov Model HTK Hidden Markov Modeling Toolkit IDFT Inverse Discrete Fourier Transform LPC Linear Predicative Coding Mel Frequency Cepstral Coefficients MFCC PDF Probability Density Function RPS Reconstructed Phase Space Texas Instruments & Massachusetts TIMIT Institute of Technology speech corpus Z Transform Z Mixture of Gauss Hidden Markov Model MGHMM v  Danh sách bảng Bng 1: Bng ký hiu dùng cho phân tích tín hiu Bng 2: Bng ký hi x lý tín hiu khơng gian phi tuyn tính 41 Bng 3: Bng ký hiu dùng cho thí nghim 56 Bng 4: Tên thí nghim thc hin 61 Bng 5: Kt qu nhn dng s d 62 Bng 6: Kt qu nhn dng s dn 64 Bng 7: Kt qu nhn dng s dng kt hn v 66 Bng 8: Kt qu nhn dng s dng mơ hình trng s 68 Bng 9: Bng so sánh kt qu nhn dng v 72 Bng 10: Bng so sánh kt qu nhn dng gi 74 vi  Danh sách hình vẽ đồ thị  khơng gian pha (RPS) ca ting nói ca mt t  th hàm X( e jw) 10 Hình 3: Biu din Z theo phn thc phn o 11 Hình 4: Biu din Z mt phng phc 12 Hình 5: Thc hin bi 12  khi mô hình to ting nói 17  khi mơ hình lc ngun to ting nói 17  th minh h  ln ph 18   19  th ca s Hamming 21  th minh ha mi quan h gia thang tn s Mel thang tn s Hz 22  khi minh h 25 Hình 13: Hàm m Gauss 25 Hình 14: Mơ hình Gauss 26 Hình 15: Hàm m Gauss ca ba phân phi 27 Hình 16: Mơ hình Markov trng thái 30 Hình 17: Mơ hình Markov n trng thái 31 Hình 18: Chui Q tc b 35  xây dng HMM 40 Hình 20: Hình v minh ha RPS ca t  43  th RPS ca t  tr  44 Hình 22: So sánh tâm bán kính ca qu o t  o t  45 Hình 23: So sánh tâm bán kính ca qu o t   46 Hình 24: So sánh tâm bán kính ca qu o t i nói khác 47 Hình 25: Hình v minh ha phân b m RPS qu o RPS 47 Hình 26: Mi quan h gia ch s ng hp 50 vii  Hình 27: Minh ha RPS bng mơ hình Gauss vi 256 Mixtures 51 Hình 28: Mơ hình Markov n left-right n trng thái 53  khi to ma trn xác sut phát 54  thut toán hun luyn 54 Hình 31: Thut toán nhn dng t ting Vit 54 n âm hun luyn 57  thut toán ct t ng 58  th RPS ca t  tr khác 58  th minh ho RPS dùng mơ hình Gauss vi 256 Mixtures 60  th kt qu nhn dng s ting Vit v 63  th kt qu nhn dng s ting Vit vc t RPS 65 Hình 38: Bi  th hin t l nhn dng xác s ting Vit v  c t c kt hp t  67  th kt qu nhn dng s dng mơ hình Markov n trng thái vc ng s) 69  th kt qu nhn dng s dng mơ hình Markov n 15 trng thái v  dùng mơ hình trng s) 70 Hìn th kt qu nhn dng vi mơ hình Markov n 70 Hình 42: Giao dit qu 71 Hình 43 th kt qu nhn dng vi mơ hình dùng trng s không dùng trng s 75 viii  MỞ ĐẦU Ngày nhu c  i thông tin ngày nhiu d n s   a t nhic tip c thơng qua sóng tín hi lnh cho máy, thơng qua ting nói, thơng qua c ch chuyng Mt nhc giao tip vi máy tính c phát trin nhiu nhng t nhiu cơng trình nghiên cu v nhn dng ting nói th gi  thng nhn dng ting nói ting Anh Via Voice ca IBM, Spoken Toolkit ca CSLU(Central of Spoken Laguage Under-standing), Speech Recognition ca Microsoft, Hidden Markov Model tookit ca i hc Cambridge, CMU Sphinx ci hNgoài mt s h thng nhn dng ting nói ti  c, Trung Qu    n Nhn dng ting nói ting Vit t s  ng dn lng dn viên bo tàng,  Phn ln cơng trình nghiên cu s dng cơng c k thut phân tích x lý tín hiu tuyn tính Gt cơng c c phát trin cho vic phân tích x lý tín hiu mơ hình ng dng lý thuyt v phi tuyn Ti mt s t, Pháp, Anh  c áp dng cho nhn dng ting     t qu tt i vi ting Vi  p cn nghiên cu dùng lý thuyt phi tuyn nhm ng dng cho nhn dng ting nói chc nghiên cu Vi mong mun góp phn to nên nhc phát tric nhn dng ting nói  c ta c v mt nghiên cng dng sn phm thc tin i sng, vi s  ng ca thy giáo PGS.TS Nguyễn Tiến Dũng thy giáo PGS.TS Hoàng Mạnh Thắng lun    ting nói  kt qu c v cho vic   hoàn t c lu         y giáo PGS.TS Nguyễn Tiến Dũng thy giáo PGS.TS Hồng Mạnh Thắng ng dn  em q trình thc hin luy, cô giáo  Vi n t - vin thông  i hc Bách khoa Hà N   u kin cho em hoàn thành lu    n sinh u kin cho em trình thu thp d liu làm lu B cc ca luc t chc nh C  Nghiên cu tng quan   i thiu tng quan v tình hình nghiên cu nhn dng ting nói  c c th gii, lch s phát trin ca nghiên cu nhn dng ting nói, gii thiu mt s kt qu nhn dng ting nói s dng lý thuyt phi tuyn gii hn phm vi nghiên cu ca lu  x lý ting nói mơ hình nhn dng ting nói  gii thiu mơ hình tuyn tính s dng cho phân tích tìm a t ting Vit cn nhn dng, gii thiu mơ hình thng kê nhn dng mu, xây dng mơ hình nhn dng t ting Vit s dng mơ hình Markov n c x lý tín hiu phi tuyn     n tính  i thiu kt qu lý thuyt phi tuyn tính c tuyn tính, xây dng mơ hình Markov n cho nhn dng t ting Vit vi  phi tuyt hp c tách t không gian phi tuyn   c tách t  c x lý tuyn tính  ng Xây dng mơ hình Markov n cho  c   n dng ting    t qu  trình bày kt qu nhn dng ting nói v    c không gian phi tuy      c không gian phi tuyn kt hp vi c  MFCC, ng tht qu nhn dng ti c Phn cui ca lu  t lu ng phát trin c tài trình bày v v luc v cn phát trin sau lu t t:

Ngày đăng: 17/02/2024, 22:21

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN