Nghiên ứu phát triển hệ thống nhận dạng tiếng việt cho ứng dụng danh bạ trên thiết bị di động

69 3 0
Nghiên ứu phát triển hệ thống nhận dạng tiếng việt cho ứng dụng danh bạ trên thiết bị di động

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Tai ngay!!! Ban co the xoa dong chu nay!!! 17057205210211000000 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI - PHẠM QUANG DUY NGHIÊN CỨU PHÁT TRIỂN HỆ THỐNG NHẬN DẠNG TIẾNG VIỆT CHO ỨNG DỤNG DANH BẠ TRÊN ĐIỆN THOẠI DI ĐỘNG LUẬN VĂN THẠC SỸ KHOA HỌC KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA NGƯỜI HƯỚNG DẪN KHOA HỌC: TS Mạc Đăng Khoa Hà Nội – 2018 Luận văn thạc sỹ 2018 LỜI CẢM ƠN     ,  y Nguyn Vi   p th   n Th Thanh H   Phm Quang Duy Phạm Quang Duy iii Luận văn thạc sỹ 2018 DANH MỤC HÌNH ẢNH  v cu to b phn phát âm  i(Huang et al., 2001a) .5 : Bi dng sóng ca s khu ca l : Ph ca l : Cu trúc ca mt h nhn dng ting nói(Jurafsky and Martin, 2000) .11 : Ví d mơ hình Markov (B.H Juang, Lawrence R Rabiner, 2005) 13  : Mơ hình HMM t (Jurafsky and Martin, 2000) .16  : Mơ hình Markov n cho b t vng s (Jurafsky and Martin, 2000) 17   : Quá trình nhn dng chu  n t tín hiu ting nói(Jurafsky and Martin, 2000) .17 : Mơ hình phi tuyn ca mt mng Neuron 18 : Hình nh ng dng Google Assistant .23 : Hình nh ng dng Siri .24 : ng dng Alice 25 : ng dn thoi Samsung 25 : ng dng cotana 26 : ng dng danh b ca Google Contact .29 : Kin trúc Sphin4 (Huang et al., 1993) 32 :VD Search Graph (Huang et al., 1993) 32 : Phân b d liu ti dài câu 34  : n ng dng voicetrans 35 : Màn hình hong ng dng Voicetrans 35 : Quy trình thu thp d liu 37  m trình nhn dng 39 : Bi use case v chg phn mm Voice Contact 41  trình t (Sequence Diagram) ng dng Voice Contact 43 :  quy trình phn mm Voice Contact 44  : Hình nh hong ca ng dng Voice Contact 45 : Màn hình chi tit danh b 46 :  q trình to mơ hình ngơn ng bng cơng c CMUclmk .55 Phạm Quang Duy iv Luận văn thạc sỹ 2018 DANH MỤC BẢNG Bng 1.1:Cu to âm tit ca ting Vit (Bùi T .8 Bng 3.1c ly t báo vi thng .34 Bng 3.2: Bng phân b i nghi âm theo vùng min 36 Bng 3.3: Th nghim kt qu vi s ng thi gian training khác 38 Bng 3.4: Kt qu  nhn dng 40 Bng 4.1: T l lnh thành công 47 Phạm Quang Duy v Luận văn thạc sỹ DANH MỤC TỪ VIẾT TẮT VÀ THUẬT NGỮ HMM : GMM : DNN : Deep Neural Network CMU : Carnegie Mellon University CME : Minimum Classification Erro DTW : Dynamic Time Warping ASR : Automatic Speech Recognition MMI : Maximum Mutual Information MLLR : Maximum Likelihood Linear Regression PMC : Parallel Model Combination ATIS : Air Travel Information Service Phạm Quang Duy Hidden Markov Model Gaussian Mixture Model vi 2018 Luận văn thạc sỹ 2018 MỤC LỤC LỜI CẢM ƠN iii DANH MỤC HÌNH ẢNH iv DANH MỤC BẢNG v DANH MỤC TỪ VIẾT TẮT VÀ THUẬT NGỮ vi MỤC LỤC vii MỞ ĐẦU Chƣơng TỔNG QUAN VỀ XỬ LÝ TIẾNG NÓI VÀ NHẬN DẠNG TIẾNG NÓI .5 1.1 Ting nói biu din ting nói 1.2 Ting Vit ng âm ting Vit 1.3 Nhn dng ting nói 10 1.3.1 Mơ hình chung h thng nhn dng ting nói 10 1.3.2 n 12 1.3.2.1 Gaussian Mixture Model  Hidden Markov Model (GMM-HMM) 1.3.2.2 Deep Neural Network (DNN) 18 1.3.2.3 La chn mơ hình phù hp cho toán 19 1.3.3 Gii thiu cơng cframework sn có cho nhn dng ting nói 20 1.4 Nhn dng ting nói cho ting Vit .20 1.5 Kt lun 21 Chƣơng NHẬN DẠNG TIẾNG NÓI TRÊN THIẾT BỊ DI ĐỘNG VÀ ỨNG DỤNG CHO DANH BẠ .23 2.1 ng dng nhn dng ting nói cho danh b n thoi .23 2.1.1 Mc tiêu ng dng 23 2.1.2 Mt s sn ph  gii 23 2.1.3  .26 Phạm Quang Duy vii Luận văn thạc sỹ 2018 2.2  xut gii pháp .27 2.2.1 Các v cn phi gii quyt .27 2.2.2  xut gii pháp 28 Chƣơng XÂY DỰNG MÔ HÌNH NHẬN DẠNG TIẾNG VIỆT CHO ỨNG DỤNG DANH BẠ 30 3.1 Công c CMU SphinX 30 3.2 Xây d d liu hun luyn .33 3.2.1 Xây dng d lin 33 3.2.2 Xây dng phn mm thu âm d liu tin thoi .34 3.3 Xây dng mơ hình âm hc 38 3.4 Thích nghi t n nhn dng cho ng dng danh b 39 Chƣơng XÂY DỰNG ỨNG DỤNG DANH BẠ ĐIỆN THOẠI TƢƠNG TÁC BẰNG TIẾNG NÓI TIẾNG VIỆT .41 4.1 Phân tích 41 4.2 Thit k 42 4.3 Trin khai .45 4.4 Th nghigiá 47 Chƣơng KẾT LUẬN 49 TÀI LIỆU THAM KHẢO 51 PHỤ LỤC 53 Phạm Quang Duy viii Luận văn thạc sỹ 2018 MỞ ĐẦU Nhn dng ting nói hic nghiên cu phát trin  nhiu công u trung tâm nghiên cu khác Hin cơng ngh nhn dng ting thành t Ví d s kin Google I/O 2018 1, phn mm Google assitant   n kh  giao tip vi nhân viên hoc khách hàng hồn tồn t ng bng ting nói   cơng ngh nhn dng ting nói ca Google có th nói   c mc ch   ng v hiu li nói ci Ngồi  tìm thy rt nhiu h thng nhn dng ting c gii thiu ng dng nhiIBM Watson Speech to Text2,Nuance Dragon 3, Ngồi ting Anh, cơng ngh nhn dng ti   c nghiên cu phát trin mnh m vi ngôn ng ph bit, Hàn , Trung, Pháp Công ngh nhn dng ting vit c b u nghiên cu phát trin t nh  2000 vi nhiu nghiên cu t  khác n CNTT, vin Hàn lâm KH&CN Vit Nam, AILabi h HCM, Vin NCQT i hc Bách Khoa Hà Ni Gêm s tham gia nghiên cu phát trin sn phm ca t      l     FPT Tiêu biu sn phm c4 c  Thi bui hin tho thành vt không th thiu vi mi chúng ta.Trong mc ng dng cơng ngh nhn dng ting nói thit b ng ngày tr nên ph bin, vi nhiu sn phc phát trin bi hang công ngh l Google Voice search, Google Assistant 5, Apple Siri6 , Samsung Bixby Tuy nhiên, công ngh nhn dng ting nói ng dng thit b ng hy ht theo kin trúc Client-Server.Rt h thng hong hoàn toàn thit b ng, bi h thng nhn dng nng chim tài nguyên Tuy nhiên h thng nhn dy lm ln phi kt ni mng https://events.google.com/io/ https://www.ibm.com/watson/services/speech-to-text/ https://www.nuance.com/dragon.html https://speech.openfpt.vn/ https://assistant.google.com/#?modal_active=none https://www.apple.com/siri/ https://www.samsung.com/vn/apps/bixby/  Luận văn thạc sỹ 2018 thit b c bit  Vic phí 3G cao, nên vi nhng tác v ng xun khơng th s dng 3G liên tc Vic phi gi d liu v bo mt  i vi dùng Vi bi cnh trên, luc thc hin vi hai mc tiêu chính:  Tri  c h thng nhn dng ting Vit vn hành hoàn toàn thit b ng (chy offline không cn kt ni internet)  ng dng tích hp nhn dng ting nói cho ng dng danh b n thoi Vi thit b ng gn tác v cn thit s dng xuyên, tác gi p trung phát trin h thng nhn dng danh b bng ting nói mt ng dng rt phù hp cho toán nhn dng offline bi nu nhn dng online rt tn tài nguyên mng ng dng hong liên tc.V n cn gii quyt ca toán (1) hin thong vi tài nguyên hn ch  xác cn thit c v nhn dng danh b, vi danh b mi mn, tên riêng, vit tt rt phc tp làm th  h thng chy t xác nht Ngồi mt v ln khác, h thng phi hong vi nhiu ging nói khác nhiu vùng min khác L          Hidden Markov Model (GMM-            105  

Ngày đăng: 22/01/2024, 16:58

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan