(Luận văn thạc sĩ hcmute) nhận dạng tiếng nói dùng mạng neural

102 4 0
(Luận văn thạc sĩ hcmute) nhận dạng tiếng nói dùng mạng neural

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH LUẬN VĂN THẠC SĨ ĐINH THỊ THANH HOA NHẬN DẠNG TIẾNG NÓI DÙNG MẠNG NEURAL S K C 0 9 NGÀNH: KỸ THUẬT ĐIÊN TỬ - 605270 S KC 0 9 Tp Hồ Chí Minh, 2013 Luan van BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH LUẬN VĂN THẠC SĨ ĐINH THỊ THANH HOA NHẬN DẠNG TIẾNG NÓI DÙNG MẠNG NEURAL NGÀNH: KÝ THUẬT ĐIỆN TỬ - 605270 Tp Hồ Chí Minh, tháng 04 năm 2013 Luan van BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH LUẬN VĂN THẠC SĨ ĐINH THỊ THANH HOA NHẬN DẠNG TIẾNG NÓI DÙNG MẠNG NEURAL NGÀNH: KỸ THUẬT ĐIỆN TỬ - 605270 Hướng dẫn khoa học: PGS.TS DƯƠNG HỒI NGHĨA Tp Hồ Chí Minh, tháng 04 năm 2013 Luan van LÝ LỊCH KHOA HỌC I LÝ LỊCH SƠ LƯỢC: Họ & tên: Đinh Thị Thanh Hoa Giới tính: Nữ Ngày, tháng, năm sinh: 07/02/1983 Nơi sinh: Nam Định Quê quán: Nam Định Dân tộc: Kinh Thường trú: 14/25S Đường Thống Nhất – Phường: 16 – Q: Gò Vấp – Tp HCM Điện thoại quan: 08 38212360 E-mail: dth070283@yahoo.com II QUÁ TRÌNH ĐÀO TẠO: Đại học Hệ đào tạo: Chính qui Thời gian đào tạo từ : 2001 đến 2006 Nơi học: Đại học Sư Phạm Kỹ Thuật Tp Hồ Chí Minh – Tp Hồ Chí Minh Ngành học: Kỹ thuật Điện – Điện tử Tên đồ án: Thiết kế lọc số sử dụng TMS320C50 Bảo vệ đồ án: tháng 02/2006 Khoa Điện tử - Trường ĐH Sư Phạm Kỹ Thuật Tp HCM Người hướng dẫn: Ths Trương Thị Bích Ngà i Luan van III Q TRÌNH CƠNG TÁC CHUN MƠN KỂ TỪ KHI TỐT NGHIỆP ĐẠI HỌC: Thời gian Nơi công tác Công việc đảm nhiệm 08/2006 đến Công ty Điện tử SamSung ViNa Kỹ thuật viên Khoa Điện tử - Tin học - Trường Giảng viên môn Điện tử CĐ Kỹ thuật Cao Thắng Tp HCM công nghiệp 02/2007 12/2007 đến ii Luan van LỜI CAM ĐOAN Tôi cam đoan cơng trình nghiên cứu tơi Các số liệu, kết nêu luận văn trung thực chưa công bố công trình khác Tp Hồ Chí Minh, ngày 24 tháng 03 năm 2013 iii Luan van LỜI CẢM ƠN Hoàn thành luận văn này, xin chân thành cảm ơn thầy Dương Hoài Nghĩa trực tiếp hướng dẫn tạo điều kiện cho tiếp cận với lĩnh vực nhận dạng tiếng nói, lĩnh vực vơ lý thú Tôi xin chân thành cảm ơn đến thầy cô trường, đặc biệt thầy cô môn Tự động điều khiển Điện tử viễn thông truyền đạt cho nhiều kiến thức bổ ích Tôi không nhắc đến động viên chăm sóc gia đình, cộng tác giúp đỡ ủng hộ tinh thần bạn bè, đồng nghiệp Tôi xin chân thành cảm ơn Thành phố Hồ Chí Minh, tháng 03/2013 iv Luan van TĨM TẮT Nhận dạng tiếng nói kỹ thuật ứng dụng nhiều lĩnh vực sống: việc điều khiển (điều khiển robot, động cơ, điều khiển xe lăn cho người tàn tật ), an ninh quốc phòng Ở Việt Nam, năm gần có số nghiên cứu ban đầu nhận dạng tiếng Việt, nhiên giới hạn độ xác, số từ, vấn đề điệu đặc thù tiếng Việt chưa đề cập Trong khn khổ khóa học Cao học, chun ngành Kỹ thuật điện tử trường Đại học Sư phạm Kỹ thuật Tp Hồ Chí Minh, tạo điều kiện giúp đỡ nhà trường PGS TS Dương Hoài Nghĩa, lựa chọn đề tài “ Nhận dạng tiếng nói dùng mạng Neural”, nhằm nghiên cứu phương pháp nhận dạng tiếng nói tiếng Việt dùng mạng Neural thử nghiệm phần mềm Matlab Nội dung luận văn trình bày thành chương sau:  Chương 1: Tổng quan Chương thứ giới thiệu tổng quan hướng nghiên cứu đề tài,mục đích phương pháp nghiên cứu  Chương 2: Cơ sở lý thuyết Chương thứ hai trình bày tóm tắt tiếng nói số phương pháp nhận dạng tiếng nói phổ biến  Chương 3: Tổng quan mạng Neural Chương trình bày tổng quan mạng Neural bao gồm: phần lịch sử phát triển, cấu trúc mạng Neural, thuật toán, ứng dụng chúng nhận dạng  Chương 4: Xây dựng hệ nhận dạng Phần trình bày trình tiến hành số kết nghiên cứu xây dựng hệ nhận dạng chữ số tiếng Việt môi trường Matlab v Luan van  Chương 5: Kết luận Chương cuối trình bày kết đạt hướng phát triển đề tài Mặc dù cố gắng khả hạn chế nên kết nghiên cứu khiêm tốn Hy vọng tương lai tơi có điều kiện để tiếp tục nghiên cứu mở rộng đề tài vi Luan van SUMMARY Speech recognition is a technique that can be applied in many areas of life: in the control (control robots, motors, control a wheelchair for the disabled, etc.), security and defense In Vietnam, in recent years there were some initial research on Vietnamese identity, but also limited in terms of accuracy, the number of words, tone issues specific language can hardly be counter In the framework of the course Master of Science degree in Electronic Engineering at the University of Technical Education Ho Chi Minh City, is the creation of conditions to help the school and Associate Professor Dr Duong Hoai Nghia, I have chosen the theme "Speech recognition using Neural Network", in order to study the method of speech recognition for Vietnammese using Neural network and Matlab software trials The content of the thesis is presented in the following chapters:  Chapter 1: Overview The first chapter introduces an overview of the research directions of the subject, purpose, and research methods  Chapter 2: Theoretical basis The second chapter presents a summary of the language and some common methods of speech recognition  Chapter 3: Overview of Neural network This chapter presents an overview of the Neural network include: historical development, Neural network structures, algorithms, their application in the identification  Chapter 4: Construction of identity This section presents the process and a number of research findings build recognize the letters of the English in the Matlab environment  Chapter 5: Conclusion The last chapter presents the results and development of the subject vii Luan van Bảng 5.8: Kết nhận dạng huấn luyện mạng Neural cho số Hàm Số N truyền lớp ẩn 10 ĐCX 90 90 93 93 92 92 91 91 95 95 92 92 92 92 10 89 89 15 91 91 Logsig 20 89 89 – 25 90 90 purelin 30 92 92 35 90 90 40 90 90 10 90 90 15 92 92 Purelin 20 90 90 – 25 90 90 purelin 30 93 93 35 90 90 40 90 90 10 15 Tansig 20 – 25 purelin 30 35 40 Trang 69 Luan van Bảng 5.9: Kết nhận dạng huấn luyện mạng Neural cho số Hàm Số N truyền lớp ẩn 10 15 Tansig 20 – 25 purelin 30 5 88 88 4 91 91 90 90 90 90 95 95 10 ĐCX 35 3 92 92 40 91 91 10 5 87 87 4 90 90 15 Logsig 20 90 90 – 25 91 91 purelin 30 93 93 4 90 90 3 90 90 35 40 10 89 89 15 92 92 90 90 4 90 90 93 93 Purelin 20 – 25 purelin 30 2 35 91 91 40 90 90 Trang 70 Luan van Bảng 5.10: Kết nhận dạng huấn luyện mạng Neural cho số Hàm Số N truyền lớp ẩn 10 4 15 3 Tansig 20 2 – 25 purelin 30 35 40 10 ĐCX 90 90 94 94 93 93 93 93 96 96 93 93 2 93 93 10 89 89 15 92 92 Logsig 20 90 90 – 25 3 90 90 purelin 30 94 94 35 3 92 92 40 91 91 10 88 88 15 3 92 92 Purelin 20 90 90 – 25 90 90 purelin 30 94 94 35 2 92 92 40 90 90 Trang 71 Luan van Bảng 5.11: Kết nhận dạng huấn luyện mạng Neural cho số 10 Hàm Số N truyền lớp ẩn 10 ĐCX 10 4 88 88 15 3 92 92 Tansig 20 90 90 – 25 90 90 purelin 30 2 93 93 35 3 90 90 40 4 90 90 10 87 87 15 3 92 92 Logsig 20 91 91 – 25 4 90 90 purelin 30 93 93 35 90 90 40 90 90 10 4 89 89 15 2 91 91 90 90 Purelin 20 – 25 90 90 purelin 30 93 93 35 90 90 40 3 2 90 90 Trang 72 Luan van Bảng 5.12: Bảng tổng hợp kết nhận dạng cho số từ đến 10 Số Hàm N truyền lớp ĐCX 10 10 84 90 86 90 88 86 88 90 88 90 88 88 15 92 92 89 91 90 90 91 93 91 94 92 91,4 Tansig 20 85 89 92 93 90 88 90 92 90 93 90 90,2 – 25 90 90 91 92 89 89 90 91 90 93 90 90,5 purelin 30 95 96 93 97 94 93 95 95 95 96 93 94,8 35 91 91 91 94 91 90 92 92 92 93 90 91,6 40 89 92 91 92 91 90 90 92 91 93 90 91 89,5 91,4 90,4 92,7 90,4 89,4 90,8 92,1 91 93,1 90,4 10 83 88 84 90 88 85 87 89 87 89 87 87 15 90 90 87 90 90 89 90 91 90 92 92 90 Logsig 20 87 90 90 92 89 89 88 89 90 90 91 89,5 – 25 90 87 90 90 89 90 88 90 91 90 90 89,5 purelin 30 92 93 91 94 93 92 93 92 93 94 93 92,8 35 88 89 89 91 90 89 90 90 90 92 90 89,8 40 90 91 89 91 90 89 90 90 90 91 90 90,1 88,5 89,7 88,6 91,1 89,8 89 89,4 90,1 90,1 91,1 90,4 10 86 89 85 89 87 85 86 90 89 88 89 87,5 15 90 92 89 90 90 90 90 92 92 92 91 90,7 Purelin 20 87 89 90 92 90 90 89 90 90 90 90 89,7 – 25 90 90 90 90 88 88 89 90 90 90 90 89,6 purelin 30 91 93 92 94 92 92 93 93 93 94 93 92,7 35 90 89 88 91 90 90 90 90 91 92 90 90,1 40 88 90 90 91 90 89 90 90 90 90 90 89,8 88,9 90,2 89,1 91 89,6 89,1 89,6 90,7 90,7 90,8 90,4 TB ẩn ĐCX số ĐCX số ĐCX số Trang 73 Luan van Từ bảng tổng kết 5.12 thấy:  Mạng cho kết nhận dạng cao 94,8% sử dụng mạng có 30 nơron lớp ẩn, hàm truyền sử dụng „tansig – purelin‟  Chữ số nhận dạng xác số (Độ xác trung bình 93,1%) sử dụng hàm truyền „tansig – purelin‟ Trang 74 Luan van Chương KẾT LUẬN 5.1 Những kết đạt  Phƣơng pháp nhận dạng mạng Neural cho kết nhận dạng cao liệu xây dựng Nhƣ dùng mạng Neural làm cấu nhận dạng hiệu quả, hệ thống nhận dạng chữ số  Mạng cho kết nhận dạng cao xây dựng hợp lý  Mơi trƣờng Matlab giúp cơng việc nghiên cứu nhận dạng tiếng nói đơn giản hiệu Nhờ có Matlab cơng cụ VoiceBox mà việc phát triển hệ thống nhận dạng đơn giản nhanh chóng (ví dụ: mã chƣơng trình dùng lệnh, nhiều phần khơng cần lập trình) Những kết luận cho thấy khả sử dụng mạng Neural mơi trƣờng Matlab nhận dạng tiếng nói có nhiều hứa hẹn Tuy nhiên để đạt đƣợc điều phải xây dựng liệu chuẩn có chiến lƣợc xây dựng, huấn luyện, thử nghiệm mạng hợp lý 5.2 Hướng phát triển đề tài 5.2.1 Xây dựng liệu huấn luyện lớn Nhƣ ta thấy, liệu thành phần quan trọng hệ nhận dạng Hiện liệu xây dựng (1100 file, 11 từ, 10 ngƣời) cịn khiêm tốn Để có kết nghiên cứu tốt hơn, mở rộng liệu: tăng số ngƣời nói số từ, đa dạng hóa mơi trƣờng ghi âm 5.2.2 Xây dựng phần mềm nhận dạng dựa kết nghiên cứu Hệ thống nhận dạng đƣợc thử nghiệm mơi trƣờng Matlab, có khả nhận dạng file ghi âm sẵn từ (nhận dạng từ đơn, ngoại tuyến), trƣờng hợp nhận dạng trực tiếp, mạng hoạt động chƣa đƣợc xác Trong để hệ nhận dạng ứng dụng đƣợc hệ phải hoạt động dạng trực tiếp liên tục (tức vừa ghi âm vừa nhận dạng, nhận dạng nhiều Trang 75 Luan van chữ số lúc, chạy nhƣ chƣơng trình hệ thống) Mục tiêu sau thử nghiệm hệ thống cho kết cao xây dựng cơng cụ nhận dạng tiếng nói phần mềm ứng dụng, mục đích nghiên cứu nhận dạng tiếng nói 5.2.3 Nghiên cứu phương pháp xác định đặc trưng khác Ở nghiên cứu này, việc tách đặc trƣng tín hiệu tiếng nói cịn đơn giản Để nâng cao kết nhận dạng cần tìm đặc trƣng ổn định tiếng nói phƣơng pháp trích đặc trƣng hiệu 5.2.4 Nghiên cứu phương pháp nhận dạng khác Các nghiên cứu khác cho thấy mơ hình Markov ẩn (HMM) cho kết nhận dạng cao Hƣớng nghiên cứu đề tài tìm cách kết hợp mạng neural mơ hình Markov ẩn nhằm kết hợp ƣu điểm hai mô hình Mặt khác, từ vựng nhỏ nhận dạng từ đơn (âm tiết) thích hợp Tuy nhiên với hệ nhận dạng cỡ lớn, hệ nhận dạng tiếng Việt hồn chỉnh (6 nghìn âm tiết) chọn đơn vị nhận dạng âm tiết khơng hợp Một hƣớng nghiên cứu khác đề tài nhận dạng đơn vị nhỏ âm tiết âm vị Tức xây dựng hệ nhận dạng có chức năng:  Phân biệt đƣợc nhiễu (khoảng lặng), phụ âm, nguyên âm  Nhận dạng phụ âm (phân biệt đƣợc phụ âm khác nhau)  Nhận dạng nguyên âm (phân biệt đƣợc nguyên âm khác nhau)  Nhận dạng điệu âm tiết Trang 76 Luan van TÀI LIỆU THAM KHẢO Đoàn Thiện Thuật, Ngữ âm tiếng Việt, NXB ĐHQG Hà Nội, 2003 Lê Bá Dũng, Xử lý tiếng nói, Trƣờng Đại học Hàng Hải Việt Nam, 2001 Phạm Hữu Đức Dục, Mạng Nơron ứng dụng điều khiển tự động, NXB Khoa Học Kỹ Thuật, 2009 Nguyễn Hồng Hải – Nguyễn Khắc Kiểm, Lập trình Matlab, Nhà xuất Khoa Học Kỹ Thuật, 2003 Joe Tebelskis, Speech Recognition using Neural Networks, School of Computer ScienceCarnegie Mellon University Pittsburgh, Pennsylvania 15213-3890, May 1995 Bahl, L., Bakis, R., Cohen, P., Cole, A., Jelinek, F., Lewis, B., and Mercer, R (1981), Speech Recognition of a Natural Text Read as Isolated Words, In Proc IEEE International Conference on Acoustics, Speech, and Signal Processing, 1981 Mark Hudson Beale, Martin T Hagan, and Howard B Demuth, Neural Network Toolbox™ User‟s Guide, The MathWorks, Inc Bodenhausen, U., and Manke, S (1993), Connectionist Architectural Learning for High Performance Character and Speech Recognition, In Proc IEEE International Confer-ence on Acoustics, Speech, and Signal Processing, 1993 Bourlard, H and Morgan, N (1990), A Continuous Speech Recognition System Embedding MLP into HMM - In Advances in Neural Information Processing Systems 2, Touretzky, D (ed.), Morgan Kaufmann Publishers 10 Bourlard, H., Morgan, N., Wooters, C., and Renals, S (1992), CDNN: A Context Dependent Neural Network for Continuous Speech Recognition, In Trang 77 Luan van Proc IEEE International Conference on Acoustics, Speech, and Signal Processing, 1992 11 Bourlard, H and Morgan, N (1994), Connectionist Speech Recognition: A HybridApproach, Kluwer Academic Publishers 12 Bridle, J (1990), Alpha-Nets: A Recurrent “Neural” Network Architecture with a Hidden Markov Model Interpretation Speech Communication, 9:83-92, 1990 13 John R.Deller & John G.Proakis & John H L Hansen, Discrete – Time Processing of Speech Signals, Macmillan Publishing Company, 1993 14 B Plannerer, An Introduction to Speech Recognition, ©2001,2002,2003 Bernd Plannerer, Munich, Germany, March 28, 2005 15 Howard Demuth, Mark Beale - Neural Network ToolboxFor Use with MATLABđ, â COPYRIGHT 1992 - 2002 by The MathWorks, Inc Trang 78 Luan van PHỤ LỤC A Giới thiệu hàm ToolBox Matlab cần để xây dựng hệ thống nhận dạng Nhƣ biết, Matlab (Matrix Laboratory) mơi trƣờng trợ giúp tính tốn hiển thị mạnh đƣợc hãng MathWorks phát triển Mức phát triển Matlab ngày chứng tỏ Matlab phần mềm có giao diện cực mạnh nhiều lợi kĩ thuật lập trình để giải vấn đề đa dạng nghiên cứu KHKT Ngoài thƣ viện hàm tính tốn, vào-ra, đồ hoạ… bản, Matlab cịn có toolbox thƣ viện cho lĩnh vực cụ thể Ví dụ có toolbox cho xử lí tín hiệu (Signal Processing), mơ mơ hình (SimulLink), logic mờ (Fuzzy Logic), mạng Neural (NNet), … chí cho thiết kế máy bay (Aerospace) hay giải phƣơng trình vi phân (PDE)… Các hàm xử lý âm [y fs]=wavread(wavfile) Đọc tín hiệu âm từ file wav cho xâu wavfile, y vector mô tả tín hiệu âm (có giá trị thực từ đến 1), fs tần số lấy mẫu (giá trị nguyên) wavwrite(y,fs,wavfile) Ghi tín hiệu âm từ file wav cho xâu wavfile, y vector mơ tả tín hiệu âm thanh, fs tần số lấy mẫu sound(y) Phát âm loa, y vector mô tả tín hiệu âm y=wavrecord(n, fs) Ghi âm (từ micro) với tần số lấy mẫu fs n mẫu Kết vector y Trang 79 Luan van VoiceBox toolbox VoiceBox toolbox Matlab chuyên xử lí tiếng nói Mike Brookes phát triển VoiceBox u cầu Matlab phiên trở lên Voicebox tải từ http://webscripts.softpedia.com/script/Scientific-Engineering- Ruby/Signal- Processing/Voicebox-34702.html VoiceBox gồm hàm chia thành số nhóm chức sau:  Xử lí file âm (đọc, ghi file wav số định dạng file âm khác)  Phân tích phổ tín hiệu  Phân tích LPC  Tính tốn MFCC, chuyển đổi spectral - cepstral  Chuyển đổi tần số (mel-scale, midi, )  Biến đổi Fourier, Fourier ngƣợc, Fourier thực  Tính khoảng cách (sai lệch) vector dãy vector  Loại trừ nhiễu tín hiệu tiếng nói Chức quan trọng trích đặc trƣng tín hiệu tiếng nói, mà loại phổ biến LPC MFCC Hàm tính MFCC tín hiệu VoiceBox hàm : melcepst(s,fs,w,nc,p,n,inc,fl,fh) Hàm có nhiều tham số, số tham số quan trọng là:  s vector tín hiệu tiếng nói (có đƣợc sau dùng hàm ), fs tần số lấy mẫu (mặc định 11050)  nc số hệ số MFCC cần tính (tức số phần tử vector đặc trƣng, mặc định 12)  p số lọc mel-scale  w xâu mô tả lựa chọn khác: có tính thêm log lƣợng, có tính thêm đặc trƣng delta Mặc dù hàm gọi cách đơn giản là: c=melcepst(s,fs); Trang 80 Luan van Lời gọi hàm sinh ma trận c, dòng ma trận 12 hệ số MFCC frame Để kèm thêm log lƣợng liệu delta nhƣ hệ nhận dạng khác, ta dùng lệnh: c=melcepst(s,fs,’ed’); Khi dịng c vector 26 hệ số MFCC frame tƣơng ứng Nhập xuất Toàn biến sử dụng đƣợc gọi không gian làm việc (workspace) Matlab Sau khỏi Matlab chúng bị xoá Để làm việc với liệu đƣợc nhiều lần ta phải ghi (save) nạp (load) biến Ngồi ta cịn có nhu cầu chia xẻ liệu Matlab môi trƣờng khác Matlab cung cấp chức Save Load để thực yêu cầu Ghi đọc liệu qua file Matlab thực qua lệnh save load, thực thi chọn menu Trong trƣờng hợp ta chắn đƣợc cấu trúc file liệu nên dùng lệnh cho nhanh, trƣờng hợp không rõ (thƣờng xảy nhập từ file môi trƣờng khác) ta nên dùng menu máy cần cung cấp xác định cấu trúc file Cú pháp l ệnh save, load: Save Ghi tồn khơng gian làm việc vào file MAT có tên Save x Ghi biến x vào file MAT có tên Save x y z Ghi biến x,y,z vào file MAT có tên Load Đọc biến file MAT có tên vào khơng gian làm vi ệc Load x Đọc giá trị biến x từ file MAT có tên Load x y z Đọc giá trị bi ến x,y,z từ Trang 81 Luan van file MAT có tên B Mạng Neural môi trường Matlab Khởi tạo mạng FEEDFORWARD net = newff(P,T,[S1 S2 S(N-l)],{TF1 TF2 TFNl}, BTF,BLF) Dùng newff để tạo mạng từ thông số ban đầu  P: ma trận vector đầu vào mẫu, vector có R phần tử  T: ma trận vector mục tiêu, vector có S phần tử  Si: mảng gồm số neural lớp ẩn tƣơng ứng Thông số bổ sung:  TFi: hàm truyền dùng lớp Mặc định: hàm truyền cho lớp ẩn tansig, cho lớp purelin  BLF: tên hàm huấn luyện Mặc định: hàm huấn luyện trainlm Khởi tạo trọng số Nếu dùng newff, mặc định trọng số đƣợc khởi tạo với giá trị ban đầu tƣơng ứng Nếu muốn khởi tạo lại trọng số bias, dùng lệnh init net = init(net) Huấn luyện mạng Khi trọng số bias đƣợc khởi tạo, nghĩa mạng sẵn sàng cho việc huấn luyện Có thể hiệu chỉnh vài thông số huấn luyện mặc định: net.trainParam.epochs = 100; net.trainParam.goal = 1; net = train(net,p,t); Mô Hàm sim dùng để mô mạng Hàm có gái trị đầu vào vector p, đối tƣợng mạng net đầu đầu a mạng a = sim(net,p); Trang 82 Luan van Luan van ... ? ?Nhận dạng tiếng nói dùng mạng Neural? ??, nhằm nghiên cứu phƣơng pháp nhận dạng tiếng nói tiếng Việt thử nghiệm xây dựng hệ thống nhận dạng cỡ nhỏ 1.1.1 Các kết nghiên cứu nước Nhận dạng tiếng nói. .. quan nhận dạng tiếng nói 12 2.2.2 Các nguyên tắc nhận dạng tiếng nói 14 2.2.3 Các phương pháp nhận dạng tiếng nói phổ biến 14 2.2.4 Các trình hệ thống nhận dạng tiếng nói ... lựa chọn đề tài “ Nhận dạng tiếng nói dùng mạng Neural? ??, nhằm nghiên cứu phương pháp nhận dạng tiếng nói tiếng Việt dùng mạng Neural thử nghiệm phần mềm Matlab Nội dung luận văn trình bày thành

Ngày đăng: 02/02/2023, 09:55

Tài liệu cùng người dùng

Tài liệu liên quan