1. Trang chủ
  2. » Luận Văn - Báo Cáo

(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng mạng Neural

97 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 97
Dung lượng 3,26 MB

Nội dung

(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng mạng Neural(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng mạng Neural(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng mạng Neural(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng mạng Neural(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng mạng Neural(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng mạng Neural(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng mạng Neural(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng mạng Neural(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng mạng Neural(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng mạng Neural(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng mạng Neural(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng mạng Neural(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng mạng Neural(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng mạng Neural(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng mạng Neural(Luận văn thạc sĩ) Nhận dạng tiếng nói dùng mạng Neural

LỜI CAM ĐOAN Tơi cam đoan cơng trình nghiên cứu Các số liệu, kết nêu luận văn trung thực chưa cơng bố cơng trình khác Tp Hồ Chí Minh, ngày 24 tháng 03 năm 2013 iii LỜI CẢM ƠN Hồn thành luận văn này, tơi xin chân thành cảm ơn thầy Dương Hoài Nghĩa trực tiếp hướng dẫn tạo điều kiện cho tiếp cận với lĩnh vực nhận dạng tiếng nói, lĩnh vực vô lý thú Tôi xin chân thành cảm ơn đến thầy cô trường, đặc biệt thầy cô môn Tự động điều khiển Điện tử viễn thông truyền đạt cho tơi nhiều kiến thức bổ ích Tơi khơng thể khơng nhắc đến động viên chăm sóc gia đình, cộng tác giúp đỡ ủng hộ tinh thần bạn bè, đồng nghiệp Tôi xin chân thành cảm ơn Thành phố Hồ Chí Minh, tháng 03/2013 iv TĨM TẮT Nhận dạng tiếng nói kỹ thuật ứng dụng nhiều lĩnh vực sống: việc điều khiển (điều khiển robot, động cơ, điều khiển xe lăn cho người tàn tật ), an ninh quốc phòng Ở Việt Nam, năm gần có số nghiên cứu ban đầu nhận dạng tiếng Việt, nhiên giới hạn độ xác, số từ, vấn đề điệu đặc thù tiếng Việt chưa đề cập Trong khn khổ khóa học Cao học, chuyên ngành Kỹ thuật điện tử trường Đại học Sư phạm Kỹ thuật Tp Hồ Chí Minh, tạo điều kiện giúp đỡ nhà trường PGS TS Dương Hồi Nghĩa, tơi lựa chọn đề tài “ Nhận dạng tiếng nói dùng mạng Neural”, nhằm nghiên cứu phương pháp nhận dạng tiếng nói tiếng Việt dùng mạng Neural thử nghiệm phần mềm Matlab Nội dung luận văn trình bày thành chương sau:  Chương 1: Tổng quan Chương thứ giới thiệu tổng quan hướng nghiên cứu đề tài,mục đích phương pháp nghiên cứu  Chương 2: Cơ sở lý thuyết Chương thứ hai trình bày tóm tắt tiếng nói số phương pháp nhận dạng tiếng nói phổ biến  Chương 3: Tổng quan mạng Neural Chương trình bày tổng quan mạng Neural bao gồm: phần lịch sử phát triển, cấu trúc mạng Neural, thuật toán, ứng dụng chúng nhận dạng  Chương 4: Xây dựng hệ nhận dạng Phần trình bày trình tiến hành số kết nghiên cứu xây dựng hệ nhận dạng chữ số tiếng Việt môi trường Matlab v  Chương 5: Kết luận Chương cuối trình bày kết đạt hướng phát triển đề tài Mặc dù cố gắng khả hạn chế nên kết nghiên cứu khiêm tốn Hy vọng tương lai tơi có điều kiện để tiếp tục nghiên cứu mở rộng đề tài vi SUMMARY Speech recognition is a technique that can be applied in many areas of life: in the control (control robots, motors, control a wheelchair for the disabled, etc.), security and defense In Vietnam, in recent years there were some initial research on Vietnamese identity, but also limited in terms of accuracy, the number of words, tone issues specific language can hardly be counter In the framework of the course Master of Science degree in Electronic Engineering at the University of Technical Education Ho Chi Minh City, is the creation of conditions to help the school and Associate Professor Dr Duong Hoai Nghia, I have chosen the theme "Speech recognition using Neural Network", in order to study the method of speech recognition for Vietnammese using Neural network and Matlab software trials The content of the thesis is presented in the following chapters:  Chapter 1: Overview The first chapter introduces an overview of the research directions of the subject, purpose, and research methods  Chapter 2: Theoretical basis The second chapter presents a summary of the language and some common methods of speech recognition  Chapter 3: Overview of Neural network This chapter presents an overview of the Neural network include: historical development, Neural network structures, algorithms, their application in the identification  Chapter 4: Construction of identity This section presents the process and a number of research findings build recognize the letters of the English in the Matlab environment  Chapter 5: Conclusion The last chapter presents the results and development of the subject vii Despite our best efforts, likely due to limited research results are relatively modest Hopefully the future will have more conditions to continue and expand research subject viii MỤC LỤC TRANG Trang tựa Quyết định giao đề tài Lý lịch cá nhân i Lời cam đoan iii Lời cảm ơn iv Tóm tắt v Mục lục ix Danh sách chữ viết tắt xiii Danh sách hình xiv Danh sách bảng xv Chương TỔNG QUAN 1.1 Tổng quan lĩnh vực nghiên cứu 1.2 Mục đích đề tài 1.3 Nhiệm vụ giới hạn đề tài 1.4 Phương pháp nghiên cứu Chương CƠ SỞ LÝ THUYẾT 2.1 Lý thuyết âm tiếng nói 2.1.1 Nguồn gốc âm 2.1.2 Các đại lượng đặc trưng cho âm 2.1.3 Các tần số âm 2.1.4 Cơ chế tạo lập tiếng nói người ix 2.1.5 Mơ hình lọc nguồn cho q trình tạo tiếng nói 2.1.6 Hệ thống nghe tai người 2.1.7 Q trình tạo tiếng nói thu nhận tiếng nói người 10 2.1.8 Các âm tiếng nói đặc trưng 11 2.2 Lý thuyết nhận dạng tiếng nói 12 2.2.1 Tổng quan nhận dạng tiếng nói 12 2.2.2 Các nguyên tắc nhận dạng tiếng nói 14 2.2.3 Các phương pháp nhận dạng tiếng nói phổ biến 14 2.2.4 Các trình hệ thống nhận dạng tiếng nói 19 Chương TỔNG QUAN VỀ MẠNG NEURAL 3.1 Giới thiệu tổng quan mạng Neural 23 3.1.1 Mạng Neural sinh học 23 3.1.2 Mạng Neural nhân tạo 24 3.2 Lịch sử phát triển mạng Neural nhân tạo 26 3.3 Các tính chất mạng Neural nhân tạo 28 3.4 Mơ hình Neural kiến trúc mạng 28 3.4.1 Mơ hình Neural 28 3.4.1.1 Mơ hình Neural đơn giản 29 3.4.1.2 Mơ hình Neural nhiều ngõ vào 32 3.4.2 Kiến trúc mạng Neural 32 3.4.2.1 Mạng Neural đơn lớp 33 3.4.2.2 Mạng Neural đa lớp 34 3.4.2.3 Mạng Neural hồi qui 35 3.5 Phương thức làm việc mạng Neural 36 x 3.6 Các luật học 38 3.7 Vấn đề thiết kế cấu trúc mạng 40 3.7.1 Số lớp ẩn 40 3.7.2 Số đơn vị lớp ẩn 40 3.8 Thuật toán lan truyền ngược 42 3.8.1 Chỉ số hiệu 43 3.8.2 Luật xích 44 3.8.3 Lan truyền ngược độ nhạy cảm 45 3.9 Ứng dụng mạng Neural nhận dạng 47 Chương XÂY DỰNG HỆ NHẬN DẠNG 4.1 Xây dựng hệ thống nhận dạng 49 4.1.1 Mô tả chung hệ thống 49 4.1.2 Sơ đồ khối hệ thống 49 4.1.3 Phương pháp giải 50 3.4.1.1 Thu nhận tín hiệu 50 3.4.1.2 Trích đặc trưng tiếng nói 53 3.4.1.3 Tính đầu vào cho mạng 57 4.2 Chương trình nhận dạng mười chữ số tiếng Việt 58 4.2.1 Giao diện phần mềm demo 58 4.2.2 Kết thử nghiệm 61 Chương KẾT LUẬN 5.1 Những kết đạt 75 5.2 Hướng phát triển đề tài 75 5.2.1 Xây dựng liệu lớn 75 xi 5.2.2 Xây dựng phần mềm nhận dạng dựa kết nghiên cứu 75 5.2.3 Nghiên cứu phương pháp xác định đặc trưng khác 76 5.2.4 Nghiên cứu phương pháp nhận dạng khác 76 TÀI LIỆU THAM KHẢO 77 PHỤ LỤC 79 xii Bảng 5.8: Kết nhận dạng huấn luyện mạng Neural cho số Hàm Số N truyền lớp ẩn 10 ĐCX 90 90 93 93 92 92 91 91 95 95 92 92 92 92 10 89 89 15 91 91 Logsig 20 89 89 – 25 90 90 purelin 30 92 92 35 90 90 40 90 90 10 90 90 15 92 92 Purelin 20 90 90 – 25 90 90 purelin 30 93 93 35 90 90 40 90 90 10 15 Tansig 20 – 25 purelin 30 35 40 Trang 69 Bảng 5.9: Kết nhận dạng huấn luyện mạng Neural cho số Hàm Số N truyền lớp ẩn 10 15 Tansig 20 – 25 purelin 30 5 88 88 4 91 91 90 90 90 90 95 95 10 ĐCX 35 3 92 92 40 91 91 10 5 87 87 4 90 90 15 Logsig 20 90 90 – 25 91 91 purelin 30 93 93 4 90 90 3 90 90 35 40 10 89 89 15 92 92 90 90 4 90 90 93 93 Purelin 20 – 25 purelin 30 2 35 91 91 40 90 90 Trang 70 Bảng 5.10: Kết nhận dạng huấn luyện mạng Neural cho số Hàm Số N truyền lớp ẩn 10 4 15 3 Tansig 20 2 – 25 purelin 30 35 40 10 ĐCX 90 90 94 94 93 93 93 93 96 96 93 93 2 93 93 10 89 89 15 92 92 Logsig 20 90 90 – 25 3 90 90 purelin 30 94 94 35 3 92 92 40 91 91 10 88 88 15 3 92 92 Purelin 20 90 90 – 25 90 90 purelin 30 94 94 35 2 92 92 40 90 90 Trang 71 Bảng 5.11: Kết nhận dạng huấn luyện mạng Neural cho số 10 Hàm Số N truyền lớp ẩn 10 ĐCX 10 4 88 88 15 3 92 92 Tansig 20 90 90 – 25 90 90 purelin 30 2 93 93 35 3 90 90 40 4 90 90 10 87 87 15 3 92 92 Logsig 20 91 91 – 25 4 90 90 purelin 30 93 93 35 90 90 40 90 90 10 4 89 89 15 2 91 91 90 90 Purelin 20 – 25 90 90 purelin 30 93 93 35 90 90 40 3 2 90 90 Trang 72 Bảng 5.12: Bảng tổng hợp kết nhận dạng cho số từ đến 10 Số Hàm N truyền lớp ĐCX 10 10 84 90 86 90 88 86 88 90 88 90 88 88 15 92 92 89 91 90 90 91 93 91 94 92 91,4 Tansig 20 85 89 92 93 90 88 90 92 90 93 90 90,2 – 25 90 90 91 92 89 89 90 91 90 93 90 90,5 purelin 30 95 96 93 97 94 93 95 95 95 96 93 94,8 35 91 91 91 94 91 90 92 92 92 93 90 91,6 40 89 92 91 92 91 90 90 92 91 93 90 91 89,5 91,4 90,4 92,7 90,4 89,4 90,8 92,1 91 93,1 90,4 10 83 88 84 90 88 85 87 89 87 89 87 87 15 90 90 87 90 90 89 90 91 90 92 92 90 Logsig 20 87 90 90 92 89 89 88 89 90 90 91 89,5 – 25 90 87 90 90 89 90 88 90 91 90 90 89,5 purelin 30 92 93 91 94 93 92 93 92 93 94 93 92,8 35 88 89 89 91 90 89 90 90 90 92 90 89,8 40 90 91 89 91 90 89 90 90 90 91 90 90,1 88,5 89,7 88,6 91,1 89,8 89 89,4 90,1 90,1 91,1 90,4 10 86 89 85 89 87 85 86 90 89 88 89 87,5 15 90 92 89 90 90 90 90 92 92 92 91 90,7 Purelin 20 87 89 90 92 90 90 89 90 90 90 90 89,7 – 25 90 90 90 90 88 88 89 90 90 90 90 89,6 purelin 30 91 93 92 94 92 92 93 93 93 94 93 92,7 35 90 89 88 91 90 90 90 90 91 92 90 90,1 40 88 90 90 91 90 89 90 90 90 90 90 89,8 88,9 90,2 89,1 91 89,6 89,1 89,6 90,7 90,7 90,8 90,4 TB ẩn ĐCX số ĐCX số ĐCX số Trang 73 Từ bảng tổng kết 5.12 thấy:  Mạng cho kết nhận dạng cao 94,8% sử dụng mạng có 30 nơron lớp ẩn, hàm truyền sử dụng „tansig – purelin‟  Chữ số nhận dạng xác số (Độ xác trung bình 93,1%) sử dụng hàm truyền „tansig – purelin‟ Trang 74 Chương KẾT LUẬN 5.1 Những kết đạt  Phƣơng pháp nhận dạng mạng Neural cho kết nhận dạng cao liệu xây dựng Nhƣ dùng mạng Neural làm cấu nhận dạng hiệu quả, hệ thống nhận dạng chữ số  Mạng cho kết nhận dạng cao xây dựng hợp lý  Mơi trƣờng Matlab giúp cơng việc nghiên cứu nhận dạng tiếng nói đơn giản hiệu Nhờ có Matlab cơng cụ VoiceBox mà việc phát triển hệ thống nhận dạng đơn giản nhanh chóng (ví dụ: mã chƣơng trình dùng lệnh, nhiều phần khơng cần lập trình) Những kết luận cho thấy khả sử dụng mạng Neural mơi trƣờng Matlab nhận dạng tiếng nói có nhiều hứa hẹn Tuy nhiên để đạt đƣợc điều phải xây dựng liệu chuẩn có chiến lƣợc xây dựng, huấn luyện, thử nghiệm mạng hợp lý 5.2 Hướng phát triển đề tài 5.2.1 Xây dựng liệu huấn luyện lớn Nhƣ ta thấy, liệu thành phần quan trọng hệ nhận dạng Hiện liệu xây dựng (1100 file, 11 từ, 10 ngƣời) cịn khiêm tốn Để có kết nghiên cứu tốt hơn, mở rộng liệu: tăng số ngƣời nói số từ, đa dạng hóa mơi trƣờng ghi âm 5.2.2 Xây dựng phần mềm nhận dạng dựa kết nghiên cứu Hệ thống nhận dạng đƣợc thử nghiệm mơi trƣờng Matlab, có khả nhận dạng file ghi âm sẵn từ (nhận dạng từ đơn, ngoại tuyến), trƣờng hợp nhận dạng trực tiếp, mạng hoạt động chƣa đƣợc xác Trong để hệ nhận dạng ứng dụng đƣợc hệ phải hoạt động dạng trực tiếp liên tục (tức vừa ghi âm vừa nhận dạng, nhận dạng nhiều Trang 75 chữ số lúc, chạy nhƣ chƣơng trình hệ thống) Mục tiêu sau thử nghiệm hệ thống cho kết cao xây dựng công cụ nhận dạng tiếng nói phần mềm ứng dụng, mục đích nghiên cứu nhận dạng tiếng nói 5.2.3 Nghiên cứu phương pháp xác định đặc trưng khác Ở nghiên cứu này, việc tách đặc trƣng tín hiệu tiếng nói cịn đơn giản Để nâng cao kết nhận dạng cần tìm đặc trƣng ổn định tiếng nói phƣơng pháp trích đặc trƣng hiệu 5.2.4 Nghiên cứu phương pháp nhận dạng khác Các nghiên cứu khác cho thấy mơ hình Markov ẩn (HMM) cho kết nhận dạng cao Hƣớng nghiên cứu đề tài tìm cách kết hợp mạng neural mơ hình Markov ẩn nhằm kết hợp ƣu điểm hai mơ hình Mặt khác, từ vựng nhỏ nhận dạng từ đơn (âm tiết) thích hợp Tuy nhiên với hệ nhận dạng cỡ lớn, hệ nhận dạng tiếng Việt hồn chỉnh (6 nghìn âm tiết) chọn đơn vị nhận dạng âm tiết không hợp Một hƣớng nghiên cứu khác đề tài nhận dạng đơn vị nhỏ âm tiết âm vị Tức xây dựng hệ nhận dạng có chức năng:  Phân biệt đƣợc nhiễu (khoảng lặng), phụ âm, nguyên âm  Nhận dạng phụ âm (phân biệt đƣợc phụ âm khác nhau)  Nhận dạng nguyên âm (phân biệt đƣợc nguyên âm khác nhau)  Nhận dạng điệu âm tiết Trang 76 TÀI LIỆU THAM KHẢO Đoàn Thiện Thuật, Ngữ âm tiếng Việt, NXB ĐHQG Hà Nội, 2003 Lê Bá Dũng, Xử lý tiếng nói, Trƣờng Đại học Hàng Hải Việt Nam, 2001 Phạm Hữu Đức Dục, Mạng Nơron ứng dụng điều khiển tự động, NXB Khoa Học Kỹ Thuật, 2009 Nguyễn Hoàng Hải – Nguyễn Khắc Kiểm, Lập trình Matlab, Nhà xuất Khoa Học Kỹ Thuật, 2003 Joe Tebelskis, Speech Recognition using Neural Networks, School of Computer ScienceCarnegie Mellon University Pittsburgh, Pennsylvania 15213-3890, May 1995 Bahl, L., Bakis, R., Cohen, P., Cole, A., Jelinek, F., Lewis, B., and Mercer, R (1981), Speech Recognition of a Natural Text Read as Isolated Words, In Proc IEEE International Conference on Acoustics, Speech, and Signal Processing, 1981 Mark Hudson Beale, Martin T Hagan, and Howard B Demuth, Neural Network Toolbox™ User‟s Guide, The MathWorks, Inc Bodenhausen, U., and Manke, S (1993), Connectionist Architectural Learning for High Performance Character and Speech Recognition, In Proc IEEE International Confer-ence on Acoustics, Speech, and Signal Processing, 1993 Bourlard, H and Morgan, N (1990), A Continuous Speech Recognition System Embedding MLP into HMM - In Advances in Neural Information Processing Systems 2, Touretzky, D (ed.), Morgan Kaufmann Publishers 10 Bourlard, H., Morgan, N., Wooters, C., and Renals, S (1992), CDNN: A Context Dependent Neural Network for Continuous Speech Recognition, In Trang 77 Proc IEEE International Conference on Acoustics, Speech, and Signal Processing, 1992 11 Bourlard, H and Morgan, N (1994), Connectionist Speech Recognition: A HybridApproach, Kluwer Academic Publishers 12 Bridle, J (1990), Alpha-Nets: A Recurrent “Neural” Network Architecture with a Hidden Markov Model Interpretation Speech Communication, 9:83-92, 1990 13 John R.Deller & John G.Proakis & John H L Hansen, Discrete – Time Processing of Speech Signals, Macmillan Publishing Company, 1993 14 B Plannerer, An Introduction to Speech Recognition, ©2001,2002,2003 Bernd Plannerer, Munich, Germany, March 28, 2005 15 Howard Demuth, Mark Beale - Neural Network ToolboxFor Use with MATLABđ, â COPYRIGHT 1992 - 2002 by The MathWorks, Inc Trang 78 PHỤ LỤC A Giới thiệu hàm ToolBox Matlab cần để xây dựng hệ thống nhận dạng Nhƣ biết, Matlab (Matrix Laboratory) mơi trƣờng trợ giúp tính tốn hiển thị mạnh đƣợc hãng MathWorks phát triển Mức phát triển Matlab ngày chứng tỏ Matlab phần mềm có giao diện cực mạnh nhiều lợi kĩ thuật lập trình để giải vấn đề đa dạng nghiên cứu KHKT Ngoài thƣ viện hàm tính tốn, vào-ra, đồ hoạ… bản, Matlab cịn có toolbox thƣ viện cho lĩnh vực cụ thể Ví dụ có toolbox cho xử lí tín hiệu (Signal Processing), mơ mơ hình (SimulLink), logic mờ (Fuzzy Logic), mạng Neural (NNet), … chí cho thiết kế máy bay (Aerospace) hay giải phƣơng trình vi phân (PDE)… Các hàm xử lý âm [y fs]=wavread(wavfile) Đọc tín hiệu âm từ file wav cho xâu wavfile, y vector mô tả tín hiệu âm (có giá trị thực từ đến 1), fs tần số lấy mẫu (giá trị nguyên) wavwrite(y,fs,wavfile) Ghi tín hiệu âm từ file wav cho xâu wavfile, y vector mô tả tín hiệu âm thanh, fs tần số lấy mẫu sound(y) Phát âm loa, y vector mô tả tín hiệu âm y=wavrecord(n, fs) Ghi âm (từ micro) với tần số lấy mẫu fs n mẫu Kết vector y Trang 79 VoiceBox toolbox VoiceBox toolbox Matlab chuyên xử lí tiếng nói Mike Brookes phát triển VoiceBox yêu cầu Matlab phiên trở lên Voicebox tải từ http://webscripts.softpedia.com/script/Scientific-Engineering- Ruby/Signal- Processing/Voicebox-34702.html VoiceBox gồm hàm chia thành số nhóm chức sau:  Xử lí file âm (đọc, ghi file wav số định dạng file âm khác)  Phân tích phổ tín hiệu  Phân tích LPC  Tính toán MFCC, chuyển đổi spectral - cepstral  Chuyển đổi tần số (mel-scale, midi, )  Biến đổi Fourier, Fourier ngƣợc, Fourier thực  Tính khoảng cách (sai lệch) vector dãy vector  Loại trừ nhiễu tín hiệu tiếng nói Chức quan trọng trích đặc trƣng tín hiệu tiếng nói, mà loại phổ biến LPC MFCC Hàm tính MFCC tín hiệu VoiceBox hàm : melcepst(s,fs,w,nc,p,n,inc,fl,fh) Hàm có nhiều tham số, số tham số quan trọng là:  s vector tín hiệu tiếng nói (có đƣợc sau dùng hàm ), fs tần số lấy mẫu (mặc định 11050)  nc số hệ số MFCC cần tính (tức số phần tử vector đặc trƣng, mặc định 12)  p số lọc mel-scale  w xâu mô tả lựa chọn khác: có tính thêm log lƣợng, có tính thêm đặc trƣng delta Mặc dù hàm gọi cách đơn giản là: c=melcepst(s,fs); Trang 80 Lời gọi hàm sinh ma trận c, dòng ma trận 12 hệ số MFCC frame Để kèm thêm log lƣợng liệu delta nhƣ hệ nhận dạng khác, ta dùng lệnh: c=melcepst(s,fs,’ed’); Khi dịng c vector 26 hệ số MFCC frame tƣơng ứng Nhập xuất Toàn biến sử dụng đƣợc gọi không gian làm việc (workspace) Matlab Sau khỏi Matlab chúng bị xố Để làm việc với liệu đƣợc nhiều lần ta phải ghi (save) nạp (load) biến Ngồi ta cịn có nhu cầu chia xẻ liệu Matlab môi trƣờng khác Matlab cung cấp chức Save Load để thực yêu cầu Ghi đọc liệu qua file Matlab thực qua lệnh save load, thực thi chọn menu Trong trƣờng hợp ta chắn đƣợc cấu trúc file liệu nên dùng lệnh cho nhanh, trƣờng hợp khơng rõ (thƣờng xảy nhập từ file mơi trƣờng khác) ta nên dùng menu máy cần cung cấp xác định cấu trúc file Cú pháp l ệnh save, load: Save Ghi tồn khơng gian làm việc vào file MAT có tên Save x Ghi biến x vào file MAT có tên Save x y z Ghi biến x,y,z vào file MAT có tên Load Đọc biến file MAT có tên vào khơng gian làm vi ệc Load x Đọc giá trị biến x từ file MAT có tên Load x y z Đọc giá trị bi ến x,y,z từ Trang 81 file MAT có tên B Mạng Neural môi trường Matlab Khởi tạo mạng FEEDFORWARD net = newff(P,T,[S1 S2 S(N-l)],{TF1 TF2 TFNl}, BTF,BLF) Dùng newff để tạo mạng từ thông số ban đầu  P: ma trận vector đầu vào mẫu, vector có R phần tử  T: ma trận vector mục tiêu, vector có S phần tử  Si: mảng gồm số neural lớp ẩn tƣơng ứng Thông số bổ sung:  TFi: hàm truyền dùng lớp Mặc định: hàm truyền cho lớp ẩn tansig, cho lớp purelin  BLF: tên hàm huấn luyện Mặc định: hàm huấn luyện trainlm Khởi tạo trọng số Nếu dùng newff, mặc định trọng số đƣợc khởi tạo với giá trị ban đầu tƣơng ứng Nếu muốn khởi tạo lại trọng số bias, dùng lệnh init net = init(net) Huấn luyện mạng Khi trọng số bias đƣợc khởi tạo, nghĩa mạng sẵn sàng cho việc huấn luyện Có thể hiệu chỉnh vài thơng số huấn luyện mặc định: net.trainParam.epochs = 100; net.trainParam.goal = 1; net = train(net,p,t); Mô Hàm sim dùng để mơ mạng Hàm có gái trị đầu vào vector p, đối tƣợng mạng net đầu đầu a mạng a = sim(net,p); Trang 82 ... ? ?Nhận dạng tiếng nói dùng mạng Neural? ??, nhằm nghiên cứu phƣơng pháp nhận dạng tiếng nói tiếng Việt thử nghiệm xây dựng hệ thống nhận dạng cỡ nhỏ 1.1.1 Các kết nghiên cứu nước Nhận dạng tiếng nói. .. quan nhận dạng tiếng nói 12 2.2.2 Các nguyên tắc nhận dạng tiếng nói 14 2.2.3 Các phương pháp nhận dạng tiếng nói phổ biến 14 2.2.4 Các trình hệ thống nhận dạng tiếng nói ... lựa chọn đề tài “ Nhận dạng tiếng nói dùng mạng Neural? ??, nhằm nghiên cứu phương pháp nhận dạng tiếng nói tiếng Việt dùng mạng Neural thử nghiệm phần mềm Matlab Nội dung luận văn trình bày thành

Ngày đăng: 17/12/2022, 16:05

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN