1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Lý thuyết mạng neuron và ứng dụng trong nhận dạng tiếng nói

129 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 129
Dung lượng 893,36 KB

Nội dung

ĐỒ ÁN TỐT NGHIỆP Đề tài: “Lý thuyết mạng Neuron ứng dụng nhận dạng tiếng nói.” LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Giáo viên hướng dẫn: Tiến sỹ Quách Tuấn Ngọc Người thực hiện: Nguyễn Đức Minh (A) Lớp: Tin mềm - K39 Địa liên hệ: Phòng - Nhà 28 - Khu TT Nhà Dầu - Khâm Thiên - Hà Nội Sốđiện thoại: 8511835 GIỚITHIỆULUẬNVĂN Nhan đề: Lý thuyết mạng Neuron vàỨng dụng nhận dạng tiếng nói Nhiệm vụ đề tài: Trình bày kết nghiên cứu lý thuyết phục vụ cho chủđề “Ứng dụng mạng neuron cho vấn đề nhận dạng tiếng nói”; đồng thời xây dựng phần mềm thử nghiệm Nhận dạng nguyên âm với mục đích hiểu sâu cách thức mà mạng neuron tiến hành việc phân loại tín hiệu tiếng nói Tóm tắt sơ lược: Ba chương đầu luận văn chủ yếu chỉđề cập đến sở lý thuyết mạng neuron mà có liên quan đến vấn đề vấn đề nhận dạng tiếng nói: thành phần mạng neuron, lý thuyết học cho mạng neuron, thuật toán học back-propagation cho mạng tiến đa mức, mở rộng cho mạng neuron hồi quy trễ Chương thứ tư tập trung phân tích Lý thuyết nhận dạng tiếng nói mà chủ yếu phương pháp tiền xử lý tín hiệu Filter Bank (để tạo đầu vào cho mạng neuron) Ba chương 5, 6, trình bày bước Phân tích, Thiết LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com kế cho việc xây dựng phần mềm thử nghiệm nhận dạng nguyên âm đồng thời giới thiệu đôi nét kết cài đặt phần mềm Chương chương Kết luận luận văn LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com GIỚI THIỆU Trong năm gần đây, người ta thường nhắc đến “Trí tuệ nhân tạo” phương thức mơ trí thơng minh người từ việc lưu trữ đến xử lý thơng tin Và thực trở thành tảng cho việc xây dựng hệ máy thông minh đại Cũng với mục đích đó, dựa quan điểm nghiên cứu hồn tồn khác, mơn khoa học đời, Lý thuyết Mạng neuron Tiếp thu thành tựu thần kinh sinh học, mạng neuron xây dựng thành cấu trúc mô trực tiếp tổ chức thần kinh não người Từ nghiên cứu sơ khai McCulloch Pitts năm 40 kỷ, trải qua nhiều năm phát triển, thập kỷ này, trình độ phần cứng phần mềm đủ mạnh cho phép cài đặt ứng dụng phức tạp, Lý thuyết Mạng neuron thực ý nhanh chóng trở thành hướng nghiên cứu đầy triển vọng mục đích xây dựng máy thơng minh tiến gần tới Trí tuệ người Sức mạnh thuộc chất tính tốn song song, chấp nhận lỗi mạng neuron chứng minh thông qua nhiều ứng dụng thực tiễn, đặc biệt tích hợp với kỹ thuật khác Một ứng dụng kinh điển mạng neuron lớp tốn nhận dạng mẫu, mẫu tập hợp (hay vector) tham số biểu thị thuộc tính q trình vật lý (ví dụ tín hiệu tiếng nói) Ngồi sức mạnh vốn có, mạng neuron cịn thể ưu điểm việc nhận dạng thơng qua khả mềm dẻo, dễ thích nghi với mơi trường Chính vậy, coi mạng neuron trước tiên cơng cụ để nhận dạng Nhiều cơng trình nghiên cứu, nhiều ứng dụng thực nghiệm thực mạng neuron với mục đích nhận dạng thu thành công to lớn Trước quyến rũ ứng dụng Trí tuệ nhân tạo, tính tị mị trước lý thuyết chưa nghiên cứu động viên khuyến khích thày giáo hướng dẫn, định thực nghiên cứu ban đầu LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Lý thuyết mạng neuron với mục đích cụ thể ứng dụng vào vấn đề nhận dạng tiếng nói Do thời gian thực đồ án tốt nghiệp có ba tháng, tơi khơng có tham vọng xây dựng phần mềm nhận dạng tiếng nói hồn chỉnh Mục đích luận văn là: Trình bày kết nghiên cứu lý thuyết phục vụ cho chủ đề “Ứng dụng mạng neuron cho vấn đề nhận dạng tiếng nói”; đồng thời xây dựng phần mềm thử nghiệm Nhận dạng nguyên âm với mục đích hiểu sâu cách thức mà mạng neuron tiến hành việc phân loại tín hiệu tiếng nói LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nội dung luận văn Phần I Cơ sở lý thuyết mạng neuron cho vấn đề nhận dạng tiếng nói Chương Mở đầu Khái niệm thành phần kiến trúc mạng neuron Chương Phương pháp học cho mạng tiến đa mức Các quy tắc học, mơ hình học thuật toán học (thuật toán back-propagation)cho mạng tiến (feedforward) đa mức Đánh giá cải thiện tính thuật toán back-propagation Chương Các mở rộng cho mạng hồi quy trễ Mơ hình mạng neuron hồi quy trễ thuật tián backpropagation mở rộng Chương Nhận dạng tiếng nói khả ứng dụng mạng neuron trễ Xử lý filter bank cho tín hiệu tiếng nói quan điểm ứng dụng mạng neuron trễ cho việc nhận dạng Phần II Xây dựng phần mềm thử nghiệm nhận dạng ngun âm Chương Phân tích tốn nhận dạng ngun âm Phân tích u cầu tốn đề xuất phương án thực Chương Chiến lược thiết kế phần mềm Thiết kế modul chương trình theo chức cụ thể Chương Giới thiệu phần mềm cài đặt Trình bày đơi nét cách thức cài đặt số modul quan trọng Phần III Kết luận LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Chương Kết luận Xét mặt lý thuyết, mạng neuron tương đối độc lập với chất q trình vật lý cần nhận dạng mà tín hiệu tiếng nói ví dụ Dựa quan điểm nhận dạng mẫu, mạng neuron quan tâm tới tham số đặc trưng tín hiệu tiếng nói sử dụng chúng đầu vào; sau trình tính tốn, đầu mạng neuron đánh giá cho phép dễ dàng biết tín hiệu ban đầu thuộc loại Chính thế, phần trình bày kết nghiên cứu lý thuyết (Phần I), tơi có ngầm phân chia thành hai khu vực: ba chương đầu hồn tồn nói mạng neuron, chương cuối chủ yếu nói cách thức lấy tham số đặc trưng tín hiệu tiếng nói Do mục đích nghiên cứu lý thuyết đề tài phần mềm thử nghiệm chưa hoàn thiện, Phần II luận văn chiếm số trang không nhiều (25 trang), đề cập đến hầu hết quan điểm xây dựng phần mềm.Sau xin giới thiệu nét khái quát nội dung thể Lý thuyết Mạng neuron Mạng neuron nhân tạo mô hình mơ cấu trúc não người Hai thành phần cấu tạo nên mạng neuron neuron (mô tế bào thần kinh) synapse (mô khớp nối thần kinh) Trong kiến trúc mơ hình kết nối, neuron nút mạng, liên kết với thông qua synpase, cung mạng Neuron đơn vị tính tốn có nhiều đầu vào đầu ra, đầu vào đến từ syanpse Đặc trưng neuron hàm kích hoạt phi tuyến chuyển đổi tổ hợp tuyến tính tất tín hiệu đầu vào thành tín hiệu đầu Hàm kích hoạt đảm bảo tính chất phi tuyến cho tính tốn mạng neuron Synapse thành phần liên kết neuron, nối đầu neuron với đầu vào neuron khác Đặc trưng synapse trọng số mà tín hiệu qua nhận với trọng số Các trọng số synapse LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com tham số tự mạng neuron, thay đổi nhằm thích nghi với mơi trường xung quanh Mạng tiến đa mức kiến trúc mạng nhất, neuron chia thành mức Có ba loại mức: mức đầu vào bao gồm nút nguồn (không phải neuron) cung cấp tín hiệu đầu vào chung nhận từ mơi trường; mức ẩn bao gồm neuron không quan hệ trực tiếp với môi trường; mức đầu đưa tín hiệu đầu cho mơi trường Lần lượt từ mức đầu vào tới mức đầu ra, tín hiệu đầu nút mạng thuộc mức trước tín hiệu đầu vào cho nút mạng thuộc mức tiếp sau Từ kiến trúc ta hình dung mạng neuron xử lý thông tin có nhiều đầu vào nhiều đầu Q trình tích luỹ mạng (học) q trình mà tham số tự (các trọng số synapse) điều chỉnh nhằm mục đích thích nghi với mơi trường Đối với vấn đề học cho mạng neuron người ta quan tâm tới ba yếu tố sau: * Quy tắc học: Phương thức tảng cho việc thay đổi trọng số syanapse (ví dụ: Quy tắc học hiệu chỉnh lỗi, Quy tắc học kiểu Heb, ) * Mơ hình học: Cách thức mạng neuron quan hệ với môi trường q trình học (ví dụ: Mơ hình học với người dạy, ) * Thuật toán học: Các bước tiến hành cụ thể cho trình học Thuật toán Back-propagation thuật toán học kinh điển áp dụng cách phổ biến cho mạng tiến đa mức Nó xây dựng sở Quy tắc học hiệu chỉnh lỗi Mô hình học với người dạy Thuật tốn bao gồm hai giai đoạn tính tốn: giai đoạn tiến mà tín hiệu chức từ mức đầu vào tới mức đẩu mạng nhằm tính tốn tín hiệu lỗi; giai đoạn lùi tín hiệu lỗi quay trở lại từ mức đầu qua mức để tính gradient cục neuron Để nâng cao tính thuật tốn, có nhiều kinh nghiệm thực tế nêu thành quy tắc mà không chứng minh cách chặt chẽ Các mạng hồi quy trễ lớp kiến trúc mở rộng tích hợp quan điểm synapse trễ kiến trúc hồi quy dựa sở mạng tiến đa mức Một LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com synapse trễ bao gồm nhiều nhánh, nhánh có trọng số riêng đặc biệt có tốn tử trễ theo thời gian (z-n) nhằm quan tâm tới ảnh hưởng lẫn neuron tời điểm khác Lớp kiến trúc đưa để xử lý tín hiệu có đặc tính thống kê biến thiên theo thời gian tín hiệu tiếng nói Lý thuyết Nhận dạng tiếng nói Nhận dạng tiếng nói Q trình thu nhận xử lý tín hiệu tiếng nói nhằm mục đích nhận biết nội dung văn Đặc trưng âm tiếng nói đa dạng tuỳ theo loại âm vị khác nhau, đơn giản dễ xử lý nguyên âm Nguyên âm âm vị đặc trưng nguồn âm tuần hồn t khơng bị chặn trình phát âm Đặc trưng nguyên âm thể formants (tần số cộng hưởng) tín hiệu miền tần số Nhận dạng mẫu tiếp cận nhận dạng tiếng nói dựa sở so sánh mẫu (các vector tham số đặc trưng cho đoạn tín hiệu cần nhận dạng) thước đo khoảng cách mẫu mà khơng cần quan tâm q nhiều tới tính chất âm học tín hiệu Tiếp cận gợi ý cho quan điểm ứng dụng mạng neuron dựa việc xử lý mẫu đầu vào mạng Quá trình xử lý đầu cuối filter bank hai phương pháp xử lý tín hiệu tiếng nói với mục đích lấy tham số đặc trưng tín hiệu tiếng nói Các tham số đặc trưng đầu vào cho nhận dạng Đặc trưng đầu cuối filter bank dãy lọc thông dải, lọc chịu trách nhiệm dải thông riêng phạm vi tần số cần quan tâm Cách cài đặt thông dụng cho filter bank dựa phép biến đổi Fourier thời gian ngắn Một tính chất quan trọng thể khác loại filter bank khác cách thức phân chia dải thông cho lọc Trong thực tế, người ta thường hay sử dụng số kiểu phân chia không Khả ứng dụng mạng neuron trễ nhắc tới Lý thuyết nhận dạng tiếng nói minh họa mang tính kinh điển cho quan điểm sử dụng mạng neuron Tín hiệu tiếng nói cần nhận dạng sau lấy mẫu lượng tử LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com phân thành đoạn theo thời gian (các frame); sau đoạn chuyển qua xử lý filter bank chuyển tới mạng neuron Các frame xử lý cách sau khoảng thời gian trễ cố định Nhờ vào cấu trúc đặc biệt dựa synapse trễ, mạng neuron trễ có khả nắm bắt biến thiên theo thời gian đặc tính thống kê tín hiệu tiếng nói Phần mềm thử nghiệm Nhận dạng nguyên âm Quá trình xử lý mạng neuron dựa mơ hình kết nối phân tán quy mơ lớn ln gây khó khăn cho người nghiên cứu việc hiểu ý nghĩa kiểm soát hoạt động mạng Mặt khác, thân Lý thuết mạng neuron xây dựng từ nhiều kinh nghiệm thực tế Chính thế, để phục vụ cho việc nghiên cứu thân, tiến hành xây dựng phần mềm mang tính thử nghiệm tốn Nhận dạng ngun âm Tơi lựa chọn nguyên âm làm đối tượng nhận dạng âm vị có đặc trưng đơn giản dễ nhận dạng nhất, phù hợp cho phần mềm thử nghiệm Điều đảm bảo tính định cho phần mềm không cần phải thiết kế mạng neuron lớn Tuy nhiên tính chất ngun âm khơng làm cho độ phức tạp thủ tục xây dựng thi hành mạng đơn giản cách đáng kể Điều giải thích đặc tính độc lập chất đối tượng nhận dạng mạng neuron Phần mềm xây dựng theo bước từ Phân tích, Thiết Cài đặt Phần mềm cài đặt chưa hoàn thiện thời gian gấp 10 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com int NumConstants; float *Constants; char **ConstName; /* Dữ liệu thời xử lý */ char *CurrentData; /*tên liệu (tên file)*/ int T; /* số frames */ float **ExtData;/*mảng lưu giữ trực tiếp liệu*/ float *A; /* (Activations) đầu Unit*/ float *GA;/* mảng gradient cục cho Unit*/ /* Các thuộc tính liên quan đến Unit */ int *type; int *backtype; int *Xindex; int *Xlag; ConnectorType *link_mode; float *backthresh; int *Numinflows; int **inflows; float **inW; /* mảng tất trọng số kết nối*/ float **inGW; float **Gain; /* mảng tất th/số tốc độ học */ float **Momentum; /* mảng tất h/số moment */ 43 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com float **DeltaW;/*mảng tất điều chỉnh trọng số*/ float **Plast; /*mảng tất hệ số độ mềm dẻo*/ Connection ***ConLink; } NetExe; /* Các hàm ch/đổi cấu trúc liệu cho mạng neuron */ NetExe *Compile(Net *net); void UpdateNet(Net *, NetExe *, int all_flag); /* Khởi đầu th/số cho th/toán back-propagation */ void initGainAndMomentum(NetExe *net, float gain, float momentum); /* Thực “bước xuống” theo gradient cục có sử dụng tham số moment */ void GradStep(Net *ann, NetExe *net, int all_flag); /* Nạp liệu bên */ void LoadExtData(NetExe *, char *Name, int load_targets, int check_range); /* “Giai đoạn tiến” thuật toán back-propagation */ void initForward(NetExe *); void Forward(NetExe *); void ForwardSection(NetExe *, int start_t, int end_t); void FinishForward(NetExe *); /* “Giai đoạn lùi” thuật toán back-propagation */ void initBackward(NetExe *); float Backward(NetExe *); 44 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com float BackwardSection(NetExe *, int start_t, int end_t); float BackwardSectionAndUpdate(NetExe *net, int start_t, int end_t); float FinishBackward(NetExe *); /* Tính tốn lỗi toàn thể */ float GetGlobalError(NetExe *); Modul AudioFiles Đây modul hệ thống quản lý thao tác vào/ra cho file âm thanh, cung cấp thủ tục chủ yếu sau: /* Thủ tục nạp toàn file âm */ void LoadAudio(char *fn, AUDiO_BUFFER *); /* Các thủ tục vào */ AUDiO_FiLE *OpenAudioFile(char *fn, char *mode); AUDiO_FiLE *OpenRawAudioFile(char *fn, int samp_freq, int little_endian_flag, int header_size, char *mode); int AudioReadFile(AUDiO_FiLE *, short *Buffer, int NumSamples); int AudioFileEOF(AUDiO_FiLE *); void CloseAudioFile(AUDiO_FiLE *); /* Lấy thông tin file âm mở */ char *GetAudioFileMode(AUDiO_FiLE *); 45 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com int GetAudioFileNumSamples(AUDiO_FiLE *); Modul ParamFiles Đây modul hệ thống quản lý thao tác vào/ra cho file tham số, cung cấp thủ tục chủ yếu sau: /* Các thủ tục nạp lưu trữ toàn file tham số */ float **LoadParameters(char *fn, int *SampleSize, int *NumSamples); void SaveParameters(char *fn, int SampleSize, int NumSamples, float **Data); /* Các thủ tục vào */ PARAM_FiLE *OpenParameterFile(char *fn, int *SampleSize, char *mode); float *ReadParameterSample(PARAM_FiLE *); void WriteParameterSample(PARAM_FiLE *, float *); int ParameterFileEOF(PARAM_FiLE *); void CloseParameterFile(PARAM_FiLE *); /* Lấy thông tin file tham số mở */ char *GetParamFileMode(PARAM_FiLE *); int GetParamFileNumSamples(PARAM_FiLE *); 7.3 Hướng dẫn sử dụng phần mềm Phần mềm bao gồm file NeuronSpeech.exe cấu trúc thư mục kèm theo Để chạy chương trình, người sử dụng cần copy file NeuronSpeech.exe thư mục mức vào chung thư mục với tên 46 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Các công việc thực phần mềm cụ thể sau: Nạp file lưu trữ mạng neuron Người sử dụng tạo file lưu trữ mạng neuron chức thêm phần mềm (File->New) File có tên Untitled.net chứa mạng neuron có cấu trúc cố định hình 7.2 với số giá trị khởi đầu cho trọng số synapse (của Connection) Người sử dụng tiến hành thao tác file lưu file lên đĩa với tên khác chức lưu file phần mềm (File->Save As ) Người sử dụng nạp file lưu trữ mạng neuron có sẵn từ ổ đĩa chức mở file phần mềm (File->Open) Sau tiến hành thao tác mạng, file chứa mạng lưu lại lên đĩa với tên khác chức lưu file phần mềm Chú ý: * Các file mặc định lưu lên đĩa Sau thao tác làm biến đổi mạng neuron, khơng có cách khơi phục lại trạng thái trước * Khi bắt đầu chạy phần mềm, file chứa mạng neuron chưa nạp không thực thao tác mạng Tạo file chứa tham số đích (đáp ứng mong muốn) cho file âm Để tiến hành tích luỹ hay đánh giá tính nhận dạng, file âm cần phải có file chứa tham số đích cung cấp đáp ứng mong muốn cho mạng neuron Có hai chức tạo file này: Tạo file cho việc tích luỹ Cửa sổ giao diện hình 7.3 (Make Files->Make Targ Files For Training->A) (nếu bạn muốn tạo file tham số đích tương ứng với nguyêm âm chọn mục Menu tương ứng với nguyên âm đó) 47 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Hình 7.3 Cửa sổ giao diện cho việc tạo file đích (*.tag) Trong ListBox bên trái phần mềm tất file *.wav thư mục quy định riêng cho file âm dành để tích luỹ (mặc định TRAINWAV) ListBox bên phải sẵn tên file *.wav mà chưa có file giá trị đích tương ứng Người sử dụng sử dụng Button để thêm hay bớt file ListBox bên phải (thêm file cách chọn file ListBox bên trái bấm Button “Add”) Sau bấm “OK”, tất file âm có tên ListBox bên phải tạo file giá trị đích tương ứng (có tên phần mở rộng “tag”) phù hợp với nguyên âm chọn Chú ý: * Thư mục quy định cho file âm dành để tích luỹ thay đổi nhờ chức thư mục hệ thống phần mềm (System>Dierectory) Tạo file cho việc đánh giá tính nhận dạng 48 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Cách sử dụng tương tự khác chỗ đối tượng file âm dành để đánh giá tính nhận dạng (Make Files->Make Targ Files For Evaluation->A) Chú ý: * Thư mục quy định cho file âm dành để đánh giá tính nhận dạng (mặc định EVALWAV) thay đổi nhờ chức thư mục hệ thống phần mềm (System->Dierectory) Xử lý filter bank cho file âm Để thực thao tác mạng neuron, file âm cần phải trải qua trình xử lý filter bank để thu file tham số đặc trưng (có tên phần mở rộng “dat”) làm đầu vào cho mạng neuron Các tham số đặc trưng vector feature frame xếp liên tiếp Ở đây, có hai chức (Make Files->Make Targ Files>For Training Make Files->Make Targ Files->For Evaluation) cách sử dụng tương tự Tiến hành tích luỹ mạng neuron Đối với mạng neuron nạp, người sử dụng thực tích luỹ mạng mô tả (Run Net->BackPropagation Training) Cửa sổ giao diện cho thao tác có hình thức hồn tồn giống hình 7.3, có ý nghĩa khác Các file ListBox bên trái file tham số đặc trưng có file giá trị đích tương ứng (của file âm thanh); file kết trình xử lý filter bank file âm dành cho việc tích luỹ ListBox bên phải sẵn file giống ListBox bên trái Nếu người sử dụng muốn tích luỹ với tập hợp ví dụ nhỏ bỏ bớt số file Button hai ListBox Sau bấm “OK”, có DialogBox yêu cầu người sử dụng chọn giá trị quan trọng cho q trình tích luỹ như: số vòng lặp tối đa, ngưỡng 49 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com dừng cho lỗi tổng thể mạng Sau tiếp tục bấm “OK”, phần mềm tiến hành tích luỹ mạng neuron khoảng thời gian không nhỏ (tuỳ theo giá trị người sử dụng nhập vào tuỳ theo tính chất mạng neuron) Mạng neuron sau tích luỹ bị thay đổi so với ban đầu Kết q trình tích luỹ (giá trị lỗi tổng thể) thông báo lên cửa sổ phần mềm sau vịng lặp Hình 7.4 thể ví dụ kết tích luỹ cho trường hợp có ba vịng lặp Tiến hành đánh giá tính nhận dạng cho mạng neuron Thao tác thứ hai cho mạng neuron nạp tiến hành đánh giá tính nhận dạng mạng Cách tiến hành thao tác tương tự (Run Net->Performance Evaluation), có khác khơng xuất DialogBox sau bấm “OK” kết hình thơng tin số frame nhận dạng tỷ lệ phần trăm so với tổng số frame Kết hình có dạng hình 7.5 50 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Hình 7.4 Ví dụ kết tích luỹ Hình 7.5 Ví dụ kết đánh giá tính nhận dạng 51 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Chương KẾT LUẬN 8.1 Những kết nghiên cứu đạt Mặc dù nghiên cứu phôi thai Lý thuyết mạng neuron năm 40 kỷ, vài thập niên trở lại thực có ứng dụng quan trọng mang đến nhiều hứu hẹn hệ máy thơng minh Chính vậy, riêng tơi cịn điều mẻ; mơn lý thuyết tương lai Điều thúc đẩy vừa thực nghiên cứu lý thuyết vừa cố gắng cài đặt phần mềm thử nghiệm với tham vọng nắm gọi khoảng thời gian thực luận văn Theo gợi ý thày giáo hướng dẫn, lựa chọn toán Nhận dạng nguyên âm cho việc ứng dụng mạng neuron Phải nói lý thuyết mạng neuron nhân tạo phức tạp quy mơ thân óc người mà mơ Chỉ với số ràng buộc mặt cấu trúc mang tính thần kinh sinh học, mạng neuron ln có tính mở cao việc xây dựng quy tắc học, thuật toán học phong phú phạm vi ứng dụng (lưu trữ mẫu, nhận dạng mẫu, xấp xỷ hàm, điều khiển, lọc, thích nghi, ) Trong khuôn khổ nghiên cứu cho luận văn tốt nghiệp, đạt số kết cụ thể sau: * Đã nắm khái niệm thành phần kiểu kiến trúc mạng neuron * Đã hiểu ý nghĩa việc học hay tích luỹ, có vai trị to lớn quy tắc học, mơ hình học thuật tốn học nhiều khả ứng dụng khác 52 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com * Đã sâu nghiên cứu kiểu kiến trúc kinh điển (mạng tiến đa mức) thuật toán học coi phù hợp cho kiến trúc thuật toán back-propagation Qua thấy rõ ưu nhược điểm kinh nghiệm nhằm cải thiện thuật toán, * Đã tìm hiểu mở rộng cho mơ hình mạng trễ hồi quy dựa kiến trúc mạng tiến đa mức với mục đích ứng dụng cho tốn nhận dạng tiếng nói Về lý thuyết nhận dạng tiếng nói: * Đã tập trung khai thác phương pháp xử lý tín hiệu hay sử dụng kỹ thuật filter bank nhằm lấy vector đặc trưng tín hiệu làm dầu vào cho mạng neuron Ngoài việc xây xựng phần mềm thử nghiệm cho phép tôi: * Kiểm nghiệm kiến thức lý thuyết thu nhận * Có nhìn rõ nét kỹ thuật ứng dụng lý thuyết vào thực tế * Bên cạnh đó, nâng cao kỹ phân tích, thiết kế lập trình việc giải tốn có độ phức tạp trung bình Tuy biết điều thu nhận phần nhỏ nghành nghiên cứu lớn, tự nhận thấy gặt hái thành công định giai đoạn nghiên cứu 8.2 Đánh giá kết cài đặt phần mềm thử nghiệm Xuất phát từ yêu cầu toán nhận dạng nguyên âm, phân tích thiết kế ban đầu, sau thời gian tiến hành cài đặt, thấy chưa thực hồn thiện cơng việc cần làm, cịn nhiều vấn đề cần tiếp tục giải 8.2.1 Những điều giải 53 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com  Xây dựng hệ thống modul thư viện cung cấp đầy đủ thủ tục cho công việc:  Xử lý tín hiệu tiếng nói  Xử lý filter bank  Xây dựng lưu trữ mạng neuron  Thi hành mạng neuron theo thuật tốn back-propagation  Xây dựng cơng cụ có chế độ thực thay đổi theo giá trị biến truyền; điều cho phép việc thay đổi ý đồ thực xây dựng modul chương trình  Modul chương trình đảm nhiệm việc nhận dẫn đầu vào lệnh thực người sử dụng thông qua giao diện để thực công việc sau:  Tạo file tham số đặc trưng cho file âm kết trình xử lý filter bank  Tạo file chứa giá trị đầu mong muốn cho file âm ứng với nguyên âm  Tiến hành tích luỹ mạng neuron từ file tham số đặc trưng file đầu mong muốn  Tiến hành đánh giá tính nhận dạng mạng neuron từ tập hợp file tham số đặc trưng 8.2.2 Những điều chưa giải Do độ phức tạp phần mềm trình tự cài đặt từ modul thư viện đến modul chương trình chính, sau thiết kế giao diện, với khoảng thời gian thực đề tài tốt nghiệp, tạo cho phần mềm diện mạo khả quan người sử dụng để lại nhiều điều thiếu sót sau: 54 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com  Chưa có tính mở cao dạng file âm file tham số (mới xử lý file âm *.wav file tham số nhị phân)  Chưa cài đặt việc nhận dạng âm trực tiếp từ micro (do thời gian gấp)  Chưa cho phép người sử dụng tự tạo mạng neuron  Giao diện thiết kế chưa thuận tiện cho việc sử dụng  Chưa có nhiều tuỳ chọn cho phép người sử dụng thay đổi tự chế độ thực tích luỹ đánh giá tính nhận dạng  Chưa tiến hành nhiều thử nghiệm phần mềm để có nhìn cụ thể tính mạng neuron có cấu trúc khác  8.3 Một vài suy nghĩ sau nghiên cứu việc ứng dụng Lý thuyết mạng neuron Nhận dạng tiếng nói Trong bối cảnh mà nghiên cứu chuyển sang hướng xây dựng hệ thống thông minh, mạng neuron lên giải pháp đầy hứu hẹn Nó thể ưu điểm bật so với hệ thống khác khả mềm dẻo, linh hoạt tính tốn thơ; số điểm khác biệt óc người với máy thơng minh nhân tạo Nhưng mà địi hỏi độ phức tạp cao thiết kế cài đặt hệ thống ứng dụng để đạt tính tốt Điểm mấu chốt quy mô hệ thống số lượng neuron số lượng mức ẩn Khả cải thiện không ngừng tương lai với phát triển mạch tích hợp phần cứng cỡ lớn nhớ ngày lớn cho phần mềm máy vi tính Chính điều mà mạng neuron coi “kỹ thuật kỷ 21” 55 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Tuy nhiên, thông qua việc cài đặt phần mềm thử nghiệm, thấy vấn đề quan trọng cần phải tiếp tục nghiên cứu giải quết vấn đề tốc độ hội tụ thuật toán học tập hợp liệu có kích thước lớn Bên cạnh phương pháp cải thiện thân thuật tốn kỹ thuật xử lý song song nhiều processor đem lại cho phần mềm nhận dạng tính tốt Và nhà bác học ln tìm cách khám phá quy tắc học thuật toán học hiệu Một điều dễ nhận thấy mạng neuron mơ trực tiếp óc người mặt cấu trúc mục tiêu trình học (điều chỉnh trọng số synnapse) quy tắc học đưa t mang tính tốn học chưa thực sự bắt chướcvề mặt thần kinh sinh học trình học xảy óc Tóm lại, khẳng định điều mục tiêu tiến gần tới hoàn hảo máy nhận thức người thách thức lớn môn lý thuyết Lý thuyết mạng neuron mà chất tương tự thần kinh sinh học cấu trúc cho “tia hy vọng” đáng lạc quan 8.4 Hướng phát triển đề tài Bản luận văn xây dựng dựa bước chập chững trình nghiên cứu Lý thuyết mạng neuron ứng dụng cho vấn đề nhận dạng tiếng nói nên chắn có nhiều điều tiếp tục phát triển mục tiêu xây dựng phần mềm nhận dạng hiệu Tuy nhiên xét riêng phạm vi toán nhận dạng nguyên âm, điều kiện cho phép, tiếp tục đề tài theo hướng sau: * Hoàn chỉnh thiếu sót chưa giải nêu phần 8.2.2 * Mở rộng phần mềm tất nguyên bao gồm nguyên âm có dấu, mở rộng cho âm tiết 56 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com * Lựa chọn sở hệ thống đủ mạnh xây dựng mạng neuron đủ hiệu nghiên cứu việc tối ưu cài đặt thuật tốn học để xây dựng hệ thống “truyền lệnh” âm đơn giản Nhưng để đạt mục tiêu này, tơi nghĩ khó khăn cho tơi tiến hành cơng việc Tơi mong muốn có hội trao đổi làm việc với người có mối quan tâm tới Mạng neuron 57 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com ... Nhan đề: Lý thuyết mạng Neuron và? ??ng dụng nhận dạng tiếng nói Nhiệm vụ đề tài: Trình bày kết nghiên cứu lý thuyết phục vụ cho chủđề ? ?Ứng dụng mạng neuron cho vấn đề nhận dạng tiếng nói? ??; đồng... luanvanchat@agmail.com Lý thuyết mạng neuron với mục đích cụ thể ứng dụng vào vấn đề nhận dạng tiếng nói Do thời gian thực đồ án tốt nghiệp có ba tháng, tơi khơng có tham vọng xây dựng phần mềm nhận dạng tiếng nói. .. lẫn neuron tời điểm khác Lớp kiến trúc đưa để xử lý tín hiệu có đặc tính thống kê biến thiên theo thời gian tín hiệu tiếng nói Lý thuyết Nhận dạng tiếng nói Nhận dạng tiếng nói Quá trình thu nhận

Ngày đăng: 01/11/2022, 16:07

w