Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 98 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
98
Dung lượng
1,28 MB
Nội dung
Đại học Quốc Gia Thành phố Hồ Chí Minh TRƯỜNG ĐẠI HỌC BÁCH KHOA -oOo - LÊ THỊ KIM ANH NGHIÊN CỨU VÀ ỨNG DỤNG MẠNG NEURON TRONG NHẬN DẠNG TIẾNG VIỆT Chuyên ngành: KT VÔ TUYẾN – ĐIỆN TỬ Mã số ngành: 2.07.01 LUẬN VĂN THẠC SĨ Tp HỒ CHÍ MINH, tháng 10 năm 2003 BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự – Hạnh phúc NHIỆM VỤ LUẬN VĂN CAO HỌC Họ tên học viên: LÊ THỊ KIM ANH Phái: Nữ Ngày tháng năm sinh: 20.02.1969 Nơi sinh: Bình Dương Chuyên ngành: KỸ THUẬT VÔ TUYẾN ĐIỆN TỬ Khóa: 12 (2001-2003) I TÊN ĐỀ TÀI: “ Nghiên cứu ứng dụng mạng neuron nhận dạng tiếng Việt” II NHIỆM VỤ VÀ NỘI DUNG: Nghiên cứu tổng quan hệ thống nhận dạng tiếng nói Tìm hiểu mạng neuron ứng dụng mạng neuron nhận dạng tiếng nói Xử lý tiếng nói chọn phương pháp trích đặc trưng Xây dựng mạng neuron để nhận dạng tiếng nói Mô kết ngôn ngữ Matlab III NGÀY GIAO NHIỆM VỤ: 15.05.2003 IV NGÀY HOÀN THÀNH NHIỆM VỤ:08.11.2003 V HỌ VÀ TÊN GIÁO VIÊN HƯỚNG DẪN: Cô TS Nguyễn Như Anh Thầy GVC_ThS Tống Văn On VI HỌ VÀ TÊN GIÁO VIÊN PHẢN BIỆN: Thầy PGS.TS Vũ Đình Thành Thầy TS Trần Xuân Phước GVHD1 GVHD2 GVPB1 GVPB2 Nội dung đề cương Luận văn Cao học thông qua hội đồng chuyên ngành PHÒNG ĐÀO TAỌ SAU ĐẠI HỌC Ngày…… tháng…… năm CHỦ NHIỆM NGÀNH Lời cảm ơn Em xin bày tỏ lòng biết ơn chân thành đến Cô Nguyễn Như Anh, đặc biệt Thầy Tống Văn On tận tình gíup đỡ động viên em mặt tinh thần phương tiện để hòan thành luận văn Xin chân thành cảm ơn q Thầy Cô môn Điện tử giúp đỡ em nhiều mặt trình thực luận án Con xin biết ơn Ba Má nuôi dạy khôn lớn tạo điều kiện để học tập ngày hôm Xin cảm ơn anh chị em, bạn bè, đồng nghiệp giúp đỡ động viên Kim Anh suốt trình làm luận án Bách Khoa, ngày 25 tháng 10 năm 2003 Lê Thị Kim Anh Tóm tắt Với mục tiêu để thực đề tài này, người viết bước nghiên cứu vấn đề sau: Nghiên cứu tổng quan hệ thống nhận dạng tiếng nói Tìm hiểu mạng neuron ứng dụng mạng neuron nhận dạng tiếng nói Xử lý tiếng nói chọn phương pháp trích đặc trưng Xây dựng mạng neuron để nhận dạng tiếng nói Mô kết ngôn ngữ Matlab Kết cuối đạt tương đối khả quan mô hệ thống nhận dạng tiếng nói ngôn ngữ Matlab với mức độ xác cao (khoảng 97%), sở để xây dựng mạng Neuron để nhận dạng tiếng nói thực phần cứng kit FPGA Abstract In order to this thesis, the author researched the following problems: Generally researching the speech recognization system Learning about neural network and its applications to speech recognization Processing speech and chosing the specific characterics method Setting up a neural network to recognize Vietnamese speech Simulating the results by using Matlab The final results are very relatively favorable The author simulated successfully a speech recognization system using Matlab with accuration up to 97%, which is the base to set up a speech recognization system done by EPGA kit PHẦN MỞ ĐẦU PHẦN TỔNG QUAN VỀ HỆ THỐNG NHẬN DẠNG PHẦN GIỚI THIỆU VỀ MẠNG NEURON PHẦN XỬ LÝ TIẾNG NÓI VÀ TRÍCH ĐẶC TRƯNG PHẦN XÂY DỰNG MẠNG NEURON Đề tài: Nghiên cứu ứng dụng mạng Neuron nhận dạng tiếng Việt 93 GVHD: Cô TS Nguyễn Như Anh Thầy GVC_ThS Tống Văn On Phần trình bày cách xây dựng mạng neuron ứng dụng cho công việc nhận dạng tiếng nói sau tìm hiểu đặc trưng chung mạng việc phân tích, xử lý trích đặc trưng tiếng nói Do mạng hay thông số tối ưu nhất, mà tùy thuộc vào yêu cầu tóan, nên để tìm giải pháp tối ưu đòi hỏi phải có nhiều thời gian thử nghiệm với nhiều mạng khác nhau, nhiều thông số khác nhau… Dựa thực nghiệm, kinh nghiệm báo cáo khoa học, luận văn sử dụng mạng Perceptron nhiều lớp thuật tóan truyền ngược Cụ thể mạng có lớp: lớp ngõ vào, lớp ẩn lớp ngõ ra.Các ưu điểm mạng trình bày phần 5.1 HUẤN LUYỆN MẠNG Trước vào trình tự bước huấn luyện thực hiện, số qui ước ký hiệu chung sau: T: số bước lặp N: số mẫu cần huấn luyện i, j, k số thể số thứ tự neuron lớp nhập, lớp ẩn lớp xuất X1 ký hiệu đầu vào đồng thời đầu neuron lớp nhập X2 ký hiệu đầu lớp ẩn X3 ký hiệu đầu lớp xuất W2, W3 trọng số liên kết lớp nhập với lớp ẩn lớp ẩn với lớp xuất net2, net3 tổng trọng hóa neuron lớp ẩn lớp xuất (đầu vào neuron lớp ẩn lớp xuất) Phần : Xây dựng mạng neuron Học viên: KS Lê Thị Kim Anh Đề tài: Nghiên cứu ứng dụng mạng Neuron 94 nhận dạng tiếng Việt GVHD: Cô TS Nguyễn Như Anh Thầy GVC_ThS Tống Văn On Giải thuật huấn luyện: Bước 1: Khởi tạo trọng số cho lớp ẩn W2( t ) (i, j) lớp xuất W3( t ) ( j, k ) cho lần lặp mẫu nhập nên t=1 n=1(việc khởi tạo theo qui tắc trình bày phần 3) Bước 2: Tính tổng ngõ nhập sau gia trọng cho lớp ẩn I net (2t ) (n , j) = ∑ X (n , i).W2( t ) (i, j) + b j X1( t ) (n, i) : ngõ neuron thứ i lớp nhập ứng với mẫu n I: số neuron lớp nhập j: neuron thứ j lớp ẩn b0j: giá trị ngưỡng neuron thứ j lớp nhập Bước 3: Tính ngõ cho neuron lớp ẩn với hàm ngưỡng tagsig X (2t ) ( n , j) = −1 + exp[ − net (2t ) ( n , j)] X (2t ) (n, j) : ngõ neuron thứ j lớp ẩn ứng với mẫu n Bước 4: Tính tổng ngõ nhập saukhi gia trọng cho lớp xuất J net 3( t ) ( n , k ) = ∑ X ( n , j).W3( t ) ( j, k ) + b k J: soá neuron lớp ẩn b0k: giá trị ngưỡng neuron thứ k lớp xuất Bước 5: Tính ngõ cho neuron lớp xuất ngõ cho tòan mạng với hàm ngưỡng tagsig X 3( t ) ( n , k ) = −1 + exp[ − net 3( t ) ( n , k )] X 3( t ) (n , k ) : ngõ neuron thứ k lớp xuất ứng với mẫu n Phần : Xây dựng mạng neuron Học viên: KS Lê Thị Kim Anh Đề tài: Nghiên cứu ứng dụng mạng Neuron nhận dạng tiếng Việt 95 GVHD: Cô TS Nguyễn Như Anh Thầy GVC_ThS Tống Văn On Bước 6: Tính sai số trọng cho lớp xuaát ΔW3( t ) ( j, k ) = −η.δ 3( t ) (k ).X 3( t ) ( n , k ) + μ.ΔW3( t −1) ( j, k ) δ 3( t ) ( k ) = η.X 3( t ) ( n , k ).[1 − X 3( t ) ( n , k )][d ( n , k ) − X 3( t ) ( n , k )] ΔW3( t ) ( j, k ) : sai số trọng lần lặp t trọng số W3( t ) ( j, k ) lớp xuaát X 3( t ) ( n , k ) : ngõ neuron thứ k lớp xuất ứng với mẫu n d3(n,k): ngõ yêu cầu neuron k ứng với mẫu thứ n η: hệ số học tập μ: hệ số momentum Bước 7: Tính sai số trọng cho lớp ẩn ΔW2( t ) (i, j) = −η.δ (2t ) ( j).X (2t ) (n , j) + μ.ΔW2( t −1) (i, j) K δ (2t ) ( j) = X (2t ) ( n , j).[1 − X (2t ) ( n , j)].∑ W3( t ) ( j, k ).δ 3( t ) ( k )] δ 3( t ) ( k ) = η.X 3( t ) ( n , k ).[1 − X 3( t ) ( n , k )][d ( n , k ) − X 3( t ) ( n , k )] ΔW3( t ) ( j, k ) : sai số trọng lần lặp t trọng số W3( t ) ( j, k ) lớp xuất X 3( t ) ( n , k ) : ngõ neuron thứ k lớp xuất ứng với mẫu n d3(n,k): ngõ yêu cầu neuron k ứng với mẫu thứ n η: hệ số học tập μ: hệ số momentum Bước 8: Tính lại trọng số cho lớp ẩn lớp xuất W3( t +1) ( j, k ) = W3( t ) ( j, k ) + ΔW3( t ) ( j, k ) W2( t +1) (i, j) = W2( t ) (i, j) + ΔW2( t ) (i, j) Quay lại bước mẫu thứ N Bước 9: Tính sai số ngõ mạng ngõ yêu cầu mse i = m m ( ( ) ) [d i (k ) − X(k )]2 e k = ∑ ∑ i m k =1 m k =1 Phần : Xây dựng mạng neuron Học viên: KS Lê Thị Kim Anh Đề tài: Nghiên cứu ứng dụng mạng Neuron nhận dạng tiếng Việt 96 GVHD: Cô TS Nguyễn Như Anh Thầy GVC_ThS Tống Văn On Nếu sai số đạt yêu cầu cho tất mẫu việc huấn luyện dừng lại, nhận trọng W3( t +1) W2( t +1) , lưu trọng số vào file để chuẩn bị cho việc vận hành mạng neuron kết thúc trình huấn luyện Nếu sai số không đạt yêu cầu cho n=1 quay trở lại bước Sau số đề nghị sử dụng luận văn 5.1.1 Chọn hàm truyền Sau thử nghiệm cho thấy, hàm truyền chọn sau: + Đối với lớp ẩn, hàm truyền thường có dạng logsig, hay tangsig nhằm chuẩn hoá liệu vào + Đối với lớp ra, hàm truyền purelin biểu diễn ngõ Tuy nhiên muốn chuẩn hoá ngõ đoạn (-1,1) ta dùng tangsig, hay (0,1) dùng logsig 5.1.2 Chọn số nút cho lớp Số nút vào: Số nút vào phụ thuộc hoàn toàn vào đặc trưng tiếng nói dùng để nhận dạng Ở người viết sử dụng phương pháp trích đặc trưng dùng hệ số MFCC, nên số ngõ vào tính sau: Mỗi lần đưa vào mẫu để huấn luyện, mẫu phân tích thành Q frame frame có 12 hệ số MFCC, số ngõ vào là: 12xQ Số nút ẩn: Một khó khăn dùng mạng xác định số nút ẩn Thông số có tác động lớn đến chất lượng độ xác mạng lại hoàn toàn bất định cách xác định tối ưu Ta phải thử với nhiều trường hợp khác để có trường hợp cho kết tốt Số lượng nút ẩn lớn mạng có khả tạo vùng định phức Phần : Xây dựng mạng neuron Học viên: KS Lê Thị Kim Anh Đề tài: Nghiên cứu ứng dụng mạng Neuron nhận dạng tiếng Việt 97 GVHD: Cô TS Nguyễn Như Anh Thầy GVC_ThS Tống Văn On tạp, số nút ẩn lớn làm thời gian tính toán lâu rơi vào tình trạng khích liệu Trong thực tế để xác định thông số thích hợp ta phải dùng phương pháp “try-and-errors” (thử sai) Số nút ngõ ra: Số nút với số từ cần nhận dạng Kết nhận dạng từ ngõ mức tích cực định 5.1.3 Chọn hàm huấn luyện Các hàm thử luận văn là: traingd, traingda, trainrp, traincgb, traincgf, trainscg 5.1.4 Sai số đích số lần huấn luyện Nhầm lẫn thường hay xảy là: sai số đích bé tốt Điều không hoàn toàn loại liệu biến động tiếng nói Quan trọng khả tổng quát hóa mạng Thực tế lần thử cho sai số giảm nhanh nhỏ thường rơi vào tình trạng khích hay sai số cực tiểu cục nên cho kết nhận dạng không cao Những lần huấn luyện khác cho đường cong sai số khác Để tránh tình trạng rơi vào cực tiểu cục bộ, nên huấn luyện mạng nhiều lần chọn lần huấn luyện tin cậy 5.1.5 Tập liệu mẫu huấn luyện: Tập liệu mẫu huấn luyện đóng vai trò quan trọng ứng dụng mạng neuron Đặc biệt vấn đề phân loại, định độ xác nhận dạng Trong ứng dụng mạng neuron để nhận dạng tiếng nói, đặc trưng đa dạng hay thay đổi tiếng nói phải tập hợp đầy đủ xác tập mẫu huấn luyện theo quy luật tỷ lệ phù hợp Các mẫu phải lựa chọn cẩn thận, quan sát mẫu lựa chọn Tập mẫu nên đọc cách tự nhiên tốt Số mẫu huấn luyện nói Phần : Xây dựng mạng neuron Học viên: KS Lê Thị Kim Anh Đề tài: Nghiên cứu ứng dụng mạng Neuron nhận dạng tiếng Việt 98 GVHD: Cô TS Nguyễn Như Anh Thầy GVC_ThS Tống Văn On chung nhiều tốt Tối thiểu 30 mẫu cho từ Tuy nhiên, số mẫu lớn thời gian huấn luyện lâu 5.1.6 Huấn luyện Đầu tiên tập sở liệu đặc trưng phải xếp thành ma trận ngõ vào, đó: cột ma trận vector đặc trưng A Nếu tập liệu mẫu có n từ vựng từ vựng có k mẫu ma trận ngõ vào xếp sau: P = [[ A11 A12 A1 j A1k ] [ Ai1 Ai Aij Aik ] [ An1 An Anj Ank ]] Tương ứng với ma trận ngõ vào trên, ma trận tập đích phải (n) hàng (k.n) cột Nếu cho ngõ đạt mức tích cực ứng với vector đặc trưng A đưa vào, có ngõ (n-1) ngõ lại –1 Ma trận đích có dạng: 1 ⎤ ⎡− − − − 1⎤ ⎡− − − − 1⎤ ⎡1 ⎢− − − − 1⎥ ⎢ 1 1 ⎥⎥ ⎢⎢− − − − 1⎥⎥ ⎢ ⎥ ⎢ T = ⎢M M M M ⎥⎢ M M M M⎥ ⎢M M M M⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥ 1 1⎦ ⎣− − − − 1⎦ ⎣− − − − 1⎦ ⎣ Sau lựa chọn thông số mạng thích hợp có ma trận vào đích ta gọi hàm huấn luyện để huấn luyện mạng 5.2 NHẬN DẠNG Các từ cần nhận dạng sau qua khâu xử lý để rút đặc trưng cho vetor đặc trưng đưa vào mạng Sau huấn luyện, nạp trọng số vào mạng từ tập tin liệu Mạng có khả nhận dạng mẫu học có từ vựng Quá trình thực mạng theo bước sau: Bước 1: Lấy trọng số lớp ẩn W2 lớp xuất W3 từ tập tin liệu Bước 2: Tính net ( j) cho neuron j lớp ẩn Phần : Xây dựng mạng neuron Học viên: KS Lê Thị Kim Anh Đề tài: Nghiên cứu ứng dụng mạng Neuron nhận dạng tiếng Việt 99 GVHD: Cô TS Nguyễn Như Anh Thầy GVC_ThS Tống Văn On Bước 3: Tính X2(j) cho neuron j lớp ẩn Bước 4: Tính net (k ) cho neuron k lớp xuất Bước 5: Tính X3(k) cho neuron k lớp xuất Bước 6: Tính trung bình bình phương sai số ngõ mạng với ngõ mong muốn: m m 2 mse i = ∑ (e i (k )) = ∑ [d i (k ) − X(k )] m k =1 m k =1 Keát từ cần nhận dạng từ thứ i từ vựng msei đạt giá trị nhỏ Phần : Xây dựng mạng neuron Học viên: KS Lê Thị Kim Anh Đề tài: Nghiên cứu ứng dụng mạng Neuron nhận dạng tiếng Việt 100 GVHD: Cô TS Nguyễn Như Anh Thầy GVC_ThS Tống Văn On I KẾT QUẢ MÔ PHỎNG Chương trình thực mô với tham số mạng thử sau: Các hàm truyền lớp: Tansig, Logsig, purelin Các hàm huấn luyện: traingd, traingda, trainrp, traincgf, traincgp, traincgb Kết cuối chọn có độ xác tương đối cao sau: Số neuron lớp ẩn : 25, hàm truyền chọn: tansig, hàm huấn luyện: traingda I.1 Bộ từ vựng thứ nhất, với số lần thử 10 Từ BẬT TẮT ĐÓNG MỞ TỚI LUI LÊN XUỐNG TRÁI PHẢI Mức độ xác: 97% Tỉ lệ 10/10 10/10 10/10 9/10 10/10 10/10 10/10 8/10 10/10 10/10 I.2 Bộ từ vựng thứ hai, với số lần thử 10 Từ KHÔNG MỘT HAI BA BỐN NĂM SÁU BẢY TÁM CHÍN Phần : Kết mô nhận xét Tỉ lệ 9/10 10/10 9/10 10/10 10/10 10/10 8/10 10/10 10/10 10/10 Hoïc viên: KS Lê Thị Kim Anh Đề tài: Nghiên cứu ứng dụng mạng Neuron nhận dạng tiếng Việt 101 GVHD: Cô TS Nguyễn Như Anh Thầy GVC_ThS Tống Văn On Mức độ xác: 96% II GIAO DIỆN CHƯƠNG TRÌNH II.1 Giao diện CHƯƠNG TRÌNH CHÍNH Giao diện chương trình gồm có tùy chọn: TẠO – THAY ĐỔI BỘ TỪ VỰNG: Mở cửa sổ nhập liệu để xây dựng từ vựng hay thay đổi từ vựng có sẵn HUẤN LUYỆN MẠNG NEURAL: Mở cửa sổ huấn luyện mạng Neural NHẬN DẠNG TIẾNG NÓI: Mở cửa sổ giao diện nhận dạng Phần : Kết mô nhận xét Học viên: KS Lê Thị Kim Anh Đề tài: Nghiên cứu ứng dụng mạng Neuron nhận dạng tiếng Việt 102 GVHD: Cô TS Nguyễn Như Anh Thầy GVC_ThS Tống Văn On II.2 Cửa sổ TẠO _ THAY ĐỔI BỘ TỪ VỰNG Trên cửa sổ ta tạo thay đổi từ vựng có Để tạo từ vựng ta thực bước sau: - Đặt tên cho từ vựng: cửa sổ TÊN BỘ TỪ VỰNG, nhắp vào biểu tượng Thêm để đặt tên cho từ vựng - Đặt tên cho từ có từ vựng: cửa sổ CÁC TỪ, nhắp vào biểu tượng Thêm để viết tên từ có từ vựng - Thực Thu mẫu tín hiệu có mẫu vừa ý - Lưu mẫu thu vào từ vựng Tối thiểu cho từ 30 mẫu - Cứ tiếp tục tạo từ vựng hoàn chỉnh Mở cửa sổ Huấn luyện để thực việc huấn luyện cho từ Phần : Kết mô nhận xét Học viên: KS Lê Thị Kim Anh Đề tài: Nghiên cứu ứng dụng mạng Neuron nhận dạng tiếng Việt 103 GVHD: Cô TS Nguyễn Như Anh Thầy GVC_ThS Tống Văn On II.3 Cửa sổ HUẤN LUYỆN MẠNG NEURON Trên cửa sổ này, chọn tham số thích hợp cho mạng neuron Chọn từ vựng cần huấn luyện, sau thực huấn luyện cho mạng Đến đạt kết hội tụ, ta chuyển qua cửa sổ nhận dạng để kiểm tra lại mức độ xác từ vựng huấn luyện Phần : Kết mô nhận xét Học viên: KS Lê Thị Kim Anh Đề tài: Nghiên cứu ứng dụng mạng Neuron nhận dạng tiếng Việt 104 GVHD: Cô TS Nguyễn Như Anh Thầy GVC_ThS Tống Văn On II.4 Cửa sổ NHẬN DẠNG TIẾNG NÓI Trên cửa sổ này, nhắp vào biểu tượng Nhận dạng để nhận dạng tín hiệu đưa vào từ micro Kết hiển thị cửa sổ TỪ ĐƯC NHẬN DẠNG III NHẬN XÉT Phương pháp nhận dạng chưa đạt độ xác cao số yếu tố : nhiễu môi trường thu, cách phát âm lấy mẫu, thời điểm thu khác nhau, giải thuật huấn luyện, …Tuy nhiên, luận văn cố gắng xây dựng hệ thống nhận dạng tiếng nói thực mạng Neuron với mức độ sai nhầm nhỏ nhất, với từ vựng nhỏ Phần : Kết mô nhận xét Học viên: KS Lê Thị Kim Anh Đề tài: Nghiên cứu ứng dụng mạng Neuron nhận dạng tiếng Việt 105 GVHD: Cô TS Nguyễn Như Anh Thầy GVC_ThS Tống Văn On HƯỚNG PHÁT TRIỂN ĐỀ TÀI Luận Văn dừng lại ứng dụng : nhận dạng tiếng nói cho người, độ xác chưa thật cao, kích thước từ vựng bị hạn chế (kích thước từ vựng tỷ lệ nghịch với độ xác) Kết nhận dạng dừng lại chổ nhận dạng tên từ không nhận dạng nghóa nó, chưa khảo sát nhận dạng âm tố điệu cấu tạo nên âm tiết Vì hạn chế đó, ta phát triển đề tài Luận Văn theo hướng sau: - Có thể dùng nhiều đặc trưng để thể đầy đủ đặc tính tiếng nói, có khả làm sở tốt để nhận dạng Cố gắng xây dựng thuật toán mô xác theo đáp ứng tần số tai người - Xây dựng mạng Neuron để nhận dạng tiếng với nhiều dạng cấu trúc, thông số cài đặc, phương pháp huấn luyện…nhằm tìm cấu trúc cho độ tin cậy cao - Phân tích tiếng nói để nhận dạng dựa âm tố điệu cấu tạo nên âm tiết, tảng để chuyển sang phần tổng hợp tiếng nói Và sở hệ thống chuyển đổi từ tiếng nói thành chữ viết Phần : Hướng phát triển đề tài Học viên: KS Lê Thị Kim Anh Đề tài: Nghiên cứu ứng dụng mạng Neuron nhận dạng tiếng Việt 106 GVHD: Cô TS Nguyễn Như Anh Thầy GVC_ThS Tống Văn On TÀI LIỆU THAM KHẢO [1] F.J.Owens, “ Signal processing of speech” Macmillan, 1993 ISBN 0-333-51921 [2] Samuel Steams, Rush A.David, “Signal processing algorithms in Matlab” Prentice Hall, 1966 ISBN 0-13-045154-1 [3] Joe Tebelskis, “Speech Recognition using Neural Networks” School of Computer Science Carnegie Mellon University Pittsburgh, Pennsylvania 15213-3890, May 1995 CMU-CS-95-142 [4] Michel Misiti, Yves Misiti, Georges Oppenheim, Jean-Michel Poggi, “Wavelets toolbox” The Mathworks Inc, 1997 [5] Howard Demuth and Mark Beale, “Neural Network Toolbox” The Mathworks Inc, 1998 [6] Claudio Becchetti and Lucio Prina Ricotti, “Speech Recognition”,John Wiley & Sons, Ltd,1999 ISBN 0-471-97730-6 [7] Một số đề tài Nhận dạng Mạng neuron có liên quan Tài liệu tham khảo Học viên: KS Lê Thị Kim Anh Đề tài: Nghiên cứu ứng dụng mạng Neuron nhận dạng tiếng Việt GVHD: Cô TS Nguyễn Như Anh Thầy GVC_ThS Tống Văn On LÝ LỊCH TRÍCH NGANG Họ tên: LÊ THỊ KIM ANH Giới tính: Nữ Ngày tháng năm sinh: 20-02-1969 Nơi sinh: Bình Dương Dân tộc: Kinh Tôn giáo: Không Địa liên lạc: Trường ĐH Bách Khoa Tp Hồ Chí Minh Khoa Điện – Điện tử BM Điện tử QUÁ TRÌNH ĐÀO TẠO ĐẠI HỌC Nơi học: Đại học Bách Khoa Tp Hồ Chí Minh Thời gian: Tháng năm 1992 đến tháng năm 1997 Ngành học: Điện Tử – Viễn Thông Hệ: Chính quy Luận án tốt nghiệp: “THIẾT KẾ MẠCH TÍNH TIỀN XĂNG DẦU DÙNG VI ĐIỀU KHIỂN 8051” Người hướng dẫn: KS Võ Tấn Thông Nơi bảo vệ luận án: Bộ môn Điện Tử Trường Đại học Bách Khoa Tp Hồ Chí Minh QUÁ TRÌNH CÔNG TÁC Từ năm 1997 đến nay: Cán giảng dạy môn Điện tử Khoa Điện – Điện tử Trường Đại học Bách Khoa Tp Hồ Chí Minh Lý lịch trích ngang Học viên: KS Lê Thị Kim Anh ... TÀI: “ Nghiên cứu ứng dụng mạng neuron nhận dạng tiếng Việt” II NHIỆM VỤ VÀ NỘI DUNG: Nghiên cứu tổng quan hệ thống nhận dạng tiếng nói Tìm hiểu mạng neuron ứng dụng mạng neuron nhận dạng tiếng. .. tài này, người viết bước nghiên cứu vấn đề sau: Nghiên cứu tổng quan hệ thống nhận dạng tiếng nói Tìm hiểu mạng neuron ứng dụng mạng neuron nhận dạng tiếng nói Xử lý tiếng nói chọn phương pháp... Kiến thức ngữ âm học vận dụng vào nhận dạng ? Phần 2: Tổng quan hệ thống nhận dạng tiếng nói Học viên: KS Lê Thị Kim Anh Đề tài: Nghiên cứu ứng dụng mạng Neuron nhận dạng tiếng Việt GVHD: Cô TS