(Luận văn thạc sĩ hcmute) nhận dạng tiếng nói tiếng việt dùng mạng nơron triển khai trên kit arm

93 2 0
(Luận văn thạc sĩ hcmute) nhận dạng tiếng nói tiếng việt dùng mạng nơron triển khai trên kit arm

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH LUẬN VĂN THẠC SĨ PHAN VĂN ĐẦY NHẬN DẠNG TIẾNG NÓI TIẾNG VIỆT DÙNG MẠNG NƠRON TRIỂN KHAI TRÊN KIT ARM S K C 0 9 NGÀNH: KỸ THUẬT ĐIỆN TỬ- 605270 S KC 0 Tp Hồ Chí Minh, 2012 Luan van BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH LUẬN VĂN THẠC SĨ PHAN VĂN ĐẦY NHẬN DẠNG TIẾNG NÓI TIẾNG VIỆT DÙNG MẠNG NƠRON TRIỂN KHAI TRÊN KIT ARM NGÀNH: KỸ THUẬT ĐIỆN TỬ- 605270 Tp Hồ Chí Minh, tháng 04/2011 Luan van BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH LUẬN VĂN THẠC SĨ PHAN VĂN ĐẦY NHẬN DẠNG TIẾNG NÓI TIẾNG VIỆT DÙNG MẠNG NƠRON TRIỂN KHAI TRÊN KIT ARM NGÀNH: KỸ THUẬT ĐIỆN TỬ - 605270 Hướng dẫn khoa học: PGS.TS LÊ TIẾN THƯỜNG Tp Hồ Chí Minh, tháng 4/2011 Luan van BỘ GIÁO DỤC & ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH CỘNG HỒ XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc PHIẾU XÁC NHẬN Tên đền tài: Nhận dạng tiếng nói Tiếng Việt dùng mạng nơron triển khai Kit ARM Họ & tên tác giả: Phan Văn Đầy Ngành: Kỹ thuật điện tử Khóa: 2009A Họ & tên người hướng dẫn (học hàm, học vị): PGS TS Lê Tiến Thường Cơ quan công tác: Trường đại học Bách Khoa thành phố Hồ Chí Minh Tp Hồ Chí Minh, ngày tháng năm 2011 Chủ nhiệm ngành Giảng viên hướng dẫn (Ký & ghi rõ họ tên) (Ký & ghi rõ họ tên) TS Ngô Văn Thuyên PGS.TS Lê Tiến Thường Luan van LÝ LỊCH KHOA HỌC (Dùng cho nghiên cứu sinh & học viên cao học) I LÝ LỊCH SƠ LƯỢC: Họ & tên: Phan văn Đầy Giới tính: Nam Ngày, tháng, năm sinh: 16/11/1976 Nơi sinh: Đồng Tháp Quê quán: Đồng Tháp Dân tộc: Kinh Chức vụ, đơn vị công tác trước học tập, nghiên cứu: Giảng viên Khoa Công nghệ thông tin Trường đại học Đồng Tháp Chỗ riêng địa liên lạc: 128/6, ấp Tân Thạnh, xã Phong Hòa, huyện Lại Vung, tỉnh Đồng Tháp Điện thoại quan: 0673.881623 Điện thoại nhà riêng: 0673.628162 Fax: 0673.881623 E-mail: Daydhdt@gmail.com II QUÁ TRÌNH ĐÀO TẠO: Đại học: Hệ đào tạo: Chính qui Thời gian đào tạo từ 09/1995 đến 04/2000 Nơi học (trường, thành phố): Trường đại học Cần Thơ, thành phố Cần Thơ Ngành học: Điện tử Tên đồ án, luận án : Phân tích tín hiệu âm miền tần số Ngày & nơi bảo vệ đồ án, luận án thi tốt nghiệp: Tháng 05 năm 2000 Người hướng dẫn: CN Đoàn Hịa Minh Thạc sĩ: Hệ đào tạo: Chính quy Thời gian đào tạo từ 02/2009 đến 02/2011 Nơi học (trường, thành phố): Trường đại học sư phạm kỹ thuật thành phố Hồ Chí Minh Ngành học: Kỹ thuật điện tử Luan van Tên luận văn: Nhận dạng tiếng nói Tiếng Việt dùng mạng nơron triển khai Kit ARM Ngày & nơi bảo vệ luận văn: Tháng năm 2011 Trường đại học sư phạm kỹ thuật thành phố Hồ Chí Minh Người hướng dẫn: PGS TS Lê Tiến Thường Trình độ ngoại ngữ: Anh văn Toefl IPT 470 điểm III Q TRÌNH CƠNG TÁC CHUN MƠN KỂ TỪ KHI TỐT NGHIỆP ĐẠI HỌC: Thời gian Nơi công tác Từ 8/2000 Khoa Công nghệ thông tin Trường Kỹ sư bảo trì sửa chữa phần đến 6/2006 đại học Cần Thơ cứng máy vi tính Từ 6/2006 Giảng viên Khoa Công nghệ thông Giảng dạy môn Kỹ thuật số tin Trường đại học Đồng Tháp Điện tử đến Công việc đảm nhiệm IV CÁC CƠNG TRÌNH KHOA HỌC ĐÃ CƠNG BỐ: Chưa có XÁC NHẬN CỦA CƠ QUAN CỬ ĐI HỌC (Ký tên, đóng dấu) Ngày 29 tháng năm 2011 Người khai ký tên Phan văn Đầy Luan van LỜI CAM ĐOAN Tôi cam đoan cơng trình nghiên cứu tơi Các số liệu, kết nêu luận văn trung thực chưa công bố cơng trình khác Tp Hồ Chí Minh, ngày 29 tháng năm 2011 (Ký tên ghi rõ họ tên) Phan Văn Đầy Luan van LỜI CẢM ƠN Tôi xin gởi lời cảm ơn chân thành đến PGS.TS Lê Tiến Thường, người tận tình hướng dẫn, giúp đỡ tơi suốt q trình thực luận văn tạo điều kiện để tơi hoàn thành luận văn Xin gởi lời cảm ơn đến Thầy Cô dạy thời gian qua Tôi xin cảm ơn bạn đồng môn đồng nghiệp quan tâm, chia suốt trình học làm luận văn Xin cảm ơn gia đình tơi dành cho tơi tình thương u hỗ trợ tốt Luan van Luận văn tốt nghiệp thạc sĩ GVHD: PGS.TS.Lê Tiến Thường TÓM TẮT Đề tài thực Trường đại học SPKT TpHCM từ ngày tháng năm 2010 đến ngày 28 tháng năm 2011 Kỳ vọng đề tài xây dựng chương trình nhận dạng tiếng nói Tiếng Việt lên Kit xử lý 32 bit họ ARMLM3S2965 thơng qua việc xây dựng chương trình nhận dạng tiếng nói Tiếng Việt, khai thác tính Kit ARM, xây dựng bo mạch thu âm, giao tiếp nhúng chương trình nhận dạng tiếng nói Tiếng Việt lên Kit LM3S2965 Trước tiên, đề tài nghiên cứu lý thuyết đặc trưng lấy mẫu tín hiệu tiếng nói Tiếng Việt từ đề tài, báo chọn phương pháp rút trích đặc trưng tín hiệu tiếng nói thơng dụng Sau đó, dùng mẫu đặc trưng rút trích để huấn luyện trọng số mạng nơron dùng mạng nơron huấn luyện để nhận dạng tiếng nói Tiếng Việt Đề tài thiết kế thi công mạch thu âm giao tiếp với Kit LM3S2965, nghiên cứu khai thác số tính Kit LM3S2965, xây dựng chương trình nhận dạng tiếng nói Tiếng Việt thực máy tính cá nhân sau xây dựng chương trình nhận dạng tiếng nói Tiếng Việt Kit LM3S2965 để điều khiển cánh tay Robot bậc tự Bộ từ vựng cần nhận dạng từ dùng để điều khiển Robot “Kẹp”, “Nhả”, “Tiến”, “Lùi”, “Trái”, “Phải”, “Nâng”, “Hạ”, “Dừng” phát từ tác giả điều kiện tiếng ồn thấp Kết chương trình nhận dạng tiếng nói Tiếng Việt thực máy tính cá nhân đạt độ xác tốt (≈90%) Kết chương trình nhận dạng tiếng nói Tiếng Việt triển khai Kit LM3S2965 có độ xác thấp số hạn chế nghiên cứu khai thác tính Kit LM3S2965 Mặc dù vậy, đề tài mở định hướng nghiên cứu để kết tốt i Luan van HVTH: Phan Văn Đầy Luận văn tốt nghiệp thạc sĩ GVHD: PGS.TS.Lê Tiến Thường ABSTRACT The topic had been being done at University Of Technical Education HCM City from September 1, 2010 to February 28, 2011 The topic’s expectations is to develop a Vietnamese speech recognition program in a 32-bit ARM processor motherboard, LM3S2965, one of motherboards has many advantages in embedded applications In addition, the topic performed the Vietnamese speech recognition programming on a personal computer for the purpose of the orientation for on the LM3S2965 motherboard programming The Vietnamese speech recognition is carried out mainly by the neural network That is, the result of identification is determined from a combination of the analysis of the neural network applied to typical Vietnamese voice Algorithm used to train the neural network is the back propagation algorithm MFCC (Mel-scale Frequency Cepstral) is used to extract speech signal characteristic The topics is limited only to identify the words used to control a robotic arm, such as “Clamp”, “Release”, “Go”, “Back”, “Left”, “Right”, “Lift”, “Lower” and “Stop” They are identified discretely in a low noise conditions and pronounced from the author, who provided the samples used to train the neural network The result of Vietnamese speech recognition performed on a personal computer achieved a good precision (approximately 90%) However, the Vietnamese speech recognition program done on the motherboard achieved a limited result The reason is that the topic couldn’t check a sampled signal on the motherboard quickly However, the topic opened a research direction, which will be able to bring a better result ii Luan van HVTH: Phan Văn Đầy       Luận văn tốt nghiệp thạc sĩ   GVHD: PGS.TS.Lê Tiến Thường hai phương pháp giúp hệ thống hoạt động hiệu mơi trường hoạt động có nhiễu lớn Lưu đồ giải thuật hình 5.21 Tín hiệu thu Tính lượng thời gian ngắn STE Tính tỉ lệ qua điểm Zero ZCR ZCR nhỏ | STE lớn ? S Đ Tín hiệu tiếng Khơng phải tiếng Hình 5.21: Lưu đồ giải thuật xác định frame tín hiệu tiếng hay nhiễu Để loại bỏ trường hợp xuất âm ngẫu nhiên thu mẫu, mẫu tín hiệu xác định tiếng chúng tín hiệu tiếng số lượng đủ lớn frame liên tục Để làm giảm độ phức tạp xử lý sau lấy mẫu, độ dài mẫu phải cố định Độ dài dãy mẫu chọn 312,5 miligiây tương đương 3500 mẫu với tốc độ lấy mẫu 11200 mẫu/giây Nếu độ dài dãy mẫu lớn 312,5 miligiây, việc lấy mẫu không xác, ta phải lấy mẫu lại Đối với dãy mẫu có độ dài nhỏ 312,5 miligiây ta phải thêm giá trị epsilon vào cho đủ số lượng mẫu 5.2.2 Lấy mẫu tín hiệu cho chương trình nhận dạng chạy Kit: Vì Kit LM3S2965 có nhớ nhỏ tốc độ xử lý chậm nên áp dụng phương pháp lấy mẫu phương pháp lấy mẫu cho chương trình nhận dạng PC Việc thu mẫu việc xác đinh điểm đầu, điểm cuối tiếng nói phải thực lồng vào Lưu đồ giải thuật hình 5.22 Chương 5: Thiết kế HTNDTN Tiếng Việt 57 Luan van HVTH: Phan Văn Đầy       Luận văn tốt nghiệp thạc sĩ   GVHD: PGS.TS.Lê Tiến Thường Bắt đầu Thu, tính ngưỡng STE, ZCR nhiễu Số frame tiếng k=0 Thu frame tín hiệu Tín hiệu tiếng? k ++ Đ S S kmin≤k≤kmax Đ Kết thúc Hình 5.22: Lưu đồ giải thuật lấy mẫu tín hiệu dùng cho chương trình chạy Kit Trong trường hợp k=kmax mà frame xét cho kết frame tiếng xem lấy mẫu khơng xác, phải khởi động lại trình lấy mẫu Nếu k < kmax ta thêm giá trị epsilon vào cho đủ số lượng mẫu 5.3 Thiết kế chương trình trích đặc trưng tín hiệu tiếng nói Tiếng Việt: Tín hiệu âm thu vào lưu mảng dài 3456 phần tử, với tốc độ lấy mẫu 11200Hz chiều dài 3456 phần tử vừa đủ cho chiều dài từ Sau mảng chia thành frame, frame dài 256 phần tử Để tạo mối liên hệ frame, frame chồng phủ lên 128 mẫu Do frame xử lý giống nên cần mảng tạm để lưu trữ cho trình xử lý Frame xử lý từ đầu hệ số đặc trưng frame lại lấy tiếp frame Quá trình tiếp diễn hết Chương 5: Thiết kế HTNDTN Tiếng Việt 58 Luan van HVTH: Phan Văn Đầy       Luận văn tốt nghiệp thạc sĩ   GVHD: PGS.TS.Lê Tiến Thường mảng liệu đầu vào Như có tất 26 frame để lấy hết chiều dài 3456 mẫu mảng đầu vào Lưu đồ giải thuật trích đặc trưng tín hiệu tiếng nói theo phương pháp MFCC hình 2.5 nêu chương - Các frame chia có độ dài 256 phần tử nên cửa sổ lọc hamming chọn có độ dài 256 phần tử - Việc biến đổi Fourier rời rạc DCT thay biến đổi Fourier nhanh FFT để tận dụng tính đối xứng tính chu kỳ hệ số pha, giúp việc tính tốn nhanh - Dãy lọc Mel chọn bao gồm 27 lọc Mel Mỗi lọc Mel cho hệ số Mel Kết sau trích lấy hệ số Mel ma trận 26*27=702 phần tử Số lượng nhiều để đưa vào ngõ vào mạng huấn luyện Nó nén lại thành 17 * 27 = 459 phần tử Thực tế lấy 442 mẫu dùng để huấn luyện nhận dạng hạn chế nhớ RAM máy tính cá nhân huấn luyện mạng công cụ huấn luyện mạng có sẳn Matlab - Kết sau tính Log(| |2) có phần thực, khơng có phần ảo nên việc tính IFFT ngun mẫu khơng cần thiết, thay việc biến đổi cosin rời rạc DCT Đối với chương trình thực Kit, q trình tính tốn FFT frame thực qua bước sau : - Đảo bit : Một mảng gồm 256 phần tử tính FFT 256 điểm Với thứ tự sẵn có khơng phù hợp cho việc tính FFT, ta phải thực q trình đảo bit trước tính FFT Với chương trình chạy máy tính cá nhân khơng cần thực bước phần mềm Matlab cung cấp sẵn công cụ tính FFT Bảng 5.1 mơ tả cách đảo bit thực đảo thứ tự ngõ vào tính FFT điểm Khi tính FFT 256 điểm công việc đảo Chương 5: Thiết kế HTNDTN Tiếng Việt 59 Luan van HVTH: Phan Văn Đầy       Luận văn tốt nghiệp thạc sĩ   GVHD: PGS.TS.Lê Tiến Thường thứ tự ngõ vào diễn tương tự Ví dụ: Số nhị phân 11010010 đảo thành 01001011 Thứ tự mẫu theo hệ thập phân Số nhị phân Số nhị phân sau đảo bit Số thập phân sau đảo 000 000 001 100 010 010 011 110 100 001 101 101 110 011 111 111 Bảng 5.1: Mô tả cách đảo bit cho việc tính FFT điểm - Sơ đồ bướm phân chia thời gian: Hình 5.23: Sơ đồ bướm tính FFT phân chia theo thời gian Chương 5: Thiết kế HTNDTN Tiếng Việt 60 Luan van HVTH: Phan Văn Đầy       Luận văn tốt nghiệp thạc sĩ   GVHD: PGS.TS.Lê Tiến Thường Việc tính FFT 256 điểm thực từ phép tính FFT điểm (theo sơ đồ bướm FFT điểm mở rộng có qui luật thành sơ đồ bướm FFT 256 điểm) Hình 5.23 trình bày việc tính FFT điểm thực theo sơ đồ bướm phân chia theo thời gian 5.4 Thiết kế cấu trúc mạng nơron Mạng nơron nhân tạo lý thuyết nghiên cứu thử nghiệm Có nhiều loại mạng đưa thử nghiệm, nhiên phổ biến mạng truyền thẳng với thuật toán học lan truyền ngược tính phổ biến tương đối đơn giản trình thực huấn luyện mạng Hiện lý thuyết số lớp số nút nơron lớp chưa hoàn thiện nên đề tài chọn lớp vào, lớp ẩn lớp Số nút vào chọn với số lượng hệ số đặc trưng trích từ Như mạng nơron thông dụng, hàm truyền cho lớp ẩn hàm Sigmoid (f(net)=2/(1+e-2net)-1) hàm truyền cho lớp hàm tuyến tính Purelin (f(net) = net) Trọng số mạng lớp (lớp vào lớp ra) khai báo mảng hai chiều với kích thước số nơron vào nhân với số nơron Việc tính tốn cho lớp tiến hành theo nơron, nhân đầu vào với trọng số tương ứng tính tổng tất lại, sau cho kết qua hàm truyền Đầu lớp đầu vào cho lớp trình tính lại thực tương tự đầu lớp cuối Một mạng nơron có giá trị học Q trình học mạng tiến hành sau Khi nhận tổ hợp tín hiệu đầu vào mạng ta có tổ hợp tín hiệu đầu thực tế tương ứng mạng nơron Sai số đầu định nghĩa hiệu số đầu mong muốn đầu thực tế ứng với đầu vào Sai số lan truyền đến ngõ vào sở để thay đổi trọng số mạng nơron Quá trình thay đổi trọng số lặp lại đến sai số đầu nhỏ ngưỡng giá trị cho trước đạt đến số vòng lặp cho phép Chương 5: Thiết kế HTNDTN Tiếng Việt 61 Luan van HVTH: Phan Văn Đầy       Luận văn tốt nghiệp thạc sĩ   GVHD: PGS.TS.Lê Tiến Thường 5.5 Thiết kế chương trình chạy Kit Đề tài thiết kế chương trình chạy Kit nhận dạng từ đơn: “KẸP”, “NHẢ”, “TIẾN”, “LÙI”, “TRÁI”, “PHẢI”, “NÂNG”, “HẠ”, “DỪNG” Do Kit có tốc độ xử lý chậm nhớ nhỏ nên chương trình thiết kế dành cho Kit thực cơng việc lấy mẫu, trích đặc trưng tính toán ngõ mạng nơron để định kết hiển thị Công việc huấn luyện mạng thực máy tính cá nhân Các hệ số lọc Hamming lọc Mel tính tốn sẳn từ máy tính cá nhân Do đề tài chưa nghiên cứu việc truyền liệu từ Kit đến máy tính cá nhân nên việc chuyển mẫu tín hiệu thu từ Kit đến máy tính cá nhân phải thực thủ công hiển thị liệu thu Kit nhập lại tay sang máy tính cá nhân Như vậy, có mẫu được dùng để làm tập huấn luyện mạng không xác định độ xác mẫu thu Chương 5: Thiết kế HTNDTN Tiếng Việt 62 Luan van HVTH: Phan Văn Đầy       Luận văn tốt nghiệp thạc sĩ   GVHD: PGS.TS.Lê Tiến Thường Chương KẾT QUẢ ĐẠT ĐƯỢC VÀ HƯỚNG PHÁT TRIỂN 6.1 Kết đạt chương trình chạy PC Tác giả làm thí nghiệm cho chương trình nhận dạng tiếng nói Tiếng Việt với từ vựng nhận dạng từ đơn: “Kẹp”, “Nhả”, “Tiến”, “Lùi”, “Trái”, “Phải”, “Nâng”, “Hạ”, “Dừng”, phát từ tác giả điều kiện mơi trường bình thường có tiếng ồn thấp Kết sau: - Khi chạy hàm main.m, chương trình gọi hàm gdc.m để hiển thị giao diện chương trình: Hình 6.1: Giao diện chương trình thu tín hiệu nhiễu giây để xác định giá trị tối đa lượng trung bình tín hiệu thời gian ngắn làm sở cho việc xác định ngưỡng tín hiệu phương pháp tách tín hiệu khỏi theo phương pháp xác định lượng thời gian ngắn Chương 6: Kết luận 63 Luan van HVTH: Phan Văn Đầy       Luận văn tốt nghiệp thạc sĩ   GVHD: PGS.TS.Lê Tiến Thường Để lưu mẫu tiếng nói dung để huấn luyện mạng, ta chọn nút để hiển thị giao diện thu âm lưu trữ mẫu dung để huấn luyện mạng nơron: Hình 6.2: Giao diện thu âm lưu trữ mẫu dung để huấn luyện mạng nơron Chúng ta quản lý, kiểm tra lại mẫu lưu trước nhấn vào nút Hình 6.3: Giao diện để kiểm tra lại mẫu lưu Số lượng trung bình mẫu tiếng nói lưu cho từ đơn: “Kẹp”, “Nhả”, “Tiến”, “Lùi”, “Trái”, “Phải”, “Nâng”, “Hạ”, “Dừng” dùng để huấn luyện mạng nơron 36 mẫu Chương 6: Kết luận 64 Luan van HVTH: Phan Văn Đầy       Luận văn tốt nghiệp thạc sĩ   GVHD: PGS.TS.Lê Tiến Thường Chương trình gọi hàm cơng cụ có sẳn Matlab để huấn luyện mạng nơron với cấu hình 442 x 15 x (442 nút vào, 15 nút ẩn nút ra): Hình 6.4: Giao diện cơng cụ huấn luyện mạng nơron có sẳn Matlab 7.7 Khi huấn luyện xong mạng nơron, ta thu tín hiệu tiếng nói để từ giao diện chương phân tích, nhận dạng Khi nhấn vào nút trình (Hình 6.1), hình giao diện ghi âm, phân tích hiển thị kết nhận dạng gọi Hình 6.5: Giao diện ghi âm, phân tích hiển thị kết nhận dạng Chương 6: Kết luận 65 Luan van HVTH: Phan Văn Đầy       Luận văn tốt nghiệp thạc sĩ   Khi nhấn vào nút GVHD: PGS.TS.Lê Tiến Thường , chương trình bắt đầu thu mẫu, tách xử lý mẫu Kết nhận dạng xác định hiển thị ta nhấn nút Thực phát âm để nhận dạng từ 11 lần Tổng số lần phát âm từ để nhận dạng 99 lần Kết phân tích sau: Số lần tách tín hiệu khỏi nền: 94 lần Các lần khơng tách tín hiệu khỏi tiếng ồn xuất thu âm Số lần nhân dạng từ: 91 lần Xác suất nhận dạng từ 99 lần thử nghiệm 90,9% 6.2 Kết nghiên cứu thực nghiệm triển khai Kit LM3S2965 Hình 6.6: Hình ảnh Kit LM3S2965 Chương 6: Kết luận 66 Luan van HVTH: Phan Văn Đầy       Luận văn tốt nghiệp thạc sĩ   GVHD: PGS.TS.Lê Tiến Thường Hình 6.7: Hình ảnh bo mạch thu âm, giao tiếp ADC Kit LM3S2965 Đề tài thực khai thác số tính Kit LM3S2965 triển khai lập trình chương trình nhận dạng tiếng nói Tiếng Việt Kit LM3S2965 Cụ thể sau: Đề tài ghi đọc liệu lên nhớ Flash 256KB Kit LM3S2965 để hỗ trợ cho lập trình code chương trình vượt dung lượng 64KB nhớ SRAM Đề tài xây dựng chương trình nhận dạng tiếng nói Tiếng Việt Kit LM3S2965 với ngôn ngữ C với số hạn chế tồn Tuy nhiên đề tài chưa kiểm tra liệu sau lấy mẫu Điều ảnh hưởng đến độ xác việc tách tín hiệu khỏi ảnh hưởng đến kết học mạng nơron Từ ảnh hưởng đến độ xác việc nhận dạng Khi thực thử nghiệm 45 lần nhận dạng, số lần nhận dạng từ 11 lần Xác suất nhận dạng 24,4 % Chương 6: Kết luận 67 Luan van HVTH: Phan Văn Đầy       Luận văn tốt nghiệp thạc sĩ   GVHD: PGS.TS.Lê Tiến Thường Tuy nhiên, chương trình dùng số liệu trọng số mạng nơron tín hiệu nhận dạng thu tách khỏi từ chương trình chạy PC kết phân tích ngõ chương trình chạy Kit LM3S2965 giống kết phân tích ngõ chương trình chạy PC Điều mở định hướng nghiên cứu: Nghiên cứu việc truyền số liệu sau lấy mẫu Kit LM3S2965 sang PC để kiểm tra, làm sở cho việc điều chỉnh chương trình, cải thiện độ xác kết kết nhận dạng 6.3 Hạn chế đề tài hướng phát triển 6.3.1 Đối với chương trình nhận dạng máy tính cá nhân Hệ thống nhận dạng có hạn chế sau: - Chương trình chưa nhận dạng tiếng nói từ ghép, chưa nhận dạng liên tục - Tín hiệu âm thu vào máy tính thơng qua card âm cần phải điều chỉnh mức tín hiệu thu vào cho phù hợp để tránh tình trạng tín hiệu thu vào lớn nhỏ, ảnh hưởng đến độ xác kết nhận dạng - Kết tách tín hiệu tiếng nói khỏi cịn phụ thuộc nhiều vào môi trường nhiễu 6.3.2 Đối với chương trình nhận dạng Kit LM3S2965 Hạn chế lớn chương trình chạy Kit LM3S2965 chưa kiểm chứng xác tín hiệu sau lấy mẫu Việc hiển thị số Kit để ghi lại nhập lại tay sang máy tính cá nhận nhiều thời gian Kết mẫu dùng để huấn luyện mạng nơron Điều ảnh hưởng lớn đến kết nhận dạng Một hạn chế khác chương trình Kit LM3S2965 chương trình chưa đáp ứng kết nhận dạng theo thời gian thực Chương 6: Kết luận 68 Luan van HVTH: Phan Văn Đầy       Luận văn tốt nghiệp thạc sĩ   GVHD: PGS.TS.Lê Tiến Thường Do kết nhận dạng tiếng nói Tiếng Việt chương trình chạy Kit có độ xác thấp nên đề tài chưa thực bo mạch giao tiếp Kit LM3S2965 với cánh tay Robot bậc tự mà thầy hướng dẫn cung cấp để thực mục tiêu cần hướng tới đề tài Hướng phát triển cho hệ thống sau: - Nghiên cứu phương pháp truyền liệu Kit LM3S2965 máy tính cá nhân để dùng máy tính cá nhân hỗ trợ cho Kit LM3S2965 việc mô phỏng, biểu diễn tín hiệu thu được, kiểm tra tính tốn điều chỉnh mức ngưỡng cho việc tách tín hiệu khỏi - Tối ưu hóa giải thuật cách tính tốn để tiết kiệm dung lượng code lập trình, tiết kiệm nhớ cấp phát thời gian tính tốn Kit LM3S2965 - Nghiên cứu xuất kết nhận dạng tiếng nói Tiếng Việt Kit LM3S2965 cổng (port) ngõ Kit Sau đó, thiết kế mạch giao tiếp Kit LM3S2965 cánh tay Robot bậc tự Mục tiêu hướng phát triển điều khiển cánh tay Robot bậc tự tiếng nói Chương 6: Kết luận 69 Luan van HVTH: Phan Văn Đầy Luận văn tốt nghiệp thạc sĩ GVHD: PGS.TS.Lê Tiến Thường TÀI LIỆU THAM KHẢO TIẾNG VIỆT [1] GVHD: PGS.TS Lê Tiến Thường, HVTH: Trần Thanh Hùng, “Phép biến đổi Wavelet nhận dạng tiếng nói”, LVTN thạc sĩ Trường đại học Bách Khoa thành phố Hồ Chí Minh, 2000 TIẾNG NƯỚC NGỒI [2] “Datasheet LM3S2965 Microcontroller”, Luminary Micro Inc, 2007, USA [3] Martin Hagan, Howard Demuth, and Mark Beale “Neural Network Toolbox™ User’s Guide”, Matlab, The MathWorks, Inc , 1992 http:// www.mathworks.com/help/pdf_doc/nnet/nnet.pdf [4] Mikes Brookes , “Voicebox : Speech processing for Matlab” , http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.html [5] R Rojas, Neural Networks (Chapter 7: The Backpropagation Algorithm), Springer-Verlag, Berlin, 1996 [6] User’s guide “Stellaris® Peripheral Driver Library”, Luminary Micro Inc, 2006, USA Tài liệu tham khảo 70 Luan van HVTH: Phan Văn Đầy Luan van ... để học đặc trưng tiếng nói dùng cấu trúc mạng nơron nhân tạo học để nhận dạng tiếng nói với kỳ vọng nâng cao độ xác kết nhận dạng tiếng nói Nhận dạng tiếng nói q trình nhận dạng mẫu, với mục... ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH LUẬN VĂN THẠC SĨ PHAN VĂN ĐẦY NHẬN DẠNG TIẾNG NÓI TIẾNG VIỆT DÙNG MẠNG NƠRON TRIỂN KHAI TRÊN KIT ARM NGÀNH: KỸ THUẬT ĐIỆN TỬ - 605270 Hướng dẫn khoa... ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH LUẬN VĂN THẠC SĨ PHAN VĂN ĐẦY NHẬN DẠNG TIẾNG NÓI TIẾNG VIỆT DÙNG MẠNG NƠRON TRIỂN KHAI TRÊN KIT ARM NGÀNH: KỸ THUẬT ĐIỆN TỬ- 605270 Tp Hồ Chí Minh,

Ngày đăng: 02/02/2023, 09:55

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan