Slide 1 BÁO CÁO BÀI TẬP LỚN Mạng neural và ứng dụng trong bài toán nhận dạng tiếng nói Giáo viên hướng dẫn Trần Cao Trưởng Học viên thực hiện Phạm Minh Tài Lớp Tin học 2 – K41 Nguyễn Văn Cường Lớp Tin.
BÁO CÁO BÀI TẬP LỚN Mạng neural ứng dụng tốn nhận dạng tiếng nói Giáo viên hướng dẫn: Trần Cao Trưởng Học viên thực hiện: -Phạm Minh Tài - Lớp Tin học – K41 -Nguyễn Văn Cường - Lớp Tin học – K41 Các vấn đề nghiên cứu: • • • • Tổng quan mạng neural Trích xuất đặc trưng file âm dùng LPC Mạng nơron nhiều tầng (MLP) Giải thuật lan truyền ngược (back propagation) • Hệ thống nhận dạng tiếng nói • Kết luận Mạng Neural nhiều tầng(MLP) Mạng Neural nhiều tầng(MLP) • MLP(Multilayered Perceptron) • MLP bao gồm tầng vào, tầng tầng ẩn Mạng Neural nhiều tầng(MLP) • Số lượng neural tầng input = số chiều • Thơng thường mạng neural dùng tầng ẩn Số lượng neural tầng ẩn thường chọn = ½ (số neural tầng input + số neural tầng output) • Chú ý: Các neural tầng input thực khơng phải neural Nó chỗ để đưa liệu mẫu vào Huấn luyện MLP • Là q trình thay đổi giá trị w để mạng biểu diễn tập liệu học • Sự khác giá trị thật mẫu kết dự đoán mạng gọi lỗi (học có giám sát) Hàm lỗi thường dùng sum squared error • Q trình huấn luyện tìm wi* để lỗi nhỏ Một số giải thuật huấn luyện MLP • Back propagation (khá tiếng, dễ hiểu) • Conjugate gradient descent & LevenberMarquardt (Bishop 1995, Shepherd 1997) • Quick propagation (Fahlman, 1988) • Delta-Bar-Delta(Jacob 1988) Giải thuật lan truyền ngược • Xét mạng neural tầng: input, hiden,output • Hàm kích hoạt nơ-ron: logistic sigmoid Giải thuật lan truyền ngược • Giải thuật lan truyền ngược gồm giai đoạn: - Lan truyền tiến (tính output neural) - Lan truyền ngược (thay đổi trọng số cung, dùng thông tin gradient hàm lỗi) Gradient hàm lỗi (1) Gradient hàm lỗi (2) Gradient hàm lỗi (3) Gradient hàm lỗi (4) Điều chỉnh trọng số • Sau tính đạo hàm riêng hàm lỗi theo trọng số Trọng số điều chỉnh cách trừ bớt lượng tích đạo hàm riêng tốc độ học: Hệ thống nhận dạng tiếng nói - Mạng neural nhận dạng tiếng nói huấn luyện - Đầu vào nhận dạng tham số đặc trưng file âm trích xuất phương pháp LPC ... cách trừ bớt lượng tích đạo hàm riêng tốc độ học: Hệ thống nhận dạng tiếng nói - Mạng neural nhận dạng tiếng nói huấn luyện - Đầu vào nhận dạng tham số đặc trưng file âm trích xuất phương pháp LPC... Tổng quan mạng neural Trích xuất đặc trưng file âm dùng LPC Mạng nơron nhiều tầng (MLP) Giải thuật lan truyền ngược (back propagation) • Hệ thống nhận dạng tiếng nói • Kết luận Mạng Neural nhiều... tầng(MLP) Mạng Neural nhiều tầng(MLP) • MLP(Multilayered Perceptron) • MLP bao gồm tầng vào, tầng tầng ẩn Mạng Neural nhiều tầng(MLP) • Số lượng neural tầng input = số chiều • Thơng thường mạng neural