Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 32 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
32
Dung lượng
1,04 MB
Nội dung
1 Hệ thống cung cấp thông tin qua mạng điện thoại và ứng dụng 0612568 : Nguyễn Trần Vọng 0612481 : Trần Minh Trường ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA CÔNG NGHỆ THÔNG TIN GVHD: TS. Vũ Hải Quân Đề tài: 2 Nội dung Mục tiêu của đề tài Mô hình tổng quát của ứng dụng Nhận dạng Tổng kết Demo 3 Mục tiêu của đề tài Xây dựng một ứng dụng thử nghiệm nhận dạng tiếng nói tiếng Việt. Thông qua xây dựng một Voice Server nhằm cung cấp thông tin chứng khoán qua mạng điện thoại. 4 Nội dung Mục tiêu của đề tài Mô hình tổng quát của ứng dụng Nhận dạng Tổng kết Demo 5 Mô hình tổng quát của ứng dụng Giao tiếp Nhận dạng Xử lý Tổng hợp DB Voice Server 6 Hoạt động Giao tiếp Nhận dạng Xử lý Tổng hợp DB Voice Server DHA: wav “DHA” “Thông tin” Thông tin:wav 7 Nội dung Mục tiêu của đề tài Mô hình tổng quát của ứng dụng Nhận dạng Tổng kết Demo 8 Nhận dạng: Nội dung Kiến trúc tổng quát Trích đặc trưng Mô hình ngữ âm Mô hình ngôn ngữ Đồ thị nhận dạng Hướng nghiên cứu và kết quả đạt được. 9 Kiến trúc tổng quát Kiến trúc tổng quan của một hệ thống nhận dạng tiếng nói điển hình 10 Kiến trúc tổng quát (tt) Bộ trích đặc trưng: thực hiện rút trích đặc trưng từ tín hiệu âm thanh trước khi đưa vào nhận dạng. Mô hình ngữ âm: liên quan đến việc biểu diễn tri thức cho tín hiệu ngữ âm, âm vị, ngữ điệu… Mô hình ngôn ngữ: liên quan đến việc biểu diễn tri thức của các từ, chuỗi từ, hình thành nên câu. [...]... nam” do nhóm sinh viên Võ Quang Diệu Hà – Nguyễn Mạnh Tuấn thực hiện Bài báo cáo khóa luận năm 2010: “Nghiên cứu và xây dựng hệ thốngVoice Server ứng dụng trên các dịch vụ truy vấn thông tin qua mạng điện thoại do nhóm sinh viên Nguyễn Thị Mỹ Dung – Dương Chí Trưởng thực hiện Microsoft Platform SDK Paper_VS.pdf, Phạm Minh Nhựt 31 Hỏi đáp Rất mong được sự đóng góp của thầy cô và các bạn 32 ... cứu và kết quả đạt được 15 Mô hình ngôn ngữ Mô hình ngôn ngữ cung cấp thông tin về cú pháp, ngữ nghĩa, trật tự từ của câu Thành phần này giúp hệ thống lựa chọn ra kết quả nhận dạng tốt nhất trong danh sách các ứng viên chọn lọc được bởi tiến trình nhận dạng 16 Nhận dạng: Nội dung Kiến trúc tổng quát Trích đặc trưng Mô hình ngữ âm Mô hình ngôn ngữ Đồ thị nhận dạng Hướng nghiên cứu và. .. 30.00% 20.00% 10.00% 0.00% 0 1 2 25 Nội dung Mục tiêu của đề tài Mô hình tổng quát của ứng dụng Nhận dạng Tổng kết Demo 26 Tổng kết Mô hình ngữ chọn sử dụng: Mô hình 2 Kết quả đạt được: độ chính xác: 87,65% Hạn chế Hướng phát triển 27 Nội dung Mục tiêu của đề tài Mô hình tổng quát của ứng dụng Nhận dạng Tổng kết Demo 28 Demo 29 Kết thúc 0612568 : 0612481 : Nguyễn Trần Vọng... bước chính: o Xây dựng bộ khung từ mô hình ngôn ngữ o Biểu diễn chi tiết đồ thị thông qua từ điển phát âm o Kết ghép các mô hình ngữ âm-HMM vào đồ thị 18 Nhận dạng: Nội dung Kiến trúc tổng quát Trích đặc trưng Mô hình ngữ âm Mô hình ngôn ngữ Đồ thị nhận dạng Hướng nghiên cứu và kết quả đạt được 19 Hướng nghiên cứu và kết quả Thử nghiệm ba mô hình ngữ âm: Mô hình tổng quát (Mô hình 0): Mô... Nội dung Kiến trúc tổng quát Trích đặc trưng Mô hình ngữ âm Mô hình ngôn ngữ Đồ thị nhận dạng Hướng nghiên cứu và kết quả đạt được 11 Trích đặc trưng Mục tiêu của bộ trích đặc trưng là tham số hoá tín hiệu tiếng nói thành chuỗi vector đặc trưng, chứa thông tin liên quan đến âm thanh của câu nói Các bước rút trích đặc trưng MFCC từ tín hiệu âm thanh MFCC: Mel-Frequency Cepstral Coefficients... Mel-Frequency Cepstral Coefficients 12 Nhận dạng: Nội dung Kiến trúc tổng quát Trích đặc trưng Mô hình ngữ âm Mô hình ngôn ngữ Đồ thị nhận dạng Hướng nghiên cứu và kết quả đạt được 13 Mô hình ngữ âm Mô hình hóa cách phát âm và ngữ điệu của các vị, âm tiết, các từ v.v… Có 2 hướng tiếp cận chính để xây dựng mô hình ngữ âm là: o Qui hoạch thời gian động (DTW) o Mô hình Markov ẩn (HMM – Hiden... nghiệm ba mô hình ngữ âm: Mô hình tổng quát (Mô hình 0): Mô hình ESAT SPRAAK Mô hình cải tiến thứ 1 (Mô hình 1): Thay đổi mô hình ngữ âm và từ điển phát âm Mô hình cải tiến thứ 2 (Mô hình 2): Thay đổi từ điển phát âm 20 Mô hình tổng quát (Mô hình 0) Các thành phần và cơ chế hoạt động của ESAT SPRAAK 21 Mô hình cải tiến thứ 1 (Mô hình 1) Mô hình cải tiến thứ 1 22 Mô hình cải tiến thứ 1 (Mô hình 1) Mô . 1 Hệ thống cung cấp thông tin qua mạng điện thoại và ứng dụng 0612568 : Nguyễn Trần Vọng 0612481 : Trần Minh Trường ĐẠI HỌC. tài Xây dựng một ứng dụng thử nghiệm nhận dạng tiếng nói tiếng Việt. Thông qua xây dựng một Voice Server nhằm cung cấp thông tin chứng khoán qua mạng điện thoại. 4 Nội dung Mục. Hướng nghiên cứu và kết quả đạt được. Mô hình ngôn ngữ 16 Mô hình ngôn ngữ cung cấp thông tin về cú pháp, ngữ nghĩa, trật tự từ của câu. Thành phần này giúp hệ thống lựa chọn ra