Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 12 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
12
Dung lượng
260,23 KB
Nội dung
MÔN HỌC: XỬLÝTIẾNG NÓIMÔN HỌC: XỬLÝTIẾNG NÓIMÔN HỌC: XỬLÝTIẾNG NÓIMÔN HỌC: XỬLÝTIẾNGNÓI Mục đích:Mục đích: –– Cung cấp cho sinh viên những kiến thức cơ bản Cung cấp cho sinh viên những kiến thức cơ bản ề lĩ h ự ử lý tiế óiề lĩ h ự ử lý tiế óivề lĩnh vực xửlýtiếng nóivề lĩnh vực xửlýtiếngnói Giảng viên: Lê Bá DũngGiảng viên: Lê Bá Dũng Địachỉ:KhoaCôngnghệ Thông tinĐịachỉ:KhoaCôngnghệ Thông tin-- Trường ĐạiTrường Đại Địa chỉ: Khoa Công nghệ Thông tinĐịa chỉ: Khoa Công nghệ Thông tin-- Trường Đại Trường Đại học Hàng Hải Việt Namhọc Hàng Hải Việt Nam--số 484 Lạch Traysố 484 Lạch Tray--Ngô Ngô QuyềnQuyền-- Tp. Hải PhòngTp. Hải Phòng Email: dungleba@gmail.comEmail: dungleba@gmail.com Website khóa học:Website khóa học: http://www fit vimaru edu vn/cntt/ dunglb/teaching/speehttp://www fit vimaru edu vn/cntt/ dunglb/teaching/spee–– http://www.fit.vimaru.edu.vn/cntt/~dunglb/teaching/speehttp://www.fit.vimaru.edu.vn/cntt/~dunglb/teaching/spee chprocessing08chprocessing08 NỘIDUNGCHÍNHNỘIDUNGCHÍNHNỘI DUNG CHÍNHNỘI DUNG CHÍNH Giới thiệu về xửlýtiếng nóiGiới thiệu về xửlýtiếngnói Các kiến thức cơ bản về xửlý tín hiệu sốCác kiến thức cơ bản về xửlý tín hiệu số Các mô hình số cho tín hiệu tiếng nóiCác mô hình số cho tín hiệu tiếngnói Các mô hình trong miền thời gian cho xửlýtiếng Các mô hình trong miền thời gian cho xửlýtiếng nóinóinóinói Biểu diễn số cho dạng sóng tiếng nóiBiểu diễn số cho dạng sóng tiếngnói Tổng hợp tiếng nóiTổng hợp tiếng nóig ợp gg ợp g Nhận dạng tiếng nóiNhận dạng tiếng nói TÀI LIỆUTHAMKHẢOTÀI LIỆUTHAMKHẢOTÀI LIỆU THAM KHẢOTÀI LIỆU THAM KHẢO Xuedong Huang, Alex Acero, Hsiao Wuen Hon, Xuedong Huang, Alex Acero, Hsiao Wuen Hon, Spoken Language ProcessingSpoken Language Processing , Prentice Hall, 2001, Prentice Hall, 2001 LRRbiRldWShfLRRbiRldWShf Di it lDi it l Lawrence R.Rabiner, Ronald W.Schafer, Lawrence R.Rabiner, Ronald W.Schafer, Digital Digital Processing of Speech SignalProcessing of Speech Signal , Prentice Hall, 1978. , Prentice Hall, 1978. Bài 1:Bài 1: Giới thiệuGiới thiệu Tiếngnói là các chuỗi âm thanh được phát Tiếngnói là các chuỗi âm thanh được phát ra từ bộ máy phát âm của con người ra từ bộ máy phát âm của con người Mục đích của tiếngnói là dùng để giao tiếpMục đích của tiếngnói là dùng để giao tiếp Quá trình giao tiếpbằng tiếng nóiQuá trình giao tiếpbằng tiếng nóiQuá trình giao tiếp bằng tiếng nóiQuá trình giao tiếp bằng tiếngnói Thông tin muốn trao đổi được chuyển thành Thông tin muốn trao đổi được chuyển thành tập hợp các tín hiệu nơron được dùng để tập hợp các tín hiệu nơron được dùng để ểểđiều khiển các bộ phận trong bộ máy phát điều khiển các bộ phận trong bộ máy phát âm (lưỡi, môi, họng, )âm (lưỡi, môi, họng, ) S h ể độ ủ ábộ hậ àS h ể độ ủ ábộ hậ à Sự chuyển động của các bộ phận này tạo ra Sự chuyển động của các bộ phận này tạo ra một dãy các cử chỉ, kết quả của nó là sóng một dãy các cử chỉ, kết quả của nó là sóng âm tương ứng mang thông tin cầntraođổiâm tương ứng mang thông tin cầntraođổiâm tương ứng mang thông tin cần trao đổiâm tương ứng mang thông tin cần trao đổi Thông tin được giao tiếp thông qua tiếng Thông tin được giao tiếp thông qua tiếngnói có thể được biểu diễn bằng sự ghép nốinói có thể được biểu diễn bằng sự ghép nối nhiều thành phần từ một tập hợp hữu hạn nhiều thành phần từ một tập hợp hữu hạn các ký hiệucác ký hiệu Ký hiệ àd à đó ỗiâ h h óKý hiệ àd à đó ỗiâ h h ó Ký hiệu mà dựa vào đó mỗi âm thanh có Ký hiệu mà dựa vào đó mỗi âm thanh có thể mang ý nghĩa được gọi là âm vịthể mang ý nghĩa được gọi là âm vị Mỗiô ữ ótậ hợ áâ ị ủMỗiô ữ ótậ hợ áâ ị ủ Mỗi ngôn ngữ có tập hợp các âm vị của Mỗi ngôn ngữ có tập hợp các âm vị của riêng nó, thông thường số lượng từ 30 đến riêng nó, thông thường số lượng từ 30 đến 50505050 Quá trình xửlý tín hiệuQuá trình xửlý tín hiệu Quá trình xửlý tín hiệutiếng nóiQuá trình xửlý tín hiệutiếng nóiQuá trình xửlý tín hiệu tiếng nóiQuá trình xửlý tín hiệu tiếngnói Nguồn thông tin: người nóiNguồn thông tin: người nói Lượng giá: dạng sóng của âm thanhLượng giá: dạng sóng của âm thanhợ gg ạ ggợ gg ạ gg Biểu diễn tín hiệu: biểu diễn tín hiệu dưới Biểu diễn tín hiệu: biểu diễn tín hiệu dưới dạng sốdạng số Biến đổi tín hiệu: chuyển tín hiệu sang một Biến đổi tín hiệu: chuyển tín hiệu sang một dạng thích hợp hơndạng thích hợp hơn Trích xuất và sử dụng thông tin: có thể Trích xuất và sử dụng thông tin: có thể được thực hiện bởi người nghe hoặc máy tự được thực hiện bởi người nghe hoặc máy tự độđộđộngđộng Các ứng dụng xửlýtiếng nóiCác ứng dụng xửlýtiếng nóiCác ứng dụng xử lýtiếng nóiCác ứng dụng xử lýtiếngnói Các ứng dụng xửlýtiếng nóiCác ứng dụng xử lýtiếng nóiCác ứng dụng xử lýtiếng nóiCác ứng dụng xửlýtiếngnói Truyền và lưu trữ tiếng nói: mã hóa tiếng Truyền và lưu trữ tiếng nói: mã hóa tiếngnói (voice coder). Mục đích của mã hóa nói (voice coder). Mục đích của mã hóa ểểtiếng nói là làm giảm thiểu băng thông cần tiếngnói là làm giảm thiểu băng thông cần thiết để truyền tiếng nóithiết để truyền tiếngnói Cá hệ hố ổ h iế ói á hệCá hệ hố ổ h iế ói á hệ Các hệ thống tổng hợp tiếng nói: các hệ Các hệ thống tổng hợp tiếng nói: các hệ thống trả lời tự động bằng máy tính là các thống trả lời tự động bằng máy tính là các hệ thống cung cấp thông tin dạng số tựhệ thống cung cấp thông tin dạng số tựhệ thống cung cấp thông tin dạng số tự hệ thống cung cấp thông tin dạng số tự động cho người sử dụng dưới dạng tiếng động cho người sử dụng dưới dạng tiếng nóinóinóinói [...]... thống định danh người nói: là các hệ thống có khả năng xác định người đang truy cập hệ thống có hợp lệ hay không thông qua tiếngnói của người đó Cá hệ thống nhận d Các hố hậ dạng tiếng nói: là các iế ói á ứng dụng chuyển đổi dạng sóng âm thanh sang thông tin dạng viết tương đương Nâng cao chất lượng tín hiệu: là các ứng dụng như loại bỏ nhiễu, loại bỏ tiếng vang trong tiếngnói . dụng xử lý tiếng nóiCác ứng dụng xử lý tiếng nóiCác ứng dụng xử lý tiếng nóiCác ứng dụng xử lý tiếng nói Các ứng dụng xử lý tiếng nóiCác ứng dụng xử lý tiếng. xử lý tín hiệuQuá trình xử lý tín hiệu Quá trình xử lý tín hiệutiếng nóiQuá trình xử lý tín hiệutiếng nóiQuá trình xử lý tín hiệu tiếng nóiQuá trình xử