HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG CƠ SỞ TẠI THÀNH PHỐ HỒ CHÍ MINH KHOA KỸ THUẬT ĐIỆN TỬ II BÁO CÁO MÔN HỌC Xử Lý Tiếng Nói NIÊN KHÓA 2017 – 2022 Giáo viên hướng dẫn Th S Hồ Nhựt Minh TP HCM –.
HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG CƠ SỞ TẠI THÀNH PHỐ HỒ CHÍ MINH KHOA KỸ THUẬT ĐIỆN TỬ II BÁO CÁO MƠN HỌC Xử Lý Tiếng Nói NIÊN KHÓA: 2017 – 2022 Giáo viên hướng dẫn : Th.S Hồ Nhựt Minh TP.HCM – Tháng 12 năm 2020 MỤC LỤC I MỞ ĐẦU II TỔNG QUAN VỀ XỬ LÝ TIẾNG NÓI III BÀI TẬP XỬ LÝ TIẾNG NÓI IV PROJECTS 16 I MỞ ĐẦU Tiếng nói phương tiện trao đổi thơng tin tiện ích vốn có người.Tiếng nói thường xuất nhiều hình thức mà ta gọi đàm thoại, việc đàm thoại thể kinh nghiệm người đàm thoại q trình gồm nhiều người, có hiểu biết chung nghi thức luân phiên nói Những người có điều kiện thể chất tinh thần bình thường dễ diễn đạt tiếng nói mình, tiếng nói phương tiện giao tiếp lúc đàm thoại Tiếng nói có nhiều yếu tố khác hỗ trợ nhằm giúp người nghe hiểu ý cần diễn đạt biểu gương mặt, cử chỉ, điệu Vì có đặc tính tác động qua lại, nên tiếng nói sử dụng nhu cầu giao tiếp nhanh chóng Sự biểu đạt tiếng nói hỗ trợ mạnh mẽ cho việc đời hệ thống máy tính có sử dụng tiếng nói, ví dụ lưu trữ tiếng nói loại liệu, hay dùng tiếng nói làm phương tiện giao tiếp qua lại.Ngồi sử dụng tiếng nói việc thay thao tác tay để thực cơng việc Nhờ có ngơn ngữ tiếng nói mà lồi người sống phát triển xã hội tiến bộ, có văn hóa, văn minh ngày II TỔNG QUAN VỀ XỬ LÝ TIẾNG NĨI Tiếng nói phương tiện giao tiếp người nhằm trao đổi thơng tin ngơn ngữ tình cảm người nói Xử lý tiếng nói nghiên cứu tiếng nói người dạng tín hiệu, phương pháp xử lý tín hiệu Tín hiệu tiếng nói thường thể dạng số, tức “số hóa”, đó, xử lý tiếng nói coi giao “xử lý tín hiệu số” “xử lý ngơn ngữ tự nhiên” Lĩnh vực xử lý tiếng nói rộng lớn, ví dụ như: + Nhận dạng tiếng nói: chuyển nội dung nói thành tín hiệu đầu vào máy tính, giúp cho máy tính xử lý tương tác với người nói + Nhận dạng người nói: xác minh người nói dựa tiếng nói liệu lưu trữ máy tính + Tăng chất lượng tiếng nói: nhằm tăng cảm nhận người nghe chất lượng tiếng nói + Mã hóa tiếng nói: dạng nén liệu, có vai trị quan trọng lĩnh vực viễn thơng Ví dụ thể thức truyền tiếng nói qua internet (voIP), việc nén liệu tiếng nói điều bắt buộc để giảm băng thông đường truyền + Phân tích giọng nói:được ứng dụng chủ yếu y học, nhằm phát khuyết tật hay vấn đề dây âm, quản, v.v… + Định vị nguồn âm thanh: xử lý tín hiệu tiếng nói để xác định vị trí nguồn phát âm Nó ứng dụng hội nghị hình thoại (videoconference), vị trí người nói hội nghị xác định, máy ghi hình lập trình tự động quay đến vị trí gửi hình ảnh Ngồi định vị nguồn âm cịn có ứng dụng kỹ thuật tăng chất lượng tiếng nói, theo dõi an ninh, v.v… + Tổng hợp tiếng nói: tạo tiếng nói nhân tạo máy tính Tổng hợp tiếng nói có vai trị quan lĩnh vực giao tiếp người máy III BÀI TẬP XỬ LÝ TIẾNG NÓI Trong cặp âm điệu đưới âm điệu xem to a 20 dB với tần số 1000Hz hay 20 dB tần số 4000Hz >>20 dB b 40dB tần số 250Hz hay 40dB tần số 1000Hz >>40dB tần số 250Hz c 50dB tần số 500Hz hay 30 dB tần số 2000Hz >>50dB tần số 500Hz tần 40dB số tần 4000Hz số 1000Hz Tần số pitch (in Mels) nhận âm điệu Ta áp dụng công mel( f )= a 50 Hz b 250Hz c 500Hz d 2000Hz e 5000Hz => 2363.47 thức chuyển 2595*log(1+ => => => => đổi f sau: /700) 77.5646 344.2 607.456 1521.36 Một tín hiệu đầu vào x(n) xác định miền -∞< n