1. Trang chủ
  2. » Kỹ Thuật - Công Nghệ

Tài liệu Xử lý tiếng nói - Spoken Language System Architecture docx

12 561 3

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 12
Dung lượng 253,27 KB

Nội dung

Bài 3:Bài 3: Kiến trúc hệ thống ngôn ngữ nóiKiến trúc hệ thống ngôn ngữ nói  Xử ngôn ngữ nói liên quan đến các kỹ Xử ngôn ngữ nói liên quan đến các kỹ thuật như: thuật như: ––Nhận dạng tiếng nói: chuyển nội dung tiếng nói Nhận dạng tiếng nói: chuyển nội dung tiếng nói thành văn bản tương ứngthành văn bản tương ứng Đọcnội dung vănbản: chuyểnnội dung vănbảnĐọcnội dung vănbản: chuyểnnội dung vănbản–– Đọc nội dung văn bản: chuyển nội dung văn bản Đọc nội dung văn bản: chuyển nội dung văn bản sang tiếng nói tương ứngsang tiếng nói tương ứng –– Hiểu ngôn ngữ nói: chuyển nội dung văn bản Hiểu ngôn ngữ nói: chuyển nội dung văn bản gg y ộ ggg y ộ g thành hành động tương ứng để hệ thống thực thành hành động tương ứng để hệ thống thực hiệnhiện  Bộ não của người nói quyết định dãy các từ Bộ não của người nói quyết định dãy các từ cần nói Wcần nói W  Tín hiệu nguồn được chuyển qua một kênh Tín hiệu nguồn được chuyển qua một kênh giao tiếp có nhiễu gồm bộ máy phát âm để giao tiếp có nhiễu gồm bộ máy phát âm để ih ó iế óiih ó iế óisinh ra sóng tiếng nóisinh ra sóng tiếng nói  Bộ giải mã tiếng nói có nhiệm vụ giải mã tín Bộ giải mã tiếng nói có nhiệm vụ giải mã tín hiệ âh Xthà h h ỗitừ W’ h W’hiệ âh Xthà h h ỗitừ W’ h W’hiệu âm học X thành chuỗi từ W’ sao cho W’ hiệu âm học X thành chuỗi từ W’ sao cho W’ gần giống nhất với chuỗi từ ban đầu Wgần giống nhất với chuỗi từ ban đầu W Tự động nhậndạng tiếng nóiTự động nhậndạng tiếng nóiTự động nhận dạng tiếng nóiTự động nhận dạng tiếng nói  Một hệ thống nhận dạng tiếng nói thông Một hệ thống nhận dạng tiếng nói thông thường trong thực tế bao gồm các thành thường trong thực tế bao gồm các thành phần:phần: –– Các mô hình ngữ âm: biểu diễn tri thức về ngữ Các mô hình ngữ âm: biểu diễn tri thức về ngữ âm âm vị tác động của nhiễucáchphátâmâm âm vị tác động của nhiễucáchphátâmâm, âm vị, tác động của nhiễu, cách phát âm âm, âm vị, tác động của nhiễu, cách phát âm của nhiều người nói khác nhaucủa nhiều người nói khác nhau –– Các mô hình ngôn ngữ: bao gồm tri thức về các Các mô hình ngôn ngữ: bao gồm tri thức về các gg ggg g thành phần cấu tạo nên từ ngữ, đặc điểm của từ thành phần cấu tạo nên từ ngữ, đặc điểm của từ ngữngữ  Bộ xử tín hiệu trích xuất các đặc điểm Bộ xử tín hiệu trích xuất các đặc điểm quan trọng cho bộ giải mãquan trọng cho bộ giải mã  Bộ giải mã sử dụng cả mô hình ngữ âm và Bộ giải mã sử dụng cả mô hình ngữ âm và ngôn ngữ để sinh ra chuỗi các từ có khả ngôn ngữ để sinh ra chuỗi các từ có khả ă đúhấ ớiáđặ điể đ đă đúhấ ớiáđặ điể đ đnăng đúng nhất với các đặc điểm được đưa năng đúng nhất với các đặc điểm được đưa vàovào Chuyển đổivănbản thành tiếng nóiChuyển đổivănbản thành tiếng nóiChuyển đổi văn bản thành tiếng nóiChuyển đổi văn bản thành tiếng nói  Hệ thống chuyển văn bản thành tiếng nói Hệ thống chuyển văn bản thành tiếng nói (Text(Text--toto--Speech) là một hệ thống có thể Speech) là một hệ thống có thể sinh ra tiếng nói gần giống với con người từ sinh ra tiếng nói gần giống với con người từ các văn bản được đưa vào (còn được gọi là các văn bản được đưa vào (còn được gọi là hệ thống tổng hợptiếng nói)hệ thống tổng hợptiếng nói)hệ thống tổng hợp tiếng nói)hệ thống tổng hợp tiếng nói)  Sự chuyển đổi các từ dưới dạng viết sang Sự chuyển đổi các từ dưới dạng viết sang tiếng nói là mộtcôngviệckhókhănvìhệtiếng nói là mộtcôngviệckhókhănvìhệtiếng nói là một công việc khó khăn vì hệ tiếng nói là một công việc khó khăn vì hệ thống TTS cần dữ liệu từ vựng rất lớn và thống TTS cần dữ liệu từ vựng rất lớn và nhiềungữ điệucủa âm thanhnhiềungữ điệucủa âm thanhnhiều ngữ điệu của âm thanhnhiều ngữ điệu của âm thanh Các thành phầncơ bảncủamộthệ thống TTSCác thành phầncơ bảncủamộthệ thống TTSCác thành phần cơ bản của một hệ thống TTSCác thành phần cơ bản của một hệ thống TTS  Bộ phân tích văn bản: chuẩn hóa văn bản Bộ phân tích văn bản: chuẩn hóa văn bản sang dạng thích hợp cho hệ thống TTSsang dạng thích hợp cho hệ thống TTS  Bộ phân tích ngữ âm chuyển đổi văn bản đã Bộ phân tích ngữ âm chuyển đổi văn bản đã được xử thành dãy các âm tương ứng sau được xử thành dãy các âm tương ứng sau đó đ hâ í h ữ điệ để á đị hđó đ hâ í h ữ điệ để á đị hđó được phân tích ngữ điệu để xác định đó được phân tích ngữ điệu để xác định trọng âm, ngắt nhịp, thời gian, trọng âm, ngắt nhịp, thời gian, C ốiù bộ tổ hợ tiế ói hậ áC ốiù bộ tổ hợ tiế ói hậ á  Cuối cùng, bộ tổng hợp tiếng nói nhận các Cuối cùng, bộ tổng hợp tiếng nói nhận các tham số đầu vào từ dãy âm vị đã xử đầy tham số đầu vào từ dãy âm vị đã xử đầy đủđủđủ đủ Hệ thống hiểungônngữ nóiHệ thống hiểungônngữ nóiHệ thống hiểu ngôn ngữ nóiHệ thống hiểu ngôn ngữ nói  Một hệ thống hiểu ngôn ngữ nói có khả Một hệ thống hiểu ngôn ngữ nói có khả năng hiểu được lời nói và thực hiện hành năng hiểu được lời nói và thực hiện hành động tương ứngđộng tương ứng  Hệ thống hiểu ngôn ngữ nói thông thường Hệ thống hiểu ngôn ngữ nói thông thường ồ bộ hậ hậ d iế ói à bộồ bộ hậ hậ d iế ói à bộgồm bộ phận nhận dạng tiếng nói và bộ gồm bộ phận nhận dạng tiếng nói và bộ phận tổng hợp tiếng nóiphận tổng hợp tiếng nói Thà h hầ hiê dị hâ óióhứThà h hầ hiê dị hâ óióhứ  Thành phần phiên dịch câu nói có chức Thành phần phiên dịch câu nói có chức năng chuyển đổi kết quả nhận dạng tiếng năng chuyển đổi kết quả nhận dạng tiếng nói sang dạng ngữ nghĩa đượcquyướcnói sang dạng ngữ nghĩa đượcquyướcnói sang dạng ngữ nghĩa được quy ướcnói sang dạng ngữ nghĩa được quy ước [...]...Thành phần quản hội thoại có chức năng giao tiếp với các ứng dụng và các thành phần khác trong hệ thống . động nhậndạng tiếng nóiTự động nhậndạng tiếng nóiTự động nhận dạng tiếng nóiTự động nhận dạng tiếng nói  Một hệ thống nhận dạng tiếng nói thông Một. thành tiếng nóiChuyển đổivănbản thành tiếng nóiChuyển đổi văn bản thành tiếng nóiChuyển đổi văn bản thành tiếng nói  Hệ thống chuyển văn bản thành tiếng nói

Ngày đăng: 14/12/2013, 10:15

TỪ KHÓA LIÊN QUAN

w