Kiến trúc một số hệ thống truy vấn tiếng nói trên- 123docz.net

Do nhu cầu tìm kiếm thông tin trên lượng dữ liệu tiếng nói khổng lồ ngày càng cao, viện tiêu chuẩn và công nghệ quốc gia của Mỹ (NIST) đã xây dựng một chương trình định giá (evaluation) ban đầu cho Truy vấn tiếng nói (Spoken Term Detection- STD). Mục đích là nghiên cứu và phát triển công nghệ tìm kiếm dãy các từ (có độ dài ngắn) một cách nhanh chóng và chính xác trong một cơ sở dữ liệu tiếng nói đa dạng và có kích thước khá lớn. Trong chương trình STD 2006 này,

NIST mời một số nhóm nghiên cứu tham gia, đồng thời cung cấp cho mỗi nhóm phần mềm tính điểm, tập dữ liệu tiếng nói chuẩn dùng để test hệ thống từ các loại nguồn dữ liệu khác nhau (cơ sở dữ liệu tiếng nói được lấy từ tin tức broadcast ,các cuộc nói chuyện điện thoại, và các cuộc nói chuyện tự do) với ba ngôn ngữ (tiếng Anh, tiếng Trung Quốc và tiếng Ả Rập). Mỗi bộ dữ liệu test lên tới 1000 giờ tiếng nói và khoảng 1000 term (mỗi term bao gồm một hay nhiều từ, term loại phổ biến, hay gặp, hay term loại ít xuất hiện…) truy vấn trên mỗi ngôn ngữ.

Vào ngày 14-15/12/2006, NIST đã tổ chức hội nghị quốc tế STD Evaluation Workshop sau khoảng ba tháng phát động chương trình tới một số khách mời, để cùng nhau xây dựng và nâng cao chất lượng hệ thống STD. Hội nghị đã đưa ra nhiều phương án khá hiệu quảđể giải quyết vấn đề truy vấn tiếng nói, một số thành viên đã đạt được kết quả bước đầu khá tốt. Sau đây, tôi xin trình bày 2 giải pháp khá tiêu biểu được đưa ra bởi hai thành viên tham dự: Tập đoàn IBM và công ty BNN:

2.3.1 Hệ thống STD của BBN a. Tổng quan hệ thống

Kiến trúc một số hệ thống truy vấn tiếng nói trên thế giới

Giới thiệu truy vấn tiếng nói