Nghiên cứuthiếtkế cấu trúcvimạch
nhận dạngtiếngnóitiếngViệttrên
nền côngnghệFPGA
Hiện nay, việc sử dụng các thiết bị điều khiển không tiếp xúc đang là xu hướng mới, đặc
biệt là điều khiển bằng tiếngnói nhờ vào côngnghệnhậndạngtiếng nói. Trên thế giới có
nhiều phần mềm nhậndạngtiếngnói được xây dựng và khai thác ứng dụng trênnền tảng
vi xử lý và tài nguyên của máy tính.
Bộ sản phẩmnhận dạngtiếngnóitiếngViệttrênnềncôngnghệFPGA mới được
nhóm tác giả giới thiệu
Tuy nhiên, côngnghệnhậndạngtiếngnói cần phải dùng đến rất nhiều các giải thuật xử
lý phức tạp khác nhau và do tính phức tạp của các giải thuật này dẫn đến thời gian thực
thi giải thuật khá lớn, không đáp ứng được yêu cầu để có thể ứng dụng trênthiết bị phần
cứng. Do vậy, các giải thuật nhậndạng giọng nói mới chỉ được dùng cho các ứng dụng
thực hiện trên phần mềm mà ít có ứng dụng trênthiết bị phần cứng.
Vì vậy, để có thể ứng dụng nhiều trong thực tế, hướng tiếp cận hợp lý là xây dựng thành
công các giải thuật này trênvi mạch, dựa vào khả năng xử lý song song nhiều luồng dữ
liệu để rút ngắn thời gian xử lý. Tuy nhiên, vì các giải thuật nhậndạng là rất phức tạp với
nhiều luồng dữ liệu, đòi hỏi các kỹ thuật đồng bộ có độ chính xác nghiêm ngặt trong vi
mạch. Hơn nữa, việc “vi mạch hóa” các giải thuật này là một thách thức rất lớn mà chưa
có một công trình nào trên thế giới đã công bố là giải quyết trọn vẹn. Với Việt Nam, khó
khăn trong việc “vi mạch hóa” các giải thuật nhậndạng ngôn ngữ tiếngViệt được nhân
lên gấp bội do tiếngViệt là ngôn ngữ đơn âm, có dấu , do vậy, ngay cả các giải thuật
phần mềm cũng chưa tìm được giải thuật hiệu quả.
Năm 2012, được sự hỗ trợ của Bộ Khoa học và Côngnghệ thông qua đề tài nghiêncứu
tiềm năng “Thiết kế chip nhậndạngtiếngnóitiếngViệttrênnềncôngnghệ FPGA”, TS.
Hoàng Trang và nhóm nghiêncứu trẻ của trường Đại học Bách khoa - Đại học Quốc gia
TP.Hồ Chí Minh đã có cơ hội để thử sức nghiêncứu xây dựng một số cấutrúcvimạch
nhận dạngtiếngnóitiếng Việt. Sau gần một năm nghiên cứu, nhóm nghiêncứu đã gặt hái
được một số kết quả bước đầu. Nhóm đã có được cấutrúcvimạchtrênnềnFPGAnhận
dạng tiếngnóitiếng Việt, bước đầu nhậndạng được chữ số từ 0-9 và khoảng 20 từ đơn
âm khác như “trái”, “phải”, “lên”, “xuống” với tốc độ xử lý nhanh hơn so với các vi
mạch cùng tính năng đã được nghiêncứu để nhậndạngtiếng Anh. Ngoài ra, nhóm cũng
đã phát triển một số cấutrúcvimạch để xử lý được một số các câu ngắn ứng dụng cho
điều khiển thiết bị điện tử trong nhà như điều hòa, đèn chiếu sáng, bình nóng lạnh Đặc
biệt, các cấutrúcvimạchnhậndạngtiếngnóitrên có độ chính xác cao khi thử nghiệm
trong nhiều môi trường khác nhau, có thể đạt nhậndạng chính xác tối thiểu 80% khi so
sánh với giải thuật phần mềm tương tự chạy trên máy tính.
Trên cơ sở kết quả đạt được, nhóm thực hiện đề tài đang hướng tới việc cho ra đời một
sản phẩm Chíp nhậndạngtiếngnóitiếngViệt đầu tiên với côngnghệ 65 nm và nghiên
cứu hoàn thiện sản phẩm dành cho các ứng dụng thiết bị đầu cuối trợ giúp người khiếm
thính. Mặc dù, đây mới chỉ nghiêncứu đầu tiên với kết quả còn khiêm tốn nhưng chúng
ta có thể hy vọng trong tương lai không xa sẽ có nhiều thiết bị đầu cuối sử dụng Chíp
nhận dạngtiếngnóitiếngViệt do chính các nhà khoa học trẻ Việt Nam nghiêncứu chế
tạo.
. Nghiên cứu thiết kế cấu trúc vi mạch nhận dạng tiếng nói tiếng Vi t trên nền công nghệ FPGA Hiện nay, vi c sử dụng các thiết bị điều khiển không tiếp xúc. sức nghiên cứu xây dựng một số cấu trúc vi mạch nhận dạng tiếng nói tiếng Vi t. Sau gần một năm nghiên cứu, nhóm nghiên cứu đã gặt hái được một số kết quả bước đầu. Nhóm đã có được cấu trúc vi. của Bộ Khoa học và Công nghệ thông qua đề tài nghiên cứu tiềm năng Thiết kế chip nhận dạng tiếng nói tiếng Vi t trên nền công nghệ FPGA , TS. Hoàng Trang và nhóm nghiên cứu trẻ của trường