ỨNG DỤNG CHO NGƯỜI KHIẾM THỊ

Một phần của tài liệu nghiên cứu về tổng hợp tiếng việt và các ứng dụng (Trang 98 - 100)

Có lẽ lĩnh vực ứng dụng quan trọng nhất của tổng hợp tiếng nói là đóng vai trò làm phương tiện hỗ trợ việc đọc và giao tiếp cho người khiếm thị. Trước khi có tổng hợp tiếng nói, người ta phải tạo ra các sách âm thanh bằng cách thu âm giọng đọc từ nội dung những cuốn sách lên băng đĩa. Hiển nhiên, để hoàn thành công việc này cho một cuốn sách lớn sẽ cần nhiều tháng và rất tốn kém. Việc lấy thông tin từ máy tính thông qua tiếng nói cũng sẽ trở nên dễ dàng hơn thay vì phải sử dụng loại bàn phím đặc biệt, vốn là giao diện để đọc chữ Braille cho người khiếm thị.

Ứng dụng thương mại đầu tiên của tổng hợp tiếng nói có lẽ là máy đọc Kurzweil cho người khiếm thị được công bố bởi Raymond Kurzweil cuối những

97

năm 1970. Nó bao gồm một máy quét quang học và phần mềm nhận dạng chữ viết, có khả năng tạo ra tiếng nói tương đối dễ hiểu từ nhiều kiểu phông chữ viết (Klatt 1987). Những chiếc máy đọc đầu tiên đó quá đắt so với khả năng của người sử dụng bình dân, vì thế chúng xuất hiện chủ yếu trong thư viện hoặc những địa điểm tương tự. Ngày nay, chất lượng của các máy đọc đã ở ngưỡng có thể chấp nhận được và giá cả cũng phải chăng hơn cho các nhu cầu cá nhân, vì thế các bộ tổng hợp tiếng nói sẽ hữu dụng và phổ biến hơn cho người khiếm thị trong tương lai. Các hệ thống hiện tại chủ yếu dựa trên phần mềm, vì thế với các hệ thống máy quét và OCR, việc cấu trúc cho các máy nói phù hợp với bất kì một môi trường máy tính nào đều khá đơn giản với một ít chi phí phụ thêm. Bất kể tốc độ phát triển của các phương tiện hỗ trợ giao tiếp nhanh đến mức nào thì vẫn luôn có thể cải tiến thêm nữa.

Nhân tố quan trọng nhất trong một máy đọc là giọng nói có thể nghe hiểu được và phải được duy trì tốc độ trong khoảng từ dưới một nửa đến tối thiểu là gấp ba lần tốc độ bình thường (Portele et al.1996). Sự tự nhiên cũng là một yếu tố quan trọng và khiến cho người ta chấp nhận tiếng nói tổng hợp. Mặc dù, tính tự nhiên là một trong những yếu tố quan trọng nhất nhưng đôi khi cũng nên mong người nghe vẫn có thể nhận ra tiếng nói đó phát ra từ một cái máy (Hess 1992), ví thế nên tiếng nói tống hợp nên có âm thật tự nhiên nhưng chừng mực nào đó phải “trung tính”.

Khi mới nghe tiếng nói tổng hợp lần đầu tiên ta sẽ thấy có vẻ dễ nghe và dễ chịu. Tuy nhiên, sau khi nghe một thời gian dài thì âm thanh lạ cũng như các điểm yếu khác có thể sẽ xuất hiện một cách rất khó chịu. Đây là hiệu ứng mặt trái và rất khó để giải quyết nó bằng những phương pháp tính tóan ngắn hạn. Vì vậy, với những trường hợp này, rất cần sự phản hồi từ những khách hàng lâu năm.

Tổng hợp tiếng nói hiện được dùng để đọc các trang www hoặc những định dạng truyền thông khác bằng máy tính cá nhân. Các dịch vụ thông tin có thể thực hiện được thông qua giao diện điện thoại thông thường với điều khiển tương tự như chữ viết-truyền hình. Với máy tính hiện đại, người ta hoàn toàn có thể bổ sung thêm các tính năng mới cho các phương tiện hỗ trợ việc đọc. Việc ứng dụng các phần

98

mềm để đọc các định dạng chuẩn hay tìm kiếm thông tin về cách cấu trúc của các bài báo là hoàn toàn có thể thực hiện được. Tuy nhiên, đôi khi việc tìm được chính xác cấu trúc của một bài báo là không thể nếu như nó được chia ra làm nhiều trang hoặc có cấu trúc dị thường.

Một người khiếm thị cũng không thể nhìn thấy độ dài của văn bản đầu vào khi họ bắt đầu nghe từ bộ tổng hợp tiếng nói, vì thế, một việc quan trọng là phải cung cấp thêm thông tin về văn bản sẽ được tổng hợp. Chẳng hạn, bộ tổng hợp có thể kiểm tra văn bản và tính toán khoảng thời gian cần thiết để tổng hợp văn bản đó, rồi thông báo cho người nghe. Thông tin về các từ in đậm hay in gạch chân cũng nên được thông báo qua việc thay đổi một chút về ngữ điệu hoặc âm lượng.

Một phần của tài liệu nghiên cứu về tổng hợp tiếng việt và các ứng dụng (Trang 98 - 100)

Tải bản đầy đủ (PDF)

(109 trang)