Đầu ra của quá trình nhận dạng

Một phần của tài liệu Giải quyết vấn đề nhận dạng tiếng Việt bằng phân tích cú pháp (Trang 72 - 73)

Đa số người hiểu biết sơ qua về nhận dạng tiếng nói đều cho rằng kết quả quả quá trình nhận dạng là văn bản. Điều đó đúng nhưng không tổng quát. Trong các hệ đọc chính tả, điều này hoàn toàn chính xác vì mỗi khi đọc thêm một tiếng thì có một từ thêm vào và tập tin văn bản sẽ dài thêm tỷ lệ với tập tin âm thanh.

Trong hệ ra lệnh bằng giọng nói, chúng ta có thể thấy đầu ra của quá trình nhận dạng không phải là văn bản mà là một hành động hay một phản ứng của máy tính. Khi ta yêu cầu mởi tập tin, thì trên màn hình xuất hiện một hộp thoại.

Trong các hệ tương tác hỏi đáp, tín hiệu âm thanh đưa vào thực chất sẽ được chuyển thành khối tham số. Khi người dùng ra một câu hỏi, nó sẽ được nhận dạng thành một khối tham số. Khối tham số này sẽ được dùng để tìm kiếm câu trả lời. Và câu trả lời sẽ được tổng hợp thành tiếng nói để đưa ra.

Trong các hệ thông ngôn tự động, nghĩa là nghe một câu nói ở một ngôn ngữ, dịch thành ngôn ngữ khác và phát ra, hoặc trong các hệ trợ thính, nghĩa là nghe một câu nói, chuyển thành rung động thần kinh thính giác, sản phẩm của quá trình nhận dạng chính là các tín hiệu khác chuyển đổi từ tín hiệu thu vào.

Mặc dù các đầu ra phong phú như vậy, chúng được trừu tượng hoá thành các ký hiệu (symbol) đầu ra. Dạng đơn giản nhất của ký hiệu đầu ra là các từ (word). Và tập tin đầu ra sẽ gồm danh sách các ký hiệu đầu ra. Dạng đơn giản nhất của tập tin đầu ra chính là tập hợp các từ hay văn bản. Chúng ta sẽ dùng ký pháp chuỗi để ký hiệu tập tin đầu ra

T = { w1, w2, .., wm }

Tập tin đầu ra như chúng ta đã trừu tượng hoá sẽ được sử dụng để xây dựng mô hình lý thuyết. Trong quá trình triển khai các tập tin đầu ra có thể được kéo dài theo thời gian hoặc không xác định độ dài. Chúng ta cũng không quan trọng điều này lắm vì nó không mất nhiều công đưa từ lý thuyết đến triển khai. Ký hiệu T có thể hiểu là text hay transcription hoặc đơn giản chỉ là đối ngẫu với phát âm S

Một phần của tài liệu Giải quyết vấn đề nhận dạng tiếng Việt bằng phân tích cú pháp (Trang 72 - 73)

Tải bản đầy đủ (PDF)

(107 trang)