Tổng quan về tiếng Việt

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt (Trang 54 - 55)

Tiếng Việt là một ngôn ngữ có thanh điệu đơn âm tiết (Monosyllable), trong đó về cơ bản mỗi âm tiết có thể chứa một trong sáu thanh điệu. Các thanh điệu được sử dụng để đặc trưng sự phân biệt cấp độ âm vị, do đó rất cần thiết để phân biệt giữa các từ. Thông tin thanh điệu như vậy được tạo ra ở tần số cơ bản F0, hai câu hỏi phổ biến nhất khi phát triển nhận dạng tiếng Việt là: (1) thanh điệu ảnh hưởng đến hiệu suất như thế nào, và (2) làm thế nào chúng ta có thể tích hợp các thông tin hoặc đặc trưng về thanh điệu vào mô hình ngữ âm.

Các đặc tính chính của âm tiết tiếng Việt như sau:

Âm tiết là đơn vị cơ bản trong hệ thống các đơn vị ngôn ngữ. Mỗi âm tiết đều có khả năng được thể hiện bởi một từ không biến hình, hay nói cách khác một âm tiết cũng đồng thời là một hình vị. Về mặt ý nghĩa và ngữ pháp trong tiếng Việt được thể hiện chủ yếu bằng trật tự giữa các từ. Như vậy tiếng Việt khác với một số ngôn ngữ khác như tiếng Anh, Pháp,… là luôn có ranh giới rõ ràng giữa hai âm tiết.

b) Âm tiết tiếng Việt có khả năng biểu hiện ý nghĩa

Hầu hết các âm tiết tiếng Việt khi đứng một mình đều có khả năng biểu hiện một ý nghĩa xác định. Như vậy âm tiết tiếng Việt ngoài vai trò là một đơn vị ngữ âm nó còn có vai trò về từ vựng và ngữ pháp.

c) Âm tiết tiếng Việt có cấu trúc chặt chẽ

Ngoài ra, mỗi âm tiết tiếng Việt có thể được coi là cấu trúc [57] được mô tả trong Bảng I. Khi sử dụng cấu trúc này, thật đơn giản để thực hiện phiên âm cho bất kỳ âm tiết tiếng Việt nào:

Bảng I: Cấu trúc âm tiết tiếng Việt

Thanh điệu

Âm đầu Vần

Âm đệm Âm chính Âm cuối

Ví dụ cấu trúc của âm tiết (từ) “chuyền” có thể được phân tích thành 5 thành phần như sau:

Bảng II: Ví dụ cấu trúc ngữ âm của âm tiết “chuyền”

Thanh điệu (Thanh huyền)

Âm đầu (Ch) Vần (uyên)

Âm đệm (u) Âm chính (yê) Âm cuối (n)

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu áp dụng mô hình mạng nơ ron end to end cho nhận dạng tiếng nói tiếng việt (Trang 54 - 55)