Chúng tôi không nói chi tiết về văn phạm tiếng Việt theo cách các nhà ngôn ngữ đã phân tích, mà chúng tôi đưa ra khái niệm văn phạm tiếng Việt như là quan hệ trước sau của các từ tiếng Việt. Các từ ở đây có thể hiểu như là từ đơn hay từ chỉ có một tiếng. Do đó nó chỉ được dùng cho nhận dạng tiếng Việt mà không phải được dùng cho các mục đích khác như hiểu ngôn ngữ hoặc biên dịch.
Có một số quan điểm cho rằng khái niệm văn phạm mà chúng tôi áp dụng trong quá trình nghiên cứu gần giống với mô hình ngôn ngữ (language model). Chúng tôi cũng đồng ý với quan điểm đó theo một cách hiểu nào đó (vì dụ như văn phạm và mô hình ngôn ngữ đều có thể biểu diễn bằng mạng lưới từ). Nhưng chúng tôi nhấn mạnh rằng văn phạm và mô hình ngôn ngữ không là một. Mô hình ngôn ngữ phản ánh mối quan hệ thống kê (không chắc chắn) giữa các từ trong khi văn phạm phản ánh mối quan hệ được xác lập trước giữa các từ. Và hơn nữa mô hình ngôn ngữ chỉ phản ánh mối quan hệ trước sau của các từ (theo cách hiểu nào đó mô hình ngôn ngữ chỉ là văn phạm chính quy) trong khi văn phạm có thể phản ánh mối quan hệ trước sau của các câu (ví dụ văn phạm phi ngữ cảnh).
Trong nghiên cứu của mình, chúng tôi không đưa ra một văn phạm hoàn chỉnh hay thống nhất cho tiếng Việt mà chúng tôi sẽ biên soạn các bộ văn phạm tiếng Việt khác nhau khi triển khai để nhận dạng trong các ứng dụng khác nhau. Ví dụ như văn phạm dùng để ra các mệnh lệnh cho hệ thống khác với văn phạm để soạn thảo. Văn phạm dùng để hỏi đáp với hệ chuyên gia khác với văn phạm truy vấn cơ sở dữ liệu.
*s = n vp; n = tôi | nó; vp = v pl;
v = đi | ra; pl = chợ | chơi;
Bảng 4-3. Ví dụ về văn phạm tiếng Việt
Văn phạm mà chúng tôi quan tâm nghiên cứu là văn phạm mô tả tập mệnh lệnh. Vì tập mệnh lệnh là những câu nói đơn giản và hay được người dùng sử dụng để ra lệnh cũng như hỏi thông tin với máy.
Cũng giống như ngữ âm, văn phạm cũng đặc trưng cho các miền ngôn ngữ hay các phương ngữ. Đây cũng là một trong những lý do mà chúng tôi không đưa ra một bộ văn phạm hoàn chỉnh.