Các thành phần trong hệ thống

Một phần của tài liệu Hệ thống trả lời tự động tiếng việt cho công tác tuyển sinh báo cáo nghiên cứu khoa học giáo viên (Trang 59 - 62)

Trong thành phần xử lý bao gồm nhiều công đoạn con từ việc tiền xử lý câu hỏi đến việc nhận kết quả truy vấn CSDL và hiển thị lên thành phần giao diện. Việc xây dựng hệ thống chính là việc đi hoàn thiện từng thành phần trên. Chúng ta sẽ tìm hiểu kỹ việc xây dựng từng thành phần trong các mục tiếp theo.

4.2 Thành phần dữ liệu

Dữ liệu của hệ thống được xây dựng trên hệ quản trị cơ sở dữ liệu SQL Server 2008.

Từ các thông tin cần truy vấn tác giả tiến hành xây dựng mô hình lưu trữ dữ liệu sau: Thành phần giao diện Thành phần xử lý Thành phần dữ liệu

Trong mô hình dữ liệu trên có thể đáp ứng được việc lưu trữ để trả lời các thông tin về trường, khoa, ngành, điểm chuẩn, chuẩn đầu ra, khối thi, ...

4.3 Thành phần xử lý

Đây chính là thành phần quan trọng nhất của một hệ thống xử lý ngôn ngữ tự nhiên. Bao gồm các công đoạn sau:

- Tiền xử lý câu hỏi.

- Phân tích cú pháp của câu.

- Tổng hợp dữ liệu để truy vấn CSDL.

- Xử lý kết quả trả lời.

Hình 4.3 Mô hình quy trình xử lý công việc của hệ thống.

4.3.1 Tiền xử lý câu hỏi

Đây là công đoạn gọt dũa câu hỏi nhằm loại bỏ các ký tự thừa, loại bỏ các dấu câu không cần thiết và chuyển các ký tự trong câu về ký tự thường.

Mặt khác, các câu hỏi trong đề tài được mô tả cú pháp dựa trên văn phạm DCG sử dụng trong ngôn ngữ lập trình Prolog. Khi triển khai trong thực tế thì gặp vấn đề về mặt kỹ thuật, đó là gói công cụ cho phép tích hợp Prolog vào trong môi trường .NET hiện chưa hỗ trợ tiếng Việt. Do đó cần chuyển các từ

Xử lý kết quả trả lời Tiền xử lý Phân tích câu hỏi Tổng hợp dữ liệu

Câu hỏi Câu hỏi

“chuẩn”

Cây truy vấn

Kết quả truy vấn

tiếng Việt về dạng mã phù hợp có thể xử lý được trên các môi trường khác nhau.

Một phần của tài liệu Hệ thống trả lời tự động tiếng việt cho công tác tuyển sinh báo cáo nghiên cứu khoa học giáo viên (Trang 59 - 62)