Thành phần xử lý ngôn ngữ tự nhiên [1], phân các câu hỏi vào các loại cụ thể. Phân loại câu hỏi cung cấp những ràng buộc ngữ nghĩa cho câu trả lời mong muốn, và cung cấp thông tin để ánh xạ Ontology dựa vào đó hình thành nên các bộ ba mô tả, cũng như để hệ thống tạo câu trả lời ngữ nghĩa tốt nhất có thể cho câu hỏi. Các câu hỏi được phân loại như sau:
NORMAL: câu hỏi có bộ ba biểu diễn trung gian là quan hệ bậc hai giữa hai khái niệm và đủ cả ba thành phần. Ví dụ:
―sinh viên nào học lớp k50 khoa học máy tính?‖ → (sinh viên, học, lớp k50 khoa học máy tính).
UNKN_TERM: câu hỏi có bộ ba biểu diễn trung gian là quan hệ bậc hai giữa hai khái niệm, nhưng thiếu thuật ngữ đầu. Ví dụ:
―mã sinh viên của Nguyễn Quốc Đại là gì?‖ → (?, mã sinh viên, Nguyễn Quốc Đại).
UNKN_REL: câu hỏi có bộ ba biểu diễn trung gian là quan hệ bậc hai nhưng thiếu quan hệ giữa hai thuật ngữ. Ví dụ:
―lớp khoa học máy tính có những sinh viên nào?‖ → (lớp khoa học máy tính, ?, sinh viên).
AFFIRM_NEG: đây là các câu hỏi dạng đúng – sai. Ví dụ:
―Nguyễn Quốc Đại có quê là Hà Nội phải không?‖ → (Nguyễn Quốc Đạt, có quê, Hà Nội)
THREETERM: đây là loại câu hỏi phức tạp, câu hỏi có biểu diễn bộ ba quan hệ bậc ba giữa ba thuật ngữ (thuật ngữ 1, quan hệ, thuật ngữ 2, thuật ngữ 3). Tùy vào từng câu hỏi, bộ ba này có thể đầy đủ thành phần, hoặc thiếu quan hệ, hoặc thiếu thuật ngữ thứ nhất.
33 Ví dụ:
―sinh viên nào học ở lớp khoa học máy tính của trường đại học công nghệ?‖ → (sinh viên, học, lớp khoa học máy tính, trường đại học công nghệ)
―trường của Nguyễn Quốc Đại của Nguyễn Quốc Đạt là gì?‖ → (?, trường, Nguyễn Quốc Đại, Nguyễn quốc Đạt).
Trên đây là các loại câu hỏi mà chúng tôi đưa ra để hỏi hệ thống này. Sau khi chúng tôi thiết kế xong Ontology (phần 4.3), chúng tôi đưa ra tổng quan về thành phần ánh xạ Ontology và trích chọn câu trả lời (mục 4.4, 4.5) dựa trên các loại câu hỏi nêu trên. Từ đó, chúng tôi đánh giá hệ thống cho các câu hỏi được hỏi.
34