Câu hỏi định nghĩa (definition question)

Một phần của tài liệu Ứng dụng trích rút thông tin vào xây dựng hệ thống hỏi đáp từ tập dữ liệu dạng văn bản (Trang 25 - 27)

3. Khảo sát các phƣơng pháp phân tích câu hỏi cho các loại câu hỏi khác nhau

3.2.Câu hỏi định nghĩa (definition question)

Câu hỏi định nghĩa hỏi về định nghĩa hoặc mô tả về một điều, một khái niệm gì đó.

Các câu hỏi thƣờng gặp có dạng nhƣ “Máy tìm kiếm là gì”, “Định nghĩa khai phá dữ liệu”, “Bush là ai ?”…

Câu trả lời cho loại câu hỏi này rất đa dạng, rất nhiều đoạn văn bản ngắn có thể coi là câu trả lời chấp nhận đƣợc. Ví dụ với câu hỏi “Who is George W. Bush ?”thì các câu trả lời có thể là:

“… George W. Bush, the 43rd President of the United States…”

“George W. Bush defeated Democratic incumbent Ann Richards to become the 46th Governor of the State of Texas…”

……

Với loại câu hỏi định nghĩa, phƣơng pháp thƣờng hay đƣợc sử dụng là so khớp mẫu (pattern matching) [17].

Ví dụ về các mẫu câu hỏi và mẫu câu trả lời

Mẫu câu hỏi What <be> a <Q> ? <Q> là gì? Who <be> <Q> ? <Q> là ai?....

Mẫu trả lời <Q>, the <A> <Q> - <A>

<Q> (a <A>) <Q> - một loại <A> <Q> is a|the <A> <Q> là <A> …

Ƣu điểm: Có độ chính xác khá cao.

Nhƣợc điểm: Các mẫu khó có thể bao quát đƣợc hết các trƣờng hợp đa dạng của câu hỏi và câu trả lời.

3.3. Câu hỏi phức tạp, có ràng buộc về thời gian

Nhiều câu hỏi phức tạp đòi hỏi phải phát hiện ra các thuộc tính về thời gian hoặc thứ tự diễn ra của sự kiện. Ví dụ“Ai là tổng bí thƣ Đảng Cộng Sản Việt Nam trong chiến thắng lịch sử Điện Biên Phủ”.

24

Loại 1: Câu hỏi về một sự kiện đơn lẻ, không có biểu đạt về thời gian (temporal expressions)

“Đại học Công Nghệ thành lập khi nào ?”.

Loại 2: Câu hỏi về một sự kiện đơn lẻ, có biểu đạt về thời gian

“Đội tuyển nào của Đại học công nghệ tham dự cuộc thi ACM quốc tế năm 2009” Ràng buộc thời gian: năm 2009.

Loại 3: Câu hỏi có nhiều sự kiện, có biểu đạt về thời gian

“Việt Nam đạt đƣợc những thành tựu gì sau khi chính sách mở cửa năm 1987 đƣợc thông qua ? ”

Tín hiệu thời gian: sau khi

Ràng buộc thời gian: năm 1987

Loại 4: Câu hỏi có nhiều sự kiện, không có biểu đạt về thời gian “Dân số thế giới là bao nhiêu trƣớc chiến tranh thế giới thứ 2” Tín hiệu thời gian: trước

Các tín hiệu thời gian trong Tiếng Việt nhƣ: sau, sau khi, trƣớc, trƣớc khi, trong khi, khi, trong thời gian, …Các biểu đạt về thời gian là các từ về ngày, tháng, năm, thế kỉ,…

Phƣơng pháp xử lý: Gồm 4 bƣớc sau:

- Phân tích câu hỏi thành các các câu hỏi factual-base đơn giản hơn. “Dân số thế giới là bao nhiêu trƣớc chiến tranh thế giới thứ 2 ?” 1) “Dân số thế giới là bao nhiêu ?”

2) “Chiến tranh thế giới thứ 2 xảy ra khi nào ?” - Tìm câu trả lời cho câu hỏi thứ nhất

- Tìm câu trả lời cho câu hỏi thứ hai

- Đƣa ra câu trả lời mà vừa trả lời câu hỏi thứ nhất, vừa có giá trị thời gian thích hợp với câu trả lời cho câu hỏi thứ hai. (adsbygoogle = window.adsbygoogle || []).push({});

25

Một phần của tài liệu Ứng dụng trích rút thông tin vào xây dựng hệ thống hỏi đáp từ tập dữ liệu dạng văn bản (Trang 25 - 27)