Các hệ thống so khớp mẫu

Một số hệ thống NLIDB đầu tiên dựa vào kỹ thuật so khớp mẫu để trả lời câu hỏi của người sử dụng. Để minh họa một cách tiếp cận so khớp mẫu đơn giản, chúng ta xét một bảng cơ sở dữ liệu chứa đựng thông tin về các quốc gia sau đây:

Countries table

Country Capital Language

France Paris French

Italy Rome Italian

… … …

Một hệ thống so khớp mẫu nguyên thủy có thể sử dụng luật sau: Mẫu: … “capital” … <country>

Hành động: Trả về Capital của hàng mà Country = <country> Mẫu: . . . “capital” . . . “country”

Luật đầu tiên có nghĩa là: nếu câu hỏi của người sử dụng chứa đựng từ

“capital” được theo sau bởi tên của một quốc gia (một cái tên xuất hiện trong cột Country) thì hệ thống xác định vị trí cột chứa đựng tên quốc gia đó và đưa ra tên thủ

đô tương ứng.

Cho ví dụ, với câu hỏi: “What is the capital of Italy?”, hệ thống sẽ sử dụng luật đầu tiên và trả về kết quả là “Rome”. Một luật có thể cho phép hệ thống xử lý nhiều

câu hỏi như: “Print the capital of Italy”, “Could you please tell me what is the capital

of Italy?”, … Trong tất cả các trường hợp đó, câu trả lời được sinh ra là như nhau.

Theo luật thứ hai, bất kỳ câu hỏi của người sử dụng chứa đựng từ “capital”

được theo sau bởi từ “country” hệ thống sẽ trả về tên thủ đô của tất cả các quốc gia có trong cơ sở dữ liệu.

Ví dụ, “what is the capital of each country?”, “List the capital of every country?”, “Captial and country please.”, … sẽ được xử lý bởi luật thứ hai.

Lợi thế chính của hướng tiếp cận so khớp mẫu là tính đơn giản của nó và hệ thống có thể dễ dàng thực thi. Ngoài ra, một số hệ thống so khớp mẫu thường thành công trong việc đưa ra một câu trả lời hợp lý. Các hệ thống so khớp mẫu không nhất thiết phải dựa trên các kỹ thuật đơn giản như được trình bày phía trên. Một số hệ thống so khớp mẫu có khả năng thực hiện tốt trong những ứng dụng nhất định. Tuy nhiên tính chất không sâu của phương pháp so khớp mẫu thường dẫn tới những kết quả sai.

Các hệ thống dựa trên cú pháp

Trích chọn thông tin trong GATE