Xác định loại quan hệ giữa các thực thể

Một phần của tài liệu LUẬN văn VN KIM SEARCH TIẾNG ANH với TRUY vấn có LIÊN từ LUẬN lý, TÍNH từ và LƯỢNG từ (Trang 42 - 45)

Theo nghiên cứu [2], bước này xác định quan hệ ngữ nghĩa của các cặp thực thể dựa trên từ

quan hệ, ta gọi bộ ba này là bộ ba truy vấn <thực thể, từ quan hệ, thực thể>.

Trước hết, ta phải xác định được bộ ba, rồi mới tìm quan hệ ngữ nghĩa của bộba đó.

Xem xét vị trí của từ quan hệđối với cặp thực thể trong câu truy vấn: ví dụ với “Where is the

location of the Orange Bowl?”, từ quan hệ of nằm giữa hai thực thể là location và Orange Bowl.

Còn với câu truy vấn “What state is the Filenes store located in?”, từ quan hệ in biểu diễn mối quan hệ LOCATEDIN giữa thực thể state và thực thể Filenes store nằm ở sau thực thể Filenes store. Và trong câu “In what country is Angkor Wat?” từ quan hệ in nằm ởtrước thực thể country

dùng để biểu diễn mối quan hệ LOCATEDIN giữa thực thể country và thực thể Angkor Wat. Như

vậy, từ quan hệ dùng để biểu diễn mối quan hệ giữa 2 thực thể có thể nằm ở giữa, ở sau hoặc ở trước 2 thực thể. Nhận định từ tập mẫu, thì từ quan hệ xuất hiện nhiều nhất là ở giữa 2 thực thể.

Do đó, để hình thành nên các bộ ba truy vấn <thực thể, từ quan hệ, thực thể>, độưu tiên sẽ là vị

trí của từ quan hệđối với vị trí của 2 thực thể. Ưu tiên nhất là từ quan hệ nằm giữa 2 thực thể, kế

tiếp là từ quan hệ nằm sau 2 thực thể và cuối cùng là từ quan hệ sẽ nằm trước 2 thực thể.

Sau khi đã xác định được bộ ba, việc xác định quan hệ ngữ nghĩa được làm bằng cách ứng với mỗi bộ ba <thực thể, từ quan hệ, thực thể>, ta sẽ đối chiếu với Ontology để ánh xạ thành <thực thể, kiểu quan hệ, thực thể>. Việc ánh xạnày được hiện thực qua giải pháp dùng heuristic (tập luật) và lập từ điển quan hệ (rút trích từ Ontology). Quá trình ánh xạ được tác giả [3] khái quát bằng lược đồnhư sau:

Hình 4-3 Lược đồ ánh xạ kiểu quan hệ của bộ ba truy vấn [3]

Chi tiết cho lược đồtrên được diễn dịch như sau:

 Xét mối quan hệ có dạng [C1, S1] – RW – [C2, S2] với: - RW là từ quan hệ,

- C1 và C2 lần lượt là lớp của thực thể thứ nhất và thứ hai,

- S1 và S2 lần lượt là giá trị chuỗi ban đầu của thực thể thứ nhất và thứ hai.

- Ánh xạ từ quan hệ RW thành tập quan hệ R1 – tập những quan hệ có thể tương ứng với từ quan hệ RW. Ví dụ từ quan hệ “’s” tương ứng với tập các quan hệ

{HASWIFE, HASSON, HASCAPITAL, …}

- Ánh xạ từ quan hệ (C1, C2) thành quan hệ R2 - tập những quan hệ có thể có giữa C1 và C2. Ví dụ giữa hai lớp (PERSON, PERSON) ta có tập các quan hệ sau: {HASWIFE, HASFATHER, HASMOTHER, …}

- Ánh xạ (S1, RW) thành R3 - tập những quan hệ có thể có nếu biết từ quan hệ RW và giá trị chuỗi ban đầu S1. Ví dụ với (wife, ’s) sẽđược ánh xạ thành tập quan hệ

{HASWIFE}.

- Ánh xạ (RW, S2) thành R4 - tập những quan hệ có thể có nếu biết từ quan hệ RW và giá trị chuỗi ban đầu S2. Ví dụ với (has, mother) sẽ được ánh xạ thành tập quan hệ {HASMOTHER}

 Ta có thể dễ dàng nhận thấy R3, R4 đều là tập con của R2. Gọi R là mối quan hệ thật sự

của từ quan hệ RW. Chắc chắn R  R1  R2. Ngoài ra, trong một sốtrường hợp, có thể

R  R1  R3 hoặc R  R1  R4 hoặc R sẽ thuộc giao của cả bốn tập hợp trên. Như vậy, về lý thuyết ta có thểxác định được quan hệ R nếu xây dựng đầy đủ cả bốn tập hợp trên.

 Việc xây dựng tập ánh xạ R3 và R4 được thực hiện bằng hệ thống luật. Chi tiết về hệ

thống luật sẽđược trình bày ởchương 5.

Dựa vào các phân tích trên, giải thuật xác định kiểu quan hệ giữa hai thực thể trong câu truy vấn như sau [2] :

Hình 4-4 Xác định loại quan hệ giữa hai thực thể ei và ej [2]

 Bước 1: Xét các từ quan hệ nằm giữa ei và ej. Bằng việc sử dụng tập luật và từđiển, nếu có từ quan hệ nào khi kết hợp với ei và ej xác định được kiểu quan hệ giữa ei và ej thì quá trình dừng, ngược lại qua Bước 2.

 Bước 2: Xét các từ quan hệ nằm ở sau ei và ej, tương tựnhư Bước 1, nếu không xác định

được kiểu quan hệ giữa ei và ej thì qua Bước 3.

 Bước 3: Xét các từ quan hệ nằm trước ei và ej.

Bằng giải thuật trên, chúng ta xác định được kiểu quan hệ (nếu có) giữa hai thực thể ei và ej. Quá trình được áp dụng tương tự cho tất cả các cặp thực thể trong câu truy vấn. Các loại quan hệ

tìm được sẽđược thêm vào một danh sách quan hệ.

Một phần của tài liệu LUẬN văn VN KIM SEARCH TIẾNG ANH với TRUY vấn có LIÊN từ LUẬN lý, TÍNH từ và LƯỢNG từ (Trang 42 - 45)

Tải bản đầy đủ (PDF)

(74 trang)