Xác định quan hệ giữa tính từ và thực thể

Một phần của tài liệu XỬ LÝ CÁC CÂU TRUY VẤN VÀ TÌM KIẾM TRÊN KHO TÀI LIỆU CÓ CHÚ THÍCH NGỮ NGHĨA BẰNG TIẾNG ANH (Trang 42 - 45)

Tại bước này, ta sẽ xét các liên kết giữa tính từ và thực thể, được gọi là một bộ hai <tính từ, thực thể>.

Xem xét câu truy vấn “What famous model was married to Billy Joel?”, tính từ famous nằm trước thực thể model. Đối với câu truy vấn “Name a tiger that is extinct?”, tính từ extinct nằm sau thực thể

tiger. Như vậy, tính từ liên kết với một thực thể cĩ thể nằm trước, hoặc nằm sau thực thể đĩ. Khi xem xét trên tập mẫu, tính từ xuất hiện nhiều nhất là ở trước thực thể. Do đĩ, để hình thành nên các bộ hai truy vấn <tính từ, thực thể>, độ ưu tiên sẽ được quyết định dựa vào vị trí của tính từđối với vị trí của

thực thể. Ưu tiên nhất là tính từ nằm trước thực thể, cuối cùng là tính từ nằm sau thực thể. Các bộ hai <tính từ, thực thể> sau đĩ sẽ được so trùng với Ontology để xác định kiểu quan hệ tương ứng cĩ trong Ontology.

Dựa vào các phân tích trên, đề tài đưa ra giải thuật xác định kiểu quan hệ giữa tính từ và thực thể trong câu truy vấn như sau (Hình 4.4):

Hình 4.0.7: Xác định loại quan hệ giữa tính từ adj và thực thể.

• Bước 1: Xét các thực thể nằm sau tính từ adj. Bằng việc sử dụng tập luật, nếu cĩ thực thể

ej nào khi kết hợp với adj mà xác định được kiểu quan hệ giữa adjej thì quá trình dừng, ngược lại qua Bước 2.

• Bước 2: Xét các thực thể ei nằm ở trước adj.

Bằng giải thuật trên, chúng ta xác định được kiểu quan hệ giữa tính từ adje nếu giữa chúng cĩ mối quan hệ với nhau trong ngữ cảnh của câu truy vấn. Quá trình được áp dụng tương tự cho tất cả các cặp tính từ, thực thể trong câu truy vấn. Các kiểu quan hệ tìm được sẽ được thêm vào danh sách quan hệ RELATION.

Việc xác định kiểu quan hệ được làm bằng cách ứng với mỗi bộ hai <tính từ, thực thể> ta sẽ ánh xạ thành <thực thể, kiểu quan hệ, thực thể>. Việc ánh xạ này cũng được thực hiện bằng giải pháp lập từ điển (Tập luật) và heuristic, tương tự quá trình ánh xạ bộ ba <thực thể, từ quan hệ, thực thể> thành <thực thể, kiểu quan hệ, thực thể> đã được trình bày tại Bước 4.1.9. Quá trình ánh xạ được khái quát bằng lược đồ Hình 4.5.

Hình 4.0.8: Lược đồ ánh xạ kiểu quan hệ giữa tính từ và thực thể.

Chi tiết cho lược đồ tại Hình 4.5 được diễn dịch như sau:

• Xét mối quan hệ cĩ dạng: [ADJ] – [E, S] với:

o ADJ là tính từ,

o E là lớp của thực thể liên kết với tính từ được xem xét.

o S là giá trị chuỗi ban đầu của thực thể E.

• Ta sẽ lần lượt xây dựng các ánh xạ sau đây:

o Ánh xạ tính từ ADJ thành tập R1 các bộ ba quan hệ <thực thể, kiểu quan hệ, thực thể>. Ví dụ, tính từ famous tương ứng với tập các bộ ba quan hệ {<FAMOUS_MODEL, SUBCLASSOF, MODEL>, <FAMOUS_PERSON, SUBCLASSOF, PERSON>, <FAMOUS_EVENT, SUBCLASSOF, EVENT>,}

o Ánh xạ (ADJ, E) thành tập R2 các bộ ba quan hệ <thực thể, kiểu quan hệ, thực thể> cĩ thể biểu diễn tính từ ADJ đối với thực thể E. Ví dụ, giữa tính từ famous và lớp

PERSON, ta cĩ thể cĩ các bộ ba sau: {<FAMOUS_MODEL, SUBCLASSOF, MODEL>, <FAMOUS_PERSON, SUBCLASSOF, PERSON>}

o Ánh xạ (ADJ, S) thành R3 - tập các bộ ba cĩ thể cĩ nếu biết tính từ ADJ và giá trị chuỗi ban đầu S. Ví dụ, (famous, model) sẽ được ánh xạ thành tập quan hệ {<FAMOUS_MODEL, SUBCLASSOF, MODEL>}

• Ta cĩ thể dễ dàng nhận thấy R2, R3 đều là tập con của R1. Gọi R là mối quan hệ thật sự biểu diễn bộ hai <tính từ, thực thể>. Chắc chắn R ∈ R1 ∩ R2∩ R3. Như vậy, về lý thuyết ta cĩ thể xác định được quan hệ R nếu xây dựng đầy đủ cả ba tập hợp trên.

• Việc xây dựng tập ánh xạ R1, R2 và R3 được thực hiện bằng hệ thống luật. Chúng ta sẽ đi vào chi tiết về hệ thống luật này ở phần sau.

Một phần của tài liệu XỬ LÝ CÁC CÂU TRUY VẤN VÀ TÌM KIẾM TRÊN KHO TÀI LIỆU CÓ CHÚ THÍCH NGỮ NGHĨA BẰNG TIẾNG ANH (Trang 42 - 45)