Ánh xạ Ontology cho câu hỏi đơn giản

Một phần của tài liệu phương pháp xây dựng hệ thống hỏi đáp tiếng việt dựa trên ontology (Trang 51 - 54)

Các câu hỏi sau khi được phân tích bởi thành phần xử lý câu hỏi ngôn ngữ tự nhiên [1], được xếp vào các loại tương ứng. Ở đây, trong mục này, chúng tôi mô tả đối với một số loại câu hỏi như ―NORMAL‖, ―UNKN_TERM‖, ―UNKN_REL‖, ―AFFIRM_NEG‖. Các câu hỏi được biểu diễn bởi một bộ ba quan hệ bậc hai giữa hai thuật ngữ, và bộ ba biểu diễn này là đầu vào cho ánh xạ Ontology. Nhưng tùy vào từng loại câu hỏi mà ánh xạ Ontology sẽ có cách tìm kiếm thuật ngữ thích hợp trong Ontology. Ánh xạ Ontology xử lý đối với các loại câu hỏi đơn giản này được mô tả như hình 4.5.

40

Hình 4.5. Tổng quan về ánh xạ Ontology đối với câu hỏi đơn giản

Trong mô hình tổng quan này (hình 4.5), cơ sở tri thức Ontology được lưu trữ trong Sesame Server. Ánh xạ Ontology lấy tất cả các thông tin về các khái niệm (mô tả các lớp), các đối tượng, và các thuộc tính mô tả quan hệ trong Ontology. Các thông tin này được sử dụng để so khớp với bộ ba đầu vào. Nếu quá trình so khớp không thành công thì ánh xạ Ontology sử dụng thuật toán khoảng cách xâu để tìm các khái niệm (hoặc các đối tượng, các quan hệ trong Ontology) tương tự với các thành phần trong bộ ba đầu vào. Nếu thuật toán khoảng cách xâu trả lại nhiều hơn một giá trị, tức là nhập nhằng xảy ra, thì ánh xạ Ontology yêu cầu tương tác với người dùng để lựa chọn thông tin thích hợp tương ứng với Ontology.

Với một đầu vào là bộ ba biểu diễn trung gian (quan hệ bậc hai giữa hai thuật ngữ) (hình 4.5), các thành phần của bộ ba được tiền xử lý và sử dụng tập từ đồng nghĩa để so khớp với các khái niệm (các lớp), các đối tượng và các quan hệ trong Ontology. Ánh xạ Ontology trước tiên sẽ so khớp các thuật ngữ để tìm kiếm thuật ngữ tương ứng trong Ontology. Các thuật ngữ có thể mang nội dung chỉ về một khái niệm hoặc một đối tượng cụ thể nào đó.

So khớp thông tin trong Ontology Tiền xử lý & tập từ đồng nghĩa

Tiền xử lý & tập từ đồng nghĩa So khớp thông tin trong Ontology

Thuật_ngữ_1

Thuật_ngữ_2

Tập quan hệ

So khớp thông tin trong Ontology

Tiền xử lý & tập từ đồng nghĩa Quan_hệ Bộ ba biểu diễn trung gian Thuật ngữ 1 Quan hệ Thuật ngữ 2

Thuật toán khoảng cách xâu

Tƣơng tác ngƣời dùng

41

Nếu việc so khớp không thành công, ánh xạ Ontology sử dụng thuật toán khoảng cách xâu để tìm các khái niệm (hoặc các đối tượng) tương tự trong Ontology. Nếu giá trị so sánh độ tương tự giữa hai khái niệm (hoặc giữa hai đối tượng) lớn hơn ngưỡng cho trước thì thuật toán trả lại khái niệm (hoặc đối tượng) tương ứng. Hoặc nếu thuật toán khoảng cách xâu trả lại nhiều hơn một kết quả, khi đó, nhập nhằng về nghĩa của các thuật ngữ vẫn xảy ra. Ví dụ, khi thuật toán khoảng cách xâu so sánh ―lớp khoa học máy tính‖ với các đối tượng trong Ontology. Khi ấy, sự nhập nhằng xảy ra khi kết quả của thuật toán trả lại đối tượng ―k50_khoa_học_máy_tính‖ là thực thể của lớp ―lớp‖ và đối tượng ―khoa_học_máy_tính‖ là đối tượng của lớp ―bộ_môn‖ trong Ontology. Lúc này, ánh xạ Ontology đưa ra yêu cầu tương tác với người dùng để lựa chọn thuật ngữ tương ứng. Sau khi người dùng phản hồi lại, hệ thống tìm được thuật ngữ cần thiết phù hợp với Ontology. Các thuật ngữ này chính là các thuật ngữ chỉ khái niệm biểu diễn một lớp trong Ontology, hoặc là các thuật ngữ chỉ đối tượng thuộc về một lớp nào đó trong Ontology.

Dựa vào các thuật ngữ vừa tìm được, ánh xạ Ontology tìm tất cả các quan hệ giữa hai thuật ngữ này. Sau đó, ánh xạ Ontology nếu so khớp quan hệ không thành công thì sử dụng thuật toán khoảng cách xâu để tìm quan hệ tương ứng. Nếu nhập nhằng về nghĩa xảy ra do thuật toán khoảng cách xâu trả lại nhiều hơn một kết quả, thì hệ thống đưa ra yêu cầu tương tác với người sử dụng. Sau bước này, ánh xạ Ontology tìm được quan hệ thích hợp giữa hai thuật ngữ trong Ontology. Nhưng tùy thuộc vào từng loại câu hỏi, chẳng hạn như câu hỏi ―UNKN_TERM‖ (thiếu thuật ngữ đầu tiên), có trường hợp tìm được mối quan hệ thông qua thuật toán khoảng cách xâu, nhưng cũng có trường hợp chính cụm từ miêu tả quan hệ trong câu lại là thuật ngữ chỉ khái niệm mô tả một lớp nào đó trong Ontology.

Chúng tôi sẽ đưa ra ví dụ cụ thể cho từng trường hợp để xem xét cách giải quyết của thành phần ánh xạ Ontology. Như vậy, kết thúc quá trình ánh xạ Ontology, hình thành bộ ba mô tả các khái niệm, đối tượng và quan hệ phù hợp với Ontology. Bộ ba mô tả này là đầu vào cho thành phần trích chọn câu trả lời đưa ra câu trả lời ngữ nghĩa tốt nhất có thể tới người dùng. Dưới đây, để miêu tả cách xử lý của hệ thống đối với thành phần ánh xạ Ontology, chúng tôi đưa ra một số ví dụ về từng loại câu hỏi và cách xử lý đối với chúng.

42

Một phần của tài liệu phương pháp xây dựng hệ thống hỏi đáp tiếng việt dựa trên ontology (Trang 51 - 54)

Tải bản đầy đủ (PDF)

(83 trang)