Xây dựng chức năng truy hồi thông tin theo thực thể có tên

Một phần của tài liệu TIỂU LUẬN PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Giải pháp tổ chức lưu trữ và xử lý tài liệu văn bản tiếng việt có ngữ nghĩa (Trang 27)

Từ khái tưởng quản lý tài liệu có ngữ nghĩa ta xây dựng chức năng thực hiện truy vấn trên cơ sở tri thức trong kho các tài liệu có chú thích ngữ nghĩa của chương trình. Đây là một số đề xuất về các cách thức truy vấn:

+ Dùng ngôn ngữ truy vấn của SesameSeRQL [Error! Reference source not

ound.]. Sesame thực chất giống như một hệ quản trị cơ sở dữ liệu tương tự MySQL hay

Oracle; và SeRQL là một ngôn ngữ truy vấn giống như SQL. Sự khác nhau là ở chỗ, Sesame cho phép ta quản lý cơ sở tri thức dựa trên các thực thể và quan hệ giữa chúng.

+ Dùng các mẫu truy vấn đã được xây dựng sẵn (dùng template). Với cách này, hệ thống sẽ cung cấp một số mẫu truy vấn thông dụng nhất, ví dụ như “tác giả X ở quốc gia Y”, … Người dùng sẽ chọn một mẫu phù hợp với yêu cầu, sau đó thay các chỗ trống bằng các thực thể cụ thể.

+ Dùng đồ thị khái niệm. Ý tưởng về đồ thị khái niệm đã được nhiều người đề cập tới trong lĩnh vực biểu diễn tri thức. Trong chương trình quản lý tài liệu có ngữ nghĩa, đồ thị khái niệm trở thành một công cụ quan trọng bởi vì nó biễu diễn theo một cách thức mà con người có thể hình dung được. Vì thế, ta sẽ xây dựng chức năng cung cấp một giao diện cho phép người dùng vẽ một đồ thị khái niệm và tiến hành truy vấn trên đó.

Đồ thị khái niệm là một cách biểu diễn hình thức rất gần với ngôn ngữ tự nhiên. Tuy nhiên, việc chuyển đổi tự động từ một câu ngôn ngữ tự nhiên thành đồ thị khái niệm lại không hề đơn giản. Trong khi đó, yêu cầu đặt ra cho việc giải quyết bài toán này là phải xây dựng được một đồ thị khái niệm hợp lệ. Điều kiện hợp lệ này là:

+ Tất cả các khái niệm cũng như quan hệ đều phải tồn tại trong ontology của hệ thống.

GIẢI PHÁP TỔ CHỨC LƢU TRỮ XỬ LÝ TÀI LIỆU TIẾNG VIỆT CÓ NGỮ NGHĨA 28 + Tất cả các quan hệ đều phải thỏa mãn các ràng buộc về miền của chủ thể (subject)khách thể (object). Các ràng buộc này cũng đã được định nghĩa trong ontology.

Điều này đặt ra một số giới hạn cho câu truy vấn đầu vào như sau:

+ Chỉ có thể truy vấn các khái niệm có trong ontology. Các câu truy vấn có khái niệm không được định nghĩa sẽ không cho kết quả .

+ Chỉ có thể truy vấn các quan hệ có trong ontology và thỏa mãn các ràng buộc. Trong quá trình xử lý, ở một số bước, do khả năng xử lý bị hạn chế ở một số điểm, nên câu truy vấn cũng vì vậy mà bị giới hạn theo.

Quá trình biến đổi câu truy vấn thành đồ thị khái niệm thực chất chính là quá trình tìm kiếm các thực thể trong câu truy vấn và xây dựng các mối quan hệ giữa chúng. Vì vậy, bài toán có thể được giải quyết theo ba bước sau đây:

+ Bước 1: Nhận diện các thực thể và từ quan hệ có trong câu truy vấn

+ Bước 2: Từ các thực thể và từ quan hệ đã nhận diện được, xây dựng khung sườn cho đồ thị khái niệm, nghĩa là phác họa trước đồ thị khái niệm kết quả sẽ có bao nhiêu khái niệm, bao nhiêu quan hệ, các khái niệm và quan hệ đó liên kết với nhau như thế nào. Sau bước này, ta sẽ có một đồ thị biễu diễn cấu trúc của câu truy vấn.

+ Bước 3: Từ các thông tin đã xây dựng được, bắt đầu điền các khái niệm và quan hệ vào đồ thị khái niệm đã xây dựng ở bước 2.

Một phần của tài liệu TIỂU LUẬN PHƯƠNG PHÁP LUẬN SÁNG TẠO KHOA HỌC Giải pháp tổ chức lưu trữ và xử lý tài liệu văn bản tiếng việt có ngữ nghĩa (Trang 27)

Tải bản đầy đủ (PDF)

(38 trang)