Tìm kiếm trong thƣ viê ̣n ngƣ̃ nghi ̃a

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Ứng dụng Web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số (Trang 47 - 50)

Chương 2. TIẾP CẬN WEB NGỮ NGHI ̃A TRONG

2.5. Tìm kiếm trong thƣ viê ̣n ngƣ̃ nghi ̃a

Tìm kiếm thông tin là dịch vụ cần phải có trong bất cứ hê ̣ thống thông tin nào, bởi vì đó là phương thức để truy cập thông tin. Chức năng tìm kiếm sẽ khai thác các thuộc tính và thể loại thông tin và các mối quan hệ giữa chúng. Sau khi người sử dụng mô tả loại tài liệu mà mình cần thông qua từ khóa hoặc các mô tả cơ bản về tài liê ̣u, hê ̣ thống sẽ tự động thực hiện tìm kiếm thông tin trong CSDL tài liệu và trả lại kết quả cho người dùng.

Hầu hết các hê ̣ thống thƣ viê ̣n đều h ỗ trợ việc tìm kiếm các siêu dữ liệu (các trường trong biểu ghi thư mu ̣c ). Với sự phát triển của các công nghê ̣ tìm kiếm , kĩ

thuâ ̣t tìm kiếm dựa trên nô ̣i dung tài liê ̣u đã được giới thiê ̣u, tuy nhiên chúng thường giới ha ̣n tr ong mô ̣t pha ̣m vi rất ha ̣n chế của các đi ̣nh da ̣ng tài liê ̣u (html, txt,...).

Trong pha ̣m vi của luâ ̣n văn này , chỉ đề cập đến việc tìm kiếm ngữ nghĩa trên các siêu dƣ̃ liê ̣u.

2.5.1. Tìm kiếm dựa trên sự phân loại

Cách tìm kiếm nà y dƣ̣a trên sƣ̣ phân loa ̣i tài liê ̣u theo phân loa ̣i Bản thể luâ ̣n (đề cập 2.3.3). Bằng cách duyê ̣t các mu ̣c, các lớp người dùng có thể không cần nhập thông tin mà vẫn có kết quả.

Ví dụ người dùng muốn tìm các tài liệu trong l ĩnh vực Giải tích có thể duyệt theo thƣ́ tƣ̣ sau : Lĩnh vực Khoa ho ̣c Tƣ̣ nhiên Toán Học Toán học Sơ Cấp

Giải tích.

2.5.2. Tìm kiếm ngữ nghĩa

Cách tìm kiếm phổ biến và thông dụng nhất hiê ̣n nay là cách tìm kiếm theo tƣ̀

khóa, hê ̣ thống sẽ lo ̣c ra các tài liê ̣u có các thông tin chính xác hoă ̣c gần chính xác với tƣ̀ khóa . Trong cách thƣ viê ̣n ngƣ̃ nghĩa , các từ khóa sẽ đƣợc kết hợp với các điều kiê ̣n ngƣ̃ nghĩa nhƣ: Tác giả, Ngôn ngƣ̃, Nhà xuất bản, Thể loa ̣i,...

Người dùng nhâ ̣p vào câu truy vấn (bao gồm từ khóa và thông tin ngữ nghĩa ), hê ̣ thống sẽ phân tích câu truy vấn từ ngôn ngữ tự nhiên (quá trình xử lí ngôn ngữ tự

nhiên), chuyển chúng sang dạng ngôn ngƣ̃ truy vấn RDF (chẳng hạn SPARQL). Hệ

thống sẽ dùng câu truy vấn RDF để tìm các kết quả tương ứng trong kho tài nguyên . Kết quả trả về đươ ̣c mô tả dưới da ̣ng XML, giao diê ̣n hê ̣ thông sẽ phân tích các tê ̣p tin XML và hiển thi ̣ cho người dùng.

Nh p truy v n

Câu truy v n d i ng ngôn ng truy v n RDF

X truy v n

Hi n t k t qu

T i nguyên d i ng XML

n th lu n

c siêu d li u ơ s d li u

Hình 2.7. Quá trình tìm kiếm trong thƣ viện số ngữ nghĩa

Trong thƣ viê ̣n số ngƣ̃ nghĩa , tài nguyên RDF có thể đƣợc chia sẻ , vì thế khi các thư viện đ ược liên kết với nhau , người dùng chỉ cần truy câ ̣p vào mô ̣t thư viê ̣n , nếu tài liê ̣u không có trong CSDL nô ̣i ta ̣i, hê ̣ thống sẽ tìm trong các thƣ viê ̣n khác.

`

GET [Vocaburary URI]

Accept: application/rdf+xml

303 See Other Location [RDF ContentLocation]

200 OK RDF GET [Vocaburary URI]

Accept: application/rdf+xml

Server

Server Client

Hình 2.8. Quá trình chia sẻ dữ liệu RDF

Các giao thƣ́c sƣ̉ du ̣ng trong viê ̣c chia sẻ dƣ̃ liê ̣u có thể sƣ̉ du ̣ng các giao thƣ́c thông thường mà không cần phải cải tiến thêm như : Dienst, Z39.50, OAI-PMH, các giao thƣ́c P2P (ALVIS, OCKHAM, HyperCuP), v.v...

Kết luận

Trong chương này , đề cập đến một cách tiếp cận mới trong việc xây dựng hệ

thống lưu trữ các tài liê ̣u số đó là thư viê ̣n số ngữ nghĩa . Thư viê ̣n số ngữ nghĩa là

sƣ̣ mở rô ̣ng của thƣ viê ̣n số và kết hợp với công nghê ̣ Web 2.0 và web ngữ nghĩa . Thƣ viê ̣n số ngƣ̃ nghĩa đã khắc phu ̣c nhƣ̃ng ha ̣n chế của thƣ viê ̣n số hiê ̣n ta ̣i : quản lí các tài nguyên một cách hiệu quả hơn , khắc phu ̣c những ha ̣n chế của các phương pháp tìm kiếm thông thường, kết hơ ̣p đươ ̣c với các nguồn tài nguyên khác nhau.

Cũng giống nhƣ web ngữ nghĩa , Bản thể luận đóng vai trò không thể thiếu đươ ̣c trong thư viê ̣n số ngữ nghĩa. Bản thể luận làm cơ sở cho việc phân loại tri thức trong thƣ viê ̣n số, hỗ trơ ̣ quá trình suy diễn trong tìm kiếm ngữ nghĩa. Xây dƣ̣ng bản thể luâ ̣n cho các biểu ghi thư mu ̣c là bước cơ bản trong xây dựng thư viê ̣n số ngữ

nghĩa.

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Ứng dụng Web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số (Trang 47 - 50)

Tải bản đầy đủ (PDF)

(66 trang)