Chương 2. TIẾP CẬN WEB NGỮ NGHI ̃A TRONG
2.5. Tìm kiếm trong thƣ viê ̣n ngƣ̃ nghi ̃a
Tìm kiếm thông tin là dịch vụ cần phải có trong bất cứ hê ̣ thống thông tin nào, bởi vì đó là phương thức để truy cập thông tin. Chức năng tìm kiếm sẽ khai thác các thuộc tính và thể loại thông tin và các mối quan hệ giữa chúng. Sau khi người sử dụng mô tả loại tài liệu mà mình cần thông qua từ khóa hoặc các mô tả cơ bản về tài liê ̣u, hê ̣ thống sẽ tự động thực hiện tìm kiếm thông tin trong CSDL tài liệu và trả lại kết quả cho người dùng.
Hầu hết các hê ̣ thống thƣ viê ̣n đều h ỗ trợ việc tìm kiếm các siêu dữ liệu (các trường trong biểu ghi thư mu ̣c ). Với sự phát triển của các công nghê ̣ tìm kiếm , kĩ
thuâ ̣t tìm kiếm dựa trên nô ̣i dung tài liê ̣u đã được giới thiê ̣u, tuy nhiên chúng thường giới ha ̣n tr ong mô ̣t pha ̣m vi rất ha ̣n chế của các đi ̣nh da ̣ng tài liê ̣u (html, txt,...).
Trong pha ̣m vi của luâ ̣n văn này , chỉ đề cập đến việc tìm kiếm ngữ nghĩa trên các siêu dƣ̃ liê ̣u.
2.5.1. Tìm kiếm dựa trên sự phân loại
Cách tìm kiếm nà y dƣ̣a trên sƣ̣ phân loa ̣i tài liê ̣u theo phân loa ̣i Bản thể luâ ̣n (đề cập 2.3.3). Bằng cách duyê ̣t các mu ̣c, các lớp người dùng có thể không cần nhập thông tin mà vẫn có kết quả.
Ví dụ người dùng muốn tìm các tài liệu trong l ĩnh vực Giải tích có thể duyệt theo thƣ́ tƣ̣ sau : Lĩnh vực Khoa ho ̣c Tƣ̣ nhiên Toán Học Toán học Sơ Cấp
Giải tích.
2.5.2. Tìm kiếm ngữ nghĩa
Cách tìm kiếm phổ biến và thông dụng nhất hiê ̣n nay là cách tìm kiếm theo tƣ̀
khóa, hê ̣ thống sẽ lo ̣c ra các tài liê ̣u có các thông tin chính xác hoă ̣c gần chính xác với tƣ̀ khóa . Trong cách thƣ viê ̣n ngƣ̃ nghĩa , các từ khóa sẽ đƣợc kết hợp với các điều kiê ̣n ngƣ̃ nghĩa nhƣ: Tác giả, Ngôn ngƣ̃, Nhà xuất bản, Thể loa ̣i,...
Người dùng nhâ ̣p vào câu truy vấn (bao gồm từ khóa và thông tin ngữ nghĩa ), hê ̣ thống sẽ phân tích câu truy vấn từ ngôn ngữ tự nhiên (quá trình xử lí ngôn ngữ tự
nhiên), chuyển chúng sang dạng ngôn ngƣ̃ truy vấn RDF (chẳng hạn SPARQL). Hệ
thống sẽ dùng câu truy vấn RDF để tìm các kết quả tương ứng trong kho tài nguyên . Kết quả trả về đươ ̣c mô tả dưới da ̣ng XML, giao diê ̣n hê ̣ thông sẽ phân tích các tê ̣p tin XML và hiển thi ̣ cho người dùng.
Nh p truy v n
Câu truy v n d i ng ngôn ng truy v n RDF
X truy v n
Hi n t k t qu
T i nguyên d i ng XML
n th lu n
c siêu d li u ơ s d li u
Hình 2.7. Quá trình tìm kiếm trong thƣ viện số ngữ nghĩa
Trong thƣ viê ̣n số ngƣ̃ nghĩa , tài nguyên RDF có thể đƣợc chia sẻ , vì thế khi các thư viện đ ược liên kết với nhau , người dùng chỉ cần truy câ ̣p vào mô ̣t thư viê ̣n , nếu tài liê ̣u không có trong CSDL nô ̣i ta ̣i, hê ̣ thống sẽ tìm trong các thƣ viê ̣n khác.
`
GET [Vocaburary URI]
Accept: application/rdf+xml
303 See Other Location [RDF ContentLocation]
200 OK RDF GET [Vocaburary URI]
Accept: application/rdf+xml
Server
Server Client
Hình 2.8. Quá trình chia sẻ dữ liệu RDF
Các giao thƣ́c sƣ̉ du ̣ng trong viê ̣c chia sẻ dƣ̃ liê ̣u có thể sƣ̉ du ̣ng các giao thƣ́c thông thường mà không cần phải cải tiến thêm như : Dienst, Z39.50, OAI-PMH, các giao thƣ́c P2P (ALVIS, OCKHAM, HyperCuP), v.v...
Kết luận
Trong chương này , đề cập đến một cách tiếp cận mới trong việc xây dựng hệ
thống lưu trữ các tài liê ̣u số đó là thư viê ̣n số ngữ nghĩa . Thư viê ̣n số ngữ nghĩa là
sƣ̣ mở rô ̣ng của thƣ viê ̣n số và kết hợp với công nghê ̣ Web 2.0 và web ngữ nghĩa . Thƣ viê ̣n số ngƣ̃ nghĩa đã khắc phu ̣c nhƣ̃ng ha ̣n chế của thƣ viê ̣n số hiê ̣n ta ̣i : quản lí các tài nguyên một cách hiệu quả hơn , khắc phu ̣c những ha ̣n chế của các phương pháp tìm kiếm thông thường, kết hơ ̣p đươ ̣c với các nguồn tài nguyên khác nhau.
Cũng giống nhƣ web ngữ nghĩa , Bản thể luận đóng vai trò không thể thiếu đươ ̣c trong thư viê ̣n số ngữ nghĩa. Bản thể luận làm cơ sở cho việc phân loại tri thức trong thƣ viê ̣n số, hỗ trơ ̣ quá trình suy diễn trong tìm kiếm ngữ nghĩa. Xây dƣ̣ng bản thể luâ ̣n cho các biểu ghi thư mu ̣c là bước cơ bản trong xây dựng thư viê ̣n số ngữ
nghĩa.