Cách tìm kiếm phổ biến và thông dụng nhất hiện nay là cách tìm kiếm theo từ khóa, hệ thống sẽ lọc ra các tài liệu có các thông tin chính xác hoặc gần chính xác với từ khóa. Trong cách thư viện ngữ nghĩa, các từ khóa sẽ được kết hợp với các điều kiện ngữ nghĩa như: Tác giả, Ngôn ngữ, Nhà xuất bản, Thể loại,...
Người dùng nhập vào câu truy vấn (bao gồm từ khóa và thông tin ngữ nghĩa), hệ thống sẽ phân tích câu truy vấn từ ngôn ngữ tự nhiên (quá trình xử lí ngôn ngữ tự nhiên), chuyển chúng sang dạng ngôn ngữ truy vấn RDF (chẳng hạn SPARQL). Hệ
39
thống sẽ dùng câu truy vấn RDF để tìm các kết quả tương ứng trong kho tài nguyên . Kết quả trả về được mô tả dưới dạng XML, giao diện hệ thông sẽ phân tích các tệp tin XML và hiển thị cho người dùng.
Hình 2.7. Quá trình tìm kiếm trong thư viện số ngữ nghĩa
Trong thư viện số ngữ nghĩa, tài nguyên RDF có thể được chia sẻ, vì thế khi các thư viện được liên kết với nhau, người dùng chỉ cần truy cập vào một thư viện, nếu tài liệu không có trong CSDL nội tại, hệ thống sẽ tìm trong các thư viện khác.
40
Hình 2.8. Quá trình chia sẻ dữ liệu RDF
Các giao thức sử dụng trong việc chia sẻ dữ liệu có thể sử dụng các giao thức thông thường mà không cần phải cải tiến thêm như: Dienst, Z39.50, OAI-PMH, các giao thức P2P (ALVIS, OCKHAM, HyperCuP), v.v...
Kết luận
Trong chương này, đề cập đến một cách tiếp cận mới trong việc xây dựng hệ thống lưu trữ các tài liệu số đó là thư viện số ngữ nghĩa. Thư viện số ngữ nghĩa là sự mở rộng của thư viện số và kết hợp với công nghệ Web 2.0 và web ngữ nghĩa. Thư viện số ngữ nghĩa đã khắc phục những hạn chế của thư viện số hiện tại: quản lí các tài nguyên một cách hiệu quả hơn, khắc phục những hạn chế của các phương pháp tìm kiếm thông thường, kết hợp được với các nguồn tài nguyên khác nhau.
Cũng giống như web ngữ nghĩa, Bản thể luận đóng vai trò không thể thiếu được trong thư viện số ngữ nghĩa. Bản thể luận làm cơ sở cho việc phân loại tri thức trong thư viện số, hỗ trợ quá trình suy diễn trong tìm kiếm ngữ nghĩa. Xây dựng bản thể luận cho các biểu ghi thư mục là bước cơ bản trong xây dựng thư viện số ngữ nghĩa.
41
Chương 3. Xây dựng thư viện số ngữ nghĩa dựa trên phần mềm JeromeDL