Phát triển dịch vụ truy hồi tri thức và tài liệu

Một phần của tài liệu Nghiên cứu phát triển các kỹ thuật xây dựng và khai thác thông tin web có ngữ nghĩa (Trang 127 - 130)

VOKBService

Dịch vụ truy hồi tri thức VOKBService cần đáp ứng được các yêu cầu sau:

1. Được hiện thực theo cơ chế đa luồng nhằm tăng khả năng đáp ứng đồng thời nhiều khách hàng truy vấn cơ sở tri thức.

Quản lý kết nối

Điều khiển trungtâm Giao

diện đồ họa

Hiển thị Ontology

Xây dựng nội

dung

Module chuyển mã

Module rút trích văn

bản tin tức

Module chú thích ngữ nghĩa

2. Cần phải hiểu giao thức HTTP để người dùng giao tiếp với VN-KIM theo giao thức này.

3. Không làm thay đổi thư viện hàm của Sesame khi VOKBService được triển khai.

Để thoả mãn các yêu cầu trên, chúng tôi phát triển VOKBService dưới dạng tập các Java Servlet và mỗi Servlet này sẽ được ánh xạ đến các địa chỉ giống với cấu hình của các Servlet trên Sesame. VOKBService sẽ vừa tiếp nhận truy vấn từ khách hàng, chuyển truy vấn này đến một Sesame đích để xử lý, rồi chuyển kết quả trả về từ Sesame cho khách hàng. Mặc khác, VOKBService cần phải điều khiển số lượng truy vấn gửi đến các Sesame đích trong mức tải cho phép. Hình 6.3.1 minh họa quá trình tiếp nhận và xử lý yêu cầu truy vấn cơ sở tri thức. Khi có yêu cầu từ khách hàng, VOKBService sẽ lấy thông tin từ VOIService và thực hiện giải thuật phân tải trình bày ở Hình 6.3.2, theo chiến lược Round-Robin trên S-Server, để chuyển yêu cầu này đến một máy Sesame thích hợp nhất.

Dịch vụ VOKBService hiện tại đã có thể hỗ trợ tất cả các hàm trong thư viện của Sesame API phiên bản 1.0.3 đã được mở rộng cho truy vấn gần đúng, bao gồm các lớp chính sau:

1. Config: đọc và ghi các thông số cấu hình.

2. LoginServlet: lưu thông tin tài khoản người dùng vào phiên người dùng.

3. LogoutServlet: giải phóng tất cả tài nguyên đã dùng cho phiên người dùng.

4. GraphQueryServlet: nhận câu truy vấn SeRQL rồi tìm một Sesame để xử lý trả về kết quả cho khách hàng.

5. TableQueryServlet: tương tự như GraphQueryServlet nhưng trả kết quả về dưới dạng bảng dữ liệu.

6. SesameServlet: là một Java Servlet giống trong thư viện Sesame API.

7. FuzzyMatchingQueryServlet: tương tự GraphQueryServlet nhưng tìm kiếm gần đúng.

8. ListRepositoriesServlet: cho phép khách hàng liệt kê tất cả các kho tri thức hiện có trên một máy Sesame.

Hình 6.3.1 Quá trình tiếp nhận và xử lý yêu cầu truy hồi tri thức

Bước 1: Khách hàng khởi tạo cầu nối HTTP đến dịch vụ VOKBService.

Bước 2: Khách hàng gọi hàm API của Sesame API để đăng nhập.

Bước 3: Khách hàng gọi hàm để gửi một câu truy vấn SeRQL truy vấn KB.

Bước 4: GraphQueryServlet nhận vào câu truy vấn và tìm một máy Sesame còn khả năng xử lý.

Bước 5: Dịch vụ VOIService được gọi để trả về địa chỉ của máy Sesame thích hợp.

Hình 6.3.2 Giải thuật phân tải truy vấn cơ sở tri thức

Client VOKBService VOIService Sesame

Service

setKBUrl( KBUrl )

Lấy thông tin tải Sesame API

Stub new

login( user, pass )

login( user, pass )

Lưu tên repository A Lưu thông tin vào

Http session setRepository( A )

setRepository( A )

performQueryGraph( se_sql )

findBestKBServic openConnection( ) Login( r_user, r_pass ) setRepository( A

queryGraph( se_sql ) logout()

Authen( user, pass )

VOLService

Dịch vụ VOLuceneService đón nhận các yêu cầu tìm tài liệu theo giao thức HTTP và được hiện thực bằng nhiều đối tượng Java Servlet, thực hiện các chức năng như truy hồi các tài liệu có mã số mong muốn hoặc đếm số lượng kết quả cho mỗi dạng tài liệu, … Khi nhận được một yêu cầu tìm tài liệu từ phía khách hàng, VOLuceneService sẽ chọn một HTTPLuceneServer phù hợp trong toàn hệ thống rồi chuyển yêu cầu này cho nơi đó xử lý.

Khi có kết quả trả về từ HTTPLuceneServer, nó lại chuyển kết quả về lại cho phía khách hàng. VOLuceneService được thiết kế để có thể dễ dàng gắn thêm các chức năng mới khi cần. Hình 6.3.3 minh họa quá trình tiếp nhận và xử lý các yêu cầu truy hồi tài liệu.

Hình 6.3.3 Quá trình tiếp nhận và xử lý yêu cầu truy hồi tài liệu

Một phần của tài liệu Nghiên cứu phát triển các kỹ thuật xây dựng và khai thác thông tin web có ngữ nghĩa (Trang 127 - 130)

Tải bản đầy đủ (PDF)

(208 trang)