Với các chức năng đã trình bày của VN-KIM, mục tiêu thiết kế hệ thống máy chủ cho nó là nhằm:
1. Đảm bảo các ứng dụng Web có ngữ nghĩa phục vụ nhiều người dùng đồng thời.
2. Tạo ra kết quả trong thời gian trung bình thấp.
3. Tính sẵn sàng cao.
Chúng tôi đặt tên cho module xử lý song song trong VN-KIM là SWG, với các nút tính toán là các máy chủ mạnh, phân ra làm nhiều nhóm (Cluster), mỗi nhóm sẽ thực thi một loại quá trình chuyên biệt như là quá trình xử lý truy vấn cơ sở tri thức, quá trình chú thích các trang Web tiếng Việt, hoặc quá trình xử lý truy hồi tài liệu đã được chú thích, ...
Các hệ thống nhóm Unix/Linux là sự ghép nối của nhiều máy tính trạm và máy chủ lại với nhau thông qua mạng truyền tốc độ cao cỡ Gbits/sec ([7]). Trong đó mỗi nút (máy tính trạm hoặc máy chủ) chạy hệ điều hành Unix/Linux và các dịch vụ cần thiết khác như Network File System, … Hiện nay, các hệ thống nhóm dùng Unix/Linux này mang lại hiệu quả đầu tư cao hơn so với các máy tính cỡ lớn (Mainframe).
Hình 2.3 mô tả tổng quan kiến trúc của hệ thống SWG. Kiến trúc phần mềm của SWG được thiết kế theo mô hình hướng dịch vụ (Service-Oriented Architecture – SOA).
Lý do chọn kiến trúc phần mềm hướng dịch vụ là vì nó tiết kiệm được thời gian tích hợp và phát triển các module độc lập đồng thời. Hơn nữa trong công nghiệp, kiến trúc hướng dịch vụ được sử dụng rộng rãi trên các ứng dụng phân bố, như IBM Service-Oriented Architecture. Chúng tôi đã thử nghiệm thành công mô hình hướng dịch vụ này cho tính toán lưới (Grid Computing), bằng việc xây dựng các dịch vụ lưới (Grid Service) chạy trên môi trường Globus Toolkit phiên bản 3.2 để giải bài toán tìm kiếm tri thức theo ngữ nghĩa.
Hình 2.3 Kiến trúc của hệ thống máy chủ xử lý song song SWG cho VN-KIM
Về mặt phần mềm, SWG có bốn loại dịch vụ cài đặt ở máy chủ tiền trạm (Front-End) là:
Client Client Client Client
VOAService VOKBService VOLService
Annotation IS Sesame IS Lucence IS
SS 1 SS 2 SS 3
AS 1 AS 2 LS 1 LS 2
VOIService
1. Dịch vụ VOIService:
Cung cấp thông tin về các chương trình đang hoạt động trên các nhóm máy chủ xử lý yêu cầu của SWG cho các giải thuật cân bằng tải. Để tăng tính tái sử dụng, dịch vụ này có thể triển khai tại các máy tính toán trong nhóm để lấy các thông tin hệ thống như tải rảnh của CPU, số Mbyte trống trên bộ nhớ RAM, … 2. Dịch vụ VOAService:
Chịu trách nhiệm nhận yêu cầu chú thích ngữ nghĩa cho các trang web tiếng Việt, rồi tìm một chương trình chú thích đang hoạt động trên nhóm máy chủ chú thích trong hệ thống SWG. Sau đó chuyển yêu cầu chú thích này đến chương trình đó, rồi chờ nhận kết quả để chuyển tiếp về phía khách hàng (Client) đã yêu cầu chú giải.
3. Dịch vụ VOKBService:
Chịu trách nhiệm nhận yêu cầu truy vấn cơ sở tri thức từ phía khách hàng, rồi tìm kiếm một hệ quản trị cơ sở tri thức như Sesame đang hoạt động trên nhóm máy chủ quản trị cơ sở tri thức trong hệ thống SWG. Sau đó chuyển yêu cầu truy vấn này đến hệ quản trị cơ sở tri thức đó, rồi chờ nhận kết quả để chuyển tiếp về phía khách hàng đã yêu cầu truy xuất cơ sở tri thức.
4. Dịch vụ VOLService:
Chịu trách nhiệm nhận và trả lời yêu cầu truy xuất các tài liệu được lưu trữ trong một hệ quản trị tài liệu đã được chú thích ngữ nghĩa như Lucene từ phía khách hàng. Chức năng và cách hiện thực dịch vụ này tương tự như của dịch vụ VOKBService.
3 Tổng kết
Như mục tiêu chính đặt ra ban đầu, đề tài đã xây dựng được một nền tảng cho Web có ngữ nghĩa tiếng Việt, đủ để hiện thực một số ứng dụng tiêu biểu và có thể phát triển tiếp thành một cơ sở hạ tầng hoàn chỉnh. Kết quả bao gồm một cơ sở tri thức về các thực thể có tên phổ biến ở Việt Nam và trên thế giới, các phương pháp và phần mềm công cụ để thu thập, rút trích và truy hồi thông tin, và một mô hình xử lý song song có thể áp dụng cho một hệ thống với số máy chủ lớn. Một phần kết quả khoa học của đề tài đã được công bố trong các kỷ yếu hội nghị, tạp chí và sách xuất bản ở nước ngoài. Hệ thống VN-KIM của đề tài đã được triển khai và thử nghiệm ở công ty du lịch VYC và báo Người lao động, đạt được các chỉ tiêu về kỹ thuật và chức năng đề ra.
Về hiệu quả kinh tế xã hội, trong các trang Web thông tin và quảng cáo của các báo điện tử, công ty du lịch, doanh nghiệp, hay tổ chức chính phủ có rất nhiều các tên riêng về nhân vật, tổ chức, nơi chốn, ... mà người đọc muốn biết hoặc tìm hiểu thêm. VN-KIM tự động cung cấp thông tin về các đối tượng xuất hiện trong các trang Web tiếng Việt cho người đọc, mà không đòi hỏi việc soạn thảo trước các siêu liên kết từ chúng đến các nguồn tin. Điều này càng có ý nghĩa đối với hàng triệu trang Web tiếng Việt đang có sẵn, mà việc chú thích ngữ nghĩa bằng tay cho chúng có thể xem như là không khả thi vì sẽ mất rất nhiều thời gian, công sức, và chi phí. Các dịch vụ của VN-KIM được cung cấp một cách gọn nhẹ thông qua một Plug-in, và các cá nhân hoặc đơn vị có nhu cầu có thể sử dụng chúng dưới sự điều khiển quyền truy cập của hệ thống.