3.1.1. Tổng quan về tìm kiếm thông tin trong các hệ phân tán
Vấn đề tìm kiếm thông tin trong các nguồn rải rác đƣợc phân bố trên các máy chủ khác nhau trở lên đáng quan ngại khi số lƣợng cơ sở dữ liệu trong các mạng LAN và Internet. Mục tiêu của tìm kiếm thông tin phân tán (distributed information retrieval - DIR) là cung cấp một giao diện tìm kiếm đơn mà có thể cung cấp truy nhập đến các cơ sở dữ liệu khả dụng. Vấn đề này đã đƣợc biết đến nhƣ là tìm kiếm liên bang (federated search), bao gồm xây dựng các mô tả nguồn tài nguyên cho từng cơ sở dữ liệu, lựa chọn những cơ sở dữ liệu này để tìm kiếm cho thông tin riêng biệt và trộn các kết quả thu thập đƣợc vào một danh sách kết quả đơn. Một số ứng dụng tìm kiếm thông tin từ nhiều nguồn tài nguyên bao gồm: meta-search engine, distributed genomic search, newsletter gathering,...
Giả sử có m máy chủ thông tin, biểu diễn bởi nguồn Si với i=1...m; mỗi nguồn thông tin đƣợc tìm kiếm bởi các hệ thống thu thập thông tin riêng biệt (information retrieval system - IRS). Giả thiết rằng mỗi search engine sẽ sinh ra một danh sách kết quả thích hợp đối với truy vấn. Để cung cấp cho ngƣời sử dụng một danh sách các kết quả thích hợp thì từ danh sách các kết quả đƣợc sinh ra bởi các IRS phải đƣợc tích hợp lại. Hình 3.1 dƣới đây mô tả một cách tổng quát về hệ thống thu thập thông tin từ nhiều nguồn dữ liệu.
3.1.2. Kiến trúc tổng quan hệ thống tìm kiếm thông tin trong hệ đa tác tử
Kiến trúc hệ thống tìm kiếm thông tin trong hệ đa tác tử dựa trên nền tảng JADE. Hình 3.2 dƣới đây mô tả một kiểu kiến trúc hệ thống tìm kiếm thông tin trong hệ đa tác tử.
Hình 3.2 - Kiến trúc hệ thống tìm kiếm thông tin trong hệ đa tác tử
Ngƣời sử dụng: gửi truy vấn đến các tác tử tìm kiếm (Search Agent) và yêu cầu các tác tử tìm kiếm các thông tin từ các cơ sở dữ liệu (Database).
Broker Agent: Sau khi nhận truy vấn của ngƣời sử dụng, nó có nhiệm vụ chia sẻ quá trình cho các Search Agent. Broker Agent cũng có thể tạo Search Agent nếu cần.
Search Agent: Tác tử có nhiệm vụ tìm kiếm các thông tin từ các nguồn phân tán và sẽ trả về các kết quả tìm kiếm cho Response Agent.
Response Agent: Tác tử này có trách nhiệm hiển thị kết quả của thông tin thu thập đƣợc từ các Search Agent. Tác tử này sẽ đóng vai trò là trung gian để tích hợp thông tin sẽ đƣợc trình bày trong phần tích hợp thông tin ở mục 3.2.