Hiện nay có nhiều giải pháp về phần mềm khác nhau để xây dựng một hệ thống lưới. Các giải pháp này tuy có nhiều điểm khác nhau về mặt kỹ thuật nhưng tương đối thống nhất về cấu trúc cơ bản của hệ thống. Điều này giúp cho việc hợp tác giữa các hệ thống lưới trong tương lai có thể trở nên dễ dàng hơn.
Khóa luận xin giới thiệu vắn tắt cấu trúc một hệ thống lưới ở mức tổng quan và cơ bản nhất, được đề xuất bởi IBM [4]. Hình 7 mô tả kiến trúc của một hệ thống lưới ở mức khái niệm, không quá đi sâu vào mặt chi tiết của từng thành phần:
Portal Broker Sheduler MDS directory Service GASS Data mgmt Gram job mgmt
Excute job, get status /result
38 -
-
-
Cổng giao tiếp (Portal): Cấu trúc hệ thống bên dưới được che giấu (trong suốt) đối với người dùng. Người dùng sẽ sử dụng hệ thống thông qua các ngõ vào (portal), các portal sẽ cung cấp cho người dùng các công cụ để thực thi ứng dụng, điều khiển hệ thống dưới các hình thức khác nhau như giao diện dòng lệnh, giao diện web…
Thành phần bảo mật (GSI – Grid Security System): Thành phần này sẽ kiểm tra, chứng thực thông tin người dùng cũng như kiểm tra quyền hạn của người dùng khi thao tác với hệ thống. Thành phần này còn chịu trách nhiệm mã hóa dữ liệu trao đổi giữa người dùng và hệ thống nếu có nhu cầu.
Thành phần lưu trữ thông tin hệ thống: MDS (Monitoring and Discovery Service): còn có thể được gọi là GIS (Grid Information Service) trong các tài liệu khác. Hệ thống lưới là một hệ thống biến động, các tài nguyên nằm phân tán, có thể tham gia hay rời bỏ hệ thống một cách thường xuyên. MDS là nơi giữ thông tin và luôn cập nhật những thay đổi về hệ thống.
Thành phần giao tiếp (Broker): Khi người dùng thực thi một ứng dụng, hệ thống cần xác định tài nguyên tính toán nào phù hợp nhất để thực thi ứng dụng đó. Vai trò này sẽ do broker đảm nhận. Broker sẽ giao tiếp với MDS để lấy những thông tin của hệ thống, dựa vào các giải thuật được cài đặt sẵn để lựa chọn tài nguyên phù hợp.
Bộ lập lịch (Scheduler): Sau khi đã xác định được tài nguyên đảm nhận ứng dụng, ứng dụng cần được điều phối lên tài nguyên để thực thi vào thời điểm thích hợp. Một tài nguyên vào một thời điểm có thể đảm nhận nhiều ứng dụng, quá trình điều phối trên tài nguyên sẽ do scheduler quyết định. Ở nhiều hệ thống, scheduler không được đặt ở mức chung toàn hệ thống mà ở mỗi tài nguyên, tài nguyên có chính sách riêng và tự quyết định hoạt động của mình.
GASS (Grid Access to Secondary Storage): Đảm trách nhiệm vụ vận chuyển ứng dụng và các dữ liệu cần thiết đến tài nguyên thực thi.
GRAM (Grid Resource Allocation Manager): Đảm nhận việc kích hoạt thực thi ứng dụng trên tài nguyên, kiểm tra trạng thái của ứng dụng (thất bại/thành công) và nhận kết quả trả về khi hoàn tất.
39