Hình 6: Các thành phần kiến trúc giám sát Grid- 123docz.net

diện producer (chấp nhận subscription, các truy vấn và khả năng thông báo). Trong một công cụ giám sát, mỗi cảm biến (sensor) được đóng gói trong một producer; tuy nhiên, một producer có thể được kết hợp với nhiều tài nguyên khác nhau; ví dụ các cảm biến, các hệ thống giám sát hoặc các cơ sở dữ liệu. Một consumer là một thành phần mà có thể nhận sự kiện từ một producer.Giao diện consumer chứa các tuyến subscription/unsubcription và các cơ chế truy vấn.Để trao đổi các sự kiện dữ liệu,

producer và consumer có một đường liên kết trực tiếp, nhưng để khởi tạo hộp thoại, chúng cần directory service.

Một vài công cụ giám sát đã được phát triển cho các hệ thống Grid. Balaton et al (2004) cung cấp một mô tả và phân loại các công cụ giám sát và đánh giá hiệu suất, và Serafeim et al.(Anikolas & Sakellariou, 2005) đề suất một phân loại các hệ thống giám sát Grid, được sử dụng để phân loại một loạt các dự án và các framework.

Ganglia (Massie, Chun & Culler, 2004) là một hệ thống giám sát phân tán có khả năng mở rộng cho các môi trường tính toán hiệu nâng cao như là cụm (clusters) và lưới. Nó dựa trên một mẫu thiết kế phân cấp nhắm vào các liên đoàn của các cụm, dựa trên một giao thức multicast / notification cho trạng thái màn hình bên trong các cụm và sử dụng lưu dấu vết của các kết nối điểm – nối – điểm (point-to-point) giữa các nút gom cụm đại diện cho các cụm liên đoàn và tập hợp trạng thái của chúng. Dữ liệu được thể hiện trong XML và được nén. Ganglia Web Frontend có thể được sử dụng để kiểm tra, ví dụ sử sử dụng CPU trong giờ qua hay tháng qua. Ganglia đã được triển khai ở nhiều cơ sở hạ tầng HPC bao gồm các phương tiện siêu máy tính và các hệ thống lưới.

Network Weather Service (NWS) (Nolski, Spring & Hayes, 1999) là một hệ thống phân tán để tạo ra các dự báo hiệu năng ngắn hạn dựa trên các thước đo hiệu năng lịch sử. NWS cung cấp một tập hợp các cảm biến hệ thống cho hiệu năng TCP/IP cuối – tới – cuối giám sát định kỳ (về băng thông và độ trễ), phần trăm CPU có sẵn và bộ nhớ non-paged có sẵn. Dựa trên dữ diệu tập hợp được, NWS tự động nhận diện đặc trưng và dự đoán hiệu năng của network và các tài nguyên điện toán.

Mercury (Balaton & Gombas, 2003) được thiết kế để thỏa mãn các yêu cầu của việc giám sát hiệu năng lưới: Nó cung cấp dữ liệu giám sát thể hiện như là số liệu thông qua cả 2 ngữ nghĩa kéo và đẩy và cũng hỗ trợ việc làm bằng cách kiểm soát. Nó hỗ trợ kiểm soát về các thực thể lưới như các tài nguyên và các ứng dụng theo cách chung, mở rộng và co dãn. Thiết kế của nó theo những đề xuất của OGF GMA được mô tả ở phần trước.

OCM-G (Balis et al., 2004) là một màn hình ứng dụng tương thích OMIS được phát triển trong dự án CrossGrid. Nó cung cấp sự giám sát mà được cấu hình trực tuyến thông qua một nhà quản lý trung tâm mà hướng các yêu cầu thông tin cho các màn hình nội bộ.

Hệ thống khám phá và kiểm soát Globus (MDS) (Czajkowski, Fitgerald, Foster & Kesselman, 2011) là một công cụ giám sát được sử dụng rộng rãi khác, nó cung cấp thông tin về các nguồn tài nguyên có sẵn trên lưới và trạng thái của chúng. Nó dựa trên schema GLUE, được sử dụng để cung cấp một sự mô tả hợp nhất của các tài nguyên và để làm cho dễ dàng hoạt động liên kết giữa những cơ sở hạ tầng lưới. Những tiếp cận khác cho các hệ thống quy mô lớn đã được phát triển như MonALISA (Newman et al., 2003), một framework giám sát có khả năng mở rộng cho các host và networks trong các hệ thống phân tán quy mô lớn và Palantir (Guim, Rodero, Tomas, Corbalan & Labarta, 2006) được thiết kế để hợp nhất sự truy cập vào các hệ thống theo dõi và thông tin khác nhau cho sự chia sẻ tài nguyên có tính mền dẻo lớn thông qua các miền quản trị để cung cấp các cách chung cho việc truy cập tất cả thông tin này. Hơn nữa, những framework portal Grid khác cộng tác những tính năng kiểm soát như HPC-Europa Single Point of Access (Guim et al., 2007) và P- GRADE Portal (Podhorszki & Kacsuk, 2001).

Một vài trung tâm dữ liệu cung cấp tài nguyên cho các hệ thống đám mây đã chọn Ganglia như một công cụ giám sát. Tuy nhiên, những môi trường ảo hóa có những thứ cần cụ thể hơn đã thúc đẩy những nhà cung cấp công nghệ điện toán đám mây phát triển hệ thống quan sát của chính họ. Một trong số chúng được tổng kết như sau:

Amazon CloudWatch làm một dịch vụ web mà cung cấp giám sát cho các tài nguyên đám mây dịch vụ web Amazon như Amazon EC2. Nó tập hợp dữ liệu thô từ các dịch vụ web Amazon và sau đó xử lý thông tin vào trong các metric có khả năng đọc để ghi lại trong thời gian 2 tuần. Nó cung cấp cho người dùng với khả năng hiển thị vào sử dụng tài nguyên, hiệu quả hoạt động, và tổng thể mô hình nhu cầu - bao gồm cả những vấn đề như sử dụng CPU, ổ đĩa đọc, ghi và lưu lượng mạng.

Windows Azure Diagnostic Monitor thu thập dữ liệu trong lưu trữ cục bộ cho tất cả các loại chẩn đoán được kích hoạt và có thể chuyển dữ liệu mà nó thu thập vào một tài khoản lưu trữ Azure để lưu trữ vĩnh viễn. Nó có thể được hoạch định để thúc đẩy các dữ liệu thu thập được để lưu trữ theo định kỳ hoặc có thể yêu cầu một cuộc chuyển giao theo yêu cầu bất cứ khi nào thông tin này là cần thiết.

OpenNebula Information Manager (IM) có trách nhiệm theo dõi các nút khác nhau trong một đám mây. Nó đi kèm với cảm biến khác nhau, mỗi cái chịu trách nhiệm về các khía cạnh khác nhau của nguồn tài nguyên tính toán được theo dõi (CPU, bộ nhớ, tên máy). Ngoài ra, có các cảm biến chuẩn bị để thu thập thông tin từ các siêu giám sát (hypervisors) khác nhau.

Các chức năng giám sát của Aneka (Vecchiola, Chu, & Buyya, 2009) được thực hiện bởi phần mềm trung gian lõi, cung cấp một tập hợp các dịch vụ bao gồm cả đàm phán về chất lượng dịch vụ, kiểm soát nhập học, quản lý thực hiện, kế toán và thanh toán. Để giúp các quản trị viên điều chỉnh hiệu suất tổng thể của các Cloud, các Management Studio cung cấp số liệu thống kê tổng hợp động.

Nimsoft Monitoring Solution (NMS) được xây dựng trên kiến trúc giám sát thống nhất Nimsoft, cung cấp chức năng giám sát đối với bất kỳ sự kết hợp của trung tâm dữ liệu ảo hóa, trên cơ sở hạ tầng lưu trữ hoặc quản lý, trong các đám mây trên IaaS hoặc PaaS hoặc chuyển giao các dịch vụ SaaS. Cụ thể, nó cung cấp giám sát thống nhất cho các trung tâm dữ liệu, mây riêng tư và mây công cộng như Amazon WS, bao gồm cả cấp độ dịch vụ và đáp ứng thời gian theo dõi, trực quan và báo cáo.

Hyperic CloudStatus cung cấp giám sát mã nguồn mở và phần mềm quản lý cho tất cả các loại của các ứng dụng web, cho dù được lưu trữ trong đám mây, bao gồm cả dịch vụ Web Amazon và Google App Engine. CloudStatus cung cấp cho người sử dụng các báo cáo thời gian thực và xu hướng hàng tuần trên các số liệu cơ sở hạ tầng.

2.3.4. Điện toán tự trị (Autonomic Computing)

Điện toán tự trị nhằm mục đích thiết kế và xây dựng hệ thống tự quản lý và đã nổi lên như một cách tiếp cận đầy hứa hẹn để giải quyết những thách thức do tính phức

tạp phần mềm (Jeffrey & Kephart, 2001). Một hệ thống tự trị có thể đưa ra quyết định để đối phó với những thay đổi trong điều kiện vận hành trong thời gian chạy, sử dụng chính sách cấp cao mà thường được cung cấp bởi một chuyên gia. Một hệ thống như vậy liên tục giám sát và tối ưu hóa hoạt động và tự điều chỉnh bản thân để thay đổi điều kiện để nó tiếp tục để đạt được mục tiêu của nó.

Có một số cột mốc quan trọng và có giá trị để đạt được điện toán tự trị hoàn toàn: đầu tiên, chức năng tự động chỉ đơn thuần là thu thập và tổng hợp thông tin để hỗ trợ các quyết định của người dùng. Sau đó, họ sẽ phục vụ như tư vấn, gợi ý các khóa học về hành động cho con người có thể có để xem xét.

Tự trị là bản chất của điện toán tự động và đã được định nghĩa trong những thuật ngữ của bốn khía cạnh của tự trị sau đây (Jeffrey & Kephart, 2001).

• Tự cấu hình (Self configuration): Các hệ thống tự trị sẽ tự cấu hình một cách tự

động phù hợp với các chính sách cấp cao đại diện cho các mục tiêu cấp thương mại, ví dụ, chỉ ra cái được mong muốn chứ không phải là cách mà nó được hoàn thành.

• Tự tối ưu (Self optimization): Các hệ thống tự động sẽ tìm kiếm các cách liên tục

để cải tiến hoạt động của chúng, nhận dạng và nắm bắt các cơ hội để tạo cho chúng hiệu quả hơn trong hiệu năng hoặc chi phí hoặc cả hai. Các hệ thống tự động sẽ kiểm soát, điều chỉnh các tham số của chúng và sẽ học để tạo các lựa chọn thích hợp về việc giữ gì các chức năng hoặc gia công chúng.

• Tự chữa trị (Self healing): Các hệ thống điện toán tự động sẽ kiểm tra, chuẩn

đoán và sửa chữa những vấn đề nội bộ có kết quả từ lỗi (bugs) hoặc thất bại (failures) trong phần mềm hoặc phần cứng.

• Tự bảo vệ (Self protection) : Các hệ thống tự động sẽ được tự bảo vệ trong hai

cách. Chúng sẽ bảo vệ toàn bộ hệ thống với quy mô lớn, các vấn đề tương quan phát sinh từ các cuộc tấn công độc hại hoặc các sự cố mà vẫn chưa được sửa chữa bởi các giải pháp tự chữa trị (self healing). Chúng cũng sẽ dự đoán các vấn đề dựa trên các báo cáo ban đầu từ cảm biến.

Hình 7: Một cấu trúc căn bản của một autonomic element