Phân hệ quản lý tài nguyên và thực thi công việc PBS_Mom

Một phần của tài liệu tìm hiểu về chương trình debugger (Trang 27 - 31)

Vai trò của Phân hệ này trong hệ thống PBS là hết sức quan trọng. Đây chính là các thành phần để thực thì công việc trên các nút tính toán cũng như thu thập các thông tin tài nguyên của các nút tính toán. Phân hệ được cài đặt trên từng nút tính toán của phân cụm, cũng dưới dạng một tiến trình ngầm và chạy với quyền root.

Hình 3.3 : Phân bố Phân hệ Quản lý Tài nguyên và Thực thi công việc trên các nút Đây là thành phần đảm nhiệm hai chức năng chính là quản lý tài nguyên và thực hiện chạy các Job. Do đó nó được chia thành hai thành phần sau

3.3.1 Thành phần quản lí tài nguyên(Resource Monitor-RM)

Thành phần quản lí tài nguyên hệ thống là thành phần bổ trợ cho thành phần lập lịch. Thành phần quản lí tài nguyên hệ thống cung cấp cho thành phần lập lịch nhưng thông tin và tài nguyên của hệ thống cục bộ. Thành phần quản lí tài nguyên hệ thống là một phần của phân hệ pbs_mom. Nó lắng nghe đầu vào tại một socket nhất định (được định nghĩa là PBS_MOM_SERVICE_PORT = 15002) và đáp ứng danh sách các tên tài nguyên và giá trị tương ứng. Thành phần quản lí tài nguyên hệ thống có thể đáp ứng yêu cầu của rất nhiều tiến trình nhưng socket được sử dụng chỉ có tiến trình chủ mới có thể kết nối. Chú ý rằng pbs_mom không còn giải quyết định

Nút tính toán PBS_MOM Nút tính toán PBS_MOM Nút tính toán PBS_MOM PBS_MOM Nút tính toán PBS_MOM Nút tính toán PBS_MOM Nút tính toán PBS_MOM Nút tính toán PBS_MOM PBS_MOM Nút tính toán PBS_MOM MẠNG LIÊN KẾT

vị của các nút thực thi các Job. Các chức năng này được chuyển cho thành phần Pbs_Server như là một phần của toàn bộ đặc tính song song.

Các thông tin được RM quản lý:

Arch Hệ điều hành của host.n

Cput Thời gian cpu theo giây.

Idletime Thời gian nghỉ của hệ thống theo giây

Loadave Số các tiến trình đang chạy

Mem Số bộ nhớ đã dùng tính theo byte

Ncpus Số bộ vi xử lý trong máy trạm.

Nsessions Số phiên làm việc đang thực hiện trong máy trạm

Nuers Số người dùng có tiến trình đang chạy trên máy trạm

Pids Danh sách cac tiến trình của cùng một phiên làm việc.

Physmem Kích thước bộ nhớ vật lý.

Sessions Số phiên làm việc trong máy trạm

Size Kích thước file hệ thống tính theo kb

Uname Thông tin từ lệnh Uname trả về

Validuser Người dùng có hợp pháp không.

Walltime Thời gian tính theo đơn vị giây mà một chương trình hay

phiên làm việc tồn tại trong hệ thống.

Mục đích của JE là chạy các nhiệm vụ (Job), theo dõi và điều khiển các Job đó và báo cáo lại cho PBS_Server. Mỗi một nút có một JE Như vậy PBS_Server chịu trách nhiệm chung về Job được chạy, còn JE chịu trách nhiệm cụ thể về Job đó, khởi tạo, giám sát, thu dọn sau khi Job hoàn thành. Một Job có thể có nhiều tiến trình. JE giám sát tất cả các tiến trình trong nút tính toán. JE gắn liền với thành phần quản lí tài nguyên nhưng khác biệt hẳn về chức năng. JE hoạt động như một Task Manager đối với các Job mà nó quản lý. Một PBS_Server sẽ làm việc với rất nhiều JE.

Hoạt động của hệ thống

Người sử dụng sẽ giao tiếp với Phân hệ quản lý công việc với tư cách là môt client đối với hệ thống PBS. Sau khi tiếp nhận được công việc, Phân hệ Lập lịch thực hiện công việc sẽ được kích hoạt để thực hiện việc lập lịch và phân phối công việc vào các nút tính toán theo các giải thuật và cơ chế lập lịch có sẵn. Đồng thời, công việc cũng được lưu trong các hàng đợi (queue) của Phân hệ quản lý công việc. Phân hệ Lập lịch để có thể lập lịch và phân bổ công việc vào đúng các nút cần thiết sẽ yêu cầu Phân hệ thu thập và quản lý tài nguyên cung cấp các thông tin về tài nguyên trên từng nút tính toán. Dựa vào nhưng thông tin đó, cùng với những thông tin có sẵn của công việc, Phân hệ Lập lịch có thể xác định được sự phân bổ công việc trên các nút. Thông tin đó sẽ đựợc chuyển xuống cho Phân hệ Thu thập tài nguyên và thực thi công việc để tiến hành thực hiện công việc đồng thời trong qua trình thực hiện công việc, các thông tin có liên quan sẽ được cập nhật và lưu trữ trong Phân hệ quản lý công việc. Khi công việc kết thúc, kết quả sẽ được trả về cho người dùng ở phía client. Quá trình này sẽ được lặp đi lặp lại để đáp ứng cho các công việc tiếp theo được đệ trình từ phía người sử dụng.

Quá trình này được diễn ra trong toàn bộ hệ thống, và các phân hệ đều trực tiếp tham gia vào.

Hình 2.4:Hoạt động của hệ thống PBS

Gi a các phân h trong h th ng PBS luôn có s giaoữ ệ ệ ố ự ti p, liên l c v i nhau. S giao ti p là c n thi t vàế ạ ớ ự ế ầ ế quan tr ng ọ đặc bi t ệ đối v i nhi m v qu n tr h th ngớ ệ ụ ả ị ệ ố phân c m. Vì n u không có các giao ti p, liên l c gi aụ ế ế ạ ữ các phân h thì toàn b h th ng s tr nên r i r c vàệ ộ ệ ố ẽ ở ờ ạ không còn là m t th th ng nh t n a. ộ ể ố ấ ữ

Một phần của tài liệu tìm hiểu về chương trình debugger (Trang 27 - 31)

Tải bản đầy đủ (DOC)

(57 trang)
w