Một số tính năng đặc biệt của Condor

Một phần của tài liệu KHÓA LUẬN TỐT NGHIỆP: TÍNH TOÁN THÔNG LƯỢNG CAO VỚI CONDOR (Trang 26 - 29)

™ Điểm kiểm tra trạng thái và sự di trú (Checkpoint and Migration)

Vì công việc có thể liên kết với các thư viện Condor, những người dùng Condor có thể được bảo đảm rằng công việc của họ sẽ từ từ hoàn thành, thậm chí trong môi trường đang thay đổi mà Condor sử dụng. Khi một máy chạy công việc được đưa vào (submit) Condor trở nên không có sẵn, công việc đó có thể được kiểm tra trạng thái. Công việc này có thể tiếp tục sau khi chuyển sang một máy khác. Đặc tính kiểm tra định kì của Condor sẽ kiểm điểm định kì một công việc ngay cả khi có sự thay đổi đặc biệt trên máy thực hiện khi có sự di chuyển công việc để đảm bảo cho việc tính toán tích luỹ theo thời gian đối với một công việc mà bị mất khi có lỗi hệ thống, chẳng hạn như việc tắt máy hoặc va chạm (crash), xung đột.

Một điểm kiểm tra trạng thái (checkpoint) là tập hợp đầy đủ của các thông tin về trạng thái của một chương trình. Có một điểm kiểm tra trạng thái như vậy, một chương trình có thể sử dụng nó để tiếp tục thi hành công việc từ trạng thái lúc công việc đó bị dừng. Với những việc tính toán lâu dài, khả năng sinh ra và sử dụng điểm kiểm tra trạng thái có thể tiết kiệm nhiều ngày, thậm chí hàng tuần cho việc tính toán tích lũy. Nếu một máy xảy ra va chạm, hay phải khởi động lại cho một nhiệm vụ quản lí, một điểm kiểm tra trạng thái sẽ giữ được những gì tính toán đã được hoàn thành. Condor tạo ra những điểm kiểm tra cho công việc, làm định kì như vậy, hay khi máy đang thực hiện công việc trở nên không có sẵn. Bằng cách này, công việc có thể được tiếp tực trên máy khác có cấu hình tương tự và điều này được gọi là sự di trú quá trình (migration).

™ Các lời gọi hệ thống từ xa (Remote System Calls)

Dù việc chạy các công việc là trên những máy từ xa, sự thực hiện của kiểu hệ thống Condor chuẩn vẫn giữ gìn, bảo vệ môi trường hoạt động địa phương thông qua các lời gọi hệ thống từ xa. Người dùng không phải lo lắng về việc làm cho các files dữ liệu có sẵn cho các trạm làm việc từ xa hay là thậm chí có thể thu được một tài khoản người dùng (người dùng không xác định) ở trạm làm việc từ

xa trước khi Condor thực hiện các chương trình ở đó. Chương trình hoạt động trong Condor cứ như thể nó vẫn đang chạy trên chiếc máy ban đầu từ khi mà được người dùng đưa vào, không có vấn đề gì khác đối với chiếc máy thật sự hoàn thành công việc.

™ Không cần thay đổi cho mã nguồn của người dùng

Không có việc lập trình đặc biệt nào được đòi hỏi cho Condor. Condor có thể chạy những chương trình độc lập không tương tác. Việc kiểm tra trạng thái (checkpointing) và sự chuyển đổi của các chương trình trong suốt và tự động, vì nó sử dụng các lời gọi hệ thống từ xa. Nếu có sự thay đổi cần thực hiện đối với một chương trình, người dùng chỉ việc liên kết lại chương trình đó. Mã nguồn không được biên dịch lại cũng như không thay đổi.

™ Các vùng hoạt động của hệ thống Condor có thể được móc nối với nhau

Kết tập là một đặc tính của Condor, cho phép những công việc được đưa vào bên trong một cụm đầu tiên của Condor có thể thực thi trên một cụm thứ hai. Cơ chế thực hiện linh hoạt, phụ thuộc yêu cầu của việc đưa vào công việc, khi mà Condor cho phép cụm thứ hai, hay một tập con của các máy trong cụm thứ hai có thể thiết lập những chính sách ghép nối thông qua những điều kiện của các công việc được thi hành.

™ Các công việc có thểđược sắp xếp theo thứ tự:

Việc sắp xếp các công việc để thi hành được đòi hỏi bởi sự phụ thuộc giữa các công việc với nhau trong một tập hợp. Tập các công việc xác định sử dụng một đồ thị vận hành không tuần hoàn, nơi mỗi công việc là một nút trong đồ thị. Các công việc tiếp theo được submit tuân theo sơ đồ đó.

™ Condor cho phép tính toán lưới (Grid Computing)

Khi tính toán lưới trở thành thực tế, Condor đã làm điều đó. Kĩ thuật glidein cho phép những công việc được đưa tới Condor được thi hành trên các máy tính lưới được định vị ở nhiều nơi. Khi mà các vấn đề tính toán lưới phát triển, khả năng của Condor cũng tăng theo (bắt đầu từ dạng Globus), để có thể kiểm soát được tài nguyên.

™ Đáp ứng mong muốn của những người chủ máy tính

Chủ nhân của một máy có quyền ưu tiên đầy đủ để sử dụng máy. Một chủ nhân nói chung vui lòng cho phép những công việc khác được tính toán trên máy đó khi nó rỗi, nhưng muốn điều đó lùi lại ngay khi mà người ấy trở lại máy mình. Chủ nhân không muốn thực hiện những hành vi đặc biệt nào để lấy lại quyền làm chủ của mình. Condor sẽ điều khiển việc này một cách tự động.

™ Cơ chế chùm tin quảng bá ClassAds

Một nhân tố đóng góp vào thành công của hệ thống là cơ chế chùm tin quảng bá (ClassAd). Cơ chế này cung cấp một vùng làm việc vô cùng linh hoạt cho việc kết nối giữa nhu cầu tài nguyên với sự đáp ứng tài nguyên. Người dùng có thể dễ dàng yêu cầu cả các đòi hỏi của công việc lẫn sự đáp ứng công việc mong muốn. Các công việc muốn được tìm thấy các máy để có thể thi hành thì cần có cơ chế này. Một công việc sẽ đòi hỏi một cấu hình nền (platform) xác định trên các máy thi hành mà đã chứa sẵn các tài nguyên cần thiết, như là yêu cầu về cấu hình chung và lượng bộ nhớ có sẵn. Một chùm tin quảng bá (ClassAd) riêng được sinh ra tương ứng với mỗi công việc và mỗi máy, liệt kê tất cả các thuộc tính của công việc hay của máy. Condor hoạt động như một bộ điều khiển kết nối tài nguyên (matchmaker) để thực hiện kết nối giữa các công việc và các máy bằng cách ghép cặp các chùm tin quảng bá ClassAd của một công việc và một máy.

Cơ chế này phức tạp chứ không chỉ đơn giản là việc nối ghép các đặc điểm nền tảng của các công việc với các đặc điểm nền của các máy. Một công việc có thể muốn thi hành trên một máy có khả năng tính toán dấu chấm động tốt hơn, hay có thể muốn thi hành trên một tập các máy xác định nào đó hơn. Những mong muốn này cũng xảy ra tương tự với các chùm tin quảng bá ClassAd. Hơn nữa, một người chủ máy có quyền cho phép những công việc nào được thi hành trong điều kiện hoàn cảnh nào trên máy đó. Người chủ đó viết một file cấu hình xác định những yêu cầu và mong muốn cho các công việc, có thể cho phép các công việc được thực hiện khi máy đó nằm rỗi (tức là khi tải của máy thấp và không có tác động đến bàn phím), hay cho phép các công việc chỉ được thực hiện vào các tối thứ ba chẳng hạn. Và cũng có thể có một yêu cầu là chỉ các công việc được đưa vào từ một nhóm người dùng nào đó được thực hiện. Bên cạnh đó, bất kì yêu cầu nào của người chủ máy đều có thể mô tả như một sự ưu tiên (preference), chẳng

hạn khi một máy thích thi hành các công việc của một nhóm được chọn, nhưng sẽ chấp nhận các công việc của các nhóm khác nếu như không có công việc nào của nhóm được chọn.

Một phần của tài liệu KHÓA LUẬN TỐT NGHIỆP: TÍNH TOÁN THÔNG LƯỢNG CAO VỚI CONDOR (Trang 26 - 29)