8. Ví dụ vềmột hế thốngđiện toán đám mâyđược thương mại hóa: Aneka
8.2.1. Khối lượng công việc cho tính toán hiệu năngcao
Hình 6 cho thấy thiết lập môi trường Aneka Cloud sử dụng để đánh giá hiệu suất. Cloud Aneka chứa 33 máy tính cá nhân (PC) với 1 nút chính(master) và 32 nút thực thi (execution) nằm trong 3 phòng thí nghiệm máy tính của sinh viên tại Khoa Khoa học Máy tính và Khoa Công nghệ phần mềm, Đại học Melbourne. Thiết lập này cho thấy Aneka Cloud thể hiện là một nguồn tài nguyên hợp nhất cho người sử dụng/người môi giới bởi tài nguyên vật lý máy tính được khai thác nằm trong 3 phòng thí nghiệm.
Hình 6: cấu hình Aneka Cloud
Khối lượng công việc tổng hợp được tạo ra bằng cách sử dụng lưu dấu (trace) dữ liệu của các ứng dụng HPC. Các thí nghiệm sử dụng 238 yêu cầu đặt chổ trong 7 ngày cuối của dấu vết SDSC SP2 (từ 04/1998 đến 04/ 2000), phiên bản 2.2 từ Feitelson's Parallel Workloads Archive. Dấu vết SDSC SP2từ San Diego Supercomputer Center (SDSC) tại Mỹ được chọn bởi vìnó sử dụng tài nguyên cao nhất 83,2% trong tổng số những dấu vết có sẵn, điều này là lý tưởng cho mô hình một kịch bản khối lượng công việc nặng nề.Tuy nhiên, các dấu vếtchỉ cung cấpthời gianinter-arrival củayêu cầu đặt chổ, số lượng các bộ vi xử lýđược dành riêng(được thu hẹp phạm vi hoạt độngtừtối đa128nút xuống còn32 nút) và khoảng thời thời gianđược dành riêng.Do đó, chúng tôi áp dụngmột phương pháptương tự (Irwinvà những người khác đưa ra)đểtổng hợpchỉ địnhcác yêu cầudịch vụ(thời hạn vàngân sách) thông quahailớp yêu cầu: (i) mức độ khẩn cấp thấp (low urgency)và (ii) mức độ khẩn cấp cao (high urgency).
Mộtyêu cầu đặt chổ i trong lớpkhẩn cấpthấp cógiá trị thời hạncaodeadlinei/durationivà giá trị của ngân sách thấpbudgeti/f(durationi).f(durationi)là một hàm biểu diễn chongân sáchđược yêu cầu tối thiểu dựatrêndurationi. Ngược lại, mỗi yêu cầu itrong lớpkhẩn cấpcaocógiá trị thời hạnthấpdeadlinei/durationivà giá trị của ngân sách cao budgeti/ f(durationi). Đây là thực tế bởi vìmột người dùnggửi mộtyêu cầu cấp báchhơnthì sẽ được đáp ứngtrong mộtthời hạnngắn hơnvà phải cung cấpmộtngân sáchcao hơn cho cácthông báo ngắn. Giá trị đượcphân bố bình thườngcho mỗitham sốthời hạnvàngân sách.
Để đơn giản,AnekaCloudchỉ tínhphí người dùngcho việc sử dụngcác loạitài nguyên tính toántrênmỗibộ vi xử lý(CPU) theogiờ (h). Do đó, người dùng không phải trả phícho việc sử dụngcác loại tài nguyênkhác như bộ nhớ, lưu trữ và băng thông. Ngoài ra,chúng tôi giả địnhrằng người sử dụng/người môi giớichắc chắn có thểchấp nhậnmột khethời gian đặt trước được đề xuấtbởiAnekaCloud nếu một trong nhữngyêu cầulà không thể,với điều kiện làcáckhe thời gianđược đề xuấtvẫn đáp ứngcả haiyêu cầu ứng dụngvàdịch vụcủa người sử dụng.
Nhưđược liệt kêtrong bảng 3, chúng tôi đánh giáhiệu suất củabảycơ chế định giáthể hiện chobaloại cơ bản:(i)Fixed, (ii) FixedTimevà (iii)LibraC+$. Mỗi cơ chếđịnh giácócấu hình tối đavàtối thiểuđể nhấn mạnhphạm vihoạt động của nó. Cơ chếtrả phí Fixedcố địnhmộtmức giá tại mọi thời điểm. Cơ chếtrả phí FixedTimecó mức giá sử dụngtài nguyên cố định trong khoảng thời giankhác nhau, vớimức giáthấp hơn đượctính phí ngoài giờ cao điểm(12AM –12PM) vàmột mức giácao hơn chocao điểm (12PM – 12AM).
Bảng 3: Các cơ chế giá
Libra+$sử dụnghàm định giá chi tiết hơnđáp ứngbốn yêu cầucần thiếtđể định giácác nguồn lực nhằmngăn ngừa tình trạngquá tải khối lượng công việc: (i)linh hoạt (flexible), (ii) hợp lý (fair), (iii) năng động(dynamic) và (iv)thích nghi (adaptive). Giá
Pijchomỗiđơn vị tài nguyênđược sử dụng bởiyêu cầu đặt chổ itính toán tạinútjđược tính như sau: . GiáPBasej- thành phầngiátĩnh,là giá cho việc sử dụngnguồn tài nguyên tạinútj
có thể đượcsử dụng bởi cácnhà cung cấpdịch vụđểtính giátối thiểunhằm thu hồichi phí hoạt động. Giásử dụngPUtilij- là thành phầngiáđộng,được tínhnhưmột yếu tốcủaPBasejdựatrênviệc sử dụng cácnguồn tài nguyêntại nútjtrongthời hạncầnyêu cầui: .
RESMaxj và RESFreeij tương ứng là đơn vịlớn nhất vàđơn vị trống còn lạicủa cácnguồn tài nguyên ởnút jtrong khoảngthời hạncủayêu cầuitương ứng. Do đó, RESFreeijđã được trừđi các đơn vịtài nguyênđã được xác nhận đặt chổ và yêu cầuicho khoảng thời hạncủa nó.
Hệ số và tương ứng là thành phầntĩnh và thành phần động củaLibraC+$ cung cấpsự linh hoạtchocác nhà cung cấpdịch vụdễ dàng cấu hìnhvàthay đổitrọng lượng củacác thành phầntĩnh và độngtrêngiá tổng thểPij.LibraC+$là hợp lý vì yêu cầu đượcđịnh giá dựa trênsố lượng tài nguyênkhác nhauđược sử dụng. LibraC+$ cũng làđộngvìgiá tổng thể củamột yêu cầukhác nhau tùy thuộcvào sự sẵn cócủacác tài nguyêntrong thời hạnyêu cầu.Cuối cùng, LibraC+$làthích ứng, giá tổng thểđược điều chỉnhtùy thuộc vàonguồn cung hiện tạivànhu cầutài nguyênhoặc làkhuyến khích hayngăn chặn yêu cầuđưa ra.
Tuy nhiên, bacơ chế nàydựatrên các tham sốgiá cảtĩnh, các tham số này thường không chính xác từ nhà cung cấpdịch vụđể tạo rahiệu quả tốt nhấtkhi cần thiết.Do đó, chúng tôi đề xuấtLibraC+$Auto, mộtLibraC+$ tự nhiêntự động điều chỉnhdựatrênsự sẵn có củacác nút tính toán. Do đó,LibraC+$Autoxem xétviệc định giátài nguyêntrêncác nút, không giống như LibraC+$chỉ xem xétgiá cả củacác nguồn tài nguyênở mỗijnútthông quaPij.
Hình7 cho thấygiá cảbình thườngvà hiệu suấtdoanh thucủabảycơ chếgiá cảtrong Aneka Cloudcho các yêu cầu có mức độkhẩn cấp cao(với thời hạnngắnvàngân sáchcao) từ các ứng dụngtuần tự(đòi hỏi phải có một bộ xử lýđể thực thi)trong khoảng thời gian7 ngày.Trong hình7, hai số liệu về hiệu suất là: (i) giá chomột xác nhận đặt chổ($/CPU/
giờ) và (ii)doanh thutích lũyđể xác nhận đặt chổ($).Cả haisố liệuđã đượcchuẩn hóatrong phạm vitừ 0 đến1 đểdễ dàng so sánh. Doanh thucho một xác nhận đặt chổlà tổngdoanh thutrêntất cả các nútdành riêngcủa nótính theogiáchỉ định (phụ thuộc vào cơ chế giácụ thể) và thời gian dự trữtại mỗi nút.Sau đó, giá của một xác nhận đặt chổđược tính toánđể phản ánhmức giá trung bìnhtrêntất cả các nútdành riêngcủa nó.
Trong hình7, với bốncơ chế định giácố địnhđược liệt kêtrongBảng 3, FixedMaxcung cấpdoanh thu cao nhất(tối đa ràng buộc), tiếp theo là FixedTimeMax, FixedTimeMinvàFixedMincódoanh thuthấp nhất(tối thiểu ràng buộc).Tuy nhiên,cơ chếFixedTimetính được dễ dàng hơnvà đáng tin cậyhơnso vớicơ chếcố địnhvì nó hỗ trợmột loạt cácgiásử dụng tài nguyên trongkhoảng thời giankhác nhau. Nhưngtất cả bốncơ chếkhông xem xétcác yêu cầudịch vụcủangười sử dụng nhưthời hạnvàngân sách.
Hình 7: Giábình thường/doanh thucủacác yêu cầu cómức độ khẩn cấp cao.
Mặt khác, Libra+$ tính phí với mức giá thấp hơn cho một yêu cầu có thời hạn dài hơn như một động lực để khuyến khích người dùng gửi yêu cầu với thời hạn dài hơn có nhiều khả năng được cung cấp hơn thời hạn ngắn hơn. Đối với một yêu cầu với thời hạn ngắn, Libra+$Max và Libra+$Min tính phí cao hơntương ứng với tham sốtrong Bảng 3. Libra+$Max cung cấp doanh thu cao hơn Libra+$Min vì có giá trị cao hơn.
Cả haiLibra+$Auto vàLibra+$Maxcó thể cung cấpdoanh thu cao hơnđáng kể so vớicơ chếgiákhác thông quagiá cao hơn chothời hạnngắn hơn.Hình7 cho thấyLibra+
$Auto tiếp tụctăng giáđểcao hơn so vớiLibra+$Max vàcơ chế định giákháckhi nhu cầucaonhưtrong nửasaucủangày1, 2, 3và5. Ngược lại, khinhu cầu thấpnhưtrong nửađầu củangày thứ 2,3, 5và6, Libra+$Autogiữgiá giảmthấp hơnso vớiLibra+$Max đểchấp nhận yêu cầukhôngsẵn sàngtrả nhiều tiền hơn. Do đó, Libra+$Autocó khả năngkhai thácgiới hạn ngân sáchđể đạt đượcdoanh thu cao nhấtbằng cách tự độngđiều chỉnhcao hơn để tănggiákhisự sẵn có củacác nútlàthấp vàtự độngđiều chỉnhthấp hơn để giảmgiákhi cónhiều nútkhông sử dụngnếu khôngsẽlãng phí.