Cụ thê hơn nữa là đưa ra một chính sách hướng tới tiết kiệm năng lượng cho việc vận hành những server farm với ba mô hình phân bố tài nguyên áp dụng đối với server ảo mô hình tải cao nhấ
Trang 1HOÀNG DUY ĐÔNG
NGHIÊN CỨU ĐÁNH GIÁ HIỆU NĂNG CỦA CÁC THUẬT TOÁN LẬP
LỊCH TRONG ĐIỆN TOÁN ĐÁM MÂY
Chuyên ngành: Kỹ thuật Viễn thông
Mã số: 60.52.02.08
HÀ NỘI - 2015
Trang 2Luận văn được hoàn thành tại:
Người hướng dẫn khoa học: TS NGUYEN CHIEN TRINH
Phản biện 1: TS NGUYEN QUÝ SY
Phản biện 2: PGS.TS ĐÀO TUẦN
Luận văn đã được bảo vệ trước Hội đông châm luận văn thạc sĩ tại Học viện
Công nghệ Bưu chính Viễn thông
Vào lục: ic ngay 20 thang 9 nam 2015
Có thê tìm hiéu luận văn tại:
- Thu viện của Học viện Công nghệ Bưu chính Viễn Thông
Trang 3MỞ ĐẦU
Điện toán đám mây hiện nay là xu hướng công nghệ mới dang phát trién mạnh
mẽ Điện toán đám mây cung cấp khả năng mở rộng tài nguyên ảo tự động thông quacác dịch vụ Internet dé sử dung theo yêu cầu, và cũng phát triển cao hơn điện toánphân tán, điện toán song song và điện toán lưới Ưu điểm chính của điện toán đámmây là có thé giảm nhanh các chi phí phần cứng và tăng khả năng tính toán và khả
năng lưu trữ, người sử dụng có thể truy cập dịch vụ chất lượng cao với mức chỉ phí
thấp
Lập lịch là một phần rất quan trọng trong điện toán đám mây, nó là một cơ chế
sắp xếp các nhiệm vụ người dùng tới nguồn tài nguyên thích hợp dé thực thi Hiệu qua
của nó ảnh hưởng trực tiếp đến hiệu suất của toàn bộ môi trường điện toán đám mây
Bang cách sử dụng kỹ thuật ảo hóa, tat cả các tài nguyên vật ly được ảo hóa và mang
lại nhiều tiện ích cho người sử dụng
Mục tiêu trong luận văn này sẽ nghiên cứu, phân tích và đưa ra đề xuất nhằmđánh giá hiệu năng năng lượng của một số thuật toán lập lịch Cụ thê hơn nữa là đưa ra
một chính sách hướng tới tiết kiệm năng lượng cho việc vận hành những server farm
với ba mô hình phân bố tài nguyên áp dụng đối với server ảo (mô hình tải cao nhất, môhình tải thấp nhất, mô hình tải ưu tiên), hướng tới việc giảm tiêu thụ năng lượng đốivới các hạ tầng thông tin và viễn thông và qua đó giảm được giá thành năng lượng đốivới các nhà cung cấp và triển khai dịch vụ điện toán đám mây
Luận văn này đã được xây dựng với những nội dung chính như sau:
Chương 1: Trình bày tổng quan về khái niệm, kiến trúc, mô hình, cũng như co
chế lập lịch trong điện toán đám mây và xu hướng nghiên cứu lập lịch hiện nay
Chương 2: Trình bày một số thuật toán lập lịch truyền thống, các tham số đánhgiá hiệu năng, so sánh hiệu năng của một số thuật toán lập lịch qua đó dé xuất thuậttoán lập lịch cho các server ảo nhằm sử dụng hiệu quả năng lượng
Chương 3: Trình bày quy trình tiến hành mô phỏng khảo sát hiệu năng chútrọng yếu tố hiệu quả năng lượng, đánh giá và nhận xét kết quả mô phỏng
Trang 4CHƯƠNG 1
TONG QUAN VE ĐIỆN TOÁN DAM MAY VÀ LẬP LICH
TRONG DIEN TOAN DAM MAY
1.1 Tổng quan về điện toán đám mây
1.1.1 Khái niệm về điện toán dam may
Điện toán đám mây [1] được định nghĩa như là một kiểu tính toán trong đó tải
nguyên có khả năng mở rộng một cách mêm dẻo và thường được ảo hóa một cách tựy Ụ ì 0 ộ :
động được cung cấp như một dịch vụ thông qua Internet Điện toán đám mây trở thành
xu hướng công nghệ quan trọng và nhiều chuyên gia kỳ vọng rằng điện toán đám mây
sẽ thay đổi hình dạng công nghệ thông tin, các quy trình và thị trường công nghệthông tin Với công nghệ điện toán đám mây, người dùng có thể sử dụng các thiết bị
khác nhau như PC, laptop, smartphones, và PDA dé truy cập các chương trình, kho lưu
trữ, nền tảng phát triển ứng dụng thông qua Internet, thông qua các dịch vụ được cung
câp bởi nhà cung câp điện toán đám mây.
{ Analytical } ( Transactional ) { Interactive }{ Browsing |
Application Capability Components
{ Webserver } | AppServer ) § Reporting | | ESB )
Trang 51.13 Các mô hình triển khai
Đám mây được triển khai theo các cách khác nhau, tùy thuộc vào phạm vi sửdụng Có bốn mô hình triển khai điện toán đám mây chính:
- Pam mây công cộng (Public Cloud)
- Dam mây riêng tu (Privare Cloud)
- Đám mây lai (Hybrid Cloud)
- Dam mây tập thé (Community Cloud)
1.1.4 Cac dich vụ trong điện toán dam mây
- Phan mềm đám mây đóng vai trò dịch vụ (SaaS)
- Cơ sở hạ tầng đám mây đóng vai trò dich vụ (laaS)
- Nén tảng đám mây đóng vai trò dịch vụ (PaaS)
1.15 Đặc điểm của điện toán đám mây
việc được quy định sẵn do người quan tri, diéu hanh viéc cung cap dich vụ va được gọi
là các chính sách Người quản trị sẽ thông qua các chính sách áp dung dé xác định mụctiêu của ứng dung và từ đó xác định và thực thi thuật toán lập lịch đối với công việc dédat được yêu cầu đầu ra mong muốn
Quá trình lập lịch là quá trình quyết định sẽ thực thi công việc tại một nguồn tàinguyên cụ thé nào và vào thời điểm nao là thích hợp nhất do đó sẽ ảnh hưởng rat lớnđến hiệu năng hoạt động của hệ thống
Trang 61.2.2 Các vấn đề trong lập lịch
Lập lịch là vấn đề của các yếu tố ánh xạ từ các tập khác nhau, điều này đượcchính thức thê hiện như một bộ ba (E, S, O), trong đó:
- E là tập hợp các mẫu, mỗi mẫu trong số đó là một đối tượng của vấn đề
- _ là tập hợp các giải pháp khả thi cho mỗi mẫu.
- _ Ó là mục tiêu của vấn đề
Vấn đề lịch có thé được tiếp tục phân loại thành hai loại tùy thuộc vào mục tiêu O: van
đề tối wu hóa và van dé quyết định
Mỗi thuật toán là một tập hợp các hướng dẫn đơn giản cho việc tìm kiếm một giải
pháp cho một vấn đề Bao gồm ba phần: Đầu vào, phương pháp, đầu ra Đầu vào là
một tập các tham số cần được xử lý Phương pháp bao gồm việc mô tả, kiểm soát và
các thủ tục lặp lại dé thực hiện mục tiêu băng cách sử dụng các thông số đầu vào Đầu
ra là kết qua của van dé Đặc biệt đối với lập lịch, thuật toán là một phương pháp mànhờ nó những tác vụ được truy cập, ánh xạ, hoặc phân bố cho các bộ vi xử lý Nói
chung, không có thuật toán lập lịch hoàn toàn hoàn hảo tồn tại, vì các mục tiêu lập lịch
có thê xung đột với nhau Một kế hoạch lập lịch tốt thực hiện một sự thỏa hiệp phù
hợp, hoặc là áp dụng kết hợp các thuật toán lập lịch theo các ứng dụng khác nhau.
1.2.3 Kiến trúc lập lịch trong điện toán đám mây
E [=]
Trang 71.2 Xu hướng lập lịch hiện nay
Điện toán đám mây chỉ ra nhiều thách thức cho các nhà phát triển hệ thống, dịch
vụ, các kỹ sư, nhà quản trị mạng và nhà cung cấp dịch vụ Vấn đề lập lịch đang hướngtới một số van đề sau:
- D6 tin cậy, tính bảo mật, tính riêng tư
- _ Chính sách lập lịch và chat lượng dịch vụ
- Su dụng năng lượng hiệu qua
- Quan lý tài nguyên ảo hóa như dữ liệu luồng
- Ứng dụng dịch vụ tăng cường trong môi trường điện toán dam mây
1.4 Kết luận chương
Các thuật toán lập lịch trong các hệ thống phân bố đóng góp vai trò trong việc
dàn trải tải trên các bộ xử lý và tối đa hoá sự sử dụng trong khi tối thiểu hoá thời gian
thực thi nhiệm vụ tổng thé Lap lich nhiém vu dong vai tro chu chốt dé cải thiện các hệ
thống tin cậy và linh hoạt Mục đích chính là để lập lịch các nhiệm vụ cho các tàinguyên thích ứng phù hợp với thời gian, bao gồm tìm ra một tuần tự hợp lý trong đócác nhiệm vụ có thê được thi hành
Trang 8CHƯƠNG 2
CÁC THUẬT TOÁN LẬP LỊCH TRONG MÔI TRƯỜNG ĐIỆN
TOÁN DAM MAY
2.1 Một số thuật toán lập lịch truyền thống
2.1.1 Thuật toán di truyền GA (Genetic Algorithm) ([4], [31], [21])
Đối với giải thuật di truyền, các thông số của bài toán tìm kiếm phải được mã
hoá thành một chuỗi hữu hạn các ký tự trên một tập hữu hạn các ký tự Chuỗi này
tương tự như các chuỗi gen của các cơ thé sinh vật Có rất nhiều cách dé mã hóa tậpthông số Một cách đơn giản là chúng ta có thê mã hoá thành các chuỗi bit trên tập ký
tự {0,1} Mỗi một chuỗi đại diện cho một điểm tìm kiếm trong không gian GA xuất
phát với một quần thé các chuỗi được khởi tạo một cách ngẫu nhiên sau đó sẽ sản sinh
các quan thé tiếp theo thông qua việc sử dụng lựa chọn ngẫu nhiên như một công cụ
Nhờ đó giải thuật di truyền tìm kiếm trên nhiều điểm song song có khả năng leo lênnhiều cực trị cùng một lúc Thông qua các toán tử của mình, giải thuật trao đôi thôngtin giữa các cực trị với nhau, từ đó làm giảm thiêu khả năng giải thuật kết thúc tại các
cực tri địa phương và bỏ qua mat cực tri toàn cục
( Initialization )
First Generation (Cppp) Knowledge-base
Next Generation (Cpạp)
Trang 92.1.2 Thuật toán điều phối FCFS (First Come First Serve)
Trong thuật toán này, độ ưu tiên phục vụ tiến trình căn cứ vào thời điểm hìnhthành tiến trình Hàng đợi các tiến trình được tô chức theo kiểu FIFO Moi tiến trình
đều được phục vụ theo trình tự xuất hiện cho đến khi kết thúc hoặc bị ngắt.
2.1.3 Thuật toán thời gian thực hiện tối thiểu (Minimum execution time) và thờigian hoàn thành tôi thiểu (Minimum Completion Time)
MET (thời gian thực hiện tối thiểu) lập lịch mỗi tác vụ theo thứ tự tùy ý tớimáy có thời gian thực hiện tính toán tối thiêu cho tác vụ này MET cũng rất đơn giản,
đưa máy tốt nhất tới mỗi công việc nhưng bỏ qua sự sẵn có của máy MET gây nguy
hiểm cho cân bằng tải ở các máy khác
MCT (thời gian hoàn thành tối thiểu) lập lịch mỗi tác vụ theo thứ tự tùy ý tới
máy có thời gian hoàn thành tối thiểu cho tác vụ này Tuy nhiên, trong thuật toánheuristic này, không phải tất cả tác vụ đều có thể có thời gian thực hiện tối thiêu
2.1.4 Thuật toán Round Robin [16]
Thuật toán cân bằng tải Round Robin cho phép phân phối các yêu cầu từ client
trên nhiều server Thuật toán này cải thiện khả năng chịu lỗi của server và thời gianphản hồi đến người sử dụng Cân bằng tải phân phối các yêu cầu của khách hàng trênnhiều máy chủ dé tối ưu hóa việc sử dụng tài nguyên
2.2 Các tham số đánh giá hiệu năng
-_ Thời gian trung bình toàn cục, thời gian đáp ứng nhanh nhất và nhỏ nhất cho tat
cả người sử dụng.
- Thời gian phân chia theo nhóm người sử dụng, được phân bố trong các vùng
địa lý.
- _ Thời gian xử lý tác vụ của người sử dụng tại các trung tam đữ liệu.
- Xác suất chặn các yêu cầu, xác suất từ chối dịch vụ
- Mức tiêu thu năng lượng và toản nhiệt của các server vật lý.
- _ Tổng công suất tiêu thụ cho các server trong đám mây gây tiêu tốn đáng ké tới
chi phí kinh doanh.
Trang 102.3 So sánh hiệu năng các thuật toán lập lịch truyền thống
Thuật toán di truyền GA
Đây là thuật toán tối ưu heristic đang được sử dụng hiện nay Thuật toán nàykhông những tìm ra kết quả chính xác mà còn tìm ra những kết quả tương tự với độlệch được giới hạn sẵn (thông qua hàm đột biến) Tuy nhiên thuật toán không đảm bảo
sẽ tìm ra vấn đề trong không gian tìm kiếm (đánh giá theo hàm fitness)
Thuật toán điều phối FCES
Ưu điểm: của thuật toán này là giờ CPU không bị ngắt và chi phí thực hiện thấpnhất vì không thay đổi thứ tự ưu tiên phục vụ (thứ tự của tiễn trình trong hàng đợi)
Nhược điểm: của thuật toán này là thời gian trung bình chờ phục vu của các tiếntrình là như nhau (không kể tiến trình ngắn hay dai), do đó dẫn đến:
-_ Thời gian chờ trung bình sẽ tăng vô hạn khi hệ thống tiếp cận tới khả năng phục
vụ của mình.
- Nếu độ phát tán thời gian thực hiện tiến trình tăng thì thời gian chờ trung bình
cũng tăng theo.
- Khi có tiến trình dài, ít bị ngắt thì các tiến trình khác phải chờ đợi lâu hơn
Thuật toán thời gian thực hiện tối thiểu (MCT) và thời gian hoàn thành tối thiểu
(MET)
Tuy nhiên, trong các thuật toán heuristic đơn giản này, không phải tất cả tác vụ
đều có thể có thời gian thực hiện tối thiểu và MET gây nguy hiểm cho cân bằng tải ở
các máy khác vì bỏ qua sự sẵn có của máy.
Thuật toán Round Robin
Uu điểm:
- Cac quá trình sẽ được luân phiên xử lý nên thời gian chờ sé ít.
- Đối với quá trình liên quan tới xuất nhập, IO, người dùng thì rất hiệu quả
- Viéc cài đặt không qua phức tạp.
Nhược điểm:
- Thoi gian chờ đợi trung bình dưới chính sách Round Robin thường là quá dai.
- _ Nếu thời gian định mức cho việc xử lý quá lớn thi Round Robin thành FIFO
Nếu thời gian quá ngăn so với thời gian xử lý của một tiến trình trong danh sách hàng
đợi thì việc chờ đợi và xử lý sẽ luân phiên nhiêu lân.
Trang 11=> Các thuật toán lập lịch truyền thống chưa giải quyết được vấn đề hiệu suất sử dụng
và yêu tô hiệu quả năng lượng các server ảo trong môi trường điện toán đám mây.
2.4 Các thuật toán lập lịch cho các server ảo nhằm sử dụng hiệu quả năng lượng2.4.1 Thuật toán cân bằng tải tăng cường tránh tắc nghẽn máy ảo
User 1 : — User2 „ : Usern `
Hình 2.4 Cấu trúc đám mây trong quá trình cân bằng tải [18]
Thuật toán đề xuất
Bước 1: Trạng thái ban đầu của máy ảo sẽ bằng 0 trong tất cả các máy ảo rỗi
Cloud Manager trong trung tâm dữ liệu duy trì một cau trúc dit liệu bao gồm
các ID công việc, ID máy ảo và các trạng thái máy ảo.
Bước 2: Khi có một hàng đợi các yêu cầu, Cloud Manager phân tích cau trúc
dữ liệu cho việc phân bó dé xác định máy ảo được sử dụng ít nhất Nếu sự sẵn
có của máy ảo là nhiều hơn thì máy ảo với hop time ít nhất sẽ được xem xét
Bước 3: Cloud Manager cập nhật các cấu trúc đữ liệu tự động sau khi phân bó.Bước 4: Cloud Manager định kỳ giám sát trạng thái của các máy ảo để phânphối tải, néu một máy ảo quá tải được tìm thấy thì Cloud Manager di chuyền tải
của máy ảo quá tải cho máy ảo có mức tải thâp.
Trang 12- Bước 5: Quyét định lựa chon máy ảo có tải thấp sẽ được dựa trên hop time.
Máy ảo với hop time ít nhất sẽ được xem xét
- Bude 6: Cloud Manager cập nhật cấu trúc dữ liệu bang cách sửa đổi các mục
dựa trên cơ sở time to time.
- Bước 7: Chu kỳ lặp đi lặp lại từ bước 2.
Trong thuật toán đề xuất Cloud Manager phân tích tính sẵn có của các máy ảo
tại thời điểm các công việc đến để cập nhật cấu trúc dữ liệu do đó có ít tốn kém hơn
trong việc duy trì cấu trúc đữ liệu so với thuật toán gốc Từ đó, thuật toán cân bang tải
đề xuất phải mang lại thời gian phản hồi ít hơn Như vậy, thời gian phản hồi ít hơn làm
giảm công việc bị từ chối và tăng hiệu quả kinh doanh
2.4.2 Thuật toán cân bằng tải nhận biết năng lượng trong điện toán đám mây (thuật
toán PALB)
Algorithm PALB
balance:
for all active compute nodes j € [m] do
n,; © current utilization of compute node j end for
if all nị > 75% utilization //all available nodes are active
boot vm on most underutilized n;
end if else
boot vm on most utilized n;
Hinh 2.8 Thuat toan PALB [16]
Thuật toán cân bằng tải PALB có thé được áp dụng cho các bộ điều khiển cụmcủa một đám mây cục bộ Tùy thuộc vào kích thước yêu cầu của máy ảo, bộ cân bằng
tải được đặt trên một nút tính toán đã được câp nguôn nêu nút tính toán đó có các
Trang 13nguồn tài nguyên dé lưu trữ Nếu không, một nút tính toán dang tat sẽ được bật lên délưu trữ máy ảo Trong thuật toán đặc biệt quan tâm đến việc tiết kiệm năng lượng bằngviéc tắt các nút tính toán không được sử dụng Thuật toán sẽ duy trì việc sử dụng tất cảcác nút tính toán và phân phối các máy ảo theo cách có năng lượng hiệu quả Mục tiêu
của thuật toán này là duy trì tính sẵn có dé tính toán các nút trong khi giảm tổng côngsuất được tiêu thụ bởi đám mây
So sánh thuật toán PALB và Round Robin
Sự khác biệt hiệu năng chính giữa thuật toán PABL và Round Robin là các nút tính
toán dang rỗi sẽ sử dụng PALB dé tắt đi Phương pháp Round Robin có hiệu quả trong
cân bằng tải qua các nút tính toán sẵn có nhưng nó tiêu thụ một lượng lớn năng lượngkhông cần thiết
Hình 2.16 So sánh các yêu cầu máy ảo của thuật toán Round Robin
Khi đám mây có năm nút tính toán và 20 máy ảo cỡ nhỏ được yêu cầu, PALB
tiêu thụ 11% năng lượng được tiêu thụ bởi Round Robin với cùng các thông số Khiyêu cầu 20 máy ảo cỡ nhỏ trong khi có 20 nút tính toán sẵn có, PALB chỉ sử dụng
2,8% năng lượng được tiêu thụ bởi Round Robin Sử dụng các yêu cầu đối với máy ảo
cỡ cực lớn với năm nút tính toán, PALB chỉ sử dụng 29,5% năng lượng được tiêu thụ