Các phương pháp gần đúng dựa trên tối ưu bày đàn và tiến hóa vi phân giải bài toán lập lịch luồng công việc trong môi trường điện toán đám mây

BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ QUỐC PHÒNG VIỆN KHOA HỌC VÀ CƠNG NGHỆ QN SỰ PHAN THANH TỒN CÁC PHƯƠNG PHÁP GẦN ĐÚNG DỰA TRÊN TỐI ƯU BÀY ĐÀN VÀ TIẾN HĨA VI PHÂN GIẢI BÀI TỐN LẬP LỊCH LUỒNG CƠNG VIỆC TRONG MƠI TRƯỜNG ĐIỆN TỐN ĐÁM MÂY Chuyên ngành : Cơ sở toán học cho tin học Mã số : 62 46 01 10 TÓM TẮT LUẬN ÁN TIẾN SĨ TOÁN HỌC HÀ NỘI - 2018 Cơng trình hồn thành tại: VIỆN KH&CN QN SỰ - BỘ QUỐC PHÒNG Người hướng dẫn khoa học: TS Nguyễn Thế Lộc TS Nguyễn Doãn Cường Phản biện 1:PGS.TS Nguyễn Đức Nghĩa Trường Đại học Bách khoa Hà Nội Phản biện 2: PGS.TS Lê Trọng Vĩnh Trường Đại học Khoa học tự nhiên Đại học Quốc gia Hà Nội Phản biện 3: PGS.TS Nguyễn Xuân Hoài Trường Đại học Hà Nội Luận án tiến sĩ bảo vệ trước Hội đồng chấm luận án cấp Viện, họp Viện KH&CNQS Vào hồi ngày tháng năm 2018 Có thể tìm hiểu luận án thư viện: - Thư viện Viện Khoa học Công nghệ quân - Thư viện Quốc gia Việt Nam MỞ ĐẦU Tính cấp thiết đề tài luận án Điện tốn đám mây hoạt động dựa tảng công nghệ ảo hóa mạng internet Trong mơi trường điện tốn đám mây tài nguyên phần cứng, phần mềm cung cấp cho khách hàng dạng dịch vụ khách hàng phải trả chi phí cho tài nguyên thực dùng Điện toán đám mây [1] môi trường phân tán không đồng với kết hợp nhiều máy chủ vật lý tạo nên máy chủ ảo để phục vụ khách hàng Bên cạnh lợi ích mang lại tài ngun ln sẵn dùng, giảm thiểu chi phí đầu tư hạ tầng đội ngũ nhân viên cơng nghệ thơng tin, điện tốn đám mây phải đối mặt với thách thức an toàn bảo mật liệu, điều phối tài nguyên hiệu trung tâm liệu, lập lịch luồng cơng việc,… Bài tốn Lập lịch luồng công việc ứng dụng nhiều lĩnh vực khoa học sống lập lịch điều phối tài nguyên hệ điều hành, hệ thống phân tán, lập lịch biểu cho dây chuyền sản xuất Các nhà khoa học sử dụng liệu dạng luồng công việc nhiều lĩnh vực khoa học nghiên cứu vũ trụ, động đất, tin sinh, vật lý….Đặc trưng loại ứng dụng cần phải xử lý số lượng lớn tác vụ , khối lượng liệu trao đổi tác vụ lớn ứng dụng thường triển khai hệ thống tính tốn phân tán điện toán lưới hay điện toán đám mây Thời gian hồn thành chi phí thực thi luồng cơng việc phụ thuộc vào nhiều yếu tố đầu vào như: • Số lượng tác vụ luồng công việc • Số tài ngun mơi trường tính tốn • Quan hệ thứ tự tác vụ luồng công việc • Độ trù mật đồ thị luồng cơng việc Rất nhiều trường hợp riêng toán lập lịch chứng minh thuộc lớp NP-Khó [2], để tìm lời giải tối ưu cho tốn với kích thước liệu vào lớn dùng phương pháp vét cạn nhiều thời gian Một số cách tiếp cận theo Heuristic truyền thống Minmin, Max-min,… thường cho chất lượng lời giải không tốt Những giải pháp khác, chẳng hạn GA hay PSO, nhà nghiên cứu đề xuất không hướng tới mục tiêu tối thiểu hóa thời gian thực (makespan) luận án đặt Do việc nghiên cứu đề xuất thuật tốn lập lịch tìm lời giải gần tối ưu thời gian ngắn giúp nâng cao hiệu trung tâm điều phối đám mây việc cung cấp dịch vụ tới khách hàng Cấu trúc luận án Luận án gồm phần mở đầu, phụ lục, 03 chương, phần kết luận hướng phát triển, danh mục cơng trình khoa học cơng bố tài liệu tham khảo Phần mở đầu: trình bày tính cấp thiết đề tài, khái quát chung mục tiêu, đối tượng, nội dung, phương pháp nghiên cứu, ý nghĩa khoa học thực tiễn luận án Chương 1: Giới thiệu toán nghiên cứu liên quan Chương trình bày khái niệm luồng công việc, cấu trúc số luồng công việc ứng dụng khoa học thực tiễn Mục 1.4 trình bày mơ hình tốn lập lịch luồng cơng việc mơi trường điện toán đám mây (từ gọi CLOS - Cloud Scheduling), biểu diễn tốn dạng kí hiệu Graham chứng minh độ phức tạp toán Mục 1.6 trình bày số nghiên cứu liên quan đến toán lập lịch đánh giá ưu nhược điểm cách tiếp cận giải toán lập lịch Chương 2: Giải toán CLOS theo phương pháp Tối ưu bày đàn Dựa theo phương pháp Tối ưu bày đàn, chương trình bày hai thuật tốn để giải toán CLOS thuật toán PSOi_H LPSO_H Mục 2.2 trình bày thuật tốn đề xuất PSOi_H với nội dung phương pháp mã hóa cá thể, cách thức cập nhật vector vị trí cá thể, phương pháp thoát khỏi cực trị địa phương, chi tiết thuật tốn PSOi_H Phần trình bày kết thực nghiệm đánh giá chất lượng lời giải thuật tốn PSOi_H Mục 2.3 trình bày chi tiết thuật toán đề xuất LPSO_H kết thực nghiệm với đánh giá chất lượng lời giải thuật toán LPSO_H Chương 3: Giải tốn CLOS theo phương pháp Tiến hóa vi phân Chương trình bày tổng quan phương pháp tiến hóa vi phân, phương pháp đối xứng, phương pháp lựa chọn theo vòng dựa xếp hạng cá thể Mục 3.2 trình bày thuật tốn đề xuất MODE để giải tốn CLOS dựa theo phương pháp tiến hóa vi phân Phần cuối chương trình bày kết thực nghiệm đánh giá chất lượng lời giải thuật toán đề xuất MODE Ý nghĩa khoa học thực tiễn Về mặt lý thuyết khoa học, số nhiều cơng trình nghiên cứu dạng khác toán Lập lịch, theo hiểu biết tác giả, luận án cơng trình giải tốn Lập lịch cho dạng liệu luồng cơng việc DAG với mục tiêu tối thiểu hóa makespan Luận án đề xuất mơ hình tốn học chặt chẽ tường minh cho toán - lấy bối cảnh thực trung tâm điện toán đám mây - sở đưa cách phân loại toán theo phương pháp Graham tốn thuộc lớp NP-Khó Luận án đề xuất ba thuật toán lập lịch dựa hướng tiếp cận metaheuristic bao gồm Tối ưu bày đàn, Tiến hóa vi phân Về thực tiễn, kết nghiên cứu luận án sở khoa học để thực thi thuật tốn lập lịch luồng cơng việc mơi trường điện tốn đám mây phù hợp cho loại đồ thị luồng công việc tham số mơi trường tốc độ tính tốn máy chủ, băng thông máy chủ Chương 1: Giới thiệu toán nghiên cứu liên quan Chương trình bày mơ hình tốn lập lịch luồng cơng việc mơi trường điện tốn đám mây, phân lớp phương pháp giải toán lập lịch chứng minh toán đề xuất CLOS thuộc lớp NP-Khó Mơ hình tốn lập lịch luồng cơng việc mơi trường điện tốn đám mây Hệ thống tính tốn Giả thiết cho trước hệ thống tính tốn bao gồm: • Tập hợp N máy chủ mơi trường điện toán đám mây S = {S1, S2, SN} • Luồng cơng việc cần thực biểu diễn đồ thị có hướng, khơng có chu trình G=(V,E), đỉnh biểu thị tác vụ, cạnh biểu diễn mối quan hệ cha-con cặp tác vụ • Tập tác vụ T={T1, T2, TM} với M số lượng tác vụ • Khối lượng tính toán tác vụ Ti ký hiệu Wi , đo đơn vị flop (floating point operations: phép tính số thực dấu phảy động) • Tốc độ tính tốn máy tính, đo đơn vị flop/s (số phép tính thực giây), ký hiệu P(), hàm số định nghĩa sau: P: S R+ Si  P(Si) • Mọi cặp máy chủ (Si, Sk) có đường truyền để trao đổi liệu với (1≤i, k≤N) • Băng thông đường truyền, ký hiệu B(), tốc độ truyền liệu máy chủ, đo đơn vị bit giây (bps), hàm số định nghĩa sau: B: SS  R+ (Si, Sk)  B(Si, Sk) • Hàm băng thơng B() tn theo ràng buộc sau: - B(Si,Si) =: thời gian truyền từ máy chủ tới 0, nghĩa tác vụ cha tác vụ bố trí máy chủ khơng thời gian để truyền liệu chúng liệu lưu trữ sử dụng chỗ - B(Si,Sk ) = B(Sk,Si): kênh truyền hoạt động từ hai đầu với tốc độ tương đương Khối lượng liệu cần truyền hai tác vụ Ti Tk, ký hiệu Dik, giá trị cho trước, Dik  Ti tác vụ cha Tk, ngược lại Dik =0 Khái niệm lịch biểu Một phương án xếp lịch F, gọi lịch biểu F, xác định hai hàm (ts , proc) • ts: T  R+; ts(Ti) thời điểm mà tác vụ Ti T bắt đầu thực • proc: T  S; proc(Ti) máy tính phân cơng thực tác vụ Ti T Từ giả thiết suy ra: Thời gian tính tốn tác vụ Ti: Wi ; i  1,2, , M P procTi  Thời gian truyền liệu tác vụ Ti tác vụ Tk là: Dik ; i, k  1,2, , M B procTi , procTk  Makespan lịch biểu F biểu diễn theo công thức sau: makespan( F )  max{ t f (Ti )}  min{ t s (Ti )} TiT TiT với tf(Ti) thời điểm kết thúc ts(Ti) thời điểm bắt đầu thực tác vụ Ti Mục tiêu toán Mục tiêu tốn tìm lịch biểu F cho makespan( F )  Xếp loại tốn CLOS thơng qua phân loại Graham • Bài tốn CLOS biểu diễn theo ký pháp Graham sau: Q|outtree, cij |Cmax Độ phức tạp toán CLOS Dựa theo toán SCHED O Sinnen chứng minh thuộc lớp NP-khó, tác giả chứng minh tốn CLOS thuộc lớp NP-khó cách qui dẫn toán SCHED toán CLOS Các nghiên cứu liên quan Phân loại phương pháp giải toán lập lịch Phân loại phương pháp giải toán lập lịch Cấu trúc Cơ chế Tập trung Tĩnh Phân tán Động Căn định Phân bậc Hình 1.12: Phân loại phương pháp lập lịch Cục Toàn cục Các giải thuật lập lịch tĩnh Các giải thuật dựa heuristics Lập lịch dựa Lập lịch dựa quyền phân ưu tiên cụm tác vụ Thuật toán di Thuật toán đàn truyền kiến Các giải thuật dựa Metaheuristics Lập lịch dựa tác vụ Phương pháp tối ưu bày đàn Thuật tốn luyện thép Phương… pháp tiến hóa vi phân Hình 1.13: Phân lớp giải thuật lập lịch tĩnh Các phương pháp giải toán lập lịch Các thuật tốn Heuristic giải tốn lập lịch Có nhiều thuật toán Heuristic giải toán lập lịch, điển hình họ thuật tốn Myopic, Min-min, Max-min, HEFT, TANH, Random, RRTSM Các thuật toán Metaheuristic giải tốn lập lịch Đã có nhiều cơng trình nghiên cứu giải toán lập lịch dựa cách tiếp cận metaheuristic thuật toán EGA, GATSM, GAPSO, PSO_H, MPSO, … So sánh thuật toán Các thuật toán heuristic metaheuristic thường cho chất lượng lời giải chấp nhận thời gian đa thức, nhiên thuật tốn heuristic thường hoạt động dựa vào tính chất tác vụ rời rạc qua trình xếp lịch hiệu số luồng cơng việc cụ thể luồng cơng việc có cấu trúc đơn giản dạng tiến trình, đường ống (pipeline), liệu truyền qua lại tác vụ nhỏ Các thuật toán metaheustic hoạt động dựa tri thức quần thể có thường có hiệu nhiều dạng tốn lập lịch cấu trúc luồng công việc phức tạp Chương 2: Giải toán CLOS theo phương pháp tối ưu bày đàn Chương gồm hai nội dung chính: (i) Đề xuất thuật toán PSOi_H giải toán CLOS (ii) Đề xuất thuật toán LPSO_H giải toán CLOS 2.1 Thuật toán đề xuất PSOi_H Thuật toán đề xuất hoạt động theo phương pháp tối ưu bày đàn, nhiên thuật toán cải tiến điểm sau: (i) Thay đổi phương pháp cập nhật vị trí cho cá thể nhằm tăng tính đa dạng cho quần thể (ii) Đề xuất thủ tục Inverse nhằm giúp quần thể khỏi cực trị địa phương Mã hóa cá thể Vector vị trí vector dịch chuyển biểu diễn cấu trúc liệu bảng băm ngơn ngữ lập trình java T1 S1 T2 S2 T3 S1 T4 S3 T5 S2 Phương thức cập nhật vị trí cá thể Định nghĩa 1: điểm lực tính tốn máy chủ (base score) đại lượng sử dụng để đánh giá hiệu suất máy chủ, tính tốn dựa điểm thành phần khác máy tính tốc độ vi xử lý, dung lượng tốc độ nhớ RAM, tốc độ ổ đĩa cứng Trong luận 11 Hình 2.5: So sánh thuật tốn PSOi_H thuật toán khác với liệu T2032 Đánh giá chất lượng lời giải thuật toán PSOi_H Với liệu chuẩn tiến hành thực nghiệm thuật toán cách độc lập với 30 lần thử, tham số băng thông máy chủ, tốc độ tính tốn máy chủ thiết lập môi trường mô CloudSim cách quán cho tất thuật toán lần thử nghiệm Với hai thuật toán PSOi_H PSO_H tham số hệ số quán tính: ; hệ số gia tốc c1, c2; số cá thể quần thể số hệ thiết lập Kết thực nghiệm chất lượng lời giải thuật tốn PSOi_H ln tốt thuật toán Random, RRTSM tham số độ lệch chuẩn, giá trị trung bình giá trị tốt tất liệu thực nghiệm Kết thực nghiệm với liệu ngẫu nhiên bảng 2-3 thuật toán PSOi_H ln cho chất lượng lời giải tốt thuật tốn PSO_H tham số độ lệch chuẩn, giá trị trung bình giá trị tốt hầu hết liệu thực nghiệm Một số liệu T1035, T2051, T2053 thuật tốn 12 PSOi_H có giá trị trung bình độ lệch chuẩn nhỏ so với kết tìm thuật toán PSO_H Kết thực nghiệm với liệu ứng dụng thực tiễn Montage, Epigenomics (xem bảng 2-4, 2-5) chất lượng lời giải thuật toán PSOi_H tốt thuật toán PSO_H tham số độ lệch chuẩn, giá trị trung bình giá trị tốt So với thuật toán EGA thuật tốn PSOi_H tốt tham số giá trị trung bình giá trị tốt Độ lệch chuẩn tìm thuật tốn PSOi_H nhỏ độ lệch chuẩn tìm thuật tốn PSO_H từ 2% - 11% cho liệu thực nghiệm có tham số mơi trường đám mây đồng băng thơng tốc độ tính tốn, nhỏ từ 16% - 51% cho liệu thực nghiệm có tham số mơi trường đám mây khơng đồng băng thơng tốc độ tính tốn máy chủ Giá trị trung bình tìm thuật toán PSOi_H nhỏ giá trị trung bình tìm thuật tốn PSO_H từ 1% - 7%, đặc biệt với liệu thực nghiệm có hệ số  nhỏ (đồ thị luồng cơng việc có số cạnh ít, hay phụ thuộc liệu tác vụ khơng nhiều) thuật tốn PSOi_H có giá trị trung bình nhỏ so với thuật toán PSO_H từ 8% 16% So với thuật toán EGA giá trị trung bình tìm thuật tốn PSOi_H nhỏ từ 2% - 9% Giá trị tốt tìm thuật tốn PSOi_H nhỏ giá trị tốt tìm thuật tốn Random RRTSM với tất liệu thực nghiệm So với thuật tốn PSO_H giá trị tốt tìm PSOi_H nhỏ 2% - 7% , đặc biệt với liệu thực nghiệm từ ứng dụng thực tiễn Epinogenmic giá trị tốt tìm PSOi_H nhỏ PSO_H từ 8% - 15% Giá trị tốt tìm thuật tốn PSOi_H nhỏ giá trị tốt tìm thuật toán EGA từ 2.3% - 8% 13 Với số liệu thực nghiệm giá trị tốt tìm thuật tốn PSOi_H giá trị tối ưu tìm theo phương pháp vét cạn; liệu chuẩn T531, T532, T533 Với liệu thực nghiệm khác giá trị tốt tìm thuật tốn PSOi_H có tỷ lệ sai lệch so với giá trị tối ưu tìm vét cạn từ 0.8% đến 4% (theo công thức 1-10) Với liệu thực nghiệm có băng thông máy chủ môi trường đám mây thấp giá trị tốt tìm thuật tốn PSOi_H có tỷ lệ sai lệch so với giá trị tối ưu tìm vét cạn từ 11.5% - 20.7% Kết trình bày chi tiết bảng 2-6 luận án 2.2 Thuật toán LPSO_H Thuật toán LPSO_H thuật toán tối ưu bày đàn lai, sử dụng kết hợp phương pháp tối ưu bày đàn phương pháp tìm kiếm lân cận Thuật toán LPSO gồm điểm cải tiến sau: (i) Thay đổi phương pháp cập nhật vị trí cá thể nhằm tăng tính đa dạng quần thể (ii) Kết hợp với thủ tục tìm kiếm lân cận nhằm giúp quần thể thoát khỏi điểm cực trị địa phương Phương pháp tìm kiếm lân cận Tìm kiếm lân cận phương pháp tìm kiếm heuristic Phương pháp thường giải pháp khởi tạo tốn, sau áp dụng dãy toán tử biến đổi lời giải ban đầu để thu lời giải với giá trị hàm mục tiêu tốt [70] Tác giả đề xuất hai toán tử Exchange RotateRight sử dụng cho trình tìm kiếm lân cận hình sau: 14 a) Toán tử RotateRight 3 3 1 b) Tốn tử Exchange Hình 2.14: Tốn tử RotateRight Exchange Thực nghiệm Tham số mơi trường điện tốn đám mây luồng liệu thực nghiệm trình bày chi tiết bảng PL1-1 đến PL1-39 PL2-1 đến PL2-3 Kết thực nghiệm thuật toán LPSO_H trình bày chi tiết bảng 2-9, 2-10 2-11 luận án Đánh giá chất lượng lời giải thuật toán LPSO_H Với liệu chuẩn tác giả tiến hành thực nghiệm thuật toán cách độc lập với 30 lần thử, tham số băng thông máy chủ, tốc độ tính tốn máy chủ thiết lập môi trường mô CloudSim cách quán cho tất thuật toán lần thử nghiệm Với hai thuật toán LPSO_H PSO_H tham số hệ số quán tính: ; hệ số gia tốc c1, c2; số cá thể quần thể số hệ thiết lập Kết thực nghiệm bảng 2-9, 2-10 2-11 chất lượng lời giải thuật tốn LPSO_H ln tốt thuật toán Random, RRTSM, PSO_H tham số độ lệch chuẩn, giá trị trung bình giá trị tốt So sánh với thuật tốn EGA, thuật tốn LPSO_H ln cho lời giải tốt thuật toán EGA tham số độ lệch chuẩn, giá trị trung bình giá trị tốt hầu hết liệu thực nghiệm Với số liệu T2054, T2055, M2531, M5081, 15 E10081 thuật tốn LPSO_H ln cho chất lượng lời giải tốt thuật toán EGA tham số giá trị trung bình giá trị tốt Độ lệch chuẩn tìm thuật tốn LPSO_H nhỏ độ lệch chuẩn tìm thuật tốn PSO_H từ 7% - 14% hầu hết liệu thực nghiệm, đặc biệt liệu thực nghiệm từ ứng dụng thực tế Montage Epigenomics độ lệch chuẩn tìm thuật tốn LPSO_H nhỏ so với thuật toán PSO_H từ 16% - 31% Giá trị trung bình tìm thuật tốn LPSO_H nhỏ giá trị trung bình tìm thuật toán PSO_H từ 2.7% - 9.8%, đặc biệt với liệu thực nghiệm có khối lượng liệu cần truyền tác vụ nhỏ giá trị trung bình tìm thuật tốn LPSO_H nhỏ so với thuật toán PSO_H từ 21% - 33% So với thuật tốn EGA giá trị trung bình tìm LPSO_H nhỏ từ 2.4% - 11.8% Giá trị tốt tìm thuật tốn LPSO_H nhỏ giá trị tốt tìm PSO_H từ 2.1% - 11% nhỏ so với thuật toán EGA từ 1.2% - 15.4% Với số liệu thực nghiệm giá trị tốt tìm thuật toán LPSO_H giá trị tối ưu tìm theo phương pháp vét cạn; liệu chuẩn T531, T532, T533 Với liệu thực nghiệm khác giá trị tốt tìm thuật tốn LPSO_H có tỷ lệ sai lệch so với giá trị tối ưu tìm vét cạn từ 0.1% đến 5.4% (theo công thức 1-10) Với liệu thực nghiệm có tham số mơi trường đám mây không đồng băng thông tốc độ tính tốn máy chủ giá trị tốt tìm thuật tốn LPSO_H có tỷ lệ sai lệch so với giá trị tối ưu tìm vét cạn từ 8.5% - 20.7% Kết trình bày chi tiết bảng 2-12 luận án So sánh thuật toán LPSO_H với thuật toán khác 16 Hình 2.18: So sánh thuật tốn LPSO_H thuật toán khác với liệu M5081 Chương 3: Giải tốn CLOS theo phương pháp tiến hóa vi phân Chương trình bày nội dung sau: (i) Phương pháp tiến hóa vi phân dựa thơng tin định hướng (ii) Đề xuất thuật toán lập lịch luồng cơng việc mơi trường điện tốn đám mây MODE dựa phương pháp tiến hóa vi phân Phương pháp tiến hóa vi phân dựa thơng tin đối xứng Định nghĩa (Tính đối xứng): cho x số thực, x  [a,b] Khi phần tử đối xứng x, ký hiệu x tính sau: x  ab x Nếu a =0, b=1 ta có: x   x 17 Định nghĩa ( Tính đối xứng khơng gian n chiều): xét điểm p(x1, x2, ,xn) không gian n chiều, với xi R xi [ai, bi] Khi điểm đối xứng p kí hiệu p  ( x1 , x2 , , xn ) tính sau: xi   bi  xi ; i  1,2, , n Phương pháp OBL: bước lặp phương pháp OBL với điểm p(x1, x2,…,xn) ta tính điểm đối xứng p  ( x1 , x2 , , xn ) p, f ( p)  f ( p) điểm p thay điểm p (với f hàm mục tiêu tốn) q trình tìm kiếm tiếp tục với tập điểm tìm Thuật tốn đề xuất MODE Thuật tốn MODE (Modified Opposition-Based Differential Evolution) thuật toán lập lịch luồng cơng việc mơi trường điện tốn đám mây nhằm cực tiểu hóa makespan, thuật tốn làm việc theo ngun tắc thuật tốn tiến hóa vi phân dựa thơng tin đối xứng, nhiên thuật tốn cải tiến điểm sau: (i) Định nghĩa phương pháp lấy đối xứng cho cá thể quần thể (ii) Sử dụng phương pháp lựa chọn theo vòng dựa xếp hạng cá thể để chọn cá thể cho trình đột biến nhằm sinh cá thể tốt cho hệ (iii) Sử dụng thông tin đối xứng cá thể dựa theo đặc trưng tốn CLOS q trình tìm kiếm Phương pháp tìm cá thể đối xứng Theo phương pháp tiến hóa vi phân dựa thơng tin đối xứng, bước khởi tạo bước lặp thuật tốn cần phải tìm quần thể đối xứng với quần thể Dựa đặc trưng toán CLOS, phần đề xuất phương pháp tìm cá thể đối xứng sau: 18 Kí hiệu: a = Max{P(Si )}; i=1,2,…,N; P(Si) lực tính tốn máy chủ Si b = Min{P(Si)}; i=1,2,…,N Cá thể xik = (Si(1), Si(2), ,Si(M)) với Si(j) {S1, S2,…,SN} j=1,2,…,M k Định nghĩa 1: cá thể đối xứng cá thể xik định nghĩa cá thể x i với thành phần (S i (1) , S i ( 2) , , S i ( M ) ) tính sau: S i ( j )  a  b  P(Si ( j ) ); j  1,2, , M (Error! No tex Với P( Si ( j ) ) lực tính toán máy chủ Si ( j ) Cách thức gán định danh máy chủ cho thành phần vector vị trí: để gán định danh cho thành phần thứ j vector k x i  ( S i (1) , S i ( 2) , , S i ( N ) ) ta tìm máy chủ có lực tính tốn gần với giá trị thành phần j S i ( j ) gán định danh máy chủ k cho thành phần thứ j vector x i Công thức gán sau: k x ij  k ; P( S k )  P( S i ( j ) )  P( S r )  P( S i ( j ) ) , S r (Error! No text of specified style in document 4) Phương lựa chọn theo vòng dựa xếp hạng cá thể Trong phương pháp DE ODE toán tử đột biến tính tốn dựa việc lựa chọn cách ngẫu nhiên hai cá thể cha mẹ, sau tính vector đột biến vi theo công thức: vi(t)  pbest + F(p1- p2) Sử dụng chiến lược đột biến best/1 thường cho chất lượng lời giải tốt tốc độ hội tụ nhanh chiến lược rand/1, rand/2 Thuật toán cải tiến MODE tác giả sử dụng phương pháp lựa chọn theo vòng dựa xếp hạng cá thể (RBRWS) để chọn cá thể cho 19 trình đột biến, phương pháp RBRWS sử dụng nhiều thuật tốn tiến hóa kiểm chứng giảm hội tụ sớm tới vùng cực trị địa phương, tránh phụ thuộc vào tính chất đồng giá trị hàm mục tiêu trình lựa chọn [76] Phương lựa chọn theo vòng dựa xếp hạng cá thể (Rank-based Roulette Wheel Selection – RBRWS) [76] phương pháp lựa chọn cá thể xác suất lựa chọn cá thể định dựa hạng cá thể quần thể, với hạng cá thể tính tốn theo giá trị hàm mục tiêu đạt cá thể Phương pháp tính giá trị hàm mục tiêu cho tất cá thể quần thể xếp chúng theo chiều tăng dần giá trị hàm mục tiêu tính được, sau cá thể gán giá trị vị trí từ đến NP (NP số cá thể quần thể) theo nguyên tắc cá thể có giá trị hàm mục tiêu nhỏ ứng với vị trí NP, cá thể NP -1,…, cá thể có giá trị hàm mục tiêu lớn có vị trí Hạng cá thể quần thể tính theo công thức sau: ranki   SP   ( SP  1)  posi  NP 1 (Error! No text of specified style in document 5) đó: + pos giá trị vị trí cá thể i + SP số đoạn [1.0, 2.0] Thực nghiệm Tham số môi trường điện toán đám mây luồng liệu thực nghiệm trình bày chi tiết bảng PL1-1 đến PL1-39 PL2-1 đến PL2-3 Kết thực nghiệm thuật toán MODE trình bày chi tiết bảng 3-2, 3-3 3-4 luận án 20 Đánh giá chất lượng lời giải thuật toán MODE Với liệu chuẩn tác giả tiến hành thực nghiệm thuật toán cách độc lập với 30 lần thử, tham số băng thông máy chủ, tốc độ tính tốn máy chủ thiết lập môi trường mô CloudSim cách quán cho tất thuật toán lần thử nghiệm Kết thực nghiệm bảng 3-2, 3-3 3-4 chất lượng lời giải thuật tốn MODE ln tốt thuật tốn Random, RRTSM, PSO_H EGA tham số độ lệch chuẩn, giá trị trung bình giá trị tốt Giá trị trung bình tìm thuật tốn MODE nhỏ giá trị trung bình tìm thuật toán PSO_H từ 2% - 9%, với liệu thực nghiệm có khối lượng liệu truyền tác vụ nhỏ giá trị trung bình tìm thuật tốn MODE nhỏ thuật toán PSO_H từ 13% 29% So với thuật toán EGA giá trị trung bình tìm MODE nhỏ từ 1.1% - 11% Giá trị tốt tìm thuật toán MODE nhỏ giá trị tốt tìm thuật tốn PSO_H từ 2.1% - 12.5%, với liệu thực nghiệm có khối lượng liệu truyền qua lại tác vụ luồng cơng việc nhỏ giá trị tốt tìm thuật tốn MODE nhỏ giá trị tốt tìm thuật tốn PSO_H từ 14.5% - 24.6% Giá trị tốt tìm MODE nhỏ so với giá trị tốt tìm thuật toán EGA từ 1.2% - 9.4% Với số liệu chuẩn lời giải tốt tìm thuật tốn MODE với giá trị tối ưu tìm thuật tốn vét cạn liệu chuẩn T1032, T1031, T1034, T1035,…, với liệu khác lời giải tốt tìm thuật tốn MODE có tỷ lệ sai lệch so với giá trị tối ưu tìm vét cạn từ 0.2% đến 4.3% Kết chi tiết trình bày bảng 3-5, thuật tốn MODE có độ lệch chuẩn nhỏ hầu 21 hết liệu thử nghiệm, giá trị lệch chuẩn thuật toán MODE nằm đoạn [0, 4.2], đồng thời chênh lệch giá trị trung bình giá trị tốt liệu thực nghiệm nhỏ, điều chứng tỏ chất lượng lời giải thuật toán MODE tốt ổn định hầu hết liệu thực nghiệm So sánh thuật toán MODE với thuật toán khác Định hướng trường hợp sử dụng thuật toán đề xuất PSOi_H, LPSO_H MODE Trên sở khảo sát thực nghiệm thuật toán theo tham số độ lệch chuẩn, giá trị trung bình, giá trị tốt thời gian chiếm dụng CPU, luận án đề xuất hướng áp dụng thuật toán PSOi_H, LPSO_H MODE cho loại liệu cụ thể sau: • Các đồ thị luồng cơng việc phức tạp có nhiều tác vụ phân chia tập hợp liệu, với số tác vụ lớn khối lượng liệu cần truyền tác vụ luồng công việc lớn thuật tốn MODE cho chất lượng lời giải tốt nhất, nhiên thời gian sử dụng CPU máy chủ thuật toán MODE lớn (xem bảng 3-6) Do cần thực việc lập lịch cho luồng công việc phức tạp với khối 22 lượng liệu cần truyền tác vụ lớn nên sử dụng thuật tốn MODE • Các đồ thị luồng cơng việc có cấu trúc đơn giản với hệ số  nhỏ đồ thị luồng cơng việc có cấu trúc dạng đường ống song song, liệu truyền qua lại tác vụ luồng cơng việc thuật tốn PSOi_H cho chất lượng lời giải tốt tương đương với hai thuật toán LPSO_H MODE, nhiên thời gian chiếm dụng CPU so với hai thuật tốn LPSO_H MODE (xem bảng 3-7) Do với đồ thị luồng cơng việc có cấu trúc đơn giản, hệ số  nhỏ khối lượng liệu cần truyền tác vụ nhỏ nên chọn thuật tốn PSOi_H • Các đồ thị luồng cơng việc có cấu trúc phức tạp với hệ số  lớn, có nhiều tác vụ tập hợp phân phối liệu luồng công việc, khối lượng liệu cần truyền tác vụ nhỏ thuật tốn LPSO_H cho chất lượng lời giải tốt so với thuật toán PSOi_H, tương đương chất lượng lời giải thuật toán MODE Tuy nhiên thời gian chiếm dụng CPU thuật toán LPSO_H nhỏ so với thuật toán MODE (xem bảng 3-8) Do trường hợp nên sử dụng thuật toán LPSO_H KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Từ nội dung nghiên cứu luận án rút kết luận sau: a Các kết luận án • Phát biểu tường minh tốn CLOS dạng cơng thức tốn học, xếp loại theo phương pháp phân loại Gramham chứng minh toán CLOS thuộc lớp NP-Khó Theo tài liệu cơng bố cho 23 tới mà chúng tơi tìm được, lần toán phát biểu thức đặt tên • Trình bày tổng quan phương pháp giải toán lập lịch luồng công việc theo hai hướng tiếp cận heuristic metaheuristic, đồng thời đánh giá ưu nhược điểm phương pháp tiếp cận • Trình bày số luồng công việc ứng dụng khoa học thực tiễn số luồng công việc ngẫu nhiên làm liệu mẫu cho thực nghiệm thuật tốn • Đề xuất ba thuật toán dựa phương pháp tối ưu bày đàn tiến hóa vi phân để giải tốn CLOS b Những đóng góp luận án • Thứ nhất: mơ tả tốn Lập lịch luồng cơng việc mơi trường điện tốn đám mây dạng ngôn ngữ tự nhiên dạng ký pháp Graham, đề xuất mơ hình tốn học cho toán, phát biểu toán dạng ràng buộc tốn học thuộc lớp NP-Khó • Thứ hai: Đề xuất hai thuật toán giải toán CLOS theo phương pháp tối ưu bày đàn PSOi_H, LPSO_H thuật toán giải toán CLOS theo phương pháp tiến hóa vi phân MODE • Thứ 3: Kết thực nghiệm liệu thực nghiệm với tính đa dạng tham số mơi trường điện tốn đám mây băng thơng, tốc độ tính tốn máy chủ nhiều dạng đồ thị luồng công việc khác rằng: Các thuật toán đề xuất cho chất lượng lời giải tốt thuật toán đối chứng Random, RRTSM, PSO_H EGA 24 c Hướng phát triển luận án Luận án đề xuất ba thuật toán gần cho toán CLOS, để kiểm chứng thuật tốn phải so sánh lời giải chúng với lời giải tối ưu Chúng tìm lời giải tối ưu thơng qua phương pháp vét cạn, nhiên phương pháp khả thi liệu kích thước nhỏ Trong thời gian tới sử dụng công cụ lập trình song song kết hợp với phương pháp nhánh cận để tìm lời giải tối ưu cho liệu kích thước vừa lớn, qua kiểm chứng rõ thuật toán đề xuất đồng thời làm phong phú thêm liệu thực nghiệm mà công bố Một hướng nghiên cứu khác mà theo đuổi áp dụng phương pháp dự báo nhu cầu tiêu thụ tài nguyên đám mây khách hàng tương lai gần, từ lập lịch hiệu cho việc phân bổ tài ngun đám mây DANH MỤC CÁC CƠNG TRÌNH KHOA HỌC ĐÃ CƠNG BỐ [1] Phan Thanh Tồn, Kiều Tuấn Dũng, Nguyễn Thế Lộc, Nguyễn Doãn Cường, “Sắp xếp lịch biểu thực thi luồng công việc đám mây điện toán”, Hội thảo quốc gia lần thứ XVI, số vấn đề chọn lọc công nghệ thông tin truyền thông (@ 2013), pp 285-290, 2013 [2] Phan Thanh Tồn, Nguyễn Thế Lộc, Nguyễn Dỗn Cường, Đỗ Như Long, “Thuật tốn lập lịch luồng cơng việc theo phương pháp tối ưu bày đàn mơi trường điện tốn đám mây”, tạp chí Nghiên cứu khoa học Cơng nghệ quân sự, pp 132-138, 2015 [3] Phan Thanh Toàn, Nguyễn Thế Lộc, Nguyễn Doãn Cường, Đỗ Như Long, “Giải thuật tối thiểu hóa chi phí thực thi luồng cơng việc mơi trường điện tốn đám mây”, Tạp chí khoa học trường đại học Sư Phạm Hà Nội, pp 47-55, 2015 [4] Phan Thanh Toàn, Nguyễn Thế Lộc, Nguyễn Dỗn Cường , “Thuật tốn lập lịch luồng cơng việc mơi trường điện tốn đám mây”, Proc Of the 8th National Conference on Foundamental and Applied Information Techonoly Research (FAIR’8), pp 687-693, 2015 [5] Phan Thanh Toàn, Nguyễn Thế Lộc, Nguyễn Dỗn Cường, “Thuật tốn lập lịch luồng cơng việc mơi trường điện tốn đám mây dựa chiến lược tối ưu bày đàn”, tạp chí Cơng nghệ thông tin Truyền thông, pp 15-20, 2015 [6] Phan Thanh Tồn, Nguyễn Thế Lộc, Nguyễn Dỗn Cường, “A Novel Workflow Scheduling Algorithm in Cloud Environment”, Proc Of 2015 2nd National Foundation for Science and Technology Development Conference on Information and Computer Science (NICS’2015), pp 125-129, 2015 [7] Phan Thanh Tồn, Nguyễn Thế Lộc, Nguyễn Dỗn Cường, Trần Đăng Hưng, “MODE: Hướng tiếp cận cho việc thực thi luồng cơng việc”, tạp chí khoa học Cơng nghệ thơng tin Truyền thông, tập 1, số 1, pp 63-70, 2016 [8] Phan Thanh Tồn, Nguyễn Thế Lộc, Nguyễn Dỗn Cường , “Thuật toán LPSO lập lịch cho ứng dụng khoa học mơi trường điện tốn đám mây”, tạp chí Khoa học Cơng nghệ, Viện hàn lâm khoa học Việt Nam, pp 287-299, 2016 [9] Phan Thanh Toàn, Nguyễn Thế Lộc, Nguyễn Doãn Cường, “A Robus and Effective MODE Algorithm for Workflow Scheduling in Cloud Enveronment”, Proc Of The 7th International Symposium on Information and Communication Technology (SoICT’2016), pp 259-264, 2016 [10] Toan Phan Thanh, Loc Nguyen The, Said Elnaffar and Cuong Nguyen Doan, "LPSO: Another Algorithm for Workflow Scheduling in the Cloud", Journal of Computer Science, ISSN: 1549-3636, DOI: 10.3844/jcssp.2016, pp.611617, Volume 12, Issue 12, 2016 ... Thuật toán đàn truyền kiến Các giải thuật dựa Metaheuristics Lập lịch dựa tác vụ Phương pháp tối ưu bày đàn Thuật tốn luyện thép Phương pháp tiến hóa vi phân Hình 1.13: Phân lớp giải thuật lập lịch. .. trình bày mơ hình tốn lập lịch luồng cơng vi c mơi trường điện tốn đám mây, phân lớp phương pháp giải toán lập lịch chứng minh toán đề xuất CLOS thuộc lớp NP-Khó Mơ hình tốn lập lịch luồng cơng vi c... định Phân bậc Hình 1.12: Phân loại phương pháp lập lịch Cục Toàn cục Các giải thuật lập lịch tĩnh Các giải thuật dựa heuristics Lập lịch dựa Lập lịch dựa quyền phân ưu tiên cụm tác vụ Thuật toán

Định dạng
Số trang	27
Dung lượng	819,8 KB