1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nâng cao hiệu năng cân bằng tải trên điện toán đám mây

133 14 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nâng Cao Hiệu Năng Cân Bằng Tải Trên Điện Toán Đám Mây
Tác giả Nguyễn Xuân Phi
Người hướng dẫn PGS.TS. Trần Công Hùng
Trường học Học viện Công nghệ Bưu chính Viễn thông
Chuyên ngành Hệ thống thông tin
Thể loại luận án tiến sĩ
Năm xuất bản 2022
Thành phố Hà Nội
Định dạng
Số trang 133
Dung lượng 751,32 KB

Cấu trúc

  • 1. Lý do chọnđềtài (12)
  • 2. Mục tiêu củaluậnán… (14)
  • 3. Phạmvi,đốitượngvàphươngphápnghiêncứu (14)
  • 4. Các đóng góp củaluậnán… (14)
  • 5. Bố cụcluậnán… (15)
    • 1.1. Cân bằng tải trên điện toánđámmây (17)
      • 1.1.1. Giớithiệuchungvềđiệntoánđámmây (17)
      • 1.1.2. Cân bằng tải và hiệu năng cân bằng tải trên điện toánđámmây (21)
      • 1.1.3. Sự cần thiết của cân bằng tải trên điện toánđámmây (22)
      • 1.1.4. Ảo hóa và quản lý máy ảo trênđámmây (24)
      • 1.1.5. Quản lý và phân bổ tài nguyên trênđámmây (0)
    • 1.2. Bài toán cânbằngtải… (28)
      • 1.2.1. Phát biểu bài toán và mô hìnhnghiêncứu (28)
      • 1.2.2. Cácyếutốảnhhưởngđếncânbằngtải (30)
      • 1.2.3. Phân loại các thuật toán cânbằngtải (34)
      • 1.2.4. Đo lường cânbằngtải (37)
    • 1.3. Các hướng giải quyết bài toán cânbằngtải… (38)
      • 1.3.1. Phương phápxấpxỉ (38)
      • 1.3.2. Chiếnlượclậplịchphânbổtàinguyên (0)
      • 1.3.3. Phương pháp cải tiến cácthamsố (44)
    • 1.4. Các vấn đề mà luận án cầngiảiquyết… (50)
    • 1.5. Kết luậnChương1 (51)
    • 2.1. Đặtvấnđề (53)
    • 2.2. ThuậttoánLBAIRT… (54)
      • 2.2.1. Cơ sởlýthuyết (54)
      • 2.2.2. Đề xuấtthuậttoán (57)
      • 2.2.3. Kết quảmôphỏng… (63)
    • 2.3. ThuậttoánRRTA (68)
      • 2.3.1. Đề xuấtthuậttoán (68)
      • 2.3.2. Thực nghiệmmôphỏng… (72)
    • 2.4. Kết luậnChương2 (80)
  • CHƯƠNG 3. PHÁT TRIỂN MỘT SỐ THUẬT TOÁN CÂN BẰNG TẢI NHẰM CẢI THIỆN THỜI GIAN XỬ LÝ TRÊN ĐIỆN TOÁN ĐÁM MÂY (16)
    • 3.1. Đặtvấnđề (82)
    • 3.2. ThuậttoánTMA (83)
      • 3.2.1. Đề xuấtthuậttoán… (83)
      • 3.2.2. Kết quảmôphỏng… (85)
      • 3.2.3. Đánhgiá… (93)
    • 3.3. ThuậttoánMMSIA… (93)
      • 3.3.1. Giới thiệu thuật toán Max–Min (94)
      • 3.3.2. Đề xuất thuậttoánMMSIA (96)
      • 3.3.3. Kết quảmôphỏng (99)
    • 3.4. Kết luậnChương3 (0)
    • I. Những kết quả chính củaluậnán… (107)
    • II. Hướng phát triển củaluậnán… (109)

Nội dung

Nâng cao hiệu năng cân bằng tải trên điện toán đám mây.Nâng cao hiệu năng cân bằng tải trên điện toán đám mây.Nâng cao hiệu năng cân bằng tải trên điện toán đám mây.Nâng cao hiệu năng cân bằng tải trên điện toán đám mây.Nâng cao hiệu năng cân bằng tải trên điện toán đám mây.Nâng cao hiệu năng cân bằng tải trên điện toán đám mây.Nâng cao hiệu năng cân bằng tải trên điện toán đám mây.Nâng cao hiệu năng cân bằng tải trên điện toán đám mây.Nâng cao hiệu năng cân bằng tải trên điện toán đám mây.Nâng cao hiệu năng cân bằng tải trên điện toán đám mây.

Lý do chọnđềtài

Theo thống kê, nếu lượng dữ liệu truyền trên hệ thống mạng toàn cầu được lưu trữ trên đĩa DVD, số lượng đĩa này sẽ xếp hàng có chiều dài gấp 2 lần quãng đường từ Trái Đất đến Mặt Trăng và dự báo sẽ tăng thêm 44 lần vào năm 2020 Dự báo của Viettel IDC cho thấy điện toán đám mây đóng vai trò quan trọng trong việc ứng phó với cuộc khủng hoảng COVID-19, khi các doanh nghiệp cố gắng duy trì hoạt động từ xa, dẫn đến sự tăng trưởng doanh thu của các nhà cung cấp dịch vụ đám mây Theo Forrester, điện toán đám mây đã thúc đẩy nhanh quá trình chuyển đổi số của doanh nghiệp sau đại dịch, với dự đoán thị trường cơ sở hạ tầng đám mây công cộng sẽ tăng trưởng 35%, đạt 120 tỷ USD vào năm 2021 Thêm vào đó, theo Thời báo Ngân hàng, thị trường điện toán đám mây tại Việt Nam đang bùng nổ nhờ vào cuộc cách mạng 4.0 và chương trình chuyển đổi số quốc gia đến năm 2025, với chi tiêu toàn cầu cho dịch vụ điện toán đám mây công cộng năm 2020 đạt 257,5 tỷ USD, dự báo tăng khoảng 40% lên 362,2 tỷ USD vào năm 2022.

Truyềnthông,thịtrườngđiệntoánđámmâyViệtNamnăm2020đạtkhoảng3.200tỷđồng(tươngđ ương133triệuUSD),dựbáođếnnăm2025,sẽđạt500triệuUSD.MộtcuộckhảosátgầnđâycủaViện GiátrịdoanhnghiệpIBM(IBV)chothấy56%doanh nghiệpViệtNamđãvàđangsửdụngnềntảngquảnlýđámmây.

Với sự bùng nổ công nghệ, người dùng trên toàn thế giới đang đối mặt với nhiều thách thức lớn liên quan đến xử lý dữ liệu, an toàn dữ liệu và đặc biệt là cân bằng tải truy cập Điện toán đám mây nổi bật như một nền tảng lý tưởng để lưu trữ dữ liệu, cung cấp dịch vụ tính toán với chi phí tối thiểu và khả năng truy cập mọi lúc mọi nơi.

(1) http://cloudvps.vn/dien-toan-dam-may-thach-thuc-va-co-hoi/

(2) https://viettelidc.com.vn/tin-tuc/du-doan-xu-huong-dien-toan-dam-may-nam-2021

(3) https://vticloud.io/forrester-du-doan-nam-2021-dien-toan-dam-may-day-nhanh-qua-trinh-chuyen-doi-cua- doanh-nghiep-sau-dai-dich-covid19/

Điện toán đám mây đang bùng nổ và trở thành lựa chọn hàng đầu cho nhiều doanh nghiệp, đặc biệt trong lĩnh vực trung tâm dữ liệu Với tính linh động và khả năng mở rộng dễ dàng, điện toán đám mây cung cấp dịch vụ theo nhu cầu sử dụng, giúp tiết kiệm chi phí đầu tư vào phần cứng Để nâng cao hiệu quả hoạt động, việc cân bằng tải trở thành yếu tố then chốt, hỗ trợ các giao dịch diễn ra nhanh chóng và an toàn Sự phát triển nhanh chóng của ứng dụng trên nền tảng đám mây đòi hỏi cải tiến liên tục trong cơ chế cân bằng tải, nhằm đáp ứng tốt hơn cho môi trường điện toán đám mây đang ngày càng phức tạp.

Hiện nay, sự bùng nổ của Internet đã đặt ra nhiều thách thức trong việc trao đổi dữ liệu và phân bổ tài nguyên máy tính cho các tổ chức, doanh nghiệp Nhiều nghiên cứu đã được thực hiện nhằm nâng cao khả năng cân bằng tải trong môi trường điện toán đám mây Một trong những phương pháp được đề xuất là cân bằng động với khả năng giám sát tập trung, quản lý trạng thái của từng yêu cầu một cách tập trung để cải thiện khả năng lập lịch và kiểm tra tình trạng các bộ xử lý Vấn đề này thu hút sự quan tâm lớn từ các nhà khoa học và đã đạt được nhiều thành tựu trong các công trình nghiên cứu.

[42], [83], [84], [108] Vì vậy, việc nghiên cứu cải tiến hiệu năng cân bằng tải cho điện toán đám mây là một cách tiếp cận của đề tài.

Việc nghiên cứu các giải pháp mới nâng cao cân bằng tải là vấn đề cấp thiết trong lĩnh vực hệ thống thông tin Đề tài “Nâng cao hiệu năng cân bằng tải trên điện toán đám mây” được thực hiện trong khuôn khổ luận án tiến sĩ nhằm cải tiến các thuật toán cân bằng tải Thách thức lớn với đề tài này đến từ sự bùng nổ dữ liệu trên Internet, với mỗi loại dữ liệu có đặc thù và phương pháp xử lý riêng Do đó, việc lựa chọn kỹ thuật phù hợp để cải tiến cân bằng tải là rất quan trọng, góp phần nâng cao chất lượng dịch vụ đám mây cho người dùng.

Mục tiêu củaluậnán…

- Mục tiêu thứ hai: Nghiên cứu, phát triển một số thuậttoáncân bằng tải nhằm cải thiện thời gian xử lýtrênđiện toán đámmây.

Phạmvi,đốitượngvàphươngphápnghiêncứu

- Đốitượngnghiêncứu:Cácthuậttoáncânbằngtải,cácthamsốảnhhưởngđến cân bằng tải, các phươngphápđánh giá thuậttoáncân bằng tải trên điện toán đámmây.

- Phươngphápnghiêncứu:Xâydựngmôhình;Càiđặt/thửnghiệmmôhìnhtrên cácphầnmềmmôphỏng;Sosánh,đánhgiákếtquảsovớicácthuậttoánkhác.

Các đóng góp củaluậnán…

 Đónggópthứnhất:Đ ề xuất02thuậttoáncânbằngtảinhằmgiảmthờigianđáp ứngtrênđiệntoánđámmây.Cáckếtquảnghiêncứucôngbốtrongcáccôngtrình (CT4) và(CT7):

- ThuậttoánLBAIRT(CT4):ĐiểmmớicủathuậttoánLBAIRTlàxétthêmsố thamsốthờigianhoànthànhcácyêucầudựkiếncủamỗitàinguyên(VM).

KếtquảmôphỏngchothấyLBAIRTcótỉlệchấpnhậnyêucầuđầuvàocao hơn, trong khi thời gian tính toán trung bình thấp hơn các công trình liên quan.

Thuật toán RRTA (CT7) mang đến điểm mới bằng cách áp dụng thuật toán dự báo ARIMA để dự đoán thời gian đáp ứng Từ đó, nó cung cấp giải pháp phân phối tài nguyên hợp lý, tối ưu hóa hiệu suất và nâng cao khả năng đáp ứng của hệ thống.

 Đónggópthứhai:Đềxuất02thuậttoáncânbằngtảivớimụcđíchcảithiệnthờigianxửlýtrên điệntoánđámmây.Cáckếtquảnghiêncứucôngbốtrongcáccôngtrình(CT5) và(CT6):

Thuật toán TMA (CT5) đã cải tiến hiệu suất bằng cách sử dụng hai bảng chỉ mục trạng thái của các máy ảo (VM) Kết quả thu được từ thuật toán đề xuất cho thấy sự giảm thiểu số lượng yêu cầu xếp hàng chờ phân phối, đồng thời cải thiện đáng kể thời gian xử lý và thời gian phản hồi của các trung tâm đám mây so với hai thuật toán truyền thống là Round Robin và Throttled.

- ThuậttoánMMSIA(CT6):Điểmmớicủathuậttoánlànhómcácyêucầuvà các máy ảo theo thời gian hoàn thành dự kiến và thời gian thực hiện hoàn thànhtổngthể.Thựcnghiệmchothấythuậttoánđãcảithiệnthờigianxửlý các yêu cầu đầu vào.

Cáckếtquảnghiêncứucủaluậnánlànhữngđónggópmớicholĩnhvựccânbằngtảitrênđiện toánđámmây,giúpgiảiquyếtbàitoánnângcaokhảnăngcânbằngtảitrênnền tảngđám mây Các thuật toán này không chỉ là cơ sở để tìm ra phương pháp tối ưu cân bằng tải hiệu quả cho dịch vụ đám mây mà còn nâng cao mức độ hài lòng của người sử dụng.

Bố cụcluậnán…

Cân bằng tải trên điện toánđámmây

1.1.1 Giới thiệu chung về điện toán đámmây Điệntoánđámmâyrađờitừnhữngnăm1950[66],khimáychủtínhtoánquy môlớnđượctriểnkhaitạimộtsốcơsởgiáodụcvàtậpđoànlớntạiMỹ.Trongnhữngnăm1960– 1990,xuấthiệnluồngýtưởngcoimáytínhhaytàinguyêncôngnghệthôngtincóthểđượctổch ứcnhưhạtầngdịchvụcôngcộng,đâylàtiềnđềlớnchosựpháttriểnsaunàycủađiệntoánđámmây. Vàonăm2006,CôngtyAmazoncungcấp nềntảngAmazonWebServices(AWS),đánhdấuviệcthươngmạihóađiệntoánđámmây.Từđầu năm2008,Eucalyptusđượcgiớithiệulànềntảngđiệntoánđámmâymã nguồnmởđầutiên,tươngthíchvớiAPIcủaAWS.Tínhtớithờiđiểmhiệntại,córất nhiềucácsảnphẩmđiệntoánđámmâyđượcđưaranhưGoogleAppEngine,Microsoft Azure,Nimbus. Điệntoán đámmây,còn gọi là điện toán máy chủ ảo, là mô hình điện toán sửdụngcác công nghệ máy tính và phát triển dựa vào mạng Internet Thuật ngữ

"đámmây"ởđâychỉđộphứctạpcủacáccơsởhạtầngmạngInternet.Trongmôhìnhđiện toánđámmây,cho phép người sử dụng truy cập các dịch vụ công nghệ từ nhà cung cấpđiệntoánđámmâymàkhôngcầnquantâmđếnhạtầngmạng.TheotổchứcIEEE,"Nólàhìnhmẫu trongđó thôngtinđượclưutrữthườngtrựctạicácmáychủtrên

Internetvà chỉ được lưu trữ tạm thời ở các máy khách, bao gồm máy tính cá nhân,trungtâmgiảitrí,máytínhtrongdoanhnghiệp,cácphươngtiệnmáytínhcầmtay, "

Hình 1.1 Mô hình điện toán đám mây

Điện toán đám mây, theo định nghĩa của Viện Quốc gia Tiêu chuẩn và Công nghệ Mỹ (NIST), là mô hình điện toán cho phép truy cập tài nguyên tính toán qua mạng một cách nhanh chóng và thuận tiện Mô hình này bao gồm khả năng cung cấp dịch vụ theo yêu cầu, cho phép người dùng truy cập từ nhiều thiết bị khác nhau và chỉ phải trả chi phí cho tài nguyên đã sử dụng NIST đã đưa ra bốn mô hình triển khai và hai mô hình dịch vụ cơ bản, nhấn mạnh sự linh hoạt và khả năng mở rộng của điện toán đám mây Sự phát triển nhanh chóng của điện toán đám mây đã giúp tối ưu hóa việc quản lý tài nguyên, đồng thời đáp ứng nhu cầu lưu trữ và xử lý dữ liệu ngày càng tăng, với các trung tâm dữ liệu ngày càng trở nên khổng lồ, có thể lên tới hàng triệu máy chủ trên toàn cầu.

Khả năng truy cập rộng rãi của dịch vụ điện toán đám mây cho phép người dùng sử dụng bất kỳ thiết bị nào có kết nối internet, bao gồm máy tính, laptop và thiết bị di động.

- Tựcấpdịchvụtheonhucầu:Ngườidùngđượccấptàinguyêntheonhucầumột cách tự động, không cần sự can thiệp từ nhà cung cấp dịchvụ.

- Khôngphụthuộcvịtríđịalý: Tàinguyêntrêndịchvụđiệntoánđámmâyđược điều phối và chia sẻ linh hoạt Người dùng không biết và không thể điều khiển được vị trí tàinguyên.

- Tính co giãn nhanh: Tài nguyên trên dịch vụ “đám mây” có thể được cấp phát hoặcthuhồimộtcáchnhanhchóng,linhhoạtvàcókhảnăngthayđổitàinguyên tăng lên hoặc giảm xuống theo nhu cầu sửdụng.

Dịch vụ đo lường trong điện toán đám mây cho phép các hệ thống tự động điều khiển, tinh chỉnh và giám sát tài nguyên hiệu quả Điện toán đám mây được phân chia thành ba loại mô hình dịch vụ chính, mỗi loại mang đến những tính năng và lợi ích riêng biệt cho người dùng.

Nhà cung cấp phát triển nhiều ứng dụng hoàn chỉnh để phục vụ nhu cầu người dùng, với các ứng dụng được lưu trữ trên máy chủ hoặc tải xuống thiết bị của khách hàng Người dùng chỉ cần sử dụng dịch vụ mà không cần lo lắng về các vấn đề kỹ thuật Ví dụ về các dịch vụ này bao gồm email, Zalo, Google Docs, Google Calendar, Google Translate, SmallPDF, OneDrive, Evernote, Facebook, và Twitter.

Cung cấp các cách thức và tính năng cần thiết cho việc xây dựng ứng dụng trên nền tảng cụ thể là rất quan trọng Hai dạng hạ tầng phổ biến là hạ tầng trao đổi thông tin ứng dụng (middleware) và nền tảng ứng dụng (application server), sử dụng các công cụ và ngôn ngữ lập trình nhất định Người dùng có thể triển khai ứng dụng mà không cần lo lắng về chi phí hay thông số phần cứng và phần mềm bên dưới Ví dụ về các nền tảng này bao gồm Google App Engine, Openshift, Salesforce, và Microsoft Azure.

Nhà cung cấp hạ tầng phần cứng triển khai các dịch vụ như máy ảo (VM), mạng và vùng lưu trữ trên hệ thống phân tán, cho phép người dùng quản lý và sử dụng tài nguyên mà không cần biết thông tin hạ tầng thực tế bên trong “đám mây” Người dùng có quyền yêu cầu mở rộng tài nguyên theo nhu cầu Một số ví dụ điển hình về các dịch vụ này bao gồm Amazon EC2/S3, Elastra (Beta 2.0, 2/2009), Nirvanix và AppNexus.

Hình 1.2 Các dịch vụ điện toán đám mây

Dịch vụ Người dùng Dịch vụ Người dùng Dịch vụ Người dùng Ứng dụng X X X

Hệ điều hành X X X Ảo hóa X X X

Mạng kết nối X X X Ứng dụng X X X

Hình 1.3 Mức độ cung cấp dịch vụ của các mô hình điện toán đám mây

Cân bằng tải là kỹ thuật phân phối lưu lượng mạng giữa nhiều máy chủ nhằm ngăn ngừa tình trạng quá tải cho bất kỳ máy chủ nào, từ đó nâng cao khả năng đáp ứng của ứng dụng Kỹ thuật này giúp giảm thiểu tối đa tình trạng máy chủ bị quá tải và ngưng hoạt động, đồng thời cải thiện năng suất hoạt động tổng thể của hệ thống khi một máy chủ gặp sự cố Cân bằng tải tập trung vào việc phân phối tài nguyên đồng đều, giảm độ trễ và nâng cao hiệu suất sử dụng hệ thống Ngoài ra, nó còn hỗ trợ các ứng dụng có kích thước thay đổi và giảm tiêu thụ năng lượng, đồng thời đáp ứng các yêu cầu về chất lượng dịch vụ (QoS) và thỏa thuận mức dịch vụ (SLA) Các nhà cung cấp đám mây cần áp dụng kỹ thuật cân bằng tải hiệu quả để tối ưu hóa việc phân phối khối lượng công việc và đảm bảo sự hài lòng của người dùng.

Các thuật toán cân bằng tải trong điện toán đám mây phải giải quyết nhiều vấn đề cụ thể, bao gồm bản chất, quy mô, sự phụ thuộc và khả năng chia nhỏ của yêu cầu, cùng với độ phức tạp của thuật toán và kiến trúc phần cứng Việc thiết kế các thuật toán này cần xem xét những yếu tố trên để nâng cao hiệu suất cân bằng tải, đồng thời cải thiện các tham số như thời gian đáp ứng, thời gian xử lý, thời gian chờ và độ trễ Mặc dù bài toán cân bằng tải không có lời giải tối ưu, nhưng khi cải thiện các tham số này, các thuật toán phải chấp nhận hy sinh một số tham số khác trong giới hạn cho phép Nâng cao hiệu năng cân bằng tải là mục tiêu chính của các thuật toán thông qua việc tối ưu hóa các tham số ảnh hưởng, nhằm giảm chi phí thời gian phục vụ và cải thiện trải nghiệm người dùng.

Sự phát triển không ngừng của điện toán đám mây đã làm nổi bật vấn đề trao đổi và xử lý dữ liệu, đặc biệt là cân bằng tải trong hệ thống Khi quy mô và số lượng ứng dụng gia tăng, việc truyền tải dữ liệu trở nên dễ bị quá tải Các ngành công nghiệp hiện nay đang sử dụng dịch vụ điện toán đám mây để giảm thiểu cơ sở hạ tầng và chi phí bảo trì, dẫn đến tải trọng ngày càng tăng Do đó, cần áp dụng một hoặc nhiều phương pháp để đảm bảo không có nút nào bị quá tải và tải được phân phối đồng đều giữa các nút Một thuật toán cân bằng tải lý tưởng sẽ giúp tối ưu hóa việc sử dụng tài nguyên, đảm bảo không có nút nào bị quá tải hoặc dưới tải Các mục tiêu của cân bằng tải liên quan đến hiệu quả sử dụng tài nguyên và khả năng đáp ứng của hệ thống.

 Sử dụng tài nguyên tốiưu.

 Điều phối thông lượng tối ưu và đồng đều trên các nútmạng.

 Thời gian đáp ứng, thời gian xử lý yêu cầu tốithiểu.

 Tránh quá tải trên các nútmạng.

Các mô hình và thuật toán cân bằng tải trong điện toán đám mây đã được phát triển nhằm giúp người dùng truy cập tài nguyên một cách nhanh chóng và thuận tiện Điện toán đám mây không chỉ cho phép chia sẻ dữ liệu mà còn cung cấp nhiều nguồn tài nguyên cho người dùng Do đó, nó đóng vai trò quan trọng trong việc lưu trữ dữ liệu và phân phối tài nguyên trong một môi trường mở Quá trình cân bằng tải giúp xác định các nút mạng bị quá tải và chuyển tải sang các nút khác có tải nhẹ hơn, đảm bảo hiệu suất tối ưu cho hệ thống.

Cân bằng tải trên điện toán đám mây tối ưu hóa việc sử dụng tài nguyên, tối đa hóa thông lượng, giảm thời gian phản hồi và ngăn ngừa quá tải Thay vì phụ thuộc vào một thành phần duy nhất, nó khai thác nhiều tài nguyên để nâng cao độ tin cậy và tính sẵn sàng của kiến trúc mạng Điều này tạo nên nhiều tính năng ưu việt, phân biệt hệ thống cân bằng tải trên đám mây với các hệ thống cân bằng tải truyền thống.

- Tăng thời gian hoạt động của hệthống

- Khả năng chịu tải vượttrội

- Sử dụng các thuật toán tiêntiến

- Hỗ trợ nhiều giao thức: HTTP, HTTPS, LDAP, LDAPS, IMAP, FTP, POP3, POP3S,SMTP.

- Dễ mở rộng mà không làm gián đoạn hệthống

1.1.4 Ảo hóa và quản lý máy ảo trên đámmây

Công nghệ ảo hóa trong điện toán đám mây là quá trình tách biệt hệ điều hành khỏi phần cứng, cho phép di chuyển và chạy ứng dụng trên nhiều thiết bị khác nhau mà không làm thay đổi dữ liệu Ảo hóa tạo ra một tầng trung gian giữa phần cứng máy tính và phần mềm, cho phép từ một máy vật lý duy nhất có thể tạo ra nhiều máy ảo độc lập, mỗi máy đều có hệ điều hành và ứng dụng riêng Quá trình này xuất phát từ việc phân chia ổ đĩa, biến một máy chủ thực thành nhiều máy chủ logic, giúp mỗi máy ảo hoạt động độc lập với hệ điều hành của máy chủ Các loại ảo hóa phổ biến bao gồm ảo hóa mạng, ảo hóa lưu trữ và ảo hóa máy chủ.

Dịch vụ điện toán đám mây được triển khai trong các trung tâm dữ liệu (TTDL) với hàng trăm ngàn máy tính, phục vụ nhiều người dùng và ứng dụng khác nhau Sự ảo hóa, một khái niệm đã xuất hiện từ lâu nhằm chia sẻ tài nguyên, đã trở thành công nghệ thiết yếu cho môi trường điện toán đám mây Ảo hóa được hiểu là việc trừu tượng hóa các tài nguyên tính toán như bộ xử lý, lưu trữ, bộ nhớ, mạng và I/O Công nghệ ảo hóa phần cứng cho phép chạy nhiều hệ điều hành và phần mềm trên một nền tảng vật lý duy nhất Mô hình kiến trúc ảo hóa bao gồm ba tầng: tầng tài nguyên phần cứng, tầng ảo hóa với phần mềm như Virtual Machine Monitor (VMM) hay Hypervisor, và máy ảo (VM) Hiện nay, các VMM phổ biến trong môi trường điện toán đám mây bao gồm VMWare, Xen và KVM.

Mỗimáyảo(VM)cóhệđiềuhànhkhách(GuestOS)khácvớihệđiềuhànhcủamáy vậtlý(HostOS),vàVMthựcthicácứngdụngkhácnhauvàđộclậpvớinhau.Nhiều VM có thể cùng chia sẻ tài nguyên phần cứng bêndưới.

Hình 1.4 Mô hình phân lớp kiến trúc ảo hóa 03 tầng [40]

B Sotomayor and colleagues proposed a Virtual Infrastructure Management (VIM) model for private and hybrid clouds, recommending the use of OpenNebula as a solution.

Bài toán cânbằngtải…

1.2.1 Phát biểu bài toán và mô hình nghiêncứu

Vấn đề cân bằng tải xuất hiện khi nhiều máy chủ ảo cùng xử lý một tập hợp yêu cầu đầu vào Giả thiết đặt ra là tất cả các máy chủ đều giống nhau về cấu hình và có khả năng phục vụ bất kỳ yêu cầu nào.

- Cóncông việc J = {J1, J2, J3,… , Jn}, với mỗi công việc có thời gian xử lý là tj>0.

Yêu cầu là phân bổ tập công việc J cho tập máy ảo M sao cho tải trên tất cả các máy M đều đồng đều Cần tránh tình trạng quá tải trên một máy bất kỳ trong khi các máy khác không thực hiện công việc nào.

Nhiệm vụ chính của luận án là nghiên cứu và phát triển các thuật toán cân bằng tải nhằm giảm thời gian đáp ứng các yêu cầu đầu vào và giảm thời gian xử lý Mục tiêu là cải thiện hiệu năng của các thuật toán này thông qua việc tối ưu hóa các tham số thời gian trong môi trường điện toán đám mây Đặt A(i) là tập công việc gán cho máy ảo Mi, máy Mi cần làm việc trong tổng thời gian tối ưu.

Đại lượng \( T_i \) biểu thị thời gian cần thiết để hoàn thành tất cả yêu cầu đầu vào và cũng là tải trên các máy \( M_i \) Mục tiêu của bài toán là tối thiểu hóa \( T = \max_i T_i \), với \( T \) là tải lớn nhất trên bất kỳ máy nào Việc tối thiểu hóa \( T \) rất quan trọng, vì khi giảm được \( T \), thời gian xử lý các yêu cầu sẽ giảm và đồng thời nâng cao hiệu suất của việc cân bằng tải trong môi trường điện toán đám mây.

Trong môi trường điện toán đám mây, khi máy ảo gặp tình trạng quá tải, các yêu cầu đầu vào cần được gỡ bỏ và chuyển đến máy ảo có ít tải hơn để đảm bảo cân bằng tải giữa các máy trong cùng một trung tâm dữ liệu Mô hình cân bằng tải trong điện toán đám mây được minh họa trong Hình 1.6.

Mô hình tổng quát nghiên cứu cân bằng tải trên điện toán đám mây cho thấy yêu cầu từ người dùng được gửi đến bộ cân bằng tải, có nhiệm vụ phân phối các yêu cầu này đến các máy ảo trong trung tâm dữ liệu một cách đồng đều Điều này nhằm tăng thời gian đáp ứng và phòng tránh hiện tượng quá tải Hiệu quả của bộ cân bằng tải phụ thuộc vào thuật toán cân bằng tải, mà các thuật toán này chịu ảnh hưởng bởi nhiều yếu tố trực tiếp Do đó, trước khi nghiên cứu các cách tiếp cận giải quyết bài toán cân bằng tải, cần phân tích các yếu tố ảnh hưởng đến nó.

Hình 1.6 Mô hình nghiên cứu cân bằng tải trên điện toán đám mây [30].

1.2.2 Các yếu tố ảnh hưởng đến cân bằngtải

Việc nghiên cứu các yếu tố ảnh hưởng đến cân bằng tải đóng vai trò quan trọng trong việc lựa chọn thuật toán nhằm nâng cao hiệu quả của quá trình này.

Có nhiều yếu tố ảnh hưởng đến cân bằng tải trên điện toán đám mây:

- Hạ tầng mạng, lưu lượng mạng, băng thôngmạng.

- Cơ chế phân phối tải, cơ chế phòng chống tắcnghẽn.

- Thamsố:thờigianđápứng,thờigianxửlý,thờigianchờ,mứcđộsửdụngtài nguyên, mức độ ưu tiên của các yêucầu.

Trung tâm dữ liệu đám mây là một hệ thống máy tính kết nối theo mô hình mạng cụ thể, và nghiên cứu trong công trình (CT1) đã phân tích ảnh hưởng của ma trận lưu lượng đầu vào đối với quản trị mạng máy tính Ma trận lưu lượng đầu vào cho phép tính toán để giải quyết các vấn đề như sử dụng băng thông, cân bằng tải và cải thiện chất lượng mạng Công trình này cũng đã xem xét các kỹ thuật ước tính và ứng dụng của ma trận lưu lượng trong quản trị mạng máy tính.

Cơ chế phân phối tải (CT2) và cơ chế phòng chống tắc nghẽn là những yếu tố quan trọng ảnh hưởng đến cân bằng tải trong môi trường điện toán đám mây Do đặc thù của điện toán đám mây là tính toán phân tán và sử dụng công nghệ ảo hóa, hiện tượng quá tải có thể xảy ra Việc phân phối tải hiệu quả giúp nâng cao chất lượng dịch vụ, giảm thiểu chi phí nâng cấp hạ tầng phần cứng, cải thiện hiệu suất hệ thống và tăng doanh thu cho các nhà cung cấp dịch vụ Tác giả Rashmi K S và các cộng sự đã phát triển một thuật toán cân bằng tải nhằm ngăn ngừa tình trạng bế tắc của các máy ảo trong môi trường điện toán đám mây Ý tưởng của nghiên cứu là chuyển các yêu cầu của người sử dụng sang máy ảo khác có mức độ sử dụng thấp hơn khi xảy ra bế tắc, từ đó nâng cao hiệu quả kinh doanh cho các nhà cung cấp dịch vụ đám mây.

Nhóm nghiên cứu đã giới thiệu kỹ thuật cân bằng động HDCS cho hệ thống tính toán phân tán không đồng nhất, phân tích ảnh hưởng của tính không đồng nhất đến khả năng xử lý yêu cầu của các nút Kỹ thuật này giúp phân bổ hiệu quả các nguồn lực và giảm thiểu thời gian hoàn thành công việc tại mỗi nút Tác giả Javed Ali đề xuất cơ chế phân loại yêu cầu, thực hiện phân vùng và cân bằng tải tại các nút, nhấn mạnh rằng không có chiến lược phân loại lý tưởng nào mà cần tùy thuộc vào từng trường hợp cụ thể Wenhong Tian và cộng sự đã giới thiệu thuật toán DAIRS, tích hợp cân bằng tải động và lập lịch cho trung tâm dữ liệu đám mây, nhằm đo lường mức độ mất cân bằng của trung tâm dữ liệu và từng máy chủ Reena Panwar nghiên cứu chiến lược phân bổ nguồn lực để đáp ứng yêu cầu đến máy ảo, cho rằng lập lịch trong hệ thống tính toán phân tán rất phức tạp Kết quả nghiên cứu đã đề xuất cơ chế tích hợp hai hàng đợi cho yêu cầu đến và mức độ sử dụng của máy chủ, giúp bộ cân bằng tải quyết định chọn máy chủ phù hợp Phân tích cho thấy việc sử dụng cơ chế phân phối tải hợp lý là rất quan trọng trong việc điều phối tải trên các trung tâm dữ liệu.

Cân bằng tải chịu ảnh hưởng trực tiếp từ nhiều tham số cần cải thiện, bao gồm thời gian đáp ứng, thời gian xử lý, thời gian chờ, mức độ sử dụng tài nguyên, mức độ ưu tiên của yêu cầu đầu vào, trạng thái của các nút mạng và băng thông cho máy ảo Các yếu tố quan trọng ảnh hưởng đến cân bằng tải bao gồm khả năng xử lý yêu cầu, khả năng dự đoán tình trạng của nút xử lý tiếp theo để tránh quá tải và giảm thiểu thời gian xử lý; thời gian tối đa hoàn thành yêu cầu tại mỗi nút; phân vùng trong đám mây; gom cụm trạng thái tải của các máy ảo với cơ chế chia sẻ tài nguyên linh hoạt; thời gian đáp ứng và tối ưu hóa băng thông cho máy ảo Nghiên cứu trong công trình (CT3) đã khảo sát và phân tích ảnh hưởng của các tham số này đến các thuật toán cân bằng tải, được thể hiện trong Bảng 1.1.

Bảng 1.1 Khảo sát các tham số ảnh hưởng đến phương pháp cân bằng tải

Tác giả Phương pháp thực hiện Thông số Kết quả

Giải thuật cân bằng động với khả năng giám sát tải tập trung

Trạng thái nút, bộ vi xử lý, yêu cầu công việc

Tối thiểuhóacác lệnh xửlýtrên các bộvixử lý vàgiảml ư u lư ợngmạng

Cân bằng tải xét đến thờigianđápứngchomỗiyêucầuc ông việcđến

Thời gian đáp ứng, ngưỡng, thời gian đáp ứng dự đoán

Tối đa hóa băng thông mạng

Giải thuật cân bằng tải Load Balance Improved Min-Min (LBIMM)

Thời gian thực thi tại mỗi nút: lập lịch các yêu cầu; tỉ lệ sử dụng nguồn lực

Giảm thờigianhoàn thànhcácyêu cầu;cảithiện hiệunăngcân bằngnguồnlực

Giải thuật HBB-LB (honey bee behavior inspired load balancing)

Mức độ ưutiêncủa cácyêucầu, hànhvibầy ongmật

Cân bằng tảicóxem xét đếnđộưu tiên củacácyêu cầu từcácmáy ảo quátải

Mô hình cân bằng tải cho các đám mây công cộng sử dụng khái niệm phân vùng đám mây kết hợp với cơ chế chuyển đổi nhằm lựa chọn chiến lược cân bằng hiệu quả Việc phân vùng đám mây giúp tối ưu hóa tài nguyên và nâng cao hiệu suất trong quản lý lưu lượng truy cập.

Cải thiện hiệu năng các máy chủ hệ thống khi phân vùng thành các đám mây riêng lẻ

Giải thuật chia sẻ tải linhhoạt

Phân phối hiệu quả tải cho các máy ảo nhằm giảm thiểu các máy ảo quá tải

Giải thuật LBRS (Load Balanced

Thời gian đáp ứng; Thời gian chờ

Cân bằng tảicóxem xétđếntầm quantrọngcủa việclậplịch cânbằngnguồnl ực

Giải thuật Enhanced Load Balancing Algorithm using Efficient Cloud Management System

Thời gian đáp ứng; Thời gian chờ; Thời gian bế tắc Đã giảm được hiện tượng tắc nghẽn trong đám mây

Giải thuật dự báo trạngtháicủa các nút tiếp theo choviệcphân bổ tải dựa trên phântíchdữ liệu quá khứ

Tải trêncácmáy chủ;Hiệusuất và hệ sốtảitrong tươnglai(dự báo)

Sử dụng hiệu quả hơn nguồn lực trên đám mây

Thuật toán quản lý tải động Phân bổ nguồn lực

Phân phốicóhiệu quảtoànbộ các yêucầuđến các máyảo

Theo khảo sát trong Bảng 1.1, nhiều yếu tố ảnh hưởng đến hiệu năng của cân bằng tải trên điện toán đám mây, bao gồm thuật toán, thời gian đáp ứng, thời gian chờ, thời gian xử lý, thông lượng và mức độ sử dụng tài nguyên Trong luận án này, chúng tôi tập trung nghiên cứu hai tham số chính là thời gian đáp ứng và thời gian xử lý Dựa trên đó, chúng tôi đề xuất thuật toán cải tiến nhằm nâng cao hiệu quả cân bằng tải trong điện toán đám mây.

1.2.3 Phân loại các thuật toán cân bằngtải

Cân bằng tải trên điện toán đám mây được thực hiện thông qua nhiều thuật toán khác nhau Nhiều nghiên cứu đã được tiến hành nhằm cải thiện cân bằng tải và tối ưu hóa việc sử dụng tài nguyên ở mức độ cao Các thuật toán cân bằng tải chủ yếu được phân loại thành ba loại: cân bằng tĩnh, cân bằng động và các thuật toán bổ sung.

Thuật toán cân bằng tĩnh không xem xét trạng thái hoặc hành vi trước đó của nút khi phân phối tải Các ví dụ tiêu biểu cho thuật toán này bao gồm Round Robin, Min-Min và Max-Min.

Các hướng giải quyết bài toán cânbằngtải…

Bài toán cân bằng tải là một bài toán NP-Complete, hiện chưa có lời giải tối ưu nhưng có thể giải quyết thông qua các thuật toán xấp xỉ Phương pháp xấp xỉ tìm kiếm lời giải gần tối ưu trong khoảng thời gian hợp lý Để thực hiện bài toán này, giả thiết đặt ra là tất cả các máy chủ giống hệt nhau và có thể sử dụng để phục vụ bất kỳ yêu cầu nào Một thuật toán đơn giản, Greedy-Balance, được áp dụng để minh họa việc giải quyết bài toán cân bằng tải bằng phương pháp xấp xỉ, trong đó thuật toán này gán công việc cho máy có tải nhỏ nhất.

M 1 M 2 M 3 M 1 M 2 M 3 a- Trước khi cân bằng b- Sau khi cân bằng

1 Bắt đầu: Không có công việc nào đượcgán.

2 Khởi tạo T i = 0 và A(i) =cho tất cả các máyMi.

4 Đặt Milà máy có tải tối thiểu(minkTk).

5 Gán công việc j cho máyMi.

Thủ tục Greedy-Balance được áp dụng cho một chuỗi 6 công việc với kích thước lần lượt là 2, 3, 4, 6, 2, 2 trên 3 máy ảo M1, M2, M3 Theo Hình 1.7, ban đầu, các máy ảo có makespan lần lượt là 8, 5, 6 (makespan hệ thống = 8), nhưng sau khi thực hiện thuật toán này, makespan đã giảm xuống còn 6, 7, 6.

Rõ ràng là thuật toán đã có sự cân bằng tải tốt hơn và đã tối tưu được tải hệ thống (makespan hệ thống = 7).

Hình 1.7 Kết quả chạy thuật toán Greedy-Balance

Giá trị T* được coi là giá trị tối ưu, thể hiện mục tiêu của các thuật toán cần bằng Mục tiêu này là tìm ra T với kỳ vọng T không lớn hơn nhiều so với T* Mặc dù chúng ta không thể xác định chính xác giá trị T*, nhưng T* luôn có giới hạn dưới Nhiều phương pháp xác định giới hạn dưới đã được đề xuất, trong đó công trình [43] dựa vào tổng thời gian xử lý ∑ j t j.

1 để tính toán Một máy ảo phải làm việc ít nhất là m công việc trong tổng số các công việc.

Do đó, ta có một số nhận xét về T và T* trong thuật toán Greedy-Balance như sau:

 Ngưỡng dưới của giá trị makespan tối ưuT*:

Giá trị T* luôn có ngưỡng dưới, nhưng trong một số trường hợp, bổ đề này không đủ mạnh Chẳng hạn, khi một công việc có thời gian xử lý rất dài so với tổng thời gian xử lý của tất cả các công việc còn lại, giải pháp hiệu quả là gán công việc đó cho một máy ảo duy nhất, và máy này sẽ là máy cuối cùng kết thúc phiên làm việc Do đó, ngưỡng dưới trong trường hợp này được mở rộng.

 Ngưỡng dưới của giá trị makespan tối ưu T* mởrộng:

Ta chứng minh công thức (1.4) để hiểu rõ hơn phương pháp xấp xỉ trong cân bằng tải:

Khi phân tích một thuật toán gần đúng, việc so sánh giải pháp với giá trị tối ưu là rất quan trọng, đặc biệt là với các giới hạn dưới (1.2) và (1.3) Đối với một máy M_i có tải tối đa T_v, cần xác định công việc cuối cùng j được gán cho máy này Nếu t_j không quá lớn so với các công việc khác, giới hạn dưới sẽ là công thức (1.2); ngược lại, nếu t_j quá lớn, giới hạn dưới sẽ là công thức (1.3) Khi gán công việc j cho M_i, máy M_i sẽ có tải nhỏ nhất so với bất kỳ máy ảo nào, đây là đặc trưng của thuật toán Greedy-Balance Tải trọng của M_i ngay trước khi thực hiện phép gán là (T_i - t_j), do đó tải trên tất cả các máy ít nhất bằng (T_i - t_j), dẫn đến tổng tải của tất cả các máy.

Giá trị tổng tải ∑ 𝑘 𝑇 𝑘 chỉ phản ánh tổng tải của tất cả các công việc ∑ 𝑗 𝑡 𝑗, vì mỗi công việc được gán cho một máy duy nhất Do đó, đại lượng 1 ∑𝑡 là giới hạn dưới cho giá trị tối ưu (1.2).

VàchúngtatínhtoánlượngtảicònlạitrênM i ,củacôngviệccuốicùngj.Ởđâythuậttoán sử dụng giới hạn dưới là công thức(1.3): t j ≤T* (1.8)

Cộng 2 bất đẳng thức (1.7) và (1.8) ta được:

Vì makepanT = T i , nên công thức (1.4) được chứng minh.

Giả sử có m máy vàn, tổng số công việc là m(m - 1) + 1 Trong đó, (n – 1) = m(m - 1) cho các công việc đầu tiên, mỗi công việc yêu cầu thời gian t j = 1, trong khi công việc cuối cùng yêu cầu thời gian n = m Thuật toán Greedy-Balance sẽ phân bổ thời gian một cách đồng đều.

Công việc đầu tiên được thực hiện, sau đó một công việc lớn được thêm vào một máy khác, dẫn đến kết quả makespan T = 2m - 1 Trong trường hợp này, giá trị makespan tối ưu là (2m-1)/m = 2 - 1/m Khi m rất lớn, tỷ lệ makespan của thuật toán Greedy-Balance so với giá trị tối ưu là 2, đây là trường hợp xấu nhất (T = 2 T*) Tuy nhiên, có thể cải tiến thuật toán xấp xỉ để tỷ lệ makespan thu được và makespan tối ưu nhỏ hơn 2, với tỷ lệ càng nhỏ càng tốt Đặc biệt, thuật toán Sorted-Balance có tỷ lệ makespan là 1,5.

1 Bắt đầu: Không có công việc nào đượcgán.

2 Đặt Ti = 0 và A(i) =cho tất cả các máyMi

6 Đặt Mi là máy có tải tối thiểu(min k Tk)

7 Gán công công việc j cho máyMi

Khi số lượng công việc ít hơn m, giải pháp Greedy-Balance sẽ là tối ưu vì mỗi công việc được phân bổ cho một máy riêng Ngược lại, nếu số lượng công việc vượt quá m, ta có thể áp dụng ràng buộc về mức makespan tối ưu để cải thiện hiệu suất.

 Nếu có nhiều hơnmcông việc,thì:

 Thuật toán Sorted-Balance tạo ra sự phân công công việc cho các máy có makepanlà:

Chúng tôi nhận thấy rằng đã có sự cải tiến trong thuật toán makspan từ công thức (1.4) và (1.10) Mặc dù không thể tính toán chính xác giá trị của T*, nhưng rõ ràng đã có thuật toán cân bằng tải để tính toán giá trị T gần với giá trị tối ưu T* Điều này cho thấy rằng thuật toán xấp xỉ có thể được sử dụng để giải quyết bài toán cân bằng tải một cách hiệu quả.

1.3.2 Chiến lược lập lịch phân bổ tàinguyên

Hướngnghiêncứutiếptheolàcảitiếncácchiếnlượclậplịchphânbổtàinguyên nhằm cân bằng nguồn lực trên điện toán đám mây [7], [16], [19], [25],[ 3 3 ] , [ 4 1 ] ,

Tác giả đã đề xuất một thuật toán quản lý tải động nhằm phân phối hiệu quả các yêu cầu đến các máy ảo, được mô phỏng bằng công cụ CloudAnalyst với các thông số như thời gian xử lý dữ liệu và thời gian đáp ứng Kết quả so sánh với thuật toán VMAssign cho thấy thuật toán phân phối tải thống nhất giúp sử dụng hiệu quả các nguồn tài nguyên Nghiên cứu của Mahesh B Nagpure đã đưa ra chiến lược phân bổ nguồn lực động, ngăn chặn tình trạng quá tải thông qua phương pháp cân bằng tải hiệu quả Thuật toán này sử dụng khái niệm độ lệch (skewness) để đo độ không đồng đều của nguồn tài nguyên trên máy chủ và đề xuất phương pháp dự báo tải trong tương lai để phân phối tài hiệu quả hơn Các công trình khác đã đề xuất các chiến lược quản lý lưu tải động nhằm tối ưu hóa thông lượng.

Công trình nghiên cứu về phương pháp tối đa hóa việc sử dụng tài nguyên thông qua mô hình cân bằng tải đã chỉ ra rằng các phương pháp này hỗ trợ dự báo xu hướng tài nguyên, cấp phát tài nguyên động và giải phóng bộ nhớ cho các máy chủ một cách hiệu quả Tài liệu của Syed Hamid tổng hợp các nghiên cứu và kỹ thuật phân bổ tài nguyên trên đám mây, là bước quan trọng sau khi lập lịch cho tài nguyên Năm 2016, V Krishna đã công bố nghiên cứu phân tích hiệu năng các thuật toán cân bằng tải trong môi trường đám mây, so sánh các nhóm thuật toán như ACO (Ant Colony Optimization), FCFS, và GA.

(Genetic Algorithm), Multi-Objective Model for

Scheduling,MOACA(MultiObjectiveA n t ColonyAlgorithm).Trongcôngtrì nh

[21]tácgiảGaochaoXuvànhómnghiêncứuchorằngcânbằngtảitrongmôitrường điện toán đám mây có một tác động quan trọng về hiệu suất của hệ thống Cân bằng tảitốtlàmchođiệntoánđámmâyhiệuquảhơnvàcảithiệnsựhàilòngcủangườisử dụng.

Mô hình cân bằng tải trong đám mây công cộng dựa trên khái niệm phân vùng đám mây giúp tối ưu hóa hiệu suất hệ thống máy chủ Việc chia đám mây thành các phân vùng riêng lẻ không chỉ nâng cao hiệu quả cân bằng tải mà còn xây dựng chiến lược hiệu quả cho các tình huống khác nhau Hiren H Bhatt và cộng sự đã đề xuất một thuật toán cân bằng tải chú trọng đến các tham số như nhóm máy ảo, phân loại tải và kỹ thuật chia máy ảo thành các nhóm khác nhau, từ đó linh hoạt phân phối tải và giảm thiểu tình trạng quá tải Tuy nhiên, việc lập lịch trình tài nguyên trong môi trường đám mây gặp phải nhiều thách thức như sự phân tán, tính không chắc chắn và tính không đồng nhất của tài nguyên Lập lịch trình tài nguyên bao gồm các chức năng như lập bản đồ tài nguyên, thực thi tài nguyên và giám sát tài nguyên.

Gần đây, nhiều công trình nghiên cứu đã tập trung vào việc cải tiến chiến lược phân bổ tài nguyên Tài liệu [88] đề xuất cơ chế nhằm tránh lãng phí tài nguyên, trong khi công trình [36] giới thiệu cơ chế di trú trực tiếp để nâng cao hiệu quả và giảm chi phí thời gian thực hiện Đồng thời, các công trình [24] và [71] cũng đã đưa ra các chiến lược phân bổ tải hiệu quả cho các máy ảo.

1.3.3 Phương pháp cải tiến các thamsố

Một hướng nghiên cứu nữa là cải tiến các tham số ảnh hưởng đến khả năng cân bằng tải thu hút rất nhiều tác giả trên thế giới [2], [8], [17], [34], [37-39], [49],

Các tham số cơ bản trong cân bằng tải điện toán đám mây bao gồm thời gian đáp ứng, thời gian xử lý, thời gian hoàn thành, tỉ lệ sử dụng tài nguyên và độ ưu tiên của nhiệm vụ Theo Agraj Sharma, thời gian đáp ứng có ảnh hưởng lớn đến hiệu năng cân bằng tải Hai vấn đề tồn tại của các thuật toán trước đây là: cân bằng tải chỉ diễn ra khi máy chủ quá tải và việc truy vấn liên tục thông tin tài nguyên dẫn đến chi phí cao Để khắc phục, tác giả đã đề xuất thuật toán cải tiến thời gian đáp ứng, giúp gán yêu cầu cho máy chủ một cách hiệu quả hơn, giảm thiểu việc truy vấn thông tin và tiết kiệm băng thông Kết quả mô phỏng bằng phần mềm ECLIPSE IDE sử dụng JAVA 1.6 đã xác nhận tính chính xác của thuật toán này.

Các vấn đề mà luận án cầngiảiquyết…

Thông qua khảo sát, đánh giá các công trình nghiên cứu liên quan ở mục 1.2 và 1.3, nghiên cứu sinh rút ra một số nhận xét:

Công trình này sử dụng tài nguyên khá hiệu quả, mang lại hiệu năng tốt trong việc cân bằng tải động Khi bộ phận quản lý đám mây nhận yêu cầu, nó sẽ tìm kiếm trong danh sách máy ảo và chọn máy ảo đầu tiên có sẵn Mặc dù phương pháp này đảm bảo tính nhanh chóng, nhưng nếu máy ảo được chọn không đủ năng lực để thực hiện yêu cầu, sẽ dẫn đến chậm trễ và lãng phí thời gian.

Thuật toán không xem xét tới lượng tài nguyên hiện tại của máy ảo, dẫn đến việc nếu một máy ảo không đủ khả năng thực hiện yêu cầu, nó sẽ phải quay lại tìm máy ảo khác Điều này làm tăng thời gian chờ và thời gian đáp ứng của hệ thống Vấn đề này đã được giải quyết trong Chương 2 và kết quả nghiên cứu đã được công bố trong công trình (CT4).

Trong công trình [89], phương pháp giảm thời gian xử lý của thuật toán gặp phải vấn đề là phải tìm kiếm toàn bộ danh sách các máy ảo để xác định máy ảo sẵn sàng cho việc phân bổ tải, điều này làm tăng thời gian xử lý công việc Nhiệm vụ của đề tài là đề xuất giải pháp khắc phục vấn đề này Phương pháp giải quyết và kết quả nghiên cứu được trình bày chi tiết trong Chương 3 và đã được công bố trong công trình (CT5).

Thuật toán Max – Min đã cho thấy hiệu quả trong việc cải thiện thời gian xử lý, tuy nhiên, việc duyệt toàn bộ danh sách máy ảo để gán yêu cầu vẫn gây ra hạn chế, làm tăng thời gian xử lý do các thao tác lặp lại Để khắc phục vấn đề này, cần giảm thiểu các thao tác lặp lại nhằm nâng cao hiệu suất xử lý Vấn đề này đã được giải quyết trong Chương 3, với các kết quả nghiên cứu được công bố trong công trình (CT6).

- ThuậttoánRRTA(CT7):S ử dụngthuậttoándựbáoARIMAđểcảithiệnthời gian đáp ứng, bằng cách đưa ra cách giải quyết phân phối tài nguyên hợp lý Vấn đề này được trình bày trong Chương 2 của Luậnán.

Kết luậnChương1

Chương 1 trình bày tổng quan về cân bằng tải và sự cần thiết của cân bằngtải trên điện toán đám mây Việc quản lý máy ảo và các chiến lược lập lịch phân bổ tài nguyên trên đám mây cũng được trình bày Tiếp theo, Chương 1 trình bày bài toán cân bằng tải, mô hình cân bằng tải, đánh giá các tham số ảnh hưởng đến cân bằngtải và trình bày một số phương pháp đánh giá hiệu năng cân bằng tải Một nội dungnữa đượctrìnhbàytrongchươngnàylàcácphươngpháptiếpcậngiảiquyếtbàitoáncân bằngtải,trongluậnántrìnhbày3cáchtiếpcậnđểgiảiquyếtvấnđề:phươngpháp xấpxỉ,phươngpháplậplịchphânbổtàinguyênvàphươngphápcảitiếncácthamsố ảnhhưởngđếncânbằngtải.Bêncạnhđó,Chương1cũngtrìnhbàymộtsốưu,nhược điểm của các phương pháp cân bằng tải thông qua việc xem xét một số tham số ảnh hưởng đến hiệu năng của thuật toán như: thời gian đáp ứng, thời gian xử lý, mức độ sử dụng tàinguyên,

Chương1cũngđãnêuracácvấnđềmàluậnántậptrunggiảiquyếtbaogồm: cảithiệnthamsốảnhhưởngđếncânbằngtải(thờigianđápứng,thờigianxửlý).Để giảiquyếtvấnđềcòntồntạinêutrên,Chương2vàChương3sẽtậptrungnghiêncứu các vấn đề cụ thể sau:

- Chương2:Nghiêncứu,pháttriểnthuậttoáncânbằngtảiđểcảithiệnthờigian đáp ứng trên điện toán đámmây.

- Chương3:Nghiêncứu,pháttriểnthuậttoáncânbằngtảiđểcảithiệnthờigian xử lý trên điện toán đámmây.

Luận án tập trung vào việc đề xuất thuật toán cân bằng tải nhằm nâng cao thời gian đáp ứng và thời gian xử lý trong môi trường điện toán đám mây Cách tiếp cận chủ yếu là cải thiện các tham số ảnh hưởng đến cân bằng tải Các phương pháp cụ thể sẽ được trình bày trong Chương 2 và Chương 3.

PHÁT TRIỂN MỘT SỐ THUẬT TOÁN CÂN BẰNG TẢI NHẰM CẢI THIỆN THỜI GIAN ĐÁP ỨNG TRÊN ĐIỆN TOÁN ĐÁM MÂY

Chương này trình bày hai phương pháp cải tiến thời gian đáp ứng trên điện toán đám mây, cùng với kết quả mô phỏng thực nghiệm để chứng minh hiệu quả của các thuật toán đề xuất Phương pháp đầu tiên là thuật toán LBAIRT (CT4), kết hợp phân phối tải với thời gian hoàn thành dự kiến của các máy ảo Phương pháp thứ hai là thuật toán R R T A (CT7), sử dụng kỹ thuật dự báo ARIMA để dự báo thời gian đáp ứng của máy ảo tiếp theo Thực nghiệm tiến hành trên dữ liệu mô phỏng cho thấy các thuật toán đề xuất có tỷ lệ chấp nhận yêu cầu cao hơn và cải thiện thời gian đáp ứng so với các thuật toán Round Robin và Throttled Nội dung chương 2 được minh chứng bằng các công bố trong các công trình (CT4) và (CT7).

Đặtvấnđề

Thờigianđápứng(ResponseTime)làtổngthờigiancầnthiếtđểphảnhồiyêu cầu dịch vụ. Trong khuôn khổ luận án, không mất đi tính tổng quát, ta có thể bỏqua thờigiantruyền,thìthờigianđápứnglàtổngcủathờigianphụcvụvàthờigianchờ.

Thời gian phục vụ là yếu tố quan trọng trong việc thực hiện công việc yêu cầu, và nghiên cứu cho thấy thời gian đáp ứng có tác động lớn đến hiệu suất của điện toán đám mây Để nâng cao hiệu suất phục vụ của các dịch vụ điện toán đám mây, việc quản lý tài nguyên đối mặt với nhiều vấn đề cơ bản như phân bổ, đáp ứng, kết nối, khám phá tài nguyên chưa sử dụng, ánh xạ, mô hình hóa, cung cấp và lập kế hoạch sử dụng tài nguyên Lập kế hoạch sử dụng tài nguyên dựa trên thời gian đáp ứng của dịch vụ là rất quan trọng, từ đó có thể nghiên cứu và đưa ra giải pháp cho việc phân bố và cân bằng tải Đây là một hướng nghiên cứu tiềm năng giúp công nghệ đám mây ngày càng hoàn thiện hơn Điện toán đám mây tạo ra môi trường tính toán phân tán, yêu cầu cân bằng tải giữa các đơn vị tính toán vật lý, và các cơ chế cân bằng tải đã được đề xuất để giải quyết thách thức này tại các trung tâm dữ liệu Mục 2.2 và 2.3 trình bày hai thuật toán cân bằng tải nhằm cải thiện thời gian đáp ứng cho các trung tâm dữ liệu.

ThuậttoánLBAIRT…

Thuật toán Throttled được giới thiệu trong công trình [89] nhằm cân bằng tải bằng cách duy trì bảng thông tin cấu hình và trạng thái của các máy ảo Khi có yêu cầu cấp phát máy ảo từ trung tâm dữ liệu, bộ phận cân bằng tải (ThrottledVmLoadBalancer - TVLB) sẽ tìm kiếm máy ảo sẵn sàng đầu tiên trong danh sách Nếu tìm thấy, yêu cầu sẽ được giao cho máy ảo đó; nếu không, giá trị -1 sẽ được trả về cho trung tâm dữ liệu (Datacentercontroller - DCC) và yêu cầu sẽ được đưa vào hàng đợi Mặc dù thuật toán này duy trì danh sách máy ảo sẵn sàng và trạng thái của chúng, giúp cải thiện hiệu suất, nhưng vẫn tồn tại hạn chế Việc chọn máy ảo đầu tiên mà không xem xét khả năng thực hiện yêu cầu có thể dẫn đến lãng phí thời gian, vì nếu máy ảo đó không đủ năng lực, hệ thống sẽ phải tìm kiếm lại máy ảo khác, làm tăng thời gian chờ và thời gian đáp ứng.

Danh sách trạng thái VM

VM ID thỏa mãn để xử lý yêu cầu

Hoặc không có VM ID thỏa mãn

Khởitạo:tấtcảmáyảođềuởtrạngtháisẵnsàng(sẵnsàng‘0’hoặckhông sẵn sàng‘1’)

1 Bộ TVLB duy trì một bảng chỉ mục bao gồm: danh sách VM và trạng thái VM (bận/sẵn sàng) tươngứng.

2 Bộ DCC nhận yêu cầumới.

3 Bộ DCC truy vấn đến TVLB cho phân bổ kếtiếp.

4 Bộ TVLB duyệt danh sách VM từ trên xuống, tìm ra VM nào đangsẵn sàng:

Trường hợp nếu tìm thấy VM:

TVLB gửi ID của VM đến Bộ DCC, sau đó Bộ DCC gửi yêu cầu tới VM DCC thông báo cho TVLB về một phân bổ mới, và TVLB cập nhật bảng chỉ mục, đồng thời chờ yêu cầu mới từ DCC.

Trường hợp ngược lại, nếu không tìm thấy VM nào:

- Trình cân bằng tải TVLB sẽ trả giá trị về là -1 cho DCC DCC sắp xếp các yêu cầu.

5 Khi VM kết thúc xử lý các yêu cầu, thì DCC nhận phản hồi, nó sẽ ghi chú lại việc cấp phát VM củaTVLB.

6 DCC kiểm tra hàng đợi Nếu còn yêu cầu, tiếp tục lặp lại bước3.

Trạng thái VM là sẵn sàng ‘0” và không sẵn sàng là “1”

Bảng chỉ mục trạng thái của tất cả VM

Thông báo trạng thái Cập nhật

Gửi yêu cầu đến VM có ID được trả về

Gửi ID của VM sẳn sàng

Trình cân bằng tải Throttled (ThrottledVmLoadBalancer) Không có VM nào sẵn sàng, trả về giá trị

Bộ điều khiển trung tâm (Data Center Controller - DCC) Yêu cầu đến

Hình 2.1: Sơ đồ nguyên lý của thuật toán Throttled

Bảng 2.2 Ưu điểm và nhược điểm của thuật toán Throttled [89] Ưu điểm Nhược điểm

- Danh sách máy ảo được duy trì cùng với trạng thái cácVM.

- Sử dụng nguồn tài nguyênhiệuquả.

- Quét toàn bộ máy ảo ngay từ đầu và chọn ra

VM sẵn sàng đầu tiên trong danhsách;

- Không xem xét tải hiện hành của cácVM.

Thuật toán Throttled có thời gian đáp ứng nhanh hơn so với Round Robin, nhưng cần phải tìm kiếm máy ảo (VM) sẵn sàng '0' trong toàn bộ danh sách VM ban đầu, dẫn đến tăng chi phí thời gian Phương pháp này không xem xét tải hiện tại của từng VM, có thể dẫn đến việc một yêu cầu lớn được gán cho VM đang bận xử lý yêu cầu khác, gây tắc nghẽn Để khắc phục vấn đề này, thuật toán LBAIRT đã được đề xuất.

Thuật toán LBAIRT, được công bố trong công trình CT4, cải tiến dựa trên hai tiêu chí chính là tải và công suất của VM để quyết định phân bổ VM cho yêu cầu Cloudlet tiếp theo DatacenterBroker sẽ phân bổ Cloudlet tới VM có tải nhỏ, nhưng thời gian phản hồi có thể không thấp hơn VM có tải lớn hơn, do phụ thuộc vào khả năng xử lý của từng VM Tại thời điểm phân bổ, DatacenterBroker nắm rõ trạng thái hiện tại của mỗi VM và các Cloudlet mà nó đang xử lý Ý tưởng của thuật toán là xem xét từng VM trên từng host vật lý, tính tổng chi phí thời gian xử lý các Cloudlet đang chờ và chi phí thời gian xử lý Cloudlet tiếp theo trên VM đó VM có tổng chi phí thời gian xử lý thấp nhất sẽ được chọn để phân bổ Cloudlet Công suất thực tế của VM trong việc xử lý Cloudlet là yếu tố quan trọng được đưa vào tính toán, khác với các phương pháp trước đây Việc xác định công suất xử lý của VM cho Cloudlet trên hạ tầng ảo hóa đám mây là phức tạp và phụ thuộc vào cơ chế lập lịch tài nguyên tính toán trong hệ thống.

Mô hình IaaS trong điện toán đám mây, thông qua thành phần Datacenter Broker, sử dụng thuật toán LBAIRT để xem xét thời gian hoàn thành công việc dự kiến của mỗi máy ảo (VM) dựa trên các yêu cầu đến Thuật toán này cân bằng tải dựa trên các thông số như cấu hình máy ảo, cấu hình yêu cầu (cloudlet), thời gian đến và thời gian hoàn thành các tác vụ Qua đó, nó ước tính thời gian hoàn thành dự kiến cho mỗi yêu cầu và thời gian đáp ứng, bao gồm thời gian xử lý và chi phí truyền tải yêu cầu cũng như thời gian chờ qua các nút mạng.

 Thời gian đáp ứng dự kiến được tính theo công thức sau[74]:

- TR dk : Thời gian đáp ứng dựkiến.

- F t : là thời điểm hoàn thành dự kiến xử lýCloudlet.

- A t : là thời điểm đến củaCloudlet.

T delay là khoảng thời gian truyền tải các yêu cầu, nhưng do thuật toán điều phối tải của DatacenterBroker chỉ ảnh hưởng đến thời gian xử lý trong môi trường mạng nội bộ của Datacenter, tham số về độ trễ truyền có thể được xem là không đáng kể Do đó, có thể thiết lập T delay bằng 0.

Trong khuôn khổ luận án, chỉ nghiên cứu chính sách lập lịch của thuật toán là Spaceshared-Timeshared.ChínhsáchSpace-sharedđượcápdụngđểphânbổmáyảo tới các

VM và chính sách Time-shared tạo nền tảng cho việc phân bổ các yêu cầu đến core xử lý bên trong một VM Trong suốt vòng đời của VM, tất cả các yêu cầu được phân bổ theo phương pháp động Cơ sở tính toán cho giải thuật đề xuất dựa vào các công thức (2.2) và (2.3), nhằm xác định thời gian đáp ứng dự kiến ở công thức (2.1) Khi tìm ra giá trị thời gian đáp ứng dự kiến, thuật toán sẽ phân bổ các yêu cầu đầu vào một cách hiệu quả, từ đó nâng cao hiệu năng của thuật toán cân bằng tải.

 Xác định Ft [74]: Do sử dụng chính sách Timeshared nênFtcủa yêu cầupđược quản lý bởi VMiđược tính nhưsau:

Thời gian thực thi của một Cloudlet được xác định theo công thức sau:

- rl: là tổng số lệnh mà Cloudletpcần được thực thi trên một bộ xửlý.

- capacity: là năng lực xử lý trung bình (tính theo MIPS) của một core dành cho

- ct: là thời gian mô phỏng hiện tại.

- cores(p): là số lượng core mà Cloudlet pcần.

- np: là số lượng core thực mà host đang xétcó.

- cap: là năng lực xử lý củacore.

Tham số Capacity xác định công suất thực sự dành cho xử lý yêu cầu trên mỗi VM và phụ thuộc vào chính sách lập lịch tài nguyên trên hệ thống ảo hóa Tổng năng lực xử lý trên một host vật lý không thay đổi, nhưng khi tài nguyên này được chia sẻ cho nhiều yêu cầu đồng thời, khái niệm core ảo xuất hiện, với mỗi core ảo có năng lực xử lý thấp hơn core vật lý Công suất của một core ảo không thể lớn hơn core vật lý, tùy thuộc vào chính sách chia sẻ tài nguyên Capacity chính là công suất xử lý của một core ảo, được phát triển dựa trên chính sách chia sẻ tài nguyên và cơ chế lập lịch trong điện toán đám mây Có hai mốc lập lịch: lập lịch VM để chia sẻ tài nguyên host vật lý và lập lịch tác vụ để chia sẻ tài nguyên VM, với hai cơ chế lập lịch là Timeshared và Spaceshared Thuật toán này sẽ thực hiện và mô phỏng dựa trên chính sách Spaceshared cho máy ảo và Timeshared cho yêu cầu.

 Bước 1: Khởi tạo DatacenterBroker Bảng chỉ mục trạng thái của máy ảo và trạngtháicácCloudlethiệntại.Lúckhởitạochưacómáyảonàođượcphânbổ Cloudlet.

Khi nhận yêu cầu, DatacenterBroker tiến hành phân tích bảng chỉ mục trạng thái Sau đó, hệ thống sẽ tính toán tổng chi phí thời gian hoàn thành xử lý tất cả Cloudlet đang chờ của mỗi máy ảo, kèm theo thời gian dự kiến cho Cloudlet mới Máy ảo có thời gian xử lý dự kiến ngắn nhất sẽ được chọn để tiếp nhận Cloudlet tiếp theo.

 Bước 3: Gửi ID của VM được chọn đến DatacenterBroker sau đó

DatacenterBroker gửi Cloudlet tới VM đó.

 Bước4:Databrokerthôngbáovềviệcphânbổmớivàcậpnhậtvàobảngtrạng thái máy ảo vàCloudlet.

Khi máy ảo hoàn tất yêu cầu xử lý, DatacenterBroker sẽ nhận phản hồi từ Cloudlet và cập nhật trạng thái của Cloudlet thành "đã hoàn thành", đồng thời giảm số lượng Cloudlet trong bảng trạng thái đi 1.

Bước 6: Quay lại bước 2 Thuật toán LBAIRT có điểm mới là đưa vào thời gian hoàn thành dự kiến cho mỗi VM trong hàng đợi cloudlet Dựa trên tham số này, thuật toán chọn VM có thời gian hoàn thành dự kiến nhỏ nhất và tỷ lệ sử dụng thấp nhất để phân bổ cloudlet Đồng thời, lượng tải hiện tại trên các VM cũng được xem xét, giúp tìm ra các VM sẵn sàng với đủ năng lực xử lý yêu cầu một cách chính xác hơn so với thuật toán Throttled.

Tổng chi phí này nhỏ nhất? Đúng

Hết yêu cầu xử lý? Sai Đúng Kết thúc

Gửi các yêu cầu tới VM được chọn trong Datacenter và gán trạng thái là chưa hoàn thành;

Thêm yêu cầu này vào hàng đợi của VM được chọn;

Xóa yêu cầu này ra khỏi hàng đợi yêu cầu cần xử lý.

Tính tổng chi phí hoàn thành dự kiến.

(Các yêu cầu trong hàng đợi và yêu cầu mới tới) Chọn ra VM tối ưu trong danh sách Nhận các yêu cầu Cloudlet

Hình 2.3: Lưu đồ thuật toán đề xuất LBAIRT.

Độ phức tạp tính toán của thuật toán LBAIRT được xác định bởi thời gian cần thiết để thực hiện thuật toán Cụ thể, nếu số yêu cầu mới là n, số máy ảo là m, kích thước hàng đợi của mỗi máy ảo là q, và kích thước của hàng đợi cần xử lý là p, thì các yếu tố này sẽ ảnh hưởng đến độ phức tạp thời gian của thuật toán.

Vì cứ mỗi yêu cầu đến, thuật toán thực hiện:

- Tínhtổngchiphíhoànthànhxửlýtấtcảcácyêucầuhiệncótrongtấtcảcác hàngđợicủatấtcảcácmáyảo.Giảthiếtthờigiantínhtoánchomộtyêucầu là 1 đơn vị, thì độ phức tạp thời gian là:O(mq).

- Tìm máy ảo có tổng thời gian xử lý thấp nhất Dùng vòng for thì độ phức tạp thời gian làO(m).

- Gửi yêu cầu tới máy ảo được chọn với độ phức tạp thời gianO(1)

- Thêm yêu cầu vào hàng đợi với độ phức tạp thời gianO(1)

Để xóa yêu cầu ra khỏi hàng đợi cần xử lý với độ phức tạp thời gian O(1), độ phức tạp thời gian cho mỗi yêu cầu mới sẽ là O(mq + m + 3) = O(mq) Khi xem xét yêu cầu mới cùng với kích thước hàng đợi cần xử lý là p, tổng số yêu cầu cần xử lý thực tế sẽ là O(n + p).

Như vậy, độ phức tạp tính toán của thuật toán là:O((n+p) mq).

Mục tiêu của mô phỏng này là so sánh và đánh giá thời gian đáp ứng cũng như thời gian thực hiện của thuật toán Throttled và thuật toán LBAIRT Sử dụng công cụ CloudSim với một trung tâm dữ liệu, hai thuật toán này được lập trình bằng ngôn ngữ Java Mô phỏng sẽ so sánh thời gian đáp ứng của đám mây dựa trên một bộ dữ liệu cụ thể Các giá trị tham số hệ thống được trình bày trong các bảng 2.3, 2.4 và 2.5, với kịch bản mô phỏng được thực hiện theo chính sách lập lịch cho máy ảo và tác vụ là SpaceShared – TimeShared.

Bảng 2.3: Giá trị các tham số trong thiết lập đám mây

Loại Tham số Giá trị

Số lượng PE trên mỗi Host 1-4

Dung lượng lưu trữ 1024000-1044480 MB

Tổng số máy ảo 3

Bộ nhớ máy ảo (Ram) 1024-3072

Bảng 2.4: Cấu hình các VM

ID Bộ nhớ (Mb) Băng thông(Mb) Số PE/core Tốc độ PE (MIPS)

Bảng 2.5: Thiết lập tham số các Cloudlet

Cloudlet Số PE yêu cầu

Bảng 2.6 và Hình 2.4 trình bày kết quả mô phỏng cho các trường hợp với 10, 20, 30, 40, 50, 60 cloudlet, đồng thời so sánh thời gian đáp ứng giữa thuật toán Throttled và thuật toán LBAIRT đề xuất Kết quả cho thấy thuật toán LBAIRT đã cải thiện đáng kể thời gian đáp ứng so với thuật toán Throttled.

Bảng 2.6: So sánh kết quả mô phỏng giữa hai thuật toán Throttled và LBAIRT

Thời gian đáp ứng trung bình (ms)

ThuậttoánRRTA

Thuật toán RRTA, được công bố trong công trình CT7, nhằm mục đích giảm thời gian đáp ứng trên điện toán đám mây bằng cách kết hợp với thuật toán dự báo ARIMA Việc áp dụng thuật toán ARIMA giúp dự báo thời gian đáp ứng, từ đó phân bổ hiệu quả các yêu cầu đầu vào Thông tin chi tiết về thuật toán ARIMA được trình bày trong Phụ lục 1.

- Giảm thiểu các quá trình truyền thông tin giữa bộ cân bằng tải và các máyảo có tài nguyên đang rảnhrỗi.

- Giảm thời gian đáp ứng các yêu cầu từ phía ngườidùng

- Hạn chế tối đa sự mất cân bằng tải giữa các máy ảo, ngăn chặn và cảnh báo trước khi mất cân bằngtải.

- Dự đoán thời gian đáp ứng tiếp theo từ bất kỳ máy chủ nào cho các yêu cầu đang được xửlý.

Bộ cân bằng tải có khả năng nhận biết các dịch vụ đang hoạt động trên các máy ảo (VM) bất kỳ lúc nào Đặc biệt, trong lĩnh vực dịch vụ Web (WebService), các máy chủ web có thể theo dõi thời gian đáp ứng của từng dịch vụ đang chạy trên web và trên từng VM.

- Bộ cân bằng tải có danh sách các VM và các dịch vụ mà đám mây cung cấp.

Bộ cân bằng tải biết trước các dịch vụ chạy trên VM nào và có thể phân bổ dịch vụ mới trên một VM mới theo yêucầu.

Mô hình này sử dụng tham số ngưỡng thời gian để dự đoán thời gian đáp ứng yêu cầu tiếp theo Chẳng hạn, nếu VM3 được chọn để xử lý yêu cầu trước đó, yêu cầu mới sẽ được phân bổ vào VM4 và quá trình này lặp lại một cách ngẫu nhiên VM được chọn sẽ có thời gian đáp ứng dự đoán nhỏ hơn ngưỡng tính toán từ thuật toán ARIMA, và các VM sẽ được đối xử như nhau trong việc phân bổ các yêu cầu Nếu không có VM nào trong pool thỏa mãn điều kiện ngưỡng, yêu cầu sẽ được phân bổ tới các pool VM tiếp theo.

VM có thời gian đáp ứng trung bình và dự đoán thấp nhất sẽ được chọn để xử lý yêu cầu tiếptheo.

- Nếu không có VM nào thỏa điều kiện ngưỡng thì xử lý nhưsau:

+ Nếu có VM (hoặc pool) không tải, có thể sử dụng các máy này để xử lý các yêu cầu, đảm bảo điều kiện thỏa mãn ngưỡng.

Nếu không có máy ảo (VM) hoặc nhóm nào không hoạt động, hoặc tất cả đều không đạt ngưỡng yêu cầu, dịch vụ đang chạy sẽ được phân bổ tới VM có thời gian đáp ứng dự đoán gần nhất với ngưỡng.

Thuật toán tối ưu hóa kế hoạch cho các yêu cầu tiếp theo nhằm duy trì sự cân bằng tải, giảm thiểu liên lạc không cần thiết giữa máy ảo (VM) và các nguồn tài nguyên hiện có Điều này giúp tăng cường băng thông và thông lượng, phục vụ tốt hơn cho nhu cầu của người dùng.

Cân bằng tải bằng thuật toán ARIMA

Hình 2.5 Mô hình thuật toán RRTA

 Nguyên lý hoạt động của thuậttoán:

Thuật toán hoạt động dựa trên dữ liệu lịch sử về chuỗi thời gian đáp ứng, sử dụng ARIMA để dự báo thời gian phản hồi Từ đó, kết quả được phân bổ tài nguyên cho các yêu cầu tiếp theo Theo công trình đã công bố trong tài liệu [2], thuật toán đề xuất bao gồm ba nhóm module chính.

(1) Module tính toán ngưỡng bằng thuật toán ARIMA chođámmây:

Trong thuật toán RRT, ngưỡng thời gian được xác định dựa trên thời gian đáp ứng trung bình của máy ảo, với điều kiện thời gian đáp ứng trung bình dự đoán nhỏ hơn ngưỡng thời gian Ngưỡng này được tính toán bằng thuật toán ARIMA, dựa trên dữ liệu chuỗi thời gian Ngưỡng mới chính là thời gian đáp ứng dự đoán trong tập các máy ảo đang xét, cụ thể là trong vòng 100 yêu cầu gần nhất.

Ngưỡng mới = T New = ARIMA(RT 1 , RT 2 ,…, RT 100 )

Trong đó RTi= là chuỗi thời gian đáp ứng ghi lại được của đám mây (chỉ xéttrong vòng 100 Request gần nhất)

(2) Module dự báo thời gian đáp ứng tiếp theo cho từng VM:

ModulenàysửdụngthuậttoánARIMAđểdựbáothờigianđápứngtiếptheo củacácVM.Việcdựbáothờigianđápứngtiếptheodựavàodữliệuchuỗithờigian đápứngtrong50requestgầnnhấtcủaVMđangxétthôngquahàmgetPredictedRT()

(Phụlục2).ĐồngthờicungcấphàmtínhtoángiátrịdựbáogầnnhấtcủacácVMso vớingưỡngđưavàothôngquahàmAllocateRequestToVM(VM,Request)(Phụlục2).

PRT i = Prediected Response Time = Thời gian đáp ứng dự đoán của VM i

(3) Module phân bổ các dịch vụ (chọnVM)

Module này có nhiệm vụ phân bổ các yêu cầu đến các VM đạt được điều kiện ngưỡng thời gian Khi một yêu cầu được gửi đến VM và VM này không bận, yêu cầu sẽ được chuyển trực tiếp đến VM đó để lấy giá trị thời gian đáp ứng Nếu thời gian đáp ứng dự báo của VM nhỏ hơn thời gian đáp ứng tiếp theo của đám mây, yêu cầu sẽ được xử lý trên VM này Ngược lại, nếu không có VM nào thỏa điều kiện ngưỡng, yêu cầu sẽ không được xử lý.

(thờigianđápứngdựbáocủaVMkhôngnhỏhơnthờigianđápứngdựbáocủađám mây) thì yêu cầu sẽ được phân bổ vào VM có dự báo gần với ngưỡngnhất.

Khởi tạo ngưỡng: ban đầu chưa có dữ liệu thời gian, lấy ngưỡng bằng thời gian đáp ứng của yêu cầu đầutiên.

Khởi tạo ngưỡng: T initial =RT 1

Các bước của thuật toán:

4 For each VM in VMList

11 VM = VMList.getMinDistance(Tnew);// Module2

Theo tài liệu [2], ngưỡng được tính toán là thời gian đáp ứng lớn nhất trong tập các VM Thuật toán RRTA áp dụng phương pháp chọn ngưỡng này, nhưng sẽ điều chỉnh một số thay đổi, hoặc đưa vào cách hệ số và tham số, tùy thuộc vào kết quả thực nghiệm.

Xác định độ phức tạp tính toán:

Giả sử có n yêu cầu và m máy ảo, với độ phức tạp tính toán phụ thuộc vào n và m Đối với mỗi yêu cầu, thuật toán sẽ thực hiện các bước cần thiết để xử lý và trả về kết quả.

- Tính toán Tnew dùng thuật toán ARIMA Độ phức tạp thời gian làO(1).

- Tìm kiếm VM trong VMList sao cho VMgetPredictedRT()

Ngày đăng: 02/06/2022, 22:26

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Agarwal A., Jain S. (2014), Efficient Optimal Algorithm and Task Scheduling in Cloud Computing Environment,International Journal of Computer Trends andTechnology (IJCTT), vol. 9, pp.344-349 Sách, tạp chí
Tiêu đề: International Journal of Computer TrendsandTechnology (IJCTT)
Tác giả: Agarwal A., Jain S
Năm: 2014
[2] Agraj Sharma, Peddoju Sateesh K. (2014), Response Time Based Load Balancing in Cloud Computing,International Conference on Control, Instrumentation,Communication and Computational Technologies(ICCICCT) Sách, tạp chí
Tiêu đề: Agraj Sharma, Peddoju Sateesh K. (2014), Response Time Based Load Balancingin Cloud Computing
Tác giả: Agraj Sharma, Peddoju Sateesh K
Năm: 2014
[3] Anant Kumar Jaiswal, Smriti Srivastava (2013), Clustering based Load Balanced Gateway Placement Approach,International Journal of Computer Applications(0975 – 8887), Volume 63– No.5 Sách, tạp chí
Tiêu đề: International Journal of ComputerApplications(0975 – 8887)
Tác giả: Anant Kumar Jaiswal, Smriti Srivastava
Năm: 2013
[4] Aruna M, D.Bhanu and S.Karthik (2017), An improved load balanced metaheuristic scheduling in cloud,Cluster Computing, DOI:10.1007/s10586-017-1213-9 Sách, tạp chí
Tiêu đề: Cluster Computing
Tác giả: Aruna M, D.Bhanu and S.Karthik
Năm: 2017
[5] Ashis Talukder, Sarder Fakhrul Abedin, Md. Shirajum Munir, and Choong Seon Hong (2017), Dual Threshold Load Balancing in SDN Environment Using Process Migration,International Conference on Information Networking( I C O I N ) ,DOI: 10.1109/ICOIN.2018.8343226,Publisher: IEEE Sách, tạp chí
Tiêu đề: International Conference on Information Networking( I C O I N )
Tác giả: Ashis Talukder, Sarder Fakhrul Abedin, Md. Shirajum Munir, and Choong Seon Hong
Năm: 2017
[6] Atyaf Dhari and Khaldun I. Arif (2017), An Efcient Load Balancing Scheme for Cloud Computing,Indian Journal of Science and Technology, Vol 10(11), DOI Sách, tạp chí
Tiêu đề: Indian Journal of Science and Technology
Tác giả: Atyaf Dhari and Khaldun I. Arif
Năm: 2017
[7] Bahman Keshanchia, Alireza Souri, Nima Jafari Navimipour (2016), An improved genetic algorithm for task scheduling in the cloud environments using the priority queues:formalverification,simulation,andstatisticaltesting,JournalofSystemsandSoftware 124, DOI:10.1016/j.jss.2016.07.006 Sách, tạp chí
Tiêu đề: JournalofSystemsandSoftware 124
Tác giả: Bahman Keshanchia, Alireza Souri, Nima Jafari Navimipour
Năm: 2016
[8] Bharat Khatavkar, Prabadevi Boopathy (2017), Efficient WMaxMin Static Algorithm For Load Balancing In Cloud Computation,International Conference onInnovations in Power and Advanced Computing Technologies [i- PACT2017],DOI:10.1109/IPACT.2017.8245166 Sách, tạp chí
Tiêu đề: International ConferenceonInnovations in Power and Advanced Computing Technologies [i-PACT2017]
Tác giả: Bharat Khatavkar, Prabadevi Boopathy
Năm: 2017
[10] Bibhudatta Sahoo, Dilip Kumar and Sanjay Kumar Jena (2013), Analysing the Impact of Heterogeneity with Greedy Resource Allocation Algorithms for Dynamic Load Balancing in Heterogeneous Distributed Computing System,InternationalJournal of Computer Applications (0975 – 8887), Volume 62–No.19 Sách, tạp chí
Tiêu đề: InternationalJournal of Computer Applications (0975 – 8887)
Tác giả: Bibhudatta Sahoo, Dilip Kumar and Sanjay Kumar Jena
Năm: 2013
[11] Branko Radojevic, Mario Zagar (2011), Analysis of Issues with Load Balancing Algorithms in Hosted (Cloud) Environments,MIPRO 2011, Opatija,Croatia Sách, tạp chí
Tiêu đề: MIPRO 2011
Tác giả: Branko Radojevic, Mario Zagar
Năm: 2011
[14] DeepaT,DhanarajCheelu(2017),LoadBalancingAlgorithmsinCloudComputing: A Comparative Study,International Journal of Innovations & Advancement inComputer Science IJIACS, ISSN 2347 – 8616,Volume 6, Issue 1 Sách, tạp chí
Tiêu đề: International Journal of Innovations & AdvancementinComputer Science IJIACS
Tác giả: DeepaT,DhanarajCheelu
Năm: 2017
[15] Dhinesh Babu,Venkata Krishna P. (2013), Honey bee behavior inspired load balancing of tasks in cloud computing environments,Elsevier- Journal of AppliedSoft Computing, no-l3, 2013,pp-2292-2303 Sách, tạp chí
Tiêu đề: Elsevier- Journal ofAppliedSoft Computing
Tác giả: Dhinesh Babu,Venkata Krishna P
Năm: 2013
[16] DivyaSreeA.,BhanuPrakashM.(2016),LoadBalancinginCloudComputingusing Dynamic Load Management Algorithm,International Journal of AdvancedTechnology and Innovative Research, Volume. 08, IssueNo.24, Pages:4740-4744 Sách, tạp chí
Tiêu đề: International Journal of AdvancedTechnology and InnovativeResearch
Tác giả: DivyaSreeA.,BhanuPrakashM
Năm: 2016
[18] EinollahJafarnejadGhomia,AmirMasoudRahmania,andNooruldeenNasihQader (2017), Load-balancing algorithms in cloud computing: A survey,Journal ofNetwork and Computer Applications 88 (2017) 50–71, Publisher:Elsevier Sách, tạp chí
Tiêu đề: EinollahJafarnejadGhomia,AmirMasoudRahmania,andNooruldeenNasihQader (2017),Load-balancing algorithms in cloud computing: A survey
Tác giả: EinollahJafarnejadGhomia,AmirMasoudRahmania,andNooruldeenNasihQader
Năm: 2017
[19] Farzana Sadia, Nusrat Jahan, Lamisha Rawshan, Madina Tul Jeba and Touhid Bhuiyan (2017), A Priority Based Dynamic Resource Mapping Algorithm For Load Balancing In Cloud,International Conference on Advances in ElectricalEngineering (ICAEE),DOI:10.1109/ICAEE.2017.8255349 Sách, tạp chí
Tiêu đề: International Conference on Advances inElectricalEngineering (ICAEE)
Tác giả: Farzana Sadia, Nusrat Jahan, Lamisha Rawshan, Madina Tul Jeba and Touhid Bhuiyan
Năm: 2017
[20] Feilong Tang, Laurence T. Yang, Can Tang, JieLiand Minyi Guo (2016), A Dynamical and Load-Balanced Flow Scheduling Approach for Big Data Centers in Clouds,IEEE TRANSACTIONS ON CLOUD COMPUTING 2016, DOI 10.1109/TCC.2016.2543722 Sách, tạp chí
Tiêu đề: IEEE TRANSACTIONS ON CLOUD COMPUTING 2016
Tác giả: Feilong Tang, Laurence T. Yang, Can Tang, JieLiand Minyi Guo
Năm: 2016
[21] GaochaoXu,JunjiePang,andXiaodongFu(2013),ALoadBalancingModelBasedonCloudPartitioningforthePublicCloud,TsinghuaScienceandTechnology,ISSN 1007-0214 04/12, pp 34-39, Volume 18, NumberI Sách, tạp chí
Tiêu đề: TsinghuaScienceandTechnology
Tác giả: GaochaoXu,JunjiePang,andXiaodongFu
Năm: 2013
[23] Geeta, Santosh Gupta, Shiva Prakash (2019), Qos and Load Balancing in Cloud Computingan Access for Performance Enhancement using Agent Based Software,International Journal of Innovative Technology and Exploring Engineering(IJITEE), ISSN: 2278-3075, Volume-8,Issue-11S Sách, tạp chí
Tiêu đề: International Journal of Innovative Technology and ExploringEngineering(IJITEE)
Tác giả: Geeta, Santosh Gupta, Shiva Prakash
Năm: 2019
[24] GeethaMegharaj,MohanKabadi(2018),RunTimeVirtualMachineTaskMigration Technique for Load Balancing in Cloud,International Journal of IntelligentEngineering and Systems, Vol.11, No.5, DOI:10.22266/ijies2018.1031.25 Sách, tạp chí
Tiêu đề: International Journal of IntelligentEngineering andSystems
Tác giả: GeethaMegharaj,MohanKabadi
Năm: 2018
[29] Hao Liu, Shijun Liu, Xiangxu Meng, Chengwei Yang, Yong Zhang (2010), LBVS:ALoadBalancingStrategyforVirtualStorage,InternationalConferenceonServiceScience,IEEE, DOI:10.1109/ICSS.2010.27 Sách, tạp chí
Tiêu đề: InternationalConferenceonServiceScience,IEEE
Tác giả: Hao Liu, Shijun Liu, Xiangxu Meng, Chengwei Yang, Yong Zhang
Năm: 2010

HÌNH ẢNH LIÊN QUAN

Hình 1.1. Mô hình điện toán đám mây - Nâng cao hiệu năng cân bằng tải trên điện toán đám mây
Hình 1.1. Mô hình điện toán đám mây (Trang 19)
Hình 1.3. Mức độ cung cấp dịch vụ của các mô hình điện toán đám mây - Nâng cao hiệu năng cân bằng tải trên điện toán đám mây
Hình 1.3. Mức độ cung cấp dịch vụ của các mô hình điện toán đám mây (Trang 22)
Hình 1.4. Mô hình phân lớp kiến trúc ảo hóa 03 tầng [40] - Nâng cao hiệu năng cân bằng tải trên điện toán đám mây
Hình 1.4. Mô hình phân lớp kiến trúc ảo hóa 03 tầng [40] (Trang 26)
Hình 1.5: Phân loại các tài nguyên trên điện toán đám mây [95]. - Nâng cao hiệu năng cân bằng tải trên điện toán đám mây
Hình 1.5 Phân loại các tài nguyên trên điện toán đám mây [95] (Trang 28)
Hình 1.6. Mô hình nghiên cứu cân bằng tải trên điện toán đám mây [30]. - Nâng cao hiệu năng cân bằng tải trên điện toán đám mây
Hình 1.6. Mô hình nghiên cứu cân bằng tải trên điện toán đám mây [30] (Trang 31)
Bảng 1.2 cho thấy ưu, nhược điểm của một số phương pháp cân bằng tải trên môi trường điện toán đám mây [14]. - Nâng cao hiệu năng cân bằng tải trên điện toán đám mây
Bảng 1.2 cho thấy ưu, nhược điểm của một số phương pháp cân bằng tải trên môi trường điện toán đám mây [14] (Trang 36)
Hình 2.5: Sơ đồ luồng thông tin quảnlý bánhàng - Nâng cao hiệu năng cân bằng tải trên điện toán đám mây
Hình 2.5 Sơ đồ luồng thông tin quảnlý bánhàng (Trang 45)
Hình 1.8. Mô hình lập lịch khối lượng công việc cho đám mây [60]. - Nâng cao hiệu năng cân bằng tải trên điện toán đám mây
Hình 1.8. Mô hình lập lịch khối lượng công việc cho đám mây [60] (Trang 47)
Bảng chỉ mục trạng thái của tất cả VM - Nâng cao hiệu năng cân bằng tải trên điện toán đám mây
Bảng ch ỉ mục trạng thái của tất cả VM (Trang 57)
Hình 2.2: Mô hình IaaS điện toán đám mây thông qua thành phần DatacenterBrocker [50]. - Nâng cao hiệu năng cân bằng tải trên điện toán đám mây
Hình 2.2 Mô hình IaaS điện toán đám mây thông qua thành phần DatacenterBrocker [50] (Trang 59)
Hình 2.3: Lưu đồ thuật toán đề xuất LBAIRT. - Nâng cao hiệu năng cân bằng tải trên điện toán đám mây
Hình 2.3 Lưu đồ thuật toán đề xuất LBAIRT (Trang 63)
Bảng 2.4: Cấu hình các VM - Nâng cao hiệu năng cân bằng tải trên điện toán đám mây
Bảng 2.4 Cấu hình các VM (Trang 65)
Bảng 2.6: So sánh kết quả mô phỏng giữa hai thuật toán Throttled và LBAIRT - Nâng cao hiệu năng cân bằng tải trên điện toán đám mây
Bảng 2.6 So sánh kết quả mô phỏng giữa hai thuật toán Throttled và LBAIRT (Trang 68)
Hình 2.5. Mô hình thuật toán RRTA - Nâng cao hiệu năng cân bằng tải trên điện toán đám mây
Hình 2.5. Mô hình thuật toán RRTA (Trang 71)
Bảng 2.7. Thông số cấu hình Datacenter - Nâng cao hiệu năng cân bằng tải trên điện toán đám mây
Bảng 2.7. Thông số cấu hình Datacenter (Trang 74)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w