tính cá nhân trong một hệ thống phân tán có thể được, ví dụ, sự kết hợp của bộ xử lý đồng loạtsong song MPP, đa xử lý đối xứng SMPS, các cụm, và các máy tính cá nhân.Dịch vụ điện toán đá
Trang 1ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
CHƯƠNG TRÌNH ĐÀO TẠO THẠC SỸ CNTT QUA MẠNG
_ _
Bài thu hoạch GRID-COMPUTING:
Giảng viên hướng dẫn: PGS TS Nguyễn Phi Khứ Thực hiện: Nguyễn Võ Thanh Sang – CH1101036
Những
mô hình
điện toán phân tán
Trang 2TP HCM, năm 2013
LỜI CẢM ƠN
Trong suốt thời gian học vừa qua, em đã nhận được sự quan tâm, động viên và tậntình hướng dẫn, giảng dạy của thầy, đã cung cấp những kiến thức hết sức bổ ích và cần thiếtlàm hành trang cho công tác sau này
Chúng em xin chân thành cảm ơn quý thầy cô trường Đại học Công Nghệ ThôngTin, Phòng Đào tạo Sau đại học đã tạo cho chúng em một môi trường học tập, rèn luyệntrong suốt thời gian học đã cung cấp những kiến thức cũng như những kinh nghiệm hết sứccần thiết cho việc học tập và nghiên cứu
Đặc biệt, chúng em xin gửi lời cảm ơn chân thành đến PGS TS Nguyễn Phi Khứ,thầy đã truyền đạt những kiến thức quý báu về môn học học “Tính toán hiệu năng cao – Grid
Computing” và hướng dẫn em thực hiện bài thu hoạch môn học này
Do kiến thức về học phần còn hạn chế nên bài thu hoạch không tránh khỏi thiếu sót
Em rất mong được hướng dẫn thêm của thầy để bài thu hoạch được hoàn thiện hơn
Nguyễn Võ Thanh Sang -CH1101036
Trang 3NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN
Trang 4
MỤC LỤC
Nội dung
Trang 5GIỚI THIỆU
Điện toán phân tán được thực hiện trên nhiều hệ thống để giải quyết một vấn đề quy môlớn Sự phát triển của các mạng băng thông rộng tốc độ cao ở các nước phát triển và đang pháttriển, sự gia tăng liên tục trong khả năng tính toán, và sự phát triển nhanh chóng của Internet đãthay đổi cách thực hiện Trong đó xã hội quản lý thông tin và dịch vụ thông tin Trong lịch sử,
mô hình tính toán đã trải qua một loạt các nền tảng và thay đổi môi trường Điện toán phân tánđảm bảo tuyệt vời cho việc sử dụng hệ thống máy tính một cách hiệu quả Kết quả là, các siêumáy tính và trung tâm dữ liệu đã thay đổi từ việc cung cấp khả năng tính toán dấu chấm độnghiệu suất cao sang đồng thời phục vụ số lượng lớn các yêu cầu từ hàng tỷ người sử dụng Hệthống điện toán phân tán sử dụng nhiều máy tính để giải quyết vấn đề quy mô lớn thông quamôi trường Internet Nó sẽ trở thành dữ liệu chuyên sâu và mạng lưới trung tâm Các ứng dụngđiện toán phân tán ngày càng rộng rãi
Trong điện toán phân tán, khó khăn chính là việc chia sẻ nguồn tài nguyên quy mô lớn
và luôn luôn thể hiện hiệu suất tốt nhất Trong phạm vi bài thu hoạch này, em xin được giới
thiệu hai bài báo: “The Distributed Computing Paradigms: P2P, Grid, Cluster, Cloud, and Jungle” của các tác giả: Brijender Kahanwal, Tejinder Pal Singh và “Smart Redundancy for Distributed Computation” của các tác giả Yuriy Brun, George Edwards, Jae young Bang, and
Nenad Medvidovic Hai bài báo đã giới thiệu các khái niệm cơ bản về điện toán phân tán vàmột giải pháp cải thiện hiệu quả thực hiện, làm nền tảng cho các nghiên cứu sau này
Trang 6Phần I NHỮNG MÔ HÌNH ĐIỆN TOÁN PHÂN TÁN
1 Giới thiệu
Sự phổ biến của Internet và sự sẵn có của máy tính mạnh mẽ và mạng tốc độ cao, chiphí thấp đang thay đổi cách tác giả tính toán.Điện toán phân tán đã trở thành một thành phầnthiết yếu của máy tính khoa học trong nhiều thập kỷ Nó bao gồm một tập hợp các quá trìnhhợp tác để đạt được một mục tiêu cụ thể chung Mọi người đều công nhận rộng rãi rằng Côngnghệ thông tin và Truyền thông Công nghệ (ICT) đã cách mạng hóa việc thực hành hàng ngày.Mạng xã hội thể hiện một bước trong quá trình sử dụng Internet để cho phép các thao tác xã hộihóa thông tin và văn hóa Hết hết các trang mạng xã hội được thực hiện trên các khái niệm về
hệ thống điện toán phân tán lớn Đó là những hoạt động trong các trung tâm dữ liệu điều khiểntập trung Tuy nhiên, xu hướng trong các hệ thống ồ ạt mở rộng là hướng tới việc sử dụng điệntoán ngang hàng, tiện ích, cụm, và rừng Điện toán tiện ích về cơ bản là điện toán lưới và điệntoán đám mây là chủ đề gần đây của nghiên cứu Phân loại này cũng thể hiện trong hình 1.1
Với tính không đồng nhất ngày càng tăng của các phần cứng cơ bản, việc lập bản đồ mộtcách hiệu quả về các vấn đề tính toán dựa trên phần cứng thuần đã trở thành cực kỳ phức tạp
Có rất nhiều thách thức của điện toán phân tán như sau:
Sự trong suốt có nghĩa là ẩn sự phân tán từ người sử dụng ở mức độ cao và từ các
chương trình ở cấp thấp Có nhiều hình thức ẩn như địa điểm, di cư, nhân rộng, truy cập đồng
thời và song song Linh hoạt nên dễ phát triển Độ tin cậy bao gồm một số yếu tố như không
mất dữ liệu, hệ thống an toàn, và các hệ thống chấp nhận lỗi Hiệu suất nên được cao Khả năng
mở rộng nên co dãn vô thời hạn
Trang 7Các hình thức điện toán phân tán
2 Các công trình liên quan
Ngành công nghiệp máy tính là một trong những ngành phát triển nhanh nhất và nóđược kích thích bởi sự phát triển công nghệ nhanh chóng trong các lĩnh vực phần cứng máytính và phần mềm Công nghệ tiên tiến trong phần cứng bao gồm phát triển chip và công nghệchế tạo, bộ vi xử lý nhanh chóng và rẻ tiền, cũng như băng thông cao và mạng lưới kết nối độtrễ thấp Trong số đó, những tiến bộ gần đây trong công nghệ điện tử đã đóng một vai trò quantrọng trong sự phát triển của máy tính tuần tự và song song mạnh mẽ
Công nghệ phần mềm cũng đang phát triển nhanh Phần mềm trưởng thành, chẳng hạnnhư hệ điều hành, ngôn ngữ lập trình, phương pháp phát triển, và các công cụ, đang có sẵn.Điều này đã cho phép sự phát triển và triển khai các ứng dụng phục vụ cho khoa học, kỹ thuật,thương mại và nhu cầu Cũng cần lưu ý rằng các ứng dụng mang tính thách thức lớn, chẳng hạnnhư dự báo thời tiết và phân tích trận động đất, đã trở thành động lực chính đằng sau sự pháttriển của máy tính song song mạnh mẽ
Hệ thống phân tán có thể được coi là mạng thông thường của những máy tính độc lập.Chúng có nhiều hình ảnh hệ thống, như mỗi nút chạy hệ điều hành riêng của mình, và các máy
Trang 8tính cá nhân trong một hệ thống phân tán có thể được, ví dụ, sự kết hợp của bộ xử lý đồng loạtsong song (MPP), đa xử lý đối xứng (SMPS), các cụm, và các máy tính cá nhân.
Dịch vụ điện toán đám mây chủ yếu chia thành ba mô hình cung cấp dịch vụ: SaaS(phần mềm như một dịch vụ, ví dụ như Google Mail), PaaS (nền tảng như một dịch vụ, ví dụnhư Google AppEngine) và IaaS (Cơ sở hạ tầng như một dịch vụ, ví dụ như Amazon EC2) Kể
từ khi công việc trình bày trong chương này có liên quan chặt chẽ với cơ sở hạ tầng như một
mô hình dịch vụ, tác giả chỉ tập trung trong phần này trên loại hình dịch vụ này Các nhà cungcấp IaaS nhằm mục đích cung cấp nguồn lực cho người sử dụng như cách thức “chỉ trả những
gì bạn dùng” Một nhà cung cấp chính của dịch vụ này là Amazon thông qua Điện toán đámmây đàn hồi (EC2) và Dịch vụ lưu trữ đơn giản (S3)
Các viện sĩ và các nhóm khổng lồ đang làm hết sức mình để trở lại với những khái niệmmới của điện toán phân tán và họ đã đưa ra rất nhiều kết quả tốt Nhưng luôn luôn có một sựtăng thêm để phát triển một công nghệ tốt hơn, vì vậy tác giả đang phát triễn và điện toán đámmây là chủ đề gần đây đang được tiến hành
3 Điện toán ngang hàng
Mạng ngang hàng (P2P) đã được làm việc chủ yếu vào các vấn đề khả năng mở rộngvốn có trong các nguồn tài nguyên phân tán trên một số lượng lớn của các kết nối mạng Trongmột hệ thống P2P, tất cả các nút hoạt động như một máy khách và máy chủ, cung cấp một phầncủa tài nguyên hệ thống Máy ngang hàng chỉ đơn giản là máy tính của khách hàng kết nối vớiInternet Tất cả các máy khách hàng hành động một cách tự tham gia hoặc rời khỏi hệ thốngmột cách tự do Điều này có nghĩa rằng không có mối quan hệ chủ-khách tồn tại giữa các đồngnghiệp Không có sự phối hợp tập trung hoặc không có cơ sở dữ liệu trung tâm là cần thiết Nóicách khác, không có máy ngang hàng nào có một cái nhìn toàn cục của toàn bộ hệ thống P2P
Hệ thống được tự tổ chức với điều khiển phân tán như thể hiện trong hình 3.1
Trang 9Figure 3.1: P2P Network
4 Điện toán cụm
Một cụm máy tính bao gồm một tập hợp các máy tính độc lập hoặc đơn lẻ và một mạngkết nối chúng Nó hoạt động hợp tác với nhau như một nguồn tài nguyên máy tính tích hợp duynhất Một cụm là địa phương trong tất cả các hệ thống con thành phần của nó được giám sáttrong một phạm vi hành chính duy nhất, thường trú tại một phòng đơn và quản lý như một hệthống máy tính duy nhất Các thành phần của một nhóm được kết nối với nhau thông qua mạngcục bộ nhanh Để xử lý khối lượng công việc nặng nề với bộ dữ liệu lớn, các hệ thống máy tínhcủa nhóm đã chứng minh kết quả ấn tượng trong quá khứ Kiến trúc của môi trường điện toáncụm được thể hiện trong Hình 4.1
Trang 10Thành phần của điện toán cụm: Có rất nhiều thành phần của điện toán cụm như sau:
o Máy tính hiệu năng cao như máy tính cá nhân, máy trạm, vv
o Hệ điều hành dựa trên hạt nhân nhỏ
o Các mạng tốc độ cao hoặc chuyển mạch như Gigabit Ethernet
o NIC (Network Interface Card)
o Các giao thức và dịch vụ thông tin nhanh
o Cụm Middleware là phần cứng, hạt nhân hệ điều hành, các ứng dụng và các hệ thốngcon
o Công cụ môi trường lập trình song song như các trình biên dịch, máy ảo song song, vv
o Các ứng dụng tuần tự và song song
Các cụm trung gian có rất nhiều khả năng cung cấp một ảnh hệ thống khó nắm bắt vàthống nhất
Sự phân loại các cụm như thể hiện trong hình 4.2
Trang 11Figure 4.2: Cluster Computing Classification
Cụm có tính sẵn sàng cao
Đây cũng được gọi là cụm chuyển đổi dự phòng Đây là những nhóm máy tính có hỗ trợcác ứng dụng máy chủ Đây có thể được sử dụng đáng tin cậy với tối thiểu là thời gian xuống.Chúng hoạt động bằng cách khai thác các máy tính dư thừa trong nhóm hoặc cụm cung cấpdịch vụ tiếp tục khi các thành phần hệ thống thất bại Nếu không có phân nhóm, nếu một máychủ đang chạy một ứng dụng bị treo đặc biệt, ứng dụng sẽ không có sẵn cho đến khi máy chủ
bị rơi là cố định Loại như vậy của cụm biện pháp khắc phục tình trạng này bằng cách phát hiệnlỗi phần cứng / phần mềm, và ngay lập tức khởi động lại ứng dụng trên máy tính khác màkhông cần sự can thiệp hành chính, một quá trình được gọi là chuyển đổi dự phòng Như là mộtphần của quá trình này, phần mềm phân nhóm có thể cấu hình các nút trước khi bắt đầu ứngdụng trên nó
Cụm cân bằng tải
Cân bằng tải thường được yêu cầu khi xây dựng các giải pháp xử lý khối lượng lớn cácyêu cầu của khách hàng hoặc có nhu cầu cao về an ninh và dự phòng Cụm hỗ trợ đa ngườidùng và môi trường đa nhiệm Các yếu tố đi kèm với tính chất không đồng nhất của các phầncứng và phần mềm cụm dẫn đến tình trạng đó phân công các khối lượng công việc của mộtnhóm là khó dự đoán tại bất kỳ thời điểm cụ thể Phương pháp tĩnh để I / O lập kế hoạch là dogần như vô dụng Hai loại chính của tải triển khai thực hiện cân bằng là:
Trang 12Cân bằng tải dựa trên phần mềm bao gồm các phần mềm đặc biệt được cài đặt trên cácmáy chủ trong một cụm cân bằng tải Công văn được phần mềm hoặc chấp nhận yêu cầu từkhách hàng đến các máy chủ, dựa trên các thuật toán khác nhau Các thuật toán có thể là mộtthuật toán vòng tròn đơn giản hoặc một thuật toán phức tạp hơn nhiều trong đó xem xét mốiquan hệ máy chủ Ví dụ, Microsoft Network Load Balancing là một phần mềm cân bằng tảicho các trang trại Web, và Microsoft phần cân bằng tải là một phần mềm cân bằng tải cho cáctrang trại ứng dụng.
Dựa trên phần cứng cân bằng tải bao gồm một chuyển đổi chuyên ngành hoặc router vớiphần mềm để cung cấp cho nó chức năng cân bằng tải Giải pháp này tích hợp chuyển đổi vàcân bằng tải vào một thiết bị duy nhất, làm giảm số lượng phần cứng bổ sung là cần thiết đểthực hiện cân bằng tải Kết hợp hai chức năng, tuy nhiên, cũng làm cho các thiết bị khó khănhơn để khắc phục sự cố
Cụm tính toán hiệu suất cao
Các doanh nghiệp đang sử dụng cụm quy mô lớn thường được chia sẻ giữa các phòngban với công chúng truy cập dễ dàng Cụm hiệu suất cao được sử dụng mà thời gian để giảipháp là quan trọng Họ cũng được sử dụng trong trường hợp một vấn đề quá lớn nó canít ìfitîtrên một máy tính duy nhất Để tăng thông lượng tính toán, HPC cụm được sử dụng trongnhiều cách khác nhau
Cách đơn giản nhất là để cho phép các nhóm để hoạt động như một trang trại tính toán.Thay vì chạy một công việc trên một máy trạm địa phương, được gửi đến các cụm để thựchiện Cluster sẽ quản lý các nguồn lực cần thiết cho công việc và phân công công việc cho mộthàng đợi công việc Khi các nguồn tài nguyên (ví dụ, một máy chủ) có sẵn, công việc đượcthực hiện và kết quả được trả về cho người dùng Người dùng cần phải chạy nhiều công việctương tự với các thông số khác nhau hoặc tập hợp dữ liệu tìm thấy cụm lý tưởng cho các loạihình công việc Họ có thể gửi hàng trăm việc làm và cho phép các nhóm để quản lý dòng chảycông việc Tùy thuộc vào các nguồn tài nguyên, tất cả các công việc có thể chạy cùng lúc hoặcmột số có thể chờ đợi trong hàng đợi trong khi công việc khác kết thúc Đây là loại máy tính làđịa phương đến một cụm nút, có nghĩa là doesnít giao tiếp nút với các nút khác, nhưng có thểcần truy cập hệ thống tập tin tốc độ cao
Trang 135 Điện toán tiện ích
Điện toán tiện ích được hình dung là thế hệ tiếp theo của công nghệ thông tin phát triển,miêu tả như thế nào nhu cầu điện toán của người sử dụng có thể được hoàn thành trong tươnglai ngành công nghiệp CNTT Tương tự của nó có nguồn gốc từ thế giới thực, nơi cung cấpdịch vụ duy trì và cung cấp dịch vụ tiện ích, chẳng hạn như năng lượng điện, khí đốt và nướccho người tiêu dùng Người tiêu dùng lần lượt trả tiền cung cấp dịch vụ dựa vào cách sử dụngcủa họ Vì vậy, việc thiết kế cơ bản của điện toán tiện ích dựa trên một mô hình dịch vụ dựphòng, nơi người dùng (người tiêu dùng) trả nhà cung cấp để sử dụng sức mạnh tính toán chỉkhi họ cần Điện toán tiện ích tập trung vào một mô hình kinh doanh, theo đó khách hàng nhậnđược tài nguyên máy tính từ một nhà cung cấp dịch vụ thanh toán Tất cả các nền tảng lưới /điện toán đám mây được coi là nhà cung cấp dịch vụ tiện ích Tuy nhiên, điện toán đám mâycung cấp một khái niệm rộng hơn so với máy tính tiện ích
5.1 Điện toán lưới
Mục đích của Điện toán lưới là cho phép chia sẻ tài nguyên và phối hợp giải quyết trongnăng động tổ chức nhiều tổ chức ảo, vấn đề
Như một lưới điện-tiện ích, một mạng lưới máy tính cung cấp một cơ sở hạ tầng các cặpmáy tính, phần mềm/trung gian, dụng cụ đặc biệt, và người và cảm biến với nhau Lưới điệnthường được xây dựng qua mạng LAN, WAN, hoặc mạng đường trục Internet tại khu vực,quốc gia, hoặc quy mô toàn cầu Các doanh nghiệp, tổ chức trình bày lưới như tài nguyên máytính tích hợp Chúng có thể được xem cũng như các nền tảng ảo để hỗ trợ các tổ chức ảo Cácmáy tính được sử dụng trong một mạng lưới chủ yếu là các máy trạm, máy chủ, các cụm, vàcác siêu máy tính Máy tính cá nhân, máy tính xách tay và PDA có thể được sử dụng như cácthiết bị truy cập vào một hệ thống lưới điện Lưới có thể có nhiều loại như, kiến thức, dữ liệu,tính toán, ứng dụng Cung cấp dịch vụ, tương tác hoặc tiện ích
Có nhiều ưu và nhược điểm Ưu điểm là như, đây là những khả năng để giải quyết lớnhơn, vấn đề phức tạp hơn trong một thời gian ngắn, đây là dễ dàng hơn để cộng tác với các tổchức khác, và những sử dụng tốt hơn phần cứng hiện có Khuyết điểm là như, phần mềm lưới
và tiêu chuẩn vẫn còn đang phát triển, bắt đầu thương đi đường vòng, và trình công việc khôngtương tác
Trang 145.2 Điện toán đám mây
Điện toán đám mây là một hình thức điện toán tiện ích Nó là một thuật ngữ mới trongthế giới điện toán và báo hiệu sự ra đời của một mô hình điện toán mới Mô hình mới này lànhanh chóng phát triển và thu hút một lượng khách hàng và các nhà cung cấp như nhau Sựphát triển nhanh chóng của điện toán đám mây đang được thúc đẩy bởi các công nghệ máy tínhmới nổi cho phép cho giá hợp lý sử dụng cơ sở hạ tầng điện toán và khả năng lưu trữ lớn Nócũng loại bỏ sự cần thiết phải đầu tư trả trước lớn trong Công nghệ thông tin (CNTT) cơ sở hạtầng
Điện toán đám mây là một mô hình điện toán liên quan đến việc gia công phần mềm củacác tài nguyên máy tính với khả năng của khả năng mở rộng nguồn tài nguyên cạn kiệt, theoyêu cầu trích lập dự phòng với chi phí đầu tư cơ sở hạ tầng CNTT ít hoặc không lên phía trước.Điện toán đám mây cung cấp các lợi ích của mình thông qua ba loại hình dịch vụ hay mô hìnhcung cấp cụ thể là cơ sở hạ tầng như một dịch vụ (IaaS), nền tảng-như-một dịch vụ (PaaS) vàphần mềm-như-một-dịch vụ (SaaS) Nó cũng cung cấp dịch vụ của mình thông qua bốn môhình triển khai cụ thể là, điện toán đám mây công cộng, đám mây riêng, đám mây cộng đồng vàđám mây lai là phân loại được thể hiện trong hình 5
Đám mây công cộng trong việc triển khai này, cơ sở hạ tầng điện toán đám mây có thểtruy cập cho công chúng nói chung và chia sẻ trong một trả như bạn đi mô hình thanh toán Cácnguồn tài nguyên điện toán đám mây có thể truy cập thông qua internet và các nhà cung cấp cótrách nhiệm bảo đảm quy mô kinh tế và quản lý cơ sở hạ tầng được chia sẻ
Trong mô hình này khách hàng có thể lựa chọn mức độ bảo mật mà họ cần, và thươnglượng mức độ dịch vụ Dịch vụ web Amazon EC2 là một đám mây công cộng Nó có thể truycập cho công chúng
Các đám mây riêng là một mô hình triển khai cho dịch vụ điện toán đám mây Trong môhình này các tài nguyên điện toán đám mây không được chia sẻ bởi các bên thứ ba không rõ.Các nguồn tài nguyên điện toán đám mây trong mô hình này có thể nằm trong phạm vi các cơ
sở tổ chức khách hàng hoặc ngoại vi
Trang 15Figure 5: Classification of Cloud ComputingTrong mô hình này, an ninh của khách hàng và yêu cầu tuân thủ không bị ảnh hưởngmặc dù cung cấp này không đem lại lợi ích gắn liền với giảm chi phí vốn trong đầu tư cơ sở hạtầng CNTT Trong loại này của điện toán đám mây công chúng không có quyền truy cập vàocác đám mây riêng không không tổ chức sử dụng điện toán đám mây công cộng.
Đám mây lai như tên gọi của nó là một mô hình triển khai kết hợp đám mây khác nhau
ví dụ như các đám mây riêng và công cộng Trong mô hình này những đám mây kết hợp giữ lạibản sắc của họ nhưng đang bị ràng buộc với nhau bằng công nghệ chuẩn hóa Trong loại nàycủa điện toán đám mây công chúng không có quyền truy cập vào các đám mây, nhưng tổ chức
sử dụng cơ sở hạ tầng trong cả hai đám mây công cộng và tư nhân
Đám mây cộng đồng là mô hình triển khai thứ tư có thể được sử dụng để cung cấp dịch
vụ điện toán đám mây Trong mô hình này, các cơ sở hạ tầng điện toán đám mây được chia sẻbởi nhiều tổ chức, các tổ chức có một mối quan tâm chia sẻ hoặc quan tâm như xem xét việctuân thủ, yêu cầu bảo mật Đây là loại điện toán đám mây có thể được quản lý bởi tổ chức hoặccủa một bên thứ ba và có thể được đặt tại chỗ hoặc tắt tại chỗ Trong loại này của điện toánđám mây cả công chúng và các tổ chức hình thành các đám mây cộng đồng được tiếp cận vớicác dịch vụ đám mây được cung cấp bởi các đám mây cộng đồng