Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 57 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
57
Dung lượng
1,69 MB
Nội dung
NGUYỄN THỊ KIM TUYẾN BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI o0o - Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm LỜI CẢM ƠN Trong trình tìm hiểu nghiên cứu để hoàn thành luận văn, gặp không khó khăn, lúc vậy, nhận động viên, khích lệ thầy giáo, TS Nguyễn Kim Khánh Thầy giúp đỡ nhiều trình nghiên cứu, hướng dẫn tận tình cách thức phương pháp nghiên cứu LUẬN VĂN THẠC SĨ KHOA HỌC NGÀNH: CÔNG NGHỆ THÔNG TIN khoa học hỗ trợ việc tìm tài liệu Để có kết luận văn này, xin gửi lời cảm ơn sâu sắc đến thầy giáo, TS Nguyễn Kim Khánh khoa Công nghệ thông tin trường ĐHBKHN CÔNG NGHỆ THÔNG TIN Tôi xin gửi lời cảm ơn đến thầy cô bạn Trung tâm tính toán hiệu cao, trường ĐHBKHN NGHIÊN CỨU TỔNG QUAN VỀ TÍNH TOÁN LƯỚI VÀ CÀI ĐẶT MÔ HÌNH THỬ NGHIỆM Cuối xin cảm ơn đồng nghiệp, gia đình bạn người bên cạnh, động viên khích lệ để có kết ngày hôm Hà Nội, ngày 05 tháng 10 năm 2006 Tác giả NGUYỄN THỊ KIM TUYẾN Nguyễn Thị Kim Tuyến Lớp Cao học CNTT 2004-2006 2004-2006 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN HÀ NỘI 2006 HÀ NỘI 10-2006 Trang Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm LỜI CAM ĐOAN Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm MỤC LỤC Tôi Nguyễn Thị Kim Tuyến, học viên lớp cao học khoá 2004-2006, chuyên ngành Công nghệ thông tin Tôi xin cam đoan luận văn "Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm" nghiên cứu, tìm hiểu hướng dẫn thầy giáo TS Nguyễn Kim Khánh, chép người khác Tôi xin chịu trách nhiệm lời cam đoan LỜI CẢM ƠN LỜI CAM ĐOAN MỤC LỤC DANH MỤC THUẬT NGỮ DANH MỤC HÌNH LỜI NÓI ĐẦU CHƯƠNG TÍNH TOÁN LƯỚI 10 1.1 Tổng quan Tính toán lưới 10 Hà Nội, ngày 05 tháng 10 năm 2006 Tác giả 1.1.1 Tính toán lưới gì? 10 1.1.2 So sánh với mô hình, công nghệ khác 12 1.1.3 Phân loại mạng lưới 13 1.2 Kiến trúc thành phần hệ thống lưới 15 Nguyễn Thị Kim Tuyến Lớp Cao học CNTT 2004-2006 1.2.1 Tổng quan kiến trúc lưới 15 1.2.2 Các thành phần theo mô hình chức 18 1.2.3 Các thành phần theo mô hình vật lý 19 1.3 Các chuẩn cho tính toán lưới 19 1.3.1 OGSA/OGSI gì? 20 1.3.2 Chuẩn OGSI .20 1.3.3 Chuẩn OGSA 22 1.4 Các thành phần mô hình chức lưới 24 1.4.1 Bảo mật 24 1.4.1.1 Cơ chế bảo mật môi trường lưới 25 1.4.1.2 Các sách bảo mật môi trường lưới .25 1.4.1.3 Hạ tầng an ninh mạng lưới GSI (Grid Security Infrastructure) 26 1.4.2 Quản lý tài nguyên lưới 27 1.4.2.1 Những thách thức quản lý tài nguyên lưới 27 1.4.2.2 Hệ quản trị tài nguyên GRAM 29 1.4.3 Quản lý liệu 30 1.4.3.1 Giao thức truyền tập tin mạng lưới GridFTP 30 1.4.3.2 Dịch vụ định vị RLS 33 1.4.4 Lập lịch môi trường lưới 36 1.4.5 Grid Portal 38 1.4.5.1 Các yêu cầu Grid Portal 39 1.4.5.2 Chuyển tải Job Grid Portal 39 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm 1.4.6 Giám sát lưới 40 1.4.6.1 Quy trình giám sát 41 1.4.6.2 Yêu cầu hệ thống giám sát lưới .41 1.4.6.3 Kiến trúc giám sát lưới GMA (Grid Monitoring Architecture) 42 1.4.6.4 Phân loại hệ thống giám sát lưới 43 1.5 Kết chương 44 CHƯƠNG TỔNG QUAN VỀ GLOBUS 45 2.1 Tổng quan kiến trúc chung GT 45 2.1.1 Các chức GT 45 2.1.2 Các đặc trưng GT4 .46 2.1.3 Tóm lược kiến trúc GT4 48 2.2 Kiến trúc hướng dịch vụ 48 2.2.1 GT4, hệ thống phân tán, dịch vụ Web 48 2.2.2 Cơ sở hạ tầng ứng dụng hướng dịch vụ 49 2.2.3 Kiến trúc hướng dịch vụ (Service Oriented Architecture-SOA) .50 2.3 Kiến trúc GT4 51 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm 3.1.2 Định nghĩa Desktop Grid 69 3.1.3 Giá trị lưới Desktop Grid 70 3.1.4 Các phần tử kỹ thuật .70 3.1.5 Các khía cạnh thực tế cần xem xét 72 3.1.6 Grid Server .73 3.2 Cluster Grids 74 3.2.1 Kiến trúc lưới Cluster .74 3.2.2 Bó phần mềm lưới cluster Sun 75 3.2.3 Yêu cầu thiết kế 78 3.2.4 Phần cứng mạng .79 3.2.5 Quản lý Cluster Grid .80 3.3 Kết nối Cluster vào Grid 81 3.3.1 Sự cần thiết việc kết nối grid cluster 82 3.3.2 Kết nối Globus-based Grid PBS-based Cluster 82 3.3.2.1 GRAM .82 3.3.2.2 PBS 83 3.3.2.3 Các yêu cầu thành phần kết nối 87 2.3.1 Kiến trúc tổng quan 51 2.3.2 Triển khai dịch vụ Web GT4 .53 3.4 Kết chương 90 2.4 Quản lý thực thi GT4 54 CHƯƠNG TRIỂN KHAI THỬ NGHIỆM 91 2.4.1 Tổng quan GT4 GRAM .55 2.4.2 Lệnh globusrun-ws 56 2.4.3 Cách thức hoạt động GT4 GRAM 60 2.4.4 Cấu hình quản trị GT4 GRAM 62 4.1 Lập thiết kế kiến trúc lưới 91 4.2 Cài đặt Grid 95 2.5.1 Tổng quan quản lý liệu GT4 63 2.5.2 Di chuyển liệu 63 2.5.3 Tạo liệu 64 4.2.1 Cấu hình phần cứng lưới 95 4.2.2 Yêu cầu trước cài đặt 96 4.2.3 Cài đặt cho nút 96 4.2.4 Cài đặt nút tính toán 101 4.2.5 Đồng thời gian nút lưới 102 4.2.6 Cấu hình dịch vụ mức lưới .103 2.6 Theo dõi phát 65 4.3 Kết nối Cluster vào Grid 105 2.6.1 Hệ thống theo dõi phát - MDS4 65 2.6.2 Bộ gộp (aggregator) nguồn thông tin 66 2.6.3 Nguồn thông tin việc đăng ký 67 4.3.1 Cấu hình phần cứng 105 4.3.2 Cấu hình cluster-based PBS 106 4.3.3 Cấu hình lưới dựa GT 108 2.5 Quản lý liệu GT4 63 2.7 Kết chương 67 4.4 Kết chương 109 CHƯƠNG CÁC KỸ THUẬT LƯỚI HIỆN ĐƯỢC TRIỂN KHAI Ở VIỆT NAM .68 KẾT LUẬN VÀ KIẾN NGHỊ 110 TÀI LIỆU THAM KHẢO 111 3.1 Desktop Grids 68 3.1.1 Tính toán phân tán xí nghiệp 68 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm DANH MỤC THUẬT NGỮ Viết tắt API CAS DPSS DTP GRAM GTCP FTP Globus XIO GMA GridFTP GSI HPSS HTTP LDAP LFN LRC Tên đầy đủ Grid Computing Globus Toolkit Chú giải Tính toán lưới Bộ công cụ middleware hỗ trợ tính toán lưới, cung cấp số dịch vụ đệ trình công việc, quản lý tài nguyên, hạ tầng bảo mật, hỗ trợ việc xây dựng dịch vụ lưới… Web Service Dịch vụ web – kiến trúc phát triển W3C nhằm cung cấp chức cho người dùng từ xa Application Programming Giao diện lập trình ứng dụng, thường tập hàm Interface giúp lập trình viên dễ dàng tương tác với dịch vụ hệ thống Community Dịch vụ chứng thực cộng đồng Một dịch vụ bảo mật Authorization Service môi trường lưới cho phép dung hòa sách sử dụng tài nguyên cộng đồng người dùng với sách sử dụng tài nguyên nhà cung cấp Distributed Parallel Hệ thống lưu trữ song song phân tán: kỹ thuật tổ chức Storage System tập đĩa cứng nằm server kết nối với qua mạng diện rộng, cung cấp khả truy cập mức độ khối logic đến liệu lớn Data Transfer Process Tiến trình quản lý việc truy cập liệu thực truyền qua kênh liệu kiến trúc GridFTP Grid Resource Allocation Dịch vụ quản lý định vị tài nguyên lưới and Management Service Grid Telecontrol Protocol Giao thức điều khiển lưới từ xa File Transfer Protocol Giao thức truyền tệp tiếng qua mạng Globus eXtensible Giao diện vào mức thấp kiến trúc Globus Input/Ouput Grid Monitoring Hệ thống gián sát lưới Architecture Grid File Transfer GridFTP mở rộng giao thức FTP, tích hợp khả Protocol bảo mật lưới, truyền liệu tốt so với FTP Grid Security Cơ sở hạ tầng bảo mật lưới kiến trúc Globus, Infrastructure hỗ trợ giấy chứng nhận theo chuẩn X509 dùng hệ mã công khai High Performance Hệ thống quản lý hiệu hàng trăm terabyte tới Storage System petabyte lưu ổ cứng băng từ, liệu thường xuyên sử dụng lưu đĩa cứng, liệu có tần suất sử dụng lưu băng từ Hypertext Transfer Giao thức truyền siêu văn bản, sử dụng để truyền Protocol thông tin từ máy phục vụ www đến trình duyệt Lightweight Directory Giao thức đặc tả kỹ thuật định danh đối tượng, mô Access Protocol hình liệu, tìm kiếm ghi khoản mục liệu Logical File Name Tên logic thực thể liệu lưới liệu, hàm chứa nội dung thực thể liệu Local Replica Catalogue Catalog định vị địa phương, lưu trữ tập ánh xạ bao gồm hai trường: {tên logic thực thể liệu, vị trí vật lý cụ thể thực thể đó} Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang Luận văn thạc sĩ khoa học MCS Metadata Catalog Service MDS PBS Monitoring and Discovery Service Message Passing Interface Open Grid Service Architecture Open Grid Service Infrastructure Protable Batch System PI Protocol Interperter RFT RLI Reliable File Transfer Service Replica Location Index RLS Replica Location Service RMI Remote Method Invocation RSL SRB Resource Specification Language Simple Mail Transfer Protocol Service Oriented Architecture Simple Object Access Protocol Software Development Kit Storage Resource Broker SSL UHE VO WSDD/ WSDL WSRF Secure Socket Layer User Host Environment Virtual Organizations Web Service Deployment Descriptor Web Service Protocol XML Extensible Markup Language MPI OGSA OGSI SMTP SOA SOAP SDK Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Dịch vụ siêu liệu kiến trúc lưới liệu Globus, cho phép gắn đối tượng liệu với số thuộc tính mô tả Dịch vụ theo dõi định vị tài nguyên Giao diện truyền thông điệp, cách thức trao đổi thông tin tiến trình Kiến trúc dịch vụ lưới, định nghĩa giao diện chuẩn chế hoạt động dịch vụ lưới Hạ tầng dịch vụ lưới mở Là hệ thống phân tải quản lý tài nguyên mạnh Được sử dụng phổ biến hệ thống tính toán song song Cung cấp khả khởi tạo lập lịch cho việc thực thi xếp công việc máy trạm Bộ thông dịch giao thức, có nhiệm vụ quản lý kênh điều khiển kiến trúc GridFTP Dịch vụ truyền file tin cậy Lưu thông tin mục cho dịch vụ định vị sao, ghi bao gồm {LFN, trỏ tới LRC tương ứng} Dịch vụ định vị kiến trúc lưới liệu Globus, cho phép xác định vị trí thực thể liệu lưới Gọi phương thức từ xa, sử dụng Java chạy RMI, đối tượng Java gọi phương thức đối tượng xa chạy máy ảo khác Ngôn ngữ đặc tả tài nguyên Giao thức từ máy phục vụ đến máy phục vụ hỗ trợ phân tán thư điện tử Kiến trúc hướng dịch vụ Giao thức truy cập đối tượng từ xa đơn giản, dùng xây dựng dịch vụ web, lập tình phân tán Tập công cụ hỗ trợ phát triển phần mềm Bộ môi giới tài nguyên lưu trữ: thực việc môi giới ứng dụng chủ tài nguyên lưu trữ, để xác định tài nguyên phù hợp cho ứng dụng Giao thức bảo mật lưới Môi trường người dùng Các tổ chức ảo Ngôn ngữ đặc tả dịch vụ web Framework đưa GT4 hỗ trợ kiến trúc lập trình Là cách thức linh động để tạo định dạng thông tin chia sẻ định dạng liệu web Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm DANH MỤC HÌNH Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm LỜI NÓI ĐẦU Hình 1-1 Sự phát triển từ Networking đến Grid Computing .11 Trong năm gần nhiều thiết bị phần cứng mạnh phục vụ cho Hình 1-2 Kiến trúc phân tầng lưới .15 yêu cầu tính toán hiệu cao tạo Nhưng, nhu cầu người Hình 1-3 Các thành phần theo mô hình chức 18 không giới hạn nên họ thấy chưa đủ, thể tính toán lưới đời nhằm đáp Hình 1-4 Mối quan hệ OGSA OGSI .21 ứng nhu cầu Tuy nhiên điểm yếu lưới sức mạnh tính Hình 1-5 Bảo mật mức giao vận 26 Hình 1-6 Bảo mật mức thông điệp .26 Hình 1-7 Mô hình thương lượng tài nguyên lưới 29 Hình 1-8 Kiến trúc GridFTP 31 Hình 1-9 Đường ống truyền liệu DTP 32 Hình 1-10 Cổng điện tử GridPortal .38 toán mà tính thực tiễn, tính thực tiễn thể chỗ lưới tính toán thường tạo dựa việc tận dụng nguồn tài nguyên bình thường, sẵn có mà không cần phải mua tạo hạ tầng phần cứng Do đó, tính toán lưới lên phương tiện tập hợp tài nguyên tính toán chi phí thấp để giải toán lớn Hình 1-11 Các thành phần kiến trúc GMA 42 Ở Việt Nam, công nghệ lưới mới, triển khai số Hình 2-1 Các thành phần kiến trúc dịch vụ Web .49 trung tâm tính toán viện nghiên cứu trường đại học chuyên ngành lớn Hình 2-2 Các thành phần chức cài đặt dịch vụ Web .49 Vì thế, luận văn viết với mục đích nhằm nghiên cứu lý thuyết tính toán Hình 2-3 Các thành phần kiến trúc GT4 51 lưới, hạ tầng cần thiết cho lưới, xây dựng môi trường tính toán lưới phục vụ Hình 2-4 GT4 Container tích hợp dịch vụ công cụ 53 cho nhu cầu nghiên cứu lĩnh vực chuyên sâu lưới sau Luận văn Hình 2-5 Bốn cấu hình GT4 container .53 chia làm chương với nội dung cụ thể sau: Hình 2-6 Sự dịch chuyển trạng thái .58 Hình 2-7 Kiến trúc GRAM 60 Hình 3-1 Xếp hạng Desktop Grid 500 siêu máy tính hàng đầu .70 Hình 3-2 Ba lớp kiến trúc lưới cluster 74 Hình 3-3 Ngăn xếp phần mềm lưới Sun Cluster Grid 75 Hình 3-4 Luồng công việc Sun Grid Engine 76 Chương Tổng quan tính toán lưới, trình bày vấn đề chung tính toán lưới định nghĩa, kiến trúc, thành phần … Chương Tổng quan Globus, trình bày chi tiết thành phần tảng tính toán lưới công cụ Globus Toolkit Chương Các kỹ thuật lưới triển khai nước ta, trình Hình 3-5 Các thành phần PBS 85 bày kỹ thuật lưới số trung tâm tính toán nước ta triển khai Hình 3-6 Cơ chế hoạt động PBS 86 Desktop Grid, Cluster Grid Kết nối Cluster vào Grid thông qua PBS Hình 3-7 Hoạt động Globus Scheduler Pbs 90 Chương Xây dựng lưới thử nghiệm, trình bày bước để thiết Hình 4-1 Mô hình lưới triển khai thử nghiệm 96 kế lưới Cài đặt thử nghiệm lưới đồng thời thực kết nối cluster Hình 4-2 Topo mạng triển khai kết nối Cluster vào lưới 105 vào lưới Phần Kết luận, trình bày tóm tắt kết đạt hướng phát triển luận văn Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Kích thước lớn: theo số lượng tài nguyên khoảng cách địa lý chúng CHƯƠNG TÍNH TOÁN LƯỚI Phân tán: có độ trễ đáng kể truyền liệu, tài nguyên trải dài 1.1 Tổng quan Tính toán lưới vùng địa lý khác 1.1.1 Tính toán lưới gì? Động: tài nguyên thay đổi ứng dụng thực ¾ Định nghĩa Hỗn tạp: kiến trúc tính chất nút lưới hoàn toàn khác Từ trước đến nay, tổ chức, cá nhân tùy theo cách quan niệm thực tế xây dựng hệ thống mà đưa định nghĩa khác lưới Tài nguyên lưới máy đơn mạng khác Vượt qua phạm vi tổ chức: có nhiều trạm sách truy nhập có Dưới quan điểm cá nhân I.Foster đồng nghiệp "Một lưới thể khác trạm, tổng thể lưới tạo tổ chức ảo thống hệ thống có đặc trưng tài nguyên điều phối cách phi tập Cơ chế sách an toàn bảo mật phức tạp Cơ chế quản lý tài nguyên trung; sử dụng giao thức chuẩn, mở đa năng; cung cấp chất lượng dịch vụ không tầm thường" - I Foster‘s Three-Point Checklist (HPCWIRE - 22.07.2002) Còn quan điểm số công ty liên minh phát triển lưới uy tín đa dạng, phức tạp ¾ Lịch sử đời Quá trình đời tính toán lưới tóm tắt sau: giới tính toán lưới định nghĩa sau [2]: Định nghĩa Oracle: tính toán lưới việc liên kết nhiều máy chủ thiết bị lưu trữ thành siêu máy tính nhằm tối ưu hóa tính ưu việt hệ thống máy chủ hệ thống ứng dụng, nhờ giảm thiểu đến mức thấp chi phí Định nghĩa IBM: tính toán lưới môi trường tính toán ảo Môi trường cho phép bố trí song song, linh hoạt, chia sẻ, tuyển lựa, tập hợp nguồn tài nguyên hỗn hợp mặt địa lý, tùy theo mức độ sẵn sàng, hiệu suất, chi phí tài nguyên tính toán yêu cầu chất lượng dịch vụ người sử dụng Định nghĩa liên minh điện toán lưới: môi trường tính toán lưới hiểu hạ tầng kết nối hệ thống máy tính, hệ thống mạng, hệ thống sở liệu sở hữu quản lý nhiều tổ chức, cá nhân nhằm cung cấp môi trường tính toán ảo với hiệu cao cho người sử dụng Để có nhìn toàn diện tính toán lưới, luận văn xin phép không đưa định nghĩa cụ thể nào, thay vào xem xét khái niệm tính toán lưới theo số đặc điểm chung sau: Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Hình 1-1 Sự phát triển từ Networking đến Grid Computing Cơ sở hạ tầng truyền thông tính toán lưới mạng Internet Sau WWW đời cuối năm 80 tạo cách mạng trình tính toán chia sẻ thông tin mạng Giao thức HTTP với trình duyệt ngôn ngữ HTML cung cấp chế cho phép liên kết văn truy cập thông tin trực tuyến, dễ dàng đâu Công nghệ XML đời vào năm 1994, chuẩn cho trình trao đổi thông tin mạng Công nghệ quang học cung cấp dịch vụ khả kết nối nhanh, rộng với chi phí hợp lý Tốc độ mạng năm 1990 lên đến 2.4Bbps Thông lượng lớn nhân tố thúc đẩy hình thành công nghệ tính toán lưới Vào năm 1990, máy tính, máy trạm mạng tốc độ cao với thiết bị đại khác đời làm nảy sinh nhu cầu gộp nhóm máy tính thành cluster dùng cho công việc tính toán tốc độ cao Sự xuất cluster Trang 10 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 11 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm mầm mống hệ thống tính toán ngang hàng lưới tính toán sau Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Clusters tâm đến toán chuyên tính toán hiệu Còn Grids giải toán tính toán phân tán chia sẻ tài nguyên Lưới liệu bắt đầu năm 1999 với Globus Tookit 2.0+ Giai đoạn tiếp Clusters thường bao gồm hệ thống đồng Grids lại kết theo với đời kiến trúc dịch vụ lưới mở rộng (OGSA) vào năm 2001 sản phẩm Globus Tookit 3.0 Giai đoạn tính từ năm 2003 đến nay, hợp nhiều dạng hệ thống khác Clusters thường có lượng tài nguyên cố định tài nguyên Grids đánh giá cố gắng chuẩn hóa công nghệ giao thức tính toán thay đổi theo yêu cầu thực tế khả dùng tài nguyên Tuy có điểm khác biệt coi tính toán phân cụm ¾ Lợi ích Tính toán lưới trường hợp đặc biệt tính toán lưới Trên thực tế Grid Các lợi ích mà tính toán lưới mang lại [2] bao gồm: Khả khai thác tài nguyên nhàn rỗi cách mạng mà thực chất bước tiến công nghệ điện toán phân tán Cung cấp khả xử lý song song Giống Web, tính toán lưới giảm bớt độ phức tạp nhiều người khai thác Giúp hợp tác tổ chức hoạt động thống khác hỗ trợ liên lạc Khi so với mạng Giúp truy nhập tài nguyên khác đường truyền phần mềm đắt tiền ngang hàng (P2P) tính toán lưới cho phép người sử dụng chia sẻ file Giúp cân sử dụng tài nguyên nhiều loại tài nguyên khác Nói chung, với công nghệ ảo khác, grid giống Mang lại độ tin cậy cao chỗ cho phép ảo hóa nguồn nhân lực CNTT khác biệt grid cho phép ảo hóa nguồn tài nguyên tản mát vô rộng lớn ¾ Phạm vi ứng dụng Tính toán lưới thường sử dụng để giải toán khoa học đòi 1.1.3 Phân loại mạng lưới hỏi khả tính toán thông lượng cao mô phỏng, thiết kế vi mạch, chia sẻ nội dung, truy nhập/thuê phần mềm/dịch vụ từ xa Hoặc toán đòi hỏi liệu lớn, thời gian thực, phục vụ theo yêu cầu toán tính toán cộng tác thiết kế cộng tác, khai phá liệu, giáo dục điện tử… Lưới thường cài đặt nhiều dạng khác theo ứng dụng cụ thể theo cấu trúc tổ chức ảo tham gia lưới theo tính chất tài nguyên chia sẻ Sau số dạng lưới [3]: ¾ Departmental Grids 1.1.2 So sánh với mô hình, công nghệ khác - điểm truy xuất đơn cho người dùng Nó phù hợp cho ứng dụng yêu cầu Khi so với cluster, người ta thấy tầng trung gian hai đưa chế hiệu tính toán băng thông lớn truyền thông điệp cho ứng dụng song song Như vậy, chất kiến trúc mức cao cluster tương tự lưới Tuy nhiên chúng có Cluster Grids: gồm nhiều hệ thống kết hợp lại nhằm cung cấp - Infra Grids: IBM đề xuất nhằm định nghĩa lưới tối ưu việc sử dụng tài nguyên xí nghiệp điểm khác biệt quan trọng như: Về mặt phạm vi, Clusters đặt phòng nhà Grids lại đặt phân tán trên vùng địa lý khác Clusters có hệ quản trị nhất, ngược lại Grids có biên quản trị ¾ Enterprise Grids - Enterprise Grids: triển khai công ty lớn có chi nhánh nhiều nơi giới có nhu cầu chia tài nguyên kéo dài Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 12 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 13 Luận văn thạc sĩ khoa học - Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Intra Grids: tài nguyên chia sẻ nhóm khác xí nghiệp Luận văn thạc sĩ khoa học - tạo thành intra grid - 1.2 Kiến trúc thành phần hệ thống lưới 1.2.1 Tổng quan kiến trúc lưới ¾ Extraprise Grids - Service Grids: cung cấp truy xuất tới tài nguyên mà mua tổ chức Campus Grids: cho phép nhiều dự án nhiều phận chia sẻ tài nguyên tính toán theo hướng cộng tác - Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Extra Grids: cho phép chia sẻ tài nguyên với đối tác bên Liên kết Lưới xây dựng tảng kiến trúc mở phân tầng Trong tổ chức thiết lập dịch vụ tin cậy tầng lưới, thành phần chia sẻ thuộc tính chung bổ sung Partner Grids: mạng lưới tổ chức, công ty, xí nghiệp tính mà không làm ảnh hưởng đến tầng khác [4] Ta lĩnh vực mà có nhu cầu cộng tác nhằm thực dự án chung tổng hợp kiến trúc lưới thành tầng sau: ¾ Global Grids - Global Grids: cho phép người dùng khai thác tài nguyên bên Nó - Inter Grids: cung cấp khả chia sẻ tài nguyên lưu trữ thông qua Web cung cấp sức mạnh tài nguyên phân tán khắp giới ¾ Compute Grids Compute grids thành lập nhằm mục tiêu chia sẻ tài nguyên tính toán - Desktop Grids: mạng lưới tập hợp sức mạnh tính toán máy - Server Grids: số tập đoàn lớn thường có tài nguyên máy chủ tính để bàn Các mạng lưới thuộc dạng chủ yếu chạy Windows Hình 1-2 Kiến trúc phân tầng lưới ¾ Tầng chế tác (Fabric layer) quản lý phận IT nằm nhiều địa điểm khác Họ muốn tạo - Bao gồm tài nguyên cục phân tán mạng, chúng bị ràng buộc Server Grids để chia sẻ tài nguyên đắt giá Cơ chế quản lý tài nguyên Cơ chế thẩm tra Người ta phân tài nguyền tầng High-Performance/Cluster Grids: mạng lưới gồm hệ thống dành riêng thành nhóm sau: cho tính toán siêu máy tính nhóm máy tính hiệu cao - Tài nguyên tính toán: cho phép kiểm soát, điều khiển việc thực thi công việc - Tài nguyên lưu trữ: dùng để lấy về/tải lên tập tin, cho phép đọc phần xây dựng nhằm tối ưu thao tác hướng liệu lưu trữ, truy xuất, trao đổi - Tài nguyên mạng: môi trường mạng truyền thông ¾ Utility Grids - ¾ Data Grids Tài nguyên chủ yếu chia sẻ mạng lưới liệu Nó Utility grids mạng lưới bao gồm tài nguyên tính toán thương mại mà trì, quản lý nhà cung cấp dịch vụ Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN tập tin chọn lọc liệu từ tập tin xa Các kho mã nguồn: nơi quản lý tất loại tài nguyên phiên mã nguồn ¾ Tầng kết nối (Connectivity layer) Trang 14 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 15 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Tầng đóng vai trò quan trọng, gồm giao thức xác thực Trong tầng tài nguyên cho phép truy cập đến loại tài nguyên đơn truyền thông Truyền thông bao gồm việc truyền thông tin, định tuyến đặt tên tầng kết hợp lại chứa giao thức dịch vụ cho phép giao tiếp tài Những giao thức tương tự giao thức IP, TCP, UDP giao thức nguyên mạng lưới Tầng bao gồm dịch vụ sau: TCP/IP giao thức tầng ứng dụng DNS, OSPF, RSVP…Vấn đề bảo mật - giải giải pháp xác thực như: - Cơ chế đăng nhập lần (Single Sign On): cho phép người dùng cần - đăng nhập vào mạng lưới lần cho tất truy cập tài đích cấp phát, lập lịch môi giới tài nguyên tương ứng Cơ chế ủy quyền (Delegation, Proxy): người dùng ủy quyền truy cập - tài nguyên hợp pháp lại cho chương trình khoảng thời gian xác định Chương trình ủy quyền có điều kiện phần Các dịch vụ nhân liệu (Data Replication Services): hỗ trợ việc quản lý lưu trữ tài nguyên, giúp việc truy cập tài nguyên lưới trở nên dễ dàng Cơ chế tích hợp đa giải pháp bảo mật địa phương (Integration with various - tiếp với chế bảo mật địa phương mà không yêu cầu thay Các hệ hỗ thống trợ lập trình lưới (Grid-enable Programming Systems): gồm thư viện lập trình local security solutions): chế bảo mật mạng lưới phải có khả giao - Các dịch vụ giám sát dự báo (Monitoring and Diagnostic Services): cho phép hệ thống hỗ trợ kiểm soát tài nguyên lưới - tập quyền cho chương trình khác - Các dịch vụ cấp phát chung, lập lịch, môi giới (Co-allocation, Scheduling & Broker Services): cho phép gửi yêu cầu đến hay nhiều máy chủ cho mục nguyên phép tầng chế tác kết thúc đăng nhập - Các dịch vụ thư mục (Directory Services): cho phép tìm hiểu tồn thuộc tính nguyên loại tài nguyên, tính khả dụng … - Hệ thống quản lý tải môi trường cộng tác (Workload Management System toàn giải pháp bảo mật có, cần có chế ánh xạ bảo mật & Collaboration Framework): cung cấp đặc tả, quản lý tính đồng bộ, đa môi trường cục khác luồng, đa thành phần… tiến trình tính toán Cơ chế quan hệ tin tưởng dựa người dùng (User-based Trust Relationships): người dùng sử dụng loại tài nguyên có từ kết hợp nhiều nhà cung cấp khác - Dịch vụ tìm kiến phần mềm (Software Discovery Service): hỗ trợ tìm kiếm lựa chọn phần mềm cài đặt làm tảng cho mạng lưới ¾ Tầng ứng dụng (Application layer) ¾ Tầng tài nguyên (Resource layer) Tầng bao gồm ứng dụng phát triển môi trường lưới như: Tầng xây dựng tảng sẵn có tầng kết nối Những giao ứng dụng sinh học, lý, thiên văn, tài chính… Về nguyên tắc, người sử dụng thức tầng tài gọi chức tầng chế tác để truy cập sử tương tác với lưới thông qua tầng ứng dụng cách suốt mà không dụng loại tài nguyên cục Nó có hai loại giao thức chính: nhận biết có mặt tầng khác lưới - Giao thức thông tin (Information protocol): cho phép lấy thông tin - Giao thức quản lý (Management protocol): dùng để xếp quản lý thứ tự cấu trúc, tình trạng loại tài nguyên mạng lưới truy cập đến tài nguyên chia sẻ ¾ Tầng kết hợp (Collective layer) Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 16 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 17 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Tài nguyên (Resource): tài nguyên lưới bao gồm xử lý, lưu trữ, 1.2.2 Các thành phần theo mô hình chức ứng dụng thành phần Quản lý liệu (Data management): liệu nằm tài nguyên, kết thực thi tác vụ Thành phần quản lý liệu phải đảm bảo an toàn ổn định trình di chuyển liệu lưới Giao thức (Protocol): thành phần đảm bảo liên kết thành phần chức kể để hoạt động tương tác với mạng lưới 1.2.3 Các thành phần theo mô hình vật lý Hình 1-3 Các thành phần theo mô hình chức Nhìn từ hình ta thấy mặt chức lưới gồm thành phần sau: Dựa tài liệu [3], thành phần lưới theo mô hình vật lý bao gồm: Cổng tương tác (Grid portal): giao diện cho phép người dùng sử Thành phần mạng (Networks): mạng đóng vai trò sở hạ tầng để truyền số liệu thông tin giám sát công việc điểm mạng lưới dụng ứng dụng lưới, lưới trở nên suốt với người dùng Thành phần bảo mật (Security): chế đảm bảo hoạt động xác Băng thông mạng thuộc tính quan trọng liên quan đên hiệu suất lưới Thành phần tính toán (Computation): cung cấp xử lý thực, cấp quyền, bảo mật-toàn vẹn liệu tính sẵn sàng liệu Chức an ninh nút (Node Security Function): chức chịu lưới, chúng đa dạng tốc độ, kiến trúc, tảng phần mềm lưu trữ tránh nhiệm xác thực bảo mật cho nút trình giao tiếp Thành phần lưu trữ (Storage): liệu lưu trữ phân tán thành phần khác bên mạng lưới Nó phụ thuộc vào hệ điều hành hệ nhiều thiết xử lý mạng SAN Mỗi xử lý thường cung cấp dung thống lưới cụ thể, thường thấy chế cấp chứng quyền truy cập lượng lưu trữ định Hệ thống file thường dùng NFS, DFS GPFS Bộ lập lịch (Scheduler): phần phối hợp trình thực thi nhiều Phần mềm quyền (Software and License): phương diện phần công việc song song Đơn giản, người sử dụng chọn nút thích hợp để chạy mềm môi trường tính toán lưới mức độ ổn định ứng dụng phần mềm tác vụ, sau việc kích hoạt lệnh để định tuyến công việc tới nút chọn quyền phần mềm hai vất đề cần quan tâm Thành phần môi giới (Broker): sau người dùng xác nhận quyền Các thiết bị đặc biệt: vài nút lưới có thiết bị đặc gia nhập vào mạng lưới thành phần an ninh nút, thành phần rõ ứng biệt, chẳng hạn thiết bị quân sự, y tế, hay thiết bị chuyên dụng khác dụng người dùng sử dụng tài nguyên đảm bảo tài nguyên sẵn 1.3 Các chuẩn cho tính toán lưới sàng sử dụng theo tham số truyền vào Lưới tính toán thường gồm tập tài nguyên không đồng Một Quản lý, phân bổ tài nguyên (grid resource allocation manager, GRAM): ứng dụng lưới thường có nhiều thành phần, dịch vụ khác Đồng thời dịch cung cấp dịch vụ để kích hoạt công việc tài nguyên cụ thể; kiểm tra vụ lại thường xuyên tương tác với Càng nhiều dịch vụ số tương tác trạng thái công việc; đọc kết công việc kết thúc Các thông tin thành chúng tăng dễ dẫn đến tình trạng hỗn loạn Nếu dịch vụ sử phần sau lập lịch sử dụng dụng cách riêng để tương tác với dịch vụ khác vấn đề giao tiếp Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 18 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 19 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm PBS đảm nhận giao tiếp Server máy trạm, máy chủ thông qua Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Tự động phân tải: chế cho phép phân tải công việc tài PBS quản lý hoạt động máy trạm PBS bao gồm ba môđun chính: nguyên hệ thống Cluster PBS_Server, PBS_Scheduler, PBS_MOM PBS cung cấp nhiều chức cho ¾ Các thành phần PBS hệ thống tính toán hiệu cao Sau số chức quan trọng PBS: Chia sẻ tài nguyên: cung cấp chế lập lịch cho công việc cách suốt hệ thống PBS nào, người sử dụng có thẩm quyền Công việc yêu cầu từ máy client bất kỳ, cục hay từ xa Giao diện đồ hoạ: giúp người sử dụng chuyển yêu cầu tính toán chế độ lô chế độ tương tác, truy vấn công việc, hàng đợi công việc tình trạng hệ thống; theo dõi tiến triển công việc Ngoài PBS hỗ trợ giao diện sử dụng chế độ dòng lệnh cho người sử dụng chuyên nghiệp Cơ chế bảo mật: cho phép quản trị thiết lập huỷ bỏ việc truy cập đến PBS người sử dụng, nhóm người, máy mạng Nhật ký: cho phép ghi lại tất hoạt động hệ thống theo người, nhóm người máy Tự động chuyển tệp: chế chép tệp cần thiết cho việc thực công việc máy trạm tính toán Các tệp cần chuyển tệp liệu tệp thực thi Hỗ trợ công việc song song: cho phép hoạt động với thư viện lập trình song song MPICH, MPI-LAM Các chương trình lập lịch để chạy hệ đa xử lý hệ thống đa máy tính Hỗ trợ tính toán lưới: cung cấp công nghệ siêu tính toán (meta-computing) tính toán lưới, bao gồm việc hỗ trợ cho GGT (Globus Grid Toolkit) Việc hỗ trợ thực phiên thương mại PBS Pro Giao diện lập trình PBS: cung cấp để người lập trình tự viết lệnh cho PBS, tích hợp PBS vào ứng dụng họ cài đặt Hình 3-5 Các thành phần PBS Mô-đun quản lý công việc (Job Server): thành phần trung tâm PBS Tất thành phần khác PBS giao tiếp với module quản lý công việc qua địa IP Chức module quản lý công việc cung cấp dịch vụ, nhận/tạo công việc lô, thay đổi công việc, bảo vệ công việc có cố hệ thống, thực công việc Module quản lý nhiều hàng đợi công việc, công việc phải thuộc vào hàng đợi Các hàng đợi server quản lý tập thuộc tính kiểu, tài nguyên, tên, Module thực công việc (PBS Mom): chia nhỏ thành thành phần chức sau: Job Executor (JE), tiến trình ngầm chịu trách nhiệm thực thi công việc Khi thực hiện, JE nhận copy công việc từ Server, xử lý công việc, sau đảm nhận công việc trả kết cho user Server yêu cầu Mỗi tiến trình ngầm JE chạy máy tính trạm mạng; Resource Monitor (RM), phận chịu trách nhiệm theo dõi, kiểm tra nguồn tài nguyên hệ thống báo cho lập lịch Scheduler Mô-đun quản lý tài nguyên (Job Scheduler): thành phần chịu trách nhiệm xác định xem công việc chạy chạy tài nguyên chế lập lịch riêng Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 84 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 85 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Người sử dụng thực lệnh trực tiếp hình console để truyền công việc yêu cầu tới Server Các shell [14] chuẩn linux giúp ta biên dịch mã lệnh để thực job Lệnh qsub lệnh dùng để đệ trình công việc muốn thực lên server Cấu trúc lệnh sau: % qsub [option] mysubrun option lựa chọn thực công việc mysubrun công việc cần thực Các tuỳ chọn dùng để mô tả tài nguyên; ví dụ sau: % qsub -l ncpus=16, walltime=4:0:0 mysubrun ncpus số CPU sử dụng để thực công việc walltime thời gian dự kiến thực công việc Các công việc miêu tả file đặc tả, file thực mô tả tất thông số tài nguyên cần sử dụng, đầu vào, đầu ra… Khi việc đệ trình công việc PBS thực lệnh đơn giản sau: % qsub Hình 3-6 Cơ chế hoạt động PBS mysubrun Trong mysubrun file mô tả công việc Như để đưa công Tương tác module mô tả sau: việc từ lưới xuống cho PBS_Server ta phải làm thông suốt trình chuyển Sự kiện kích hoạt module quản lý công việc bắt đầu vòng lập lịch Module quản lý công việc gửi lệnh lập lịch cho lập lịch đổi công việc từ file đặc tả RSL Globus sang file miêu tả công việc PBS, vấn đề đề cập phần đồ án Module lập lịch yêu cầu thông tin tài nguyên từ module quản lý tài nguyên 3.3.2.3 Các yêu cầu thành phần kết nối Coi Cluster tài nguyên lưới tài nguyên khác, cung cấp Module quản lý tài nguyên trả thông tin yêu cầu giao diện truy cập thống cho thành viên lưới khác sử dụng Globus toolkit Bộ lập lịch yêu cầu thông tin từ module quản lý công việc Module quản lý công việc gửi thông tin trạng thái công việc tới lập lịch, lập lịch đưa sách định việc thực công việc Bộ lập lịch gửi yêu cầu thực công việc đến module quản lý công việc Module quản lý công việc gửi công việc đến module thực thi công việc cung cấp modul cho phép thành phần globus giao tiếp với hầu hết hệ quản lý cluster phổ biến PBS, LSF, Condor (Chương 2) Như vậy, để cluster trở thành tài nguyên lưới ta cài Globus Toolkit lên nút chủ cluster, thêm mô-đun thực giao tiếp với nút chủ để thực cluster thực cấu hình cần thiết Globus giao tiếp ¾ Đệ trình công việc PBS với thành phần quản lý tài nguyên địa phương cluster Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 86 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 87 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Thông thường lưới tồn hai loại công việc có khác rõ Globus Toolkit có cung cấp cho số dịch vụ để giao tiếp với rệt Thứ nhất, công việc thông thường thực qua dịch vụ lưới, PBS_Server Những dịch vụ nằm gói cài đặt scheduler-pbs-3.2- người sử dụng việc đưa liệu đầu vào qua GridPortal nhận kết src_bundle.tar.gz trả Loại công việc thứ hai, công việc có tính chuyên môn cao, đòi Sau cài đặt xong việc cấu hình cho hệ thống Đây thực hỏi khối lượng tính toán lớn, công việc người sử dụng phải vấn đề không đơn giản Chi tiết việc cấu hình xây dựng shell script biết rõ tài nguyên thực công việc (siêu máy tính hay Cluster), viết chương cấu hình tự động trình bày chương Khi việc cấu hình hoàn tất, thực trình thực loại tài nguyên tương ứng, sau đệ trình công việc thông khởi động trình chứa (globus-start-container) dịch vụ Globus qua giao diện GridPortal, lưới tìm tài nguyên tương ứng dựa thời gian Toolkit có thêm hai dịch vụ: thực số nút tính toán, lưới thực truyền công việc cho cluster với http://hostname:8080/ogsa/services/base/gram/PbsManagedJobFac tham số để thực hiện, cluster thực công việc sau trả lại kết cho toryService lưới sau lưới thực trả kết cho người dùng Việc kết nối lưới http://hostname:8080/ogsa/services/base/gram/MasterPbsManaged dựa GT cluster dựa PBS thực chất thực giao tiếp thành phần GRAM lưới thành phần PBS Server nút chủ Cluster thông qua thành phần Globus-scheduler-pbs JobFactoryService Dịch vụ MasterPbsManagedJobFactoryService đóng vai trò giao diện đệ trình công việc, trực tiếp nhận yêu cầu công việc từ phía client Đối với công việc dịch vụ MasterPbsManagedJobFactoryService gọi đến dịch vụ GRAM: cung cấp giao diện chuẩn cho việc yêu cầu sử dụng tài nguyên hệ thống từ xa để thực công việc Đối với công việc yêu cầu máy tính đơn hay siêu máy tính GRAM thực công việc máy tính Đối với công việc yêu cầu thực Cluster GRAM chuyển nội dung công việc cho thành phần Globus-scheduler-pbs PbsManagedJobFactoryService sinh thể (instance) tương ứng trực tiếp làm việc với client ¾ Hoạt động Globus Scheduler Pbs Như trình bày trên, Globus Scheduler Pbs gồm thành phần (mjs-pbs, mmjfs-pbs, rips-pbs-provider, globus-job-manager-pbs) giúp cho việc hoạt động đệ Globus-scheduler-pbs: thành phần có nhiệm vụ chuyển nội dung công việc sang dạng mà PBS_Server hiểu trình công việc lên PBS_Server thực Giao tiếp thành phần mô tả hình sau: PBS_Server: nút chủ thực lập lịch (địa phương), quản lý thực phân chia công việc thực nút Như thấy việc kết nối cluster vào lưới nghĩa phải quản lý đến máy đơn cluster mà quản lý cluster cách tổng thể Lưới quản lý cụm máy tính cluster tài nguyên đơn thông qua quản lý tài nguyên địa phương PBS ¾ Thành phần Globus Scheduler PBS Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 88 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 89 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Hình 3-7 Hoạt động Globus Scheduler Pbs Người dùng có giấy chứng nhận cấp nhà thẩm quyền, thực tài nguyên lưới (Quy định Grid-mapfile) thực đệ trình công việc Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm CHƯƠNG TRIỂN KHAI THỬ NGHIỆM 4.1 Lập thiết kế kiến trúc lưới Việc xây dựng hệ thống tính toán lưới không đơn cài đặt với trình quản lý công việc MMJFS-PBS Trình quản lý công việc MMJFS-PBS thực sinh thể quản phần mềm, ứng dụng tài nguyên kết nối sẵn có mà phải tuân theo quy trình quy hoạch, thiết kế cách bản, chuyên nghiệp Về bản, việc thiết kế lý công việc phục vụ cho người dùng MJS-PBS Trình quản lý công việc MJS-PBS thực lấy file đặc tả công việc lưới bao gồm số bước sau [2]: Khảo sát yêu cầu nghiệp vụ tổ chức người dùng chuyển cho thành phần biên dịch Globus-job-manager-pbs Thành phần Globus-job-manager-pbs thực chuyển file đặc tả người Quy hoạch hạ tầng mạng sẵn có Lựa chọn loại lưới dùng thành công việc cho PBS_Server Trình quản lý công việc người dùng yêu cầu PBS_Server thực công Lựa chọn topo lưới Lựa chọn hạ tầng (hạ tầng phần mềm, phần cứng, chuẩn mở, chế an việc PBS_Server thực công việc đưa kết trả cho thành phần toàn, bảo mật cho lưới…) Chính sách quản trị lưới quản lý thông tin tài nguyên RIPS-PBS Triển khai lưới RIPS-PBS trả kết cho trình quản lý công việc người dùng Ngoài ra, thiết kế lưới kiến trúc lưới cần phải thoả mãn Trình quản lý công việc người dùng MJS-PBS trả kết cho người sử yêu cầu như: tính an toàn, tĩnh sẵn sàng hiệu suất cao dụng ¾ Khảo sát yêu cầu 3.4 Kết chương Chương đưa khái niệm, khía cạnh kỹ thuật chế triển khai, kết nối số dạng lưới triển khai trung tâm nghiên cứu tính toán lưới nước ta Phần kiến thức trình bày chương làm tiền đề kết hợp với Chương Chương để tiến hành xây dựng lưới cụ thể chương Trong thiết kế kiến trúc lưới, bước khảo sát yêu cầu bước quan trọng, kết qủa ảnh hưởng trực tiếp đến tất bước Thường bước này, người thiết kế phải đưa thông tin cần thiết mục đích việc xây dựng lưới gì? Lưới có yêu cầu nghiệp vụ, hạ tầng ứng dụng? Cuối cần phải tinh chỉnh xem xét lại xem yêu cầu có phù hợp với hạ tầng phần cứng phần mềm nguồn nhân lực sẵn có hay không Sau xác định đươc yêu cầu đặt cho lưới, đồng thời nhận thấy hạ tầng có đủ đáp ứng để xây dựng lưới, ta phải tiến hành qui hoạch lại hạ tầng mạng để phục vụ việc triển khai lưới thuận tiện khoa học ¾ Lựa chọn loại lưới Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 90 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 91 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Thường tuỳ theo yêu cầu nghiệp vụ lưới mà ta chọn loại lưới thích hợp Nhưng nhìn chung, lưới triển khai thường rơi vào hai dạng sau: Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm muốn xây dựng kết nối mạng với đối tác (B2B) nhằm chia sẻ tài nguyên, liệu dựa tin tưởng lẫn Lưới tính toán (Computational Grid): dùng muốn kết hợp tăng sức Intergrid: xây dựng mạng WAN Internet sử dụng mạnh tính toán hệ thống tính toán phân tán Đặc trưng lưới công ty công nghệ, tập đoàn công nghiệp, nhà sản xuất công nghiệp Đặc trưng tính toán dựa tích hợp đơn vị có sức mạnh tính toán khả Intergrid là: Có tham gia nhiều tổ chức; Kết nối nhiều đối tác; Kết nối lưu trữ không cao Lợi ích lưới tính toán giảm thiểu chi phí sở hữu rút nhiều mạng liên kết; Cơ chế an ninh phức tạp, phân tán ngắn thời gian phát triển Nó dùng cho mục đích nâng cao hiệu suất sử dụng ¾ Lựa chọn hạ tầng lưới hệ thống máy tính hệ thống ứng dụng sẵn có dùng để giải toán khoa học, toán mô phỏng, toán đánh giá hội đầu … Khái niệm hạ tầng bao gồm phần cứng vật lý phần mềm sử dụng để kểt nối máy tính lưới lại với Hạ tầng cung Lưới liệu (Data Grid): chủ yếu dùng vào việc cung cấp khả truy cập cấp dịch vụ cho việc kết nối, đảm bảo an toàn quản trị đến nguồn liệu hỗn hợp, phân tán bảo mật cho thực thể tham gia lưới Hạ tầng bảo mật: giải pháp bảo mật hay áp dụng cho hệ thống tính Lưới liệu hiểu sở liệu liên hợp, giữ vai trò liên kết toán lưới sử dụng tường lửa Giải pháp bảo vệ máy chủ lưới liệu rời rạc thành sở liệu ảo thống người dùng truy tránh khỏi công từ bên tạo lập thêm hàng rào bảo vệ, ngăn cập sở liệu qua giao diện Lưới liệu thích hợp với tổ cản truy nhập không mong muốn từ người sử dụng bên lẫn bên chức, doanh nghiệp có nhu cầu mở rộng khả khai phá, sử dụng liệu Hạ tầng mạng: phải cung cấp băng thông đủ lớn cho ứng dụng dịch phạm vi rộng nhằm tối ưu hoá việc sử dụng hạ tầng thiết bị lưu trữ sẵn có giảm vụ Hạ tầng mạng cần phải thường xuyên bảo trì, tuỳ chỉnh nhằm đảm thiểu hoá phức tạp việc quản lý liệu bảo hiệu suất hoạt động tính sẵn sàng cao Hạ tầng lưu trữ: sức mạnh vô tận hệ thống tính ¾ Lựa chọn topo lưới Hiện triển khai lưới, người thiết kế thường lựa chọn toán lưới Khi thiết kế hệ thống, người thiết kế phải trả lời câu hỏi như: cách thức dùng để bảo đảm an toàn cho thiết bị lưu trữ, cách thức dùng số topo lưới thông dụng sau [2]: Intragrid: thường triển khai tổ chức doanh nghiệp Dựa nhân liệu, để quản lý thiết bị cách hiệu kiến trúc mạng LAN mạng Intranet dùng riêng tổ chức, doanh nghiệp Mục tiêu cuối việc thiết kế lưới phải đảm bảo sẵn sàng Nó có: Băng thông mức độ sẵn sàng cao; Cơ chế an toàn, bảo mật riêng rẽ; liệu cho tài nguyên người dùng có yêu cầu Môi trường tác nghiệp độc lập Topo lưới dạng phù hợp triển khai ¾ Lựa chọn tập dịch vụ cho lưới Tập dịch vụ gồm thành phần: Bộ cung cấp tính bảo lưới tính toán lưới liệu Extragrid: thiết lập dựa hai nhiều Intragrid Đặc trưng mật; Tập thành phần cuả GT Grid clients; CA; GateKeepers; MDS loại topo là: Cơ chế an toàn, bảo mật phân tán; Có tham gia nhiều tổ (GRIS/GIIS); Các chứng số cho việc xác thực; Bộ lập lịch công việc bản; chức doanh nghiệp; Dựa mạng WAN Extragrid thích hợp với tổ chức Các thiết bị hạ tầng thông dụng mạng quản trị, tường lửa, hệ thống phát truy cập trái phép; Mạng thiết bị lưu trữ … Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 92 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 93 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm ¾ Quản trị lưới tính toán Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm ¾ Các yêu cầu lưới sau thiết lập Đối với người quản trị lưới, cần phải nắm rõ sản phẩm liên quan Tính an toàn: lưới sau triển khai phải giảm thiểu rủi ro đến mức chấp tính hệ thống tính toán lưới Các sản phẩn liên quan đến hệ thống tính toán nhận được, nghĩa thiết kế cần phải vạch rõ yêu cầu an toàn, bảo lưới bao gồm: Phần mềm tầng trung gian; Hệ thống giám sát hiệu suất lưới; Grid mật hệ thống, đồng thời phải đưa công cụ biện pháp nhằn tăng portals; Môi trường lập trình; Bộ lập lịch; Hệ thống phát triển kiểm thử lưới tính an toàn bảo mật cho hệ thống Mức độ an toàn bảo mật hệ thống tính Các tính hệ thống tính toán lưới: Quản lý dịch vụ; Truyền thông toán lưới phụ thuộc vào topo lưới liệu tài nguyên cần bảo mật dịch vụ; Quản lý sách; Lựa chọn triển khai phần mềm trung gian, lựa Mức độ bảo mật khác lưới dùng công ty có tính chọn ứng dụng, trả kết cho ứng dụng; Điều khiển dịch vụ; SLAs; chất nghiệp vụ khác Bản thân mô hình an toàn bảo mật cho hệ Quản lý hiệu suất/tài khoản/lỗi; an toàn bảo mật thống tính toán lưới có rủi ro tiềm ẩn Do đó, thiết kế mô hình ¾ Triển khai lưới bảo mật cho lưới cần tính đến vài phương án dự phòng Ngoài ra, nên có Một lưới tính toán đơn giản xây dựng dựa thư viện lập tường lửa, hệ thống phát truy cập trái phép, giải pháp phòng chống virus,… trình hỗ trợ tính tính toán lưới, sử dụng tính cung cấp Tính sẵn sàng: hiểu cách đơn giản phần trăm thời gian mà hệ công cụ Globus Toolkit Tuy nhiên, hệ thống mở rộng trở nên thống đáp ứng trở lại yêu cầu thực thể tham gia lưới Trong giai đoạn thiết phức tạp, ta cần phải tiếp cận theo phương thức khác kế, cần đưa mức độ sẵn sàng hệ thống Dựa mức độ này, người Đầu tiên bước thiếp lập hạ tầng cho lưới tính toán đơn giản dựa Globus Toolkit bao gồm cài đặt máy chủ máy trạm như: Hệ điều hành, thư viện, công cụ GT; Thiết lập dịch vụ, đơn vị chứng thực, quản lý tài nguyên … thiết kế xác định tài nguyên dư thừa cần có hệ thống dự phòng phương thức xử lý cố hỏng hóc cần thiết Cuối cùng, dựa kiến thức thu từ việc nghiên cứu tính toán lưới công cụ liên quan trình bày chương trước Đồng Tiếp theo bước thiết lập ứng dụng, dịch vụ cho hệ thống tính toán lưới thời với giúp đỡ thầy hướng dẫn bạn trung tâm tính toán hiệu vừa cài đặt dựa Globus Toolkit công cụ dựa cao Tôi bạn trung tâm tiến hành cài đặt thử nghiệm lưới chuẩn OGSA bao gồm: Định nghĩa dịch vụ lưới ngôn ngữ WSDL; với mục đích hiểu sâu vấn đề nghiên cứu đồng thời tạo lưới dùng Sinh mã Java cho việc định nghĩa WSDL; Viết mã cài đặt phía máy chủ, máy để phục vụ việc thử nghiệm nghiên cứu tính toán lưới sau khách; Triển khai thử nghiệm dịch vụ lưới sử dụng trình duyệt OGSA 4.2 Cài đặt Grid Sau danh sách công việc cần thực hiện: Dự kiến quy định tài nguyên lưới; Lựa chọn phần mềm trung gian; Lựa chọn công cụ quản trị, xây dựng quy trình quản trị phần mềm trung gian; Cài đặt, thử nghiệm, tuỳ chỉnh phát hành phần mềm, ứng dụng lưới; Thiết lập điều khiển dịch vụ, công cụ, quy trình kiểm soát, điều khiển an ninh; Thiết lập công cụ quản lý lỗi, hiệu năng, hạ tầng mang tính tích hợp Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Phần liệt kê bước giải thích ngắn gọn trình cài đặt hệ thống sở hạ tầng cho lưới dựa Globus Toolkit 4.2.1 Cấu hình phần cứng lưới Topo lưới trung tâm bố trí hình 4.1, hệ thống bao gồm: Một nút Gridsv-172.16.14.130 Năm nút tính toán là: Alpha-172.16.14.182; Trang 94 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 95 Luận văn thạc sĩ khoa học Beta-172.16.14.144; Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Gama-172.16.14.133; Delta-172.16.14.175; Omega- Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm [root]#adduser -p "globus" -g users -d /home/globus globus 172.16.14.202 Tại thời điểm cài đặt thử nghiệm tất máy tính [root]#mkdir /usr/local/GlobusToolkit4.0.1 PenIII800, kết nối với qua mạng LAN [root]#ln -s /usr/local/GlobusToolkit4.0.1 /usr/local/globus [root]#chown globus:users /usr/local/GlobusToolkit4.0.1 Bước 1: Cài gói gt4.0.1-x86_fc_3-binary-installer user globus vừa tạo: [globus]$tar xzf /opt/gt4.0.1-x86_fc_3-binaryinstaller.tar.gz [globus]$export JAVA_HOME=/usr/local/java [globus]$export ANT_HOME=/usr/local/ant [globus]$export GLOBUS_LOCATION=/usr/local/globus [globus]$cd gt4.0.1-x86_fc_3-binary-installer [globus]$./configure prefix=/usr/local/globus withiodbc=/usr/local/lib [globus]$make [globus]$make install Bước 2: Cấu hình an toàn bảo mật cho nút user globus Đây bước tạo simpleCA, ký chứng thực cho host: [globus]$$GLOBUS_LOCATION/setup/globus/setup-simple-ca Hình 4-1 Mô hình lưới triển khai thử nghiệm lựa chọn tuỳ chọn cho lệnh phụ lục A [5] 4.2.2 Yêu cầu trước cài đặt Login vào user root, gõ lệnh: Các nút lưới máy tính PC Intel Pentium nối mạng với qua Fast Ethernet, cài Linux Fedora Core tất gói phần mềm cần thiết [5] cho việc cài đặt Globus Toolkit [root]#$GLOBUS_LOCATION/setup/globus_simple_ca_ebb88ce5_setup /setup-gsi [root]#source $GLOBUS_LOCATION/etc/globus-user-env.sh [root]#grid-cert-request -host `hostname` Để nút mạng nhìn liên lạc với file /etc/hosts tất nút lưới phải có nội dung chứa đầy đủ địa IP tên máy trực tiếp tham gia lưới Login vào user globus, gõ lệnh: [globus]$grid-ca-sign -in /etc/gridsecurity/hostcert_request.pem -out hostsigned.pem Login vào user root, gõ lệnh: 4.2.3 Cài đặt cho nút [root]#cp ~globus/hostsigned.pem /etc/grid- Trước thực cài đặt cho nút chính, ta tạo user "globus", security/hostcert.pem user thực công việc quản trị Globus Toolkit Phải đăng nhập vào user root (tạo [root]#cp /etc/grid-security/hostcert.pem/etc/grid- cài đặt Fedora Core 3) để thực lệnh tạo user, root có quyền ghi security/containercert.pem vào file hệ thống Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN [root]#cp /etc/grid-security/hostkey.pem/etc/gridsecurity/containerkey.pem Trang 96 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 97 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm [root]#chown globus:users container*.pem server_args Cấp ký chứng thực người dùng "usergrid" Tạo người dùng có tên log_on_success+= DURATION usergrid Đây người dùng sử dụng dịch vụ hệ thống Grid Dùng lệnh nice = 10 tạo user với user globus, sau tạo tạo simpleCA, ký chứng thực cho host disable = no bước = -i } Sau gõ lệnh: Các bước cài đặt cấu hình dịch vụ, lệnh chi tiết [5] Bước 3: Cài đặt dịch vụ GRAM [root]#echo "gsiftp 2811/tcp" >> /etc/services [root]#/etc/init.d/xinetd reload Login vào user root, gõ lệnh cấu hình sudo: [root]#netstat -an | grep 2811 Bước 5: Khởi động GT container tự động boot máy [root]#visudo sau đó, thêm dòng sau vào file etc/sudoers: Login vào user globus, tạo file $GLOBUS_LOCATION/bin/start-stop có nội dung sau: # Globus GRAM entries Runas_Alias GRAM_USERS = usergrid #!/bin/sh globus set –e ALL=(GRAM_USERS) NOPASSWD: /usr/local/globus/libexec/globus-gridmap-and- export GLOBUS_LOCATION=/usr/local/globus execute -g export JAVA_HOME=/usr/local/java /etc/grid-security/grid-mapfile /usr/local/globus/libexec/globus-job-manager-script.pl * export ANT_HOME=/usr/local/ant globus export GLOBUS_OPTIONS="-Xms256M -Xmx512M" ALL=(GRAM_USERS) NOPASSWD: /usr/local/globus/libexec/globus-gridmap-and- $GLOBUS_LOCATION/etc/globus-user-env.sh execute cd $GLOBUS_LOCATION -g /etc/grid-security/grid-mapfile /usr/local/globus/libexec/globus-gram-local-proxy-tool * case "$1" in Bước 4: Cài đặt GridFTP start) Login vào user root, dùng trình soạn thảo dạng console $GLOBUS_LOCATION/sbin/globus-start-containerdetached -p 8443 Fedora để tạo file /etc/xinetd.d/gridftp có nội dung sau: ;; service gsiftp stop) { instances $GLOBUS_LOCATION/sbin/globus-stop-container- = 100 socket_type detached = stream ;; wait = no user = root env += GLOBUS_LOCATION=/usr/local/globus env += LD_LIBRARY_PATH=/usr/local/globus/lib server *) echo "Usage: globus {start|stop}" >&2 exit ;; = /usr/local/globus/sbin/globus-gridftpesac server Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 98 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 99 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm exit [root]#su postgres -c "createuser -P globus" [globus]$chmod +x $GLOBUS_LOCATION/bin/start-stop Tạo sở liệu ban đầu cho RFT Login vào user root, tạo file /etc/init.d/globus có nội dung sau: [globus]$createdb rftDatabase #!/bin/sh –e [globus]$psql -d rftDatabase -f ## BEGIN chkconfig header [globus]$$GLOBUS_LOCATION/share/globus_wsrf_rft/rft_schema.sq # chkconfig: 345 80 30 l # processname: /usr/local/globus/bin/start-stop Thay đổi mật file # description: sysv init script to start GT container $GLOBUS_LOCATION/etc/globus_wsrf_rft/jndi-config.xml thành "globus" ## END chkconfig header 4.2.4 Cài đặt nút tính toán case "$1" in start) Phần trình bày bước để cài đặt sở hạ tầng Grid lên su - globus /usr/local/globus/bin/start-stop start ;; nút tính toán Cài đặt phải thực lặp tất nút tính toán có lưới Trên nút tính toán việc cài đặt tạo user hay cài đặt GT4, GridFTP, stop) su - globus /usr/local/globus/bin/start-stop stop ;; GT container, GRAM RFT thực tương tự với nút server Riêng cài đặt GSI có chút khác biệt sau: restart) Dùng user globus, chép file globus_simple_ca_ebb88ce5_setup- $0 stop sleep 0.18.tar.gz thư mục ~globus/.globus/simpleCA nút vào thư mục $0 start home user globus nút tính toán [globus]$export GLOBUS_LOCATION=/usr/local/globus ;; [globus]$$GLOBUS_LOCATION/sbin/gpt-build *) globus_simple_ca_ebb88ce5_setup-0.18.tar.gz echo "Usage: $0 {start|stop|restart}n" >&2 [globus]$$GLOBUS_LOCATION/sbin/gpt-postinstall ;; esac Login vào user root, gõ lệnh: exit [root]#export GLOBUS_LOCATION=/usr/local/globus [root]#755 /etc/init.d/globus [root]#source $GLOBUS_LOCATION/etc/globus-user-env.sh [root]#chkconfig add globus [root]#$GLOBUS_LOCATION/setup/globus_simple_ca_ebb88ce5_setup [root]#service globus start /setup-gsi Bước 6: Cấu hình RFT Cấu hình hệ quản trị sở liệu PostgresSQL Thêm dòng "host rftDatabase Tạo yêu cầu cấp chứng thực ký chứng thực host cho nút tính toán "globus" "172.16.14.130" 255.255.255.0 trust" vào tập tin /var/lib/pgsql/data/pg_hba.conf, 172.16.14.130 địa user root: [root]#grid-cert-request -host `hostname` IP nút ta cài đặt [root]#/etc/init.d/postgresql restart Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 100 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 101 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm copy tập tin /etc/grid-security/hostcert_request.pem tới người quản trị globus server 1.pool.ntp.org nút CA: globus@gridsv.it.bkvn vào thư mục ~globus/.globus/hosts/, server 2.pool.ntp.org (: tên nút tính toán xin cấp chứng thực) fudge 172.16.14.0 stratum 10 driftfile /etc/ntp/drift Người quản trị globus@gridsv.it.bk.vn ký chứng thực lệnh broadcastdelay grid-ca-sign -in.globus/hosts//hostcert_request.pem authenticate no -out hostcert.pem Cập nhật ngày cho nút chính: 0.008 sau chuyển tập tin hostcert.pem vào lại thư mục /etc/grid-security nút [root]#ntpdate -u 0.pool.ntp.org tính toán quyền root (lặp lại lệnh nút xác) [root]#cp ~globus/hostsigned.pem /etc/grid- Khởi động NTP server: security/hostcert.pem [root]#chkconfig ntpd on [root]#cp /etc/grid-security/hostcert.pem/etc/grid- [root]#/etc/init.d/ntpd security/containercert.pem Cập nhật trạng thái cho NTP server: [root]#cp /etc/grid-security/hostkey.pem/etc/grid- [root]#ptrace 0.pool.ntp.org security/containerkey.pem [root]#ntptrace 1.pool.ntp.org [root]#chown globus:users container*.pem [root]#ntptrace 2.pool.ntp.org [root]#ls -l /etc/grid-security/*.pem [root]#ntpq –p [root]#echo ""/O=Grid/OU=GlobusTest/OU=simpleCAgridca.math.hcmuns.edu.vn/OU=math.hcmuns.edu.vn/CN=igrid" [root]#ntptrace localhost ¾ Cài đặt NTP client nút tính toán igrid" >> /etc/grid-security/grid-mapfile Tạo yêu cầu cấp chứng thực ký chứng thực người dùng usergrid nút tính toán Bước cần thực cho phép người dùng usergrid login vào [root]#ntpdate -b 172.16.14.130 (Chạy nhiều lần lệnh thời gian hệ thống xác) [root]#chkconfig crond on nút tính toán để sử dụng lưới Thêm tập tin /etc/cron.hourly/ntp.client nội dung sau: 4.2.5 Đồng thời gian nút lưới #!/bin/sh Đây bước quan trọng chứng thực có hiệu lực # Update system time every hour from time server: 172.29.3.131 ntpdate -b 172.16.14.130 khoảng thời gian Yêu cầu tất nút phảicó gói ntp-4.0.0 trở [root]#chmod +x /etc/cron.hourly/ntp.client ¾ Cài đặt NTP server nút [root]#/etc/init.d/crond reload Đầu tiên thay đổi nội dung tập tin /etc/ntp.conf thành: 4.2.6 Cấu hình dịch vụ mức lưới restrict default noserve Sau cài đặt xong hết gói cần thiết, ta tiến hành cấu hình dịch restrict 127.0.0.1 restrict 172.16.14.0 mask 255.255.255.0 vụ IndexService, WebMDS, MyProxy server Thông tin lệnh cấu hình thực server [5] 0.pool.ntp.org Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 102 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 103 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm ¾ Cấu hình IndexService Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm 4.3 Kết nối Cluster vào Grid Ta cấu hình để nút tính toán đăng ký dịch vụ Index với nút 172.29.3.130, cách thêm dòng: Sau có lưới, thực thiết lập mạng con, mạng coi hệ thống tính toán song song phân cụm (Cluster) Thực kết nối https://gridca.math.hcmuns.edu.vn:8443/wsrf/service mạng vào lưới s/DefaultIndexService vào tập tin $GLOBUS_LOCATION/etc/globus_wsrf_mds_index/hierarchy.xml, sau 4.3.1 Cấu hình phần cứng khởi động lại GT container: Trên trung tâm triển khai cluster để kết nối vào hệ thống lưới thiết lập phần trước với topo mạng hình dưới: [globus]$globus-stop-container-detached [globus]$sleep [globus]$globus-start-container-detached ¾ Cấu hình WebMDS Đây ứng dụng Web cho phép hiển thị thông tin MDS lưới Chỉ cài đặt WebMDS nút gói Tomcat jakarta-tomcat-4.1.31.tar.gz: [root]#tar zxf /opt/jakarta-tomcat-4.1.31.tar.gz [root]#ln -s jakarta-tomcat-4.1.31 tomcat [root]#echo "export CATALINA_HOME=/usr/local/tomcat" >>/etc/profile [root]#echo "export PATH=$CATALINA_HOME/bin:$PATH" >> /etc/profile ¾ Cấu hình triển khai WebMDS vào Tomcat container Sửa tham số "endpoint" file $GLOBUS_LOCATION/lib/webmds/conf/indexinfo thành: "https://172.29.3.130:8443/wsrf/services/DefaultIndexService" [root]#$GLOBUS_LOCATION/lib/webmds/bin/webmds-create-contextfile Hình 4-2 Topo mạng triển khai kết nối Cluster vào lưới $CATALINA_HOME/conf/Catalina/localhost Đợt cài đặt thử nghiệm sử dụng hai cluster nhóm sinh viên thực [root]#$CATALINA_HOME/bin/startup.sh tập trung tâm thiết lập trước đó, cluster thứ gồm máy tính có địa IP ¾ Cài đặt cấu hình MyProxy server nút Dùng để quản lý chứng thực người dùng nút khác lưới [root]# cp $GLOBUS_LOCATION/etc/myproxy-server.config /etc từ 172.17.14.1 đến 172.17.14.4 cài đặt Globus Toolkits, GlobusPbsScheduler, PBS MPICH Sử dụng máy có địa 172.17.14.1 làm máy chủ, đồng thời có địa IP dùng để giao tiếp với bên Sau đó, soạn lại tập tin /etc/myproxy-server.config [5] 172.16.14.150 Cluster thứ hai gồm máy tính thiết lập địa IP từ Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 104 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 105 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm 172.17.14.10 đến 172.17.14.15, máy cài đặt Globus Toolkits, acl_hosts: danh sách máy yêu cầu từ server GlobusPbsScheduler, PBS MPICH Ở cluster thứ hai, sử dụng máy có địa default_queue: hàng đợi mặc định dùng ko rõ tên 172.17.14.10 làm máy chủ, máy chủ có địa IP dùng để giao tiếp với bên log_events: độ dài xâu kỹ tự ghi lại kiện xảy hệ thống 172.16.14.152 mail_from: định danh người dùng mà server dùng để gửi thư Bên cạnh cluster thêm mới, hệ thống lưới tính toán giữ nguyên toàn queue_other_job: cho phép người dùng không sở hữu công việc máy đơn thiết lập mục trước xem tình trạng 4.3.2 Cấu hình cluster-based PBS resources_default: tập giá trị mặc định 10 scheduler_interation: khoảng thời gian lần lập lịch Công việc cấu hình cluster-based PBS thực nút chủ cluster PBS cung cấp cho môt lệnh quản lý cấu hình PBS dùng cho việc cấu hình giao diện dòng lệnh lệnh qmgr 11 default_node: nút tính toán mặc định dùng không rõ tên nút để cấu hình cho server Toàn việc cấu hình cho đối tượng Server thực lệnh ¾ Các lệnh cấu hình PBS shell script [17] Các lệnh cấu hình cho PBS thường có cấu trúc sau: ¾ Cấu hình đối tượng hàng đợi (queue) command server [names] [attr OP value[, ]] command queue command node Trong PBS có hai kiểu hàng đợi khác [14]: hàng đợi định tuyến [names] [attr OP value[, ]] (routing) hàng đợi thực thi (execution) Một hàng đợi định tuyến dùng để chuyển [names] [attr OP value[, ]] Ở đậy “command” thực tác động lên đối tượng “server”, công việc từ hàng đợi sang hàng đợi khác PBS Server Còn hàng đợi thực thi dùng để thực công việc, công việc tồn suốt trình chạy “queue”, “node” Các lệnh bao gồm [14]: Active: dùng để kích hoạt đối tượng Thông thường PBS Server muốn hoạt động tốt phải có hai loại hàng đợi Create: tạo đối tượng hàng đợi nút Các thuộc tính hàng đợi chia thành ba nhóm: - Delete: xóa đối tượng hàng đợi nút Nhóm thuộc tính áp dụng với hàng đợi thực thi Help: hiển thị thông tin chi tiết lệnh - Nhóm thuộc tính áp dụng với hàng đợi định tuyến List: liệt kê thuộc tính giá trị đối tượng - Nhóm thuộc tính áp dụng với hai kiểu hàng đợi Print: hiển thị hàng đợi thiết lập thuộc tính server Set: định nghĩa thêm thuộc tính cho đối tượng, ngược lại Unset Các thuộc tính hàng đợi định tuyến queue_type_route: kiểu hàng đợi định tuyến, dùng để phân công việc max_running: số công việc tối đa năm hàng đợi lúc ¾ Cấu hình cho đối tượng Server route_destination: hàng đợi mà công việc chuyển đến Sử dụng thuộc tính lệnh cấu hình PBS [14] như: scheduling: kích hoạt tắt lập lịch enable: cho phép nhận/không nhận công việc max_user_run: số công việc tối đa người thực lúc started: công việc lập lịch thực thi từ hàng đợi acl_host_enable: cho phép server sử dụng danh dách máy acl_hosts Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 106 Các thuộc tính hàng đợi thực thi Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 107 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Luận văn thạc sĩ khoa học queue_type_excecute: kiểu hàng đợi thực thi % gpt-postinstall lệnh thực khởi tạo cấu hình mặc định cho lưới priority: mức độ ưu tiên hàng đợi so với hàng đợi $GLOBUS_LOCATION/setup/globus/setup-mmjfs-pbs max_running: số công việc tối đa đồng thời có hàng đợi resource_max: lượng tài nguyên lớn yêu cầu cho lệnh thực cấu hình để thêm dịch vụ MasterPbsManagedJobFactoryService vào dịch vụ Globus Toolkit công việc, ngược lại resource_min $GLOBUS_LOCATION/setup/globus/setup-mjs-pbs resource_default: tài nguyên mặc định lệnh thực cấu hình để thêm dịch vụ PbsManagedJobFactoryService vào enable: cho phép nhận/không nhận công việc dịch vụ Globus Toolkit started: công việc lập lịch thực thi từ hàng đợi Việc cấu hình đối tượng hàng đợi định tuyến hàng đợi thực thi thực thông qua lệnh shell script [17] Để tạo loại hàng đợi khác cần thay đổi giá trị nhập cho thuộc tính lệnh shell script dùng để tạo hàng đợi thực thi có tên $GLOBUS_LOCATION/setup/globus/setup-pbs-provider lệnh thực cấu hình để thành phần RIPS (Resource Information Provider) lưới làm việc với PBS, RIPS nhận thông tin trả từ PBS_Server cung cấp cho trình quản lý công việc $GLOBUS_LOCATION/setup/globus/setup-globus-job-manager-pbs small, mức độ ưu tiên 100, dùng để thực công việc có thời gian yêu cầu 20 phút cpu-per-node=1 lệnh thiết lập số lượng vi xử lý (CPU) nút đơn cluster, thông số phải phù hợp với tài nguyên tương ứng cluster # Create and define queue small Qmgr: create queue small $GLOBUS_LOCATION/setup/globus/setup-globus-job-manager-pbs Qmgr: set queue small queue_type = Execution remote-shell=rsh Qmgr: set queue small Priority = 100 lệnh thực việc chuyển đổi remote-shell mặc định thành rsh, thông thường Qmgr: set queue small max_running = 10 hệ thống tính toán song song phân cụm thường dùng rsh để truy cập tài Qmgr: set queue small resources_max.cput = 00:20:00 Qmgr: set queue small resources_default.cput = 00:20:00 nguyên cluster $GLOBUS_LOCATION/setup/globus/setup-globus-job-manager-pbs – Qmgr: set queue small enabled = True validate-queues=yes Qmgr: set queue small started = True Tất shell script [17] dùng kiểm thử trung tâm tính lệnh thực kiểm tra hàng đợi tương ứng PBS phù với yêu cầu hay toán hiệu cao, cho kết tốt không 4.3.3 Cấu hình lưới dựa GT 4.4 Kết chương Trước thực cấu hình cho lưới ta cần phải thực cài đặt Globus Toolkits 4.0.1 nút chủ cluster, cài đặt gói phần mềm scheduler-pbs-3.2src_bundle.tar.gz Sau số bước cấu hình cần thiết để thiết lập PBS Trong chương 4, luận văn giới thiệu bước cần thực việc lập kế hoạch triển khai lưới Đồng thời đưa mô hình lưới thử nghiệm, bao gồm hướng dẫn cài đặt Đây bước áp dụng thực tế cho phần lý thuyết nghiên cứu chương trình quản lý công việc cho lưới Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Trang 108 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 109 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm KẾT LUẬN VÀ KIẾN NGHỊ Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm TÀI LIỆU THAM KHẢO Kết thu Trong trình tìm hiểu tính toán lưới thực cài đặt lưới thử Sách tiếng Anh: [1] nghiệm, luận văn thu kết sau: Ian Foster, Carl Kesselman (eds) - The Grid: Blueprint for a New Computing Infrastructure, 1st edition, Morgan Kaufmann Publishers, San Francisco, Bước đầu làm chủ công nghệ tính toán lưới nước ta USA (1 November 1998), ISBN: 1558604758 Nắm bắt công cụ Globus Toolkit vận dụng vào cài đặt thực tế Triển khai hệ thống lưới thử nghiệm [2] Daniel Minoli - A Networking Approach to Grid Computing Biết cách kết nối cluster vào lưới, nhằm tăng sức mạnh tính toán cho lưới [3] Ahmar Abbas - Grid Computing: A Practical Guide to Technology and Applications Hướng phát triển [4] Fran Berman, Anthony J.G.Hey, Geoffrey C.Fox – Grid computing: Make lao để tận dụng hết nguồn lực tài nguyên đa dạng phong phú [5] Globus Books - Globus Toolkit Admin Guide Các vấn đề mà Grid đặt cộng đồng giới giải Các [6] Globus Books - A Globus Primer 0.6 (2005) thành mà Gird Computing đem lại giúp giai nhiều toán mà [7] IBM Red Books – Globus Toolkit 3.0 Quick Start trước giải kỹ thuật toán song song [8] Joshy Joseph, Craig Fellenstein - Grid Computing [9] IBM Red Books – Fundamentals of Grid Computing [10] IBM Red Books – Introduction to Grid Computing with Globus Toolkit tóan đòi hỏi lượng tính tóan tài nguyên cao mạnh để phát [11] The Globus Alliance - How to Build a Service using GT4 triển tốt môi trường tính toán mạng lưới [12] Sun BluePrints Online - The Sun Infrastructure Solution for Grid Computing Dựa kiến thức thu trình làm luận văn Trong thời gian [13] Sun BluePrints Online - Introduction to the Cluster Grid tới, việc nghiên cứu tiếp tính toán lưới theo hướng phát triển [14] Proytable Batch System - OpenPBS Release 2.3 - Administrator sau: [15] James Patton Jones - PBS Pro 5.0 - Administrator Guide [16] Jarek Nabryski, Jenifer M.Schopf, Jan Weglars - Grid Resource Management Có thể nói việc phát triển môi trường tính toán Mạng lưới hướng the Global Infrastructure a Reality nghiên cứu công nghệ có triển vọng lớn tương lai, có ứng dụng lớn Tuy nhiên có số toán mà công nghệ Grid chưa thể thể giải Dù việc tận dụng nguồn tài nguyên rãnh rỗi để tính tóan Nghiên cứu hạ tầng truyền thông môi trường lưới, tìm hiểu đưa giải pháp để kết nối nút lưới với điều kiện hạ tầng truyền thông chưa tốt Việt Nam Sách tiếng Việt: Về mặt lập trình tiến hành xây dựng môdun riêng như: quản trị người [17] Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Đồ án đại học - Kết nối Globus PBS - Nguyễn Đức Mạnh khoá K45 trường ĐHBKHN dùng lưới, môi giới tài nguyên, lập lịch kinh tế, … Trang 110 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 111 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính toán lưới cài đặt mô hình thử nghiệm Trang Web: [18] Workspace Admin Guide:http://workspace.globus.org/vm/TP1.2/doc/adminindex.html#installing-workspace-service [19] SimpleCA: http://gdp.globus.org/gt3-tutorial/multiplehtml/ch12s02.html [20] Website Globus Toolkits http://www.globus.org [21] Globus Toolkit Tutorial: http://www.globusconsortium.org/tutorial/ [22] http://www.globus.org/toolkit/docs/4.0/admin/docbock/index.html [23] http://www.globus.org/toolkit/docs/4.0/data/gridftp/admin-index.html [24] http://www.globus.org/toolkit/docs/development/4.1.0/admin/docbook/quick [25] ML Levisetto - About PBS and the Grid: start.html#q-container http://www.bo.infn.it/alice/introgrid/pbsabout/index.html [26] Quick Tutorial for PBS: [27] PBS Userguide: http://www.princeton.edu/~letchu/compting/scientific_computing/PBS.html http://www.doesciencegrid.org/public/pbs/homepage.html [28] http://www.w3.org/2002/ws/ [29] J Postel, J Reynolds, “File Transfer Protocol”, tài nguyên sẵn có web [30] http://doesciencegrid.org/projects/GPDK/ địa http://www.w3.org/Protocols/rfc959/ Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 112