Nghiên cứu tổng quan về tính toán lưới và cài đặt mô hình thử nghiệm

113 14 0
Nghiên cứu tổng quan về tính toán lưới và cài đặt mô hình thử nghiệm

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

NGUYỄN THỊ KIM TUYẾN BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI o0o - LUẬN VĂN THẠC SĨ KHOA HỌC NGÀNH: CÔNG NGHỆ THÔNG TIN CÔNG NGHỆ THÔNG TIN NGHIÊN CỨU TỔNG QUAN VỀ TÍNH TỐN LƯỚI VÀ CÀI ĐẶT MƠ HÌNH THỬ NGHIỆM NGUYỄN THỊ KIM TUYẾN 2004-2006 HÀ NỘI 2006 HÀ NỘI 10-2006 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm LỜI CẢM ƠN Trong q trình tìm hiểu nghiên cứu để hồn thành luận văn, tơi gặp khơng khó khăn, lúc vậy, tơi ln nhận động viên, khích lệ thầy giáo, TS Nguyễn Kim Khánh Thầy giúp đỡ tơi nhiều q trình nghiên cứu, hướng dẫn tận tình cách thức phương pháp nghiên cứu khoa học hỗ trợ việc tìm tài liệu Để có kết luận văn này, xin gửi lời cảm ơn sâu sắc đến thầy giáo, TS Nguyễn Kim Khánh khoa Công nghệ thông tin trường ĐHBKHN Tôi xin gửi lời cảm ơn đến thầy cô bạn Trung tâm tính tốn hiệu cao, trường ĐHBKHN Cuối tơi xin cảm ơn đồng nghiệp, gia đình bạn người bên cạnh, động viên khích lệ tơi để có kết ngày hôm Hà Nội, ngày 05 tháng 10 năm 2006 Tác giả Nguyễn Thị Kim Tuyến Lớp Cao học CNTT 2004-2006 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm LỜI CAM ĐOAN Tơi Nguyễn Thị Kim Tuyến, học viên lớp cao học khoá 2004-2006, chuyên ngành Công nghệ thông tin Tôi xin cam đoan luận văn "Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm" tơi nghiên cứu, tìm hiểu hướng dẫn thầy giáo TS Nguyễn Kim Khánh, chép người khác Tôi xin chịu trách nhiệm lời cam đoan Hà Nội, ngày 05 tháng 10 năm 2006 Tác giả Nguyễn Thị Kim Tuyến Lớp Cao học CNTT 2004-2006 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm MỤC LỤC LỜI CẢM ƠN LỜI CAM ĐOAN MỤC LỤC DANH MỤC THUẬT NGỮ DANH MỤC HÌNH LỜI NÓI ĐẦU CHƯƠNG TÍNH TỐN LƯỚI 10 1.1 Tổng quan Tính tốn lưới 10 1.1.1 Tính tốn lưới gì? 10 1.1.2 So sánh với mơ hình, cơng nghệ khác 12 1.1.3 Phân loại mạng lưới 13 1.2 Kiến trúc thành phần hệ thống lưới 15 1.2.1 Tổng quan kiến trúc lưới 15 1.2.2 Các thành phần theo mơ hình chức 18 1.2.3 Các thành phần theo mơ hình vật lý 19 1.3 Các chuẩn cho tính tốn lưới 19 1.3.1 OGSA/OGSI gì? 20 1.3.2 Chuẩn OGSI .20 1.3.3 Chuẩn OGSA 22 1.4 Các thành phần mơ hình chức lưới 24 1.4.1 Bảo mật 24 1.4.1.1 Cơ chế bảo mật môi trường lưới 25 1.4.1.2 Các sách bảo mật mơi trường lưới .25 1.4.1.3 Hạ tầng an ninh mạng lưới GSI (Grid Security Infrastructure) 26 1.4.2 Quản lý tài nguyên lưới 27 1.4.2.1 Những thách thức quản lý tài nguyên lưới 27 1.4.2.2 Hệ quản trị tài nguyên GRAM 29 1.4.3 Quản lý liệu 30 1.4.3.1 Giao thức truyền tập tin mạng lưới GridFTP 30 1.4.3.2 Dịch vụ định vị RLS 33 1.4.4 Lập lịch môi trường lưới 36 1.4.5 Grid Portal 38 1.4.5.1 Các yêu cầu Grid Portal 39 1.4.5.2 Chuyển tải Job Grid Portal 39 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm 1.4.6 Giám sát lưới 40 1.4.6.1 Quy trình giám sát 41 1.4.6.2 Yêu cầu hệ thống giám sát lưới .41 1.4.6.3 Kiến trúc giám sát lưới GMA (Grid Monitoring Architecture) 42 1.4.6.4 Phân loại hệ thống giám sát lưới 43 1.5 Kết chương 44 CHƯƠNG TỔNG QUAN VỀ GLOBUS 45 2.1 Tổng quan kiến trúc chung GT 45 2.1.1 Các chức GT 45 2.1.2 Các đặc trưng GT4 .46 2.1.3 Tóm lược kiến trúc GT4 48 2.2 Kiến trúc hướng dịch vụ 48 2.2.1 GT4, hệ thống phân tán, dịch vụ Web 48 2.2.2 Cơ sở hạ tầng ứng dụng hướng dịch vụ 49 2.2.3 Kiến trúc hướng dịch vụ (Service Oriented Architecture-SOA) .50 2.3 Kiến trúc GT4 51 2.3.1 Kiến trúc tổng quan 51 2.3.2 Triển khai dịch vụ Web GT4 .53 2.4 Quản lý thực thi GT4 54 2.4.1 Tổng quan GT4 GRAM .55 2.4.2 Lệnh globusrun-ws 56 2.4.3 Cách thức hoạt động GT4 GRAM 60 2.4.4 Cấu hình quản trị GT4 GRAM 62 2.5 Quản lý liệu GT4 63 2.5.1 Tổng quan quản lý liệu GT4 63 2.5.2 Di chuyển liệu 63 2.5.3 Tạo liệu 64 2.6 Theo dõi phát 65 2.6.1 Hệ thống theo dõi phát - MDS4 65 2.6.2 Bộ gộp (aggregator) nguồn thông tin 66 2.6.3 Nguồn thông tin việc đăng ký 67 2.7 Kết chương 67 CHƯƠNG CÁC KỸ THUẬT LƯỚI HIỆN ĐƯỢC TRIỂN KHAI Ở VIỆT NAM .68 3.1 Desktop Grids 68 3.1.1 Tính tốn phân tán xí nghiệp 68 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm 3.1.2 Định nghĩa Desktop Grid 69 3.1.3 Giá trị lưới Desktop Grid 70 3.1.4 Các phần tử kỹ thuật .70 3.1.5 Các khía cạnh thực tế cần xem xét 72 3.1.6 Grid Server .73 3.2 Cluster Grids 74 3.2.1 Kiến trúc lưới Cluster .74 3.2.2 Bó phần mềm lưới cluster Sun 75 3.2.3 Yêu cầu thiết kế 78 3.2.4 Phần cứng mạng .79 3.2.5 Quản lý Cluster Grid .80 3.3 Kết nối Cluster vào Grid 81 3.3.1 Sự cần thiết việc kết nối grid cluster 82 3.3.2 Kết nối Globus-based Grid PBS-based Cluster 82 3.3.2.1 GRAM .82 3.3.2.2 PBS 83 3.3.2.3 Các yêu cầu thành phần kết nối 87 3.4 Kết chương 90 CHƯƠNG TRIỂN KHAI THỬ NGHIỆM 91 4.1 Lập thiết kế kiến trúc lưới 91 4.2 Cài đặt Grid 95 4.2.1 Cấu hình phần cứng lưới 95 4.2.2 Yêu cầu trước cài đặt 96 4.2.3 Cài đặt cho nút 96 4.2.4 Cài đặt nút tính tốn 101 4.2.5 Đồng thời gian nút lưới 102 4.2.6 Cấu hình dịch vụ mức lưới .103 4.3 Kết nối Cluster vào Grid 105 4.3.1 Cấu hình phần cứng 105 4.3.2 Cấu hình cluster-based PBS 106 4.3.3 Cấu hình lưới dựa GT 108 4.4 Kết chương 109 KẾT LUẬN VÀ KIẾN NGHỊ 110 TÀI LIỆU THAM KHẢO 111 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm DANH MỤC THUẬT NGỮ Viết tắt API CAS DPSS DTP GRAM GTCP FTP Globus XIO GMA GridFTP GSI HPSS HTTP LDAP LFN LRC Tên đầy đủ Grid Computing Globus Toolkit Chú giải Tính tốn lưới Bộ cơng cụ middleware hỗ trợ tính tốn lưới, cung cấp số dịch vụ đệ trình cơng việc, quản lý tài ngun, hạ tầng bảo mật, hỗ trợ việc xây dựng dịch vụ lưới… Web Service Dịch vụ web – kiến trúc phát triển W3C nhằm cung cấp chức cho người dùng từ xa Application Programming Giao diện lập trình ứng dụng, thường tập hàm Interface giúp lập trình viên dễ dàng tương tác với dịch vụ hệ thống Community Dịch vụ chứng thực cộng đồng Một dịch vụ bảo mật Authorization Service mơi trường lưới cho phép dung hịa sách sử dụng tài nguyên cộng đồng người dùng với sách sử dụng tài nguyên nhà cung cấp Distributed Parallel Hệ thống lưu trữ song song phân tán: kỹ thuật tổ chức Storage System tập đĩa cứng nằm server kết nối với qua mạng diện rộng, cung cấp khả truy cập mức độ khối logic đến liệu lớn Data Transfer Process Tiến trình quản lý việc truy cập liệu thực truyền qua kênh liệu kiến trúc GridFTP Grid Resource Allocation Dịch vụ quản lý định vị tài nguyên lưới and Management Service Grid Telecontrol Protocol Giao thức điều khiển lưới từ xa File Transfer Protocol Giao thức truyền tệp tiếng qua mạng Globus eXtensible Giao diện vào mức thấp kiến trúc Globus Input/Ouput Grid Monitoring Hệ thống gián sát lưới Architecture Grid File Transfer GridFTP mở rộng giao thức FTP, tích hợp khả Protocol bảo mật lưới, truyền liệu tốt so với FTP Grid Security Cơ sở hạ tầng bảo mật lưới kiến trúc Globus, Infrastructure hỗ trợ giấy chứng nhận theo chuẩn X509 dùng hệ mã công khai High Performance Hệ thống quản lý hiệu hàng trăm terabyte tới Storage System petabyte lưu ổ cứng băng từ, liệu thường xuyên sử dụng lưu đĩa cứng, cịn liệu có tần suất sử dụng lưu băng từ Hypertext Transfer Giao thức truyền siêu văn bản, sử dụng để truyền Protocol thông tin từ máy phục vụ www đến trình duyệt Lightweight Directory Giao thức đặc tả kỹ thuật định danh đối tượng, mô Access Protocol hình liệu, tìm kiếm ghi khoản mục liệu Logical File Name Tên logic thực thể liệu lưới liệu, hàm chứa nội dung thực thể liệu Local Replica Catalogue Catalog định vị địa phương, lưu trữ tập ánh xạ bao gồm hai trường: {tên logic thực thể liệu, vị trí vật lý cụ thể thực thể đó} Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang Luận văn thạc sĩ khoa học MCS Metadata Catalog Service MDS PBS Monitoring and Discovery Service Message Passing Interface Open Grid Service Architecture Open Grid Service Infrastructure Protable Batch System PI Protocol Interperter RFT RLI Reliable File Transfer Service Replica Location Index RLS Replica Location Service RMI Remote Method Invocation RSL SRB Resource Specification Language Simple Mail Transfer Protocol Service Oriented Architecture Simple Object Access Protocol Software Development Kit Storage Resource Broker SSL UHE VO WSDD/ WSDL WSRF Secure Socket Layer User Host Environment Virtual Organizations Web Service Deployment Descriptor Web Service Protocol XML Extensible Markup Language MPI OGSA OGSI SMTP SOA SOAP SDK Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm Dịch vụ siêu liệu kiến trúc lưới liệu Globus, cho phép gắn đối tượng liệu với số thuộc tính mơ tả Dịch vụ theo dõi định vị tài nguyên Giao diện truyền thông điệp, cách thức trao đổi thông tin tiến trình Kiến trúc dịch vụ lưới, định nghĩa giao diện chuẩn chế hoạt động dịch vụ lưới Hạ tầng dịch vụ lưới mở Là hệ thống phân tải quản lý tài nguyên mạnh Được sử dụng phổ biến hệ thống tính tốn song song Cung cấp khả khởi tạo lập lịch cho việc thực thi xếp công việc máy trạm Bộ thông dịch giao thức, có nhiệm vụ quản lý kênh điều khiển kiến trúc GridFTP Dịch vụ truyền file tin cậy Lưu thông tin mục cho dịch vụ định vị sao, ghi bao gồm {LFN, trỏ tới LRC tương ứng} Dịch vụ định vị kiến trúc lưới liệu Globus, cho phép xác định vị trí thực thể liệu lưới Gọi phương thức từ xa, sử dụng Java chạy RMI, đối tượng Java gọi phương thức đối tượng xa chạy máy ảo khác Ngôn ngữ đặc tả tài nguyên Giao thức từ máy phục vụ đến máy phục vụ hỗ trợ phân tán thư điện tử Kiến trúc hướng dịch vụ Giao thức truy cập đối tượng từ xa đơn giản, dùng xây dựng dịch vụ web, lập tình phân tán Tập công cụ hỗ trợ phát triển phần mềm Bộ môi giới tài nguyên lưu trữ: thực việc môi giới ứng dụng chủ tài nguyên lưu trữ, để xác định tài nguyên phù hợp cho ứng dụng Giao thức bảo mật lưới Môi trường người dùng Các tổ chức ảo Ngôn ngữ đặc tả dịch vụ web Framework đưa GT4 hỗ trợ kiến trúc lập trình Là cách thức linh động để tạo định dạng thông tin chia sẻ định dạng liệu web Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm DANH MỤC HÌNH Hình 1-1 Sự phát triển từ Networking đến Grid Computing .11 Hình 1-2 Kiến trúc phân tầng lưới .15 Hình 1-3 Các thành phần theo mơ hình chức 18 Hình 1-4 Mối quan hệ OGSA OGSI .21 Hình 1-5 Bảo mật mức giao vận 26 Hình 1-6 Bảo mật mức thơng điệp .26 Hình 1-7 Mơ hình thương lượng tài ngun lưới 29 Hình 1-8 Kiến trúc GridFTP 31 Hình 1-9 Đường ống truyền liệu DTP 32 Hình 1-10 Cổng điện tử GridPortal .38 Hình 1-11 Các thành phần kiến trúc GMA 42 Hình 2-1 Các thành phần kiến trúc dịch vụ Web .49 Hình 2-2 Các thành phần chức cài đặt dịch vụ Web .49 Hình 2-3 Các thành phần kiến trúc GT4 51 Hình 2-4 GT4 Container tích hợp dịch vụ công cụ 53 Hình 2-5 Bốn cấu hình GT4 container .53 Hình 2-6 Sự dịch chuyển trạng thái .58 Hình 2-7 Kiến trúc GRAM 60 Hình 3-1 Xếp hạng Desktop Grid 500 siêu máy tính hàng đầu .70 Hình 3-2 Ba lớp kiến trúc lưới cluster 74 Hình 3-3 Ngăn xếp phần mềm lưới Sun Cluster Grid 75 Hình 3-4 Luồng công việc Sun Grid Engine 76 Hình 3-5 Các thành phần PBS 85 Hình 3-6 Cơ chế hoạt động PBS 86 Hình 3-7 Hoạt động Globus Scheduler Pbs 90 Hình 4-1 Mơ hình lưới triển khai thử nghiệm 96 Hình 4-2 Topo mạng triển khai kết nối Cluster vào lưới 105 Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm LỜI NĨI ĐẦU Trong năm gần nhiều thiết bị phần cứng mạnh phục vụ cho u cầu tính tốn hiệu cao tạo Nhưng, nhu cầu người không giới hạn nên họ thấy chưa đủ, thể tính tốn lưới đời nhằm đáp ứng nhu cầu Tuy nhiên điểm yếu lưới khơng phải sức mạnh tính tốn mà tính thực tiễn, tính thực tiễn thể chỗ lưới tính tốn thường tạo dựa việc tận dụng nguồn tài nguyên bình thường, sẵn có mà khơng cần phải mua tạo hạ tầng phần cứng Do đó, tính toán lưới lên phương tiện tập hợp tài ngun tính tốn chi phí thấp để giải tốn lớn Ở Việt Nam, cơng nghệ lưới mới, triển khai số trung tâm tính toán viện nghiên cứu trường đại học chuyên ngành lớn Vì thế, luận văn viết với mục đích nhằm nghiên cứu lý thuyết tính tốn lưới, hạ tầng cần thiết cho lưới, xây dựng mơi trường tính tốn lưới phục vụ cho nhu cầu nghiên cứu lĩnh vực chuyên sâu lưới sau Luận văn chia làm chương với nội dung cụ thể sau: Chương Tổng quan tính tốn lưới, trình bày vấn đề chung tính tốn lưới định nghĩa, kiến trúc, thành phần … Chương Tổng quan Globus, trình bày chi tiết thành phần tảng tính tốn lưới công cụ Globus Toolkit Chương Các kỹ thuật lưới triển khai nước ta, trình bày kỹ thuật lưới số trung tâm tính tốn nước ta triển khai Desktop Grid, Cluster Grid Kết nối Cluster vào Grid thông qua PBS Chương Xây dựng lưới thử nghiệm, trình bày bước để thiết kế lưới Cài đặt thử nghiệm lưới đồng thời thực kết nối cluster vào lưới Phần Kết luận, trình bày tóm tắt kết đạt hướng phát triển luận văn Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm [root]#chown globus:users container*.pem Cấp ký chứng thực người dùng "usergrid" Tạo người dùng có tên usergrid Đây người dùng sử dụng dịch vụ hệ thống Grid Dùng lệnh tạo user với user globus, sau tạo tạo simpleCA, ký chứng thực cho host bước Các bước cài đặt cấu hình dịch vụ, lệnh chi tiết [5] Bước 3: Cài đặt dịch vụ GRAM Login vào user root, gõ lệnh cấu hình sudo: [root]#visudo sau đó, thêm dịng sau vào file etc/sudoers: # Globus GRAM entries Runas_Alias GRAM_USERS = usergrid globus ALL=(GRAM_USERS) NOPASSWD: /usr/local/globus/libexec/globus-gridmap-andexecute -g /etc/grid-security/grid-mapfile /usr/local/globus/libexec/globus-job-manager-script.pl * globus ALL=(GRAM_USERS) NOPASSWD: /usr/local/globus/libexec/globus-gridmap-andexecute -g /etc/grid-security/grid-mapfile /usr/local/globus/libexec/globus-gram-local-proxy-tool * Bước 4: Cài đặt GridFTP Login vào user root, dùng trình soạn thảo dạng console Fedora để tạo file /etc/xinetd.d/gridftp có nội dung sau: service gsiftp { instances = 100 socket_type = stream wait = no user = root env += GLOBUS_LOCATION=/usr/local/globus env += LD_LIBRARY_PATH=/usr/local/globus/lib server = /usr/local/globus/sbin/globus-gridftp- server Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 98 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm server_args = -i log_on_success+= DURATION nice = 10 disable = no } Sau gõ lệnh: [root]#echo "gsiftp 2811/tcp" >> /etc/services [root]#/etc/init.d/xinetd reload [root]#netstat -an | grep 2811 Bước 5: Khởi động GT container tự động boot máy Login vào user globus, tạo file $GLOBUS_LOCATION/bin/start-stop có nội dung sau: #!/bin/sh set –e export GLOBUS_LOCATION=/usr/local/globus export JAVA_HOME=/usr/local/java export ANT_HOME=/usr/local/ant export GLOBUS_OPTIONS="-Xms256M -Xmx512M" $GLOBUS_LOCATION/etc/globus-user-env.sh cd $GLOBUS_LOCATION case "$1" in start) $GLOBUS_LOCATION/sbin/globus-start-containerdetached -p 8443 ;; stop) $GLOBUS_LOCATION/sbin/globus-stop-containerdetached ;; *) echo "Usage: globus {start|stop}" >&2 exit ;; esac Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 99 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm exit [globus]$chmod +x $GLOBUS_LOCATION/bin/start-stop Login vào user root, tạo file /etc/init.d/globus có nội dung sau: #!/bin/sh –e ## BEGIN chkconfig header # chkconfig: 345 80 30 # processname: /usr/local/globus/bin/start-stop # description: sysv init script to start GT container ## END chkconfig header case "$1" in start) su - globus /usr/local/globus/bin/start-stop start ;; stop) su - globus /usr/local/globus/bin/start-stop stop ;; restart) $0 stop sleep $0 start ;; *) echo "Usage: $0 {start|stop|restart}n" >&2 ;; esac exit [root]#755 /etc/init.d/globus [root]#chkconfig add globus [root]#service globus start Bước 6: Cấu hình RFT Cấu hình hệ quản trị sở liệu PostgresSQL Thêm dòng "host rftDatabase "globus" "172.16.14.130" 255.255.255.0 trust" vào tập tin /var/lib/pgsql/data/pg_hba.conf, 172.16.14.130 địa IP nút ta cài đặt [root]#/etc/init.d/postgresql restart Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 100 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm [root]#su postgres -c "createuser -P globus" Tạo sở liệu ban đầu cho RFT [globus]$createdb rftDatabase [globus]$psql -d rftDatabase -f [globus]$$GLOBUS_LOCATION/share/globus_wsrf_rft/rft_schema.sq l Thay đổi mật file $GLOBUS_LOCATION/etc/globus_wsrf_rft/jndi-config.xml thành "globus" 4.2.4 Cài đặt nút tính tốn Phần trình bày bước để cài đặt sở hạ tầng Grid lên nút tính tốn Cài đặt phải thực lặp tất nút tính tốn có lưới Trên nút tính tốn việc cài đặt tạo user hay cài đặt GT4, GridFTP, GT container, GRAM RFT thực tương tự với nút server Riêng cài đặt GSI có chút khác biệt sau: Dùng user globus, chép file globus_simple_ca_ebb88ce5_setup0.18.tar.gz thư mục ~globus/.globus/simpleCA nút vào thư mục home user globus nút tính tốn [globus]$export GLOBUS_LOCATION=/usr/local/globus [globus]$$GLOBUS_LOCATION/sbin/gpt-build globus_simple_ca_ebb88ce5_setup-0.18.tar.gz [globus]$$GLOBUS_LOCATION/sbin/gpt-postinstall Login vào user root, gõ lệnh: [root]#export GLOBUS_LOCATION=/usr/local/globus [root]#source $GLOBUS_LOCATION/etc/globus-user-env.sh [root]#$GLOBUS_LOCATION/setup/globus_simple_ca_ebb88ce5_setup /setup-gsi Tạo yêu cầu cấp chứng thực ký chứng thực host cho nút tính tốn user root: [root]#grid-cert-request -host `hostname` Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 101 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm copy tập tin /etc/grid-security/hostcert_request.pem tới người quản trị globus nút CA: globus@gridsv.it.bkvn vào thư mục ~globus/.globus/hosts/, (: tên nút tính tốn xin cấp chứng thực) Người quản trị globus@gridsv.it.bk.vn ký chứng thực lệnh grid-ca-sign -in.globus/hosts//hostcert_request.pem -out hostcert.pem sau chuyển tập tin hostcert.pem vào lại thư mục /etc/grid-security nút tính tốn quyền root [root]#cp ~globus/hostsigned.pem /etc/gridsecurity/hostcert.pem [root]#cp /etc/grid-security/hostcert.pem/etc/gridsecurity/containercert.pem [root]#cp /etc/grid-security/hostkey.pem/etc/gridsecurity/containerkey.pem [root]#chown globus:users container*.pem [root]#ls -l /etc/grid-security/*.pem [root]#echo ""/O=Grid/OU=GlobusTest/OU=simpleCAgridca.math.hcmuns.edu.vn/OU=math.hcmuns.edu.vn/CN=igrid" igrid" >> /etc/grid-security/grid-mapfile Tạo yêu cầu cấp chứng thực ký chứng thực người dùng usergrid nút tính tốn Bước cần thực cho phép người dùng usergrid login vào nút tính tốn để sử dụng lưới 4.2.5 Đồng thời gian nút lưới Đây bước quan trọng chứng thực có hiệu lực khoảng thời gian Yêu cầu tất nút phảicó gói ntp-4.0.0 trở ¾ Cài đặt NTP server nút Đầu tiên thay đổi nội dung tập tin /etc/ntp.conf thành: restrict default noserve restrict 127.0.0.1 restrict 172.16.14.0 mask 255.255.255.0 server 0.pool.ntp.org Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 102 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm server 1.pool.ntp.org server 2.pool.ntp.org fudge 172.16.14.0 stratum 10 driftfile /etc/ntp/drift broadcastdelay 0.008 authenticate no Cập nhật ngày cho nút chính: [root]#ntpdate -u 0.pool.ntp.org (lặp lại lệnh nút xác) Khởi động NTP server: [root]#chkconfig ntpd on [root]#/etc/init.d/ntpd Cập nhật trạng thái cho NTP server: [root]#ptrace 0.pool.ntp.org [root]#ntptrace 1.pool.ntp.org [root]#ntptrace 2.pool.ntp.org [root]#ntpq –p [root]#ntptrace localhost ¾ Cài đặt NTP client nút tính tốn [root]#ntpdate -b 172.16.14.130 (Chạy nhiều lần lệnh thời gian hệ thống xác) [root]#chkconfig crond on Thêm tập tin /etc/cron.hourly/ntp.client nội dung sau: #!/bin/sh # Update system time every hour from time server: 172.29.3.131 ntpdate -b 172.16.14.130 [root]#chmod +x /etc/cron.hourly/ntp.client [root]#/etc/init.d/crond reload 4.2.6 Cấu hình dịch vụ mức lưới Sau cài đặt xong hết gói cần thiết, ta tiến hành cấu hình dịch vụ IndexService, WebMDS, MyProxy server Thơng tin lệnh cấu hình thực [5] Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 103 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm ¾ Cấu hình IndexService Ta cấu hình để nút tính tốn đăng ký dịch vụ Index với nút 172.29.3.130, cách thêm dòng: https://gridca.math.hcmuns.edu.vn:8443/wsrf/service s/DefaultIndexService vào tập tin $GLOBUS_LOCATION/etc/globus_wsrf_mds_index/hierarchy.xml, sau khởi động lại GT container: [globus]$globus-stop-container-detached [globus]$sleep [globus]$globus-start-container-detached ¾ Cấu hình WebMDS Đây ứng dụng Web cho phép hiển thị thông tin MDS lưới Chỉ cài đặt WebMDS nút gói Tomcat jakarta-tomcat-4.1.31.tar.gz: [root]#tar zxf /opt/jakarta-tomcat-4.1.31.tar.gz [root]#ln -s jakarta-tomcat-4.1.31 tomcat [root]#echo "export CATALINA_HOME=/usr/local/tomcat" >>/etc/profile [root]#echo "export PATH=$CATALINA_HOME/bin:$PATH" >> /etc/profile ¾ Cấu hình triển khai WebMDS vào Tomcat container Sửa tham số "endpoint" file $GLOBUS_LOCATION/lib/webmds/conf/indexinfo thành: "https://172.29.3.130:8443/wsrf/services/DefaultIndexService" [root]#$GLOBUS_LOCATION/lib/webmds/bin/webmds-create-contextfile $CATALINA_HOME/conf/Catalina/localhost [root]#$CATALINA_HOME/bin/startup.sh ¾ Cài đặt cấu hình MyProxy server nút Dùng để quản lý chứng thực người dùng nút khác lưới [root]# cp $GLOBUS_LOCATION/etc/myproxy-server.config /etc Sau đó, soạn lại tập tin /etc/myproxy-server.config [5] Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 104 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm 4.3 Kết nối Cluster vào Grid Sau có lưới, thực thiết lập mạng con, mạng coi hệ thống tính tốn song song phân cụm (Cluster) Thực kết nối mạng vào lưới 4.3.1 Cấu hình phần cứng Trên trung tâm triển khai cluster để kết nối vào hệ thống lưới thiết lập phần trước với topo mạng hình dưới: Hình 4-2 Topo mạng triển khai kết nối Cluster vào lưới Đợt cài đặt thử nghiệm sử dụng hai cluster nhóm sinh viên thực tập trung tâm thiết lập trước đó, cluster thứ gồm máy tính có địa IP từ 172.17.14.1 đến 172.17.14.4 cài đặt Globus Toolkits, GlobusPbsScheduler, PBS MPICH Sử dụng máy có địa 172.17.14.1 làm máy chủ, đồng thời có địa IP dùng để giao tiếp với bên ngồi 172.16.14.150 Cluster thứ hai gồm máy tính thiết lập địa IP từ Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 105 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm 172.17.14.10 đến 172.17.14.15, máy cài đặt Globus Toolkits, GlobusPbsScheduler, PBS MPICH Ở cluster thứ hai, sử dụng máy có địa 172.17.14.10 làm máy chủ, máy chủ có địa IP dùng để giao tiếp với bên 172.16.14.152 Bên cạnh cluster thêm mới, hệ thống lưới tính tốn giữ ngun tồn máy đơn thiết lập mục trước 4.3.2 Cấu hình cluster-based PBS Cơng việc cấu hình cluster-based PBS thực nút chủ cluster PBS cung cấp cho mơt lệnh quản lý cấu hình PBS dùng cho việc cấu hình giao diện dịng lệnh lệnh qmgr ¾ Các lệnh cấu hình PBS Các lệnh cấu hình cho PBS thường có cấu trúc sau: command server [names] [attr OP value[, ]] command queue [names] [attr OP value[, ]] command node [names] [attr OP value[, ]] Ở đậy “command” thực tác động lên đối tượng “server”, “queue”, “node” Các lệnh bao gồm [14]: Active: dùng để kích hoạt đối tượng Create: tạo đối tượng hàng đợi nút Delete: xóa đối tượng hàng đợi nút Help: hiển thị thông tin chi tiết lệnh List: liệt kê thuộc tính giá trị đối tượng Print: hiển thị hàng đợi thiết lập thuộc tính server Set: định nghĩa thêm thuộc tính cho đối tượng, ngược lại Unset ¾ Cấu hình cho đối tượng Server Sử dụng thuộc tính lệnh cấu hình PBS [14] như: scheduling: kích hoạt tắt lập lịch max_user_run: số cơng việc tối đa người thực lúc acl_host_enable: cho phép server sử dụng danh dách máy acl_hosts Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 106 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm acl_hosts: danh sách máy yêu cầu từ server default_queue: hàng đợi mặc định dùng ko rõ tên log_events: độ dài xâu kỹ tự ghi lại kiện xảy hệ thống mail_from: định danh người dùng mà server dùng để gửi thư queue_other_job: cho phép người dùng không sở hữu công việc xem tình trạng resources_default: tập giá trị mặc định 10 scheduler_interation: khoảng thời gian lần lập lịch 11 default_node: nút tính tốn mặc định dùng không rõ tên nút để cấu hình cho server Tồn việc cấu hình cho đối tượng Server thực lệnh shell script [17] ¾ Cấu hình đối tượng hàng đợi (queue) Trong PBS có hai kiểu hàng đợi khác [14]: hàng đợi định tuyến (routing) hàng đợi thực thi (execution) Một hàng đợi định tuyến dùng để chuyển công việc từ hàng đợi sang hàng đợi khác PBS Server Còn hàng đợi thực thi dùng để thực công việc, công việc tồn suốt q trình chạy Thơng thường PBS Server muốn hoạt động tốt phải có hai loại hàng đợi Các thuộc tính hàng đợi chia thành ba nhóm: - Nhóm thuộc tính áp dụng với hàng đợi thực thi - Nhóm thuộc tính áp dụng với hàng đợi định tuyến - Nhóm thuộc tính áp dụng với hai kiểu hàng đợi Các thuộc tính hàng đợi định tuyến queue_type_route: kiểu hàng đợi định tuyến, dùng để phân công việc max_running: số cơng việc tối đa năm hàng đợi lúc route_destination: hàng đợi mà công việc chuyển đến enable: cho phép nhận/không nhận công việc started: công việc lập lịch thực thi từ hàng đợi Các thuộc tính hàng đợi thực thi Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 107 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm queue_type_excecute: kiểu hàng đợi thực thi priority: mức độ ưu tiên hàng đợi so với hàng đợi max_running: số công việc tối đa đồng thời có hàng đợi resource_max: lượng tài nguyên lớn u cầu cho cơng việc, ngược lại resource_min resource_default: tài nguyên mặc định enable: cho phép nhận/không nhận công việc started: công việc lập lịch thực thi từ hàng đợi Việc cấu hình đối tượng hàng đợi định tuyến hàng đợi thực thi thực thông qua lệnh shell script [17] Để tạo loại hàng đợi khác cần thay đổi giá trị nhập cho thuộc tính lệnh shell script dùng để tạo hàng đợi thực thi có tên small, mức độ ưu tiên 100, dùng để thực công việc có thời gian u cầu 20 phút # Create and define queue small Qmgr: create queue small Qmgr: set queue small queue_type = Execution Qmgr: set queue small Priority = 100 Qmgr: set queue small max_running = 10 Qmgr: set queue small resources_max.cput = 00:20:00 Qmgr: set queue small resources_default.cput = 00:20:00 Qmgr: set queue small enabled = True Qmgr: set queue small started = True Tất shell script [17] dùng kiểm thử trung tâm tính tốn hiệu cao, cho kết tốt 4.3.3 Cấu hình lưới dựa GT Trước thực cấu hình cho lưới ta cần phải thực cài đặt Globus Toolkits 4.0.1 nút chủ cluster, cài đặt gói phần mềm scheduler-pbs-3.2src_bundle.tar.gz Sau số bước cấu hình cần thiết để thiết lập PBS trình quản lý công việc cho lưới Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 108 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm % gpt-postinstall lệnh thực khởi tạo cấu hình mặc định cho lưới $GLOBUS_LOCATION/setup/globus/setup-mmjfs-pbs lệnh thực cấu hình để thêm dịch vụ MasterPbsManagedJobFactoryService vào dịch vụ Globus Toolkit $GLOBUS_LOCATION/setup/globus/setup-mjs-pbs lệnh thực cấu hình để thêm dịch vụ PbsManagedJobFactoryService vào dịch vụ Globus Toolkit $GLOBUS_LOCATION/setup/globus/setup-pbs-provider lệnh thực cấu hình để thành phần RIPS (Resource Information Provider) lưới làm việc với PBS, RIPS nhận thông tin trả từ PBS_Server cung cấp cho trình quản lý cơng việc $GLOBUS_LOCATION/setup/globus/setup-globus-job-manager-pbs -cpu-per-node=1 lệnh thiết lập số lượng vi xử lý (CPU) nút đơn cluster, thông số phải phù hợp với tài nguyên tương ứng cluster $GLOBUS_LOCATION/setup/globus/setup-globus-job-manager-pbs -remote-shell=rsh lệnh thực việc chuyển đổi remote-shell mặc định thành rsh, thơng thường hệ thống tính toán song song phân cụm thường dùng rsh để truy cập tài nguyên cluster $GLOBUS_LOCATION/setup/globus/setup-globus-job-manager-pbs – validate-queues=yes lệnh thực kiểm tra hàng đợi tương ứng PBS phù với yêu cầu hay không 4.4 Kết chương Trong chương 4, luận văn giới thiệu bước cần thực việc lập kế hoạch triển khai lưới Đồng thời đưa mơ hình lưới thử nghiệm, bao gồm hướng dẫn cài đặt Đây bước áp dụng thực tế cho phần lý thuyết nghiên cứu chương Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 109 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm KẾT LUẬN VÀ KIẾN NGHỊ Kết thu Trong trình tìm hiểu tính tốn lưới thực cài đặt lưới thử nghiệm, luận văn thu kết sau: ƒ Bước đầu làm chủ công nghệ tính tốn lưới cịn nước ta ƒ Nắm bắt công cụ Globus Toolkit vận dụng vào cài đặt thực tế ƒ Triển khai hệ thống lưới thử nghiệm ƒ Biết cách kết nối cluster vào lưới, nhằm tăng sức mạnh tính tốn cho lưới Hướng phát triển Có thể nói việc phát triển mơi trường tính tốn Mạng lưới hướng nghiên cứu cơng nghệ có triển vọng lớn tương lai, có ứng dụng lớn lao để tận dụng hết nguồn lực tài nguyên đa dạng phong phú Các vấn đề mà Grid đặt cộng đồng giới giải Các thành mà Gird Computing đem lại giúp giai nhiều toán mà trước khơng thể giải kỹ thuật tốn song song Tuy nhiên có số tốn mà công nghệ Grid chưa thể thể giải Dù việc tận dụng nguồn tài nguyên rãnh rỗi để tính tóan tóan địi hỏi lượng tính tóan tài ngun cao ln mạnh để phát triển tốt mơi trường tính tốn mạng lưới Dựa kiến thức thu trình làm luận văn Trong thời gian tới, việc nghiên cứu tiếp tính tốn lưới theo hướng phát triển sau: ƒ Nghiên cứu hạ tầng truyền thơng mơi trường lưới, tìm hiểu đưa giải pháp để kết nối nút lưới với điều kiện hạ tầng truyền thông chưa tốt Việt Nam ƒ Về mặt lập trình tiến hành xây dựng mơdun riêng như: quản trị người dùng lưới, môi giới tài nguyên, lập lịch kinh tế, … Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 110 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm TÀI LIỆU THAM KHẢO Sách tiếng Anh: [1] Ian Foster, Carl Kesselman (eds) - The Grid: Blueprint for a New Computing Infrastructure, 1st edition, Morgan Kaufmann Publishers, San Francisco, USA (1 November 1998), ISBN: 1558604758 [2] Daniel Minoli - A Networking Approach to Grid Computing [3] Ahmar Abbas - Grid Computing: A Practical Guide to Technology and Applications [4] Fran Berman, Anthony J.G.Hey, Geoffrey C.Fox – Grid computing: Make the Global Infrastructure a Reality [5] Globus Books - Globus Toolkit Admin Guide [6] Globus Books - A Globus Primer 0.6 (2005) [7] IBM Red Books – Globus Toolkit 3.0 Quick Start [8] Joshy Joseph, Craig Fellenstein - Grid Computing [9] IBM Red Books – Fundamentals of Grid Computing [10] IBM Red Books – Introduction to Grid Computing with Globus Toolkit [11] The Globus Alliance - How to Build a Service using GT4 [12] Sun BluePrints Online - The Sun Infrastructure Solution for Grid Computing [13] Sun BluePrints Online - Introduction to the Cluster Grid [14] Proytable Batch System - OpenPBS Release 2.3 - Administrator [15] James Patton Jones - PBS Pro 5.0 - Administrator Guide [16] Jarek Nabryski, Jenifer M.Schopf, Jan Weglars - Grid Resource Management Sách tiếng Việt: [17] Đồ án đại học - Kết nối Globus PBS - Nguyễn Đức Mạnh khoá K45 trường ĐHBKHN Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 111 Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm Trang Web: [18] Workspace Admin Guide:http://workspace.globus.org/vm/TP1.2/doc/adminindex.html#installing-workspace-service [19] SimpleCA: http://gdp.globus.org/gt3-tutorial/multiplehtml/ch12s02.html [20] Website Globus Toolkits http://www.globus.org [21] Globus Toolkit Tutorial: http://www.globusconsortium.org/tutorial/ [22] http://www.globus.org/toolkit/docs/4.0/admin/docbock/index.html [23] http://www.globus.org/toolkit/docs/4.0/data/gridftp/admin-index.html [24] http://www.globus.org/toolkit/docs/development/4.1.0/admin/docbook/quick start.html#q-container [25] ML Levisetto - About PBS and the Grid: http://www.bo.infn.it/alice/introgrid/pbsabout/index.html [26] Quick Tutorial for PBS: http://www.princeton.edu/~letchu/compting/scientific_computing/PBS.html [27] PBS Userguide: http://www.doesciencegrid.org/public/pbs/homepage.html [28] http://www.w3.org/2002/ws/ [29] J Postel, J Reynolds, “File Transfer Protocol”, tài nguyên sẵn có web địa http://www.w3.org/Protocols/rfc959/ [30] http://doesciencegrid.org/projects/GPDK/ Nguyễn Thị Kim Tuyến – Lớp Cao học CNTT –Khoá 2004-2006 - Đại học BKHN Trang 112 ... Trang Luận văn thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm CHƯƠNG TÍNH TỐN LƯỚI 1.1 Tổng quan Tính tốn lưới 1.1.1 Tính tốn lưới gì? ¾ Định nghĩa Từ trước đến... thạc sĩ khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm CHƯƠNG TỔNG QUAN VỀ GLOBUS Globus hạ tầng cung cấp cơng cụ phần mềm để xây dựng tính toán mạng lưới ứng dụng khác... khoa học Nghiên cứu tổng quan tính tốn lưới cài đặt mơ hình thử nghiệm 1.2.2 Các thành phần theo mơ hình chức Hình 1-3 Các thành phần theo mơ hình chức Nhìn từ hình ta thấy mặt chức lưới gồm

Ngày đăng: 27/02/2021, 23:42

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan