Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 69 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
69
Dung lượng
1,36 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
Nguyễn Đức Thịnh
GIẢI HỆPHƢƠNGTRÌNHTUYẾNTÍNHKÍCH
THƢỚC LỚNTRÊNNỀNTẢNGGRID
COMPUTING
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công nghệ thông tin
Cán bộ hƣớng dẫn: Tiến sĩ. Nguyễn Minh Hằng
HÀ NỘI - 2010
Lời cảm ơn
Trước hết là lời cảm ơn sâu sắc của em đến những người đã giúp đỡ em hoàn
thành khóa luận tốt nghiệp này, một dấu mấu quan trọng trong cuộc đời và sự nghiệp của
em.
Em xin chân thành cảm ơn Khoa công nghệ thông tin trường đại học Công Nghệ -
Đại học quốc gia Hà Nội đã tạo điều kiện cho em được thực hiện khóa luận này.
Khóa luận sẽ không thể hoàn thành nếu thiếu sự chỉ bảo tận tình của TS.Nguyễn
Minh Hằng, người đã định hướng, hỗ trợ em trong suốt thời gian 3 tháng thực hiện khóa
luận. Em xin chân thành cảm ơn cô.
Một lời cảm ơn từ đáy lòng con xin được gửi đến cha mẹ, những người đã nuôi
nấng con thành người để được có ngày hôm nay.
Em xin cảm ơn các quý thầy cô đã dạy dỗ em trong suốt 4 năm học ở nhà trường,
cung cấp cho em những kiến thức quý báu để bước vào đời.
Cảm ơn các bạn của tôi đã là những người động viên tinh thần cũng như ở bên tôi
giúp đỡ tôi khi tôi gặp khó khăn.
Thời gian 3 tháng vừa qua, mặc dù đã cố gắng để hoàn thành khóa luận một cách
tốt nhất nhưng vẫn không thể tránh nổi những sai sót. Em xin kính mong nhận được sự
góp ý cũng như chỉ bảo của quý thầy cô. Xin chân thành cảm ơn
Sinh viên
Nguyễn Đức Thịnh
Mc lc
Li m u 1
Tóm tt khóa lun 3
ng quan v công ngh GridComputing 4
1.1. Lch s phát trin ca công ngh Grid 4
1.2. Khái nim 5
1.3. Các kiu tài nguyên ca Grid 6
1.3.1. Tài nguyên tính toán 6
6
n liên lc 6
1.3.4. Phn mm, ng dng 7
1.3.5. Các thit b c bit 7
1.4. Phân lai các h thng Grid 7
1.4.1. GridTính toán (Computation Grid) 7
1.4.2. Grid D liu (Data Grid) 8
1.4.3. Scavenging Grid 8
1.5. Kin trúc Grid 8
1.5.1. Bn cht Kin trúc Grid 8
1.5.2. Chi tit Kin trúc Grid tng quát 10
1.5.2.1. Tng Fabric 10
1.5.2.2. Tng Connectivity 11
1.5.2.3. Tng Resource 12
1.5.2.4. Tng Collective 13
1.5.2.5. Tng Application 13
i nhng li ích gì ? 13
1.6.1. Khai thác t lý 13
1.6.2. Kh lý song song 14
1.6.3. Chia s tài nguyên o và t chc o 14
1.6.4. S truy cn các tài nguyên khác 14
1.6.5. Cân bng tài nguyên 15
tin cy 16
17
2.1. Khái nim v Globus 17
2.2. Nguyên nhân thúc y s phát trin ca Globus 18
2.3. Kin trúc Globus 19
2.3.1. Các thành phng trc 19
2.3.1.1. Java WS Core 19
2.3.1.2. C WS Core 19
2.3.2. Các thành phn bo mt 19
n v bo mt Grid và GSI 20
2.3.3. Các thành phn qun lý d liu 25
2.3.3.1. GridFTP 25
2.3.3.2. Information services 26
2.3.3.3. Index Service 27
2.3.4. Các thành phn qun lý tài nguyên 27
2.3.4.1. Kin trúc qun lý tài nguyên ca Globus Toolkit 27
2.3.4.2. Chi tit các thành phn 29
2.3.4.2.1. GRAM 29
2.3.4.2.2. Pre-WS GRAM 32
2.3.4.2.3. WS-GRAM 34
-G2 40
3.1. MPI 40
3.2. MPICH 41
3.3. MPICH-G2 41
3.3.1. Quá trình thc thi mt ng dng 42
n khai h thn cho m
tính toán song song s dng Globus Toolkit và MPICH-G2 44
4.1. Trin khai Globus Toolkit 44
4.1.1. Chun b v phn cng và phn mm h thng 44
t Globus Toolkit 45
4.1.3. Cu hình các thành phn ca globus toolkit 47
4.1.3.1. Cu hình bo mt 47
4.1.3.2. Cu hình dich v GridFTP 50
4.1.3.3. Cu hình gatekeeper 51
4.1.3.4. Cu hình WS GRAM 52
4.2. Trin khai MPICH-G2 53
a h thng Grid 54
5.1. Gii thiu v 3 bài toán s c th nghim 54
5.1.1. Tính toán s PI 54
5.1.2. H n tính 54
5.1.3. Bài toán quy hoch tuyn tính 55
5.2. Cách thc chy 1 bài toán trên h thc xây dng bi 2 công c
Globus Toolkit và MPICH 57
5.3. Kt qu chy các t qu 59
5.3.1. Kt qu ch PI 59
5.3.2. Kt qu chi h n tính 59
5.3.3. Kt qu gii bài toán quy hoch tuyn tính 60
5.3.4. Nhn xét chung 62
Kt lun 63
Tài liu tham kho 64
1
Lời mở đầu
Trong thp niên qua, nn công ngh thông tin th gii phát trit
nhiu vào s phát trin chung ca th gii. Chúng ta có th bt gp nhng ng dng ca
công ngh thông tin khp m i s hu máy tính cá nhân, s hu
nhng chin thoi, cp nhp thông tin qua nhng trang web, kt ni vi nhau qua
nhng phn my là nhng th hin hu hàng ngày mà chúng ta trc tip s
thy và s dng nó, n sau nó là nhng nghiên cu, nhng công ngh c rt nhiu nhà
khoa hn trên th gii nghiên c phát trin ca
nn công ngh thông tin nói riêng và nn khoa hc th gii nói chung.
n máy tính, mt khái nic nhn là nhng chic máy tính
bàn nh gn hay nhng chic laptop cá nhân. Nng thit b cá nhân giúp
chúng ta gii trí, làm vic, còn vi nhng chic máy tính phi x ng d liu t khp
gii mng xuyên và liên tc bt
gp khái nim siêu máy tính (Super Computer) . Nhng siêu máy tínhtrên th gic
xây dng rt tin vu b vi x ng
h thy tn rt nhiu tin ca cho vic trin khai bng, vi
m dng kt ni nhi dùng hay t chc có chung mt m x lý
hay tn dng tài nguyên máy tính ca bt k to thành mt
h thng mnh m phc v cho vic gii các bài toán v khoa hc, i, m
vc nghiên cu m Nói mt cách tng quát nht
Grid là mt loi h thng phân tán, b trí song song, cho phép linh hot chia s, tuyn la
và tp hp các nguc lp và ri rác v a lý, tùy theo kh n có,
công sut, hong, chi phí và yêu cu v chng dch v ci s dng. Grid
Computing có rt nhim mà có th áp dng cho vic nghiên cng
m có th áp dng cho doanh nghip.
Trên th ging v GridComputing c hình thành và nghiên cu t rt
lâu c s bùng n lc các t chp
n trên th gii nghiên cu và trin khai. Ti Vit Nam, công vic nghiên cu Grid
c trin khai t khá lâu và g tài cc
cu, phát trin h th h tr gii quyt các bài toán có khng tính
2
toán l do PGS.TS. Vũ Đức Thi làm chủ nhiệm c mt s
thành tu nhnh.
Nhn thy Gridcomputing là mng nghiên cu c quan tâm ti
Vit Nam c gii và nhng li ích to ln mà nó mang li. Em quynh chn
i gii h n tính c ln trên nn t
vi mu Công ngh Grid là gì ,nhng khái nim liên quan,
thí nghim to mt h thng Grid nh bng gói phn mm GLOBUS TOOLKIT cùng
MPICH-G2 kim nghim hi ca h thng grid khi chy bài toán Gii h
n tính c ln.
3
Tóm tắt khóa luận
1. Thông tin chung về khóa luận
tài : Giải hệ phương trìnhtuyếntính trên nềntảngGridComputing
Ging dn : TS.Nguyễn Minh Hằng
Sinh viên thc hin : Nguyễn Đức Thịnh
2. Tóm tắt nội dung khóa luận
Khóa lun thc hin nghiên cu tìm hiu các v chung ca công ngh Grid v
mt khái nim, kin trúc ca mt h thng Grid và nhng ích li ca Grid mang li. Cung
cp mt cái nhìn tng quan v Grid.
Tìm hiu mô hình hong ca gói phn mm Globus Toolkit, mt gói phn mm
giúp xây dng mt h thng Grid, các v khi thc hin trin khai to dng mt h
thng Grid vi Globus Toolkit.
Tìm hiu v MPICH, MPICH-G2, nguyên tc hong ca MPICH kt hp vi
to dng h thng Grid phc v vic tính toán song song s dng ngôn
ng C và MPI.
Th nghim bài toán gii h n tính theo thut toán song song trên
mt h th xem cách thc hom v kh t hp x lý
gia các máy tính khác nhau.
3. Các công cụ đƣợc sử dụng triển khai và thử nghiệm
Globus Toolkit 4.2.1
Centos 5.4
MPICH-1.2.7
4
Chương 1 : Tổng quan về công nghệ GridComputing
1.1. Lịch sử phát triển của công nghệ Grid
Trong nh c nghe nhi n công ngh Grid và
nhm ca nó. Vy Grid xut hin t khi nào, t bao gi ? Trong quá kh, nhng
t hin, vi nhng tên gi khác nhau và cách
tip cn khác nhau.
Ví d t hin t nh-70
ca th k c chia s t các máy mainframe.
i phát trin h u hành Multics (tin thân ca h u hành
cn vic s dt tin ích, mm
rt gn vm v Grid hit h thng cung cc tính toán
thng cung cc hic s dng trong cuc sng hàng
i dùng khi mun s d x lý công vic, ch cn cm
thit b vào h thng cung cp, s dng và tr tin gim thit b n vào
n.
ng v n gc ca Grid chính thc
t ng i, dùng
mô t các d án kt ni các trung tâm siêu máy tính ca M nhm kt hp sc mnh
x lý ca nhiu siêu máy tính li vi nhau.
án siêu tính toán quan trng, ng ln các công
ngh nn tng trong các d án Grid ngày nay là FAFNER (Factoring via Network-
Enabled Recursion) và I-i.
Khái ni i phòng thí nghim Argonne National Laboratory vào tháng
n sách "The Grid: Blueprint for a New Computing
Infrastructure" vit bi tin s Ian Foster (Argonne National Laboratory) và Carl
ng tham gia d
án I-i tham gia d án Globus Toolkit, mt d án nn tng
ca công ngh Grid và Metacomputing.
5
T n nay, vic phát trin công ngh Grid tr nên rng vi s tham gia
nghiên ca nhiu t chc, tp thông tin, nhiu qu
c nhng thành tu. Có th nói, vic phát trin và xây dng h thng
Grid là s k tha và phát tring, các công ngh hin hành m
phát trin không ngng c h tng, phn cng máy tính, m
thng Grid ngày nay thc hic nhi
1.2. Khái niệm
M Grid khá hoàn chi tin s
“Grid là một loại hệ thống song song, phân tán cho phép chia sẻ, lựa chọn, kết hợp các
tài nguyên phân tán theo địa lý, thuộc nhiều tổ chức khác nhau dựa trêntính sẵn sàng,
khả năng, chi phí của chúng và yêu cầu về chất lượng dịch vụ (QoS) của người dùng để
giải quyết các bài toán, ứng dụng có quy mô lớn trong khoa học, kỹ thuật và thương mại.
Từ đó hình thành nên các “tổ chức ảo” (Virtual Organization (VO)), các liên minh tạm
thời giữa các tổ chức và tập đoàn, liên kết với nhau để chia sẻ tài nguyên và/hoặc kỹ năng
nhằm đáp ứng tốt hơn các cơ hội kinh doanh hoặc các dự án có nhu cầu lớn về tính toán
và dữ liệu, toàn bộ việc liên minh này dựa trên các mạng máy tính”
Mt h thng Grid có nhsau:
Có s kt hp, chia s c qun lý tp trung Grid tích hp
và phi hi dùng thuc nhiu vùng qun lý khác nhau, nhiu
khác nhau trong mt t chc, hay nhiu t chc khác nhau. Công ngh Grid
tp trung gii quyt các v v bo mt, chính sách qun tr, chi phí, thành
y sinh trong quá trình chia s và s dng tài nguyên.
S dng các giao din và giao thc chun, mang tính mc xây
dng trên các giao thc và giao din t gii quyt các v
bng thi dùng, phân quyn, tìm kim và truy xut tài nguyên.
ng yêu cu cao v chng dch v. Grid cho phép s dng phi hp các
cung cp nhiu loi dch v vi các mc chng khác nhau, liên
n ví d ng, hiu sut, tính sn sàng, bo mt, cho phép
kt hp nhiu ki ng nhu cu phc tp ci dùng. Mc
tiêu là phi phi h kh a h thng sau khi kt hp phi ln
n tng kh a t cu thành nên Grid.
[...]... tế, các giải pháp Grid thường là sự kết hợp 2 hay nhiều loại khác nhau 1.4.1 GridTính toán (Computation Grid) Loại Grid này tập trung chủ yếu vào việc sử dụng năng lực tính toán Ở dạng Grid này, phần lớn các node là các máy tính hay các nhóm máy tính( cluster) có năng lực xử lý, tính toán rất lớn Hình thức thực hiện là chia tác vụ tính toán lớn thành nhiều công việc nhỏ thực thi song song trên các... nguyên trênGrid sao cho dưới mắt của người dùng, các tài nguyên Grid là một khối thống nhất 1.4 Phân lọai các hệ thống Grid Công nghệ GridComputing có thể được sử dụng theo nhiều cách khác nhau để giải quyết các loại yêu cầu ứng dụng Thông thường Grid được phân loại bởi kiểu của ứng dụng cần giải quyết Có 3 loại Grid như trình bày dưới đây Tuy nhiên không có ranh giới phân biệt rõ ràng giữa các loại Grid. .. của Grid Việc phân tán các tác vụ tính toán trong Grid sẽ làm giảm rất đáng kể toàn bộ thời gian xử lý và tăng khả năng tận dụng hệ thống Thông thường một hệ thống chính sẽ chia khối dữ liệu cần xử lý thành các phần nhỏ, sau 7 đó phân phối đến các node trênGrid Mỗi node sẽ thực hiện xử lý dữ liệuvà trả kết quả về hệ thống chính để hệ này tổng hợp và trình diễn kết quả toàn cục cho người dùng 1.4.2 Grid. .. ~/.globus/ Grid- cert-request Grid- cert-info Diễn giải Lấy thông tin về chứng chỉ Ví dụ : -subject - $ Grid- cert-info –subject enddate -issuer -help “/O =Grid/ O=GridTest/OU=test.domain.com /CN=GreenStar -hours Thực hiện khởi tạo proxy và đăng nhập vào -bits Grid- proxy-init -all -startdate Grid -help Grid- proxydestroy Logout khỏi Grid, thực hiện hủy proxy cục bộ Lưu ý, các proxy ở xa không bị huỷ Grid- proxy-info... này Các Grid Dữ liệu có thể được sử dụng trong lĩnh vực khai thác dữ liệu(data mining) hoặc các hệ thống thương mại thông minh Trong trường hợp này, không chỉ có hệ thống file hay các cơ sở dữ liệu mà toàn bộ dữ liệu của tổ chức cần tập hợp lại Ở đây có thể phải kết hợp giữa Grid Dữ liệu và GridTính toán 1.4.3 Scavenging Grid Một Scavenging Grid thường được dùng với một lượng lớn các máy tính để bàn... ,giải quyết những bài toán lớn, có tính độc lập của các thành phần cao 1.6.3 Chia sẽ tài nguyên ảo và tổ chức ảo Gridcomputing cho phép tạo ra một môi trường cộng tác rộng lớn ,đồng nhất Mỗi môi trường đó là một tổ chức ảo Gridcomputing thậm chí còn cho phép kết hợp các tổ chức ảo, không đồng nhất với nhau để cộng tác với nhau Các tổ chức ảo này chia sẽ tài nguyên với nhau như là một mạng lưới lớn. .. người dùng cục bộ Điều này cho phép phân cho các người dùng Grid khác nhau các quyền khác nhau trên tài nguyên thông qua các người dùng cục bộ được ánh xạ Để từ chối truy cập đối với một DN, chỉ cần loại bỏ DN đó ra khỏi Grid map file Trong Globus Toolkit, trên hệ thống Linux, Grid map file được lưu trong file : /etc /grid- security /grid- mapfile Grid- mapfile là một file text, mỗi dòng là một ánh xạ 23 giữa... nguyên của Grid 1.3.1 Tài nguyên tính toán Đây là tài nguyên phổ biến nhất, là các chu kỳ tính toán (computing cycles) được cung cấp bởi bộ vi xử lý của các thiết bị trong Grid Các bộ vi xử lý không cần phải cùng loại mà có thể có tốc độ, kiến trúc, chạy phần mềm khác nhau Có 3 cách để khai thác tài nguyên tính toán của Grid: 1 Cách đơn giản nhất là chạy các ứng dụng hiện có trên một node của Grid thay... dữ liệu 2.3.3.1 GridFTP Giao thức GridFTP đưa ra một cơ chế sử dụng cho mục đích truyền sữ liệu an toàn, tin cậy, đạt hiệu suất cao Grid được sử dụng rộng rãi trong các nhu cầu truyền tải 25 liệu với khối lượng lớn dữ liệu GridFTP được xây dựng trênnềntảng của giao thức FTP và đưa ra 2 kênh giao tiếp: một kênh điều khiển và 1 cây dữ liệu Các lệnh và những dòng phản hồi được di chuyển trên kênh điều... Resource) - 1.6 Gridcomputing đem lại những lợi ích gì ? 1.6.1 Khai thác tối đa tài nguyên xử lý Lợi ích đầu tiên cần nói đến đó là khả năng chạy một chương trìnhtrên nhiều máy tính khác nhau Hay nói một cách khác ,đó là xử lý song song Trong một mạng lưới gồm nhiều máy tính ,rất ít khi các máy tính đều được sử dụng một cách tối đa những tài nguyên của mình ,thường thì với công việc văn phòng ,tính toán . CÔNG NGHỆ
Nguyễn Đức Thịnh
GIẢI HỆ PHƢƠNG TRÌNH TUYẾN TÍNH KÍCH
THƢỚC LỚN TRÊN NỀN TẢNG GRID
COMPUTING
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH. luận
1. Thông tin chung về khóa luận
tài : Giải hệ phương trình tuyến tính trên nền tảng Grid Computing
Ging dn : TS.Nguyễn Minh Hằng