Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 104 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
104
Dung lượng
767,58 KB
Nội dung
ĐẠI HỌC QUỐC GIA TP.HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA TPHCM -oOo - NGUYỄN QUANG HÙNG Chuyên ngành: Mã số ngành: CÔNG NGHỆ THÔNG TIN 01.02.10 LUẬN VĂN THẠC SỸ TP.HCM, Tháng 12 Năm 2004 CÔNG TRÌNH ĐƯC HOÀN THÀNH TẠI: TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM ĐẠI HỌC QUỐC GIA TP.HCM Cán hướng dẫn khoa học: Tiến sỹ NGUYỄN THANH SƠN Cán chấm nhận xét 1: Tiến sỹ Cán chấm nhận xét 2: Tiến sỹ Luận văn thạc sỹ bảo vệ tại: HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN THẠC SỸ TRƯỜNG ĐẠI HỌC BÁCH KHOA, ngày tháng năm 200 NGHIÊN CỨU VÀ PHÁT TRIỂN DỊCH VỤ LƯỚI – ỨNG DỤNG CHO BÀI TOÁN SO TRÙNG CÁC ĐỒ THỊ TRONG TÌM KIẾM BẰNG NGỮ NGHĨA Nguyễn Quang Hùng Luận văn thạc sỹ Công nghệ thông tin Trường Đại học Bách Khoa TP.HCM, Việt Nam TÓM TẮT Công nghệ Lưới (the Grid), hay tính toán lưới (Grid computing), hạ tầng kỹ thuật tính toán tương lai nhằm giải vấn đề hợp tác chia xẻ tài nguyên tổ chức ảo (Virtual Organization) Các tổ chức ảo hình thành từ viện nghiên cứu, doanh nghiệp, hay quốc gia qua mối quan hệ chia xẻ tài nguyên Lưới Tài nguyên chia xẻ không đơn chia xẻ tập tin mà chúng hệ thống tính toán mạnh (siêu máy tính), hệ thống lưu trữ (SAN) cảm biến thí nghiệm Tuy nhiên, việc xây dựng sử dụng công nghệ để phát triển ứng dụng vấn đề cần nghiên cứu Nhằm đón đầu xu hướng phát triển kiến trúc Lưới theo hướng dịch vụ lưới (grid service), luận văn nghiên cứu Lưới để qua đề xuất kiến trúc hướng dịch vụ lưới Kiến trúc áp dụng cho nhiều ứng dụng, có ứng dụng áp dụng giải thuật so trùng đồ thị tìm kiếm ngữ nghóa Môi trường Lưới sử dụng luận văn dựa hệ thống (tên BKGRID) có cấu hình gồm: i) nhiều nút lưới (grid-node) nối mạng LAN/WAN; ii) Globus Toolkit chọn làm Middleware cho nút lưới Ngoài ra, luận văn khảo sát mô hình tính toán Vitual Hosting Environment Master/Worker (VHE MW) cho ứng dụng Lưới, thiết kế giải thuật phân bố yêu cầu client gởi đến cho nút lưới song song hóa giải thuật so trùng đồ thị[4] Kết cuối toàn hệ thống khuyến khích việc triển khai công nghệ Lưới Globus Toolkit làm tảng cho hệ thống tính toán chia xẻ tài nguyên tương lai i RESEARCH AND DEVELOP GRID SERVICE - GRAPHS MATCHING ALGORITHM FOR SEMANTIC SEARCH APPLICATION By Nguyễn Quang Hùng Thesis for Master Degree in Information Technology Ho Chi Minh city University of Technology, Viet Nam ABSTRACT The Grid (or called Grid computing) is a new computing infrastructure doing coordinated resource sharing and problem solving in dynamic, multi-institutional virtual organizations A virtual organization (VO) includes many individuals or institutes coordinate sharing resources The sharing resource maybe Supercluster, SuperComputer, data storage system, data sources… However, developing a Grid-enabled application is still a research problem For getting ahead of Grid development base on grid services, this thesis will research on the Grid and propose a grid service-oriented architecture We applied the grid service-oriented architecture to develop some real grid services for semantic search application GraphMatching grid service is a grid service that implemented graph matching algorithm In this system grid fabric is a network of PCs and Globus Tookit version 3.x is Middleware The service-oriented system uses the VHE Master/Worker computing model in which a service is started at a suitable grid-node Some load balancing algorithms are developed to share matching graphs requests between grid-nodes in a VO In additional, the parallel algorithm of matching graphs based on multi-thread is presented ii Lời cảm ơn “Uống nước nhớ nguồn” Tục ngữ Việt Nam Em xin chân thành bày tỏ lòng kính trọng gởi lời cảm ơn sâu sắc đến Thầy TS Nguyễn Thanh Sơn trực tiếp hướng dẫn em thực luận văn này! Thầy tận tình dẫn em bước nghiên cứu quan trọng cho Luận văn nghiên cứu Em xin cám ơn sâu sắc Thầy TS Thoại Nam dành nhiều thời gian quý báo giúp em thực luận văn này! Thầy tậm tâm dạy cho em nhiều kinh nghiệm quý báo thực luận văn, dạy điều em thiếu sót Xin chân thành cám ơn nhà trường tạo điều kiện, phương tiện làm việc tốt ! Xin cảm ơn toàn thể nhà nghiên cứu tham gia cộng đồng GridForum (http://www.ggf.org), tác giả dự án Globus Toolkit trường Đại học Chicago (http://www.globus.org) tất tác giả phần tài liệu tham khảo công bố ý tưởng mã nguồn mở Con xin cảm ơn Cha mẹ khổ cực nuôi dưỡng thành tài! iii Lời Cam Đoan Tôi xin cam đoan luận văn công trình thân nghiên cứu làm việc vất vả để hoàn thành, không chép lại luận văn Tôi xin chịu hoàn toàn hình thức kỷ luật vi phạm chép luận văn người khác iv MỤC LỤC Tóm tắt Abstract Lời cảm ơn Lời cam đoan Mục lục v Danh mục ký hiệu, chữ viết tắt ix Danh mục bảng x Danh mục hình xi Thuật ngữ Anh – Việt đối chiếu xii CHƯƠNG GIỚI THIỆU 1.1 ĐỘNG LỰC NGHIÊN CỨU 1.1.1 Động lực nghiên cứu từ công nghệ Lưới 1.1.2 Động lực nghiên cứu từ tìm kiếm ngữ nghóa 1.2 GIỚI THIỆU VỀ CÁC KHÁI NIỆM TRONG CÔNG NGHỆ LƯỚI 1.2.1 Phân loại tính toán lưới 1.2.2 Khái niệm dịch vụ lưới (grid service) 1.2.3 Các dự án Lưới giới 1.3 MỤC TIÊU CỦA LUẬN VĂN 1.4 TỔNG QUAN CỦA LUẬN VAÊN 1.4.1 Hệ thống tính toán lưới BK-GRID 1.4.2 Bài toán ứng dụng giải thuật so trùng đồ thị tìm kiếm ngữ nghóa 1.4.3 Kiến trúc hướng dịch vụ lưới cho ứng dụng so trùng đồ thị tìm kiếm ngữ nghóa 11 1.5 PHƯƠNG PHÁP LUẬN CỦA LUẬN VĂN 12 1.5.1 Nội dung nghiên cứu 12 1.5.2 Phương hướng giải vấn ñeà 12 1.6 NHỮNG ĐÓNG GÓP CHÍNH .13 1.7 CẤU TRÚC LUẬN VAÊN .15 CHƯƠNG 16 CÁC NGHIÊN CỨU LIÊN QUAN 16 v 2.1 GIỚI THIỆU VỀ TÍNH TOÁN LƯỚI 16 2.1.1 Tính triết lý Lưới[2] 16 2.1.2 Open Grid Service Architecture - OGSA [8] 17 2.1.3 Open Grid Service Infrastructure – OGSI[12] 18 2.1.4 Dịch vụ lưới (Grid Service) [2][8][12] 19 2.1.5 Grid Service Data Element – SDE [12] 20 2.1.6 Grid Service Handle, Grid Service Reference[12] 21 2.1.7 Globus Toolkit [24] 21 2.1.8 Moâ hình lập trình phía server 24 2.1.9 Mô hình lập trình phía client 26 2.2 SỬ DỤNG OGSA ĐỂ TẠO CÁC TỔ CHỨC ẢO KHÁC NHAU[8] 26 CHƯƠNG 3: 30 KIẾN TRÚC HƯỚNG DỊCH VỤ CỦA ỨNG DỤNG ÁP DỤNG GIẢI THUẬT SO TRÙNG CÁC ĐỒ THỊ TRONG TÌM KIẾM BẰNG NGỮ NGHĨA 30 3.1 GIỚI THIỆU 30 3.2 CÁC YÊU CẦU ĐỐI VỚI BK-GRID 31 3.2.1 Yêu cầu kiến trúc phần mềm hướng dịch vụ lưới 31 3.2.2 Yêu cầu cân tải nút lưới 31 3.2.3 Yêu cầu song song hóa toán so trùng đồ thị tìm kiếm ngữ nghóa 32 3.3 KIẾN TRÚC HƯỚNG DỊCH VỤ LƯỚI CỦA ỨNG DỤNG SO TRÙNG CÁC ĐỒ THỊ TRONG TÌM KIẾM BẰNG NGỮ NGHĨA TRÊN BK-GRID 33 3.3.1 Giới thiệu 33 3.3.2 Thieát Keá 34 3.4 KẾT LUẬN 37 CHƯƠNG 38 MÔ HÌNH VHE MASTER/WORKERS VÀ CÁC GIẢI THUẬT CÂN BẰNG TẢI TRÊN CÁC NÚT LƯỚI 38 4.1 GIỚI THIỆU 38 4.2 MÔ HÌNH VHE MASTER/WORKERS .39 4.2.1 Giới thiệu 39 4.2.2 Mô hình 39 4.3 GIẢI THUẬT PHÂN BỐ TẢI TÍNH TOÁN LÊN CÁC NÚT LƯỚI 41 vi 4.3.1 Phương thức lấy thông tin hệ thống nút lưới 42 4.3.2 Cân tải chiến lược lựa chọn nút lưới tốt 45 4.3.3 Cân tải chiến lược round-robin 48 4.3.4 Cân tải chiến lược lựa chọn nút lưới có tài nguyên thích hợp 48 4.4 KẾT LUAÄN 49 CHƯƠNG 5: 50 HIỆN THỰC SONG SONG CHO GIẢI THUẬT SO TRÙNG CÁC ĐỒ THỊ 50 5.1 GIAÛI THUẬT SO TRÙNG CÁC ĐỒ THỊ TRONG TÌM KIẾM BẰNG NGỮ NGHĨA[4] 50 5.2 SONG SONG HÓA GIẢI THUẬT SO TRÙNG ĐỒ THỊ TRÊN TẬP HP CÁC ĐỒ THỊ MẪU 52 CHƯƠNG 55 HIỆN THỰC CÁC DỊCH VỤ LƯỚI CHO ỨNG DỤNG SO TRÙNG CÁC ĐỒ THỊ TRONG TÌM KIẾM BẰNG NGỮ NGHĨA 55 6.1 GIỚI THIEÄU 55 6.2 HIỆN THỰC DỊCH VỤ VOGRAPHMATCHING 56 6.2.1 Tác vụ VOGraphMatching::MatchGraph() 58 6.2.2 Cấu hình dịch vụ VOGraphMatching 60 6.3 HIỆN THỰC DỊCH VỤ GRAPHMATCHING 62 6.3.1 Tác vụ Graphrepository::Matchgraph() 62 6.3.2 Laáy Dữ Liệu Từ Dịch Vụ GraphRepository – LoadGraphResource() 65 6.3.3 Song song hoá giải thuật so trùng đồ thị – ParallelMatching() 66 6.3.4 Cấu Hình Dịch Vụ GraphMatching 67 6.4 HIỆN THỰC DỊCH VỤ GRAPHREPOSITORY .68 6.4.1 Phương Thức GraphRepository::getListResourceGraph 68 6.4.2 Cấu Hình Dịch Vụ GraphRepository 70 6.5 KẾT LUẬN 70 CHƯƠNG 71 KẾT QUẢ THỬ NGHIỆM 71 vii CHƯƠNG 8: 84 KẾT LUẬN VÀ KIẾN NGHỊ 84 TÀI LIỆU THAM KHẢO 89 viii Trang 76 similarity="0.6032961503504247" url="www.viettien.com.vn/t-shirt"/> Trong taøi liệu XML mô tả kết nút gốc tài liệu XML thẻ Trong thẻ có nhiều thẻ Ở thẻ có thuộc tính sau: i) Thuộc tính “name”: tên điểm nhập đồ thị mẫu (hay có nghóa đối tượng sản phẩm mà đồ thị mẫu biểu diễn) ii) Thuộc tính “similarity”: giá trị độ giống đồ thị mẫu đồ thị truy vấn sau qua giải thuật so trùng (chương 5) iii) Thuộc tính “url”: URL đến nguồn thông tin mà đồ thị mẫu biểu diễn Ví dụ: www.viettien.com.vn/shirt đến sản phẩm áo sơ mi Viettien Việc cài đặt hệ thống BK-GRID thử nghiệm trải qua nhiều giai đoạn nâng cấp để số lượng máy tham gia vào ngày tăng Bên biểu đồ minh họa khả xử lý yêu cầu so trùng đồ thị từ client gởi đến hệ thống Trang 77 7.1.2 Tiêu chí thử nghiệm chương trình giả lập số lượng client gởi yêu cầu so trùng Tiêu chí đánh giá thử nghiệm: xem xét thời gian xử lý request hệ thống số lượng client gởi yêu cầu đến đồng thời lúc tăng theo hàm bậc thang, hàm f(x) = a * round( x ) Mỗi client gởi yêu cầu so trùng đến thực thể dịch vụ VOGraphMatching Thời gian đáp ứng đo phía client, tính từ client bắt đầu gọi tác vụ VOGraphMatching::matchGraph() đến tác vụ thực thi xong gởi trả kết (bao gồm thời gian client gọi class stub nó) Hàm giả lập số lượng client thử nghiệm có biểu thức: • f(x) : số lượng client gởi yêu cầu đến giây • Hệ số a = fmax / t1 = 50 / 300 = 0,1666667 • Giải thuật sau minh họa cho thay đổi giá trị x: for (long x = tstart; x < t1; x++ ) { count = Math.round( a * x - 0.5); // How many client perseconds totalThreads += count; for (int i = 0; i < count; i++) { Task task = new Task( logger ); task.strVOFacHandle = strVOFacHandle; task.strXmlQueryGraph = strXmlQueryGraph; listThreads.add( task ); task.setDaemon( true ); task.start(); Thread.yield(); Thread.sleep(10); // sleep 10 mili-seconds } Thread.yield(); Thread.sleep( 2000 - 10*count ); // Main thread sleep 2000 miliseconds traceCurrentThread( x, listThreads ); }// end for giai doan Mỗi đối tượng Task giải thuật java object thực giao diện java.lang.Runnable Đối tượng Task có nhiệm vụ gọi tác vụ Trang 78 VOGraphMatching::matchGraph() với thông số đầu vào tài liệu XML mô tả đồ thị truy vấn (có dạng giống phần 7.1 trên) 7.1.3 Thử nghiệm 1: trường hợp tải ban đầu nút lưới cân tương đối Các máy tính sử dụng thử nghiệm có cấu hình phần cứng sau: tất máy tính có CPU Pentium IV tốc độ 1,5 GHz, ổ cứng 20 Gbytes, nhớ RAM 256 Mbytes, máy nối mạng 100 Mbits/s thiết bị Intel switch Các máy tính có cài đặt phần mềm sau: • Tất máy dùng hệ điều hành RedHat Linux Enterprise version với kernel 2.4 • Một máy triển khai môi trường Globus Toolkit 3.2 cài đặt dịch vụ lưới VOGraphMatching • Bốn máy triển khai môi trường Globus Toolkit 3.2 cài đặt dịch vụ lưới GraphMatching GraphRepository lên máy Trong trình thử nghiệm, process hệ điều hành gần toàn tài nguyên hệ thống dành hết cho ứng dụng so trùng Trên đồ thị (hình 7-3a, 7-3b bên dưới), đồ thị cho biết thay đổi thời gian đáp ứng hệ thống yêu cầu so trùng Trục tung bên trái thời gian xử lý yêu cầu so trùng, đơn vị tính theo mili-giây Trục tung bên phải cho biết số lượng yêu cầu gởi đến đồng thời giây Trục hoành đồng hồ thời gian hệ thống Mỗi biểu đồ biểu diễn thay đổi thời gian xử lý yêu cầu so trùng từ phía client theo số lượng yêu cầu đồng thời tăng dần Hai biểu đồ xuất nhằm so sánh độ tốt thời gian hai chiến lược cân tải Trang 79 Kết thử nghiệm cho biểu đồ thời gian xử lý yêu cầu client (hình 7-3a hình 7-3b) bên Kết cho thấy điều kiện lý tưởng, nút lưới có tải ban đầu cân tương đối, chiến lược xoay vòng tốt Vì chiến lược xoay vòng đảm bảo phân phối đồng nhanh chóng cho tất nút lưới (không thời gian tìm kiếm nút lưới tốt nhất) Còn với chiến lược tìm “Best Grid-node”, thông tin nút lưới tốt cập nhật tức (có độ trể, ví dụ 10 giây), kết có 50 lần gọi gởi đến khoảng thời gian nhỏ (ví dụ 10 giây) 50 lần gọi chuyển cho nút lưới tốt đó, điều làm cho nút lưới tốt bị tải (heavy load) tạm thời Kết luận: với trường hợp tải ban đầu nút lưới cân tương đối việc cân tải chiến lược xoay vòng tốt chiến lược tìm nút lưới tốt 7.1.4 Thử nghiệm 2: tải nút lưới khác Các máy tính sử dụng thử nghiệm có cấu hình phần cứng sau: tất máy tính có CPU Pentium IV tốc độ 1,5 GHz, ổ cứng 20 Gbytes, nhớ RAM 256 Mbytes, máy nối mạng 100 Mbps switch Intel Còn mặt phần mềm có cấu hình triển khai dịch vụ sau: • Tất máy dùng hệ điều hành RedHat Linux Enterprise version với kernel 2.4 • Một máy triển khai môi trường Globus Toolkit 3.2 cài đặt dịch vụ lưới VOGraphMatching • Bốn máy triển khai môi trường Globus Toolkit 3.2 cài đặt dịch vụ lưới GraphMatching GraphRepository lên máy • Một máy cài sở liệu Xindice XML DB Trang 80 • Trong trình thử nghiệm, hệ thống có nhiều người khác dùng chạy nhiều ứng dụng khác không kiểm soát Trên đồ thị trục tung bên trái thời gian xử lý yêu cầu so trùng, đơn vị tính theo mili-giây Trục tung bên phải cho biết số lượng yêu cầu gởi đến đồng thời giây Trục hoành đồng hồ thời gian hệ thống Kết thử nghiệm cho biểu đồ thời gian xử lý yêu cầu client (hình 7-4a 7-4b) bên Mỗi biểu đồ biểu diễn thay đổi thời gian xử lý yêu cầu so trùng từ phía client theo số lượng yêu cầu đồng thời tăng dần Hai biểu đồ xuất nhằm so sánh độ tốt thời gian hai chiến lược cân tải Trong trường hợp hệ thống chạy thực, giống tình trạng tải ban đầu nút lưới nên chiến lược lựa chọn nút lưới tốt tốt chiến lược xoay vòng Hạn chế chiến lược xoay vòng nút lưới tải (trước) việc giao thêm việc làm tổn hại hiệu suất đầu toàn hệ thống Điều phù hợp với thực tế hình 7-4b cho trường hợp cân tải chiến lược xoay vòng bị trì hoãn lâu, thời gian xử lý yêu cầu từ client lớn 50000 msec số yêu cầu gởi đến lớn 15 Còn với chiến lược tìm nút lưới tốt có điểm phạt yêu cầu từ client hệ thống BK-GRID chạy trơn tru suốt trình thử nghiệm Kết luận: trường hợp thử nghiệm với tải nút lưới tùy ý, chiến lược tìm nút lưới tốt với điểm phạt hiệu suất yêu cầu từ client tốt chiến lược xoay vòng Trang 81 Hình 7-3a: Thử nghiệm 1: cân tải chiến lược xoay vòng Hình 7-3b: Thử nghiệm 1: cân tải chiến lược tìm nút lưới tốt Trang 82 Hình 7-4a:Thử nghiệm 2: cân tải chiến lược tìm nút lưới tốt có điểm phạt hiệu suất yêu cầu client gởi đến Hình 7-4b: Thử nghiệm 2: cân tải chiến lược xoay vòng Trang 83 7.2 KẾT LUẬN Qua hai lần thử nghiệm với hai chiến lược cân tải cho thấy: i) trường hợp lý tưởng (các máy phục vụ cho ứng dụng so trùng đồ thị tìm kiếm ngữ nghóa) chiến lược round-robin tốt chiến lược lựa chọn nút lưới tốt nhất; ii) chuyển hệ thống sang môi trường có nhiều người dùng chạy ứng dụng khác ngẫu nhiên chiến lược cân tải tốt tốt hẳn chiến lược round-robin Đồng thời chiến lược round-robin rơi vào tình trạng treo lâu Nghóa thời gian xử lý yêu cầu toàn hệ thống (đo phía client) lớn, vượt qua 50000 mili-giây số lượng yêu cầu đến lớn 10 yêu cầu giây Như thử nghiệm 3, chiến lược round-robin làm việc cân tải tốt Nguyên nhân nút lưới tải mà phân việc đến rõ ràng tải hơn, hiệu suất hệ thống giảm trước Trang 84 Chương 8: KẾT LUẬN VÀ KIẾN NGHỊ 8.1 KẾT LUẬN Cả hai vấn đề công nghệ Grid Computing toán tìm kiếm thông tin theo ngữ nghóa (Semantic Search) thách thức rộng lớn Hiện có nhiều tổ chức nghiên cứu theo hướng Knowledge Grid, Genetic Grid… Với sức cá nhân luận văn tạm dừng mức độ khiêm tốn xây dựng thành sau: Các Kết Quả Đạt Được: ¾ Một hệ thống BK-GRID tương thích chuẩn OGSA: Luận văn chọn môi trường Globus Toolkit để bám sát chuẩn OGSA/OGSI Luận văn phần chứng minh dễ dàng xây dựng ứng dụng tảng OGSA Với kiến trúc tương thích OGSA, sau dễ dàng nâng cấp portable ¾ Xây dựng ứng dụng so trùng đồ thị dạng kiến trúc hướng dịch vụ: Luận văn xây dựng thêm dịch vụ khác nhằm phục vụ cho toán khác toán so trùng đồ thị Trang 85 Bước đầu chạy thực nghiệm cho thấy hệ thống có kết tốt BK-GRID gồm tám nút lưới (tương ứng với tám máy tính PC thường - cấu phần thực nghiệm) ¾ Xây dựng hoàn chỉnh dịch vụ so trùng đồ thị (GraphMatching grid service) cho toán tìm kiếm theo ngữ nghóa: Phân bố dịch vụ GraphMatching nhiều nút lưới có kiến trúc khác (máy đơn hay Supercluster) Công việc tìm kiếm thông tin theo ngữ nghóa tăng tốc cách song song giải thuật so trùng đồ thị truy vấn mô tả thông tin cần tìm với tập đồ thị mẫu (tài nguyên) Sự song song hoá trình tìm kiếm phát triển mô hình Master-Workers, giải pháp lập trình Multithread Tăng khả đáp ứng nhiều client đồng thời truy cập dịch vụ hệ thống giải pháp: phân phối công việc tìm kiếm nhiều nút lưới dựa thông tin hệ thống nút lưới đích (hệ thống thực việc so trùng đồ thị) Thông tin hệ thống (processor, memory, file system) nút lưới sẳn sàng giải pháp có daemon định kỳ truy vấn cập nhật thông tin hệ thống nút lưới Phân bố liệu (các đồ thị mẫu) nhiều nút lưới khác nhằm tăng độ tin cậy giảm thắt nút mặt liệu Việc mở rộng số lượng hệ thống nút lưới nhằm tăng thêm khả đáp ứng yêu cầu từ phía grid client dịch vụ so trùng dễ dàng Do cần nhìn thấy dịch vụ VOGraphMatching tổng quát, bên hệ thống Trang 86 suốt với grid client dù có nhiều dịch vụ GraphMatching cài đặt nhiều nút lưới ¾ BK-GRID sẳn sàng cho nhiều ứng dụng mới: với dịch vụ mà luận văn xây dựng xem thành phần (component) tái sử dụng cho việc phát triển toán ứng dụng khác Grid môi trường Globus Toolkit Cụ thể: dịch vụ cung cấp thông tin tài nguyên hệ thống (tải rảnh processor, dung lượng trống nhớ, file system… làm công việc phân phối tải luận văn làm nhằm tăng khả đáp ứng số grid client truy cập đồng thời ¾ Ứng dụng tốt kiến trúc phần mềm 3-Lớp: giúp việc mở rộng lên nhiều nút lưới hoàn toàn dễ dàng cần cài đặt dịch vụ GraphMatching cấu hình dịch vụ GraphRepository (cho biết liệu mà dịch vụ GraphMatching cần) Những Hạn Chế Của Luận Văn: Luận văn chưa tự động hoá phần thu gom liệu để tạo thành đồ thị mẫu Chưa khảo sát hệ thống grid có cấu hình lớn gồm nhiều hệ máy Supercluster xen kẻ máy đơn Chưa song song việc truyền liệu từ dịch vụ GraphRepository với Chưa thực giải thuật so trùng đồ thị dạng MPI/PVM Tuy nhiên thực xong thư viện cho phép gọi chương trình MPI từ java class Java class nhận kết gởi trả từ chương trình MPI Trang 87 8.2 HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI Nếu khắc phục hạn chế nêu phần giới hạn đề tài hệ thống hoàn chỉnh đủ tốt để cung cấp tiện ích tìm kiếm thông tin theo ngữ nghóa Nghóa miền domain cần trả lời câu hỏi xây dựng thành kho liệu đồ thị mẫu Việc thu gom thông tin Web Web Crapber kéo liệu sau dùng công cụ kết hợp với học máy (machine learning) để tạo tự động đồ thị mẫu Nếu sử dụng framework ứng dụng cho toán eBusiness e-Science mà cần có phối hợp tính toán nhiều hệ thống máy tính Supercluster, liệu phân bố nhiều site khác Một hướng phát triển kiến trúc hướng dịch vụ (nêu chương 4) phát triển Portal Grid Nếu hệ thống Lưới có nhiều Supercluster phát triển dịch vụ so trùng đồ thị song song cho Supercluster Thí dụ mở rộng mô hình giao tiếp truyền thông điệp MPI, PVM cho toán so trùng đồ thị Supercluster Phát triển hệ thống giám sát hoạt động dịch vụ nhằm đưa thống kê thấy hoạt động toàn hệ thống có hiệu không Chuẩn hóa framework xây dựng để sử dụng cho lớp toán khác Một hướng phát triển toán so trùng đồ thị kết hợp với dự án Semantic Web 8.3 LỜI KẾT Trang 88 Công nghệ tính toán lưới (Grid computing) toán tìm kiếm thông tin theo ngữ nghóa hai vấn đề lớn nhiều quốc gia tổ chức lớn nghiên cứu Họ có tham vọng phát triển hệ thống Grid Computing tầm cỡ quốc gia hay liên lục địa (như dự án vật lý DataGrid EU chia xẻ thông tin vật lý cho nước thành viên EU chẳng hạn, ChinaGrid Trung Quốc…) Thiếu công cụ phát triển IDE GUI tốt gây khó khăn cho việc xây dựng cài đặt dịch vụ lưới vào hệ thống Lưới Kết đạt luận văn minh chứng cho khả chuẩn OGSA áp dụng Việt Nam Tuy kết khiêm tốn bước đầu cho việc phát triển ứng dụng tính toán lưới mạnh mẽ sau Trong thời gian tới tác giả hy vọng thúc đẩy nhiều ứng dụng phân bố áp dụng kiến trúc hướng dịch vụ đề hơn, nhiều số liệu đo đạc cho môi trường tính toán lưới BK-GRID Trang 89 Tài liệu tham khảo Ian Foster, Carl Kesselman, Steven Tuecke The Anatomy of the Grid Enabling Scalable Virtual Organizations, Initl J SuperComputing Applications, 2001 I Foster and C.Kesselman (Eds) The Grid – Blueprint for New Computing Infrastructure, trang 5-10, 2004 Ann Chervenak, Jan Foster, Carl Kesselman, Charles Salisbury, Steven Tuecke, The Data Grid – Towards an architecture for distributed management and analysis of large scientific Dataset Haiping Zhu, Jiwei Zhong, Jianming Li, Yong Yu An Approach for Semantic Search by Matching RFD graphs, American Association for AI Publisher, 2002 Foster, I and Kesselman, C , Tsudik, G and Tuecke, S A Security Architecture for Computational Grids, ACM Conference on Computers and Security, trang 83-91, 1998 Czajkowski, Fitzgerald, Foster, Kesselman Grid Information Services for Distributed Resource Sharing, 2001 Czajkowski, Ian Foster, Karonis, Kesselman, Martin, Smith, Tuecke A Resource Management Architecture for Metacomputing Systems Trong The 4th Workshop on Job Scheduling Strategies for Parallel Processing, trang 62-68, 1998 Ian Foster, Carl Kesselman , Jeffrey M Nick, Steven Tuecke The Physiology of the Grid – An Open Grid Services Architecture for Distributed Systems Integration 2002 IBM Redbook – Globus Toolkit Quick Start, REDP3697, August 2003 10 IBM Red book – Fundamental of Grid computing, Viktors Berstis, 2002 11 Ivar Jacobson, Grady Booch, James Rumbauch The Unified Software Development Process 1999 12 S Tuecke, K Czajkowski, I Foster, J Frey, S Graham, C Kesselman, T Maquire, T Sandholm, D Snelling, P Vanderbilt Open Grid Service Infrastructure Version 27/06/2003 13 Karl Czajkowski, Ian Foster, Carl Kesselman Resource Co-Allocation in Computational Grid 2001 14 Ian Foster, Carl Kesselman, Craig Lee, Bob Lindell, Klara Nahrstedt, Alain Roy A Distributed Resource Management Architecture that Supports Advance Reservations and Co-Allocation 2002 15 Karl Czajkowski, Ian Foster, Carl Kesselman, Steve Graham, Igor Sedukhin, David Snelling, Steve Tuecke, William Vambenepe The WS-Resource Framework 03/05/2004 16 Karl Czajkowski, Don Ferguson, Ian Foster, Jeff Frey, Steve Graham, Tom Maguire, David Snelling, Steve Tuecke From OGSI to WSRF: Refactoring and Evolution 2004 Trang 90 17 Jean Pierre Goux, Sanjeev Kulkarni, Jeff Linderoth, Michael Yoder An Enabling Framework for Master-Worker Applications on the Computational Grid 2001 18 Gregor von Laszewski, Ian Foster, Jarek Gawor, Peter Lane, Nell Rehn, Mike Russell Designing Grid-Based Solving Environment and Portals 2000 19 Gregor Von Laszewski, Ian Foster Usage of LDAP in Globus 2000 20 Borja Sotomayor Globus Toolkit Programmer’s Tutorial 2004 21 Globus group Java programmer’s Guide Core Framework 03/09/2003 22 Ondrej ˇSvab, Vojtˇech Svatek, Martin Kavalec, and Martin Labsk, Querying the RDF: A small case study in the Bicycle Sale Domain, Department of Information and Knowledge Engineering University of Economics, Czech Republic 23 Li, J., Zhang, L., and Yu, Learning to Generate Semantic Annotation for Domain Specific Sentences 2001 24 Sowa, J.F Conceptual Structures: Information Processing in Mind and Machine Addison-Wesley, 1984 25 Dự án Data Grid EU từ http://eu-datagrid.web.cern.ch/eu-datagrid/ 26 Globus Toolkit 3.0 taïi http://www.globus.org/ 27 IBM developers website: http://www.ibm.com 28 W3C RDF web site: http://www.w3c.org/RDF ... Yêu cầu song song hóa toán so trùng đồ thị tìm kiếm ngữ nghóa Trong chương giới thiệu toán so trùng đồ thị tìm kiếm ngữ nghóa Trong [4], giải thuật so trùng đồ thị cho tìm kiếm ngữ nghóa chứng minh... Dịch vụ ứng dụng so trùng đồ thị gọi dịch vụ GraphMatching iii Dịch vụ thuộc lớp Backend Dịch vụ ứng dụng so trùng đồ thị gọi dịch vụ GraphRepository Trang 34 Các dịch vụ riêng ứng dụng so trùng. .. BK-GRID, phát triển ứng dụng áp dụng giải thuật so trùng đồ thị cho tìm kiếm ngữ nghóa Giải thuật so trùng giải thuật lónh vực tìm kiếm ngữ nghóa Ứng dụng phát triển theo kiến trúc hướng dịch vụ lưới