Kịch bản triển khai

Một phần của tài liệu Nghiên cứu và phát triển một số tính năng mở rộng cho hệ thống lưu trữ và chia sẻ dữ liệu lindax (Trang 66)

Hình 4.1 – Kịch bản triển khai LindaX 4.1.2 Ứng dụng web

Máy chủ ứng dụng web có các lớp nghiệp vụ nhƣ sau: Tầng ứng dụng web

Tầng lƣu trữ lƣới

202.191.56.49

202.191.56.48

65

4.1.2.1 Lớp biên

# Tên Thư mục File Mô tả

1 UserManagePage Web Manage_user.jsp Lớp giao diện quản lý ngƣời dùng. 2 SupplierManagePage Web Manage-

supplier.jsp

Lớp giao diện quản lý nhà cung cấp.

3 SearchPage Web Search.jsp Lớp giao diện tìm kiếm. 4 FileManagePage Web Manage_file.jsp Lớp giao diện quản lý tệp. 5 UploadPage Web Homepage.jsp Lớp giao diện upload tệp. 6 DownloadPage Web Download.jsp Lớp giao diện download tệp. 7 RegisterPage Web Register.jsp Lớp giao diện đăng ký tài khoản. 8 LoginPage Web Header.jsp Lớp giao diện đăng nhập hệ thống. 9 PersonalManagePage Web Account.jsp Lớp giao diện quản lý tài khoản cá

nhân.

4.1.2.2 Lớp tác vụ

# Tên Gói File Mô tả

1 UserManageServlet Linda.action UserManageServlet.java

Lớp tác vụ quản lý ngƣời dùng. 2 SupplierManageServlet Linda.action SupplierManageServlet.

java

Lớp tác vụ quản lý nhà cung cấp. 3 SearchServlet Linda.action SearchServlet.java Lớp tác vụ

tìm kiếm. 4 FileManageServlet Linda.action FileManageServlet.java Lớp tác vụ

quản lý tệp.

5 PersonalManageServlet Linda.action PersonalManageServlet. java

Lớp tác vụ quản lý tài khoản cá nhân.

6 ServerLoadControl WebStorage.action ServerLoadControl.java

Lớp tác vụ lựa chọn máy chủ lƣu trữ để upload. 7 FileUploadServlet WebStorage.action FileUploadServlet.java Lớp tác vụ

66

lên máy chủ lƣu trữ. 8 NodeManage WebStorage.action NodeManage.java

Lớp tác vụ quản lý máy chủ lƣu trữ. 9 Download WebStorage.action Download.java Lớp tác vụ

download. 10 DownloadMulti WebStorage.action DownloadMult.java

Lớp tác vụ download đa luồng. 11 RegisterServlet Linda.action RegisterServlet.java

Lớp tác vụ đăng ký tài khoản. 12 LoginServlet Linda.action LoginServlet.java (adsbygoogle = window.adsbygoogle || []).push({});

Lớp tác vụ đăng nhập tài khoản. 13 Logout Servlet Linda.action Logout Servlet.java

Lớp tác vụ đăng xuất tài khoản.

4.1.3 Máy chủ HeadNode

Nhƣ đã trình bày ở trên, máy HeadNode đóng vai trò điều khiển các máy lƣu trữ tầng lƣới. Máy HeadNode đƣợc triển khai các thành phần sau:

 Web server Tomcat: Tomcat dùng để triển khai một số ứng dụng đƣợc thiết kế cho dịch vụ của LindaX, bao gồm các thao tác có nhiệm vụ liên kết tầng ứng dụng web và tầng lƣu trữ lƣới.

 Chứng thực tài nguyên: Để máy HeadNode có thể sử dụng các dịch vụ lƣới, ta cần có chứng thực tài nguyên cho máy. Chứng thực cho máy đƣợc cài đặt theo chuẩn của Globus.

 Chứng thực ngƣời dùng: Ngƣời dùng “lindax” đƣợc tạo ra trên máy HeadNode để chạy các tác vụ trên lƣới. Đây là chứng thực ngƣời dùng cho toàn bộ hệ thống.

 Quản lý proxy cho ngƣời dùng lƣới

 Dịch vụ GridFTP: dịch vụ cài trên HeadNode có nhiệm vụ điều khiển quá trình truyền tệp giữa các server lƣu trữ.

 Dịch vụ RLS: dịch vụ định vị bản sao. Dịch vụ này của lƣới dữ liệu hỗ trợ tạo và quản lý nhân bản trên lƣới.

 Cơ sở dữ liệu cho dịch vụ RLS: đây là cơ sở dữ liệu đã đƣợc xây dựng sẵn của bộ Globus Toolkit 4.0.2. Hệ quản trị cơ sở dữ liệu đƣợc sử dụng là MySql.

67

 Cơ sở dữ liệu quản lý các server lƣu trữ: Quản lý các thông tin và tài nguyên cung cấp của các máy lƣu trữ tệp. Hệ quản trị cơ sở dữ liệu đƣợc sử dụng là MySql.

4.1.4 Các DataNode

Nhƣ đã trình bày ở trên, DataNode là máy chủ lƣu trữ dữ liệu thực sự của hệ thống. Tại DataNode sẽ đƣợc triển khai các thành phần sau:

 Một ngƣời dùng hệ thống: ở đây tạo một ngƣời dùng với tên “lindax”. Ngƣời dùng này không có đặc quyền gì trên máy lƣu trữ và chỉ dùng để chạy các dịch vụ của hệ thống.

 Web server Apache: Sử dụng với mục đích công khai các đƣờng dẫn vật lý tới ngƣời dùng qua giao diện web và xử lý một số chính sách khi download.

 Web server Tomcat: Triển khai 2 module upload và download. 2 module này có nhiệm vụ nhận, xử lý và trả thông tin về cho ngƣời dùng trong quá trình upload, download. Tomcat phải đƣợc khởi động bằng quyền của ngƣời dùng lindax.

 Quản lý tài nguyên các DataNodes

 Chứng thực tài nguyên: Để sử dụng các dịch vụ lƣới và bảo mật giữa các tổ chức tham gia vào hệ thống lƣu trữ.

 Ánh xạ ngƣời dùng: Ánh xạ quyền của ngƣời dùng lƣới trên máy lƣu trữ đến ngƣời dùng linda. Khi đó, máy HeadNode có thể điều khiển đƣợc các máy StorageNode dƣới quyền của ngƣời dùng lindax.

 Các thƣ mục và file cấu hình hệ thống: Đây là các thƣ mục và các file cấu hình của hệ thống LindaX, đƣợc tạo sẵn trên các hệ thống máy lƣu trữ để xác định thông tin trong quá trình vận hành.

4.1.5 Kết quả triển khai

Hệ thống đã đƣợc triển khai dựa trên thực tế tại Trung tâm Tính toán Hiệu năng cao, Đại học Bách Khoa Hà Nội theo nhƣ mô hình đã đề cập trong Chƣơng 2. Các máy chủ ứng dụng web, máy chủ thông tin dữ liệu (HeadNode), máy chủ lƣu trữ dữ liệu (DataNode) đều sở hữu IP thực. Chi tiết các dịch vụ đƣợc triển khai nhƣ bảng dƣới

# Tên máy Chức năng Thành phần triển khai

1

WebServer

hpcc.hut.edu.vn 202.191.56.49

Trung gian giữa ngƣời dùng và tầng lƣu trữ lƣới

Quản lý giao diện ngƣời dùng. (adsbygoogle = window.adsbygoogle || []).push({});

Giao diện giao tiếp ngƣời dùng. Cơ sở dữ liệu ngƣời dùng. Cơ sở dữ liệu tệp logic.

2

HeadNode

bkluster.hut.edu.vn 202.191.56.48

Máy chủ quản lý tầng lƣu trữ lƣới.

Dịch vụ định vị bản sao (RLS). Dịch vụ quản lý Proxy

Dịch vụ quản lý DataNode. Dịch vụ GridFTP.

68

Chứng thực CA.

3 DataNode 1

202.191.56.61 Node lƣu trữ dữ liệu.

Module upload/download. Chứng thực CA.

Dịch vụ GridFTP.

4 DataNode 2

202.191.56.62 Node lƣu trữ dữ liệu.

Module upload/download. Chứng thực CA.

Dịch vụ GridFTP.

Một số kết quả đạt đƣợc thể hiện qua giao diện hệ thống

4.1.5.1 Giao diện trang chủ LindaX

69

4.1.5.2 Giao diện quá trình upload

Hình 4.3 – Giao diện upload tệp

70

Hình 4.5 – Upload tệp thành công

71

4.1.5.3 Giao diện quá trình download

Hình 4.7 – Giao diện download

72

4.1.5.4 Giao diện quản trị

Hình 4.9 – Giao diện quản trị (adsbygoogle = window.adsbygoogle || []).push({});

4.2 Đánh giá

Về chức năng: Hệ thống đã thực hiện đƣợc hai chức năng chính và cũng là bắt buộc phải có đối với một hệ thống lƣu trữ và chia sẻ tệp đó là upload và download. Bên cạnh đó, hệ thống cũng đƣợc tích hợp thêm các chức năng phụ trợ khác để làm đầy đủ hơn và tiện dụng hơn cho ngƣời dùng nhƣ: chia sẻ liên kết, quản lý không gian tệp, quản lý ngƣời dùng. Về mặt hệ thống, LindaX đã có chức năng giám sát các nút lƣu trữ hỗ trợ cho việc kết nạp thêm các nút lƣu trữ vào hệ thống.

Về hiệu năng: Do hạn chế về trang thiết bị và cơ sở hạ tầng, hệ thống chƣa đƣợc triển khai trên số lƣợng lớn các máy lƣu trữ và phân tán thực sự về mặt địa lý, nên chƣa đánh giá đƣợc hết hiệu năng của hệ thống khi đƣợc triển khai thực sự đầy đủ. Tuy nhiên, trong phạm vi của luận văn thử nghiệm và đánh giá, hệ thống cũng cho thấy những nét khả quan về hiệu năng khi sử dụng công nghệ lƣới dữ liệu để lƣu trữ và chia sẻ dữ liệu.

Về tính dễ sử dụng: Hệ thống đã có đƣợc giao diện thân thiện với ngôn ngữ tiếng Việt, các chức năng bố trí hợp lý, không gian thao tác đƣợc thiết kế đẹp mắt do vậy ngƣời dùng có thể dễ dàng thao tác với các chức năng. Tính dễ sử dụng còn đƣợc cải thiện thông qua việc sử dụng công nghệ AJAX giúp cho ngƣời dùng có cảm giác nhƣ đang sử dụng ứng dụng Desktop chứ không phải đang truy cập trang web. Điều đó tạo lên hiệu quả đáng kể trong việc thu hút khách hàng đến với dịch vụ của hệ thống.

Về khả năng mở rộng: Bƣớc đầu hệ thống mới chỉ triển khai trong phạm vi hẹp với mục đích thử nghiệm. Tuy nhiên tính khả thi và khả năng mở rộng của hệ thống là hoàn toàn có thể. Việc dễ dàng kết nối vào hệ thống và quyền lợi đầy đủ đối với các nhà cung cấp máy chủ lƣu trữ sẽ thúc đẩy các nhà cung cấp sẵn sàng tham gia mở rộng không gian của hệ thống cả về không gian lƣu trữ và không gian địa lý. Những nghiên cứu của luận vănđang ở những bƣớc đầu, do đó khả

73

năng nghiên cứu về mặt công nghệ để nâng cao chất lƣợng hệ thống, tính bảo mật và độ ổn định còn nhiều.

5.1 Kết luận

Có thể nói luận văn đã đạt đƣợc hầu hết các mục tiêu cơ bản đƣợc đặt ra ban đầu là xây dựng và triển khai thành công hệ thống lƣu trữ và chia sẻ dữ liệu LindaX, đáp ứng đƣợc các yêu cầu cơ bản của một hệ thống lƣu trữ và chia sẻ, có những chức năng tƣơng tự nhƣ các hệ thống nổi tiếng trên thế giới đã đề cập đến trong Chƣơng 1 của luận văn. Các mục tiêu cụ thể đó là:

 Nghiên cứu về công nghệ lƣới và lƣới dữ liệu. Triển khai thành công một lƣới dữ liệu phục vụ cho tầng lƣu trữ của hệ thống LindaX.

 Xây dựng các mô-đun cho tầng lƣu trữ dữ liệu nhƣ: quản lý ủy quyền (proxy), quản lý tài nguyên lƣới, điều khiển truyền tệp, định vị bản sao trên lƣới, mô-đun upload/download v.v.. dựa trên các dịch vụ của bộ công cụ Globus Toolkit 4.0.2, phục vụ cho nhiều ứng dụng khác nhau.

 Triển khai các tính năng upload và download trên ứng dụng web kết nối đƣợc với tầng lƣu trữ lƣới, có các chính sách cụ thể của hệ thống lƣu trữ nhƣ: giới hạn dung lƣợng, hạn chế IP download, giới hạn tốc độ, thời gian lƣu trữ tệp, download đa luồng, v.v…

5.2 Hướng phát triển

Do thời gian nghiên cứu và thực hiện luận văn còn hạn chế, nên hệ thống LindaX còn cần nhiều nâng cấp bổ sung để có thể hoàn thiện hơn và ứng dụng rộng rãi đƣợc trong thực tế. Những định hƣớng phát triển cho hệ thống LindaX cụ thể là:

Hỗ trợ tính năng sao lưu dữ liệu trực tuyến

Khi ngƣời dùng không may xóa nhầm dữ liệu trong không gian lƣu trữ của mình, hệ thống sẽ có một cơ chế lập lịch sao lƣu dữ liệu cho một số đối tƣợng khách hàng sử dụng dịch vụ này. Khi đó, LindaX sẽ có tính năng khôi phục lại trạng thái của kho dữ liệu tại một thời điểm trƣớc đó. Việc sao lƣu dữ liệu có thể do khách hàng quy định hoặc hệ thống tự lập lịch một cách hợp lý.

Xây dựng tính năng quản lý phiên bản

Khi nhiều ngƣời dùng cùng muốn chia sẻ một nguồn dữ liệu để thao tác chung lên dữ liệu đó,hệ thống LindaX sẽ lƣu trữ riêng biệt các phiên bản của dữ liệu đó tại các thời điểm khác nhau tƣơng ứng với từng ngƣời dùng tác động lên dữ liệu chung đó. Việc quản lý phiên bản này chỉ ảnh hƣởng lên một vùng dữ liệu do ngƣời dùng quy định và chỉ đƣợc chia sẻ cho một nhóm ngƣời xác định.

Nâng cao độ bảo mật

Hệ thống cần phải thiết lập thêm các cơ chế bảo mật cho quá trình upload/download tệp, xác nhận ngƣời dùng hệ thống, v.v.. Đối với một hệ thống lƣu trữ và chia sẻ trực tuyến, đây là một

75

vấn đề luôn đƣợc đặt lên hàng đầu. Cơ chế bảo mật phải gắn liền với các chính sách ngƣời dùng của hệ thống LindaX

Cải thiện tốc độ upload/download

Tốc độ upload/download của một hệ thống phụ thuộc vào nhiều yếu tổ khác nhau. Để tăng tốc độ download/upload, hệ thông LindaX sẽ sử dụng thông tin về vị trí địa lý của ngƣời dùng, cho phép ngƣời dùng đó tiếp cận với máy chủ dữ liệu tại gần đó nhất. Theo lý thuyết, cách làm này sẽ làm tăng đáng kể tốc độ upload và download của ngƣời dùng. Muốn làm đƣợc điều này, hệ thống LindaX sẽ đƣa ra một quy trình nhanh gọn, hỗ trợ mở rộng các nhà cung cấp máy chủ lƣu trữ. Bên cạnh đó, chính sách hạn chế băng thông cũng sẽ đƣợc xem xét kỹ hơn để hệ thống không bị quá tải.

chapter1,JohnWiley&Sons,Inc.2005.

[2]. I. Foster, “What is the Grid? A Three Point Checklist,” page 2-3, GRIDToday, July. 2002.

[3]. Ian Foster, Carl Kesselman, and Steven Tuecke, “The Autonomy of the Grid, Enabling Scalable Virtual Organizations,” Int. J. Supercomput. Appl. 2002.

[4]. Ian Foster, Adriana Iamnitchi, “On Death, Taxes, and Convergence of Peer-to-Peer and Grid Computing” In 2nd International Workshop on Peer-to-Peer Systems (IPTPS'03), Berkeley, CA, Feb. 2003.

[5]. PeterJ.Braam,“TheCodaDistributedFileSystem”, http://www.coda.cs.cmu.edu/.

[6]. Ian Foster,JensVo¨ckler,MichaelWilde,andYongZhao,“TheVirtualDataGrid:A NewModeland Architecturefor Data-IntensiveCollaboration,”CIDR 2003,page1. (adsbygoogle = window.adsbygoogle || []).push({});

[7]. NguyễnKimAnh,“Nguyênlýcủacáchệ cơsởdữliệu”chƣơng3,chƣơng5,chƣơng7, chƣơng8,NhàxuấtbảnĐạihọcquốcgiaHàNội.

[8]. Ann Chervenak, Ian Foster, Carl Kesselman, Charles Salisbury, and Steven Tuecke, “The Data Grid: Towards an Architecture for the Distributed Management and Analysis of Large Scientific Datasets,” page 1.

[9]. William Stallings, “Computer Organization and Architecture,” chapter 5, 5th, Prentice Hall Inc, 1996.

[10]. IanFoster, CarlKesselman,“Adatagridreferencearchitecture”,Jan.2001. [11]. Globusproject, http://www.globus.org/toolkit.

[12]. W. Allcock, J. Bresnahan, R. Kettimuthu, M. Link, C. Dumitrescu, I. Raicu, I. Foster, “The Globus Striped GridFTP Framework and Server,” Proceedings of Super Computing 2005 (SC05), Nov. 2005.

[13]. J.Postel,J.Reynolds,“File Transfer Protocol”, http://www.w3.org/Protocols/rfc959/.

[14]. I. Foster, C. Kesselman, G. Tsudik, S. Tuecke, “A Security Architecture for ComputationalGrids,”Proc.5th ACMConferenceon ComputerandCommunications SecurityConference,page83-92,1998.

[15]. J. Novotny, S.Tuecke,V.Welch, “An OnlineCredential RepositoryfortheGrid: MyProxy,”ProceedingsoftheTenthInternational Symposium onHighPerformance DistributedComputing(HPDC-10),IEEEPress,Aug.2001.

[16]. L. Pearlman, V. Welch, I. Foster, C. Kesselman, S. Tuecke, “A Community AuthorizationServiceforGroupCollaboration,”Proceedingsof theIEEE3rd International WorkshoponPoliciesfor DistributedSystems andNetworks,2002.

Một phần của tài liệu Nghiên cứu và phát triển một số tính năng mở rộng cho hệ thống lưu trữ và chia sẻ dữ liệu lindax (Trang 66)