Tuy nhiên trong điều kiện thực tế hiện nay, trên các hệ thống UNIX, đôi khi người sử dụng vẫn gặp khó khăn khi tìm kiếm, cài đặt và quản lý phần mềm,cách thức sử dụng hệ thống UNIX khá p
CÁC VẤN ĐỀ VỀ HỆ THỐNG PHÂN PHỐI PHẦN MỀM PHÂN TÁN
Các khái niệm cơ bản về phần mềm
Phần mềm là tập hợp các lệnh được lập trình bằng một hoặc nhiều ngôn ngữ, sắp xếp theo trật tự nhất định để thực hiện các công việc cụ thể.
Về cơ bản, phần mềm được chia thành các loại như sau:
Phần mềm hệ thống là loại phần mềm thiết yếu giúp vận hành phần cứng và hệ thống máy tính Chức năng chính của nó là tích hợp, điều khiển và quản lý các thành phần phần cứng riêng lẻ trong hệ thống máy tính.
Phần mềm ứng dụng là chương trình cho phép máy tính thực hiện các tác vụ cụ thể theo yêu cầu của người dùng.
Phần mềm lập trình cung cấp các công cụ cần thiết để hỗ trợ lập trình viên trong việc phát triển các chương trình máy tính, bao gồm cả phần mềm hệ thống và phần mềm ứng dụng.
Đề tài nghiên cứu tập trung vào cơ chế và phương thức phân tán phần mềm ứng dụng, nhằm tìm hiểu cách thức hoạt động của các ứng dụng trong một hệ thống máy tính.
1.1.2 Hoạt động của phần mềm ứng dụng trong một hệ thống máy tính
Các phần mềm ứng dụng trong hệ thống máy tính cần sự hỗ trợ từ phần mềm hệ thống để hoạt động hiệu quả Phần mềm hệ thống cung cấp các dịch vụ và tài nguyên cần thiết cho phần mềm ứng dụng.
Điều khiển các phần mềm ứng dụng là rất quan trọng trong việc chia sẻ tài nguyên máy tính, giúp đảm bảo rằng các phần mềm trong hệ thống có thể hoạt động đồng thời một cách hiệu quả.
• Cơ sở dữ liệu: cung cấp kho chứa thông tin, hỗ trợ phần mềm ứng dụng trong việc kết nối với với cơ sở dữ liệu
1.1.3 Các hình thức và quy trình cung cấp phần mềm
Phần mềm trên máy tính được phát triển bởi cá nhân hoặc nhà sản xuất, có thể chia thành hai loại chính: phần mềm miễn phí và phần mềm thương mại Phần mềm thương mại yêu cầu người dùng trả tiền khi mua hoặc trong quá trình sử dụng Cả hai loại phần mềm này đều có thể được cung cấp dưới hai hình thức khác nhau.
Nhà sản xuất thực hiện việc đóng gói sản phẩm và in sao lên các thiết bị lưu trữ như CD, DVD, hoặc cung cấp kèm theo các sản phẩm như máy xách tay, máy để bàn Sau đó, sản phẩm được chuyển đến tay người sử dụng.
Cung cấp trực tuyến mang lại lợi ích lớn cho người dùng và doanh nghiệp, cho phép truy cập dễ dàng vào các sản phẩm phần mềm qua Internet Người sử dụng có thể tải về các phiên bản mới, bản sửa lỗi và cập nhật bảo mật một cách thuận tiện mà không bị rào cản địa lý Tuy nhiên, việc này cũng đặt ra một số thách thức liên quan đến bản quyền, tính pháp lý và thanh toán trực tuyến.
Tổng quan về hệ thống phân phối phần mềm phân tán
Hệ thống phân phối phần mềm phân tán là một mạng lưới gồm nhiều máy tính kết nối với nhau, cho phép chia sẻ và xử lý dữ liệu một cách hiệu quả Trong hệ thống này, các máy tính tương tác để thực hiện các tác vụ khác nhau, mang lại sự linh hoạt và khả năng mở rộng cho người dùng.
Sử dụng nhiều máy chủ cho phép cung cấp và phân tán phần mềm đến các máy trạm trong hệ thống Các máy trạm này sẽ tải phần mềm phân tán từ máy chủ, giúp tối ưu hóa hiệu suất và quản lý tài nguyên hiệu quả hơn.
Một hệ thống phân phối phần mềm phân tán cần đảm bảo:
Hệ thống có khả năng đáp ứng các yêu cầu từ máy trạm, với số lượng yêu cầu phụ thuộc vào số lượng máy trạm trong hệ thống Đặc biệt, số lượng máy trạm có thể được mở rộng linh hoạt để phù hợp với nhu cầu sử dụng.
• Hệ thống phải đảm báo tính trong suốt để người sử dụng giao tiếp với hệ thống như một hệ thống thống nhất toàn vẹn
• Hệ thống phải có tính an toàn, bảo mật cao.
• Hệ thống cho phép các dịch vụ khác bổ sung vào mà không gây xung đột với các dịch vụ đã có của hệ thống phân tán.
• Trên máy trạm ngoài việc cài đặt còn cho phép cập nhật các gói phần mềm một cách dễ dàng
1.2.2 Nguyên tắc hoạt động cơ bản của một hệ thống phân tán phần mềm
Hệ thống phân tán phần mềm hoạt động để chuyển sản phẩm từ nhà sản xuất đến người sử dụng, quy trình này bao gồm ba bước chính: đóng gói phần mềm, phân tán phần mềm, và bảo trì cùng nâng cấp phần mềm.
Quá trình đóng gói phần mềm giúp thuận tiện cho việc phân phối từ nhà phân phối và cải thiện trải nghiệm cài đặt Trên các hệ thống máy UNIX, phương thức đóng gói phổ biến là RPM và DEB, trong khi trên Windows, phần mềm thường được đóng gói dưới dạng file cài đặt EXE Kể từ phiên bản Windows 2000, Microsoft đã giới thiệu chuẩn đóng gói MSI mới.
Phân tán phần mềm trực tuyến hiện nay phổ biến trên hệ điều hành Windows, nơi người dùng tải các bản phần mềm từ internet và cài đặt trên máy tính Đối với các máy UNIX, người sử dụng cũng có thể tải các gói phần mềm và tiến hành cài đặt thông qua câu lệnh hoặc phần mềm hỗ trợ.
1.2.3 Cách thức quản lý phần mềm trên hệ điều hành nguôn mở
Trên hệ điều hành nguồn mở, phần mềm được tổ chức dưới dạng các gói, với các loại gói phổ biến như Debian, RPM và Tarball.
Debian là định dạng gói phần mềm phổ biến nhất khi cài đặt phần mềm trong Ubuntu, sử dụng chuẩn gói của Debian và các nhánh con của nó Tất cả phần mềm trong kho của Ubuntu đều được đóng gói theo định dạng này Tarballs là tập hợp các tệp nén trong một tệp duy nhất, tương tự như tệp zip trên Windows hoặc tệp hqx trên Mac Định dạng RPM của Redhat được thiết kế để dễ dàng cài đặt và quản lý gói phần mềm, cho phép tự động cài đặt, nâng cấp và gỡ bỏ các gói, đồng thời theo dõi các phụ thuộc, ngăn không cho cài đặt phần mềm nếu các phụ thuộc chưa được cài đặt.
1.2.4 Vai trò của người quản trị trên hệ thống phân tán phần mềm
Trong hệ thống phân tán phần mềm, vai trò của người quản trị là cực kỳ quan trọng Họ chịu trách nhiệm cấu hình, bổ sung và cập nhật thông tin cho các gói phần mềm, đảm bảo hệ thống hoạt động hiệu quả và ổn định.
Trên máy chủ, nhiệm vụ của người quản trị hệ thống bao gồm:
• Cấu hình hệ thống, cập nhật hệ điều hành tối ưu hóa hệ thống
• Cài đặt tường lửa, kiểm tra sửa lỗi bảo mật
• Bổ sung, cập nhậtcác gói phần mềm
• Theo dõi hệ thống, hỗ trợ 24/7
Trao đổi giữa các thành phần trong một hệ thống phân tán
Phân phối phần mềm trong mô hình Client-Server bao gồm Client và Server, trong đó Client khởi đầu các hoạt động và Server chờ nhận yêu cầu từ Client Để đảm bảo tính nhất quán và độ tin cậy của dữ liệu chia sẻ, cần có sự phối hợp chặt chẽ giữa Client và Server Điều này yêu cầu hai điều kiện trái ngược: hoạt động của các Client không được ảnh hưởng lẫn nhau, đồng thời các Client có thể sử dụng Server để chia sẻ dữ liệu Do các thao tác của Client phụ thuộc vào Server, nên Server cần đảm bảo khả năng chia sẻ dữ liệu hiệu quả.
• Có kh nả ăng điều khiển tương tranh
• Có kh nả ăng đ ềui phối giao dịch phân tán
• Có kh nả ăng phục hồi và chịu lỗi
• Có kh nả ăng bảo ật m cao.
Trong trường hợp Client gửi yêu cầu đến Server và nhận được kết quả lớn, việc trao đổi dữ liệu có thể được thực hiện nhiều lần thay vì nhận toàn bộ dữ liệu trong một lần Điều này cho phép cả Client và Server có thời gian thực hiện các tác vụ khác trong khi vẫn tiếp tục trao đổi dữ liệu, đồng thời Client có thể xử lý ngay dữ liệu vừa nhận để đưa ra quyết định cho các thao tác tiếp theo.
Giao dịch phân tán là quá trình thực hiện một loạt các thao tác giữa nhiều máy tính, trong đó một số máy cung cấp tài nguyên cho giao dịch, một máy quản lý các thao tác trên tài nguyên, và một máy yêu cầu thực hiện giao dịch.
Gửi yêu cầu đến máy quản lý giao dịch, có thể là một hoặc nhiều máy khác nhau tùy thuộc vào cấu trúc hệ thống Có hai phương thức giao dịch phân tán: giao dịch đơn giản và giao dịch cấu trúc lồng.
Trong giao dịch đơn giản, Client gửi yêu cầu đến nhiều Server, nhưng mỗi Server xử lý yêu cầu độc lập mà không liên quan đến các thao tác trên Server khác Mỗi giao dịch của Client hoàn thành các yêu cầu trước khi chuyển sang giao dịch tiếp theo, do đó, các giao dịch truy cập dữ liệu một cách tuần tự Khi các Server sử dụng trạng thái khóa, một giao dịch chỉ bị khóa đối với một phần tử dữ liệu tại một thời điểm.
Trong một số trường hợp, thao tác trên Server có thể liên quan đến các Server khác Để giải quyết vấn đề này, mỗi giao dịch Client được cấu trúc thành một tập hợp các giao dịch lồng, cho phép thực hiện đồng thời các giao dịch ở cùng một mức Giao dịch có cấu trúc mang lại hiệu năng cao hơn so với giao dịch đơn giản nhờ khả năng thực hiện song song các yêu cầu, trong khi giao dịch đơn giản yêu cầu thực hiện tuần tự.
1.3.3 Khôi phục và chịu lỗi
Máy chủ cung cấp các giao dịch thông qua một trình quản trị, với nhiệm vụ đảm bảo tính hiệu quả và an toàn cho các giao dịch Khi máy chủ khởi động lại sau sự cố, quá trình khôi phục sẽ lưu trữ các thành phần dữ liệu trong một bộ nhớ tạm thời, cùng với danh sách các ý định và tình trạng thông tin của mỗi giao dịch.
Các phiền giao dịch trong hệ thống phải được tối ưu hóa cho mọi ứng dụng, đặc biệt là những ứng dụng yêu cầu thời gian thực Để đảm bảo hoạt động ổn định, các ứng dụng này cần có các giải pháp dự phòng cho khả năng chịu lỗi và khôi phục kịp thời.
Khả năng chịu lỗi có hai khía cạnh chính: khả năng mô tả các đặc điểm và ảnh hưởng của các lỗi có thể xảy ra trong hệ thống phân tán Nhiều loại lỗi có thể xuất hiện, bao gồm lỗi 'fail stop' và lỗi 'Byzantine failure'.
Có hai cách chính để thực hiện che phủ lỗi, bao gồm che phủ lỗi phân cấp và che phủ lỗi nhóm.
Một dịch vụ giao dịch ưng ý là giải pháp lý tưởng để giải quyết các vấn đề liên quan đến dữ liệu được chia sẻ trong một thời gian dài, nhưng trên thực tế không phải dịch vụ nào cũng phù hợp cho mọi ứng dụng phân tán Một dịch vụ giao dịch lưu trữ các thành phần dữ liệu quan trọng của nó trong một tệp khôi phục, phục vụ trong hoạt động thường xuyên của nó Vì vậy, khi xảy ra lỗi, nó có thể thực hiện khôi phục các thành phần dữ liệu từ tệp khôi phục này.
Hệ thống phân tán mang lại nhiều lợi ích, cho phép người dùng chia sẻ thông tin qua mạng Tuy nhiên, để tối ưu hóa hiệu quả của hệ thống, việc đảm bảo an toàn và bảo mật là rất quan trọng, giúp người dùng tin tưởng và nâng cao giá trị sử dụng của mạng phân tán.
Sự an toàn của mạng phân tán thường bị xâm phạm do tính mở của các kênh thông tin, mà cụ thể là các cổng hợp pháp được sử dụng để truyền tải thông tin giữa các tiến trình, chẳng hạn như giữa Client và Server.
PHÂN PHỐI PHẦN MỀM TRÊN CÁC HỆ ĐIỀU HÀNH NGUỒN MỞ
Quản lý và phân phối phần mềm trên Debian
Ubuntu ra mắt lần đầu vào ngày 20 tháng 10 năm 2004, khởi nguồn từ một nhánh tạm thời của dự án Debian Linux Mục tiêu của việc này là để phát hành phiên bản mới của Ubuntu mỗi 6 tháng, nhằm tạo ra một hệ điều hành được cập nhật thường xuyên hơn.
Bản phát hành Ubuntu luôn bao gồm phiên bản GNOME mới nhất và được phát hành khoảng một tháng sau GNOME Khác với các nhánh Debian như MEPIS, Xandros, Linspire, Progeny và Libranet, thường dựa vào phần mềm bổ sung có mã nguồn đóng, Ubuntu tuân theo triết lý của Debian và sử dụng phần mềm miễn phí (libre) trong mọi thời điểm.
2.2.1 Phân phối phần mềm trên hệ điều hành Debian
Deb là định dạng mở rộng của gói phần mềm Debian, được sử dụng phổ biến trong hầu hết các hệ thống Debian Tên gọi "Deb" được đặt theo tên của Debra, người bạn gái của Ian Murdock, người sáng lập hệ điều hành Debian.
• C g ác ói trong dòng Debian cũng là n tền ảng ủa c Debian trong ph n â phối ầnph mềm, dữliệu
Gói Debian là một chuẩn lưu trữ trong hệ điều hành UNIX, bao gồm hai định dạng là gzipped và bzipped tar Một định dạng được sử dụng để nén thông tin, trong khi định dạng còn lại dùng để chứa dữ liệu.
• Một chương trình chuẩn được sử dụng để quản lý các gói deb này là dpkg
• G ói deb c thểó chuyển đổi sang cácđịnh ạng d khác bằng cách s dử ụngAlien.
Về cơ bản thì phần lớn của hệ thống Debian được điều khiển bởi hệ thống quản lý gói này Những phần này gồm:
/var (Có thể làm /var/local và hoạt động trong đó một cách an toàn)
Có thể thay thế tệp /usr/bin/perl, nhưng việc nâng cấp gói Perl sẽ làm mất các tệp đã được chèn Để tránh tình trạng này, các chuyên gia nên đặt gói Perl riêng biệt.
“giữ lại” trong chương trình aptitude
Một trong những phương pháp cài đặt hiệu quả nhất là APT, với hai phiên bản là dòng lệnh apt-get và giao diện toàn màn hình aptitude Cần lưu ý rằng apt cho phép hợp nhất các phân loại Chính (main), Đóng góp (contrib.) và Khác tự do (non-free), giúp truy cập vào các gói bị hạn chế khi xuất và sử dụng phiên bản chuẩn.
Khi cài đặt phần mềm trong Debian, khái niệm "dependencies" (các phụ thuộc) rất quan trọng, vì chúng là các gói phần mềm cần thiết cho việc hoạt động của gói chính Các phụ thuộc này được ghi lại trong tài liệu và lưu trữ trong các tệp điều khiển Chẳng hạn, một gói chứa trình biên dịch GNU C (gcc) sẽ phụ thuộc vào các gói binutils, bao gồm các linker và assembler.
Khi một người dùng cố gắng cài đặt gcc mà chưa cài đặt binutils, hệ thống quản lý gói dpkg sẽ thông báo lỗi và ngừng quá trình cài đặt gcc.
Cài đặt phần mềm trên hệ debian luôn đảm ảo b :
• Có khả năng biên dịch lại mã nguồn, cấu hình, kiểm tra bản quyền
• Có khả năng cập nhật phần mềm, kiểm tra sự phụ thuộc, hỗ trợ bảo mật
• Dễ dàng gỡ bỏ phần mềm
• Đảm bảo các phần mềm làm việc tốt và cùng với nhau
2.2.2 Gói phần mềm trên hệ điều hành Debian
Một gói Debian bao gồm các tệp thực thi, thư viện và tài liệu được lưu trữ trong tệp có định dạng deb Tên tệp của một gói Debian thường có cấu trúc nhất định.
___.deb Trong đó:
2 Version Number: là phiên bản của gói phần mềm
3 Debian Revision Number: là ên bản của h phi ệthống
4 Debian Architecture: chứa kiến trúc của hệ thống
Gói nhị phân (Binary packages) chứa chương trình thực thi, tệp cấu hình, thông tin bản quyền và tài liệu liên quan Các gói này được phân phối theo định dạng Debian với phần mở rộng deb Để mở gói tệp nhị phân, người dùng có thể sử dụng tiện ích dpkg.
• Data.tar.gz (chứa các tệp h ệthống)
• Control.tar.gz (Chứanhữngnhững ịch k b và d ản ữliệu)
• Debian-binary (Chứa êphi n bản g ) ói
Xét một gói như nhau:
Gói cài đặt $ar tv parted_1.4.24-4_i386.deb chứa các tệp quan trọng như debian-binary, control.tar.gz và data.tar.gz Phiên bản của tệp deb được xác định bởi nội dung "2.0\n" Tệp data.tar.gz bao gồm tất cả các tệp sẽ được cài đặt, với cấu trúc thư mục như / và /sbin/, cùng với quyền truy cập tương ứng được chỉ định cho người dùng root.
- rwxr xr x root/root 31656 2002 03 28 13:44:49 /sbin/parted - - - - drwxr xr - - x root/root 0 2002 - 03 - 28 13:44:38 /usr/ drwxr xr - - x root/root 0 2002 - 03 - 28 13:44:41 /usr/share/ drwxr xr - - x root/root 0 2002 - 03 - 28 13:44:38 /usr/share/man/
Control tar.gz: Chứa các thông tin đ ều khiển, kiểm i tra và các kịch bản
- -r r rw 1 root root 1336 Mar 28 2002 control
- -r r rw 1 root root 388 Mar 28 2002 md5sums
- rwxr xr 1 root root 253 Mar 28 2002 postinst - -x
- rwxr xr 1 root root 194 Mar 28 2002 prerm - -x
Ví dụ một tệp control như sau:
Maintainer: Adam Heath
Description: The classic greeting, and a good example
• Package: chứa tên của g ói tin, đây là tên của gói được c côác ng cụ quản lý g ói s dử ụng
Gói phần mềm đóng vai trò quan trọng trong việc quản lý sắp xếp các công việc, giúp phân loại thông tin theo danh mục và cấp độ.
• Version: trường này chứa êphi n bản c g ủa ói phần ềm m
• Architecture: Chứa ôth ng tin kiến trúc CPU
• Depends: Ch danh sứa ách ác c gói c ần được cài đặttrướckhi cài đặt gói tin này
• Installed-size: Chứa k ích thước ôkh ng gian bộnhớ ần c thiết để c g ài đặt ói phần mềm
• Description: Chứa c ôác th ng tin mô tả, những ôth ng tin nàyđược đóng g k ói èm theo và chứa các thông tin sơ ược ề l v gói tin.
Md5sums chứa mã hóa md5 cho mỗi tệp trong data.tar.gz, ví dụ một tệp md5 sẽ như sau:
4eb9cc2e192f1b997cf13ff0b921af74 usr/share/man/man8/parted.8.gz
2f356768104a09092e26a6abb012c95e usr/share/doc/parted/README.Debian a6259bd193f8f150c171c88df2158e3e usr/share/doc/parted/copyright
7f8078127a689d647586420184fc3953 usr/share/doc/parted/changelog.Debian.gz
98f217a3bf8a7407d66fd6ac8c5589b7 usr/share/doc/parted/changelog.gz
C k b ác ịch ản preinst, postinst, prerm và postrm là những kịch bản được tự động chạy trước và sau khi cài đặt một gói
Kịch bản Preinst sẽ được thực thi trước khi tiến hành cài đặt, ví dụ như sử dụng để dừng các dịch vụ đang chạy trong quá trình cài đặt hoặc nâng cấp.
Postinst là một kịch bản sẽ được thực thi sau khi cài đặt phần mềm Thông thường, nó được sử dụng để cấu hình lại hệ thống, thông báo cho người dùng về những thay đổi trong hệ thống, hoặc để khởi động và khởi động lại các dịch vụ liên quan.
• Prerm: Là kịch b ản đượcchạytrướckhi gỡ ỏ ột b m g ói
• Postrm: Là kịch b ản đượcchạysau khi gỡ ỏ ột b m g ói
Tiến trình cài đặt một gói deb nhị phân:
Hình 2- : 13 Tiến trình cài đặt một gói Deb nhị phân
• Tiến trình h b m g ủy ỏ ột ói deb:
Hình 2- : 14 Tiến trình hủy bỏ một gói deb nhị phân
Gói nguồn trong hệ thống quản lý gói bao gồm các tệp có phần mở rộng dsc, chứa thông tin về gói mã nguồn và danh sách các tệp kèm theo Các tệp có phần mở rộng orig tar gz chứa mã nguồn gốc không thể thay đổi, được nén theo định dạng tar, trong khi các tệp có phần mở rộng diff chứa các khác biệt so với mã nguồn gốc.
-52- và gz chứa những thay đổi tệp mã nguồn gốc Tiện ích dpkg-source được sử dụng để đóng gói và mở gói mã nguồn Deb.
T m g mã ừ ột ói nguồn debian c thểó êbi n dịch thành m g ột ói nhị phân Trong một g mã ói nguồndebian có chứa:
Hình 2- : 15 Định dạng một gói nguồn
• dsc: Chứa tệpcontrol, c ác th ng tin vó c ô à mô t v ả ề phần ềm m và c ác thuộc t ính để biên dịch
• orig.tar.gz: Chứa mã nguồn chương trình
• diff.gz: chứa nhữngthay đổi cho hệDebian
Hình 2- : 16 Tổng quan về quá trình đóng gói trong debian
Mạng ngang hàng (Peer to Peer – P2P)
2.3.1 Các kiến trúc sử dụng để phân tán
Hệ thống phân tán file chủ yếu áp dụng kiến trúc Client Server truyền thống, nhưng kiến trúc chia sẻ ngang hàng cũng đang ngày càng phổ biến và phát triển mạnh mẽ.
NFS (Hệ thống Tệp Mạng của Sun Microsystems) là một trong những hệ thống phân tán tệp phổ biến trên hệ thống UNIX, hoạt động theo kiến trúc Client-Server Ý tưởng chính của NFS là chuẩn hóa mô hình và định dạng các tệp mà máy chủ cung cấp, cho phép các máy trạm truy cập mà không cần quan tâm đến cách thức thực thi của tệp Giao thức truyền thông của NFS cho phép chia sẻ tệp giữa các máy tính với kiến trúc và hệ điều hành khác nhau, tạo điều kiện thuận lợi cho việc chia sẻ tài nguyên.
Mô hình NFS và các hệ thống tương tự được gọi là dịch vụ file từ xa Trong mô hình này, máy trạm có khả năng truy cập các file trên Server giống như khi truy cập các file trên chính máy trạm Mô hình này được gọi là mô hình truy cập từ xa.
Ngược lại với mô hình truyền thống, mô hình upload/download cho phép máy trạm truy cập và tải file từ Server, sau đó upload lại để các máy trạm khác có thể sử dụng Mô hình này thường được áp dụng trong các dịch vụ FTP, nơi nhiều máy trạm cần thay đổi nội dung của file trên Server Hệ thống UNIX hầu hết đều tích hợp sẵn NFS theo kiến trúc phân lớp, tạo điều kiện thuận lợi cho việc chia sẻ và quản lý file.
Hình 2- : 21 Kiến trúc phân lớp NFS
Một máy trạm truy cập vào file hệ thống thông qua lớp System call, nhưng không giao tiếp trực tiếp với Local file system interface mà thông qua lớp Virtual File System (VFS) VFS cho phép thao tác truy cập file trên máy trạm hoặc trên Server thông qua NFS Client, có nhiệm vụ điều khiển các thao tác truy cập tới file trên Server Tất cả giao tiếp giữa Client và Server trong NFS được thực hiện qua phương thức RPCs, với NFS Client thực hiện các lệnh RPCs để thao tác với file trên Server.
2.3.1.2 Phân tán file theo mạng ngang hàng
Mạng ngang hàng (P2P) là một hệ thống cho phép hai hoặc nhiều máy tính chia sẻ tập tin và truy cập thiết bị như máy in mà không cần máy chủ hay phần mềm máy chủ Đơn giản hơn, mạng P2P được hình thành từ các máy tính kết nối với nhau để chia sẻ tài nguyên mà không cần thông qua máy chủ riêng Ứng dụng đầu tiên của mạng P2P bắt nguồn từ việc triển khai các máy tính cá nhân độc lập vào đầu những năm 1980.
Mạng ngang hàng (P2P) đã nhanh chóng thu hút sự chú ý từ khi ra đời, đặc biệt trong việc áp dụng các mô hình P2P để phát triển những ứng dụng chia sẻ tệp và điện thoại.
Internet (Internet-based telephony) đã đạt được nhiều thành công Hiện nay các ứng dụng P2P chiếm hơn 75% băng thông trên Internet.
Mạng ngang hàng là loại mạng cho phép các thiết bị hoạt động với chức năng và khả năng tương đương nhau.
Hình 2-22: So sánh mô hình Client Server và mô hình P2P
2.3.2.2 Phân loại mạng ngang hàng
Mạng ngang hàng có thể được phân loại theo mục đích sử dụng, ví dụ:
• Chia sẻ file (file sharing)
• Đa phương tiện media streaming (audio, video)
• Diễn đàn thảo luận (Discussion forums)
Mạng ngang hàng có thể được phân loại theo mức độ tập trung của mạng (đối với P2P overlay networks).
Hình 2-23: Phân loại các kiến trúc mạng ngang hàng
2.3.3 Kiến trúc trong mạng ngang hàng
Trong mô hình P2P, mỗi máy trạm tham gia được gọi là một peer, và các peer này được kết nối qua một mạng overlay Mô hình P2P được phân chia thành hai loại: có kiến trúc và không có kiến trúc.
2.3.3.1 Mạng ngang hàng không cấu trúc
Mô hình tập trung là mạng ngang hàng thế hệ thứ nhất, đặc trưng bởi việc dựa vào một máy chủ tìm kiếm trung tâm, do đó còn được gọi là mạng ngang hàng tập trung (Centralized Peer-to-Peer networks) Cấu trúc Overlay của loại mạng này có thể được mô tả như một mạng hình sao.
Hình 242- : Mô hình chia sẻ tập trung
Mô hình hoạt động này cho phép mỗi Client lưu trữ các file mà họ muốn chia sẻ với các Node khác trong mạng Nó bao gồm một bảng lưu trữ thông tin kết nối của người dùng đăng ký như địa chỉ IP và dung lượng băng thông, cùng với một bảng liệt kê danh sách các file mà mỗi người dùng muốn chia sẻ, bao gồm tên file và dung lượng Tất cả máy tính trong mạng đều kết nối với một máy chủ tìm kiếm trung tâm, nơi tiếp nhận và phân tích các yêu cầu tìm kiếm Nếu yêu cầu được đáp ứng, máy chủ sẽ gửi địa chỉ IP của máy chứa tài nguyên trong mạng, và quá trình truyền file diễn ra theo cơ chế mạng ngang hàng giữa các host mà không cần thông qua máy chủ trung tâm.
Kiến trúc này có ưu điểm nổi bật là dễ dàng trong việc xây dựng và tìm kiếm thông tin nhanh chóng, hiệu quả Tuy nhiên, nó cũng tồn tại nhược điểm là dễ bị tấn công và đòi hỏi quản trị chặt chẽ.
• Mạng ngang hàng thuần túy (Pure)
Mạng ngang hàng thuần túy (Pure) là một dạng mạng ngang hàng thế hệ thứ nhất, không sử dụng máy chủ tìm kiếm tập trung như Napster, giúp khắc phục vấn đề nút cổ chai Tuy nhiên, việc tìm kiếm trong mạng này dựa vào cơ chế Flooding, khiến yêu cầu tìm kiếm được gửi đến tất cả các Node lân cận, dẫn đến tăng lưu lượng mạng đáng kể Đây là một trong những điểm yếu của mạng ngang hàng thuần túy Các phần mềm tiêu biểu cho loại mạng này bao gồm Gnutella 4.0 và FreeNet.
Mô hình chia sẻ thuần túy có ưu điểm dễ xây dựng và đảm bảo tính phân tán hoàn toàn cho các Node trong mạng, cho phép các Node tham gia và rời khỏi mạng một cách linh hoạt mà không làm ảnh hưởng đến cấu trúc mạng Tuy nhiên, nhược điểm của mô hình này là tốn băng thông, gây phức tạp trong việc tìm kiếm, và các Node với khả năng khác nhau về CPU, băng thông và lưu trữ đều phải chịu tải giống nhau.
XÂY DỰNG HỆ THỐNG PHÂN PHỐI PHẦN MỀM PHÂN TÁN KẾT HỢP P2P
Yêu cầu đối với mô hình phân phối phần mềm phân tán
Mô hình phân phối phần mềm phân tán mới cần phải đảm bảo tính tiện lợi cho người sử dụng, đồng thời đáp ứng đầy đủ các yêu cầu và đặc trưng của hệ thống phân tán.
Hệ phân tán kết nối người sử dụng với tài nguyên hữu hạn, trong khi số lượng người sử dụng đang tăng trưởng nhanh chóng Do đó, cần có giải pháp hiệu quả để chia sẻ tài nguyên giữa hệ thống và người sử dụng, cũng như giữa các người sử dụng với nhau một cách tối ưu.
• Tính trong suốt: Hệ thống phải đảm bảo tính trong suốt để người sử dụng giao tiếp với hệ thống như một hệ thống thống nhất và toàn vẹn
Hệ thống có tính mở, cho phép các dịch vụ mới được bổ sung mà không gây xung đột với các dịch vụ hiện có trong hệ thống phân tán.
• Tính co dãn: Hệ thống dễ dàng thay đổi quy mô, tùy thuộc vào như cầu của tổ chức hay người sử dụng.
Sau khi hoàn thành hệ thống vận hành sẽ cho phép:
• Số người sử dụng lớn và dễ dàng mở rộng hệ thống
• Cho phép người sử dụng tìm kiếm, tải phần mềm từ các máy chủ một cách dễ dàng và thuận tiện
• Chia sẻ phần mềm từ một máy trạm tới các máy trạm khác một cách dễ dàng
• Thiết lập, cấu hình, quản lý hệ thống một cách dễ dàng, chi phí thấp,
Hoạt động này rất phù hợp với các doanh nghiệp nhỏ, trung tâm, viện và trường đại học, đồng thời có khả năng mở rộng để cho phép nhiều người sử dụng hệ thống cùng một lúc.
Với một yêu cầu như vậy, mô hình của hệ thống sẽ được xây dựng như sau:
Xây dựng mô hình phân phối phần mềm phân tán
3.2.1 Mô hình tổng thể và cơ chế làm việc
Mô hình hệ thống phân phối phần mềm phân tán bao gồm các điểm phân phối phần mềm (DP) được kết nối qua một hệ thống mạng máy tính Hệ thống mạng này có thể được thiết lập cho quy mô tổ chức nhỏ hoặc mở rộng qua đường truyền Internet.
Trên mỗi một điểm phân tán sẽ có máy chủ, máy chủ phân tán sẽ kết nối với kho chứa phần mềm và các máy trạm.
Hình 3-1: Mô hình chung hệ thống phân phối phần mềm phân tán
Đối với hệ thống có lượng truy cập cao, việc cài đặt nhiều máy chủ tại các điểm phân tán là cần thiết Mỗi máy chủ sẽ được trang bị phần mềm phân tán, thực hiện các chức năng quan trọng để tối ưu hóa hiệu suất và quản lý lưu lượng truy cập.
• Quản lý các truy cập từ máy trạm, thực hiện các yêu cầu từ máy trạm đến
• Quản lý kho phần mềm, thực hiện đóng gói, phân loại, sắp xếp, tối ưu
Chúng tôi cung cấp đa dạng dịch vụ, bao gồm tiếp nhận phần mềm từ máy khách, quảng bá sản phẩm phần mềm, và cung cấp giải pháp quản lý gói cùng với dịch vụ đóng gói cho các máy trạm.
• Kết nối với các điểm phân tán khác, đảm bảo luôn luôn cập nhật danh sách các kho phần mềm và các điểm phân tán khác
Kho phần mềm là nơi lưu trữ các gói phần mềm đã được đóng gói và mô tả chi tiết Mỗi gói phần mềm chứa thông tin trong các trường header, trong khi thông tin bổ sung được lưu trữ tại cơ sở dữ liệu trên Server Server quản lý dữ liệu này, giúp người dùng dễ dàng truy vấn và tìm kiếm các gói phần mềm.
Trên máy trạm, việc cài đặt phần mềm phân tán giúp biến nó thành một nút trong mô hình phân tán, cho phép người dùng tương tác và quản lý dữ liệu hiệu quả hơn.
Phần mềm có thể được đóng gói và chia sẻ với các điểm phân tán hoặc nút khác Chi tiết về phần mềm phân tán trên máy trạm sẽ được trình bày trong phần tiếp theo.
3.2.2 Mô hình trên mỗi điểm phân tán Để đảm bảo quản lý và phân phối phần mềm trên mạng được linh hoạt và hiệu quả trên điểm âph n phối phải đảm bảo được các nhiệm vụ sau:
• Đóng gói các phần mềm, cung cấp đầy đủ thông tin về mỗi gói phần mềm, phân loại được các phần mềm thuộc nhóm phần mềm nào
Cung cấp phần mềm quản lý và công cụ đóng gói cho máy trạm tương tự như các công cụ trên hệ điều hành mã nguồn mở, giúp máy trạm dễ dàng tải về và thực hiện quy trình đóng gói phần mềm hiệu quả.
Cơ sở dữ liệu của chúng tôi lưu trữ và cập nhật thường xuyên danh sách các phần mềm trực tuyến, giúp người dùng dễ dàng tìm kiếm và truy cập những phần mềm cần thiết.
Đảm bảo định tuyến chính xác cho các máy trạm đến các kho chứa phần mềm cần thiết, bao gồm cả kho do hệ thống cung cấp và các kho phần mềm từ các nhà cung cấp thương mại khác.
• Có khả năng điều khiển tương tranh, điều phối phân tải tránh tắc nghẽn hệ thống khi có nhiều người cùng download hoặc upload
Từ các yêu cầu trên mô hình trên mỗi điểm phân tán sẽ, bao gồm 2 khối chính và các module như sau:
Hình 3-2: Mô hình các khối trên điểm phân tán phần mềm
Chi tiết về các khối và từng module sẽ được mô tả trong phần sau
3.2.3 Mô hình trên máy trạm
Phần mềm quản lý và phân phối phần mềm trên máy trạm đáp ứng được các yêu cầu sau:
Người dùng có thể tải danh sách phần mềm từ các điểm phân tán và kiểm tra tính tương thích của từng phần mềm với máy tính của mình.
• Quản lý, đóng gói, cài đặt gỡ bỏ các gói phần mềmtrên máy tính.
Cho phép hệ thống tự biến thành một điểm phân tán, chia sẻ tài nguyên và phần mềm cho máy chủ cùng các máy trạm khác Để thực hiện các nhiệm vụ này trên máy trạm, cần cài đặt phần mềm kết nối và các module tương ứng.
Hình 3-3: Các module trên máy trạm
Các thành phần của hệ thống và chi tiết về chức năng của từng module sẽ được phân tích trong phần sau.
3.2.4 Mô hình mạng tổng thể cả hệ thống
Luận văn trình bày một mô hình hệ thống, trong đó các máy trạm kết nối với Server và với nhau Các Server đóng vai trò là các điểm phân tán, trong khi các máy trạm là các điểm phân tán con, từ đó tạo ra một hệ thống đồng bộ và hiệu quả.
-76- bảo dễ dàng cho việc cài đặt phần mềm, đảm bảo giảm tải cho Server, đảm bảo các phiên bản phần mềm mới luôn được cập nhật.
Để xây dựng mô hình mạng tổng thể cho toàn bộ hệ thống, mỗi máy trạm và Server cần cài đặt phần mềm phân tán Phần mềm trên Server chịu trách nhiệm quản lý tài nguyên, kiểm soát truy cập và phân phối tài nguyên đến các máy trạm, đồng thời tiếp nhận tài nguyên từ chúng Trong khi đó, phần mềm phân tán trên máy trạm có nhiệm vụ quản lý và phân phối tài nguyên, cập nhật và tải phần mềm từ máy chủ, cũng như chia sẻ phần mềm với các máy khác trong hệ thống thông qua cơ chế chia sẻ ngang hàng.
Các server được kết nối với nhau để cập nhật và trao đổi phần mềm, đồng thời có cơ chế cân bằng nhằm giảm tải cho mỗi server khi toàn bộ hệ thống hoạt động đồng thời.
Cơ chế hoạt động giải pháp trên từng thành phần của hệ thống
Phần mềm quản lý và điều khiển điểm phân phối phần mềm nó quản lý và điều khiển toàn bộ hoạt động của phân phối phần mềm
Điều khiển giao dịch và định tuyến cho máy trạm giúp tải đúng phần mềm từ kho chứa yêu cầu Hệ thống có khả năng phân tải cho các kho chứa, tự động sao chép phần mềm thường xuyên được tải xuống bởi nhiều người dùng sang các kho chứa khác để giảm tải Khi một kho chứa gặp sự cố hoặc quá tải, hệ thống sẽ tự động định tuyến đến các kho chứa tương tự ở khu vực khác.
Ngoài việc thực hiện phân tán, phân tải hợp lý Trên mỗi điểm phân tán có các module, thực hiện các công việc khác nhau
3.3.1.1 Mo dule đóng gói phần mềm
Module đóng gói phần mềm có vai trò quan trọng trong việc chuẩn bị và phân phối các ứng dụng Trên các hệ thống UNIX, quá trình đóng gói thường tuân theo các tiêu chuẩn RPM hoặc DEB để đảm bảo tính tương thích và hiệu suất.
Quá trình đóng gói phần mềm gói RPM và DEB đã được trình bày trong chương 2 Quy trình đóng gói phần mềm về cơ bản bao gồm các bước:
Hình 3-5: Quá trình đóng gói phần mềm
Phần mềm phân tán trên máy chủ giúp người quản trị hệ thống trong quá trình đóng gói, cung cấp các tương tác trực quan thay vì sử dụng dòng lệnh.
Quá trình đóng gói phần mềm trở nên dễ dàng hơn với các tác thân thiện và đơn giản, cho phép người quản trị lưu trữ phần mềm dưới dạng file RPM và DEB trong kho chứa phần mềm Thông tin liên quan đến các gói phần mềm cũng được lưu trữ trong cơ sở dữ liệu trên máy chủ, giúp quản lý và tìm kiếm các gói phần mềm hiệu quả hơn Cơ sở dữ liệu này chứa các thông tin quan trọng về các gói phần mềm mà server quản lý.
• Đường dẫn: Lưu trữ đường dẫn vật lý về gói phần mềm trên kho phần mềm
• Nhóm phần mềm: Lưu trữ các thông tin để phân loại, hỗ trợ cho việc tìm kiếm phần mềm.
Để cài đặt phần mềm và các phụ thuộc, cần cung cấp thông tin chi tiết về các yêu cầu phụ thuộc Những thông tin này đảm bảo rằng các gói phần mềm máy trạm tải về tương thích với hệ thống và có thể sử dụng hiệu quả.
• Thông tin về bản quyền: Một số gói không miễn phí, trường này sẽ lưu trữ các thông tin về bản quyền của phần mềm
• Các thông tin khác: Chứa các thông tin khác như: phiên bản, nhà phát triển, ngày cập nhật, hướng dẫn sử dụng v.v…
3.3.1.2 Module quản lý kho phần mềm
Mỗi server lớn, đặc biệt là những server cung cấp đa dạng phần mềm cho người dùng, có khả năng sử dụng nhiều kho chứa khác nhau Mỗi kho chứa này lưu trữ một hoặc nhiều nhóm phần mềm ứng dụng như kho chứa phần mềm quản lý, phần mềm soạn thảo, phần mềm đồ họa, và phần mềm trò chơi.
Các kho chứa phần mềm được lưu trữ trong cơ sở dữ liệu, cho phép máy chủ chuyển hướng máy trạm tải các phần mềm cần thiết Những kho chứa này được cập nhật thường xuyên để đảm bảo tính chính xác và sẵn có của phần mềm.
Một kho chứa phần mềm có thể gặp tình trạng quá tải khi có lượng truy cập lớn, đặc biệt là trong thời điểm cập nhật phần mềm Khi hệ thống đồng loạt truy cập để thực hiện cập nhật, điều này có thể dẫn đến việc kho phần mềm bị quá tải và không thể xử lý các yêu cầu từ người dùng.
Khi quản lý các kho phần mềm cho 79 máy trạm, cần thiết phải áp dụng một cơ chế cân bằng hệ thống Cơ chế này bao gồm hai nhiệm vụ chính để đảm bảo hiệu quả hoạt động và tối ưu hóa tài nguyên.
Cân bằng định kỳ là quá trình được thực hiện thường xuyên để ghi nhận thông tin truy cập đến từng kho phần mềm Hệ thống sẽ tự động phát hiện các nhóm phần mềm có lượng truy cập vượt trội so với các phần mềm khác Khi đó, hệ thống sẽ sắp xếp và bố trí lại các thành phần vật lý trong các kho phần mềm, nhằm đảm bảo sự cân bằng về lượng truy cập giữa các kho này.
Cân bằng khi quá tải là giải pháp hiệu quả cho các phần mềm gặp phải lượng tải tăng đột ngột, đặc biệt sau khi cập nhật Khi lượng truy cập tăng cao, hệ thống sẽ tự động sao chép phần mềm đến các kho chứa khác để tạo ra nhiều nguồn truy cập Server sẽ điều hướng các truy cập này, giúp đảm bảo rằng hệ thống hoạt động bình thường và không bị gián đoạn.
3.3.1.3 Module quản lý kết nối
Module quản lý kết nối chịu trách nhiệm điều phối các kết nối giữa máy trạm và Server, cũng như giữa các Server với nhau Các kết nối này diễn ra qua mạng LAN và Internet Để đảm bảo hiệu quả trong việc quản lý kết nối giữa máy trạm và Server, cũng như giữa các Server, cần phải có những biện pháp phù hợp.
• Khả ă n ng điều khiển tương tranh
• Khả ă n ng iều ph i giao dịch phân tán đ ố
• Khả ă n ng phục hồi và chịu lỗi
Trong một số trường hợp, máy trạm gửi yêu cầu đến Server và nhận kết quả lớn, do đó, thay vì tải toàn bộ phần mềm một lần, máy trạm và Server có thể trao đổi dữ liệu qua nhiều lần Chúng ta áp dụng mô hình giao dịch chung và mô hình chia sẻ P2P, trong đó mỗi gói phần mềm được chia thành các phần nhỏ (piece) Mỗi piece có thể được tải từ nhiều nguồn khác nhau, cho phép máy trạm thiết lập nhiều kết nối với các nguồn khác nhau để tải phần mềm hiệu quả hơn.
Module này đảm bảo rằng tất cả các kết nối đến các kho phần mềm khác nhau trên máy chủ luôn được thông suốt và hiệu quả.
Module này đảm bảo kết nối giữa các Server khác nhau, cho phép mỗi Server cung cấp thông tin về các gói phần mềm không có trên chính nó Khi người dùng tìm kiếm gói phần mềm, Server sẽ kiểm tra trước trên hệ thống của mình; nếu không tìm thấy, nó sẽ tìm kiếm trên các Server kết nối Ngoài ra, trong trường hợp Server bị quá tải, module sẽ điều hướng truy cập đến các Server khác để giảm tải và đảm bảo người dùng luôn nhận được phần mềm yêu cầu.
C d v êác ịch ụ tr n đ ểm phân phối phần mềm là trang chủ của điểm phân phối phần i mềm với các khối dịch vụ chức năng như h ình sau:
Triển khai xây dựng hệ thống trên các hệ điều hành nguồn mở
Đề xuất xây dựng một hệ thống hoàn chỉnh nhằm đáp ứng nhu cầu phân tán và phát triển cho các công ty, tổ chức có số lượng máy tính vừa phải Hệ thống này sẽ được thử nghiệm với dưới 1000 máy trạm kết nối, phù hợp với các trường đại học, trường phổ thông và doanh nghiệp vừa và nhỏ.
Máy chủ được lựa chọn đáp ứng đầy đủ các yêu cầu đã phân tích và được cài đặt hệ điều hành Linux Server cùng phần mềm phân tán theo thiết kế Nó có khả năng phục vụ đồng thời 1000 máy trạm, đảm bảo khả năng phản hồi nhanh chóng khi tất cả các máy trạm cùng truy cập.
Máy chủ này có khả năng mở rộng và nâng cấp khi số lượng máy trạm kết nối tăng lên, đồng thời đảm bảo tính an toàn và bảo mật cao Trên máy chủ, phần mềm phân tán được cài đặt và cấu hình một cách hiệu quả, kết nối với cơ sở dữ liệu hỗ trợ để tối ưu hóa hiệu suất hoạt động.
Hệ thống thử nghiệm đề xuất bao gồm hai máy chủ kết nối với thiết bị lưu trữ qua mạng LAN, trong đó các thiết bị lưu trữ được coi là kho chứa phần mềm với địa chỉ IP cố định, cho phép người dùng truy cập thông qua máy chủ Sử dụng hệ thống lưu trữ NAS là một giải pháp hiệu quả, không yêu cầu đầu tư lớn nhưng vẫn đảm bảo dung lượng lưu trữ lớn, tính an toàn bảo mật cao và quản trị vận hành đơn giản.
Bên cạnh đó, NAS cho phép thực hiện mở rộng về dung lượng lưu trữ khi nhu cầu sử dụng tăng cao một cách dễ dàng, nhanh chóng.
Hình 3-10: Triển khai hệ thống lưu trữ
Sử dụng một số máy trạm để kết nối với Server, trên mỗi máy trạm cần cài đặt phần mềm phân tán đã được thiết kế và phân tích trước đó Phần mềm phân tán này sẽ được cấu hình để kết nối với Server qua đường truyền Internet.
Triển khai hệ thống bao gồm 2 máy chủ và phần mềm lưu trữ được tải lên kho NAS Các máy trạm được cài đặt sẵn phần mềm phân tán, sau đó tiến hành kiểm tra toàn bộ hệ thống để đảm bảo hoạt động hiệu quả.
Hinh 3-11: Mô hình đơn giản một mạng phân tán phần mềm
Với một hệ thống đã xây dựng, trên máy trạm có thể thực hiện các tác vụ như sau:
• Thực hiện tải phần mềm mới từ máy chủ: Trên máy trạm, cập nhật danh sách phần mềm có sẵn trên máy chủ, thực hiện tiến hành cài đặt
Khi có phiên bản phần mềm mới, máy chủ sẽ gửi thông tin cập nhật tới từng máy trạm Người sử dụng có quyền quyết định có nên cập nhật phần mềm hay không
Tải phần mềm lên Server cho phép các gói phần mềm được đóng gói và upload, từ đó Server sẽ chia sẻ phần mềm đó đến các máy khác trong hệ thống.
Phân tán phần mềm cho phép các gói phần mềm được chia sẻ từ máy trạm này sang máy trạm khác theo mô hình chia sẻ ngang hàng Trong mô hình này, Server đóng vai trò hỗ trợ kết nối và phối hợp giữa các máy trạm để thực hiện quá trình chia sẻ hiệu quả.
Đánh giá hệ thống
Ứng dụng mô hình đề xuất rõ ràng sẽ mang lại sự tiện lợi đáng kể khi triển khai phần mềm Khi cài đặt và thiết lập hệ thống cho một tổ chức, hệ thống này sẽ giúp tối ưu hóa quy trình làm việc và nâng cao hiệu quả hoạt động.
Việc phân tán phần mềm trở nên dễ dàng hơn khi cài đặt trên máy tính Server sẽ gửi thông báo đến các máy trạm, từ đó các máy trạm sẽ tải phần mềm yêu cầu về Điều này giúp đảm bảo rằng phiên bản phần mềm trên tất cả các máy trạm luôn đồng nhất.
• Cài đặt và cập nhật phần mềm trực tuyến thông qua mô hình chia sẻ ngang hàng sẽ làm cho Server không bị quá tải.
• Dễ dàng thực hiện chia sẻ phần mềm cho các máy trạm khác trong hệ thống
3.5.1 Các thao tác cơ bản của hệ thống
Hệ thống yêu cầu các thao tác cơ bản để thiết lập và vận hành, bao gồm các đối tượng tham gia, địa điểm thực hiện và chi tiết các bước cần thực hiện, được trình bày trong bảng dưới đây.
Thao tác Đối tượng tham gia Nơi thực hiện Công việc phải làm
Cài đặt cấu hình máy chủ Người quản trị Trên kho phần mềm
Thiết lập máy chủ, cài đặt hệ điều hành, cấu hình tổng thể, thiết lập kho lưu trữ NAS
Cài đặt phần mềm phân tán máy chủ Người quản trị Trên kho phần mềm
Cài đặt phần mềm phân tán, tạo cơ sở dữ liệu lưu trữ, phân vùng lưu trữ phần mềm
Thiết lập mạng Người quản trị Trên kho phần mềm
Thiết lập kết nối từ máy chủ tới các máy trạm, thiết lập hệ thống tưởng lửa
Cấu hình hệ thống phân tán Người quản trị Trên kho phần mềm
Cấu hình phần mềm, thực hiện kiểm tra kết nối, kiểm tra quá trình các module trên phần mềm phân tán
Cài đặt phần mềm phân tán trên máy trạm Người dùng Trên máy trạm Tải phiên bản phần mềm phân tán, cài đặt
Cấu hình phần mềm phân tán trên máy trạm Người dùng Trên máy trạm Thiết lập, cấu hình kết nối tới các server (nếu cần) Đóng gói phần mềm
Người quản trị & người dùng
Trên kho phần mềm & trên máy trạm
Chuẩn bị mã nguồn, bổ sung thông tin cho các gói phần mềm, tiến hành biên dịch
Tìm kiếm phần mềm Người sử dụng Trên máy trạm Nhập từ khóa để tìm kiếm
Phân tán phần mềm Người quản trị Trên kho phần mềm
Kiểm tra kết nối, kiểm tra hiệu năng hệ thống và các xung đột có thể xảy ra
Bảng 3-1: Các thao tác cơ bản của hệ thống phân phối phần mềm phân tán
3.5.2 Độ phức tạp của từng thao tác
Khi vận hành hệ thống, các thao tác cơ bản bao gồm đóng gói, phân tán và cài đặt phần mềm Phân tán phần mềm được chia thành hai hình thức: phân tán phần mềm mới và nâng cấp phần mềm Quá trình cài đặt phần mềm diễn ra trên máy trạm, và độ phức tạp của từng thao tác được đánh giá dựa trên thời gian và khối lượng thông tin trao đổi.
3.5.2.1 Thao tác đóng gói phần mềm
Quá trình đóng gói phần mềm bao gồm việc chuẩn bị mã nguồn, các phụ thuộc và thư viện cần thiết Người sử dụng cần bổ sung thông tin cho gói phần mềm và tiến hành biên dịch Thời gian thực hiện quá trình này phụ thuộc vào hiệu năng máy tính và kích thước của gói phần mềm.
Trong quá trình đóng gói phần mềm, thời gian nén dữ liệu đóng vai trò quan trọng, với các chuẩn nén phổ biến như gzip và bzip2 Hiện tại, gói RPM và tương lai của gói Deb đang chuyển sang sử dụng thuật toán nén LZMA (Lempel Ziv Markov chain algorithm), là thuật toán mặc định cho định dạng 7z LZMA đạt tốc độ nén khoảng 1 MB/s trên bộ vi xử lý 2 GHz, trong khi tốc độ giải nén dao động từ 10 đến 20 MB/s trên cùng cấu hình CPU Tuy nhiên, hiệu suất này có thể thay đổi tùy thuộc vào cấu trúc CPU và số lượng lõi.
Chuyên gia John Goerzen đã thực hiện một cuộc thử nghiệm đánh giá các giải thuật nén khác nhau thông qua Practical Compressor Test trên website http://www.grandtrunk.net/compression, sử dụng gói dữ liệu có kích thước 6Gb để đưa ra bảng thông số đánh giá chi tiết.
Công cụ Không gian Tiết kiệm (MB) So sánh không gian với Gzip So sánh về mặt thời gian với Gzip gzip 3398 100.00% 100.00% bzip2 3590 92.91% 333.05% lzma -1 3641 91.01% 195.58% lzma -2 3783 85.76% 273.83%
Những con số này cho ta thấy:
• bzip2 tốt hơn 7% better than gzip, tuy nhiên thời gian tăng gấp 3 lần
LZMA -1 là một lựa chọn tốt hơn so với bzip2, với thời gian nén chỉ tăng gấp đôi Việc sử dụng thuật toán này giúp tạo ra file có kích thước nhỏ hơn và thời gian nén nhanh hơn nhiều.
LZMA -2 cung cấp kích thước nén nhỏ hơn đáng kể và thời gian nén nhanh hơn so với bzip2 Phần mềm được phát triển cho phép người dùng lựa chọn định dạng nén phù hợp với nhu cầu của mình.
• Máy chủ tìm kiếm trên các trạm
Máy chủ quản lý nhiều máy trạm kết nối theo mô hình P2P, sử dụng bảng băm phân tán DHT để quản lý Địa chỉ IP của từng node được băm nhằm xác định vị trí của nó trong bảng băm.
- NodeID = SHA 1(Node IP Address) - o Mỗi file dữ liệu được gán một số định danh (Key)
- Key = SHA-1(tên file) hoặc SHA 1(nội dung file).-
Khóa là giá trị duy nhất trong không gian địa chỉ, với mỗi node quản lý một khoảng giá trị trong không gian này Dữ liệu được lưu trữ tại node và được quản lý thông qua khóa của dữ liệu, có thể được lưu trực tiếp hoặc gián tiếp qua địa chỉ IP Khi tìm kiếm dữ liệu, thông điệp tìm kiếm khóa K sẽ được gửi lần lượt đến các node trong DHT cho đến khi tìm thấy node quản lý khóa đó.
Như vậy trong trường hợp xấu nhất, để tìm được dữ liệu, thông điệp sẽ được chuyền đi trên khắp các node
• Quá trình tìm kiếm thông tin góiphần mềm
Thông tin về gói phần mềm không chỉ được lưu trữ trong cơ sở dữ liệu mà còn tồn tại trong chính các gói phần mềm, bao gồm thông tin về các file và sự phụ thuộc Máy chủ tìm kiếm và truy vấn những thông tin này Tương tự, trên máy trạm, phần mềm phân tán có thể truy vấn để lấy thông tin về các gói phần mềm Ví dụ, công cụ rpm cho phép sử dụng lệnh rpm –q cùng các tham số để tìm kiếm thông tin gói phần mềm Chúng ta không đi sâu vào quá trình này vì đây là nhiệm vụ của hệ thống; phần mềm phân tán chỉ chuyển yêu cầu cho rpm thực hiện.
Kết nối với server để nhận thông tin và tương tác với các máy trạm khác, sau đó tiến hành tải gói phần mềm Quá trình này phụ thuộc vào server cũng như số lượng máy tính trong hệ thống.
Kiểm tra phiên bản các gói phần mềm và kết nối tới Server là bước đầu tiên trong quy trình Sau đó, hệ thống tiếp nhận thông tin và thực hiện bắt tay với các máy trạm khác Cuối cùng, tiến hành tải gói phần mềm, quá trình này phụ thuộc vào server, số lượng máy tính trong hệ thống và tính sẵn có của gói.