1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên ứu tìm hiểu bài toán sao lưu dữ liệu phân tán, ứng dụng bào việ triển khai hệ thống thông tin

60 6 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên Cứu Tìm Hiểu Bài Toán Sao Lưu Dữ Liệu Phân Tán, Ứng Dụng Vào Việc Triển Khai Hệ Thống Thông Tin
Tác giả Trần Tiến Thành
Người hướng dẫn TS. Hà Quốc Trung
Trường học Trường Đại Học Bách Khoa Hà Nội
Chuyên ngành Kỹ thuật máy tính và truyền thông
Thể loại luận văn thạc sĩ khoa học
Năm xuất bản 2012
Thành phố Hà Nội
Định dạng
Số trang 60
Dung lượng 4,81 MB

Nội dung

Một trong các bài toán thường được ứng dụng trong các hệ thống hiện nay dựa trên hai mô hình này là bài toán sao lưu dữ liệu phân tán.. Ngược lại, các mô hình sao lưu dữ liệu phân tán th

Trang 1

TRƯỜ NG Đ Ạ I H C BÁCH KHOA HÀ NỘI Ọ

-Trần Ti n Thành ế

NGHIÊN C Ứ U TÌM HIỂU BÀI TOÁN SAO LƯU DỮ LI Ệ U PHÂN TÁN, NG Ứ

D Ụ NG VÀO VIỆC TRIỂN KHAI HỆ THỐNG THÔNG TIN

LUẬ VĂN THẠC SĨ KHOA HỌ N C

Chuyên ngành : K ỹ thuật máy tính và truyề n thông

Hà N – ộ i Năm 2012

Trang 2

-Trần Ti n Thành ế

NGHIÊN C Ứ U TÌM HIỂU BÀI TOÁN SAO LƯU DỮ LI Ệ U PHÂN TÁN, NG D NG Ứ Ụ

VÀO VI C TRI N KHAI H Ệ Ể Ệ TH NG THÔNG TIN Ố

LUẬN VĂN THẠC SĨ KHOA HỌC

Chuyên ngành : K ỹ thuật máy tính và truyề n thông

NGƯỜ I HƯ Ớ NG DẪN KHOA HỌ C :

1 TS Hà Qu ố c Trung

Hà Nội – Năm 2012

Trang 3

Lời cam đoan

Tôi xin cam đoan luận văn cao học đề tài “Nghiên cứu tìm hiểu bài toán sao lưu dữ liệu phân tán, ứng dụng vào việc triển khai hệ thống thông tin”

là công trình nghiên cứu của bản th n Những số liệu, hình vẽ và thử nghiệm âđều tự tôi nghiên cứu tính toán

Hà nội, ngày 12 tháng 3 năm 2012

Tác giả luận văn Trần Tiến Thành

Trang 4

Danh mục Bảng

Bảng 1.1 So sánh kiến trúc Client/Server và Peer to Peer 12

Table 3.1 Bảng Locator Table 42

Bảng 3.2 So sánh thông lượng trung bình của Client 49

Bảng 3.3 Bảng so sánh tải của máy chủ 49

Trang 5

Danh mục hình vẽ

Hình 1.1 : Kiến trúc Client – Server 8

Hình 1.2: Hệ thống ngang hàng thuần tuý 11

Hình 1.3: Hệ thống ngang có cấu trúc 12

Hình 2.1 Mô hình sao lưu phân tán trên hệ thống Client/Server 14

Hình 2.2 : Mô hình kết nối FTP từ Client tới Server 20

Hình 2.3 : Mô hình kết nối Active FTP 21

Hình 2.4 : Mô hình kết nối Passive FTP 22

Hình 2.5 : Mô hình Reverse Proxy 24

Hình 2.6 : Mô hình Cache 26

Hình 2.7: Kiến trúc siêu ngang hàng 31

Hình 2.8: Hoạt động của mạng siêu ngang hàng 32

Hình 2.9: Mạng siêu ngang hàng dư cấp 2 33

Hình 2.10 Kiến trúc của Napster 37

Hình 2.11 Kiến trúc của Gnutella 38

Hình 3.1 : Mô hình Cache trên mạng ngang hàng 40

Hình 3.2 : Client kết nối vào mạng 41

Hình 3.3 : Cache Registration 41

Hình 3.4 : Client đọc một đối tượng 42

Hình 3.5 : Client cập nhật/ghi một đối tượng 44

Hình 3.6 : Mô hình hệ thống không có cache 46

Hình 3.7 : Mô hình Cache trên client 47

Hình 3.8 : Mô hình Cache trên mạng ngang hàng 48

Hình 3.9 : Mô hình hệ thống sao lưu phân tán sử dụng Sopcast 53

Hình 3.10 Xem truyền hình trực tuyến trên phần mềm Sopcast 55

Hình 3.11 Chọn Kênh 1 Đài PTTH Hà nội trên phần mềm Sopcast - 56

Trang 6

Lời mở đầu

Trong cấu trúc mạng Internet hiện nay, mô hình mạng Client/Server và mô hình mạng ngang hàng (P2P) là hai mô hình đang được ứng dụng phổ biến nhất hiện nay Một trong các bài toán thường được ứng dụng trong các hệ thống hiện nay dựa trên hai mô hình này là bài toán sao lưu dữ liệu phân tán ác mô hình sao lưu C

dữ liệu phân tán tổ chức theo kiểu mạng ngang hàng hiện nay tuy ít về số lượng nhưng lại lớn về lưu lượng Ngược lại, các mô hình sao lưu dữ liệu phân tán theo kiểu Client/Server tuy lớn về số lượng, được sử dụng hầu hết trong các hệ thống mạng hiện nay, nhưng lưu lượng lại chiếm ít hơn lưu lượng qua mạng ngang hàng Nghiên cứu về sao lưu dữ liệu phân tán trên cả hai mô hình là Client/Server và mạng ngang hàng (P2P) sẽ giúp người quản trị công nghệ thông tin biết cách lựa chọn và ứng dụng giải pháp sao lưu dữ liệu phù hợp với yêu cầu bài toán đặt ra

Đó cũng chính là lý do tôi lựa chọn đề tài “Nghiên cứu, tìm hiểu bài toán sao lưu dữ liệu phân tán và ứng dụng vào việc triển khai hệ thống thông tin”

Từ trước tới nay tôi là quản trị mạn tại Đài PT TH Hà nội, chuyên cập nhật g

-và nghiên cứu công nghệ mới để ứng dụng cho công việc chuyên môn của Đài Trong đó tôi cũng có nghiên cứu các giải pháp sao lưu dữ liệu phân tán chủ yếu dựa trên mô hình mạng Client/Server, tôi đã nghiên cứu cả giải pháp Client/server thông thường và giải pháp Client/Server có cache nhằm giải quyết yêu cầu bài toán là truyền phát video chất lượng trên mạng Internet Tuy nhiên, giải pháp ứng dụng mô hình Client/Server mắc phải một số nhược điểm là bị tắc nghẽn ở “nút cổ chai”, Server càng phải chịu tải lớn khi số lượng người xem càng gia tăng, tính mở rộng

hệ thống bị hạn chế

Vì thế mục đích nghiên cứu luận văn này là để đưa ra giải pháp sao lưu dữ liệu phân tán tốt hơn, trong luận văn này tôi đề xuất giải pháp sao lưu dữ liệu phân tán

có cache dựa trên mô hình mạng ngang hàng

Giải pháp này có ưu điểm là tính sẵn sàng cao, không bị tắc nghẽn ở “nút cổ chai” hay quá tải Server, tính co giãn cao và càng nhiều máy tham gia vào mạng thì hiệu năng hệ thống càng cao Giải pháp này phù hợp với mô hình phát video trên mạng

Trang 7

Luận văn này sẽ trình bày tổng quan về mô hình Client/Server, mô hình Client/Server nâng cao, mô hình mạng ngang hàng, các ứng dụng của mô hình mạng P2P, sao lưu dữ liệu phân tán, đặc biệt mô hình sử dụng cache Từ đó đề xuất giải pháp sao lưu dữ liệu phân tán có cache dựa trên P2P, thử nghiệm giải pháp và ứng dụng thử nghiệm giải pháp này trong việc truyền phát Audio và Video trên mạng Internet tại Đài PT TH Hà nội.-

Luận văn được chia thành bốn chương:

Chương 1 : Giới thiệu

Chương 2 Tổng quan về công nghệ :

Chương 3 Ứng dụng thử nghiệm iải pháp sao lưu dữ liệu : g phân tán trên dựa trên mạng P2P trong việc triển khai hệ thống thông tin

Chương 4 : Kết luận

Để hoàn thành luận văn tôi xin chân thành cảm ơn TS Hà Quốc Trung, người

đã nhiệt tình hướng dẫn giúp tôi hoàn thành tốt luận văn này

Trang 8

MỤC LỤC

Lời mở đầu 4

MỤC LỤC 6

CHƯƠNG I GIỚI THIỆU 8

1.1 Kiến trúc Client/Server 8

1.1.1 Mô hình Client /Server thông thường 8

1.1.2 Mô hình Client/Server mở rộng 9

1.2 Kiến trúc Peer to Peer (Mạng ngang hàng) 10

1.2.1 Mạng ngang hàng không có cấu trúc (Pure Peer- - to peer Systems) 10

1.2.2 Mạng ngang hàng có cấu trúc (Structured) 11

1.3 So sánh kiến trúc Client/Server và Peer to Peer 12

Bảng 1.1 So sánh kiến trúc Client/Server và Peer to Peer 12

1.4 Sao lưu phân tán dựa trên P2P 13

CHƯƠNG II : TỔNG QUAN VỀ CÔNG NGHỆ 14

2.1 Công nghệ sao lưu phân tán 14

2.1.1 Khái niệm chung 14

2.1.2 Sao lưu phân tán trong hệ thống Client/Server: 14

2.1.3 Sao lưu phân tán trong hệ thống P2P 15

2.1.4 Các bài toán áp dụng giải pháp sao lưu dữ liệu phân tán trên P2P 16

2.1.4.1 Dạng dữ liệu thô 16

2.1.4.2 Dạng dữ liệu Dòng (Streaming data) 16

2.1.4.3 Bài toán sa o lưu phân tán sử dụng GIS 18

2.2 Các mô hình Client- Server 20

2.2.1 Hệ thống truyền file FTP (File Transfer Protocol) 20

2.2.2 Proxy ngược (Reverse Proxy) 24

2.2.3 Mô hình Cache 25

2.3 C ông nghệ Peer to Peer (P2P) 27

2.3.1 Giới thiệu về mạng ngang hàng (peer to peer – P2P) 27

2.3.1.1 Khái niệm cơ bản 27

2.3.1.2 Đặc điểm của các mạng ngang hàng 27

2.3.1.3 Tiện ích mạng P2P mang lại 28

2.3.1.4 Những khó khăn trong thiết kế mạng ngang hàng 28

2.3.1.5 Các ứng dụng mạng ngang hàng 30

2.3.2 Mô hình mạng P2P tiên tiến 30

2.3.2.1 Kiến trúc siêu ngang hàng (Super- peer Architecture) 31

2.3.2.2 Mạng siêu ngang hàng dư (Super -peer Redundancy) 33

2.3.2.3 Ưu điểm và nhược điểm của kiến trúc siêu ngang hàng 34

2.3.3 Một số ứng dụng chia sẻ file ngang hàng 36

CHƯƠNG III ỨNG DỤNG GIẢI PHÁP SAO LƯU DỮ LIỆU PHÂN TÁN DỰA TRÊN MẠNG P2P TRONG VIỆC TRIỂN KHAI HỆ THỐNG THÔNG TIN 40

3.1 Giải pháp sao lưu dữ liệu phân tán dựa trên mạng P2P 40

3.1.1 Mô hình hệ thống : 40

3.1.2 Cơ chế hoạt động và các chức năng của phân hệ 40

3.2 Thử nghiệm giải pháp 45

3.2.1 Kịch bản và mô hình thử nghiệm 45

3.2.1.1 Kịch bản thử nghiệm 45

Trang 9

3.2.1.2 Mô hình thử nghiệm 46

3.2.2 Dự kiến kết quả thử nghiệm 48

3.2.3 Đánh giá mô hình thử nghiệm 50

3.3 Ứng dụng thử nghiệm giải pháp cho hệ thống thông tin tại Đài PT TH Hà nội - 52

3.3.1 Mô hình thử nghiệm Hệ thống sao lưu phân tán video sử dụng mạng ngang hàng Sopcast 52

3.3.2 Mục đích hệ thống 54

3.3.3 Kịch bản thử nghiệm 54

3.3.4 Kết quả thử nghiệm 56

Chương 4 : Kết luận 57

Tài liệu tham khảo 58

Trang 10

CHƯƠNG I GIỚI THIỆU

Internet ngày nay đã thay đổi và phát triển nhiều nhưng chủ yếu phát triển,vận hành theo 2 mô hìnhphổ biến cơ bản là Client/Server và Peer-to- er, Pe có những

mô hình lai kết hợp kết hợp cả 2 mô hình cơ bản này Đối với những bài toán triểnkhai trên diện rộng, dữ liệu dung lượng lớn, phục vụ số lượng truy cập cùng lúc nhiều thì sử dụng mô hình mạng ngang hàng sẽ đem lại hiệu quả cao hơn về mặthiệu năng, còn mô hình Client/Server thường được áp dụng đối với hầu hết các bàitoán còn lại Các giải pháp s ao lưu dữ liệu phân tán ứng dụng trong các mô hình trên nhằm giải quyết các bài toán chia và sao về sẻ lưu dữ liệu phân tán Ngày nay, con người sử dụng các dạng dữ liệu dung lượng lớn ngày càng nhiều nên để đápứng các nhu cầu này thì các hệ thống mới xu có hướng thường sử dụng các giảipháp sao lưu dữ liệu trên mạng ngang hàng

1.1 Kiến trúc Client/Server

1.1.1 Mô hình Client/Server thông thường

Mô hình Client-Server thông thường là một mô hình rất phổ biến trong mạng máy tính, nó là mô hình 2 tầng, được áp dụng rất rộng rãi và là mô hình của mọi trang web hiện có

Trang 11

Ý tưởng của mô hình này là các máy con (đóng vài trò là máy khách) gửi một yêu cầu (request) đến máy chủ (đóng vai trò người cung ứng dịch vụ), máy chủ

sẽ xử lý và trả kết quả về cho máy khách

Một mô hình ngược lại là mô hình Master Slaver, trong đó máy chủ (đóng vai trò ông chủ) sẽ gửi dữ liệu đến máy con (đóng vai trò nô lệ) bất kể máy con có cần hay không

-1.1.2 Mô hình Client/Server mở rộng

1.1.2.1 Mô hình kiến trúc tầng:3

Ta có thể tránh được các vấn đề của kiến trúc client/server hai tầng bằng cách mở rộng kiến trúc thành ba tầng Một kiến trúc ba tầng có thêm một tầng mới tách biệt việc xử lý dữ liệu ở vị trí trung tâm

Theo kiến trúc ba tầng, một ứng dụng được chia thành ba tầng tách biệt nhau

về mặt logic Tầng đầu tiên là tầng trình diễn thường bao gồm các giao diện đồ họa Tầng thứ hai, còn được gọi là tầng trung gian hay tầng tác nghiệp Tầng thứ ba chứa

dữ liệu cần cho ứng dụng Tầng thứ ba về cơ bản là chương trình thực hiện các lời gọi hàm để tìm kiếm dữ liệu cần thiết Tầng trình diễn nhận dữ liệu và định dạng nó

để hiển thị Sự tách biệt giữa chức năng xử lý với giao diện đã tạo nên sự linh hoạt cho việc thiết kế ứng dụng Nhiều giao diện người dùng được xây dựng và triển khai mà không làm thay đổi logic ứng dụng

Tầng thứ ba chứa dữ liệu cần thiết cho ứng dụng Dữ liệu này có thể bao gồm bất kỳ nguồn thông tin nào, bao gồm cơ sở dữ liệu như Oracale, SQL Server hoặc tài liệu XML

1.1.2.2 Kiến trúc n tầng

-Kiến trúc n tầng được chia thành các tầng như sau:

Tầng giao diện người dùng: quản lý tương tác của người dùng với ứng dụng

- Tầng logic trình diễn: Xác định cách thức hiển thị giao diện người dùng và các yêu cầu của người dùng được quản lý như thế nào

Trang 12

- Tầng logic tác nghiệp: Mô hình hóa các quy tắc tác nghiệp,

- Tầng các dịch vụ hạ tầng: Cung cấp một chức năng bổ trợ cần thiết cho ứng dụng như các thành phần (truyền thông điệp, hỗ trợ giao tác)

• Ưu điểm của hệ thống Client/Server:

Ưu điểm chính của hệ thống máy tính tập trung là sự đơn giản của nó Vì tất

cả dữ liệu đều được tập trung tại một vị trí nên việc quản lý hệ thống máy tính tập trung là dễ dàng Đồng thời, hệ thống này cũng không gặp phải những vấn đề về tính nhất quán và chặt chẽ của dữ liệu Hệ thống máy tính tập trung cũng tương đối

dễ bảo mật vì chỉ có một host cần phải bảo vệ

• Nhược điểm của hệ thống Client/Server:

Trở ngại của hệ thống này cũng chính bởi mọi thông tin đều tập trung tại Server Do đó, Server là một điểm có thể gây lỗi trầm trọng cho hệ thống vì nếu Server gặp trục trặc, toàn bộ các ứng dụng client nối với Server cũng sẽ gặp trục trặc theo Server cũng là nơi làm đình trệ hiệu năng của hệ thống Mặc

dù kiến trúc Client/Server được chấp nhận rộng rãi tại các web-server hay các database-server nhưng nhược điểm về tính mở rộng và tỉ lệ gặp lỗi làm cho hệ thống này không thích hợp với việc triển khai ứng dụng phân tán đa năng

1.2 Kiến trúc Peer to Peer (Mạng ngang hàng)

1.2.1 Mạng ngang hàng không có cấu trúc (Pure Peer-to- peer Systems)

Trong hệ thống này, tất cả các máy đều được nối với nhau Mỗi máy trong hệ thống được gọi là một nút mạng (peer), chúng có vai trò như nhau Trong toàn bộ hệ thống, không có một máy nào giữ vai trò điều khiển Hoạt động của hệ thống dựa trên các trao đổi trực tiếp giữa các peer nhờ những liên kết được thiết lập giữa các peer tương ứng

Ưu điểm của hệ thống ngang hàng thuần túy là khả năng mở rộng được, bất

kỳ nút nào cũng có thể tham gia vào mạng và sau đó, có thể truyền dữ liệu với các nút khác

Trang 13

Tuy nhiên, hệ thống này lại bộc lộ nhược điểm: trong một hệ thống, có quá nhiều liên kết được thiết lập, mỗi một peer sẽ nối với (N 1) peer còn lại (với N là số -máy trong mạng)

Trong trường hợp tại cùng một thời điểm, một peer A nào đó nhận được các yêu cầu của tất cả (N-1) peer còn lại, hiện tượng quá tải sẽ xảy ra, điều này còn thể làm cho mạng gặp sự cố

1.2.2 Mạng ngang hàng có cấu trúc (Structured)

Trong hệ thống này, mỗi máy đều được nối với tất cả các máy khác trên mạng, cách nối này mang đặc điểm của hệ thống ngang hàng thuần túy

Tuy nhiên, vẫn có một máy đóng vai trò Server trung tâm, Server này điều

khiển hoạt động của mạng như một phần tử có thể kiểm soát toàn bộ các máy khác, đảm bảo tính chặt chẽ của thông tin trên mạng, đây là đặc điểm của hệ thống tập trung Tất cả các luồng dữ liệu thông thường đều được truyền trực tiếp giữa các peer, chỉ các luồng thông tin điều khiển mới được truyền qua Server trung tâm

Những nhược điểm của việc quản lý điều khiển tập trung vẫn tồn tại trong hệ thống này Nếu Server trung tâm gặp lỗi, hệ thống sẽ mất khả năng tác động tới những thay đổi trong luồng dữ liệu Tuy nhiên, những ứng dụng đang có sẽ không chịu ảnh hưởng của lỗi server trung tâm vì luồng dữ liệu giữa các peer vẫn tiếp tục

Peer

Hình 1.2: Hệ thống ngang hàngthuần tuý

Trang 14

được truyền mà không quan tâm tới liệu Server trung tâm có đang làm việc hay không

Độ an toàn và bảo mật kém, phụ thuộc vào mức truy nhập được chia sẻ

Độ an toàn và bảo mật cao gần như Client- Server.

Khả năng cài đặt Khó cài đặt Dễ cài đặt Khó cài đặt Đòi hỏi về phần

cứng và phần mềm

Đòi hỏi có máy chủ, hệ điều hành mạng và các phần cứng bổ sung

Không cần máy chủ, hệ điều hành mạng, phần cứng bổ sung rất ít

Như Server

Client-Quản trị mạng Phải có quản trị mạng Không cần có quản trị

mạng Như Client-Server

Xử lý và lưu trữ tập

Chi phí cài đặt Cao Thấp Cao

Bảng 1.1 So sánh kiến trúc Client/Server và Peer to Peer

PeerPeer

Center Server

Hình 1.3: Hệ thống ngang có cấu trúc

Trang 15

1.4 Sao lưu phân tán dựa trên P2P

Lý do sử dụng sao lưu phân tán trên P2P

- Do nhu cầu con người cần dữ liệu dung lượng lớn ngày càng nhiều và số lượng người sử dụng ngày càng tăng, dẫn đến cần phải có phương pháp truyền dữ liệu nhanh, số lượng lớn và hiệu quả hơn

- Do áp dụng trên mạng P2P sẽ khắc phục nhược điểm tắc nghẽn mạng ở nút

cổ chai

- Tận dụng tài nguyên mạng, năng lực xử lý và lưu trữ của các máy tính Client

- Giảm tải cho Server, năng lực xử lý và băng thông máy chủ không đủ để đáp ứng khối lượng dữ liệu lớn và lượng truy cập nhiều cùng lúc

Sao lưu phân tán dựa trên P2P là gì ?

Sao lưu phân tán là phương pháp tạo các bản sao và lưu phân tán trên các nút mạng (gọi là các peer) bằng cách chia nhỏ nội dung đó ra thành nhiều mảnh rồi truyền và lưu giữ trên mọi peer, các peer sau khi nhận được các mảnh dữ liệu đến lượt mình sẽ truyền tiếp các mảnh dữ liệu đó đến các peer lân cận theo một thuật toán nào đó Quá trình sao lưu kết thúc khi các mảnh đó được truyền hết và được ghép lại thành nội dung hoàn chỉnh

Giải pháp này thường không sử dụng nhiều Server phức tạp mà thay vào đó

các tính toán và phân bổ dữ liệu đều dự trên Client

Trang 16

CHƯƠNG II : TỔNG QUAN VỀ CÔNG NGHỆ

2.1 Công nghệ sao lưu phân tán

2.1.1 Khái niệm chung

Sao lưu phân tán là phương pháp tạo các bản sao và lưu phân tán trên một hoặc nhiều máy tính qua mạng bằng cách chia nhỏ nội dung đó ra thành nhiều mảnh, quá trình sao lưu kết thúc khi các mảnh đó được truyền hết và được ghép lại thành nội dung hoàn chỉnh

2.1.2 Sao lưu phân tán trong hệ thống Client/Server:

Trong các hệ thống phân tán dựa trên mô hình Client/Server hiện nay đa phần đều dùng Cache Có thể là cache tại Client, cache tại Server gốc hoặc cache tại máy chủ trung gian Hệ thống có cache như vậy là một hệ thống sao lưu dữ liệu

Trang 17

phân tán hiệu quả

Khi Client truy vấn đến hệ thống thì dữ liệu được lấy hoặc trực tiếp tại Local hoặc yêu cầu Server đáp ứng

Ví dụ, trong các ứng dụng web, các bản sao (cache) đóng vai trò quan trọng cho các dịch ụv web, giúp trang web hoạt động nhanh, hiệu quả và công nghệ sao lưu phân tán đã được sử dụng rộng rãi ong các tổ chức (trường đại học, tr các cơ quan chính phủ, các công ty và nhà cung cấp dịch vụ Internet)

Các công ty, tổ chức thường triển khai các máy chủ chuyên cache đặt tại các nhà cung cấp dịch vụ mạng (ISPs) Trong trường hợp một Client yêu cầu 1 đối tượng, nếu đối tượng đó đã được yêu cầu bởi một Client khác trong quá khứ thì đã

có 1 bản sao trên Proxy vì thế Client không cần thiết phải truy vấn đến máy chủ chứa dữ liệu chính mà chỉ cần lấy đối tượng từ Proxy server đã cache

Giải pháp này rất hiệu quả và được sử dụng trong hầu hết các mô hình mạng hiện nay Ví dụ, để tăng tốc độ truy cập và để giảm lưu lượng mạng Internet quốc

tế, các ISP Việt nam đã cho phép Google được đặt các máy chủ DNS, máy chủ tìm kiếm và máy chủ Video hỗ trợ cache cho Youtube, vì lưu lượng liên quan đến các dịch vụ này chiếm hầu hết băng thông quốc tế

2.1.3 Sao lưu phân tán trong hệ thống P2P

Trong mô hình mạng P2P, các bản sao được lưu trữ phân tán trên các máy client Khi có một Client có yêu cầu tải một đối tượng nào đó thì tất cả các máy Client có chứa đối tượng đó sẽ phân chia đối tượng đó thành các mảnh, truyền cho client có yêu cầu, sau khi truyền xong sẽ ghép lại thành một đối tượng hoàn chỉnh

Mô hình này phù hợp với việc chia sẻ các đối tượng có dung lượng lớn, số lượng client truy cập cùng lúc nhiều Ví dụ như các dịch vụ trực tuyến, truyền video, truyền file, …

Ban đầu, khi nút tham gia một mạng ngang hàng nó được xếp vào bảng , cấu trúc dữ liệu DHT cần thiết để hỗ trợ các dịch vụ truy vấn và dịch vụ khác Tuy

Trang 18

nhiên, không gian bộ nhớ cache của nó là trống rỗng và không có bản sao của bất

kỳ tập tin nào Tiếp theo, khi một truy vấn được thực hiện, hệ thống sẽ đưa ra quyết định có bao nhiêubản sao của các đối tượng yêu cầu được tạo ra, và peer nào dọc theo con đường định tuyến (truy vấn) được lựa chọn cho bộ nhớ đệm iệc Vnày được thực hiện bằng các thuật toán xác định vị trí bộ nhớ cache

Đối với hệ phân tán P2P, bộ nhớ đệm là cơ chế hiệu quả để giảm số lượng truyền tải dữ liệu trên các đường trục Internet, và cải thiện tốc độ truy cập của người

sử dụng

2.1.4 Các bài toán áp dụng giải pháp sao lưu dữ liệu phân tán trên P2P

Đối với từng loại dữ liệu khác nhau sẽ có các giải pháp sao lưu dữ liệu khác nhau

2.1.4.1 Dạng dữ liệu thô

Dữ liệu thô là loại dữ liệu chưa qua xử lý, chúng có thể tồn tại ở Client hoặc

ở trên server Các dữ liệu thô này có thể là các con số như : có bao nhiêu người viếng thăm website, họ đã ghé thăm trang nào, nơi họ truy cập ở trang, họ rời trang của bạn ở đâu Các dữ liệu thô được phân tán ở khắp các client trong mạng, giá trị của chúng được phát huy trong cách thu thập dữ liệu, tổng hợp và xử lý chúng cho những bài toán cụ thể

Ví dụ như các bài toán thu thập dữ liệu để đánh giá, xác định, biết trước nhu cầu, xu hướng người dùng

2.1.4.2 Dạng dữ liệu Dòng (Streaming data)

Với những tiến bộ trong công nghệ băng thông rộng truy cập Internet và các

kỹ thuậtmã hóa,dịch vụ video trực tuyến đã trở nên ngày càng phổ biến Theo truyền thống, các dịch vụ video trực tuyến được triển khai trong kiến trúc client/server Tuy nhiên, kiến trúc tập trung này không thể cung cấp trực tuyến một

số lượng lớn người sử dụng do sự quá tải của máy chủ Công nghệ Peer-to-Peer

Trang 19

(P2P) gần đây đã trở thành một công nghệ đầy hứa hẹn, cung cấp dịch vụ nhanh chóng Video truyền trực tiếp và dịch vụ Video on Demand (VoD) phục vụ cho một

số lượng lớn người sử dụng đồng thời trên mạng toàn cầu Hệ thống P2P trựctuyến có thể được phân thành hệ thống truyền trực tiếp trên P2P và các hệ thống Video theo yêu cầuP2P chạy trên P2P

Các Đài Truyền hình có thể sử dụng giải pháp này để phân phối video cho người xem

2.1.4.2.1 Dòng video trực tiếp (live)

Trong một hệ thốngP2Ptruyền dòng video trực tiếp, Video được phát đồng

bộ, trực tiếp chotất cả người dùng cùng lúc theo thời gian thực

Tùy thuộc vào các phương pháp tiếp cận xây dựng lớp phủ, hệ thống truyền dòng trực tiếp P2P có thể được phân loại thành hệ thống truyền dòng trực tiếp P2Pdạng cây và cáchệ thống truyền dòng trực tiếp dựa trênP2Pdạng lưới

Đối với hệ thống truyền dòng trực tiếp P2P dạng cây, các dòng video được phân phối qua một cây lớp ứng dụng đơn hoặc nhiều cây lớp ứng dụng

Đối với hệ thống truyền dòng trực tiếp P2P dạng lưới, mỗipeertrao đổi dữ liệu với một tập hợp các máy bên cạnh

Có thể áp dụng cho các Đài Truyền hình như 1 kênh phát sóng

2.1.4.2.2 Video on Demand (VoD)

Trong một hệ thống P2P VoD, người dùng có thể chọn bất kỳ video mà họthích và bắt đầu xem nó ở bất kỳ thời điểm nào Video sẽ được phát không đồng bộ cho nhiều người dùng ở những khoảng thời gian khác nhau Các dịch vụ VoD cung cấp linh hoạt và tương tác hơn với người sử dụng Tùy thuộc vào phương pháp tiếp cận, hệ thống VoD P2Pcó thể được phân loại thành các hệ thống bộ đệm chuyển tiếp, các hệ thống lưu trữ chuyển tiếp và các hệ thống hybrid chuyển tiếp Trong các hệ thống VoD P2P, chương trình tìm nạp trướccho phép các peer được download các phân đoạn trong tương tính lai từ vị trí phát hiện hành, do đó tăng tính liên tục phát lại

Trang 20

2.1.4.3 Bài toán sao lưu phân tán sử dụng GIS

2.1.4.3.1 GIS là gì ?

GIS là hệ thống thông tin địa lý, là công cụ máy tính bao gồm tập hợp phần cứng, mạng, phần mềm máy tính và dữ liệu địa lý nhằm chụp hình, quản lý, phân tích và hiển thị tất cả các dạng của thông tin liên quan đến địa lý

G, I, Svà

• G: geographic – thuộc địa lý:

– Dữ liệu không gian – Các thành phần liên quan đến địa lý

• I: information – thông tin:

– Cơ sở dữ liệu – Hiển thị thông tin

• S: systems – Các hệ thống

– Người sử dụng – Phần cứng – Phần mềm

2.1.4.3.2 Các thành phần cấu thành của GIS

hệ thống chứa dữ liệu khổng lồ với lượng người sử dụng lớn, điều đó sẽ khiến cho các Server quá tải khi phải đáp ứng các truy vấn về các dữ liệu hình ảnh

Trang 21

2.1.4.3 3. Ví dụ về hệ thống Gis sử dụng giải pháp sao lưu dữ liệu phân tán trên

P2P:

Ví dụ về việc khi người dùng xem bản đồ về 1 vùng địa lý nào đó, dữ liệu sẽ được tải trực tiếp từ Server về máy client, khi người dùng di chuyển màn hình để xem đi xem lại ở 1 số địa điểm nào đó thì theo cách thông thường server phải tải liên tục lặp đi lặp lại dữ liệu hình ảnh đó về máy client Nếu làm như vậy thì sẽ tốn băng thông và client sẽ phải chờ thời gian tải lại dữ liệu và nếu nhiều người dùng cùng xem 1 địa điểm như vậy thì Server sẽ bị quá tải gây đình trệ hệ thống

Vậy giải pháp đặt ra với bài toán này là sử dụng giải pháp sao lưu dữ liệu phân tán dựa trên P2P

Nếu người sử dụng truy cập vào 1 vùng địa lý nào đó lần đầu thì áp dụng giải pháp cache dữ liệu tại máy client Khi đó hệ thống sẽ cache lại những dữ liệu client

đã xem hoặc là sẽ tải trước về máy client toàn bộ các lớp hình ảnh trong vùng dữ liệu mà client định xem Như vậy, trong quá trình sử dụng nếu client xem lại các dữ liệu hình ảnh đó thì dữ liệu được hiển thị ra ngay từ cache ở máy client

Nếu có nhiều người cùng truy cập vào hệ thống thì hệ thống sẽ sử dụng cache trên P2P; tức là nếu client truy cập lần đầu vào 1 vùng dữ liệu hình ảnh nào

đó thì đầu tiên nó sẽ tìm trong cache của chính nó, nếu không có nó sẽ tìm trong các máy client có chứa cache vùng dữ liệu đó và tải về cache tại máy mình rồi sau đó hiển thị

Trong bài toán Gis có một đặc trưng là hệ thống có thể xác định được các máy client đang truy cập vào cùng một vùng dữ liệu hình ảnh hoặc các vùng lân cận, từ đó hệ thống có thể sẽ cache trước về máy client Ví dụ như trong những bài toán mô phỏng thế giới thực dạng 3D và hiển thị trong xe ô tô cho các tài xế biết trước quãng đường đi của mình

Trang 22

2.2 Các mô hình Client-Server

2 .2.1 Hệ thống truyền file FTP (File Transfer Protocol)

FTP thường được dùng để trao đổi tệp tin qua mạng Internet sử dụng giao thức TCP/IP Hoạt động của FTP cần có hai máy tính, một máy chủ và một máy khách) Máy chủ FTP, dùng chạy phần mềm cung cấp dịch vụ FTP, gọi là trình chủ, lắng nghe yêu cầu về dịch vụ của các máy tính khác trên mạng lưới Máy khách chạy phần mềm FTP dành cho người sử dụng dịch vụ, gọi là trình khách, khởi động một liên kết với máy chủ Một khi hai máy đã liên kết với nhau, máy khách có thể

xử lý một số thao tác về tập tin, như tải tập tin lên máy chủ, tải tập tin từ máy chủ xuống máy của mình, đổi tên của tập tin, hoặc xóa tập tin ở máy chủ v.v

Phương thức truyền File :

Có 3 phương thức truyền dữ liệu thông qua FTP:

- Truyền dữ liệu theo chế độ dòng hệ thống chuyển các tập tin ; theo một dòng liên tục từ máy này sang máy kia mà không can thiệp hoặc xử lý thông tin vào các file với những định dạng khác nhau Ví dụ, trong trường hợp truyền dữ liệu giữa hai máy tính với hệ điều hành giống hệt nhau, FTP không cần phải sửa đổi các tập tin

- Truyền theo chế độ khối FTP phân chia các dữ liệ cần chuyển vào các : u khối thông tin, gồm một tiêu đề, số lượng byte, và các dạng dữ liệu

- Truyền theo chế độ nén FTP nén các tập tin bằng cách mã hóa chúng.:

Có 2 chế độ kết nối giữa Client và Server là : Active FTP và Passive FTP

FTP ServerClient

INTERNET

Hình 2.2 : Mô hình kết nối FTP từ Client tới Server

Trang 23

FTP là một giao thức truyền file chỉ sử dụng giao thức TCP không sử dụng UDP FTP là một dịch vụ đặc biệt ở chỗ nó sử dụng hai cổng, một cổng cho dữ liệu

và cổng cho chỉ thị lệnh (còn được gọi là các cổng kiểm soát) Thông thườn cácg, cổng 21 chocổng lệnh và cổng20 chocổng dữ liệu.Tuy nhiên, tùy thuộc vào từng chế độ, các cổng dữ liệu có thể không sử dụng cổng 20

Active FTP

Trong chế độ Active, FTP client kết nối từ một cổng ngẫu nhiên không có đặc quyền (N> 1023) đến cổng lệnh của máy chủFTP, port 21 Sau đó, client bắtđầu lắng nghe cổngN +1 và gửi lệnhFTP PORT N +1đến FTP server Máy chủsau đó sẽ kết nối trở lại cổng dữ liệu quy định của client từ cổng dữ liệu địa phương,

đó là cổng 20

Từ quan điểm của các bức tường lửa phía máy chủ, hỗ trợ chế độ active FTPcác kênh truyền thông sau đây cần phải được mở ra:

- Mở ổ c ng 21 của FTP server từ mọi nơi (Client khởi tạo kết nối)

- Mở cổng 21 của FTP server cho cổng 1023 Client kết nối tới > (Server đáp ứng các cổng kiểm soát của Client)

- Mở cổng 2 của FTP0 server kết nối đến cổng > 1023 (Server khởi tạo kết nối dữ liệu đến cổng dữ liệu của client)

- Mở cổng 2 của FTP0 server từ cổng > 1023 của Client (Client gửi ACKs đến cổng dữ liệu của server)

Trang 24

lệnh của Client liên lạc với cổng lệnh của server và gửi lệnh qua cổng 1027 Sau đó Server sẽ gửi một ACK trở lại cổng lệnh của client trong bước 2 Ở bước 3, Server khởi tạo một kết nối trên cổng dữ liệu cục bộ của nó đến cổng dữ liệu Client được quy định trước đó Cuối cùng, Client gửi một ACK trở lại như trong bước 4.

Vấn đề chính với chế độ active FTP là ở phía client FTP client không tạo kết nối thực sự vào cổng dữ liệu của Server - nó chỉ đơn giản là nói cho server biết cổng nào nó đang lắng nghe và Server kết nối trở lại ổng đã c quy định trên máy Client Passive FTP

Trong chế độ thụ động FTP client khởi tạo cả hai kết nối đến máy chủ, giải quyết cácvấn đề bức tường lửa lọc các cổng kết nối dữ liệu đến cho Client máy từchủ Khi mở một kết nốiFTP, client sẽ mở hai cổng ngẫu nhiên không có đặc quy ền cục bộ (N 1023 và N +1) Các địa chỉ liên lạc cổng đầu tiên trên cổng 21 của Server, nhưng thay vì sau đó ban hành một lệnh PORT và cho phép các máy chủ

để kết nối đến cổng dữ liệu của nó, client ban hành sẽ lệnh PASV

Kết quả của việc này là máy chủ sau đó sẽ mở ra một cổng ngẫu nhiênkhông có đặc quyền (P> 1023) và gửi lệnh PORT P lại cho Client Client sau đóđưa ra sự kết nối từ cổng N +1vào cổng trên máy chủ để truyền dữ liệu P

Hình 2.4 : Mô hình kết nối Passive FTP

Trang 25

- Mở ổc ng 21 của FTP server từ bất cứ nơi nào (Client khởi tạo kết nối)

- Mở ổc ng 21 của FTP server để kết nối đến cổng> 1023 của Client (Server đáp ứng các cổng kiểm soát của Client)

- Mở ổc ng > 1023 của FTP server từ bất cứ nơi nào (Client khởi tạo kết nối

dữ liệu đến cổng ngẫu nhiên theo quy định của áy chủ) m

- Mở cổng > 1023 của FTP server từ cổng> 1023 của Client (Server gửiACKs (và dữ liệu) đếncổng dữ liệu của Client)

Trong bước 1, Client liên lạc với Server qua cổng lệnh và đưa ra lệnhPASV.Các Server sau đó sẽ trả lời ở bước 2 với PORT 2024, nói với Client cổng nó đang lắng nghe cho cáckết nối dữ liệu Trong bước 3 Client sau đó khởi tạo kết nối dữliệu từ cổng dữ liệu của nó đến cổng dữ liệu đã được xác định trên máy chủ Cuối cùng, Server sẽ gửi lại một ACK trong bước 4 đến cổng dữ liệu của Client

Khi chế độ bị động FTP giải quyết nhiều vấn đề từ phía Client, nó mở ra cả một loạt các vấn đề ở phía máy chủ Vấn đề lớn nhất là sự cần thiết để cho phép bất

kỳ kết nối từ xa nào đến cổng đánh số thứ tự cao trên máy chủ May mắn thay,nhiều FTP daemon, bao gồm WU-ftpd phổ biến cho phép người quản trị xácđịnh một loạt các cổng mà Server FTPsẽ sử dụng

Vấn đề thứ hai liên quan đến việc hỗ trợ và xử lý sự cố Client màhỗ trợ (hoặc không hỗ trợ) chế độ thụ động Ví dụ,cáctiện ích dòng lệnh FTP được cung cấp với Solaris không hỗ trợ chế độ thụ động, cần phải có một Client FTP của bên thứ ba, chẳng hạn như ncftp

Với sự phổ biến lớn củaWorld Wide Web, nhiều người thích sử dụng trình duyệt web như là một Client FTP.Hầu hết các trình duyệt chỉ hỗ trợ chế độ thụ động khi truy cập vàocác URL ftp:// Điềunàycó thể là tốt hay xấu tùy thuộc vàonhững gì các Server và tường lửa được cấu hình để hỗ trợ

Active FTP là có lợi cho người quản trị máy chủ FTP, nhưng bất lợi cho các admin phía Client Các máy chủ FTP cố gắng tạo các kết nối cho các cổng mức cao ngẫu nhiên trên máy Client, gần như chắc chắn sẽ bị chặn bởi một bức tường lửa ở phía Client Passive FTP là có lợi cho Client, nhưng bất lợi cho người quản trị máy

Trang 26

chủ FTP Các Client sẽ tạo cả hai kết nố đến máy chủ, nhưng một trong số đó sẽ là i một cổng mức cao ngẫu nhiên, gần như chắc chắn sẽ bị chặn bởi một bức tường lửa ở phía máy chủ.

Vì vậy khi quản trị máy chủ chạy FTP thì việc cần phải làm là cấu hình cho máy chủ và xác định số lượng lớn nhất các Client kết nối đến và Server gần như chắc chắnsẽ phải hỗ trợ Passive FTP Khi đó ta cần xác định giới hạn các cổng trên máy chủ đủ để cho việc kết nối với số lượng các client hiện có, các cổng còn lại sẽ bị chặn bởi Firewall Việc giới hạn này tuy không loại bỏ tất cả các nguy cơ

có thể đến với máy chủ nhưng nó cũng đã giảm đi rất nhiều nguy cơ có thể xảy ra

2.2.2 Proxy ngược (Reverse Proxy)

Proxy ngược là một loại máy chủ proxy đại diện cho các Client kết nối tớimáy chủ Nó là phần mềm proxy cho Server sử dụng giao thức HTTP

Nó là một cổng vào ra cho HTTP Server hoặc HTTP Server farm và địa chỉ

IP của nó là địa chỉ IP cuối cùng truy cập hệ thống Server bên trong

Hình 2.5 Mô hình Reverse Proxy

Trang 27

Reverse Proxy kết hợp chặt chẽ với các firewall để đảm bảo chỉ có Reverse Proxy mới được truy cập vào các máy chủ bên trong Nếu nhìn từ bên ngoài, Reverse Proxy chính là HTTP Server (máy chủ gốc)

Ưu điểm của Reverse Proxy

- Che giấu sự tồn tại và đặc điểm của máy chủ gốc, nhờ đó hạn chế các dò tìm, tấn công từ bên ngoài vào các server bên trong

- Các ứng dụng tường lửa cài trên nó có thể chống lại được các tấn công dựa trên nền web phổ biến vào các server gốc

- Giảm tải cho Máy chủ gốc bằng bộ nhớ đệm nội dung tĩnh hoặc động Nó có thể đáp ứng số lượng đáng kể các yêu cầu trang web giúp giảm tải trên máy chủ gốc

- Reverse Proxy có thể tối đa hóa nội dung bằng cách nén nó lại để tăng tốc độ tải

- Dễ dàng đổi tên hay thay thế các Server gốc bên trong nhờ tính năng ánh xạ ngược của Reverse Proxy

Trong quá trình Client truy vấn tới server, nếu hệ thống có cache ở khâu nào

đó sẽ giúp hoạt động của hệ thống hiệu quả hơn; Client truy xuất đến dữ liệu nhanh hơn, tiết kiệm thời gian truyền, giảm tải cho Server

Trang 28

Ưu điểm của Cache :

- Tăng tốc độ truy cập của Client

Khi Client truy vấn trong hệ thống, tỷ lệ các đối tượng mà client truy vấn được cache cao thì tốc độ uy cập của client tăng tr

- Băng thông của hệ thống tăng

Đối tượng được cache sẽ giúp hệ thống không phải tải đối tượng đó nhiều lần nhờ đó tiết kiệm được băng thông truyền tải

- Giảm tải cho Server

Server sẽ không phải load lại các đối tượng mà Client truy vấn khi đối tượng được cache, nó chỉ load nhưng phần thay đổi của đối tượng

Trang 29

2.3 Công nghệ Peer to Peer (P2P)

2.3.1 Giới thiệu về mạng ngang hàng (peer to peer P2P)

2.3.1.1 Khái niệm cơ bản

Mạng ngang hàng hay còn gọi là mạng đồng đẳng, là một mạng máy tính trong đó hoạt động của mạng chủ yếu dựa vào khả năng tính toán và băng thông của các máy tham gia chứ không tập trung vào một số nhỏ các máy chủ trung tâm như các mạng thông thường

Mạng ngang hàng có nhiều ứng dụng Ứng dụng thường xuyên gặp nhất là : chia sẻ tệp tin, tất cả các dạng như âm thanh, hình ảnh, dữ liệu, hoặc để truyền dữ liệu thời gian thực như điện thoại VoIP

Một mạng ngang hàng đúng nghĩa không có khái niệm máy chủ và máy khách, nói cách khác, tất cả các máy tham gia đều bình đẳng và được gọi là peer, là một nút mạng đóng vai trò đồng thời là máy khách và máy chủ đối với các máy khác trong mạng Tính chất này i lập hoàn toàn với kiến trúc client – server truy n đố ề

thống ơ có ộ n i m t ho ặc một ố điểm s nút c hỉ đóng vai trò cun cấg p dịch vụ (servers)

và các điểm nút còn ại chỉ ử ụ l s d ng dịch vụ (clients)

Không giống nh trong kiư ến trúc client – server, hiệu su t ho t ấ ạ độngchung của ạm ng ngang hàng có xu hướng t ng lên khi gia ng s ă tă ố điểm nút tham gia H u iệ suất này cũng ph thu vào tụ ộc ừng ứng ụng d mạng c thể, ụ vào giao thứcngang hàng và u hình m ng (topology).cấ ạ

2.3.1.2 Đặc điểm của các mạng ngang hàng

Các mạng ngang hàng ngày nay thường mang ột số đặc trưng hổ biếm p n sau:

- Cá điểm nút trongc m ng có th nh n b n ạ ể ậ iết lẫ nhau Nghĩ là cóa m t c ộ ơ

ch ế nào đó giúp cho m ột điểm nút khi tham gia vào m ng ạ có hể xá đị t c nh m ộtmáy khác ũngc là thành viên của m ng T đó ạ ừ chúng có thể đị nh được nhau, vị

g i ử thông điệ ới nhau và n ập t h n thông điệ ừ p t nhau

- c Cá điểm nút o m t tạ ra ộ mạng k t ế nối ả và ở ộ o m t m c ứ trừu ượng cao hơ t n

so với các ơ ấu ổ chứ c c t c nh : t ng l a ư ườ ử (firewall), NAT (Network Address

Trang 30

khác nhau, chịu những ơ c ch t cế ổ hức, iểm soát và gi i h n hoàn k ớ ạ toàn riêng bi t ệTuy nhiên khi ã đ tham gia vào mạng, chúng t ch c sẽ ổ ứ đượ nhữc ng m i ố liên ế k t logic với nhau thông qua việc sử dụng các dịch ụ hoặc ch y v ạ các ứng dụng ở ầ g t ncao h so ơn với nh ng c ch v a ữ ơ ế ừ được nh c t i T o ra m t mắ ớ ạ ộ ạng k n i ết ố logic

gi a nh ng ữ ữ điểm nút b l p hóa trong c m ng riêng b t chính là ý tbị iệt ậ ác ạ iệ ưởng xuyên suốt nhất của k n trúc nga hàng iế ng

- Mỗi điểm nút t nó có th v ự ể ừa đóng vai trò ủa client vừa đóng vai trò ủ c c a server Điều này th hể iện rõ vai trò bình đẳng và độ lậc p của từng điểm nút Mọiđiểm nút ừ v a có th cung p dể cấ ịch vụ cho các iđ ểm nút khác vừ cóa th sể ử ụ d ng

dịch vụ ủa ột c m hay nhi u ề điểm nút còn ại.l

- Xu t hấ iện ộ ố nhó m t s m điểm nút liên ết ớ nha để chia sẻ ữ iệ k v i u d l u và

cộng tác với nhau trong lý xử Đây là s t hự ổ ợp c lại cá đ m nút cóiể nh ng m i ữ ố liên

h ch t ch và mang tính tệ ặ ẽ ương tác ầ g n g i h n ũ ơ trong quá trình ho t ạ động ủa ứ c ng dụng m ng ạ

2.3.1.3 Tiện ích mạng P2P mang lại

- Giúp cho người dùng dễ dàng tìm được dữ liệu cần thiết

- Tận dụng được tiện ích tổng hợp: Nơi lưu trữ, thông tin và chi phí tính toán được phân phối giữa các PEER, làm các máy tính tham gia vào mạng sẽ dễ dàng có được thông tin yêu cầu

- Tăng độ tin cậy

- Chứa đựng rất nhiều thông tin: Trong mạng P2P có rất nhiều các máy tính tham ra vào, bản thân mỗi máy tính đã chứa nhiều thông tin, trong khi đó các công

cụ tìm kiếm chỉ có thể nắm bắt được khoảng 20% nội dung của các Website

2.3.1.4 Những khó khăn trong thiết kế mạng ngang hàng

• Cân đối băng thông: Trong ph l ần ớn các ứng dụng ch y trên mạ ạng nga ng

hàng, do m ỗi điểm nút u đề đóng cả hai vai trò: ient và se er cl rv nên t lỉ ệ s ử dụng

băng thông đầu ra (outbound bandwidth) và b ng thông ă đầu vào (inbound bandwidth) ttại ừng đ ểi m nút là tương i đố cân ằng Tuy nhiên b các nhà cung

c p dấ ịch vụ ạm ng (ISPs) tlại hường triển khai các mạng không i xứng đố trong đó

Ngày đăng: 26/01/2024, 15:56

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w