Sơ đồ một Storage Area Network

Một phần của tài liệu nghiên cứu một số cơ chế bảng băm phân tán trong mạng ngang hàng (Trang 30 - 35)

e) Các chu trình xử lý (Processor Cycles)

Có thể nhận thấy rằng trong các ứng dụng đòi hỏi cần phải có sức mạnh tính tốn người ta thường tìm cách xây dựng các máy tính mạnh, đắt tiền chứ chưa chú trọng vào việc tận dụng khả năng tính tốn của các máy tính được nối mạng. Ngày nay do những u cầu địi hỏi tính tốn hiệu năng cao như các thao tác tính tốn trong tin sinh học, trong tài chính, trong đo lường mà nhiều nghiên cứu ứng dụng mạng ngang hàng vào xử lý tính tốn đã được đưa ra. Bằng việc sử dụng các ứng dụng mạng ngang hàng để bó cụm các chu trình xử lý có thể nhận được khả năng tính tốn ngang bằng với một siêu máy tính đắt tiền. Trong một mạng mỗi máy tính là trong suốt với các máy tính khác và tất cả các node được kết nối mạng sẽ tạo thành một máy tính logic.

1.1.5. Các phương pháp đánh giá mạng ngang hàng

Cộng đồng nghiên cứu peer to peer nói chung sử dụng ba phương pháp để đánh giá, kiểm nghiệm các kết quả nghiên cứu về mơ hình mạng ngang hàng đó là phương pháp phân tích, phương pháp thực nghiệm và phương pháp mơ phỏng.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

26

Người ta tổ chức phân bố các máy trong mạng theo một quy luật toán học nhất định. Căn cứ vào các phép biến đổi tốn học, các định lý, tính chất để phân tích mạng. Phương pháp này thu được độ chính xác rất cao khi đánh giá các tham số của mạng. Tuy vậy nó chỉ thích hợp với mơ hình có topo mạng đơn giản, tn theo quy luật sắp xếp. Nói chung trong thực tế thì mạng rất phức tạp, các điểm trong mạng sắp xếp một cách ngẫu nhiên và mạng thì thường rất lớn. Lúc đó phương pháp phân tích khơng thể đưa ra kết quả chính xác được. Khi dùng phương pháp phân tích thì nhiều tham số phức tạp của mạng bị bỏ qua. Đây là phương pháp được sử dung trong nghiên cứu đánh giá những tham số đơn giản.

b) Phương pháp thử nghiệm

Sử dụng phương pháp phân tích tỏ ra khá phức tạp, một giải pháp được đặt ra là chạy thử nghiệm với hệ thống thực. Nhưng hệ thống P2P có thể gồm có một số lớn các node bất kỳ sự thử nghiệm nào trên thậm chí một quy mơ tương đối nhỏ khoảng vài nghìn node là khơng thực tế thậm chí khơng thực hiện được. Khi đưa những thay đổi vào thử nghiệm như thay đổi giao thức đang chạy trên các node và tôpô của mạng thì sẽ rất khó và thời gian thử nghiệm chắc chắn sẽ lớn. Vì vậy phương pháp này cũng chỉ được thực hiện tại các cơ quan, tổ chức khi cần những kết quả đánh giá một mạng mới. Ví dụ như tổ chức PlanetLab đã cung cấp 753 node tại 363 site để kiểm tra mạng. Các mạng P2P thường có số lượng các node tham gia rất lớn nên phương pháp thử nghiệm gặp rất nhiều khó khăn và ít được dùng.

c) Phương pháp mơ phỏng

Đây là phương pháp có thể giải quyết những khó khăn của các phương pháp trên và trong thực tế hay sử dụng. Người ta xây dựng các phần mềm để mô phỏng mạng, với các tham số đưa vào phần mềm sẽ xử lý đưa ra các kết quả. Căn cứ vào các kết quả đó ta có thể đánh giá chất lượng của một mạng P2P, độ tối ưu của một thuật toán trong mạng. Tuy vậy phương pháp mơ phỏng vẫn cịn tồn tại những hạn chế, do đó nên kết hợp với các phương pháp trên để đánh giá mạng có hiệu quả. Hiện nay có nhiều phần mềm mơ

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

27

phỏng để đánh giá mạng P2P. Mỗi phần mềm mơ phỏng có những đặc điểm riêng và phương thức mô phỏng riêng, tuỳ vào từng trường hợp và mục đích cụ thể mà ta sử dụng các phần mềm trên để mô phỏng.

Bài luận này sẽ sử dụng phương pháp mô phỏng để nghiên cứu và đánh giá hiệu năng của DHT Chord trong mạng ngang hàng.

1.1.6. Các vấn đề đối với mạng mạng ngang hàng hiện nay

Các hệ thống P2P có nhiều ưu điểm so với các hệ thống client-server truyền thống như tính khả mở, khả năng chịu lỗi, hiệu năng. Tuy nhiên các hệ thống P2P đang phải đối mặt với một số vấn đề:

Bảo mật (security): các cài đặt phân tán phát sinh thêm một số vấn đề bảo

mật so với kiến trúc client-server truyền thống. Bởi vì trong hệ thống P2P các peer là động và không tin tưởng lẫn nhau nên để đạt được mức bảo mật cao trong các hệ thống P2P sẽ khó hơn trong các hệ thống client-server. Các cơ chế bảo mật truyền thống để bảo vệ dữ liệu và hệ thống khỏi tấn công, xâm nhập như firewall không thể bảo vệ thống P2P bởi vì các hệ thống này phân tán và các cơ chế bảo mật có thể ngăn chặn, hạn chế quá trình truyền thơng P2P. Do đó cần đưa ra các khái niệm bảo mật mới cho phép tương tác và xử lý phân tán trong các hệ thống P2P.

Tính tin cậy (reliability): một hệ thống tin cậy là một hệ thống có khả năng hồi

phục sau khi xuất hiện lỗi. Các cơ chế đảm bảo độ tin cậy trong mạng P2P bao gồm nhân bản dữ liệu, phát hiện và khôi phục node bị lỗi, xây dựng nhiều cơ chế đảm bảo thông tin định vị, tránh “single point of failure” và đảm bảo nhiều đường đi tới dữ liệu.

Tính linh hoạt (flexibility): một trong những tính chất quan trọng nhất trong các

hệ thống P2P là các peer tự chủ, chúng có thể join/leave bất kỳ lúc nào. Các hệ thống P2P gần đây có quy mô lớn, điều khiển phân tán và hoạt động trong môi trường động. Để giải quyết vấn đề quy mơ và tính động của các hệ thống P2P, khi xây dựng các hệ thống P2P cần chú ý đến khả năng điều chỉnh và tự tổ chức.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

28

trọng đối với hiệu quả hoạt động của các mạng P2P. Một trong những giải pháp cho vấn đề phân tán này là distributed hash table (DHT). Trong cách tiếp cận này, cân bằng tải được xem xét trên hai khía cạnh: cân bằng khơng gian địa chỉ tức là cân bằng phân phối của không gian key address trên các node và cân bằng item trong trường hợp phân phối của các item trong không gian địa chỉ không thể là ngẫu nhiên. Cân bằng tải giữa các node tính tốn trong hệ thống P2P cũng có thể được cài đặt sử dụng mơ hình tự tổ chức dựa trên agent.

1.2. Bảng băm

1.2.1. Bảng băm (Hash table)

Một hash table là một cấu trúc dữ liệu ánh xạ giữa key và value. Tức là tương ứng với một key, hash table sẽ trả về một value. Để thực hiện việc ánh xạ, hash table sử dụng hash function tính tốn vị trí lưu value dựa trên key. Hash function phải đảm bảo: tránh xung đột và dễ dàng thực hiện. Tránh xung đột nghĩa là ánh xạ giữa không gian key và không gian địa chỉ phải đều và ngẫu nhiên đến mức có thể.

1.2.2. Bảng băm phân tán - Distributed Hash Table (DHTs)

Distributed Hash Table (DHTs) là thuật toán được sử dụng trong các ứng dụng P2P, DHTs cho phép quản lý mạng P2P theo đúng nghĩa với độ tin cậy cao, khả mở, hiệu quả và có khả năng chịu lỗi. (adsbygoogle = window.adsbygoogle || []).push({});

DHTs là một hash table được cài đặt như một hệ thống phân tán. Cũng như một hash table thông thường, DHTs cung cấp ánh xạ từ key đến value. Nhưng không giống như hash table thông thường, các value trong một DHTs được lưu trên các node khác nhau trong mạng chứ không phải lưu trong một cấu trúc dữ liệu cục bộ. Thông qua một key, value tương ứng được lưu tại một node phù hợp trên mạng hoặc được lấy về từ node tương ứng trên mạng.

Trong một DHTs, key được tính ra từ value. Tất cả các key đều nằm trên cùng một không gian địa chỉ. Các ứng dụng file sharing thường sử dụng không gian địa chỉ

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

29

160 bit. Để xác định node nào lưu value nào, mỗi node phải có một ID trong khơng gian địa chỉ giống như không gian địa chỉ của key. Các DHTs đưa ra khái niệm khoảng cách giữa hai ID (một key có thể xem như ID của value). Khi đó value được lưu trên node có ID gần với ID của value nhất.

Để lưu một value trên mạng, một node gửi thông điệp yêu cầu lưu dữ liệu tới một contact phù hợp được chọn ra từ bảng routing table, trong bảng routing table, contact này có ID gần với ID của dữ liệu cần lưu nhất. Quá trình cứ tiếp tục như vậy, thông điệp được chuyển tiếp trên mạng cho đến khi nó gặp node có ID gần với ID của dữ liệu nhất và value được lưu trên node này.

Để tìm một value, thủ tục cũng tương tự, node cần tìm dữ liệu sẽ gửi đi thông điệp tìm kiếm dữ liệu. Sau q trình chuyển tiếp thơng điệp giống như quá trình chuyển tiếp thông điệp lưu dữ liệu, node lưu dữ liệu sẽ được tìm ra và node này sẽ trả dữ liệu cho node tìm kiếm.

Distributed Hash Tables có các ưu điểm khác biệt so với dịch vụ hướng Client - Server truyền thống:

- DHTs cho phép hoạt động phân tán, không cần duy trì một server trung tâm để điều khiển hoạt động của mạng P2P. Cũng vì vậy, các ứng dụng P2P sử dụng DHTs là các ứng dụng P2P thuần túy.

- Hệ thống có tính khả mở, nghĩa là hệ thống vẫn hoạt động tốt ngay cả với số lượng node và lưu lượng trên mạng lớn.

- Tải được cân bằng giữa các peer trong mạng.

- Hệ thống dựa trên giả định rằng mạng không tĩnh và các thay đổi xuất hiện thường xuyên với các node join vào mạng và leave khỏi mạng (còn gọi là churn).

- Việc định tuyến và lấy dữ liệu nhanh và có thể hồn thành trong thời gian tỷ lệ loga.

- Hệ thống mạnh mẽ, nghĩa là nó có thể đứng vững ngay cả khi bị tấn công trên diện rộng. DHTs cung cấp dịch vụ lưu trữ, tìm kiếm dữ liệu thơng qua hai hàm insert và

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

30

lookup.

Một phần của tài liệu nghiên cứu một số cơ chế bảng băm phân tán trong mạng ngang hàng (Trang 30 - 35)