Chƣơng 3 PHƢƠNG PHÁP LƢU TRỮ NÂNG CAO NHÓM
3.1. Các độ đo hiệu năng
Đánh giá hiệu năng của các hệ thống mạng P2P trên thực tế là một bài toán vô cùng phức tạp. Đứng ở mỗi khía cạnh, hệ thống lại đƣợc đánh giá về những tiêu chí khác nhau nên việc đánh giá hệ thống P2P một cách toàn diện là rất khó khăn. Ngoài những vấn đề nhƣ tải mạng, tải trên các nút tham gia, độ trễ trong quá trình tìm kiếm… còn có một số tiêu chí quan trọng nhƣ tỷ lệ yêu cầu tìm kiếm thành công, băng thông của các nút, tính chân thật của nút yêu cầu và nút đáp ứng [14].
Trong khi đó, hoạt động đóng vai trò chủ yếu của các mạng P2P là tìm kiếm tài nguyên theo yêu cầu trong môi trƣờng phân tán, bao gồm cả hoạt động định tuyến yêu cầu phân tán và quá trình tạo bản sao dữ liệu trên mạng. Do vậy bài toán đánh giá hiệu năng mạng P2P thƣờng đƣợc đƣa về bài toán đánh giá hiệu quả của thuật toán tìm kiếm và tạo bản sao đƣợc áp dụng. Xét về mặt thuật toán, chúng ta không thể đƣa mọi tiêu chí đã nêu để xem xét một thuật toán. Thay vào đó, ta chỉ tập trung vào các độ đo mức độ hiệu quả của thuật toán, phản ánh các thuộc tính chủ yếu của thuật toán. Theo [14][9][3], các độ đo hiệu năng đƣợc chia thành hai loại dựa trên hai khía cạnh: khía cạnh ngƣời dùng và khía cạnh tải mạng.
Xét về khía cạnh tải mạng, ngƣời ta xem xét ba độ đo. Độ đo thứ nhất có mối liên hệ mật thiết với tải mạng. Đó là số thông báo trung bình trên một nút, tính bằng số thông báo tìm kiếm trung bình mà mỗi nút phải xử lý trên mạng. Thứ hai là số nút đi qua, tính bằng số nút mạng tham gia vào một thao tác tìm kiếm. Thứ ba là số thông
báo lớn nhất, tính bằng số lƣợng thông báo lớn nhất mà nút mạng bận nhất phải xử lý
cho một tập các yêu cầu. Những độ đo này đều đánh giá một cách tổng quát về mạng và phải có cái nhìn toàn cục để đánh giá. Do vậy, để có thể đánh giá về khía cạnh tải
Xét về khía cạnh ngƣời dùng, có hai độ đo đƣợc quan tâm. Độ đo thứ nhất là tỷ
lệ yêu cầu thành công. Độ đo này đƣợc tính bằng tỷ lệ giữa số lƣợng yêu cầu tìm kiếm
đƣợc thoả mãn so với tổng số yêu cầu. Đó cũng chính là xác suất tìm đƣợc dữ liệu theo yêu cầu trƣớc khi kết thúc tìm kiếm, tuỳ theo điều kiện kết thúc tìm kiếm của thuật toán. Độ đo thứ hai là số chặng, hay độ trễ trong quá trình tìm kiếm, tính bằng số nút phải đi qua từ nút yêu cầu đến nút có dữ liệu tƣơng ứng. Thông thƣờng số chặng thƣờng đƣợc đánh giá qua giá trị trung bình của độ đo này xét với một số lƣợng lớn thao tác tìm kiếm.
Với các hệ thống mạng P2P phi cấu trúc, do không có một cơ chế điều khiển toàn cục cụ thể nào nên việc xem xét hiệu năng dựa trên khía cạnh tải mạng là rất khó khăn. Trong nghiên cứu này, để đánh giá hiệu năng của các hệ thống P2P phi cấu trúc, ta quan tâm đến các độ đo hiệu năng xét về khía cạnh ngƣời dùng, cụ thể là độ đo tỷ lệ yêu cầu thành công và số chặng trung bình.
Cũng do cơ chế tìm kiếm ngẫu nhiên không có điều khiển toàn cục, thao tác tìm kiếm trong P2P phi cấu trúc không có gì đảm bảo sau một số bƣớc đi thông báo tìm kiếm sẽ tới đƣợc nút chứa dữ liệu cần tìm. Điều này cũng đồng nghĩa không có yếu tố nào đảm bảo rằng sau một số bƣớc đi yêu cầu tìm kiếm sẽ thành công. Và điều dễ hiểu là tỷ lệ yêu cầu thành công và số chặng trung bình trong các hệ thống P2P phi cấu trúc thấp hơn hẳn trong các hệ thống có cấu trúc.
Một số nghiên cứu gần đây theo hƣớng đƣa các mạng P2P không cấu trúc về gần với mô hình thế giới nhỏ để giảm khoảng cách trung bình giữa các nút mạng nhƣ [13] [8] [12] [23]. Thực tế cho thấy, việc áp dụng mô hình thế giới nhỏ đã đem lại nhiều kết quả khả quan trong việc nâng cao hiệu năng của các hệ thống mạng P2P.
Dƣới đây, chúng ta sẽ tìm hiểu phƣơng pháp lƣu trữ nâng cao nhóm của Hui Zhang [23] dựa trên các đặc điểm của mô hình thế giới nhỏ. Kết quả cho thấy, bằng những cải tiến đơn giản nhƣng hiệu năng của Freenet đƣợc nâng cao đáng kể cả trong trƣờng hợp tải mạng tăng cao.