Chương 1 KIẾN THỨC NỀN TẢNG
2.4. Đánh giá thuật toán
2.4.1. Phương pháp đánh giá
Chúng tôi sử dụng chương trình mơ phỏng để đánh giá hiệu quả của thuật toán ThresholdPlus và so sánh với thuật toán cân bằng tải theo ngưỡng do Ganesan đề xuất do thuật toán ThresholdPlus được cải tiến từ thuật tốn
Threshold và có cùng cách tiếp cận với Threshold.
Chương trình mơ phỏng được phát triển từ chương trình mơ phỏng của Jonathan Ledlie [44] và hoạt động theo các bước thời gian rời rạc. Mỗi bước hoạt động gồm ba kịch bản: nút tham gia và rời hệ thống, cập nhật bảng tìm đường, truy vấn dữ liệu và thực hiện cân bằng tải. Bằng cách sử dụng mô phỏng chúng tơi có thể theo dõi hiệu năng của hệ thống trong nhiều kịch bản khác nhau. Trong các thí nghiệm mơ phỏng chúng tơi lựa chọn 10 thư mục và lưu trữ ở 10 nút ngẫu nhiên trong mạng gồm 4096 nút vật lý. Số nút được chọn để thử trong thuật toán Threshold là Log2(N), với N=4096.
Nút vào và ra: Tại mỗi bước các nút ra/vào hệ thống theo phân bố xác
suất Pareto [36]. Chúng tôi tạo ra một số phân bố xác suất để mô phỏng thời điểm ra/vào của các nút với thời gian sống trung bình của các nút trong mạng là 15 phút, 30 phút, 1 giờ, 2 giờ và 3 giờ. Mô phỏng thực hiện trong thời gian là 3 giờ. Chúng tôi ghi lại các thống kê trong nửa cuối của thời gian mô phỏng để tránh các kết quả mô phỏng không ổn định. Khả năng xử lý truy vấn của một nút là một số được sinh ngẫu nhiên có giá trị từ 1 đến 399,999. Khả năng xử lý truy vấn trung bình của một nút là khoảng 8000 truy vấn.
Cập nhật bảng tìm đường: Mỗi nút mới tham gia vào hệ thống khởi tạo
một bảng tìm đường rỗng. Các nút dựa theo cơ chế Chord để điền thông tin vào log(N) hàng của bảng tìm đường [21].
Truy vấn dữ liệu: Các nút khởi tạo các câu truy vấn một cách ngẫu
nhiên từ một tập khóa truy vấn. Khóa truy vấn được sinh ra theo theo phân bố Uniform hoặc phân bố Zipf phụ thuộc vào từng thí nghiệm cụ thể. Tập các khóa truy vấn được sinh theo phân bố xác suất Zipf có mức độ phổ biến khác nhau dựa trên một tham số gọi là thứ hạng. Xác suất để một khóa xuất hiện trong tập khóa truy vấn là 1
𝑟 với r là thứ hạng của khóa và là một số ngẫu
nhiên giữa 1 và tổng số khóa truy vấn, là một hằng số phản ảnh mức độ phổ biến của một khóa trong tập khóa, càng lớn thì mức độ phổ biến của một
khóa càng lớn và ngược lại.
Mỗi nút sử dụng một finger (một hàng) thích hợp trong bảng tìm đường để chuyển câu truy vấn tới đích. Khi một nút chuyển tiếp câu truy vấn đến đích, hoặc thực hiện duy trì bảng tìm đường thì tải của nút đó tăng thêm một đơn vị. Nếu nút chuyển tiếp câu truy vấn có tải vượt q khả năng xử lý của nó thì câu truy vấn đó được gọi là khơng thành cơng. Một câu truy vấn được gọi là thành cơng nếu nó đến được nút đích.
Cân bằng tải: Định kỳ trong khoảng thời gian trung bình 30 giây, các
nút kiểm tra ngưỡng tải và thực hiện cân bằng tải nếu tải của nút vượt quá ngưỡng cho phép.
Chúng tôi đánh giá hiệu quả của phương pháp đề xuất thông qua các tham số mô tả trong các phần dưới đây.