5.4.2.2 Thiết lập
Bảng 5-1: Thông số cho giải thuật Bayesian
Thông số Giá trị thiết lập
Số mẫu khởi tạo 100
Batch selection 10
Số vòng lặp 30
0.0001
Số thế hệ của NSGA-II 50
Kích thước population của NSGA-II 100
Các tham số của giải thuật Bayesian được thiết lập như bảng 5-1. Tương tự giải thuật tiến hóa di truyền, do hướng tiếp cận Bayesian này cũng dựa trên giải thuật
NSGA-II nên sẽ có những thơng số phép tốn di truyền cần được thiết lập. Các phép toán di truyền sẽ được thiết lập tương tự như trong phần 5.4.1.
CHƯƠNG 6: THỰC NGHIỆM
Chương này mô tả mơi trường, tập dữ liệu thực nghiệm, kết quả thí nghiệm, và các phân tích dựa trên các kết quả đó. Phần đầu tiên là các thơng tin về tập dữ liệu và kết quả thí nghiệm đánh giá cơng cụ giả lập được phát triển trong luận văn này. Để đánh giá mức độ tin cậy, môi trường mô phỏng sẽ được so sánh với thông tin và tập dữ liệu từ một hệ thống CDN thực. Phẩn kế tiếp là đánh giá giải pháp tối ưu hóa được đề xuất giải quyết 2 bài tốn thực tiễn đã được mơ tả trong chương 5. Giải pháp đề xuất sẽ được so sánh với các giải thuật baseline. Đặc biệt, giải pháp thiết lập từ giải thuật đề xuất sẽ được so sánh với thiết lập của hệ thống thực, từ đó cho thấy lợi ích mang lại khi sử dụng giải thuật tối ưu trong bài tốn tìm thiết lập tối ưu cho hệ thống CDN.
6.1 Thí nghiệm đánh giá cơng cụ giả lập CDN
Trong phần này, luận văn mơ tả, trình bày các kết quả thí nghiệm liên quan đến cơng cụ giả lập CDN. Cụ thể hơn, luận văn sẽ đánh giá tính đúng đắn về mặt chức năng dựa trên tập dữ liệu và thông tin hệ thống từ một hệ thống CDN thực tại Việt Nam. Các ứng dụng và môi trường thực tế của hệ thống sẽ được công cụ giả lập cố gắng mô phỏng lại và so sánh với hệ thống log file chứa thông tin hoạt động của hệ thống thực. Sau khi đánh giá được mức độ tin cậy của công cụ, luận văn sẽ đánh giá hiệu năng của công cụ. Một câu hỏi thường được đặt ra với người sử dụng công cụ là: “Với giới hạn phần cứng nhất định, kích thước mạng tối đa mà cơng cụ giả lập có thể mơ phỏng được là bao nhiêu và cần bao nhiêu thời gian để chạy mô phỏng ?”. Cuối cùng, luận văn sẽ đưa ra một use case ứng dụng công cụ vào thực tiễn cho người sử dụng là các nhà đầu tư xây dựng hệ thống CDN. Các chủ dịch vụ CDN quan tâm đến vấn đề khi lượng traffic hay người dùng tăng thì họ cần đầu tư thêm bao nhiêu tài nguyên để có thể cung cấp chất lượng dịch vụ ổn định như trước đó.
6.1.1 Mơi trường thí nghiệm
6.1.1.1 Môi trường mô phỏng hệ thống thực
Trong phần này, luận văn sẽ trích xuất log file thơ từ một hệ thống CDN thực ở Việt Nam để có thể mơ phỏng trong cơng cụ giả lập. Các tính chất, hành vi, đặc điểm của hệ thống này, người dùng hệ thống đã được phân tích trong bài báo [4]. Cụ thể hơn, hệ thống đây là một hệ thống CDN theo mơ hình truyền thống được th bởi các công ty cung cấp dịch vụ truyền hình và xem phim trực tuyến như FPT Play, VTVCab,... Vậy nên, nội dung chủ yếu được người dùng yêu cầu từ hệ thống này là từ dịch vụ live streaming. Bảng 6-1 cho thấy thống kê số lượng yêu cầu người dùng từ các loại dịch vụ của hệ thống. Các nội dung được yêu cầu từ người dùng mà không được cache tại CDN hay bị lỗi đã được lọc trong q trình trích xuất từ log file thơ. Tập dữ liệu này chứa thông tin hoạt động người dùng trong 1 ngày và được chia nhỏ thành 24 phần (24h/1 ngày). Một bước quan trọng trước khi tiến hành mơ phỏng là q trình lấp đầy cache của hệ thống CDN. Trong các thí nghiệm sử dụng tập dữ liệu thực trong luận văn này, cache sẽ được lấp đầy bởi các yêu cầu người dùng trong 30p trước khung giờ được mơ phỏng. Các thí nghiệm sử dụng trong luận văn này chỉ chạy mô phỏng traffic của hệ thống trong 1 giờ. Ví dụ khung giờ mơ phỏng là từ 10h-11h, khung giờ traffic được sử dụng để lấp đầy cache là 9h30-10h.
Bảng 6-1: Thống kê số lượng yêu cầu người dùng theo từng loại dịch vụ
Dịch vụ Có sử dụng Packaging Số lượng yêu cầu
Live Streaming Khơng 152697608
Live Streaming Có 129278868
VoD Không 2069393
Website Không 14301252
Kiến trúc hệ thống CDN này có dạng tương tự cây nhị phân 2 tầng với 5 replica servers. Hình 13 minh họa hình dạng kiến trúc hệ thống này. Bảng 6-2 cung
container. Ứng dụng live streaming được mô phỏng bằng một server HTTP tạo nội dung đơn giản.