Như ở phần 2.2.3 trình bày về phân tích hồi quy Gaussian Process và phần 2.2.4 trình bày về sử dụng mô hình hàng đợi để dự đoán hiệu năng Web Services. Ta có thể nhận thấy phân tích hồi quy Gaussian Procees cho kết quả nội suy khá tốt. Còn sử dụng mô hình hàng đợi cho kết quả ngoại suy khá tốt, gần với hệ thống thực tế. Từ đó giúp ta có thể kết hợp phân tích hồi quy Gaussian Process và mô hình hàng đợi để cho kết quả nội suy và ngoại suy đều tốt.
Như ở phần 2.2.2 có trình bày, ta sẽ phân bộ dữ liệu kiểm thử hiệu năng hệ thống thành hai tập: tập huấn luyện gồm 80% bộ số liệu chứa các bộ giá trị có tốc độ tới nhỏ, tập kiểm chứng gồm 20% bộ số liệu chứa các bộ giá trị có tốc độ tới lớn. Tập kiểm chứng dùng để đánh giá sai số ngoại suy cho kết quả dự đoán. Tập huấn luyện được dùng để đánh giá các tham số cho mô hình hàng đợi. Đặt λt−min, λt m− ax lần lượt là giá trị tốc độ tới nhỏ nhất, giá trị tốc độ tới lớn nhất trong tập huấn luyện. Sau khi các tham số của mô hình hàng đợi đã xác định, ta sẽ sử dụng mô hình hàng đợi để lấy thêm các mẫu tại tốc độ tới λ nằm ngoài khoảng [λt−min,λt m− ax] là chủ yếu (có thể lấy trong khoảng tốc độ tới nếu ta thấy cần thiết), tức là λ λ< t−min||λ λ> t m− ax. Gọi kích thước bộ dữ liệu mới lấy thêm từ mô hình hàng đợi là M, tập dữ liệu mới này có dạng: { ,f ( , )| j=1,ˆ }
j q j M
λ λ θ . Kết hợp tập dữ liệu mới này
với tập huấn luyện ta có tập dữ liệu làm giàu trước khi đưa vào phân tích hồi quy Gaussian Process. Tập dữ liệu đã làm giàu có dạng:
ˆ
{ ,f ( , )| j=1,λj q λ θj M} + {( ,R ) | i=1, }i
i N
λ (2-40)
Gọi λe−min,λe m− axlần lượt là tốc độc tới nhỏ nhất, và tốc độ tới lớn nhất trong tập dữ liệu đã làm giàu nêu trong công thức (2-40). Bộ dữ liệu đã làm giàu này cùng với mô hình nhiễu nêu trong công thức (2-11) là đầu vào cho phân tích hồi quy Gaussian Process. Kết quả nội suy Gaussian Process cho dải giá trị tốc độ tới trong khoảng [λe−min,λe m− ax] được lấy làm kết quả dự đoán hiệu năng cho phương pháp.
Tổng quan về các bước thực hiện phương pháp mới dự đoán hiệu năng Web Services được trình bày tại phần 2.2.1 cùng chương. Ở đây sau khi đã hiểu đầy đủ bản chất việc thực hiện phương pháp, ta có thể mô tả lại lại một cách chi tiết sự kết hợp Gaussian Process và mô hình hàng đợi qua hai bước như sau:
- Bước 2:
• Bước 2a: Xác định mô hình hàng đợi thích hợp cho hệ thống Web Services. Sử dụng phương pháp Gradient liên hợp không tuyến tính với hàm tối ưu hóa là bình phương sai số nêu trong công thức (2-39), dựa trên bộ dữ liệu vào là tập huấn luyện, để xác định các tham số cho mô hình hàng đợi.
• Bước 2b: Lựa chọn các giá trị tốc độ tới nằm ngoài khoảng giá tốc độ tới trong tập huấn luyện: λ λ< t−min||λ λ> t m− axlà chủ yếu, sử dụng mô hình hàng đợi ở trên để thu được các kết quả dự đoán tại các điểm tốc độ tới này. Kết hợp kết quả dự đoán theo mô hình hàng đợi và tập huấn luyện ta thu được bộ dữ liệu đã được làm giàu.
- Bước 3: Dữ liệu đã được làm giàu ở trên (cho tín hiệu) và dữ liệu trong mô hình nhiễu (2-11) là đầu vào cho phân tích hồi quy Gaussian Process. Đưa ra kết quả dự đoán tại các điểm tốc độ tới nằm trong khoảng giá trị tốc độ tới của tập dữ liệu đã làm giàu
min ax
[λe− ,λe m− ].
Hình vẽ sau mô tả một cách trực quan cho hai bước nêu ở trên:
Hình 11: Kết hợp Gaussian Process và mô hình hàng đợi Đánh giá tham số
mô hình hàng đợi Sinh dữ liệu mới từ mô hình hàng đợi Mô hình hàng đợi Các tham số Mô hình
dữ liệu vào Tập huấn luyện
Bước 2b Bước 2a
Tập huấn luyện & mô hình nhiễu Dữ liệu mới Dữ liệu làm giàu +
Phân tích hồi quy Gaussian Process
Kết quả dự đoán hiệu năng
Kết quả của việc thực hiện các bước ở trên khi kết hợp phân tích hồi quy Gaussian Process với mô hình hàng đợi, áp dụng với bộ số liệu nêu trong bảng 2 được chỉ ra dưới đây. Ta có thể nhận xét thấy là sai số ngoại suy đã giảm hơn so với sử dụng mô hình hàng đợi, và giảm hơn hẳn so với sử dụng phân tích Gaussian Process đơn thuần.
Arrival Rate
Response Time
Noise Prediction Error Confidence
Interval 0.7 1.14128 0.18913 1.12715 0.01413 0.45556 0.9 1.29254 0.24931 1.33209 0.03955 0.45404 1.1 1.49045 0.06666 1.45553 0.03492 0.45358 1.3 1.44095 0.11004 1.48836 0.04741 0.45355 1.5 1.75876 0.1083 1.73155 0.02721 0.45389 1.7 2.20186 0.18208 2.31045 0.10859 0.45562 1.9 3.02408 0.21431 2.95496 0.06912 0.46013 2.1 5.11726 0.09568 4.54487 0.57239 0.47464 2.2 20.64173 2.6318 7.49849 13.1432 4 0.49633