Tổng quan về phương pháp

Trong phần trên ta trình bày về các phương pháp dự đoán hiệu năng Web Services, chỉ ra những ưu điểm và hạn chế trong mỗi phương pháp. Điểm chung nhất có thể kể tới trong ba phương pháp trên đó là đều sử dụng tới mô hình hàng đợi để đánh giá cho kết quả dự đoán về thời gian đáp ứng. Trong phương pháp mới đề xuất này cũng sử dụng lí thuyết hàng đợi để đánh giá thời gian đáp ứng. Ngoài ra với nhận định là một hệ thống thực tế thì kết quả đo được bao giờ cũng tồn tại nhiễu. Chính do nhiễu nên có thể nhận thấy các kết quả đo đạc hiệu năng với cùng một tốc độ tới là khác nhau tại các thời điểm khác nhau mặc dù sử dụng cùng một quy trình đo đạc. Nhiễu thường mang tính chất ngẫu nhiên và không kiểm soát được. Một số nguyên nhân gây ảnh hưởng tới kết quả đo có thể kể tới là mạng kết nối trong hệ thống, tài nguyên phần cứng, phần mềm của hệ thống,...Điều này gợi ý cho ta làm cách nào để xây dựng mô hình đầu vào có nhiễu dựa trên bộ số liệu thu thập

được. Và có một nhận xét cơ bản là đối với các hệ thống có nhiễu, lí thuyết Gauss tỏ ra tương đối hiệu quả để giải quyết các bài toán này. Một quá trình nhiễu ngẫu nhiên thường được mô hình hóa bởi phân phối Gauss chuẩn. Phương pháp phân tích hồi quy Gaussian Process cũng xem xét tới tính chất có nhiễu của bộ dữ liệu đầu vào để đưa ra kết quả dự đoán kèm theo sai số do nhiễu. Từ các nhận xét trên đã đưa ra một hướng tiếp cận mới trong dự đoán hiệu năng Web Services đó là sự kết hợp của việc xây dựng mô hình dữ liệu đầu vào có nhiễu, sử dụng kết hợp mô hình hàng đợi để làm giàu dữ liệu với phân tích hồi quy Gaussian Process để đưa ra kết quả dự đoán kèm theo giá trị phương sai. Lí thuyết về khoảng tin cậy trong phân phối Gauss cho ta một khoảng sai số với độ tin cậy xác định trước. Điều này dẫn tới kết quả dự đoán cho phương pháp là một giá trị kì vọng kèm theo sai số dự đoán. Kết quả này, với việc chứng minh tính đúng đắn bằng lí thuyết và thêm phần thực nghiệm cho ta giá trị dự đoán có ý nghĩa hơn, gần hơn với hệ thống thực tế.

Sự kết hợp các yếu tố kể trên được chỉ ra trong ba bước để thực hiện phương pháp này như sau:

- Bước 1: Thu thập các dữ liệu hiệu năng Web Services thông qua thực hiện kiểm thử hiệu năng Web Services, cụ thể là có được bộ giá trị tốc độ tới – thời gian phản hồi ( , )λ R . Từ đó xây dựng mô hình nhiễu của đầu vào cho phương pháp, phân chia bộ dữ liệu đầu vào thành tập huấn luyện vào tập kiểm chứng như nêu trong phương pháp 2.1.3.

- Bước 2: Sử dụng mô hình hàng đợi, dựa vào các dữ liệu trong tập huấn luyện để đánh giá các tham số cho mô hình. Khi mô hình hàng đợi hoàn toàn xác định, chỉ phụ thuộc vào tốc độ tới, ta bắt đầu thực hiện làm giàu dữ liệu. Lấy các giá trị tốc độ tới nằm ngoài khoảng giá trị trong bộ dữ liệu huấn luyện, và tính toán thời gian đáp ứng, để thu được bộ giá trị dữ liệu mới ( , )λ R .

- Bước 3: Thực hiện phân tích hồi quy Gaussian Process trên bộ dữ liệu huấn luyện và bộ dữ liệu được làm giàu. Kết quả sau phân tích hồi quy Gaussian sẽ được đưa về dạng một giá trị kì vọng kèm theo sai số với khoảng tin cậy xác định.

Ba bước thực hiện phương pháp ở trên có thể được biểu diễn một cách trực quan hơn qua hình vẽ sau (DLHN = dữ liệu hiệu năng; DLLG = dữ liệu làm giàu):

Các phương pháp phân tích hồi quy [2]

Phân tích hồi quy phi tham số