Về sai số nội suy:
Điểm đầu tiên có thể khẳng định đó là phương pháp dự đoán mới đề xuất đưa ra kết quả nội suy khá nhỏ (cỡ E-3). Căn cứ vào kết quả thực nghiệm trong các công thức (3-1) và (3- 6) ta thấy sai số bình phương trong nội suy của phương pháp mới đề xuất xấp xỉ so với phương pháp phân tích hồi quy Gaussian Process:
G InterR C InterR
E − ≈E − (3-8)
Trong khi đó sai số nội suy của phương pháp sử dụng mô hình hàng đợi lớn hơn nhiều so với ở hai phương pháp còn lại. Kết quả thực nghiệm này một lần nữa khẳng định rằng phương pháp dự đoán mới đề xuất khai thác được điểm mạnh trong quá trình nội suy của phân tích hồi quy Gaussian Process.
Về sai số ngoại suy:
Căn cứ vào các công thức (3-2), (3-5),(3-7) ta có thể khẳng định phương pháp mới đề xuất đưa ra kết quả dự đoán với sai số ngoại suy nhỏ hơn nhiều so với khi sử dụng riêng lẻ phương pháp phân tích hồi quy Gaussian Process và mô hình hàng đợi. Phần thực nghiệm này cũng khẳng định rằng phân tích hồi quy Gaussian Process tỏ ra rất kém hiệu quả trong bài toán ngoại suy. Đây cũng là điểm yếu chung cho các phương pháp phân tích hồi quy chuẩn. Dự đoán sử dụng mô hình hàng đợi làm giảm đáng kể sai số ngoại suy. Đường cong dự đoán sử dụng mô hình hàng đợi gần với hệ thống thực tế hơn. Lí do là vì khi tốc độ tới
Hình 18: Kết quả dự đoán theo phương pháp mới
tăng thì đồng nghĩa với việc có nhiều yêu cầu gửi tới Server trong khi Server vẫn đang bận phục vụ những yêu cầu khác. Khả năng người sử dụng phải đợi lâu trong hàng đợi cho tới khi Server cung cấp đủ tài nguyên phục vụ là lớn, do đó thời gian đáp ứng trong trường hợp tốc độ tới lớn là lớn. Đường cong trong phương pháp sử dụng mô hình hàng đợi thể hiện được điều đó. Một điểm lưu ý nữa là khi làm giàu dữ liệu hiệu năng sử dụng mô hình hàng đợi, giá trị tốc độ tới được lấy nhiều tại khoảng nằm ngoài giá trị tốc độ tới của bộ số liệu mẫu, đặc biệt là tại các điểm có tốc độ tới lớn. Bộ dữ liệu được làm giàu là đầu vào cho phân tích hồi quy Gaussian Process, nên thực chất kết quả ngoại suy của bộ số liệu đầu vào phương pháp là kết quả nội suy của phương pháp Gaussian Process trên bộ dữ liệu làm giàu. Phương pháp Gaussian Process cho kết quả nội suy tốt. Điều đó giải thích tại sao ở phần thực nghiệm ta thu được kết quả ngoại suy của phương pháp mới đề xuất tốt hơn so với hai phương pháp còn lại.
Ex Ex
C traR Q traR G ExtraR
E − ≤E − ≤E − (3-9)
Về độ tin cậy cho giá trị kì vọng:
Khoảng tin cậy 95% cho giá trị kì vọng trong kết quả dự đoán cho biết xác xuất để giá trị hiệu năng đo được tại điểm dự đoán nằm trong khoảng giá trị đề ra là 95%. Ta sẽ dựa vào bộ số liệu nêu trong phụ lục P-3 để tiến hành kiểm chứng lại kết quả này:
Ví dụ, với giá trị tốc độ tới λ =0.52, bảng 12 cho ta khoảng tin cậy 95% tại giá trị này là 1.27434 0.537238± . Ta sẽ lấy số liệu trong 10 lần đo để kiểm tra xem có bao nhiêu giá trị trong 10 lần đo này nằm trong khoảng tin cậy ở trên. Kết quả chỉ ra trong bảng dưới, trong đó T = Thuộc; K = Không thuộc.
Lần đo 1 2 3 4 5 6 7 8 9 10
Kết luận T T T T T T T T T T
Bảng 12: Bảng đánh giá khoảng tin cậy cho giá trị tốc độ tới λ=0.52
Như vậy ta có khẳng định là 100% giá trị thời gian đáp ứng đo với tốc độ tới λ=0.52
nằm trong khoảng tin cậy. Làm tương tự ta có kết quả trong bảng sau: Tốc độ tới (cust/s) 0.52 0.78 1 1.12 1.27 1.4 1.75 1.84 2 Phần trăm thuộc (%) 100 80 100 90 100 100 100 0 0
Bảng 13: Bảng thống kê độ thuộc vào khoảng tin cậy của giá trị kì vọng
Các kết quả trong bảng 13 chỉ mang tính chất tham khảo. Lí do là vì lí thuyết xác suất đối với các biến rời rạc chỉ trở nên đúng đắn với trường hợp số lượng sự kiện rất nhiều, có thể giả sử tới vô hạn. Do trong khuôn khổ có hạn của tài nguyên Server và điều kiện thực
nghiệm, ở đây ta chỉ xét với trường hợp có 10 lần đo giá trị hiệu năng cho mỗi tốc độ tới, con số này là nhỏ chưa phản ánh đúng bản chất xác xuất của khoảng tin cậy. Tuy nhiên nhìn vào bảng 13 ta cũng thấy có nhiều giá trị tốc độ tới mà thời gian đáp ứng hoàn toàn thuộc vào khoảng tin cậy (100%).
Điểm nhận xét thứ hai ở bảng 13 đó là con số 0% thuộc khoảng tin cậy đối với các điểm ngoại suy. Lí do ta có thể giải thích được điều này là vì dữ liệu được làm giàu là dữ liệu gồm có tập huấn luyện (các điểm nội suy) và dữ liệu được làm mới từ phương pháp sử dụng mô hình hàng đợi. Các dữ liệu mới này thực chất cũng là các giá trị dự đoán. Lí thuyết hàng đợi chứng minh công thức dự đoán là đúng đắn, gần với thực tế. Nhưng tất nhiên vì là dự đoán nên vẫn có sai số. Các kết quả ngoại suy của phương pháp mới đề xuất này làm việc trên các bộ dữ liệu ngoại suy có sai số như vậy nên tất nhiên trong trường hợp này không thể khẳng định được khoảng tin cậy 95% cho các giá trị kì vọng vùng ngoại suy là đúng đắn. Tuy nhiên như ở phần đánh giá sai số ngoại suy ở trên, phương pháp này đã làm giảm sai số ngoại suy đi rất nhiểu, nên vẫn là một phương pháp cho kết quả ngoại suy tốt.
Trên đây ta đã trình bày về đánh giá thực nghiệm của phương pháp mới đề xuất trên các khía cạnh sai số nội suy, sai số ngoại suy và khoảng tin cậy 95% cho giá trị kì vọng. Qua các kết quả ta có thể khẳng định rằng phương pháp mới đề xuất hội tụ được những yêu điểm tốt của cả hai phương pháp sử dụng mô hình hàng đợi và sử dụng phân tích hồi quy Gaussian Process. Để từ đó phương pháp cho ra kết quả nội suy tốt và ngoại suy cũng tốt, kèm theo khoảng tin cậy 95% cho giá trị kì vọng. Khoảng tin cậy này phù hợp với các hệ thống thực tế, khi có nhiễu xảy ra làm cho giá trị đo đạc hiệu năng tại các thời điểm khác nhau là khác nhau mặc dùng ta sử dụng cùng một quy trình đo. Phương pháp này đưa ra khẳng định các kết quả đo đó sẽ nằm trong khoảng tin cậy với xác suất 95%, để từ đó giúp nhà quản trị có thể hình dung được các ngưỡng của hiệu năng của hệ thống của mình. Qua đó có thể tiến hành các điều chỉnh phù hợp để nâng cao hiệu năng của hệ thống, giúp cho hệ thống hoạt động tốt hơn, đáp ứng được các yêu cầu của người sử dụng.
KẾT LUẬN VÀ ĐỊNH HƯỚNG PHÁT TRIỂN