Mơ hình SARIMA

Một phần của tài liệu Sử dụng công nghệ SD WAN để cải thiện chất lượng truyền tải trong hệ thống mạng thế hệ mới (Trang 43 - 46)

3.2 CÁC THUẬT TOÁN TRONG PHƯƠNG PHÁP ĐIỀU KHIỂN LƯU

3.2.2.3 Mơ hình SARIMA

Mơ hình SARIMA hay mơ hình ARIMA theo mùa

Dự báo yêu cầu băng thông là một phần quan trọng của thiết kế mạng và lập kế hoạch đảm bảo an toàn trong vận hành khai thác dịch vụ. Đảm bảo đủ băng thông trong mạng của họ từ lõi đến cơ sở khách hàng là thách thức thường xuyên đối với các nhà khai thác mạng và nhà cung cấp dịch vụ. Trong bối cảnh này, dự báo băng thơng kịp thời và chính xác là rất hữu ích để lập kế hoạch tài nguyên mạng, mở rộng và nâng cấp kịp thời để tránh tắc nghẽn và suy giảm chất lượng dịch vụ QoS. Cách tự nhiên để dự báo yêu cầu băng thông cho mạng hiện tại là phân tích các xu hướng trong quá khứ và áp dụng mơ hình tốn học thích hợp để dự đốn lưu lượng đạt mức cao nhất vào thời điểm trong tương lai.

a) Cơ sở lý thuyết

Trong nhu cầu sử dụng lưu lượng hằng ngày của người dùng, hành vi sử dụng băng thông tăng cao tập trung phần lớn vào giờ cao điểm, chính là thời gian làm việc ban ngày [30-32]. Ngoài ra, trong thời đại bùng nổ thông tin nội dung số, đáp ứng nhu cầu giải trí cá nhân vào giờ nghỉ ngơi buổi tối cũng có thể dẫn đến lưu lượng tăng cao. Thời gian lưu lượng cực kỳ thấp tương ứng với khoảng thời gian giấc ngủ của chúng ta từ khuya đến sáng sớm. Đã có nhiều cách tiếp cận để dự báo dữ liệu chuỗi thời gian. Một trong những phương pháp phổ biến nhất là Tự hồi quy tích hợp trung bình trượt (mơ hình ARIMA - Autoregressive Integrated Moving Average), được sử dụng trong việc tạo ra một mơ hình dự báo trong các lĩnh vực khác nhau. Trong luận văn, đối với dữ liệu chuỗi thời gian về lưu lượng truyền tải từ người dùng có đặc tính lặp lại theo chu kỳ nên ta sẽ áp dụng mơ hình SARIMA (tức ARIMA theo mùa) để phù hợp dự báo lưu lượng trong mạng.

Tác giả George Box và các cộng sự [33] đã giới thiệu phương pháp ARIMA. Phương pháp này hiện đại diện cho một trong những cơng cụ mơ hình chuỗi thời gian đơn biến được sử dụng thường xun nhất. Mơ hình ARIMA dựa trên Mơ hình hồi quy tự động (AR - Autoregressive), Mơ hình trung bình trượt (MA – Moving Average) và sự kết hợp của AR và MA, mơ hình ARMA [34].

Mơ hình ARIMA (p, d, q) có thể được biểu diễn bằng:

∆𝑑𝑋𝑡 = 𝜇 + 𝜙1∆𝑑𝑋𝑡−1+ ⋯ + 𝜙𝑝∆𝑑𝑋𝑡−𝑝+ 𝜀𝑡+ 𝜃1𝜀𝑡−1 + ⋯ + 𝜃𝑞𝜀𝑡−𝑞 (3.2) trong đó, 𝑋𝑡 là chuỗi thời gian, ∆𝑑 chỉ ra bậc sai phân d, 𝜀𝑡 là nhiễu trắng, p = bậc của thành phần AR, 𝜙𝑖 là tham số của AR, q = bậc của thành phần MA, 𝜃𝑖 là tham số của

MA [35].

Seasonal Autoregressive Integrated Moving Average, SARIMA hoặc Seasonal ARIMA, là một phần mở rộng của ARIMA hỗ trợ rõ ràng dữ liệu chuỗi thời gian đơn biến với thành phần theo mùa. Nó thêm ba siêu tham số mới để chỉ định hồi quy tự động (AR), tích phân (I) và trung bình trượt (MA) cho thành phần theo mùa của chuỗi dữ liệu, cũng như một tham số bổ sung cho khoảng thời gian theo mùa. Khi xử lý các hiệu ứng theo mùa, tôi sử dụng ARIMA theo mùa, được ký hiệu là ARIMA (p, d, q)(P, D, Q)s. Ở đây, (p, d, q) là các tham số không theo mùa, trong khi (P, D, Q) theo cùng một định nghĩa nhưng được áp dụng cho thành phần theo mùa của chuỗi thời gian. Thuật ngữ s là chu kỳ của chuỗi thời gian (ví dụ: 24 cho khoảng thời gian hàng ngày, 12 cho khoảng thời gian hàng năm, v.v.).. Mơ hình SARIMA được biểu diễn bởi:

(1 − 𝜙1𝐵 − ⋯ − 𝜙𝑝𝐵𝑝)((1 − 𝛷1𝐵𝑠− ⋯ − 𝛷𝑝𝐵𝑃𝑠) × (1 − 𝐵𝑠)𝐷𝑦𝑡 = (1 − 𝜃1𝐵 −

⋯ − 𝜃𝑞𝐵𝑞)(1 − 𝛩1𝐵𝑠− ⋯ − 𝛩𝑄𝐵𝑄𝑠)𝜀𝑡 (3.3)

trong đó, 𝜙𝑖, 𝜃𝑖, Φ𝑖, Θ𝑖 lần lượt tương ứng là các tham số của AR, MA, AR theo mùa, MA theo mùa, và B là toán tử dịch lùi với Bxt = xt-1. Phần theo mùa của mơ hình bao gồm các thuật ngữ tương tự như các thành phần khơng theo mùa của mơ hình, nhưng liên quan đến dịch chuyển ngược của giai đoạn theo mùa [35].

b) Các bước triển khai Nhận dạng mơ hình:

Xác định các giá trị (D, d, p, P, q, Q). Trong đó, trước hết cần xác định bậc sai phân theo mùa vụ D, sai phân thường d và thực hiện biến đổi chuỗi thành chuỗi dừng. Sau đó, kiểm tra biểu đồ của hàm tự tương quan (Autocorrelation Function - ACF), và hàm tự tương quan riêng phần (Partial Autocorrelation Function - PACF) tại các trễ mùa vụ và trễ thường; thực hiện kiểm định nghiệm đơn vị để xác định bậc tự hồi quy p và tự hồi quy theo mùa p, bậc trung bình trượt q và trung bình trượt theo mùa Q [36].

Ước lượng các tham số sử dụng phương pháp ước lượng cực đại hợp lý để ước lượng giá trị các tham số này.

Đồ thị ACF và PACF có thể giúp chúng ta tìm các giá trị thích hợp cho các tham số p và q. Tuy nhiên, khơng phải lúc nào việc giải thích các đồ thị này cũng rõ ràng. Để đảm bảo hơn cho các lựa chọn của mình và tính hoạt động thời gian thực liên tục của chương trình Advanced Routing một cách tự động, chúng ta có thể áp dụng phương pháp thực nghiệm. Phương pháp này bao gồm việc điều chỉnh mơ hình ARIMA cho các giá trị khác nhau của p và q, đồng thời chọn giá trị tốt nhất dựa trên các chỉ số như Akaike’s Information Criterion (AIC) được định nghĩa:

AIC = −2 log(L) + 2k (3.4)

trong đó L là khả năng xảy ra của mơ hình và k là tổng số tham số và trạng thái ban đầu đã được ước lượng (bao gồm cả phương sai dư).

một mơ hình. Giá trị càng nhỏ thì mơ hình càng tốt.

Kiểm định mơ hình:

Kiểm định tính hợp lý của mơ hình SARIMA được lựa chọn, bao gồm kiểm định các tham số và kiểm định phần dư. Nếu kiểm định mơ hình được lựa chọn khơng thỏa mãn thì quay lại từ giai đoạn nhận dạng để lựa chọn mơ hình khác hợp lý hơn.

Dự báo:

Dựa trên mơ hình được lựa chọn thực hiện dự báo giá trị tương lai của dữ liệu chuỗi thời gian theo mùa vụ, cũng như đưa ra khoảng tin cậy của dự báo. Giá trị tương lai có thể được dự báo cho thời điểm kế tiếp hoặc theo mùa/chu kỳ kế tiếp.

3.3 KẾT LUẬN CHƯƠNG

Các thuật tốn Ngưỡng cứng, Trung bình trượt đã được đề xuất trong chương này nhằm mục đích cải thiện chất lượng dịch vụ trong mạng truyền tải SD-WAN về độ trễ, độ mất gói so với khi áp dụng thuật tốn mặc định của hệ thống. Mơ hình SARIMA được áp dụng nhằm mục đích dự báo lưu lượng trong tương lai để lập kế hoạch giải quyết vấn đề nghẽn có thể xảy ra.

CHƯƠNG 4 - KẾT QUẢ THỰC HIỆN VÀ ĐÁNH GIÁ HIỆU QUẢ

4.1 GIỚI THIỆU CHƯƠNG

Trong bài luận văn này, các loại thuật tốn TE được đề xuất với mục đích cải thiện hiệu suất của mạng dựa trên SD-WAN về tính khả dụng của dịch vụ. Trước tiên, luận văn đánh giá hiệu suất của thuật tốn TE mặc định của hệ thống. Sau đó, áp dụng các thuật toán Ngưỡng cứng (Hard Thresholding) và Trung bình trượt (Moving Average) áp dụng vào môi trường lab giả lập để kiểm tra khả năng tự xử lý dữ liệu theo thời gian thực và tìm đường đi tối ưu nhất giải quyết các hạn chế tồn tại và cải thiện hơn so với thuật toán mặc định. Về giả lập lưu lượng hành vi người dùng bị hạn chế trong mơi trường lab nên kiểm nghiệm mơ hình SARIMA cho dự báo lưu lượng được thực hiện bởi dữ liệu đầu vào từ lưu lượng một khách hàng thuê kênh WAN của một ISP.

Một phần của tài liệu Sử dụng công nghệ SD WAN để cải thiện chất lượng truyền tải trong hệ thống mạng thế hệ mới (Trang 43 - 46)

Tải bản đầy đủ (PDF)

(93 trang)