Hình 3.2. Biểu đồ thành phần sai số của thuật tốn 1 mơ hình SVM
Thuật tốn 2
Để cải tiến kết quả của thuật toán 1, luận văn nhận thấy thành phần mùa của dữ liệu còn trong thành phần sai số 𝑒𝑡 (Hình 3.2). Luận văn tiếp tục rút thêm các yếu tố mùa của dữ liệu từ thành phần sai số 𝑒𝑡 bằng SVM, và học theo tháng 1.
Từ thuật toán 1: 𝑦𝑡 = 𝑓𝑡1+ 𝑒𝑡 = 𝑓𝑡1+ 𝑓𝑡2+ 𝑒𝑡2
Trong đó: 𝑓𝑡12 = 𝑓𝑡1+ 𝑓𝑡2 chính là tổng thành phần xu thế và mùa của chuỗi 𝑦𝑡 và 𝑒𝑡 = 𝑓𝑡2+ 𝑒𝑡2.
Học 𝑓𝑡1 bằng hai thuật toán Alg 1.1/ Alg 1.2.
Học 𝑓𝑡2 chỉ bằng mơ hình SVM theo tháng (mùa), giả thiết một số chuỗi thời gian thu thập được ít điểm dữ liệu nên việc chạy RVM theo tháng bị phát sinh lỗi.
1 Trong nội dung (1) mục 3.1.2: Bước 1 dùng trung bình di động, luận văn dùng RVM
Ký hiệu:
Nếu 𝑓𝑡1 học bằng Alg 1.1 thì ký hiệu S-SVM.
Nếu 𝑓𝑡1 học bằng Alg 1.2 thì ký hiệu S-RVM.
Ví dụ: Từ thành phần sai số 𝑒𝑡 của thuật tốn 1, áp dụng mơ hình SVM theo tháng để học 𝑓𝑡2.
Hình 3.3. Biểu đồ của học thuật toán 2
Kết quả khi áp dụng thuật toán 2 để học tiếp sai số 𝑒𝑡 của thuật toán 1, ta nhận thấy cả hai RVM/SVM đều học tốt (Hình 3.3), đồng thời Bảng 3.4 thể hiện sai số của mơ hình tốt hơn nhiều so với Bảng 3.3: như độ lệch chuẩn của thuật toán 1 đối với mơ hình SVM là 7.5834, đối với thuật tốn 2 giảm cịn 1.0886; trung bình của thuật tốn 1 là -1.7511, đối với thuật toán 2 là 0.0237 đã gần với 0 (trung bình là khơng đối với phân rã tổng), thể hiện qua Hình 3.4 thành phần sai số et2 là nhiễu trắng. Tương tự, đối với mơ hình RVM thì sai số của thuật tốn 2 là 2.4254 tốt hơn so vói thuật tốn 1 là 11.5704.
Sai số SVM RVM
Trung bình 0.0237 -0.2466
Độ lệch chuẩn 1.0886 2.4254