Bài viết đề xuất phương pháp dự báo phụ tải tháng tiếp theo của các trạm bằng mô hình Long Short Term Memory đồng thời phân cụm các trạm theo dữ liệu chuỗi thời gian tải dựa trên biến đổi Fourier rời rạc nhằm cải thiện độ hiệu quả của mô hình, khắc phục các bất lợi về số lượng các mô hình cần huấn luyện khi số lượng trạm quá lớn và khắc phục nhược điểm về số lượng điểm dữ liệu tại mỗi trạm.
Hội nghị Quốc gia lần thứ 24 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2021) Ứng Dụng Phân Cụm Chuỗi Thời Gian Dự Báo Phụ Tải Điện Trong Smart Grid Đặng Tiến Đạt1, Nguyễn Tiến Dũng1, Nguyễn Khánh Tùng2, Lê Anh Ngọc3 Trường Đại học Bách Khoa Hà Nội Trường Đại học Điện Lực Swinburne VietNam, Đại học FPT Email: ngocla2@fe.edu.vn Tóm tắt nội dung—Trong hệ thống lưới điện thông minh (smart grid), trạm điện đóng vai trị quan trọng việc phân phối điện đến điểm tiêu thụ Chính vai trò quan trọng trạm điện mà việc thu thập liệu liên quan chúng quan trọng Nhằm nâng cao hiệu hoạt động cho trạm điện lưới điện nói chung, chúng tơi tích hợp vào hệ thống quản lí lưới điện tính thu thập liệu, phân tích dự báo phụ tải dài hạn Do lượng lượng phân phối trạm lớn nên việc có mơ hình dự báo xác cần thiết Bài báo đề xuất phương pháp dự báo phụ tải tháng trạm mơ hình Long Short Term Memory đồng thời phân cụm trạm theo liệu chuỗi thời gian tải dựa biến đổi Fourier rời rạc nhằm cải thiện độ hiệu mơ hình, khắc phục bất lợi số lượng mô hình cần huấn luyện số lượng trạm lớn khắc phục nhược điểm số lượng điểm liệu trạm Tại cụm trạm xếp nối với theo thứ tự cố định, thu chuỗi dài mơ hình Long Short Term Memory sử dụng để dự báo phụ tải tháng trạm Mơ hình đề xuất áp dụng tỉnh Việt Nam dự báo phụ tải tháng tới cho 1300 trạm điện Từ khóa – Dự báo, biến đổi Fourier rời rạc, LSTM, phân cụm chuỗi thời gian I GIỚI THIỆU Về nguyên tắc hệ thống điện thông minh nâng cấp cập nhật hệ thống điện có cơng nghệ đo lường, điều khiển bảo vệ kỹ thuật số với hệ thống truyền thông đại nhằm đáp ứng nhu cầu độ tin cậy, an toàn, chất lượng điện, tiết kiệm lượng Các trạm điện đóng vai trị quan trọng hệ thống điện nói chung hệ thống lưới điện nói riêng thực chức biến đổi từ lượng điện cao áp nhận đầu nguồn thành điện tiêu dùng chuyển đến tay người dân Bài toán dự báo phụ tải điện trạm có ảnh hưởng trực tiếp đến việc bảo trì, nâng cấp sở hạ tầng hệ thống lưới điện Đối với toán dự báo phụ tải nay, mơ hình kể tới: i) Mơ hình phân tích thống kê cổ điển ISBN 978-604-80-5958-3 409 AR, ARMA, ARIMA [1] [2]; (ii) Mơ hình học máy ANN, RNN, LSTM [2] [3] Bằng cách phân tích sâu thành phần chuỗi thời gian, mơ hình thống kê thường hoạt động tốt dự báo dài hạn trường hợp liệu đủ lớn với liệu nhỏ, việc sử dụng mơ hình thống kê cổ điển khơng đem lại hiệu Ngồi ra, mơ hình cổ điển gặp phải bất lợi xử lý số thông tin đầu vào, cụ thể hầu hết sử dụng thông tin chuỗi thời gian phụ tải Mơ hình LSTM hoạt động tốt với liệu dạng chuỗi, đặc biệt liệu có nhiều chuỗi thời gian thành phần Sự so sánh LSTM mơ hình thống kê cổ điển thực báo [2] kết thu sai số mơ hình LSTM giảm rõ rệt Do LSTM mơ hình học sâu, việc huấn luyện tham số điều cần thiết, bất lợi LSTM cho toán dự báo nhiều đối tượng xây dựng cho đối tượng mơ hình tổng lượng thời gian huấn luyện vô lâu, toán dự báo phụ tải trạm điện với số lượng trạm điện lên tới hàng nghìn việc huấn luyện hàng nghìn mơ hình trở nên khơng khả thi Bài tốn phân cụm chuỗi thời gian đóng vai trò quan trọng báo Saeed Aghabozorgi cộng [4] tổng hợp kết bật phân cụm chuỗi thời gian 10 năm qua, báo tổng hợp có loại phân cụm chuỗi thời gian là: phân cụm chuỗi thời gian toàn bộ, phân cụm chuỗi phân cụm điểm Với loại phân cụm chuỗi thời gian bước cần thực biểu diễn chuỗi thời gian, xác định metric đo lường khoảng cách độ tương tự, nguyên mẫu phân cụm thuật toán phân cụm Biến đổi Fourier rời rạc [5] phương pháp phổ biến để biểu diễn chuỗi thời gian K-Means thuật tốn phân cụm đơn giản Bài báo đề xuất phương pháp dự báo phụ tải tháng trạm mơ hình Long Short Term Memory đồng thời phân cụm trạm theo liệu chuỗi thời gian tải dựa biến đổi Fourier rời rạc nhằm cải thiện độ hiệu mơ hình, khắc phục Hội nghị Quốc gia lần thứ 24 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2021) bất lợi số lượng mơ hình cần huấn luyện số lượng trạm lớn khắc phục nhược điểm số lượng điểm liệu trạm Cấu trúc báo trình bày phần: Phần giới thiệu tổng quan dự báo phụ tải điện dựa phương pháp truyền thống, học sâu phân cụm chuỗi thời gian Phần Phương pháp đề xuất kết hợp LSTM phân cụm chuỗi thời gian dự báo Phần áp dụng phương pháp đề xuất vào dự báo phụ tải điện cho hệ thống lưới điện tỉnh Việt Nam Phần kết luận II MƠ HÌNH ĐỀ XUẤT Hình Khối phân cụm chuỗi thời gian Trong báo này, đề xuất sử dụng biến đổi Fourier rời rạc để biểu diễn chuỗi thời gian trạm qua tập hệ số chuỗi Fourier Sau metric chọn để đo độ tương tự tập hệ số Euclid cuối cùng, nguyên mẫu trung bình chọn với thuật toán phân cụm phổ biến Kmeans III Hình Mơ hình đề xuất Hình thể tổng quan cho mơ hình đề xuất báo với đầu vào chuỗi thời gian N trạm điện đầu k mơ hình dự báo tương ứng với k cụm Cụ thể, liệu trạm toán theo tháng nên chuỗi thời gian ngắn, điều gây hai vấn đề: chất lượng mô hình thời gian huấn luyện Hướng giải tồn thường thấy tạo cho trạm mơ hình việc dẫn tới bất lợi lớn thời gian huấn luyện với liệu trạm có vài chục ghi, việc sử dụng mơ hình thống kê truyền thống không đem lại hiệu tốt mơ hình học sâu cần huấn luyện lâu - dẫn tới khớp (overfitting), nữa, với số lượng trạm lên tới hàng nghìn thấy hướng giải không khả thi Một hướng giải khác với đối tượng trạm có ảnh hưởng lần điện truyền qua trạm có thẻ ghép tất trạm thành chuỗi thời gian, vấn đề thời gian huấn luyện giải cần huấn luyện mơ hình Tuy nhiên, điều lại ảnh hưởng tới chất lượng mơ hình có nhiều trạm, thời điểm có tới hàng nghìn trạm Do đó, báo đề xuất kết hợp hai hướng giải cách từ chuỗi thời gian tương ứng với trạm điện, sử dụng phương pháp phân cụm chuỗi thời gian để thu cụm (chi tiết phương pháp phân cụm chuỗi thời gian trình bày phía sau) Tại cụm, trạm xếp theo thứ tự cố định thời điểm, từ thu k chuỗi thời gian Mơ hình LSTM sau sử dụng để dự báo cho chuỗi thời gian ISBN 978-604-80-5958-3 410 THÍ NGHIỆM VÀ KẾT QUẢ A Bộ liệu Bộ liệu phụ tải theo tháng 1364 trạm điện sử dụng báo thu thập từ hệ thống lưới điện tỉnh Phú Thọ từ tháng 1/2011 đến tháng 11/2016 Mỗi ghi bao gồm thông tin mã trạm, công suất trạm, lượng điền đầu nguồn số lượng khách hàng Bộ liệu chia làm tập: tập huấn luyện từ 1/2011 đến 7/2016 tập kiểm định từ 8/2016 đến tháng 11/2016 Bộ liệu minh họa qua hình hình Hình Dữ liệu phụ tải trạm qua 71 tháng Hình Dữ liệu phụ tải 1364 trạm qua 71 tháng B Thí nghiệm Trước sử dụng mơ hình LSTM để dự báo, chúng tơi tạo features (bao gồm features thời gian features giá trị phụ tải khứ) từ features ban đầu nhằm tăng tính độ chi tiết cho ghi, LSTM có lợi cho việc tiếp nhận nhiều chuỗi thời gian thành phần 1) Mơ hình khơng phân cụm: Với mơ hình không phân cụm, hợp trạm lại thành chuỗi sau sử dụng mơ hình LSTM để dự báo trường hợp thay đổi số epochs kích thước lơ dùng để huấn luyện tham số Hội nghị Quốc gia lần thứ 24 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2021) mơ hình Ngồi ra, siêu tham số khác chọn units 100 timestep Metric để đánh giá chất lượng dự báo mơ hình báo trung bình phần trăm trị tuyệt đối sai số (Mean Absolute Percentage Error - MAPE) Bảng Hai loại thí nghiệm với số lượng epoches batch size thay đổi Thí nghiệm Epoches 100 200 ( Batch size 612 256 , )= | | − tập giá trị thực tập với điểm giá trị thực giá trị dự báo từ mơ hình, giá trị dự báo điểm thứ tập , thứ 2) Mơ hình đề xuất a) Phân cụm chuỗi thời gian phụ tải trạm: Như trình bày phần phương pháp trên, chúng tơi sử dụng tập tham số chuỗi Fourier để biểu diễn chuỗi thời gian trạm Số tham số để biểu diễn cho trạm 14 Với số lượng tham số 14, với thử nghiệm trạm bất kì, chúng tơi thu chuỗi Fourier xấp xỉ tốt từ chuỗi phụ tải ban đầu C Kết Dựa kết metric Elbow Silhouette [6] hình dưới, số cụm trạm Hình Khảo sát giá trị metric Silhouette Hình Biểu diễn chuỗi Fourier dựa 14 hệ số chuỗi phụ tải Các metric sử dụng để đánh giá chọn số cụm chất lượng phân cụm Elbow Silhouette với ý nghĩa: Elbow thể cho tổng bình phương khoảng cách từ điểm đến tâm cụm mà điểm thuộc cịn Silhouette thể chất lượng phân cụm thể tính tách biệt cụm tính gắn kết điểm cụm b) Dự báo cụm Sau trạm phân thành cụm, cụm xây dựng mơ hình LSTM tương ứng Nhằm đánh giá cách cơng mơ hình phân cụm đề xuất mơ hình khơng phân cụm, báo thực việc dự báo trạm trường hợp số lượng epochs batch size trên, đồng thời, giữ nguyên siêu tham số khác units: 100 timestep: Ngoài ra, nhằm đánh giá ổn định mơ hình, với trạm chúng tơi chạy mơ hình dự báo 30 lần 3) Các metrics đánh giá ISBN 978-604-80-5958-3 411 Hình Khảo sát giá trị metric Elbow Với kết phân cụm cụm, báo thí nghiệm trường hợp phân cụm với việc đánh giá ổn định mơ hình cách trạm chúng tơi chạy mơ hình dự báo 30 lần Kết việc chạy 30 lần cho cụm mơ hình thể bảng sau: Bảng Kết trung bình MAPE thu sau 30 lần chạy cho điểm thu Thí nghiệm Không phân cụm 3.09% 3.05% cụm 3.055% 2.93% cụm 3.31% 3.043% Hội nghị Quốc gia lần thứ 24 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2021) Nhìn từ Bảng 2, dễ thấy mơ hình phân thành cụm có giá trị MAPE trung bình tốt trường hợp, trường hợp mơ hình cho kết tốt với = 2.93%, với mơ hình phân thành cụm số lượng epoches 200 với kích thước lơ 256 Ngồi ra, ta thấy với trường hợp 2, tăng số lượng epoches giảm kích thước lơ lỗi dự báo mơ hình giảm, mơ hình phân thành cụm có cải thiện tốt giảm xấp xỉ 0.27%, mơ hình phân thành cụm không phân cụm giảm 0.125% 0.04% Hình 10 Minh họa kết dự báo cho cụm trường hợp số cụm Hình Biểu đồ box plot MAPE model thí nghiệm Minh họa kết dự báo trường hợp phân cụm trạm thành cụm trường hợp số epoches 200 kích thước lơ 256 Hình Biểu đồ box plot MAPE model thí nghiệm Hình thể biểu đồ hộp trường hợp, ta thấy cải thiện mơ hình đặc biệt mơ hình cụm với trường hợp đem lại kết tốt Tuy mơ hình cụm có cải thiện đáng kể khoảng phân vị lớn với mơ hình cụm, có phân cụm có khoảng phân vị gần với mơ hình khơng phân cụm Minh họa kết dự báo trường hợp phân cụm trạm thành cụm trường hợp số epoches 200 kích thước lơ 256 Hình 11 Minh họa kết dự báo cho cụm trường hợp số cụm Từ hình 10 11, ta thấy tất đường dự báo (màu đỏ) cho kết khớp với đường giá trị thực (màu xanh) ISBN 978-604-80-5958-3 412 Hội nghị Quốc gia lần thứ 24 Điện tử, Truyền thông Công nghệ Thông tin (REV-ECIT2021) IV KẾT LUẬN Bài báo nêu mơ hình đề xuất tích hợp phân cụm chuỗi thời gian cho dự báo phụ tải điện trạm điện áp dụng mơ hình đề xuất vào liệu thực tỉnh Việt Nam Kết mơ hình đề xuất cho thấy tốt mơ hình LSTM thơng thường Ngồi ra, phương pháp đề xuất có khả cân hai yếu tố chất lượng dự báo thời gian huấn luyện để xây dựng mơ hình TÀI LIỆU THAM KHẢO [1] [2] [3] [4] [5] [6] M M Eljazzar and E E Hemayed, "Enhancing electric load forecasting of ARIMA and ANN using adaptive Fourier series," in 2019 International Conference on Electrical, Computer and Communication Engineering (ECCE), 2017 S Siami-Namini and N Tavakoli, "A Comparison of ARIMA and LSTM in Forecasting Time Series," in 2018 17th IEEE International Conference on Machine Learning and Applications (ICMLA) M A R A Z Hasan-Al-Shaikh, "Electric Load Forecasting with Hourly Precision Using Long Short-Term Memory Networks," in 2017 IEEE 7th Annual Computing and Communication Workshop and Conference (CCWC), 2019 S Aghabozorgi, A Shirkhorshidi and T Wah, "Time-series clustering – A decade review," Information Systems, vol 53, pp 16-38, 2015 V S S P T A S B O Charantej Reddy Pochimireddy, "Computing the Discrete Fourier Transform of signals with spectral frequency support," in 2021 IEEE International Symposium on Information Theory (ISIT), 2021 P J.Rousseeuw, "Silhouettes: A graphical aid to the interpretation and validation of cluster analysis," Journal of Computational and Applied Mathematics, vol 20, pp 53-65, 1987 ISBN 978-604-80-5958-3 413 ... dự báo phụ tải điện dựa phương pháp truyền thống, học sâu phân cụm chuỗi thời gian Phần Phương pháp đề xuất kết hợp LSTM phân cụm chuỗi thời gian dự báo Phần áp dụng phương pháp đề xuất vào dự. .. phương pháp phân cụm chuỗi thời gian trình bày phía sau) Tại cụm, trạm xếp theo thứ tự cố định thời điểm, từ thu k chuỗi thời gian Mơ hình LSTM sau sử dụng để dự báo cho chuỗi thời gian ISBN 978-604-80-5958-3... nhiều trạm, thời điểm có tới hàng nghìn trạm Do đó, báo đề xuất kết hợp hai hướng giải cách từ chuỗi thời gian tương ứng với trạm điện, sử dụng phương pháp phân cụm chuỗi thời gian để thu cụm (chi