Bài viết trình bày phương pháp dự báo phụ tải ngắn hạn dựa trên kỹ thuật xử lý dữ liệu nhóm kết hợp với các kỹ thuật tiền xử lý trong xác suất thống kê.
ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, VOL 17, NO 7, 2019 MƠ HÌNH DỰ BÁO PHỤ TẢI NGẮN HẠN DỰA TRÊN PHƯƠNG PHÁP XỬ LÝ DỮ LIỆU NHÓM A SHORT-TERM LOAD FORECASTING MODEL BASED ON GROUP METHOD OF DATA HANDLING Lê Đình Dương Trường Đại học Bách khoa - Đại học Đà Nẵng; ldduong@dut.udn.vn Tóm tắt - Dự báo phụ tải nói chung dự báo phụ tải ngắn hạn nói riêng đóng vai trị quan trọng việc vận hành hiệu tin cậy hệ thống điện Hiện nay, có nhiều phương pháp dự báo phụ tải đề xuất phương pháp có ưu nhược điểm riêng Bài báo trình bày phương pháp dự báo phụ tải ngắn hạn dựa kỹ thuật xử lý liệu nhóm kết hợp với kỹ thuật tiền xử lý xác suất thống kê Phương pháp đề xuất cho kết có độ xác cao linh hoạt dễ sử dụng với chuỗi số liệu thực tế Kết đạt từ phương pháp đề xuất so sánh với phương pháp phổ biến khác để chứng tỏ ưu điểm phương pháp đề xuất Abstract - Load forecasting in general and short-term load forecasting in particular plays a very important role in efficient and reliable operation of power systems Currently, there are many load forecasting methods that have been proposed and each method has its own advantages and disadvantages This paper presents a short-term load forecasting method based on Group Method of Data Handling (GMDH) combined with pre-processing techniques in probability and statistics The proposed method can give high accurate results and is very flexible so it is easy to use with time series data in practice The results obtained from the proposed method are also compared with those obtained from other popular methods to demonstrate the advantages of the proposed method Từ khóa - Dự báo phụ tải; ngắn hạn; phương pháp xử lý liệu nhóm; mơ hình chuỗi thời gian; tự hồi quy tích hợp trung bình trượt Key words - Load forecasting; Short-term; Group Method of Data Handling; time series model; ARIMA Đặt vấn đề Dự báo phụ tải lĩnh vực quan tâm nhà nghiên cứu đơn vị quản lý, vận hành hệ thống điện Dự báo phụ tải cung cấp thông tin quan trọng cho quy hoạch phân phối điện Dự báo phụ tải định kế hoạch vận hành, kế hoạch sản xuất hướng đầu tư phát triển tương lai Kết dự báo ảnh hưởng lớn đến vận hành hệ thống: Nếu dự báo cao nhiều so với thực tế phải huy động vốn để xây dựng nhiều nguồn phát điện thực tế không dùng hết công suất gây lãng phí; ngược lại, kết dự báo thấp nhiều so với thực tế giảm độ an toàn cung cấp điện thiếu hụt nguồn điện gây cắt điện diện rộng thiệt hại kinh tế - xã hội, an ninh quốc phòng Hiện nay, có nhiều phương pháp dự báo phụ tải Một phương pháp cho kết xác phương pháp Persistence sử dụng giả thuyết đơn giản giá trị dự báo thời điểm tương lai với giá trị thực tế trước bước thời gian sau bước thời gian giá trị đo cập nhật để phục vụ cho dự báo cho bước Phương pháp cho kết xác áp dụng miền thời gian dự báo cực ngắn (vài phút đến vài giờ) Tuy nhiên, tính xác giảm cách nhanh chóng miền thời gian dự báo tăng lên Nhóm phương pháp dự báo phổ biến phương pháp chuỗi thời gian [1] Các mô hình dễ mơ hình hóa dễ phát triển so với mơ hình khác Phương pháp chuỗi thời gian bao gồm nhóm phương pháp dự báo tự hồi quy (AR – AutoRegressive), trung bình trượt (MA – Moving Average), trung bình trượt kết hợp tự hồi quy (ARMA – AutoRegressive Moving Average), tự hồi quy tích hợp trung bình trượt (ARIMA – Auto-Regressive Integrated Moving Average) Phương pháp thống kê thích hợp dự báo cho miền thời gian ngắn Với phát triển trí tuệ nhân tạo nhiều phương pháp dự báo phụ tải phát triển Mạng nơron nhân tạo [2, 3] giải vấn đề khơng tuyến tính phức tạp dự báo, nhiên mơ hình địi hỏi nguồn liệu đầy đủ cho việc huấn luyện mơ hình (bao gồm số liệu phụ tải số liệu mơi trường ) Một nhóm phương pháp khác kết hợp (hybrid) phương pháp khác để tận dụng ưu điểm phương pháp riêng lẽ Tuy nhiên, phương pháp thường phức tạp việc kết hợp phải thực cách hiệu phát huy tác dụng phương pháp [4] Nhìn chung, phương pháp dự báo có ưu nhược điểm đặc điểm sử dụng riêng, tùy theo số liệu cụ thể thu thập được, đặc trưng số liệu yêu cầu ứng dụng toán dự báo, miền thời gian tương lai yêu cầu mà lựa chọn phương pháp dự báo phù hợp Theo miền thời gian tương lai, dự báo phụ tải phân thành ba loại: dự báo ngắn hạn (vài phút đến vài giờ, ngày), trung hạn (một vài ngày đến tuần) dài hạn (một tuần, tháng, năm đến vài năm) So với dự báo trung dài hạn, dự báo tải ngắn hạn đóng vai trị quan trọng công tác vận hành Bài báo tập trung vào dự báo ngắn hạn Trong miền dự báo này, ngồi phương pháp đề cập phương pháp xử lý liệu nhóm (GMDH) [5-7] đề xuất sử dụng báo Phương pháp GMDH nhóm mơ hình tốn học thuật toán hồi quy phi tuyến, ban đầu đề xuất Ivakhnenko, nhà khoa học nhà toán học người Ukraine vào năm 1968 Phương pháp có cách tiếp cận mạng nơron đa thức, sử dụng ý tưởng chọn lọc tự nhiên để kiểm sốt kích thước, độ phức tạp độ xác mạng Phương pháp cho kết dự báo có độ xác cao Ngoài ra, kết dự báo đạt từ GMDH cịn so sánh với nhóm phương pháp chuỗi thời gian sử dụng phổ biến dự báo phụ tải ngắn hạn Lê Đình Dương 2 Mơ hình chuỗi thời gian 2.1 Mơ hình tự hồi quy (AR) Một trình ngẫu nhiên {Xt, t Z } trình tự hồi quy cấp p, viết Xt ~ AR(p) trình dừng {Xt, t Z } thỏa mãn [1]: X t = a0 + a1 X t −1 + a2 X t −2 + + a p X t − p + t (1) Với: - { t }: Nhiễu trắng [1] (white noise) Một chuỗi thời gian nhiễu trắng biến độc lập phân phối giống hệt với giá trị trung bình khơng - a0 , a1 , a2 a p : Các hệ số phân tích hồi quy Ta viết biểu thức q trình tự hội quy công thức: Xt - a0 - a1 Xt-1 - a2 Xt-2 - …- ap Xt-p = t (2) Ví dụ: + Mơ hình AR(1): Xt = a0 + a1 Xt-1 + t + Mơ hình AR(2): Xt = a0 + a1 Xt-1 + a2 Xt-2 + t 2.2 Mơ hình trung bình trượt (MA) Quá trình {Xt, t Z } gọi trình trung bình trượt cấp q, ký hiệu Xt ~ MA(q), trình {Xt, t Z } thỏa mãn biểu thức [1]: X t = t + b1 t −1 ++ bq t −q (3) Với: b1, b2, , bq hệ số mơ hình Ví dụ: + Mơ hình MA(1): X t = t + b1 t −1 + Mơ hình MA(2): X t = t + b1 t −1 + b2 t −2 2.3 Mơ hình tự hồi quy trung bình trượt (ARMA) Một trình {Xt, t Z } gọi trình tự hồi quy trung bình trượt cấp p, q, kí hiệu Xt ~ ARMA(p,q) trình {Xt, t Z } thỏa mãn [1]: X t = a0 + a2 X t −1 + + a p X t − p + t + b1 t −1 + +bq t −q (4) Trong đó: a0 , a1 a p ; b1, b2, , bq: Các hệ số mơ hình A(z) B(z) đa thức tự hồi quy đa thức trung bình trượt có bậc tương ứng p q [1] A(z) = + a1.z + a2.z-2 + …+ ap.z-p (5) q B(z) = + b1.z + b2.z +…+ bq.z (6) Khi ta viết q trình ARMA(p,q) dạng tốn tử: A(z).Xt = B(z) t (7) Ví dụ mơ hình ARMA(2,1): X t = a0 + a1 X t −1 + a2 X t −2 + t + b1t −1 2.4 Mơ hình tự hồi quy tích hợp trung bình trượt (ARIMA) Các mơ hình sử dụng cho chuỗi số liệu đơn có tính dừng (stationary) Khi liệu khơng có tính dừng (nonstationary), trước áp dụng mơ hình trên, chuỗi số liệu phải xử lý để thỏa mãn điều kiện dừng Nếu dùng phương pháp tích hợp (I - Integrated) để biến chuỗi thời gian không dừng thành chuỗi dừng áp dụng mơ hình ARMA lúc ta có mơ hình ARIMA [1] Như vậy, mơ hình phân tích mơ chuỗi thời gian ARIMA gồm trình sau: tự hồi quy (AR), tích hợp (I) trung bình trượt (MA) Nếu chuỗi tích hợp bậc d (ký hiệu I(d)) sau lấy sai phân d lần chuỗi dừng Trong thực tế với chuỗi khơng dừng thường d Mơ hình ARIMA ký hiệu ARIMA(p,d,q) Như vậy, mơ hình ARIMA mơ hình tổng qt chuỗi thời gian Để dùng mơ hình ARIMA cho việc dự báo cần thực bước sau đây[1]: Bước 1: Nhận dạng mơ hình + Bước để xác định chuỗi thời gian có dạng dạng AR, MA, ARMA, ARIMA xác định thành phần p, d q mơ hình + Thành phần sai phân d mơ hình nhận dạng thơng qua việc xác định tính dừng chuỗi thời gian: Nếu chuỗi thời gian dừng bậc khơng ta có d=0, sai phân bậc chuỗi dừng ta có d=1, sai phân bậc chuỗi dừng ta có d=2… Các phương pháp phổ biến kiểm tra tính dừng Dickey-fuller [8], Kwiatkowski-PhillipsSchmidt-Shin (KPSS) [9] + Xác định bậc p, q thành phần AR MA: Có thể sử dụng hàm tự tương quan (Autocorrelation function - ACF) [1] tự tương quan riêng phần (Partial autocorrelation function - PACF) [1] sau: - Nếu ACF có hệ số tương quan sau bậc q giảm nhanh không PACF có hệ số tương quan riêng phần giảm dần khơng, q bậc MA; - Nếu PACF có hệ số tương quan riêng phần sau bậc p giảm nhanh không ACF có hệ số tương quan giảm dần khơng, p bậc AR; Bước 2: Ước lượng tham số mơ hình Có thể sử dụng phương pháp ước lượng hợp lý cực đại (Maximum Likelihood Estimation - MLE) [10] phương pháp bình phương cực tiểu (Ordinary Least Squares - OLS) [11] Bước 3: Kiểm định mơ hình Để đảm bảo mơ hình phù hợp, sai số mơ hình phải nhiễu trắng Có thể sử dụng hàm tự tương quan ACF để kiểm tra Bước 4: Sử dụng mơ hình để dự báo Phương pháp xử lý liệu nhóm Thuật tốn GMDH biểu diễn dạng tập hợp nơron cặp khác lớp kết nối thơng qua đa thức bậc hai tạo nơron lớp Mối quan hệ biến đầu đầu vào biểu thị dạng rời rạc phức tạp chuỗi Volterra [5, 6]: r r r r r r y = a0 + xi + aij xi x j + aijk xi x j xk + i =1 i =1 j =1 i =1 j =1 k =1 (8) ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, VOL 17, NO 7, 2019 Biểu thức biết đến đa thức Kolmogorov– Gabor, X = (x1, x2, , xr) vector đầu vào, y biến đầu Dạng (8) mơ tả tốn học đầy đủ, biểu diễn hệ thống đa thức bậc hai bán phần gồm hai biến (nơron) dạng: yˆ = a0 + a1 xi + a2 x j + a3 xi x j + a4 xi2 + a5 x 2j ngày lại để kiểm định độ xác mơ hình Trên Hình ta thấy rằng, số liệu có đặc tính ngày theo biến động phụ tải (9) Mục đích biểu thức ước lượng cho giá trị yˆ gần với giá trị thực tế y mơ hình dự báo xác Thuật tốn GMDH gồm bước sau: Bước 1: Xác định tất nơron (ước lượng vector tham số dùng tập liệu huấn luyện) với đầu vào bao gồm tất cặp giá trị biến đầu vào Do đó, bao gồm r(r-1)/2 cặp (nơron) Bước 2: Dùng tập hợp số liệu xác nhận để chọn nơron phù hợp với tiêu chí lựa chọn Bước 3: Nếu điều kiện dừng thỏa mãn (mạng phù hợp với liệu với độ xác mong muốn việc giới thiệu nơron không làm tăng đáng kể khả xấp xỉ mạng nơron), sau cho dừng, khơng sử dụng đầu nơron tốt (được chọn Bước 2) để hình thành vector đầu vào cho lớp tiếp theo, sau chuyển sang Bước GMDH hoạt động cách xây dựng lớp liên tiếp với liên kết (hoặc kết nối) phức tạp mục đa thức Lớp ban đầu đơn giản lớp đầu vào Lớp thực cách hồi quy biến đầu vào sau chọn biến tốt Lớp thứ hai tạo cách tính hồi quy giá trị lớp với biến đầu vào Điều có nghĩa thuật toán xây dựng đa thức đa thức Áp dụng Trong phần này, phương pháp thực để dự báo cho phụ tải thực tế Trong số liệu đo đếm thực tế thường tồn số liệu lỗi liệu bị (missing data) Nếu số liệu khơng xử lý khó việc xây dựng mơ hình dự báo ảnh hưởng lớn đến độ xác tốn dự báo Do đó, số liệu lỗi phải loại trước xây dựng mơ hình Các số liệu thường lỗi thiết bị đo đếm việc truyền lưu trữ liệu gây Có nhiều phương pháp để loại trừ liệu vậy, báo tác giả sử dụng phương pháp đề xuất Grubbs [12] số liệu lớn khác so với phần lại xác định loại bỏ khỏi tập số liệu Sau loại trừ liệu lỗi, bước xác định xử lý liệu bị Tương tự số liệu lỗi, số liệu bị lỗi thiết bị đo đếm việc truyền lưu trữ liệu gây Các số liệu suy từ số liệu lân cận phương pháp nội suy [13] Hình vẽ số liệu thu thập điểm đo phụ tải thực tế, số liệu thu thập theo bước thời gian 30 phút (mỗi ngày có 48 số liệu thu thập) Tổng số liệu có 30 ngày số liệu 24 ngày đầu dùng để ước lượng huấn luyện mơ hình, số liệu Hình Số liệu thu thập phụ tải 1(Bước thời gian 30 phút) Thực bước ARIMA cho dự báo ngày (ngày thứ 25) trình bày Mục 2.4 thu kết Hình Mơ hình có dạng ARIMA(2,0,0) với hệ số ước lượng {a1 = 0,806394, a2 = -0,0145791} Tương tự, thực dự báo áp dụng thuật tốn GMDH thu kết Hình Trên Hình 2, so sánh kết ta thấy rằng, hai phương pháp cho kết tốt, phương pháp GMDH cho kết xác so với ARIMA Sai số tuyệt đối trung bình (Mean Absolute Error - MAE) [14] 0,0332 cho GMDH 0,0844 cho ARIMA Hình Kết dự báo cho phụ tải 1(Bước thời gian 30 phút) Tương tự, áp dụng phương pháp cho chuỗi số liệu thu thập điểm đo thứ phụ tải thực tế Số liệu thu thập 20 ngày số liệu 16 ngày để ước lượng mơ hình ngày cịn lại để kiểm tra độ xác Hình số liệu tập liệu dùng để ước lượng Hình cho thấy, phụ tải có đặc tính ngày có độ thay đổi nhiều so với phụ tải điểm đo Hình Số liệu thu thập phụ tải Lê Đình Dương Tương tự, ta ước lượng mơ hình chuỗi thời gian có dạng ARIMA(4,0,0) với hệ số ước lượng {a1 = 1,06281, a2 = -0,114748, a3 = 0,06088, a4 = -0,06263} mơ hình GMDH Kết so sánh Hình (dự báo cho ngày thứ 17) cho thấy phương pháp có độ xác giảm so với trường hợp Tuy nhiên, phương pháp GMDH cho kết xác cịn phương pháp ARIMA bị ảnh hưởng nhiều tính phức tạp số liệu đầu vào Sai số tuyệt đối trung bình MAE [14] 0,0646 cho GMDH 0,2108 cho ARIMA Hình Kết dự báo cho phụ tải (Bước thời gian 30 phút) Kết luận Bài báo trình bày phương pháp dự báo phụ tải miền thời gian ngắn hạn Phương pháp dùng mơ hình chuỗi thời gian sử dụng phổ biến vừa xác vừa dễ sử dụng thực tế Trong báo này, phương pháp xử lý liệu nhóm GMDH đề xuất sử dụng đặc điểm trội độ xác tính linh hoạt dễ thích ứng với chuỗi số liệu thực tế Điều thể qua ví dụ áp dụng khác Hướng nghiên cứu áp dụng phương pháp GMDH cho nhiều loại phụ tải khác thực tế TÀI LIỆU THAM KHẢO [1] G E P Box and G M Jenkins, Time Series Analysis: Forecasting and Control, San Francisco, CA: Holden Day, 1976 [2] Luis Hernández, Carlos Baladrón, Javier M Aguiar, Lorena Calavia, Belén Carro, Antonio Sánchez-Esguevillas, Francisco Pérez, Ángel Fernández, Jaime Lloret, Artificial Neural Network for ShortTerm Load Forecasting in Distribution Systems, Energies 2014, 7, 1576-1598 [3] Papia Ray, Debani Prasad Mishra, Rajesh Kumar Lenka, Short term load forecasting by artificial neural network, International Conference on Next Generation Intelligent Systems (ICNGIS), 2016 [4] Jinliang Zhang, Yi-Ming Wei, Dezhi Li, Zhongfu Tan, Jianhua Zhou, Short term electricity load forecasting using a hybrid model, Energy, vol 158, pp 774-781, 2018 [5] A.G Ivakhnenko, The group method of data handling in prediction problems, Soviet Automatic Control c/c of Avtomatika, vol.9, no.6, pp.21-30, 1976 [6] J.A Muller, A.G Ivachnenko, F Lemke, GMDH algorithms for complex systems modelling, Mathematical and Computer Modelling of Dynamical Systems, vol 4, no 4, pp 275-316, 1998 [7] Wei Liu, Zhenhai Dou, Weiguo Wang, Yueyu Liu, Hao Zou, Bo Zhang, Shoujun Hou, Short-Term Load Forecasting Based on Elastic NetImproved GMDH and Difference DegreeWeighting Optimization, Appl Sci., 8, 1603, 2018 [8] D A Dickey, W A Fuller, Distribution of the Estimators for Autoregressive Time Series with a Unit Root, Journal of the American Statistical Association, 74 (366), 427-431, 1979 [9] D Kwiatkowski, P C B Phillips, P Schmidt, Y Shin, Testing the null hypothesis of stationarity against the alternative of a unit root, Journal of Econometrics, 54 (1-3), 159-178, 1992 [10] Online:https://en.wikipedia.org/wiki/Maximum_likelihood_estimation [11] Online: https://en.wikipedia.org/wiki/Ordinary_least_squares [12] F E Grubbs, Procedures for Detecting Outlying Observations in Samples, Technometrics, Feb 1969 [13] P J Davis, Interpolation and approximation, Dover, New York, 1976 [14] Cort J Willmott, Kenji Matsuura, Advantages of the mean absolute error (MAE) over the root mean square error (RMSE) in assessing average model performance, Climate Research, 30: 79–82, 2005 (BBT nhận bài: 02/6/2019, hoàn tất thủ tục phản biện: 29/6/2019) ... xây dựng đa thức đa thức Áp dụng Trong phần này, phương pháp thực để dự báo cho phụ tải thực tế Trong số liệu đo đếm thực tế thường tồn số liệu lỗi liệu bị (missing data) Nếu số liệu khơng xử lý. .. xây dựng mơ hình dự báo ảnh hưởng lớn đến độ xác tốn dự báo Do đó, số liệu lỗi phải loại trước xây dựng mô hình Các số liệu thường lỗi thiết bị đo đếm việc truyền lưu trữ liệu gây Có nhiều phương. .. số liệu đầu vào Sai số tuyệt đối trung bình MAE [14] 0,0646 cho GMDH 0,2108 cho ARIMA Hình Kết dự báo cho phụ tải (Bước thời gian 30 phút) Kết luận Bài báo trình bày phương pháp dự báo phụ tải