Các phần chính trong giải thuật: - Đọc chuỗi dữ liệu. - Chuẩn hóa dữ liệu.
- Xác định cấu trúc mạng LSTM. - Huấn luyện mạng LSTM.
- Dự báo các bƣớc thời gian trong tƣơng lai. - So sánh giá trị dự đoán và giá trị kiểm tra
50 5.3. Kết quả thực nghiệm từng bƣớc
5.3.1. Đọc chuỗi dữ liệu
Nhập chuỗi dữ liệu là chỉ số năng lƣợng tái tạo chứ 1 chuỗi thời gian đơn, trong đó các bƣớc thời gian là đơn vị ngày và các giá trị tƣơng ứng với tải tiêu thụ. Dữ liệu này đƣợc đƣa vào vector hàng (Hình 5.2).
Phân chia dữ liệu để huấn luyện và kiểm tra là dùng 80% chuỗi dữ liệu để huấn luyện và 20% để kiểm tra.
Hình 5.2: Dữ liệu phụ tải điện năng tỉnh Tiền Giang giai đoạn 2012-2017
5.3.2. Chuẩn hóa dữ liệu
Để dữ liệu đầu vào mô hình tốt hơn cũng nhƣ ngăn chặn việc bị phân kỳ trong quá trình huấn luyện thì việc chuẩn hóa dữ liệu là vô cùng quan trọng. Cụ thể chuẩn hóa dữ liệu huấn luyện về giá trị trung bình bằng không và phƣơng sai đơn vị. Chuẩn hóa dữ liệu kiểm tra cùng thông số nhƣ là dữ liệu huấn luyện (Hình 5.3).
51
Hình 5.3: Dữ liệu phụ tải điện năng tỉnh Tiền Giang giai đoạn 2012-2017
Hình 5.4: Cấu trúc mạng đề xuất
5.3.3. Huấn luyện mạng LSTM
Huấn luyện mạng LSTM với các tùy chọn huấn luyện, đƣợc chỉ định “Adam (ƣớc lƣợng mômen thích nghi”).
Quá trình huấn luyện đƣợc giới hạn trong 200 chu kỳ và ngƣỡng đƣợc đặt là 1, tốc độ học ban đầu là 0.005, tốc độ học này sẽ giảm sau 125 chu kỳ huấn luyện bằng cách nhân hệ số 0.2 (Hình 5.5).
5.3.4. Dự báo thời gian trong tƣơng lai
Để dự báo những giá trị trong tƣơng lai dùng hàm “predictAndUpdateState” và cập nhật trạng thái của mạng tại mỗi lần kết quả dự báo. Đối với mỗi dự đoán, hãy sử dụng dự đoán trƣớc đó làm đầu vào cho hàm (Hình 5.6).
52
Hình 5.5: Quá trình huấn luyện
53 5.3.5. So sánh giá trị dự đoán và giá trị kiểm tra khi sử dụng mạng LSTM
Kết quả phụ tải điện sau khi dự báo sẽ đƣợc so sánh với giá trị kiểm ra (test) trong tập dữ liệu ban đầu. Từ hình 5.7 nhận thấy, hai kết quả này bám sát nhau, có nghĩa là kết quả dự báo về phụ tải điện tƣơng đối chính xác với độ sai số bình phƣơng trung bình nhỏ, cụ thể RMSE=9.6333.
Hình 5.7: So sánh kết quả dự báo phụ tải điện năng với giá trị kiểm tra
5.4. Sử dụng mạng Nơ - ron truyền thống để dự báo phụ tải điện năng
5.4.1. Quá trình huấn luyện của mạng Nơ - ron truyền thống (Fully Connected) Sơ đồ quá trình huấn luyện cho ta thấy, kết quả kiểm tra (test) đang có xu Sơ đồ quá trình huấn luyện cho ta thấy, kết quả kiểm tra (test) đang có xu hƣớng bị phân kỳ. Điều này chứng tỏ kết quả dự báo chỉ đúng ở các giá trị đầu, từ những giá trị sau kết quả dự đoán ngày càng có độ sai số lớn, dẫn đến việc dự báo không bền vững theo thời gian.
54
Hình 5.8: Quá trình huấn luyện của mạng Nơ - ron truyền thống
5.4.2. So sánh giá trị dự đoán và giá trị kiểm tra khi sử dụng mạng Nơ - ron truyền thống (Fully Connected) thống (Fully Connected)
Từ hình 6.2, ta nhận thấy khi sử dụng mạng Nơ - ron truyền thống thì kết quả phụ tải điện sau khi dự báo với giá trị kiểm ra trong tập dữ liệu ban đầu không bám sát nhau. Điều này có nghĩa là kết quả dự báo về phụ tải điện không có độ chính xác cao.
Hình 5.9: Kết quả dự báo phụ tải được so sánh với kết quả kiểm tra trong tập dữ liệu ban đầu khi sử dụng mạng Nơ - ron truyền thống
55
Chƣơng 6: KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN
6.1. Kết luận:
Mạng bộ nhớ dài – ngắn (Long Short-Term Memory networks) giải quyết các nhƣợc điểm mà mạng truyền thống chƣa làm đƣợc.
Về cơ bản mô hình của LSTM không khác mô hình truyền thống của RNN, nhƣng chúng sử dụng hàm tính toán khác ở các trạng thái ẩn. Bộ nhớ của LSTM đƣợc gọi là tế bào (Cell) và nó nhận đầu vào là trạng thái phía trƣớc ht−1 và đầu vào hiện tại xt . Ngoài ra bộ nhớ LSTM sẽ tự quyết định cái gì cần phải nhớ và cái gì sẽ xoá đi. Sau đó, chúng sẽ kết hợp với trạng thái phía trƣớc và đầu vào hiện tại. Vì vậy mà ta có thể truy xuất đƣợc quan hệ của các từ phụ thuộc xa nhau rất hiệu quả
Trong đề tài này tác giả đã dự báo nhu cầu phụ tải điện năng trên tập dữ liệu thực. Trong quá trình nghiên cứu tác giả phân tích lý thuyết và kiểm chứng thực nghiệm trên phần mềm. Qua đó thấy đƣợc phƣơng pháp mà tác giả đề xuất là dùng mạng LSTM để dự báo có độ chính xác cao hơn so với các phƣơng pháp truyền thống trƣớc đây.
Về ý nghĩa thực tiễn thì dự báo nhu cầu phụ tải điện năng có ý nghĩa vô cùng quan trọng vì nó gắn liền và ảnh hƣởng trực tiếp đến đời sống sinh hoạt của nhân dân và các ngành kinh tế khác. Ngoài ra, nó còn có ý nghĩa quyết định trong việc đảm bảo chế độ làm việc an toàn và tiết kiệm của hệ thống điện, đồng thời có tính chất quyết định trong việc hoạch định chiến lƣợc phát triển hệ thống.
Tóm lại kết quả của đề tài đã đƣa ra kết quả dự báo khá chính xác về nhu cầu phụ tải điện năng, qua đó có thể áp dụng kết quả nghiên cứu này vào thực tế tại các cơ quan điện lực trên toàn quốc.
6.2. Hƣớng phát triển:
Chạy trên nhiều tập dữ liệu khác nhau để cho kết quả chính xác hơn So sánh với nhiều phƣơng pháp khác.
56
TÀI LIỆU THAM KHẢO
[1] M. Buhari and S. S. Adamu, "Short-term load forecasting using artificial neural network," in Proceedings of the International MultiConference of Engineers and Computer Scientists, 2012, vol. 1, pp. 806-811.
[2] Z. Tang, C. De Almeida, and P. A. Fishwick, "Time series forecasting using neural networks vs. Box-Jenkins methodology," Simulation, vol. 57, no. 5, pp. 303-310, 1991.
[3] A. Bakirtzis, J. Theocharis, S. Kiartzis, and K. Satsios, "Short term load forecasting using fuzzy neural networks," IEEE Transactions on Power Systems, vol. 10, no. 3, pp. 1518-1524, 1995.
[4] D. C. Park, M. El-Sharkawi, R. Marks, L. Atlas, and M. Damborg, "Electric load forecasting using an artificial neural network," IEEE transactions on Power Systems, vol. 6, no. 2, pp. 442-449, 1991.
[5] T. G. Barbounis, J. B. Theocharis, M. C. Alexiadis, and P. S. Dokopoulos, "Long-term wind speed and power forecasting using local recurrent neural network models," IEEE Transactions on Energy Conversion, vol. 21, no. 1, pp. 273-284, 2006.
[6] B. Kermanshahi, "Recurrent neural network for forecasting next 10 years loads of nine Japanese utilities," Neurocomputing, vol. 23, no. 1-3, pp. 125- 133, 1998.
[7] Schmidhuber, Jürgen (1993). Habilitation thesis: System modeling and optimization. Page 150 ff demonstrates credit assignment across the equivalent of 1,200 layers in an unfolded RNN.
[8] R. Bertolami, H. Bunke, S. Fernandez, A. Graves, M. Liwicki, and J. Schmidhuber, "A Novel Connectionist System for Improved Unconstrained Handwriting Recognition," IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 31, no. 5, 2009.
57 [9] S. Venugopalan, H. Xu, J. Donahue, M. Rohrbach, R. Mooney, and K. Saenko, "Translating videos to natural language using deep recurrent neural networks," arXiv preprint arXiv:1412.4729, 2014.
[10] P. Malhotra, L. Vig, G. Shroff, and P. Agarwal, "Long short term memory networks for anomaly detection in time series," in Proceedings, 2015, p. 89: Presses universitaires de Louvain.