Kỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt NamKỹ thuật dự báo trong vận hành thị trường điện Việt Nam
Trang 1TP HỒ CHÍ MINH NĂM 2020
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP HCM
Trang 2TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÀNH PHỐ HỒ CHÍ MINH
Người hướng dẫn khoa học 1: PGS TS Trần Thu Hà
Người hướng dẫn khoa học 2: PGS TS Nguyễn Thanh Phương
Có thể tìm hiểu luận án tại thư viện:
- Đại học Bách khoa Tp HCM
- Đại học Công nghệ Tp HCM
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi Các
số liệu, kết quả nêu trong Luận án là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác
Tôi xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện Luận án này đã được cảm ơn và các thông tin trích dẫn trong Luận án đã được chỉ rõ nguồn gốc tham khảo
Tác giả Luận án
NGUYỄN TUẤN DŨNG
Trang 4LỜI CÁM ƠN
Tôi xin bày tỏ lòng biết ơn chân thành nhất đến PGS.TS Trần Thu
Hà và PGS.TS Nguyễn Thanh Phương, các Thầy, Cô đã tận tâm chỉ dẫn, truyền đạt những kiến thức và kinh nghiệm quý báu cho tôi trong suốt quá trình thực hiện Luận án này
Và tôi xin được gửi lời cám ơn đến gia đình và bạn bè - những người đã luôn ủng hộ và động viên chúng tôi trong suốt thời gian vừa qua
Tác giả Luận án
NGUYỄN TUẤN DŨNG
Trang 5TÓM TẮT
Đặc điểm của quá trình sản xuất và tiêu thụ điện năng là phải đảm bảo sự cân bằng giữa sản xuất và tiêu thụ ở mọi thời điểm, khi có sự mất cân bằng giữa sản xuất và tiêu thụ đều làm cho chất lượng điện năng thay đổi, nặng nề hơn có thể dẫn đến sự sụp đỗ điện áp gây tan
rã hệ thống
Tuy nhiên, điện năng là một mặt hàng rất đặc biệt, đó là về mặt kinh tế không thể lưu trữ và ổn định hệ thống điện đòi hỏi một sự cân bằng liên tục giữa sản xuất và tiêu dùng Đồng thời, nhu cầu sử dụng
điện còn phụ thuộc vào thời tiết (nhiệt độ, tốc độ gió, mưa,…); nhu
cầu sử dụng của các doanh nghiệp, cũng như các hoạt động hàng
ngày (công suất đỉnh so với giờ cao điểm, các ngày trong tuần so với ngày cuối tuần, ngày lễ và gần ngày lễ,…); công suất phát của các
nguồn năng lượng tái tạo cũng thay đổi theo điều kiện tự nhiên; Do
đó, phải cần đến kỹ thuật dự báo điện năng để cung cấp thông tin cho quá trình điều khiển HTĐ nhằm đảm bảo sự cân bằng giữa sản xuất
và tiêu thụ Đặc biệt khi HTĐ được vận hành theo cơ chế thị trường điện cạnh tranh, kết quả dự báo sẽ cung cấp thông tin cho các nhà quản lý điều hành giá mua bán diện
Đã có nhiều phương pháp dự báo được sử dụng, tuy nhiên phần lớn là các phương pháp dự báo dài hạn và trung hạn dùng để cung cấp thông tin cho việc qui hoạch phát triển nguồn, lưới điện và lập kế hoạch vận hành HTĐ Luận án sẽ nghiên cứu đề xuất một phương pháp dự báo ngắn hạn mới để cung cấp thông tin phụ tải điện cho các nhà quản lý điều hành thị trường điện cạnh tranh
Việc nghiên cứu các đặc tính của phụ tải; xây dựng các phương pháp xử lý dữ liệu thiếu, sai sốt dữ liệu; cũng như đề xuất sử dụng
Trang 6biểu đồ phụ tải chuẩn hóa đơn vị (SLP) để cung cấp thông tin cho các
mô hình dự báo là những nhiệm vụ quan trọng của luận án Qua phân
tích các mô hình dự báo đang được sử dụng trên thế giới (Kỹ thuật thống kê – mô hình SARIMA; Trí tuệ nhân tạo, học máy – mô hình Support Vector Regression; Neural Network, Feedforward Networks; Random Forest), luận án đã đã xây dựng thành công giải thuật mới
đó là sử dụng Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) làm bộ dữ liệu đầu vào cho các modules xây dựng hàm hồi qui đã phát huy tác dụng
và cho kết quả dự báo có độ sai số thấp, nó giải quyết được câu chuyện chênh lệch ngày âm và ngày dương, các ngày lễ hội, ngày đặc
biệt trong năm và nhất là các ngày trong các tháng 01 và 02 (tháng có
Tết Dương lịch và Tết Nguyên Đán) Mô hình kết hợp Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) và Support Vector Regression (SVR) đã
hoàn thiện hàm dự báo ngắn hạn, cung cấp kết quả dự báo cho các nhà quản lý điều hành thị trường điện cạnh tranh, các kết quả dự báo
được kiểm chứng với bộ dữ liệu của 05 Tổng công ty Điện lực thuộc Tập đoàn Điện lực Việt Nam
Ngoài ra, luận án cũng đã có những phân tích sự tác động của giá thị trường SMP và các hợp đồng CFD đến các kết quả dự báo Qc để làm sao hạn chế tới mức thấp nhất các rủi ro và tận dụng được các biến động của thị trường để mang về lợi nhuận cao nhất Các module
xử lý dữ liệu thiếu, xây dựng Biểu đồ phụ tải chuẩn hóa đơn vị (SLP), dự báo phụ tải,… được chính tác giả tự lập trình bằng ngôn ngữ Matlab 2017
Trang 7ABSTRACT
The characteristic of the production and consumption of electricity is to ensure a balance between production and consumption at all times, when there is an imbalance between production and consumption, the quality of electricity is changed More severe changes may result in a voltage collapse resulting in system breakdown
However, electricity is a very special commodity, it is economically impossible to store and stabilize electrical systems requiring a constant balance between production and consumption
At the same time, the demand for electricity also depends on the weather (temperature, wind speed, rain, ); needs of businesses, as well as daily activities (peak capacity compared to peak hours, days
of the week compared to weekends, holidays and close to holidays, ); The generation capacity of renewable energy sources also varies according to natural conditions; Therefore, it is necessary to use power forecasting technology to provide information for the process
of controlling the power system to ensure the balance between production and consumption Especially when the power system is operated under the competitive electricity market mechanism, the forecast results will provide information to the regulators on the purchase and sale price
There have been many forecasting methods used, but most of them are long-term and medium-term forecasting methods to provide information for power development planning, power grids and operation planning The dissertation will study a short-term forecasting method to provide additional charge information for
Trang 8regulators operating the competitive electricity market
The study of load characteristics; building methods to handle data missing and falsified data; as well as proposing the use of Standardized Load Profiles (SLP) diagram to provide information for forecasting models which are important tasks of the thesis Through analysis of forecasting models being used in the world (Statistical techniques - SARIMA model; Artificial intelligence, machine learning - Support Vector Regression model; Neural Network, Feedforward Networks; Random Forest), treatise The project has successfully built a new algorithm which is using Standardized Load Profiles (SLP) as the input data set for the regression module building modules that have worked and forecasted results with low errors, it solves the story of the difference between negative and positive days, festivals, special days of the year and especially the days in January and February (months with New Year's Day and New Year's Day) The combined model of Standardized Load Profiles (SLP) and Support Vector Regression (SVR) has completed the short-term forecasting function, providing forecasting results for regulators operating the competitive electricity market, The forecast results are verified with the data set of 05 Electricity Corporations
In addition, the thesis also analyzes the impact of SMP market price and CFD contracts on Qc forecast results to minimize risks and take advantage of fluctuations of the market to bring about the highest profit The data processing modules are missing, built the Standardized Load Profiles (SLP), Load forecast, programmed by the author in Matlab 2017
Trang 9CÁC CÔNG TRÌNH NGHIÊN CỨU ĐÃ CÔNG BỐ
1 Nguyen Tuan Dung, Tran Thu Ha, Nguyen Thanh Phuong,
2018: COMPARATIVE STUDY OF SHORT-TERM
ELECTRIC LOAD FORECASTING: CASE STUDY EVNHCMC - 2018 4th International Conference on Green
Technology and Sustainable Development (GTSD) – IEEE Conference 2018
2 Nguyen Tuan Dung, Nguyen Thanh Phuong, tháng 7 năm
2018: Comparative Study of Short-Term Electric Load
Forecasting: Case Study EVNHCMC – Hội thảo Quốc gia
lần thứ XXI – Một số vấn đề chọn lọc của Công nghệ thông tin
và Truyền thông – Thanh Hóa
3 Nguyen Tuan Dung, Nguyen Thanh Phuong, 2018: DỰ BÁO
PHỤ TẢI ĐIỆN NGẮN HẠN BẰNG SUPPORT VECTOR REGRESSION (SVR) – Hội nghị Khoa học công nghệ 2018
– Trường Đại học Công nghệ thành phố Hồ Chí Minh
4 Nguyen Tuan Dung, Nguyen Thanh Phuong, 2019:
HANDLING MISSING DATA USING STANDARDIZED LOAD PROFILE (SLP) AND SUPPORT VECTOR REGRESSION (SVR) - 2019 International Conference on
System Science and Engineering (ICSSE) – IEEE Conference
2019
5 Nguyen Tuan Dung, Nguyen Thanh Phuong, 2020: LOAD
FORECASTING FOR MONTHS OF THE LUNAR NEW YEAR HOLIDAY USING STANDARDIZED LOAD PROFILE AND SUPPORT REGRESSION VECTOR:
Trang 10CASE STUDY HO CHI MINH CITY - The International
Conference On Science, Technology And Society Studies (STS 2020) – Trường Đại học Công nghệ thành phố Hồ Chí Minh
HỌC
6 Nguyen Tuan Dung, Nguyen Thanh Phuong, 2017:
DEALING WITH MISSING DATA FOR THE POWER
REGRESSION (SVR) - ISSN 1859-1531 - Tạp chí KHOA
HỌC VÀ CÔNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, SỐ Số 3(112).2017-Quyển 1; Trang: 28-33
7 Nguyen Tuan Dung, Nguyen Thanh Phuong, 2019: XỬ LÝ
DỮ LIỆU THIẾU BẰNG BIỂU ĐỒ CHUẨN HÓA ĐƠN
VỊ (SLP) VÀ SUPPORT VECTOR REGRESSION (SVR) -
ISSN 1859-3585 - Tạp chí KHOA HỌC & CÔNG NGHỆ, Số 50.2019, trang 21
8 Nguyen Tuan Dung, Nguyen Thanh Phuong, 2019:
SHORT-TERM ELECTRIC LOAD FORECASTING USING
SUPPORT VECTOR REGRESSION (SVR) - Engineering,
Technology & Applied Science Research Vol 9, No 4, 2019, 4548-4553
9 Nguyen Tuan Dung, Nguyen Thanh Phuong, 2019:
IMPROVE THE ACCURACY OF SHORT-TERM FORECASTING ALGORITHMS BY STANDARDIZED
Trang 11LOAD PROFILE AND SUPPORT REGRESSION VECTOR: CASE STUDY VIETNAM - Advances in
Science, Technology and Engineering Systems Journal Vol 4,
No 5, 243-249 (2019) ASTESJ ISSN: 2415-6698 https://dx.doi.org/10.25046/aj040530
Trang 121.1.3 Trí tuệ nhân tạo, học máy 10 1.2 Các yếu tố tác động đến dự báo phụ tải ngắn hạn 15
1.4 Nhiệm vụ và giới hạn của luận án 18
a) Xây dựng mô hình hồi quy cho việc dự đoán các giá trị thiếu26
Trang 13b) Kết quả xử lý dữ liệu thiếu 27 + Phương pháp thông thường: sử dụng giá trị trung bình trong cùng thời gian cho 4 tuần trước đó của chuổi dữ liệu đang xét,
+ Phương pháp xây dựng đường cong hồi qui bằng giải thuật SVR (Support Vector Regression) 28 CHƯƠNG III: NGHIÊN CỨU PHỤ TẢI VÀ BIỂU ĐỒ CHUẨN
3.1.1 Đặc tính tải ngày – tuần (week day) 30 3.1.2 Đặc tính tải giờ – ngày (hour day) 30
3.2 BIỂU ĐỒ PHỤ TẢI CHUẨN HÓA ĐƠN VỊ 32
3.2.2 Ứng dụng xử lý dữ liệu thiếu bằng Biểu đồ chuẩn hóa đơn vị (SLP) và Support Vector Regression (SVR) 32 3.2.3 Kết quả áp dụng SLP vào xử lý dữ liệu thiếu: 35 CHƯƠNG VI: XÂY DỰNG MÔ HÌNH DỰ BÁO NGẮN HẠN 41
4.2.2 Xây dựng đồ thị chuẩn hóa đơn vị: 48 4.2.3 Xây dựng các mô hình hồi quy cho STLF: 48
4.2.6 Kiểm chứng bằng bộ dữ liệu ngày Tết Nguyên Đán
Trang 144.2.7 Kiểm chứng với bộ dữ liệu của 05 Tổng công ty Điện lực
thuộc Tập đoàn Điện lực Việt Nam (Chi tiết theo Phụ lục đính
CHƯƠNG V – DỰ BÁO TRONG VẬN HÀNH THỊ TRƯỜNG
5.1 Các yêu cầu về dự báo phụ tải trong VWEM 56 5.2 Dự báo phục vụ công tác vận hành thị trường điện cạnh tranh58 5.3 Kết quả áp dụng Kỹ thuật dự báo vào vận hành Thị trường điện Bán buôn Việt Nam (phạm vi Tổng công ty Điện lực
Trang 15CHƯƠNG I: TỔNG QUAN
1.1 Tổng quan về vấn đề nghiên cứu
Vấn đề dự báo điện năng đóng một vai trò hết sức quan trọng và
có tính quyết định đối với nền kinh tế và đời sống của chúng ta Đây
là một môn khoa học quan trọng nhằm nghiên cứu các phương pháp luận khoa học để đưa ra các con số chính xác nhất sẽ xảy ra trong tương lai, giúp cho chúng ta định hướng được phương hướng và kế hoạch cho tương lai, chủ động trong công việc và xử lí được những biến cố Nếu như không thực hiện công tác dự báo điện năng, ta sẽ gặp phải hai trường hợp có thể xảy ra, đó là: sẽ thiếu hụt điện năng sử dụng hay dư thừa điện năng sản xuất
Trong những năm qua, dự báo tiêu thụ điện năng thu hút một sự quan tâm lớn từ các Công ty điện lực và các nhà nghiên cứu từ các khu vực khác nhau Đối với các Công ty điện lực đây là một vấn đề lớn bởi vì họ cần phải ước lượng điện cần thiết để đáp ứng nhu cầu khách hàng của họ Đối với họ, đây không phải là một nhiệm vụ dễ dàng bởi vì nhu cầu điện ngày càng tăng trong những năm qua và cũng vì mô hình tiêu thụ điện ngày càng khác nhau với nhiều yếu tố tác động Vì vậy, một trong những mục tiêu của Công ty điện lực là
dự báo phải bám sát với nhu cầu thực tế để ngăn ngừa sự thiếu hụt hoặc lãng phí điện năng
Việc tìm kiếm các phương pháp dự báo tốt nhất không phải là một nhiệm vụ dễ dàng vì có nhiều biến như: nhiệt độ, độ ẩm, gió, nhân khẩu học, số lượng trung bình của các thiết bị điện trong nước, mùa trong năm, ngày trong tuần, ngày lễ đã được đưa vào xem xét Ngoài
ra, việc xây dựng các nhà máy và hệ thống điện luôn cần có thời gian
Do vậy, muốn đáp ứng được nhu cầu sử dụng điện, ngành điện phải
Trang 16làm tốt công tác dự báo để lập kế hoạch triển khai Chính sự phát triển nhanh của nhu cầu sử dụng điện đang gây ra mất cân đối về tài chính để đảm bảo sự phát triển bền vững của ngành Điện Giá điện mua cạnh tranh sẽ là công cụ của thị trường để tạo ra sự cân bằng tự nhiên nhu cầu sử dụng điện, lợi nhuận của các ngành sản xuất và các đơn vị cung cấp điện [1]
Hiện nay, do sự phát triển nhanh về khoa học kĩ thuật, đặc biệt là những công cụ tính toán, nhiều phương pháp dự báo đã, đang và sẽ được nghiên cứu để đưa vào sử dụng Chúng ta có thể chia dự báo thành các dạng mô hình chính như sau:
1.1.1 Các phương pháp thống kê
(1) Phương pháp bình quân di động
Phương pháp này sử dụng khi các số liệu trong dãy số biến động không lớn lắm Các số bình quân di động được tính từ các số liệu của dãy số thời gian có khoảng cách đều nhau
(2) Phương pháp bình quân di động có trọng số
Những số liệu mới xuất hiện trong các thời kỳ cuối có giá trị lớn hơn những số liệu xuất hiện đã lâu Để xét đến vấn đề này ta sử dụng các trọng số để nhấn mạnh giá trị các số liệu gần nhất, vừa xảy ra Việc chọn các trọng số phụ thuộc vào kinh nghiệm và sự nhạy cảm
của người làm công tác dự báo
(3) Phương pháp san bằng số mũ
Phương pháp này rất tiện lợi khi dùng máy tính Đây cũng là kỹ thuật tính số bình quân di động nhưng không đòi hỏi phải có nhiều số liệu quá khứ
(4) Phương pháp san bằng số mũ có điều chỉnh xu hướng
Phương pháp san bằng số mũ giản đơn không thể hiện rõ xu
hướng biến động Do đó cần phải sử dụng thêm kỹ thuật điều chỉnh
Trang 17xu hướng Cách làm như sau: đầu tiên tiến hành dự báo theo phương
pháp san bằng số mũ giản đơn sau đó sẽ thêm vào một lượng điều chỉnh (có thể âm hay dương)
Phương pháp Winter là một trong một số phương pháp làm mịn hàm mũ giúp phân tích các chuỗi thời gian theo mùa một cách trực tiếp Phương pháp này được dựa trên ba hằng số làm mịn cho tính dừng, xu hướng và mùa Kết quả phân tích của Barakat et al [2] cho thấy rằng mô hình độc đáo của năng lượng và nhu cầu liên quan đến các khu vực phát triển nhanh rất khó để phân tích và dự đoán bằng cách áp dụng trực tiếp phương pháp Winter El-Keib et al [3] trình bày một cách tiếp cận lai, trong đó làm mịn hàm mũ được tăng cường với phân tích phổ điện và mô hình tự điều chỉnh tự hồi quy
(5) Phương pháp dự báo theo đường khuynh hướng
Các phương pháp dự báo theo đường khuynh hướng cũng dựa vào dãy số thời gian Dãy số này cho phép ta xác định đường khuynh hướng lý thuyết trên cơ sở kỹ thuật bình phương cực tiểu, tức là tổng khoảng cách từ các điểm thể hiện nhu cầu thực tế trong quá khứ đến đường khuynh hướng lấy theo trục tung là nhỏ nhất Sau đó dựa vào đường khuynh hướng lý thuyết ta tiến hành dự báo nhu cầu cho các năm trong tương lai
Có thể sử dụng được đường khuynh hướng dự báo theo đường khuynh hướng để dự báo ngắn hạn, trung và dài hạn Đường khuynh hướng có thể là tuyến tính hay phi tuyến
Để xác định được đường khuynh hướng là tuyến tính trước hết ta cần biểu diễn các nhu cầu thực tế trong quá khứ lên biểu đồ và phân tích xu hướng phát triển của các số liệu đó Qua phân tích nếu thấy rằng các số liệu tăng hay giảm tương đối đều đặn theo một chiều hướng nhất định thì ta có thể vạch ra một đường biểu hiện chiều
Trang 18hướng đó Nếu các số liệu biến động theo hướng đặc biệt hơn như tăng giảm ngày càng nhanh hay ngày càng biến động chậm thì ta có thể sử dụng các đường cong thích hợp để mô tả biến động đó (đường parabol, hyperbol, logarit,…)
(6) Dự báo từ các mô hình chuỗi thời gian (mô hình JENKINS)
BOX-Các mô hình kinh tế lượng chủ yếu dựa trên một động thái rõ nét của các đối tượng có liên quan đến hệ thống kinh tế Tuy nhiên một
họ các mô hình thay thế khác được sử dụng rộng rãi, đặc biệt trong
dự báo ngắn hạn, được gọi là các mô hình chuỗi thời gian
Một phương pháp rất phổ biến trong việc lập mô hình chuỗi thời
gian là phương pháp trung bình trượt kết hợp tự hồi quy
(autoregressive integrated moving average - ARIMA), thường
được gọi là phương pháp luận Box-Jenkins Trọng tâm của các
phương pháp dự báo này không phải là xây dựng các mô hình đơn phương trình hay phương trình đồng thời mà là phân tích các tính chất xác suất hay ngẫu nhiên của bản thân các chuỗi thời gian kinh tế
theo triết lý “hãy để dữ liệu tự nói” [4] – [8]
Sau đây là một hình theo phương pháp luận Box-Jenkins trong quá trình dự báo từ mô hình chuỗi thời gian:
a) Mô hình tự hồi quy (AR):
Mô hình chuỗi thời gian tự hồi quy hoàn toàn có cấu trúc như sau:
hay
Trong đó Yt* là quan sát thứ t đối với biến phụ thuộc sau khi trừ đi giá trị trung bình (μ) của chính nó, và ut là thành phần sai số có trung bình bằng 0 và phương sai không đổi, và không tương quan với u
Trang 19nếu t ≠ s (khái niệm này gọi là nhiễu trắng – white noise) Thành
phần hằng số được bỏ qua vì Yt được biểu diễn dạng độ thiên lệch khỏi giá trị trung bình Nói cách khác, Yt được mô hình hóa chỉ với
quá khứ của nó và không với các biến độc lập khác Đây là các mô hình tự hồi qui, AR và mô hình trong phương trình trên được gọi là
mô hình AR (p), với p là bậc tự hồi quy
- Nếu ta lập mô hình Yt như sau: (Yt - μ) = α1(Yt-1 - μ) + ut
với μ là giá trị trung bình của Y và ut là một số hạng sai số ngẫu
nhiên không tương quan (có giá trị trung bình bằng 0 và phương sai không đổi σ2) thì ta nói rằng Yt tuân theo quá trình ngẫu nhiên tự hồi
quy bậc nhất hay AR(1)
- Nhưng nếu xem xét mô hình sau:
(Yt - μ) = α1(Yt-1 - μ) + α2(Yt-2 - μ) + ut
thì ta có thể nói rằng Yt tuân theo quá trình tự hồi quy bậc hai hay
AR(2) Tức là, giá trị của Y trong thời đoạn t phụ thuộc vào giá trị
của nó trong hai thời đoạn trước đó, với các giá trị của Y được biểu
diễn xung quanh giá trị trung bình μ, ta có thể viết mô hình sau: (Yt - μ) = α1(Yt-1 - μ) + α2(Yt-2 - μ) + … + αp(Yt-p - μ) + ut
Trong trường hợp này, Yt là quá trình tự hồi quy bậc p hay
AR(p)
b) Mô hình trung bình trượt (MA)
Quá trình AR vừa đề cập trên không phải là cơ chế duy nhất có thể tạo ra chuỗi dữ liệu Y
- Giả sử ta lập mô hình Y như sau:
với μ là hằng số và ut là số hạng sai số nhiễu ngẫu nhiên thuần
túy Ở đây, Y trong thời gian t bằng một hằng số cộng với trung bình
trượt của sai số hiện tại và quá khứ Vậy trong trường hợp này, ta nói
rằng Y tuân theo quá trình trung bình trượt bậc nhất hay MA(1)
Trang 20- Nhưng nếu Y tuân theo biểu thức:
thì đó là một quá trình trung bình trượt bậc hai hay MA(2)
- Tổng quát hơn, ta có mô hình cho quá trình trung bình trượt
• Sai phân hoá
Hầu hết các chuỗi dữ liệu trong kinh tế luôn có tính không dừng
bởi vì chúng tăng trưởng dần theo thời gian Việc ước lượng của quá trình ARMA đòi hỏi Yt phải là một chuỗi dừng Hầu hết các chuỗi thời gian không dừng đều có thể được chuyển thành dạng dừng thông
qua quá trình sai phân hóa
Giả sử, xét một xu hướng tuyến tính có dạng Yt = α + βt Sai phân bậc nhất của Yt được định nghĩa là: ΔYt = Yt –Yt-1
Ta thấy: ΔYt = α + βt – α – β(t–1) = β là hằng số và do đó nó có tính dừng Do đó, xu hướng tuyến tính có thể được loại bỏ bằng cách lấy sai phân một lần Nếu một chuỗi tăng trưởng theo lũy thừa với mức tăng không đổi, ln(Yt) sẽ có xu hướng tuyến tính và có thể lấy sai phân
Một dạng khác mà trong đó tính không dừng thường xuất hiện đó
là tính mùa Tính không dừng trong các chuỗi theo tháng và theo quý thường có thể được loại bỏ bằng cách lấy sai phân thích hợp: Δ4 = Yt
– Y đối với dữ liệu theo quý và Δ = Y – Y đối với dữ liệu theo
Trang 21tháng
• Mô hình ARIMA
Đa số dữ liệu kinh tế theo chuỗi thời gian không có tính dừng mà
có tính kết Để nhận được dữ liệu có tính dừng, chúng ta phải sử dụng sai phân của dữ liệu
+ Các bậc sai phân
- Sai phân bậc 0 là I(0): chính là dữ liệu gốc Yt
- Sai phân bậc 1 là I(1): wt = Yt – Yt-1
- Sai phân bậc 2 là I(2): w2
t = wt – wt-1
- Sai phân bậc d ký hiệu I(d)
Mô hình ARMA(p,q) áp dụng cho I(d) được gọi là mô hình ARIMA(p,d,q)
1.1.2 Phương pháp chuyên gia
(1) Phương pháp tính hệ số vượt trước (hệ số đàn hồi)
Phương pháp này xác định tỷ số của nhịp độ phát triển năng lượng điện với nhịp độ phát triển của nền kinh tế quốc dân Phương pháp này giúp ta thấy được khuynh hướng phát triển của nhu cầu và sơ bộ cân đối nhu cầu này với nhịp độ phát triển của nền kinh tế quốc dân nói chung Chẳng hạn như, trong giai đoạn 5 năm 1994 - 1999, sản lượng công nghiệp tăng 185%, còn sản lượng điện năng cũng trong thời gian ấy tăng 194%, như vậy hệ số vượt trước sẽ là: K = 194 /
185 = 1,05
Như vậy phương pháp này chỉ nói lên xu thế phát triển với một
Trang 22mức độ chuẩn xác nào đó và trong tương lai xu thế này còn chịu ảnh hưởng của các nhân tố biến động không lường trước khác như:
- Suất tiêu hao năng lượng với mỗi sản phẩm công nghiệp ngày càng giảm xuống do tiến bộ về mặt kỹ thuật và về mặt quản lý
- Điện năng ngày càng được sử dụng rộng rãi trong lĩnh vực kinh tế xã hội và trong cuộc sống
- Cơ cấu kinh tế không ngừng thay đổi,…
Vì những lý do nêu trên nên hệ số giá trị vượt trước biến động khá nhiều, nên nếu dùng hệ số vượt trước (hệ số đàn hồi) để xác định nhu cầu điện năng ở năm dự báo sẽ không hoàn toàn chuẩn xác
(2) Phương pháp tính trực tiếp
Phương pháp này xác định nhu cầu điện năng của năm dự báo, dựa trên tổng sản lượng kinh tế của các ngành ở năm đó và suất tiêu hao điện năng đối với từng loại sản phẩm Đối với những trường hợp không có suất tiêu hao điện năng thì xác định nhu cầu điện năng cho
từng trường hợp cụ thể (như công suất điện trung bình cho 1 hộ gia đình, bệnh viện, trường học, ) Phương pháp tính trực tiếp được sử
dụng phổ biến ở những nước kinh tế phát triển có kế hoạch, ổn định
và không bị khủng hoảng
Phương pháp này có ưu điểm là tính toán đơn giản và ngoài việc xác định tổng điện năng dự báo, chúng ta còn biết được tỷ lệ sử dụng điện năng trong các ngành kinh tế, chẳng hạn tỷ lệ dùng điện trong công nghiệp, nông nghiệp, dân dụng, cũng như xác định được nhu cầu điện năng ở các khu vực địa lý khác nhau, như vậy tạo điều kiện thuận lợi cho công tác thiết kế quy hoạch cung cấp điện Tuy nhiên mức độ chính xác của phương pháp này bị phụ thuộc vào mức độ chính xác của tổng sản lượng các ngành kinh tế quốc dân trong tương lai, cũng như phụ thuộc vào suất tiêu hao điện Phương pháp này
Trang 23thường được áp dụng để dự báo nhu cầu điện năng với thời gian ngắn
và trung bình
(3) Phương pháp ngoại suy theo thời gian
Phương pháp ngoại suy theo thời gian nghiên cứu sự diễn biến của nhu cầu điện năng trong một thời gian quá khứ tương đối ổn định, tìm ra quy luật và áp dụng quy luật ấy ra để dự đoán cho tương lai Phương pháp này chỉ cho ta kết quả chính xác nếu tương lai không có nhiều thay đổi lớn so với quá khứ và sự phát triển ở tương lai phải tuân theo đúng quy luật ở quá khứ
(4) Phương pháp tương quan
Phương pháp này nghiên cứu mối tương quan giữa các thành phần kinh tế nhằm phát hiện những quan hệ về mặt định lượng của các tham số trong nền kinh tế quốc dân, dựa vào những phương pháp thống kê toán học Cụ thể mục đích của chúng ta là dự báo nhu cầu điện năng, cho nên ta cần nghiên cứu sự tương quan giữa điện năng tiêu thụ với các chỉ tiêu kinh tế khác như tổng giá trị sản lượng công nghiệp, tổng giá trị sản lượng kinh tế quốc dân (đồng/năm)
(5) Phương pháp đối chiếu so sánh
Phương pháp này so sánh đối chiếu nhu cầu phát triển điện năng của các nước có hoàn cảnh phát triển kinh tế - xã hội hoàn toàn tương
tự Phương pháp này chỉ nên dùng kiểm tra, xử lý lại kết quả dự báo
mà ta đã dùng phương pháp ngoại suy và phương pháp tương quan
(6) Phương pháp chuyên gia
Trong những năm gần đây người ta quan tâm nhiều và đánh giá cao những kinh nghiệm của các chuyên gia trong lĩnh vực dự báo, qui hoạch trong các ngành của nền kinh tế quốc dân, để dự báo các chỉ tiêu kinh tế Chuyên gia ở đây chúng ta có thể hiểu là cá nhân, hay 1 công trình kết quả tính toán dự báo của 1 viện nghiên cứu hay công
Trang 24trình nào đó đã thực hiện
1.1.3 Trí tuệ nhân tạo, học máy
Trí tuệ nhân tạo là một lĩnh vực nghiên cứu tương đối mới Thuật toán tính toán thường được sử dụng để chỉ các lĩnh vực của hệ thống
mờ, mạng nơ ron nhân tạo (ANN) và học máy
(1) Fuzzy logic
Một hệ thống logic mờ với việc giải mờ có thể xác định và gần đúng bất kỳ hệ thống động không xác định nào (ở đây là tải) trên thiết lập nhỏ gọn đến độ chính xác tùy ý Liu [9] đã quan sát thấy rằng một hệ thống logic mờ có khả năng tuyệt vời trong việc vẽ các điểm tương đồng từ dữ liệu khổng lồ
Trình dự báo dựa trên logic mờ hoạt động theo hai giai đoạn: đào tạo và dự báo trực tiếp Trong giai đoạn đào tạo, dữ liệu tải quá khứ được sử dụng để đào tạo một bộ đếm thời gian dựa trên mô-đun 2m đầu vào, 2n đầu ra để tạo cơ sở dữ liệu mẫu và cơ sở nguyên tắc mờ bằng cách sử dụng sự khác biệt thứ nhất và thứ hai của dữ liệu Sau khi đào tạo đủ, nó sẽ được liên kết với một bộ điều khiển để dự đoán thay đổi tải trực tuyến Nếu có thể tìm thấy mô hình phù hợp nhất với khả năng cao nhất, thì mô hình đầu ra sẽ được tạo ra thông qua một phần mềm giải mờ centroid [10] – [23]
(2) Neural networks
Mạng thần kinh được mô phỏng theo nguyên tắc hoạt động cơ bản của bộ não con người Chúng bao gồm một vài nơ-ron, một nơ-ron nhận được thông tin về các nút đầu vào và tổng hợp thông tin Sau
đó, nó xác định kích hoạt của nó và truyền phản ứng của nó qua nút đầu ra cho các nơ-ron khác Mạng thần kinh thường được áp dụng cho dự báo tải (xem ví dụ Hippert và cộng sự [24] để kiểm tra)
Trang 25Hình 1.1 – Mạng nơ-ron truyền thẳng Một mạng nơ-ron truyền thẳng bao gồm một vài lớp kế tiếp các nơ-ron với một một nơ-ron đầu vào, một số lớp ẩn và một lớp đầu ra, các nơ-ron được kết nối bằng các vectơ trọng số Phương pháp học
cơ bản hoặc điều chỉnh trọng số là sự truyền ngược trở lại giá trị lỗi
đề dự báo tải điện
(4) Mô hình Bộ hồi quy dựa theo vector hỗ trợ – Support vector regression (SVR)
Ý tưởng cơ bản của SVR là ánh xạ không gian đầu vào sang một
Trang 26không gian đặc trưng nhiều chiều mà ở đó, ta có thể áp dụng được
hồi quy tuyến tính (mà nếu ta áp dụng trực tiếp hồi quy tuyến tính thì không hiệu quả)
Đặc điểm của SVR là cho ta một giải pháp thưa (sparse solution); nghĩa là để xây dựng được hàm hồi quy, ta không cần phải sử dụng hết tất cả các điểm dữ liệu trong bộ huấn luyện Những điểm có đóng góp vào việc xây dựng hàm hồi quy được gọi là những Support Vector Việc phân lớp cho một điểm dữ liệu mới sẽ chỉ phụ thuộc vào các support vector
Hình 1.2 – Biến đổi không gian dữ liệu sang
không gian đặc trưng (thủ thuật Kernel)
Hàm hồi quy cần tìm có dạng:
b x w x f
Cho tập huấn luyện {(x1, t1), (x2, t2), …, (xN, tN)} Rn R
Với bài toán hồi quy đơn giản, để tìm w và b ta phải tối thiểu hóa
hàm lỗi chuẩn hóa:
Trang 272 1
22 } { 2
1
w t
y
N
n
n n
+
−
=
với là hằng số chuẩn hóa
Để có được một giải pháp thưa, ta sẽ thay hàm lỗi trên bằng hàm
lỗi ε-insensitive Đặc điểm của hàm lỗi này là nếu trị tuyệt đối của sự
sai khác giữa giá trị dự đoán y(x) và giá trị đích nhỏ hơn ε (với ε> 0) thì nó coi như độ lỗi bằng 0
Như vậy bây giờ, ta phải tối thiểu hóa hàm lỗi chuẩn hóa sau:
2 1
22
1 ) ) (
E CN n
n
= Vớiy x w T x n b
+
( n)
t (nằm ngoài và phía trên ống) và ˆ n 0 ứng với điểm
mà t n y(x n)− (nằm ngoài và phía dưới ống)
Hình 1.3 – Minh họa cho các biến lỏngn
Điều kiện để một điểm đích nằm trong ống là:
Trang 28n n
n
n n
n
y t
y t
ˆ
−
−
+ +
Như vậy, ta có hàm lỗi cho SVR:
) 2
1 ˆ
1
w C
n n
n
n n
n
n n
y t
y t
0ˆ,0
n
n n m
n N
n
N
m
m m n
a
1 1
)ˆ()ˆ(),()ˆ)(
ˆ(
2
Với k là hàm nhân:k(x,x')=(x)T(x') Bất kỳ một hàm nào thỏa điều kiện Mercer thì đều có thể được dùng làm hàm nhân Hàm nhân được sử dụng phổ biến nhất là hàm Gaussian:k(x i,x j)=exp(− x i −x j 2)
Cực đại hóa với các ràng buộc:
0)ˆ(
aˆ0
a0
N
1
n n
Từ đây, ta có hàm hồiqui của SVR:
b x x k a a x
Trang 29này đều ảnh hưởng đến độ chính xác dự đoán của mô hình và cần phải chọn lựa kỹ càng Nếu C quá lớn thì sẽ ưu tiên vào phần độ lỗi huấn luyện, dẫn đến mô hình phức tạp, dễ bị quá khớp Còn nếu C quá nhỏ thì lại ưu tiên vào phần độ phức tạp mô hình, dẫn đến mô hình quá đơn giản, giảm độ chính xác dự đoán Ý nghĩa của ε cũng tương tự C Nếu ε quá lớn thì có ít vectơ hỗ trợ, làm cho mô hình quá đơn giản Ngược lại, nếu ε quá nhỏ thì có nhiều vectơ hỗ trợ, dẫn đến
mô hình phức tạp, dễ bị quá khớp Tham số phản ánh mối tương quan giữa các vectơ hỗ trợ nên cũng ảnh hưởng đến độ chính xác dự đoán của mô hình
(5) Mô hình Rừng ngẫu nhiên (Random Forest Regression)
RF là một bộ các cây phân loại và hồi qui (CART), được đưa ra bởi Breiman (2001) [56] Trong RF, mẫu huấn luyện được đặt cho một nhà phân loại cơ bản được xây dựng bằng cách sử dụng thuật toán Bagging [57] Khi xây dựng một cơ sở phân loại, các nút bên trong được kết hợp với một tập hợp thuộc tính ứng cử viên ngẫu nhiên
Trong CART truyền thống, mỗi nút bên trong là tập con của tập
dữ liệu ban đầu và nút gốc chứa tất cả dữ liệu ban đầu Các rừng ngẫu nhiên để hồi quy được hình thành bằng cách hình thành cây dựa vào một vector ngẫu nhiên sao cho cây tiên đoán có các giá trị số cao hơn
so với các nhãn lớp Tập huấn luyện được rút ra một cách độc lập từ
sự phân bố của vector ngẫu nhiên, các dự đoán rừng ngẫu nhiên được hình thành bằng cách lấy trung bình trên k của cây Giải thuật rừng ngẫu nhiên sinh ra mô hình có độ chính xác cao đáp ứng được yêu cầu thực tiễn cho vấn đề phân loại, hồi qui [58] – [63]
1.2 Các yếu tố tác động đến dự báo phụ tải ngắn hạn
Dự báo phụ tải ngắn hạn trong vận hành thị trường điện thường là
Trang 30dự báo phụ tải cho ngày tới, tuần tới với chu kỳ 60/30 phút, nó được chia thành các loại ngày trong tuần, chẳng hạn như: ngày bình thường (thứ ba đến thứ 6); ngày thứ 2; ngày thứ 7; ngày chủ nhật, các ngày
lễ, Tết (Dương lịch và Nguyên Đán); các kỳ nghỉ trong năm Mỗi loại ngày có một đặc điểm hình thái riêng của nó, do đó mô hình dự báo được thiết lập phải làm sao phản ánh được các đặc tính này
Các mẫu phụ tải điện bao gồm các yếu tố tiềm ẩn, nó thường có
xu hướng tương đồng mô hình tải trước đó, tuy nhiên, nó sẽ dẫn đến
dự đoán sai giữa các ngày tiếp theo nếu kiểu ngày khác so với ngày trước đó hoặc có một sự kiện nào đó tác động Ngoài ra, sự biến đổi theo mùa, xu thế khí tượng học (như El nino, La nina) cũng được xem xét cẩn thận
Các biến thời tiết có ảnh hưởng đáng kể đến nhu cầu tải Nhiều biến thời tiết có thể được xem xét trong dự báo tải (nhiệt độ, tốc độ gió, độ che phủ mây, độ ẩm), nhưng ảnh hưởng của chúng đến nhu cầu tải là khác nhau Theo nhiều tác giả, nhiệt độ là một biến được chấp nhận rộng rãi trong dự báo tải điện Tuy nhiên, ở đây cần phải cẩn thận vì dự báo nhiệt độ là một vấn đề phức tạp hơn nhiều so với
dự báo tải điện và nhiệt độ ước tính được sử dụng cho đầu vào thay
vì số thực Tuy nhiên, không phải lúc nào nhiệt độ cũng là sự lựa chọn tốt cho đầu vào dự báo, đôi khi có thể làm giảm độ chính xác của kết quả dự báo
Ngoài ra, đối với các nước Châu Á có sử dụng lịch âm thì một vấn
đề cần được quan tâm và khó dự đoán nhất đó chính là các ngày lễ, Tết Nguyên Đán (thường rơi vào các ngày cuối tháng 1 hoặc đầu tháng 2 dương lịch) Thường kết quả dự báo giai đoạn này có sai số lớn, do có sự sai lệch chu kỳ phụ tải giữa ngày dương lịch và ngày
âm lịch
Trang 31Đối với các bài toán dự báo trước đây, các tác giả thường lấy giá trị quá khứ của bộ dữ liệu như: phụ tải ngày trước, giờ trước, trung bình của tuần trước,… để làm dữ liệu đầu vào huấn luyện Như trình bày trên, do đặc thù là nước sử dụng cả lịch âm và lịch dương nên trên thực tế việc sử dụng các dữ liệu đầu vào này sẽ bị ảnh hưởng rất lớn do sự chênh lệch ngày âm và ngày dương, cũng như làm cho kết quả dự báo bị ảnh hưởng rất nhiều, nhất là trong các tháng 01 và 02 Quan sát biểu đồ phụ tải của tháng 01 và tháng 02, chúng ta sẽ thấy
có sự biến động rất lớn về hình dáng biểu đồ qua các năm, làm cho việc sử dụng các dữ liệu quá khứ để dự báo cho khoảng thời gian này
là hết sức phức tạp Trên thực tế, các thuật toán khi áp dụng để dự báo cho Việt Nam đều phải thực hiện qua một khâu trung gian đó là qui đổi các tháng này thành các tháng thông thường và sau khi chạy kết quả dự báo sẽ qui đổi ngược lại hoặc là chấp nhận sai số lớn Các phần mềm thương mại do nước ngoài cung cấp đều gặp rắc rối này Thêm nữa, với sự tác động của biến đổi khí hậu toàn cầu thì các
số liệu dự báo thời tiết gần đây hầu như không chuẩn xác và khoảng thời gian dự báo tin cậy cũng rất ngắn chỉ từ 05 đến 07 ngày, khó đáp ứng yêu cầu ngày càng cao của các qui định thị trường điện bán buôn cạnh tranh (các Tổng công ty Điện lực phải công bố bảng chào Qc tháng N+1 24 chu kỳ trước ngày 20 của tháng N,…)
1.3 Mục tiêu của luận án
Luận án đặt mục tiêu xây dựng Mô hình kết hợp Biểu đồ phụ tải
chuẩn hóa đơn vị (SLP) – Support Vector Regression (SVR) để giải quyết các vấn đề khó khăn tác động đến các mô hình dự báo phụ tải ngắn hạn nêu trên và đáp ứng các yêu cầu về dự báo ngắn hạn của Cục Điều Tiết Điện lực (ERAV) – Bộ Công Thương Đồng thời, áp
dụng giải thuật này vào thực tế dự báo ngắn hạn của EVNHCMC,
Trang 32cung cấp kết quả dự báo cho các nhà quản lý điều hành thị trường điện cạnh tranh, cũng như đánh giá, hiệu chỉnh kết quả dự báo Qc để làm sao hạn chế tới mức thấp nhất các rủi ro và tận dụng được các biến động của thị trường để mang về lợi nhuận cao nhất từ thị trường
1.4 Nhiệm vụ và giới hạn của luận án
Một số vấn đề ra cần phải giải quyết khi nghiên cứu như sau:
- Nghiên cứu các đặc tính, các thành phần của chuỗi dữ liệu quá khứ điện năng ghi nhận được theo năm, theo tháng, theo ngày và theo giờ (thành phần xu hướng, thành phần chu kỳ, thành phần bất qui tắc
và thành phần theo mùa)
- Nghiên cứu các kỹ thuật ước lượng lại dữ liệu bị lỗi, thiếu và sai sót
- Các mô hình dự báo phụ tải điện
- Nghiên cứu các mô hình dự báo tiên tiến trên thế giới để xây dựng giải thuật mới để áp dụng dự báo phụ tải theo từng tháng/năm;
dự báo ngày/tháng và dự báo phụ tải 24 giờ/ngày, có xem xét tác động của yếu tố thời tiết và các yếu tố tác động khác (nếu có), tạo tiền đề để áp dụng trong dự báo thị trường điện phân phối và bán lẻ cạnh tranh
- Đánh giá sự ảnh hưởng của thị trường điện đến công tác dự báo nhu cầu phụ tải nhằm đảm bảo hạn chế rủi ro, tối đa hóa lợi nhuận của hoạt động Sản xuất – Kinh doanh các Tổng công ty Điện lực phân phối trong môi trường thị trường điện
1.5 Phương pháp nghiên cứu
- Thống kê, tổng hợp và xử lý các số liệu điện thương phẩm, công suất cực đại – cực tiểu (Pmax – Pmin), tốc độ phát triển điện, tốc độ tăng trưởng của nền kinh tế, số liệu thống kê nhiệt độ thời tiết, giá điện các thành phần,… dữ liệu quá khứ điện năng ghi nhận được
Trang 33theo năm, theo tháng, theo ngày và theo giờ trong các năm vừa qua (từ khoảng 4 – 5 năm)
- Xử lý các thành phần của chuỗi dữ liệu quá khứ điện năng ghi nhận được theo năm, theo tháng, theo ngày và theo giờ để xác định các thành phần xu hướng, thành phần chu kỳ, thành phần bất qui tắc
và thành phần theo mùa
- Nghiên cứu mô hình thống kê Box-Jenkin (SARIMA), nghiên cứu các mô hình học máy tiên tiến như: Neural Network, Support Vector Regression, Random Forest,… để xây dựng mô hình dự báo (dự báo ngắn hạn, trung hạn) theo yêu cầu của Cục Điều Tiết Điện lực (ERAV) – Bộ Công Thương
- Nghiên cứu và đánh giá sự ảnh hưởng thị trường điện đến việc
dự báo nhu cầu phụ tải điện Đồng thời, xác định các mối quan hệ tác động ảnh hưởng đến các thành phần phụ tải, dự báo xu hướng để xây dựng kế hoạch phát triển dài hạn
- Các modules về xử lý dữ liệu, về các giải thuật dự báo đều được chính tác giả lặp trình bằng ngôn ngữ Matlab 2017; Bộ dữ liệu
sử dụng trong luận án là bộ dữ liệu được thu thập trong quá trình vận hành hệ thống điện của EVNHCM và dữ liệu vận hành Thị trường điện bán buôn (VWEM) của A0;
1.6 Đóng góp của luận án
- Luận án đã nghiên cứu, xây dựng được công cụ tự động ước
lượng các dữ liệu bị lỗi (dữ liệu thiếu, sai sót, ngoại lai,…) mà trước
đây phải thực hiện thực một cách thủ công Đã đề xuất Mô hình kết hợp Biểu đồ chuẩn hóa đơn vị (SLP) và Support Vector Regression (SVR) góp một phần không nhỏ trong kỹ thuật ước lượng lại dữ liệu
bị lỗi
Trang 34- Luận án đã xây dựng thành công giải thuật mới là sử dụng Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) làm bộ dữ liệu đầu vào cho các modules xây dựng hàm hồi qui đã phát huy tác dụng và cho kết quả dự báo có độ sai số thấp, nó giải quyết được câu chuyện chênh lệch ngày âm và ngày dương, các ngày lễ hội, ngày đặc biệt trong năm và nhất là các ngày trong các tháng 01 và 02 (tháng có Tết âm lịch);
- Luận án cũng đã thử nghiệm được nhiều mô hình dự báo tiên tiến theo xu hướng thế giới như: Kỹ thuật thống kê – mô hình SARIMA; Trí tuệ nhân tạo (học máy) – mô hình Support Vector Regression (SVR); mạng Neural Network, Feedforward Networks; Rừng ngẫu nhiên (Random Forest); Qua đó, đã đánh giá kết quả các giải thuật xây dựng đường cong hồi qui của từng mô hình, với những
bộ trọng số khác nhau, để từ đó lựa chọn được mô hình có sai số phù hợp làm hàm dự báo STLF;
- Ngoài ra, luận án cũng đã có những phân tích sự tác động của giá thị trường SMP và các hợp đồng CFD đến các kết quả dự báo Qc
để làm sao hạn chế tới mức thấp nhất các rủi ro và tận dụng được các biến động của thị trường để mang về lợi nhuận cao nhất;
1.7 Ý nghĩa thực tiễn của luận án
Việc dự báo nhu cầu phụ tải điện có ý nghĩa khác nhau đối với các đơn vị có chức năng khác nhau khi tham gia vào thị trường điện, cụ thể:
- Xây dựng được cho ngành điện thêm một công cụ dự báo mang tính ứng dụng cao giải quyết các vấn đề của các nghiên cứu trước đây: vẫn còn nặng về nghiên cứu phương pháp luận và học thuật, chưa đi vào số liệu cụ thể, sai số dự báo còn cao và nhất là khả năng áp dụng còn nhiều giới hạn; Áp dụng giải thuật này vào thực tế
Trang 35dự báo ngắn hạn của EVNHCMC, cung cấp kết quả dự báo cho các nhà quản lý điều hành thị trường điện cạnh tranh;
- Các thành viên tham gia thị trường cần phải dự báo nhu cầu phụ tải trước để lên kế hoạch sản xuất kinh doanh, cũng như lập kế hoạch phân bổ nguồn vốn đầu tư một cách hợp lý để tối ưu hoá lợi nhuận, hạn chế rủi ro;
- Những đơn vị điều hành thị trường điện cũng có thể vận dụng
dự báo nhu cầu phụ tải và giá điện để xác định phản ứng của thị trường tại vào các thời điểm khác nhau từ đó có chiến lược điều tiết thị trường một cách hợp lý;
- CHƯƠNG II: CHUỖI DỮ LIỆU VÀ XỬ LÝ GIÁ TRỊ THIẾU Chương này đề cập đến việc thu thập và phân tích dữ liệu, cũng như thảo luận về các vấn đề khác nhau gây ra bởi các giá trị còn thiếu
và những cách khác nhau mà chúng ta có thể giải quyết Đồng thời, chương này cũng sẽ đề xuất phương pháp xây dựng đường cong hồi qui bằng giải thuật huấn luyện SVR (Support Vector Regression), từ
đó ước lượng, xử lý các vấn đề thiếu, sai sót dữ liệu trong quá trình nghiên cứu, dự báo phụ tải điện
- CHƯƠNG III: NGHIÊN CỨU PHỤ TẢI VÀ BIỂU ĐỒ CHUẨN HÓA ĐƠN VỊ
Chương này đề cập đến việc nghiên cứu/phân tích phụ tải để hiểu
Trang 36rõ hơn về những gì chúng ta đang cố gắng dự báo (xu hướng, tổng nhu cầu, sự khác biệt các vùng, đặc tính tải, ), kiểm tra bất kỳ biến
động đặc thù nào đó và là cách tuyệt vời để kiểm tra dữ liệu sai Đồng thời, tác giả đã xây dựng khái niệm Biểu đồ phụ tải chuẩn hóa
đơn vị (Standardized Load Profiles - SLP) và Ứng dụng xử lý dữ liệu
thiếu bằng Biểu đồ chuẩn hóa đơn vị (SLP) và Support Vector Regression (SVR) theo cấp độ theo 24 chu kỳ/ ngày
- CHƯƠNG IV: XÂY DỰNG MÔ HÌNH DỰ BÁO NGẮN HẠN
Dự báo phụ tải ngắn hạn (STLF) đóng một vai trò quan trọng trong việc xây dựng các chiến lược kinh doanh, đảm bảo tin cậy và
an toàn cho hệ thống điện Chương này đã đề xuất giải thuật mới là
Mô hình kết hợp Biểu đồ phụ tải chuẩn hóa đơn vị (SLP) - Support
Vector Regression (SVR) để làm hàm dự báo STLF (kiểm chứng với
bộ dữ liệu của 05 Tổng công ty Điện lực)
Ngoải ra, trong chương này tác giả còn chạy thử nghiệm được nhiều mô hình dự báo tiên tiến theo xu hướng thế giới như: Kỹ thuật thống kê – mô hình SARIMA; Trí tuệ nhân tạo (học máy) – mạng Neural Network, Feedforward Networks; Rừng ngẫu nhiên (Random Forest) để so sánh đánh giá, để từ đó lựa chọn được mô hình có sai số phù hợp làm hàm dự báo STLF
- CHƯƠNG V – DỰ BÁO TRONG VẬN HÀNH THỊ TRƯỜNG ĐIỆN CẠNH TRANH CỦA VIỆT NAM
Chương này cung cấp các thông tin tổng quan về thị trường điện cạnh tranh Việt Nam và tác giả cũng đã chạy các kết quả dự báo dài hạn (5-10 năm), dự báo theo tháng/ năm và kết quả dự báo ngắn hạn 24/48 chu kỳ của 365 ngày/năm theo đúng qui định của thị trường cho Tổng công ty Điện lực TP.HCM
Trang 37Chương này cũng đánh giá việc áp dụng giải thuật này vào thực tế
dự báo ngắn hạn của EVNHCMC trong các năm vừa qua (đánh giá thông qua sai số dự báo theo chu kỳ/ngày/tuần/tháng/năm), cũng như tác giả đã có những phân tích thật sự sâu về tác động của giá thị trường SMP và các hợp đồng CFD đến các kết quả dự báo Qc để làm sao hạn chế tới mức thấp nhất các rủi ro và tận dụng được các biến dộng của thị trường để mang về lợi nhuận cao nhất
- CHƯƠNG VI – KẾT LUẬN
Chương này tổng hợp các nội dung đã nghiên cứu và trình bày trong luận án, theo đó đã tóm lược các điểm mới và hạn chế trong quá trình nghiên cứu, cũng như trình bày hướng phát triển tiếp theo của luận án
Trang 38CHƯƠNG II: CHUỖI DỮ LIỆU VÀ XỬ LÝ GIÁ TRỊ THIẾU
2.1 CHUỖI DỮ LIỆU
2.1.1 Xác định yêu cầu dữ liệu
Điều đầu tiên cần thực hiện khi lập kế hoạch thu thập dữ liệu là phải xác định xem các dữ liệu nào là cần thiết để có thể giải quyết bài toán Về tổng thể, có thể cần sự trợ giúp của các chuyên gia trong
lĩnh vực của bài toán cần giải quyết Cần biết: i) Các dữ liệu chắc chắn có liên quan đến bài toán; ii) Các dữ liệu nào có thể liên quan; iii) Các dữ liệu nào là phụ trợ Các dữ liệu có liên quan và có thể liên
quan đến bài toán cần phải được xem là các đầu vào cho hệ thống
2.1.2 Xác định nguồn dữ liệu
Bước kế tiếp là quyết định nơi sẽ lấy dữ liệu, điều này cho phép ta xác định được các ước lượng thực tế về những khó khăn và phí tổn cho việc thu thập dữ liệu Nếu ứng dụng yêu cầu các dữ liệu thời gian thực, những ước lượng này cần tính đến khả năng chuyển đổi các dữ liệu tương tự thành dạng số Trong một số trường hợp, ta có thể chọn lựa dữ liệu mô phỏng từ các tình huống thực tế Tuy nhiên, cần phải quan tâm đến độ chính xác và khả năng thể hiện của dữ liệu đối với các trường hợp cụ thể
2.1.3 Xác định lượng dữ liệu
Ta cần phải ước đoán số lượng dữ liệu cần thiết để có thể sử dụng trong việc xây dựng giải thuật Nếu lấy quá ít dữ liệu thì những dữ liệu này sẽ không thể phản ánh toàn bộ các thuộc tính mà giải thuật cần xử lý Mặt khác, cũng không nên đưa vào quá nhiều dữ liệu đầu vào làm cho giải thuật thêm phức tạp
Việc định lượng gần đúng lượng dữ liệu cần đưa vào xử lý là hết sức cần thiết Thông thường, dữ liệu thường thiếu hoàn chỉnh (trong
Trang 39một số trường hợp dữ liệu ghi nhận bị đứt quản do thiết bị ghi nhận
bị sự cố hoặc nhân viên vận hành quên ghi nhận), do đó nếu muốn giải thuật có khả năng thực hiện được những điều mà ta mong đợi thì
nó cần phải được xử lý với lượng dữ liệu lớn hơn
2.2 DỮ LIỆU THIẾU TRONG NGHIÊN CỨU PHỤ TẢI ĐIỆN
Nghiên cứu phụ tải là hoạt động phân tích biểu đồ phụ tải hệ thống điện nhằm chia thành biểu đồ của các thành phần phụ tải, phân nhóm phụ tải, các khách hàng sử dụng điện cuối cùng và các công nghệ sử dụng điện, để đưa ra các thông tin quan trọng như: Công suất
và thời gian xuất hiện phụ tải đỉnh; Xu hướng tăng trưởng của Phụ tải đỉnh và Hệ số phụ tải; Chênh lệch phụ tải cao/thấp điểm của hệ thống; Lập kế hoạch, thiết kế và triển khai các chương trình DSM; Nâng cao độ chính xác của dự báo phụ tải ngắn hạn;
Đây là một hoạt động chuyên sâu về phân tích số liệu, trong đó dữ liệu được thu thập thường là rất lớn, thông qua các hình thức thu thập
tự động hoặc thủ công Do đó dữ liệu bị lỗi là rất khó tránh khỏi, bởi
có rất nhiều nguyên nhân như: sự cố đường truyền, sự cố thiết bị đo đếm, sự cố thiết bị lưu trữ hay do việc xữ lý dữ liệu thủ công không đúng phương pháp,
2.2.1 Phương pháp xử lý dữ liệu thiếu trong nghiên cứu phụ tải điện
Một số phương pháp ước lượng số liệu đo đếm của các phụ tải điện bị lỗi trong quá trình thu thập dữ liệu của các Công ty điện lực thường được sử dụng như sau [99]:
- Nội suy tuyến tính: nội suy từ đường đặc tính xu thế tiêu thụ điện;
- Ngày tương đồng: sử dụng dữ liệu ngày tương đồng của tuần hiện tại hoặc tuần trước;
Trang 40- Tự động ước lượng: sử dụng trong trường hợp dữ liệu bị thiếu không quá bảy (07) ngày;
- Kiểm tra trực quan đồ thị: để biết được dữ liệu bị sai và quyết định về dữ liệu được ước lượng;
- Hiệu chỉnh ước lượng số liệu thủ công: được sử dụng khi dữ liệu
bị thiếu nhiều hơn bảy (07) ngày;
- Hiệu chỉnh ước lượng giá trị trung bình các tuần của ngày tham chiếu: dựa vào dữ liệu của bốn (04) tuần gần nhất;
Tuy nhiên, các cách làm này đều thực hiện một cách thủ công và phụ thuộc rất nhiều vào năng lực kinh nghiệm của chuyên gia thực hiện ước lượng
Luận án xin đề xuất một phương pháp xử lý dữ liệu thiếu bằng cách xây dựng các xây dựng các mô hình hồi quy tối ưu hóa các thông số tự động thông qua quá trình huấn luyện học máy Support Vector Regression (SVR), từ đó ước lượng lại các dữ liệu đã mất hoặc không ghi nhận được trong quá trình đo đếm
2.2.2 Kết quả nghiên cứu
a) Xây dựng mô hình hồi quy cho việc dự đoán các giá trị thiếu
Dựa trên mối quan hệ tuyến tính của ba thành phần số liệu công suất (Pmax), điện năng tiêu thụ (Atổng) và nhiệt độ (t0), luận án đề xuất giải thuật xây dựng mô hình hồi qui dự đoán các giá trị thiếu cho chuỗi dữ liệu điện năng tiêu thụ (Atổng), trên cơ sở ràng buộc của bộ
dữ liệu huấn luyện là thành phần số liệu công suất (Pmax) và nhiệt độ (t0) Yêu cầu đặt ra là thực hiện việc xử lý các dữ liệu điện năng tiêu thụ bị lỗi trong quá trình đo đếm theo từng giờ trong ngày hoặc tổng điện năng tiêu thụ tổng từng ngày theo tháng Giải thuật như sau: