MỤC LỤC
- Tối ưu hóa lưu trữ năng lượng:Dự báo chính xác về công suất phát từ nhà máy ĐMTgiúpđưaraquyếtđịnhvềviệclưutrữnănglượngdưthừa(sửdụngpinlưu trữ hoặc hệ thống lưu trữ năng lượng khác…) một cách hợp lý để phát vào các khung thời gian hệ thống cần công suất như khi có các sụt giảm, biến động lớn mà các nguồn khác không đủ hoặc chưa kịp đápứng. Với sự tiến bộ của công nghệ trong thời gian qua, nhiều môhìnhhọcmáy,họcsâuhiệnđạiđãrađờivàđãchứngminhhiệuquảtronggiảiquyết các vấn đề thực tiễn như xử lý nguôn ngữ tự nhiên, xử lý hình ảnh, hệ thống khuyến nghị… Việc nghiên cứu các công nghệ này để phát triển các mô hình dự báo ngắn hạn côngsuấtcácnhàmáyĐMTđặcbiệtlàcácmôhìnhmạngnơ-ronhồiquylàmộthướng.
- Xâydựngđượcquytrìnhhoànchỉnhvàcôngcụphầnmềmdựbáongắnhạncông suất nhà máy ĐMT sử dụng mạng nơ-ron hồi quy, tạo điều kiện thuận lợi cho người sử dụng có nhu cầu cho việc triển khai và sử dụng công nghệ dự báo trong thực tế cho các nhà máyĐMT.
Để đánh giá độ suy giảm của điện áp, dòng điện hay công suất phátđầu ratheođộtăngnhiệtđộ,ngườitasửdụnghệsốnhiệtđộ.Cácdatasheetcủacáctấmpinđều được nhà sản xuất cung cấp hệ số nhiệt độ (TC) cho điện áp mạch mở VOCtrongđiềukiệnthínghiệmtiêuchuẩn(STC–. StandardTestCondition),dòngđiệnmạchngắnISCtrong STC và giá trị công suất tối đa (MPP – Maximum Power Point) trongSTC. (Nguồn:“Vietnam, a System in Rapid Transition” - ESIG Spring Technical Workshop[3]) Mộtvấnđềđángchúýtrongvậnhànhlàvấnđềnghẽnmạch,hiệntạidosựphân bố không cân đối của phụ tải và nguồn năng lượng tái tạo, trong các thời điểm đặc biệt là khung giờ giữa trưa, hệ thống gặp phải vấn đề nghẽn mạch đối với một số nhóm nhà máy đấu nối vào các đường dây 220/110kV có khả năng truyền tải bị hạn chế.
Để xử lý vấn đề này, đơn vị điều độ đã sử dụng hệ thống AGC (Automatic Generation Control – Hệ thống tự động điều khiển công suất) để tự động điều chỉnh công suất các nhà máy trong các nhóm nghẽn mạch an toàn cho đường dây và đảmbảo côngbằngtronghuyđộnggiữacácnhàmáy.Điềunàydẫnđếnkhảnăngnhàmáyđược. Đối với dự báo cho 24 tiếng tới, nghiên cứu [25] đã đạtđượcmộtmôhìnhsaisốcónRMSElà19%tốthơnmộtchútsovớigiátrịtiêuchuẩn theo phương pháp quán tính là20%.
Vì biểu đồ phân bố sai số là hình vẽ mà phải là một con số cụ thể nên khả năng hiểu và phân tích dữ liệu từ đây rất quan trọng để có thể rút ra được những nhận xét đánh giá.Hình 1.9dưới đây là một ví dụ về biểu đồ phân bố sai số phần trăm của hai phương pháp dự báo. Dễ nhận thấy rằng phương pháp 1 cho kết quả tốt hơn so với phương pháp 2 do sai số tập trung quanh mức 0% của phương pháp cao hơn hẳn so vớiphươngpháp2.Đồngthờiởnhữngmứcsaisốlớn,xácxuấtxảyracủaphươngpháp 1 cũng thấp hơn so với phương pháp2.
Do vậy, nếu phải tính sai phân một chuỗi thời gian d lần để làm cho nó có tính dừng và sau đó áp dụng mô hình ARMA(p, q), ta nói rằng chuỗi thời gian ban đầu là ARIMA(p, d, q), tức là nó là một chuỗi thời gian trung bình trượt kết hợp tự hồi quy, vớipbiểuthịsốcácsốhạngtựhồiquy,dbiểuthịsốlầnchuỗithờigianphảiđượctính sai phân cho tới khi có tính dừng, và q là số các số hạng trung bìnhtrượt. Mạng nơ-ron được lấy cảm hứng từ hiểu biết của chúng ta về sinh học của bộ não - tất cả các kếtnốigiữacácnơ-ronđó.Tuynhiên,khácvớibộnãosinhhọc,trongđóbấtkỳnơ-ron nào cũng có thể kết nối với bất kỳ nơ-ron khác trong một khoảng cách vật lý nhất định, cácmạngnơ- ronnhântạonàyđượccấutrúcthànhcáclớp,kếtnốivàhướngdẫndữliệu riêngbiệt.Mạngnơ- ronchínhlànềntảngchocácmôhìnhHọcsâu(DeepLearning–. DL) phức tạp hiện nay a.
Mô hình LSTM mà nhóm tác giả đề xuất được cải tiến nâng cấp so mới mô hình đã công bố tại nghiên cứu [66] có sai số dự báo tốt nhấttrongcácmôhìnhsosánhvớigiátrịchuẩnhóaMAPEđạtđượclà3,5%vànRMSE là 6,5% cho dự báo 1 bước tới, MAPE 4,25% và nRMSE 7,0% cho dự báo 2 bước tới, MAPE 6,9% và nRMSE 10,2% cho dự báo 4 bướctới. TrongnghiêncứucủanhómtácgiảNguyễnThịHoàiThuvàcộngsựcôngbốnăm 2022 [78], các tác giả đã thực nghiệm với bộ số liệu trong vòng 6 thángtừ1/2022đến6/2022củacáchệthốngĐMTmáinhàtạikhuvựcBảoHà,LâmĐồng, củaViệtNam.KếtquảđạtđượclàmôhìnhđềxuấtcủanhómtácgiảdựatrênmạngLSTMc óRMSEđạt2,641MWvàMAEđạt1,896MW,tínhchocảngày24giờ.Mặcdùnhómtác giả không công bố chính xác giá trị công suất đặt của bộ số liệu tuy nhiênq u a biểuđồhìnhvẽcóthểxácđịnhtươngđốigiátrịnàykhoảng60MW.Sauk hichuẩnhóatươngđốiđểsosánhchokhungcónắngtừ5- 18h(13giờ),giátrịchuẩnhóaMAPElà4,8%vànRMSElà9,046%.Nhưvậygiátrịướctính nRMSElà8,127%vàMAPElà5,834%.Lưuýrằng,đâylànghiêncứudànhchodựbáoĐ MTmáinhàtrênmộtkhuvựcđịalýrộngvàdữliệucôngsuấttổngsẽcótínhchấtcủahiệuứng“smoothi ngeffect”.
Ngoài ra, các thông số khí tượng khác liên quan đến nhà máy, chẳng hạn như nhiệt độ không khí, độ ẩm, lượng mưa, tốc độ và hướng giú cần được theo dừi bởi một trạm thời tiết chuyờndụng. Điều này có nghĩa là mỗi điểm dữ liệu có một chỉ dấu thời gian đại diện cho trung bình của tất cả các điểm dữ liệu SCADA trong khoảng thời gian 5 phút kể từ thời điểm của.
Seaborn là một thư viện trực quan hóa dữ liệu được xây dựng trên Matplotlib, nhằm cung cấp một giao diện cao cấp và tùy chỉnh hơn cho việc trực quan hóa dữ liệu.Seaborn cung cấp các biểu đồ và kiểu trực quan hóa cao cấp như heatmaps, violin plots,pairplotsvàjointplots,giỳpngườidựngkhỏmphỏvàhiểurừhơnvề. PVLIB cung cấp các công cụ và chức năng để tính toán liên quan đến điện mặt trời, giúp nghiên cứu và ứng dụng trong lĩnh vực học máy và bài toán dự báo điện mặttrời.
Với kết quả này, có thể nhận thấy rằng đối với công suất đầu ra của nhà máy ĐMT và GHI có một mối tương quan dương mạnh(r. =0,982249),nhiệtđộvàđộẩmtươngquanmạnhmặcdùđộẩmcótươngquanâm.Tốc độ gió có mối tương quan dương nhưng ở mức thấp (r =0,379356). Ứng dụng cụ thể cho bộ dữ liệu đang xem xét, trong mỗi giờ trong một ngày,dữ liệunhưcôngsuất,cómộtphạmvibiếnthiênnhấtđịnh.Phạmvibiếnthiênchomỗigiờ có thể được mô tả như trongHình 2.5, sau quá trình áp dụng thuật toán IQR, các điểm ngoại lai được loại bỏ và dữ liệu được biểu diễn nhưHình2.6.
Dữ liệu đầu vào là dữ liệu chỉ dấu thời gian theo Lịch (Ngày trong năm, Giờ trong ngày, Phút trong giờ) và dữ liệu khí tượng (Bức xạ mặt trời - GHI, Nhiệt độ - TEM, Tốc độ gió - WIS, Độ ẩm - HUM). Từ nghiên cứu tổng hợp [19], phương pháp phổ biến để dự báo công suất nhà máyĐMTtrongngắnhạnlàmạngnơ-ronnhântạo(ANN).ANNlàmộtmạnglướigồm các nơ-ron nhân tạo được kết nối trong các lớp khác nhau: lớp đầu vào, lớp ẩn và lớp đầu ra.
Giá trị hàm mất mát (MAE) trong quá trình huấn luyện. tháng),mớicầnhuấnluyệnlạimôhìnhtrêntoànbộtậpdữliệulớn.Quahìnhmôtảgiá trị hàm mất mát trong quá trình huấn luyện, với mạng 50 nút hoặc 100 nút, giá trị của hàm mất mát đã ổn định sau khoảng 10 epoch huấn luyện.
Kếtquảkiểmtratrêntậpdữliệukiểmtrachothấymôhìnhquántínhchokếtquả lỗi tương đối lớn; RMSE là 11,325 MW và MAE là 7,401 MW, tương ứng với MAPE là15,418%. Các mạng LSTM cho thấy ưu thế về độ chính xác trên tập kiểm tra so với các phươngpháptruyềnthốngkhác.MạngLSTMđơngiảnnhấtvớicấutrúcmộtlớpẩnvà 7 nút ẩn có kết quả khá tương đồng với mạng MLP tốt nhất.
Phân bố sai số tương đối trên tập dữ liệu kiểm tra của các mô hình.
So sánh sai số mô hình sử dụng đầu vào đa biến và mô hình sử đụng đầu vào đơn biến.
Một số đám mây nhỏ ngang qua cũng có thể ảnh hưởng mạnh đến bức xạ đo được tại vị trí trạm khí tượng nhưng lại ít ảnh hưởng đến công suất toàn bộ.
Đểtìmhiểunguyênnhângâyrahiệntượngnày,luậnántiếnhànhphântíchhệsốtương quan của các yếu tố khí tượng đến công suất đầu ra theo các bước trễ khác nhau với phạm vi từ 1 đến 288 bước trễ 05 phút. Ở độtrễ khoảng12tiếng,hệsốtươngquancủacảbứcxạ,nhiệtđộ,độẩmvàtốcđộgióđềuđảo chiều rất mạnh so với các độ trễ nhỏ, đây có thể là nguyên nhân chính dẫn đến hiện tượng sai số của khoảng độ trễ này tăngmạnh.
Điều này cho thấysựkhácbiệttrongquymôcôngsuấtdựbáoảnhhưởngđếnchấtlượngdựbáo.Như đã trình bày ở các phần trước, ở các nhà máy quy mô công suất lớn, thực tế chỉ có từ1- 2 trạm đo các thông số khí tượng cho cả nhà máy ĐMT quy mô vài chục MW với diện tích gần vài chục hecta. So với các kết quả của luận án đạt được hoặc một số kết quả đã công bố khác với cùng khung 1 ngày tới, kết quả của nhóm nghiên cứu Nguyễn Đức Tuyên và công sự đạt được có sai sốtốthơnrấtnhiềuvớiMAPEkhoảng3,7%vànRMSEkhoảng5,4%.Tuynhiêndodữ liệu công suất dùng để so sánh với giá trị dự báo là giá trị cực đại lý thuyết được nhóm tác giả tính toán từ các giá trị khí tượng quá khứ nên sẽ có ảnh hưởng khi so sánh với kết quả từ các mô hìnhkhác.
Nguyên nhân chính đến từ việc nhà máy được kết nối vào một khu vực lưới gồm nhiều nhà máy điện mặt trời và gió khác, mà tổng công suất của những nhà máy này ở trạng thái công suất tối đa lớn hơn công suất vận hành cho phép của đường truyền tải điện, vì vậy các nhà máy trong khu vực thường phải giảm công suất trong các giờ giữa trưa. Để thấy rừ hiệu quả của việc tiền xử lý dữ liệu theo phương ỏn đề xuất, luận ỏn đãtiếnhànhsửdụngmôhìnhLSTM-4L100N(đãthuđượctừChương2)đểhuấnluyện và dự báo cho hai bộ dữ liệu trước và sau xử lý.Bảng 3.1trình bày kết quả sai số dự báo trên tập dữ liệu kiểm tra với bộ dữ liệu huấn luyện trước và sau khi xử lý với kỹ thuậtP/GHIkếthợpphâncụmGHI.Quađócóthểthấy,ápdụngkỹthuậtxửlýđềxuất giúp giảm MAPE từ 6,413% xuống còn 4,109 % với mức cải thiện36,2%.
Tuy nhiên, để có được giải pháp khả thi giúp áp dụng mô hình tính toán công suấtđầuratrongthựctếvớikếtquảtốt,nghiêncứusinhvànhómnghiêncứuđãđềxuất và công bố một giải pháp với ý tưởng chính là mô hình học cũng từ dữ liệu dự báo khí tượngtrongquákhứ,đểvớicùngnguồndữliệudựbáo,trongtươnglaimôhìnhcókhả năng cải thiện độ chính xác củamình. Các mô hình 7I+1F, 7I +2F, 7I+3F, 7I+4F là các mô hình được thêm các đầu vào là số liệu khí tượng dự báo trong quákhứđểcùnghuấnluyện.Từbảngsốliệutạimục(a)củaBảng3.3cóthểnhậnthấy, khi thêm các đầu vào là số liệu khí tượng dự báo, sai số mô hình đạt được trên tập dữ liệu kiểm tra tăng lên so với mô hình chỉ gồm các đầu vào khí tượng quá khứ thựcđo.
Trongđiềukiệnnhàmáyđiệnđượcpháttoànbộcôngsuấtthìcôngsuấtphátphụ thuộc vào khả năng của hệ thống điện mặt trời, tức là phụ thuộc vào GHI (bức xạ toàn phần,tínhbằngđơnvịW/m2)vàmộtsốđiềukiệnthờitiếtkhác.Tuynhiên,khinhàmáy điện mặt trời bị giới hạn công suất hay sự cố thì xảy ra hiện tượng tập dữ liệu thu được có nhiều điểm dữ liệu không đáng tin cậy như có giá trị P (công suất phát, MW) khi GHI bằng 0, hoặc tỷ lệ giữa GHI và P là bất thường, GHI lớn nhưng công suất phát P lại nhỏ, không tươngxứng. - Đã thu thập thông tin và tổng hợp hệ thống hóa lại các kiến thức liên quan đến lĩnh vực dự báo công suất phát của ĐMT trên toàn diện các khía cạnh gồm: dữ liệu đầuvào,khungdựbáo,tiêuchíđánhgiáchấtlượng,cácphươngphápdựbáo.Quaviệc tổng hợp, phân tích, đánh giá các nghiên cứu trong và ngoài nước đã công bố liên quan đến dự báo công suất nhà máy ĐMT sử dụng mạng LSTM trong 5 năm trở lại đây đã củng cố lựa chọn về hướng đi sâu nghiên cứu mô hình dự báo ngắn hạn công suất phát của nhà máy ĐMT sử dụng mạng nơ-ron hồi quy LSTM.
[1] L.D.Bui,N.Q.Nguyen,B.VanDoan,andE.R.Sanseverino,“Forecasting energy output of a solar power plant in curtailment condition based on LSTM using P/GHI coefficient and validation in training process, a case study in Vietnam,”Electric Power Systems. Di Cara, andQ.D.Nguyen,“Anewmethodforforecastingenergyoutputofalarge- scale solar power plant based on long short-term memory networks a case study in Vietnam,”Electric Power Systems Research, vol.