HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA NGUYỄN THÀNH DANH DỰ BÁO SẢN LƯỢNG ĐIỆN MẶT TRỜI TẠI THÀNH PHỐ THỦ DẦU MỘT – TỈNH BÌNH DƯƠNG BẰNG MÔ HÌNH MẠNG TRÍ TUỆ NHÂN TẠO Chuyên ngành: Quản
GIỚI THIỆU TỔNG QUAN
Xu hướng phát triển của năng lượng tái tạo
Hiện tại ở Việt Nam nhiệt điện than và thủy điện là hai nguồn cung cấp năng lượng chính vì cho ra nguồn điện ổn định và giá thành phù hợp Tuy nhiên, với nhu cầu sử dụng điện ngày càng nâng cao, việc phụ thuộc quá nhiều vào các nguồn năng lượng hóa thạch sẽ không đảm bảo an ninh năng lượng bền vững trong tương lai vì nguồn năng lượng này sẽ dần cạn kiệt Chính vì vậy, năng lượng tái tạo đóng một vai trò quan trọng trong việc đảm bảo an ninh năng lượng quốc gia Việc phát triển các nguồn năng lượng sạch giúp giảm áp lực của ngành nhiệt điện về vấn đề môi trường trong quá trình xử lý than làm ô nhiễm và khan hiếm nguồn nước, ảnh hưởng đến đặc điểm của địa chất, thủy văn của vùng khai thác [1]
Năng lượng tái tạo đặc biệt là điện mặt trời mái nhà góp phần khai phá tiềm năng của nhiều tỉnh thành trải khắp Việt Nam, đặc biệt là duyên hải Nam Trung Bộ với nắng và gió lên đến 300 ngày/năm Không những vậy, nó đóng góp cho sự phát triển kinh tế của những tỉnh có đầu tư cho nguồn năng lượng tái tạo lớn
Tuy nhiên, một trong những thách thức lớn mà ngành năng lượng mặt trời phải đối mặt là khả năng sản xuất năng lượng mặt trời không thể đoán trước được, phụ thuộc nhiều vào điều kiện thời tiết như mây che phủ, mưa và cường độ ánh sáng mặt trời Do đó, việc phát triển các mô hình chính xác và đáng tin cậy để dự báo sản lượng điện của các dự án điện mặt trời là rất cần thiết, điều này rất quan trọng để quản lý hiệu quả các hệ thống năng lượng Thực tế là năng lượng mặt trời dự kiến sẽ đóng một vai trò quan trọng trong quá trình chuyển đổi toàn cầu sang các nguồn năng lượng sạch và tái tạo Cơ quan Năng lượng Quốc tế (IEA) ước tính rằng năng lượng mặt trời có thể cung cấp tới 30% điện năng của thế giới vào năm 2050 [1] Dự báo này nhấn mạnh sự cần thiết của các mô hình dự báo năng lượng mặt trời mạnh mẽ có thể hỗ trợ tích hợp hiệu quả năng lượng mặt trời vào lưới điện và tối ưu hóa các hệ thống năng lượng Hơn nữa, nhu cầu
Dữ liệu dự báo HV: Nguyễn Thành Danh dự báo năng lượng mặt trời đặc biệt cấp thiết ở các nước đang phát triển như Việt Nam, nơi các dự án điện mặt trời đang gia tăng và nhu cầu năng lượng đang tăng nhanh Theo báo cáo của Ngân hàng Thế giới, nhu cầu năng lượng của Việt Nam dự kiến sẽ tăng trung bình 10% mỗi năm cho đến năm 2030 [2]
Do đó, công tác dự báo sản lượng điện mặt trời có tính chất quan trọng và gần như đóng vai trò quyết định đối với các Công ty Điện lực trong việc quản lý và vận hành hệ thống điện, đầu tư xây dựng lưới điện trong tương lai Đồng thời, việc dự báo với sai số thấp nhất trong phạm vi cho phép giúp các Công ty Điện lực chủ động xử lí được những biến cố, hạn chế tình trạng mất cân đối khi nhu cầu tăng cao, hạn chế được tình trạng quá tải lưới điện và đảm bảo sự phát triển bền vững của ngành Điện
Việc tìm kiếm các phương pháp dự báo tốt nhất không phải là một nhiệm vụ dễ dàng vì có nhiều biến phụ thuộc như: nhiệt độ, độ bức xạ, công suất đặt, cơ sở pháp lý Ngày nay cùng với sự phát triển nhanh về khoa học kĩ thuật, đặc biệt là những công cụ tính toán, nhiều phương pháp dự báo đã, đang và sẽ được nghiên cứu để đưa vào sử dụng Các mô hình dự báo hiện đại ứng dụng công nghệ mạng nơ-ron là một trong những giải pháp để dự báo sản lượng điện mặt trời tại thành phố Thủ Dầu Một, tỉnh Bình Dương.
Mục tiêu nghiên cứu
Mục tiêu nghiên cứu của đề tài bao gồm các điểm cơ bản sau:
• Tìm hiểu về dự báo phụ tải hệ thống điện, tầm quan trọng của năng lượng tái tạo đối với lưới điện Việt Nam và các yếu tố ảnh hưởng đến sản lượng điện mặt trời
• Tìm hiểu các mô hình mạng trí tuệ nhân tạo dự báo và ứng dụng các mô hình mạng nơ-ron cho dự báo sản lượng điện mặt trời mái nhà tại thành phố Thủ Dầu
• Tìm hiểu về nguồn dữ liệu và tiền xử lý dữ liệu thu thập được trong quá khứ từ năm 2022 đến năm 2023 thuộc Công ty Điện lực Bình Dương
Dữ liệu dự báo HV: Nguyễn Thành Danh
• Áp dụng, so sánh và đánh giá kết quả mô phỏng của các mô hình mạng trí tuệ nhân tạo dự báo sản lượng điện mặt trời
Phạm vi nghiên cứu
− Chỉ thu thập dữ liệu phụ tải khách hàng lắp đặt điện mặt trời mái nhà trên địa bàn thành phố Thủ Dầu Một có tổng sản lượng trên 100kWp/tháng
− Thu thập dữ liệu công suất lắp đặt, độ bức xạ và thời tiết (nhiệt độ, độ ẩm), góc phương vị mặt trời cả khu vực
Trên cơ sở số liệu quá khứ, từ đó sẽ đánh giá mức độ tương quan của các thành phần và đề xuất xây dựng và mô phỏng các mô hình dự báo sản lượng điện mặt trời bằng mạng nơ-ron nhân tạo.
Giới hạn đề tài
• Địa điểm nghiên cứu: Thành phố Thủ Dầu Một, tỉnh Bình Dương, Việt Nam
- Dữ liệu lịch sử về bức xạ mặt trời, nhiệt độ, độ ẩm, và các yếu tố khí tượng khác
- Dữ liệu sản lượng điện mặt trời thực tế tại các hệ thống điện mặt trời đã được lắp đặt trong khu vực nghiên cứu
• Nghiên cứu chỉ áp dụng và so sánh một số mô hình mạng trí tuệ nhân tạo phổ biến như MLP, LSTM, và GRU, không bao gồm các mô hình dự báo khác như mô hình thống kê truyền thống hoặc các phương pháp học máy khác
• Nghiên cứu chỉ áp dụng và so sánh một số mô hình mạng trí tuệ nhân tạo phổ biến như mạng truyền thẳng, mạng hồi quy không bao gồm các mô hình dự báo khác như mô hình thống kê truyền thống
• Mô hình trí tuệ nhân tạo yêu cầu nhiều tài nguyên tính toán và thời gian huấn luyện, do đó, hiệu suất thực tế có thể bị giới hạn bởi khả năng tính toán hiện có
Dữ liệu dự báo HV: Nguyễn Thành Danh
Tính cấp thiết của đề tài
Đề tài về dự báo sản lượng năng lượng điện mặt trời sử dụng mô hình Neural Network (ANN) mang lại một số lợi ích và tính cấp thiết như sau:
• Quan trọng cho ngành năng lượng tái tạo: Việc dự báo sản lượng năng lượng điện mặt trời giúp tối ưu hóa việc sử dụng nguồn năng lượng tái tạo, đặc biệt là trong bối cảnh tăng cường ứng dụng các nguồn năng lượng xanh để giảm thiểu sự phụ thuộc vào nguồn năng lượng hóa thạch
• Hỗ trợ quyết định và lập kế hoạch: Dự báo chính xác sản lượng năng lượng giúp các nhà quản lý và lập kế hoạch trong ngành năng lượng có cái nhìn toàn diện và chính xác về nguồn cung, từ đó hỗ trợ trong việc ra quyết định và lập kế hoạch về phát triển và vận hành các dự án năng lượng tái tạo
• Tiết kiệm chi phí và tăng hiệu quả: Việc dự báo chính xác sản lượng năng lượng giúp tối ưu hóa hoạt động sản xuất và phân phối, giúp giảm thiểu lãng phí và tăng hiệu quả sử dụng tài nguyên năng lượng
• Ứng dụng trong nhiều lĩnh vực: Các phương pháp dự báo sản lượng năng lượng có thể được áp dụng trong nhiều lĩnh vực khác nhau, từ sản xuất năng lượng đến quản lý tài nguyên và môi trường
Với những lợi ích trên, đề tài về dự báo sản lượng năng lượng điện mặt trời mang lại giá trị thực tiễn và có tính cấp thiết trong việc phát triển và tối ưu hóa nguồn năng lượng tái tạo, đồng thời đóng góp vào việc giảm thiểu tác động tiêu cực lên môi trường từ việc sử dụng nguồn năng lượng hóa thạch.
Các nghiên cứu liên quan
• Tình hình nghiên cứu ở nước ngoài
Hiện nay, các mô hình dựa trên công cụ học máy (ML) đã chứng minh thành công đáng kể trong việc dự đoán đầu ra của các dự án năng lượng mặt trời, tận dụng các thuật
Dữ liệu dự báo HV: Nguyễn Thành Danh toán tiên tiến để phân tích nhiều biến số như điều kiện thời tiết, hiệu suất của tấm pin mặt trời và vị trí địa lý [3] Bằng cách tận dụng dữ liệu lịch sử và dữ liệu thời tiết theo thời gian thực, các mô hình học máy có thể đưa ra dự báo chính xác và đáng tin cậy về sản lượng năng lượng mặt trời, cho phép các nhà quản lý năng lượng tối ưu hóa hệ thống năng lượng và giảm chi phí vận hành Việc sử dụng ML trong dự báo năng lượng mặt trời đã thu hút được sự chú ý đáng kể trong những năm gần đây, với một số nghiên cứu chứng minh tiềm năng của các mô hình dựa trên ML trong việc cải thiện độ chính xác và độ tin cậy của dự báo năng lượng mặt trời
Một nghiên cứu được công bố trên tạp chí Năng lượng tái tạo vào năm 2019 đã đề xuất một mô hình dự báo dựa trên ML, sử dụng các thuật toán học máy để dự đoán sản lượng năng lượng mặt trời hàng giờ của hệ thống quang điện Mô hình đạt độ chính xác 94,9% trong việc dự đoán sản lượng năng lượng mặt trời, vượt trội so với các phương pháp dự báo truyền thống [4] Một nghiên cứu khác được công bố trên tạp chí Năng lượng ứng dụng vào năm 2022 đã đề xuất một mô hình dựa trên ML sử dụng thuật toán học sâu để dự báo sản lượng điện của nhà máy điện mặt trời [5] Mô hình tận dụng dữ liệu thời tiết thời gian thực, dữ liệu sản lượng năng lượng mặt trời trong lịch sử và dữ liệu vận hành nhà máy để đưa ra dự báo chính xác và đáng tin cậy về sản lượng năng lượng mặt trời Mô hình đạt được độ chính xác hơn 90% trong việc dự đoán sản lượng năng lượng mặt trời, cho thấy tiềm năng của các mô hình dựa trên ML trong việc cải thiện hiệu quả và độ tin cậy của các hệ thống năng lượng
• Tình hình nghiên cứu trong nước
Tại Việt Nam, xu hướng dự báo năng lượng mặt trời tại Việt Nam liên quan đến việc sử dụng các nguồn dữ liệu khí tượng chính xác như Meteonorm để thiết kế các dự án năng lượng mặt trời trên mái nhà, nâng cao hiệu quả kinh tế và kỹ thuật cho các nhà đầu tư [13], việc sử dụng các mô hình học máy hay các mô hình trí tuệ nhân tạo (AI) trong dự báo năng lượng mặt trời vẫn còn đang trong giai đoạn nghiên cứu phát triển,
Dữ liệu dự báo HV: Nguyễn Thành Danh một nghiên cứu được thực hiện năm 2023 về việc sử dụng mô hình máy học tăng cường độ dốc (Gradient Boosting) vào dự đoán năng lượng pin mặt trời với các dữ liệu đầu vào nhiệt độ môi trường, nhiệt độ pin và bức xạ nhiệt đã đạt được độ chính xác kỳ vọng [6] Nghiên cứu [7] cũng đề xuất một mô hình dự báo kết hợp giữa NARX và LSTM, đồng thời so sánh hiệu suất giữa các mô hình và chỉ ra mạng nơ-ron truyền thẳng cho kết quả dự báo chính xác hơn
Trong phạm vi Luận văn, tác giả cũng sử dụng các mô hình nơ-ron nhân tạo để dự báo công suất điện mặt trời và so sánh hiệu suất giữa các mô hình.
Các vấn đề nghiên cứu của Luận văn
Luận văn “Dự báo sản lượng điện Mặt Trời tại thành phố Thủ Dầu Một – tỉnh Bình Dương bằng mạng trí tuệ nhân tạo” tập trung vào việc giải quyết các vấn đề nghiên cứu sau đây:
• Thu thập dữ liệu các nhà máy điện mặt trời tại thành phố Thủ Dầu Một, tỉnh Bình Dương và các dữ liệu quan trắc liên quan
• Xây dựng các mô hình dự báo dự trên mạng nơ-ron nhân tạo để dự báo sản lượng điện mặt trời tại một nhà máy để tìm ra mô hình phù hợp nhất (có sai số RMSE thấp nhất và giá trị R 2 gần 1 nhất)
• Ngôn ngữ lập trình được sử dụng là Python, trên môi trường PyCharm
• Tiến hành dự báo sản lượng cho tất cả các nhà máy điện trên địa bàn thành phố Thủ Dầu Một, tỉnh Bình Dương và tính toán kết quả dự báo tổng hợp cho sản lượng điện mặt trời của thành phố Thủ Dầu Một, tỉnh Bình Dương
Trong chương 1, tác giả đã trình bày tổng quan về mục tiêu nghiên cứu, phạm vi nghiên cứu, giới hạn của đề tài, tính cấp thiết của đề tài, lược sử nghiên cứu gần đây ở trong và ngoài nước và sau đó đưa ra vấn đề nghiên cứu.
Cơ sở lý thuyết HV: Nguyễn Thành Danh
CƠ SỞ LÝ THUYẾT
Tổng quan về các phương pháp dự báo phụ tải hiện đại
Dự báo phụ tải là công tác dùng dữ liệu trong quá khứ để dự đoán xu hướng thay đổi và phát triển của phụ tải nhằm đưa ra những phương án, hoạch định phù hợp
Dự báo là hoạt động tính toán, ước lượng và đánh giá xu hướng, tốc độ tăng trưởng và nhu cầu của phụ tải được cung cấp điện từ hệ thống điện trong ngắn hạn, trung hạn và dài hạn [8] Để cải thiện nhược điểm của các phương pháp dự báo phụ tải truyền thống, các nhà khoa học đã ứng dụng các phương pháp dự báo phụ tải hiện đại nhằm ngày càng nâng cao độ chính xác của dự báo phụ tải Các phương pháp dự báo phụ tải hiện đại phổ biến ngày nay gồm:
+ Mạng noron nhân tạo (Artificial Neural Network ANN)
Ngày nay cùng với sự phát triển mạnh mẽ của máy tính điện tử, các phương pháp học sâu xuất hiện và được áp dụng rộng rãi Điển hình như:
+ Mạng niềm tin sâu (Deep Belief Network)
+ Mạng Neuron tích chập (Convolutional Neural Network)
+ Học máy trên vector hỗ trợ (Support Vector Machine)
+ Bộ nhớ dài – ngắn hạn (Long Short Term Memory)
Bên cạnh đó, các bộ lọc tiền xử lý dữ liệu cũng đã được nghiên cứu và có những bước phát triển vượt bật như:
Cơ sở lý thuyết HV: Nguyễn Thành Danh
+ Bộ lọc rời rạc dựa trên biến đổi Wavelet (Discrete Wavelet
+ Bộ lọc dựa trên phân tích thống kê (Statistical Analysis Data Filter
Các yếu tố tác động đến sản lượng điện mặt trời
2.2.1 Vật liệu tế bào quang điện
Mỗi vật liệu có mức năng lượng ở vùng cấm khác nhau, từ đó hiệu suất hấp thụ bức xạ cũng khác nhau Từ giới hạn Shockley Queisser, các vật liệu được dùng làm tế bào quang điện thường có mức năng lượng Eg từ 1 đến 1,8 eV Ví dụ:
Hình 2 1 Giới hạn Shockley Queisser đối với tế bào quang điện có một lớp tiếp giáp p – n [8]
Cơ sở lý thuyết HV: Nguyễn Thành Danh
Hình 2 2 Hiệu suất tấm pin theo công nghệ [8]
Các tấm pin mặt trời được thử nghiệm ở điều kiện thử nghiệm tiêu chuẩn (STC) là 25°C (77 ° F) và do đó vượt quá nhiệt độ đó sẽ ảnh hưởng đến sản lượng năng lượng Lượng năng lượng được tạo ra bởi một tấm pin mặt trời được tính bằng cách nhân dòng điện và điện áp Dựa trên hiệu suất của nó, một tấm pin mặt trời có lượng năng lượng tối đa mà nó có thể tạo ra là: Hiệu suất = (Dòng điện tối đa x Điện áp tối đa) / công suất đầu vào mặt trời
Khi các tấm pin mặt trời của bạn tiếp xúc với nhiệt độ cao hơn, dòng điện sẽ tăng lên, trong khi điện áp sẽ giảm dẫn đến hiệu suất giảm theo Bằng cách ảnh hưởng đến hiệu suất của các tấm pin mặt trời, nhiệt độ làm cho các tấm pin sản sinh ra ít năng lượng hơn
2.2.2 Bức xạ mặt trời và nhiệt độ môi trường
Bức xạ mặt trời được hiểu là các dòng vật chất và năng lượng do mặt trời phát ra Đây là nguồn năng lượng chính cho các quá trình phong hoá, bóc mòn, vận chuyển và bồi tụ trên Trái Đất, cũng như chiếu sáng và sưởi ấm cho các hành tinh trong Hệ Mặt Trời
Cơ sở lý thuyết HV: Nguyễn Thành Danh
Dữ liệu bức xạ cho các hệ thống điện năng lượng mặt trời (hệ thống của pin quang điện) thường được biểu thị dưới đơn vị kilowatt giờ trên mét vuông (kWh/m 2 ) Ước tính trực tiếp về năng lượng mặt trời cũng có thể được tính bằng watt trên một mét vuông (W/m 2 )
Sản lượng của tấm pin mặt trời phụ thuộc đáng kể vào năng lượng mặt trời hoặc bức xạ mặt trời vì nguồn năng lượng mặt trời rất thay đổi Độ chiếu xạ thường thay đổi do thời tiết, sự thay đổi theo mùa, vị trí địa lý, thời gian trong ngày và vị trí mặt trời trên bầu trời Các mô đun P-V nhận được cả ánh sáng trực tiếp từ mặt trời và ánh sáng tán xạ từ bầu trời, mặt đất và các vật thể lân cận Tuy nhiên, phần đóng góp đáng kể đến từ việc chiếu xạ trực tiếp bằng năng lượng mặt trời Việc ước lượng bức xạ tới trở nên phức tạp khi các vật thể gần đó tạo bóng hoặc phản xạ ánh sáng mặt trời lên các mô đun P-V
Khoảng 99% bức xạ mặt trời, hay sóng ngắn, trên bề mặt trái đất nằm trong vùng từ 0,3 đến 3,0 àm, tương ứng với bước súng giữa tia cực tớm và tia hồng ngoại gần Bờn trên bầu khí quyển của trái đất, bức xạ mặt trời có cường độ xấp xỉ 1380 W/m 2 Trên bề mặt trái đất của chúng ta, cường độ bức xạ mặt trời xấp xỉ 1000 W/m 2 vào một ngày quang đãng vào buổi trưa trong những tháng mùa hè (Bằng cường độ bức xạ mặt trời tại điều kiện tiêu chuẩn STC) Sự khác biệt giữa giá trị này là do sự mất mát khi truyền vào khí quyển
Bức xạ mặt trời và nhiệt độ có liên quan mật thiết đến các yếu tố thời tiết như áp suất, tốc độ gió, độ che mây, lượng mưa… nên các yếu tố thời tiết cũng ảnh hưởng đến sản lượng cũng như công suất ngõ ra của nguồn điện mặt trời
Bên cạnh đó, bức xạ mặt trời với sản lượng và công suất có mối quan hệ phi tuyến với nhau Tuy nhiên với xấp xỉ gần đúng thì quan hệ giữa bức xạ mặt trời và dòng ngắn mạch Isc có thể xem như là tuyến tính
Cơ sở lý thuyết HV: Nguyễn Thành Danh
Hình 2.3 thể hiện mối quan hệ tuyến tính giữa bức xạ và dòng ngắn mạch của một pin quang điện, đồng thời điện áp hở mạch cũng tăng lên một chút Ngược lại, Hình 2.4 cho đặc tính I-V của một pin quang điện khi nhiệt độ của pin thay đổi trong khi độ chiếu nắng trên pin không đổi Có thể thấy rằng trong trường hợp này Isc biến thiên không đáng kể trong khi Voc thay đổi nhiều, khiến đặc tính P-V của pin cũng thay đổi theo nhiệt độ
Hình 2 3 Đặc tính I-V và P-V của pin STP240 20/Wde, SUNTECH [8]
Hình 2 4 Đặc tính I-V của tế bào quang điện khi nhiệt độ thay đổi [8]
Cơ sở lý thuyết HV: Nguyễn Thành Danh
Tầm quan trọng của dự báo sản lượng điện mặt trời
Nguồn năng lượng tái tạo đặc biệt là điện mặt trời đóng một vai trò quan trọng trong việc đảm bảo an ninh năng lượng quốc gia Việc chuyển dịch sang năng lượng tái tạo, dựa trên những lợi thế về mặt địa lý và thiên nhiên, sẽ giúp Việt Nam chủ động hơn trong việc đảm bảo năng lượng phục vụ cho phát triển kinh tế giảm thiểu rủi ro tác động từ thị trường bên ngoài
Dự báo sản lượng điện mặt trời chính xác với sai số thấp nhất có vai trò quan trọng hơn trong việc xây dựng các Kế hoạch Sản xuất kinh doanh và Đầu tư xây dựng lưới điện Ngoài ra, việc dự báo còn giúp thiết lập kế hoạch công tác sửa chữa, bảo dưỡng lưới điện được hiệu quả đảm bảo lưới luôn ổn định trong suốt thời gian công tác.
Thực trạng công tác dự báo sản lượng điện mặt trời hiện nay
Nhiều năm trở lại đây, do thực trạng khan hiếm nhiên liệu hóa thạch và tính cấp thiết của nhu cầu bảo vệ môi trường, năng lượng điện tái tạo trở thành một lựa chọn quan trọng Cho đến nay, tuy đã có nhiều nghiên cứu trong việc giải quyết bài toán dự báo sản lượng điện năng mặt trời nhưng đây vẫn là bài toán khó, chưa có chuẩn mực về phương pháp luận
Bên cạnh các lợi ích như bù đắp năng lượng thiếu hụt, tận dụng năng lượng tại chỗ, giảm thiểu khí nhà kính, việc các nguồn điện tái tạo như điện mặt trời, điện gió tham gia vào lưới điện cũng gây ra nhiều ảnh hưởng cho việc vận hành lưới điện, trong đó có hai thách thức chính như sau:
Công suất đầu ra nguồn điện mặt trời, gió không ổn định, thay đổi thường xuyên với tính ngẫu nhiên cao, dẫn đến hệ thống điện luôn phải có dự phòng công suất lớn để bảo đảm cung cấp đủ công suất cho hệ thống phụ tải
Cơ sở lý thuyết HV: Nguyễn Thành Danh
Các nguồn điện này hay thay đổi đột ngột, không có dự trữ động năng như các máy phát điện quay, nên khi chúng tham gia vào hệ thống điện với tỷ trọng cao sẽ làm giảm quán tính quay của hệ thống, dẫn đến giảm độ dự trữ ổn định của hệ thống điện và tăng nguy mất ổn định lưới điện Để giải quyết hai thách thức trên mà vẫn sử dụng được nguồn năng lượng tái tạo nhiều nhất có thể, cần phải thực thi các giải pháp trên lưới điện như lắp đặt, bổ sung hệ thống lưu trữ năng lượng, phối hợp điều khiển tải và hệ thống lưu trữ năng lượng để tăng quán tính quay tổng hợp của hệ thống, thiết kế các bộ điều khiển tại chỗ cũng như diện rộng để ổn định lưới điện
Việc dự báo chính xác công suất của các nguồn điện tái tạo có một vai trò rất quan trọng để bảo đảm tính hiệu quả và tối ưu của các giải pháp trên Ngay cả khi mức độ nguy hiểm của các thách thức này chưa cao, việc dự báo công suất của các nguồn điện tái tạo cũng rất cần thiết để công tác lập kế hoạch, quản lý và vận hành hệ thống điện
Hiện nay, bài toán dự báo điện năng trong ngành điện tại Việt Nam phần lớn đang được thực hiện thông qua việc sử dụng các phương pháp dự báo truyền thống, phụ thuộc phần lớn vào kinh nghiệm đúc kết từ quá khứ và các kinh nghiệm ấy cũng không thể vận dụng hiệu quả do tính chất biến động của phụ tải và các yếu tố khách quan lẫn chủ quan thường xuyên tác động đến nhu cầu phụ tải
Trong chương 2, tác giả đã trình bày các lý thuyết về điện mặt trời và các yếu tố ảnh hưởng đến công suất điện mặt trời, đồng thời đi sơ lược về bài toán dự báo và thực trạng công tác dự báo hiện nay, trong chương tiếp theo, tác giả sẽ đi vào phân tích các mô hình dự báo từ quá khứ đến hiện tại.
Tổng quan các mô hình HV: Nguyễn Thành Danh
TỔNG QUAN VỀ CÁC MÔ HÌNH DỰ BÁO SẢN LƯỢNG ĐIỆN MẶT TRỜI
Mô hình quán tính
Mô hình quán tính là mô hình giả thiết các điều kiện môi trường tại thời điểm dự báo bằng với thời điểm hiện tại Trong trường hợp bức xạ mặt trời, mô hình ước tính giá trị bức xạ ở thời điểm t+1 bằng với bức xạ ở thời điểm t Mô hình quán tính được sử dụng chủ yếu trong dự báo phụ tải ngắn hạn trong khoảng thời gian cực ngắn từ 1 phút đến 1 giờ
Mô hình vật lý
Phương pháp dự báo theo mô hình vật lý sử dụng hệ phương trình động học mô tả quan hệ giữa các đại lượng thời tiết như tốc độ gió, hướng gió, nhiệt độ, bức xạ mặt trời, áp suất, độ ẩm tương đối và nhiệt độ điểm sương trong một khu vực địa lý rộng với một độ phân giải không gian cho trước [9] Việc giải hệ phương trình trên miền thời gian và không gian có thể cho ra kết quả của các đại lượng thời tiết ở tại các vị trí không có các trạm đo Các biến của hệ phương trình có độ phân giải vị trí từ 2km đến hàng chục km,
Tổng quan các mô hình HV: Nguyễn Thành Danh tùy vào việc mô hình được xây dựng cho phạm vi cục bộ (một vùng, một quốc gia) hay toàn cầu
Việc giải hệ phương trình đòi hỏi phải sử dụng các phương pháp số và tốn rất nhiều thời gian tính toán Lời giải của hệ phương trình mô hình vật lý trên thường có thời gian lấy mẫu tính theo đơn vị giờ, và chỉ thích hợp cho dự báo trung hạn và dài hạn Do khoảng thời gian và phạm vi dự báo lớn kèm theo đó là độ chính xác cao, mô hình vật lý được sử dụng rộng rãi trong dự báo thời tiết và được biết với tên gọi là NWP (Numeric Weather Prediction) [3]
Hình 3 1 Chu kỳ tính toán của phương pháp dự báo dùng mô hình vật lý [9]
Mô hình thống kê
Mô hình thống kê là một mô hình toán học bao gồm một tập hợp các giả định thống kê có liên quan đến việc tạo ra dữ liệu mẫu Một mô hình thống kê (thường ở dạng lý tưởng) thể hiện quá trình tạo ra dữ liệu Đối với dự báo bức xạ mặt trời, các mô hình thống kê sử dụng bộ dữ liệu quá khứ để xác định sai số cho độ phù hợp của mô hình Các mô hình thống kê này thường sử dụng các kỹ thuật phân tích chuỗi thời gian, chẳng hạn như mô hình hồi quy (AR), mô hình trung bình diễn tiến kết hợp tự hồi quy (ARMA), mô hình tự hồi quy tích hợp trung bình diễn tiến (ARIMA), mô hình tự hồi quy tích hợp trung bình diễn tiến phân mảnh (fractional ARIMA), mô hình liên tiến lũy thừa (ES) và mô hình tự hồi quy vector (VAR)
Tổng quan các mô hình HV: Nguyễn Thành Danh
[8] Các mô hình thống kê thường chỉ thích hợp và chính xác cho các dự báo tức thời và ngắn hạn.
Mô hình dự trên mạng nơ-ron nhân tạo
3.4.1 Khái niệm về mạng nơ-ron nhân tạo
Theo các nhà nghiên cứu sinh học, hệ thống thần kinh của con người bao gồm khoảng 1011 tế bào thần kinh, thường gọi là nơ-ron Mỗi tế bào nơ-ron có ba phần chính:
• Thân nơ-ron (soma): chứa nhân tế bào, nơi tiếp nhận hoặc phát ra các xung động thần kinh
• Dendrite: một hệ thống dạng cây của các dây thần kinh vào, đưa tín hiệu tới nhân nơ-ron Các dendrite tạo thành một lưới dày đặc xung quanh thân nơ-ron, chiếm diện tích khoảng 0,25 mm²
• Axon: đầu dây thần kinh ra phân nhánh hình cây, có thể dài từ một cm đến hàng mét Axon nối với các dây thần kinh vào hoặc trực tiếp với nhân tế bào của các nơ-ron khác thông qua các khớp nối (synapse)
Có hai loại khớp nối: khớp nối kích thích (excitatory) cho phép tín hiệu truyền qua để tới nơ-ron khác, và khớp nối ức chế (inhibitory) ngăn cản tín hiệu tới nơ-ron Người ta ước tính mỗi nơ-ron trong bộ não con người có khoảng 104 khớp nối
Chức năng cơ bản của các tế bào nơ-ron là liên kết với nhau để tạo nên hệ thống thần kinh, điều khiển hoạt động của cơ thể sống Các tế bào nơ-ron truyền tín hiệu cho nhau thông qua các dây thần kinh vào và ra Các tín hiệu này là dạng xung điện, được tạo ra từ các quá trình phản ứng hóa học phức tạp Tại nhân tế bào, khi điện thế của tín hiệu vào đạt tới một ngưỡng nào đó, nó sẽ tạo ra một xung điện dẫn tới axon Xung này truyền theo axon đến các nhánh rẽ và tiếp tục truyền tới các nơ-ron khác
Các xung điện này di chuyển dọc theo axon thông qua một quá trình gọi là truyền điện thế hành động (action potential propagation) Khi xung điện đến các điểm nối
Tổng quan các mô hình HV: Nguyễn Thành Danh synapse, nó sẽ kích hoạt việc giải phóng các chất dẫn truyền thần kinh (neurotransmitters) từ các túi nhỏ (vesicles) trong đầu axon vào khe synapse (synaptic cleft)
Các chất dẫn truyền thần kinh này sau đó khuếch tán qua khe synapse và gắn vào các thụ thể (receptors) trên bề mặt của dendrite của nơ-ron tiếp theo, gây ra một loạt các phản ứng hóa học Tùy thuộc vào loại chất dẫn truyền thần kinh và loại thụ thể, tín hiệu này có thể là kích thích hoặc ức chế, dẫn đến việc tăng hoặc giảm khả năng phát ra xung điện của nơ-ron tiếp theo
Hệ thống thần kinh của con người vô cùng phức tạp và tinh vi, với hàng tỷ nơ-ron liên kết với nhau tạo thành một mạng lưới rộng lớn Mỗi nơ-ron có khả năng kết nối với hàng nghìn nơ-ron khác, tạo nên sự giao tiếp nhanh chóng và hiệu quả Sự phối hợp và liên lạc giữa các nơ-ron này là cơ sở cho mọi hoạt động của cơ thể, từ những hành động cơ bản như di chuyển và hô hấp đến những quá trình tư duy phức tạp và cảm xúc
Nhờ vào sự hiểu biết ngày càng sâu sắc về cách thức hoạt động của nơ-ron và hệ thống thần kinh, các nhà khoa học có thể phát triển những phương pháp điều trị mới cho các bệnh lý thần kinh và tâm lý, đồng thời tạo ra các công nghệ tiên tiến như trí tuệ nhân tạo lấy cảm hứng từ cách mà bộ não hoạt động
Mạng nơ-ron nhân tạo (Artificial Neural Network - ANN), thường được gọi là mạng nơ-ron, là một mô hình xử lý thông tin dựa trên cách thức xử lý của các hệ nơ-ron sinh học Mạng này được tạo thành từ nhiều phần tử xử lý thông tin, gọi là nơ-ron, được kết nối với nhau qua các liên kết có trọng số (trọng số liên kết) Các nơ-ron hoạt động cùng nhau như một thể thống nhất để giải quyết các vấn đề cụ thể
Mạng nơ-ron nhân tạo được cấu hình cho các ứng dụng cụ thể như nhận dạng mẫu hoặc phân loại dữ liệu thông qua quá trình học từ tập mẫu huấn luyện Quá trình học thực chất là việc hiệu chỉnh các trọng số liên kết giữa các nơ-ron
Tổng quan các mô hình HV: Nguyễn Thành Danh
Hình 3 2 Cấu tạo của một nơ-ron [14]
Một nơ-ron là đơn vị xử lý thông tin cơ bản của mạng nơ-ron Cấu trúc của một nơ-ron bao gồm năm thành phần chính:
• Tập các đầu vào: Đây là các tín hiệu vào của nơ-ron, thường được biểu diễn dưới dạng một vectơ m chiều
• Tập các liên kết: Mỗi liên kết được biểu diễn bởi một trọng số, gọi là trọng số liên kết (synaptic weight) Trọng số liên kết giữa tín hiệu vào thứ j và nơ-ron k được kí hiệu là w jk Thông thường, các trọng số này được khởi tạo ngẫu nhiên khi khởi tạo mạng và được cập nhật liên tục trong quá trình học
• Bộ tổng (Summing function): Bộ tổng này tính tổng của tích các đầu vào với trọng số liên kết tương ứng
• Ngưỡng (Bias): Ngưỡng này thường được thêm vào như một thành phần của hàm truyền
• Hàm truyền (Transfer function): Còn gọi là hàm kích hoạt (activation function), hàm này giới hạn phạm vi đầu ra của mỗi nơ-ron Nó nhận đầu vào là kết quả của bộ tổng và ngưỡng Phạm vi đầu ra của mỗi nơ-ron thường được giới hạn trong
Tổng quan các mô hình HV: Nguyễn Thành Danh đoạn [0,1] hoặc [-1,1] Các hàm truyền có thể là tuyến tính hoặc phi tuyến và việc lựa chọn hàm truyền nào phụ thuộc vào bài toán cụ thể và kinh nghiệm của người thiết kế mạng
GIỚI THIỆU DỮ LIỆU DỰ BÁO SẢN LƯỢNG ĐIỆN MẶT TRỜI TẠI THÀNH PHỐ THỦ DẦU MỘT, TỈNH BÌNH DƯƠNG
Dữ liệu đầu vào tại một nhà máy ở Thủ Dầu Một
Dữ liệu được lấy từ dự án Nhà máy Điện mặt trời thuộc sở hữu của Công ty Cổ phần Điện Sun với quy mô 2247 tấm pin GCL 445Wp, tổng công suất là 999.915kWp
Hình 4 1 Mặt bằng bố trí lắp đặt pin mặt trời
Dữ liệu công suất nhà máy điện mặt trời và dữ liệu nhiệt độ các tấm pin PV tác giả sử dụng để chạy mô hình trong luận văn này lấy từ ngày 29/03/2023 tới 03/01/2024, với các thông số đo được từ 6 giờ 00 phút đến 18 giờ 00 phút, cách nhau 15 phút cho mỗi lần đo Tổng cộng 3539 điểm dữ liệu sau khi đã loại bỏ các dữ liệu không thu thập được do lỗi kết nối hoặc các nguyên nhân khác
Dữ liệu dự báo HV: Nguyễn Thành Danh
Hình 4 2 Dữ liệu thô được trích xuất từ nhà máy
Các dữ liệu còn lại về quan trắc phục vụ cho công tác dự báo được lấy từ dữ liệu của NASA POWER (Prediction Of Worldwide Energy Resource) Độ tin cậy của dữ liệu được thể hiện qua các thông tin sau đây:
• Nguồn gốc và phương pháp thu thập
- Dữ liệu vệ tinh: Dữ liệu của NASA POWER chủ yếu được thu thập từ các vệ tinh của NASA và các tổ chức không gian quốc tế, đảm bảo độ chính xác và chi tiết cao
- Mô hình khí hậu tiên tiến: Dữ liệu được xử lý qua các mô hình khí hậu và dự báo tiên tiến như MERRA-2 (Modern-Era Retrospective analysis for Research and Applications), đảm bảo tính nhất quán và chính xác của dữ liệu
• Kiểm định và xác thực
- Kiểm định chéo: Dữ liệu từ NASA POWER thường được kiểm định và đối chiếu với các nguồn dữ liệu khác, bao gồm cả dữ liệu từ các trạm quan trắc mặt đất, giúp tăng cường độ tin cậy của dữ liệu
Dữ liệu dự báo HV: Nguyễn Thành Danh
- Xác thực bởi cộng đồng khoa học: Dữ liệu từ NASA POWER đã được sử dụng rộng rãi và xác thực bởi cộng đồng khoa học toàn cầu trong nhiều nghiên cứu và dự án khác nhau
- Nghiên cứu khoa học: Dữ liệu từ NASA POWER đã được sử dụng trong nhiều nghiên cứu khoa học về khí hậu, năng lượng tái tạo, và quản lý tài nguyên
- Dự báo năng lượng: Các công ty năng lượng và tổ chức môi trường sử dụng dữ liệu này để dự báo sản lượng năng lượng mặt trời, lập kế hoạch và tối ưu hóa hệ thống năng lượng
Các điểm dữ liệu được thu thập tại vị trí tọa độ quan trắc: Vĩ độ (Latitude): 10.9800°
N, Kinh độ (Longitude): 106.6500° E, chu kỳ lấy mẫu 60 phút
• Thông số năng lượng mặt trời:
ALLSKY_SFC_SW_DWN: Bức xạ mặt trời toàn bầu trời trên bề mặt (W/m²)
CLRSKY_SFC_SW_DWN: Bức xạ mặt trời bầu trời quang đãng trên bề mặt
T2M: Nhiệt độ không khí ở độ cao 2 mét (°C)
T2M_MIN: Nhiệt độ tối thiểu không khí ở độ cao 2 mét (°C)
T2M_MAX: Nhiệt độ tối đa không khí ở độ cao 2 mét (°C)
RH2M: Độ ẩm tương đối ở độ cao 2 mét (%)
QV2M: Tỷ lệ hỗn hợp hơi nước ở độ cao 2 mét (g/kg)
Dữ liệu dự báo HV: Nguyễn Thành Danh
WS2M: Tốc độ gió ở độ cao 2 mét (m/s)
WS10M: Tốc độ gió ở độ cao 10 mét (m/s)
WD2M: Hướng gió ở độ cao 2 mét (độ)
WD10M: Hướng gió ở độ cao 10 mét (độ)
CLOUD_AMT: Lượng mây toàn phần (%)
• Solar Azimuth Angle (Góc phương vị của mặt trời):
SZA (Solar Zenith Angle): Đây là góc giữa tia mặt trời và đường thẳng đứng tại một điểm trên bề mặt trái đất.
Các phương pháp đánh giá và xử lý bộ dữ liệu
Tiền xử lý dữ liệu là quá trình xử lý dữ liệu thô/ gốc (raw/ original data) nhằm cải thiện chất lượng dữ liệu (quality of the data) và cải thiện chất lượng của kết quả mô phỏng
Dữ liệu thô/ gốc là dữ liệu là dữ liệu có cấu trúc, bán cấu trúc hoặc phi cấu trúc được đưa vào từ các nguồn dữ liệu trong hệ thống xử lý tệp tin (file processing systems) hay các hệ thống cơ sở dữ liệu (database systems) Chất lượng dữ liệu (data quality) bao gồm:
- Tính chính xác (accuracy): giá trị được ghi nhận đúng với giá trị thực
- Tính hiện hành (currency/ timeliness): giá trị được ghi nhận không bị lỗi thời
- Tính toàn vẹn (completeness): tất cả các giá trị dành cho một biến/ thuộc tính đều được ghi nhận
Dữ liệu dự báo HV: Nguyễn Thành Danh
- Tính nhất quán (consistency): tất cả các giá trị dữ liệu đều được biểu diễn như nhau trong tất cả các trường hợp
Các bước tiền xử lý dữ liệu:
- Tích hợp dữ liệu (data integration)
- Làm sạch dữ liệu (data cleaning)
- Biến đổi dữ liệu (data transformation)
- Tích hợp dữ liệu (data integration)
4.2.1 Các phương pháp tích hợp dữ liệu
Tích hợp dữ liệu (Data Integration) là quá trình liên quan đến việc kết hợp dữ liệu từ trong các nguồn khác nhau và cung cấp cho người dùng một cái nhìn tổng quan nhất về chúng Quá trình này trở nên quan trọng trong nhiều trường hợp bao gồm cả thương mại, kinh tế, kỹ thuật và khoa học
Theo nghiên cứu “Tích hợp dữ liệu Data Mining” [9], tác giả đề xuất hai phương pháp tích hợp dữ liệu chủ yếu là ghép nối chặt chẽ (Tight Coupling) và ghép nối lỏng lẻo (Loose Coupling)
4.2.1.1 Ghép nối chặt chẽ (Tight Coupling)
Phương pháp ghép nối chặt chẽ thường được thực hiện thông qua kho dữ liệu, dữ liệu được lấy từ nhiều nguồn khác nhau đưa vào một vị trí vật lý duy nhất thông qua quá trình ETL (Extraction, Transformation, Loading) Lớp ETL giúp ánh xạ dữ liệu từ các nguồn để cung cấp một kho dữ liệu thống nhất Vị trí vật lý, cung cấp một giao diện đồng nhất để truy vấn dữ liệu
Cách tiếp cận này được gọi là ghép nối chặt chẽ vì trong cách tiếp cận này dữ liệu được kết hợp chặt chẽ với kho lưu trữ vật lý tại thời điểm truy vấn
4.2.1.2 Ghép nối lỏng lẻo (Loose Coupling)
Dữ liệu dự báo HV: Nguyễn Thành Danh Ở đây một lược đồ trung gian ảo cung cấp một giao diện nhận truy vấn từ người dùng, biến đổi nó theo cách mà cơ sở dữ liệu nguồn có thể hiểu và gửi truy vấn trực tiếp tới cơ sở dữ liệu nguồn để thu được kết quả Trong phương pháp này, dữ liệu chỉ nằm trong cơ sở dữ liệu nguồn thực tế
Trong phạm vi Luận văn, tác giả kết hợp nguồn dữ liệu từ nhà máy khảo sát và dữ liệu quốc tế về các đại lượng quan trắc, dữ liệu trong bài luận văn đã được tích hợp đầy đủ các biến vào ra
4.2.2 Làm sạch dữ liệu (data cleaning)
Mục đích chính của làm sạch dữ liệu hướng đến không chỉ đơn thuần là loại bỏ dữ liệu, tạo không gian để thêm vào dữ liệu mới thay thế, mà phải tìm cách tăng tối đa độ chính xác của dữ liệu trong khi cố gắng hạn chế tối đa việc loại bỏ dữ liệu Đối với dữ liệu thu thập được, cần xác định các vấn đề ảnh hưởng khiến cho bộ dữ liệu đó không sạch Bởi vì, dữ liệu không sạch (có chứa lỗi, nhiễu, không đầy đủ, có mâu thuẫn) thì các tri thức khám phá được sẽ bị ảnh hưởng và không đáng tin cậy, sẽ dẫn đến các quyết định không chính xác Làm sạch dữ liệu bao gồm xử lý dữ liệu thiếu và xử lý dữ liệu nhiễu.
Xử lý dữ liệu
4.3.1 Thiếu dữ liệu hoàn toàn ngẫu nhiên (MCAR)
Dữ liệu bị thiếu được coi là MCAR khi sự thiếu dữ liệu không liên quan đến bất kỳ giá trị nào của chính biến bị thiếu hoặc các giá trị của bất kỳ biến nào khác Điều này có nghĩa là các điểm dữ bị thiếu này tạo thành một tập hợp con ngẫu nhiên của dữ liệu và hoàn toàn không có hệ thống Ví dụ: khi một người từ chối tiết lộ thu nhập của mình, điều này không ảnh hưởng đến thu nhập thực tế của anh ta cũng như thu nhập của gia đình anh ta Do đó, bỏ qua các giá trị thiếu MCAR không làm cho phân tích dữ liệu bị
Dữ liệu dự báo HV: Nguyễn Thành Danh sai lệch những sẽ làm tăng sai số chuẩn của các ước tính mẫu do kích thước mẫu giảm [11]
4.3.2 Thiếu dữ liệu ngẫu nhiên (Missing at Random, MAR)
Thiếu dữ liệu ngẫu nhiên là kiểu thiếu dữ liệu mà xác suất của giá trị thiếu chỉ phụ thuộc vào dữ liệu quan sát, chứ không phụ thuộc vào phần dữ liệu bị thiếu Hay nói cách khác, các giá trị thiếu của một biến phụ thuộc vào các giá trị có sẵn của chính nó và các biến khác Điều này cho phép có thể ước tính dữ liệu thiếu dựa trên các biến khác Ví dụ đánh giá học sinh tham gia một môn học bao gồm hai bài kiểm tra: bài kiểm tra giữa kỳ và bài kiểm tra cuối kỳ Để làm bài kiểm tra cuối kỳ, học sinh phải vượt qua bài kiểm tra giữa kỳ Giả sử rằng một sinh viên trượt kỳ thi giữa kỳ và sinh viên ấy bỏ học Vì vậy, việc thiếu điểm kỳ thi cuối kỳ của sinh viên này là MAR
4.3.3 Thiếu dữ liệu không ngẫu nhiên (Not Missing at Random, NMAR)
Dữ liệu bị thiếu là kiểu thiếu ngẫu nhiên, giá trị bị thiếu phụ thuộc vào các giá trị bị thiếu khác Do đó, với loại dữ liệu bị thiếu này, chúng ta không thể ước tính dữ liệu không đầy đủ từ các dữ liệu hiện có
Lưu ý rằng các nguyên nhân gây ra sự thiếu dữ liệu này chỉ là giả định về lý do thiếu dự liệu trong ngữ cảnh phân tích Do đó, theo quan điểm giả thuyết (các nhà thống kê học), chúng không thể được xác minh (ngoại trừ giả thuyết MCAR) các giả thuyết này
Vì vậy, việc gán nguyên nhân các giá trị bị thiếu cho một loại dữ liệu thiếu ở trên là không rõ ràng và chắc chắn [9] Hiện nay hầu hết các nghiên cứu tập trung vào ba loại dữ liệu bị thiếu ở trên để nghiên cứu đề xuất hoặc lựa chọn phương pháp điền dữ liệu tương ứng Tuy nhiên Molenberghs [12] khuyên rằng sẽ luôn tốt hơn khi chúng ta kiểm tra mức độ chính xác của kết quả phân tích đối với các giả định khác nhau
Do đó, xử lý các dữ liệu mất mát nói chung và mất mát dữ liệu trong chuỗi dữ liệu thời gian nói riêng đóng vai trò đặc biệt quan trọng trong máy học, khai phá và xử lý dữ
Dữ liệu dự báo HV: Nguyễn Thành Danh liệu thống kê, là tiền đề để thực hiện tiếp các mục đích khác như phân tích, phân lớp, dự báo Trong phần này, tác giả trình bày một số tiếp cận xử lý dữ liệu thiếu và thực hiện so sánh khả năng điền đầy đủ dữ liệu thiếu của một số phương pháp cho chuỗi dữ liệu thời gian Từ đó, tìm ra phương pháp phù hợp để áp dụng cho bộ số liệu trong luận văn này
4.3.4 Phương pháp xử lý dữ liệu bị thiếu
Trên thực tế, các lĩnh vực khác nhau có kiểu dữ liệu đặc trưng và cách lưu trữ khác nhau Do đó không có phương pháp nào chuyên dụng thực sự thỏa đáng được khuyên dùng cho việc xử lý dữ liệu thiếu mà tùy thuộc vào kiểu dữ liệu và loại dữ liệu thiếu để từ đó quyết định áp dụng hoặc đề xuất các phương pháp phù hợp Có hai phương pháp xử lý dữ liệu thiếu cơ bản nhất là:
+ Bỏ qua các giá trị thiếu (Deletion method): Bỏ qua tất cả những quan sát không có dữ liệu được xem như phân tích trường hợp đầy đủ và là một trong những phương pháp phổ biến nhất [10] Có hai phương pháp thường được áp dụng đó là:
- Listwise Deletion: thực hiện xóa mọi trường hợp dữ liệu thiếu giá trị cho một hoặc nhiều biến [12] Cách tiếp cận này loại bỏ tất cả các trường hợp dữ liệu có giá trị bị thiếu, dẫn đến một tập dữ liệu chỉ có các giá trị quan sát đầy đủ
- Pairwise method (Available Case Analysis, ACA): Phương pháp này chỉ loại bỏ những trường hợp có các giá trị bị thiếu trong số các biến được phân tích [12] Thông thường, phương pháp này loại bỏ ít trường hợp hơn phương pháp Listwise nhưng làm giảm kích thước của tập dữ liệu Khi sử dụng phương pháp này, kích thước của tập dữ liệu cuối cùng sẽ khác nhau vì nó phụ thuộc vào các biến sử dụng trong mỗi phân tích
Dữ liệu dự báo HV: Nguyễn Thành Danh
+ Ước lượng các giá trị bị thiếu: Khác với cách tiếp cận của xóa dữ liệu bị thiếu là bỏ qua các bản ghi chứa dữ liệu bị thiếu, cách tiếp cận này sẽ tìm cách thay thế các giá trị bị thiếu bằng các giá trị ước lượng sử dụng phương pháp kháp khác nhau gồm:
- Thay thế bằng giá trị trung bình/ trung vị (Mean/median substitution)
- Phương pháp sử dụng giá trị quan sát cuối cùng (Last Value Carried Forward)
- Thay thế giá trị phương pháp nội suy (Interpolation)
+ Các phương pháp ước lượng các giá trị thiếu trực tiếp dựa vào dữ liệu có sẵn:
Hình 4 3 Ví dụ minh họa ước tính các giá trị thiếu bằng DTWBI [12]
Dữ liệu dự báo HV: Nguyễn Thành Danh
Hình 4 4 Ví dụ minh họa ước tính các giá trị thiếu bằng eDTWBI [12]
Trong phạm vi của Luận văn, tác giả sử dụng phương pháp bỏ qua các giá trị thiếu Listwise Deletion đối với các thời điểm không ghi nhận được dữ liệu điện mặt trời do trục trặc từ hệ thống đo đếm Đối với các giá trị thiếu là các thông số ảnh hưởng đến dự báo, tác giả sử dụng phương pháp nội suy để điền vào các giá trị bị khuyết.
Đánh giá tương quan giữa dữ liệu thu thập và công suất điện mặt trời
Đánh giá mức độ tương quan trước khi chọn dữ liệu đưa vào mô hình dự báo là một bước quan trọng trong quy trình xây dựng mô hình Dưới đây là các lý do chính vì sao việc này cần thiết:
• Xác định các biến quan trọng
+ Biến dự báo có liên quan: Đánh giá tương quan giúp xác định những biến số có mối quan hệ mạnh mẽ với biến đích (biến cần dự báo) Các biến số có tương quan cao với biến đích thường là những biến dự báo quan trọng và nên được đưa vào mô hình
Dữ liệu dự báo HV: Nguyễn Thành Danh
+ Loại bỏ biến không liên quan: Những biến số có mức độ tương quan thấp hoặc không có tương quan với biến đích có thể không cung cấp thông tin hữu ích cho mô hình dự báo Loại bỏ những biến này giúp giảm độ phức tạp của mô hình và tránh tình trạng overfitting (quá khớp)
• Giảm độ đa cộng tuyến (Multicollinearity)
+ Đa cộng tuyến: Khi hai hoặc nhiều biến số độc lập có mối tương quan cao với nhau, nó có thể gây ra vấn đề đa cộng tuyến trong mô hình hồi quy Điều này làm cho việc ước lượng các hệ số hồi quy trở nên không ổn định và khó giải thích
+ Chọn lọc biến: Bằng cách đánh giá tương quan, có thể phát hiện và loại bỏ hoặc biến đổi những biến số có mối quan hệ mạnh với nhau để giảm đa cộng tuyến, từ đó tăng tính ổn định và độ chính xác của mô hình
• Hiểu rõ hơn về dữ liệu
+ Khám phá dữ liệu: Việc đánh giá tương quan giúp hiểu rõ hơn về cấu trúc và mối quan hệ trong dữ liệu Điều này cung cấp cái nhìn tổng quan về dữ liệu và giúp định hướng cho các bước tiếp theo trong quá trình xây dựng mô hình
+ Phát hiện các mối quan hệ tiềm ẩn: Một số mối quan hệ giữa các biến số có thể không rõ ràng ban đầu Đánh giá tương quan giúp phát hiện những mối quan hệ tiềm ẩn này, từ đó giúp cải thiện mô hình dự báo
• Cải thiện hiệu suất mô hình
+ Tăng độ chính xác: Sử dụng các biến số có tương quan cao với biến đích thường dẫn đến mô hình dự báo chính xác hơn, vì những biến này cung cấp thông tin quan trọng và hữu ích cho việc dự báo
Dữ liệu dự báo HV: Nguyễn Thành Danh
+ Giảm độ phức tạp: Việc chọn lọc những biến số quan trọng và loại bỏ những biến số không liên quan giúp đơn giản hóa mô hình, từ đó cải thiện hiệu suất và khả năng giải thích của mô hình
• Phòng tránh vấn đề dữ liệu
+ Xử lý ngoại lệ (Outliers): Đánh giá tương quan có thể giúp phát hiện các giá trị ngoại lệ hoặc bất thường trong dữ liệu, từ đó có các biện pháp xử lý thích hợp trước khi xây dựng mô hình
+ Kiểm tra tính chính xác của dữ liệu: Việc kiểm tra tương quan có thể giúp xác định các vấn đề về tính chính xác và độ tin cậy của dữ liệu, đảm bảo rằng dữ liệu được sử dụng là hợp lệ và có chất lượng cao
Việc đánh giá mức độ tương quan giữa hai đại lượng thường được thực hiện bằng các phương pháp thống kê Các phương pháp này giúp xác định mức độ mạnh yếu và chiều hướng của mối quan hệ giữa hai biến số Dưới đây là một số phương pháp phổ biến để đánh giá mức độ tương quan:
Hệ số tương quan Pearson (r) đo lường mức độ tuyến tính giữa hai biến số Giá trị của r dao động từ -1 đến 1:
• r = 1: Tương quan dương hoàn hảo
• r = -1: Tương quan âm hoàn hảo
• r = 0: Không có tương quan tuyến tính
Công thức của hệ số tương quan Pearson:
Hệ số tương quan Spearman (Spearman's Rank Correlation Coefficient): Hệ số tương quan Spearman (ρ hoặc rs) đo lường mối quan hệ đơn điệu giữa hai biến số, bất
Dữ liệu dự báo HV: Nguyễn Thành Danh kể mối quan hệ đó có tuyến tính hay không Nó dựa trên thứ hạng của dữ liệu thay vì giá trị thô
• ρ = 1: Tương quan đơn điệu dương hoàn hảo
• ρ = -1: Tương quan đơn điệu âm hoàn hảo
• ρ = 0: Không có tương quan đơn điệu
Công thức tính hệ số tương quan Spearman:
Trong đó, di là sự khác biệt giữa thứ hạng của các giá trị tương ứng và n là số lượng quan sát
Hệ số tương quan Kendall (Kendall's Tau): Hệ số tương quan Kendall (τ) cũng đo lường mối quan hệ đơn điệu giữa hai biến số, tương tự như hệ số tương quan Spearman, nhưng nó được tính dựa trên số lượng cặp quan sát đồng thuận và bất thuận
Công thức tính hệ số tương quan Kendall: ( )
• C là số cặp quan sát đồng thuận
• D là số cặp quan sát bất thuận
• T là số cặp quan sát có giá trị X trùng nhau
• U là số cặp quan sát có giá trị Y trùng nhau
Ma trận tương quan (Correlation Matrix): Khi muốn đánh giá mức độ tương quan giữa nhiều biến số cùng lúc, một ma trận tương quan có thể được sử dụng Ma trận tương quan là một bảng hiển thị hệ số tương quan giữa tất cả các cặp biến số trong tập dữ liệu
Dữ liệu dự báo HV: Nguyễn Thành Danh
Biến đổi dữ liệu
Biến đổi dữ liệu là một bước vô cùng quan trọng trong máy học nói chung và trí tuệ nhân tạo nói riêng Bởi vì, các biến đầu vào của một mô hình mạng nơ-ron nhân tạo yêu cầu các biến đầu vào phải có giá trị nhỏ, có thể nằm trong khoảng từ 0 đến 1 hoặc được chuẩn hóa với giá trị trung bình băng 0 và độ lệch chuẩn bằng 1 Biến đổi dữ liệu được chia thành 2 loại:
- Data Normalization là phương pháp biến đổi dữ liệu từ một miền bất kì sang miền giá trị nằm trong khoảng từ 0 đến 1 Phương pháp này yêu cầu xác định được giá trị lớn nhất và giá trị nhỏ nhất của tập dữ liệu Phương pháp bình thường hóa dữ liệu được sử dụng khi không biết dạng phân phối của dữ liệu hoặc biết rằng phân phối của dữ liệu không phải là phân phối Gaussian Phương pháp này rất hữu ích khi bộ dữ liệu có nhiều khoảng giá trị và thuật toán đang sử dụng không cần đưa ra giả thuyết về phân phối dữ liệu
BỨC XẠ QUANG ĐÃNG ĐANGX
NHIỆT ĐỘ 2M ĐỘ ẨM 2M GÓC PHƯƠNG VỊ
Dữ liệu dự báo HV: Nguyễn Thành Danh
- Data Standardization: Data Standardization là việc scale dữ liệu về một phân bố trong đó giá trị trung bình của các quan sát bằng 0 và độ lệch chuẩn bằng
1 Kỹ thuật này còn được gọi là “whitening” Nhờ việc chuẩn hóa, các thuật toán như linear regression, logistic regression được cải thiện Phương pháp chuẩn hóa dữ liệu cần giả định rằng phân phối của tập dữ liệu là phân phối Gaussian Giả thiết này không nhất định phải đúng nhưng sẽ hiệu quả hơn nếu tập dữ liệu có dạng phân phối chuẩn Phương pháp này được sử dụng khi tập dữ liệu có nhiều thang đo khác nhau và bài toán đưa ra giả thuyết là phân phối chuẩn
Trong phạm vi của Luận văn, tác giả sử dụng kỹ thuật Data Standardization để chuẩn hóa cho tập dữ liệu trước khi đưa vào xây dựng mô hình dự báo Các lợi ích của việc xử lý chuẩn hóa dữ liệu:
• Tăng tốc độ hội tụ của các mô hình học máy
Giảm thiểu Gradient Vanishing/Exploding: Khi dữ liệu không được chuẩn hóa, giá trị đầu vào có thể rất khác nhau về mặt quy mô Điều này có thể dẫn đến các vấn đề như gradient vanishing (biến mất gradient) hoặc gradient exploding (bùng nổ gradient) trong quá trình huấn luyện mô hình học máy, đặc biệt là các mô hình mạng neuron sâu Chuẩn hóa dữ liệu giúp duy trì các giá trị đầu vào trong một phạm vi nhất định, giảm thiểu các vấn đề này và giúp mô hình học máy hội tụ nhanh hơn
• Cải thiện hiệu suất và độ chính xác của mô hình
+ Đồng nhất hóa trọng số đầu vào: Khi các tính năng có quy mô khác nhau, các trọng số trong mô hình học máy sẽ thay đổi tương ứng, điều này có thể dẫn đến việc mô hình không tối ưu Chuẩn hóa dữ liệu giúp các tính năng có cùng một quy mô, giúp mô hình học máy tối ưu hóa trọng số một cách hiệu quả hơn và cải thiện độ chính xác dự báo
Dữ liệu dự báo HV: Nguyễn Thành Danh
+ Giảm độ thiên lệch của mô hình: Nếu một tính năng có giá trị lớn hơn so với các tính năng khác, mô hình có thể thiên vị tính năng đó và coi nhẹ các tính năng khác Chuẩn hóa dữ liệu giúp giảm thiểu độ thiên lệch này, giúp mô hình cân bằng hơn khi học các tính năng từ dữ liệu
• Tăng tính ổn định của thuật toán học máy
+ Giảm ảnh hưởng của giá trị ngoại lệ (outliers): Giá trị ngoại lệ có thể ảnh hưởng lớn đến mô hình nếu dữ liệu không được chuẩn hóa Bằng cách chuẩn hóa dữ liệu, ảnh hưởng của các giá trị ngoại lệ có thể được giảm thiểu, giúp mô hình học máy trở nên ổn định hơn
+ Cải thiện khả năng tổng quát hóa: Dữ liệu chuẩn hóa giúp mô hình học máy học được các mẫu từ dữ liệu một cách hiệu quả hơn, từ đó cải thiện khả năng tổng quát hóa của mô hình trên các tập dữ liệu mới hoặc chưa được thấy trước đó
• Dễ dàng so sánh và tích hợp nhiều nguồn dữ liệu
+ Hỗ trợ trong việc tích hợp dữ liệu từ nhiều nguồn khác nhau: Khi dữ liệu từ nhiều nguồn khác nhau được tích hợp, các tính năng có thể có các đơn vị đo lường khác nhau Chuẩn hóa dữ liệu giúp các tính năng từ các nguồn khác nhau có thể so sánh và tích hợp một cách dễ dàng
+ Đồng nhất hóa đơn vị đo lường: Khi làm việc với các tính năng có các đơn vị đo lường khác nhau (như nhiệt độ, công suất, tốc độ gió), chuẩn hóa dữ liệu giúp các tính năng này có cùng một đơn vị đo lường tương đối, giúp dễ dàng hơn trong việc phân tích và dự báo
Các dữ liệu đầu vào sau khi được chuẩn hóa được thể hiện như sau:
Dữ liệu dự báo HV: Nguyễn Thành Danh
Hình 4 9 Dữ liệu đầu vào sau khi được chuẩn hóa
Phân chia tập dữ liệu
Phân chia tập dữ liệu là một phần quan trọng của quy trình huấn luyện mô hình máy học hoặc học sâu Dưới đây là một số lý do chính tại sao chúng ta cần phân chia tập dữ liệu:
• Đánh giá hiệu suất của mô hình: Phân chia tập dữ liệu thành tập huấn luyện và tập kiểm tra cho phép chúng ta đánh giá hiệu suất của mô hình trên dữ liệu mà nó chưa từng thấy trước đó Việc này giúp đánh giá khả năng tổng quát hóa của mô hình, tức là khả năng áp dụng kiến thức học được từ tập huấn luyện vào dữ liệu mới
• Tránh overfitting: Overfitting xảy ra khi mô hình học “quá nhớ” dữ liệu huấn luyện và không tổng quát hóa tốt trên dữ liệu mới Phân chia tập dữ liệu giúp phát hiện và ngăn chặn overfitting bằng cách kiểm tra hiệu suất của mô hình trên dữ liệu kiểm tra độc lập
• Tinh chỉnh tham số: Phân chia tập dữ liệu cũng cho phép chúng ta tinh chỉnh các tham số của mô hình một cách hiệu quả hơn bằng cách sử dụng tập kiểm tra để đánh giá hiệu suất của các cấu hình tham số khác nhau
Dữ liệu dự báo HV: Nguyễn Thành Danh
• Kiểm tra ổn định của mô hình: Bằng cách sử dụng tập kiểm tra độc lập, chúng ta có thể đánh giá xem mô hình có hoạt động đúng cách và ổn định trên dữ liệu mới không
• Tăng độ tin cậy của kết quả: Bằng cách phân chia dữ liệu, chúng ta có thể sử dụng tập kiểm tra để đánh giá mô hình cuối cùng sau khi đã hoàn tất quá trình tinh chỉnh
Ta tiến hành phân chia tập dữ liệu thu thập thành 2 tập như hình bên dưới: tập huấn luyện và tập kiểm tra, sử dụng các chỉ số để lựa chọn vị trí chia dữ liệu và lưu vào các biến train_data, test_data Đánh giá việc chia tỷ lệ có ảnh hưởng đến hiệu suất của quá trình huấn luyện Sau khi thay đổi tỉ lệ nhiều lần thì chúng ta có một tỷ lệ phù hợp :
Bảng 4 2 Phân chia tập dữ liệu
Tập dữ liệu Nhãn dữ liệu Số lượng đặc trưng Số lượng mẫu
Data train_data (tập huấn luyện)
Y_train test_data (tập kiểm tra)
Y_testHình 4 10 Phân chia tập dữ liệu
Dữ liệu dự báo HV: Nguyễn Thành Danh
Tập huấn luyện được sử dụng để đào tạo mô hình, tập kiểm tra được sử dụng để kiểm tra hiệu suất của mô hình trên dữ liệu không được sử dụng trong quá trình huấn luyện
Các bộ dữ liệu từ các nhà máy điện mặt trời khác trên địa bàn thành phố Thủ Dầu Một, tỉnh Bình Dương cũng được thu thập và xử lý tương tự
Trong chương 4, tác giả đã trình bày các bước chuẩn bị dữ liệu cho việc dự báo công suất điện mặt trời bao gồm dữ liệu thực từ nhà máy, dữ liệu từ các trạm quan trắc, tiến hành tiền xử lý dữ liệu, đánh giá mức độ tương quan của các yếu tố quan trắc đến công suất phát của nhà máy và chọn ra được 5 thành phần có ảnh hưởng lớn nhất Trong chương này tác giả còn tiến hành các bước chuẩn hóa, phân chia tập dữ liệu để chuẩn bị cho việc xây dựng mô hình và đánh giá sai số dự báo trong chương 5.
Phân tích kết quả HV: Nguyễn Thành Danh
XÂY DỰNG MÔ HÌNH VÀ PHÂN TÍCH KẾT QUẢ DỰ BÁO
Mô hình GRU
Tương tự như mô hình LSTM, GRU cũng là một loại mạng nơ-ron hồi tiếp (RNN), nhưng với cấu trúc đơn giản hơn GRU đã thu hút sự quan tâm của cộng đồng machine learning và deep learning nhờ vào khả năng học tốt trên các chuỗi dữ liệu dài và khả năng giảm hiện tượng biến mất gradient Dưới đây là một số ưu điểm của mô hình GRU:
• Hiệu suất học tập: GRU thường có hiệu suất học tập tốt hơn so với các mô hình RNN truyền thống như vanilla RNN, do việc sử dụng cơ chế cổng giúp kiểm soát lưu lượng thông tin qua thời gian
• Giảm hiện tượng biến mất gradient: Các cổng trong GRU giúp giảm thiểu hiện tượng biến mất gradient, một vấn đề thường gặp trong việc huấn luyện mô hình RNN truyền thống
• Hiệu suất tính toán: So với mô hình LSTM, GRU có cấu trúc đơn giản hơn với ít tham số hơn, điều này giúp tăng tốc quá trình tính toán và giảm bộ nhớ yêu cầu
• Hiệu suất tốt trên dữ liệu chuỗi ngắn: GRU thường cho kết quả tốt hơn trên các dữ liệu chuỗi ngắn và đơn giản, đặc biệt là khi lượng dữ liệu hạn chế
• Tính linh hoạt: GRU có khả năng học và lưu trữ thông tin từ các chuỗi dữ liệu, giúp mô hình phù hợp với nhiều loại dữ liệu và tác vụ khác nhau
Việc xây dựng mô hình GRU được thực hiện qua các bước sau:
Bước 1: o Khởi tạo trạng thái ẩn ban đầu (hidden state) h₀ và trạng thái đầu vào x₀
Bước 2: o Với mỗi thời gian t o Đầu vào: Nhận đầu vào xt tại thời điểm t
Phân tích kết quả HV: Nguyễn Thành Danh o Ở cổng Reset o 𝑟 𝑡 = 𝜎 (𝑊 (𝑟) 𝑥 𝑡 + 𝑈 (𝑧) ℎ 𝑡−1 + 𝑏 𝑟 ) (4.1) o r(t) là cổng đặc trưng tại thời điểm t o σ là hàm sigmoid o W(r) là ma trận trọng số liên kết giữa đầu vào xt và cổng reset rt o U(r) là ma trận trọng số liên kết giữa trạng thái ẩn trước đó h(t-1) và cổng đặc trưng rt o x(t) là đầu vào tại thời điểm t o h(t-1) là trạng thái ẩn trước đó tại thời điểm (t-1)
Bước 4 : o Ở cổng Update o 𝑧 𝑡 = 𝜎 (𝑊 (𝑧) 𝑥 𝑡 + 𝑈 (𝑧) ℎ 𝑡−1 +b z ) (4.2) o zt là cổng cập nhật tại thời điểm t
Bước 5 : o Tính toán giá trị trạng thái tạm thời ℎ̃(t) = tanh (Wx(t) + r(t) * Uh(t-1) ) (4.3)
Bước 6: o Tính toán trạng thái mới ℎ(t) = (1 - z(t)) * ℎ̃(t) + z(t) * ℎ(t-1) (4.4)
Bước 7: Trả về giá trị đầu ra yt
Bước 8: Lặp lại bước 2 đến 5 cho mỗi bước thời gian t trong chuỗi dữ liệu đầu vào
Phân tích kết quả HV: Nguyễn Thành Danh
Khởi tạo trạng thái ẩn trước đó (h t-1 ) Khởi tạo mô hình GRU
Tính giá trị cổng Reset
Quên Không có trạng thái mới nào được cập nhật Tính giá trị cổng Update
Kết thúc Khởi tạo ma trận trọng số (W) và bias (b), số lớp GRU, tốc độ học, số lượng epoch,…
Tính trạng thái ẩn tạm thời
Sử dụng giá trị huấn luyện để tiến hành huấn luyện
Tính trạng thái ẩn mới để tính toán đầu ra
Xuất kết quả đầu ra
Lặp lại cho đến khi đủ số lượng epoch đã chọn, hội tụ và đạt được kết quả tốt
So sánh kết quả đầu ra với thực tế
Hình 5 1 Lưu đồ giải thuật của thuật toán GRU
Phân tích kết quả HV: Nguyễn Thành Danh
Các thông số được sử dụng cho mô hình GRU được thể hiện trong bảng bên dưới : Bảng 5 1 Thông số đầu vào của mô hình GRU Đặc trưng Chi tiết
ALLSKY_SFC_SW_DWN, CLRSKY_SFC_SW_DWN,
Mục tiêu dự báo (1) CS
1 Lớp GRU với 50 đơn vị GRU Lớp kết nối đầy đủ với 1 đơn vị đầu ra
Thông số hiệu chỉnh mô hình
Thuật toán sử dụng : Adam MaxEpochs: 150 Batch_size: 32 Bảng mô tả tóm tắt mô hình GRU được thể hiện ở hình bên dưới
Bảng 5 2 Thông số mô hình GRU
Phân tích kết quả HV: Nguyễn Thành Danh
Các đại lượng đánh giá kết quả dự báo :
Kết quả dự báo của mô hình GRU được thể hiện như bảng bên dưới:
Bảng 5 3 Kết quả dự báo của mô hình GRU
Hình 5 2 Kết quả dự báo của mô hình GRU
Phân tích kết quả HV: Nguyễn Thành Danh
Hình 5 3 So sánh giá trị dự báo và giá trị thực mô hình GRU Bảng 5 4 So sánh mô hình GRU trên hai tập dữ liệu Đánh giá sai số Trên tập huấn luyện
Trên tập kiểm tra Nhận xét
RMSE 67.55 70.27 Sự chênh lệch nhỏ giữa RMSE và R² trên tập huấn luyện và tập kiểm tra cho thấy mô hình có khả năng tổng quát hóa tốt, không bị overfitting hoặc underfitting
Tổng quát, mô hình đã cho kết quả dự báo khá chính xác với sai số thấp và hệ số R² trên tập kiểm tra cao hơn một chút so với tập huấn luyện, điều này là tích cực và chỉ ra rằng mô hình có thể giải thích tốt biến thiên của dữ liệu thực tế không chỉ trong quá trình huấn luyện mà còn trên dữ liệu mới
Phân tích kết quả HV: Nguyễn Thành Danh
Bảng 5 5 Các yếu tố ảnh hưởng mô hình GRU
Yếu tố ảnh hưởng Mức độ ảnh hưởng
Số neural trong mỗi lớp Không nhiều
Mô hình LSTM
Một số ưu điểm của mô hình LSTM:
• Xử lý dữ liệu chuỗi dài: LSTM có khả năng xử lý dữ liệu chuỗi dài mà các mô hình truyền thống khác như mạng nơ-ron tiêu chuẩn hoặc RNN không thể làm được Điều này là do cơ chế cổng quên của LSTM, cho phép “nhớ” hoặc “quên” thông tin từ quá khứ khi cần thiết
• Phù hợp cho dữ liệu chuỗi có thời lượng biến đổi: LSTM hoạt động tốt trên các dữ liệu có thể có độ dài khác nhau hoặc biến đổi theo thời gian
• Khả năng học thông tin dài hạn: LSTM được thiết kế để giải quyết vấn đề biến mất và vấn đề nhanh chóng quên thông tin trong RNN
• Khả năng chọn lọc thông tin quan trọng: LSTM có khả năng chọn lọc thông tin quan trọng và loại bỏ thông tin không cần thiết trong quá trình học
Việc xây dựng mô hình LSTM được thực hiện qua các bước sau:
Bước 1: o Khởi tạo trạng thái ẩn ban đầu h₀ và trạng thái tế bào C₀ o Khởi tạo các trọng số và bias của các cổng (input gate, forget gate, output gate) và các kết nối tương tác (cell state)
Bước 2: o Với mỗi thời gian t
Phân tích kết quả HV: Nguyễn Thành Danh o Đầu vào: Nhận đầu vào xt tại thời điểm t
Bước 3 : o Ở cổng quên: Tính toán giá trị cổng quên 𝑓(𝑡) = 𝜎(𝑊 𝑖 [ℎ 𝑡−1 , 𝑥 𝑡 ] + 𝑏 𝑓 ) (4.7)
• xt: Đầu vào tại thời điểm t
• ht−1: Trạng thái ẩn tại thời điểm t-1
• ft: Cổng quên (forget gate) tại thời điểm t
• bf: là vector bias cho cổng quên
Bước 4 : o Ở cổng đầu vào o Tính giá trị cổng đầu vào: i(𝒕) = 𝝈(𝑾 𝒊 [𝒉 𝒕−𝟏 , 𝒙 𝒕 ] + 𝒃 𝒊 ) (4.8)
Bước 5 : o Tính toán giá trị trạng thái tế bào ước lượng (cell state candidate):
𝐶̃(𝑡) = 𝑡𝑎𝑛ℎ(𝑊 𝑐 [ℎ 𝑡−1 , 𝑥 𝑡 ] + 𝑏 𝑐 ) (4.9) o Tính toán giá trị cell state: Ct = ft Ct-1 + it.𝐶̃(𝑡) (4.10)
Bước 6: o Ở cổng đầu ra o Tính giá trị cổng đầu ra: o(𝑡) = 𝜎(𝑊 𝑜 [ℎ 𝑡−1 , 𝑥 𝑡 ] + 𝑏 𝑜 ) (4.11) o Tính trạng thái ẩn đầu ra: ht = ot tanh(Ct) (4.12)
Bước 7: Trả về giá trị đầu ra yt
Bước 8: Lặp lại bước 2 cho mỗi bước thời gian t trong chuỗi dữ liệu đầu vào
Phân tích kết quả HV: Nguyễn Thành Danh
Hình 5 4 Sơ đồ khối thực hiện LSTM
Khởi tạo trạng thái ẩn trước đó (h t-1 ) Khởi tạo mô hình LSTM
Cổng quên Cổng đầu ra
Tính giá trị cổng quên Quên
Tính giá trị cổng đầu ra
Khởi tạo ma trận trọng số (W) và bias
Tính trạng thái tế bào mới Nhận giá trị đầu vào x t tại thời điểm t
Tính trạng thái ẩn mới Tính toán đầu ra
Cập nhật trọng số Khởi tạo trạng thái tế bào trước đó
Tính giá trị cổng đầu vào
So sánh kết quả đầu ra với thực tế
Lặp lại cho đến khi đủ số lượng epoch đã chọn, hội tụ và đạt được kết quả tốt
Phân tích kết quả HV: Nguyễn Thành Danh
Các thông số được sử dụng cho mô hình LSTM được thể hiện trong bảng bên dưới : Bảng 5 6 Các thông số đầu vào của mô hình LSTM Đặc trưng Chi tiết
ALLSKY_SFC_SW_DWN, CLRSKY_SFC_SW_DWN,
Mục tiêu dự báo (1) CS
1 Lớp LSTM với 50 đơn vị LSTM Lớp kết nối đầy đủ với 1 đơn vị đầu ra
Thông số hiệu chỉnh mô hình
Thuật toán sử dụng : Adam MaxEpochs: 200 Batch_size: 32 Bảng mô tả tóm tắt mô hình LSTM được thể hiện ở hình bên dưới
Bảng 5 7 Thông số mô hình LSTM
Phân tích kết quả HV: Nguyễn Thành Danh
Các đại lượng đánh giá kết quả dự báo :
Kết quả dự báo của mô hình LSTM được thể hiện như bảng bên dưới:
Bảng 5 8 Kết quả dự báo của mô hình LSTM
Hình 4 11 Kết quả dự báo của mô hình LSTM
Phân tích kết quả HV: Nguyễn Thành Danh
Hình 4 12 So sánh giá trị dự báo và giá trị thực của mô hình LSTM Bảng 5 9 So sánh LSTM trên hai tập dữ liệu Đánh giá sai số Trên tập huấn luyện
Trên tập kiểm tra Nhận xét
RMSE 67.5 69.72 Sự chênh lệch nhỏ giữa RMSE và R² trên tập huấn luyện và tập kiểm tra cho thấy mô hình có khả năng tổng quát hóa tốt, không bị overfitting hoặc underfitting
Tổng quát, mô hình có hiệu suất tốt trên tập huấn luyện nhưng không tốt bằng trên tập kiểm tra, mô hình LSTM đã đạt được độ chính xác cao và phù hợp tốt với dữ liệu Nếu cần cải thiện thêm, có thể thử các kỹ thuật như tăng kích thước tập dữ liệu huấn luyện, điều chỉnh siêu tham số của mô hình, gia tăng số vòng lặp epochs và số đơn vị ẩn của mô hình
Phân tích kết quả HV: Nguyễn Thành Danh
Bảng 5 10 Xem xét các yếu tố ảnh hưởng mô hình LSTM
Yếu tố ảnh hưởng Mức độ ảnh hưởng
Số neural trong mỗi lớp Không nhiều
Mô hình MLP
Mô hình MLP (Multilayer Perceptron) là một trong những mô hình nổi tiếng và phổ biến trong lĩnh vực học sâu Dưới đây là một số ưu điểm chính của mô hình MLP:
• Khả năng học tập linh hoạt: MLP có khả năng học tập các hàm phức tạp và không tuyến tính từ dữ liệu đầu vào
• Khả năng xử lý dữ liệu phi tuyến tính: Với cấu trúc đa tầng, MLP có thể xử lý được các mối quan hệ phi tuyến tính trong dữ liệu, giúp nó phù hợp cho nhiều loại bài toán
• Khả năng tùy chỉnh: MLP cho phép tùy chỉnh cấu trúc mạng nơ-ron bằng cách thay đổi số lượng tầng ẩn, số lượng nơ-ron trên mỗi tầng, và hàm kích hoạt Điều này giúp tối ưu hóa mô hình cho từng bài toán cụ thể
• Khả năng áp dụng cho nhiều loại dữ liệu: MLP có thể áp dụng cho nhiều loại dữ liệu khác nhau, bao gồm dữ liệu có cấu trúc và dữ liệu không cấu trúc
• Dễ hiểu và triển khai: Cấu trúc đơn giản của MLP làm cho nó dễ hiểu và triển khai trong các ứng dụng thực tế, đặc biệt là khi có sẵn các thư viện hỗ trợ như TensorFlow và PyTorch
Việc xây dựng mô hình MLP được thực hiện qua các bước sau:
Bước 1: o Khởi tạo ngẫu nhiên các ma trận trọng số và vector bias cho các tầng ẩn và tầng đầu ra
Phân tích kết quả HV: Nguyễn Thành Danh
Bước 2: o Đầu ra của tầng ẩn lớp thứ i: ai= activation_function(Wi* x + bi) o Trong đó Wi là ma trận trọng số o bi là vector bias o activation_function là hàm kích hoạt phi tuyến tính như sigmoid
Bước 3 : o Đầu ra của tầng đầu ra: y = activation_function(Woutput * ahidden + boutput) o Trong đó Woutput là ma trận trọng số của tầng đầu ra o boutput là vector bias của tầng đầu ra o ahidden là đầu ra của tầng ẩn cuối cùng
Bước 4 : o Tính toán hàm mất mát giữa dự đoán và nhãn thực tế (ví dụ: hàm lỗi bình phương sai): loss = compute_loss(y, true_label) o Tính toán đạo hàm của hàm mất mát theo các tham số trọng số và bias: dWoutput, dboutput, dWi, dbi = compute_gradients(loss)
Bước 5 : o Cập nhật các trọng số và bias: o Woutput = Woutput - learning_rate * dWoutput (4.15) o boutput = boutput - learning_rate * dboutput (4.16) o Wi = Wi - learning_rate * dWi (4.17) o bi = bi - learning_rate * dbi (4.18)
Bước 6: o Lặp lại bước 2 đến bước 4 cho một số lần lặp (epochs) đã cho hoặc cho đến khi tiêu chí dừng được đáp ứng (ví dụ: hàm mất mát đạt đến ngưỡng chấp nhận được)
Phân tích kết quả HV: Nguyễn Thành Danh
Bước 7: Trả về giá trị đầu ra yt
Khởi tạo các trọng số Đưa dữ liệu vào huấn luyện Tiến hành lan truyền thẳng để tính toán giá trị đầu ra
Cập nhật trọng số Khởi tạo các tham số (số lớp ẩn, số lượng neural, hệ số học, các tham số liên quan,…)
Lặp lại cho đến khi đạt điều kiện dừng hoặc số lần lặp tối đa
So sánh kết quả đầu ra với thực tế
Hình 5 5 Lưu dồ giải thuật của thuật toán MLP
Phân tích kết quả HV: Nguyễn Thành Danh
Các thông số được sử dụng cho mô hình MLP được thể hiện trong bảng bên dưới : Bảng 5 11 Các thông số mô hình MLP Đặc trưng Chi tiết
ALLSKY_SFC_SW_DWN, CLRSKY_SFC_SW_DWN,
Mục tiêu dự báo (1) CS
1 Lớp Dense với 32 đơn vị Dense
1 Lớp Dense với 64 đơn vị Dense Lớp kết nối đầy đủ với 1 đơn vị đầu ra
Thông số hiệu chỉnh mô hình
Thuật toán sử dụng : Adam MaxEpochs: 150 Batch_size: 32 Bảng 5 12 Thông số mô hình MLP
Phân tích kết quả HV: Nguyễn Thành Danh
Các đại lượng đánh giá kết quả dự báo :
Kết quả dự báo của mô hình LSTM được thể hiện như bảng bên dưới:
Bảng 5 13 Kết quả đánh giá sai số dự báo
Hình 5 6 Kết quả dự báo của mô hình MLP
Phân tích kết quả HV: Nguyễn Thành Danh
Hình 5 7 So sánh giá trị dự báo và giá trị thực mô hình MLP Bảng 5 14 So sánh mô hình MLP trên hai tập dữ liệu Đánh giá sai số Trên tập huấn luyện
Trên tập kiểm tra Nhận xét
RMSE 64.32 67.23 RMSE trên tập kiểm tra chỉ cao hơn một chút so với tập huấn luyện, cho thấy mô hình duy trì được độ chính xác khi áp dụng trên dữ liệu mới
Giá trị R² cao (gần 1) cho thấy mô hình giải thích được 86.6% sự biến thiên của dữ liệu huấn luyện và 87.8% sự biến thiên của dữ liệu kiểm tra
Phân tích kết quả HV: Nguyễn Thành Danh
Mô hình MLP cho thấy hiệu suất tốt cả trên tập huấn luyện và tập kiểm tra, với sai số thấp và độ giải thích cao
Sự chênh lệch nhỏ giữa RMSE và R² trên hai tập dữ liệu cho thấy mô hình không bị overfitting và có khả năng dự đoán ổn định trên dữ liệu mới
Bảng 5 15 Các yếu tố ảnh hưởng mô hình MLP
Yếu tố ảnh hưởng Mức độ ảnh hưởng
Số neural trong mỗi lớp Không nhiều
Kết quả tổng hợp
Bảng tổng hợp so sánh các đại lượng đánh giá của các mô hình:
Hình 5 8 So sánh sai số dự báo của các mô hình
Phân tích kết quả HV: Nguyễn Thành Danh
Hình 5 9 So sánh hệ số R 2 của các mô hình Bảng 5 16 Bảng tổng hợp kết quả so sánh
Dựa trên các chỉ số đánh giá hiệu suất của các mô hình dự báo trên bộ dữ liệu đã cung cấp, chúng ta có thể rút ra một số nhận xét sau
• Cả ba mô hình đều hiệu quả trên tập dữ liệu thu thập và cho kết quả dự báo khá chính xác
Phân tích kết quả HV: Nguyễn Thành Danh
• Mô hình MLP (Multilayer Perceptron) đã cho kết quả tốt nhất, với RMSE (Root Mean Square Error) thấp nhất và R 2 (Coefficient of Determination) cao nhất Điều này cho thấy mô hình MLP có khả năng dự đoán chính xác và giải thích được một phần lớn sự biến động của dữ liệu
• Mặc dù mô hình LSTM (Long Short-Term Memory) cũng cho kết quả khá tốt, nhưng vẫn thua so với MLP Trong khi đó, mô hình GRU (Gated Recurrent Unit) có hiệu suất kém hơn cả hai mô hình kia, với RMSE cao và R 2 thấp.
Dự báo điện mặt trời tại thành phố Thủ Dầu Một
Dựa trên kết quả so sánh các mô hình, tác giả lựa chọn mô hình MLP để dự báo sản lượng điện tại thành phố Thủ Dầu Một, tỉnh Bình Dương
5.5.1 Dữ liệu điện mặt trời tại thành phố Thủ Dầu Một
Theo số liệu từ Phòng Kỹ thuật của Điện lực Thủ Dầu Một, tổng công suất và tổng số lượng điện mặt trời tại thành phố Thủ Dầu Một tỉnh Bình Dương được thể hiện trong bảng 5.17 và 5.18
Bảng 5 17 Công suất điện mặt trời tại thành phố Thủ Dầu Một
Công suất điện mặt trời
Tổng công suất Giai đoạn