Luận văn thạc sĩ Quản lý năng lượng: Ứng dụng mô hình mạng neuron nhân tạo dự báo nhu cầu điện năng ngắn hạn cho khu vực Thành phố Hồ Chí Minh

Dựa trên dữ liệu lịch sử, thực hiện đánh giá sự tương quan giữa các thành phần và đề xuất xây dựng mô hình dự báo ngắn hạn về sản lượng điện nhận đầu nguồn sử dụng mạng nơ-ron nhân tạo,

CƠ SỞ LÝ THUYẾT VỀ DỰ BÁO ĐIỆN NĂNG

Tổng quan về dự báo điện năng

Dự báo phụ tải không chỉ là việc sử dụng dữ liệu về phụ tải trong quá khứ để dự đoán những biến động, xu hướng tiếp theo, mà đây còn là một quá trình tính toán, đánh giá thực tế, giúp mang lại cái nhìn toàn diện về sự phát triển, thay đổi của phụ tải, từ đó đề xuất những phương án và kế hoạch linh hoạt nhằm đáp ứng hiệu quả nhất với nhu cầu nguồn điện

Dự báo phụ tải không chỉ tập trung vào việc dự đoán mà còn liên quan đến việc tính toán chi tiết, ước lượng chính xác và đánh giá mức độ tăng trưởng cũng như nhu cầu của phụ tải, qua đó cung cấp sự hỗ trợ trong cả ngắn hạn, trung hạn và dài hạn cho hệ thống điện [3]

Phân loại dự báo điện năng

Dự báo phụ tải rất ngắn hạn, hay VSTLF (Very Short-Term Load Forecasting) là công cụ quan trọng được ứng dụng trong quá trình điều khiển hệ thống điện, giúp tối ưu hóa quy trình sản xuất điện, đáp ứng nhu cầu điều khiển nguồn phát tự động trong khoảng vài phút đến 24 giờ [2]

Dự báo phụ tải ngắn hạn, còn gọi là STLF (Short-Term Load Forecasting), chú trọng vào việc dự báo trong khoảng thời gian từ 1 ngày đến 2 tuần, chủ yếu được sử dụng để định hình biểu đồ phát điện, hỗ trợ các công ty điện lên kế hoạch kinh doanh, bảo dưỡng, và chiến lược điều khiển phụ tải nhằm giảm thiểu chi phí [2]

Dự báo trung hạn, hay MTLF (Mid-Term Load Forecasting), có phạm vi dự báo kéo dài từ 1 tháng đến 3 năm Loại dự báo này thường được áp dụng để xác định cụ thể các thiết bị và lưới điện sẽ được triển khai, đồng thời hỗ trợ quyết định về hợp đồng trong thị trường điện [2]

Cuối cùng, dự báo dài hạn, hay LTLF (Long-Term Load Forecasting), nhìn xa về tương lai với phạm vi dự báo từ 3 đến 30 năm Trong khoảng thời gian này, dự

6 báo đóng vai trò quan trọng trong quá trình quy hoạch, xây dựng nhà máy điện, đường dây truyền tải và hệ thống phân phối điện [2]

Bảng 2 1 Đặc điểm của các loại dự báo

Loại Dự Báo Thời gian tối thiểu Thời gian tối đa

Dự báo rất ngắn hạn ≥ 1 Phút 1 Ngày

Dự báo ngắn hạn 1 Ngày 2 Tuần

Dự báo trung hạn 1 Tháng 3 Năm

Dự báo dài hạn 3 Năm 30 Năm

Dự báo điện năng ngắn hạn

2.3.1 Tầm quan trọng của dự báo điện năng ngắn hạn

So với dự báo phụ tải dài hạn và trung hạn, dự báo phụ tải ngắn hạn đóng một vai trò quan trọng trong quá trình xây dựng kế hoạch Sản xuất Kinh doanh và Đầu tư xây dựng Những kế hoạch Sản xuất Kinh doanh và Đầu tư xây dựng cơ bản nhất đòi hỏi sự chính xác từ dự báo phụ tải ngắn hạn, đặc biệt, sự chính xác của dự báo phụ tải ngắn hạn giúp định hình kế hoạch cho công tác sửa chữa và bảo dưỡng lưới điện, đảm bảo hiệu suất lưới điện luôn ổn định trong suốt quá trình thực hiện các công tác

Các phương pháp dự báo ngắn hạn có thể được phân loại thành ba loại chính gồm: các phương pháp dựa trên kỹ thuật thống kê (phương pháp tương tự, phương pháp chuỗi thời gian, phương pháp hồi quy, …); các phương pháp sử dụng trí tuệ nhân tạo (phương pháp mạng nơ-ron, phương pháp hệ thống chuyên gia logic, …) và các phương pháp kết hợp giữa kỹ thuật thống kê và mạng trí tuệ nhân tạo

Mỗi phương pháp đều có những ưu điểm và nhược điểm riêng, tuy nhiên, trong những phương pháp trên thì phương pháp sử dụng mạng nơ-ron nhân tạo có nhiều ưu điểm hơn vì dễ ứng dụng thực hiện, độ chính xác và hiệu quả cao

2.3.2 Những yếu tố tác động đến dự báo điện năng ngắn hạn

Dựa trên nghiên cứu và thống kê thực tế quản lý kinh doanh điện tại thành phố

Hồ Chí Minh, có những yếu tố ảnh hưởng đáng kể đến phụ tải điện khu vực, bao gồm:

- Thứ của ngày trong tuần: Phụ tải theo giờ trong các ngày làm việc thường cao hơn so với các ngày nghỉ cuối tuần

- Thời tiết trong ngày: Các yếu tố như nhiệt độ, độ ẩm, tốc độ gió và hướng gió, cường độ ánh sáng Trong đó, nhiệt độ có ảnh hưởng mạnh nhất tới phụ tải, có thể xem phụ tải là một hàm số phụ thuộc vào nhiệt độ Giữa phụ tải và nhiệt độ là có qui luật ví dụ như: nhiệt độ tăng thì phụ tải tăng và ngược lại Chỉ có trường hợp đặc biệt ở miền Bắc khi thời tiết quá lạnh phụ tải tăng do việc sử dụng các thiết bị sưởi ấm

- Ngày đặc biệt trong năm: Các ngày lễ, ngày Tết như ngày Tết âm lịch, Tết dương lịch, ngày 30/4 và 01/5, ngày 02/09 Phụ tải những ngày này giảm rất nhiều so với ngày thường và ta có thấy rõ điều đó qua các số liệu thống kê trong quá khứ Phụ tải sát các ngày sát ngày lễ, ngày Tết cũng bị ảnh hưởng Dự báo phụ tải trong các ngày đặc biệt này không áp dụng như ngày thường mà phải theo phương pháp riêng dựa vào sự thay đổi phụ tải của các năm trước trong các ngày này so với ngày thường

- Công tác sửa chữa lớn, sa thải phụ tải do sự cố: Các công việc sửa chữa, sa thải phụ tải do sự cố cũng có ảnh hưởng đáng kể đến phụ tải

Tuy nhiên, trong số các yếu tố này, nhiệt độ môi trường và đặc tính của ngày đang xét (thứ của ngày trong tuần, các ngày đặc biệt trong năm) được xác định là có ảnh hưởng và tác động mạnh nhất đối với nhu cầu tiêu thụ điện khu vực Hai yếu tố này có mối tương quan mật thiết với nhau:

Khi nhiệt độ môi trường tăng, nhu cầu tiêu thụ điện có thể tăng và ngược lại Tuy nhiên, việc đo đếm và dự báo nhiệt độ vẫn chưa tự động hóa cao, gây thiếu sót trong số liệu cần thiết cho dự báo Tính chất của ngày đang xét (thứ của ngày trong

8 tuần, các ngày đặc biệt trong năm) cũng đóng vai trò quan trọng, đặt ra yêu cầu xây dựng mô hình dự báo phù hợp với từng loại ngày để giảm sai số.

Các nghiên cứu liên quan về dự báo phụ tải

Dự báo phụ tải chính xác đóng vai trò quan trọng giúp phát triển các chiến lược kế hoạch và vận hành hệ thống sản xuất, truyền tải và phân phối điện Việc điều phối vận hành thời gian thực của các nhà máy điện phụ thuộc rất nhiều vào dự báo phụ tải chính xác [3] Ngoài ra, nếu không có kết quả dự báo chính xác, chi phí vận hành không thể ước đoán được

Dự báo phụ tải có thể chia thành ba loại: Dự báo phụ tải ngắn hạn nhằm dự báo phụ tải từ vài giờ đến vài tuần; dự báo phụ tải trung hạn dự báo tải từ một tuần đến một năm và dự báo phụ tải dài hạn dự báo tải trên một năm [4] Dự báo phụ tải ngắn hạn ước đoán phụ tải cho ngày tiếp theo, điều này đặc biệt quan trọng cho vận hành và kiểm soát hệ thống điện Cho đến nay, nhiều phương pháp dự báo phụ tải ngắn hạn (STLF) được nghiên cứu và sử dụng Các phương pháp này được phân loại chung là kỹ thuật truyền thống hoặc trí tuệ nhân tạo Phương pháp thống kê thường được sử dụng trong các phương pháp truyền thống [5], ngoài ra còn có các phương pháp khác như: hồi quy tuyến tính nhiều biến [6], [7], exponential smoothing [5] và mô hình ARIMA [8] Tuy nhiên, do đặc tính phi tuyến của dữ liệu phụ tải theo thời gian, những phương pháp đã đề cập có thể không chính xác trong dự báo phụ tải điện ngắn hạn [8]-[10]

Các giải pháp dựa trên máy học đã được phát triển và sử dụng rộng rãi trong việc giải quyết các bài toán liên quan đến dự báo phụ tải ngắn hạn [11] Các phương pháp phân nhóm [12], support vector regression (SVR) [13], logic mờ (Fuzzy logic) [14], mạng nơ-ron nhân tạo (ANN) [15]-[18], mạng hàm cơ sở bán kính (RBFN) [19], và các phương pháp kết hợp [20], [21] là các phương pháp dựa trên máy học được nghiên cứu và ứng dụng gần đây

Nghiên cứu [22] trình bày việc ứng dụng một mô hình SVR sử dụng hàm kernel để dự báo phụ tải điện, hiệu suất của mô hình được đánh giá và chứng minh

9 bằng tập dữ liệu thực tế của Australia và California Nghiên cứu [23] mô tả một phương pháp dự báo phụ tải hàng giờ dựa trên logic mờ và tập dữ liệu một năm từ một hệ thống điện lớn, trong đó kết hợp dữ liệu tải lịch sử với thời gian và ngày, trong đó ngày được chia thành ngày cuối tuần hoặc các ngày làm việc trong tuần Điều này nhằm mục đích tính toán đường cong phụ tải dự kiến của một ngày cụ thể thông qua phân tích dữ liệu một năm Để dự báo nhu cầu phụ tải điện ngắn hạn, nghiên cứu [24] đã phát triển một giải pháp hiệu quả dựa trên phương pháp kết hợp mô hình ANN với thuật toán wavelet de-noising, kết quả từ phương pháp đề xuất cho thấy độ chính xác của dự báo được cải thiện rõ rệt Các phương pháp học sâu đang thu hút nhiều sự chú ý gần đây vì chúng có nhiều lớp ẩn, cho phép mô hình xử lý các mẫu dữ liệu phi tuyến phức tạp [25], [26] Nghiên cứu [27] trình bày phương pháp dự báo điện gió (WPF) trước 6 tháng dựa trên máy học, trong đó các phương pháp dựa trên cây quyết định, tăng cường gradient và tăng cường cực đại (XGBoost) được sử dụng để huấn luyện mô hình WPF Kết quả cho thấy mô hình đề xuất mang lại hiệu suất và độ chính xác rất cao trong dự báo điện gió cho trang trại gió Ghadamgah

Ngoài ra, nhờ vào khả năng học tập từ các bộ dữ liệu tải không ổn định, mạng nơ-ron hồi quy (RNN) cũng được sử dụng cho dự báo phụ tải ngắn hạn Trong [28], Shi và đồng nghiệp đã sử dụng một thuật toán RNN kết hợp bộ dữ liệu tải trong khu vực với và thu được kết quả sai số trung bình bình phương (RMSE) rất khả quan Trong nghiên cứu [29], Wei và đồng nghiệp giới thiệu một thuật toán dự báo phụ tải hiện đại dựa trên RNN sử dụng ý tưởng dự báo một bước trước (one-step-ahead), phương pháp được đề xuất cho hiệu suất cao so với các mô hình khác, tuy nhiên cần lưu ý rằng vấn đề tiêu biến gradient và bùng nổ gradient xuất hiện trong RNN, giảm độ chính xác của dự đoán Ngoài ra, do không gặp vấn đề tiêu biến gradien, mạng nơ- ron hồi quy có cổng (GRUN) đã được sử dụng rộng rãi trong những năm gần đây [30] Trong nghiên cứu [31], một thuật toán GRUN dựa trên dữ liệu đa nguồn cho STLF được đề xuất, mô hình này cho kết quả sai số trung bình phần trăm (MAPE) thấp nhất, vượt trội so với các phương pháp hiện tại khác Mạng LSTM cũng được

10 sử dụng để xử lý vấn đề gradient biến mất, cho kết quả dự báo chính xác trong trường hợp chuỗi dữ liệu phức tạp và có nhiều đặc trưng phụ thuộc dài hạn

Từ các nội dung lược sử tài liệu nên trên, ta có thể thấy rằng trong các năm gần đây, mạng nơ-ron nhân tạo đang được nghiên cứu và phát triển để giải quyết hiệu quả các bài toán về dự báo phụ tải ngắn hạn Trong phạm vi Luận văn Thạc sĩ, tác giả cũng ứng dụng các mô hình mạng nơ-ron nhân tạo để dự báo điện nhận đầu nguồn của Tổng Công ty Điện lực Thành phố Hồ Chí Minh.

Thực trạng công tác dự báo điện năng hiện nay tại EVNHCMC

Tính đến thời điểm hiện tại, tại Việt Nam, bài toán dự báo điện năng trong ngành điện chủ yếu được giải quyết thông qua các phương pháp dự báo truyền thống, dựa vào kinh nghiệm tích lũy từ quá khứ Tuy nhiên, việc áp dụng hiệu quả các kinh nghiệm này gặp khó khăn do sự biến động cao của phụ tải và ảnh hưởng đa dạng từ các yếu tố khách quan và chủ quan

Tại EVNHCMC, công tác dự báo đang được cải thiện cả về khía cạnh kỹ thuật và chất lượng thông qua việc nghiên cứu, phát triển giải thuật sử dụng Matlab để xử lý số liệu, phân tích, tính toán, đưa ra kết quả dự báo với sai số thấp nhất nhằm đáp ứng yêu cầu của thị trường điện cạnh tranh Tuy nhiên, việc thiếu hụt dữ liệu để xác định các thông số đầu vẫn là một thách thức lớn, làm giảm khả năng đánh giá toàn diện về tính chất của phụ tải và sai số dự báo Do đó, công tác dự báo điện năng ngắn hạn tại EVNHCMC vẫn đang đối mặt với nhiều thách thức khó khăn và chưa có chuẩn mực cụ thể về phương pháp tiếp cận

Kết luận chương 2: Chương 2 đã trình bày về lý thuyết dự báo điện năng từ ngắn hạn đến dài hạn, phân loại các loại dự báo theo thời gian và mô tả tầm quan trọng của dự báo ngắn hạn trong quản lý điện Bên cạnh đó, trình bày các phương pháp dự báo, yếu tố tác động đến kết quả dự báo và lược sử nghiên cứu tài liệu Qua đó, có cái nhìn tổng quát và đánh giá hiện trạng hiện của công tác dự báo điện năng và những thách thức, khó khăn tại EVNHCMC

MẠNG NƠ-RON NHÂN TẠO TRONG DỰ BÁO ĐIỆN NĂNG 11

Giới thiệu chung

Theo các nhà nghiên cứu sinh học, hệ thống thần kinh của con người có cấu trúc rất phức tạp bao gồm khoảng 15 tỷ tế bào thần kinh, thường gọi là các nơ ron Mỗi tế bào nơ ron gồm thân nơ-ron với nhân bên trong là nơi tiếp nhận hay phát ra các xung động thần kinh và một hệ thống dạng cây các dây thần kinh vào để đưa tín hiệu tới nhân nơ-ron [18]

Mạng nơ-ron nhân tạo (Artificial Neural Network) là một mô hình xử lý thông tin mô phỏng theo cách thức xử lý thông tin của các hệ nơ-ron sinh học Nó được tạo nên từ một số lượng lớn các phần tử (gọi là phần tử xử lý hay nơ-ron) kết nối với nhau thông qua các liên kết (gọi là trọng số liên kết) làm việc như một thể thống nhất để giải quyết một vấn đề cụ thể nào đó [18]

Một mạng nơ-ron nhân tạo được cấu hình cho một ứng dụng cụ thể (nhận dạng mẫu, phân loại dữ liệu, ) thông qua quá trình học từ tập các mẫu huấn luyện, quá trình này về bản chất chính là quá trình hiệu chỉnh trọng số liên kết giữa các nơ-ron

Hình 3 1 Mô hình mạng nơ-ron sinh học [18]

Trong Hình 3.1, các liên kết thần kinh (Synapses) nhận các xung điện từ các nơ- ron khác Sự tăng cường hoặc suy giảm của các xung điện này phụ thuộc vào trạng

12 thái kích thích hoặc ức chế của các nhánh thần kinh (Dendrites) Tất cả các tín hiệu điện đi qua thân tế bào (Cell body) và được tổng hợp tại nhân (Nucleus) Nếu tổng của các tín hiệu điện vượt qua một ngưỡng nhất định, nhân của nơ-ron sẽ phát ra một xung điện, truyền qua trục thần kinh (Axon) để phân phối xung điện hoạt động đến các nơ-ron khác

Hình 3 2 Mô hình mạng nơ-ron nhân tạo [18]

Trong Hình 3.2, các tín hiệu vào (input signals) của nơ-ron vào dưới dạng một vec-tơ m chiều Các nhánh thần kinh được liên kết bởi một trọng số (gọi là trọng số liên kết – Synpatic weight) Thông thường, các trọng số này được khởi tạo một cách ngẫu nhiên ở thời điểm khởi tạo mạng và được cập nhật liên tục trong quá trình học mạng Bộ tổng hợp tất cả các tín hiệu đầu vào của nơ-ron bằng cách nhân chúng với các trọng số tương ứng, tạo thành một bộ tổ hợp tuyến tính Sau khi tín hiệu đầu vào đi qua bộ tổng, giá trị đầu ra được xác định bởi một hàm kích hoạt (Activation function) Hàm này được dùng để giới hạn phạm vi đầu ra của mỗi nơ ron Nó nhận đầu vào là kết quả của hàm tổng và ngưỡng đã cho Thông thường, phạm vi đầu ra của mỗi nơ-ron được giới hạn trong đoạn [0,1] hoặc [-1, 1] Các hàm truyền rất đa dạng có thể là các hàm tuyến tính hoặc phi tuyến Việc lựa chọn hàm truyền nào là tuỳ thuộc vào từng bài toán và kinh nghiệm của người thiết kế mạng

Nơ-ron tính tổng các đầu vào của nó(𝑥 1 , 𝑥 2 𝑥 𝑚 ), gia trọng nó bằng các trọng số(𝑤 𝑘1 , 𝑤 𝑘2 𝑤 𝑘𝑚 ), so sánh với ngưỡng b Nếu tổng này vượt qua thì hàm kích hoạt

13 f sẽ tạo ra đầu ra của nó Kết quả sau khi được chuyển đổi là đầu ra của các nơ-ron được tổng quát đơn giản như sau:

Bảng 3 1 Ưu điểm và nhược điểm của mạng nơ-ron nhân tạo Ưu điểm Nhược điểm

- Có thể xét đồng thời nhiều yếu tố ảnh hưởng

- Dễ dàng xử lý các bài toán phi tuyến mà các thuật toán số học khác gặp nhiều khó khăn hoặc không giải quyết được

- Đặc biệt hiệu quả trong dự báo phụ tải ngắn hạn (đã được chứng minh bởi các chuyên gia trên thế giới)

- Có sẵn một số mô hình mạng nơ-ron trên thị trường

- Thời gian chạy lâu và không đảm bảo chắc chắn hội tụ

- Thuật toán và cấu trúc mạng phức tạp, cần qua kiểm nghiệm thực tế để lựa chọn cấu trúc phù hợp và mất nhiều thời gian, công sức để xây dựng và hiệu chỉnh mô hình

- Kết quả phụ thuộc nhiều vào số liệu mẫu dùng để huấn luyện

Tìm hiểu các cấu trúc mạng nơ-ron nhân tạo

Cấu trúc của mạng nơ-ron được định nghĩa bởi số lớp, số nơ-ron trên mỗi lớp, và sự liên kết giữa các lớp như thế nào Các cấu trúc mạng nơ-ron về tổng thể được chia thành hai loại dựa trên cách thức liên kết với nhau gồm: mạng nơ-ron truyền thẳng và mạng nơ-ron hồi quy

3.2.1 Mạng nơ-ron truyền thẳng Feedforward nơ-ron network)

Mạng nơ-ron truyền thẳng là mạng có cấu trúc đơn giản nhất Trong mạng này, thông tin chỉ truyền thẳng từ lớp đầu vào qua lớp ẩn rồi tới lớp đầu ra mà không đi qua bất kỳ vòng lặp nào

Có 2 dạng mạng nơ-ron truyền thẳng:

- Mạng nơ-ron truyền thẳng một lớp gồm: lớp đầu vào kết nối trực tiếp với lớp đầu ra thông qua các trọng số Mạng này chỉ có thể giải quyết các bài toán có mẫu phân tách tuyến tính, Hình 3.3

- Mạng nơ-ron truyền thẳng nhiều lớp gồm: gồm lớp đầu vào, nhiều lớp ẩn và lớp đầu ra Nếu như so với mạng nơ-ron một lớp thì mạng nơ-ron nhiều lớp có thể giải quyết các bài toán phức tạp hơn, Hình 3.4

Hình 3 3 Mạng nơ-ron truyền thẳng một lớp [18]

Hình 3 4 Mạng nơ-ron truyền thẳng hai lớp [18]

3.2.2 Mạng nơ-ron hồi quy (Recurrent neural network)

Khác với mạng nơ-ron truyền thẳng, trong mạng nơ-ron hồi quy có chứa thêm các liên kết ngược, các thông tin không chỉ được truyền đi mà còn truyền ngược lại điều này làm cho mạng nơ-ron hồi quy hiệu quả khi xử lý dữ liệu dạng chuỗi

Mạng nơ-ron hồi quy có khả năng xử lý đầu vào có độ dài bất kỳ, kích cỡ mô hình không tăng theo kích cỡ đầu vào và quá trình tính toán sử dụng thông tin lịch sử Trọng số được chia sẻ trong suốt quá trình, tuy nhiên, mạng này có tốc độ tính toán chậm và khó để truy cập thông tin từ một khoảng thời gian dài trước đó [19]

Hình 3 5 Mạng nơ-ron hồi quy [19]

Tìm hiểu các phương thức học của mạng nơ-ron

Mạng nơ-ron nhân tạo ra đời với ý tưởng mô phỏng cách bộ não con người hoạt động Trong quá trình này, các nơ-ron được huấn luyện thông qua các kinh nghiệm và chúng lưu giữ những kinh nghiệm này để sử dụng trong các tình huống tương lai phù hợp

3.3.1 Phương thức học có giám sát (supervised learning)

Học có giám sát là dự đoán đầu ra của bộ dữ liệu dựa trên các cặp dữ liệu đã biết trước Đây là phương pháp học phổ biến nhất trong các thuật toán học máy Theo toán học, học có giám sát nghĩa là khi có một tập hợp n biến đầu vào X = {x1, x2, …, xn} và tập hợp tương ứng Y = {y1, y2, …, yn} Tập hợp các cặp dữ liệu (xi, yi) được gọi là tập dữ liệu huấn luyện (training data) Từ tập huấn luyện này cần tạo ra một hàm số ánh xạ, mỗi phần tử từ tập X sang một phần tử (xấp xỉ) tương ứng của tập Y Thuật toán học có giám sát có 2 bài toán chính là phân loại (classification) và hồi quy (regression) [35]

3.3.2 Phương thức học không giám sát (unsupervised learning)

Học không giám sát chỉ sử dụng tập dữ liệu đầu vào X mà không cần biết tập

Y tương ứng Do đó, thuật toán này chủ yếu dựa vào cấu trúc của dữ liệu để thực hiện các phương pháp như phân nhóm (clustering) hoặc giảm số chiều của dữ liệu (dimension reduction) để tối ưu lưu trữ và tính toán [35]

3.3.3 Phương thức học bán giám sát (semi-supervised learning)

Học bán giám sát được sử dụng trong trường hợp bài toán có một lượng lớn dữ liệu đầu vào X, nhưng chỉ một phần tập Y tương ứng được xác định Các bài toán thuộc nhóm này nằm ở giữa hai nhóm chính: học có giám sát và học không giám sát

3.3.4 Phương thức học sâu (deep learning)

Học sâu là phương pháp tiến của mạng nơ-ron nhân tạo, tận dụng sức mạnh tính toán ngày càng tiện lợi từ các chip xử lý hiện đại Phương pháp học này nhằm mục tiêu xây dựng các mạng nơ-ron phức tạp hơn và giải quyết các bài toán với dữ liệu khổng lồ không được gán nhãn đầy đủ Các thuật toán học sâu phổ biến bao gồm Deep Boltzmann Machine (DBM), Deep Belief Networks (DBN), Convolutional Neural Network (CNN), Stacked Auto-Encoders [35]

Tìm hiểu hiện tượng overfitting và underfitting trong dự báo điện năng

Hiện tượng quá mức (Overfitting) xảy ra khi mô hình quá chính xác với tập dữ liệu huấn luyện, điều này có thể gây ra hậu quả nghiêm trọng nếu trong tập dữ liệu đó có nhiễu Khi đó, mô hình không thể tổng quát hóa tốt cho dữ liệu nằm ngoài tập huấn luyện Overfitting thường xuất hiện khi dung lượng của tập huấn luyện là quá nhỏ hoặc độ phức tạp của mô hình là quá cao Một mô hình được coi là hiệu quả khi cả sai số trong quá trình huấn luyện và kiểm thử đều thấp Nếu sai số huấn luyện thấp nhưng sai số kiểm thử cao, mô hình đang trải qua hiện tượng quá mức Ngược lại, nếu cả hai sai số đều cao, mô hình đang trải qua hiện tượng dưới mức Nếu sai số huấn luyện cao mà sai số kiểm thử thấp, khả năng xảy ra rất ít [20]

Hình 3 6 Mô hình có hiện tượng Overfitting [20]

Underfitting là hiện tượng mô hình không phù hợp với cả tập huấn luyện lẫn tập dữ liệu mới (tập test) Nguyên nhân chủ yếu có thể là do mô hình chưa đủ phức tạp để hiệu quả trong việc tổng quát hóa tập dữ liệu Để xây dựng một mô hình hiệu quả, tránh được hiện tượng quá mức, có một số kỹ thuật được áp dụng như sau:

- Kỹ thuật Validation: Một phần của tập huấn luyện được tách ra để tạo thành tập validation và mô hình được đánh giá trên tập validation này Phần còn lại của tập huấn luyện sẽ là tập dữ liệu mới cho mô hình

- Kỹ thuật Regularization: Thực hiện điều chỉnh mô hình bằng cách giảm độ phức tạp, từ đó ngăn chặn hiện tượng quá mức

Hình 3 7 Mô hình hiện tượng Underfitting [20]

Hình 3 8 Mô hình phù hợp [20]

Mục tiêu của luận văn này là tìm kiếm một mô hình phù hợp, có kết quả đánh giá sai số trên tập dữ liệu kiểm tra (Sai số thực tế) là thấp nhất Bảng 3.2 so sánh sai số của ba mô hình trong quá trình huấn luyện và kiểm tra

Bảng 3 2 So sánh sai số của các mô hình

Sai số Mô hình bị

Mô hình phù hợp Mô hình bị

Huấn luyện Thấp Thấp Cao

Kiểm tra Cao Thấp Cao

Tìm hiểu các mô hình mạng nơ-ron nhân tạo dự báo điện năng ngắn hạn 18

LSTM (Long Short – term memory) là một dạng đặc biệt của mô hình RNN truyền thống, có bộ nhớ trong có khả năng học và ghi nhớ các phụ thuộc xa nhau Chính vì thế nó hoạt động cực kì hiệu quả trên nhiều bài toán khác nhau và ngày càng trở nên phổ biến Kiến trúc mạng LSTM bao gồm các cổng dùng để kiểm soát trạng thái ô nhớ và trạng thái ẩn:

- Input gate (i): Cổng vào, kiểm soát mức độ của cập nhật trạng thái ô nhớ, có nhiệm vụ chọn lọc những thông tin cần thiết nào được thêm vào trạng thái ô nhớ

- Forget gate (f): Cổng quên, kiểm soát mức độ của việc thiết lập lại trạng thái ô nhớ (quên), có nhiệm vụ loại bỏ những thông tin không cần thiết nhận được khỏi trạng thái ô nhớ

- Cell candidate (g, hay được đề cập phía trên là 𝐶̃): Ô nhớ tiềm năng, thêm thông tin vào trạng thái ô nhớ

- Output gate (o): Cổng ra, kiểm soát mức độ của trạng thái ô nhớ được thêm vào trạng thái ẩn, có nhiệm vụ xác định những thông tin nào từ trạng thái ô nhớ được sử dụng như đầu ra

Hình 3 9 Sơ đồ mạng LSTM chứa 4 lớp tương tác [34] Đầu tiên, LSTM sẽ bỏ đi hoặc thêm vào các thông tin cần thiết cho trạng thái tế bào, quá trình này được điều chỉnh bởi cổng quên Cổng quên sẽ lấy giá trị đầu vào và trạng thái tế bào trước đó đi qua hàm kích hoạt Sigmoid để giá trị đầu ra rơi vào khoảng [0,1] Khi đầu ra là 0 thì có nghĩa là không cho thông tin nào qua cả, còn khi là 1 thì có nghĩa là cho tất cả các thông tin được phép đi qua nó

Hình 3 10 Cổng quên của LSTM [34]

Tiếp theo, LSTM sẽ lưu thông tin mới nhờ vào việc xác định lượng thông tin cần được lưu phụ thuộc vào đầu vào và trạng thái tế bào trước đó Quá trình này gồm

2 phần: đầu tiên là hàm tanh tạo ra một vector cho giá trị mới là 𝐶t biểu diễn những thông tin tiềm năng cần thêm vào trạng thái tế bào và hàm Sigmoid lúc này được gọi là tầng cổng vào [34]

Hình 3 11 Cổng vào của LSTM [34]

Trạng thái tế bào của các thông tin mới Ct được cập nhật bằng cách nhân trạng thái cũ với ft để bỏ các thông tin quên và lưu thông tin mới [34]

Hình 3 12 Cập nhật trạng thái mới của ô nhớ trong LSTM [34]

Cuối cùng, thông tin lưu trữ từ trạng thái tế bào được đưa qua hàm tanh có giá trị trong khoảng [-1,1] và nhân với đầu ra của hàm Sigmoid để quyết định thông tin ngõ ra Hàm Sigmoid lúc này được gọi là tầng cổng ra

Hình 3 13 Cổng ra của LSTM [34]

3.5.2 Mô hình GRU (Gated Recurrent Unit)

GRU, viết tắt của “Gated Recurrent Units”, là một kiểu mạng nơ-ron nút hồi tiếp độc đáo, ra đời như một biến thể thú vị của LSTM Năm 2014, Kyunghyun giới thiệu mô hình GRU, kết hợp các cổng quên và cổng đầu vào thành một cổng cập nhật (update gate) Điều đặc biệt, GRU hợp nhất trạng thái ô nhớ và trạng thái ẩn vào một, giúp mô hình trở nên đơn giản hóa hơn so với mô hình LSTM truyền thống và đang ngày càng trở nên phổ biến Cấu trúc mạng GRU gồm:

- Cổng xóa (reset gate): quyết định bao nhiêu thông tin từ các bước thời gian trước đó có thể bị quên

- Cổng cập nhật (update gate): quyết định lượng thông tin từ các bước thời gian trước đó phải được lưu

- Đầu ra Ouput: mang thông tin dọc theo toàn bộ chuỗi và đại diện cho bộ nhớ của mạng

Hình 3 14 Cấu trúc đồ mạng GRU [36]

3.5.3 Mô hình MLP (Multilayer Perceptron)

Mạng nơ-ron nhiều lớp (Multilayer Perceptron - MLP) là một kiến trúc mạng nơ-ron trong lĩnh vực học máy, được biết đến với khả năng mô hình hóa các mối quan hệ phức tạp giữa các biến đầu vào và đầu ra Đây là một dạng mạng nơ-ron nhiều lớp, với ít nhất một lớp ẩn giữa lớp đầu vào và lớp đầu ra Đặc điểm chính của MLP bao gồm:

- Tính linh hoạt: MLP có thể được áp dụng vào nhiều bài toán khác nhau bao gồm phân loại, dự báo và hồi quy, làm cho nó trở thành một công cụ đa nhiệm trong học máy

- Học được các đặc trưng phức tạp: Với khả năng học được các đặc trưng ẩn, MLP có thể mô hình hóa những mối quan hệ phức tạp trong dữ liệu, giúp nó thích ứng với các bài toán có độ phức tạp cao

- Hàm kích hoạt: MLP sử dụng các hàm kích hoạt phi tuyến trong quá trình học, điều này giúp mô hình có khả năng học được mối quan hệ phi tuyến giữa các biến

- Quy luật tự tổ chức: Với cấu trúc nhiều lớp, MLP có thể tự tổng hợp thông tin từ các lớp ẩn, giúp học được các đặc trưng phức tạp từ dữ liệu đầu vào

Đề xuất mô hình kết hợp mạng nơ-ron MLP-LSTM

Với mục tiêu cải thiện độ chính xác của kết quả dự báo, trong luận văn này, tác giả đề xuất kết hợp mạng nơ-ron nhiều lớp (MLP) và mạng nơ-ron bộ nhớ dài-ngắn (LSTM) để dự báo điện năng ngắn hạn cho khu vực thành phố Hồ Chí Minh

Hình 3 16 Sơ đồ cấu trúc của mô hình kết hợp MLP-LSTM

Hai mô hình mạng nơ-ron LSTM và MLP được huấn luyện độc lập trên tập huấn luyện để xác định bộ trọng số của từng mô hình, sau đó tiến hành thực hiện dự báo trên tập kiểm chứng mô hình để tìm giá trị Alpha cho mô hình kết hợp

3.6.2 Biểu diễn toán học cho mô hình đề xuất

Biểu diễn toán học cho mô hình MLP có thể được diễn đạt như sau:

X là các giá trị đầu vào

𝑓 𝑀𝐿𝑃 là hàm dự đoán của MLP

𝑌̂ 𝑀𝐿𝑃 là đầu ra dự đoán của MLP

Biểu diễn toán học cho mô hình LSTM có thể được diễn đạt như sau:

𝑓 𝐿𝑆𝑇𝑀 là hàm dự đoán của LSTM

𝑌̂ 𝐿𝑆𝑇𝑀 là đầu ra dự đoán của LSTM

Biểu diễn toán học cho mô hình kết hợp MLP-LSTM có thể được diễn đạt:

𝑌̂ 𝐶𝑜𝑚𝑏𝑖𝑛𝑒𝑑 là kết quả đầu ra của mô hình kết hợp

𝛼 là tham số được điều chỉnh trong tập kiểm chứng mô hình

3.6.3 Tìm hệ số Alpha của mô hình kết hợp

Hàm mục tiêu của Alpha:

: là trọng số liên kết của mô hình kết hợp

RMSE : Sai số bình phương trung bình Để tìm được hệ số Alpha tối ưu cho mô hình kết hợp, tác giả sử dụng phương pháp tối ưu hóa thông qua tìm kiếm Grid Search trên tập kiểm chứng mô hình Validation [37], với mỗi giá trị Alpha, tác giả kết hợp kết quả dự báo của LSTM và MLP với Alpha đã chọn, sau đó đánh giá hiệu suất của mô hình kết hợp theo sai số trung bình bình phương (RMSE) trên tập validation

Chọn giá trị Alpha tối ưu: chọn Alpha tương ứng với RMSE thấp nhất trên tập kiểm chứng mô hình

Chương 3 đã trình bày tổng quan về mạng nơ-ron nhân tạo trong dự báo điện năng ngắn hạn, giới thiệu về các cấu trúc cơ bản của mạng nơ-ron, các phương pháp học và các thuật toán huấn luyện mạng

Luận văn đã tìm hiểu và trình bày một số mô hình mạng nơ-ron nhân tạo đã được nghiên cứu, từ đó làm cơ sở để tác giả đề xuất mô hình mạng nơ-ron kết hợp MLP-LSTM nhằm cải thiện độ chính xác của dự báo, tác giả mong muốn xây dựng một mô hình dự báo điện năng có tính ứng dụng cao với khả năng dự báo chính xác nhu cầu tiêu thụ điện trong tương lai, mang lại giá trị thiết thực trong quản lý sản xuất kinh doanh điện tại EVNHCMC

ỨNG DỤNG MẠNG NƠ-RON NHÂN TẠO XÂY DỰNG MÔ HÌNH DỰ BÁO ĐIỆN NĂNG NGẮN HẠN CHO KHU VỰC THÀNH PHỐ HỒ CHÍ MINH

Giới thiệu ngôn ngữ lập trình Python

Python là một trong những ngôn ngữ lập trình đa năng được sử dụng phổ biến hiện nay trong nhiều lĩnh vực khác nhau bao gồm khoa học dữ liệu, trí tuệ nhân tạo, học máy, phát triển web, phát triển ứng dụng di động

Python cung cấp và cho phép người dùng sử dụng nhiều lựa chọn thư viện và framework khác nhau để phân tích và thống kê dữ liệu, trực quan hóa dữ liệu bằng biểu đồ, xây dựng các thuật toán học máy, xử lý ngôn ngữ tự nhiên từ đơn giản đến phức tạp Các thư viện Python được sử dụng để xây dựng mô hình dự báo phụ tải ngắn hạn cho khu vực thành phố Hồ Chí Minh gồm:

- Thư viện Numpy (Numerical Python) giúp xử lý các dữ liệu số Đây là thư viện chứa các cấu trúc dữ liệu ma trận (matrix data) và mảng đa chiều (multidimensional array) có thể thực hiện nhiều phép toán khác nhau

- Thư viện Pandas (Python Data Analysis) giúp xử lý và lưu trữ dữ liệu ở định dạng bảng bao gồm các hàng và cột để dễ dàng phân tích dữ liệu hơn như tìm giá trị trung bình, giá trị lớn nhất, giá trị nhỏ nhất trên mỗi cột trong tập dữ liệu

- Các thư viện học sâu (Deeplearning) gồm TensorFlow, Theano và Keras để tính toán số, xây dựng và huấn luyện các mô hình mạng nơ-ron với tốc độ xử lý nhanh

- Thư viện Matplotlib giúp xử lý và trực quang hóa dữ liệu dưới dạng các biểu đồ

Dữ lệu đầu vào

Trong phạm vi luận văn này, tác giả lựa chọn khu vực Thành phố Hồ Chí Minh để tiến hành xây dựng mô hình dự báo điện năng ngắn hạn với dữ liệu là sản lượng điện nhận đầu nguồn của EVNHCMC Tập dữ liệu được thu thập từ hệ thống đo xa và được đối soát, xử lý sai lệch để phục vụ tính toán và thanh toán tiền điện hằng tháng giữa EVNHCMC với Tập đoàn Điện lực Việt Nam, từ ngày 01/01/2018 cho đến 31/03/2024

Phân tích dữ liệu theo định dạng ngày thường (thứ 2, thứ 3, thứ 4, thứ 5 và thứ 6); ngày thứ 7 và ngày Chủ nhật nhằm phù hợp với các đồ thị phụ tải đặc trưng được xây dựng Đồ thị sản lượng điện nhận đầu nguồn điển hình của ngày làm việc trong tuần và ngày cuối tuần được mô tả trong hình 4.1 Qua đây cho ta thấy nhu cầu sử dụng điện của người dùng tại hai thời điểm trong tuần là hoàn toàn khác nhau và cần được xem xét riêng biệt

Hình 4 1 Đồ thị điển hình điện nhận ngày làm việc trong tuần và nghỉ cuối tuần

Nhu cầu sử dụng điện tại khu vực thành phố Hồ Chí Minh có xu hướng tăng và giảm theo chuỗi thời gian trong ngày Cụ thể thời gian sử dụng điện thấp nhất trong ngày là khoảng thời gian từ 22 giờ 00 phút đến 04 giờ 00 ngày hôm sau, sau đó tăng dần để đáp ứng nhu cầu sử dụng điện cho hoạt động sản xuất kinh doanh cũng

28 như các khối hành chánh sự nghiệp, các khối văn phòng làm việc Đến 12 giờ 00 trưa, nhu cầu sử dụng điện sẽ giảm dần do dừng các hoạt động sản xuất, dừng làm việc để nghỉ trưa và sẽ bắt đầu tăng cao trở lại trong khoảng thời gian từ 13 giờ 00 đến 16 giờ

30 và đây cũng là thời điểm có nhiệt độ cao nhất trong ngày Sau đó nhu cầu tiêu thụ điện sẽ giảm dần nhẹ và bắt đầu tăng trở lại để phục vụ cho thắp sáng, sinh hoạt và giảm dần cho đến ngày hôm sau Nhu cầu tiêu thụ điện sẽ được lặp lại theo chu kỳ cho những ngày tiếp theo

Theo phạm vi luận văn được trình bày ở mục 1.3, dữ liệu năm 2021 sẽ không được sử dụng để dự báo do bộ dữ liệu tại thời điểm COVID có nhiều đặc trưng riêng biệt và cần xem xét đến các yếu tố đột biến.

Các bước xây dựng mô hình dự báo

Các nghiên cứu và thực nghiệm đã chứng minh việc tiếp cận các bài toán dự báo điện năng ngắn hạn bằng cách sử dụng mạng nơ-ron nhân tạo sẽ đảm bảo độ chính xác cao hơn Tuy nhiên, để đạt được mục tiêu trên, cần phải nghiên cứu và huấn luyện để lựa chọn cấu trúc mạng nơ-ron tối ưu với các thông số như số lớp ẩn, số nơ- ron lớp ẩn, thuật toán, …

4.3.1 Thu thập và xử lý số liệu Đối với bài toàn dự báo điện năng ngắn hạn tại khu vực thành phố Hồ Chí Minh dữ liệu đầu vào là lượng điện nhận đầu nguồn của EVNHCMC theo chu kỳ 30 phút, từ gày 01/01/2018 đến ngày 31/03/2024

Các dữ liệu đầu vào sau khi được thu thập sẽ được sắp xếp lại trong file Excel để chuẩn bị cho quá trình xử lý trên chương trình Python Cấu trúc dữ liệu được thiết kế để chạy chương trình được thể hiện trong Hình 4.2

Hình 4 2 Cấu trúc dữ liệu đưa vào chương trình

Quá trình kiểm tra và xử lý sơ bộ được thực hiện trên chương trình Python để loại bỏ các dữ liệu lỗi (dữ liệu không phải kiểu dữ liệu số NaN-Not a number), xử lý các điểm outliers bằng phương pháp khoảng tứ phân vị IQR và bổ sung các dữ liệu bị nhiễu hoặc thiếu (nếu có)

Phương pháp khoảng tứ phân vị thường được sử dụng để phát hiện các điểm ngoại lệ trong dữ liệu, được định nghĩa là các giá trị quan sát nằm dưới (Q1 − 1.5 IQR) hoặc nằm trên (Q3 + 1.5 IQR) Trong đó, Q1 và Q3 lần lượt là tứ phân vị thứ 25% và 75% của bộ dữ liệu và IQR = Q3 − Q1 [37] Biểu đồ hộp trực quan dữ liệu sau khi xử lý được thể hiện trong Hình 4.3

Hình 4 3 Trực quan dữ liệu trước và sau khi được xử lý

Do tập dữ liệu đã được đối soát, xử lý sai lệch để phục vụ tính toán và thanh toán tiền điện hằng tháng giữa EVNHCMC và Tập đoàn Điện lực Việt Nam nên khi xử lý bằng chương trình Python hầu như không xuất hiện các điểm dữ liệu bất thường

4.3.2 Phân chia tập dữ liệu Để xây dựng mô hình mạng nơ-ron nhân tạo, cần phải phân chia dữ liệu thành các tập huấn luyện, tập kiểm chứng và tập kiểm tra thực tế

Tập huấn luyện là một tập dữ liệu có kích thước lớn, được sử dụng để huấn luyện mô hình Các thuật toán học máy sẽ học các mô hình từ tập huấn luyện này Việc học sẽ khác nhau tùy thuộc vào thuật toán và mô hình sử dụng Các điểm trong tập huấn luyện được sử dụng để tìm ra hàm số hay đường phù hợp nhất mô tả quan hệ giữa đầu vào và đầu ra của tập dữ liệu huấn luyện bằng cách sử dụng một số phương pháp tối ưu hóa Trong thực tế, tập dữ liệu huấn luyện thường bao gồm các cặp vectơ đầu vào và vectơ đầu ra tương ứng, trong đó vectơ đầu ra thường được gọi là nhãn

Mục tiêu của dự báo là tạo ra những mô hình có khả năng tổng quát hóa để dự đoán tốt trên cả dữ liệu nằm ngoài tập huấn luyện Do đó, để biết một thuật toán hay mô hình có tốt hay không thì sau khi được huấn luyện, mô hình cần được đánh giá hiệu quả thông qua tập dữ liệu kiểm tra Tập dữ liệu kiểm tra được sử dụng để tính độ chính xác hoặc sai số dự báo thực tế của mô hình đã được huấn luyện để xem xét liệu mô hình có dự đoán đúng hay không?

Trong khuôn khổ luận văn, dựa trên các đặc điểm của bộ dữ liệu, tác giả đã chia bộ dữ liệu thành 05 bộ dữ liệu con, mỗi bộ dữ liệu con sẽ được phân chia thành

03 tập dữ liệu với mục đích khác nhau cụ thể gồm tập huấn luyện, tập kiểm chứng và tập kiểm tra để tiến hành dự báo và so sánh kết quả giữa các mô hình mạng nơ-ron, Hình 4.4 biểu diễn việc phân chia dữ liệu cho việc dự báo sản lượng điện nhận đầu nguồn của Tổng Công ty Điện lực Thành phố Hồ Chí Minh

Hình 4 4 Phân chia dữ liệu để chuẩn bị cho việc huấn luyện xây dựng mô hình 4.3.2.1 Toàn bộ dữ liệu (đã loại trừ dữ liệu năm 2021)

- Tập huấn luyện mô hình dùng 80% dữ liệu trong toàn bộ dữ liệu từ ngày 01/01/2018 đến ngày 31/03/2024 (đã loại trừ dữ liệu năm 2021)

- Tập kiểm chứng mô hình dùng 10% dữ liệu trong tập huấn luyện mô hình

- Tập kiểm tra thực tế dùng 20% dữ liệu còn lại trong toàn bộ dữ liệu từ ngày 01/01/2018 đến ngày 31/03/2024 (đã loại trừ dữ liệu năm 2021)

4.3.2.2 Bộ dữ liệu một năm gần nhất (từ tháng 03/2023 đến tháng 03/2024)

- Tập huấn luyện mô hình dùng 80% dữ liệu trong bộ dữ liệu một năm gần nhất từ tháng 03/2023 đến tháng 03/2024

- Tập kiểm tra thực tế dùng 20% dữ liệu còn lại trong bộ dữ liệu một năm gần nhất từ ngày từ tháng 03/2023 đến tháng 03/2024

4.3.2.3 Bộ dữ liệu một tháng gần nhất (tháng 03/2024)

- Tập huấn luyện mô hình dùng 80% dữ liệu trong bộ dữ liệu một tháng gần nhất, tháng 03/2024

- Tập kiểm tra thực tế dùng 20% dữ liệu còn lại trong bộ dữ liệu một tháng gần nhất, tháng 03/2024

4.3.2.4 Bộ dữ liệu các ngày trong tuần (từ thứ 2 đến thứ 6)

- Tập huấn luyện mô hình dùng 80% dữ liệu trong bộ dữ liệu các ngày trong tuần từ thứ 2 đến thứ 6

- Tập kiểm tra thực tế dùng 20% dữ liệu còn lại trong trong bộ dữ liệu các ngày trong tuần từ thứ 2 đến thứ 6

4.3.2.5 Bộ dữ liệu các ngày cuối tuần (thứ bảy và chủ nhật)

- Tập huấn luyện mô hình dùng 80% dữ liệu trong bộ dữ liệu các ngày cuối tuần thứ 7 và chủ nhật

- Tập kiểm tra thực tế dùng 20% dữ liệu còn lại trong trong bộ dữ liệu các ngày cuối tuần thứ 7 và chủ nhật

4.3.3 Xây dựng cấu trúc mạng

Trong khuôn khổ luận văn, tác giả sẽ xây dựng các mô hình mạng nơ-ron qua các thông số cơ bản được thiết lập ban đầu để chạy chương trình Python gồm các thông số như bảng sau:

Bảng 4 1 Các thông số thiết lập ban đầu để xây dựng mô hình bằng Python

STT Thông số/ Ý nghĩa Giá trị

1 Solver name/ Chọn thuật toán để huấn luyện Adam

2 Activation functions/ Hàm kích hoạt ReLu

3 Hidden layers/ Số lớp ẩn 01

4 Maximum epochs/ Số vòng lặp để huấn luyện tối đa 50

5 MiniBatchSize/ Kích thước các miniBatch 32

6 Look_batch/ Bước thời gian 07

7 OutputSize of fully layer/ Kích thước đầu ra của lớp fullyConnected 01

4.3.4 Huấn luyện mạng nơ-ron

Mục tiêu của việc huấn luyện mạng là tìm ra bộ trọng số sao cho đạt được giá trị nhỏ nhất toàn cục của hàm mất mát Một câu hỏi đặt ra là khi nào ngừng việc huấn luyện

Trong phạm vi của luận văn, quá trình huấn luyện mạng sẽ dừng lại khi thỏa một trong hai điều kiện đạt đến số vòng lặp tối đa (epochs) hoặc đạt được yêu cầu về sai số theo kỳ vọng

4.3.5 Đánh giá sai số dự báo

Sai số dự báo là sự chênh lệch giữa giá trị thực tế và giá trị dự báo, được sử dụng để đánh giá chất lượng, đo độ chính xác của mô hình dự báo tại cùng một thời điểm [5] Mô hình mạng nơ-ron sau khi được huấn luyện, tiến hành thực hiện dự báo sản lượng điện nhận đầu nguồn theo yêu cầu cụ thể và được đánh giá sai số dự báo

Xây dựng mô hình dự báo điện năng ngắn hạn cho khu vực thành phố Hồ Chí Minh bằng Python

Mô hình mạng nơ-ron nhân tạo dự báo nhu cầu điện năng ngắn hạn cho khu vực thành phố Hồ Chí Minh được xây dựng bằng ngôn ngữ lập trình Python với các bước thực hiện được thể hiện trên Hình 5.1

Hình 4 5 Lưu đồ giải thuật mô hình dự báo điện năng bằng Python

Các mô hình mạng nơ-ron LSTM, MLP và GRU đề cập trong luận văn được huấn luyện độc lập với bộ dữ liệu hiện có Mỗi mô hình đơn lẻ được điều chỉnh và tối ưu để tận dụng ưu điểm của nó trong việc dự báo chuỗi thời gian Sau đó, các kết quả dự đoán từ 02 mô hình đơn lẻ MLP và LSTM được kết hợp lại để tạo thành một mô hình kết hợp Quá trình kết hợp dựa trên phương pháp tối ưu hóa thông qua tìm kiếm giá trị Alpha được xác định dựa trên tập dữ liệu kiểm chứng mô hình

Kết quả đánh giá mô hình được đo bằng các chỉ số như RMSE và MAPE trên các tập dữ liệu huấn luyện, kiểm chứng và kiểm tra

Hình 4 6 Sơ đồ khối mô hình MLP

Sơ đồ khối của mô hình GRU được thể hiện trong hình 5.2

Với một cấu trúc đơn giản, giảm thiểu được độ phức tạp của mô hình và số lượng tham số cần huấn luyện nên GRU thường cần ít thời gian và dữ liệu hơn để học các quy tắc và mô hình hóa mối quan hệ trong dữ liệu Mô hình GRU có khả năng kiểm soát quá trình huấn luyện tốt hơn trong việc xử lý độ dài chuỗi dữ liệu GRU sử dụng cơ chế cổng thông minh để điều chỉnh thông tin được truyền từ quá khứ sang tương lai, giúp ngăn chặn hiện tượng mất mát thông tin trong quá trình huấn luyện

Sơ đồ khối của mô hình GRU được thể hiện trong hình 5.3

Hình 4 7 Sơ đồ khối mô hình GRU

Sơ đồ khối của mô hình LSTM được thể hiện trong hình 5.4

Hình 4 8 Sơ đồ khối mô hình LSTM Bảng 4 2 Các thông số được chọn để xây dựng mô hình mạng nơ-ron bằng Python

- Lớp đầu vào (Input Layer): Lớp đầu vào được xác định bằng input_shape=(look_back_gru, 1)

- look_back_gru là số lượng các bước thời gian trước đó mà mô hình sẽ sử dụng để dự đoán giá trị tiếp theo Ở đây, chúng ta có một chiều (1) cho dữ liệu đầu vào

- Lớp ẩn (Hidden Layer): Lớp ẩn được xác định bằng GRU (50, activation='relu') Đây là lớp GRU với 50 đơn vị (units)

- Activation function được sử dụng là ReLU (Rectified Linear Activation)

- Lớp đầu ra (Output Layer): Lớp đầu ra được xác định bằng Dense(1) Đây là lớp Dense với một nơ-ron đầu ra

- Compile Model: Mô hình được biên dịch bằng model_gru.compile(optimizer='adam', loss='mean_squared_error')

- Adam là một thuật toán tối ưu hóa

- Hàm mất mát được sử dụng là mean squared error (MSE), hay còn gọi là loss function

- Lớp đầu vào (Input Layer): Lớp đầu vào được xác định bằng input_shape=(look_back_lstm, 1)

- look_back_lstm là số lượng các bước thời gian trước đó mà mô hình sẽ sử dụng để dự đoán giá trị tiếp theo Ở đây, chúng ta có một chiều (1) cho dữ liệu đầu vào

- Lớp ẩn (Hidden Layer): Lớp ẩn được xác định bằng LSTM(50, activation='relu') Đây là lớp LSTM với 50 đơn vị (units)

- Lớp đầu ra (Output Layer): Lớp đầu ra được xác định bằng Dense(1) Đây là lớp Dense với một nơ-ron đầu ra

- Compile Model: Mô hình được biên dịch bằng model_lstm.compile(optimizer='adam', loss='mean_squared_error')

- Lớp đầu vào (Input Layer): Lớp đầu vào được xác định bằng input_dim=look_back_mlp

- look_back_mlp là số lượng các đặc trưng hoặc biến đầu vào mà mô hình sẽ sử dụng để dự đoán giá trị đầu ra

- Trong trường hợp này, không có activation function được áp dụng cho lớp đầu vào vì nó không có ý nghĩa trong mô hình MLP

- Lớp ẩn (Hidden Layer): Lớp ẩn được xác định bằng Dense(50, activation='relu') Đây là một lớp Dense với 50 nơ-ron

- Lớp đầu ra (Output Layer): Lớp đầu ra được xác định bằng Dense(1) Đây là một lớp Dense với một nơ-ron đầu ra

- Không có activation function cụ thể được chỉ định, do đó mặc định là linear activation

- Compile Model: Mô hình được biên dịch bằng model_mlp.compile(optimizer='adam', loss='mean_squared_error')

Chương 4 đã trình bày chi tiết các bước quan trọng trong quá trình nghiên cứu và xây dựng mô hình dự báo điện năng ngắn hạn cho khu vực thành phố Hồ Chí Minh bao gồm: tiền xử lý dữ liệu, phân chia tập dữ liệu, xây dựng cấu trúc mạng nơ-ron, quá trình huấn luyện và đánh giá mô hình Luận văn sử dụng các mô hình mạng nơ- ron được xây dựng và mô hình mạng nơ-ron kết hợp MLP-LSTM để thực hiện dự báo và kết quả dự báo được trình bày chi tiết trong chương 5

CHƯƠNG 5 KẾT QUẢ DỰ BÁO ĐIỆN NĂNG NGẮN HẠN CHO KHU VỰC THÀNH PHỐ HỒ CHÍ MINH

Kết quả dự báo điện năng ngắn hạn cho khu vực thành phố Hồ Chí Minh

Kết quả tính toán của các mô hình mạng nơ-ron với bộ dữ liệu đầu vào được xem xét là toàn bộ dữ liệu từ ngày 01/01/2018 đến ngày 31/03/2024 (đã loại trừ dữ liệu năm 2021)sau khi kết thúc chương trình huấn luyện, kết quả giá trị Alpha tốt nhất của mô hình kết hợp tìm được trên tập kiểm chứng là 0,76

Hình 5.1 và Hình 5.2 thể hiện kết quả kiểm tra sai số dự báo trên tập kiểm tra Nhìn vào đồ thị có thể thấy, tất cả các mô hình dự báo đều đáp ứng sai số kỳ vọng và mục tiêu xây dựng mô hình là ± 1,5% Với cùng dữ liệu là toàn bộ dữ liệu từ ngày 01/01/2018 đến ngày 31/03/2024 (đã loại trừ dữ liệu năm 2021) và cùng các thông số đưa vào chương trình, mô hình kết hợp MLP-LSTM cho kết quả sai số tối ưu hơn so với mô hình LSTM, GRU và MLP, kết quả cụ thể được thể hiện trong Bảng 5.1

Hình 5 1 Kết quả sai số MAPE của các mô hình với toàn bộ dữ liệu

Hình 5 2 Kết quả sai số RMSE của các mô hình với toàn bộ dữ liệu

Bảng 5 1 So sánh sai số RMSE/MAPE giữa các mô hình

Mô hình RMSE (kWh) MAPE (%)

Qua quan sát 100 mẫu trong tập toàn bộ dữ liệu, cho thấy mô hình kết hợp MLP-LSTM cho kết quả dự báo khá bám sát giá trị thực tế, Hình 5.3

Hình 5 3 So sánh giá trị dự báo và giá trị thực tế của mô hình kết hợp MLP-LSTM

5.1.2 Trường hợp bộ dữ liệu năm gần nhất

Kết quả tính toán của các mô hình với cùng các thông số đưa vào chương trình và bộ dữ liệu đầu vào là một năm gần nhất (từ tháng 03/2023 đến tháng 03/2024) để kiểm tra độ chính xác của các mô hình dự báo, sau khi kết thúc chương trình huấn luyện, giá trị Alpha của mô hình kết hợp tìm được trên tập kiểm chứng là 0,51

Hình 5 4 Kết quả sai số MAPE của các mô hình với bộ dữ liệu một năm gần nhất

Nhìn vào đồ thị có thể thấy, tất cả các mô hình dự báo đều đáp ứng sai số kỳ vọng và mục tiêu xây dựng mô hình là ± 1,5%

Hình 5 5 Kết quả sai số RMSE của các mô hình với bộ dữ liệu một năm gần nhất

Qua kết quả chạy chương trình cho các mô hình dự báo khác nhau cho kết quả giá trị MAPE của mô hình kết hợp MLP-LSTM rất thấp cho thấy mô hình có khả năng dự đoán chính xác với tỷ lệ sai số nhỏ so với giá trị thực tế

Hình 5 6 So sánh giá trị dự báo và giá trị thực tế của mô hình kết hợp MLP-LSTM

5.1.3 Trường hợp bộ dữ liệu ngày trong tuần

Chạy các mô hình mạng nơ-ron với bộ dữ liệu đầu vào là ngày trong tuần (từ ngày thứ 2 đến thứ 6) để tiếp tục kiểm chứng kết quả dự báo Đối với bộ dự liệu các ngày trong tuần là các ngày bình thường từ thứ 2 đến thứ 6, sau khi kết thúc chương trình huấn luyện, kết quả giá trị Alpha của mô hình kết hợp tìm được trên tập kiểm chứng là 0,89

Hình 5 7 Kết quả sai số MAPE của các mô hình với bộ dữ liệu ngày trong tuần

Nhìn vào đồ thị có thể thấy, tất cả các mô hình dự báo đều đáp ứng sai số kỳ vọng và mục tiêu xây dựng mô hình là ± 1,5%

Hình 5 8 Kết quả sai số RMSE của các mô hình với bộ dữ liệu ngày trong tuần

Qua kết quả chạy bộ dữ liệu các ngày trong tuần từ thứ 2 đến thứ 6 cho các mô hình dự báo khác nhau trong Bảng 5.3, có thể thấy sai số phần trăm tuyệt đối trung bình và sai số trung bình bình phương của mô hình kết hợp MLP-LSTM là thấp

45 nhất, nằm trong giới hạn cho phép Như vậy, một lần nữa khẳng định tính vượt trội của mô hình kết hợp MLP-LSTM trong công tác dự báo ngắn hạn

Hình 5 9 So sánh giá trị dự báo và giá trị thực tế của mô hình kết hợp MLP-LSTM với bộ dữ liệu ngày trong tuần

Qua quan sát 100 mẫu trong tập toàn bộ dữ liệu, một lần nữa chứng minh mô hình kết hợp MLP-LSTM cho kết quả dự báo vẫn bám rất sát giá trị thực tế

5.1.4 Trường hợp bộ dữ liệu cuối tuần Để tiếp tục kiểm tra kết quả dự báo của các mô hình, tác giả chạy chương trình với bộ dự liệu là ngày cuối tuần (thứ 7 và chủ nhật), sau khi kết thúc chương trình huấn luyện, kết quả giá trị Alpha của mô hình kết hợp tốt nhất tìm được trên tập kiểm chứng là 0,71

Hình 5 10 Kết quả sai số MAPE của các mô hình với bộ dữ liệu cuối tuần

Nhìn vào đồ thị có thể thấy, tất cả các mô hình LSTM, GRU, MLP-GRU đều đáp ứng sai số kỳ vọng và mục tiêu xây dựng mô hình là ± 1,5%, tuy nhiên mô hình MLP lại có sai số vượt ngưỡng (1.6%)

Hình 5 11 Kết quả sai số RMSE của các mô hình với bộ dữ liệu cuối tuần

Kết quả chạy chương trình với bộ dữ liệu ngày cuối tuần cũng cho thấy sai số của mô hình kết hợp MLP-LSTM vẫn thấp nhất trong các mô hình

Hình 5 12 So sánh giá trị dự báo và giá trị thực tế của mô hình kết hợp MLP-LSTM với bộ dữ liệu cuối tuần

5.1.5 Trường hợp bộ dữ liệu tháng gần nhất

Tác giả tiếp tục chạy thêm các mô hình mạng nơ-ron với bộ dữ liệu đầu vào là một tháng gần nhất (tháng 03/2024 ) để kiểm tra độ chính xác của mô hình kết hợp MLP-LSTM, sau khi kết thúc chương trình huấn luyện, kết quả giá trị Alpha của mô hình kết hợp tìm được trên tập kiểm chứng là 0,42

Hình 5 13 Kết quả sai số MAPE của các mô hình với bộ dữ liệut tháng gần nhất

Nhìn vào đồ thị có thể thấy, tất cả các mô hình LSTM, MLP, MLP-GRU đều vượt sai số kỳ vọng và mục tiêu xây dựng mô hình là ± 1,5%, tuy nhiên mô hình GRU lại có sai số đạt kỳ vọng (1.6%)

Hình 5 14 Kết quả sai số RMSE của các mô hình với bộ dữ liệu tháng gần nhất

Trong trường hợp này, qua quan sát kết quả cho thấy mô hình kết hợp MLP-LSTM không còn phù hợp, ngược lại mô hình GRU lại đạt hiệu suất cao hơn với sai số phần trăm tuyệt đối trung bình và sai số trung bình bình phương là thấp nhất, Bảng 5.6

Hình 5 15 So sánh giá trị dự báo và giá trị thực tế của mô hình GRU với bộ dữ liệu tháng gần nhất

Qua quan sát 100 mẫu trong tập dữ liệu tháng gần nhất, cho thấy mô hình GRU cho kết quả dự báo khá bám sát với giá trị thực tế.

Nhận xét

Qua kết quả chạy các bộ dữ liệu để so sánh các mô hình dự báo khác nhau (Bảng 5.7), chúng ta thấy tương ứng với từng bộ dữ liệu (theo các thời điểm khác nhau) thì sai số phần trăm tuyệt đối trung bình thấp nhất của kết quả dự báo với 04/05

50 bộ dữ liệu gồm toàn bộ dữ liệu, một năm gần nhất, ngày trong tuần và ngày cuối tuần đều rơi vào mô hình kết hợp MLP-LSTM Như vậy, có thể khẳng định tính vượt trội của mô hình kết hợp trong công tác dự báo điện năng ngắn hạn cho khu vực thành phố Hồ Chí Minh, góp phần cải thiện chất lượng dự báo, hỗ trợ đắc lực cho vào hoạt động sản xuất – kinh doanh của EVNHCMC

Bảng 5 6 Tổng hợp kết quả các mô hình dự báo trong các trường hợp khảo sát

Bộ dữ liệu Mô hình RMSE (kWh) MAPE (%)

Tuy nhiên, đối với bộ dữ liệu một tháng gần nhất giá trị sai số phần trăm tuyệt đối trung bình của mô hình kết hợp MLP-LSTM lại cao hơn mô hình MLP và mô hình GRU Do đó mô hình kết hợp không phù hợp với bài toán dự báo với số lượng mẫu đầu vào quá ít

So với các phương pháp dự đoán truyền thống cũng như dự báo với các mô hình mạng nơ-ron đơn lẻ thì mô hình kết hợp MLP-LSTM đã cho kết quả vượt trội hơn về độ chính xác và khả năng dự đoán Sự kết hợp của các mô hình MLP-LSTM đã giúp cải thiện hiệu suất và giảm thiểu các sai số Điều này cho thấy mô hình kết hợp đã học và tổng hợp tốt từ các mô hình MLP và LSTM để dự báo chính xác cho bài toán dự báo điện năng ngắn hạn

Sau nhiều lần thay đổi bộ dữ liệu đầu vào và lặp đi lặp lại các khảo sát tác giả đã thu được kết quả tính toán có độ tin cậy cao Dựa trên kết quả tính toán, tác giả đã chứng minh mô hình kết hợp MLP-LSTM đạt được hiệu suất tốt trong việc dự báo điện năng ngắn hạn cho khu vực thành phố Hồ Chí Minh Các giá trị đánh giá trên tập huấn luyện, tập xác nhận và tập kiểm tra lần lượt biểu diễn kết quả tốt Điều này cho thấy mô hình có khả năng dự báo chính xác giá trị sản lượng trên các tập dữ liệu khác nhau và có mức độ tương quan cao giữa giá trị dự báo và giá trị thực tế

Tóm lại, mô hình kết hợp MLP-LSTM cho kết quả dự báo đạt được hiệu suất tốt và có khả năng dự báo chính xác giá trị điện năng Tuy nhiên, cần tiếp tục nghiên cứu và kiểm tra để đảm bảo tính ổn định và độ chính xác của mô hình trên các tình huống và các dữ liệu khác nhau

Tiêu đề	Ứng dụng mô hình mạng neuron nhân tạo dự báo nhu cầu điện năng ngắn hạn cho khu vực Thành phố Hồ Chí Minh
Tác giả	Nguyễn Ngọc Lan Anh
Người hướng dẫn	TS. Huỳnh Quang Minh, TS. Trường Hoàng Khoa, TS. Nguyễn Hữu Vinh
Trường học	Đại học Quốc gia TP. HCM, Trường Đại học Bách Khoa
Chuyên ngành	Quản lý năng lượng
Thể loại	Luận văn thạc sĩ
Năm xuất bản	2024
Thành phố	TP. Hồ Chí Minh

Định dạng
Số trang	92
Dung lượng	1,04 MB