Số liệu huấn luyện cho hai năm 2004 và 2005

Một phần của tài liệu ứng dụng mạng nơ ron nhân tạo trong dự báo ngắn hạn phụ tải điện khu vực tỉnh sóc trăng (Trang 89)

Ngày d Pmax d Pmax d-1 Pmax d-2 … Pmax d-7 Pmin d-1 Pmax d-2 … Pmax d-7 Tmin d Tmax d 8/1/04 43,25 43,5 43,4 … 40,7 20,1 21,6 … 19,5 22,7 30,6 9/1/04 43 43,25 43,5 … 41,6 20,3 20,1 … 18,7 23,8 30,7 10/1/04 43,1 43 43,25 … 40,9 20,5 20,3 … 20,5 24,0 30,7 … … … … … … … … … … … … 23/12/05 42 41,5 43,3 … 43,6 19,8 21,1 … 21,5 20,0 27,7

Trong đó Pmaxd-1đến Tmin là tập huấn luyện và Pmaxd là tập kiểm tra cho thuật toán lan truyền ngược sai số. Trong mạng này ta chỉ hiệu chỉnh mạng bằng cách thay

đổi số phần tử lớp Nn và số lần tính lặp các thông số khác không thay đổi.

Tp kim tra

Mỗi mô hình mạng sau khi huấn luyện sẽđược kiểm tra trên một tập số liệu khác năm 2006 (hoàn toàn độc lập) để kiểm tra xem khả năng hoạt động của mạng. Một mạng được đánh giá là tốt khi được huấn luyện trên một tập số liệu và được kiểm tra trên một tập số liệu khác. Bảng 6.2 Số liệu dùng để kiểm tra năm 2006 Ngày d Pmax d Pmax d-1 Pmax d-2 … Pmax d-7 Pmin d-1 Pmax d-2 … Pmax d-7 Tmin d Tmax d 8/1/2006 42,8 43,2 44,6 … 42,7 22,7 23,4 … 23,6 22,7 29,2 9/1/2006 42,8 42,8 43,2 … 43,8 20,9 22,7 … 21,4 21,9 29,2 10/1/2004 43 42,8 42,8 … 44,9 21,3 20,9 … 22,9 22,0 29,3 … … … … … … … … … … … … 23/12/06 44,9 48 46,25 … 47,4 23 23,5 … 24,6 20,2 29,5

Để dự báo phụ tải cho một ngày ta cần số liệu của một số ngày trước đó ví dụ: để

7/1/2006) đến Tmin (số liệu dự báo) tổng cộng 16 đầu vào. Bộ số liệu này sẽ ánh xạ

qua mạng và cho một kết quả dự báo Pmax ngày 8/1/2006. Số liệu dự báo này sẽđược so sánh với Pmax thực tế. Sai số này sẽ cho ta biết được chất lượng của mạng mà ta đã huấn luyện.

Công tác tìm mạng được thực hiện qua hai bước:

Mục tiêu của ta là có thể xây dựng một mạng có khả năng dự báo cho năm 2006 với sai số thấp nhất có thể được. Ta tiến hành luyện mạng với số phần tử lớp Nn khác nhau trên tập mẫu luyện và tập kiểm tra để tìm số nút Nn tối ưu. Công tác tìm kiếm

được thực hiện qua hai bước.

Giá trị sai số được tính theo phương pháp sai số phần trăm trung bình tuyệt đối Mean Absolute Percentage Error (MAPE).

∑ = − = N i Pthucte i i Pdubao i Pthucte N MAPE 1 ( ) ) ( ) ( 100 Bước 1: Cốđịnh số lần tính lặp là 200. Tiến hành huấn luyện các mạng có số nơ

ron lớp Nn thay đổi từ 8 đến 30 phần tử. Sau khi huấn luyện mỗi mạng ta tiến hành kiểm tra sai số trên tập kiểm tra. Kết quả cụ thể như trên hình 6.2. Trục hoành là số nơ

ron Nn của mạng, trục tung là sai số trung bình của các mạng có số nơ ron Nn tương ứng

đã thử nghiệm.

Đối với các nơ ron lớp Nn ít khoảng từ 10 đến 22 phần tử sai số trên tập kiểm tra là tương đối thấp hơn so với các nơ ron lớp Nn từ 23 đến 30. Điều này lý giải rằng, với quá nhiều nơ ron lớp Nn mạng sẽ dẫn đến tình trạng trở nên quá khớp với tập dữ liệu học mà khả năng tổng quát hoá lại thấp. Với 22 nơ ron lớp Nn mạng sẽ cho sai số trung bình trên tập kiểm tra là thấp nhất 3,79%.

Hình 6.2: Sai số phần trăm khi thay đổi số nơ ron lớp ẩn với số lần tính lặp 200

Bước 2: Khi đã có số phần tử lớp Nn được chọn là 22 phần tử ta tiến hành thay đổi số lần tính lặp để giảm sai số, nhận thấy rằng sai số có giảm nhưng giảm rất ít. Với số

lần tính lặp 50 sai số giảm xuống còn 3,77%.

Hình 6.3: Sai số phần trăm khi thay đổi số lần tính lặp với 22 phần tử cốđịnh

Giá trị sai số khi tối ưu hoá thay đổi số lần tính lặp, nhưng kết quả tối ưu sai số

giảm không đáng kể. Từ 3,79% giảm còn 3,77%.

Kết lun:Để dự báo cho Pmax, ta cần 22 phần tử cho lớp Nn và với 50 lần tính lặp sẽ

¾ Quá trình luyện mạng với 22 phần tử lớp ẩn 50 lần lặp

Hình 6.4: Quá trình huấn luyện mạng với 22 phần tử lớp ẩn 50 lần lặp

(b) Sau 50 vòng lặp

Hình 6.5: Sai số luyện mạng giảm sau mỗi chu kỳ tính lặp với thuật toán L - M

Sau một số chu kỳ luyện mạng, trả lời của mạng tốt hơn so với trạng thái ban đầu. Có thể thấy rằng, lỗi MSE được giảm sau một thời gian huấn luyện.

Qua thí nghiệm thấy rằng: Toàn bộ các khoảng vòng lặp hàm chất lượng mạng MSE giảm khá nhanh (Giảm nhanh khi độ lớn của vec tơ gradient lớn). Với thuật toán L-M điểm tìm kiếm không bị rơi vào vùng bằng phẳng của mặt lỗi, còn gọi là vùng hội tụ chậm.

Quá trình huấn luyện sẽ dừng lại khi số lần lặp được chọn là 50 lần. Sai số huấn luyện khi đó là 1,02.10-3. (adsbygoogle = window.adsbygoogle || []).push({});

Kết thúc quá trình huấn luyện ta thu được bộ trọng số mới gọi là bộ trọng số sau khi huấn luyện và dùng bộ trọng số này để dự báo. Bộ trọng số W sẽ là ma trận 22x16 và V sẽ là ma trận 22x1.

6.3.2 Xây dựng mạng dự báo đáy BĐPT

Tương tự như xây dựng MNR dự báo Pmax việc xây dựng MNR dựng báo Pmin

• Mạng MLP

• Giải pháp lan truyền ngược sai số

Thuật toán Levenberg - Marquart

• Số phần tửđầu vào 16 phần tử:

Pmax(d-1), Pmax(d-2), Pmax(d-3), Pmax(d-4), Pmax(d-5), Pmax(d- 6),Pmax(d-7), Pmin(d-1), Pmin(d-2), Pmin(d-3), Pmin(d-4), Pmin(d-5), Pmin(d-6),Pmin(d-7),Tmin(d),Tmax(d)

• Số phần tửđầu ra 1 phần tử:

Pmin(d)

• Số phần tử lớp Nn

Được xác định dựa trên phương pháp sai số trên tập kiểm tra là thấp nhất.

Cũng tương tự về cách thức huấn luyện mạng của Pmax, số nơ ron lớp Nn cho

Pmin cũng được tìm tương tự theo hai bước nhưđã thực hiện với Pmax.

Bước 1: Cố định số lần tính lặp là 200. Thay đổi số phần tử của lớp Nn từ 8 đến 28 phần tử. Kết quả tốt nhất là với 9 phần tử lớp Nn, ứng với sai số trung bình 3,34%.

Bước 2 (Tối ưu hoá sai số): Bước tiếp theo ta cốđịnh số phần tử lớp Nn, tiến hành thay đổi số lần tính lặp, kết quả với số lần tính lặp 15 cho sai số giảm xuống còn 3,29%.

Hình 6.7: Sai số phần trăm khi thay đổi số lần tính lặp với 9 phần tử cốđịnh

Giá trị sai số khi thay đổi khi tối ưu sai số từ3,34% giảm còn 3,29%.

Kết lun: Để dự báo cho Pmin, ta cần 9 phần tử cho lớp Nn và với 15 lần tính lặp sẽ cho sai số trên tập kiểm tra là bé nhất có thể.

Tương tự ta cũng xây dựng cho các mô hình còn lại (mô hình 1,2). Các mô hình sau khi được xây dựng sẽ tiến hành so sánh với nhau để lựa chọn mô hình tốt nhất.

6.4 Xây dựng mạng cho mô hình 1

Mô hình 1 bao gồm 14 thông số đầu vào bao gồm các phụ tải trong quá khứ ta cũng xây dựng hai mạng riêng biệt để dự báo đỉnh BĐPT và dự báo đáy BĐPT.

6.4.1 Các mô hình dự báo đỉnh BĐPT:

Các đầu vào cho mạng là: Pmax(d-1), Pmax(d-2), Pmax(d-3), Pmax(d-4), Pmax(d- 5), Pmax(d-6),Pmax(d-7), Pmin(d-1), Pmin(d-2), Pmin(d-3), Pmin(d-4), Pmin(d-5), Pmin(d-6), Pmin(d-7).

Cốđịnh số lần tính lặp là 200, ta thay đổi số nơ ron lớp Nn từ 8 đến 30 kết quả khi

Hình 6.8: Sai số phần trăm Pmax khi thay đổi số phần tử lớp ẩn với số lần tính lặp 200

Khi số lần tính lặp là 200, thay đổi số nơ ron lớp Nn từ 8 đến 30 ta sẽ có 23 mô hình nhỏ khác nhau tiến hành đánh giá sai số thì mô hình con với số nơ ron lớp Nn là 18 sẽ cho sai số là 3,75% thấp nhất.

6.4.2 Các mô hình dự báo đáy BĐPT:

Các đầu vào cho mạng là: Pmin(d-1), Pmin(d-2), Pmin(d-3), Pmin(d-4), Pmin(d-5), Pmin(d-6),Pmin(d-7), Pmax(d-1), Pmax(d-2), Pmax(d-3), Pmax(d-4), Pmax(d-5), Pmax(d-6),Pmax(d-7).

Cốđịnh số lần tính lặp là 200, ta thay đổi số nơ ron lớp Nn từ 8 đến 30 kết quả khi (adsbygoogle = window.adsbygoogle || []).push({});

Hình 6.9: Sai số phần trăm Pmin khi thay đổi số phần tử lớp ẩn với số lần tính lặp 200

Khi số lần tính lặp là 200, thay đổi số nơ ron lớp Nn từ 8 đến 30 ta sẽ có 23 mô hình nhỏ khác nhau tiến hành đánh giá sai số thì mô hình con với số nơ ron lớp Nn là 26 sẽ cho sai số là 3,96% thấp nhất.

6.5 Xây dựng mạng cho mô hình 2

Mô hình 2 bao gồm 15 thông sốđầu vào là các phụ tải trong quá khứ kết hợp với yếu tố thời tiết Tmin, ta cũng xây dựng hai mạng riêng biệt để dự báo đỉnh BĐPT và dự

báo đáy BĐPT.

6.5.1 Các mô hình dự báo đỉnh BĐPT

Các đầu vào cho mạng là: Pmax(d-1), Pmax(d-2), Pmax(d-3), Pmax(d-4), Pmax(d- 5), Pmax(d-6),Pmax(d-7), Pmin(d-1), Pmin(d-2), Pmin(d-3), Pmin(d-4), Pmin(d-5), Pmin(d-6),Pmin(d-7), Tmin.

Cũng với số lần tính lặp cốđịnh là 200, thay đổi số nơ ron lớp Nn từ 8 đến 30 ta sẽ

có 23 mô hình nhỏ khác nhau tiến hành đánh giá sai số thì mô hình con với số nơ ron lớp Nn là 22 sẽ cho sai số là 4,07% thấp nhất.

Hình 6.10: Sai số phần trăm Pmax khi thay đổi số phần tử lớp ẩn với số lần tính lặp 200

6.4.2 Các mô hình dự báo đáy BĐPT:

Các đầu vào cho mạng là: Pmin(d-1), Pmin(d-2), Pmin(d-3), Pmin(d-4), Pmin(d- 5), Pmin(d-6),Pmin(d-7), Pmax(d-1), Pmax(d-2), Pmax(d-3), Pmax(d-4), Pmax(d-5), Pmax(d-6),Pmax(d-7), Tmin.

Cốđịnh số lần tính lặp là 200, ta thay đổi số nơ ron lớp Nn từ 8 đến 30 kết quả khi

đánh giá sai số cho ở hình 6.11.

Khi số lần tính lặp là 200, thay đổi số nơ ron lớp Nn từ 8 đến 30 ta sẽ có 23 mô hình nhỏ khác nhau tiến hành đánh giá sai số thì mô hình con với số nơ ron lớp Nn là 9 sẽ cho sai số là 3,46% thấp nhất.

Tổng kết các mô hình trên:

Các mô hình 1,2,3 sau khi chọn được số nơ ron lớp Nn của mình sao cho sai số

trên tập kiểm tra là thấp nhất, bước tiếp theo sẽ so sánh và chọn mô hình có sai số thấp nhất.

Bảng 6.3 Tổng kết giá trị sai số của 3 mô hình chưa tối ưu hoá Mô hình 1: Không có yếu tố thời tiết Mô hình 2: Có yếu tố thời tiết Tmin Mô hình 3: Có yếu tố thời tiết TmaxTmin

Pmax Pmin Pmax Pmin Pmax Pmin 3,75% 3,96% 4,07% 3,46% 3,79% 3,34% Sai số Trung bình: 3,86% Sai số Trung bình: 3,77% Sai số Trung bình: 3,57%

Đồ thị trên biểu diễn 3 mô hình với sai số thấp nhất cho từng mô hình với số lần tính lặp không thay đổi là 200 lần.

Nhận xét:

Có thể nhận thấy rằng đối với mô hình 1: Sai số trung bình là cao nhất so với hai mô hình còn lại. Tuy nhiên mô hình này có sai sốPmax là thấp nhất trong các mô hình. Mặt khác mô hình này không sử dụng yếu tố thời tiết do đó sai số của mô hình không phụ thuộc vào sai số dự báo thời tiết.

Đối với mô hình 2: Sai số trung bình vẫn cao hơn so với mô hình 3, tuy nhiên mô hình này chỉ có 1 yếu tốđầu vào cần dự báo là nhiệt độ thấp nhất Tmin.

Đối với mô hình 3: Mô hình tốt nhất trong ba mô hình vì cho sai số trung bình

PmaxPmin thấp nhất, mô hình dự báo cho Pmin cũng có sai số thấp nhất trong cả

ba mô hình, tuy nhiên mô hình này đòi hỏi nhiều đầu vào nhất và yêu cầu phải có dự

báo nhiệt độ cao nhất và thấp nhất thật chính xác.

Qua phân tích trên luận văn sẽ chọn mô hình 3 sẽ là mô hình tốt nhất để làm mô hình dự báo PmaxPmin.

Kết lun: Để dự báo PmaxPmin ta sử dụng mô hình 3, ta cần 16 thông sốđầu vào cho cả hai mô hình, 22 nơ ron lớp Nn và 50 lần tính lặp cho mô hình dự báo Pmax sai số trung bình trên tập kiểm tra 3,77%; 9 nơ ron lớp Nn và 15 lần tính lặp cho mô hình dự báo Pmin sai số trung bình trên tập kiểm tra là 3,29%. Vậy sai số trung bình cả (adsbygoogle = window.adsbygoogle || []).push({});

PmaxPmin của mô hình 3 khi đã tối ưu là 3,53%.

6.6 Tiến hành dự báo Pmax Pmin và đánh giá sai số:

Đối với bài toán dự báo phụ tải PmaxPmin của hệ thống điện tỉnh Sóc Trăng, các giá trị Pmax nằm trong khoảng 37,5 – 55,9 MW ta sẽ chuNn hóa Pmax theo công thức 3.1 để giá trị Pmax nằm trong khoảng [0 1]. Tương tự ta cũng xét cho Pmin nằm trong khoảng 17,3 - 36,7 MW ta cũng chuNn hóa Pmin theo công thức 3.1 để Pmin

nằm trong khoảng [0 1] (các công đoạn này được xử lý tự động trong chương trình). Giá trị đầu ra của mạng sẽ được nhân với 55,9 để thu được giá trị thực dự báo cho

Pmax và nhân với 36,7 để thu được giá trị thực dự báo cho Pmin.

Sai số phần trăm của giá trị thật và giá trị dự báo được tính theo công thức sau: 100 . max max max % thucte P dubao P thucte P e − =

Ví dụ: Tháng cần dự báo giảđịnh là từ 1/7/2006 đến 31/7/2006, số liệu Pmax Pmin

thật sựđược xây dựng như sau:

Bảng 6.3 Kết quả dự báo Pmax và Pmin từ 1/7 đến 31/7

Ngày Pmax tht Pmax d báo Sai s % Pmin tht Pmin d báo Sai s %

1/7/2006 43,8 43,356 1,0137 26,1 25,555 2,0881 2/7/2006 39,9 43,966 10,1905 25 25,644 2,5760 3/7/2006 41,6 42,056 1,0962 24,1 23,529 2,3693 4/7/2006 43,2 40,152 7,0556 25 24,297 2,8120 5/7/2006 42,1 43,75 3,9192 26,8 25,138 6,2015 6/7/2006 43,6 43,42 0,4128 26,7 25,991 2,6554 7/7/2006 46 43,627 5,1587 26,6 26,665 0,2444 8/7/2006 43,8 44,885 2,4772 28,6 27,438 4,0629 9/7/2006 42,6 44,609 4,7160 25,5 27,765 8,8824 10/7/2006 45,3 43,198 4,6402 29,7 25,951 12,6229 11/7/2006 45,5 45,375 0,2747 28,6 28,84 0,8392 12/7/2006 45,7 45,562 0,3020 28,2 28,498 1,0567 13/7/2006 44,8 45,098 0,6652 28,1 27,896 0,7260 14/7/2006 44,8 45,261 1,0290 27,3 28,385 3,9744

15/7/2006 43,9 45,168 2,8884 27,2 27,358 0,5809 16/7/2006 44,9 44,306 1,3229 28,1 26,804 4,6121 17/7/2006 46,1 45,153 2,0542 26,8 27,257 1,7052 18/7/2006 47,5 45,464 4,2863 27,1 27,505 1,4945 19/7/2006 48,7 46,486 4,5462 27,9 27,964 0,2294 20/7/2006 48,3 47,427 1,8075 29,4 28,684 2,4354 21/7/2006 45,6 47,835 4,9013 28,3 29,131 2,9364 22/7/2006 43,8 46,184 5,4429 27,4 27,089 1,1350 23/7/2006 45,9 45,042 1,8693 27,8 26,157 5,9101 24/7/2006 45,6 46,031 0,9452 26,6 27,279 2,5526 25/7/2006 45,3 45,806 1,1170 27,9 27,081 2,9355 26/7/2006 48,7 46,029 5,4846 29 27,925 3,7069 27/7/2006 46,6 47,777 2,5258 29,4 29,713 1,0646 28/7/2006 45,9 46,949 2,2854 28,2 28,528 1,1631 29/7/2006 46,9 46,093 1,7207 28,6 28,567 0,1154 30/7/2006 47,1 46,679 0,8938 27,5 28,6 4,0000 31/7/2006 44,3 46,434 4,8172 26 27,699 6,5346

Hình 6.13 Biểu đồ phụ tải dự báo và thực tế của Pmax và Pmin từ 1/7 đến 31/7 năm 2006

Giá trị sai số khi tính toán cho một khoảng thời gian dài (1 tháng) cho kết qua dự

báo chấp nhận được. Tuy vẫn có một số ngày dự báo có sai số cao, nhưng số ngày gây sai số lớn không nhiều. Đối với tháng 7 dự báo Pmax sai số trung bình 2,96% và Pmin

Một phần của tài liệu ứng dụng mạng nơ ron nhân tạo trong dự báo ngắn hạn phụ tải điện khu vực tỉnh sóc trăng (Trang 89)