Một trong những mục tiêu nghiên cứu phụ tải và khoa học nói chung là tìm ra mối những mối tương quan giữa các yếu tố phụ thuộc lẫn nhau và qua đó có thể tiên lượng một yếu tố phụ thuộc từ các yếu tố độc lập. “Mối tương quan” ở đây bao gồm các đặc điểm như mức độ tương quan.
Chẳng hạn để tìm mối liên hệ giữa Công suất Pmax và công suất Pmin có
nghĩa là tìm mối tương quan giữa hai biến này ra sao và có thể sử dụng Pmax để tiên lượng Pmin cho một ngày hay không. Trong mối liên hệ này, chúng ta xác định
Pmin là biến phụ thuộc và Pmax là biến độc lập. Vậy nếu gọi x là biến Pmax và y là
biến Pmin, chúng ta tìm hiểu mối tương quan giữa x và y, hệ số tương quan càng
cao mối quan hệ giữa x và y càng lớn và ngược lại.
Gọi xi và yi là hai biến quan sát được. Giả sử ta có n đối tượng thì i=1,2,3…n. Gọi x và y là hai số trung bình của biến quan sát được; 2
x
s và 2
y
s lần lược là phương sai của hai biến, được định nghĩa như sau:
( ) ∑ = − − = n i i x x x n s 1 2 2 1 1 ( ) ∑ = − − = n i i y y y n s 1 2 2 1 1
Hiệp phương sai:
∑ = − − − = n i i i x y y x n y x 1 ) )( ( 1 1 ) , cov( Hệ số tương quan: y x s s y x y x y x r × = = cov( , ) ) var( ). var( ) , cov(
Công thức trên còn được biết đến như là hệ số Pearson (Pearson’s correlation coeffcient) để nghi nhận cống hiến của nhà thống kê học nổi tiếng Karl Pearson, người đầu tiên phát triển lý thuyết tương quan vào đầu thế kỷ 20.
Đối với x, y như trên hình (a) mối liên hệ của x và y hoàn toàn xác định và tuyến tính; có nghĩa là cho bất cứ giá trị nào của x chúng ta đều có thể xác định được giá trị của y thì ta sẽ có r=1.
Khi mối liên hệ giữa x và y hình (b) là đảo ngược tức x tăng thì y giảm khi đó giá trị của r là âm.
Và khi hai biến x và y là toàn toàn độc lập hay như trên hình (c) giá trị của y là hằng số và không phụ thuộc giá trị của x khi đó r=0
Mối liên hệ giữa x và y: (a) r=1, (b) r= -1, (c)=0 (độc lập).
Trong thực tế khoa học thực nghiệm, ít khi nào chúng ta có những mối liên hệ xác định như vừa trình bày. Các mối liên hệ giữa x và y thường dao động cao hơn - 1 và thấp hơn 1.
5.1.2 Tìm hệ số tương quan giữa công suất với công xuất trong quá khứ
Khi xây dựng bất kỳ mô hình nào thì việc mô hình hoạt động có tốt hay không phụ thuộc rất lớn vào mối quan hệ đầu vào và đầu ra, bên cạnh đó tùy thuộc vào từng bài toán mà ta phải lựa chọn các thông số đầu vào khác nhau. Trong đó hàm tương quan là một thước đo để lựa chọn thông số đầu vào cho mô hình.
Với số liệu phụ tải và nhiệt độ hai năm 2004 – 2005 các thông số đầu ra cần xác định là công suất cực đại và công suất cực tiểu, chúng ta sẽ xem xét mối tương quan công suất cực đại của một ngày với các ngày trước đó.
Đặt:
Pmax(d), Pmin(d): Là công suất phụ tải cao nhất, thấp nhất trong ngày d
Pmax(d-x), Pmin(d-x): Là công suất phụ tải cao nhất và thấp nhất cách ngày trước x
ngày (x=1, 2…7, 14, 21, 28)
Xét các mối tương quan giữa Pmaxd với 20 yếu tố ảnh hưởng khác:
1. Pmax(d), Pmax(d-1): Công suất cực đại ngày hiện tại với công suất cực đại
ngày hôm trước
2. Pmax(d), Pmax(d-2): Công suất cực đại ngày hiện tại với công suất cực đại
cách đó hai ngày 3. …
7. Pmax(d), Pmax(d-7): Công suất cực đại ngày hiện tại với công suất cực đại
cách đó bảy ngày(1 tuần)
8. Pmax(d), Pmax(d-14): Công suất cực đại ngày hiện tại với công suất cực đại
9. Pmax(d), Pmax(d-21): Công suất cực đại ngày hiện tại với công suất cực đại
cách đó 21 ngày (3 tuần)
10. Pmax(d), Pmax(d-28): Công suất cực đại ngày hiện tại với công suất cực đại
cách đó 28 ngày (4 tuần)
11. Pmax(d), Pmin(d-1): Công suất cực đại ngày hiện tại với công suất cực tiểu
Ngày hôm trước
12. Pmax(d), Pmin(d-2): Công suất cực đại ngày hiện tại với công suất cực tiểu
Ngày hôm trước 13. …..
17. Pmax(d), Pmax(d-7): Công suất cực đại ngày hiện tại với công suất cực đại
cách đó bảy ngày(1 tuần).
18. Pmax(d), Pmax(d-14): Công suất cực đại ngày hiện tại với công suất cực đại
cách đó 14 ngày (2 tuần)
19. Pmax(d), Pmax(d-21): Công suất cực đại ngày hiện tại với công suất cực đại
cách đó 21 ngày (3 tuần)
20. Pmax(d), Pmax(d-28): Công suất cực đại ngày hiện tại với công suất cực đại
cách đó 28 ngày (4 tuần)
5.1.3 Một số kết quả thu được sau khi phân tích tương quan
Hình 5.1: Đồ thị phụ thuộc của Pmax(d) vào Pmax(d-1) với hệ số tương quan r=0,81 Hình 5.2: Đồ thị phụ thuộc của Pmax(d) vào Pmax(d-7) với hệ số tương quan r=0,61
Tương tự với Pmin: Ta cũng xét ảnh hưởng của 20 yếu tố đến Pmin kết quả xét
tương quan được trình bày hình bên dưới.
Hình 5.3 Hình 5.4 Hình 5.3: Đồ thị phụ thuộc của Pmin(d) vào Pmin(d-1) với hệ số tương quan r=0,93
Hình 5.4: Đồ thị phụ thuộc của Pmin(d) vào Pmin(d-7) với hệ số tương quan r=0,81
Bảng 5.1 Kết quả phân tích tương quan giữa Pmax và 20 yếu tố
Ngày Pmaxd, Pmaxd-1 Pmaxd, Pmaxd-2 Pmaxd, Pmaxd-3 Pmaxd, Pmaxd-4
r 0,8058 0,7461 0,7023 0,6723
Ngày Pmaxd, Pmaxd-5 Pmaxd, Pmaxd-6 Pmaxd, Pmaxd-7 Pmaxd, Pmaxd-14 r 0,652 0,6166 0,6149 0,5164 Ngày Pmaxd, Pmaxd-21 Pmaxd,Pmaxd-28 Pmaxd, Pmind-1 Pmaxd, Pmind-2
r 0,5108 0,4243 0,7776 0,7337
Ngày Pmaxd, Pmind-3 Pmaxd, Pmind-4 Pmaxd, Pmind-5 Pmaxd, Pmind-6
r 0,7078 0,6704 0,6496 0,6322
Ngày Pmaxd, Pmind-7 Pmaxd, Pmind-14 Pmaxd, Pmind-21 Pmaxd,Pmind-28
r 0,6226 0,5422 0,526 0,458
Bảng 5.2 Kết quả phân tích tương quan giữa Pmin và 20 yếu tố
Ngày Pmind, Pmind-1 Pmind, Pmind-2 Pmind, Pmind-3 Pmind, Pmind-4
Ngày Pmind, Pmind-5 Pmind, Pmind-6 Pmind, Pmind-7 Pmind, Pmind-14
r 0,8314 0,8183 0,8090 0,7569
Ngày Pmind, Pmind-21 Pmind,Pmind-28 Pmin, Pmax-1 Pmind, Pmaxd-2
r 0,7495 0,6689 0,7492 0,7122
Ngày Pmind, Pmaxd-3 Pmind, Pmaxd-4 Pmind, Pmaxd-5 Pmind, Pmaxd-6
r 0,6817 0,668 0,6536 0,6407
Ngày Pmind, Pmaxd-7 Pmind, Pmaxd-14 Pmind, Pmaxd-21 Pmind,Pmaxd-28
r 0,6321 0,5918 0,598 0,5491
Đồ thị biểu diễn mối quan hệ Pmax và các yếu tố đầu vào
Hình 5.5 Đồ thị tương quan giữa Pmax và các Pmax trong quá khứ
Nhận thấy hệ số tương quan của Pmax và các ngày trong quá khứ càng xa càng giảm. Nhưng đồ thị hệ số tương quan giảm nhanh ở Pmax(d-14), Pmax(d-21),
Pmax(d-28). Do đó có thể chọn Pmax(d-1) đến Pmax(d-7) làm thông số đầu vào để
Hình 5.6 Đồ thị tương quan giữa Pmax và các Pmin trong quá khứ
Hệ số tương quan của Pmax và các Pmin trong quá khứ càng xa càng giảm. Nhưng đồ thị hệ số tương quan giảm nhanh ở Pmin(d-14), Pmin(d-21), Pmin(d-28). Do đó có thể chọn Pmin(d-1) đến Pmin(d-7) làm thông số đầu vào để dự báo
Pmaxd.
Đồ thị biểu diễn mối quan hệ Pmin và các yếu tố đầu vào
Hình 5.8 Đồ thị tương quan giữa Pmin và các Pmax trong quá khứ
Tương tự như xét các đầu vào để dự báo cho Pmax, chọn thông số đầu vào cho
Pmin cũng tương tự như vậy.
Nhận xét: Qua việc tìm hệ số tương quan phụ tải cực đại và cực tiểu của ngày
hiện tại và các ngày trước đó có thể nhận ra rằng hệ số tương quan sẽ theo chiều hướng giảm khi mối quan hệ ngày hiện tại và ngày trước đó càng cách xa nhau. Ngược lại ảnh hưởng của phụ tải của ngày hiện tại và ngày trước đó càng gần thì ảnh hưởng càng lớn.
Kết luận dựa vào các kết quả phân tích các nhân tố có khả năng ảnh hưởng lên
Pmax là 20 nhân tố, nhưng qua kết quả tính tương quan thì có thể chọn được 14 thông số đầu vào để dự báo Pmax. Đây cũng là 14 nhân tố ảnh hưởng lớn nhất lên
Pmax. Điều này cũng làm tương tự cho Pmin:
Để dự báo Pmax: Để dự báo Pmin:
− Pmax-1(cách đó 1 ngày) Pmin-1(cách đó 1 ngày)
− … …
− Pmax-7(cách đó 7 ngày) Pmin-7(cách đó 7 ngày)
− Pmin-1(cách đó 1 ngày) Pmax-1(cách đó 1 ngày)
− Pmin-2(cách đó 2 ngày) Pmax-2(cách đó 2 ngày)
− … …
− Pmin-7(cách đó 7 ngày) Pmax-7(cách đó 7 ngày)
Tổng cộng 14 đầu vào Tổng cộng 14 đầu vào
5.2 Lựa chọn mạng nơ ron cho bài toán dự báo đỉnh và đáy BĐPT
Vấn đề dự báo đỉnh và đáy biểu đồ phụ tải:
Như chúng ta đã biết việc xác định hai giá trị Pmax và Pmin trên biểu đồ phụ tải là mục tiêu quan trọng hàng đầu của người làm công tác dự báo. Tính kinh tế, hiệu quả, phương thức vận hành điều độ trong ngày phụ thuộc rất lớn vào độ chính xác của việc dự báo hai giá trị này.
Yêu cầu bài toán là xác định được mô hình dự báo Pmax và Pmin sử dụng mạng nơ ron nhân tạo dựa trên phụ tải ngày trước và nhiệt độ với sai số chấp nhận được.
Phương pháp luận lựa chọn mạng nơ ron:
Căn cứ vào đăc thù của bài toán, phù hợp nhất là mạng MLP có một lớp Nn, bởi vì mạng MLP có một số ưu điểm trong yêu cầu của bài toán dự báo đỉnh và đáy biểu đồ phụ tải sau đây:
Đây là mô hình kinh điển, đã được sử dụng rộng rãi và có chất lượng đã được khẳng định như trong các mô hình dự báo như [1,6,7,11,14]
Do tính kinh điển của mình mà mạng MLP có rất nhiều chương trình mô phỏng khác nhau, đặc biệt là thư viện của Matlab. Việc sử dụng thư viện này làm cho phép viết chương trình mô phỏng một cách dễ dàng, thuận tiện, hiển thị kết quả cũng nhanh và chính xác hơn.
5.2.1 Mạng Perceptron MLP a) Cấu trúc mạng MLP a) Cấu trúc mạng MLP
Với các phần tử nơ ron cơ bản, ta có thể xây dựng mô hình cấu trúc mạng bao gồm nhiều nơ ron. Về mặt lý thuyết ta có thể xây dựng một mạng với cách ghép nối tuỳ ý, tuy nhiên trong thực tế để thuận tiện cho việc lập trình tính toán ta sử dụng mô hình mạng MLP, trong đó các nơ ron được xếp thành nhiều lớp, bao gồm lớp đầu vào X, lớp đầu ra Y và một số lớp ở giữa gọi là lớp Nn. Tại mỗi lớp (trừ lớp đầu vào) ta có các nơ ron, giữa hai lớp có các kết nối trọng số. Các nghiên cứu đã chứng minh được rằng ta chỉ cần sử dụng tối đa 2 lớp Nn là có thể mô hình hóa một hàm phi tuyến với độ chính xác tùy chọn. Trong các mô hình đã được nghiên cứu, phần lớn chỉ dùng một lớp Nn. Khi đó mạng MLP sẽ gồm có tổng cộng 3 lớp. Cấu trúc một mạng MLP với 1 lớp Nn được thể hiện trên hình 5.9 với W là ma trận các trọng số kết nối giữa lớp đầu vào và lớp Nn, V là ma trận các trọng số kết nối giữa lớp Nn và lớp đầu ra.
Hình 5.9 Cấu trúc mạng MLP với một lớp ẩn
Mạng MLP với một lớp Nn có thể được đặc trưng bởi các thông số sau:
- Bộ ba (N , M, K), trong đó N – số đầu vào, M – số nơ ron thuộc lớp Nn, K – số nơ ron ở lớp đầu ra
- Các hàm truyền đạt f1 của lớp Nn và f2 của lớp đầu ra.
- Ma trận trọng số W kết nối giữa lớp đầu vào và lớp Nn, ma trận trọng số kết nối V giữa lớp Nn và lớp đầu ra.
Khi đó, với véc tơ đầu vào x, đầu ra tín hiệu sẽ được tuần tự tính như sau (do việc tính toán theo thứ tự nên ta còn gọi đây là quá trình lan truyền thuận).
- Tổng đầu vào của nơ ron Nn thứ i bằng: ∑ = = M j ij j i xW u 0 . - Đầu ra của nơ ron Nn thứ i : vi = f1( )ui
- Tổng đầu vào của nơ ron đầu ra thứ i: ∑ = = N j ij j i vV g 0
- Và cuối cùng ta có đầu ra thứ i của mạng sẽ bằng yi = f2( )gi
Qua quá trình lan truyền thuận ta thấy, thực chất đầu ra của mạng MLP là một hàm phi tuyến bậc cao của các véc tơ đầu vào. Mục đích của quá trình xây dựng mô hình là xác định các thông số của mạng MLP sau cho ta có được đầu ra tín hiệu như mong muốn.
b) Cách thức hoạt động của mạng:
Quá trình học:
Để có thể xây dựng được mô hình mạng MLP ta cần có một bộ số liệu mẫu
( )
{x(i),d(i) },i=1,2,…,p, (một mẫu bao gồm một cặp véc tơ đầu vào x(i) và véc tơ đích đầu ra d(i) tương ứng) cho bài toán đang xét. Mục tiêu đầu tiên đó là xác định các thông số của mạng MLP sao cho với bất cứ véc tơ đầu vào nào trong tập mẫu thì đáp ứng đầu ra của mạng MLP cũng gần xấp xỉ với giá trị của đích đã chọn trước y(i) =MLP( )x(i) ≈d(i). Sai số giữa hai giá trị này sẽ được sử dụng để điều chỉnh các thông số của mô hình. Đây sẽ làm một quá trình lặp và điều chỉnh thích nghi. Quá trình này được lặp lại nhiều lần cho đến khi giá trị đầu ra thỏa mảng một giá trị sai số nào đó hoặc đạt đến số lần lặp mà ta qui định. Quá trình tính lặp sử dụng sai số từ đầu ra để điều chỉnh mô hình được gọi là quá trình lan truyền ngược. Bằng cơ chế lan truyền ngược vào mạng như trên, ta có thể hiệu chỉnh được các trọng số của các nút để tăng độ chính xác của mô hình.
Thuật toán lan truyền truyền ngược hội tụ đến một giải pháp tối thiểu hoá sai số trung bình bình phương, vì cách thức hiệu chỉnh trọng số và trọng ngưỡng của thuật toán là ngược hướng với véc tơ gradient của hàm sai số trung bình bình phương đối với trọng số. Tuy nhiên, đối với mạng MLP thì sai số trung bình bình phương thường phức tạp và có nhiều cực trị cục bộ của hàm sai số trung bình bình phương mà không đạt đến cực trị tổng thể. Vấn đề là trong quá trình huấn luyện sẽ hội tụ như thế nào thì ngoài việc chọn được hệ số học thích hợp thì thuật toán huấn luyện cũng ảnh hưởng rất lớn nhằm tăng tốc quá trình huấn luyện và tránh rơi vào cực trị địa phương. Đã có nhiều nghiên cứu tìm ra thuật toán nhằm tăng tốc quá trình huấn luyện và khả năng tổng quá hoá như thuật toán: thuật toán hệ số học thích nghi (Variable learning Rate), thuật toán N ewton, Thuật toán Levenberg- Marquardt. Tất cả những thuật toán này đều rất thông dụng và được tích hợp trong tool box của Matlab.
Trong các thuật toán trên thì thuật toán L-M được xem là thuật toán có khả năng làm giảm hàm lỗi cao, có tốc độ hội tụ tốt nên được nhiều công trình nghiên cứu [6,16] sử dụng.
5.2.2 Thuật toán Levenberg – Marquardt (L-M)
Luật học L-M được ứng dụng cho mạng lan truyền tiến nhằm cả thiện tốc độ học. Phương pháp này được cải tiến từ phương pháp Guass-Newton để tránh tình trạng mạng rơi vào các cực trị địa phương. Thuật toán này dựa trên khai triển bậc hai của khai triển Taylor nhằm mục tính xác định giá trị bé nhất của sai số định nghĩa bởi ∑ = − = p i i i E 1 2 ) ( ) ( d y
Các tham số tham gia quá trình điều chỉnh này là các trọng số ghép nối giữa các lớp nơ ron của mạng MLP. Đối với mạng có một lớp Nn, ta có 2 bộ trọng số ghép nối giữa lớp đầu vào, lớp Nn và lớp đầu ra. Ta ký hiệu chung W – ma trận chứa các tham số của quá trình tối ưu hóa tìm giá trị nhỏ nhất của hàm E. Khi đó ta
[ ] ( ) ( ) 2 1 ) ( ) ( ) (W p E W g W p p H W p O h3 E + = + T + T + với 1 2 ( ) , , ,