Phát triển JOONE
tính năng lượng bức xạ mặt trời
Sau khi thực hiện cài đặt các thuật toán, các quy tắc học mới để bổ sung điểm yếu của JOONE chúng ta cần sử dụng để kiểm nghiệm lại các thuật toán đã cài đặt cũng như kiểm nghiệm lại lý thuyết đã nghiên cứu. Chúng ta sử dụng JOONE để học hàm số bậc hai quen thuộc: y=x2 với đồ thị như hình 66 dưới đây.
Đồ thị hàm y = x2
Các bước thực hiện như sau:
• Chuẩn bị số liệu học và tiền xử lý.
• Sử dụng giải thuật lai di truyền - lan truyền ngược sai số ứng với các mạng có cấu trúc khác nhau để tìm ra mạng phù hợp nhất.
• Khởi đầu bằng cùng một mạng có cấu trúc đã tìm được ở trên, huấn luyện mạng sử dụng các quy tắc học khác nhau và so sánh.
I.31.1. Chuẩn bị số liệu học và tiền xử lý
a. Chuẩn bị số liệu
Số liệu học cho bài toán này chuẩn bị khá đơn giản, chúng ta chỉ việc lấy giá trị của hàm y = x2 tương ứng với một số điểm. Các số liệu này được phõn ra làm hai
tập:
• Tập học: dùng để lan truyền ngược lại và hiệu chỉnh trọng số,
• Tập kiểm tra: dùng để kiểm tra chéo, đánh giá tính tổng quát của mạng
nơron hiện tại.
Các giá trị của x chọn nằm trong khoảng [-10, 10], tương ứng với các giá trị hàm x2 nằm trong khoảng từ [0, 100]. Các điểm x được sử dụng trong tập học được lấy cách nhau một đơn vị bằng 0.5. Chúng ta thiết kế một tập kiểm tra với 15 mẫu như cho ở bảng 7.
vii. Bảng số liệu chuẩn bị việc học hàm y = x2:
STT x x2 STT x X2 STT x x2 1 -10.0 100.00000 21 0.0 0.00000 41 -9.8 95.06250 2 -9.5 90.25000 22 0.5 0.25000 42 -8.3 68.06250 3 -9.0 81.00000 23 1.0 1.00000 43 -6.8 45.56250 4 -8.5 72.25000 24 1.5 2.25000 44 -5.3 27.56250 5 -8.0 64.00000 25 2.0 4.00000 45 -3.8 14.06250 6 -7.5 56.25000 26 2.5 6.25000 46 -2.3 5.06250 7 -7.0 49.00000 27 3.0 9.00000 47 -0.8 0.56250 8 -6.5 42.25000 28 3.5 12.25000 48 0.8 0.56250 9 -6.0 36.00000 29 4.0 16.00000 49 2.3 5.06250 10 -5.5 30.25000 30 4.5 20.25000 50 3.8 14.06250 11 -5.0 25.00000 31 5.0 25.00000 51 5.3 27.56250 12 -4.5 20.25000 32 5.5 30.25000 52 6.8 45.56250 13 -4.0 16.00000 33 6.0 36.00000 53 8.3 68.06250 14 -3.5 12.25000 34 6.5 42.25000 54 9.8 95.06250 15 -3.0 9.00000 35 7.0 49.00000 55 10.0 100.00000 16 -2.5 6.25000 36 7.5 56.25000
(15 mẫu kiểm tra)
17 -2.0 4.00000 37 8.0 64.00000
18 -1.5 2.25000 38 8.5 72.25000
19 -1.0 1.00000 39 9.0 81.00000
20 -0.5 0.25000 40 9.5 90.25000
b. Tiền xử lý
Do chúng ta thường dùng các lớp nơron xích-ma với giá trị đầu vào ”nhạy” trong khoảng (-1, 1) và giá trị ra giới hạn trong khoảng (0,1), vì vậy trước hết chúng ta chuẩn hoá số liệu về trong các khoảng tương ứng.
Ở trên ta chọn số liệu học nằm trong khoảng [-10,10] đối với giá trị đầu vào, và [0,100] với giá trị đầu ra nên việc chuẩn hoá khá đơn giản:
100 ' 10 ' y y x x = =
Từ đó chỳng ta có tập số liệu học như bảng 8 dưới đây.
viii. Số liệu đã xử lý cho việc học hàm y = x2
STT x/10 x2/100 STT x/10 x2/100 ST T x/10 x2/100 1 -1.00 1.00000 21 0.00 0.00000 41 -0.975 0.95063 2 -0.95 0.90250 22 0.05 0.00250 42 -0.825 0.68063 3 -0.90 0.81000 23 0.10 0.01000 43 -0.675 0.45563 4 -0.85 0.72250 24 0.15 0.02250 44 -0.525 0.27563 5 -0.80 0.64000 25 0.20 0.04000 45 -0.375 0.14063 6 -0.75 0.56250 26 0.25 0.06250 46 -0.225 0.05063 7 -0.70 0.49000 27 0.30 0.09000 47 -0.075 0.00563 8 -0.65 0.42250 28 0.35 0.12250 48 0.075 0.00563 9 -0.60 0.36000 29 0.40 0.16000 49 0.225 0.05063 10 -0.55 0.30250 30 0.45 0.20250 50 0.375 0.14063 11 -0.50 0.25000 31 0.50 0.25000 51 0.525 0.27563 12 -0.45 0.20250 32 0.55 0.30250 52 0.675 0.45563 13 -0.40 0.16000 33 0.60 0.36000 53 0.825 0.68063 14 -0.35 0.12250 34 0.65 0.42250 54 0.975 0.95063 15 -0.30 0.09000 35 0.70 0.49000 55 1.000 1.00000 16 -0.25 0.06250 36 0.75 0.56250
(15 mẫu kiểm tra)
17 -0.20 0.04000 37 0.80 0.64000
18 -0.15 0.02250 38 0.85 0.72250
19 -0.10 0.01000 39 0.90 0.81000
20 -0.05 0.00250 40 0.95 0.90250
Khi sử dụng mạng tương tự chỳng ta phải chia giá trị vào cho 10 để lấy giá trị đầu vào cho mạng nơron, sau khi thực hiện lan truyền tiến chúng ta nhận được một giá trị đầu ra, nhõn thêm 100 chúng ta có giá trị cần tìm.
I.31.2. Tỡm cấu trúc mạng phù hợp nhất với bài toàn
Bài toán học hàm bậc hai này khá đơn giản, chúng ta khởi đầu từ một mạng nơron có số nơron trong lớp ẩn là 1 và tăng dần số nơron lên. Ứng với mỗi cấu trúc mạng đó chúng ta sử dụng giải thuật lai di truyền - lan truyền ngược sai số để tỡm ra cá thể tốt nhất trong quần thể. So sánh các cá thể này chỳng ta rút ra được một cấu hình mạng phù hợp nhất với bài toán.
Các tham số được áp dụng cho giải thuật lai di truyền – lan truyền ngược bao gồm:
• Số cá thể trong quần thể: 100 • Số thế hệ tiến hoá: 100 • Xác suất tạp lai: 0.75
• Xác suất đột biến: 0.001
• Số cá thể lấy từ giải thuật di truyền: 10% (ứng với 10 cá thể).
• Quy tắc học tiếp của giải thuật lan truyền ngược sai số: quy tắc học thích nghi.
• Kiểu học: học cả gói. • Hằng số học: 0.7
• Số vòng học tiếp theo: 10000 vòng
ix. Thống kê sai số của các mạng học hàm y = x2
Số nơron
lớp ẩn RMSE Validate RMSE
Dấu hiệu quá khít 1 0.158249199 0.226322593 0 2 0.023758026 0.035916995 0 3 0.014391969 0.028034455 0 4 0.007830512 0.018396561 0 5 0.007566454 0.014193457 0 6 0.007652552 0.014934524 x 7 0.000600495 0.014497057 x
Qua bảng thống kê số liệu trên, chỳng ta nhận thấy đã có sự xuất hiện quá khít khi số nơron trong lớp ẩn lớn hơn 5. Đồng thời ta cũng nhận xét được lỗi sinh ra trong quá trình học và quá trình kiểm tra của cấu trúc mạng này xấp xỉ với cấu trúc mạng có 6 và 7 nơron trong lớp ẩn. Vậy cấu trúc mạng nơron có số nơron trong lớp ẩn là 5 là hợp lý nhất.
I.31.3. So sánh các quy tắc học của giải thuật lan truyền ngược
Chúng ta đã rút ra được cấu trúc mạng phù hợp với bài toán học hàm bậc hai, trong bước này chúng ta sử dụng mạng này với cùng một khởi tạo các trọng số của mạng, sử dụng các quy tắc học khác nhau của giải thuật lan truyền ngược sai số để có sự so sánh giữa chúng.
Cùng xuất phát từ 10 mạng nơron (có 5 nơron trong lớp ẩn và khởi tạo ngẫu nhiên ban đầu các trọng số của mạng), các quy tắc học được sử dụng để luyện mạng với các tham số cho như bảng 10. Sau quá trình luyện mạng chỳng ta có kết quả thống kê lại như bảng 11.
x. Các tham số cho các quy tắc học:
Quy tắc học Tham số Giảm dốc nhất (Delta) Quán tính (Momentum) Thích nghi (Delta-Bar-Delta) Thích nghi quán tính. Hệ số học η 0.5 0.5 0.5 0.5 Hệ số quán tính µ 0.5 0.5 - 0.5 Hệ số κ - - 0.1 0.1
Hệ số φ - - 0.5 0.5
Hệ số θ - - 0.5 0.5
xi. Thống kê số liệu sau khi luyện 10 mạng theo các quy tắc học:
Cá
thể Sai số ban đầu
Delta Momentum Delta-Bar-Delta Momentum-DBD
Sai số KT Sai số học Sai số KT Sai số học Sai số KT Sai số học Sai số KT Sai số học
1 0.232769798 0.033179508 0.016952730 0.027189184 0.012533292 0.012670685 0.005138350 0.013216299 0.004804092 2 0.232820377 0.028499249 0.024902621 0.026782122 0.021545106 0.024952178 0.018862313 0.022785143 0.017611294 3 0.233773515 0.017140267 0.009017469 0.015410989 0.008352205 0.01403944 5 0.007155029 0.01468863 6 0.006720909 4 0.234523486 0.042856996 0.043074058 0.02953277 6 0.025091202 0.024911672 0.01744186 3 0.024105145 0.017222617 5 0.239140117 0.041029715 0.021764080 0.031680295 0.015158872 0.03167363 1 0.015345548 0.013299640 0.006859858 6 0.244282478 0.050917795 0.047729564 0.03873276 3 0.030036258 0.030152400 0.015118144 0.030585707 0.015140136 7 0.252517141 0.054815030 0.036557558 0.037209991 0.01956645 7 0.014609412 0.00713696 3 0.014508880 0.006625828 8 0.256001282 0.023535330 0.012685080 0.02147339 3 0.010408780 0.016122170 0.010810848 0.021307218 0.015874621 9 0.264190472 0.044295410 0.024958145 0.03007817 3 0.01787547 5 0.029442207 0.01403713 8 0.017914651 0.008189844 10 0.265278150 0.298531636 0.209772956 0.298513281 0.20974693 6 0.03192346 8 0.015588419 0.298491273 0.209668820 Trần Ngọc Tú - Lớp CNPM – K44 100
Biểu đồ so sánh sai số học của các quy tắc học trên 10 cá thể.
Tương ứng với bảng thống kê số liệu 11 theo các quy tắc học khác nhau trên chúng ta có ba biểu đồ theo ba góc nhìn khác nhau:
• Hình 67: So sánh sai số kiểm tra theo các quy tắc học của 10 mạng.
• Hình 69: So sánh sai số học theo các quy tắc học của 10 mạng.
• Hình 68: So sỏnh các quy tắc học theo tổng sai số học của 10 mạng.
Qua hai biểu đồ hình 67 và 69 chúng ta có nhận xét các quy tắc học giảm dốc nhất, quy tắc học quán tính hội tụ chậm hơn rừ rệt so với các quy tắc học thích nghi hoặc thích nghi - quán tính.
Để theo dừi quá trình hội tụ theo các quy tắc học khác nhau, chúng ta theo dừi các biểu trờn các hình 70, 71, 72, 73 tương ứng với sai số kiểm tra, sai số học thực hiện trên mạng thứ nhất theo các quy tắc học khác nhau trong quá trình học.
Qua biểu đồ trên hình 68 chúng ta có nhận xét chung về các quy tắc học như sau:
• Quy tắc học thích nghi luôn hội tụ và luôn cho các kết quả ổn định trên
cả 10 mạng thử nghiệm. Đồng thời trong đa số trường hợp quy tắc học này hội tụ nhanh nhất.
• Quy tắc học thích nghi - quán tính hội tụ trờn đa số các mạng tuy nhiên
có trường hợp lại không hội tụ. Quy tắc này hội tụ khá nhanh.
• Quy tắc giảm dốc nhất (delta) hội tụ khá chậm và thường có ”dao
động” khi chọn hệ số học không thích hợp.
• Quy tắc học quán tính hội tụ nhanh hơn quy tắc delta nhưng vẫn rất
chậm so với hai phương pháp cũn lại.
Sai số theo quy tắc học delta
Sai số theo quy tắc học quán tính
Sai số theo quy tắc học thích nghi
xii. Đánh giá quy tắc học đối với bài toán bậc hai: Quy tắc học Đặc tính Giảm dốc nhất Quán tính (Momentum) Thích nghi (Delta-bar- delta) Thích nghi – Quán tính
Cài đặt Đơn giản Vừa Khó Khó nhất
Bộ nhớ Ít nhất Vừa Nhiều Nhiều nhất
Tốc độ hội tụ Khá chậm Chậm Nhanh Nhanh
Hội tụ ổn định Không Vừa Ổn định nhất Ổn định Thích hợp với BT Không Không Thích hợp nhất Vừa
I.31.4. Kết luận.
Đối với bài toán hàm bậc hai chúng ta đã tìm ra quy tắc học thích nghi là thích hợp nhất. Đồng thời so sánh giữa 10 mạng tìm được sau khi thực hiện quy tắc học
thích nghi, chúng ta chọn được mạng thứ nhất là mạng tốt nhất ứng với sai số kiểm
tra và sai số học bé nhất.
Chỳng ta sử dụng mạng này để kiểm tra lại hàm bậc hai ban đầu. Với số liệu đầu vào là 101 giá trị: -10.0, -9.8, -9.6, .... , 0.0, 0.2, ...., 9.8, 10.0.
Sau quá trình tiền xử lý tương tự như quá trình học chúng ta thu được kết xuất của mạng như trên hình 74.
Qua đồ thị của hình 74, chỳng ta có thể mạng nơron đã cho một kết xuất rất sát với giá trị đúng của hàm bậc hai như vậy mạng tìm được đã giải quyết được bài toán mô phỏng hàm bậc hai.
I.32. Ứng dụng JOONE cho bài toán tính năng lượng bức xạ mặt trời
I.32.1. Giới thiệu bài toán tính năng lượng bức xạ mặt trời [12]
Mặt trời được coi như là một lò phản ứng hạt nhân khổng lồ với nguồn năng lượng phát ra dưới dạng năng lượng bức xạ là 3.8x1023kW. Chỉ một phần rất nhỏ nguồn năng lượng này được trái đất tiếp nhận nhưng cũng lên đến 1.8x1014kW, trong đó chỉ có khoảng 60% phần năng lượng tới bên ngoài khí quyển đến được bề mặt trái đất, mặc dù chỉ một phần rất nhỏ năng lượng mặt trời đến được bề mặt của trái đất, nhưng nếu so sánh với nhu cầu sử dụng năng lượng của con người trờn trỏi đất thì đõy lại là một nguồn năng lượng rất khổng lồ, ta lấy một số con số để so sánh: sản lượng điện của Mỹ hàng năm là 7x108kW, tương đương với nguồn năng lượng mặt trời trên bề mặt của khoảng 1000 dặm vuông tại vùng sa mạc, hay tổng công suất điện hiện nay của Việt Nam vào khoảng 0,1x108 kW tương đương với nguồn năng lượng mặt trời trên bề mặt của khoảng 100 dặm vuông sa mạc. Mặc dù năng lượng mặt trời trên mặt đất rất lớn như vậy nhưng do trải khắp mặt đất nên cường độ bức xạ mặt trời (BXMT) thường ít khi vượt quá 1.0kW/m2, so với các nguồn năng lượng khác như năng lượng hạt nhân, năng lượng của các nhiên liệu hoỏ thạch…thỡ mật độ năng lượng BXMT tương đối nhỏ làm cho công tác khai thác phục vụ các nhu cầu cung cấp năng lượng rất khó khăn và phức tạp.
Với sự phát triển mạnh mẽ của công nghệ, năng lượng BXMT ngày càng được khai thác một cách đa dạng hơn, các thiết bị cũng có hiệu quả khai thác cao hơn, điều này cũng phần nào khắc phục được hạn chế khi khai thác năng lượng BXMT.
Tuy nhiên, để có thể khai thác một cách hợp lý được nguồn năng lượng dồi dào và khụng gõy ô nhiễm này, vấn đề đánh giá tiềm năng tại từng vị trí địa lý là một việc làm hết sức cần thiết, bởi vì năng lượng BXMT không ổn định, nguồn năng lượng này biến đổi hầu như liên tục và phụ thuộc vào nhiều yếu tố, cũng vì vậy việc xác định được cường độ BXMT tại một địa phương có ý nghĩa to lớn cho các nhà đầu tư, các nhà hoạch định chính sách và ở phạm vi hẹp hơn đó là phục vụ nhu cầu tiêu dùng.
BXMT được xác định thông qua các số liệu quan trắc tại các trạm khí tượng, trên cơ sở đó xác định được cường độ BXMT trung bình ngày, tháng và năm tại các địa phương đặt các trạm quan trắc, rất tiếc không phải quốc gia nào cũng có đủ kinh phí và điều kiện kỹ thuật để thu thập số liệu quan trắc BXMT ở các địa phương. ở Việt Nam hiện nay chỉ có 18 trạm có số liệu quan trắc BXMT ở miền Bắc là số liệu từ năm 1960, ở phía Nam thì số liệu cũn ớt hơn và bị thất lạc nhiều sau chiến tranh,
điều này gõy khú khăn rất nhiều cho chúng ta đối với việc phân tích đặc điểm và xác định trị số tính toán BXMT cho các địa phương ở nước ta.
Để phục vụ cho công tác nghiên cứu, thiết kế công trình, trên thế giới ở những địa phương không có hoặc không thể thu thập số liệu quan trắc, các nhà khoa học đã xây dựng các mô hình tính toán BXMT dựa trên quy luật vận động của trái đất và mặt trời.
I.32.2. Xây dựng mô hình sử dụng mạng nơron nhân tạo cho bài toán
Với tầm quan trọng của việc đánh giá tiềm năng về năng lượng mặt trời của các địa phương đã có nhiều mô hình được đề nghị, như mô hình tính năng lượng mặt trời trong mô hình của ASHRAE tính năng lượng bức xạ mặt trời theo lý thuyết dựa vào toạ độ của địa phương và thời gian (ngày tháng trong năm), tuy nhiên những tham số trong mô hình được tính, thống kê và áp dụng cho các quốc gia khác. Theo KS Đỗ Trần Hải [12] chúng ta cần sử dụng một mô hình ASHRAE với các tham số phù hợp với điều kiện của Việt Nam.
Những mô hình đang được sử dụng là tính sử dụng các số liệu quan trắc năng