3.4.2 Số liệu sử dụng
Chúng tôi sử dụng số liệu từ năm 1964 đến năm 2002 tại trạm đo Tạ Bú trên sông Đà, trạm đo lưu lượng gần hồ Hoà Bình nhất (xem mục 3.1.7). Số liệu này được đo trong mùa cạn từ tháng Mười Hai năm trước đến tháng Năm năm sau. Bộ dữ liệu được chia làm hai phần:
- Phần dữ liệu học (training set): Từ cuối năm 1964 đến đầu năm 1995 có tổng cộng 480 mẫu học.
- Phần dữ liệu kiểm tra (test set): Từ cuối năm 1995 đến đầu năm 2002 tổng cộng có 90 mẫu kiểm tra.
3.4.3 Các tham số
a. Các tham số của mạng nơ-ron
- Kiến trúc mạng: chúng tôi sử dụng mạng nơ-ron lan truyền thẳng ba lớp: lớp vào, lớp ẩn và lớp ra. Trong đó lớp vào là đầu vào của các tham số phục vụ cho việc dự báo. Lớp ra chỉ có một nơ-ron, giá trị đầu ra của nơ-ron này chính là lưu lượng nước cần dự báo.
- Hàm kích hoạt được sử dụng là hàm sigmoid (hình 1.13).
b. Các tham số học
- Sử dụng phương pháp học kết hợp giữa giải thuật di truyền có cải tiến và giải thuật lan truyền ngược sai số như đã đề cập trong phần 2.4.
- Giá trị trọng số được khởi tạo ngẫu nhiên trong khoảng (-3, 3). - Với giải thuật di truyền:
o Số lượng quần thể: 100
o Sử dụng lai ghép nút, đột biến nút (kết hợp đột biến BIASED với đột biến UNBIASED mục 2.2.6)
o Xác suất lai: 0.3
o Xác suất đột biến BIASED: 0.1
o Xác suất đột biến UNBIASED: 0.03 - Với giải thuật lan truyền ngược sai số:
o Hằng số học: 0.3
o Không sử dụng hằng số quán tính.
3.4.4 Các phương án dự báo
Việc thử nghiệm được tiến hành với 3 phương án dự báo dòng chảy đến hồ Hoà Bình trước 10 ngày như đã được chúng tôi trình bày trong [2]. Trong nghiên cứu được trình bày trong [2], chúng tôi sử dụng mạng nơ-ron truyền thẳng với phương pháp học dựa trên giải thuật lan truyền ngược sai số. Trong phần này, chúng tôi thử nghiệm các phương án dự báo đó với mạng nơ-ron sử dụng phương pháp học kết hợp giữa giải thuật di truyền cải tiến và giải thuật lan truyền ngược sai số như đã trình bày trong chương 2 phần 2.4 để so sánh với các kết quả trong [2].
a. Phương án 1
Trong phương án này việc dự báo lưu lượng nước tương lai trước 10 ngày Q(t+10) dựa vào các lưu lượng nước tại thời điểm hiện tại và quá khứ. Chúng tôi sử dụng ba giá trị lưu lượng làm đầu vào của mạng gồm:
- Lưu lượng nước hiện tại: Q(t)
- Lưu lượng nước trước đó 10 ngày: Q(t-10) - Lưu lượng nước trước đó 20 ngày: Q(t-20)
Q t( 10) f Q t Q t ( ), ( 10), (Q t20) (3.6) Ta sẽ dùng mạng nơ-ron để học được mối quan hệ này. Kết quả sau khi học, các chỉ số dự báo với dữ liệu kiểm tra (test set):
- Sai số căn quân phương RMSE = 102.60 m3 /s - Chỉ số R2
= 0.7703
(Kết quả dự báo dùng mạng nơ-ron sử dụng phương pháp lan truyền ngược sai số trình bày trong [2]: RMSE = 110.49 m3
/s, R2 = 0.7509) 0 200 400 600 800 1000 1200 1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 Mẫu thử L ư u lư ợ n g (m 3 /s) Thực tế Dự báo