Dataset Training dataset Testing dataset
Website 5000 data (70%) 2000 data (30%)
Sensor 65000 data (70%) 28000 data (30%)
4.3 Thực nghiệm thuật toán
Huấn luyện mạng sẽ được thực nhiệm nhiều lần với số nơron trong lớp ẩn khác nhau để tìm ra mơ hình mạng với thơng số tốt nhất.
Mơ hình sẽ được đưa vào tập dữ liệu training datatset đã được lựa chọn ở bảng 4.1 và phân loại thành 2 nhóm dữ liệu bao gồm:
- Dữ liệu với thuộc tính khơng gây mưa: các thông số thời tiết này được thu thập vào các ngày không mưa.
mảng dữ liệu này sẽ lần lượt được đưa vào để huấn luyện cho mạng và tăng khả năng học của mạng với nhiều trường hợp thời tiết khác nhau. Để thực nghiệm, tác giả sẽ thực hiện đưa vào 70 mảng (mỗi mảng tương ứng với 1000 thông số nhiệt độ và độ ẩm ở 500 thời điểm khác nhau) với 35 mảng dữ liệu ở nhóm khơng mưa và 35 mảng dữ liệu ở nhóm có mưa để thực hiện việc huấn luyện.
Đầu ra mong muốn của mơ hình này là 0 (khơng mưa) và 1 (có mưa) sẽ được so sánh với đầu ra huấn luyện của mơ hình sau mỗi vịng lặp để tính tốn sai số của mạng ở mỗi lần lặp. Sai số hàm lỗi và đầu ra huấn luyện sẽ được cập nhật sau mỗi vòng lặp huấn luyện khi ma trận trọng số đã được thay đổi ở lần lặp trước. Ma trận trọng số sẽ được khởi tạo ngẫu nhiên ở lần lặp đầu tiên.
Trong ứng dụng dự báo này, tác giả đã lần lượt thay đổi số nơron lớp ẩn để thử nghiệm. Để đánh kết quả dự báo của từng số lượng nơron lớp ẩn, tác giả sử dụng công thức (3.3), (3.4) và (3.5) và thu được kết quả như bảng 4.2: