2.3 .Hàm xử lý
3.5. Xây dựng mạng Nơron
3.5.2. Huấn luyện mạng Nơron cho mơ hình
Sử dụng tập dữ liệu đầu vào sau tiền xử lý như Hình 3.5 cho bài tốn nên phương án giải bài toán sẽ là khuyến cáo dạng hồi quy. Tức là sử dụng dữ liệu của những năm trước để dự báo cho những năm tiếp theo.
Trong mơ hình mạng Nơron với 2 đầu ra nên ta sử dụng một số hàm và cơng cụ đo để có độ chính xác như sau:
+ Hàm Softmax
Hàm Softmax được sử dụng ở mơ hình nhằm đánh giá xác suất phân loại của dữ liệu đầu vào. Ngoài ra, hàm Softmax cũng thường được sử dụng để tính tốn trọng số cho dữ liệu.
+ Hàm tối ưu adam
Adam sử dụng là chọn một cách thích nghi một tỷ lệ học tập riêng cho từng tham số. Các thông số thường nhận được các bản cập nhật nhỏ hơn hoặc ít thường xuyên hơn sẽ nhận được các bản cập nhật lớn hơn với Adam. Điều này tăng tốc độ học tập trong trường hợp tỷ lệ học tập phù hợp khác nhau giữa các tham số.
Các lợi ích của thuật tốn Adam
- Khơng khó khăn để triển khai thực hiện cho mơ hình - Dùng để xử lý độ phức tạp hiệu quả
- Ít bộ nhớ yêu cầu.
- Thích hợp với các bài tốn có độ biến thiên khơng ổn định và dữ liệu traning phân mảnh.
- Các siêu tham số được biến thiên một cách hiệu quả và yêu cầu ít điều chỉnh. + Hàm mất mát loss:
Hàm loss sẽ chỉ ra mơ hình đốn sai bao nhiêu so với giá trị thực tế. Dựa trên phản hồi, mơ hình có thể sửa những lỗi sai trước đó. Q trình này lặp đi lặp lại cho đến khi mơ hình đạt đến một độ chính xác nhất định.
+ Cơng cụ đo: metrics
Khi xây dựng mơ hình khuyến cáo chúng ta sẽ muốn biết một cách khái quát tỷ lệ các trường hợp được khuyến cáo đúng trên tổng số các trường hợp là bao nhiêu. Tỷ lệ đó được gọi là độ chính xác. Độ chính xác giúp ta đánh giá hiệu quả dự báo của mơ hình trên một bộ dữ liệu. Độ chính xác càng cao thì mơ hình càng chuẩn xác. Trong các metrics đánh giá mơ hình phân loại thì độ chính xác là metric khá được ưa chuộng vì nó có cơng thức tường minh và dễ diễn giải ý nghĩa .
Sau đó khởi tạo các tham số và huấn luyện MLP 200 lần epoch với batch_size =10. Giá trị loss được lưu sau mỗi 200 epoch. Một số thông tin huấn luyện MLP trong mơ hình như sau.
Ở đây Learning_rate Epoch 198/200
583/583 [==============================] - 0s 132us/sample - loss: 0.114 6 - acc: 0.9640 được gán bằng 0.9640.
Nhìn vào đồ thị Hình 3.3 cho thấy độ phù hợp của mơ hình dự báo có giá trị huấn luyện là 0.9640, chỉ biến động từ Epoch 1 đến Epoch 20 theo phương thẳng đứng còn lại từ Epoch 20 đến Epoch 200 là tương đối đều nhau các giá trị này ở mức tương đối cao, điều này cho thấy kết quả của dự báo mang tính chính xác, cho ra kết quả có độ tin cậy cao.
Hình 3.3: Đồ thị thể hiện mức độ học của MLP
Với dữ liệu kiểm tra và quan sát trên đồ thị thể hiện mức độ học của MLP, đầu ra của mạng cũng xấp xỉ đầu ra yêu cầu (tức là đầu ra thực của dữ liệu học). Chúng ta dễ dàng nhận thấy mạng nơron MLP học khá tốt. Tuy nhiên tại một số điểm vẫn cịn lỗi nhỏ trong mơ hình.
+ Precision: trả lời cho câu hỏi trong các trường hợp được dự báo là tốt thì có bao nhiêu trường hợp là đúng. Và tất nhiên độ chính xác càng cao thì mơ hình của chúng ta càng tốt trong việc khuyến cáo. Precision sẽ cho chúng ta biết mức độ chuẩn xác của mơ hình đối với các mơ hình được dự báo là xấu. [17]
Precision = 𝑇𝑃
total predicted positive=
𝑇𝑃 𝑇𝑃 + 𝐹𝑃
+ Recall: đo lường tỷ lệ dự báo chính xác các trường hợp positive trên tồn bộ các mẫu thuộc nhóm positive. Để tính được recall thì chúng ta phải biết trước nhãn của dữ liệu. Do đó recall có thể được dùng để đánh giá trên tập train và validation vì chúng ta đã biết trước nhãn. Trên tập test khi dữ liệu được coi như mới hồn tồn và chưa biết nhãn thì chúng ta sẽ sử dụng precision. [18]
Recall= 𝑇𝑃
total actual positive =
𝑇𝑃 𝑇𝑃 + 𝐹𝑁
+ F1 score: trung bình điều hịa giữa precision và recall. Do đó nó đại diện hơn trong việc đánh gía độ chính xác trên đồng thời precision và recall. Nó được sử dụng để đánh giá hiệu suất của mơ hình phân loại hoặc khuyến cáo
F1 = 2
precision−1+recall−1
Hình 3.4: Kết quả huấn luyện của mạng
Trong Hình 3.4 cho thấy các giá trị mức cảnh báo đối với học sinh, sinh viên được đưa ra là 96/583 và không cảnh báo là 487/583. Và các công cụ đo như
Accuracy, Precision, Recall, f1-Score đặt mức trong khoảng 85%-96%, đây là mức tương đối cao với bài toán dự báo.