Dựa trên kiến trúc của một hệthống khai phá dữliệu đã được tôi trình bày ở chương 2, cùng với nhữn lý thuyết về mạng noron ở chương 3. Chúng ta có thểsửdụng mô hình sau cho việc dự đoán:
Hình 4.1 – Mô hình dự đoán sửdụng mạng noron
Mô hình trên bao gồm:
Tập huấn luyện Học cho mạng Tập đánh giá Mạng đã được học n, ⃗ Mạng tối ưu Tập dự đoán Kết quả No Hàm đánh giá Yes
Tập đánh giá: là tập dùng để kiểm chứng việc học của mạng.
Hàm đánh giá: thực hiện công việc kiểm định xem mạng đã đáp ứng được yêu cầu của hệthống chưa.
Tập dự đoán: là tập dữliệu có cấu trúc giống như tập huấn luyện nhưng giá trị cần dự đoán bị khuyết và nhiệm vụcủa mạng noron đã được tối ưu là bổ sung giá trị bị khuyết này của tập dự đoán.
Quá trình hoạt động của mô hình
Giai đoạn học: Ban đầu mạng noron với thuật toán lan truyền ngược (đã giới thiệu ở trên) sẽsửdụng tập huấn luyện làm vector đầu vào đểxác lập các tham số cho mạng như sốlớp ẩn, các trọng sốliên kết… Kết quả thu được sẽlà một mạng đã được học, tuy nhiên để đảm bảo nó đáp ứng được độchính xác cao cần phải cho chạy thửvới tập dữliệu khác dùng để đánh giá. Ta sẽ thu tỷ lệ lỗi của mạng đối với tập đánh giá này và thực hiện so sánh với tỷlệ lỗi giới hạn, nếu đáp ứng được thì chấp nhận mạng vừa được học đó, nếu không thì thay đổi tham sốvà quay lại bước học
Giai đoạn dự đoán: Sau khi kết thúc giai đoạn học, ta sẽ thu được một mô hình mạng nơ ron với các tham số tốt nhất. Khi đó, ta chỉ cần dùng bộ dữ liệu dùng để dự đoán áp vào mô hình thì mô hình sẽtrảlại kết quảdựbáo.