Dựa trên kiến trúc của một hệthống khai phá dữliệu đã được tơi trình bày ở chương 2, cùng với nhữn lý thuyết về mạng noron ở chương 3. Chúng ta cĩ thểsửdụng mơ hình sau cho việc dự đốn:
Hình 4.1 – Mơ hình dự đốn sửdụng mạng noron
Mơ hình trên bao gồm:
Tập huấn luyện Học cho mạng Tập đánh giá Mạng đã được học n, ⃗ Mạng tối ưu Tập dự đốn Kết quả No Hàm đánh giá Yes
Tập đánh giá: là tập dùng để kiểm chứng việc học của mạng.
Hàm đánh giá: thực hiện cơng việc kiểm định xem mạng đã đáp ứng được yêu cầu của hệthống chưa.
Tập dự đốn: là tập dữliệu cĩ cấu trúc giống như tập huấn luyện nhưng giá trị cần dự đốn bị khuyết và nhiệm vụcủa mạng noron đã được tối ưu là bổ sung giá trị bị khuyết này của tập dự đốn.
Quá trình hoạt động của mơ hình
Giai đoạn học: Ban đầu mạng noron với thuật tốn lan truyền ngược (đã giới thiệu ở trên) sẽsửdụng tập huấn luyện làm vector đầu vào đểxác lập các tham số cho mạng như sốlớp ẩn, các trọng sốliên kết… Kết quả thu được sẽlà một mạng đã được học, tuy nhiên để đảm bảo nĩ đáp ứng được độchính xác cao cần phải cho chạy thửvới tập dữliệu khác dùng để đánh giá. Ta sẽ thu tỷ lệ lỗi của mạng đối với tập đánh giá này và thực hiện so sánh với tỷlệ lỗi giới hạn, nếu đáp ứng được thì chấp nhận mạng vừa được học đĩ, nếu khơng thì thay đổi tham sốvà quay lại bước học
Giai đoạn dự đốn: Sau khi kết thúc giai đoạn học, ta sẽ thu được một mơ hình mạng nơ ron với các tham số tốt nhất. Khi đĩ, ta chỉ cần dùng bộ dữ liệu dùng để dự đốn áp vào mơ hình thì mơ hình sẽtrảlại kết quảdựbáo.