- Giai đoạn 4: Đánh giá độ chính xác của phân lớp.
3.5.1. Thông tin về dữ liệu học sinh.
theo học tại trường, sau khi công tác tổng kết đánh giá hoàn thành thì các nhận xét, đánh giá cũng được cập nhật vào hồ sơ, còn thời điểm thứ 2 là vào trước khai giảng mỗi năm học đối với học sinh tuyển sinh đầu cấp, hồ sơ sẽ được cung cấp bởi học sinh và các thông tin được thu thập từ các cấp học trước đó mà các em đã theo học. Các trường học sử dụng dữ liệu thu thập được phục vụ cho các kế hoạch giáo dục của nhà trường như xếp lớp, chăm lo chính sách cho học sinh, … việc quan tâm đến các thông số này làm ảnh hưởng không nhỏ đến chất lượng giáo dục của nhà trường. Các thông tin sẽ được cập nhật tại Sổ đăng bộ của nhà trường.
Bảng 3.24 Trích dẫn thông tin học sinh.
* Thông tin chi tiết về tập dữ liệu nghỉ, bỏ học của học sinh:
Tập dữ liệu huấn luyện gồm 1062 giao dịch, tập dữ liệu thử nghiệm gồm 460 giao dịch (tỷ lệ tập huấn luyện – thử nghiệm là 70% - 30%)
Số thuộc tính: 14 Số lớp: 2
Giá trị khuyết thiếu: không
1.Giới tính: 1-2 2.Học lực: 1 - 5 3.Hạnh kiểm: 1 - 5 4.Hoàn cảnh gia đình: : 1 - 5 5.Mồ côi : 1 - 5 6.Nghiện ma túy: 1 - 5 7.Nghiện game: 1 - 5 8.Hút thuốc lá: 1 - 5 9.Vi phạm nội quy: 1 - 5
10. Cha mẹ là lao động phổ thông: 1 - 5 11. Cha mẹ là trí thức: 1 - 5
12. Trễ tuổi: 1 - 5 13. Sớm tuổi: 1 - 5 14. Bảo lưu: 1 - 5
15. Bỏ học: 0 (không có nguy cơ bỏ học) – 1 (có nguy cơ bỏ học)