Thu thập dữ liệu

Một phần của tài liệu (LUẬN văn THẠC sĩ) sử dụng một số thuật toán học máy để dự đoán thành tích học tập của học sinh (Trang 27 - 29)

Thu thập dữ liệu là công việc rất quan trọng, vì không có dữ liệu thì không thể xây dựng được mô hình. Thông qua tìm hiểu cá nhân và tham khảo một số nghiên cứu tương tự cho thấy các thành phần như: Năng khiếu, di truyền dòng họ, bố mẹ và kết hợp các điều kiện hoàn cảnh nghị lực sống có tác động ảnh hưởng trực tiếp đến kết quả học tập của một học sinh. Động cơ học tập, sức khỏe, gia đình, trường học, xã hội, mạng xã hội đều có những ảnh hưởng lớn đến kết quả học tập. Từ đó thiết kế và liệt kê rất nhiều những câu hỏi trong bảng hỏi để có thể lấy được nhiều thông tin nhất của học sinh. Việc khảo sát và thu thập trực tiếp được thực hiện với hơn 500 học sinh các khóa 19 (niên khóa 2017-2020), 20 (niên khóa 2018-2021) và 21 (niên khóa 2019-2022) tại trường THPT Lương Thế Vinh – Cẩm Phả - Quảng Ninh để đưa ra mối liên hệ và dự đoán. Phiếu khảo sát được thực hiện theo mẫu như hình 2.1, 2.2. Bao gồm các thông tin:

1. Mã lớp - Định danh lớp học của học sinh. 2. Họ và tên

3. TBCM - Điểm trung bình các môn trong năm học

4. Bi quan - Thái độ sống, lạc quan tích cực hay tiêu cực, bi quan. 5. Học thêm - Có học thêm hay không.

6. Người yêu - Có người yêu, bạn khác giới hay không.

7. Học đại học - Có nguyện vọng học tiếp đại học hay không. 8. Làm việc nhà - Có tham gia làm việc nhà thường xuyên không.

Hình 2.1: Phiếu khảo sát thông tin

10. Thời gian ở trường.

11. Hút thuốc - Có hút thuốc hay không.

12. Uống rượu - Lượng ml rượu uống trong tuần. 13. Uống chè - Có thói quen uống chè không. 14. Thời gian rảnh- Thời gian tính giờ trên tuần. 15. Thời gian chơi game - Giờ trên tuần.

16. Thời gian thể thao- Giờ trên tuần. 17. Thời gian đọc sách - Giờ trên tuần. 18. Thời gian học bài - Giờ trên tuần. 19. Số thành viên gia đình.

20. Trình độ bố 21. Trình độ mẹ 22. ...vv.v.

Sau khi thiết lập form thu thập, bảng hỏi đã thu được hơn 550 dữ liệu. Dữ liệu do học sinh trả lời có thể không đầy đủ, ghi sai, ghi thừa. Tất cả dữ liệu này được lưu trữ thô dưới dạng file exel, thể hiện trong các hình ảnh 2.3, 2.4, 2.5 dưới đây.

Một phần của tài liệu (LUẬN văn THẠC sĩ) sử dụng một số thuật toán học máy để dự đoán thành tích học tập của học sinh (Trang 27 - 29)

Tải bản đầy đủ (PDF)

(62 trang)