Thu thập dữ liệu cho mơ hình

Một phần của tài liệu (LUẬN văn THẠC sĩ) xây dựng mô hình khuyến cáo khả năng nghỉ học của sinh viên trường cao đẳng kỹ thuật công nghệ bà rịa vũng tàu (Trang 61 - 62)

2.3 .Hàm xử lý

3.2. Thu thập dữ liệu cho mơ hình

Dữ liệu đóng một vai trị rất quan trọng trong các phương pháp sử dụng mạng Nơron. Chất lượng, tính sẵn có, độ tin cậy và phù hợp của dữ liệu được sử dụng để phát triển hệ thống giúp cho các giải pháp thành cơng.

Nhiều mơ hình đơn giản cũng có thể đạt được những kết quả tốt được nếu như dữ liệu được xử lý tốt, phát hiện được các thơng tin quan trọng. Trong khi đó, các mơ

hình tốt có thể sẽ khơng cho ta các kết quả như mong muốn nếu hệ thống dữ liệu đưa vào quá phức tạp và rắc rối khơng đúng mục tiêu.

Các thơng tin có thể thu thập tại trường để thực hiện xây dựng mơ hình bao gồm: họ và tên, ngày sinh, nơi sinh, quê quán, ngành học, tổng số các môn học trong 2 học kỳ đầu, điểm tổng kết của từng môn ở 2 học kỳ đầu, tổng số buổi vắng trong học kỳ 1 và 2, số lần cảnh cáo kỷ luật, nợ học phí từng kỳ, bảo lưu, số mơn cịn nợ trong học kỳ, điểm tích lũy tồn khóa, xếp loại rèn luyện của mỗi học sinh, sinh viên.

Dữ liệu thu thập thông tin học sinh, sinh viên của nhà trường được lấy từ năm 2017 đến năm 2019 với tổng số là của 2432 học sinh, sinh viên khóa T18,T19 hệ trung cấp và CD8, CD9, của hệ cao đẳng thuộc các khoa Điện, Cơ khí, Cơng nghệ thơng tin, May thời trang và chế biến thực phẩm. Tuy nhiên để làm giảm bớt độ phức tạp tính tốn dữ liệu đầu vào cho mơ hình thì dữ liệu phải được lựa chọn.

Lựa chọn dữ liệu cho huấn luyện là khóa học năm 2017-2018, dữ liệu cho tập kiểm tra là khóa học 2018-2019 được lấy từ phịng đào tạo, phịng cơng tác học sinh, sinh viên nên có độ tin cậy rất lớn.

Một phần của tài liệu (LUẬN văn THẠC sĩ) xây dựng mô hình khuyến cáo khả năng nghỉ học của sinh viên trường cao đẳng kỹ thuật công nghệ bà rịa vũng tàu (Trang 61 - 62)