Bộ số liệu và tính năng

Một phần của tài liệu Dự Đoán Điểm học kỳ tiếp theo bằng phương pháp học máy, học sâu (Trang 30 - 33)

CHƯƠNG 2: MỘT SỐ PHƯƠNG PHÁP HỌC MÁY SỬ DỤNG TRONG BÀI TOÁN DỰ ĐOÁN KẾT QUẢ HỌC TẬP

3.2 Bộ số liệu và tính năng

Bộ dữ liệu được thu thập từ một trường đại học tự trị ở Singapore bao gồm bốn nhóm liên tiếp (2011-2014) gồm các sinh viên đại học từ cùng một chương trình cấp bằng. Sinh viên bắt buộc phải hoàn thành 8 học kỳ của chương trình.

Bảng 3.2 cho thấy số liệu thống kê tập dữ liệu. Nó bao gồm 618 sinh viên và 691 khóa học. Tổng cộng, chúng tôi có 19.655 cặp khóa sinh viên viên liên quan đến điểm số, được gọi là cặp sinh viên-khóa học. Sinh viên từ nhóm 4 được sử dụng làm nhóm thử nghiệm để cho phép sử dụng nhiều dữ liệu hơn trong quá trình đào tạo. Trường đại học triển khai 12 chữ cái chấm điểm được quy đổi thành các giá trị số để dự đoán điểm như sau. A+, A, A-, B+, B, B-, C+, C, C-, D+, D và F được ánh xạ tới 4.3, 4.0, 3.7, 3.3, 3.0, 2.7, 2.3, 2.0, 1.7, 1.3, 1.0 và 0.0 tương ứng.

Bảng 3.2 Bảng thống kê tập dữ liệu

30

Bảng 3.3 Bảng nhóm sinh viên-khóa học của nhóm mục tiêu 4 (CSS: sinh viên bắt đầu nguội, CSC: khóa bắt đầu nguội, NCS: nhóm không bắt đầu nguội)

Các cặp sinh viên-môn học "khởi đầu nguội" của một kỳ học mục tiêu là những cặp có sinh viên hoặc môn học mới đối với kỳ học đó. Chúng không xuất hiện trong tập huấn luyện, nhưng lại xuất hiện trong tập kiểm tra. Như được thể hiện trong Bảng 2, kỳ học t1 thấy tất cả các cặp khởi đầu nguội với sinh viên mới (được biểu thị bằng CSS). Tuy nhiên, các kỳ học khác thì gần như không gặp sinh viên mới. Các cặp liên quan đến các môn học mới (được biểu thị bằng CSC) thì tương đối ít vì không có nhiều môn học mới được giới thiệu trong mỗi kỳ học. Hầu hết các môn học mới được quan sát trong các kỳ học từ t6 đến t8, ba kỳ học cuối cùng của chương trình. Các cặp khác là các cặp không phải là khởi đầu nguội (NCS).

3.2.2 Đặc điểm của Sinh viên, Khóa học

"Đặc điểm sinh viên tĩnh": đề cập đến các đặc điểm hoặc thuộc tính của một sinh viên không thay đổi theo thời gian và không liên quan đến bất kỳ giai đoạn cụ thể nào trong chương trình giáo dục. Những đặc điểm này thường bao gồm các khía cạnh như chuyên ngành của sinh viên, giới tính, trường cũ (nơi sinh viên trước đây đã học), và khóa học (nhóm sinh viên cùng nhập học vào một chương trình).

31

Nét sinh viên năng động: Đây là những đặc điểm của sinh viên bắt nguồn từ dữ liệu và giá trị của chúng có thể khác nhau trong các điều khoản chương trình mục tiêu khác nhau. Các tính năng này đặc biệt hữu ích để xác định thành tích mới nhất và khối lượng học tập của sinh viên, chẳng hạn như điểm trung bình của sinh viên trong học kỳ chương trình trước ( điểm trung bình cuối kỳ) và cho đến thời hạn chương trình trước đó (kỳ hạn kiêm gpa), số đơn vị tín chỉ (CU) mà sinh viên nhận được cho đến học kỳ trước của chương trình (tổng số giờ) và được đăng ký trong thời hạn chương trình mục tiêu (thuật ngữ chrs), số CU trung bình cho mỗi học kỳ chương trình do một sinh viên thực hiện (tốc độ), số lượng khóa học mà một sinh viên tham gia trong mỗi môn học cho đến học kỳ chương trình mục tiêu (phân phối đĩa), CU tương đối mà một sinh viên đạt được so với tất cả sinh viên trong cùng một nhóm (tổng số rel) và tương đối kỳ hạn kiêm gpa của một sinh viên so với của đoàn hệ (liên quan đến cgpa).

Tính năng khóa học tĩnh: Đây là những tính năng của một khóa học cj không thay đổi theo thời gian: kỷ luật của khóa học (đĩa), CU (chrs), và mức (trình độ).

Tính năng khóa học năng động: Đây là những tính năng của một khóa học cj thay đổi theo thời gian: người hướng dẫn của cj (iid), số sinh viên tham gia cjtrong thời hạn chương trình mục tiêu (số đã đăng ký) và trong tất cả các điều khoản chương trình trước đó (tổng số ghi danh), điểm trung bình ( thuật ngữ cgrade) và phân bố điểm (thuật ngữ hạ cấp) thu được bởi các sinh viên của nhóm trước đó khi họ lấy cjtrong học kỳ chương trình mục tiêu, điểm trung bình (học kỳ kiêm cấp) và phân bố điểm (kỳ hạn kiêm dgrade) thu được bởi các sinh viên của cùng một nhóm và các nhóm trước đó khi họ tham gia cj trong bất kỳ điều khoản chương trình nào trong quá khứ.

Các tính năng tương tác giữa sinh viên và khóa học: Như chúng tôi đã biết sinh viên nào học khóa học nào cj trong chương trình mục tiêu nhưng không phải lớp, chúng tôi có thể khai thác thông tin này để rút ra một số tính năng

32

nắm bắt gián tiếp tương tác giữa S và cj để chúng tôi xác định xem S sẽ thực hiện tốt trong cj. Chúng tôi lấy được liên quan do thời hạn chương trình S đăng ký cho cj liên quan đến thời hạn chương trình, các sinh viên khác trong cùng một nhóm tham gia cj. Chúng tôi cũng rút ra lớp đó là điểm trung bình đạt được bởi S khi tham gia bất kỳ khóa học chia sẻ cùng một kỷ luật khóa học như cj

trong các nhiệm kỳ trước.

Một phần của tài liệu Dự Đoán Điểm học kỳ tiếp theo bằng phương pháp học máy, học sâu (Trang 30 - 33)

Tải bản đầy đủ (PDF)

(75 trang)