Kết quả và đánh giá

Một phần của tài liệu (LUẬN văn THẠC sĩ) sử dụng một số thuật toán học máy để dự đoán thành tích học tập của học sinh (Trang 50 - 54)

Việc thực hiện dự đoán được em xây dựng thành web demo cho thuận tiện. Sau khi lựa chọn thuật toán, người dùng chọn tập test hoặc dữ liệu cần dự đoán để upload lên. Rồi chọn sử dụng tất cả feature hay sử dụng lựa chọn feature ảnh hưởng nhất. Khi chạy, hệ thống sẽ đưa ra điểm trung bình môn học của dữ liệu cần dự đoán và xếp loại tương ứng.

Hình ảnh 3.3 và 3.4 là kết quả dự đoán của các bạn: Trần Thế Anh, Vũ Tuấn Anh và Nguyễn Minh Lâm với việc sử dụng all feature và feature selection tương ứng. Kết quả với tất cả các dữ liệu test cũng được hiển thị theo 10 dòng 1, ở đây e chỉ đưa ra một số bạn vì màn hình không hiển thị hết. Khi cần có thể kéo các thanh cuộn để biết. Rõ ràng ta thấy khi sử dụng feature selection, kết quả chính xác hơn.

Hình 3.3: Kết quả dự đoán điểm của một số học sinh khi sử dụng all feature

Từ một tập dữ liệu data thu thập được một cách khách quan có thể dễ dàng xác định được các feature đặc biệt ảnh hưởng đến thành tích học tập của học sinh sau một chuỗi các bước thiết kế feature, thu thập thông tin chuẩn hóa dữ liệu xây dựng model. Cuối cùng xây dựng model dự đoán được năng lực học tập của học sinh. Từ đó ta có thể ứng dụng

Hình 3.4: Kết quả dự đoán điểm của một số học sinh khi sử dụng feature selection

và phát triển thêm để đưa ra đánh giá năng lực của học sinh, tìm những vấn đề khó khăn vướng mắc nan giải và đưa ra những phương pháp học tập phù hợp.

Độ chính xác của model đạt được là 80% tuy chưa phải là con số lý tưởng nhưng một phần là chấp nhận được và có thể sử dụng.

Trong luận văn này ngoài kết quả đạt được cũng đang có nhất nhiều hạn chế mắc phải tồn đọng cần phải giải quyết thêm. Lượng dữ liệu đang còn khá ít chưa phản ánh bao quát cho toàn bộ bài toán cần giải quyết dẫn tới năng lực dự đoán kém.

Dữ liệu Null đang còn nhiều việc thu thập và cách xử lý loại dữ liệu này chưa được tốt. Nên hạn chế loại dữ liệu này nhất là ở các feature nhạy cảm không thể tính toán.

Thu thập thêm dữ liệu tìm kiếm và thăm dò các phường pháp process data khác nhau mục tiêu cuối cùng là làm cho dữ liệu phong phú và phản ánh một cách đúng đắn khách quan.

KẾT LUẬN CHUNG

Dưới sự chỉ bảo tận tình của của Giáo viên hướng dẫn, căn cứ vào đề cương luận văn đã được phê duyệt, luận văn đã đạt được một số nhiệm vụ sau:

(1) Tìm hiểu về mô hình giải quyết một bài toán thực tế bằng học máy. Vận dụng mô hình để tiếp cận giải quyết một vấn đề cụ thể.

Nghiên cứu khá chi tiết các thuật toán học máy từ phân tích toán học, đến tìm nghiệm tối ưu, cài đặt thành thạo trên môi trường Python và các IDE chuyên dùng.

(2) Hiểu rõ và thực hiện được quy trình thao tác với các đặc trưng của dữ liệu từ đó làm sạch, chuẩn hóa, điền khuyết, lựa chọn các thuộc tính ảnh hưởng nhiều đến dữ liệu.

(3) Hiểu và thực hành được quá trình training và tối ưu hóa, lựa chọn tham số cho một mô hình học máy.

(4) Đưa ra được một số dự đoán, đánh giá với học sinh có nhãn và chưa có nhãn.

Trên cơ sở của các kết quả đã đạt được, nếu có thể tiếp tục nghiên cứu thì luận văn là nền tảng tốt để nghiên cứu thêm một số vấn đề sau:

• Các phương pháp học máy ứng dụng cho dự đoán, phân lớp. • Tối ưu hóa tham số mô hình học máy.

TÀI LIỆU THAM KHẢO

[1] Vũ Hữu Tiệp, Machine learning cơ bản. Ebook on machinelearning- coban.com, 2020.

[2] Hoàng Xuân Huấn , Giáo Trình học máy. NXB ĐHQG Hà Nội, 2015.

[3] Aurélien Géron, Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow. Published by O’Reilly Media, 2019.

[4] Mehryar Mohri, Afshin Rostamizadeh, Ameet Talwalkar, Founda- tions of Machine Learning. Massachusetts Institute of Technology, 2018.

[5] Peter Flach, Machine learning, the art and science of algorithms that make sence of data.. Cambridge, 2012.

[6] Murat Pojon, Using Machine Learning to Predict Student Perfor- mance. M. Sc. Thesis, University of Tampere, 2017.

[7] Elaf Abu Amrieh, Thair Hamtini and Ibrahim Aljarah, Mining Ed- ucational Data to Predict Student’s academic Performance using Ensemble Methods. International Journal of Database Theory and Application Vol.9, No.8 (2016), pp.119-136.

[8] Kuca Danijel, Juricic Vedran and Dambic Goran,Machine Learning in Education - a Survey of Current Research Trends. Proceedings of the 29th DAAAM International Symposium, pp.0406-0410, B. Katalinic (Ed.), Published by DAAAM International, ISBN 978-3- 902734-20-4, ISSN 1726-9679, Vienna, Austria, 2018.

PHỤ LỤC -CODE CHƯƠNG TRÌNH

Một phần của tài liệu (LUẬN văn THẠC sĩ) sử dụng một số thuật toán học máy để dự đoán thành tích học tập của học sinh (Trang 50 - 54)

Tải bản đầy đủ (PDF)

(62 trang)