Áp dụng kỹ thuật gợi ý xây dựng mô hình dự báo kết quả học tập sinh viên

144 47 0
Áp dụng kỹ thuật gợi ý xây dựng mô hình dự báo kết quả học tập sinh viên

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA TP HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA - TRẦN THỊ THU TRANG ÁP DỤNG KỸ THUẬT GỢI Ý XÂY DỰNG MƠ HÌNH DỰ BÁO KẾT QUẢ HỌC TẬP SINH VIÊN LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH – THÁNG NĂM 2020 ĐẠI HỌC QUỐC GIA TP HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA - TRẦN THỊ THU TRANG ÁP DỤNG KỸ THUẬT GỢI Ý XÂY DỰNG MÔ HÌNH DỰ BÁO KẾT QUẢ HỌC TẬP SINH VIÊN LUẬN VĂN THẠC SĨ CHUYÊN NGÀNH : HỆ THỐNG THÔNG TIN QUẢN LÝ MÃ NGÀNH: 60.34.04.05 GVHD: PGS.TS THOẠI NAM TP HỒ CHÍ MINH – THÁNG NĂM 2020 CƠNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA –ĐHQG -HCM Cán hướng dẫn khoa học: PGS TS Thoại Nam Cán chấm nhận xét 1: PGS TS Nguyễn Thanh Bình Cán chấm nhận xét 2: TS Lê Hoành Sử Luận văn thạc sĩ bảo vệ Trường Đại học Bách Khoa, ĐHQG Tp.HCM ngày 25 tháng năm 2020 Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: Chủ tịch: PGS.TS Trần Minh Quang Thư ký: TS Phan Trọng Nhân Phản biện 1: PGS TS Nguyễn Thanh Bình Phản biện 2: TS Lê Hoành Sử Ủy viên: PGS TS Nguyễn Thanh Hiên Xác nhận Chủ tịch Hội đồng đánh giá LV Trưởng Khoa quản lý chuyên ngành sau luận văn sửa chữa (nếu có) CHỦ TỊCH HỘI ĐỒNG TRƯỞNG KHOA KH&KTMT ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: TRẦN THỊ THU TRANG MSHV : 1670471 Ngày, tháng, năm sinh: 01/06/1982 Nơi sinh: TPHCM Chuyên ngành: Hệ thống thông tin quản lý Mã số : 60.34.04.05 I TÊN ĐỀ TÀI: Áp dụng kỹ thuật gợi ý xây dựng mơ hình dự báo kết học tập sinh viên (tên tiếng Anh : Applying Recommender Systems for Predicting Student Performance) I NHIỆM VỤ VÀ NỘI DUNG: -II NGÀY GIAO NHIỆM VỤ : (Ghi theo QĐ giao đề tài) …………… III NGÀY HOÀN THÀNH NHIỆM VỤ: (Ghi theo QĐ giao đề tài)… IV.CÁN BỘ HƯỚNG DẪN (Ghi rõ học hàm, học vị, họ, tên): PGS.TS Thoại Nam Tp HCM, ngày tháng năm 2020 CÁN BỘ HƯỚNG DẪN CHỦ NHIỆM BỘ MÔN ĐÀO TẠO (Họ tên chữ ký) (Họ tên chữ ký) TRƯỞNG KHOA KH&KTMT (Họ tên chữ ký) LỜI CẢM ƠN Với lòng biết ơn sâu sắc nhất, em xin gửi đến Thầy Cô khoa Khoa học Kỹ thuật Máy tính trường Đại học Bách Khoa TPHCM hết lòng dạy, trang bị cho em kiến thức tảng bổ ích, với hỗ trợ gia đình tạo điều kiện, động viên, ủng hộ em trình học tập trường Đặc biệt, em xin chân thành cảm ơn PGS.TS Thoại Nam tận tâm hướng dẫn, động viên, truyền đạt nhiều kiến thức, kinh nghiệm quý báu giúp em thực luận văn Mặc dù, có nhiều cố gắng luận văn khơng thể tránh khỏi thiếu sót, chưa hồn thiện, em mong nhận ý kiến đóng góp quý báu q Thầy Cơ để em rút kinh nghiệm, tích lũy kiến thức lĩnh vực hoàn thiện Sau cùng, em xin kính chúc q Thầy Cơ gia đình dồi sức khỏe, ln thành cơng nghiệp sống i TÓM TẮT Hệ thống gợi ý ứng dụng phổ biến khoa học liệu nay, đặc biệt khai phá liệu giáo dục Hệ thống gợi ý tích hợp vào hệ thống trực tuyến để tự động phân tích liệu khứ dự đoán kết cho người dùng Mục tiêu luận án nghiên cứu áp dụng cho hệ thống khuyến nghị để dự đoán kết học tập sinh viên trường Đại học Bách Khoa - ĐHQG - TPHCM Với việc ánh xạ liệu giáo dục để tiếp cận hệ thống gợi ý phương pháp lọc cộng tác, lọc dựa tương đồng môn học-sinh viên sinh viên-sinh viên với mơ hình yếu tố tiềm ẩn Phương pháp dự đoán xếp hạng tiềm ẩn cách sử dụng tương đồng sinh viên khoa môn học để đề xuất môn học cho sinh viên Bên cạnh đó, luận án trình bày trường hợp Tiền xử lý liệu khác áp dụng cho thuật toán khác để giá trị sai số thấp tìm giải pháp phù hợp cho tập liệu Kết thực nghiệm cho thấy thuật tốn Baseline_SGD với giá trị MAE có độ xác dự báo tốt thuật tốn khác ii ABSTRACT Recommender systems are among the most popular applications of data science today, especially educational data mining Recommend system is integrated into online systems to automatically analyze the past data and predict the results for users My thesis goal statement is research and applies to the recommender systems for predicting student performance in the Ho Chi Minh City University of Technology With the mapping educational data to approach recommender systems are collaborative filtering methods, similarily-based filtering between student-subject and student-student with latent factor models This method predicts unknown ratings by using the similarities between students in the same faculty and subjects to recommend the next subjects for students Besides that, the thesis presented different data preprocessing cases that applied to different algorithms to the lowest error values and find a suitable solution for this data set The experimental results show that the Baseline_SGD algorithm with MAE values has the forecasting accuracy better than others iii LỜI CAM ĐOAN Tôi xin cam đoan luận văn “Áp dụng kỹ thuật gợi ý xây dựng mơ hình dự báo kết học tập sinh viên” nghiên cứu riêng Các số liệu, tài liệu sử dụng luận văn trung thực Tất tài liệu tham khảo, kế thừa trích dẫn tham chiếu đầy đủ iv MỤC LỤC LỜI CẢM ƠN i TÓM TẮT ii ABSTRACT iii LỜI CAM ĐOAN iv MỤC LỤC v DANH MỤC TỪ VIẾT TẮT viii DANH MỤC BẢNG ix DANH MỤC HÌNH, BIỂU ĐỒ x CHƯƠNG I: GIỚI THIỆU 1.1 Giới thiệu đề tài 1.1.1 Giới thiệu vấn đề cần nghiên cứu 1.1.2 Đối tượng nghiên cứu 1.1.3 Phạm vi nghiên cứu 1.2 Mục tiêu nghiên cứu 1.3 Nội dung nghiên cứu 1.4 Ý nghĩa khoa học đề tài 1.5 Ý nghĩa thực tiễn 1.6 Cấu trúc luận văn 1.7 Kết luận chương Giới thiệu CHƯƠNG II: CƠ SỞ LÝ THUYẾT 2.1 Tổng quan hệ thống gợi ý: 2.2 Lọc cộng tác (Collaborative Filtering) 2.2.1 Ma trận hữu ích (Ultility Matrix) 2.2.2 Hàm tương đồng (Similarity Function) 2.2.3 Hạn chế User-based Collaborative Filtering 2.3 Kỹ thuật phân rã ma trận (Matrix factorization) 2.3.1 Giải thuật Singular Value Decomposition (SVD) 10 2.3.2 Giải thuật SVD ++ 11 2.3.3 Alternative Least Square (ALS) 11 2.3.4 Giải thuật Baseline Surprise 12 2.4 Đánh giá độ xác mơ hình 12 2.5 Các cơng trình nghiên cứu bật 13 2.6 Kết luận chương II 14 CHƯƠNG III: PHÂN TÍCH VÀ GIẢI PHÁP 16 3.1 Các đặc trưng liệu sinh viên Đại học 16 3.1.1 Mô tả liệu sinh viên Đại học 16 3.1.2 Độ xiên (skewness) Kurtosis điểm sinh viên 24 3.1.3 Biểu đồ tương quan đa biến 24 3.2 Đặc tả toán 25 3.3 Giải pháp giải toán 26 3.3.1 Giải pháp đề xuất 26 v 3.3.2 Môi trường thực nghiệm 28 3.3.3 Kiến trúc tổng quan 29 3.3.4 Các bước thực Tiền xử lý liệu 29 3.4 Áp dụng kỹ thuật gợi ý dự đoán, xếp hạng điểm SVĐH 36 3.5 Kết luận chương III 37 CHƯƠNG IV: KẾT QUẢ VÀ ĐÁNH GIÁ 39 4.1 Bài tốn dự đốn điểm số đề xuất mơn học 39 4.2 Kết thực nghiệm 39 4.3 Đánh giá độ xác mơ hình thuật toán 39 4.3.1 Trường hợp (TH1): Thực nghiệm liệu khoa, giữ nguyên điểm 40 ❖ Độ đo hàm lỗi RMSE 40 ❖ Độ đo hàm lỗi MAE 41 ❖ Độ đo hàm lỗi MSE 43 4.3.2 Trường hợp (TH2): Thực nghiệm liệu khoa, loại bỏ điểm gộp điểm từ 0,1 đến thành điểm 47 ❖ Độ đo hàm lỗi RMSE 47 ❖ Độ đo hàm lỗi MAE 48 ❖ Độ đo hàm lỗi MSE 50 4.3.3 Trường hợp (TH3): Thực nghiệm liệu toàn trường để huấn luyện dùng liệu khoa để kiểm thử Loại bỏ điểm gộp điểm từ 0,1 đến thành điểm 54 ❖ Độ đo hàm lỗi RMSE 54 ❖ Độ đo hàm lỗi MAE 55 ❖ Độ đo hàm lỗi MSE 56 4.4 Kết luận chương IV 59 CHƯƠNG V: TỔNG KẾT 62 5.1 Đối chiếu mục tiêu, nội dung nghiên cứu 62 5.2 Thuận lợi khó khăn thực đề tài 62 5.2.1 Thuận lợi đề tài 62 5.2.2 Khó khăn thực đề tài 62 5.3 Kết luận chung đề tài 63 5.4 Đề xuất hướng phát triển đề tài tương lai 64 PHỤ LỤC 67 PHỤ LỤC A: KẾT QUẢ THỰC NGHIỆM 67 A.1 Trường hợp 1: Thực nghiệm liệu khoa, giữ nguyên điểm 67 ❖ Kết thực nghiệm sinh viên khoa MT 67 ❖ Kết thực nghiệm sinh viên khoa BD 68 ❖ Kết thực nghiệm sinh viên khoa CK 70 ❖ Kết thực nghiệm sinh viên khoa DC 71 ❖ Kết thực nghiệm sinh viên khoa GT 72 ❖ Kết thực nghiệm sinh viên khoa HC 73 vi Hình A.122: Kết với giải thuật Baseline_ALS khoa GT Hình A.123: Kết với giải thuật SVD khoa GT Hình A.124: Kết với giải thuật SVD++ khoa GT 108 ❖ Kết thực nghiệm sinh viên khoa HC Hình A.125: Kết với giải thuật Baseline_SGD khoa HC Hình A.126: Kết với giải thuật Baseline_ALS khoa HC Hình A.127: Kết với giải thuật SVD khoa HC 109 Hình A.128: Kết với giải thuật SVD++ khoa HC ❖ Kết thực nghiệm sinh viên khoa MO Hình A.129: Kết với giải thuật Baseline_SGD khoa MO Hình A.130: Kết với giải thuật Baseline_ALS khoa MO 110 Hình A.131: Kết với giải thuật SVD khoa MO Hình A.132: Kết với giải thuật SVD++ khoa MO ❖ Kết thực nghiệm sinh viên khoa QL Hình A.133: Kết với giải thuật Baseline_SGD khoa QL 111 Hình A.134: Kết với giải thuật Baseline_ALS khoa QL Hình A.135: Kết với giải thuật SVD khoa QL Hình A.136: Kết với giải thuật SVD++ khoa QL 112 ❖ Kết thực nghiệm sinh viên khoa UD Hình A.137: Kết với giải thuật Baseline_SGD khoa UD Hình A.138: Kết với giải thuật Baseline_ALS khoa UD 113 Hình A.139: Kết với giải thuật SVD khoa UD Hình A.140: Kết với giải thuật SVD++ khoa UD 114 ❖ Kết thực nghiệm sinh viên khoa VL Hình A.141: Kết với giải thuật Baseline_SGD khoa VL Hình A.142: Kết với giải thuật Baseline_ALS khoa VL 115 Hình A.143: Kết với giải thuật SVD khoa VL Hình A.144: Kết với giải thuật SVD++ khoa VL 116 ❖ Kết thực nghiệm sinh viên khoa VP Hình A.145: Kết với giải thuật Baseline_SGD khoa VP Hình A.146: Kết với giải thuật Baseline_ALS khoa VP Hình A.147: Kết với giải thuật SVD khoa VP 117 Hình A.148: Kết với giải thuật SVD++ khoa VP ❖ Kết thực nghiệm sinh viên khoa XD Hình A.149: Kết với giải thuật Baseline_SGD khoa XD Hình A.150: Kết với giải thuật Baseline_ALS khoa XD 118 Hình A.151: Kết với giải thuật SVD khoa XD Hình A.152: Kết với giải thuật SVD++ khoa XD ❖ Kết thực nghiệm sinh viên khoa PD Hình A.153: Kết với giải thuật Baseline_SGD khoa PD 119 Hình A.154: Kết với giải thuật Baseline_ALS khoa PD Hình A.155: Kết với giải thuật SVD khoa PD Hình A.156: Kết với giải thuật SVD++ khoa PD 120 PHỤ LỤC B: BẢNG ĐỐI CHIẾU THUẬT NGỮ ANH – VIỆT STT Thuật ngữ Tiếng Anh Thuật ngữ Tiếng Việt Hồi quy Biểu đồ hộp Biểu đồ bong bóng Độ xiên Lọc cộng tác CF Hệ thống gợi ý RS 10 11 12 Regression Boxplot Bubble chart Skewness Collaborative Filtering Recommendation System Singular Vector Decomposition Alternative Least Square Root Mean Square Error Mean Squared Error Mean Absolute Error Graphical User Interface Từ viết tắt Thuật toán SVD Thuật toán ALS ALS Sai số bình phương trung bình Sai số tồn phương trung bình Sai số tuyệt đối trung bình RMSE MSE MAE Giao diện đồ họa người dùng GUI 121 LÝ LỊCH TRÍCH NGANG Họ tên: TRẦN THỊ THU TRANG Ngày, tháng, năm sinh: 01/06/1982 Nơi sinh: TPHCM Địa liên lạc: 71 đường số 13, phường 16, quận Gị Vấp, TPHCM Q TRÌNH ĐÀO TẠO 2001 – 2006: học trường Đại học Văn Hiến, TPHCM 2016 – 2020: học Thạc sĩ, trường Đại học Bách Khoa, TPHCM QUÁ TRÌNH CƠNG TÁC 2006 - 2008: làm việc phịng Kế hoạch phát triển Hạ tầng mạng, FPT Telecom 2008 - 2019: công tác Cục Kỹ thuật Nghiệp vụ, Tổng cục An ninh, Bộ Công an 122 ... giảng dạy cho môn học phù hợp • Ý nghĩa thực tiễn sinh viên Đại học Dựa vào kết học tập sinh viên mơn học, dự đốn môn học mà sinh viên học học kỳ để sinh viên đăng ký mơn học có kết học tập tốt nhất,... ? ?áp dụng kỹ thuật gợi ý xây dựng mơ hình dự báo kết học tập sinh viên Đại học? ?? từ liệu có trường Đại học Bách Khoa - TPHCM Bài tốn đặt xây dựng mơ hình phân tích dự báo xếp hạng cuối học kỳ dựa... kỳ dựa kết học tập sinh viên đề xuất gợi ý môn học cho sinh viên môn học dựa liệu khứ kết học tập sinh viên khoa học theo môn học cụ thể Từ kết đề xuất đó, sinh viên lựa chọn mơn học có kết tốt

Ngày đăng: 02/03/2021, 20:44

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan