1. Trang chủ
  2. » Luận Văn - Báo Cáo

LUẬN án TIẾN sĩ CHUYÊN NGÀNH hệ THỐNG THÔNG TIN xây DỰNG mô HÌNH tìm KIẾM và gợi ý tài NGUYÊN học tập

156 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây Dựng Mô Hình Tìm Kiếm Và Gợi Ý Tài Nguyên Học Tập
Tác giả Trần Thanh Điện
Người hướng dẫn PGS.TS. Nguyễn Thái Nghe
Trường học Trường Đại Học Cần Thơ
Chuyên ngành Hệ Thống Thông Tin
Thể loại luận án tiến sĩ
Năm xuất bản 2022
Thành phố Cần Thơ
Định dạng
Số trang 156
Dung lượng 1,95 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CẦN THƠ TRẦN THANH ĐIỆN XÂY DỰNG MƠ HÌNH TÌM KIẾM VÀ GỢI Ý TÀI NGUYÊN HỌC TẬP LUẬN ÁN TIẾN SĨ CHUYÊN NGÀNH HỆ THỐNG THÔNG TIN MÃ SỐ 62 48 01 04 2022 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CẦN THƠ TRẦN THANH ĐIỆN MÃ SỐ NCS: P1617001 XÂY DỰNG MƠ HÌNH TÌM KIẾM VÀ GỢI Ý TÀI NGUYÊN HỌC TẬP LUẬN ÁN TIẾN SĨ CHUYÊN NGÀNH HỆ THỐNG THÔNG TIN MÃ SỐ 62 48 01 04 NGƯỜI HƯỚNG DẪN PGS.TS NGUYỄN THÁI NGHE 2022 LỜI CẢM TẠ Để hồn thành luận án này, tơi nhận quan tâm, giúp đỡ hướng dẫn nhiệt tình từ q Thầy Cơ thuộc Khoa Cơng nghệ Thông tin Truyền thông, Trường Đại học Cần Thơ hỗ trợ tích cực đồng nghiệp Đặc biệt, xin gửi lời cảm ơn chân thành sâu sắc đến PGS.TS Nguyễn Thái Nghe tận tình dẫn, động viên tạo điều kiện thuận lợi cho tơi suốt q trình học tập nghiên cứu Tôi xin gửi lời cảm ơn đến TS Nguyễn Thanh Hải hỗ trợ tơi q trình triển khai thực nghiệm nghiên cứu Xin chân thành cảm ơn quý Thầy Cô truyền đạt thêm nhiều kiến thức, quan tâm, hỗ trợ tạo điều kiện cho trình học tập Khoa Cơng nghệ Thơng tin Truyền thông thân yêu, nơi theo học đại học giai đoạn 1993-1998 Xin gửi lời cảm ơn chân thành đến Lãnh đạo Nhà trường, Ban Giám đốc Trung tâm Thông tin Quản trị mạng, Nhà xuất Đại học Cần Thơ đồng nghiệp tạo điều kiện để tơi học tập nâng cao trình độ chun môn giúp đỡ suốt thời gian học tập Sau xin chân thành cảm ơn đến gia đình người thân chia sẻ, động viên tạo điều kiện tốt để tơi hồn thành luận án TĨM TẮT Trong thời gian qua, với phát triển nhanh công nghệ thông tin công nghệ hỗ trợ giáo dục trực tuyến, nhu cầu học tập mở ngày gia tăng, có học tập trực tuyến nhằm ứng phó với thay đổi thực tế, đặc biệt bối cảnh hạn chế tiếp xúc trực tiếp người dạy người học tình hình dịch bệnh nhiều lý khác Trong luận án này, giải pháp đề xuất nhằm cung cấp tài nguyên học tập đáp ứng tốt nhu cầu lực người học Các nghiên cứu thực với đóng góp trình bày sau Đầu tiên, cách tiếp cận dựa kỹ thuật học sâu với mạng nơ-ron truyền thẳng đa tầng MLP đề xuất đùng để phân loại tài nguyên học tập, phục vụ cho trình tìm kiếm tài nguyên Trong thực nghiệm, mơ hình phân loại với kỹ thuật MLP so sánh với kỹ thuật học máy khác; kết cho thấy cách tiếp cận cho kết phân loại khả thi hiệu kỹ thuật truyền thống tập liệu, đặc biệt liệu cân Thứ hai, hai cách tiếp cận tìm kiếm tài nguyên học tập có quan tâm vấn đề ngữ nghĩa đề xuất, tìm kiếm dựa tương đồng nội dung văn dựa mạng ngữ nghĩa ontology Ở cách tiếp cận, truy vấn phân loại để xác định lĩnh vực nhằm thu hẹp khơng gian tìm kiếm trước tìm lĩnh vực tương ứng tài nguyên học tập xây dựng sẵn Kết thực nghiệm cho thấy, cách tiếp cận khả thi để xây dựng mơ hình tìm kiếm tài nguyên học tập, đặc biệt tìm kiếm có quan tâm vấn đề ngữ nghĩa Thứ ba, mơ hình dự đốn kết học tập đề xuất với ba cách tiếp cận dựa kỹ thuật học sâu, gồm xây dựng mơ hình dự đốn cho tồn sinh viên sử dụng mạng nơron tích chập CNN, mơ hình dự đốn theo nhóm lực học tập sử dụng mạng nơ- ron đa tầng MLP kỹ thuật học máy rừng ngẫu nhiên RF, mô hình dự đốn theo sinh viên sử dụng nhớ ngắn dài hạn LSTM Các kết thực nghiệm cho thấy mơ hình đề xuất cho kết dự đoán tốt, đặc biệt sử dụng kỹ thuật tiền xử lý liệu trước đưa vào mơ hình học dự đốn Cuối cùng, mơ hình gợi ý tài nguyên học tập sử dụng kỹ thuật phân rã ma trận sâu DMF, mở rộng từ kỹ thuật phân rã ma trận chuẩn MF, đề xuất Mơ hình kiểm chứng nhiều tập liệu tài nguyên học tập kết học tập sinh viên, so sánh với kỹ thuật khác hệ thống gợi ý Kết cho thấy mơ hình DMF có hiệu suất dự đốn xếp hạng tốt so với kỹ thuật khác, từ sử dụng để gợi ý tài nguyên học tập phù hợp với lực người học Từ khóa: Tài nguyên học tập, phân loại tài nguyên học tập, tìm kiếm tài ngun học tập, dự đốn kết học tập, gợi ý tài nguyên học tập, kỹ thuật học máy học sâu ABSTRACT In recent years, along with the rapid development of information technology, there are various technologies that support for online education to effectively exploit available learning resources to meet the needs of online learning, especially in the context of limited face-to-face classes due to the epidemic situation as well as many other reasons With the continuous increase of those resources, it is a challenge for learners to be able to search for suitable learning resources In this dissertation, we propose state-of-the-art approaches to help learners search learning resources meeting their needs and capacities The contributions of the thesis are presented as follows Firstly, an approach to use deep learning with Multilayer Perceptron (MLP) for the classification tasks of learning resources is proposed The experimental results show that by using this approach, the results get even better than using other traditional machine learning algorithms, especially on imbalanced datasets Secondly, approaches for searching learning resources based on document similarity and based on semantics are proposed For similarity-based searching, cosine similarity and word-order similarity of the documents are combined For semantic-based searching, searching learning resources using ontologies is proposed In both of the approaches, the query is classified to determine the topic to aim narrowing the search topics before searching on the corresponding one of the built-in learning resources The experimental results show that these approaches are feasible to build models for searching learning resources related semantics Thirdly, student performance prediction models which are proposed based on three approaches using deep learning techniques include a prediction model for all students using a convolutional neural network (CNN), a group-based prediction model for students who have similar learning performance using multilayer perceptron (MLP) and machine learning technique of RF, and a prediction model for each student using long short-term memory (LSTM) The experimental results show that the proposed methods provides good prediction results The results are feasible for applying to practical cases, especially when the data are preprocessed before fetching them into the predictive learning model Finally, a deep matrix factorization (DMF) model extended from the standard matrix factorization (MF) is proposed for learning resources recommendation Two dataset groups including datasets of learning resources and datasets of learning performance are used to validate the model, and the model is also compared with other techniques of the recommender system The experimental results show that the proposed DMF model can perform well on various datasets, especially large-scale datasets It can be used for recommending suitable learning resources for students Keywords: Learning resources, topic classification, learning resources searching, performance prediction, learning resources recommendation, deep learning and machine learning LỜI CAM ĐOAN Tôi tên Trần Thanh Điện, nghiên cứu sinh ngành Hệ thống thơng tin, khóa 2017 Tơi xin cam đoan luận án cơng trình nghiên cứu khoa học thực thân hướng dẫn PGS.TS Nguyễn Thái Nghe Các thông tin sử dụng tham khảo luận án thu thập từ nguồn đáng tin cậy, kiểm chứng, cơng bố rộng rãi tơi trích dẫn nguồn gốc rõ ràng phần danh mục tài liệu tham khảo Các kết nghiên cứu trình bày luận án tơi thực cách nghiêm túc, trung thực không trùng lắp với đề tài khác công bố trước Tơi xin lấy danh dự uy tín thân để đảm bảo cho lời cam đoan Cần Thơ, ngày Người hướng dẫn Nguyễn Thái Nghe tháng 01 năm 2022 Nghiên cứu sinh Trần Thanh Điện MỤC LỤC CHƯƠNG GIỚI THIỆU 1.1 Tính cấp thiết nghiên cứu 1.2 Mục tiêu, đối tượng, phạm vi phương pháp nghiên cứu 1.3 Nội dung nghiên cứu hướng tiếp cận luận án 1.3.1 Xây dựng mơ hình phân loại tài ngun học tập 1.3.2 Xây dựng mơ hình tìm kiếm tài ngun học tập 1.3.3 Xây dựng mô hình dự đốn kết học tập 1.3.4 Xây dựng mơ hình gợi ý tài nguyên học tập 1.4 Các đóng góp luận án 1.5 Bố cục luận án CHƯƠNG CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU LIÊN QUAN .10 2.1 Khái quát hệ thống quản lý tài nguyên học tập 10 2.1.1 Tài nguyên học tập hệ thống quản lý tài nguyên học tập .10 2.1.2 Hệ thống quản lý tài nguyên học tập có quan tâm ngữ nghĩa 10 2.1.3 Hệ thống gợi ý tài nguyên học tập 10 2.2 Một số kỹ thuật phân loại văn 11 2.2.1 Phân loại với máy véc-tơ hỗ trợ SVM 12 2.2.2 Phân loại sử dụng giải thuật định rừng ngẫu nhiên 14 2.2.3 Phân loại với kỹ thuật học sâu 14 2.3 Các kỹ thuật tính tốn độ tương đồng văn 15 2.3.1 Độ tương đồng .15 2.3.2 Một số phương pháp tính độ tương đồng văn 15 2.4 Các kỹ thuật xây dựng mạng ngữ nghĩa phục vụ tìm kiếm 17 2.4.1 Khái quát web ngữ nghĩa 17 2.4.2 Mơ hình liệu biểu diễn lĩnh vực (ontology) 19 2.5 Hệ thống gợi ý kỹ thuật hệ thống gợi ý 21 2.5.1 Tổng quan hệ thống gợi ý .21 2.5.2 Các nhóm giải thuật hệ thống gợi ý 23 2.5.3 Một số kỹ thuật hệ thống gợi ý 26 2.6 Các nghiên cứu liên quan 46 2.6.1 Nghiên cứu phân loại văn 46 2.6.2 Nghiên cứu tìm kiếm tài liệu 48 2.6.3 Nghiên cứu dự đoán xếp hạng gợi ý 50 2.6.4 Thảo luận đề xuất nghiên cứu luận án .52 CHƯƠNG MƠ HÌNH PHÂN LOẠI TÀI NGUN HỌC TẬP .54 3.1 Giới thiệu .54 3.2 Mơ hình phân loại tài ngun học tập 55 3.2.1 Phân loại tài nguyên học tập 55 3.2.2 Tiền xử lý liệu 56 3.2.3 Mơ hình phân loại tài ngun học tập 58 3.3 Mô tả tập liệu độ đo đánh giá mô hình 59 3.4 Cài đặt siêu tham số môi trường thực nghiệm 59 3.5 Kết thực nghiệm 61 3.6 Tổng kết chương 63 CHƯƠNG MƠ HÌNH TÌM KIẾM TÀI NGUN HỌC TẬP 64 4.1 Giới thiệu .64 4.2 Tìm kiếm tài nguyên học tập dựa độ tương đồng văn .65 4.2.1 Mơ hình đề xuất 66 4.2.2 Mô tả liệu phương pháp đánh giá 68 4.2.3 Kết thực nghiệm 69 4.3 Tìm kiếm tài nguyên học tập dựa mạng ngữ nghĩa ontology 72 4.3.1 Mơ hình đề xuất 73 4.3.2 Mô tả liệu 76 4.3.3 Kết thực nghiệm 76 4.4 Tăng tốc xử lý liệu tìm kiếm kỹ thuật xử lý liệu lớn 78 4.5 Tổng kết chương 78 CHƯƠNG MƠ HÌNH DỰ ĐỐN KẾT QUẢ HỌC TẬP 80 5.1 Giới thiệu .80 5.2 Khái quát dự đoán kết học tập 81 5.2.1 Dự đoán kết học tập dựa hồ sơ cá nhân 82 5.2.2 Dự đoán kết học tập theo kỹ thuật lọc cộng tác hệ thống gợi ý .82 5.3 Mơ hình dự đốn kết học tập tồn liệu sinh viên 82 5.3.1 Mô hình đề xuất 82 5.3.2 Mô tả liệu 83 5.3.3 Tiền xử lý liệu 85 5.3.4 Kết thực nghiệm 87 5.4 Mô hình dự đốn kết học tập theo nhóm lực học tập .90 5.4.1 Mơ hình đề xuất 91 5.4.2 Mô tả liệu 92 5.4.3 Kết thực nghiệm 93 5.5 Mô hình dự đốn kết học tập theo sinh viên 95 5.5.1 Mô tả liệu thực nghiệm tiền xử lý liệu 95 5.5.2 Mơ hình đề xuất chuẩn hóa liệu 96 5.5.3 Kết thực nghiệm 98 5.6 Tổng kết chương 100 CHƯƠNG MƠ HÌNH GỢI Ý TÀI NGUYÊN HỌC TẬP 101 6.1 Giới thiệu .101 6.2 Khái quát vấn đề gợi ý tài nguyên học tập 102 6.2.1 Đối với liệu tài nguyên học tập 102 6.2.2 Đối với liệu môn học .103 6.3 Mơ hình gợi ý tài ngun học tập mơ hình phân rã ma trận sâu 103 6.4 Các phương pháp hệ thống gợi ý 105 6.5 Mô tả liệu thực nghiệm 105 6.6 Kết thực nghiệm 107 6.6.1 Kết thực nghiệm tập liệu tài nguyên học tập 107 6.6.2 Kết thực nghiệm tập liệu kết học tập 109 6.7 Tổng kết chương 111 CHƯƠNG KẾT LUẬN VÀ HƯỚNG NGHIÊN CỨU TIẾP THEO .112 7.1 Kết luận 112 7.2 Hướng nghiên cứu 113 CÁC CƠNG TRÌNH ĐÃ CÔNG BỐ 115 TÀI LIỆU THAM KHẢO 117 PHỤ LỤC 129 PHỤ LỤC 131 DANH SÁCH HÌNH Hình 1.1: Kiến trúc tổng qt mơ tả nội dung nghiên cứu luận án Hình 2.1: Phân loại tuyến tính với SVM 12 Hình 2.2: SVM đa lớp với One-vs-All (a) One-vs-One (b) 13 Hình 2.3: Sơ đồ phân loại câu hỏi với SVM 14 Hình 2.4: Kiến trúc phân tầng semantic web (Berners-Lee et al., 2001) 18 Hình 2.5: Các thành phần ontology 19 Hình 2.6: Bộ ba RDF 20 Hình 2.7: Ma trận biểu diễn liệu RS (user-item-rating matrix) 22 Hình 2.8: Minh họa phương pháp gợi ý dựa lọc nội dung (Doshi, 2019) 24 Hình 2.9: Minh họa phương pháp gợi ý dựa lọc cộng tác (Doshi, 2019) 25 Hình 2.10: Minh họa kỹ thuật phân rã ma trận 28 Hình 2.11: Minh họa kỹ thuật phân rã ma trận chiều (Dunlavy et al., 2011) 30 Hình 2.12: Minh họa kỹ thuật phân rã TF 31 Hình 2.13: Phân loại mạng nơ-ron sâu thành hai loại (Zhang et al., 2019) .32 Hình 2.14: Minh họa mạng CNN với nhiều tầng tích chập (MathWorks, 2018) 34 Hình 2.15: Mơ hình mạng nơ-ron truyền thẳng đa tầng (Ronaghan, 2018a) .34 Hình 2.16: Mơ hình nơ-ron nhân tạo (Al-Rabadi, 2011) .35 Hình 2.17: Mô tả đoạn mạng nơ-ron hồi quy (Mittal, 2019) .35 Hình 2.18: Các thành phần LSTM (Jiang et al., 2019) 36 Hình 2.19: Đồ thị hàm sigmoid 37 Hình 2.20: Đồ thị hàm 38 Hình 2.21: Đồ thị hàm ReLU 39 Hình 2.22: Minh họa tượng overfitting 41 Hình 2.23: Ví dụ mạng nơ-ron trước sau Dropout (Srivastava et al., 2014) .42 Hình 2.24: Minh họa phương pháp Early stopping (Shin et al., 2016) .42 Hình 2.25: Minh họa k-fold cross-validation (Sossi Alaoui et al., 2018) 43 Hình 2.26: Minh họa độ đo AUC - ROC (Greulich et al., 2019) 44 Hình 3.1: Kiến trúc đề xuất để tiền xử lý phân loại tài nguyên học tập 56 Dien, T T., Hai, N T., Sang, L H and Nghe, N T., 2020 Deep learning with data transformation and factor analysis for student performance prediction International Journal of Advanced Computer Science and Applications 11(8): 711-721 Dien, T T., Han, H N and Thai-Nghe, N., 2019 An Approach for Plagiarism Detection in Learning Resources Future Data and Security Engineering Springer International Publishing, Cham, pp 722-730 Dien, T T., Hoai-Sang, L., Thanh-Hai, N and Thai-Nghe, N., 2020 Course Recommendation with Deep Learning Approach Future Data and Security Engineering Big Data, Security and Privacy, Smart City and Industry 4.0 Applications Springer Singapore, Singapore, pp 63-77 Dien, T T., Loc, B H and Thai-Nghe, N., 2019 Article Classification using Natural Language Processing and Machine Learning Proceedings of the 2019 International Conference on Advanced Computing and Applications, ACOMP 2019, pp 78-84 Dien, T T., Phuoc, P H., Thanh-Hai, N and Thai-Nghe, N., 2021 Personalized Student Performance Prediction Using Multivariate Long Short-Term Memory Future Data and Security Engineering Big Data, Security and Privacy, Smart City and Industry 4.0 Applications Springer Singapore, Singapore, pp 238247 Dien, T T., Thanh-Hai, N and Thai-Nghe, N., 2020 Deep Learning Approach for Automatic Topic Classification in an Online Submission System Advances in Science, Technology and Engineering Systems Journal 5(4): 700-709 Dien, T T., Trung, L V and Thai-Nghe, N., 2020 An approach for semantic-based searching in learning resources Proceedings of the 12th International Conference on Knowledge and Systems Engineering (KSE), pp 183-188 Do Thi Thanh-Nga, 2010 Tính tốn độ tương tự ngữ nghĩa văn dựa vào độ tương tự từ với từ ĐHCN Doshi, S., 2019 Brief on Recommender Systems, accessed on 2021 Available from https://towardsdatascience.com/brief-on-recommender-systems-b86a1068a4dd Drachsler, H., Hummel, H and Koper, R., 2008 Navigation support for learners in informal learning environments Proceedings of the 2008 ACM conference on Recommender systems ACM, pp 303-306 Drachsler, H., Hummel, H and Koper, R., 2009 Identifying the goal, user model and conditions of recommender systems for formal and informal learning Journal of Digital Information 10(2): 4-24 Dunlavy, D M., Kolda, T G and Acar, E., 2011 Temporal Link Prediction Using Matrix and Tensor Factorizations ACM Trans Knowl Discov Data 5(2): 1-27 Durme, B., Huang, Y and Nyberg, E., 2003 Towards light semantic processing for question answering Proceedings of the HLT-NAACL 2003 workshop on Text meaning Farouk, M., 2020 Measuring text similarity based on structure and word embedding Cognitive Systems Research 63: 1-10 Feng, M., Heffernan, N and Koedinger, K., 2009 Addressing the assessment challenge with an online system that tutors as it assesses User Modeling and User-Adapted Interaction 19(3): 243-266 Fu, M., Qu, H., Yi, Z., Lu, L and Liu, Y., 2019 A Novel Deep Learning-Based Collaborative Filtering Model for Recommendation System IEEE Transactions on Cybernetics 49(3): 1084-1096 Garcia-Martinez, S and Hamou-Lhadj, A., 2013 In Multimedia Services in Intelligent Environments Springer 113-124 García, E., Romero, C., Ventura, S and De Castro, C., 2009 An architecture for making recommendations to courseware authors using association rule mining and collaborative filtering User Modeling and User-Adapted Interaction 19(12): 99-132 Gennari, J H., Musen, M A., Fergerson, R W et al, 2003 The evolution of Protégé: an environment for knowledge-based systems development International Journal of Human-computer studies 58(1): 89-123 Geoffrey Hinton, N S., Kevin Swersky, 2012 Neural Networks for Machine Learning: Lecture 6a Overview of mini‐batch gradient descent, accessed on 2020 Available from https://www.cs.toronto.edu/~tijmen/csc321/slides/lecture_slides_lec6.pdf Ghazanfar, M A., Prügel-Bennett, A and Szedmak, S., 2012 Kernel-Mapping Recommender system algorithms Information Sciences 208: 81-104 Gomaa, W and Fahmy, A., 2013 A Survey of Text Similarity Approaches International Journal of Computer Applications 68(13): 13-18 Gomez-Uribe, C A and Hunt, N., 2015 The netflix recommender system: Algorithms, business value, and innovation ACM Transactions on Management Information Systems 6(4): 1-19 Goodfellow, I., Bengio, Y and Courville, A., 2016 6.2.2.3 Softmax Units for Multinoulli Output Distributions MIT Press 180–184 Greulich, S., Mayr, A., Gloekler, S et al, 2019 Time-Dependent Myocardial Necrosis in Patients With ST-Segment-Elevation Myocardial Infarction Without Angiographic Collateral Flow Visualized by Cardiac Magnetic Resonance Imaging: Results From the Multicenter STEMI-SCAR Project Journal of the American Heart Association 8: e012429 Grosso, W E., Eriksson, H., Fergerson, R W., Gennari, J H., Tu, S W and Musen, M A., 1999 Knowledge modeling at the millennium (the design and evolution of Protégé-2000) Gruber, T R., 1993 A translation approach to portable ontology specifications Knowledge acquisition 5(2): 199-220 Gunasinghe, U L D N., Silva, W A M D., Silva, N H N D d., Perera, A S., Sashika, W A D and Premasiri, W D T P., 2014 Sentence similarity measuring by vector space model 2014 14th International Conference on Advances in ICT for Emerging Regions (ICTer), pp 185-189 Gunter, D W., 2009 Semantic search Bulletin of the American Society for Information Science and Technology 36: 36-37 Guo, B., Zhang, R., Xu, G., Shi, C and Yang, L., 2015 Predicting Students Performance in Educational Data Mining 2015 International Symposium on Educational Technology (ISET), pp 125-128 Guo, H., Tang, R., Ye, Y., Li, Z and He, X., 2017, DeepFM: a factorization-machine based neural network for CTR prediction In Proceedings of the 26th International Joint Conference on Artificial Intelligence, Melbourne, Australia AAAI Press 1725–1731 Hacioglu, K and Ward, W., 2003 Question classification with support vector machines and error correcting codes Proceedings of the 2003 Conference of the North American Chapter of the Association for Computational Linguistics on Human Language Technology: companion volume of the Proceedings of HLTNAACL 2003 short papers-Volume Association for Computational Linguistics, pp 28-30 Haddoud, M., Mokhtari, A., Lecroq, T and Abdeddaïm, S., 2016 Combining supervised term-weighting metrics for SVM text classification with extended term representation Knowledge and Information Systems 49(3): 909-931 Hai, N P., Sheu, T.-W and Nagai, M., 2015 Predicting the Student Learning Outcomes Based on the Combination of Taylor Approximation Method and Grey Models (in Vietnamese) VNU Journal of Science: Education Research 31(2): 70-83 Han, J and Moraga, C., 1995 The influence of the sigmoid function parameters on the speed of backpropagation learning From Natural to Artificial Neural Computation Mira, J and Sandoval, F Springer Berlin Heidelberg, Berlin, Heidelberg, pp 195-201 Hastings, P., 2001 Adding syntactic information to LSA Herlocker, J L., Konstan, J A., Borchers, A and Riedl, J., 1999 An algorithmic framework for performing collaborative filtering 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, SIGIR 1999 Association for Computing Machinery, Inc, pp 230237 Hochreiter, S and Schmidhuber, J., 1997 Long Short-term Memory Neural computation 9: 1735-1780 Huynh-Ly, T.-N and Thai-Nghe, N., 2013 A system for predicting students’s course result using a free recommender system library of MyMediaLite (in Vietnamese) Information technology conference 2013, Can Tho University IBM Cloud Education, 2020 Convolutional Neural Networks, accessed on 2021 Available from https://www.ibm.com/cloud/learn/convolutional-neuralnetworks Imran, H., Hoang, Q., Chang, T.-W and Graf, S., 2014 A framework to provide personalization in learning management systems through a recommender system approach Asian Conference on Intelligent Information and Database Systems Springer, pp 271-280 Iqbal, Z., Qadir, J., Mian, A and Kamiran, F., 2017 Machine Learning Based Student Grade Prediction: A Case Study Jaccard, P., 1901 Étude comparative de la distribution florale dans une portion des Alpes et des Jura Bull Soc Vaudoise Sci Nat 37: 547-579 Jiang, C., Chen, Y., Chen, S et al, 2019 A Mixed Deep Recurrent Neural Network for MEMS Gyroscope Noise Suppressing Electronics 8: 181 Jisc, 2016 What are the benefits of releasing OER? Available from https://www.jisc.ac.uk/guides/open-educational-resources/stakeholders-andbenefits Joeran, B., Barry, S and Andrew, C., 2018 RARD II: The 2nd Related-Article Recommendation Dataset Kaushal, G., 2011 Role of Ontology in Semantic Web DESIDOC Journal of Library & Information Technology 31: 116-120 Khanal, S S., Prasad, P W C., Alsadoon, A and Maag, A., 2020 A systematic review: machine learning based recommendation systems for e-learning Education and Information Technologies 25(4): 2635-2664 Kingma, D and Ba, J., 2014 Adam: A Method for Stochastic Optimization International Conference on Learning Representations Kolda, T and Bader, B., 2009 Tensor Decompositions and Applications SIAM Review 51(3): 455-500 Koren, Y., 2010 Factor in the neighbors: Scalable and accurate collaborative filtering ACM Trans Knowl Discov Data 4(1): 1-24 Koren, Y and Bell, R., 2011 In: Ricci, F et al (Eds.) Recommender Systems Handbook Springer US Boston, MA, 145-186 Koren, Y., Bell, R and Volinsky, C., 2009 Matrix factorization techniques for recommender systems Computer 8: 30-37 Kowsari, K., Jafari Meimandi, K., Heidarysafa, M., Mendu, S., Barnes, L and Brown, D., 2019 Text Classification Algorithms: A Survey Information 10(4): Krizhevsky, A., Sutskever, I and Hinton, G E., 2017 ImageNet classification with deep convolutional neural networks Commun ACM 60(6): 84–90 Li, Q., Peng, H., Li, J et al, 2020 A Survey on Text Classification: From Shallow to Deep Learning arXiv e-prints arXiv:2008.00364 Li, X and Roth, D., 2002 Learning question classifiers Proceedings of the 19th international conference on Computational linguistics-Volume Association for Computational Linguistics, pp 1-7 Li, Y., Bandar, Z., McLean, D and O'Shea, J., 2004 A Method for Measuring Sentence Similarity and its Application to Conversational Agents Li, Y., Zhang, L., Xu, Y., Yao, Y., Lau, R Y K and Wu, Y., 2017 Enhancing Binary Classification by Modeling Uncertain Boundary in Three-Way Decisions IEEE Transactions on Knowledge and Data Engineering 29(7): 1438-1451 Lin, E., Chen, Q and Qi, X., 2020 Deep reinforcement learning for imbalanced classification Applied Intelligence 50(8): 2488-2502 Liu, Y and Zheng, Y F., 2005 One-against-all multi-class SVM classification using reliability measures Proceedings 2005 IEEE International Joint Conference on Neural Networks, 2005 IEEE, pp 849-854 Lops, P., de Gemmis, M and Semeraro, G., 2011 In: Ricci, F et al (Eds.) Recommender Systems Handbook Springer US Boston, MA, 73-105 Ma, C., Liang, W., Zheng, M and Sharif, H., 2016 A Connectivity-Aware Approximation Algorithm for Relay Node Placement in Wireless Sensor Networks IEEE Sensors Journal 16(2): 515-528 Ma, S and Tian, L., 2015 Ontology-based semantic retrieval for mechanical design knowledge International Journal of Computer Integrated Manufacturing 28(2): 226-238 Mat, U b., Buniyamin, N., Arsad, P M and Kassim, R., 2013 An overview of using academic analytics to predict and improve students' achievement: A proposed proactive intelligent intervention 2013 IEEE th Conference on Engineering Education (ICEED), pp 126-130 MathWorks, T., 2018 Convolutional Neural Network, accessed on 2021 Available from https://uk.mathworks.com/discovery/convolutional-neural-networkmatlab.html McAuley, J., 2018 Amazon product data McAuley, J., 2019 Social Recommendation Data McCallum, A and Nigam, K., 1998 A comparison of event models for naive bayes text classification AAAI-98 workshop on learning for text categorization Citeseer, pp 41-48 Mingwei, T., 2010 The Research of Document Retrieval System Based on the Semantic Vector Space Model Journal of Intelligence 5(29): 167–177 Mishra, M., Mishra, V and Sharma, H R., 2013 Question Classification using Semantic, Syntactic and Lexical features International Journal of Web & Semantic Technology 4: 39-47 Mitchell, T., 1997 Machine Learning, McGraw-Hill Higher Education New York Mittal, A., 2019 Understanding RNN and LSTM, accessed on 2021 Available from https://aditi-mittal.medium.com/understanding-rnn-and-lstm-f7cdf6dfc14e Muñoz-Merino, P J., Kloos, C D and Naranjo, J F., 2009 Enabling interoperability for LMS educational services Computer Standards & Interfaces 31(2): 484-498 Nair, V and Hinton, G E., 2010, Rectified linear units improve restricted boltzmann machines In Proceedings of the 27th International Conference on International Conference on Machine Learning, Haifa, Israel Omnipress 807–814 Nghị, Đ T., 2011 Khai mỏ liệu, minh họa ngôn ngữ R Nhà Xuất Bản Đại học Cần Thơ Nguyen-Thai-Nghe, Lucas, D., Horvath, T and Lars, S T., 2012 Multi-Relational Factorization Models for Predicting Student Performance Nguyen Thai-Nghe, Lucas Drumond, Tomáš Horváth, Artus Krohn-Grimberghe, Alexandros Nanopoulos and Schmidt-Thieme, L., 2012 In: Olga, C S and Jesus, G B (Eds.) Educational Recommender Systems and Technologies: Practices and Challenges IGI Global Hershey, PA, USA, 129-153 Nguyễn Thái Nghe, 2016, Hệ thống gợi ý: Kỹ thuật ứng dụng Trong: Đệ, T C Nghiên cứu ứng dụng công nghệ thông tin Đồng sông Cửu Long Nhà xuất Đại học Cần Thơ Thành phố Cần Thơ, 21-47 Nguyễn Thị Minh Huyền, Vũ Xuân Lương and Lê Hồng Phương, 2010 VnTokenizer, accessed on July 15, 2019 Available from http://vntokenizer.sourceforge.net/ Okuboyejo, O., Misra, S., Omoregbe, N., Damasevicius, R and Maskeliunas, R., 2018 A Semantic Web-Based Framework for Information Retrieval in ELearning Systems Communications in Computer and Information Science 96106 Oldham, K B., Myland, J C and Spanier, J., 2009 In: Oldham, K et al (Eds.) An Atlas of Functions: with Equator, the Atlas Function Calculator Springer US New York, NY, 289-296 Park, D H., Kim, H K., Choi, I Y and Kim, J K., 2012 A literature review and classification of recommender systems research Expert Systems with Applications 39(11): 10059-10072 Pedregosa, F., Varoquaux, G., Gramfort, A et al, 2012 Scikit-learn: Machine Learning in Python Journal of machine learning research 12: 2825-2830 Perone, C S., 2013 Machine Learning :: Cosine Similarity for Vector Space Models (Part III), accessed on July 20, 2019 Available from http://blog.christianperone.com/2013/09/machine-learning-cosine-similarityfor-vector-space-models-part-iii/ Pilászy, I and Tikk, D., 2009 Recommending new movies: even a few ratings are more valuable than metadata Proceedings of the third ACM conference on Recommender systems ACM, pp 93-100 Powers, D., 2008 Evaluation: From Precision, Recall and F-Factor to ROC, Informedness, Markedness & Correlation Mach Learn Technol 2: 1-24 Prins, F., Nadolski, R., Berlanga, A., Drachsler, H., Hummel, H and Koper, R., 2008 Competence Description for Personal Recommendations: The importance of identifying the complexity of learning and performance situations Rastrollo-Guerrero, J L., Gómez-Pulido, J A and Durán-Domínguez, A., 2020 Analyzing and Predicting Students’ Performance by Means of Machine Learning: A Review Applied Sciences 10(3): 1042 Rendle, S and Schmidt-Thieme, L., 2008, Online-updating regularized kernel matrix factorization models for large-scale recommender systems In Proceedings of the 2008 ACM conference on Recommender systems, Lausanne, Switzerland Association for Computing Machinery 251–258 Ricci, F., Rokach, L and Shapira, B., 2011 In Recommender systems handbook Springer 1-35 Romero, C., Ventura, S., Zafra, A and De Bra, P., 2009 Applying Web usage mining for personalizing hyperlinks in Web-based adaptive educational systems Computers & Education 53(3): 828-840 Ronaghan, S., 2018a Deep Learning: Common Architectures, accessed on 2021 Available from https://srnghn.medium.com/deep-learning-commonarchitectures-6071d47cb383 Ronaghan, S., 2018b Deep Learning: Overview of Neurons and Activation Functions, accessed on 24/4/2021 Available from https://srnghn.medium.com/deeplearning-overview-of-neurons-and-activation-functions-1d98286cf1e4 Sagar, S., 2017 Activation Functions in Neural Networks, accessed on 2021 Available from https://towardsdatascience.com/activation-functions-neural-networks1cbd9f8d91d6 Saif, H., Fernández, M., He, Y and Alani, H., 2014, On stopwords, filtering and data sparsity for sentiment analysis of Twitter In LREC 2014, Ninth International Conference on Language Resources and Evaluation, Reykjavik, Iceland 810817 Sampson, D G., Lytras, M D., Wagner, G and Diaz, P., 2008 Ontologies and the Semantic Web for E-learning Educational Technology & Society 7(4): 26-28 Santos, O C and Boticario, J G., 2011 Requirements for semantic educational recommender systems in formal e-learning scenarios Algorithms 4(2): 131154 Sebastiani, F., 2002 Machine learning in automated text categorization ACM Comput Surv 34(1): 1-47 Shahiri, A M., Husain, W and Rashid, N a A., 2015 A Review on Predicting Student's Performance Using Data Mining Techniques Procedia Computer Science 72: 414-422 Sharma, K., Singh, S., Mukherjee, I and Kumar, B., 2018 Plagiarism detection based on semantic analysis International Journal of Knowledge and Learning 12: 242 Shetty, D., Varma, J., Navi, S and Ahmed, M R., 2020 Diving Deep into Deep Learning: History, Evolution, Types and Applications The International Journal on Media Management 9: 2278-3075 Shin, S., Hoang, T.-T., Le, T.-H and Lee, M.-Y., 2016 A New Robust Design Method Using Neural Network Journal of Nanoelectronics and Optoelectronics 11: 68- 78 Smith, M C., 2016 What are learning resources? What are some examples? , accessed on 18/7/2019 Available from https://www.quora.com/What-arelearning- resources-What-are-some-examples Sossi Alaoui, S., Farhaoui, Y and Aksasse, B., 2018 Classification algorithms in Data Mining International Journal of Tomography and Simulation 31: 34-44 Spachtholz, P., 2017 Book Recommender: Collaborative Filtering, Shiny, accessed on 26/3/2020 Available from https://www.kaggle.com/philippsp/bookrecommender-collaborative-filtering-shiny/code Srivastava, N., Hinton, G E., Krizhevsky, A., Sutskever, I and Salakhutdinov, R., 2014 Dropout: a simple way to prevent neural networks from overfitting J Mach Learn Res 15: 1929-1958 State Government of Victoria, 2020 Teaching and Learning Resources — Selecting Appropriate Materials Available from https://www2.education.vic.gov.au/pal/selecting-suitable-teachingresources/policy Stefan, D., 2000 The semantic web: The roles of XML and RDF IEEE Internet Computing 4(5): 63 Studer, R., Benjamins, V R and Fensel, D., 1998 Knowledge engineering: principles and methods Data & knowledge engineering 25(1-2): 161-197 Su, X and Khoshgoftaar, T M., 2009 A survey of collaborative filtering techniques Advances in artificial intelligence 2009: 1-19 Susan, D A., 2009 Open Educational Resources: reviewing initiatives and issues Open Learning: The Journal of Open, Distance and e-Learning 24(1): 3-10 Takács, G., Pilászy, I., Németh, B and Tikk, D., 2009 Scalable collaborative filtering approaches for large recommender systems Journal of machine learning research 10: 623-656 Tang, L and Chen, X., 2015 Ontology-Based Semantic Retrieval for Education Management Systems Journal of Computing and Information Technology 23: 255 Tanuar, E., Heryadi, Y., Lukas, Abbas, B S and Gaol, F L., 2018 Using Machine Learning Techniques to Earlier Predict Student's Performance 2018 Indonesian Association for Pattern Recognition International Conference (INAPR), pp 8589 Tavangarian, D., Leypold, M E., Nölting, K., Röser, M and Voigt, D., 2004 Is eLearning the Solution for Individual Learning? Electronic Journal of Elearning 2(2): 273-280 Thai-Nghe, N., Horvath, T and Schmidt-Thieme, L., 2011 Factorization Models for Forecasting Student Performance Thai-Nghe, N and Schmidt-Thieme, L., 2015 Multi-relational Factorization Models for Student Modeling in Intelligent Tutoring Systems 2015 Seventh International Conference on Knowledge and Systems Engineering (KSE), pp 61-66 Thaoroijam, K., 2014 A Study on Document Classification using Machine Learning Techniques IJCSI International Journal of Computer Science 11: 217-222 Tin Kam, H., 1995 Random decision forests Proceedings of 3rd International Conference on Document Analysis and Recognition, pp 278-282 vol.271 Tomasevic, N., Paunović, D and Vraneš, S., 2019 User-based collaborative filtering approach for content recommendation in OpenCourseWare platforms Trần Cao Đệ Phạm Nguyên Khang, 2012 Phân loại văn với máy học véc-tơ hỗ trợ định Tạp chí Khoa học Trường Đại học Cần Thơ 21a: 52-63 Trần Thanh Điện, Nguyễn Ngọc Tuấn, Nguyễn Thanh Hải Nguyễn Thái Nghe, 2020, Tăng tốc tìm kiếm tài nguyên học tập theo nội dung kỹ thuật xử lý liệu lớn In Hội thảo khoa học Quốc Gia lần thứ 9: Công nghệ Thông tin Ứng dụng lĩnh vực (CITA 2020) Đà Nẵng, 171-178 Tran Thanh Dien, Nguyen Thanh-Hai and Thai-Nghe, N., 2021 Deep Matrix Factorization for Learning Resources Recommendation Computational Collective Intelligence Nguyen, N T et al Springer International Publishing, Cham, pp 167-179 Trần Thị Thu Thảo Vũ Thị Chinh, 2012 Xây dựng hệ thống phân loại tài liệu tiếng Việt Báo cáo nghiên cứu khoa học Truong Quoc-Dinh, Ngo Ba-Hung Truong Quoc-Bao, 2014 Các hệ thống tìm kiếm thơng tin văn Nhà xuất Đại học Cần Thơ Tversky, A., 1977 Features of similarity Psychological review 84(4): 327 UNESCO, 2019 Recommendation on Open Educational Resources (OER Available from https://en.unesco.org/themes/building-knowledge-societies/oer Versloot, C., 2019 Leaky ReLU: improving traditional ReLU, accessed on 2021 Available from https://www.machinecurve.com/index.php/2019/10/15/leakyrelu-improving-traditional-relu/ Vnexpress, 2020 accessed on 20/2/2020 Available from https://vnexpress.net/ W3C, 2006 DOME, accessed on https://www.w3.org/2001/sw/wiki/DOME 2019 Available from W3C, 2009 OWL Web Ontology Language Overview, accessed on 2019 Available from http://www.w3.org/TR/owlfeatures/ W3C, 2012 Knoodl, accessed on https://www.w3.org/2001/sw/wiki/Knoodl 2019 Available from Wali, W., Gargouri, B and Ben Hamadou, A., 2020 An Enhanced Plagiarism Detection Based on Syntactico-Semantic Knowledge Intelligent Systems Design and Applications Springer International Publishing, Cham, pp 264274 Weiss, G M., 2019 Sample Weka Data Sets, accessed on 18/1/2020 Available from https://storm.cis.fordham.edu/gweiss/data-mining/datasets.html Winkler, W E., 1990 String Comparator Metrics and Enhanced Decision Rules in the Fellegi-Sunter Model of Record Linkage Wu, B., 2018 The Semantic Retrieval System for Learning Resources Based on Subject Knowledge Ontology International Conference on Computer Science, Electronics and Communication Engineering (CSECE 2018) Atlantis Press, pp 467-469 Xiao, J., Wang, M., Jiang, B and Li, J., 2018 A personalized recommendation system with combinational algorithm for online learning Journal of Ambient Intelligence and Humanized Computing 9(3): 667-677 Yang, Y and Liu, X., 1999, A re-examination of text categorization methods In Proceedings of the 22nd annual international ACM SIGIR conference on Research and development in information retrieval, Berkeley, California, USA ACM 312647, 42-49 Yu, B., 2019 Research on information retrieval model based on ontology EURASIP Journal on Wireless Communications and Networking 2019(1): 30 Zhang, D and Lee, W S., 2003, Question classification using support vector machines In Proceedings of the 26th annual international ACM SIGIR conference on Research and development in informaion retrieval, Toronto, Canada ACM 860443, 26-32 Zhang, F., Song, J and Peng, S., 2018 Deep Matrix Factorization for Recommender Systems with Missing Data not at Random Journal of Physics: Conference Series 1060: 012001-012001 Zhang, L., Luo, T., Zhang, F and Wu, Y., 2018 A Recommendation Model Based on Deep Neural Network IEEE Access 6: 9454-9463 Zhang, S., Yao, L., Sun, A and Tay, Y., 2019 Deep Learning Based Recommender System: A Survey and New Perspectives ACM Comput Surv 52(1): Article Zulqarnain Muhammad, Ghazali, R., Mazwin, Y and Rehan, M., 2020 A comparative review on deep learning models for text classification PHỤ LỤC TĂNG TỐC XỬ LÝ DỮ LIỆU BẰNG KỸ THUẬT XỬ LÝ DỮ LIỆU LỚN 1.1 Mơ hình đề xuất Nghiên cứu đề xuất giải pháp nhằm tăng tốc độ xử lý liệu phục vụ tìm kiếm sử dụng kỹ thuật xử lý liệu lớn dựa tảng Hadoop với kỹ thuật xử lý văn đề cập Mơ hình tổng qt hệ thống tìm kiếm tài liệu mơ tả Hình 1.1 Hình 1.1: Mơ hình tìm kiếm tài liệu sử dụng Hadoop MapReduce Mơ hình gồm ba phận phận phân tích văn bản, phận lập mục, phận so khớp xếp tài liệu trả Bộ phận phân tích văn có nhiệm vụ phân tích văn thu thập câu truy vấn thành từ riêng biệt Bộ phận lập mục gồm từ thu thập từ phận phân tích văn lựa chọn để làm mục Giai đoạn phân tích văn bản, lập mục thực Hadoop MapReduce nhằm tận dụng sức mạnh xử lý song song phân tán cụm máy tính Đối với phận so khớp xếp tài liệu trả về, từ trích từ câu truy vấn từ mục văn so khớp với để tìm tài liệu liên quan đến câu truy vấn Mỗi tài liệu có độ tương quan với câu truy vấn, tài liệu xếp theo độ tương quan giảm dần trả cho người dùng Để thực tìm kiếm, tài liệu đầu vào gồm câu truy vấn tài nguyên học tập tiền xử lý, tính trọng số TF-IDF, lập mục sử dụng mơ hình khơng gian véc-tơ trước tính độ tương đồng cosine để so khớp trả kết tìm kiếm 1.2 Mơ tả liệu Mơ hình tìm kiếm đề xuất sử dụng tìm kiếm nhiều dạng tài nguyên học tập sách, giáo trình, giảng, báo khoa học,… Nghiên cứu thử nghiệm đề cương môn môn học có sẵn Tập liệu gồm 2.829 tập tin đề cương môn học Trường Đại học Cần Thơ Để thực tìm kiếm, tài liệu đầu vào gồm câu truy vấn tài nguyên học tập tiền xử lý để lọc thông tin thừa (mục tiêu, nội dung môn học), chuyển tài liệu dạng văn (text), tách từ, loại bỏ từ dừng, tính trọng số TFIDF, lập mục sử dụng mơ hình khơng gian véc-tơ trước tính độ tương đồng để so khớp trả kết tìm kiếm Trong nghiên cứu góc tài liệu câu truy vấn để đo độ tương đồng hai tài liệu không gian véc-tơ sử dụng 1.3 Kết thực nghiệm Phần không đề cập hiệu việc tìm kiếm dựa độ đo tương đồng cosine véc-tơ truy vấn với véc-tơ tài liệu trình bày phần trước, mà đề cập đến tốc độ tìm kiếm sử dụng tảng Hadoop MapReduce Để phục vụ cho trình thử nghiệm, nghiên cứu sử dụng phần cứng hệ điều hành gồm: CPU Intel® Core™ i5-4460 3.20GHz, 8GB RAM, triển khai hệ điều hành Ubuntu-20.04, nhớ 20GB cho node máy chủ master slave Ngồi ra, ngơn ngữ lập trình Python 3.6, tính tốn liệu phân tán với Hadoop 3.2.0, công cụ tách từ tài liệu tiếng Việt Underthesea 1.1.17 sử dụng Kết thực nghiệm cho thấy, hệ thống dựa tảng Hadoop MapReduce có kết xử lý liệu tìm kiếm nhanh nhiều so với hệ thống thông thường sức mạnh xử lý song song phân tán cụm máy tính Thực nghiệm thực tập liệu với 2.829 tập tin đề cương môn học Trường Đại học Cần Thơ để kiểm tra tốc độ xử lý toàn tài liệu với số lượng máy chủ tăng dần từ đến máy Kết đo lường thời gian trình bày Bảng 1.1: Bảng 1.1: So sánh thời gian thực xử lý liệu Số lượng máy chủ Thời gian (%) Stt Xử lý 01 máy chủ Xử lý 02 máy chủ Xử lý 03 máy chủ 100,0% 73,6% 43,4% Bảng 1.1 cho thấy với tập liệu cố định, số lượng máy chủ tham gia tăng thời gian xử lý giảm dần Cụ thể, sử dụng hai máy chủ thời gian xử lý liệu tìm kiếm thơng tin giảm cịn 73,6% so với máy chủ; sử dụng ba máy chủ thời gian giảm cịn 43,4% so với máy chủ Điều cho thấy, việc áp dụng tảng Hadoop MapReduce giải pháp tích cực giúp tăng tốc độ xử lý liệu phân tán nhiều máy chủ khác nhau, làm tăng tốc độ tìm kiếm thơng tin PHỤ LỤC MƠ HÌNH DỰ ĐỐN KẾT QUẢ HỌC TẬP 2.1 Mơ hình đề xuất Mơ hình đề xuất thể Hình 2.1 Quan sát mơ hình thấy mơ hình đề xuất dự đốn bao gồm bước Ở bước đầu tiên, toàn tập liệu chia thành tập huấn luyện kiểm tra dựa thời gian, tập huấn luyện từ năm 2007 đến 2017, tập kiểm tra từ năm 2018 đến 2020 Bước hai thực tính điểm trung bình cho tồn sinh viên tập huấn luyện để huấn luyện bốn mơ hình khác dựa mức điểm xếp loại (bao gồm mô hình: Excellent, Very Good, Good, Fairly) Bước ba phân chia sinh viên theo nhóm điểm trung bình; nhóm, lấy điểm tồn mơn tất sinh viên nhóm Ở bước cuối, sau xây dựng bốn mơ hình dựa mức điểm xếp loại, thực tải tập liệu kiểm tra vào bốn mơ hình dựa điểm trung bình sinh viên để dự đốn điểm cho sinh viên Hình 2.1: Mơ hình đề xuất dựa mức xếp loại điểm Kết sau dự đoán trả mức điểm theo quy định khoảng từ đến Các bước tóm tắt Giải thuật 2.1 Giải thuật 2.1: Các bước phân chia liệu để xây dựng mơ hình dựa GPA Begin Bước 1: Chia toàn tập liệu thành tập train test dựa vào thời gian Tập train từ 2007 đến 2017, tập test từ 2018 đến 2020 Bước 2: Trên tập train, tính điểm trung bình sinh viên toàn sinh viên Bước 3: Chia theo điểm trung bình tích lũy Cụ thể: + Excellent model: GPA >= 3,6 + Very good model: 3,2 ≤ GPA < 3,6 + Good model: 2,5 ≤ GPA < 3,2 + Fairly model: GPA < 2,5 Với nhóm, chọn điểm tất sinh viên vào nhóm Bước 4: Huấn luyện riêng cho nhóm tương ứng dãy điểm Bước End 2.2 Mô tả liệu Để đánh giá mơ hình đề xuất, liệu thu thập tập thực tế từ hệ thống quản lý sinh viên trường đại học Dữ liệu thu thập liên quan đến sinh viên, khóa học, điểm thông tin khác từ năm 2007 đến năm 2020 với 4,5 triệu mẫu tin Phân bố liệu điểm tập huấn luyện tập kiểm tra sinh viên mô tả Hình 2.2 Hình 2.3 Hình 2.2: Phân bố mức điểm tập huấn luyện Hình 2.3: Phân bố mức điểm tập kiểm tra Phương pháp tiền xử lý liệu thực tương tự nghiên cứu trước trình bày luận án này, loại bỏ thuộc tính dư thừa từ tập tập liệu gốc hệ thống quản lý sinh viên liệu gây nhiễu trước chuyển thuộc tính từ chuỗi sang giá trị số 2.3 Kết thực nghiệm Nghiên cứu cài đặt thông số kỹ thuật gồm server 72 core 320 GB RAM cài đặt hệ điều hành Ubuntu 20.4; ngơn ngữ lập trình Python 3.7 với thư viện deep learning hỗ trợ tiến trình triển khai thực nghiệm Tập liệu ban đầu chia thành tập huấn luyện tập kiểm tra dựa thời gian Tập liệu tập huấn có khoảng 3,8 triệu mẫu tin điểm khoảng thời gian từ năm 2007 đến 2017, tập liệu kiểm tra khoảng 656 ngàn mẫu tin điểm từ năm 2018 đến 2020 Giải thuật hồi quy rừng ngẫu nhiên sử dụng 80 cây, số lượng mẫu tối thiểu cần thiết để tách nút 30 độ sâu tối đa 30 Hai độ đo lỗi MAE RMSE sử dụng cho mơ hình với tất sinh viên bốn mơ hình đề xuất chia theo mức xếp loại điểm, kết biểu diễn Hình 2.4 Hình 2.4: So sánh MAE RMSE RF bốn mơ hình với RF Thực nghiệm cho thấy, với mơ hình MAE cho kết 0,5567, độ lỗi phương pháp đề xuất với bốn mơ hình MAE giảm xuống cịn 0,4525 Với độ đo lỗi RMSE phương pháp đề xuất bốn mơ hình có cải thiện đáng kể, khoảng 22% so với cách tiếp cận mơ hình Như vậy, việc phân chia tập liệu để huấn luyện bốn mô hình dựa bốn mức điểm tích lũy kỳ vọng cải thiện đáng kể dự đoán kết học tập sinh viên ... nguyên học tập phù hợp với lực người học Từ khóa: Tài nguyên học tập, phân loại tài nguyên học tập, tìm kiếm tài nguyên học tập, dự đoán kết học tập, gợi ý tài nguyên học tập, kỹ thuật học máy học. .. nguyên học tập 10 2.1.1 Tài nguyên học tập hệ thống quản lý tài nguyên học tập .10 2.1.2 Hệ thống quản lý tài nguyên học tập có quan tâm ngữ nghĩa 10 2.1.3 Hệ thống gợi ý tài nguyên học tập. .. học Nghiên cứu xây dựng mô hình dự đốn kết học tập gợi ý tài nguyên học tập phù hợp với người học Đối tượng nghiên cứu luận án mơ hình tìm kiếm gợi ý tài ngun học tập Để giải hai vấn đề tìm kiếm

Ngày đăng: 05/12/2022, 15:20

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w