1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Xây dựng mô hình tìm kiếm và gợi ý tài nguyên học tập

149 11 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CẦN THƠ TRẦN THANH ĐIỆN MÃ SỐ NCS: P1617001 XÂY DỰNG MƠ HÌNH TÌM KIẾM VÀ GỢI Ý TÀI NGUN HỌC TẬP LUẬN ÁN TIẾN SĨ CHUYÊN NGÀNH HỆ THỐNG THÔNG TIN MÃ SỐ 62 48 01 04 NGƯỜI HƯỚNG DẪN PGS.TS NGUYỄN THÁI NGHE 2022 LỜI CẢM TẠ Để hoàn thành luận án này, nhận quan tâm, giúp đỡ hướng dẫn nhiệt tình từ quý Thầy Cô thuộc Khoa Công nghệ Thông tin Truyền thông, Trường Đại học Cần Thơ hỗ trợ tích cực đồng nghiệp Đặc biệt, tơi xin gửi lời cảm ơn chân thành sâu sắc đến PGS.TS Nguyễn Thái Nghe tận tình dẫn, động viên tạo điều kiện thuận lợi cho tơi suốt q trình học tập nghiên cứu Tôi xin gửi lời cảm ơn đến TS Nguyễn Thanh Hải hỗ trợ tơi q trình triển khai thực nghiệm nghiên cứu Xin chân thành cảm ơn quý Thầy Cô truyền đạt thêm nhiều kiến thức, quan tâm, hỗ trợ tạo điều kiện cho tơi q trình học tập Khoa Công nghệ Thông tin Truyền thông thân yêu, nơi theo học đại học giai đoạn 1993-1998 Xin gửi lời cảm ơn chân thành đến Lãnh đạo Nhà trường, Ban Giám đốc Trung tâm Thông tin Quản trị mạng, Nhà xuất Đại học Cần Thơ đồng nghiệp tạo điều kiện để học tập nâng cao trình độ chun mơn giúp đỡ suốt thời gian học tập Sau xin chân thành cảm ơn đến gia đình người thân chia sẻ, động viên tạo điều kiện tốt để tơi hồn thành luận án LỜI CAM ĐOAN Tôi tên Trần Thanh Điện, nghiên cứu sinh ngành Hệ thống thơng tin, khóa 2017 Tôi xin cam đoan luận án công trình nghiên cứu khoa học thực thân hướng dẫn PGS.TS Nguyễn Thái Nghe Các thông tin sử dụng tham khảo luận án thu thập từ nguồn đáng tin cậy, kiểm chứng, công bố rộng rãi tơi trích dẫn nguồn gốc rõ ràng phần danh mục tài liệu tham khảo Các kết nghiên cứu trình bày luận án tơi thực cách nghiêm túc, trung thực không trùng lắp với đề tài khác công bố trước Tôi xin lấy danh dự uy tín thân để đảm bảo cho lời cam đoan Cần Thơ, ngày Người hướng dẫn tháng 01 năm 2022 Nghiên cứu sinh Nguyễn Thái Nghe Trần Thanh Điện MỤC LỤC CHƯƠNG GIỚI THIỆU 1.1 Tính cấp thiết nghiên cứu 1.2 Mục tiêu, đối tượng, phạm vi phương pháp nghiên cứu 1.3 Nội dung nghiên cứu hướng tiếp cận luận án 1.3.1 Xây dựng mơ hình phân loại tài nguyên học tập 1.3.2 Xây dựng mơ hình tìm kiếm tài nguyên học tập 1.3.3 Xây dựng mơ hình dự đốn kết học tập 1.3.4 Xây dựng mơ hình gợi ý tài nguyên học tập 1.4 Các đóng góp luận án 1.5 Bố cục luận án CHƯƠNG CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU LIÊN QUAN 10 2.1 Khái quát hệ thống quản lý tài nguyên học tập 10 2.1.1 Tài nguyên học tập hệ thống quản lý tài nguyên học tập 10 2.1.2 Hệ thống quản lý tài nguyên học tập có quan tâm ngữ nghĩa 10 2.1.3 Hệ thống gợi ý tài nguyên học tập 10 2.2 Một số kỹ thuật phân loại văn 11 2.2.1 Phân loại với máy véc-tơ hỗ trợ SVM 12 2.2.2 Phân loại sử dụng giải thuật định rừng ngẫu nhiên 14 2.2.3 Phân loại với kỹ thuật học sâu 14 2.3 Các kỹ thuật tính tốn độ tương đồng văn 15 2.3.1 Độ tương đồng 15 2.3.2 Một số phương pháp tính độ tương đồng văn 15 2.4 Các kỹ thuật xây dựng mạng ngữ nghĩa phục vụ tìm kiếm 17 2.4.1 Khái quát web ngữ nghĩa 17 2.4.2 Mơ hình liệu biểu diễn lĩnh vực (ontology) 19 2.5 Hệ thống gợi ý kỹ thuật hệ thống gợi ý 21 2.5.1 Tổng quan hệ thống gợi ý 21 2.5.2 Các nhóm giải thuật hệ thống gợi ý 23 2.5.3 Một số kỹ thuật hệ thống gợi ý 26 2.6 Các nghiên cứu liên quan 46 2.6.1 Nghiên cứu phân loại văn 46 2.6.2 Nghiên cứu tìm kiếm tài liệu 48 2.6.3 Nghiên cứu dự đoán xếp hạng gợi ý 50 2.6.4 Thảo luận đề xuất nghiên cứu luận án 52 CHƯƠNG MƠ HÌNH PHÂN LOẠI TÀI NGUYÊN HỌC TẬP 54 3.1 Giới thiệu 54 3.2 Mơ hình phân loại tài ngun học tập 55 3.2.1 Phân loại tài nguyên học tập 55 3.2.2 Tiền xử lý liệu 56 3.2.3 Mơ hình phân loại tài nguyên học tập 58 3.3 Mô tả tập liệu độ đo đánh giá mơ hình 59 3.4 Cài đặt siêu tham số môi trường thực nghiệm 59 3.5 Kết thực nghiệm 61 3.6 Tổng kết chương 63 CHƯƠNG MƠ HÌNH TÌM KIẾM TÀI NGUN HỌC TẬP 64 4.1 Giới thiệu 64 4.2 Tìm kiếm tài nguyên học tập dựa độ tương đồng văn 65 4.2.1 Mơ hình đề xuất 66 4.2.2 Mô tả liệu phương pháp đánh giá 68 4.2.3 Kết thực nghiệm 69 4.3 Tìm kiếm tài nguyên học tập dựa mạng ngữ nghĩa ontology 72 4.3.1 Mơ hình đề xuất 73 4.3.2 Mô tả liệu 76 4.3.3 Kết thực nghiệm 76 4.4 Tăng tốc xử lý liệu tìm kiếm kỹ thuật xử lý liệu lớn 78 4.5 Tổng kết chương 78 CHƯƠNG MƠ HÌNH DỰ ĐỐN KẾT QUẢ HỌC TẬP 80 5.1 Giới thiệu 80 5.2 Khái quát dự đoán kết học tập 81 5.2.1 Dự đoán kết học tập dựa hồ sơ cá nhân 82 5.2.2 Dự đoán kết học tập theo kỹ thuật lọc cộng tác hệ thống gợi ý .82 5.3 Mơ hình dự đốn kết học tập tồn liệu sinh viên 82 5.3.1 Mơ hình đề xuất 82 5.3.2 Mô tả liệu 83 5.3.3 Tiền xử lý liệu 85 5.3.4 Kết thực nghiệm 87 5.4 Mơ hình dự đốn kết học tập theo nhóm lực học tập .90 5.4.1 Mơ hình đề xuất 91 5.4.2 Mô tả liệu 92 5.4.3 Kết thực nghiệm 93 5.5 Mơ hình dự đốn kết học tập theo sinh viên 95 5.5.1 Mô tả liệu thực nghiệm tiền xử lý liệu 95 5.5.2 Mơ hình đề xuất chuẩn hóa liệu 96 5.5.3 Kết thực nghiệm 98 5.6 Tổng kết chương 100 CHƯƠNG MƠ HÌNH GỢI Ý TÀI NGUYÊN HỌC TẬP 101 6.1 Giới thiệu 101 6.2 Khái quát vấn đề gợi ý tài nguyên học tập 102 6.2.1 Đối với liệu tài nguyên học tập 102 6.2.2 Đối với liệu môn học 103 6.3 Mơ hình gợi ý tài ngun học tập mơ hình phân rã ma trận sâu .103 6.4 Các phương pháp hệ thống gợi ý 105 6.5 Mô tả liệu thực nghiệm 105 6.6 Kết thực nghiệm 107 6.6.1 Kết thực nghiệm tập liệu tài nguyên học tập 107 6.6.2 Kết thực nghiệm tập liệu kết học tập 109 6.7 Tổng kết chương 111 CHƯƠNG KẾT LUẬN VÀ HƯỚNG NGHIÊN CỨU TIẾP THEO .112 7.1 Kết luận 112 7.2 Hướng nghiên cứu 113 CÁC CƠNG TRÌNH ĐÃ CÔNG BỐ 115 TÀI LIỆU THAM KHẢO 117 PHỤ LỤC 129 PHỤ LỤC 131 CHƯƠNG GIỚI THIỆU 1.1 Tính cấp thiết nghiên cứu Học tập mở (open learning) trở thành phong trào đổi giáo dục vào năm 1970 nhanh chóng phát triển khơng ngừng Thuật ngữ open learning thường dùng để hoạt động tăng cường hội học tập hệ thống giáo dục thức mở rộng hội học tập bên hệ thống giáo dục thức (Susan, 2009) Học tập mở bao gồm, khơng giới hạn, phương thức giảng dạy lớp học, phương pháp tiếp cận học tập tương tác, văn hóa hệ sinh thái cộng đồng học tập phát triển, sử dụng nguồn tài nguyên giáo dục mở (Chang, 2010) Tài nguyên giáo dục mở (open educational resources) thiếu học tập mở Tài nguyên giáo dục mở tài liệu học tập, giảng dạy nghiên cứu định dạng phương tiện cơng bố cơng khai có quyền phát hành theo giấy phép mở, cho phép truy cập, sử dụng tái sử dụng, thay đổi chia sẻ lại nội dung hồn tồn miễn phí hợp pháp (UNESCO, 2019) Đối với giáo viên, tài nguyên giáo dục mở giúp tăng cường nội dung đa dạng hóa nguồn tài liệu sử dụng cho q trình giảng dạy, tiết kiệm chi phí mua tài nguyên học tập Trong đó, tài nguyên giáo dục mở tạo điều kiện cho người học có hội tiếp cận môi trường học tập số hóa đa dạng, nguồn tài liệu học tập có chất lượng cập nhật thường xuyên; hỗ trợ cho việc tự học, tự nghiên cứu học nhóm, học cộng tác (Jisc, 2016) Nói đến tài nguyên học tập (learning resources) muốn đề cập đến tài nguyên giáo dục phát triển cung cấp cho trình dạy học, đáp ứng mục tiêu học tập (Smith, 2016) Tài nguyên học tập cung cấp thông qua hệ thống hệ thống học trực tuyến, hệ thống quản lý giáo trình/bài giảng, hệ thống quản lý đào tạo, hệ thống quản lý cơng trình nghiên cứu/cơng bố khoa học,… Các hệ thống quản lý tài nguyên học tập có đặc điểm riêng có chung mục đích cung cấp tính dựa web để hỗ trợ trình dạy học viện, trường nhu cầu tự học tập người học (Barajas and Gannaway, 2007; Muñoz-Merino et al., 2009; Santos and Boticario, 2011) Trong thời gian qua, với phát triển nhanh công nghệ thông tin công nghệ hỗ trợ giáo dục trực tuyến, nhu cầu học tập mở ngày gia tăng, có nhu cầu học tập trực tuyến nhằm ứng phó với thay đổi thực tế, chẳng hạn tình trạng hạn chế lại dịch bệnh, từ làm gia tăng nhu cầu sử dụng tài liệu phục vụ giảng dạy học tập Vấn đề đặt cần có mơ hình tìm kiếm tài ngun học tập, giúp cho việc tìm kiếm sử dụng tài nguyên học tập hiệu bối cảnh tài nguyên học tập ngày đa dạng không ngừng gia tăng Xuất phát từ nhu cầu đó, vấn đề tìm kiếm tài ngun học tập có quan tâm ngữ nghĩa nhằm giúp người học tìm kiếm tài nguyên hiệu hơn, tìm kiếm dựa độ tương đồng văn dựa mạng ngữ nghĩa trọng Một vấn đề khác là, với gia tăng liên tục tài nguyên học tập, việc người học tìm kiếm thơng tin phù hợp với nhu cầu lực trở nên khó khăn Để hỗ trợ cho người học, hệ thống gợi ý đời nhằm tăng khả đề xuất tài nguyên phù hợp với người học dựa nhu cầu, lực đặc điểm cá nhân khác (Imran et al., 2014; Xiao et al., 2018) Hệ thống gợi ý giúp giải vấn đề tải thông tin thông qua việc cung cấp đề xuất xếp hạng từ cao xuống thấp để người học chọn tài nguyên học tập phù hợp Trong năm gần đây, có nghiên cứu liên quan tìm kiếm gợi ý tài nguyên học tập, nhiên số vấn đề tồn cần nghiên cứu cải tiến đề xuất giải pháp để việc tìm kiếm tài nguyên học tập hiệu hơn, đáp ứng nhu cầu người học Vấn đề đặt hệ thống quản lý tài nguyên học tập là: Việc tìm kiếm tài nguyên học tập không dạng sở liệu quan hệ mà chủ yếu dạng liệu phi cấu trúc (như word, powerpoint, pdf, web, audio, video) nguồn liệu ngày lớn Vì vậy, cần giải vấn đề tìm kiếm tài liệu phi cấu trúc có quan tâm đến vấn đề ngữ nghĩa nhằm giúp người học tìm nguồn tài nguyên học tập tốt hơn, phù hợp với lực người học Tài nguyên học tập đa dạng thuộc nhiều lĩnh vực khơng ngừng gia tăng, cần có phương pháp tìm kiếm tài liệu hiệu Một vấn đề quan trọng tìm kiếm cần phân loại truy vấn tài nguyên học tập trước thực tìm kiếm nhằm giới hạn khơng gian tìm kiếm, giúp cho trình tìm kiếm nhanh hiệu Ngồi ra, vấn đề tìm kiếm có quan tâm ngữ nghĩa cần quan tâm, vấn đề lĩnh vực giáo dục, đặc biệt hệ thống quản lý tài nguyên học tập Thực tế, tốn tìm kiếm gợi ý khơng thể tách rời Ngồi kết tìm kiếm, hệ thống cần đề xuất tài nguyên học tập có liên quan đến người học Ngồi ra, dự đốn xếp hạng gợi ý thường gắn kết Để gợi ý cần có kết dự đốn xếp hạng, từ kết dự đốn chọn kết có hạng thuộc tốp đầu để gợi ý Hiện nay, có nhiều nghiên cứu dự đốn xếp hạng với cách tiếp cận khác Tuy nhiên, lĩnh vực giáo dục, toán dự đoán xếp hạng gợi ý sử dụng liệu thực tế kết học tập sinh viên tài ngun học tập có nghiên cứu Các hệ thống dự đoán xếp hạng gợi ý sử dụng chủ yếu kỹ thuật lọc cộng tác k láng giềng, phân rã ma trận, phân rã ma trận thiên vị, Tuy vậy, với tập liệu lớn giàu thuộc tính cần nghiên cứu phương pháp dự đoán xếp hạng gợi ý hiệu hơn, đặc biệt sử dụng kỹ thuật tiên tiến học sâu Từ lý trên, luận án “Xây dựng mơ hình tìm kiếm gợi ý tài nguyên học tập” thực Đây luận án có ý nghĩa khoa học thực tiễn trình triển khai hệ thống quản lý tài nguyên học tập 1.2 Mục tiêu, đối tượng, phạm vi phương pháp nghiên cứu Từ cần thiết nêu trên, mục tiêu tổng qt luận án đề xuất mơ hình tìm kiếm gợi ý tài nguyên học tập nhằm đáp ứng nhu cầu người học, giúp cho việc học tập đạt kết tốt Mục tiêu cụ thể luận án là: Nghiên cứu xây dựng mơ hình tìm kiếm tài ngun học tập có quan tâm đến vấn đề ngữ nghĩa nhằm nâng cao hiệu tìm kiếm đáp ứng nhu cầu người học Nghiên cứu xây dựng mơ hình dự đốn kết học tập gợi ý tài nguyên học tập phù hợp với người học Đối tượng nghiên cứu luận án mơ hình tìm kiếm gợi ý tài nguyên học tập Để giải hai vấn đề tìm kiếm gợi ý tài ngun học tập, mơ hình phân loại tài ngun học tập, tìm kiếm dựa độ tương đồng nội dung văn dựa mạng ngữ nghĩa văn số vấn đề có liên quan nghiên cứu Tài nguyên học tập rộng đa dạng với nguồn học liệu dạng văn giảng, giáo trình, sách, báo; dạng hình ảnh, video hay nguồn học liệu số khác Với mong muốn đề xuất giải pháp xây dựng mơ hình tìm kiếm gợi ý tài ngun học tập hệ thống quản lý tài nguyên học tập, luận án giới hạn phạm vi tài nguyên học tập dạng văn Phương pháp nghiên cứu luận án tổng hợp, phân tích nghiên cứu có liên quan cơng bố tạp chí kỷ yếu hội nghị, sách có uy tín nguồn cơng bố khác đáng tin cậy, từ đề xuất mơ hình phương pháp tiếp cận nhằm nâng cao hiệu tìm kiếm gợi ý tài nguyên học tập Các vấn đề đặt luận án giải cách tiếp cận khác máy học, phân loại liệu, mạng nơ-ron truyền thẳng, mạng ngữ nghĩa ontology, hệ thống gợi ý, Dữ liệu thực nghiệm thu thập từ nhiều nguồn báo khoa học xuất bản, tin tức đăng báo điện tử, liệu kết học tập sinh viên thuộc trường đại học, liệu công bố công khai từ nguồn cung cấp liệu tin cậy Kết thực nghiệm từ mơ hình đo đạc độ đo khác tùy thuộc vào kỹ thuật sử dụng, từ đánh giá cách khách quan mơ hình đề xuất 1.3 Nội dung nghiên cứu hướng tiếp cận luận án Như đề cập, mục tiêu tổng quát luận án đề xuất mơ hình tìm kiếm gợi ý tài nguyên học tập nhằm đáp ứng nhu cầu người học Để đạt mục tiêu cần giải hai vấn đề quan trọng tìm kiếm gợi ý, kết hợp phân loại dự đoán xếp hạng nhằm đạt hiệu tốt mơ hình đề xuất, cụ thể: Vấn đề thứ xây dựng mô hình tìm kiếm tài ngun học tập Trong đó, cần kết hợp phân loại truy vấn tài nguyên học tập nhằm giới hạn không gian trước thực tìm kiếm Ngồi ra, vấn đề ngữ nghĩa quan tâm nhằm giúp cho trình tìm kiếm hiệu Vấn đề thứ hai xây dựng mơ hình gợi ý tài ngun học tập Sau có kết tìm kiếm hệ thống quản lý tài nguyên học tập cần đề xuất tài nguyên học tập có liên quan đến người học Bên cạnh đó, để gợi ý tài nguyên học tập phù hợp kết dự đốn xếp hạng cần quan tâm, từ kết dự đốn chọn kết có thứ hạng thuộc tốp đầu để gợi ý Khái niệm tài nguyên học tập: Tài nguyên học tập thuật ngữ dùng để dạng tài nguyên số phục vụ cho trình giảng dạy học tập Tài nguyên học tập tồn từ dạng văn giảng môn học, giáo trình, sách, báo, luận văn, luận án đến dạng hình ảnh, âm thanh, video nguồn học liệu số khác (State Government of Victoria, 2020) Với mong muốn đề xuất giải pháp xây dựng mơ hình tìm kiếm gợi ý tài ngun học tập hệ thống quản lý, luận án sử dụng tài nguyên học tập dạng văn giáo trình, báo, liệu kết học tập sinh viên, liệu đánh giá tài nguyên số Kiến trúc tổng quát: Trên sở vấn đề nêu trên, luận án đề xuất giải nội dung nghiên cứu mô tả kiến trúc Hình 1.1 Hình 1.1: Kiến trúc tổng quát mô tả nội dung nghiên cứu luận án Để giải mục tiêu tổng qt đề xuất mơ hình tìm kiếm gợi ý tài nguyên học tập, hướng tiếp cận giải vấn đề luận án chia toán lớn thành toán nhỏ dễ giải gồm tốn phân loại, tìm kiếm, dự đốn gợi ý Trong đó, tốn phân loại nhằm mục đích giới hạn khơng gian tìm kiếm, giúp q trình tìm kiếm nhanh hơn; toán dự đoán làm tiền đề sử dụng cho tốn gợi ý xác hiệu Feng, M., Heffernan, N and Koedinger, K., 2009 Addressing the assessment challenge with an online system that tutors as it assesses User Modeling and User-Adapted Interaction 19(3): 243-266 Fu, M., Qu, H., Yi, Z., Lu, L and Liu, Y., 2019 A Novel Deep Learning-Based Collaborative Filtering Model for Recommendation System IEEE Transactions on Cybernetics 49(3): 1084-1096 Garcia-Martinez, S and Hamou-Lhadj, A., 2013 In Multimedia Services in Intelligent Environments Springer 113-124 García, E., Romero, C., Ventura, S and De Castro, C., 2009 An architecture for making recommendations to courseware authors using association rule mining and collaborative filtering User Modeling and User-Adapted Interaction 19(1-2): 99-132 Gennari, J H., Musen, M A., Fergerson, R W et al, 2003 The evolution of Protégé: an environment for knowledge-based systems development International Journal of Human-computer studies 58(1): 89-123 Geoffrey Hinton, N S., Kevin Swersky, 2012 Neural Networks for Machine Learning: Lecture 6a Overview of mini‐batch gradient descent, accessed on 2020 Available from https://www.cs.toronto.edu/~tijmen/csc321/slides/lecture_slides_lec6.pdf Ghazanfar, M A., Prügel-Bennett, A and Szedmak, S., 2012 Kernel-Mapping Recommender system algorithms Information Sciences 208: 81-104 Gomaa, W and Fahmy, A., 2013 A Survey of Text Similarity Approaches International Journal of Computer Applications 68(13): 13-18 Gomez-Uribe, C A and Hunt, N., 2015 The netflix recommender system: Algorithms, business value, and innovation ACM Transactions on Management Information Systems 6(4): 1-19 Goodfellow, I., Bengio, Y and Courville, A., 2016 6.2.2.3 Softmax Units for Multinoulli Output Distributions MIT Press 180–184 Greulich, S., Mayr, A., Gloekler, S et al, 2019 Time-Dependent Myocardial Necrosis in Patients With ST-Segment-Elevation Myocardial Infarction Without Angiographic Collateral Flow Visualized by Cardiac Magnetic Resonance Imaging: Results From the Multicenter STEMI-SCAR Project Journal of the American Heart Association 8: e012429 Grosso, W E., Eriksson, H., Fergerson, R W., Gennari, J H., Tu, S W and Musen, M A., 1999 Knowledge modeling at the millennium (the design and evolution of Protégé-2000) Gruber, T R., 1993 A translation approach to portable ontology specifications Knowledge acquisition 5(2): 199-220 Gunasinghe, U L D N., Silva, W A M D., Silva, N H N D d., Perera, A S., Sashika, W A D and Premasiri, W D T P., 2014 Sentence similarity measuring by vector space model 2014 14th International Conference on Advances in ICT for Emerging Regions (ICTer), pp 185-189 120 Gunter, D W., 2009 Semantic search Bulletin of the American Society for Information Science and Technology 36: 36-37 Guo, B., Zhang, R., Xu, G., Shi, C and Yang, L., 2015 Predicting Students Performance in Educational Data Mining 2015 International Symposium on Educational Technology (ISET), pp 125-128 Guo, H., Tang, R., Ye, Y., Li, Z and He, X., 2017, DeepFM: a factorization-machine based neural network for CTR prediction In Proceedings of the 26th International Joint Conference on Artificial Intelligence, Melbourne, Australia AAAI Press 1725–1731 Hacioglu, K and Ward, W., 2003 Question classification with support vector machines and error correcting codes Proceedings of the 2003 Conference of the North American Chapter of the Association for Computational Linguistics on Human Language Technology: companion volume of the Proceedings of HLTNAACL 2003 short papers-Volume Association for Computational Linguistics, pp 28-30 Haddoud, M., Mokhtari, A., Lecroq, T and Abdeddaïm, S., 2016 Combining supervised term-weighting metrics for SVM text classification with extended term representation Knowledge and Information Systems 49(3): 909-931 Hai, N P., Sheu, T.-W and Nagai, M., 2015 Predicting the Student Learning Outcomes Based on the Combination of Taylor Approximation Method and Grey Models (in Vietnamese) VNU Journal of Science: Education Research 31(2): 70-83 Han, J and Moraga, C., 1995 The influence of the sigmoid function parameters on the speed of backpropagation learning From Natural to Artificial Neural Computation Mira, J and Sandoval, F Springer Berlin Heidelberg, Berlin, Heidelberg, pp 195-201 Hastings, P., 2001 Adding syntactic information to LSA Herlocker, J L., Konstan, J A., Borchers, A and Riedl, J., 1999 An algorithmic framework for performing collaborative filtering 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, SIGIR 1999 Association for Computing Machinery, Inc, pp 230-237 Hochreiter, S and Schmidhuber, J., 1997 Long Short-term Memory Neural computation 9: 1735-1780 Huynh-Ly, T.-N and Thai-Nghe, N., 2013 A system for predicting students’s course result using a free recommender system library of MyMediaLite (in Vietnamese) Information technology conference 2013, Can Tho University IBM Cloud Education, 2020 Convolutional Neural Networks, accessed on 2021 Available from https://www.ibm.com/cloud/learn/convolutional-neuralnetworks Imran, H., Hoang, Q., Chang, T.-W and Graf, S., 2014 A framework to provide personalization in learning management systems through a recommender system approach Asian Conference on Intelligent Information and Database Systems Springer, pp 271-280 121 Iqbal, Z., Qadir, J., Mian, A and Kamiran, F., 2017 Machine Learning Based Student Grade Prediction: A Case Study Jaccard, P., 1901 Étude comparative de la distribution florale dans une portion des Alpes et des Jura Bull Soc Vaudoise Sci Nat 37: 547-579 Jiang, C., Chen, Y., Chen, S et al, 2019 A Mixed Deep Recurrent Neural Network for MEMS Gyroscope Noise Suppressing Electronics 8: 181 Jisc, 2016 What are the benefits of releasing OER? Available from https://www.jisc.ac.uk/guides/open-educational-resources/stakeholders-andbenefits Joeran, B., Barry, S and Andrew, C., 2018 RARD II: The 2nd Related-Article Recommendation Dataset Kaushal, G., 2011 Role of Ontology in Semantic Web DESIDOC Journal of Library & Information Technology 31: 116-120 Khanal, S S., Prasad, P W C., Alsadoon, A and Maag, A., 2020 A systematic review: machine learning based recommendation systems for e-learning Education and Information Technologies 25(4): 2635-2664 Kingma, D and Ba, J., 2014 Adam: A Method for Stochastic Optimization International Conference on Learning Representations Kolda, T and Bader, B., 2009 Tensor Decompositions and Applications SIAM Review 51(3): 455-500 Koren, Y., 2010 Factor in the neighbors: Scalable and accurate collaborative filtering ACM Trans Knowl Discov Data 4(1): 1-24 Koren, Y and Bell, R., 2011 In: Ricci, F et al (Eds.) Recommender Systems Handbook Springer US Boston, MA, 145-186 Koren, Y., Bell, R and Volinsky, C., 2009 Matrix factorization techniques for recommender systems Computer 8: 30-37 Kowsari, K., Jafari Meimandi, K., Heidarysafa, M., Mendu, S., Barnes, L and Brown, D., 2019 Text Classification Algorithms: A Survey Information 10(4): Krizhevsky, A., Sutskever, I and Hinton, G E., 2017 ImageNet classification with deep convolutional neural networks Commun ACM 60(6): 84–90 Li, Q., Peng, H., Li, J et al, 2020 A Survey on Text Classification: From Shallow to Deep Learning arXiv e-prints arXiv:2008.00364 Li, X and Roth, D., 2002 Learning question classifiers Proceedings of the 19th international conference on Computational linguistics-Volume Association for Computational Linguistics, pp 1-7 Li, Y., Bandar, Z., McLean, D and O'Shea, J., 2004 A Method for Measuring Sentence Similarity and its Application to Conversational Agents Li, Y., Zhang, L., Xu, Y., Yao, Y., Lau, R Y K and Wu, Y., 2017 Enhancing Binary Classification by Modeling Uncertain Boundary in Three-Way Decisions IEEE Transactions on Knowledge and Data Engineering 29(7): 1438-1451 122 Lin, E., Chen, Q and Qi, X., 2020 Deep reinforcement learning for imbalanced classification Applied Intelligence 50(8): 2488-2502 Liu, Y and Zheng, Y F., 2005 One-against-all multi-class SVM classification using reliability measures Proceedings 2005 IEEE International Joint Conference on Neural Networks, 2005 IEEE, pp 849-854 Lops, P., de Gemmis, M and Semeraro, G., 2011 In: Ricci, F et al (Eds.) Recommender Systems Handbook Springer US Boston, MA, 73-105 Ma, C., Liang, W., Zheng, M and Sharif, H., 2016 A Connectivity-Aware Approximation Algorithm for Relay Node Placement in Wireless Sensor Networks IEEE Sensors Journal 16(2): 515-528 Ma, S and Tian, L., 2015 Ontology-based semantic retrieval for mechanical design knowledge International Journal of Computer Integrated Manufacturing 28(2): 226-238 Mat, U b., Buniyamin, N., Arsad, P M and Kassim, R., 2013 An overview of using academic analytics to predict and improve students' achievement: A proposed th proactive intelligent intervention 2013 IEEE Conference on Engineering Education (ICEED), pp 126-130 MathWorks, T., 2018 Convolutional Neural Network, accessed on 2021 Available from https://uk.mathworks.com/discovery/convolutional-neural-networkmatlab.html McAuley, J., 2018 Amazon product data McAuley, J., 2019 Social Recommendation Data McCallum, A and Nigam, K., 1998 A comparison of event models for naive bayes text classification AAAI-98 workshop on learning for text categorization Citeseer, pp 41-48 Mingwei, T., 2010 The Research of Document Retrieval System Based on the Semantic Vector Space Model Journal of Intelligence 5(29): 167–177 Mishra, M., Mishra, V and Sharma, H R., 2013 Question Classification using Semantic, Syntactic and Lexical features International Journal of Web & Semantic Technology 4: 39-47 Mitchell, T., 1997 Machine Learning, McGraw-Hill Higher Education New York Mittal, A., 2019 Understanding RNN and LSTM, accessed on 2021 Available from https://aditi-mittal.medium.com/understanding-rnn-and-lstm-f7cdf6dfc14e Muñoz-Merino, P J., Kloos, C D and Naranjo, J F., 2009 Enabling interoperability for LMS educational services Computer Standards & Interfaces 31(2): 484-498 Nair, V and Hinton, G E., 2010, Rectified linear units improve restricted boltzmann machines In Proceedings of the 27th International Conference on International Conference on Machine Learning, Haifa, Israel Omnipress 807–814 Nghị, Đ T., 2011 Khai mỏ liệu, minh họa ngôn ngữ R Nhà Xuất Bản Đại học Cần Thơ 123 Nguyen-Thai-Nghe, Lucas, D., Horvath, T and Lars, S T., 2012 Multi-Relational Factorization Models for Predicting Student Performance Nguyen Thai-Nghe, Lucas Drumond, Tomáš Horváth, Artus Krohn-Grimberghe, Alexandros Nanopoulos and Schmidt-Thieme, L., 2012 In: Olga, C S and Jesus, G B (Eds.) Educational Recommender Systems and Technologies: Practices and Challenges IGI Global Hershey, PA, USA, 129-153 Nguyễn Thái Nghe, 2016, Hệ thống gợi ý: Kỹ thuật ứng dụng Trong: Đệ, T C Nghiên cứu ứng dụng công nghệ thông tin Đồng sông Cửu Long Nhà xuất Đại học Cần Thơ Thành phố Cần Thơ, 21-47 Nguyễn Thị Minh Huyền, Vũ Xuân Lương and Lê Hồng Phương, 2010 VnTokenizer, accessed on July 15, 2019 Available from http://vntokenizer.sourceforge.net/ Okuboyejo, O., Misra, S., Omoregbe, N., Damasevicius, R and Maskeliunas, R., 2018 A Semantic Web-Based Framework for Information Retrieval in E-Learning Systems Communications in Computer and Information Science 96-106 Oldham, K B., Myland, J C and Spanier, J., 2009 In: Oldham, K et al (Eds.) An Atlas of Functions: with Equator, the Atlas Function Calculator Springer US New York, NY, 289-296 Park, D H., Kim, H K., Choi, I Y and Kim, J K., 2012 A literature review and classification of recommender systems research Expert Systems with Applications 39(11): 10059-10072 Pedregosa, F., Varoquaux, G., Gramfort, A et al, 2012 Scikit-learn: Machine Learning in Python Journal of machine learning research 12: 2825-2830 Perone, C S., 2013 Machine Learning :: Cosine Similarity for Vector Space Models (Part III), accessed on July 20, 2019 Available from http://blog.christianperone.com/2013/09/machine-learning-cosine-similarityfor-vector-space-models-part-iii/ Pilászy, I and Tikk, D., 2009 Recommending new movies: even a few ratings are more valuable than metadata Proceedings of the third ACM conference on Recommender systems ACM, pp 93-100 Powers, D., 2008 Evaluation: From Precision, Recall and F-Factor to ROC, Informedness, Markedness & Correlation Mach Learn Technol 2: 1-24 Prins, F., Nadolski, R., Berlanga, A., Drachsler, H., Hummel, H and Koper, R., 2008 Competence Description for Personal Recommendations: The importance of identifying the complexity of learning and performance situations Rastrollo-Guerrero, J L., Gómez-Pulido, J A and Durán-Domínguez, A., 2020 Analyzing and Predicting Students’ Performance by Means of Machine Learning: A Review Applied Sciences 10(3): 1042 Rendle, S and Schmidt-Thieme, L., 2008, Online-updating regularized kernel matrix factorization models for large-scale recommender systems In Proceedings of the 2008 ACM conference on Recommender systems, Lausanne, Switzerland Association for Computing Machinery 251–258 Ricci, F., Rokach, L and Shapira, B., 2011 In Recommender systems handbook Springer 1-35 124 Romero, C., Ventura, S., Zafra, A and De Bra, P., 2009 Applying Web usage mining for personalizing hyperlinks in Web-based adaptive educational systems Computers & Education 53(3): 828-840 Ronaghan, S., 2018a Deep Learning: Common Architectures, accessed on 2021 Available from https://srnghn.medium.com/deep-learning-commonarchitectures-6071d47cb383 Ronaghan, S., 2018b Deep Learning: Overview of Neurons and Activation Functions, accessed on 24/4/2021 Available from https://srnghn.medium.com/deeplearning-overview-of-neurons-and-activation-functions-1d98286cf1e4 Sagar, S., 2017 Activation Functions in Neural Networks, accessed on 2021 Available from https://towardsdatascience.com/activation-functions-neural-networks1cbd9f8d91d6 Saif, H., Fernández, M., He, Y and Alani, H., 2014, On stopwords, filtering and data sparsity for sentiment analysis of Twitter In LREC 2014, Ninth International Conference on Language Resources and Evaluation, Reykjavik, Iceland 810817 Sampson, D G., Lytras, M D., Wagner, G and Diaz, P., 2008 Ontologies and the Semantic Web for E-learning Educational Technology & Society 7(4): 26-28 Santos, O C and Boticario, J G., 2011 Requirements for semantic educational recommender systems in formal e-learning scenarios Algorithms 4(2): 131-154 Sebastiani, F., 2002 Machine learning in automated text categorization ACM Comput Surv 34(1): 1-47 Shahiri, A M., Husain, W and Rashid, N a A., 2015 A Review on Predicting Student's Performance Using Data Mining Techniques Procedia Computer Science 72: 414-422 Sharma, K., Singh, S., Mukherjee, I and Kumar, B., 2018 Plagiarism detection based on semantic analysis International Journal of Knowledge and Learning 12: 242 Shetty, D., Varma, J., Navi, S and Ahmed, M R., 2020 Diving Deep into Deep Learning: History, Evolution, Types and Applications The International Journal on Media Management 9: 2278-3075 Shin, S., Hoang, T.-T., Le, T.-H and Lee, M.-Y., 2016 A New Robust Design Method Using Neural Network Journal of Nanoelectronics and Optoelectronics 11: 6878 Smith, M C., 2016 What are learning resources? What are some examples? , accessed on 18/7/2019 Available from https://www.quora.com/What-arelearning-resources-What-are-some-examples Sossi Alaoui, S., Farhaoui, Y and Aksasse, B., 2018 Classification algorithms in Data Mining International Journal of Tomography and Simulation 31: 34-44 Spachtholz, P., 2017 Book Recommender: Collaborative Filtering, Shiny, accessed on 26/3/2020 Available from https://www.kaggle.com/philippsp/bookrecommender-collaborative-filtering-shiny/code 125 Srivastava, N., Hinton, G E., Krizhevsky, A., Sutskever, I and Salakhutdinov, R., 2014 Dropout: a simple way to prevent neural networks from overfitting J Mach Learn Res 15: 1929-1958 State Government of Victoria, 2020 Teaching and Learning Resources — Selecting Appropriate Materials Available from https://www2.education.vic.gov.au/pal/selecting-suitable-teachingresources/policy Stefan, D., 2000 The semantic web: The roles of XML and RDF IEEE Internet Computing 4(5): 63 Studer, R., Benjamins, V R and Fensel, D., 1998 Knowledge engineering: principles and methods Data & knowledge engineering 25(1-2): 161-197 Su, X and Khoshgoftaar, T M., 2009 A survey of collaborative filtering techniques Advances in artificial intelligence 2009: 1-19 Susan, D A., 2009 Open Educational Resources: reviewing initiatives and issues Open Learning: The Journal of Open, Distance and e-Learning 24(1): 3-10 Takács, G., Pilászy, I., Németh, B and Tikk, D., 2009 Scalable collaborative filtering approaches for large recommender systems Journal of machine learning research 10: 623-656 Tang, L and Chen, X., 2015 Ontology-Based Semantic Retrieval for Education Management Systems Journal of Computing and Information Technology 23: 255 Tanuar, E., Heryadi, Y., Lukas, Abbas, B S and Gaol, F L., 2018 Using Machine Learning Techniques to Earlier Predict Student's Performance 2018 Indonesian Association for Pattern Recognition International Conference (INAPR), pp 8589 Tavangarian, D., Leypold, M E., Nölting, K., Röser, M and Voigt, D., 2004 Is eLearning the Solution for Individual Learning? Electronic Journal of Elearning 2(2): 273-280 Thai-Nghe, N., Horvath, T and Schmidt-Thieme, L., 2011 Factorization Models for Forecasting Student Performance Thai-Nghe, N and Schmidt-Thieme, L., 2015 Multi-relational Factorization Models for Student Modeling in Intelligent Tutoring Systems 2015 Seventh International Conference on Knowledge and Systems Engineering (KSE), pp 61-66 Thaoroijam, K., 2014 A Study on Document Classification using Machine Learning Techniques IJCSI International Journal of Computer Science 11: 217-222 Tin Kam, H., 1995 Random decision forests Proceedings of 3rd International Conference on Document Analysis and Recognition, pp 278-282 vol.271 Tomasevic, N., Paunović, D and Vraneš, S., 2019 User-based collaborative filtering approach for content recommendation in OpenCourseWare platforms Trần Cao Đệ Phạm Nguyên Khang, 2012 Phân loại văn với máy học véc-tơ hỗ trợ định Tạp chí Khoa học Trường Đại học Cần Thơ 21a: 52-63 126 Trần Thanh Điện, Nguyễn Ngọc Tuấn, Nguyễn Thanh Hải Nguyễn Thái Nghe, 2020, Tăng tốc tìm kiếm tài nguyên học tập theo nội dung kỹ thuật xử lý liệu lớn In Hội thảo khoa học Quốc Gia lần thứ 9: Công nghệ Thông tin Ứng dụng lĩnh vực (CITA 2020) Đà Nẵng, 171-178 Tran Thanh Dien, Nguyen Thanh-Hai and Thai-Nghe, N., 2021 Deep Matrix Factorization for Learning Resources Recommendation Computational Collective Intelligence Nguyen, N T et al Springer International Publishing, Cham, pp 167-179 Trần Thị Thu Thảo Vũ Thị Chinh, 2012 Xây dựng hệ thống phân loại tài liệu tiếng Việt Báo cáo nghiên cứu khoa học Truong Quoc-Dinh, Ngo Ba-Hung Truong Quoc-Bao, 2014 Các hệ thống tìm kiếm thơng tin văn Nhà xuất Đại học Cần Thơ Tversky, A., 1977 Features of similarity Psychological review 84(4): 327 UNESCO, 2019 Recommendation on Open Educational Resources (OER Available from https://en.unesco.org/themes/building-knowledge-societies/oer Versloot, C., 2019 Leaky ReLU: improving traditional ReLU, accessed on 2021 Available from https://www.machinecurve.com/index.php/2019/10/15/leakyrelu-improving-traditional-relu/ Vnexpress, 2020 accessed on 20/2/2020 Available from https://vnexpress.net/ W3C, 2006 DOME, accessed on 2019 Available from https://www.w3.org/2001/sw/wiki/DOME W3C, 2009 OWL Web Ontology Language Overview, accessed on 2019 Available from http://www.w3.org/TR/owlfeatures/ W3C, 2012 Knoodl, accessed on 2019 Available from https://www.w3.org/2001/sw/wiki/Knoodl Wali, W., Gargouri, B and Ben Hamadou, A., 2020 An Enhanced Plagiarism Detection Based on Syntactico- Semantic Knowledge Intelligent Systems Design and Applications Springer International Publishing, Cham, pp 264-274 Weiss, G M., 2019 Sample Weka Data Sets, accessed on 18/1/2020 Available from https://storm.cis.fordham.edu/gweiss/data-mining/datasets.html Winkler, W E., 1990 String Comparator Metrics and Enhanced Decision Rules in the Fellegi-Sunter Model of Record Linkage Wu, B., 2018 The Semantic Retrieval System for Learning Resources Based on Subject Knowledge Ontology International Conference on Computer Science, Electronics and Communication Engineering (CSECE 2018) Atlantis Press, pp 467-469 Xiao, J., Wang, M., Jiang, B and Li, J., 2018 A personalized recommendation system with combinational algorithm for online learning Journal of Ambient Intelligence and Humanized Computing 9(3): 667-677 Yang, Y and Liu, X., 1999, A re-examination of text categorization methods In Proceedings of the 22nd annual international ACM SIGIR conference on 127 Research and development in information retrieval, Berkeley, California, USA ACM 312647, 42-49 Yu, B., 2019 Research on information retrieval model based on ontology EURASIP Journal on Wireless Communications and Networking 2019(1): 30 Zhang, D and Lee, W S., 2003, Question classification using support vector machines In Proceedings of the 26th annual international ACM SIGIR conference on Research and development in informaion retrieval, Toronto, Canada ACM 860443, 26-32 Zhang, F., Song, J and Peng, S., 2018 Deep Matrix Factorization for Recommender Systems with Missing Data not at Random Journal of Physics: Conference Series 1060: 012001-012001 Zhang, L., Luo, T., Zhang, F and Wu, Y., 2018 A Recommendation Model Based on Deep Neural Network IEEE Access 6: 9454-9463 Zhang, S., Yao, L., Sun, A and Tay, Y., 2019 Deep Learning Based Recommender System: A Survey and New Perspectives ACM Comput Surv 52(1): Article Zulqarnain Muhammad, Ghazali, R., Mazwin, Y and Rehan, M., 2020 A comparative review on deep learning models for text classification 128 PHỤ LỤC TĂNG TỐC XỬ LÝ DỮ LIỆU BẰNG KỸ THUẬT XỬ LÝ DỮ LIỆU LỚN 1.1 Mơ hình đề xuất Nghiên cứu đề xuất giải pháp nhằm tăng tốc độ xử lý liệu phục vụ tìm kiếm sử dụng kỹ thuật xử lý liệu lớn dựa tảng Hadoop với kỹ thuật xử lý văn đề cập Mơ hình tổng qt hệ thống tìm kiếm tài liệu mơ tả Hình 1.1 Hình 1.1: Mơ hình tìm kiếm tài liệu sử dụng Hadoop MapReduce Mơ hình gồm ba phận phận phân tích văn bản, phận lập mục, phận so khớp xếp tài liệu trả Bộ phận phân tích văn có nhiệm vụ phân tích văn thu thập câu truy vấn thành từ riêng biệt Bộ phận lập mục gồm từ thu thập từ phận phân tích văn lựa chọn để làm mục Giai đoạn phân tích văn bản, lập mục thực Hadoop MapReduce nhằm tận dụng sức mạnh xử lý song song phân tán cụm máy tính Đối với phận so khớp xếp tài liệu trả về, từ trích từ câu truy vấn từ mục văn so khớp với để tìm tài liệu liên quan đến câu truy vấn Mỗi tài liệu có độ tương quan với câu truy vấn, tài liệu xếp theo độ tương quan giảm dần trả cho người dùng Để thực tìm kiếm, tài liệu đầu vào gồm câu truy vấn tài nguyên học tập tiền xử lý, tính trọng số TF-IDF, lập mục sử dụng mơ hình khơng gian véc-tơ trước tính độ tương đồng cosine để so khớp trả kết tìm kiếm 129 1.2 Mơ tả liệu Mơ hình tìm kiếm đề xuất sử dụng tìm kiếm nhiều dạng tài nguyên học tập sách, giáo trình, giảng, báo khoa học,… Nghiên cứu thử nghiệm đề cương mơn mơn học có sẵn Tập liệu gồm 2.829 tập tin đề cương môn học Trường Đại học Cần Thơ Để thực tìm kiếm, tài liệu đầu vào gồm câu truy vấn tài nguyên học tập tiền xử lý để lọc thông tin thừa (mục tiêu, nội dung môn học), chuyển tài liệu dạng văn (text), tách từ, loại bỏ từ dừng, tính trọng số TF-IDF, lập mục sử dụng mơ hình khơng gian véc-tơ trước tính độ tương đồng để so khớp trả kết tìm kiếm Trong nghiên cứu góc tài liệu câu truy vấn để đo độ tương đồng hai tài liệu không gian véc-tơ sử dụng 1.3 Kết thực nghiệm Phần không đề cập hiệu việc tìm kiếm dựa độ đo tương đồng cosine véc-tơ truy vấn với véc-tơ tài liệu trình bày phần trước, mà đề cập đến tốc độ tìm kiếm sử dụng tảng Hadoop MapReduce Để phục vụ cho trình thử nghiệm, nghiên cứu sử dụng phần cứng hệ điều hành gồm: CPU Intel® Core™ i5-4460 3.20GHz, 8GB RAM, triển khai hệ điều hành Ubuntu-20.04, nhớ 20GB cho node máy chủ master slave Ngồi ra, ngơn ngữ lập trình Python 3.6, tính tốn liệu phân tán với Hadoop 3.2.0, cơng cụ tách từ tài liệu tiếng Việt Underthesea 1.1.17 sử dụng Kết thực nghiệm cho thấy, hệ thống dựa tảng Hadoop MapReduce có kết xử lý liệu tìm kiếm nhanh nhiều so với hệ thống thông thường sức mạnh xử lý song song phân tán cụm máy tính Thực nghiệm thực tập liệu với 2.829 tập tin đề cương môn học Trường Đại học Cần Thơ để kiểm tra tốc độ xử lý toàn tài liệu với số lượng máy chủ tăng dần từ đến máy Kết đo lường thời gian trình bày Bảng 1.1: Bảng 1.1: So sánh thời gian thực xử lý liệu Stt Số lượng máy c Xử lý 03 máy ch Xử lý 01 máy ch Xử lý 02 máy ch Bảng 1.1 cho thấy với tập liệu cố định, số lượng máy chủ tham gia tăng thời gian xử lý giảm dần Cụ thể, sử dụng hai máy chủ thời gian xử lý liệu tìm kiếm thơng tin giảm cịn 73,6% so với máy chủ; sử dụng ba máy chủ thời gian giảm cịn 43,4% so với máy chủ Điều cho thấy, việc áp dụng tảng Hadoop MapReduce giải pháp tích cực giúp tăng tốc độ xử lý liệu phân tán nhiều máy chủ khác nhau, làm tăng tốc độ tìm kiếm thơng tin 130 PHỤ LỤC MƠ HÌNH DỰ ĐỐN KẾT QUẢ HỌC TẬP 2.1 Mơ hình đề xuất Mơ hình đề xuất thể Hình 2.1 Quan sát mơ hình thấy mơ hình đề xuất dự đốn bao gồm bước Ở bước đầu tiên, toàn tập liệu chia thành tập huấn luyện kiểm tra dựa thời gian, tập huấn luyện từ năm 2007 đến 2017, tập kiểm tra từ năm 2018 đến 2020 Bước hai thực tính điểm trung bình cho tồn sinh viên tập huấn luyện để huấn luyện bốn mơ hình khác dựa mức điểm xếp loại (bao gồm mơ hình: Excellent, Very Good, Good, Fairly) Bước ba phân chia sinh viên theo nhóm điểm trung bình; nhóm, lấy điểm tồn mơn tất sinh viên nhóm Ở bước cuối, sau xây dựng bốn mơ hình dựa mức điểm xếp loại, thực tải tập liệu kiểm tra vào bốn mơ hình dựa điểm trung bình sinh viên để dự đoán điểm cho sinh viên Hình 2.1: Mơ hình đề xuất dựa mức xếp loại điểm Kết sau dự đoán trả mức điểm theo quy định khoảng từ đến Các :bướcCácbướctrên phânđược chiatóm dữtắt liệunhư đểGiảixâythuậtdựng2.41 mơ hình dựa GPA Giải thuật 2.1 Begin Bướctrain từ1: 2007Chiatoànđến 2017,bộtậptậpdữtestliệutừthành2018tậpđếntrain2020và test dựa vào thời gian Tập Bước 2: Trên tập train, tính điểm trung bình sinh viên tồn sinh viên + BướcVeryExcellent3good:Chiamodel:model:theođiểmGPA3,2≤>=trungGPA3,6

Ngày đăng: 19/01/2022, 11:55

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w