1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Xây dựng mô hình tìm kiếm và gợi ý tài nguyên học tập TT

30 10 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 30
Dung lượng 1,17 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CẦN THƠ TÓM TẮT LUẬN ÁN TIẾN SĨ Chuyên ngành: Hệ thống thông tin Mã ngành: 62 48 01 04 TRẦN THANH ĐIỆN XÂY DỰNG MƠ HÌNH TÌM KIẾM VÀ GỢI Ý TÀI NGUN HỌC TẬP Cần Thơ, 2022 CƠNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC CẦN THƠ Người hướng dẫn: PGS.TS Nguyễn Thái Nghe Luận án bảo vệ trước Hội đồng đánh giá luận án tiến sĩ cấp trường Họp tại: Phòng bảo vệ luận án tiến sĩ, Lầu 2, Nhà Điều hành, Khu II, Trường Đại học Cần Thơ Vào lúc ngày tháng năm Phản biện 1: Phản biện 2: Phản biện 3: Có thể tìm hiểu luận án thư viện: - Thư viện Quốc gia Việt Nam - Trung tâm Học liệu, Trường Đại học Cần Thơ CÁC CƠNG TRÌNH ĐÃ CƠNG BỐ CT1 CT2 CT3 CT4 CT5 CT6 Tran Thanh Dien, Bui Huu Loc and Nguyen Thai-Nghe, 2019 Article Classification using Natural Language Processing and Machine Learning The 13th International Conference on Advanced Computing and Applications (ACOMP 2019), pp 78-84 DOI: 10.1109/ACOMP.2019.00019 (Scopus) Tran Thanh Dien, Thanh Hai Nguyen, Nguyen Thai-Nghe, 2020 Deep Learning Approach for Automatic Topic Classification in An Online Submission System Advances in Science, Technology and Engineering Systems Journal, Vol 5, No 4, pp 700-709 ISSN: 2415-6698 DOI: 10.25046/aj050483 (Scopus) Tran Thanh Dien, Huynh Ngoc Han and Nguyen ThaiNghe, 2019 An Approach for Plagiarism Detection in Learning Resources The 6th International Conference on Future Data and Security Engineering (FDSE 2019) Lecture Notes in Computer Science Springer Nature Vol 11814, pp 722-730 E-ISSN: 1611-3349, P-ISSN: 03029743 DOI: 10.1007/978-3-030-35653-8_52 (Scopus Q3) Tran Thanh Dien, Le Van Trung, Nguyen Thai-Nghe, 2020 An approach for semantic-based searching in learning resources The 12th IEEE International Conference on Knowledge and Systems Engineering (KSE 2020), pp 183188 DOI: 10.1109/KSE50997.2020.9287798 (Scopus) Trần Thanh Điện, Nguyễn Ngọc Tuấn, Nguyễn Thanh Hải, Nguyễn Thái Nghe, 2020 Tăng tốc tìm kiếm tài nguyên học tập theo nội dung kỹ thuật xử lý liệu lớn Kỷ yếu Hội thảo khoa học Quốc Gia lần thứ 9: Công nghệ Thông tin Ứng dụng lĩnh vực (CITA 2020) Trang 171178 ISBN: 978-604-84-5517-0 Tran Thanh Dien, Luu Hoai Sang, Thanh Hai Nguyen, Nguyen Thai-Nghe, 2020 Deep Learning with Data Transformation and Factor Analysis for Student Performance Prediction International Journal of Advanced Computer Science and Applications (IJACSA), Vol 11, No 8, pp 711-721 E-ISSN: 2156-5570, P-ISSN: 2158-107X DOI: 10.14569/IJACSA.2020.0110886 (Scopus Q3; ESCI) CT7 Tran Thanh Dien, Luu Hoai Sang, Thanh Hai Nguyen, Nguyen Thai-Nghe 2020 Course Recommendation with Deep Learning Approach The 7th International Conference on Future Data and Security Engineering (FDSE 2020) Communications in Computer and Information Science Springer Nature Vol 1306, pp 63-77 E-ISSN: 1865-0937, P-ISSN: 1865-0929 DOI: 10.1007/978-981-33-4370-2_5 (Scopus Q4) CT8 Tran Thanh Dien, Le Duy-Anh, Nguyen Hong-Phat, Nguyen Van-Tuan, Trinh Thanh-Chanh, Le Minh-Bang, Nguyen Thanh-Hai, and Nguyen Thai-Nghe, 2021 Four Grade Levels-based Models with Random Forest for Student Performance Prediction at a Multidisciplinary University The 15th International Conference on Complex, Intelligent, and Software Intensive Systems (CISIS-2021) Lecture Notes in Networks and Systems Springer Nature Vol 278, pp 1-12 E-ISSN: 2367-3389, P-ISSN: 23673370 DOI: 10.1007/978-3-030-79725-6_1 (Scopus Q4) CT9 Tran Thanh Dien, Pham Huu Phuoc, Nguyen Thanh-Hai, Nguyen Thai-Nghe, 2021 Personalized student performance prediction using multivariate long short-term memory The 8th International Conference on Future Data and Security Engineering (FDSE 2021) Communications in Computer and Information Science Springer Nature Vol 1500, pp 238-247 E-ISSN: 1865-0937, P-ISSN: 18650929 DOI: 10.1007/978-981-16-8062-5_16 (Scopus Q4) CT10 Tran Thanh Dien, Nguyen Thanh-Hai and Nguyen ThaiNghe, 2021 Deep Matrix Factorization for Learning Resources Recommendation 13th International Conference on Computational Collective Intelligence (ICCCI 2021) Lecture Notes in Computer Science Springer Nature Vol 12876, pp 167-179 E-ISSN: 1611-3349, P-ISSN: 03029743 DOI: 10.1007/978-3-030-88081-1_13 (Scopus Q3) CHƯƠNG GIỚI THIỆU 1.1 Tính cấp thiết luận án Học tập mở trở thành phong trào đổi giáo dục phát triển không ngừng Tài nguyên giáo dục mở thiếu học tập mở Tài nguyên học tập dạng tài nguyên giáo dục phát triển cung cấp cho trình dạy học, đáp ứng mục tiêu học tập Tài nguyên học tập cung cấp thông qua hệ thống hệ thống học trực tuyến, hệ thống quản lý giáo trình/bài giảng, hệ thống quản lý đào tạo, hệ thống quản lý công trình nghiên cứu/cơng bố khoa học… Với phát triển nhanh chóng cơng nghệ thơng tin, nhu cầu học tập trực tuyến nhiều, ra, vấn đề di lại bị hạn chế tình hình dịch bệnh vấn đề khác, từ làm gia tăng nhu cầu sử dụng tài liệu phục vụ giảng dạy học tập trực tuyến Nhu cầu học trực tuyến nhiều dẫn đến yêu cầu tìm kiếm tài nguyên cầu học tập gia tăng Vì thế, cần có phương pháp tìm kiếm tài ngun học tập hiệu đề xuất tài nguyên phù hợp nhu cầu người học Mặc dù có nghiên cứu liên quan tìm kiếm gợi ý tài nguyên học tập, nhiên số vấn đề tồn cần nghiên cứu cải tiến đề xuất giải pháp để việc tìm kiếm tài nguyên học tập hiệu hơn, đáp ứng nhu cầu người học Tài nguyên học tập chủ yếu định dạng doc, pdf, cần giải vấn đề tìm kiếm tài liệu dạng phi cấu trúc Mặt khác, tài nguyên học tập ngày đa dạng thuộc nhiều lĩnh vực khác nên cần có phương pháp tìm kiếm hiệu quả, ví dụ phân loại để xác định lĩnh vực truy vấn, từ tìm kiếm lĩnh vực tương ứng thay tồn liệu Một vấn đề khác cần quan tâm vấn đề ngữ nghĩa tìm kiếm nhằm giúp cho trình tìm kiếm hiệu Ngồi ra, cần có phương pháp dự đốn xếp hạng/gợi ý tài nguyên học tập phù hợp với người học Vì vậy, nghiên cứu xây dựng mơ hình tìm kiếm gợi ý tài nguyên học tập có ý nghĩa khoa học thực tiễn trình triển khai hệ thống quản lý tài nguyên học tập 1.2 Mục tiêu, đối tượng, phạm vi phương pháp nghiên cứu Mục tiêu tổng quát luận án đề xuất mơ hình tìm kiếm gợi ý tài nguyên học tập nhằm đáp ứng nhu cầu người học, giúp cho việc học tập đạt kết tốt Mục tiêu cụ thể luận án (1) Nghiên cứu xây dựng mơ hình tìm kiếm tài ngun học tập có quan tâm đến vấn đề ngữ nghĩa nhằm nâng cao hiệu tìm kiếm đáp ứng nhu cầu người học; (2) Nghiên cứu xây dựng mơ hình dự đốn kết học tập gợi ý tài nguyên học tập phù hợp với người học Đối tượng nghiên cứu luận án mơ hình tìm kiếm gợi ý tài nguyên học tập Tài nguyên học tập bao hàm rộng đa dạng nguồn học liệu khác giảng mơn học, giáo trình, sách, báo, luận văn, luận án, hình ảnh, video nguồn học liệu số khác, nhiên phạm vi luận án tập trung chủ yếu vào loại tài nguyên học tập văn Phương pháp nghiên cứu luận án tổng hợp, phân tích nghiên cứu có liên quan tập hợp từ nhiều nguồn báo khoa học, sách nguồn tài liệu uy tín tin cậy, từ đề xuất mơ hình phương pháp tiếp cận nhằm nâng cao hiệu tìm kiếm gợi ý tài nguyên học tập 1.3 Nội dung nghiên cứu luận án Để thực mục tiêu trên, luận án cần giải nội dung nghiên cứu kiến trúc tổng thể Hình 1.1 Nội dung nghiên cứu thứ xây dựng mô hình phân loại tài nguyên học tập nhằm giới hạn khơng gian tìm kiếm, giúp cho q trình tìm hiệu Nội dung thể mục  kiến trúc Hình 1.1 trình bày chi tiết Chương 3; làm tiền đề cho tìm kiếm tài nguyên học tập trình bày Chương Nội dung nghiên cứu thứ hai xây dựng mơ hình tìm kiếm tài ngun học tập có quan tâm vấn đề ngữ nghĩa có kế thừa kết phân loại tài nguyên học tập nội dung nghiên cứu thứ Nội dung nghiên cứu thể mục   kiến trúc Hình 1.1 trình bày chi tiết Chương 4; làm tiền đề cho dự đoán xếp hạng gợi ý tài nguyên học tập trình bày Chương Chương Nội dung nghiên cứu thứ ba xây dựng mơ hình dự đốn xếp hạng, cụ thể dự đoán kết học tập mà người học đạt Nội dung nghiên cứu thể mục  kiến trúc Hình 1.1 trình bày chi tiết Chương 5; làm tiền đề sử dụng cho gợi ý tài nguyên học tập phù hợp với lực người học trình bày Chương Nội dung nghiên cứu thứ tư xây dựng mơ hình gợi ý tài nguyên học tập nhằm giúp người học chọn lựa tài nguyên học tập phù hợp với lực, từ nâng cao kết học tập Nội dung nghiên cứu thể mục  kiến trúc Hình 1.1 trình bày chi tiết Chương Hình 1.1: Kiến trúc hệ thống tìm kiếm gợi ý tài nguyên học tập 1.4 Các đóng góp luận án Thứ nhất, luận án đề xuất cách tiếp cận dựa kỹ thuật học sâu với mạng nơ-ron truyền thẳng đa tầng MLP, so sánh với kỹ thuật học máy khác Kết cho thấy cách tiếp cận đề xuất phân loại tài nguyên học tập khả thi tập liệu Các kết đóng góp thể qua công bố CT1 CT2 Thứ hai, luận án đề xuất hai cách tiếp cận tìm kiếm tài ngun học tập dựa tính tốn tương đồng nội dung văn tìm kiếm dựa mạng ngữ nghĩa ontology Cả hai cách tiếp cận tiền xử lý phân loại câu truy vấn tài nguyên học tập để xác định lĩnh vực tương ứng nhằm thu hẹp khơng gian tìm kiếm Giải pháp nhằm tăng tốc độ xử lý liệu tìm kiếm thử nghiệm Các kết đóng góp thể qua cơng bố CT3, CT4 CT5 Thứ ba, luận án đề xuất mơ hình dự đốn kết học tập với cách tiếp cận khác dựa kỹ thuật học sâu, bao gồm mơ hình dự đốn kết học tập cho toàn sinh viên sử dụng mạng nơ-ron tích chập CNN, mơ hình dự đốn theo nhóm lực học tập sử dụng mạng nơ-ron đa tầng MLP kỹ thuật học máy rừng ngẫu nhiên RF, mơ hình dự đốn theo sinh viên sử dụng nhớ ngắn dài hạn LSTM Các kết đóng góp thể qua cơng bố CT6, CT7, CT8 CT9 Thứ tư, luận án đề xuất mơ hình phân rã ma trận sâu DMF mở rộng từ phân rã ma trận chuẩn MF Hai nhóm liệu gồm tập liệu tài nguyên học tập tập liệu kết học tập sinh viên dùng để kiểm chứng mơ hình, đồng thời so sánh với kỹ thuật khác hệ thống gợi ý Các kết đóng góp thể qua cơng bố CT10 1.5 Tóm tắt bố cục của luận án Luận án trình bày thành chương Chương trình bày Chương bày sở lý thuyết nghiên cứu liên quan đến phân loại tài liệu, vấn đề tìm kiếm tài liệu, dự đoán xếp hạng gợi ý Chương đề xuất mơ hình phân loại tài ngun học tập sử dụng kỹ thuật học sâu Chương đề xuất mô hình tìm kiếm tài nguyên học tập dựa độ tương đồng văn tìm kiếm dựa mạng ngữ nghĩa Chương đề xuất mơ hình dự đốn kết học tập dựa tồn liệu sinh viên, theo nhóm lực học tập theo sinh viên sử dụng kỹ thuật học sâu Chương đề xuất mơ hình gợi ý tài nguyên học tập với kỹ thuật phân rã ma trận sâu, so sánh với phương pháp khác hệ thống gợi ý Chương trình bày tóm tắt kết hạn chế hướng nghiên cứu luận án CHƯƠNG CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU LIÊN QUAN Như đề cập, đối tượng nghiên cứu luận án mơ hình tìm kiếm gợi ý tài nguyên học tập Để giải hai vấn cần tìm hiểu mơ hình phân loại tài nguyên học tập, tìm kiếm tài nguyên học tập số vấn đề khác 2.1 Các kỹ thuật phân loại văn Trong hệ thống tìm kiếm tài nguyên học tập, đặc biệt nguồn tài nguyên có quy mơ lớn, giai đoạn q trình tìm kiếm xử lý truy vấn để xác định chủ đề nào, từ tìm miền hay chủ đề Vì vậy, việc phân loại truy vấn có vai trị quan trọng nhằm giới hạn khơng gian tìm kiếm, tăng tốc độ nâng cao độ xác kết tìm kiếm Có nhiều giải thuật cho toán phân loại văn theo phương pháp học máy k láng giềng gần nhất, Naïve Bayes, máy véctor hỗ trợ, định, rừng ngẫu nhiên để học tập câu hỏi mẫu gán nhãn từ xây dựng mơ hình phân loại câu truy vấn, máy véc-tơ hỗ trợ kỹ thuật sử dụng phổ biến hiệu 2.2 Các kỹ thuật tìm kiếm tài liệu dựa độ tương đồng Phát biểu tốn tính độ tương đồng sau: xét văn di dj Mục tiêu tìm giá trị S (di, dj), S € (0,1), thể độ tương đồng văn di dj Giá trị cao giống nghĩa hai văn nhiều Hiện nay, có số phương pháp tính độ tương đồng văn bản, có độ tương tự ngữ nghĩa văn (tương đồng cossine) độ tương tự thứ tự từ văn 2.3 Các kỹ thuật tìm kiếm dựa ngữ nghĩa ontology Web ngữ nghĩa (semantic web) mô hình liệu biểu diễn (ontology) lĩnh vực hai tảng tìm kiếm ngữ nghĩa Kiến trúc semantic web bao gồm nhiều tầng phức tạp Một ý tưởng semantic web liệu có nghĩa chia sẻ máy tính dạng mơ hình liệu biểu diễn lĩnh vực Ontology biểu tập khái niệm hay đối tượng, miền cụ thể mối quan hệ khái niệm Trình soạn thảo ontology ứng dụng thiết kế để hỗ trợ việc tạo thao tác ontologies 2.4 Hệ thống gợi ý kỹ thuật hệ thống gợi ý Bài toán gợi ý biểu diễn cách khái quát sau: Gọi U tập hợp n người dùng, I tập hợp m mục tin (item), R tập hợp giá trị đánh giá người dùng rui ∈ R (R ⊂ ℜ) xếp hạng người dùng u mục thông tin i Gọi Dtrain ⊆ U × I × R tập liệu huấn luyện; Dtest ⊆ U × I × R tập liệu kiểm thử; r: U × I → R (u, i) ↦ rui Mục tiêu RS tìm hàm: 𝑟𝑟̂ : U × I → ℜ cho hàm mục tiêu 𝒪𝒪(𝑟𝑟, 𝑟𝑟̂ ) thỏa mãn điều kiện Chẳng hạn, 𝒪𝒪 hàm để đo độ lỗi Root Mean Squared Error, đó: RMSE = ∑ (rui − rˆ(u ,i ) ) | D test | u ,i , r∈D test cần tối thiểu Một số kỹ thuật sử dụng cho nghiên cứu luận án Kỹ thuật phân rã ma trận MF việc chia ma trận lớn X thành hai ma trận có kích thước nhỏ W H, cho ta xây dựng lại X từ hai ma trận nhỏ xác tốt, nghĩa X ~ WHT, minh họa Hình 2.1 Kỹ thuật phân rã ma trận thiên vị BMF, biến thể kỹ thuật MF, theo giá trị dự đoán cộng thêm độ lệch (biases) Kỹ thuật phân rã ma trận TF dạng tổng quát kỹ thuật phân tích ma trận cho ngữ cảnh chiều với tensor Z với kích thước U × I × T, Z viết lại sau: 𝐙𝐙 ≈ ∑𝐾𝐾 𝑘𝑘=1 𝒘𝒘𝑘𝑘 ∘ 𝒉𝒉𝑘𝑘 ∘ 𝒒𝒒𝑘𝑘 Ngoài ra, số phương pháp phổ biến hệ thống gợi ý sử dụng để làm sở so sánh, chẳng hạn Global Average, User Average, Item Average, User kNN Một vấn đề khác liệu có kích thước lớn, đa dạng liệu cần huấn luyện với kỹ thuật tiên tiến hơn, kỹ thuật học sâu (deep learning) trình bày chi tiết phần gồm mạng nơ-ron truyền thẳng đa tầng MLP, mạng nơ-ron tích chập CNN, mạng nhớ ngắn dài hạn LSTM mơ hình phân loại xây dựng để xác định lĩnh vực báo Sau đó, hệ thống thực tìm kiếm lĩnh vực báo (query) với ngưỡng (threshold) cho trước trả kết danh sách báo có độ tương đồng phù hợp với threshold Một số thực nghiệm kiểm tra độ tương đồng báo trình bày Bảng 4.1 Khi người dùng nhập báo để kiểm tra độ tương đồng chọn ngưỡng tương đồng (threshold), sau thực kiểm tra cho kết báo tương đồng với báo xét với ngưỡng cho trước Bảng 4.1: Kết thực nghiệm kiểm tra độ tương đồng số báo Stt Bài báo kiểm tra Kết trả Lĩnh vực: Công nghệ; SIM threshold > 20% Xây dựng quy trình Bài báo 1: Nghiên cứu tận dụng rác thải tính tốn cấp phối nhựa gia cơng bê tông làm vật liệu xây cho bê tông tự lèn dựng SIM = 0,274 sở tối ưu cấp Bài báo 2: Phát triển thuật toán xử lý ảnh phối cốt liệu thể để phát ước lượng khoảng cách từ hệ camera đến tâm cà chua chín tích vữa SIM = 0,210 … Chúng thực nghiệm kiểm tra độ tương đồng hai báo định, kết minh họa Bảng 4.2 Bảng 4.2: Kết thực nghiệm kiểm tra độ tương đồng hai báo cho trước SIM Kết Stt Bài báo thứ Bài báo thứ threshold Sinh khối rừng Sinh khối khả > 30% SIM = tràm vườn quốc hấp thụ 0,556 gia U Minh CO2 rừng Thượng, tỉnh tràm khu bảo tồn Kiên Giang thiên nhiên Lung Ngọc Hồng 12 4.3 Tìm kiếm dựa mạng ngữ nghĩa ontology 4.3.1 Mơ hình đề xuất Kiến trúc tổng qt mơ hình tìm kiếm theo ngữ nghĩa mơ tả chi tiết Hình 4.1 Quá trình phân loại văn sử dụng kỹ thuật máy véc-tơ hỗ trợ SVM Hình 4.1: Lưu đồ kiến trúc hệ thống tìm kiếm ngữ nghĩa Trong nghiên cứu này, chúng tơi xây dựng hệ thống tìm kiếm theo ngữ nghĩa tài nguyên học tập thuộc lĩnh vực Công nghệ thông tin (gồm lĩnh vực: Hệ thống thông tin, Khoa học máy tính, Kỹ thuật phần mềm, Mạng máy tính truyền thơng), nhiên nghiên cứu mở rộng cho lĩnh vực khác 4.3.2 Dữ liệu thực nghiệm Từ lĩnh vực xác định, chúng tơi thu thập giáo trình, giảng liên quan Sau đó, xây dựng tự điển cho lĩnh vực cơng nghệ thơng tin, trích lọc câu (record) từ tài liệu thu thập Sau tiền xử lý liệu, thực bước tách từ, loại bỏ từ dừng (stop words) Dữ liệu sau xử lý thu gồm có 1.114 record với số chiều véc-tơ 1.336 (số thuộc tính) 13 4.3.3 Kết thực nghiệm Để phân loại liệu, sử dụng giải thuật SVM đánh giá mơ hình phân loại dựa vào số precision, recall độ đo F1 Kết thực nghiệm cho thấy hiệu phân loại giải thuật SVM tốt, cho độ xác > 95% Trong nghiên cứu này, thực nghiệm xây dựng hệ thống tìm kiếm dựa mạng ngữ nghĩa ontology mô tả sơ đồ Hình 4.3 Hình 4.2: Sơ đồ hệ thống tìm kiếm ngữ nghĩa Trong nghiên cứu này, thử nghiệm giải pháp tăng tốc xử lý liệu phục vụ cho tìm kiếm dựa kỹ thuật xử lý liệu lớn Thực nghiệm cho thấy việc xử lý song song rút ngắn nhiều thời gian xử lý liệu tìm kiếm so với tìm kiếm truyền thống độ xác khơng thay đổi 4.4 Kết chương Trong chương này, đề xuất cách tiếp cận tìm kiếm tài nguyên học tập dựa vào độ tương đồng văn bản, kết hợp độ tương tự ngữ nghĩa văn với độ tương tự thứ tự từ văn Bên cạnh đó, chúng tơi đề xuất giải pháp tìm kiếm tài nguyên học tập dựa mạng ngữ nghĩa ontology Để tăng tốc độ tìm kiếm tài nguyên học tập, giải pháp tăng tốc độ xử lý liệu thử nghiệm Kết thực nghiệm cho thấy giải pháp, mơ hình đề xuất khả thi để áp dụng cho tìm kiếm tài nguyên học tập dựa độ tương tự ngữ nghĩa dựa mạng ngữ nghĩa ontology 14 CHƯƠNG MÔ HÌNH DỰ ĐỐN KẾT QUẢ HỌC TẬP 5.1 Giới thiệu Trong chương này, chúng tơi đề xuất mơ hình dự đoán kết học tập với ba cách tiếp cận dựa kỹ thuật học sâu, gồm xây dựng mơ hình dự đốn cho tồn sinh viên sử dụng mạng nơron tích chập CNN, mơ hình dự đốn theo nhóm lực học tập sử dụng mạng nơ-ron đa tầng MLP kỹ thuật học máy rừng ngẫu nhiên RF, mơ hình dự đốn theo sinh viên sử dụng nhớ ngắn dài hạn LSTM mạng MLP Kết thực nghiệm cho thấy mơ hình đề xuất cho kết dự đốn tốt, áp dụng vào trường hợp thực tế Nội dung trình bày chương cơng bố cơng trình CT6, CT7, CT8 CT9 5.2 Mơ hình dự đốn kết học tập tồn liệu 5.2.1 Mơ hình đề xuất Kiến trúc học sâu sử dụng mạng nơ-ron tích chập CNN liệu chiều có dạng minh họa Hình 5.1 Mạng CNN đề xuất nhận đầu vào gồm chuỗi liệu với 21 thuộc tính qua lớp tích chập sử dụng 64 kernels kích thước với bước trượt (stride) Hình 5.1: Kiến trúc CNN đề xuất 15 5.2.2 Dữ liệu thực nghiệm Dữ liệu thu thập liên quan đến sinh viên, môn học, điểm thông tin khác từ năm 2007 đến 2019 với 3,8 triệu mẫu tin Dữ liệu chia theo giai đoạn, từ 2007 đến 2016 dùng huấn luyện từ 2017 đến 2019 dùng kiểm tra 5.2.3 Kết thực nghiệm Quá trình tìm siêu tham số: Chúng tơi so sánh sử dụng hàm tối ưu RMSprop Adam; sử dụng kỹ thuật early stopping với epochs liên tục kết khơng cải thiện q trình học dừng, chạy tối đa 500 epochs Chúng sử dụng độ đo MAE Phép biến đổi liệu: Các giá trị đầu vào lớn làm chậm trình học hội tụ, thời gian huấn luyện lớn Vì thế, ta biến đổi (scale) giá trị thuộc tính khoảng giá trị định Trong nghiên cứu đề xuất sử dụng QTF (Quantile Transformation) làm phép biến đổi liệu, giúp giải thuật học sâu hội tụ tốt Thực nghiệm sử dụng mạng CNN, phép biến đổi QTF hàm tối ưu Adam cho thấy kết dự đốn có độ sai số tốt có 16 tập liệu xét có độ đo MAE nhỏ 0,8 (dự đốn thang điểm 4), cá biệt có độ đo MAE nhỏ 0,5 sử dụng kiến trúc CNN Luận án tiếp tục sử dụng mạng CNN biến đổi liệu QTF, nhiên, việc sử dụng hàm tối ưu Adam, đề xuất sử dụng thêm hàm tối ưu RMSprop để so sánh, đánh giá khách quan mơ hình đề xuất Kết thực nghiệm Bảng 5.1 cho thấy với mơ hình dự đốn sử dụng mạng CNN hàm tối ưu RMSprop cho kết dự đoán tốt Adam hầu hết tập liệu xét (13/16 tập liệu), sử dụng kết hợp với phép biến đổi liệu QTF Kết cho thấy hàm tối ưu RMSprop có khả phù hợp sử dụng liệu chiều (1D) có tính chất trình tự (sequence time) Với phép biến đổi QTF, hàm tối ưu RMSprop Adam, thực nghiệm với mơ hình sử dụng mạng CNN để dự 16 đốn kết học tập tồn tập liệu chứa 3,8 triệu mẫu tin thu thập từ tất đơn vị đào tạo Trường Đại học Cần Thơ Kết cho thấy sử dụng hàm tối ưu Adam cho kết tốt so với hàm tối ưu RMSprop sử dụng mô hình dự đốn với kiến trúc mạng CNN Điều lý giải sử dụng tồn tập liệu tính chất trình tự liệu bị hạn chế, hàm RMSprop chưa phát huy mạnh Bảng 5.1: Kết dự đoán kết học tập với độ đo MAE sử dụng mơ hình học sâu CNN, phép biến đổi QTF hai hàm tối ưu Adam RMSprop CNNCNNDataset RMSprop Adam Sư phạm 0,5733 0,5847 Môi trường Tài nguyên thiên nhiên 0,5989 0,6130 Kinh tế 0,5922 0,6098 Ngoại ngữ 0,4853 0,4961 Khoa học Xã hội Nhân văn 0,5920 0,5793 Thủy sản 0,5918 0,6471 Luật 0,5546 0,5675 Khoa học Chính trị 0,5765 0,5547 Nghiên cứu phát triển ĐBSCL 0,5678 0,5684 Nông nghiệp 0,5806 0,5828 Nghiên cứu phát triển CNSH 0,5330 0,5980 Giáo dục thể chất 0,6762 0,6853 Công nghệ 0,7454 0,7487 Công nghệ Thông tin Truyền thông 0,6903 0,7285 Khoa học Tự nhiên 0,6725 0,7989 Phát triển Nơng thơn 0,7134 0,6936 5.3 Mơ hình dự đốn kết theo nhóm lực học tập 5.3.1 Mơ hình đề xuất Trong nghiên cứu này, chúng tơi đề xuất sử dụng bốn mơ hình dự đốn cho bốn nhóm sinh viên có học lực khác sử dụng kỹ thuật MLP Hình 5.2 Kiến trúc MLP bao gồm tầng input, tầng 17 output tầng ẩn Tầng input chứa thuộc tính liệu, tầng output có nơ-ron biểu diễn điểm cần dự đốn có giá trị từ đến Bốn tầng ẩn chứa 256 nơ-ron tầng ẩn thứ năm chứa nơ-ron Hình 5.2: Sơ đồ tổng quát phương pháp tiếp cận Chúng sử dụng kỹ thuật early stopping với epochs, chạy tối đa 500 epochs; hàm tối ưu Adam, tốc độ học mặc định 0,001 5.3.2 Mô tả liệu Dữ liệu thu thập liên quan đến sinh viên, môn học, điểm thông tin khác từ năm 2007 đến 2019 với 3,8 triệu mẫu tin Chúng chia liệu theo thời gian, tập train tập test có tỷ lệ 2/3 1/3 5.3.3 Kết thực nghiệm Để so sánh, sử dụng baselines User Average (dự đoán dựa kết trung bình sinh viên), Item Average (dự đốn dựa kết trung bình mơn học) Ngồi ra, chúng tơi so sánh với phương pháp khác lọc cộng tác Trong nghiên cứu này, sử dụng hai độ đo phổ biến RMSEvà MAE để đánh giá mơ hình, lấy trung bình 10 lần chạy thực nghiệm 18 Kết thực nghiệm với hai độ đo RMSE MAE trình bày Hình 5.3 GroupMLP trình bày bốn mơ hình dựa bốn nhóm lực học tập sinh viên MLP trình bày mơ hình để dự đoán kết học tập tất sinh viên Hình 5.3: So sánh RMSE MAE GroupMLP MLP Kết cho thấy GroupMLP hoạt động tốt so với phương pháp khác hệ thống gợi ý (baselines) với hai độ đo MAE RMSE cho kết cải thiện 70% Ngoài sử dụng kỹ thuật MLP, đề xuất mơ hình đốn khác dựa điểm tích lũy (GPA) để chia thành bốn mơ hình khác (bao gồm xuất sắc/excellent, giỏi/very good, khá/good trung bình/fairly) sử dụng giải thuật rừng ngẫu nhiên RF Kết cho thấy mơ hình cho kết qua dự đốn tốt theo nhóm lực học tập 5.4 Mơ hình dự đốn kết học tập theo sinh viên 5.4.1 Mơ hình đề xuất liệu thực nghiệm Trong nghiên cứu này, đề xuất mơ hình dự đốn kết học tập sinh viên sử dụng mạng nhớ ngắn dài hạn LSTM mạng nơ-ron truyền thẳng đa tầng MLP Kiến trúc mạng LSTM nhận đầu vào luồng liệu bước thời gian có trình tự (Sequences of time steps) Tầng LSTM có 50 nơ-ron, tầng ẩn kết nối dày đặc có nơ-ron cho kết dự đoán giá trị khoảng từ đến Hình 5.4 19 Hình 5.4: Kiến trúc mạng LSTM Trong đó, kiến trúc mạng MLP gồm tầng input, tầng ẩn tầng output Tầng input chứa thuộc tính liệu đầu vào Tầng ẩn có nơ-ron sử dụng hàm kích hoạt ReLU, tầng ẩn thứ hai thứ ba có 27 nơ-ron sử dụng hàm kích hoạt sigmoid, tầng ẩn thứ tư có nơ-ron sử dụng hàm kích hoạt ReLU, tầng ẩn thứ năm có nơ-ron cho giá trị đầu khoảng từ đến Hình 5.5 Hình 5.5: Kiến trúc mạng MLP Để thực nghiệm, sử dụng tập liệu kết học tập sinh viên số đơn vị đào tạo (chủ yếu khối khoa học kỹ thuật) trường đại học Dữ liệu kết học tập lấy từ năm 2017 đến năm 2019 với triệu mẫu tin Để đa dạng hóa nguồn liệu, chúng tơi chia tập liệu gốc với triệu mẫu tin kết học tập môn học sinh viên thành tập liệu giữ lại sinh viên có 10 mẫu tin 20 mẫu tin kết học tập 5.4.2 Kết thực nghiệm Kết dự đoán sử dụng độ đo RMSE với hai kiến trúc mạng nhớ ngắn dài hạn LSTM mạng nơ-ron đa tầng MLP thể Bảng 5.2 20 Bảng 5.2: Kết dự đoán với RMSE hai kiến trúc LSTM MLP Dataset LSTM MLP Mơ tả Tập liệu có từ 10 StudentPerformance10 0,505 0,536 mẫu tin / sinh viên Tập liệu có từ 20 StudentPerformance 20 0,513 0,526 mẫu tin / sinh viên Kết cho thấy mơ hình LSTM dự đốn đạt hiệu suất tốt mơ hình MLP tập liệu Điều cho thấy mạng LSTM hoạt động tốt liệu có yếu tố chuỗi thời gian Với mơ hình sử dụng kiến trúc MLP, kết tốt so với huấn luyện mơ hình cho tất sinh viên nghiên cứu phần trước 5.5 Tổng kết chương Trong chương này, chúng tơi trình bày cách tiếp cận xây dựng mơ hình dự đốn kết học tập toàn liệu sinh viên sử dụng mạng CNN, mơ hình dự đốn kết học tập theo nhóm lực học tập sử dụng mạng MLP rừng ngẫu nhiên RF, mơ hình dự đốn kết học tập theo sinh viên sử dụng mạng LSTM MLP Các kết thực nghiệm cho thấy, mơ hình đề xuất cho kết dự đốn tốt cải thiện dần theo trình tự cách tiếp cận nêu Điều cho thấy, mơ hình kỹ thuật đề xuất, đặc biệt kỹ thuật học sâu áp dụng thực tế cho dự đoán kết học tập, từ sử dụng cho gợi ý môn học phù hợp cho sinh viên 21 CHƯƠNG MƠ HÌNH GỢI Ý TÀI NGUN HỌC TẬP 6.1 Giới thiệu Trong chương này, chúng tơi đề xuất mơ hình phân rã ma trận sâu DMF mở rộng từ phân rã ma trận chuẩn MF nhằm gợi ý tài nguyên học tập phù hợp với lực người học Nội dung trình bày chương cơng bố cơng trình CT10 6.2 Mơ hình gợi ý tài ngun học tập mơ hình DMF Chúng tơi đề xuất mơ hình gợi ý sử dụng phân rã ma trận sâu DMF mô tả chi tiết Hình 6.1 Hình 6.1: Framework mơ hình DMF Mơ hình DMF đề xuất có layer Input layer mô tả người dùng/tài nguyên học tập Embedding layer để nhúng thuộc tính người dùng tài nguyên học tập (các yếu tố tiềm ẩn) Các thuộc tính nhúng nối với làm đầu vào cho hidden layer MLP Cuối cùng, output layer cho kết giá trị xếp hạng dự đoán Trong nghiên cứu này, hidden layer MLP có 128 nơron (có thể thiết lập số lớp ẩn số nơ-ron khác phụ thuộc vào tập liệu) Số nơ-ron chọn phương pháp tìm kiếm siêu tham số (hyper-parameter) Mạng triển khai với hàm tối ưu Adam, với tốc độ học (learning rate) mặc định 0,001 22 6.3 Dữ liệu thực nghiệm Chúng tơi kiểm chứng mơ hình đề xuất dựa hai nhóm liệu thực nghiệm, gồm tập liệu tài nguyên học tập tập liệu kết học tập sinh viên trường đại học Các tập liệu tài nguyên học tập: Gồm tập liệu mô tả việc đánh giá (ratings) tài nguyên học tập (item) người dùng (user) Số lượng người dùng, tài nguyên học tập xếp hạng tập liệu mô tả Bảng 6.1 Các tập liệu thưa (sparse), lọc để giữ lại người dùng/tài nguyên học tập có ratings Bảng 6.1: Mơ tả tập liệu đầy đủ Stt Dataset Ratings LibraryThings BX-Book-ratings Related-Article Recommendation Ratings-Books #user #item 53.424 10.000 70.618 385.251 105.283 340.556 2.663.825 7.224.279 #ratings 981.756 1.387.125 1.149.780 48.879.167 8.026.324 2.330.066 22.507.155 Các tập liệu kết học tập sinh viên: Gồm tập liệu kết học tập sinh viên Tập liệu thứ kết học tập sinh viên số đơn vị đào tạo trường đại học Trong đó, tập liệu thứ hai kết học tập sinh viên giữ lại 10 mẫu tin (10 môn học) cho sinh viên Tương tự, tập liệu thứ lọc giữ lại 20 mẫu tin cho sinh viên 6.4 Kết thực nghiệm Trong nghiên cứu này, sử dụng độ đo RMSE để đánh giá mơ hình so sánh phương pháp khác hệ thống gợi ý Global Average, User Average, Item Average, User-kNN CF MF Các siêu tham số (hyperparameters) tìm thơng qua thực nghiệm Cả hai thực nghiệm hai nhóm liệu gồm tập liệu tài nguyên học tập tập liệu kết học tập sinh viên cho kết tương đồng 23 Chẳng hạn nhóm tập liệu tài ngun học tập, chúng tơi tìm số nơ-ron tầng MLP vào khoảng 100; số yếu tố tiềm ẩn (latent factors) K ~ 10; số epochs để mơ hình DMF hội tụ (so với mơ hình MF hội tụ sau đến epochs) Tương tự nhóm tập liệu kết học tập sinh viên, mơ hình DMF ln hội tụ sớm Một ví dụ độ đo RMSE DMF phương pháp khác hệ thống gợi ý tập liệu Dataset Hình 6.2 Kết tương tự tập liệu khác Hình 6.2: So sánh RMSE phương pháp dataset (Ratings) Nhìn chung, DMF cho kết vượt trội so với phương pháp khác hệ thống gợi ý Những tập liệu khắc phục tình trạng liệu thưa kết ghi nhận tốt so với tập liệu gốc Từ kết dự đốn xếp hạng sử dụng để gợi ý môn học hay gợi ý tài nguyên học tập phù hợp với người học 6.5 Tổng kết chương Trong chương này, đề xuất mô hình phân rã ma trận sâu DMF Chúng tơi kiểm chứng mơ hình đề xuất hai nhóm liệu gồm tập liệu tài nguyên học tập tập liệu kết học tập sinh viên so sánh mơ hình đề xuất với phương pháp khác hệ thống gợi ý Kết cho thấy mơ hình DMF có hiệu suất dự đoán tốt so với kỹ thuật khác tập liệu Từ kết dự đốn xếp hạng gợi ý tài ngun học tập hay gợi ý môn học phù hợp với người học 24 CHƯƠNG KẾT LUẬN VÀ HƯỚNG NGHIÊN CỨU 7.1 Kết luận Để thực mục tiêu tổng quát luận án xây dựng mơ hình tìm kiếm gợi ý tài ngun học tập, luận án đề xuất mơ hình phân loại, tìm kiếm tài ngun học tập, dự đốn kết học tập gợi ý tài nguyên học tập với kỹ thuật khác nhằm giải vấn đề tồn cần nghiên cứu Các kết luận án tóm tắt sau: Đề xuất mơ hình phân loại tài ngun học tập dựa tiếp cận kỹ thuật học sâu với mạng nơ-ron truyền thẳng đa tầng MLP Thực nghiệm so sánh cách tiếp cận kỹ thuật học sâu với kỹ thuật học máy bật khác, kết cho thấy cách tiếp cận cho kết phân loại tài liệu khả thi hiệu Đề xuất hai cách tiếp cận tìm kiếm tài nguyên học tập dựa tương đồng nội dung văn dựa mạng ngữ nghĩa ontology Ở cách tiếp cận, truy vấn tài nguyên học tập phân loại để xác định lĩnh vực nhằm thu hẹp khơng gian tìm kiếm trước tìm lĩnh vực tương ứng tài nguyên học tập xây dựng sẵn Đề xuất mơ hình dự đốn kết học tập sử dụng kỹ thuật học sâu gồm mơ hình dự đốn kết học tập toàn liệu sinh viên sử dụng mạng nơ-ron tích chập CNN, mơ hình dự đốn theo nhóm lực học tập sử dụng mạng nơ-ron truyền thẳng đa tầng MLP rừng ngẫu nhiên RF, mơ hình dự đoán theo sinh viên sử dụng mạng nhớ ngắn dài hạn LSTM Kết thực nghiệm cho thấy mơ hình đề xuất cho kết dự đốn tốt cải thiện dần theo trình tự cách tiếp cận nêu Điều cho thấy mơ hình kỹ thuật đề xuất, đặc biệt kỹ thuật học sâu có tiềm để xây dựng mơ hình dự đốn kết học tập hay tài nguyên học tập nói chung Nghiên cứu đề xuất mơ hình gợi ý tài nguyên học tập sử dụng kỹ thuật phân rã ma trận sâu DMF mở rộng từ kỹ thuật phân 25 rã ma trận chuẩn MF Mơ hình kiểm chứng với hai nhóm liệu gồm tập liệu tài nguyên học tập tập liệu kết học tập sinh viên trường đại học Mơ hình DMF so sánh với kỹ thuật khác hệ thống gợi ý Kết cho thấy mơ hình DMF có hiệu suất dự đoán xếp hạng tốt so với kỹ thuật khác, từ gợi ý tài nguyên học tập hay môn học phù hợp với người học 7.2 Hướng nghiên cứu Luận án đề xuất hai tiếp cận tìm kiếm tài nguyên học tập dựa độ tương đồng văn dựa mạng ngữ nghĩa Thời gian tới, việc nghiên cứu phương pháp đánh giá hiệu mô hình tìm kiếm dựa mạng ngữ nghĩa ontology cần thiết Việc so sánh hiệu tìm kiếm hai cách tiếp cận cần xem xét Cần triển khai thực nghiệm nhiều tập liệu khác mơ hình dự đốn xếp hạng kết học tập, gợi ý tài nguyên học tập để có đánh giá tồn diện, khách quan kỹ thuật đề xuất, đặc biệt kỹ thuật học sâu Ngoài ra, cần nghiên cứu bổ sung nhiều thuộc tính (đa thuộc tính) có yếu tố thời gian, chọn lọc thuộc tính có ảnh hưởng tính cực đến kết dự đốn để cải thiện hiệu mơ hình học sâu Các mơ hình tìm kiếm, dự đốn gợi ý tập trung tài nguyên học tập dạng văn Một vấn đề nghiên cứu thời gian tới nghiên cứu cải tiến mơ hình cho dạng tài nguyên học tập khác, chẳng hạn video Nghiên cứu tạo gắn kết cho kết nghiên cứu luận án cần thiết Ngồi ra, nghiên cứu tích hợp mơ hình tìm kiếm, dự đốn xếp hạng gợi ý tài nguyên học tập thành hệ thống quản lý tài nguyên học tập để áp dụng vào trường hợp thực tiễn sở giáo dục, đặc biệt giáo dục đại học 26 ... hạng /gợi ý tài nguyên học tập phù hợp với người học Vì vậy, nghiên cứu xây dựng mơ hình tìm kiếm gợi ý tài ngun học tập có ý nghĩa khoa học thực tiễn trình triển khai hệ thống quản lý tài nguyên học. .. quát luận án xây dựng mơ hình tìm kiếm gợi ý tài ngun học tập, luận án đề xuất mơ hình phân loại, tìm kiếm tài ngun học tập, dự đốn kết học tập gợi ý tài nguyên học tập với kỹ thuật khác nhằm... ý tài nguyên học tập phù hợp với người học Đối tượng nghiên cứu luận án mơ hình tìm kiếm gợi ý tài nguyên học tập Tài nguyên học tập bao hàm rộng đa dạng nguồn học liệu khác giảng môn học, giáo

Ngày đăng: 19/01/2022, 11:50

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w