Tính cấp thiết của đề tài
Tình trạng sinh viên tốt nghiệp muộn hoặc không tốt nghiệp đang trở thành một vấn đề nghiêm trọng trong giáo dục đại học tại Việt Nam và trên toàn thế giới, với tỷ lệ sinh viên bị buộc thôi học đạt 7,66% và tỷ lệ tốt nghiệp muộn là 10,4% trong năm học 2019-2020 Theo VnExpress, khoảng 14-50% sinh viên tại các cơ sở giáo dục đại học không hoàn thành chương trình học, dẫn đến lãng phí nguồn lực thời gian, tài chính và sức khỏe tâm lý Việc chậm tốt nghiệp không chỉ gây khó khăn cho sinh viên trong việc tìm kiếm việc làm mà còn ảnh hưởng đến tăng trưởng kinh tế và phát triển xã hội Bên cạnh đó, sinh viên gặp áp lực tâm lý do cảm giác bất an và thiếu hứng thú trong học tập, có thể dẫn đến lo âu và trầm cảm Hơn nữa, họ thường phải đối mặt với sự phân biệt và kỳ thị trong xã hội, gây ra cảm giác bị bỏ lại và mất niềm tin vào bản thân, góp phần vào sự bất đồng và mất cân bằng xã hội.
Tình trạng học tập của sinh viên bị ảnh hưởng bởi nhiều yếu tố, bao gồm lý do tâm lý, hoàn cảnh gia đình, và môi trường bạn bè Phương pháp học tập tại đại học cũng đóng vai trò quan trọng, cùng với việc thiếu tập trung do ảnh hưởng từ môi trường học tập tại các cơ sở giáo dục Gia đình và nhà trường cần chú ý đến những yếu tố này để hỗ trợ sinh viên tốt hơn.
Can thiệp sớm để xác định sinh viên có nguy cơ tốt nghiệp muộn hoặc không đủ điều kiện tốt nghiệp là rất quan trọng Việc dự đoán tình trạng nguy cơ này giúp gia đình và nhà trường tư vấn kịp thời, từ đó hỗ trợ sinh viên định hướng học tập hiệu quả hơn Các nhà nghiên cứu và quản lý giáo dục đại học cần phát triển các mô hình dự báo và cảnh báo sớm về kết quả học tập để hỗ trợ sinh viên hoàn thành chương trình đào tạo Nghiên cứu về các mô hình này đang được nhiều chuyên gia trong lĩnh vực giáo dục quan tâm (Guo et al., 2015; Tanuar et al., 2018; Altabrawee et al., 2019).
Dự báo sớm kết quả học tập của sinh viên là một thách thức lớn đối với các cơ sở giáo dục đại học do nhiều yếu tố phức tạp Mỗi sinh viên có nền tảng học vấn, khả năng và hoàn cảnh riêng, khiến cho việc dự đoán trở nên khó khăn và không chính xác Quá trình học tập kéo dài và bị ảnh hưởng bởi nhiều yếu tố như tâm lý, xã hội và môi trường học tập, trong đó nhiều sinh viên có thể gặp khó khăn trong việc hòa nhập hoặc gặp vấn đề về sức khỏe, ảnh hưởng đến kết quả học tập Hơn nữa, các trường đại học phải đối mặt với việc thu thập, xử lý và phân tích một lượng lớn dữ liệu phức tạp để đưa ra dự báo chính xác.
Tại Học viện Ngân hàng, tỷ lệ sinh viên tốt nghiệp đúng hạn trong thời gian
Trong giai đoạn 2017-2022, tỷ lệ sinh viên đại học chính quy tốt nghiệp đạt khoảng 60-70%, trong khi có khoảng 10-15% sinh viên không hoàn thành chương trình học hoặc bị buộc thôi học Thực trạng này yêu cầu cần tiến hành các nghiên cứu sâu hơn để tìm ra nguyên nhân và giải pháp phù hợp.
Mô hình cảnh báo sớm kết quả học tập cho sinh viên đại học chính quy tại Học viện Ngân hàng nhằm đánh giá các nhân tố ảnh hưởng đến kết quả học tập Việc này không chỉ giúp sinh viên và gia đình có giải pháp hỗ trợ cần thiết, mà còn giảm thiểu tỷ lệ sinh viên bị buộc thôi học hoặc không tốt nghiệp Đây là vấn đề cấp thiết đối với giáo dục đại học ở Việt Nam hiện nay, đặc biệt tại Học viện Ngân hàng Phòng Đào tạo Học viện Ngân hàng đề xuất nghiên cứu nhằm xây dựng mô hình này, từ đó nâng cao chất lượng giáo dục và hỗ trợ sinh viên hiệu quả hơn.
Mục tiêu nghiên cứu của đề tài
Nghiên cứu nhằm phân tích và dự báo kết quả học tập của sinh viên đại học chính quy, từ đó xây dựng mô hình cảnh báo sớm để hỗ trợ sinh viên tại Học viện Ngân hàng Mục tiêu là đề xuất các giải pháp nhằm nâng cao kết quả học tập, giảm tỷ lệ sinh viên chậm tốt nghiệp và không tốt nghiệp.
Phương pháp nghiên cứu
Phương pháp nghiên cứu của đề tài kết hợp giữa nghiên cứu định tính và định lượng, với các phương pháp cụ thể được áp dụng để đảm bảo tính chính xác và độ tin cậy của kết quả nghiên cứu.
Phương pháp phân tích và tổng hợp thông tin được áp dụng trong nghiên cứu này nhằm khai thác dữ liệu thứ cấp từ các nghiên cứu trong nước và kinh nghiệm thực tiễn Mục tiêu là dự báo sớm kết quả học tập của sinh viên, từ đó nâng cao hiệu quả giáo dục.
11 trường đại học kết hợp phân tích thực trạng kết quả học tập của sinh viên Học viện Ngân hàng
Nghiên cứu này áp dụng phương pháp khảo sát bằng cách phân tích số liệu sơ cấp và thứ cấp liên quan đến kết quả học tập của sinh viên tại Học viện Ngân hàng.
Phương pháp phân tích số liệu áp dụng trí tuệ nhân tạo, bao gồm học máy và học sâu, nhằm phân tích dữ liệu kết quả học tập của sinh viên đại học chính quy trong giai đoạn 2010-2021 Mục tiêu là dự báo kết quả học tập và xây dựng mô hình cảnh báo sớm về hiệu suất học tập của sinh viên.
Kết cấu đề tài
Ngoài phần Mở đầu và Kết luận, đề tài nghiên cứu được bố cục thành 03 chương như sau:
Cơ sở lý thuyết về mô hình cảnh báo sớm kết quả học tập của sinh viên đại học chính quy
1.1.1 Phân tích dữ liệu học tập sinh viên
Dự báo kết quả học tập sinh viên
Dự báo kết quả học tập sinh viên là quá trình áp dụng phương pháp thống kê và trí tuệ nhân tạo để dự đoán thành tích học tập của sinh viên dựa trên dữ liệu hiện có Quá trình này nhằm hỗ trợ các nhà giáo dục và quản lý trong việc đưa ra quyết định hợp lý để phát triển năng lực và hỗ trợ sinh viên hiệu quả hơn.
Các phương pháp dự báo kết quả học tập của sinh viên bao gồm phương pháp truyền thống và phương pháp hiện đại, trong đó phương pháp hiện đại sử dụng các mô hình học máy và học sâu để nâng cao độ chính xác trong việc dự đoán.
Phương pháp dự báo truyền thống dựa trên thông tin về thành tích học tập trước đây của sinh viên, quá trình học tập hiện tại và các yếu tố liên quan để dự đoán kết quả học tập tương lai Phương pháp này có ưu điểm là dễ triển khai, chi phí thấp và độ chính xác đáng tin cậy trong một số trường hợp Tuy nhiên, hạn chế lớn nhất là chỉ có thể dự báo dựa trên quá khứ, không thể phản ánh các yếu tố mới phát sinh trong quá trình học tập.
Phương pháp dự báo hiện đại sử dụng các mô hình học máy và học sâu là một kỹ thuật tiên tiến, giúp xây dựng các mô hình dựa trên dữ liệu học tập Các mô hình này được huấn luyện trên tập dữ liệu huấn luyện và sau đó dự báo kết quả học tập cho sinh viên mới Ưu điểm nổi bật của phương pháp này là khả năng dự báo chính xác hơn nhờ vào việc sử dụng thông tin đa dạng, có thể phát hiện các yếu tố mới và áp dụng cho nhiều đối tượng sinh viên khác nhau Tuy nhiên, phương pháp này cũng có những hạn chế, bao gồm yêu cầu về dữ liệu đầy đủ và chất lượng cao để huấn luyện, cùng với sự cần thiết có kỹ năng và kiến thức chuyên môn để xử lý và phân tích dữ liệu.
Cơ sở kỹ thuật của mô hình cảnh báo sớm kết quả học tập sinh viên đại học chính quy
Khai phá dữ liệu (Data Mining) là quá trình tìm kiếm thông tin ẩn trong các tập dữ liệu lớn thông qua các phương pháp khoa học máy tính và trí tuệ nhân tạo Mục tiêu của khai phá dữ liệu là khám phá mối quan hệ, khuynh hướng, mẫu số và tri thức mới, từ đó hỗ trợ các tổ chức và doanh nghiệp đưa ra quyết định chính xác và hiệu quả hơn.
Khai phá dữ liệu là bước quan trọng trong quá trình khai phá tri thức, sử dụng các thuật toán để tìm kiếm tri thức dưới dạng mẫu và mô hình Hai chức năng chính của khai phá dữ liệu là mô tả và dự báo Chức năng mô tả tìm kiếm các đặc trưng và tính chất quan trọng, trong khi chức năng dự báo phân tích dữ liệu quá khứ và hiện tại để dự đoán giá trị tương lai Mục tiêu chính của khai phá dữ liệu là áp dụng các kỹ thuật thống kê và giải thuật để phát hiện các mẫu và mô hình ẩn trong khối lượng lớn dữ liệu.
Khai phá dữ liệu là một lĩnh vực đang phát triển nhanh chóng, kết hợp giữa dữ liệu lớn (Big Data) và các kỹ thuật thống kê, học máy, học sâu Lĩnh vực này sử dụng các thuật toán hỗ trợ cho dữ liệu lớn và dữ liệu phân tán để rút trích tri thức, quy luật và thông tin có giá trị từ Big Data.
Hình 1 Mối quan hệ giữa khai phá dữ liệu và kinh doanh thông minh
Có nhiều phương pháp và kỹ thuật khai phá dữ liệu phổ biến như phân tích hồi quy đa biến, phân tích chuỗi thời gian, phân tích động, phân lớp, phân cụm, phân tích chuỗi, phân tích nhân tố, phân tích mạng và học máy Những phương pháp này cho phép các nhà nghiên cứu và chuyên gia tạo ra các mô hình dự báo và dự đoán hiệu quả trong nhiều lĩnh vực, đặc biệt là trong giáo dục (Jiawei và cộng sự, 2006; Bao HT, 2008).
Quy trình khai phá dữ liệu bao gồm 5 bước như trong hình 2
Hình 2 Quy trình khai phá dữ liệu
Nguồn: Bao HT(2008) 1.2.2 Học máy
Học máy (Machine Learning) là một lĩnh vực trong khoa học máy tính và trí tuệ nhân tạo, tập trung vào phát triển các phương pháp và thuật toán giúp máy tính tự động học từ dữ liệu Mục tiêu của học máy là cải thiện hiệu suất trong dự đoán và phân loại thông qua việc sử dụng các kỹ thuật toán học và thống kê, đặc biệt trong các bài toán liên quan đến dữ liệu lớn.
Học máy có nhiều ứng dụng đa dạng, bao gồm nhận dạng ký tự trong hình ảnh và âm thanh, phân loại thư rác, dự báo thời tiết, cũng như phân tích dữ liệu trong nhiều lĩnh vực khác nhau.
16 kinh doanh và tài chính Học máy cũng được sử dụng rộng rãi trong lĩnh vực y tế để phát hiện bệnh và dự đoán kết quả điều trị
Học máy và thống kê đều nghiên cứu phân tích dữ liệu, nhưng học máy chú trọng vào sự phức tạp của các thuật toán trong việc thực thi tính toán, khác với cách tiếp cận của thống kê.
Học máy được chia thành ba phương pháp chính tương tự như cách học của con người: Học có giám sát, Học bán giám sát và Học không giám sát.
Hình 3 Phân loại học máy theo phương thức học
Học có giám sát (Supervised Learning) : Theo Cunningham và cộng sự
Học có giám sát là phương pháp sử dụng dữ liệu đã được gán nhãn để suy luận mối quan hệ giữa đầu vào và đầu ra Dữ liệu này, gọi là dữ liệu huấn luyện, bao gồm các cặp đầu vào - đầu ra Mục tiêu chính của học giám sát là xác định quy luật giữa input và output, từ đó đưa ra dự đoán cho những đầu vào mới chưa từng gặp Các thuật toán trong học có giám sát rất đa dạng và phong phú.
Support vector machine; Linear regression; Logistic regression; Naives Bayes; Linear discriminant analysis; Decision tress; K-nearest neighbor ; Neural Networks; Similarity learning
Học không giám sát (Unsupervised Learning) là phương pháp sử dụng dữ liệu chưa được gán nhãn để suy luận và tìm ra cấu trúc của tập dữ liệu Theo Barlow (1989), phương pháp này rất hiệu quả trong việc phân tích và khám phá thông tin tiềm ẩn Một số thuật toán phổ biến trong học không giám sát bao gồm K-means clustering và Association Rules.
Học bán giám sát (Semi-supervised Learning) là một phương pháp học máy sử dụng tập dữ liệu đầu vào X bao gồm cả mẫu có nhãn và không có nhãn, trong đó số lượng mẫu có nhãn chỉ chiếm một tỷ lệ nhỏ Các thuật toán học bán giám sát, như Self-training, giúp cải thiện hiệu suất mô hình bằng cách tận dụng thông tin từ cả hai loại mẫu.
Training, Generative models, S3VMs, Graph-Based Algorithms, Multiview Algorithms,…
Ngoài ra còn có một số phương pháp học máy khác như Học tăng cường (Reinforcement Learning-RL), Học chuyển giao (transfer learning),…
Trí tuệ nhân tạo không chỉ tự học mà còn có khả năng học sâu và tư duy phức tạp như con người, dẫn đến khái niệm học sâu (Deep learning) Học sâu được lấy cảm hứng từ chức năng của các tế bào não, hay còn gọi là tế bào thần kinh Đây là một phần của học máy, sử dụng mạng thần kinh nhân tạo để phân tích dữ liệu chi tiết thông qua các thuật toán mô phỏng hệ thần kinh của con người, từ đó học hỏi từ lượng lớn dữ liệu để giải quyết các vấn đề cụ thể (LeCun, 2015).
Học sâu mang lại nhiều lợi thế vượt trội so với học máy, bao gồm khả năng tự động hóa các tính năng, cho phép các thuật toán tự tạo ra các đặc trưng mới từ dữ liệu đào tạo mà không cần sự can thiệp của con người Nó cũng tương thích tốt hơn với các dữ liệu phi cấu trúc như hình ảnh, văn bản và âm thanh, giúp khai thác tối đa thông tin từ các loại dữ liệu này Thêm vào đó, các lớp nơ-ron trong mô hình học sâu giúp cải thiện khả năng học tập thông qua việc xử lý đồng thời nhiều tính năng phức tạp và thực hiện tính toán chuyên sâu Kiến trúc của các mô hình học sâu còn cho phép chúng học từ các lỗi của chính mình, nâng cao độ chính xác qua các lần học Cuối cùng, học sâu tận dụng được các thuật toán phân tán và song song, hỗ trợ cải thiện tốc độ huấn luyện mô hình.
Học sâu đang ngày càng phát triển và được ứng dụng rộng rãi trong nhiều bài toán thực tế, từ đơn giản đến phức tạp Một số phương pháp và kỹ thuật học sâu phổ biến hiện nay bao gồm Mạng nơ-ron cổ điển, Mạng nơ-ron tích chập (CNN), Mạng nơ-ron hồi quy (RNN), Mạng sinh đối kháng (GAN), và Học tăng cường sâu (Deep Reinforcement Learning).
Mạng nơ-ron cổ điển là các mô hình toán học được thiết kế dựa trên cấu trúc của mạng nơ-ron trong não người Mỗi nơ-ron hoạt động như một hàm toán học, tiếp nhận dữ liệu đầu vào, biến đổi nó thành dạng dễ điều chỉnh và phân loại thành các lớp dữ liệu đầu ra Cấu trúc mạng nơ-ron cổ điển bao gồm lớp đầu vào, các lớp ẩn và lớp đầu ra Mỗi nút trong mạng tương ứng với một thuật toán Perceptron Learning Algorithm (PLA), hay còn gọi là Perceptron, là bộ phân loại tuyến tính dùng để phân loại dữ liệu thành hai phần nhị phân Các hàm toán học phổ biến trong Perceptron bao gồm hàm tuyến tính, hàm phi tuyến như sigmoid, hàm tanh và hàm ReLU (Rectified Linear Unit).
Quy trình xây dựng mô hình học máy
Quy trình xây dựng mô hình học máy là một chu trình lặp đi lặp lại nhằm phát triển một mô hình học máy hiệu quả Quy trình này bao gồm bảy bước chính, mỗi bước đóng vai trò quan trọng trong việc tối ưu hóa và cải thiện hiệu suất của mô hình.
(1) Xác định mục tiêu thực tế của mô hình học máy;
(4) Lựa chọn mô hình học máy và huấn luyện mô hình;
(5) Đánh giá hiệu suất mô hình;
(6) Đưa mô hình vào hoạt động thực tế;
1.3.1 Xác định mục tiêu thực tế của mô hình học máy
Các dự án ứng dụng học máy cần bắt đầu bằng việc xác định mục tiêu và yêu cầu cụ thể Mục tiêu phải rõ ràng, chi tiết và có thể đo lường được Ngoài ra, cần xem xét bối cảnh kinh doanh, tính khả thi về dữ liệu và tài chính, cũng như hiệu quả dự kiến Để xác định đầy đủ các mục tiêu của dự án, cần trả lời các câu hỏi liên quan đến yêu cầu và mong đợi của dự án học máy.
(1) Mục tiêu cụ thể của dự án học máy này là gì?
(2) Các tiêu chí đo lường đánh giá mức độ thành công của dự án là gì?
(3) Vấn đề đang được giải quyết có đặc điểm gì?
Đặc điểm của dữ liệu trong vấn đề giải quyết rất quan trọng, vì chúng có thể ảnh hưởng đến việc lựa chọn giải thuật phân cụm, phân lớp hoặc các giải thuật học sâu khác Các đặc điểm này giúp xác định tính chất và cấu trúc của dữ liệu, từ đó hỗ trợ trong việc tối ưu hóa quy trình phân tích và cải thiện độ chính xác của mô hình Việc hiểu rõ các đặc điểm dữ liệu sẽ dẫn đến quyết định đúng đắn trong việc áp dụng các kỹ thuật học máy phù hợp.
(5) Các kỳ vọng đặt ra về đầu vào và đầu ra của mô hình là gì?
(6) Mức độ chấp nhận đối với độ chính xác của mô hình trong khoảng nào?
(7) Lợi ích của mô hình mang lại là gì? Cách thức để xác định và đo lường các lợi ích đó như thế nào?
(8) Dự án có cần phải lưu ý gì về các vấn đề đạo đức không?
Việc trả lời đầy đủ và chi tiết các câu hỏi trong bước đầu tiên sẽ giúp dự án xác định rõ bức tranh toàn cảnh về vấn đề, từ đó định hình kế hoạch thực hiện cho các bước tiếp theo Mục tiêu cốt lõi của bước này là xác định rõ mục tiêu và tính khả thi của dự án học máy.
Dữ liệu là nguyên liệu thiết yếu cho các mô hình học máy, ảnh hưởng trực tiếp đến hiệu quả của chúng Dữ liệu được phân chia thành hai phần: huấn luyện và kiểm tra, trong đó dữ liệu huấn luyện giúp mô hình học, còn dữ liệu kiểm tra dùng để đánh giá độ chính xác sau huấn luyện Để xây dựng mô hình học máy hiệu quả và đạt được các mục tiêu đề ra, việc xác định nguồn dữ liệu đầu vào chất lượng là rất quan trọng Do đó, giai đoạn xác định và thu thập dữ liệu trở thành bước thiết yếu trong quy trình phát triển mô hình học máy.
Trong giai đoạn này, việc xác định các nguồn dữ liệu đa dạng là rất quan trọng, vì dữ liệu có thể được thu thập từ nhiều nguồn như tệp tin, dữ liệu có cấu trúc từ cơ sở dữ liệu của hệ thống thông tin tổ chức, cũng như dữ liệu phi cấu trúc từ mạng xã hội, internet và thiết bị di động Sự phong phú về số lượng và chất lượng dữ liệu sẽ ảnh hưởng lớn đến quá trình phân tích và ra quyết định.
25 của dữ liệu được thu thập sẽ quyết định hiệu quả của đầu ra Dữ liệu càng nhiều thì dự đoán càng chính xác
Trong giai đoạn này, cần đặt ra và trả lời các câu hỏi nhằm hiểu và xác định dữ liệu cần thiết cho mô hình học máy.
(1) Nguồn dữ liệu cần thiết cho các mô hình học máy ở đâu?
(2) Các mô hình học máy cần số lượng dữ liệu tối thiểu như thế nào để đạt được các mục tiêu đã đề ra?
(3) Nguồn dữ liệu hiện tại đang có như thế nào cả về chất lượng và số lượng?
(4) Phân chia tập dữ liệu đào tạo và tập dữ liệu kiểm tra theo tỷ lệ nào để phù hợp với mô hình học máy?
(5) Với các mô hình học có giám sát, liệu có thể gán nhãn cho các dữ liệu hiện tại được không?
(6) Các nguồn dữ liệu được truy cập theo thời gian thực hay không?
(7) Các khó khăn, trở ngại trong việc tiếp cận các nguồn dữ liệu cho các mô hình học máy là gì?
Chất lượng nguồn dữ liệu hiện có là yếu tố quan trọng để xây dựng mô hình học máy hiệu quả Việc trả lời đầy đủ các câu hỏi liên quan giúp dự án hình dung rõ ràng cách xác định nguồn dữ liệu cần thiết ngay từ những giai đoạn đầu.
Trong giai đoạn này, cần hình dung mô hình học máy của dự án hoạt động như thế nào trên dữ liệu thực tế Mô hình có thể sử dụng dữ liệu offline để huấn luyện, sau đó kiểm tra và đánh giá trước khi đưa vào hoạt động với dữ liệu thực tế, hoặc hoạt động với dữ liệu theo thời gian thực, học liên tục từ dữ liệu online, cập nhật mô hình và trả ra kết quả ngay lập tức Việc xác định rõ cách thức hoạt động của mô hình là cần thiết để xác định nguồn dữ liệu cần thiết và đưa ra yêu cầu truy cập dữ liệu cho các mô hình.
Bằng cách thực hiện tác vụ này, dự án học máy sẽ tạo ra một tập dữ liệu nhất quán, đóng vai trò quan trọng trong việc lập kế hoạch và thực hiện thu thập dữ liệu cho mô hình học máy.
Giai đoạn 3 của dự án học máy tập trung vào việc chuẩn bị dữ liệu từ các nguồn đã xác định ở giai đoạn 2, bao gồm thu thập, làm sạch, tổng hợp, nâng cấp, mã hóa và gán nhãn dữ liệu Các hoạt động quan trọng trong giai đoạn này bao gồm thay thế dữ liệu không chính xác, loại bỏ dữ liệu rác và trùng lặp, cũng như mã hóa và ẩn danh dữ liệu nhạy cảm Dữ liệu cần được tăng cường bằng cách sử dụng nguồn từ bên thứ ba và áp dụng kỹ thuật mở rộng nếu cần Mục tiêu cuối cùng là tạo ra một tập dữ liệu sạch, đầy đủ về số lượng và chất lượng để chia thành các tập train/test, chiếm khoảng 80% thời gian và chi phí của dự án Việc đầu tư nguồn lực cho giai đoạn này là rất quan trọng để đảm bảo chất lượng dữ liệu cho các bước tiếp theo trong quá trình xây dựng mô hình học máy.
1.3.4 Lựa chọn mô hình học máy và thực hiện huấn luyện mô hình
Khi đã có dữ liệu, bước tiếp theo là lựa chọn mô hình phù hợp và đưa dữ liệu vào quá trình huấn luyện Cần thiết lập các tham số cho mô hình, thực hiện cải tiến và điều chỉnh để tối ưu hóa hiệu suất với dữ liệu hiện có Các hoạt động trong giai đoạn này bao gồm việc xác định mô hình, tinh chỉnh tham số và cải thiện hiệu quả của mô hình.
(1) Dựa trên mục tiêu thực tế đã xác định, tập dữ liệu đã có ở giai đoạn 3 thực hiện lựa chọn mô hình học máy phù hợp nhất
Để đạt hiệu suất tối ưu cho mô hình học máy, việc thiết lập cấu hình là rất quan trọng Cần xác định và áp dụng các kỹ thuật xử lý dữ liệu huấn luyện phù hợp, giúp cải thiện khả năng học hỏi và dự đoán của mô hình.
(3) Xem xét mô hình học máy có khả năng giải quyết được các vấn đề đặt ra hay không?
(4) Cải tiến mô hình để nâng cao hiệu suất của mô hình
(5) Huấn luyện mô hình với tập dữ liệu huấn luyện
1.3.5 Đánh giá hiệu suất của mô hình học máy
Mô hình sau huấn luyện cần thực hiện đánh giá Thực hiện đánh giá hiệu suất của mô hình thông qua các bước sau:
(1) Đánh giá độ chính xác của mô hình với tập dữ liệu kiểm tra
(2) Sử dụng các thông số khác để đánh giá hiệu suất như độ chính xác mô hình, ma trận nhầm lẫn, F1,…
(3) Lựa chọn mô hình tối ưu sau huấn luyện mô hình bằng các so sánh giữa các mô hình với nhau
(4) Đánh giá mô hình học máy sau huấn luyện xem có đáp ứng được các mục tiêu thực tế đã đề ra
1.3.6 Đưa mô hình vào hoạt động thực tế
Sau khi mô hình học máy được huấn luyện và đạt hiệu suất tốt trên dữ liệu kiểm thử, bước tiếp theo là triển khai mô hình vào dữ liệu thực tế Giai đoạn này là giai đoạn vận hành mô hình trong môi trường thực tế, nơi mà việc đo lường độ chính xác của mô hình cần được thực hiện liên tục và lặp lại Để các dự án trí tuệ nhân tạo, đặc biệt là học máy, đạt được thành công, việc lặp lại các mô hình trong nhiều môi trường khác nhau là rất quan trọng nhằm đảm bảo rằng các mô hình này có thể cung cấp giá trị dự báo đáng tin cậy.
Khi mô hình đã được triển khai, việc theo dõi hiệu suất liên tục và thực hiện các điều chỉnh cải tiến là rất cần thiết Công nghệ và môi trường xung quanh có thể thay đổi, do đó, việc cập nhật và tối ưu hóa mô hình sẽ giúp duy trì hiệu quả hoạt động của nó.
Xây dựng mô hình cảnh báo sớm kết quả học tập của sinh viên đại học chính quy
Khái quát về lịch sử hình thành và phát triển Học viện Ngân hàng 32 2.2 Thực trạng kết quả học tập của sinh viên đại học chính quy tại Học viện Ngân hàng
Học viện Ngân hàng, tiền thân là Trường Cao cấp nghiệp vụ Ngân hàng, được thành lập vào ngày 13/9/1961 Đến năm 1998, Học viện Ngân hàng chính thức được thành lập theo quyết định số 30/1998/QĐ-TTg của Thủ tướng Chính phủ vào ngày 09 tháng 02 năm 1998.
Học viện Ngân hàng đã trải qua 60 năm phát triển, khẳng định vị thế là cơ sở giáo dục đại học hàng đầu tại Việt Nam, cung cấp nguồn nhân lực chất lượng cao cho hệ thống ngân hàng và xã hội Định hướng của Học viện là trở thành trường đại học đa ngành, ứng dụng, đạt tiêu chuẩn quốc tế và dẫn đầu trong lĩnh vực tài chính ngân hàng Năng lực đào tạo của Học viện không ngừng được nâng cao với đội ngũ giảng viên chất lượng, có trình độ chuyên môn cao và được đào tạo từ các nước phát triển Cơ sở vật chất hiện đại và uy tín đào tạo của Học viện cũng ngày càng được cải thiện.
Học viện Ngân hàng hiện đào tạo 09 chuyên ngành đại học, bao gồm Tài chính ngân hàng, Kế toán, Quản trị kinh doanh, Kinh doanh quốc tế, Ngôn ngữ Anh, Hệ thống thông tin quản lý, Luật kinh tế, Kinh tế đầu tư và Công nghệ thông tin Năm 2023, Học viện mở thêm 04 chương trình liên ngành mới: Công nghệ tài chính (Fintech), Ngân hàng số (Digital Banking), Quản trị du lịch, và Logistics cùng quản trị chuỗi cung ứng Ngoài các chương trình đại trà, Học viện còn phát triển các chương trình cử nhân Chất lượng cao trong các chuyên ngành Tài chính và Ngân hàng, được đánh giá cao bởi cả sinh viên và nhà tuyển dụng.
Chuyên ngành Kế toán và Quản trị kinh doanh tại các trường đại học hàng đầu khối kinh tế ở Việt Nam thường có chỉ tiêu tuyển sinh hàng năm trên 3.500 sinh viên Chất lượng đầu vào của ngành này luôn nằm trong top cao, với điểm trúng tuyển cao, thu hút nhiều thí sinh có năng lực.
Học viện Ngân hàng đang tích cực mở rộng hoạt động đào tạo hợp tác quốc tế, hiện có 04 chương trình đào tạo đại học liên kết quốc tế Trong đó, nổi bật là sự hợp tác với Đại học Sunderland, cung cấp 02 chuyên ngành Tài chính Ngân hàng.
Chương trình Kế toán tại trường được liên kết với Đại học CityU, chuyên ngành Quản trị tài chính, cùng với chương trình định hướng Nhật Bản bao gồm Kế toán và Hệ thống thông tin quản lý Trường cũng hợp tác với Đại học Coventry, cung cấp ba chuyên ngành: Tài chính và Ngân hàng quốc tế, Marketing số, và Kinh doanh quốc tế Ngoài ra, chương trình Thạc sĩ liên kết quốc tế với Đại học West of England (UWE) cung cấp chuyên ngành Tài chính & Đầu tư.
2.2 Thực trạng kết quả học tập của sinh viên đại học chính quy tại Học viện Ngân hàng
Học viện Ngân hàng thực hiện tuyển sinh đại học chính quy khóa K1 năm
Năm 2008, Học viện Ngân hàng bắt đầu áp dụng đào tạo theo học chế tín chỉ cho khóa đại học chính quy K11 Nghiên cứu này phân tích dữ liệu và xây dựng các mô hình cảnh báo sớm kết quả học tập cho sinh viên từ khóa K11 đến K20 Dữ liệu được thu thập từ phần mềm quản lý đào tạo của Học viện Ngân hàng cho đến hết năm học 2021-2022.
Bảng 1 Quy mô sinh viên theo khóa/ngành
Hệ thống thông tin quản lý
Nguồn: Phòng Đào tạo - Học viện Ngân hàng
Quy mô sinh viên của Học viện Ngân hàng hiện ổn định ở mức khoảng 2.500 sinh viên từ các khóa K11-K16, nhưng đã có sự gia tăng mạnh mẽ từ khóa K17-K20, đạt gần 4.000 sinh viên Tuy nhiên, tỷ lệ sinh viên không tốt nghiệp, bao gồm những trường hợp buộc thôi học, xin nghỉ học, hoặc không đủ điều kiện tốt nghiệp, cũng đang có xu hướng gia tăng đáng kể.
Bảng 2 Tỷ lệ tốt nghiệp theo khóa
Khóa Tốt nghiệp Không tốt nghiệp*
Số lượng Tỷ lệ Số lượng Tỷ lệ
Nguồn: Phòng Đào tạo - Học viện Ngân hàng
Số sinh viên không tốt nghiệp bao gồm những người bị buộc thôi học, thôi học, hoặc đang trong thời gian đào tạo nhưng chưa đủ điều kiện tốt nghiệp Đối với sinh viên K20, đến hết năm học 2021-2022, họ vẫn còn 01 năm trong thời gian đào tạo tối đa là 06 năm để hoàn thành chương trình đào tạo.
Hình 9 Biểu đồ lượng sinh viên tốt nghiệp và không tốt nghiệp các khóa
Nguồn: Phòng Đào tạo - Học viện Ngân hàng
Tỷ lệ phân loại tốt nghiệp xuất sắc và giỏi đang có xu hướng giảm, trong khi tỷ lệ sinh viên tốt nghiệp loại khá và trung bình lại tăng lên Hiện tại, sinh viên tốt nghiệp loại khá chiếm khoảng 2/3 tổng số sinh viên của khóa học (Bảng 3).
Bảng 3 Phân loại tốt nghiệp theo khóa
Khóa Xuất sắc Giỏi Khá Trung bình
SL Tỷ lệ SL Tỷ lệ SL Tỷ lệ SL Tỷ lệ
Nguồn: Phòng Đào tạo - Học viện Ngân hàng
Tốt nghiệp Số lượng Không tốt nghiệp* Số lượng
Hình 10 Biểu đồ tỷ lệ phân loại tốt nghiệp các khóa
Nguồn: Phòng Đào tạo - Học viện Ngân hàng
Trong những năm gần đây, số lượng sinh viên bị cảnh báo học vụ và buộc thôi học đã gia tăng mạnh, đặc biệt là trong năm học 2020-2021 do ảnh hưởng của dịch bệnh Covid-19, khi sinh viên chuyển từ học trực tiếp sang học trực tuyến Tình trạng này dẫn đến tỷ lệ sinh viên bị cảnh báo tăng vọt, ảnh hưởng trực tiếp đến số lượng sinh viên chậm tốt nghiệp hoặc không tốt nghiệp Trung bình mỗi học kỳ, có trên 500 sinh viên bị cảnh báo và hơn 200 sinh viên bị buộc thôi học, cho thấy cần thiết phải có hệ thống cảnh báo sớm và tư vấn hỗ trợ sinh viên để giảm thiểu tỷ lệ này.
Xuất sắc Giỏi Khá Trung bình
Hình 11 Biểu đồ số lượng sinh viên bị xử lý học vụ theo năm học
Nguồn: Phòng Đào tạo - Học viện Ngân hàng
Thực trạng các giải pháp cảnh báo kết quả học tập của sinh viên Học viện Ngân hàng
Trong những năm gần đây, tỷ lệ sinh viên bị buộc thôi học và tốt nghiệp chậm tại Học viện Ngân hàng từ K15 đến K20 đã gia tăng Để đối phó với tình trạng này và những tác động tiêu cực đến chất lượng đào tạo, Ban lãnh đạo Học viện đã chỉ đạo các phòng ban và khoa bộ môn tìm kiếm giải pháp nâng cao chất lượng giáo dục Mục tiêu là tăng tỷ lệ tốt nghiệp đúng hạn và giảm tỷ lệ sinh viên không đủ điều kiện tốt nghiệp Một số giải pháp đã được triển khai, bao gồm hệ thống thông tin quản lý đào tạo và hệ thống cố vấn học tập nhằm cảnh báo kết quả học tập cho sinh viên.
2.3.1 Hệ thống thông tin quản lý đào tạo
Hệ thống thông tin quản lý đào tạo tại Học viện Ngân hàng là công cụ thiết yếu giúp quản lý toàn bộ quy trình đào tạo Hệ thống này hỗ trợ từ việc tuyển sinh, nhập học, quản lý hồ sơ sinh viên, cho đến quản lý chương trình đào tạo và lập kế hoạch.
Cảnh báo học vụBuộc thôi học
Quá trình quản lý giáo dục bao gồm việc lập kế hoạch, đăng ký học phần, quản lý lớp học, tổ chức thi, đánh giá kết quả học tập, công bố kết quả học tập, cảnh báo học tập, xét tốt nghiệp và cấp bằng tốt nghiệp.
Hệ thống thông tin quản lý đào tạo của Học viện Ngân hàng đóng vai trò quan trọng trong quản trị đại học, được xây dựng trên nền tảng công nghệ hiện đại Từ khi bắt đầu áp dụng hệ thống tín chỉ, Học viện đã nỗ lực cải thiện chất lượng đào tạo và quản lý thông tin hiệu quả hơn.
Năm 2008, Học viện Ngân hàng đã triển khai hệ thống quản lý đào tạo nhằm phục vụ công tác quản lý và cung cấp thông tin cho sinh viên Đến năm 2019, Học viện đã nâng cấp hệ thống thông tin quản lý đào tạo cũ lên thành hệ sinh thái thông tin quản trị đại học, với hệ thống quản lý đào tạo là hệ thống lõi Tất cả thông tin về quá trình đào tạo được đồng bộ và thiết kế trên một hệ thống dữ liệu chung, tạo sự thống nhất và hiệu quả trong quản lý đào tạo.
Cổng thông tin sinh viên của Học viện Ngân hàng, được triển khai từ năm 2008, là kênh giao tiếp quan trọng nhất trong hệ thống tín chỉ, cung cấp đầy đủ thông tin về quy chế, quy định đào tạo và thông báo học vụ Tại đây, sinh viên có thể tra cứu chương trình đào tạo, tiến độ học tập, cũng như các chi tiết về học phần Cổng thông tin còn hỗ trợ sinh viên theo dõi quá trình học tập qua việc đăng ký học, quản lý học phí, lịch học và kết quả học tập Ngoài ra, hệ thống cũng cung cấp cảnh báo học tập, thông tin về các học phần đã hoàn thành và các chứng chỉ đạt yêu cầu, cùng với thông báo từ các phòng ban và cố vấn học tập.
Hệ thống thông tin quản lý đào tạo cung cấp số liệu thống kê và báo cáo quản trị cho lãnh đạo Học viện, các khoa, bộ môn, và phòng ban Những thông tin này giúp cố vấn học tập theo dõi kết quả học tập của sinh viên theo từng học kỳ và năm học, từ đó tư vấn và hỗ trợ sinh viên một cách hiệu quả nhất.
2.3.2 Hệ thống cố vấn học tập
Bộ Giáo dục và Đào tạo đã ban hành các quy định quan trọng về hoạt động cố vấn học tập tại các cơ sở giáo dục đại học nhằm triển khai đào tạo theo hệ thống tín chỉ.
- Các quy chế đào tạo: Quy chế đào tạo theo học chế tín chỉ (Quy chế số
Ngày 15 tháng 8 năm 2007, Bộ trưởng Bộ Giáo dục và Đào tạo đã ban hành Quyết định số 43/2007/QĐ-BGDĐT, quy định về đào tạo đại học và cao đẳng Tiếp theo, Thông tư số 57/2012/TT-BGDĐT ngày 27 tháng 12 năm 2012 đã sửa đổi, bổ sung một số điều của Quy chế đào tạo đại học và cao đẳng hệ chính quy theo hệ thống tín chỉ Đến ngày 15 tháng 5 năm 2014, Văn bản hợp nhất số 17/VBHN-BGDĐT đã được ban hành, hợp nhất Quy chế 43/2007/QĐ-BGDĐT và Thông tư 57/2012/TT-BGDĐT nhằm quy định rõ hơn về đào tạo đại học và cao đẳng chính quy theo hệ thống tín chỉ.
Bộ Giáo dục và Đào tạo đã đề cập đến vai trò của cố vấn học tập trong hệ thống đào tạo theo học chế tín chỉ, bao gồm việc tư vấn và hỗ trợ sinh viên trong quá trình đăng ký và điều chỉnh các học phần trong học kỳ.
- Các quy định về chế độ làm việc của giảng viên: Thông tư 20/2020/TT-
Theo BGDĐT ngày 27/7/2020, Bộ Giáo dục và Đào tạo quy định chế độ làm việc của giảng viên tại các cơ sở giáo dục đại học Thông tư liên tịch số 36/2014/TTLT-BGDĐT-BNV ngày 28/11/2014 cũng nêu rõ mã số và tiêu chuẩn chức danh nghề nghiệp viên chức giảng dạy trong các cơ sở giáo dục công lập, trong đó nhấn mạnh nhiệm vụ quan trọng của giảng viên là tư vấn học tập cho sinh viên.
- Các quy định về quản lý học sinh sinh viên: Thông tư số 10/2016/TT-
Vào ngày 31/12/2014, Bộ trưởng Bộ Giáo dục và Đào tạo đã ban hành quy chế công tác sinh viên cho chương trình đào tạo đại học hệ chính quy, trong đó quy định rõ ràng về hoạt động cố vấn học tập của sinh viên tại các cơ sở giáo dục đại học.
Về phía Học viện Ngân hàng: Căn cứ vào các văn bản quy định của Bộ
Theo các văn bản như 17/VBHN-BGDĐT, 47/2014/TT-BGDĐT, và 10/2016/TT-GDĐT, Giám đốc Học viện Ngân hàng đã ban hành Quy chế công tác cố vấn học tập vào ngày 04/10/2018 Quy chế này quy định rõ ràng về tổ chức và chế độ làm việc của viên chức làm công tác cố vấn học tập cho sinh viên đại học và cao đẳng chính quy theo hệ thống tín chỉ tại Học viện Ngân hàng, bao gồm các chức năng, nhiệm vụ và quyền hạn của cố vấn học tập.
Hệ thống cố vấn học tập tại Học viện Ngân hàng được thiết kế theo mô hình 2 cấp, bao gồm cố vấn học tập kiêm nhiệm là giảng viên từ các khoa và cố vấn học tập chuyên trách là viên chức phụ trách hoạt động cố vấn tại các phòng đào tạo Các cố vấn này có nhiệm vụ định hướng, tư vấn, hướng dẫn và cung cấp thông tin hỗ trợ sinh viên trong suốt quá trình học tập, rèn luyện và nghiên cứu khoa học.
Hàng năm, Học viện Ngân hàng có các quyết định phân công giảng viên cố vấn học tập cho các lớp, các khóa mới tuyển sinh tại Học viện Các cố vấn học tập kiêm nhiệm sẽ thực hiện nhiệm vụ cố vấn học tập với các lớp trong suốt quá trình sinh viên các lớp đó theo học tại Học viện Trường hợp giảng viên nghỉ chế độ, đi học hoặc thôi việc, Học viện có các quyết định cử các cố vấn học tập thay thế Theo tinh thần này, các cố vấn học tập kiêm nhiệm sẽ thực hiện theo dõi được đầy đủ quá trình học tập, rèn luyện của sinh viên một cách tổng thể, xuyên suốt, từ đó có thể nắm bắt kịp thời thông tin sinh viên để có các hoạt động tư vấn cho sinh viên
2.3.3 Một số vấn đề đặt ra đối với các giải pháp cảnh báo kết quả học tập hiện tại của Học viện Ngân hàng
Ứng dụng mô hình cảnh báo sớm kết quả học tập sinh viên đại học chính quy tại Học viện Ngân hàng
Sự cần thiết của mô hình dự báo sớm kết quả học tập sinh viên đại học chính quy tại Học viện Ngân hàng
Việc xây dựng mô hình dự báo sớm kết quả học tập của sinh viên đại học chính quy tại Học viện Ngân hàng là rất cần thiết trong thời đại hiện nay với những lợi ích sau:
Sử dụng mô hình dự báo sớm kết quả học tập giúp giảng viên đánh giá hiệu quả giảng dạy một cách kịp thời, từ đó đưa ra các biện pháp can thiệp nhằm cải thiện kết quả học tập của sinh viên.
Thứ hai là giúp sinh viên có sự chuẩn bị tốt hơn: Nhờ mô hình dự báo sớm, sinh viên có thể biết được kết quả học tập của mình trước khi kết thúc kỳ học Điều này giúp cho sinh viên có thể chuẩn bị tốt hơn cho kỳ thi cuối kỳ hoặc cải thiện kết quả học tập của mình
Mô hình dự báo sớm giúp giảm tỷ lệ thất bại và thời gian học tập của sinh viên Khi giảng viên và sinh viên nắm bắt được kết quả học tập dự kiến, họ có thể tìm ra giải pháp hỗ trợ sinh viên đạt được mục tiêu Điều này không chỉ nâng cao hiệu quả học tập mà còn tiết kiệm thời gian, tạo điều kiện cho sinh viên tiến bộ nhanh chóng.
Hệ thống cố vấn học tập của Học viện được nâng cao hiệu quả hoạt động nhờ mô hình dự báo sớm, giúp nắm bắt thông tin quan trọng về kết quả học tập của sinh viên Qua đó, hệ thống có khả năng đưa ra các biện pháp tư vấn, can thiệp và cảnh báo kịp thời, hỗ trợ sinh viên một cách hiệu quả trong quá trình học tập tại trường.
Với những lợi ích trên, việc xây dựng mô hình dự báo sớm kết quả học tập là rất cần thiết để tăng cường hiệu quả giảng dạy và học tập của sinh viên đại học chính quy tại Học viện Ngân hàng
Quy trình ứng dụng mô hình cảnh báo sớm kết quả học tập sinh viên đại học chính quy tại Học viện Ngân hàng
học chính quy tại Học viện Ngân hàng
Dựa trên quy trình triển khai ứng dụng các mô hình học máy để dự báo kết quả học tập của sinh viên, nhóm nghiên cứu đề xuất quy trình triển khai ứng dụng mô hình cảnh báo sớm kết quả học tập sinh viên đại học chính quy Học viện Ngân hàng theo Hình 18
Hình 18 Quy trình dự báo kết quả học tập của sinh viên Học viện Ngân hàng
Nguồn: Tổng hợp từ kết quả nghiên cứu
(1) Xác định mục tiêu dự báo: Đây là bước quan trọng đầu tiên của quy trình dự báo kết quả học tập, mang tính định hướng cho toàn bộ quy trình Trong giai đoạn này cần xác định rõ các mục tiêu, yêu cầu cần dự báo của cơ sở giáo dục đại học Các mục tiêu yêu cầu cụ thể và có thể đo lường đánh giá chính xác được
(2) Thu thập dữ liệu: Dữ liệu là nguồn nguyên liệu quan trọng nhất của các mô hình dự báo Do đó, cần xác định rõ các nguồn dữ liệu có liên quan đến
Tiền xử lý dữ liệu
Mô hình đã được đánh giá
Database từ các nguồn khác
Các mô hình học máy, học sâu, AI
Dự báo kết quả học tập
Mô hình đã huấn luyện
66 mục tiêu dự báo bao gồm các nguồn dữ liệu sẵn có từ các hệ thống thông tin của cơ sở giáo dục đại học Đây là các nguồn dữ liệu có cấu trúc mà cơ sở giáo dục đào tạo có thể có được nhưng đang bị phân tán cần đồng bộ và xử lý Ngoài ra, các nguồn dữ liệu quan trọng khác như dữ liệu về hành vi, thái độ của người học, các dữ liệu quốc gia về dân cư, các dữ liệu về xu hướng xã hội về ngành nghề,
…tùy thuộc vào mục tiêu dự báo cần xác định rõ nguồn thu thập các dữ liệu này để từ đó có chiến lược và giải pháp thu thập dữ liệu phù hợp
(3) Tiền xử lý dữ liệu: Đây là bước mất rất nhiều nguồn lực trong xây dựng mô hình cảnh báo kết quả học tập của sinh viên trong các cơ sở giáo dục đại học
Để quản lý dữ liệu từ nhiều nguồn khác nhau, các cơ sở giáo dục đại học cần xây dựng một kho dữ liệu (data warehouse) và đồng bộ hóa thông tin Thiết kế kiến trúc kho dữ liệu chung đòi hỏi nhiều nguồn lực, đồng thời việc xử lý dữ liệu khuyết thiếu và lỗi cũng là một thách thức lớn Trong quy trình xây dựng mô hình dự báo, giai đoạn 2 và 3 thường chiếm đến 80% nguồn lực về thời gian và tài chính.
Xây dựng các kho dữ liệu chuyên biệt (data mart) là bước quan trọng sau khi đã có một kho dữ liệu chung đầy đủ thông tin về hoạt động của cơ sở giáo dục Việc chia nhỏ kho dữ liệu lớn và phức tạp thành các kho dữ liệu chuyên biệt sẽ giúp tối ưu hóa quá trình xử lý dữ liệu và nâng cao hiệu quả của các mô hình dự báo.
Để xây dựng tập dữ liệu huấn luyện và kiểm tra cho các mô hình dự báo, cần xác định rõ mục tiêu và yêu cầu dữ liệu của từng mô hình Việc lựa chọn và xây dựng các tập dữ liệu này phải phù hợp với các tiêu chí đã đề ra để đảm bảo hiệu quả trong quá trình huấn luyện.
Tỷ lệ tập dữ liệu huấn luyện và tập dữ liệu kiểm tra thường được chia ngẫu nhiên theo tỷ lệ 80%:20%
Để đạt được độ chính xác cao trong dự báo, việc lựa chọn các mô hình học máy, học sâu và trí tuệ nhân tạo phù hợp là rất quan trọng Dựa trên mục tiêu dự báo và đặc điểm của tập dữ liệu huấn luyện, cần xác định các mô hình đơn lẻ hoặc kết hợp nhiều mô hình để nâng cao hiệu quả dự báo Trong quá trình huấn luyện, áp dụng các kỹ thuật xử lý dữ liệu như xử lý mất cân bằng và mở rộng dữ liệu sẽ giúp cải thiện độ chính xác của mô hình.
Đánh giá mô hình sau huấn luyện là bước quan trọng để xác định độ tin cậy và chính xác của mô hình Sau khi hoàn thành quá trình huấn luyện với dữ liệu huấn luyện, cần thực hiện đánh giá mô hình bằng cách sử dụng tập dữ liệu đánh giá Dựa vào các mục tiêu dự báo đã đề ra và kết quả từ tập dữ liệu đánh giá, chúng ta có thể kết luận xem mô hình có đủ độ tin cậy và chính xác để áp dụng vào dự báo thực tế hay không Những mô hình đạt yêu cầu sẽ được lưu trữ để phục vụ cho các dự báo trong tương lai.
Các cơ sở giáo dục đại học sử dụng mô hình dự báo đã được huấn luyện với độ tin cậy và chính xác cao để xây dựng ứng dụng phục vụ cho công tác dự báo Những ứng dụng này hỗ trợ sinh viên, giảng viên cố vấn học tập, lãnh đạo quản lý và phụ huynh sinh viên Các đối tượng này cung cấp dữ liệu thực tế để chạy vào các mô hình, từ đó đưa ra các kết quả dự báo hữu ích.