Ứng dụng khai phá dữ liệu xây dựng mô hình tư vấn chọn ngành học tại trường Đại học Đồng Tháp

8 2 0
Ứng dụng khai phá dữ liệu xây dựng mô hình tư vấn chọn ngành học tại trường Đại học Đồng Tháp

Đang tải... (xem toàn văn)

Thông tin tài liệu

Bài viết trình bày việc tiếp cận khai phá dữ liệu và lý thuyết mật mã John Holland để xây dựng mô hình tư vấn chọn ngành học tại Trường Đại học Đồng Tháp. Kết quả thu được có thể góp phần đẩy mạnh công tác tư vấn tuyển sinh, vừa hỗ trợ cho các thí sinh, vừa góp phần nâng cao chất lượng học tập và đào tạo, đồng thời cũng làm cầu nối để thí sinh biết đến các thông tin tuyển sinh của trường nhiều hơn.

TNU Journal of Science and Technology 227(08): 441 - 448 DATA MINING APPLICATION FOR BUILDING A SYSTEM TO SUPPORT THE SELECTION OF MAJORS AT DONG THAP UNIVERSITY Huynh Le Uyen Minh* Dong Thap University ARTICLE INFO Received: 28/4/2022 Revised: 30/5/2022 Published: 31/5/2022 KEYWORDS Admissions consulting John Holland theory Random forest Data mining Choosing a major ABSTRACT In this paper, we have approached data mining and John Holland's theory to build a recommendation model for major choosing at Dong Thap University We collect data of students at the school and some students graduate on time, and then the pre-processing step is to transform the dataset into structured one, suited for the input of data mining algorithms used in the next step The random forest model is learnt from the dataset to build the predictive model In the system building step, we used the above model to build a suitable counseling function for candidates when they choose a major at Dong Thap University In addition, we also built a function to help candidates in identifying the right career group for themselves The experimental results can the improve the admissions consulting, contribute to improving the quality of studing and training, at the same time, candidates also know the admission information of the Dong Thap University more ỨNG DỤNG KHAI PHÁ DỮ LIỆU XÂY DỰNG MƠ HÌNH TƯ VẤN CHỌN NGÀNH HỌC TẠI TRƯỜNG ĐẠI HỌC ĐỒNG THÁP Huỳnh Lê Uyên Minh Trường Đại học Đồng Tháp THÔNG TIN BÀI BÁO Ngày nhận bài: 28/4/2022 Ngày hồn thiện: 30/5/2022 Ngày đăng: 31/5/2022 TỪ KHĨA Tư vấn tuyển sinh Lý thuyết John Holland Rừng ngẫu nhiên Khai phá liệu Chọn ngành học TÓM TẮT Trong này, tiếp cận khai phá liệu lý thuyết mật mã John Holland để xây dựng mơ hình tư vấn chọn ngành học Trường Đại học Đồng Tháp Chúng tiến hành thu thập liệu sinh viên học trường số sinh viên tốt nghiệp tiến độ, sau thực bước tiền xử lý liệu, đưa liệu cấu trúc bảng Tiếp đó, sử dụng giải thuật rừng ngẫu nhiên học từ liệu để xây dựng mơ hình dự báo Trong bước xây dựng hệ thống, sử dụng mô hình thu để xây dựng chức tư vấn phù hợp thí sinh chọn ngành học trường Đại học Đồng Tháp Bên cạnh đó, chúng tơi xây dựng chức hỗ trợ thí sinh xác định nhóm ngành nghề phù hợp với cá nhân mình, dựa lý thuyết mật mã John Holland Kết thu góp phần đẩy mạnh cơng tác tư vấn tuyển sinh, vừa hỗ trợ cho thí sinh, vừa góp phần nâng cao chất lượng học tập đào tạo, đồng thời làm cầu nối để thí sinh biết đến thơng tin tuyển sinh trường nhiều DOI: https://doi.org/10.34238/tnu-jst.5915 Email: uyenminhdhdt@gmail.com http://jst.tnu.edu.vn 441 Email: jst@tnu.edu.vn TNU Journal of Science and Technology 227(08): 441 - 448 Giới thiệu Trong năm gần đây, công tác tuyển sinh xem nhiệm vụ đặc biệt quan trọng, yếu tố định đến tồn phát triển trường đại học Trong đó, vấn đề tư vấn tuyển sinh (TVTS) yếu tố hàng đầu góp phần vào thành công công tác tuyển sinh, kênh nối trực tiếp nhà trường với thí sinh (TS) phụ huynh Nó có vai trị quan trọng, cần thiết việc quảng bá hình ảnh nhà trường, đồng thời cung cấp đầy đủ thông tin tuyển sinh đến học sinh, phụ huynh để giúp cho TS hiểu, tin tưởng lựa chọn học trường Việc lựa chọn ngành học cho phù hợp với lực thân vấn đề đầy băn khoăn bạn học sinh rời ghế nhà trường, điều ảnh hưởng trực tiếp đến chất lượng học tập TS vào đại học ảnh hưởng đến hội việc làm sau trường Đây vấn đề trăn trở không bậc phụ huynh nhiều quan tâm sở đào tạo Hoạt động TVTS Trường Đại học Đồng Tháp (ĐHĐT) thực nhiều hình thức khác như: tư vấn tuyển sinh trường trung học phổ thông, tư vấn qua điện thoại, tư vấn trực tiếp tư vấn qua mạng xã hội thông qua mục hỏi - đáp, đồng thời nhà trường kết hợp đưa thông tin tư vấn website http://tuyensinh.dthu.edu.vn/ với fanpage để cung cấp thông tin tuyển sinh Tuy nhiên, hình thức nhằm hỗ trợ cung cấp thơng tin liên quan cho TS, mà chưa có chức tư vấn định hướng ngành học phù hợp với lực, tính cách TS Cùng với đó, sở liệu giáo dục lưu trữ trường đại học lớn, điều kiện thuận lợi cho việc nghiên cứu, ứng dụng khai phá liệu (KPDL) để xây dựng hệ thống gợi ý, tư vấn lĩnh vực Đây thực vấn đề cần thiết cho nhà quản lý giáo dục, giúp công tác quản lý, tư vấn giáo dục ngày hiệu Đã có nhiều nghiên cứu liên quan đến việc ứng dụng KPDL giáo dục sau: Nhóm tác giả Lê Đức Thắng cộng [1] đề xuất phương pháp dự đoán kết học tập sinh viên (SV) nhằm hỗ trợ SV lập kế hoạch học tập phù hợp Tác giả thực nghiệm liệu thực tế để xác định SV có thuộc diện “cảnh báo” hay “không cảnh báo” cho thấy phương pháp có khả dự đốn tốt so với phương pháp KPDL tiêu biểu Nghiên cứu Nguyễn Thái Nghe [2] sử dụng phương pháp dự đốn KPDL thơng qua hai nghiên cứu, nghiên cứu thứ liên quan đến việc sử dụng giải thuật khơng cá nhân hóa mạng Bayes Cây định, nghiên cứu thứ hai liên quan đến việc sử dụng giải thuật cá nhân hóa – lấy ý tưởng từ kỹ thuật hệ thống gợi ý - kỹ thuật phân rã ma trận thiên vị (Biased Matrix Factorization) nhằm dự đoán kết học tập cho cá nhân SV Nhóm tác giả Đỗ Thanh Nghị cộng [3] giới thiệu tiếp cận khai mỏ liệu để phát môn học quan trọng ảnh hưởng đến kết học tập SV ngành cơng nghệ thơng tin (CNTT) Nhóm tác giả tiến hành sưu tập liệu học tập SV tốt nghiệp ngành CNTT Trường Đại học Cần Thơ, sau thực bước tiền xử lý liệu, đưa liệu cấu trúc bảng, sau đề xuất sử dụng giải thuật rừng ngẫu nhiên học từ liệu để rút trích mơn học quan trọng chương trình đào tạo ngành CNTT Nghiên cứu Lưu Hoài Sang cộng [4] đề xuất phương pháp dự báo kết học tập SV kỹ thuật học sâu nhằm khai thác sở liệu hệ thống quản lý SV trường đại học Dữ liệu sau thu thập phân tích, tiền xử lý liệu, thiết kế huấn luyện mạng nơ-ron đa tầng Kết thực nghiệm cho thấy mơ hình đề xuất cho kết dự đốn xác hồn tồn khả thi để áp dụng vào thực tế Nghiên cứu Nguyễn Đăng Nhượng [5] trình bày kết đạt tiến hành áp dụng giải thuật gom cụm liệu, kMeans [6] để khai thác thông tin từ điểm học sinh trường Cao đẳng nghề Văn Lang Hà Nội Tác giả tìm hiểu ảnh hưởng vùng miền, hồn cảnh gia đình, dân tộc, đạo đức… đến kết học tập học sinh, phân loại kết học tập để đánh giá cách nhanh chóng nhận thức người học http://jst.tnu.edu.vn 442 Email: jst@tnu.edu.vn TNU Journal of Science and Technology 227(08): 441 - 448 Nhóm tác giả Nguyễn Thị Kim Sơn cộng [7] nghiên cứu việc xây dựng tập liệu SV kết ứng dụng kỹ thuật học máy để lập chương trình dự báo cho loại tốt nghiệp SV, dự báo yếu tố tổ hợp tuyển sinh ảnh hưởng tới kết học tập SV Có thể thấy rằng, nghiên cứu tập trung vào việc khai thác thông tin liệu người học, từ áp dụng biện pháp tiền xử lý liệu giải thuật khai phá phù hợp để đưa mơ hình gợi ý, tư vấn cho người học yếu tố liên quan đến việc học cho phù hợp, hiệu kịp thời, giúp cho người học có kết học tập tốt Tuy nhiên, chưa thấy có nghiên cứu liên quan đến việc KPDL người học để áp dụng vấn đề tư vấn chọn ngành học cho TS, đặc biệt TS có nguyện vọng lựa chọn ngành học trường ĐHĐT Với mục đích tìm mơ hình tư vấn chọn ngành học cho phù hợp với lực, sở thích tính cách TS theo học trường ĐHĐT, đề xuất “Xây dựng mô hình hỗ trợ định tư vấn chọn ngành học trường Đại học Đồng Tháp” dựa công nghệ khám phá tri thức khai mỏ liệu [8] Qua góp phần đẩy mạnh công tác TVTS, hỗ trợ cho TS việc định hướng nghề nghiệp phù hợp với lực thân, góp phần nâng cao chất lượng đào tạo, chất lượng học tập, đồng thời qua kênh tư vấn ngành học cho TS, làm cầu nối để TS biết đến thông tin tuyển sinh trường nhiều Phương pháp nghiên cứu Các bước thực nghiên cứu bao gồm bước nghiên cứu bước vận dụng mơ hình để xây dựng ứng dụng web Ở bước nghiên cứu bản, tiến hành nghiên cứu tài liệu kỹ thuật KPDL, lý thuyết trắc nghiệm chọn ngành nghề tiến sỹ Tâm lý học John Holland, tìm hiểu thông tin tuyển sinh trường ĐHĐT quy định chung Bộ Giáo dục Đào tạo Tiếp theo thu thập thông tin SV học trường ĐHĐT qua khóa 2018, 2019, 2020 số SV tốt nghiệp, liệu tập trung ngành học đơng SV Sau thực bước tiền xử lý liệu để trích chọn, làm biến đổi liệu dạng cấu trúc bảng cho phù hợp, từ áp dụng giải thuật rừng ngẫu nhiên [12] để huấn luyện đưa mơ hình dự báo ngành học phù hợp cho TS, dựa điểm trội tiềm ẩn tính cách TS (lý thuyết John Holand) dựa đặc thù chung TS tham gia học trường ĐHĐT Ở bước vận dụng mô hình để xây dựng hệ thống, chúng tơi tập trung vào hai chức hỗ trợ cho TS: Thứ chức hỗ trợ TS tự đối chiếu sở thích, lực tự nhiên cá nhân với yêu cầu nhóm ngành nghề, để từ TS định hướng nghề nghiệp theo nhóm ngành phù hợp dựa lý thuyết trắc nghiệm chọn ngành nghề John Holland Thứ hai chức hỗ trợ định tư vấn chọn ngành học trường ĐHĐT dựa công nghệ khám phá tri thức KPDL, đưa dự báo phù hợp TS có nguyện vọng chọn học ngành học trường ĐHĐT Cơ sở lý thuyết 3.1 Lý thuyết mật mã Holland John Lewis Holland (1919 – 2008) giáo sư xã hội học danh dự Trường Đại học Johns Hopkins nhà tâm lý học Mỹ Ông biết đến tác giả học thuyết lựa chọn nghề nghiệp hay gọi mã Holland (Holland Codes) thường viết tắt RIASEC [9], [10] Trên sở lý thuyết này, John Holland xây dựng câu hỏi dành cho người muốn tự tìm hiểu Qua nhiều năm phát triển, trắc nghiệm giúp cho người ta tự phát kiểu người trội tiềm ẩn người để tự định hướng lựa chọn nghề Lý thuyết dựa luận điểm, luận điểm đầu là: Hầu xếp vào kiểu người có mơi trường hoạt động ứng với kiểu người kể [11], cụ thể: http://jst.tnu.edu.vn 443 Email: jst@tnu.edu.vn TNU Journal of Science and Technology 227(08): 441 - 448 Realistic (người thực tế, viết tắt R): Thích làm với vật cụ thể, máy móc, dụng cụ, cối, vật hoạt động ngồi trời Investigative (người thích nghiên cứu – I): Thích quan sát, tìm tịi, điều tra, phân tích, đánh giá giải vấn đề Artistic (người có tính nghệ sĩ – A): Có khả nghệ thuật, sáng tác, trực giác thích làm việc tình khơng có kế hoạch trước dùng trí tưởng tượng sáng tạo Social (người có tính xã hội – S): Thích làm việc cung cấp làm sáng tỏ thơng tin, thích giúp đỡ, huấn luyện, chữa trị chăm sóc sức khoẻ cho người khác, có khả ngơn ngữ Enterprising (người dám nghĩ dám làm – E): Thích làm việc với người khác, có khả tác động, thuyết phục, thể hiện, lãnh đạo quản lý mục tiêu tổ chức, lợi ích kinh tế Conventional (người cơng chức – C): Thích làm việc với liệu, số, có khả làm việc văn phịng, thống kê, thực cơng việc địi hỏi chi tiết, tỉ mỉ, cẩn thận làm theo hướng dẫn người khác 3.2 Rừng ngẫu nhiên định Tiếp cận rừng ngẫu nhiên Breiman đưa phương pháp tập hợp mơ hình thành cơng [12] Giải thuật rừng ngẫu nhiên tạo tập hợp định [13], [14] không cắt nhánh, xây dựng tập mẫu bootstrap (lấy mẫu có hồn lại từ tập học), nút phân hoạch tốt thực từ việc chọn ngẫu nhiên tập thuộc tính Lỗi tổng quát rừng phụ thuộc vào độ xác thành viên rừng phụ thuộc lẫn thành viên Giải thuật rừng ngẫu nhiên xây dựng không cắt nhánh nhằm giữ cho thành phần lỗi bias thấp (thành phần lỗi bias thành phần lỗi giải thuật học, độc lập với tập liệu học) dùng tính ngẫu nhiên để điều khiển tính tương quan thấp rừng Tiếp cận rừng ngẫu nhiên cho độ xác cao so sánh với thuật toán học có giám sát Như trình bày [12], rừng ngẫu nhiên học nhanh, chịu đựng nhiễu tốt khơng bị tình trạng học vẹt Giải thuật rừng ngẫu nhiên sinh mơ hình có độ xác cao đáp ứng yêu cầu thực tiễn cho vấn đề phân loại, hồi qui Giải thuật máy học rừng ngẫu nhiên trình bày ngắn gọn sau: − Từ tập liệu học LS có m phần tử n biến (thuộc tính), xây dựng T định cách độc lập nhau; − Mơ hình định thứ t xây dựng tập mẫu Bootstrap thứ t (lấy mẫu m phần tử có hoàn lại từ tập học LS); − Tại nút trong, chọn ngẫu nhiên n’ biến (n’

Ngày đăng: 06/07/2022, 16:56

Hình ảnh liên quan

Bảng 2. Mức độ quan trọng của các thuộc tính - Ứng dụng khai phá dữ liệu xây dựng mô hình tư vấn chọn ngành học tại trường Đại học Đồng Tháp

Bảng 2..

Mức độ quan trọng của các thuộc tính Xem tại trang 6 của tài liệu.
Form Hình thức xét tuyển vào đại học 8,4 - Ứng dụng khai phá dữ liệu xây dựng mô hình tư vấn chọn ngành học tại trường Đại học Đồng Tháp

orm.

Hình thức xét tuyển vào đại học 8,4 Xem tại trang 6 của tài liệu.
Ứng dụng này sẽ sử dụng mô hình đã đào tạo (Randomforestmodel.pkl) ở bước trên để dự đoán sự phù hợp khi TS chọn học một ngành tại trường ĐHĐT, dựa trên kết quả trắc nghiệm tính  cách người dùng ở giao diện trước và kết hợp với các thông tin đặc điểm riên - Ứng dụng khai phá dữ liệu xây dựng mô hình tư vấn chọn ngành học tại trường Đại học Đồng Tháp

ng.

dụng này sẽ sử dụng mô hình đã đào tạo (Randomforestmodel.pkl) ở bước trên để dự đoán sự phù hợp khi TS chọn học một ngành tại trường ĐHĐT, dựa trên kết quả trắc nghiệm tính cách người dùng ở giao diện trước và kết hợp với các thông tin đặc điểm riên Xem tại trang 7 của tài liệu.
Hình 3. Tham khảo các ngành nghề ứng với từng nhóm tính cách - Ứng dụng khai phá dữ liệu xây dựng mô hình tư vấn chọn ngành học tại trường Đại học Đồng Tháp

Hình 3..

Tham khảo các ngành nghề ứng với từng nhóm tính cách Xem tại trang 7 của tài liệu.

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan