Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 36 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
36
Dung lượng
1,31 MB
Nội dung
HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - BÙI THỊ BÉ BA HỆ THỐNG QUẢN LÝ VÀ DỰ BÁO TUYỂN SINH TẠI HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG TĨM TẮT LUẬN VĂN THẠC SỸ TP.HỒ CHÍ MINH – NĂM 2022 Luận văn hoàn thành tại: HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG Người hướng dẫn khoa học: TS Huỳnh Trọng Thưa Phản biện 1: PGS.TS Nguyễn Đình Thn Phản biện 2: PGS.TS Lê Hồng Thái Luận văn bảo vệ trước Hội đồng chấm luận văn thạc sĩ Học viện Cơng nghệ Bưu Viễn thông Vào lúc: giờ, ngày 02 tháng 07 năm 2022 Có thể tìm hiểu luận văn tại: - Thư viện Học viện Cơng nghệ Bưu Viễn thông I MỞ ĐẦU Lý chọn đề tài Tại Học viện Cơng nghệ Bưu Viễn thơng, năm có hàng ngàn thí sinh tham gia xét tuyển, công tác quản lý tuyển sinh quản lý file excel; việc thống kê kết kết trúng tuyển, kết nhập học cần kết hợp từ nhiều file, Bên cạnh để có chuẩn bị sở vật chất, đội ngũ cán giảng viên, nên Học viện cần đoán trước số liệu liên quan đến công tác tuyển sinh cho năm tới Đề tài “Hệ thống quản lý dự báo tuyển sinh Học viện Công nghệ Bưu Viễn thơng” với mục tiêu xây dựng hệ thống để quản lý kết hợp với dự báo số liệu giúp hạn chế sai sót cho cán quản lý trình sử dụng giúp cán quản lý nắm bắt kịp thời tình hình tuyển sinh, thơng số liên quan đến tuyển sinh để có nhìn tổng quan từ nhanh chóng đưa giải pháp, chiến lược tư vấn tuyển sinh tới, sở vật chất, đội ngũ giảng viên Tổng quan vấn đề nghiên cứu Để xây dựng hệ thống, trước hết cần nghiên cứu cơng cụ, ngơn ngữ lập trình phù hợp để xây dựng hệ thống tích hợp chức quản lý dự báo, sau thu thập thơng tin, liệu liên quan đến thông số cần thiết đánh giá tầm quan trọng thông số đầu vào, từ tìm hiểu mơ hình, kịch đánh giá để đặt vấn đề cho thông số đầu vào Dự báo số liệu tuyển sinh điều cần thiết công tác tuyển sinh Phục vụ cho nhiều hoạt động tư vấn tuyển sinh (nếu số lượng sinh viên vùng miền cịn ít, đẩy mạnh công tác tư vấn tuyển sinh xuống vùng miền đó), có chuẩn bị kịp thời sở vật chất, đội ngũ giảng viên (dựa vào số lượng sinh viên dự báo theo ngành) Nhiều cơng trình nghiên cứu dự báo theo chuỗi thời gian thuật tốn Facebook Prophet gần như: Bài báo “Phân tích dự báo hoạt động đầu tư khu công nghệ cao thành phố Hồ Chí Minh”, Huỳnh Trọng Thưa cộng Kết nghiên cứu báo sở để xây dựng mơ hình dự báo thông minh cho khu công nghệ cao khác nước Trong nghiên cứu này, tác giả thiết kế xây dựng chức quan trọng web nhập liệu, mơ hình phân tích dự báo hoạt động đầu tư khu công nghệ cao dựa thuật toán Prophet Facebook Kết thu trang web thể thông tin thống kê dự báo dòng vốn đầu tự vào khu công nghệ cao cho thời gian tới Bài báo “Time series facebook prophet model and python for covid-19 outbreak prediction”, Mashael Khayyat, Kaouther Laabidi, Nada Almalki1and Maysoon Al-zahrani[2] Kết báo dự báo sớm lây lan coronavirus để tạo điều kiện thuận lợi cho việc lập kế hoạch phòng chống dịch bệnh Trong báo tác giả đưa dự báo COVID-19 cách sử dụng kỹ thuật liệu chuỗi thời gian dựa tập liệu đề xuất để phân tích liệu bùng phát vi rút COVID-19 Bài báo đề xuất việc sử dụng phương pháp phân tích liệu để dự báo đại dịch Kết cho thấy mô hình đề xuất có khả dự báo thấp trường hợp khôi phục liệu COVID-19 Ngược lại, mơ hình đề xuất trường hợp tử vong có khả dự báo cao tập liệu COVID-19 Mục tiêu nghiên cứu 3.1 Mục tiêu tổng quát Mục tiêu đề tài xây dựng hệ thống để hỗ trợ cho công tác quản lý tuyển sinh, cung cấp giao diện dễ dùng, dễ dàng việc xem số liệu, tránh rủi ro sai sót từ người quản lý Hỗ trợ để đưa số dự báo cho tiêu ngành, vùng góp phần vào cơng tác tư vấn tuyển sinh sớm có chuẩn bị sở vật chất, đội ngũ cán giảng viên cho kì tuyển sinh tới 3.2 Mục tiêu cụ thể Xây dựng hệ thống gồm chức sau: - Chức quản lý gồm: Chức nhập thơng tin hồ sơ thí sinh qua form import thông tin từ file excel vào hệ thống - Chức tìm kiếm thơng tin: tìm kiếm hiển thị thơng tin theo năm, ngành, vùng tìm kiếm theo mã sinh viên - Chức dự báo gồm: Dự báo số lượng sinh viên trúng tuyển nhập học, theo ngành, khu vực, vùng, theo đối tượng ưu tiên sau xuất đồ thị thể số liệu tương ứng với thông số lựa chọn Đối tượng phạm vi nghiên cứu 4.1 Đối tượng nghiên cứu Quy trình, nghiệp vụ quản lý tuyển sinh đại học nhu cầu thống kê, dự báo thông tin Học viện Công nghệ Bưu Viễn thơng Các tài liệu, liệu tuyển sinh từ năm 2016 đến 2021 Học viện Công nghệ Bưu Viễn thơng Thuật tốn mã nguồn mở Prophet Facebook, công cụ, framework, kỹ thuật để xây dựng trang web Phương pháp nghiên cứu Đề tài sử dụng phương pháp nghiên cứu lý thuyết kết hợp với xây dựng ứng dụng thực nghiệm II NỘI DUNG CHƯƠNG 1: NGHIÊN CỨU TỔNG QUAN 1.1 Nghiên cứu quy trình tuyển sinh Quy trình tuyển sinh Học viện qua nhiều cơng đoạn, luận văn tập trung vào để hỗ trợ giải công đoạn từ việc tập hợp tập tin excel để thống kê kết từ lấy liệu đầu vào để hỗ trợ cho chức dự báo số liệu 1.2 Nghiên cứu mô hình phân rã - Thuật tốn Prophet Prophet phân rã chuỗi thời gian thành thành phần đại diện cho xu hướng, tính chu kỳ, ảnh hưởng ngày lễ sai số mơ hình theo phương trình: y(t)= g(t) + s(t) + h(t) + εt (1.3.3) Trong đó: g(t) hàm đại diện cho xu hướng, thay đổi khơng có tính chu kỳ chuỗi thời gian s(t) hàm đại diện cho thay đổi có tính chu kỳ chuỗi thời gian (ví dụ: hàng tuần, hàng tháng, hàng năm) h(t) hàm đại diện cho ảnh hưởng ngày nghỉ, ngày lễ xảy theo lịch vài ngày εt sai số mang tính ngẫu nhiên khơng xác định mơ hình Ưu điểm thuật tốn Prophet: Rất nhanh, xây dựng Stan, ngơn ngữ lập trình để suy luận thống kê viết C ++ Một mơ hình hồi quy cộng hưởng xu hướng phi tuyến phù hợp với tính thời vụ hàng năm, hàng tuần hàng ngày Mạnh mẽ thiếu liệu thay đổi theo xu hướng, có khả xử lý tốt cho trường hợp ngoại lệ Dễ dàng thay đổi quy trình điều chỉnh dự báo bổ sung thông tin chi tiết liệu doanh nghiệp CHƯƠNG 2: PHÂN TÍCH THIẾT KẾ 2.1 Thu thập liệu Công việc thu thâ ̣p dữ liê ̣u tuyển sinh Học viện Cơng nghệ Bưu Viễn thơng từ năm 2016 đến năm 2021 phận quản lý tuyển sinh Dữ liệu file excel bao gồm: Thơng tin chi tiết thí sinh đăng ký xét tuyển Thơng tin chi tiết thí sinh trúng tuyển Thơng tin chi tiết sinh viên nhập học Dữ liệu thu thập năm có định dạng khơng đồng 2.2 Tiền xử lý liệu Sau thu thập nhận thấy liệu không thống nhất, qua năm có thay đổi cấu trúc file liệu nên cần bước tiền xử lý liệu trước tiến hành viết chức import cho hệ thống Các file khác nên đưa định dạng để phục vụ cho chức import 2.3 Phân tích, đánh giá liệu Tiếp theo sau tiền xử lý liệu ta tiến hành truy vấn, tổng hợp liệu để hỗ trợ việc phân tích đánh giá liệu Kết truy vấn liệu sinh viên trúng tuyển ngành qua năm thể bảng sau: Bảng 2.3.1: Bảng liệu tổng số lượng sinh viên trúng tuyển qua năm Kết lấy tổng số lượng sinh viên trúng tuyển ngành công nghệ đa phương tiện qua năm bên dưới: Bảng 2.3.2: Bảng liệu tổng số lượng sinh viên trúng tuyển ngành công nghệ đa phương tiện qua năm Nhìn chung liệu tuyển sinh phụ thuộc vào quy chế, quy định Bộ giáo dục đào tạo Vì ta thấy liệu có thay đổi lớn, nhìn số tổng quát, bảng 2.3.2 liệu có biến đổi lớn năm 2020, năm 2020 có sách thay đổi từ Bộ giáo dục đào tạo Nhưng nhìn riêng ngành Cơng nghệ đa phương tiện năm 2020 số lượng sinh viên trúng tuyển giảm mạnh, số 20 Do hình thức xét tuyển kết hợp có năm 2020 2021 trở đi, nên chức cho phép người dùng nhập liệu tạm để có liệu phục vụ cho chức dự báo Để nhập thông tin “Xét tuyển kết hợp” nhấn vào nút “Thêm xét tuyển kết hợp” hiển thị form “Thông tin chi tiết” nhập vào thông tin form, sau bấm nút “Thêm” dịng liệu hình thức “Xét tuyển kết hợp” lưu vào hiển thị lên giao diện Hình 3.2.5: Giao diện form “Thông tin chi tiết” “Xét tuyển kết hợp” Tiếp theo menu mục “Xét tuyển kì thi ĐGNL” Tương tự mục “Xét tuyển kết hợp” chức phép người dùng nhập thơng tin cho hình thức xét tuyển dựa vào kỳ thi đánh giá lực 21 Để nhập thơng tin “Xét tuyển kì thi ĐGNL” giống nhập thông tin “Xét tuyển kết hợp” nhấn vào nút “Thêm xét tuyển ĐGNL” hiển thị form “Thông tin chi tiết” nhập vào thơng tin form, sau bấm nút “Thêm” dịng liệu hình thức “Xét tuyển kì thi ĐGNL” lưu vào hiển thị lên giao diện Mục cuối menu chức “Dự báo” Sau chọn mục “Dự báo” hệ thống mở trang để người dùng thao tác chức dự báo Chức dự báo gồm có mục trang quản lý: “Xét tuyển dựa vào kết thi THPT”, “Xét tuyển dựa vào kì thi đánh giá lực”, “Xét tuyển kết hợp” Hình 3.2.6: Giao diện tổng quan gồm mục trang dự báo 22 Ở mục trang dự báo có chung chức xem liệu dự báo số liệu theo hình thức tuyển sinh Đầu tiên mục dự báo “Xét tuyển dựa vào kết thi THPT” Ở mục người dùng xem dự báo theo nhiều tiêu chí (vùng miền, khu vực ưu tiên, ngành, ) hiển thị dạng biểu đồ tròn Nên người dùng phải chọn xem liệu theo tiêu chí tiêu chí như: vùng miền, khu vực ưu tiên, đối tượng ưu tiên, ngành, Ở tiêu chí chọn cho phép người dùng lựa chọn thêm xem theo tiêu chí khác như: xem liệu theo năm qua năm đối tượng (trúng tuyển, nhập học, tất cả) Ví dụ ta chọn xem liệu theo Ngành chọn thêm xem liệu theo năm đối tượng ( trúng tuyển, nhập học, ) tất đối tượng Hoặc xem liệu theo Ngành qua năm đối tượng (trúng tuyển, nhập học, ) tất đối tượng Tiếp theo phần dự báo tùy tiêu chí (vùng miền, ngành, ) mà người dùng chọn bước cho phép chọn tiếp số năm dự báo tới chọn đối tượng (trúng tuyển, nhập học, ) theo lĩnh vực nhỏ tiêu chí ví dụ ngành gồm có (Cơng nghệ Đa phương tiện, Quản trị 23 kinh doanh, Marketing, ), tương tự tiêu chí Vùng (Bắc Bộ, Đơng Nam Bộ, ) Hình 3.2.7: Giao diện tổng quan lựa chọn số năm, chọn đối tượng dự báo theo ngành Khi đối tượng dự báo số lượng sinh viên trúng tuyển nhập học người dùng xem chi tiết cho ngành Sau chọn xong hệ thống chạy kết dự báo bên phải menu gồm có: Biểu đồ thể số liệu đường tăng trưởng theo liệu thực liệu dự báo Bảng thống kê số liệu dự báo năm Ngồi người dùng cịn tải kết dự báo về, tải liệu hiển thị file excel theo format hình bên dưới: 24 Hình 3.2.8: Giao diện format file excel kết dự báo tải Tiếp theo mục dự báo “Xét tuyển kết hợp” “Xét tuyển dựa vào kì thi đánh giá lực” Khác với mục “Xét tuyển dựa vào kết thi THPT” hai mục giống cho xem liệu theo ngành biểu diễn dạng biểu đồ cột gồm đối tượng (đăng ký, trúng tuyển, nhập học) dự báo liệu theo đối tượng ngành 25 Hình 3.2.9: Giao diện tổng quan xem liệu dự báo mục “Xét tuyển kết hợp” Do hai mục giống nên trình bày “Xét tuyển kết hợp” Đầu tiên xem số liệu tổng quan người dung phải lựa chọn ngành tất ngành để xem liệu Sau liệu ngành chọn hiển thị bảng bên ngành chọn biểu diễn biểu đồ cột phía bên phải Tiếp theo phần dự báo giống mục “Xét tuyển dựa vào kết THPT” dự báo cho phép người dùng chọn đối tượng (trúng tuyển, nhập học, ), chọn tiếp số năm 26 dự báo tới theo ngành tổng ngành trường có tuyển sinh ngành Cơng nghệ Đa phương tiện, Quản trị kinh doanh, Marketing, Sau lựa chọn xong kết dự báo bên phải menu gồm có: Biểu đồ thể số liệu đường tăng trưởng theo liệu thực liệu dự báo Bảng thống kê số liệu dự báo năm tải biểu diễn dạng file excel 27 Chương 4: ĐÁNH GIÁ KẾT QUẢ THỬ NGHIỆM 4.1 Kết thực nghiệm Phần sau trình kiểm chứng kế t quả dự báo áp dụng thuật toán Facebook Prophet số liệu ngành Công nghệ đa phương tiện từ năm 2016 đến năm 2021 Phần phân tích dự báo xây dựng Google Colaboratory Mục đích Google Colab hỗ trợ chạy code Python trực tiếp thơng qua trình duyệt web, cơng cụ thích hợp cho việc phân tích liệu, machine learning giáo dục[13] Sau cài đặt môi trường import thư viện cần thiết Sau tiến hành tạo file có CSV để lưu thơng tin số lượng sinh viên trúng tuyển ngành Công nghệ đa phương tiện từ năm 2016 đến năm 2021 File gồm cột ds y, tương ứng với thời gian số lượng sinh viên Việc upload file lên google drive để đọc data từ Google Colab thể số liệu qua năm dạng đường gấp khúc hình 4.1.3 bên dưới: 28 Hình 4.1.1: Dữ liệu ngành Cơng nghệ đa phương tiện qua năm Để đánh giá mức độ hiệu thuật toán cần chia dữ liê ̣u thành phầ n: Phầ n dữ liê ̣u huấ n luyê ̣n (tập Train): từ năm 2016 đến năm 2019 (4 năm); phầ n dữ liê ̣u kiể m thử (tập Test): từ năm 2020 đến năm 2021 (2 năm) Kết liệu sau chia: Hình 4.1.2: Tập Cus_train tập Cus_test sau chia liệu Sau áp dụng thuật tốn Prophet với mơ hình growth='linear' cho tập Train để dự báo phản hồi cho tập train tập test sau: 29 Hình 4.1.3: Câu lệnh Thuật toán prophet áp dụng Dùng hàm plot để thể kết Hình sau đoạn mã truy xuất liệu, thực dự báo thuật tốn Prophet với mơ hình Growth = Linear cho hiển thị kết dự báo trực tiếp trình duyệt web Hình 4.1.4: Kết áp dụng thuật tốn Prophet với mơ hình growth=linear Kết thể hình gồm biểu đồ: Biểu đồ có line “Actual” màu xanh dương vẽ số liệu thực tế từ năm 2016 đến năm 2021 Biểu đồ có line “Forecast train” màu xanh lục vẽ số liệu dùng hàm predict() cho tập Train 30 Biểu đồ có line “Forecast test” màu xanh non vẽ số liệu dùng hàm predict() cho tập Test Sai số tuyệt đối trung bình MAE (Mean Absolute Error) của mô hiǹ h: + Với predict() cho tập Train: Hình 4.1.5: Cơng thức kết MAE tập Train + Với predict() cho tập Test: Hình 4.1.6: Cơng thức kết MAE tập Test Tỉ lê ̣ phầ n trăm trung biǹ h sai số tuyệt đối MAPE: + Với predict() cho tập Train Hình 4.1.7: Cơng thức kết MAPE tập Train + Với predict() cho tập Test: 31 Hình 4.1.8: Cơng thức kết MAPE tập Test In kết giá trị dự báo cho năm 2020 2021: Hình 4.1.9: Kết dự báo năm 2020 2021 Prophet cho phép điều chỉnh tham số để kết dự báo xác cách sử dụng Cross-validation để cho ̣n tham số phù hơ ̣p cho bô ̣ dữ liêụ cách thay đổi giá trị cho tham số changepoint_prior_scale[16] Trước tiên, cần chọn tham số cho changepoint_prior_scale Ứng với tham số tham số trên, tiến hành tính giá trị RMSE để chọn tham số tối ưu tham số có giá trị RMSE nhỏ nhất: Giá trị tối ưu RMSE 8.980455 tương ứng với tham số changepoint_prior_scale có giá trị 0.0001 Sau áp dụng lại thuật tốn Prophet với changepoint_prior_scale có giá trị 0.0001 để đánh giá so sánh với kết chưa áp dụng 32 tham số Kết giá trị dự báo cho năm 2020 2021 có áp dụng tham số changepoint_prior_scale=0.0001 sau: Hình 4.1.10: Kết dự báo năm 2020 2021 với changepoint_prior_scale Sai số tuyệt đối trung bình MAE = 7.302034465032428 Tỉ lê ̣ phầ n trăm trung biǹ h sai số tuyệt đối MAPE = 7.562012637162127 Bảng 4.1: So sánh kết Giá trị Prophet Prophet(dùng changepoint_prior_scale) yhat(2020) yhat(2021) MAE MAPE 106.77967 80.851719 7.3020345 7.5620126 107.82686 82.222795 7.6843076 7.9926896 So sánh kế t quả của đô ̣ đo Sai số tuyệt đối trung bình MAE của trường hợp Kết cho thấy liệu này, sai số tuṭ đớ i của mơ hiǹ h có điều chỉnh tham số changepoint_prior_scale thấp so với sai số tuyê ̣t đố i của 33 mô hiǹ h không áp dụng tham số Và tỉ lê ̣ sai số tuyêṭ đố i nhỏ 4.2 Nhận xét kết thử nghiệm ứng dụng Qua kết dự báo cho thấy ưu điểm thuật toán prophet linh hoạt, điều chỉnh tham số cho phù hợp với liệu đầu vào để có kết tối ưu Do liệu lựa chọn để đánh giá liệu ngành Cơng nghệ đa phương tiện, nhìn chung liệu tương đối ổn định, biến động, nên cho kết dự báo sát với thực tế Nhưng liệu khác, có kết sai số lớn hơn, liệu có thay đổi lớn qua năm 34 III KẾT LUẬN Hiện có nhiều hướng nghiên cứu để triển khai hệ thống quản lý dự báo tuyển sinh Luận văn trình bày hướng tiếp cận nhằm đáp ứng nhu cầu quản lý dự báo số liệu cho công tác tuyển sinh, nghiên cứu xây dựng hệ thống dự báo số liệu dựa phương pháp dự báo chuỗi thời gian dựa thuật toán Facebook Prophet Kết thực nghiệm mơ hình dự báo liệu phụ thuộc vào liệu đầu vào Do đặc thù ngành tuyển sinh thay đổi năm, nên để lấy liệu đồng thu thập từ năm 2016 đến nay, dẫn đến liệu ít, liệu phụ thuộc nhiều vào quy chế, quy định năm Bộ giáo dục đào tạo Đề tài mở hướng phát triển dự báo lĩnh vực giáo dục đào tạo, góp phần hỗ trợ cán quản lý có nhìn tổng quan giúp cho việc lên kế hoạch, chiến lược cụ thể nhằm chủ động trong công tác tuyển sinh, giúp công tác tuyển sinh phát triển ngày tốt