Nghiên cứu này nhằm mục đích thể hiện ứng dụng Kỹ thuật Khai phá dữ liệu, hỗ trợ cho việc ra quyết định của các nhà Quản lý giáo dục tại trường đại học ư, cụ thể là xác định những nhân t
BỘ THÔNG TIN VÀ TRUYỀN THÔNG HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THƠNG ****** BÁO CÁO ĐỀ TÀI : ỨNG DỤNG KỸ THUẬT KHAI PHÁ DỮ LIỆU TRONG QUẢN LÝ GIÁO DỤC TẠI TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI GIẢNG VIÊN : TS Trần Tiến Công HỌC VIÊN : Đàm Tiến Đạt – B22CHIS003 L ỚP : Hệ thống thông tin Hà Nội năm 2023 MỤC LỤC TÓM TẮT ĐẶT VẤN ĐỀ TỔNG QUAN NGHIÊN CỨU VÀ CƠ SỞ LÝ THUYẾT 2.1 2.2 Một số nghiên cứu liên quan đến đề tài Lý thuyết phân lớp trích chọn thuộc tính khai phá liệu 2.2.1 Phân lớp .7 2.2.2 Trích chọn thuộc tính PHƯƠNG PHÁP NGHIÊN CỨU KẾT QUẢ VÀ THẢO LUẬN 10 4.1 Một số đặc điểm đối tượng điều tra 10 4.2 Kết trích chọn thuộc tính .10 4.3 Kết độ xác phân lớp thời gian xử lý .12 KẾT LUẬN 13 DANH MỤC TÀI LIỆU THAM KHẢO 15 DANH MỤC BẢNG BIỂU Bảng 1: Độ xác phân lớp, thời gian thực trước sau trích chọn thuộc tính 12 DANH MỤC HÌNH VẼ Hình 1: Mơ hình xử lý liệu 10 Hình 2: Kết trích chọn thuộc tính 11 TÓM TẮT Đứng trước nguồn liệu khổng lồ mà nhà quản lý giáo dục lưu trữ, người quản lý gặp nhiều khó khăn việc chắt lọc thông tin, tri thức mà nguồn liệu mang lại Hầu hết định nhà quản lý giáo dục chưa sử dụng triệt để lợi ích mà kỹ thuật Khai phá liệu đem lại Nghiên cứu nhằm mục đích thể ứng dụng Kỹ thuật Khai phá liệu, hỗ trợ cho việc định nhà Quản lý giáo dục trường đại học Sư, cụ thể xác định nhân tố ảnh hưởng quan trọng đến đến định chọn ngành Hệ thống Thông tin Quản lý (HTTTQL) Trên sở đó, nhà quản lý giáo dục định chiến lược thu hút đầu vào sinh viên ngành Hệ thống Thơng tin nói riêng sinh viên trường Đại học Sư phạm Hà Nội nói chung Bằng cách ứng dụng phần mềm khai phá liệu WEKA với kỹ thuật Trích chọn thuộc tính Phân lớp, kết nghiên cứu cho thấy có nhân tố quan trọng ảnh hưởng đến định chọn ngành HTTTQL sinh viên trường Đại học Sư phạm Hà Nội, Tổng điểm xét tuyển sinh viên, niềm đam mê ứng dụng Cơng nghệ thơng tin vào giới tính, hội việc làm sau tốt nghiệp Từ khóa: Phân lớp, trích chọn thuộc tính, khai phá liệu, độ xác phân lớp, Nạve Bayes, Cây định, WEKA ĐẶT VẤN ĐỀ Kinh tế phát triển dựa tảng giáo dục bền vững Tuy nhiên, thực trạng đào tạo đại học thống kê Báo người lao động rõ, 64% người tìm việc không xác định mục tiêu nghề nghiệp học đại học, 50% số sinh viên trường phải đào tạo lại [9] Điều đỏi hỏi trường đại học cần có chiến lược nghiên cứu cụ thể để thể giải bất cập này, để không nâng cao số lượng đầu vào mà nâng cao chất lượng đào tạo, nắm bắt tâm lý người học, định hướng nghề nghiệp cho sinh viên Trong xu giáo dục bền vững với cạnh tranh ngày cao trường đại học, địi hỏi trường phải tìm chiến lược đào tạo thu hút đầu vào cho chuyên ngành Ngành Hệ thống Thông tin Quản lý (HTTTQL) ngành có xu hướng nhiều sinh viên lựa chọn Tuy nhiên, số lượng sinh đăng ký học ngành Hệ thống Thông tin Quản lý trường Đại học Sư phạm Hà Nộivẫn chưa cao, chí có xu hướng giảm nhẹ Số lượng đầu vào thấp nên chưa sử dụng tối đa nguồn lực đào tạo sở vật chất trang bị cho đào tạo chuyên ngành Do vậy, việc nghiên cứu để tìm nhân tố tác động đến định lựa chọn ngành HTTTQL sinh viên quan trọng Trên sở đó, Trường Đại học Sư phạm Hà Nộicó thể đề chiến lược đắn, hiệu cho việc thu hút sinh viên để nâng cao số lượng chất lượng đầu vào cho chuyên ngành Vấn đề tìm nhân tố tác động đến lựa chọn chuyên ngành học nhiều tác giả nước nước nghiên cứu Ví dụ, Keshishian cộng nghiên cứu nhân tố động lực ảnh hưởng đến lựa chọn chuyên ngành học trường đại học sinh viên Y Dược [6]; Nguyễn Thị Lan Hương nghiên cứu nhân tố ảnh hưởng đến động chọn ngành Quản trị Doanh nghiệp sinh viên trường Cao đẳng Kinh tế Đà Nẵng [8]; Edmonds nghiên cứu nhân tố ảnh hưởng đến lựa chọn chuyên ngành học tìm khác biệt chuyên ngành trường Rowan University [4] Mặc dù có nhiều nghiên cứu tiến hành chưa có nghiên cứu thực để tìm nhân tố ảnh hưởng đến lựa chọn ngành Hệ thống Thông tin Quản lý sinh viên trường Đại học Sư phạm Hà Nội Nghiên cứu ứng dụng phần mềm khai phá liệu WEKA với hai kỹ thuật trích chọn thuộc tính phân lớp để tìm nhân tố định đến lựa chọn ngành Hệ thống Thông tin Quản lý sinh viên TỔNG QUAN NGHIÊN CỨU VÀ CƠ SỞ LÝ THUYẾT 2.1 Một số nghiên cứu liên quan đến đề tài Nghiên cứu Yazici cộng đưa nhóm nhân tố tác động đến định lựa chọn chuyên ngành học sinh viên Trong nhân tố có ảnh hưởng khác nhau, bao gồm uy tín trường đại học, vị trí, chi phí, tình trạng kinh tế xã hội sinh viên Ngoài ra, thú vị ngành học, tiềm hội làm việc ảnh hưởng từ bố mẹ, giáo viên sinh viên lựa chọn chuyên ngành học nhân tố [13] Nghiên cứu Beggs cộng xác định nhân tố ảnh hưởng lớn đến định chọn chuyên ngành sinh viên bao gồm: đặc điểm chuyên ngành học phù hợp với sở thích cá nhân, đặc điểm cá nhân, đặc điểm công việc, lợi ích tài chính, tâm lý lợi ích xã hội, thông tin ngành [2] Document continues below Discover more from: An toàn ứng dụng web c… AT2021 Học viện Công ng… 291 documents Go to course Toan Cao Cap A1 Học 146 viện CN Bưu chính… An toàn ứng dụng… 100% (8) tham khảo gdqp học 12 phần - có sẵn đáp… An tồn ứng dụng… 100% (5) Tactics toeic audio 17 scripts An toàn ứng dụng… 100% (5) TA1-K6146 Supplementary… An toàn ứng dụng… 100% (5) Dump Splunk Sale 11 Rep - ưedsfg An toàn 88% Nghiên cứu Nguyễn Thị Lan Hương nhân tố ảnhdụn… hưởng đến động cơ(24) ứng chọn ngành quản trị doanh nghiệp, đối tượng sinh viên trường Cao đẳng Kinh tế - Kế hoạch Đà Nẵng, đưa mơ tham chiếu cô đọng bao gồm: đào tạo Ke liên thông, hội nghề nghiệp đối tượng tham chiếu [8] TCDT1429 rong đối Thiet tượng tham Cobè,Ban Baigia… chiếu xác định nghiên cứu bao gồm Thầy Cô, BốWeb Mẹ, bạn sinh 217 viên học trường, người làm lĩnh vực, buổi nói chuyện chuyên gia ngành An toàn ứng dụng… 100% (3) Tuy nhiên, nghiên cứu khác lại cho sinh viên nên đầu tư vào chuyên ngành giúp họ có tương lai ổn định, an tồn, thành cơng tương lai Quyết định khơng phải dựa cảm tính cá nhân mà dựa vào phù hợp họ [12] Kế thừa kết nghiên cứu trước [4] [8], vào đặc điểm đặc trưng chuyên ngành Hệ thống Thông tin Quản lý (HTTTQL), nghiên cứu đề xuất 39 nhân tố tương ứng với 39 thuộc tính sử dụng để đánh giá tác động đến định chọn ngành HTTTQL sinh viên bao gồm: giới tính, quê quán, dân tộc, ba môn thi dự tuyển vào đại học, điểm thành phần môn dự tuyển vào đại học, tổng điểm (bao gồm điểm ưu tiên), nghề Bố, nghề mẹ, định hướng, Anh Chị Em gia đình, Thầy Cơ, bạn bè, người thân, điểm tuyển sinh đầu vào, đam mê tìm hiểu cơng nghệ thơng tin, đam mê ứng dụng công nghệ thông tin vào kinh tế, đam mê cơng việc thống kê tính tốn, xu ngành, thách thức chuyên ngành, thương hiệu uy tín ngành, đội ngũ giáo viên, giao thơng, điều kiện sinh hoạt, học phí, truyền thơng, hướng nghiệp, thăm quan trường, khung chương trình, nhu cầu việc làm, hội việc làm, hội thăng tiến công việc, lương cao, môi trường làm việc động, sáng tạo, chuyên nghiệp Thuộc tính cuối ghi sinh viên trường liệu đặt tên “class”, trường lưu với nội dung “Yes” sinh viên theo học ngành Hệ thống Thông tin Quản lý; ngược lại lưu “No” 2.2 Lý thuyết phân lớp trích chọn thuộc tính khai phá liệu 2.2.1 Phân lớp Bao gồm dự đoán kết đầu dựa liệu đầu vào cho trước Để dự đoán kết đầu ra, thuật toán xử lý tập liệu, gọi tập huấn luyện (Traning set), gồm tập hợp thuộc tính thuộc tính kết tương ứng Thuộc tính kết gọi thuộc tính dự đốn hay cịn gọi lớp (class) Thuật tốn tìm cách huấn luyện khám phá mối quan hệ thuộc tính tập liệu để dự đốn khả đầu Sau đó, thuật tốn cho tập liệu mới, gọi tập kiểm thử (Testing set) Tập có chứa tập hợp thuộc tính, ngoại trừ thuộc tính dự đốn (tên lớp – khơng biết trước) Thuật tốn phân tích đầu vào, xử lý đưa dự đốn Độ xác dự báo cao, giải thuật đánh giá “tốt” [10] Hai kỹ thuật phân lớp thường sử dụng phân tích liệu giáo dục Naïve Bayes Cây định (Decision tree) Trong đó, kỹ thuật Nạve Bayes phân lớp dựa định lý Bayes lý thuyết xác suất để đưa phán đoán phân loại liệu dựa liệu quan sát thống kê [1] Mặt khác, Cây định phân cấp có cấu trúc, dùng để phân lớp đối tượng dựa vào dãy luật Các thuộc tính đối tượng (khơng bao gồm thuộc tính phân lớp) thuộc kiểu liệu khác Thuộc tính phân lớp, hay “class” phải có kiểu liệu nhị phân có thứ tự Cây định sinh luật để dự đoán lớp đối tượng chưa biết sở liệu đối tượng thu thập, giá trị nút định nhãn lớp [10] Để đánh giá độ xác (trung bình) mơ hình phân lớp, nghiên cứu sử dụng nhiều phương pháp đánh giá khác bao gồm: Holdout (Splitting): Dữ liệu ngẫu nhiên chia thành tập liệu huấn luyện (training) tập liệu kiểm thử (testing) Thông thường 2/3 liệu cấp cho huấn luyện, phần lại dùng cho kiểm thử Hai tập chia tập không giao K-fold cross validation: Nhằm tránh trùng lặp tập kiểm thử, toàn ghi sở liệu chia ngẫu nhiên thành k tập khơng giao nhau, có kích thước xấp xỉ Mỗi lần (trong số k lần) lặp, tập sử dụng làm tập kiểm thử - testing, (k-1) tập lại dùng làm tập huấn luyện – training Live-one-out cross validation:Thực việc kiểm thử với liệu huấn luyện (training) liệu kiểm thử (testing) ghi Điều có nghĩa là, sử dụng liệu thu từ ghi để huấn luyện, sau dùng liệu ghi chưa dùng huấn luyện để kiểm tra độ xác theo phương pháp kiểm tra chéo [3] 2.2.2 Trích chọn thuộc tính Mục đích trích chọn thuộc tính chọn tập tập thuộc tính ban đầu, cách loại bỏ thuộc tính dư thừa, khơng liên quan khơng trợ giúp việc đưa dự đoán Lựa chọn thuộc tính chứng minh lý thuyết thực hành thơng qua hiệu phân lớp, tăng độ xác dự đoán giảm nhớ lưu trữ liệu vào, giảm thời gian thực phân lớp [7] PHƯƠNG PHÁP NGHIÊN CỨU Đối tượng điều tra kích thước mẫu: Sinh viên k49, hệ quy trường Đại học Sư phạm Hà Nội đối tượng điều tra nghiên cứu Để đảm bảo mức độ đại diện, tổng mẫu cần thiết 300 mẫu, xác định theo bảng tính Israel [5] Tương ứng với tổng thể 1,000 sinh viên k49, mức độ tin cậy 95% Thiết kế bảng hỏi: Bảng hỏi cấu trúc xây dựng Trong đó, câu hỏi vào thuộc tính đề xuất Chuẩn hóa liệu: Dữ liệu thơ ban đầu lưu trữ dạng file excel (.xlsx) Chuẩn hóa file liệu dạng file ARFF (Attribute Relation File Format) để sử dụng WEKA Ứng dụng WEKA Trích chọn thuộc tính: Nghiên cứu sử dụng đánh giá thuộc tính dựa vào lớp định nghĩa WEKA Với đánh giá thuộc tính đề tài sử dụng lớp CfsSubsetEval sử dụng phương pháp tìm kiếm BestFirst search [11] Phân lớp: Áp dụng hai phương pháp phân lớp phổ biến dùng nghiên cứu khai phá liệu giáo dục Naïve Bayes Decision tree Mơ hình xử lý liệu: Nghiên cứu đề xuất mơ hình xử lý liệu sau: Dữ liệu thơ Trích chọn thu ộc tính Dữ liệu sau trích chọn Phân lớp Đánh giá độ xác thời gian thực Kết luận Những nhân t ố định mơ hình phân lớp hiệu qu ả Hình 1: Mơ hình xử lý liệu Dữ liệu thô ban đầu áp dụng kỹ thuật trích chọn thuộc tính để tìm tập liệu Bước tiếp theo, tập liệu áp dụng kỹ thuật phân lớp Với giải thuật, kết độ xác phân lớp thời gian thực lưu lại để đánh giá so sánh Cuối cùng, tập nhân tố quan trọng khẳng định đồng thời với mơ hình phân lớp hiệu đề xuất KẾT QUẢ VÀ THẢO LUẬN 4.1 Một số đặc điểm đối tượng điều tra Kết điều tra cho thấy, nơi sinh sinh viên điều tra phân bố không 13 tỉnh Trong đó, sinh viên sinh Hà Nội chiếm tỷ lệ cao với 63.67%, Quảng Bình với 9%, Quảng trị với 8.33% Hà Tĩnh 4.67% Số lượng sinh viên thuộc ngành Hệ thống Thông tin Quản lý tham gia điều tra 126 sinh viên, chiếm 42% tổng số phiếu điều tra Còn lại, 174 mẫu tương ứng với 58% sinh viên từ ngành học khác Bên cạnh đó, số lượng sinh viên nam tham gia vào điều tra 94 mẫu, chiếm 31.33% tổng số mẫu điểu tra; Số lượng sinh viên nữ 206 sinh viên, tương ứng với 68.67% Trong đó, số lượng sinh viên nam thuộc ngành Hệ thống Thông tin Quản lý 55 sinh viên, chiếm 58.51% tổng số sinh viên nam hỏi; số lượng sinh viên nữ thuộc ngành Hệ thống Thông tin Quản lý hỏi 71 sinh viên, chiếm 34.46% tổng số sinh viên nữ hỏi 4.2 Kết trích chọn thuộc tính Sau chạy mơ hình trích chọn thuộc tính WEKA, dựa lớp đánh giá thuộc tính CfsSubsetEval phương pháp tìm kiếm BestFirst search, kết cho 10 thuộc tính (tương ứng với nhân tố) bao gồm: giới tính, tổng điểm thi (bao gồm điểm ưu tiên), hội việc làm, đam mê ứng dụng công nghệ thông tin Kết chạy trích chọn thuộc tính WEKA thể Hình 2: === Run information === === Attribute Selection on all input data === Search Method: Best first Start set: no attributes Search direction: forward Stale search after node expansions Total number of subsets evaluated: 246 Merit of best subset found: 0.549 Attribute Subset Evaluator (supervised, Class (nominal): 39 Class): CFS Subset Evaluator Including locally predictive attributes Selected attributes: 1,8,33,37 : Gioi tinh Tong diem Dam me ung dung CNTT Viec lam Hình 2: Kết trích chọn thuộc tính Kết cho thấy, nhân tố rút từ nghiên cứu trước, ví dụ như, yếu tố tác động đối tượng tham chiếu (Bố mẹ, thầy cô, anh chị em, bạn bè), kiến thức hữu ích cá nhân, hay nhân tố tầm ảnh hưởng việc quảng bá ngành học trường sinh viên nhân tố định đến lựa chọn ngành học Hệ thống Thông tin Quản lý sinh viên trường Đại học Sư phạm Hà Nội Mặt khác, kết phản ánh, sinh viên định chọn ngành Hệ thống Thơng tin Quản lý chưa có tìm hiểu sâu chuyên ngành đào tạo, lựa chọn ngành dựa chủ yếu vào cảm tính chủ quan cá nhân Tuy nhiên, kết phù hợp với thực tế đào tạo đặc trưng ngành Hệ thống Thông tin Quản lý so với ngành học khác trường Thứ nhất, giới tính, tỷ lệ sinh viên nam theo học ngành cao so với sinh viên nữ Thứ hai, để an toàn lựa chọn ngành, sinh viên ngành Hệ thống Thông tin Quản lý ngành khác trọng đến việc lựa chọn chuyên ngành có điểm đầu vào phù hợp với tổng điểm thi Thứ ba, rõ ràng lựa chọn học ngành Hệ thống Thơng tin, sinh viên có nhiều hội tìm kiếm việc làm sinh viên vừa trang bị kiến thức kỹ lĩnh tin học Do đó, sinh viên tìm kiếm nhiều hội việc làm 11 có nhiều lựa chọn so với số ngành khác Cuối cùng, sinh viên tham gia học chuyên ngành thường có khả tìm hiểu ứng dụng cơng nghệ thơng tin Chính điều tác động đến yếu tố cuối đam mê ứng dụng Cơng nghệ thông tin Áp dụng phương pháp xếp hạng (Ranker) trích chọn thuộc tính, chạy liệu đầu vào thuộc tính chọn Kết cho thấy, thuộc tính Tổng điểm xếp thứ tự ưu tiên cao tương ứng với ảnh hưởng lớn đến định chọn ngành, sau đến đam mê ứng dụng Cơng nghệ thơng tin, giới tính, cuối hội việc làm sau tốt nghiệp 4.3 Kết độ xác phân lớp thời gian xử lý Sau trích chọn thuộc tính nêu trên, nghiên cứu thực việc so sánh độ phân lớp xác thời gian thực mơ hình phân lớp liệu trước sau trích chọn.Bảng kết tổng hợp đây: Bảng 1: Độ xác phân lớp, thời gian thực trước sau trích chọn thuộc tính Kỹ thuật Bayes Tree Lớp định nghĩa WEKA BayesNet Naïve Bayes NaïveBayesMultiomialText NaïveBayesUpdatable DecisionStump HoeffdingTree J48 LMT RandomForest RandomTree REPTree Độ xác phân lớp (%) Thời gian (s) Trước trích chọn Sau trích chọn Trước trích chọn 89.33 84.67 58.00 84.67 88.00 84.67 88.67 90.00 92.67 88.33 87.34 90.00 86.00 58.00 86.00 88.00 86.34 92.00 90.00 93.33 90.00 90.34 0.19 0.03 0.02 0.05 0.03 0.14 0.13 18.3 0.56 0.06 0.11 Sau trích chọn 0.08 0.03 0.01 0.02 0.01 0.06 0.09 0.88 0.31 0.02 0.03 (Nguồn: Kết chạy mơ hình sử dụng WEKA) Kết cho thấy, tổng thể sở liệu thu thập đề tài, kỹ thuật phân lớp dựa giải thuật Cây định mang lại độ xác phân lớp cao so với kỹ thuật dựa giải thuật Bayes Ví dụ, kết độ phân lớp xác cao dựa Bayes 90% - cho BayesNet sau trích chọn thuộc tính, kỹ thuậtCây định, tỷ lệ phân loại xác cao thuộc kết chạy RandomForest với 93.33% Bên cạnh đó, độ phân lớp xác thấp chạy Cây 12 định liệu trích chọn 86.34% cho H oefdingTree, độ xác thấp phân lớp dựa kỹ thuật Bayes đạt có 58% cho BạveBayesMultiomialText liệu đầu vào Có cải thiện đáng kể mức độ phân loại xác sau thực thao tác trích chọn liệu so với liệu thơ Hơn nữa, với tất trường hợp, thời gian thực mơ hình phân lớp nhanh đáng kể sau trích chọn thuộc tính quan trọng.Ví dụ, xét với giải thuật phân loại tốt thuộc nhóm Bayes, trước trích chọn thuộc tính, BayesNet cho kết phân lớp xác 89.33% với thời gian xây dựng mơ hình phân lớp 0.19s, độ xác phân lớp tăng lên 90% thời gian xử lý 0.08s sau liệu trích chọn Thêm vào đó, thấy với giải thuật tốt thuộc nhóm Cây định, mơ hình phân lớp dựa RandomForest cho kết độ xác phân lớp sau trích chọn liệu cao trước trích chọn 0.66%, thời gian xử lý giảm 0.25s Đặc biệt, giải thuật J48 thể chênh lệch lớn độ xác phân lớp trước sau trích chọn Độ xác tăng 3.33% từ 88.67% trước trích chọn lên 92% sau trích chọn liệu, thời gian xử lý lại giảm xuống từ 0.13s cịn 0.09s Mơ hình phân lớp cho độ xác tốt dựa thuộc tính trích chọn dựa giải thuật RandomForest, với độ xác 93.33%, thực 0.31s KẾT LUẬN Bằng cách ứng dụng kỹ thuật Khai phá liệu, bao gồm Phân lớp Trích chọn thuộc tính, nghiên cứu, nhân tố quan trọng ảnh hưởng đến định lựa chọn ngành Hệ thống Thông tin xác định theo thứ tự giảm dần: Tổng điểm (bao gồm điểm ưu tiên), đam mê ứng dụng Cơng nghệ thơng tin giới tính, hội việc làm Từ kết trên, nhà quản lý giáo dục nhận thấy sinh viên ngành Hệ thống Thông tin Quản lý lựa chọn ngành học chủ yếu dựa vào điểm tổng xét tuyển phù hợp với điểm tuyển sinh ngành, dựa vào cảm tính mong muốn chủ quan cá nhân, chưa có tìm hiểu sâu sắc ngành học Nghiên cứu phần phản ánh thực trạng vai trò nhà trường đối tượng tham chiếu việc lựa chọn ngành học sinh viên chưa rõ ràng Chính điều dẫn đến thực tế mà nhà trường phải đối mặt sinh viên không đáp ứng 13 yêu cầu đào tạo khơng biết trước u cầu đào tạo, khơng có chuẩn bị trước mặt kiến thức tinh thần để đáp ứng yêu cầu đầu Như vậy, để tăng chất lượng đào tạo, đồng thời tăng số lượng sinh viên đăng ký nhập học chuyên ngành này, vai trò nhà trường việc định hướng nghề nghiệp buổi hướng nghiệp cho học sinh trung học phổ thông cần tăng cường Bên cạnh đó, việc quảng bá ngành học cần thực để người học biết đến chuyên ngành, sở vật chất dành cho đào tạo chuyên ngành, đội ngũ giảng viên, yêu cầu đầu vào, đầu ra, phẩm chất người học,…trên sở đó, người học tự có định hướng rõ ràng hơn, tin tưởng chuyên ngành theo học, họ trở thành trung tâm hoạt động học tập Khi người học chủ động trung tâm hoạt động học tập nhà trường đạt nhân tố vô quan trọng đánh giá giáo dục bền vững mà nhà quản lý giáo dục trường Đại học Sư phạm Hà Nội nói riêng trường Đại học khác nước nói chung theo đuổi 14 DANH MỤC TÀI LIỆU THAM KHẢO Ahmed, Abeer Badr El Din, and Ibrahim Sayed Elaraby 2014 Data Mining: A prediction for Student's Performance Using Classification Method World Journal of Computer Application and Technology: (2):43-47 [1] [2] Beggs, Jeri Mullins, John H Bantham, and Steven Taylor 2008 Distinguishing the factors influencing college students'choice of major College Student Journal: 42 (2):381 [3] Bottou, Léon, Corinna Cortes, John S Denker, Harris Drucker, Isabelle Guyon, Lawrence D Jackel, Yann LeCun, Urs A Muller, Edward Sackinger, and Patrice Simard 1994 Comparison of classifier methods: a case study in handwritten digit recognition Paper read at Pattern Recognition, 1994 Vol 2-Conference B: Computer Vision & Image Processing., Proceedings of the 12th IAPR International Conference on [4] Edmonds, Jill 2012 Factors influencing choice of college major: what really makes a difference? [5] Israel, Glenn D 1992 Determining sample size: University of Florida Cooperative Extension Service, Institute of Food and Agriculture Sciences, EDIS Gainesville [6] Keshishian, Flora, Joseph M Brocavich, R Thomas Boone, and Somnath Pal 2010 Motivating factors influencing college students' choice of academic major American journal of pharmaceutical education: 74 (3):46 [7] Koller, Daphne, and Mehran Sahami 1996 Toward optimal feature selection Stanford InfoLab [8] Lan Hương, Thị Nguyễn 2012 Nghiên cứu yếu tố ảnh hưởng đến động chọn ngành quản trị doanh nghiệp sinh viên trường Cao đẳng Kinh tế-Kế hoạch Đà Nẵng [9] My, Trà 2005 Báo người lao động [10] Voznika, Fabricio, and Leonardo Viana 2007 Data Mining Classification [11] WekaSource Available from (http://weka.sourceforge.net/doc.stable/weka/attributeSelection/CfsSubsetEval.html) [12] Xiao, Zhenyu, Dengfeng Wang, and Yang Liu 2009 Economic environment and personality: how they influence investment decisions and regret? Social Behavior and Personality: 37 (10):1297-1304 [13] Yazici, Sedat, and Yazici Asli 2010 Students' choice of college major and their perceived fairness of the procedure: Evidence from Turkey Educational Research and Evaluation: 16 (4):371-382 15 More from: An toàn ứng dụng web và… AT2021 Học viện Công… 291 documents Go to course Toan Cao Cap A1 146 Học viện CN Bưu… An toàn ứng dụn… 100% (8) tham khảo gdqp 12 17 46 học phần - có sẵ… An tồn ứng dụn… 100% (5) Tactics toeic audio scripts An toàn ứng dụn… 100% (5) TA1-K61Supplementary… An toàn ứng dụn… 100% (5) Recommended for you Dump Splunk Sale 11 Rep - ưedsfg An toàn ứng… 88% (24) Tipping Point IPS 15 Dump - sdfg An toàn ứng dụn… 100% (1) Email Security for 12 Financial… An toàn ứng dụn… 100% (1) Lower Secondary 118 Answers Log on to… Physics 100% (2)