UBND TỈNH BÌNH DƢƠNG TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT NGUYỄN THẾ BẢO PHÂN TÍCH YẾU TỐ ẢNH HƯỞNG QUAN TRỌNG ĐẾN NÂNG CAO CHẤT LƯỢNG GIẢNG DẠY BẰNG DATA MINING – ÁP DỤNG VỚI DỮ LIỆU TẠI KHOA KỸ THUẬT – CÔNG N.
UBND TỈNH BÌNH DƢƠNG TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT NGUYỄN THẾ BẢO PHÂN TÍCH YẾU TỐ ẢNH HƯỞNG QUAN TRỌNG ĐẾN NÂNG CAO CHẤT LƯỢNG GIẢNG DẠY BẰNG DATA MINING – ÁP DỤNG VỚI DỮ LIỆU TẠI KHOA KỸ THUẬT – CÔNG NGHỆ TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ SỐ: 8480104 LUẬN VĂN THẠC SỸ BÌNH DƯƠNG, năm 2019 UBND TỈNH BÌNH DƢƠNG TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT NGUYỄN THẾ BẢO PHÂN TÍCH YẾU TỐ ẢNH HƯỞNG QUAN TRỌNG ĐẾN NÂNG CAO CHẤT LƯỢNG GIẢNG DẠY BẰNG DATA MINING – ÁP DỤNG VỚI DỮ LIỆU TẠI KHOA KỸ THUẬT – CÔNG NGHỆ TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ SỐ: 8480104 LUẬN VĂN THẠC SỸ NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS LÊ TUẤN ANH BÌNH DƯƠNG, năm 2019 LỜI CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu riêng tơi Các số liệu, kết nêu Luận văn trung thực chƣa đƣợc công bố cơng trình khác Tơi xin cam đoan giúp đỡ cho việc thực Luận văn đƣợc cảm ơn thơng tin trích dẫn Luận văn đƣợc rõ nguồn gốc Học viên thực đề tài Nguyễn Thế Bảo i LỜI CẢM ƠN Để hồn thành Luận văn này, xin gửi lời cảm ơn chân thành tới PGS.TS Lê Tuấn Anh Thầy tận tình giảng dạy, hƣớng dẫn giúp tiếp cận việc nghiên cứu Thầy ln tận tâm động viên, khuyến khích dẫn giúp tơi hồn thành đƣợc luận văn Bên cạnh đó, tơi xin gửi lời cảm ơn tới quý Thầy/Cô, bạn sinh viên Khoa Kỹ thuật – Công nghệ, Trƣờng Đại học Thủ Dầu Một hỗ trợ trình khảo sát liệu Đặc biệt xin gửi lời cảm ơn tới Thạc sĩ Hồ Đắc Hƣng nhiệt tình giúp đỡ trình thực luận văn Học viên thực đề tài Nguyễn Thế Bảo ii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC BẢNG v DANH MỤC HÌNH, ĐỒ THỊ vi DANH MỤC CHỮ VIẾT TẮT vii MỞ ĐẦU CHƢƠNG TỔNG QUAN 1.1 Giới thiệu 1.2 Khai phá liệu 1.3 Mục tiêu luận văn 1.4 Đối tƣợng nghiên cứu phạm vi nghiên cứu CHƢƠNG CÁC NGHIÊN CỨU LIÊN QUAN 2.1 Khai phá liệu giáo dục 2.2 Một số phƣơng pháp khai phá liệu đƣợc sử dụng luận văn 2.2.1 Cây định 2.2.2 Naive Bayes 2.2.3 Support Vector Machine (SVM) 2.2.4 k-NN 2.2.5 Multilayer Perceptron 10 2.2.6 Bảng định (Decision Table) 11 2.3 Tiêu chí đánh giá đặc trƣng 11 2.3.1 Xếp hạng đặc trƣng dựa vào độ tƣơng quan (Correlation-based) (CB) 11 2.3.2 Xếp hạng đặc trƣng dựa vào Info Gain (IG) 11 2.3.3 Xếp hạng đặc trƣng dựa vào Gain Ratio (GR) [7] [9] 12 2.3.4 Xếp hạng đặc trƣng OneR (OneR) 13 CHƢƠNG XÂY DỰNG MƠ HÌNH 14 3.1 Mơ hình 14 3.2 Thiết kế câu hỏi khảo sát 14 3.3 Lựa chọn đặc trƣng 17 3.4 Áp dụng phƣơng pháp khai phá liệu 18 iii CHƢƠNG ĐÁNH GIÁ KẾT QUẢ 19 4.1 Thực nghiệm 19 4.2 Đánh giá kết thực nghiệm 22 4.2.1 Khai phá liệu với tập liệu chƣa rút trích đặc trƣng (B1) 22 4.2.2 Khai phá liệu với tập liệu rút trích đặc trƣng (B2) 22 4.2.3 So sánh kết xây dựng mơ hình từ tập liệu ban đầu tập liệu đƣợc trích chọn đặc trƣng (B3) 24 4.2.4 Thử nghiệm liệu giảng viên 25 KẾT LUẬN VÀ KIẾN NGHỊ 28 TÀI LIỆU THAM KHẢO 29 iv DANH MỤC BẢNG Bảng 3.1: Câu hỏi khảo sát 15 Bảng 4.1: Chi tiết tập liệu 21 Bảng 4.2: Kết khai phá liệu với tập liệu chƣa rút trích đặc trƣng 22 Bảng 4.3: Sáu đặc trƣng có ảnh hƣởng theo thuật toán xếp hạng 23 Bảng 4.4: Bốn đặc trƣng có ảnh hƣởng theo thuật toán xếp hạng 23 Bảng 4.5: Độ xác mơ hình khai phá liệu với tập liệu rút gọn đặc trƣng 24 Bảng 4.6: Thời gian mơ hình khai phá liệu với tập liệu rút gọn đặc trƣng 24 Bảng 4.7: So sánh độ xác, thời gian thực thi áp dụng thuật toán khai phá liệu với tập liệu ban đầu tập liệu rút gọn đặc trƣng OneR 25 Bảng 4.8 Độ xác (%) khai phá liệu với tập liệu GV1 26 Bảng 4.9: Thời gian thực thi khai phá liệu với tập liệu GV1 26 Bảng 4.10: Độ xác (%) khai phá liệu với tập liệu GV2 27 Bảng 4.11: Thời gian thực thi khai phá liệu với tập liệu GV2 27 v DANH MỤC HÌNH, ĐỒ THỊ Hình 1.1: Quá trình khám phá tri thức [7] Hình 2.1: Mạng nơ-ron truyền thẳng nhiều lớp [17] 10 Hình 3.1: Quá trình thực 14 Hình 4.1: Lƣu đồ thực nghiệm 20 vi DANH MỤC CHỮ VIẾT TẮT TỪ VIẾT TẮT TIẾNG ANH TIẾNG VIỆT AUN ASEAN University Network PDCA Plan-Do-Check-Act AUN-QA ASEAN University Network – Hệ thống đại học ASEAN Quality Assurance EDM Education Data Mining Khai phá liệu giáo dục SVM Support Vector Machine Máy vec-tơ hỗ trợ k-NN k-Nearest Neighbor k- láng giềng MLP MultiLayer Perceptron Mạng nơ-ron nhiều lớp SMO Sequential Minimal Optimization NB Naïve Bayes DT Decision Table Bảng định KQHTMĐ Kết học tập mong đợi CB Correlation-based IG Info Gain GR Gain Ratio vii MỞ ĐẦU Việc đảm bảo, cải thiện chất lƣợng yếu tố sống tổ chức nào, sở giáo dục đại học ngoại lệ Nâng cao chất lƣợng đào tạo nhiệm vụ quan trọng hàng đầu, hƣớng mà trƣờng hƣớng tới để nâng tầm mình, sánh vai với trƣờng giới Trƣờng Đại học Thủ Dầu Một tập trung hồn thiện lộ trình xây dựng chƣơng trình đào tạo, đổi phƣơng pháp giảng dạy theo sáng kiến CDIO, đáp ứng chuẩn kiểm định nƣớc, nên đảm bảo chất lƣợng nhiệm vụ quan trọng mà Khoa, Chƣơng trình đào tạo phải thực Data mining (Khai phá liệu) cơng cụ mạnh mẽ việc tìm kiếm thơng tin hữu ích từ liệu Khai phá liệu đƣợc sử dụng để khám phá tri thức hầu hết lĩnh vực đời sống xã hội Áp dụng khai phá liệu vào lĩnh vực giáo dục đƣợc quan tâm năm gần Cùng với gia tăng tài nguyên học tập điện tử, phần mềm hỗ trợ học tập kết nối internet giáo dục tạo lƣợng lớn liệu giáo dục Tùy vào nhu cầu mà sở giáo dục có phân tích đánh giá liệu riêng mình, từ hỗ trợ cho việc định Ở sở giáo dục đại học, việc áp dụng khai phá liệu để phân tích tìm yếu tố ảnh hƣởng đến chất lƣợng giáo dục từ có biện pháp cải thiện, nâng cao chất lƣợng giáo dục việc làm cần thiết Trong đề tài này, sử dụng phƣơng pháp khai phá liệu kết hợp với phƣơng pháp xếp hạng đặc trƣng áp dụng vào liệu khảo sát đƣợc, so sánh kết xây dựng mơ hình trƣớc sau rút trích đặc trƣng để xác định yếu tố ảnh hƣởng quan trọng tới kết học tập sinh viên Khoa Kỹ thuật Công nghệ, Trƣờng Đại học Thủ Dầu Một Luận văn đƣợc chia làm Chƣơng: Chƣơng – Giới thiệu tổng quan Đảm bảo chất lƣợng, cải thiện chất lƣợng sở giáo dục đại học trình Khám phá tri thức; mục tiêu đối tƣợng nghiện cứu đề tài Chƣơng – Giới thiệu khai phá liệu giáo dục nghiên cứu liên quan Chƣơng – Đề xuất mô hình trình thực Chƣơng – Các thực nghiệm luận văn liên quan đến học phần Q6 Q7 Q8 Q9 Q10 Q11 Q12 Q13 Q14 Q15 Q16 Q17 Q18 Q19 Q20 Q21 Q22 Giảng viên trao đổi, lắng nghe, biết đƣợc khó khăn Sinh viên để có phƣơng pháp giúp đỡ kịp thời Giảng viên sử dụng nhiều phƣơng pháp giảng dạy theo hƣớng phát huy tính tích cực, chủ động Sinh viên Giảng viên thiết kế nhiều hoạt động giúp Sinh viên phát triển khả tự học, tự nghiên cứu Các tiết học Giảng viên thực tạo đƣợc thích thú/hấp dẫn/sinh động/lơi Sinh viên Giảng viên hƣớng dẫn Sinh viên lên kế hoạch cho cơng việc học tập Giảng viên hƣớng dẫn, yêu cầu Sinh viên tìm đọc, nghiên cứu tài liệu liên quan đến học phần Mọi thông tin học phần (đề cƣơng, giảng, thực hành,…) đƣợc Giảng viên cung cấp hệ thống E-learning Giảng viên tƣơng tác thƣờng xuyên với Sinh viên qua hệ thống Elearning Nội dung thực hành có giúp sinh viên hiểu rõ kiến thức lý thuyết Giảng viên thơng báo hình thức, phƣơng pháp kiểm tra, đánh giá học phần rõ ràng (thời điểm, thời hạn nộp, tiêu chí đánh giá) Sinh viên hiểu đƣợc tiêu chí đánh giá học phần mà Giảng viên đề Các tập, kiểm tra, thi phù hợp với nội dung mục tiêu mà Giảng viên đƣa ban đầu Khối lƣợng công việc (bài tập, đồ án, đề thi) học phần phù hợp vừa sức với Sinh viên Giảng viên dành thời gian nhận xét, đánh giá, phản hồi tập Sinh viên đƣợc giao cách chi tiết, kịp thời Học phần giúp Sinh viên phát triển kỹ chuyên ngành Phòng Lab Khoa giúp Sinh viên phát triển kỹ năng, hỗ trợ Sinh viên học tốt học phần Học phần giúp Sinh viên phát triển khả làm việc nhóm 16 Q23 Q24 Q25 Q26 Q27 Q28 Học phần giúp Sinh viên phát triển kỹ giải vấn đề Các công việc (bài tập, thực hành,…) giúp Sinh viên phát triển kỹ tƣ bậc cao (phân tích, tổng hợp, đánh giá, sáng tạo) Phòng học, phòng thực hành bố trí hợp lý, thống mát an tồn Các trang thiết bị phục vụ giảng dạy học (máy tính, máy chiếu,…) chất lƣợng tốt, đáp ứng nhu cầu học tập học phần Hệ thống thông tin (Wifi, Edusoft, E-learning) nhà trƣờng hỗ trợ Sinh viên hiệu học phần Các tài liệu liên quan đến học phần phong phú tìm thấy dễ dàng 3.3 Lựa chọn đặc trƣng Trong phƣơng pháp Học máy (Machine learning), số lƣợng đặc trƣng nhiều chƣa mang lại độ xác cao Nhƣng ngƣợc lại, số lƣợng đặc trƣng lớn dẫn đến nhiều khó khăn q trình huấn luyện, xây dựng mơ hình Do đó, liệu cần phải đƣợc xử lý Điểm quan trọng xử lý liệu lựa chọn đặc trƣng [10] [11] Lựa chọn đặc trƣng cho tập liệu nhỏ thích hợp với q trình phân tích liệu Việc lựa chọn đặc trƣng phải đảm bảo độ xác q trình phân tích liệu, cải thiện thời gian huấn luyện độ khớp (over-fitting) phân tích liệu Luận văn sử dụng phƣơng pháp xếp hạng đặc trƣng đƣợc cài đặt công cụ Weka nhƣ Correlation Attribute evaluation, GainRatio Attribute evaluation, Information Gain Attribute evaluation [11] OneR [15] để tiến hành xếp hạng đặc trƣng liệu thu thập đƣợc Xếp hạng đặc trƣng dựa vào độ tƣơng quan Pearson [8]: Các đặc trƣng đƣợc xếp hạng dựa vào độ tƣơng quan Pearson với lớp mục tiêu ∑ ( ̅) ( ̅) √∑ ( ̅̅̅) ( ̅) (13) với r: độ tƣơng quan pearson hai biến x y; biến thứ i; ̅ giá trị trung bình biến x, ̅ giá trị trung bình biến y Xếp hạng đặc trƣng dựa vào độ lợi thông tin [13]: Các đặc trƣng đƣợc xếp hạng dựa vào độ lợi thông tin 17 InfoGain(lớp,thuộc tính) = H(lớp) - H(lớp | thuộc tính) (14) với infoGain độ lợi thông tin, H entropy đƣợc tính theo cơng thức (7) Xếp hạng đặc trƣng dựa vào tỉ số độ lợi [14]: Các đặc trƣng đƣợc xếp hạng dựa vào tỉ số độ lợi GainR(lớp,thuộc tính) = (H(lớp) - H(lớp | thuộc tính)) / H(thuộc tính) (15) với GainR tỉ số độ lợi, H entropy đƣợc tính theo cơng thức (7) Xếp hạng dựa vào OneR [15] [7]: Các thuộc tính đƣợc xếp hạng dựa vào phƣơng pháp OneR Lựa chọn đặc trƣng giúp có đƣợc tập liệu nhƣng đảm bảo độ xác Và giúp nhận đâu đặc trƣng quan trọng, yếu tố có ảnh hƣởng quan trọng tới cải thiện chất lƣợng sở giáo dục 3.4 Áp dụng phƣơng pháp khai phá liệu Các phƣơng pháp khai phá liệu giúp khám phá thông tin hữu ích từ liệu thu thập đƣợc Từ trƣớc tới có nhiều kỹ thuật khai phá liệu đƣợc giới thiệu rộng rãi Việc lựa chọn đƣợc kỹ thuật phù hợp giúp cho việc khám phá tri thức, tìm kiếm thơng tin hữu ích nhanh Mục tiêu luận văn xác định đƣợc yếu tố quan trọng ảnh hƣởng kết học tập sinh viên để từ đề giải pháp cải thiện chất lƣợng giảng dạy Do dó, luận văn phƣơng pháp khai phá liệu nhƣ Decision Table (DT), J48, Naïve Bayes (NB), Multilayer Perceptron (MP), K-Nearest Neighbor (k-NN) Sequential Minimal Optimization (SMO) đƣợc sử dụng với tập liệu So sánh độ xác, thời gian thực thi thuật tốn áp dụng với tập liệu (trƣớc sau lựa chọn đặc trƣng) để tìm đƣợc thuật tốn có kết tốt nhất, xác định yếu tố có ảnh hƣởng quan trọng tới việc cải thiện chất lƣợng giảng dạy Chƣơng đề xuất mơ hình thực trình thực luận văn Bên cạnh đó, chƣơng trình bày quy định, nghiên cứu liên quan để làm sở cho việc xây dựng câu hỏi khảo sát Trong chƣơng tiếp theo, trình bày kết thực nghiệm rút kết luận việc xác định yếu tố có ảnh hƣởng quan trọng tới kết học tập sinh viên 18 CHƯƠNG ĐÁNH GIÁ KẾT QUẢ Sau đề xuất xây dựng mơ hình, chƣơng tiến hành thực nghiệm để đánh giá Chúng tiến hành thực nghiệm theo bƣớc sau: khai phá liệu với tập chƣa trích chọn đặc trƣng, khai phá liệu với tập trích chọn đặc trƣng Từ kết khai phá liệu, so sánh để rút kết luận luận văn 4.1 Thực nghiệm Quá trình đƣợc thể lƣu đồ sau: DT J48 MP Tập liệu SMO k-NN NB CB IR GR Xếp hạng đặc trƣng Model OneR Kết DL xếp DL xếp hạng DL xếp DL đãhạng xếp hạng hạng Model DT J48 Trích chọn đặc trƣng MP SMO k-NN NB 19 So sánh Hình 4.1: Lưu đồ thực nghiệm 20 Để xác định đƣợc thuật toán khai phá liệu phù hợp, đồng thời xác định đƣợc đặc trƣng quan trọng Chúng thực thực nghiệm theo Hình 4.1 nhƣ bƣớc sau: - Bƣớc (B1): Chúng tiến hành áp dụng thuật toán khai phá liệu DT, J48, MP, SMO, k-NN NB tập liệu chƣa rút gọn đặc trƣng - Bƣớc (B2): Áp dụng thuật toán khai phá liệu DT, J48, MP, SMO, kNN NB tập liệu rút gọn đặc trƣng Trong đó: + Bƣớc 2.1 (B2.1): Chúng tơi sử dụng phƣơng pháp xếp hạng đặc trƣng Correlation Attribute evaluation, GainRatio Attribute evaluation, Information Gain Attribute evaluation OneR để xếp hạng đặc trƣng theo mức độ quan trọng giảm dần + Bƣớc 2.2 (B2.2): Số lƣợng đặc trƣng quan trọng đƣợc xác định cách so sánh độ xác thuật tốn khai phá liệu với tập liệu đƣợc xếp đặc trƣng - Bƣớc (B3): So sánh kết xây dựng mơ hình từ tập liệu ban đầu tập liệu đƣợc trích chọn đặc trƣng Hơn nữa, để kiểm chứng lại kết hợp thuật toán khai phá liệu xếp hàng đặc trƣng, tiến hành đánh giá lại tập liệu giảng viên Dựa bảng câu hỏi thiết kế, việc khảo sát đƣợc thực Khoa Kỹ thuật Công nghệ, Trƣờng Đại học Thủ Dầu Một Các môn học đƣợc khảo sát môn học sở ngành sinh viên ngành Hệ thống thông Kỹ thuật phần mềm Tập liệu thu đƣợc gồm có 551 hàng (tƣơng ứng với 551 phiếu khảo sát sinh viên), 28 cột (tƣơng ứng với câu hỏi từ đến 28), cột phân lớp điểm học phần mà sinh viên đƣợc học phần sinh viên thực khảo sát Bảng 4.1: Chi tiết tập liệu Mã giảng viên Số môn học đƣợc khảo sát Tổng số sinh viên khảo sát GV1 189 GV2 196 GV3 166 21 Để tiến hành thực nghiệm đánh giá kết quả, luận văn xây dựng ứng dụng Java có kết hợp với thƣ viện Weka [12] Tất thực nghiệm đƣợc thực Laptop Asus K55A, xử lý Intel(R) Core i7-3630QM, CPU 2.4GHz, nhớ RAM 8GB đƣợc cài hệ điều hành Windows 10 phiên Education 64bit, liệu đƣợc chia thành hai phần gồm huấn huyện (80%) kiểm tra (20%) 4.2 Đánh giá kết thực nghiệm 4.2.1 Khai phá liệu với tập liệu chƣa rút trích đặc trƣng (B1) Chúng sử dụng phƣơng pháp khai phá liệu DT, J48, MP, SMO, kNN NB để tiến hành xây dựng mơ hình từ tập liệu chƣa rút trích đặc trƣng Từ kết Bảng 4.3 cho thấy, thuật toán SMO thuật toán DT cho độ xác cao (72.1%) Tuy nhiên, từ kết thời gian thực thi thuật tốn nhận thấy thuật tốn SMO thực thi với thời gian thuật tốn DT Bảng 4.2: Kết khai phá liệu với tập liệu chƣa rút trích đặc trƣng Thuật tốn Các so sánh Độ xác (%) Thời gian thực thi (mili giây) DT J48 NB MP k-NN SMO 72.1 55.9 44.1 62.2 60.4 72.1 47 ≈0 1921 ≈0 16 15 4.2.2 Khai phá liệu với tập liệu rút trích đặc trƣng (B2) Để xác định đƣợc số lƣợng đặc trƣng quan trọng, tiến hành bƣớc sau: Sử dụng phƣơng pháp xếp hạng đặc trƣng để xếp hạng đặc trƣng cho tập liệu, sau xây dựng mơ hình cách sử dụng thuật toán SMO (kết chọn từ thực nghiệm bƣớc B1) Cuối cùng, xác định số lƣợng đặc trƣng quan trọng đại diện cho tập liệu B2.1: Xếp hạng đặc trƣng tập liệu Các đặc trƣng đƣợc xếp hạng dựa vào phƣơng pháp: phƣơng pháp xếp hạng đặc trƣng dựa vào mối tƣơng quan đặc trƣng (CB); phƣơng pháp xếp hạng đặc trƣng thông qua đánh giá tỉ số độ lợi thông tin đặc trƣng (GR); phƣơng pháp lựa chọn đặc trƣng thông qua đánh giá độ lợi thông tin đặc 22 trƣng (IG) phƣơng pháp xếp hạng đặc trƣng OneR (OneR) Các đặc trƣng đƣợc xếp hạng theo thứ tự từ cao tới thấp theo mức độ quan trọng B2.2: Xác định số lƣợng đặc trƣng quan trọng Để xác định số lƣợng đặc trƣng quan trọng, tiến hành xây dựng mơ hình phân loại dựa kết hợp thuật toán SMO với tập liệu đƣợc xếp hạng đặc trƣng bƣớc B2.1 Số lƣợng đặc trƣng đƣợc tăng dần trình xây dựng mơ hình phân loại So sánh độ xác mơ hình tƣơng ứng với số lƣợng đặc trƣng Khi số lƣợng đặc trƣng khoảng từ tới 24 gần nhƣ khơng có khác biệt độ xác (độ xác khoảng 72.1%) Với số lƣợng đặc trƣng từ 25 trở độ xác có suy giảm Do chọn sáu đặc trƣng làm đại diện cho tập liệu Bảng 4.4 sáu đặc trƣng quan trọng theo thuật toán xếp hạng đặc trƣng Bảng 4.5 bốn đặc trƣng quan trọng theo thuật toán xếp hạng đặc trƣng Bảng 4.3: Sáu đặc trƣng có ảnh hƣởng theo thuật tốn xếp hạng Xếp hạng Correlation Gain Ratio Info gian OneR Q17 Q12 Q17 Q28 Q11 Q17 Q11 Q10 Q10 Q11 Q12 Q9 Q12 Q15 Q1 Q11 Q22 Q1 Q15 Q27 Q2 Q8 Q10 Q12 Bảng 4.4: Bốn đặc trƣng có ảnh hƣởng theo thuật toán xếp hạng Xếp hạng Correlation Gain Ratio Info gian OneR 25 Q6 Q Q20 Q17 26 Q7 Q5 Q5 Q1 27 Q14 Q21 Q13 Q19 28 Q21 Q13 Q21 Q1 23 4.2.3 So sánh kết xây dựng mơ hình từ tập liệu ban đầu tập liệu đƣợc trích chọn đặc trƣng (B3) Với số lƣợng đặc trƣng đƣợc chọn sáu đặc trƣng, đặc trƣng quan trọng đƣợc loại bỏ Trong phần thực nghiệm tiến hành xây dựng mơ hình từ tập liệu rút gọn đặc trƣng Bảng 4.6 cho thấy độ xác xây dựng mơ hình có kết hợp thuật toán khai phá liệu với thuật toán xếp hạng đặc trƣng Bảng 4.7 so sánh thời gian thực thi thuật toán khai phá liệu kết hợp với thuật toán xếp hạng đặc trƣng Bảng 4.5: Độ xác mơ hình khai phá liệu với tập liệu rút gọn đặc trƣng Thuật toán Khai phá liệu Thuật toán DT J48 NB MP k-NN SMO xếp hạng đặc trƣng Corellation 72.1 48.6 45.9 69.4 57.7 72.1 Info Gain 72.1 55 48.6 56.8 60.4 72.1 Gain Ratio 72.1 55.7 49.5 58.6 59.5 72.1 OneR 72.1 72.1 72.1 72.1 72.1 72.1 Bảng 4.6: Thời gian mơ hình khai phá liệu với tập liệu rút gọn đặc trƣng Thuật toán Khai phá liệu DT J48 NB MP k-NN SMO Corellation 16 ≈0 ≈0 433 ≈0 31 Info Gain 16 15 15 417 ≈0 22 Gain Ratio 15 15 ≈0 517 ≈0 16 OneR 16 ≈0 ≈0 455 ≈0 ≈0 Thuật toán xếp hạng đặc trƣng 24 Kết Bảng 4.6 Bảng 4.7 rằng, thuật toán DT SMO kết hợp với thuật toán xếp hạng đặc trƣng cho độ xác cao (72.1%) Tuy nhiên, so sánh thêm thời gian thực thi thuật toán nhận thấy SMO kết hợp với OneR thực thi nhanh so với thuật tốn cịn lại Từ kết xây dựng mơ hình với tập liệu chƣa rút trích đặc trƣng ( thực nghiệm 4.2.1) tập liệu đƣợc trích chọn đặc trƣng trên, nhận thấy với tập liệu đƣợc trích chọn đặc trƣng cho kết khả quan so với tập liệu ban đầu Bảng 4.7: So sánh độ xác, thời gian thực thi áp dụng thuật toán khai phá liệu với tập liệu ban đầu tập liệu rút gọn đặc trƣng OneR Độ xác (%) Thời gian thực thi (mili giây) Tập liệu chƣa Tập liệu Tập liệu chƣa Tập liệu trích chọn đặc trích chọn đặc trích chọn đặc trích chọn đặc trƣng trƣng trƣng trƣng DT 72.1 72.1 47 16 J48 55.9 72.1 15 ≈0 NB 44.1 72.1 ≈0 ≈0 MP 62.2 72.1 1921 455 k-NN 60.4 72.1 ≈0 ≈0 SMO 72.1 72.1 16 ≈0 4.2.4 Thử nghiệm liệu giảng viên Hơn nữa, để kiểm chứng lại kết hợp thuật toán khai phá liệu xếp hàng đặc trƣng, tiến hành đánh giá lại tập liệu giảng viên Trong thực nghiệm này, chúg tách riêng biệt liệu hai giảng viên toàn tập liệu, sau tiến hành xây dựng mơ hình tập liệu giảng viên Bảng 4.8 mô tả độ xác xây dựng mơ hình có kết hợp thuật toán khai phá liệu với thuật toán xếp hạng đặc trƣng tập liệu Giảng viên Bảng 4.9 mô tả thời gian thực thi xây dựng mơ hình có kết hợp 25 thuật toán khai phá liệu với thuật toán xếp hạng đặc trƣng tập liệu Giảng viên Bảng 4.8 Độ xác (%) khai phá liệu với tập liệu GV1 Thuật toán Khai phá liệu Thuật toán DT J48 NB MP k-NN SMO xếp hạng đặc trƣng Corellation 86.8 86.8 73.7 84.2 86.8 86.8 Info Gain 86.8 86.8 78.9 84.2 84.2 86.8 Gain Ratio 86.8 86.8 78.9 84.2 84.2 86.8 OneR 86.8 86.8 65.8 86.8 81.6 86.8 Bảng 4.9: Thời gian thực thi khai phá liệu với tập liệu GV1 Thuật toán Khai phá liệu Thuật toán DT J48 NB MP k-NN SMO xếp hạng đặc trƣng Corellation 16 ≈0 ≈0 147 ≈0 15 Info Gain ≈0 ≈0 ≈0 162 ≈0 ≈0 Gain Ratio 15 16 ≈0 202 ≈0 10 OneR ≈0 ≈0 15 185 ≈0 ≈0 Bảng 4.10 mô tả độ xác xây dựng mơ hình có kết hợp thuật toán khai phá liệu với thuật toán xếp hạng đặc trƣng tập liệu Giảng viên Bảng 4.11 mô tả thời gian thực thi xây dựng mơ hình có kết hợp thuật toán khai phá liệu với thuật toán xếp hạng đặc trƣng tập liệu Giảng viên 26 Bảng 4.10: Độ xác (%) khai phá liệu với tập liệu GV2 Thuật toán Khai phá liệu DT J48 NB MP k-NN SMO Thuật toán xếp hạng đặc trƣng Corellation 85.3 85.3 88.2 76.5 79.4 88.2 Info Gain 85.3 82.4 88.2 88.2 85.3 88.2 Gain Ratio 88.2 85.3 88.2 88.2 85.3 88.2 OneR 85.3 88.2 88.2 82.4 79.4 88.2 Bảng 4.11: Thời gian thực thi khai phá liệu với tập liệu GV2 Thuật toán Khai phá liệu DT Thuật toán J48 NB MP k-NN SMO xếp hạng đặc trƣng Corellation 16 16 ≈0 147 ≈0 15 Info Gain 16 ≈0 ≈0 160 10 Gain Ratio ≈0 ≈0 185 ≈0 16 OneR 10 10 ≈0 161 ≈0 ≈0 27 KẾT LUẬN VÀ KIẾN NGHỊ Trong luận văn trình bày cách tiếp cận khác việc áp dụng khai phá liệu vào lĩnh vực giáo dục Bằng cách kết hợp thuật toán khai phá liệu với thuật toán xếp hạng đặc trƣng để nhận biết đƣợc số lƣợng đặc trƣng đại diện cho tập liệu Từ kết thực nghiệm, cho thấy đặc trƣng quan trọng tập liệu Q9 (Các tiết học Giảng viên thực tạo đƣợc thích thú/hấp dẫn/sinh động/lôi Sinh viên), Q10 (Giảng viên hƣớng dẫn Sinh viên lên kế hoạch cho công việc học tập mình), Q11 (Giảng viên hƣớng dẫn, yêu cầu Sinh viên tìm đọc nghiên cứu tài liệu liên quan đến học phần), Q12 (Mọi thông tin học phần (đề cƣơng, giảng, thực hành,…) đƣợc Giảng viên cung cấp hệ thống E-learning), Q27 (Hệ thống thông tin (Wifi, Edusoft, E-learning) nhà trƣờng hỗ trợ Sinh viên hiệu học phần này) Q28 (Các tài liệu liên quan đến học phần phong phú tìm thấy dễ dàng) yếu tố ảnh hƣởng quan trọng tới việc cải thiện chất lƣợng giảng dạy sơ giáo dục đại học - Khoa Kỹ thuật Công nghệ, Trƣờng Đại học Thủ Dầu Một Các yếu tố từ kết phân tích hồn tồn phù hợp với tình hình thực tế Khoa Khoa Kỹ thuật Cơng nghệ, Trƣờng Đại học Thủ Dầu Một Khi giảng viên lên lớp có kế hoạch phù hợp, tạo hứng thú cho sinh viên, giúp sinh viên lên kế hoạch học tập rõ ràng kết học tập sinh viên tốt Việc sử dụng Hệ thống Elearning đƣợc đẩy mạnh học kỳ gần đây, giảng viên đƣợc tham gia buổi tập huấn việc giảng dạy Elearning, nguồn tài nguyên học tập (bài giảng, đề cƣơng, kiểm tra đánh giá,…) đƣợc giảng viên cập nhật liên tục hệ thống Elearning từ sinh viên truy cập tự học, nâng cao kết học tập Bên cạnh đó, Nhà trƣờng lắp đặt thêm hệ thống WiFi bao phủ dãy phòng học, khu tự học Trƣờng, hệ thống thƣ viện liên kết với nhiều sở liệu khác để giảng viên, sinh viên truy cập tìm kiếm tài liệu hỗ trợ học tập Chính yếu tố giúp cải thiện kết học tập sinh viên Tuy nhiên, việc khảo sát thực Khoa Kỹ thuật – Công nghệ, nên hƣớng phát triển đề tài, thời gian tới sử dụng tập liệu lớn từ việc khảo sát sinh viên toàn Trƣờng để bao phủ nhiều khía cạnh 28 TÀI LIỆU THAM KHẢO [1] Huỳnh L Thanh Nhàn, Nguyễn Thái Nghe 2013a Hệ thống dự đoán kết học tập gợi ý lựa chọn môn học Kỷ yếu hội thảo quốc gia lần thứ XVI: Một số vấn đề chọc lọc CNTT&TT (@2013), trang 110-118 Nhà xuất Khoa học kỹ thuật ISBN: 987-604-67-0251-1 [2] Huỳnh L Thanh Nhàn Nguyễn Thái Nghe 2013b Hệ thống dự đoán kết học tập sinh viên sử dụng thƣ viện hệ thống gợi ý mã nguồn mở MYMEDIALITE Kỷ yếu Hội thảo toàn quốc CNTT năm 2013 Trang 192-201 NXB Đại học Cần Thơ ISBN: 978-604-919-012-4 [3] Ahmed Mohamed Ahmed, Ahmet Rizaner, Ali Hakan Ulusoy, Using data mining to predict instructor performance, International Conference on Application of Fuzzy Systems and Soft Computing, ICAFS 2016, Procedia Computer Science 102 ( 2016 ) 137 – 142 [4] Cristobal Romero and Sebastian Ventura, Data mining in education, WIREs Data Mining Knowl Discovery, vol 3, pp 12–27, 2013 [5] Facilitators notes – Guide to AUN-QA Assessment at Programme Level, Version 3, [6] PDCA, https://en.wikipedia.org/wiki/PDCA Truy cập ngày 14/01/2019 [7] Ian H Witten, Eibe Frank, Data mining – Practical Machine Learning Tools and Techniques, Morgan Kaufman, 2005 [8] https://en.wikipedia.org/wiki/Pearson_correlation_coefficient Truy cập ngày 16/02/2019 [9] Nguyễn Hà Nam, Nguyễn Trí Thành, Hà Quang Thụy, Giáo trình Khai phá liệu, NXB ĐHQG Hà Nội, 2013 [10] K.Sutha, J Jebamalar Tamilselvi, A Review of Feature Selection Algorithms for Data Mining Techniques, International Journal on Computer Science and Engineering (IJCSE), page: 63-67 (2015), ISSN: 0975-3397 [11] Gnanambal S, Thangaraj M, Meenatchi V.T, Gayathri V, Classification Algorithms with Attribute Selection: an evaluation study using WEKA, Int J Advanced Networking and Applications, Volume: 09 Issue: 06 Pages: 3640-3644 (2018) ISSN: 0975-0290 [12] Weka 3, https://www.cs.waikato.ac.nz/ml Truy cập ngày 10/12/2018 29 [13] http://weka.sourceforge.net/doc.dev/weka/attributeSelection/GainRatioAttributeEval html Truy cập ngày 10/01/2019 [14] http://weka.sourceforge.net/doc.stable/weka/attributeSelection/InfoGainAttributeEval html Truy cập ngày 10/01/2019 [15] Robert C Holte, Very Simple Classification Rules Perform Well on Most Commonly Used Datasets, Machine Learning, 11, 63-91 (1993) [16] Hoàng Mạnh Dũng, Hoàng Thị Thanh Nhàn, Đo lƣờng hài lịng sinh viên hệ quy chất lƣợng đào tạo Trƣờng Đại học Thủ Dầu Một - năm 2017, Tạp chí Đại học Thủ Dầu Một, số 36 (2018), trang 99-107, ISSN: 1859-4433 [17] http://kdientu.duytan.edu.vn/media/50176/ly-thuyet-mang-neural.pdf Truy cập ngày 13/01/2019 30 ... TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT NGUYỄN THẾ BẢO PHÂN TÍCH YẾU TỐ ẢNH HƯỞNG QUAN TRỌNG ĐẾN NÂNG CAO CHẤT LƯỢNG GIẢNG DẠY BẰNG DATA MINING – ÁP DỤNG VỚI DỮ LIỆU TẠI KHOA KỸ THUẬT – CÔNG NGHỆ TRƯỜNG ĐẠI... Khoa Kỹ thuật Công nghệ, Trƣờng Đại học Thủ Dầu Một Các yếu tố từ kết phân tích hồn tồn phù hợp với tình hình thực tế Khoa Khoa Kỹ thuật Công nghệ, Trƣờng Đại học Thủ Dầu Một Khi giảng viên lên lớp... xác định yếu tố ảnh hƣởng quan trọng đến kết học tập sinh viên nhóm ngành Cơng nghệ thơng tin (Kỹ thuật Phần mềm Hệ thống Thông tin) Khoa Kỹ thuật Công nghệ, Trƣờng Đại học Thủ Dầu Một 1.4 Đối