Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên

78 0 0
Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ CÔNG THƯƠNG TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH TRƯƠNG MINH TUẤN NGHIÊN CỨU MỘT SỐ THUẬT TOÁN PHÂN CỤM MỜ VÀ ỨNG DỤNG VÀO BÀI TOÁN PHÂN LOẠI SINH VIÊN Chuyên ngành: KHOA HỌC MÁY TÍNH Mã chuyên ngành: 60480101 LUẬN VĂN THẠC SĨ THÀNH PHỐ HỒ CHÍ MINH, NĂM 2021 Cơng trình hồn thành Trường Đại học Cơng nghiệp TP Hồ Chí Minh Người hướng dẫn khoa học: Tiến sĩ Đặng Quang Vinh Luận văn thạc sĩ bảo vệ Hội đồng chấm bảo vệ Luận văn thạc sĩ Trường Đại học Cơng nghiệp thành phố Hồ Chí Minh ngày 18 tháng 11 năm 2021 Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: PGS.TS Huỳnh Trung Hiếu - Chủ tịch Hội đồng PGS.TS Nguyễn Hoà - Phản biện TS Lê Thành Sách - Phản biện TS Lê Nhật Duy - Ủy viên TS Phạm Thị Thiết - Thư ký (Ghi rõ họ, tên, học hàm, học vị Hội đồng chấm bảo vệ luận văn thạc sĩ) CHỦ TỊCH HỘI ĐỒNG TRƯỞNG KHOA CÔNG NGHỆ THÔNG TIN BỘ CÔNG THƯƠNG TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH CỘNG HỊA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: Trương Minh Tuấn MSHV: 18104761 Ngày, tháng, năm sinh: 29/09/1987 Nơi sinh: Long An Chuyên ngành: Khoa học máy tính Mã chuyên ngành: 60480101 I TÊN ĐỀ TÀI: Nghiên cứu mợt số thuật tốn phân cụm mờ ứng dụng vào toán phân loại sinh viên NHIỆM VỤ VÀ NỘI DUNG: - Nghiên cứu phương pháp phân cụm với thuật toán K-Means, thuật toán FCM (Fuzzy C-means, thuật tốn εFCM (ε Insensitive Fuzzy C-means) - Áp dụng mơ hình phân cụm để giải tốn phân loại kết học tập sinh viên trường Cao đẳng Y tế Đồng Tháp II NGÀY GIAO NHIỆM VỤ: 29/12/2020 III NGÀY HOÀN THÀNH NHIỆM VỤ: 20/10/2021 IV NGƯỜI HƯỚNG DẪN KHOA HỌC: Tiến sĩ Đặng Quang Vinh Tp Hồ Chí Minh, ngày … tháng … năm 2021 NGƯỜI HƯỚNG DẪN CHỦ NHIỆM BỘ MÔN ĐÀO TẠO Ts Đặng Quang Vinh TRƯỞNG KHOA CÔNG NGHỆ THÔNG TIN LỜI CẢM ƠN Để hoàn thành luận văn này, nỗ lực cá nhân, em xin chân thành cảm ơn quý Thầy cô Khoa Công nghệ thông tin, trường Đại học Cơng nghiệp TPHCM tận tình giảng dạy, trang bị cho em kiến thức quý báo chương trình đào tạo Cao học Đặc biệt, em xin bày tỏ lòng biết ơn chân thành đến Thầy Tiến sĩ Đặng Quang Vinh – người trực tiếp hướng dẫn em Nhờ định hướng đắng từ đầu Thầy nên em hồn thành luận văn cao học Ngồi ra, em xin chân thành cảm ơn TS Lê Nhật Duy – Phó trưởng khoa Công nghệ thông tin hướng dẫn giúp đỡ em trình học tập quy trình, biểu mẫu để hồn thành luận văn này, từ bắt đầu đăng ký đề cương đến bảo vệ luận văn Em xin cám ơn đến Trường Cao đẳng Y tế Đồng Tháp tạo điều kiện tốt nhất việc sử dụng liệu nhà trường cho mục đích nghiên cứu luận văn này, đồng thời vừa giúp em vừa hồn thành cơng việc quan, vừa học tập, nghiên cứu hồn thành chương trình cao học Và cuối cùng, em xin chân thành cảm ơn động viên từ gia đình, bạn bè đặc biệt chia sẽ, thấu hiểu từ vợ Lê Thị Huỳnh Anh để em tập trung hồn thành khố học làm tốt nghiên cứu luận văn Một lần nữa, xin trân trọng cảm ơn! i TÓM TẮT LUẬN VĂN THẠC SĨ Đánh giá kết học tập phân loại sinh viên một vấn đề quan trọng q trình đào tạo mơi trường giáo dục Hiện quy định Bộ Lao động Thương binh – Xã hội [1] xếp loại học lực rèn luyện sinh viên dựa theo thang điểm cứng, kết học tập sở đào tạo, đối tượng sinh viên khác mợt trường đào tạo thường có khác biệt chủ quan đánh giá kết học tập học phần, module Do đó, nhà trường cần có mợt cơng cụ xếp loại mềm, sử dụng nhiều tiêu chí đánh giá cơng cụ để so sánh, điều chỉnh kết phân loại học tập sinh viên theo nhóm đối tượng khác nhau, điều giúp cho Nhà trường, nhà tuyển dụng dễ dàng việc giới thiệu ứng cử viên sau khoá học Đây mục tiêu kiểm định chất lượng đào tạo, hướng đến nhà trường số hố quy trình đánh giá chất lượng kết đào tạo một cách rõ ràng, công tâm đặc biệt nâng cao chất lượng dạy học, kết hợp vận dụng Y đức sau sinh viên tốt nghiệp Tác giả bước cài đặt thuật toán phân cụm K-mean, phân cụm Fuzzy C-mean (FCM) [2], phân cụm ε Insensitive Fuzzy C-Means (εFCM) để kiểm tra kết so sánh với 15 tập liệu xuất bao gồm hệ cao đẳng quy ngành Dược học, Điều dưỡng, Kỹ thuật xét nghiệm, Phục hồi chức năng, hệ cao đẳng liên thông ngành Dược học, Điều dưỡng, Hộ sinh hệ trung cấp Y sỹ quy quốc tế Campuchia Từ kết thu được, tác giả thực biễu mẫu để so sánh kết cụ thể từ quy chế cứng Bộ thông qua thuật toán phân cụm cài đặt ii LỜI CAM ĐOAN Tơi xin cam đoan cơng trình nghiên cứu thân Những kết nghiên cứu, phân tích kết luận luận văn hồn tồn trung thực khơng chép từ bất kỳ mợt nguồn hay bất kỳ hình thức Việc tham khảo nguồn tài liệu (nếu có) thực trích dẫn ghi nguồn tài liệu tham khảo quy định Học viên Trương Minh Tuấn iii MỤC LỤC LỜI CAM ĐOAN iii MỤC LỤC iv DANH MỤC HÌNH ẢNH vii DANH MỤC BẢNG BIỂU ix DANH MỤC TỪ VIẾT TẮT xi MỞ ĐẦU 1 Đặt vấn đề .1 Mục tiêu nghiên cứu Đối tượng phạm vi nghiên cứu Cách tiếp cận phương pháp nghiên cứu .3 Ý nghĩa thực tiễn đề tài .4 CHƯƠNG TỔNG QUAN VỀ LĨNH VỰC NGHIÊN CỨU 1.1 Tổng quan đề tài 1.2 Tổng quan nghiệp vụ xếp loại sinh viên 1.2.1 Cách tính điểm kết học tập học kỳ/năm học/khoá học 1.2.2 Cách quy đổi điểm kết học tập học kỳ/năm học/khoá học 1.2.3 Xếp loại tốt nghiệp .9 1.3 Các hướng tiếp cận .9 1.4 Khó khăn thách thức 10 1.5 Đề xuất hướng giải 10 1.6 Bố cục luận văn 11 CHƯƠNG CƠ SỞ LÝ THUYẾT 12 2.1 Tổng quan khai phá liệu: 12 2.1.1 Giới thiệu khai phá liệu .12 2.1.2 Quá trình khám phá tri thức 12 2.1.3 Các giai đoạn trình khai phá liệu 13 2.1.4 Các phương pháp khai phá liệu 14 2.1.5 Các hướng tiếp cận kỹ thuật áp dụng .14 iv 2.1.6 Các thách thức khó khăn KPTT KPDL 15 2.1.7 Kết luận 15 2.2 Tổng quan phân cụm liệu .15 2.2.1 Các khái niệm 15 2.2.2 Các ứng dụng phân cụm 16 2.2.3 Những kỹ thuật tiếp cận phân cụm liệu .17 2.3 Kỹ thuật phân cụm liệu mờ 17 2.3.1 Giới thiệu phân cụm mờ 17 2.3.2 Lý thuyết gom cụm (Clustering): .19 2.3.3 Thuật toán K-Means: 19 2.3.4 Thuật toán FCM (Fuzzy C-Means): 21 2.3.5 Thuật toán 𝜺FCM (𝜺 −Insensitive Fuzzy C-Means) 22 CHƯƠNG ÁP DỤNG KẾT QUẢ NGHIÊN CỨU 24 3.1 Cách tổ chức thực nghiệm 24 3.2 Chuẩn bị cài đặt thực nghiệm: 26 3.3 Thực nghiệm với tập liệu đánh giá kết quả: 28 3.3.1 Thực nghiệm với liệu CĐCQ Dược học khoá 28 3.3.2 Thực nghiệm với liệu CĐCQ Điều dưỡng khoá 30 3.3.3 Thực nghiệm với liệu CĐCQ Kỹ thuật xét nghiệm khoá 32 3.3.4 Thực nghiệm với liệu CĐCQ Phục hồi chức khoá 34 3.3.5 Thực nghiệm với liệu CĐCQ Dược học khoá 36 3.3.6 Thực nghiệm với liệu CĐCQ Điều dưỡng khoá 38 3.3.7 Thực nghiệm với liệu CĐCQ Kỹ thuật xét nghiệm khoá 40 3.3.8 Thực nghiệm với liệu CĐCQ Phục hồi chức khoá 42 3.3.9 Thực nghiệm với liệu CĐLT Dược học khoá 44 3.3.10 Thực nghiệm với liệu CĐLT Điều dưỡng khoá .46 3.3.11 Thực nghiệm với liệu CĐLT Hợ sinh khố 48 3.3.12 Thực nghiệm với liệu CĐLT Dược học khoá 50 3.3.13 Thực nghiệm với liệu CĐLT Điều dưỡng khoá 52 3.3.14 Thực nghiệm với liệu CĐLT Hợ sinh khố 54 v 3.3.15 Thực nghiệm với liệu TCCQ Y sỹ khoá Campuchia .56 3.4 Bàn luận thực nghiệm .58 KẾT LUẬN VÀ KIẾN NGHỊ 59 DANH MỤC CƠNG TRÌNH ĐÃ CÔNG BỐ CỦA HỌC VIÊN 61 TÀI LIỆU THAM KHẢO 62 LÝ LỊCH TRÍCH NGANG CỦA HỌC VIÊN 64 vi DANH MỤC HÌNH ẢNH Hình 2.1 Q trình khám phá tri thức .12 Hình 2.2 Quá trình khai phá liệu 13 Hình 2.3 Mơ tả tập liệu phân thành cụm 16 Hình 2.4 Minh hoạ khái niệm gọm cụm 19 Hình 3.1 Mơ hình sở liệu quan hệ phần mềm 24 Hình 3.2 Tập liệu sau xử lý 26 Hình 3.3 Data Visualization Kmean với liệu CĐCQ Dược học khoá 28 Hình 3.4 Data Visualization FCM với liệu CĐCQ Dược học khố 28 Hình 3.5 Data Visualization εFCM với liệu CĐCQ Dược học khoá 28 Hình 3.6 Data Visualization Kmean với liệu CĐCQ Điều dưỡng khố 30 Hình 3.7 Data Visualization FCM với liệu CĐCQ Điều dưỡng khoá 30 Hình 3.8 Data Visualization εFCM với liệu CĐCQ Điều dưỡng khố 30 Hình 3.9 Data Visualization Kmean với liệu CĐCQ KTXN khoá 32 Hình 3.10 Data Visualization FCM với liệu CĐCQ KTXN khố 32 Hình 3.11 Data Visualization εFCM với liệu CĐCQ KTXN khoá 32 Hình 3.12 Data Visualization Kmean với liệu CĐCQ PHCN khố 34 Hình 3.13 Data Visualization FCM với liệu CĐCQ PHCN khoá 34 Hình 3.14 Data Visualization εFCM với liệu CĐCQ PHCN khố 34 Hình 3.15 Data Visualization Kmean với liệu CĐCQ Dược học khoá 36 Hình 3.16 Data Visualization FCM với liệu CĐCQ Dược học khố .36 Hình 3.17 Data Visualization εFCM với liệu CĐCQ Dược học khoá .36 Hình 3.18 Data Visualization Kmean với liệu CĐCQ Điều dưỡng khố 38 Hình 3.19 Data Visualization FCM với liệu CĐCQ Điều dưỡng khoá 38 Hình 3.20 Data Visualization εFCM với liệu CĐCQ Điều dưỡng khố 38 Hình 3.21 Data Visualization Kmean với liệu CĐCQ KTXN khoá 40 Hình 3.22 Data Visualization FCM với liệu CĐCQ KTXN khố 40 Hình 3.23 Data Visualization εFCM với liệu CĐCQ KTXN khoá 40 Hình 3.24 Data Visualization Kmean với liệu CĐCQ PHCN khoá 42 vii 3.3.12 Thực nghiệm với liệu CĐLT Dược học khoá 3.3.12.1 Data Visualization với thuật toán Kmean Chọn 60 sinh viên (n=60), có 26 features, phân vào cụm (k=4) Thuật tốn PCA Thuật tốn t-SNE Thuật tốn ISOMAP Hình 3.36 Data Visualization Kmean với liệu CĐLT Dược học khoá 3.3.12.2 Data Visualization với thuật toán FCM Với tham số mũ m=1.1, chọn 60 sinh viên (n=60), có 26 features, phân vào cụm (c=4) Thuật toán PCA Thuật tốn t-SNE Thuật tốn ISOMAP Hình 3.37 Data Visualization FCM với liệu CĐLT Dược học khoá 3.3.12.3 Data Visualization với thuật toán εFCM Với tham số mũ m=1.1, tiêu chuẩn hội tụ (epsilon)=1.2, chọn 60 sinh viên (n=60), có 26 features, phân vào cụm (c=4) Thuật tốn PCA Thuật tốn t-SNE Thuật tốn ISOMAP Hình 3.38 Data Visualization εFCM với liệu CĐLT Dược học khoá 50 3.3.12.4 Đánh giá kết với liệu CĐLT Dược học khoá  Dùng phương pháp đánh giá Confusion Matrix cho thuật toán Thuật toán Kmean Thuật toán FCM Thuật toán εFCM Bảng 3.24 Ghi nhận kết với liệu CĐLT Dược học khoá Thuật toán Kmean Nội dung Thuật toán dự báo nhóm kết tương ứng bao gồm: group đạt 18 sinh viên, group đạt 21 sinh viên, group đạt sinh viên, group đạt 20 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng FCM Thuật tốn dự báo nhóm kết tương ứng bao gồm: group đạt 11 sinh viên, group đạt 11 sinh viên, group đạt 20 sinh viên, group đạt 18 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng εFCM Thuật tốn dự báo nhóm kết tương ứng bao gồm: group đạt 17 sinh viên, group đạt 17 sinh viên, group đạt 13 sinh viên, group đạt 13 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động Bảng 3.25 Kết phân loại với liệu CĐLT Dược học khoá Kmean FCM εFCM Mean 0.10 21.60 24.63 Std 0.14 0.40 0.99 Accuracy 0.05 0.33 0.22 51 3.3.13 Thực nghiệm với liệu CĐLT Điều dưỡng khoá 3.3.13.1 Data Visualization với thuật toán Kmean Chọn 142 sinh viên (n=142), có 29 features, phân vào cụm (k=4) Thuật toán PCA Thuật toán t-SNE Thuật toán ISOMAP Hình 3.39 Data Visualization Kmean với liệu CĐLT Điều dưỡng khoá 3.3.13.2 Data Visualization với thuật toán FCM Với tham số mũ m=1.7, chọn 142 sinh viên (n=142), có 29 features, phân vào cụm (c=4) Thuật tốn PCA Thuật tốn t-SNE Thuật tốn ISOMAP Hình 3.40 Data Visualization FCM với liệu CĐLT Điều dưỡng khoá 3.3.13.3 Data Visualization với thuật toán εFCM Với tham số mũ m=1.7, tiêu chuẩn hội tụ (epsilon)=1.2, chọn 142 sinh viên (n=142), có 29 features, phân vào cụm (c=4) Thuật toán PCA Thuật toán t-SNE Thuật tốn ISOMAP Hình 3.41 Data Visualization εFCM với liệu CĐLT Điều dưỡng khoá 52 3.3.13.4 Đánh giá kết với liệu CĐLT Điều dưỡng khoá  Dùng phương pháp đánh giá Confusion Matrix cho thuật toán Thuật toán Kmean Thuật toán FCM Thuật toán εFCM Bảng 3.26 Ghi nhận kết với liệu CĐLT Điều dưỡng khoá Thuật toán Nội dung Thuật tốn dự báo nhóm kết tương ứng bao gồm: group Kmean đạt 52 sinh viên, group đạt 37 sinh viên, group đạt sinh viên, group đạt 50 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng Thuật tốn dự báo nhóm kết tương ứng bao gồm: group FCM đạt 35 sinh viên, group đạt 37 sinh viên, group đạt 40 sinh viên, group đạt 30 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng εFCM Thuật tốn dự báo nhóm kết tương ứng bao gồm: group đạt 38 sinh viên, group đạt 38 sinh viên, group đạt 30 sinh viên, group đạt 36 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động Bảng 3.27 Kết phân loại với liệu CĐLT Điều dưỡng khoá Kmean FCM εFCM Mean 0.27 22.04 25.44 Std 0.10 4.23 7.51 Accuracy 0.16 0.30 0.25 53 3.3.14 Thực nghiệm với liệu CĐLT Hộ sinh khoá 3.3.14.1 Data Visualization với thuật toán Kmean Chọn 73 sinh viên (n=73), có 30 features, phân vào cụm (k=4) Thuật toán PCA Thuật toán t-SNE Thuật tốn ISOMAP Hình 3.42 Data Visualization Kmean với liệu CĐLT Hợ sinh khố 3.3.14.2 Data Visualization với thuật toán FCM Với tham số mũ m=1.1, chọn 73 sinh viên (n=73), có 30 features, phân vào cụm (c=4) Thuật toán PCA Thuật toán t-SNE Thuật tốn ISOMAP Hình 3.43 Data Visualization FCM với liệu CĐLT Hợ sinh khố 3.3.14.3 Data Visualization với thuật tốn εFCM Với tham số mũ m=1.1, tiêu chuẩn hợi tụ (epsilon)=1.2, chọn 73 sinh viên (n=73), có 30 features, phân vào cụm (c=4) Thuật toán PCA Thuật tốn t-SNE Thuật tốn ISOMAP Hình 3.44 Data Visualization εFCM với liệu CĐLT Hợ sinh khố 54 3.3.14.4 Đánh giá kết với liệu CĐLT Hộ sinh khoá  Dùng phương pháp đánh giá Confusion Matrix cho thuật toán Thuật toán Kmean Thuật toán FCM Thuật toán εFCM Bảng 3.28 Ghi nhận kết với liệu CĐLT Hợ sinh khố Thuật tốn Nội dung Kmean Thuật tốn dự báo nhóm kết tương ứng bao gồm: group đạt 22 sinh viên, group đạt 26 sinh viên, group đạt 13 sinh viên, group đạt 12 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động FCM Thuật tốn dự báo nhóm kết tương ứng bao gồm: group đạt 19 sinh viên, group đạt 19 sinh viên, group đạt 16 sinh viên, group đạt 19 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động εFCM Thuật tốn dự báo nhóm kết tương ứng bao gồm: group đạt 22 sinh viên, group đạt 19 sinh viên, group đạt 12 sinh viên, group đạt 20 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động Bảng 3.29 Kết phân loại với liệu CĐLT Hợ sinh khố Kmean FCM εFCM Mean 0.28 25.95 31.07 Std 0.15 0.77 1.19 Accuracy 0.25 0.26 0.18 55 3.3.15 Thực nghiệm với liệu TCCQ Y sỹ khoá Campuchia 3.3.15.1 Data Visualization với thuật toán Kmean Chọn 79 sinh viên (n=79), có 15 features, phân vào cụm (k=4) Thuật tốn PCA Thuật tốn t-SNE Thuật tốn ISOMAP Hình 3.45 Data Visualization Kmean với liệu TCCQ Y sỹ khoá Campuchia 3.3.15.2 Data Visualization với thuật toán FCM Với tham số mũ m=1.1, chọn 79 sinh viên (n=79), có 15 features, phân vào cụm (c=4) Thuật toán PCA Thuật tốn t-SNE Thuật tốn ISOMAP Hình 3.46 Data Visualization FCM với liệu TCCQ Y sỹ khoá Campuchia 3.3.15.3 Data Visualization với thuật toán εFCM Với tham số mũ m=1.1, tiêu chuẩn hội tụ (epsilon)=1.2, chọn 79 sinh viên (n=79), có 15 features, phân vào cụm (c=4) Thuật toán PCA Thuật toán t-SNE Thuật toán ISOMAP Hình 3.47 Data Visualization εFCM với liệu TCCQ Y sỹ khoá Campuchia 56 3.3.15.4 Đánh giá kết với liệu TCCQ Y sỹ khoá Campuchia  Dùng phương pháp đánh giá Confusion Matrix cho thuật toán Thuật toán Kmean Thuật toán FCM Thuật toán εFCM Bảng 3.30 Ghi nhận kết với liệu TCCQ Y sỹ khoá Campuchia Thuật toán Kmean Nội dung Thuật tốn dự báo nhóm kết tương ứng bao gồm: group đạt 19 sinh viên, group đạt 21 sinh viên, group đạt 20 sinh viên, group đạt 19 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động Thuật tốn dự báo nhóm kết tương ứng bao gồm: group FCM đạt 20 sinh viên, group đạt 22 sinh viên, group đạt 22 sinh viên, group đạt 15 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng εFCM Thuật tốn dự báo nhóm kết tương ứng bao gồm: group đạt 14 sinh viên, group đạt 22 sinh viên, group đạt 24 sinh viên, group đạt 19 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động Bảng 3.31 Kết phân loại với liệu TCCQ Y sỹ khoá Campuchia Kmean FCM εFCM Mean 0.24 27.21 29.89 Std 0.08 2.81 1.72 Accuracy 0.24 0.33 0.32 57 3.4 Bàn luận thực nghiệm Thơng qua kết học tập cuối khố từ 15 tập liệu kết xuất từ trường CĐYT Đồng Tháp, tác giả nhận thấy kết học tập sinh viên không kết xếp loại, cụ thể lớp Cao đẳng quy khố có 0.74% loại X́t sắc, 5.64% loại Giỏi, loại Khá 52.21%, loại Trung bình 41.42%; Cao đẳng quy khố có 0.27% loại X́t sắc, 3.75% loại Giỏi, 68.63% loại Khá 27.35% loại Trung bình; Trong lớp Cao đẳng liên thơng tỷ lệ xếp loại Xuất sắc, Giỏi tương ứng 4.36% 44.73%; loại Khá đạt 68.63%, trung bình đạt 3.64% Thơng qua số liệu từ phần mềm có kết học tập sinh viên không từ hệ quy liên thơng; vấn đề đặt lên hàng đầu cho nhà trường để cải thiện chất lượng đào tạo đánh giá kết đào tạo thơng qua khố sau tốt nghiệp, mục tiêu hướng đến đơn vị sử dụng lao động chất lượng cao mang đến trải nghiệm tốt nhất cho sinh viên sau tốt nghiệp Và chương này, tác giả dùng thuật toán cụ thể Kmean, FCM, εFCM để thực nghiệm việc đánh giá kết học tập sinh viên để gom kết học tập theo nhóm khác bước đầu cho thấy thuật toán phân sinh viên vào cụm khác theo kết group1, group2, group3, group4 Các kết từ nhóm phân loại điều kiện để nhà trường chọn lọc nhóm ưu tú nhất, đạt kết cao nhất để gửi đến nhà tuyển dụng lao động Kết không giúp cho nhà trường nhìn nhận việc đưa ứng viên đến người sử dụng lao đợng theo cảm tính, mà cịn rất minh bạch, công tâm cho tất sinh viên học trường Trong trình thực nghiệm, tác giả lựa chọn tham số mũ (m) 1.7 có thay đổi tham số mũ 1.1 tập khác tác giả mong muốn kết dự báo giải thuật đạt hiệu tối ưu nhất Qua việc phân nhóm sinh viên theo kết điểm đạt hiệu cho tất tập liệu; tiền đề cho việc lựa chọn ứng viên tiềm thời buổi cạnh tranh việc làm nay, đặc biệt ngành Y tế chất lượng kể y đức đặt lên hàng đầu 58 KẾT LUẬN VÀ KIẾN NGHỊ Kết luận Trong nghiên cứu này, một phương pháp xếp loại học tập sinh viên thực mơ hình mới, thay mơ hình theo thang điểm cứng trước Tuy nhiên, tác giả giữ tồn bợ kết học tập theo quy định Nhà trường, đưa kết song song để gợi ý cho nhà trường có chọn lọc cụ thể để giới thiệu đến đơn vị sử dụng lao đợng Qua đó, nhà trường có nhìn tổng quát trình đào tạo xây dựng hệ thống kiểm định chất lượng đào tạo tạo tốt để làm tiền đề cho việc phân loại sinh viên trình học tập trường giai đoạn hợi nhập quốc tế ASEAN với nhóm sinh viên chất lượng cao nhóm sinh viên lại phục vụ tỉnh nước Trong trình thực nghiệm với 15 tập liệu kết trên, tác giả chọn ngành Điều dưỡng khoá để so sánh ngẫu nhiên với kết sinh viên sau tốt nghiệp kết dự báo từ thuật toán mang lại hiệu mong đợi, cụ thể số lượng sinh viên tham gia việc làm đạt khoảng 60% kết dự báo giải thuật; kết khả quan cho nghiên cứu Tuy nhiên, tác giả sử dụng mợt tập ngẫu nhiên chưa đánh giá hết hiệu tập liệu khác Đây bước đột phá nhà trường việc ứng dụng Công nghệ thông tin để giải tốn cải cách hành Trường CĐYT Đồng Tháp điều kiện để nâng cấp phần mềm Quản lý Đào tạo trường lên mợt mức cao vừa hỗ trợ cho nhà trường, vừa giúp cho đơn vị ngành giải toán sinh viên chất lượng cao nay, đồng thời mục tiêu ứng dụng CNTT cho việc chuyển đổi số nhà trường giai đoạn 2021 – 2025 tầm nhìn 2030 tiến đến trở thành trường đào tạo chất lượng cao khu vực Mekong 59 Hướng phát triển Thông qua việc áp dụng thuật toán, tác giả kết phân cụm theo nhóm dựa tập liệu từ hệ thống phần mềm sẵn Tuy nhiên với nghiên cứu này, tác giả áp dụng cho khoá đào tạo trường, loại bỏ tḥc tính kết học tập khơng nằm nội dung nghiên cứu Trên thực tế việc đánh giá xếp loại học tập dựa vào rất nhiều yếu tố hệ số tín chỉ, học phần dễ, khó, giảng viên dễ, khó khác nhau, việc dẫn đến kết điểm số học phần khác Việc làm cho kết phân cụm nghiên cứu bị ảnh hưởng, ra, thuật toán phân cụm, tác giả dừng lại việc sử dụng toán Fuzzy C-Means áp dụng tiêu chuẩn hội tụ (epsilon); thực tế, thực phân cụm cịn nhiều khó khăn phức tạp đa dạng liệu, kích thước liệu, nhiều loại tḥc tính khác nhau…và để khắc phục việc mợt kỹ thuật nghiên cứu Fuzzy C-means cải tiến, dùng phương pháp nhân qua việc biến đổi liệu đầu vào thông qua một hàm nhân phi tuyến thành một không gian liệu mà phân cụm liệu thực tuyến tính dễ dàng Từ kết đạt nghiên cứu, tác giả đề x́t mợt số hướng khả thi để hồn thiện nghiên cứu tương lai Thứ nhất nên áp dụng đa dạng hoá kết học tập sinh viên bao gồm kết kiểm tra thường kỳ, điểm thi kết thúc học phần áp dụng cho các khối ngành học nhà trường, mục tiêu có nhìn tổng quan để thay đổi chương trình kiểm định chất lượng đào tạo hàng năm khơng thể tính tốn khố học kết thúc Thứ hai, tác giả nghiên cứu xây dựng thành một ứng dụng cụ thể theo dạng realtime để lãnh đạo nhà trường theo dõi, kiểm tra có số liệu cụ thể bất kỳ thời điểm nào; đặc biệt trình ký kết hợp tác nhà trường đối tác doanh nghiệp nước 60 DANH MỤC CƠNG TRÌNH ĐÃ CƠNG BỐ CỦA HỌC VIÊN [1] Quang-Vinh Dang, Minh-Tuan Truong and M -H Huynh ""Studying the Fuzzy Clustering Methods to Understand Employee Performance," presen at the 2021 4th International Conference on Artificial Intelligence and Big Data (ICAIBD), pp 541-544 doi: 10.1109/ICAIBD51990.2021.9459054," 2021 [2] Minh-Tuan Truong and Quang-Vinh Dang "Digital Signatures using Hardware Security Modules for Electronic Bills in Vietnam: Open Problems and Research Directions," In Proceedings of the 7th International Conference, CCIS 1306, Springer Verlag Internet: https://link.springer.com/chapter/10.1007/978-98133," 2020 61 TÀI LIỆU THAM KHẢO [1] Bộ Lao động - Thương binh Xã hội "Thông tư quy định việc tổ chức thực chương trình đào tạo trình đợ trung cấp, trình đợ cao đẳng theo niên chế theo phương thức tích lũy mơ-đun tín chỉ; quy chế kiểm tra, thi, xét cơng nhận tốt nghiệp." Số 09/2017/TT-BLĐTBXH, 2017 [2] Bezdek et al "The fuzzy c-means clustering algorithm," Computers & Geosciences Vol 10, no 2-3, pp 191-203, U.S.A: Pergamon Press Ltd, 1984 [3] B K a E Vityaev Data mining for financial applications Data Mining and Knowledge Discovery Handbook, pp 1203–1224, Springer, 2005 [4] W Raghupathi “Data mining in healthcare,” Healthcare Informatics: Improving Efficiency through Technology, Analytics, and Management Pp 353–372, 2016 [5] P G a S Figini Applied data mining for business and industry Wiley, 2009 [6] C R a S Ventura "Data mining in education,” Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery Vol 3, no 1, pp 12–27, 2013 [7] R D A.K Jain Algorithms for clustering data Ptentice Hall, Englewood Cliffs, NJ, 1988 [8] M Windham “Cluster validity for fuzzy clustering algorithms,” Fuzzy Sets and System Vol 3, pp 177-183, 1981 [9] P A Pantel "Clustering by Committee," Canada: Thesis Doctor of Philosophy, University of Alberta, pp 15-25, 2003 [10] E W Forgy, “Cluster analysis of multivariate data: efficiency versus interpretability of classifications,” Biometrics Vol 21, pp 768–769, 1965 [11] M J Z a W M Jr Data Mining and Machine Learning: Fundamental 62 Concepts and Algorithms Cambridge University Press, 2019 [12] K Zalik "Cluster validity index for estimation of fuzzy clusters of different sizes and densities," Pattern Recognition Vol 43, pp 3374-3390, 2010 [13] W.Pedrycz “Algorithms of fuzzy clustering with partial supervision,” Pattern Recognition Vol 23, pp.121-146, 1990 [14] Y Z W Wang "On fuzzy cluster validity indices," ScienceDirect Vol 158, pp 2095 -2117, 2007 [15] J B MacQueen "Some Methods for classification and Analysis of Multivariate Observations," present at The Proc 5th Berkeley Symp Math Stat Probab, 1967 [16] R E.H A new approach to clustering Information and Control, 1969 [17] Dunn "A fuzzy relative of the isodata process and its use in detecting compact well-separated clusters," J Cybern Pp 32–57, 1973 [18] A Arning et al "Linear method for deviation detection in large databases," present at The 1996 Int Conf Data Mining and Knowledge Discovery (KDD’96), pp 164–169, Portland, Oregon, Aug 1996 [19] J H a M Kember Data Mining Concept and Techniques (Second Edition), 2011 [20] M J N K P A M Krishna Kant Singh "A Fuzzy Kohonen Local Information C-Means Clustering for Remote Sensing Imagery,” IETE Technical Review Vol 31, Issue 1, 2014, pp 75-81, 2014 [21] R J a M.-R G.Bueno "“Fuzzy colour C-means clustering for pattern segmentation in histological images,” present at The 3rd European Medical and Biological Engineering Conference, 2005 63 LÝ LỊCH TRÍCH NGANG CỦA HỌC VIÊN I LÝ LỊCH SƠ LƯỢC Họ tên: Trương Minh Tuấn Giới tính: Nam Ngày, tháng năm sinh: 29/09/1987 Nơi sinh: Long An Email: tieudinhtuan@gmail.com Điện thoại: 0942999871 II QUÁ TRÌNH ĐÀO TẠO Từ năm 2005 đến 2008: học Cao đẳng Công nghệ thông tin trường Đại học Sư phạm Đồng Tháp Từ năm 2009 đến 2011: học liên thông Đại học Khoa học máy tính trường Đại học Đồng Tháp Từ năm 2018 đến 2020: học cao học Khoa học máy tính Đại học Cơng nghiệp Thành phố Hồ Chí Minh III Q TRÌNH CƠNG TÁC CHUN MƠN Thời gian Nơi công tác Công việc đảm nhiệm 2006 – 2008 Cơng ty Thiên Trúc Lập trình phần mềm Trường Cao đẳng Y tế 2008 – Đồng Tháp Quản trị sở liệu, phát triển hệ thống quản lý đào tạo học trực tuyến trường Tp.HCM, ngày 20 tháng 10 năm 2021 Người khai Trương Minh Tuấn 64

Ngày đăng: 19/05/2023, 22:38

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan