Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

41 3 0
Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

24 CHƯƠNG 3 ÁP DỤNG KẾT QUẢ NGHIÊN CỨU Trong phần này, tác giả tiến hành thực nghiệm ứng dụng với dữ liệu trên phần mềm quản lý đào tạo tại trường CĐYT Đồng Tháp để đánh giá và so sánh các kết quả học tập của sinh viên theo quy định của Bộ và các thuật toán phân cụm 3 1 Cách tổ chức thực nghiệm Dữ liệu được trích xuất từ cơ sở dữ liệu của hệ thống quản lý đào tạo tại trường CĐYT Đồng Tháp, bao gồm toàn bộ KQHT sinh viên cao đẳng chính quy khóa 6, 7 ngành Dược học, Điều dưỡng, Kỹ thuật xét ngh.

CHƯƠNG ÁP DỤNG KẾT QUẢ NGHIÊN CỨU Trong phần này, tác giả tiến hành thực nghiệm ứng dụng với liệu phần mềm quản lý đào tạo trường CĐYT Đồng Tháp để đánh giá so sánh kết học tập sinh viên theo quy định Bợ thuật tốn phân cụm 3.1 Cách tổ chức thực nghiệm Dữ liệu trích xuất từ sở liệu hệ thống quản lý đào tạo trường CĐYT Đồng Tháp, bao gồm toàn bợ KQHT sinh viên cao đẳng quy khóa 6, ngành Dược học, Điều dưỡng, Kỹ thuật xét nghiệm, Phục hồi chức cao đẳng liên thơng khóa 4, ngành Dược học, Điều dưỡng, Hộ sinh sinh viên quy quốc tế Campuchia hệ trung cấp khóa ngành Y sỹ đa khoa, loại trừ sinh viên bảo lưu thơi học bị đình không đủ liệu học phần, không thu thập liệu học phần Giáo dục thể chất, Giáo dục quốc phịng an ninh Hình 3.1 Mơ hình sở liệu quan hệ phần mềm Thông qua việc truy vấn T-SQL trực tiếp từ CSDL tác giả nhận thấy liệu có nhiều tḥc tính để quản lý kết học tập sinh viên, tác giả tiến hành xử lý liệu thông qua bước: 24 Bước 1: Kiểm tra làm liệu, loại bỏ một số thông tin không cần thiết sinh viên nghỉ học không đủ liệu, cột mã đào tạo, mã lớp, tên lớp, ngày sinh, giới tính, học kỳ, cột kiểm tra, thi kết thúc học phần (HS1,HS2,HS3), TBCHS, điểm mười, điểm chữ, loại trường hợp điểm (F, loại yếu) thông qua câu truy vấn T-SQL Bước 2: Sau có kết liệu từ truy vấn loại bỏ mợt số tḥc tính khơng cần thiết tác giả thu tḥc tính tập liệu sau:  Tḥc tính studentID: khố để lưu trữ thơng tin sinh viên  Tḥc tính subjectID: khố để lưu trữ thơng tin học phần  Tḥc tính score4: kết điểm sinh viên  Tḥc tính result: kết học tập tồn khố học sinh viên Bước 3: Tác giả tiếp tục truy vấn để phân liệu theo điều kiện khác theo ngành học, khoá học, đối tượng sinh viên,…kết thu 15 tập liệu sau: Bảng 3.1 Bảng bộ liệu mẫu Ngành Kết truy vấn liệu Khố (dịng/cột) Hệ Cao đẳng quy khố 6, khố (Việt Nam) Dược học 2017 – 2020 / 2018 – 2021 (289,38) / (229,38) Điều dưỡng 2017 – 2020 / 2018 – 2021 (73,48) / (99,51) Kỹ thuật xét nghiệm 2017 – 2020 / 2018 – 2021 (32,45) / (25,47) Phục hồi chức 2017 – 2020 / 2018 – 2021 (14,44) / (19,42) Hệ Cao đẳng liên thông khoá 4, khoá (Việt Nam) Dược học 2017 – 2019 / 2018 – 2020 (236,26) / (60,26) Điều dưỡng 2017 – 2019 / 2018 – 2020 (180,32) / (142,29) Hộ sinh 2017 – 2019 / 2018 – 2020 (67,27) / (73,30) Hệ Trung cấp quy khố (Campuchia) Y sỹ 2018 – 2019 (79,15) 25 Bước 4: Sau đó, liệu mã hóa thành số từ 1-4 trùng với kết điểm truy vấn liệu (theo kết thang điểm 4) cột kết xếp loại mã hoá theo xếp alphabet tiến hành train với tập liệu, kết thu hình 3.2 Hình 3.2 Tập liệu sau xử lý Bước 5: Sau đó, tác giả tiếp tục loại bỏ cột studentID, result tập liệu trên, kết thu hình 3.3 3.2 Chuẩn bị cài đặt thực nghiệm: - Lựa chọn tham số mũ m=1.7 thay đổi trình thực nghiệm với tập liệu khác nhau, liệu không đồng số lượng sinh viên số features chương trình đào tạo - Tiêu chuẩn hợi tụ (epsilon)=1.2 - Số phân cụm c=4, tương ứng với nhóm kết sinh viên 26 - Thư viện cài đặt thuật tốn: dùng thư viện có sẵn: sklearn, fuzzy-c-means - Sử dụng thuật toán để trực quan hoá liệu PCA, tSNE, ISOMAP cho thuật toán tương ứng với tập liệu cụ thể Sau dùng phương pháp Confusion matrix để đánh giá kết dự báo cho thuật toán ứng với tập liệu có - Cấu hình máy tính để thực nghiệm: Hệ điều hành Window 64 bit, CPU Core i7 (2.70Ghz), Ram: 8GB, ổ cứng SSD 128GB 27 3.3 Thực nghiệm với tập liệu đánh giá kết quả: 3.3.1 Thực nghiệm với liệu CĐCQ Dược học khoá 3.3.1.1 Data Visualization với thuật toán Kmean Chọn 289 sinh viên (n=289), có 38 features, phân vào cụm (k=4) Thuật toán PCA Thuật toán t-SNE Thuật tốn ISOMAP Hình 3.3 Data Visualization Kmean với liệu CĐCQ Dược học khoá 3.3.1.2 Data Visualization với thuật toán FCM Với tham số mũ m=1.7, chọn 289 sinh viên (n=289), có 38 features, phân vào cụm (c=4) Thuật toán PCA Thuật toán t-SNE Thuật toán ISOMAP Hình 3.4 Data Visualization FCM với liệu CĐCQ Dược học khoá 3.3.1.3 Data Visualization với thuật toán εFCM Với tham số mũ m=1.7, tiêu chuẩn hội tụ (epsilon)=1.2, chọn 289 sinh viên (n=289), có 38 features, phân vào cụm (c=4) Thuật toán PCA Thuật toán t-SNE Thuật tốn ISOMAP Hình 3.5 Data Visualization εFCM với liệu CĐCQ Dược học khoá 28 3.3.1.4 Đánh giá kết với liệu CĐCQ Dược học khoá  Dùng phương pháp đánh giá Confusion Matrix cho thuật toán Thuật toán Kmean Thuật toán FCM Thuật toán εFCM Bảng 3.2 Ghi nhận kết với liệu CĐCQ Dược học khoá Thuật toán Kmean Nội dung Thuật tốn dự báo nhóm kết tương ứng bao gồm: group đạt 131 sinh viên, group đạt 127 sinh viên, group đạt 19 sinh viên, group đạt 12 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động FCM Thuật tốn dự báo nhóm kết tương ứng bao gồm: group đạt 67 sinh viên, group đạt 72 sinh viên, group đạt 78 sinh viên, group đạt 67 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng εFCM Thuật tốn dự báo nhóm kết tương ứng bao gồm: group đạt 66 sinh viên, group đạt 73 sinh viên, group đạt 75 sinh viên, group đạt 75 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động Bảng 3.3 Kết phân loại với liệu CĐCQ Dược học khoá Kmean FCM εFCM Mean 0.22 7.56 10.53 Std 0.11 4.10 1.64 Accuracy 0.10 0.27 0.28 29 3.3.2 Thực nghiệm với liệu CĐCQ Điều dưỡng khoá 3.3.2.1 Data Visualization với thuật toán Kmean Chọn 73 sinh viên (n=73), 48 features, phân vào cụm (k=4) Thuật toán PCA Thuật toán t-SNE Thuật tốn ISOMAP Hình 3.6 Data Visualization Kmean với liệu CĐCQ Điều dưỡng khoá 3.3.2.2 Data Visualization với thuật toán FCM Với tham số mũ m=1.1, chọn 73 sinh viên (n=73), có 48 features, phân vào cụm (c=4) Thuật toán PCA Thuật toán t-SNE Thuật tốn ISOMAP Hình 3.7 Data Visualization FCM với liệu CĐCQ Điều dưỡng khoá 3.3.2.3 Data Visualization với thuật tốn εFCM Với tham số mũ m=1.1, tiêu chuẩn hợi tụ (epsilon)=1.2, chọn 73 sinh viên (n=73), có 48 features, phân vào cụm (c=4) Thuật toán PCA Thuật tốn t-SNE Thuật tốn ISOMAP Hình 3.8 Data Visualization εFCM với liệu CĐCQ Điều dưỡng khoá 30 3.3.2.4 Đánh giá kết với liệu CĐCQ Điều dưỡng khoá  Dùng phương pháp đánh giá Confusion Matrix cho thuật toán Thuật toán Kmean Thuật toán FCM Thuật toán εFCM Bảng 3.4 Ghi nhận kết với liệu CĐCQ Điều dưỡng khoá Nội dung Thuật tốn Thuật tốn dự báo nhóm kết tương ứng bao gồm: group Kmean đạt 36 sinh viên, group đạt 33 sinh viên, group đạt sinh viên, group đạt sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động Thuật tốn dự báo nhóm kết tương ứng bao gồm: group FCM đạt 18 sinh viên, group đạt 16 sinh viên, group đạt 20 sinh viên, group đạt 19 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động εFCM Thuật tốn dự báo nhóm kết tương ứng bao gồm: group đạt 19 sinh viên, group đạt 18 sinh viên, group đạt sinh viên, group đạt 19 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động Bảng 3.5 Kết phân loại với liệu CĐCQ Điều dưỡng khoá Kmean FCM εFCM Mean 0.09 8.18 8.18 Std 0.09 0.23 0.23 Accuracy 0.04 0.26 0.23 31 3.3.3 Thực nghiệm với liệu CĐCQ Kỹ thuật xét nghiệm khoá 3.3.3.1 Data Visualization với thuật toán Kmean Với việc chọn 32 sinh viên (n=32), có 45 features, phân vào cụm (k=4) Thuật toán PCA Thuật toán t-SNE Thuật toán ISOMAP Hình 3.9 Data Visualization Kmean với liệu CĐCQ KTXN khoá 3.3.3.2 Data Visualization với thuật toán FCM Với tham số mũ m=1.1, chọn 32 sinh viên (n=32), có 45 features, phân vào cụm (c=4) Thuật tốn PCA Thuật tốn t-SNE Thuật tốn ISOMAP Hình 3.10 Data Visualization FCM với liệu CĐCQ KTXN khoá 3.3.3.3 Data Visualization với thuật toán εFCM Với tham số mũ m=1.1, tiêu chuẩn hội tụ (epsilon)=1.2, chọn 32 sinh viên (n=32), có 45 features, phân vào cụm (c=4) Thuật toán PCA Thuật toán t-SNE Thuật toán ISOMAP Hình 3.11 Data Visualization εFCM với liệu CĐCQ KTXN khoá 32 3.3.3.4 Đánh giá kết với liệu CĐCQ KTXN khoá  Dùng phương pháp đánh giá Confusion Matrix cho thuật toán Thuật toán Kmean Thuật toán FCM Thuật toán εFCM Bảng 3.6 Ghi nhận kết với liệu CĐCQ KTXN khoá Thuật toán Kmean Nội dung Thuật toán dự báo nhóm kết tương ứng bao gồm: group đạt sinh viên, group đạt 25 sinh viên, group đạt sinh viên, group đạt sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng FCM Thuật tốn dự báo nhóm kết tương ứng bao gồm: group đạt sinh viên, group đạt sinh viên, group đạt sinh viên, group đạt 10 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động εFCM Thuật tốn dự báo nhóm kết tương ứng bao gồm: group đạt sinh viên, group đạt 11 sinh viên, group đạt sinh viên, group đạt sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động Bảng 3.7 Kết phân loại với liệu CĐCQ KTXN khoá Kmean FCM εFCM Mean 0.29 34.28 12.28 Std 0.11 0.70 0.91 Accuracy 0.28 0.19 0.25 33 3.3.12 Thực nghiệm với liệu CĐLT Dược học khoá 3.3.12.1 Data Visualization với thuật toán Kmean Chọn 60 sinh viên (n=60), có 26 features, phân vào cụm (k=4) Thuật tốn PCA Thuật tốn t-SNE Thuật tốn ISOMAP Hình 3.36 Data Visualization Kmean với liệu CĐLT Dược học khoá 3.3.12.2 Data Visualization với thuật toán FCM Với tham số mũ m=1.1, chọn 60 sinh viên (n=60), có 26 features, phân vào cụm (c=4) Thuật toán PCA Thuật tốn t-SNE Thuật tốn ISOMAP Hình 3.37 Data Visualization FCM với liệu CĐLT Dược học khoá 3.3.12.3 Data Visualization với thuật toán εFCM Với tham số mũ m=1.1, tiêu chuẩn hội tụ (epsilon)=1.2, chọn 60 sinh viên (n=60), có 26 features, phân vào cụm (c=4) Thuật tốn PCA Thuật tốn t-SNE Thuật tốn ISOMAP Hình 3.38 Data Visualization εFCM với liệu CĐLT Dược học khoá 50 3.3.12.4 Đánh giá kết với liệu CĐLT Dược học khoá  Dùng phương pháp đánh giá Confusion Matrix cho thuật toán Thuật toán Kmean Thuật toán FCM Thuật toán εFCM Bảng 3.24 Ghi nhận kết với liệu CĐLT Dược học khoá Thuật toán Kmean Nội dung Thuật toán dự báo nhóm kết tương ứng bao gồm: group đạt 18 sinh viên, group đạt 21 sinh viên, group đạt sinh viên, group đạt 20 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng FCM Thuật tốn dự báo nhóm kết tương ứng bao gồm: group đạt 11 sinh viên, group đạt 11 sinh viên, group đạt 20 sinh viên, group đạt 18 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng εFCM Thuật tốn dự báo nhóm kết tương ứng bao gồm: group đạt 17 sinh viên, group đạt 17 sinh viên, group đạt 13 sinh viên, group đạt 13 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động Bảng 3.25 Kết phân loại với liệu CĐLT Dược học khoá Kmean FCM εFCM Mean 0.10 21.60 24.63 Std 0.14 0.40 0.99 Accuracy 0.05 0.33 0.22 51 3.3.13 Thực nghiệm với liệu CĐLT Điều dưỡng khoá 3.3.13.1 Data Visualization với thuật toán Kmean Chọn 142 sinh viên (n=142), có 29 features, phân vào cụm (k=4) Thuật toán PCA Thuật toán t-SNE Thuật toán ISOMAP Hình 3.39 Data Visualization Kmean với liệu CĐLT Điều dưỡng khoá 3.3.13.2 Data Visualization với thuật toán FCM Với tham số mũ m=1.7, chọn 142 sinh viên (n=142), có 29 features, phân vào cụm (c=4) Thuật tốn PCA Thuật tốn t-SNE Thuật tốn ISOMAP Hình 3.40 Data Visualization FCM với liệu CĐLT Điều dưỡng khoá 3.3.13.3 Data Visualization với thuật toán εFCM Với tham số mũ m=1.7, tiêu chuẩn hội tụ (epsilon)=1.2, chọn 142 sinh viên (n=142), có 29 features, phân vào cụm (c=4) Thuật toán PCA Thuật toán t-SNE Thuật tốn ISOMAP Hình 3.41 Data Visualization εFCM với liệu CĐLT Điều dưỡng khoá 52 3.3.13.4 Đánh giá kết với liệu CĐLT Điều dưỡng khoá  Dùng phương pháp đánh giá Confusion Matrix cho thuật toán Thuật toán Kmean Thuật toán FCM Thuật toán εFCM Bảng 3.26 Ghi nhận kết với liệu CĐLT Điều dưỡng khoá Thuật toán Nội dung Thuật tốn dự báo nhóm kết tương ứng bao gồm: group Kmean đạt 52 sinh viên, group đạt 37 sinh viên, group đạt sinh viên, group đạt 50 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng Thuật tốn dự báo nhóm kết tương ứng bao gồm: group FCM đạt 35 sinh viên, group đạt 37 sinh viên, group đạt 40 sinh viên, group đạt 30 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng εFCM Thuật tốn dự báo nhóm kết tương ứng bao gồm: group đạt 38 sinh viên, group đạt 38 sinh viên, group đạt 30 sinh viên, group đạt 36 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động Bảng 3.27 Kết phân loại với liệu CĐLT Điều dưỡng khoá Kmean FCM εFCM Mean 0.27 22.04 25.44 Std 0.10 4.23 7.51 Accuracy 0.16 0.30 0.25 53 3.3.14 Thực nghiệm với liệu CĐLT Hộ sinh khoá 3.3.14.1 Data Visualization với thuật toán Kmean Chọn 73 sinh viên (n=73), có 30 features, phân vào cụm (k=4) Thuật toán PCA Thuật toán t-SNE Thuật tốn ISOMAP Hình 3.42 Data Visualization Kmean với liệu CĐLT Hợ sinh khố 3.3.14.2 Data Visualization với thuật toán FCM Với tham số mũ m=1.1, chọn 73 sinh viên (n=73), có 30 features, phân vào cụm (c=4) Thuật toán PCA Thuật toán t-SNE Thuật tốn ISOMAP Hình 3.43 Data Visualization FCM với liệu CĐLT Hợ sinh khố 3.3.14.3 Data Visualization với thuật tốn εFCM Với tham số mũ m=1.1, tiêu chuẩn hợi tụ (epsilon)=1.2, chọn 73 sinh viên (n=73), có 30 features, phân vào cụm (c=4) Thuật toán PCA Thuật tốn t-SNE Thuật tốn ISOMAP Hình 3.44 Data Visualization εFCM với liệu CĐLT Hợ sinh khố 54 3.3.14.4 Đánh giá kết với liệu CĐLT Hộ sinh khoá  Dùng phương pháp đánh giá Confusion Matrix cho thuật toán Thuật toán Kmean Thuật toán FCM Thuật toán εFCM Bảng 3.28 Ghi nhận kết với liệu CĐLT Hợ sinh khố Thuật tốn Nội dung Kmean Thuật tốn dự báo nhóm kết tương ứng bao gồm: group đạt 22 sinh viên, group đạt 26 sinh viên, group đạt 13 sinh viên, group đạt 12 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động FCM Thuật tốn dự báo nhóm kết tương ứng bao gồm: group đạt 19 sinh viên, group đạt 19 sinh viên, group đạt 16 sinh viên, group đạt 19 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động εFCM Thuật tốn dự báo nhóm kết tương ứng bao gồm: group đạt 22 sinh viên, group đạt 19 sinh viên, group đạt 12 sinh viên, group đạt 20 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động Bảng 3.29 Kết phân loại với liệu CĐLT Hợ sinh khố Kmean FCM εFCM Mean 0.28 25.95 31.07 Std 0.15 0.77 1.19 Accuracy 0.25 0.26 0.18 55 3.3.15 Thực nghiệm với liệu TCCQ Y sỹ khoá Campuchia 3.3.15.1 Data Visualization với thuật toán Kmean Chọn 79 sinh viên (n=79), có 15 features, phân vào cụm (k=4) Thuật tốn PCA Thuật tốn t-SNE Thuật tốn ISOMAP Hình 3.45 Data Visualization Kmean với liệu TCCQ Y sỹ khoá Campuchia 3.3.15.2 Data Visualization với thuật toán FCM Với tham số mũ m=1.1, chọn 79 sinh viên (n=79), có 15 features, phân vào cụm (c=4) Thuật toán PCA Thuật tốn t-SNE Thuật tốn ISOMAP Hình 3.46 Data Visualization FCM với liệu TCCQ Y sỹ khoá Campuchia 3.3.15.3 Data Visualization với thuật toán εFCM Với tham số mũ m=1.1, tiêu chuẩn hội tụ (epsilon)=1.2, chọn 79 sinh viên (n=79), có 15 features, phân vào cụm (c=4) Thuật toán PCA Thuật toán t-SNE Thuật toán ISOMAP Hình 3.47 Data Visualization εFCM với liệu TCCQ Y sỹ khoá Campuchia 56 3.3.15.4 Đánh giá kết với liệu TCCQ Y sỹ khoá Campuchia  Dùng phương pháp đánh giá Confusion Matrix cho thuật toán Thuật toán Kmean Thuật toán FCM Thuật toán εFCM Bảng 3.30 Ghi nhận kết với liệu TCCQ Y sỹ khoá Campuchia Thuật toán Kmean Nội dung Thuật tốn dự báo nhóm kết tương ứng bao gồm: group đạt 19 sinh viên, group đạt 21 sinh viên, group đạt 20 sinh viên, group đạt 19 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động Thuật tốn dự báo nhóm kết tương ứng bao gồm: group FCM đạt 20 sinh viên, group đạt 22 sinh viên, group đạt 22 sinh viên, group đạt 15 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng εFCM Thuật tốn dự báo nhóm kết tương ứng bao gồm: group đạt 14 sinh viên, group đạt 22 sinh viên, group đạt 24 sinh viên, group đạt 19 sinh viên; tiêu chí để nhà trường chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động Bảng 3.31 Kết phân loại với liệu TCCQ Y sỹ khoá Campuchia Kmean FCM εFCM Mean 0.24 27.21 29.89 Std 0.08 2.81 1.72 Accuracy 0.24 0.33 0.32 57 3.4 Bàn luận thực nghiệm Thơng qua kết học tập cuối khố từ 15 tập liệu kết xuất từ trường CĐYT Đồng Tháp, tác giả nhận thấy kết học tập sinh viên không kết xếp loại, cụ thể lớp Cao đẳng quy khố có 0.74% loại X́t sắc, 5.64% loại Giỏi, loại Khá 52.21%, loại Trung bình 41.42%; Cao đẳng quy khố có 0.27% loại X́t sắc, 3.75% loại Giỏi, 68.63% loại Khá 27.35% loại Trung bình; Trong lớp Cao đẳng liên thơng tỷ lệ xếp loại Xuất sắc, Giỏi tương ứng 4.36% 44.73%; loại Khá đạt 68.63%, trung bình đạt 3.64% Thơng qua số liệu từ phần mềm có kết học tập sinh viên không từ hệ quy liên thơng; vấn đề đặt lên hàng đầu cho nhà trường để cải thiện chất lượng đào tạo đánh giá kết đào tạo thơng qua khố sau tốt nghiệp, mục tiêu hướng đến đơn vị sử dụng lao động chất lượng cao mang đến trải nghiệm tốt nhất cho sinh viên sau tốt nghiệp Và chương này, tác giả dùng thuật toán cụ thể Kmean, FCM, εFCM để thực nghiệm việc đánh giá kết học tập sinh viên để gom kết học tập theo nhóm khác bước đầu cho thấy thuật toán phân sinh viên vào cụm khác theo kết group1, group2, group3, group4 Các kết từ nhóm phân loại điều kiện để nhà trường chọn lọc nhóm ưu tú nhất, đạt kết cao nhất để gửi đến nhà tuyển dụng lao động Kết không giúp cho nhà trường nhìn nhận việc đưa ứng viên đến người sử dụng lao đợng theo cảm tính, mà cịn rất minh bạch, công tâm cho tất sinh viên học trường Trong trình thực nghiệm, tác giả lựa chọn tham số mũ (m) 1.7 có thay đổi tham số mũ 1.1 tập khác tác giả mong muốn kết dự báo giải thuật đạt hiệu tối ưu nhất Qua việc phân nhóm sinh viên theo kết điểm đạt hiệu cho tất tập liệu; tiền đề cho việc lựa chọn ứng viên tiềm thời buổi cạnh tranh việc làm nay, đặc biệt ngành Y tế chất lượng kể y đức đặt lên hàng đầu 58 KẾT LUẬN VÀ KIẾN NGHỊ Kết luận Trong nghiên cứu này, một phương pháp xếp loại học tập sinh viên thực mơ hình mới, thay mơ hình theo thang điểm cứng trước Tuy nhiên, tác giả giữ tồn bợ kết học tập theo quy định Nhà trường, đưa kết song song để gợi ý cho nhà trường có chọn lọc cụ thể để giới thiệu đến đơn vị sử dụng lao đợng Qua đó, nhà trường có nhìn tổng quát trình đào tạo xây dựng hệ thống kiểm định chất lượng đào tạo tạo tốt để làm tiền đề cho việc phân loại sinh viên trình học tập trường giai đoạn hợi nhập quốc tế ASEAN với nhóm sinh viên chất lượng cao nhóm sinh viên lại phục vụ tỉnh nước Trong trình thực nghiệm với 15 tập liệu kết trên, tác giả chọn ngành Điều dưỡng khoá để so sánh ngẫu nhiên với kết sinh viên sau tốt nghiệp kết dự báo từ thuật toán mang lại hiệu mong đợi, cụ thể số lượng sinh viên tham gia việc làm đạt khoảng 60% kết dự báo giải thuật; kết khả quan cho nghiên cứu Tuy nhiên, tác giả sử dụng mợt tập ngẫu nhiên chưa đánh giá hết hiệu tập liệu khác Đây bước đột phá nhà trường việc ứng dụng Công nghệ thông tin để giải tốn cải cách hành Trường CĐYT Đồng Tháp điều kiện để nâng cấp phần mềm Quản lý Đào tạo trường lên mợt mức cao vừa hỗ trợ cho nhà trường, vừa giúp cho đơn vị ngành giải toán sinh viên chất lượng cao nay, đồng thời mục tiêu ứng dụng CNTT cho việc chuyển đổi số nhà trường giai đoạn 2021 – 2025 tầm nhìn 2030 tiến đến trở thành trường đào tạo chất lượng cao khu vực Mekong 59 Hướng phát triển Thông qua việc áp dụng thuật toán, tác giả kết phân cụm theo nhóm dựa tập liệu từ hệ thống phần mềm sẵn Tuy nhiên với nghiên cứu này, tác giả áp dụng cho khoá đào tạo trường, loại bỏ tḥc tính kết học tập khơng nằm nội dung nghiên cứu Trên thực tế việc đánh giá xếp loại học tập dựa vào rất nhiều yếu tố hệ số tín chỉ, học phần dễ, khó, giảng viên dễ, khó khác nhau, việc dẫn đến kết điểm số học phần khác Việc làm cho kết phân cụm nghiên cứu bị ảnh hưởng, ra, thuật toán phân cụm, tác giả dừng lại việc sử dụng toán Fuzzy C-Means áp dụng tiêu chuẩn hội tụ (epsilon); thực tế, thực phân cụm cịn nhiều khó khăn phức tạp đa dạng liệu, kích thước liệu, nhiều loại tḥc tính khác nhau…và để khắc phục việc mợt kỹ thuật nghiên cứu Fuzzy C-means cải tiến, dùng phương pháp nhân qua việc biến đổi liệu đầu vào thông qua một hàm nhân phi tuyến thành một không gian liệu mà phân cụm liệu thực tuyến tính dễ dàng Từ kết đạt nghiên cứu, tác giả đề x́t mợt số hướng khả thi để hồn thiện nghiên cứu tương lai Thứ nhất nên áp dụng đa dạng hoá kết học tập sinh viên bao gồm kết kiểm tra thường kỳ, điểm thi kết thúc học phần áp dụng cho các khối ngành học nhà trường, mục tiêu có nhìn tổng quan để thay đổi chương trình kiểm định chất lượng đào tạo hàng năm khơng thể tính tốn khố học kết thúc Thứ hai, tác giả nghiên cứu xây dựng thành một ứng dụng cụ thể theo dạng realtime để lãnh đạo nhà trường theo dõi, kiểm tra có số liệu cụ thể bất kỳ thời điểm nào; đặc biệt trình ký kết hợp tác nhà trường đối tác doanh nghiệp nước 60 DANH MỤC CƠNG TRÌNH ĐÃ CƠNG BỐ CỦA HỌC VIÊN [1] Quang-Vinh Dang, Minh-Tuan Truong and M -H Huynh ""Studying the Fuzzy Clustering Methods to Understand Employee Performance," presen at the 2021 4th International Conference on Artificial Intelligence and Big Data (ICAIBD), pp 541-544 doi: 10.1109/ICAIBD51990.2021.9459054," 2021 [2] Minh-Tuan Truong and Quang-Vinh Dang "Digital Signatures using Hardware Security Modules for Electronic Bills in Vietnam: Open Problems and Research Directions," In Proceedings of the 7th International Conference, CCIS 1306, Springer Verlag Internet: https://link.springer.com/chapter/10.1007/978-98133," 2020 61 TÀI LIỆU THAM KHẢO [1] Bộ Lao động - Thương binh Xã hội "Thông tư quy định việc tổ chức thực chương trình đào tạo trình đợ trung cấp, trình đợ cao đẳng theo niên chế theo phương thức tích lũy mơ-đun tín chỉ; quy chế kiểm tra, thi, xét cơng nhận tốt nghiệp." Số 09/2017/TT-BLĐTBXH, 2017 [2] Bezdek et al "The fuzzy c-means clustering algorithm," Computers & Geosciences Vol 10, no 2-3, pp 191-203, U.S.A: Pergamon Press Ltd, 1984 [3] B K a E Vityaev Data mining for financial applications Data Mining and Knowledge Discovery Handbook, pp 1203–1224, Springer, 2005 [4] W Raghupathi “Data mining in healthcare,” Healthcare Informatics: Improving Efficiency through Technology, Analytics, and Management Pp 353–372, 2016 [5] P G a S Figini Applied data mining for business and industry Wiley, 2009 [6] C R a S Ventura "Data mining in education,” Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery Vol 3, no 1, pp 12–27, 2013 [7] R D A.K Jain Algorithms for clustering data Ptentice Hall, Englewood Cliffs, NJ, 1988 [8] M Windham “Cluster validity for fuzzy clustering algorithms,” Fuzzy Sets and System Vol 3, pp 177-183, 1981 [9] P A Pantel "Clustering by Committee," Canada: Thesis Doctor of Philosophy, University of Alberta, pp 15-25, 2003 [10] E W Forgy, “Cluster analysis of multivariate data: efficiency versus interpretability of classifications,” Biometrics Vol 21, pp 768–769, 1965 [11] M J Z a W M Jr Data Mining and Machine Learning: Fundamental 62 Concepts and Algorithms Cambridge University Press, 2019 [12] K Zalik "Cluster validity index for estimation of fuzzy clusters of different sizes and densities," Pattern Recognition Vol 43, pp 3374-3390, 2010 [13] W.Pedrycz “Algorithms of fuzzy clustering with partial supervision,” Pattern Recognition Vol 23, pp.121-146, 1990 [14] Y Z W Wang "On fuzzy cluster validity indices," ScienceDirect Vol 158, pp 2095 -2117, 2007 [15] J B MacQueen "Some Methods for classification and Analysis of Multivariate Observations," present at The Proc 5th Berkeley Symp Math Stat Probab, 1967 [16] R E.H A new approach to clustering Information and Control, 1969 [17] Dunn "A fuzzy relative of the isodata process and its use in detecting compact well-separated clusters," J Cybern Pp 32–57, 1973 [18] A Arning et al "Linear method for deviation detection in large databases," present at The 1996 Int Conf Data Mining and Knowledge Discovery (KDD’96), pp 164–169, Portland, Oregon, Aug 1996 [19] J H a M Kember Data Mining Concept and Techniques (Second Edition), 2011 [20] M J N K P A M Krishna Kant Singh "A Fuzzy Kohonen Local Information C-Means Clustering for Remote Sensing Imagery,” IETE Technical Review Vol 31, Issue 1, 2014, pp 75-81, 2014 [21] R J a M.-R G.Bueno "“Fuzzy colour C-means clustering for pattern segmentation in histological images,” present at The 3rd European Medical and Biological Engineering Conference, 2005 63 LÝ LỊCH TRÍCH NGANG CỦA HỌC VIÊN I LÝ LỊCH SƠ LƯỢC Họ tên: Trương Minh Tuấn Giới tính: Nam Ngày, tháng năm sinh: 29/09/1987 Nơi sinh: Long An Email: tieudinhtuan@gmail.com Điện thoại: 0942999871 II QUÁ TRÌNH ĐÀO TẠO Từ năm 2005 đến 2008: học Cao đẳng Công nghệ thông tin trường Đại học Sư phạm Đồng Tháp Từ năm 2009 đến 2011: học liên thông Đại học Khoa học máy tính trường Đại học Đồng Tháp Từ năm 2018 đến 2020: học cao học Khoa học máy tính Đại học Cơng nghiệp Thành phố Hồ Chí Minh III Q TRÌNH CƠNG TÁC CHUN MƠN Thời gian Nơi công tác Công việc đảm nhiệm 2006 – 2008 Cơng ty Thiên Trúc Lập trình phần mềm Trường Cao đẳng Y tế 2008 – Đồng Tháp Quản trị sở liệu, phát triển hệ thống quản lý đào tạo học trực tuyến trường Tp.HCM, ngày 20 tháng 10 năm 2021 Người khai Trương Minh Tuấn 64 ... Visualization với thuật toán εFCM Với tham số mũ m=1.7, tiêu chuẩn hội tụ (epsilon)=1.2, chọn 289 sinh viên (n=289), có 38 features, phân vào cụm (c=4) Thuật toán PCA Thuật toán t-SNE Thuật toán ISOMAP... Visualization với thuật toán εFCM Với tham số mũ m=1.1, tiêu chuẩn hội tụ (epsilon)=1.2, chọn 73 sinh viên (n=73), có 48 features, phân vào cụm (c=4) Thuật toán PCA Thuật toán t-SNE Thuật toán ISOMAP... 3.3.7.2 Data Visualization với thuật toán FCM Với tham số mũ m=1.1, chọn 25 sinh viên (n=25), có 47 features, phân vào cụm (c=4) Thuật toán PCA Thuật toán t-SNE Thuật toán ISOMAP Hình 3.22 Data Visualization

Ngày đăng: 30/06/2022, 10:54

Hình ảnh liên quan

Hình 3.1 Mô hình cơ sở dữ liệu quan hệ trên phần mềm - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Hình 3.1.

Mô hình cơ sở dữ liệu quan hệ trên phần mềm Xem tại trang 1 của tài liệu.
3.2 Chuẩn bị cài đặt thực nghiệm: - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

3.2.

Chuẩn bị cài đặt thực nghiệm: Xem tại trang 3 của tài liệu.
Hình 3.2 Tập dữ liệu sau khi xử lý - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Hình 3.2.

Tập dữ liệu sau khi xử lý Xem tại trang 3 của tài liệu.
Hình 3.4 Data Visualization FCM với dữ liệu CĐCQ Dược học khoá 6 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Hình 3.4.

Data Visualization FCM với dữ liệu CĐCQ Dược học khoá 6 Xem tại trang 5 của tài liệu.
Hình 3.7 Data Visualization FCM với dữ liệu CĐCQ Điều dưỡng khoá 6 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Hình 3.7.

Data Visualization FCM với dữ liệu CĐCQ Điều dưỡng khoá 6 Xem tại trang 7 của tài liệu.
Hình 3.6 Data Visualization Kmean với dữ liệu CĐCQ Điều dưỡng khoá 6 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Hình 3.6.

Data Visualization Kmean với dữ liệu CĐCQ Điều dưỡng khoá 6 Xem tại trang 7 của tài liệu.
Bảng 3.6 Ghi nhận kết quả với dữ liệu CĐCQ KTXN khoá 6 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Bảng 3.6.

Ghi nhận kết quả với dữ liệu CĐCQ KTXN khoá 6 Xem tại trang 10 của tài liệu.
Bảng 3.8 Ghi nhận kết quả với dữ liệu CĐCQ PHCN khoá 6 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Bảng 3.8.

Ghi nhận kết quả với dữ liệu CĐCQ PHCN khoá 6 Xem tại trang 12 của tài liệu.
Hình 3.16 Data Visualization FCM với dữ liệu CĐCQ Dược học khoá 7 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Hình 3.16.

Data Visualization FCM với dữ liệu CĐCQ Dược học khoá 7 Xem tại trang 13 của tài liệu.
Bảng 3.10 Ghi nhận kết quả với dữ liệu CĐCQ Dược học khoá 7 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Bảng 3.10.

Ghi nhận kết quả với dữ liệu CĐCQ Dược học khoá 7 Xem tại trang 14 của tài liệu.
Hình 3.19 Data Visualization FCM với dữ liệu CĐCQ Điều dưỡng khoá 7 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Hình 3.19.

Data Visualization FCM với dữ liệu CĐCQ Điều dưỡng khoá 7 Xem tại trang 15 của tài liệu.
Hình 3.21 Data Visualization Kmean với dữ liệu CĐCQ KTXN khoá 7 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Hình 3.21.

Data Visualization Kmean với dữ liệu CĐCQ KTXN khoá 7 Xem tại trang 17 của tài liệu.
Hình 3.24 Data Visualization Kmean với dữ liệu CĐCQ PHCN khoá 7 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Hình 3.24.

Data Visualization Kmean với dữ liệu CĐCQ PHCN khoá 7 Xem tại trang 19 của tài liệu.
Hình 3.25 Data Visualization FCM với dữ liệu CĐCQ PHCN khoá 7 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Hình 3.25.

Data Visualization FCM với dữ liệu CĐCQ PHCN khoá 7 Xem tại trang 19 của tài liệu.
Bảng 3.16 Ghi nhận kết quả với dữ liệu CĐCQ PHCN khoá 7 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Bảng 3.16.

Ghi nhận kết quả với dữ liệu CĐCQ PHCN khoá 7 Xem tại trang 20 của tài liệu.
Hình 3.27 Data Visualization Kmean với dữ liệu CĐLT Dược học khoá 4 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Hình 3.27.

Data Visualization Kmean với dữ liệu CĐLT Dược học khoá 4 Xem tại trang 21 của tài liệu.
Hình 3.28 Data Visualization FCM với dữ liệu CĐLT Dược học khoá 4 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Hình 3.28.

Data Visualization FCM với dữ liệu CĐLT Dược học khoá 4 Xem tại trang 21 của tài liệu.
Bảng 3.19 Kết quả phân loại với dữ liệu CĐLT Dược học khoá 4 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Bảng 3.19.

Kết quả phân loại với dữ liệu CĐLT Dược học khoá 4 Xem tại trang 22 của tài liệu.
Hình 3.31 Data Visualization FCM với dữ liệu CĐLT Điều dưỡng khoá 4 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Hình 3.31.

Data Visualization FCM với dữ liệu CĐLT Điều dưỡng khoá 4 Xem tại trang 23 của tài liệu.
Hình 3.30 Data Visualization Kmean với dữ liệu CĐLT Điều dưỡng khoá 4 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Hình 3.30.

Data Visualization Kmean với dữ liệu CĐLT Điều dưỡng khoá 4 Xem tại trang 23 của tài liệu.
Hình 3.33 Data Visualization Kmean với dữ liệu CĐLT Hộ sinh khoá 4 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Hình 3.33.

Data Visualization Kmean với dữ liệu CĐLT Hộ sinh khoá 4 Xem tại trang 25 của tài liệu.
Hình 3.34 Data Visualization FCM với dữ liệu CĐLT Hộ sinh khoá 4 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Hình 3.34.

Data Visualization FCM với dữ liệu CĐLT Hộ sinh khoá 4 Xem tại trang 25 của tài liệu.
Bảng 3.23 Kết quả phân loại với dữ liệu CĐLT Hộ sinh khoá 4 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Bảng 3.23.

Kết quả phân loại với dữ liệu CĐLT Hộ sinh khoá 4 Xem tại trang 26 của tài liệu.
Hình 3.37 Data Visualization FCM với dữ liệu CĐLT Dược học khoá 5 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Hình 3.37.

Data Visualization FCM với dữ liệu CĐLT Dược học khoá 5 Xem tại trang 27 của tài liệu.
Bảng 3.24 Ghi nhận kết quả với dữ liệu CĐLT Dược học khoá 5 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Bảng 3.24.

Ghi nhận kết quả với dữ liệu CĐLT Dược học khoá 5 Xem tại trang 28 của tài liệu.
Hình 3.39 Data Visualization Kmean với dữ liệu CĐLT Điều dưỡng khoá 5 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Hình 3.39.

Data Visualization Kmean với dữ liệu CĐLT Điều dưỡng khoá 5 Xem tại trang 29 của tài liệu.
Hình 3.40 Data Visualization FCM với dữ liệu CĐLT Điều dưỡng khoá 5 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Hình 3.40.

Data Visualization FCM với dữ liệu CĐLT Điều dưỡng khoá 5 Xem tại trang 29 của tài liệu.
Bảng 3.28 Ghi nhận kết quả với dữ liệu CĐLT Hộ sinh khoá 5 - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Bảng 3.28.

Ghi nhận kết quả với dữ liệu CĐLT Hộ sinh khoá 5 Xem tại trang 32 của tài liệu.
Hình 3.46 Data Visualization FCM với dữ liệu TCCQ Y sỹ khoá 6 Campuchia - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Hình 3.46.

Data Visualization FCM với dữ liệu TCCQ Y sỹ khoá 6 Campuchia Xem tại trang 33 của tài liệu.
Bảng 3.31 Kết quả phân loại với dữ liệu TCCQ Y sỹ khoá 6 Campuchia - Nghiên cứu một số thuật toán cụm mờ và ứng dụng vào bài toán phân loại sinh viên p3

Bảng 3.31.

Kết quả phân loại với dữ liệu TCCQ Y sỹ khoá 6 Campuchia Xem tại trang 34 của tài liệu.

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan