1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu phân tích cụm dữ liệu và ứng dụng trong phân tích, đánh giá kết quả học tập của sinh viên

56 22 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 56
Dung lượng 0,91 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC VINH NGUYỄN CÔNG KHA NGHIÊN CỨU PHÂN CỤM DỮ LIỆU VÀ ỨNG DỤNG TRONG PHÂN TÍCH, ĐÁNH GIÁ KẾT QUẢ HỌC TẬP CỦA SINH VIÊN LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN ĐỒNG THÁP, tháng 3/2017 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC VINH NGUYỄN CÔNG KHA NGHIÊN CỨU PHÂN CỤM DỮ LIỆU VÀ ỨNG DỤNG TRONG PHÂN TÍCH, ĐÁNH GIÁ KẾT QUẢ HỌC TẬP CỦA SINH VIÊN Chuyên ngành: Công nghệ thông tin Mã số: 60480201 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Người hướng dẫn khoa học: TS PHAN ANH PHONG ĐỒNG THÁP, tháng 3/2017 LỜI CẢM ƠN Lần đầu tiên, cho em gửi lời cảm ơn sâu sắc chân thành đến TS Phan Anh Phong, người tận tụy nhiệt tình hướng dẫn, bảo giúp đỡ em suốt trình làm luận văn Em xin chân thành gửi lời cảm ơn đến thầy, cô tham gia giảng dạy chia kinh nghiệm q báu cho tập thể lớp nói chung thân em nói riêng Tơi xin gửi lời cảm ơn tới gia đình, bạn bè, đồng nghiệp ln ủng hộ động viên tơi để tơi hồn thành tốt luận văn Cuối cùng, tơi xin gửi lời cảm ơn tới Ban giám hiệu trường Đại học Đồng Tháp, Phòng Đào tạo sau đại học tạo điều kiện thuận lợi cho tơi tham gia khóa học hoàn thành luận văn Một lần nữa, xin chân thành cảm ơn Đồng Tháp, ngày 02 tháng năm 2017 Học viên Nguyễn Công Kha LỜI CAM ĐOAN Tôi xin cam đoan luận văn kết tìm hiểu, nghiên cứu tài liệu cách nghiêm túc hướng dẫn TS Phan Anh Phong Nội dung luận văn hình thành phát triển từ ý tưởng, sáng tạo thân, kết thu hoàn toàn trung thực Cần Thơ, ngày 02 tháng năm 2017 Người cam đoan Nguyễn Công Kha MỤC LỤC LỜI CẢM ƠN LỜI CAM ĐOAN DANH MỤC CÁC TỪ VIẾT TẮT DANH MỤC CÁC BẢNG DANH MỤC CÁC HÌNH MINH HOẠ MỞ ĐẦU Lý chọn đề tài Lịch sử vấn đề Đối tượng phạm vi nghiên cứu 3.1 Đối tượng nghiên cứu 3.2 Phạm vi nghiên cứu Mục đích nhiệm vụ nghiên cứu 10 Phương pháp nghiên cứu 10 Đóng góp luận văn 10 Chương 1: TỔNG QUAN VỀ TẬP MỜ VÀ PHÂN CỤM DỮ LIỆU 11 1.1 Đặt vấn đề 11 1.2 Tập mờ 12 1.2.1 Các khái niệm 12 1.2.2 Các phép toán tập mờ 13 1.2.3 T-norms t-conorm 18 1.2.4 Khoảng cách tập mờ 20 1.3 Phân cụm liệu 20 1.3.1 Các phương pháp phân cụm 20 1.3.2 Thuật toán phân cụm C-MEANS 25 1.3.3 Một ví dụ phân cụm C-MEANS 26 1.4 Phân cụm liệu giáo dục 31 1.4.1 Ứng dụng phân cụm liệu phân tích, đánh giá kết học tập học sinh 31 1.4.2 Ứng dụng thuật toán phân cụm liệu để khai thác kết thi nhằm chuẩn hóa chất lượng đề thi trắc nghiệm 32 1.5 Kết luận chương 32 Chương 2: PHÂN CỤM MỜ DỮ LIỆU VỚI THUẬT TOÁN FCM 33 2.1 Tổng quan thuật toán cụm mờ C-means (FCM) 33 2.2 Thuật toán phân cụm mờ FCM 33 2.2.1 Cơ sở toán học FCM 33 2.2.2 Thuật toán FCM 34 2.3 Ưu điểm nhược điểm FCM 36 2.4 FCM với hàm khoảng cách khác 36 2.4.1 Hàm khoảng cách 36 2.4.2 Khoảng cách Euclidian 37 2.4.3 Khoảng cách Chebyshev 37 2.4.4 Khoảng cách Manhattan 38 2.4.5 Nhận xét kết phân cụm FCM với hàm khoảng cách 38 2.5 FCM với thay đổi số mờ “m” 40 2.6 FCM với thay đổi số cụm “c” 40 2.7 Kết luận chương 41 Chương 3: PHÂN TÍCH VÀ ĐÁNH GIÁ KẾT QUẢ HỌC TẬP CỦA SINH VIÊN SỬ DỤNG KỸ THUẬT PHÂN CỤM 42 3.1 Ứng dụng phân cụm liệu phân tích, đánh giá kết học tập sinh viên theo học phần chung 43 3.2 Ứng dụng phân cụm liệu phân tích, đánh giá kết học tập sinh viên theo học phần tiên 48 KẾT LUẬN 52 TÀI LIỆU THAM KHẢO 53 DANH MỤC CÁC TỪ VIẾT TẮT AutoClass BIRCH CLARA CLARANS Naive Bayes Clustering Balanced Iterative Reducing and Clustering using Hierarchies Clustering LARge Applications Clustering Large Applications based on RANdomized Search CLIQUE Clustering In QUEst CURE Clustering Using Representatives DBSCAN Density based Spatial Clutering of Application with Noise EM Expectation–Maximization FCM Fuzzy C-Means STING STatistical INformation Grid-based method WAVECLUSTER Wavelet-Based Functional Clustering DANH MỤC CÁC BẢNG Bảng 3.1 So sánh kết phân cụm hàm khoảng cách với số cụm 47 Bảng 3.2 So sánh kết phân cụm Manhattan với kết đánh giá Bộ GD&ĐT với số cụm 48 DANH MỤC CÁC HÌNH MINH HỌA Hình 1.1 Tập mờ tập rõ 12 Hình 1.2 Miền tin cậy miền xác định tập mờ A 13 Hình 1.3 Tập bù Hình 1.4 Hợp hai tập mờ có tập vũ trụ 15 Hình 1.5 Giao hai tập mờ có tập vũ trụ 15 Hình 2.1 Khoảng cách Chebyshev bàn cờ vua 38 Hình 2.2 So sánh khoảng cách Mahattan khoảng cách Euclide 38 Hình 2.3 So sánh kết phân cụm hàm khoảng cách khác 39 Hình 3.1 Ma trận Uik theo khoảng cách Euclide với số cụm 44 Hình 3.2 Ma trận Uik theo khoảng cách Euclide với số cụm 46 Hình 3.3 Ma trận Uik theo khoảng cách Manhattan với số cụm 47 Hình 3.4 Bảng thuộc tính 20 sinh viên theo học phần tiên 49 Hình 3.5 Giá trị Uik 20 sinh viên theo học phần tiên 50 Hình 3.6 Giá trị Vij học phần tiên theo cụm 51 A tập mờ A 14 MỞ ĐẦU Lý chọn đề tài Trong giáo dục nhà quản lý, cán tham gia giảng dạy cần có cơng cụ đủ mạnh để thơng qua có nhìn tổng quát cụ thể trình học kết học tập sinh viên Phân cụm liệu cơng cụ hồn tồn đáp ứng nhu cầu Trên giới nay, phân cụm liệu nhiều quốc gia ứng dụng nhiều lĩnh vực, có giáo dục Và thành cơng mang lại bước đầu nhà quản lý giáo dục Việt Nam nghiên cứu ứng dụng Tại Việt Nam, có số cơng trình nghiên cứu phân cụm liệu giáo dục như: Ứng dụng phân cụm liệu phân tích, đánh giá kết học tập học sinh Tuy nhiên, mức độ ứng dụng dừng lại nghiên cứu Xuất phát từ lý trên, chọn đề tài “Nghiên cứu phân cụm liệu ứng dụng phân tích, đánh giá kết học tập sinh viên” Lịch sử vấn đề Phân cụm liệu kỹ thuật khai phá liệu nhằm tìm kiếm, phát cụm liệu tiềm năng, quan trọng tập liệu ban đầu, từ cung cấp thơng tin, tri thức có ích việc đưa định Bản chất phân cụm liệu chia tách tập liệu lớn ban đầu thành cụm liệu cho phần tử cụm tương tự phần tử cụm khác không tương tự Hiện có nhiều thuật tốn phân cụm khác như: K-means, Pam, C-means, thuật toán phân cụm trừ… Trong đó, thuật tốn phân cụm mờ means kế thừa phát triển từ thuật toán phân cụm rõ K-means Cả thuật toán sử dụng chung chiến lược phân cụm liệu Phân cụm liệu ứng dụng nhiều lĩnh vực khác như: kinh tế, bảo hiểm, qui hoạch đô thị… lĩnh vực giáo dục không ngoại lệ Chẳng hạn, lĩnh vực qui hoạch đô thị, ứng dụng phân cụm liệu việc nhận dạng nhóm nhà theo kiểu vị trí địa lý, nhằm cung cấp cho thông tin qui hoạch Trong lĩnh vực bảo hiểm, nhận dạng nhóm cơng ty bảo hiểm có sách bảo hiểm mơ tơ với chi phí đền bù cao… Đối tượng phạm vi nghiên cứu 3.1 Đối tượng nghiên cứu - Căn tập mờ; - Phân cụm rõ K-MEANS; - Phân cụm mờ C-MEANS; - Kết học tập sinh viên ; - Cách đánh giá kết học tập sinh viên; - Ngơn ngữ lập trình Matlab 3.2 Phạm vi nghiên cứu - Vận dụng thuật toán K-MEANS, C-MEANS để phân tích đánh giá kết học tập sinh viên theo học phần chung học phần tiên quyết; - Thảo luận, phân tích đánh giá kết học tập sinh viên theo học phần (trong có học phần chung học phần tiên quyết) với tham số khác áp dụng thuật toán phân cụm liệu 41 Số lượng cụm liệu lựa chọn cách dựa vào kinh nghiệm để tiên đốn số cụm xác định số kỹ thuật áp dụng năm gần như: Sugar and James [18], Cuevas et al [5]… 2.7 Kết luận chương Trong chương 2, nghiên cứu thuật toán FCM, sở toán học tìm hiểu bước thuật tốn FCM Bên cạnh nghiên cứu hàm khoảng cách khác FCM như: Euclide, Chebyshev, Mahattan Đồng thời, ta rút ưu khuyết điểm FCM so với thuật toán K-means Mặt khác, ta tìm hiểu ảnh hưởng số mờ “m” số cụm “c” thay đổi chúng 42 Chương 3: PHÂN TÍCH VÀ ĐÁNH GIÁ KẾT QUẢ HỌC TẬP CỦA SINH VIÊN SỬ DỤNG KỸ THUẬT PHÂN CỤM Trong học kỳ, sinh viên học bao gồm nhiều học phần Sau kết thúc học phần sinh viên có cho điểm kết thúc học phần Tuy nhiên, nhìn vào bảng điểm tổng hợp đó, cán bộ, giảng viên người quản lý, Ban giám hiệu muốn đưa kết luận kết học tập sinh viên thơng qua kết phải làm sao? Hiện nay, việc đánh giá kết học tập sinh viên trường cao đẳng Cần Thơ thực theo Quyết định số 43/2007/QĐ-BGDĐT văn hợp số 17/VBHN-BGDĐT Bộ Giáo dục Đào tạo Nhìn chung, việc đánh giá, xếp loại học tập sinh viên Bộ Giáo dục Đào tạo phản ảnh mục tiêu, yêu cầu việc phân loại khuyến khích q trình học tập sinh viên Từ thấy, việc đánh giá kết học tập sinh viên vô quan trọng Nó tiền đề để đưa phân tích, đánh giá cho việc điều chỉnh việc dạy học để hoàn thiện đạt kết tốt Từ kết điểm kết thúc học phần sinh viên lớp ngành tiến hành phân cụm nhằm phân tích dựa vào điểm kết thúc Từ đó, đưa nhìn đa dạng với nhiều góc độ khác nhau, làm sở đánh giá đắn tình hình học tập sinh viên Từ đó, đề định hướng, kế hoạch cho nhà trường việc nâng cao chất lượng đào tạo Trong chương tập trung vào ứng dụng phân cụm liệu mờ phân tích đánh giá kết học tập sinh viên: phân cụm theo điểm kết thúc học phần chung điểm kết thúc học phần tiên 43 Mục đích việc phân cụm theo hướng khác Nếu phân cụm liệu dựa vào điểm kết thúc học phần môn chung nhằm tìm so sánh kết học tập nhóm học phần giảng viên khác dạy, từ có điều chỉnh hợp lý việc dạy học Trong đó, việc phân cụm dựa vào điểm kết thúc học phần tiên giúp cho việc sinh viên mức độ nhận thức vào lớp Như giúp cho việc dạy giảng viên thuận lợi việc truyền đạt kiến thức đến sinh viên 3.1 Ứng dụng phân cụm liệu phân tích, đánh giá kết học tập sinh viên theo học phần chung Trong phần ta chọn ngành quản lý tài ngun mơi trường khóa 40 với số lượng 200 sinh viên (04 lớp) để phân cụm Học phần chung chọn Những nguyên lý Bốn lớp giảng viên khác đảm nhận việc giảng dạy Cụ thể, lớp quản lý môi trường A giảng viên Nguyễn Văn A dạy Tương tự, lớp quản lý môi trường B, C, D Nguyễn Văn B, Nguyễn Văn C Nguyễn Văn D giảng dạy 44 Với liệu đầu vào file DIEMNLCB1.txt ta xét trường hợp phân cụm đây: a Trường hợp số cụm phân Với hàm khoảng cách khác sau: - Theo khoảng cách Euclide: Ma trận thuộc Uik 12 sinh viên thể sau: Hình 3.1 Ma trận Uik theo khoảng cách Euclide với số cụm Ma trận Uik ma trận thể độ thuộc phần tử thứ i vào cụm thứ k Uik lớn độ thuộc phần tử thứ i vào cụm k cao Từ đó, nhìn vào ma trận Uik ta thấy: Ở sinh viên thứ nhất, độ thuộc U12=U13=U14=U15= 0.0000, U11=1.000 Từ đó, ta kết luận sinh viên thứ thuộc cụm thứ So với kết đánh giá Bộ Giáo dục đào tạo kết Xét sinh viên thứ giống vậy, U21=U22=U23=U25=0.0000, U24=1.0000, ta kết luận sinh viên thứ phần tử cụm thứ (cụm với sinh viên có học lực mức khá) Điều hoàn toàn với cách đánh giá Bộ Giáo dục đào tạo Tương tự, ta xét cho 198 sinh viên lại theo cách Kết cuối thể thống kê đây: - Số lượng sinh viên cụm 1: 87 - Số lượng sinh viên cụm 2: 47 - Số lượng sinh viên cụm 3: 45 - Số lượng sinh viên cụm 4: 51 - Số lượng sinh viên cụm 5: 08 Với liệu đầu vào file DIEMNLCB1.txt kết phân cụm theo khoảng cách Euclide, ta kết luận: kết phân cụm theo thuật tốn FCM (khoảng cách Euclide) hồn tồn trùng khớp với cách đánh giá Bộ Giáo dục đào tạo Kết phân cụm theo thuật toán FCM cho ta biết rằng: số lượng sinh viên tập trung chủ yếu cụm với số lượng 87/200 (chiếm 43.5%) cụm có sinh viên có sức học trung bình học phần Ngun lý chia cho lớp Tuy nhiên, số lượng học sinh đạt điểm 4, có 59/200 sinh viên, tập trung chủ yếu lớp A, B, D với 48/59 sinh viên Lớp C lớp có số lượng sinh viên đạt điểm 4, tương đối thấp với 11/59 sinh viên (chiếm tỉ lệ 18.6%) Số lượng học sinh yếu chiếm số lượng lớn với 54/200 sinh viên Trong đó, tập trung nhiều lớp C với 17 sinh viên, lớp A, B có số lượng sinh viên đạt điểm 0,1 Từ ta thấy rằng, lớp C vừa có số lượng sinh viên đạt điểm thấp nhiều số lượng sinh viên đạt điểm cao thấp Trong đó, lớp D ngược lại, vừa có số lượng sinh viên đạt điểm thấp số lượng sinh viên đạt điểm cao tương đối nhiều Vì cần nghiên cứu phương pháp dạy giảng viên Nguyễn Văn D có hay mới, từ kịp thời nhân rộng áp dụng cho lớp giảng viên Nguyễn Văn C Tương tự cách làm phía dành cho khoảng cách Euclide, ta tiến hành phân cụm cho hàm khoảng cách Manhattan Chebysev với số cụm Tuy nhiên, kết cuối với số lượng phần tử thuộc vào cụm khơng có thay đổi 46 Từ đó, ta tiến hành phân cụm với hàm khoảng cách với số cụm để tìm hiểu xem khác biệt việc thay đổi số cụm: b Trường hợp số cụm 4: - Theo khoảng cách Euclide: Hình 3.2 Ma trận Uik theo khoảng cách Euclide với số cụm Tương tự cách phân tích Nhìn vào ma trận Uik ta thấy: Ở sinh viên thứ ba, độ thuộc U31=U32=U34= 0.0000, U13=1.000 Vì sinh viên thứ ba thuộc vào cụm (cụm dành cho sinh viên đạt điểm 4) Tương tự, ta có thống kê số lượng sinh viên thuộc vào cụm sau: + Cụm 1: 51 sinh viên + Cụm 2: sinh viên + Cụm 3: 87 sinh viên + Cụm 4: 54 sinh viên So với việc phân cụm thành cụm phía trên, việc phân cụm với số cụm thay đổi thành có thay đổi số lượng sinh viên thuộc vào cụm Cụ thể, số lượng sinh viên cụm điểm 4, 3, không thay đổi số lượng lượng sinh viên 87, 51 Nhưng số lượng sinh viên cụm gộp thành cụm việc phân cụm theo cụm với số lượng sinh viên 54 Thực việc phân chia cụm với hàm khoảng cách Chebyshev kết giống với việc phân chia theo hàm khoảng cách Euclide 47 Tuy nhiên, điều khác biệt đến tiến hành phân cụm theo hàm khoảng cách Manhattan: Hình 3.3 Ma trận Uik theo khoảng cách Manhattan với số cụm Xét sinh viên thứ 2, độ thuộc U22=0.0015, U23=0.0060, U24= 0.0007, U21=0.9918 Vì sinh viên thứ thuộc vào cụm 1, cụm dành cho sinh viên có điểm từ 3,4 nằm cụm với sinh viên thứ Tuy nhiên, kết phân cụm theo số cụm 5, sinh viên thứ lại nằm khác cụm với sinh viên thứ TÊN CỤM Chebyshev Euclide Manhattan Cụm 54 54 Cụm 87 87 87 Cụm 51 51 47 Cụm 8 59 Bảng 3.1 So sánh kết phân cụm hàm khoảng cách với số cụm Tương tự, cụm hàm khoảng cách Manhattan tổng hợp hai cụm phân cụm theo số cụm Nếu sinh viên đạt điểm phân theo số cụm nằm cụm hồn tồn khác phân cụm với số cụm sinh viên đạt điểm nằm chung cụm với Tuy nhiên kết phân cụm trường hợp lại khác so với cách phân loại truyền thống theo cách Bộ Giáo dục đào tạo Cụ thể thể bảng sau: 48 TÊN CỤM Theo Bộ GD&ĐT Manhattan Cụm 54 Cụm 87 87 Cụm 51 47 Cụm 59 Bảng 3.2 So sánh kết phân cụm Manhattan với cách đánh giá Bộ GD&ĐT với số cụm Bảng phân cụm có sinh viên theo cách phân loại truyền thống Bộ Giáo dục đào tạo thuộc cụm dành cho sinh viên đạt điểm từ >3 đến sinh viên Nhưng theo cách phân cụm hàm khoảng cách Manhttan sinh viên có điểm đạt nằm chung cụm với sinh viên đạt điểm Điều thể khác biệt phân cụm theo truyền thống phân cụm mờ, mà hàm khoảng cách Manhattan 3.2 Ứng dụng phân cụm liệu phân tích, đánh giá kết học tập sinh viên theo học phần tiên Việc phân bổ sinh viên có nhóm học lực vào học lớp điều cần thiết Có nhiều cách tiếp cận khác với việc phân bổ việc ứng dụng phân cụm mờ ý tưởng hay Việc phân bổ thực dựa vào kết học tập học phần tiên định ảnh hưởng lớn đến ngành học sinh viên theo học Phương pháp giúp sinh viên có khả nhận thức vào lớp sinh viên có khả nhận thức khác lớp khác 49 Ở đây, ta xét 180 sinh viên ngành học Kế toán K39 trường Cao đẳng Cần Thơ Với học phần tiên mà sinh viên trải qua học kỳ trước bao gồm: Kinh tế vi mô, kinh tế vĩ mô, nguyên lý kế tốn, kế tốn tài kế tốn ngân hàng Dựa vào kết học tập sinh viên để phân bổ vào cụm (đại diện cho cho lớp) Để cho dễ dàng, ta lấy 20 sinh viên tổng số 180 sinh viên để làm ví dụ minh họa Điểm số học phần tiên nói 20 sinh viên thể đây, việc phân bổ vào lớp thể dựa theo thuộc tính Hình 3.4 Bảng thuộc tính 20 sinh viên theo học phần tiên 50 đây: Các giá trị Uik 20 sinh viên thể bảng liệu Hình 3.5 Giá trị Uik 20 sinh viên theo học phần tiên Trong bảng giá trị Uik đưa bên trên, giá trị thể cho độ thuộc phần tử vào cụm 1, 2, Ví dụ sinh viên thứ 6, giá trị hàng thứ hiểu sau: U61 =0.84421, U62= 0.10793, U63=0.04787 Trong ba giá trị giá trị U61 lớn sinh viên số thích hợp phân vào cụm thứ vào cụm Cũng tương tự ta có việc phân bổ 20 sinh viên vào ba lớp sau: - Lớp A bao gồm sinh viên với số thứ tự là: 5, 6, 14, 15, 17 51 - Lớp B bao gồm sinh viên với số thứ tự là: 4, 8, 9, 10, 12, 16, 20 - Lớp C bao gồm sinh viên với số thứ tự là: 1, 2, 3, 7, 11, 13, 18, 19 Tâm cụm thể giá trị Vij học phần tiên phân ba lớp sau: Hình 3.6 Giá trị Vij học phần tiên theo cụm Giá trị dòng thể sau: V11=1.9281, V12=21.53996, V13= 2.03912 Từ ba giá trị V ta kết luận rằng, khả hiểu biết cao môn thứ 1: Kinh tế vi mô nằm sinh viên thuộc lớp C, sinh viên lớp A cuối lớp B Tương tự, ta kết luận học phần lại khả hiểu biết học phần rơi vào sinh viên thuộc lớp nhiều 52 KẾT LUẬN Đề tài nghiên cứu thuật toán phân cụm liệu mà cụ thể K-means FCM việc ứng dụng vấn đề phân cụm toán cụ thể đánh giá kết học tập sinh viên trường cao đẳng Cần Thơ theo kết học tập sinh viên học phần chung học phần tiên Bên cạnh đề tài nghiên cứu cơng cụ lập trình Matlab cơng cụ liên quan Đối với toán cụ thể tiến hành phân cụm, từ kết phân cụm tiến hành phân tích, đánh giá kết học tập sinh viên Kết phân cụm giúp người quản lý có nhìn tổng qt trích xuất thơng tin nhanh việc quản lý việc học sinh viên từ điều chỉnh kế hoạch dạy học cho hợp lý Từ ứng dụng phân cụm liệu đề xuất xây dựng ứng dụng phân cụm phục vụ cho công tác đào tạo Trường 53 TÀI LIỆU THAM KHẢO [1] A.K Jain, R.C Dubes (1988), Algorithms for clustering data, PtenticeHall, Englewood Cliffs, NJ [2] Babuška, R (2005), Perspectives of fuzzy systems and control Fuzzy clustering algorithms, 156 (3), 432-444 [3] Chen-Chia Chuang, Jin-Tsong Jeng2 and Chih-Wen Li (2008), Fuzzy CMeans Clustering Algorithm with Unknown Number of Clusters for Symbolic Interval Data” SICE Annual Conference 2008, August 20-22, 2008, The University Electro-Communications, Japan [4] C Hwang and F C H Rhee, Uncertainly fuzzy clustering: Interval type-2 fuzzy approach to c-means IEEE Transactions on Fuzzy Systems, vol 15(1), pp 107-120, 2007 [5] Cuevas A., Febrero M and Fraiman R (2000), Estimating the number of clusters, The Canadian Journal of Statistics, vol 28(2), pp 367–382 [6] Dunn, J C (1973), A Fuzzy Relative of the ISODATA Process and Its Use in Detecting Compact Well-Separated Clusters Journal of Cybernetics [7] Hossen, J., Rahman, A., Sayeed, S., Samsuddin, K and Rokhani, F (2011), A modified hybrid fuzzy clustering algorithm for data partitions Austr J Basic Appl Sci [8] J.C Bezdek, R Ehrlich, W Full (1984), FCM: The fuzzy c-Means clustering algorithm, Computers & Geosciences Vol 10, No 2-3, pp 191203 [9] J C Bezdek, A physical interpretation of Fuzzy ISODATA IEEE Trans Syst., Man, Cybern., vol SMC-6, pp 387-390, 1976 54 [10] K.L.Wu, M.S.Yang (2005), A cluster validity index for fuzzy clustering, Pattern Recognition Lett 26, pp 1275–1291 [11] M Ramze Rezaee, B.P.F Lelieveldt, J.H.C Reiber (1998), A new cluster validity index for the fuzzy c-mean, Pattern Recognition Letters 19, pp 237– 246 [12] N R Pal and J C Bezdek, On cluster validity for fuzzy c-means model IEEE Trans Fuzzy Systems, vol 1, pp 370-379, 1995 [13] P P Bonissone, “A fuzzy sets based linguistic approach: Theory and applications,” in Proceedings of the 12th conference on Winter simulation IEEE Press, 1980, pp 99–111 [14] R.A Jarvis, E.A Patrick (1973), Clustering using a similarity measurebased on shared near neighbors, IEEE Transactions on ComputersC22, pp 1025-1034 [15] R.Suganya, R.Shanthi (2012), Fuzzy C-Means Algorithm - A Review, International Journal of Scientific and Research Publications, Volume 2, pp 2250–3153 [16] S Ghosh, S.K Dubey (2013), Comparative Analysis of K-Means and Fuzzy C-Means Algorithms, International Journal of Advanced Computer Science and Applications, Vol 4, No.4, pp 35-39 [17] Shen'k, Shi, and Zhang (2001), “Improvement and Optimization of a Fuzzy C-Means Clustering Algorithm”, IEEE Instrumentation and Measurement Technology Conference, Budapest, Hungary, May 21-23 [18] S.H Kwon (1998), Cluster validity index for fuzzy clustering, Electron Lett 34 (22), pp 2176–2177 55 [19] Sugar C and James G (2003), Finding the number of clusters in a data set: An information theoretic approach, J of the American Statistical Association, vol 98, pp 750–763 [20] Y.HUI, Ch Zuo, Y Yag, F Qu (2011), A cluster validity index for fuzzy c-means clustering, Interational Conference on System Science, Engineering Design and Manufacturing Informatization, 2011 Int Conf (vol.2), pp 263– 266 [21] W Wang and X Xin, “Distance measure between intuitionistic fuzzy sets,” Pattern Recognition Letters, vol 26, no 13, pp 2063–2069, 2005 [22] Đỗ Văn Minh (2013), Ứng dụng phân cụm liệu phân tích, đánh giá kết điểm học sinh, Học viện Bưu Chính Viễn Thơng [23] An Hồng Sơn (2008), Nghiên cứu số thuật toán phân cụm mờ ứng dụng, Đại học Thái Nguyên [24] Đặng Thái Thịnh (2015), “Ứng dụng thuật toán phân cụm liệu để khai thác kết thi nhằm chuẩn hóa chất lượng đề thi trắc nghiệm”, Tạp chí khoa học công nghệ Đà Nẵng, Quyển Số 12 [25] Nguyễn Thị Thanh Thủy (2012), “Ứng dụng khai phá liệu xây dựng cơng cụ dự đốn kết học tập sinh viên”, Hội nghị sinh viên nghiên cứu khoa học lần Đại học Đà Nẵng ... cụm liệu giáo dục 1.4.1 Ứng dụng phân cụm liệu phân tích, đánh giá kết học tập học sinh Việc ứng dụng Đỗ Văn Minh – tác giả đề tài ? ?Ứng dụng phân cụm liệu phân tích đánh giá kết học tập học sinh? ??... GIÁ KẾT QUẢ HỌC TẬP CỦA SINH VIÊN SỬ DỤNG KỸ THUẬT PHÂN CỤM 42 3.1 Ứng dụng phân cụm liệu phân tích, đánh giá kết học tập sinh viên theo học phần chung 43 3.2 Ứng dụng phân cụm liệu. .. KMEANS phân tích đánh giá kết học tập sinh viên Phương pháp nghiên cứu Dựa thực trạng quản lý việc dạy học trường Cao đẳng Cần Thơ để nghiên cứu ứng dụng phân cụm liệu vào phân tích, đánh giá kết học

Ngày đăng: 25/08/2021, 16:34

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w