PHÁT TRIỂN THUẬT TOÁN xác ĐỊNH số cụm TRONG THUẬT TOÁN GOM cụm mờ và cài đặt ỨNG DỤNG

50 155 0
PHÁT TRIỂN THUẬT TOÁN xác ĐỊNH số cụm TRONG THUẬT TOÁN GOM cụm mờ và cài đặt ỨNG DỤNG

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA TP HCM TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN TRẦN THỊ THANH TRÚC PHÁT TRIỂN THUẬT TOÁN XÁC ĐỊNH SỐ CỤM TRONG THUẬT TOÁN GOM CỤM MỜ VÀ CÀI ĐẶT ỨNG DỤNG LUẬN VĂN THẠC SĨ NGÀNH KHOA HỌC MÁY TÍNH Mã số: 60.48.01 NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS.TS NGUYỄN ĐÌNH THN TP HỒ CHÍ MINH – Năm 2017 LỜI CAM ĐOAN Tôi xin cam đoan: (1) Luận văn sản phẩm nghiên cứu riêng tôi; (2) Các số liệu, kết đƣợc trình bày luận văn trung thực; (3) Tơi xin chịu trách nhiệm nghiên cứu Học viên Trần Thị Thanh Trúc MỤC LỤC DANH MỤC CÁC CHỮ VIẾT TẮT DANH MỤC CÁC BẢNG DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ MỞ ĐẦU CHƢƠNG 1: TỔNG QUAN VỀ ĐỀ TÀI 1.1 Lý chọn đề tài 1.2 Mục tiêu, đối tƣợng phạm vi nghiên cứu 1.2.1 Mục tiêu 1.2.2 Đối tƣợng 1.2.3 Phạm vi 1.3 Các đóng góp từ kết nghiên cứu luận văn 1.4 Bố cục luận văn CHƢƠNG 2: GOM CỤM DỮ LIỆU MỜ 10 2.1 Gom cụm liệu số kỹ thuật gom cụm 10 2.2 Bài toán gom cụm mờ 10 2.2.1 Giới thiệu gom cụm mờ 10 2.2.2 Thuật toán Fuzzy C_Mean (FCM) 15 2.3 Các phƣơng pháp xác định số cụm gom cụm liệu 19 2.3.1 Xác định số cụm dựa phƣơng pháp truyền thống 20 2.3.2 Xác định số cụm phƣơng pháp Eblow 20 2.3.3 Xác định số cụm dựa phƣơng pháp Cross Validation 23 2.3.4 Xác định số cụm sử dụng thuật toán thống kê khoảng cách 23 CHƢƠNG 3: THUẬT TOÁN XÁC ĐỊNH SỐ CỤM ĐỀ XUẤT 26 3.1 Tổng quan nghiên cứu phƣơng pháp xác định số cụm dựa độ nén độ chồng liệu 26 3.2 Xác định số cụm dựa độ nén độ chồng liệu 27 3.2.1 Độ nén (compactness): 27 3.2.2 Độ chồng (overlap): 32 3.2.3 Độ phân tách (separation): 33 3.3 Thuật toán xác định số lƣợng cụm tối ƣu 34 3.4 Thuật toán xác định số cụm tối ƣu thuật toán gom cụm mờ dựa hàm số đánh giá kết hợp độ chồng độ nén liệu 35 3.4.1 Sơ đồ thuật toán 35 3.4.2 Thuật toán dạng liệt kê 35 3.4.3 Xác định độ phức tạp thuật toán với n liệu đầu vào 36 3.5 Đánh giá thuật toán 37 CHƢƠNG 4: CÀI ĐẶT ỨNG DỤNG 38 4.1 Mục đích chƣơng trình 38 4.2 Cơ sở liệu 38 4.3 Các chức chƣơng trình 39 4.4 Kết luận 44 CHƢƠNG 5: KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 45 5.1 Kết luận 45 5.2 Hƣớng phát triển 45 TÀI LIỆU THAM KHẢO 46 DANH MỤC CÁC CHỮ VIẾT TẮT Ký hiệu Diễn giải DBLP Digital Bibliography & Library Project FPCM Fuzzy Possibilistic C-Means GG Gath-Geva 𝜀FCM 𝜀-Insensitive Fuzzy C- means (𝜀FCM) THPT Trung học phổ thông DANH MỤC CÁC BẢNG Bảng 3.1 Bảng tính độ phức tạp thuật tốn 36 Bảng 3.2 Đánh giá thuật toán đề xuất 37 DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ Hình 2.1 Ví dụ gom cụm liệu 10 Hình 2.2 Gom cụm tập liệu với số lƣợng cụm khác 19 Hình 2.3 "Eblow" đƣợc định vòng tròn màu đỏ 20 Hình 2.4 Ví dụ áp dụng phƣơng pháp Eblow cho K-means 21 Hình 2.6 Ví dụ áp dụng phƣơng pháp Eblow cho PAM 22 Hình 2.6 Ví dụ áp dụng thuật tốn thống kê khoảng cách cho K-means 24 Hình 2.7 Ví dụ áp dụng thuật toán thống kê khoảng cách cho PAM 25 Hình 3.1 Ví dụ độ nén 28 Hình 3.2 Độ nén cụm liệu 28 Hình 3.3 Biểu đồ minh họa độ nén 29 Hình 3.4 Hàm liên thuộc dạng sin 29 Hình 3.5 Hàm liên thuộc tuyến tính 30 Hình 3.6 Hình minh họa độ chồng 32 Hình 3.7 Hình minh họa độ phân tách 33 Hình 3.8 Quá trình ƣớc lƣợng số cụm tối ƣu 34 Hình 4.1 Cơ sở liệu điểm trƣờng THPT 38 Hình 4.2 Màn hình khởi động 40 Hình 4.3 Hình minh họa chức gom cụm liệu 41 Hình 4.4 Hình minh họa kết gom cụm liệu với tùy chọn 01 42 Hình 4.5 Hình minh họa kết gom cụm liệu với tùy chọn 02 43 Hình 4.6 Hình minh họa kết gom cụm liệu với tùy chọn 03 44 MỞ ĐẦU Với bùng nổ phát triển công nghệ thông tin mang lại nhiều hiệu khoa học nhƣ hoạt động thực tế, khai phá liệu lĩnh vực mang lại hiệu thiết thực cho ngƣời Khai phá liệu giúp ngƣời thu đƣợc tri thức hữu ích từ sở liệu kho liệu khổng lồ khác Khai phá liệu ngày trở nên quan trọng lĩnh vực nhận đƣợc nhiều quan tâm Để tiến hành khai phá liệu có nhiều phƣơng pháp khác nhau, nhƣng phƣơng pháp gom cụm liệu đƣợc sử dụng nhiều Trong gom cụm ta có hai hƣớng gom cụm rõ gom cụm mờ Gom cụm rõ đƣợc hiểu ta có tập liệu X, ta kiểm tra điểm liệu xem giống với đặc điểm nhóm ta gán điểm liệu vào nhóm Nhƣng thực tế khơng phải lúc toán gom cụm rõ áp dụng đƣợc Gom cụm mờ phƣơng pháp gom cụm liệu mà cho phép điểm liệu thuộc hai nhiều cụm thông qua bậc thành viên hay độ thuộc Gom cụm mờ đƣợc sử dụng rộng rãi gom cụm liệu với số cụm đƣợc cho trƣớc Để tăng tính hiệu q trình gom cụm ngƣời ta có nhu cầu xác định trƣớc số cụm tiến hành gom cụm Do mục tiêu luận văn phát triển thuật toán xác định số cụm thuật toán gom cụm mờ cài đặt ứng dụng Chƣơng 1: Tổng quan đề tài CHƢƠNG 1: TỔNG QUAN VỀ ĐỀ TÀI 1 Lý chọn đề tài Trƣờng THPT Chuyên Long An đƣợc thành lập năm 2009 Từ ngày thành lập đến nay, trƣờng không ngừng phát triển trở thành trƣờng trọng điểm tỉnh Long An Năm học 2013- 2014, trƣờng có điểm thi đại học với mức trung bình 21,5 xếp hạng thứ 10 tồn quốc Do đó, kết thi tuyển sinh vào đai học hàng năm đƣợc bậc phụ huynh học sinh, ban giám hiệu giáo viên quan tâm nên việc theo sát tình hình học tập học sinh quan trọng Học sinh vừa phải chịu áp lực việc ơn tập kiến thức đối mặt với vấn đề chọn lớp học phù hợp với lực, sở thích đồng thời phải đạt đƣợc kết tốt kỳ thi quan trọng Bộ phận phụ trách quản lý điểm trƣờng THPT Chuyên Long An phối hợp với phụ huynh, ban giám hiệu, giáo viên môn tƣ vấn việc chọn lớp ôn tập cho thi trung học phổ thông quốc gia để em hiểu biết chọn nguyện vọng tham gia kỳ thi, tránh tình trạng chọn nhằm lớp ảo tƣởng lực, giúp học sinh ổn định mặt tâm lý, chuẩn bị tâm sẵn sàng bƣớc vào kì thi, góp phần nâng cao chất lƣợng kì tuyển sinh Từ cho thấy, giáo viên, phụ huynh, học sinh cần có cơng cụ mang tính khoa học để làm sở tham khảo việc định hƣớng lựa chọn lớp học phù hợp với lực học tập học sinh Xuất phát từ nhu cầu thực tế này, luận văn xây dựng ứng dụng chọn lớp ôn luyện thi trung học phổ thông quốc gia cho trƣờng THPT Chuyên Long An, nhằm góp thêm giải pháp giúp học sinh chọn lớp học theo lực, giảm bớt áp lực thi cử, đồng thời hỗ trợ công tác quản lý chuyên môn nhà trƣờng, đồng thời giúp phụ huynh học sinh có định hƣớng đắn cho học sinh việc lựa chọn tổ hợp ôn luyện kỳ thi trung học phổ thông quốc gia Ứng dụng đƣợc xây dựng dựa sở liệu điểm học sinh trƣờng THPT Chuyên Long An với đặc điểm tốn gom cụm mờ Với liệu điểm trung bình mơn học học sinh học sinh chọn đƣợc lớp ôn luyện khác tùy theo mức độ điểm trung bình Có nhiều thuật toán gom cụm mờ đƣợc đề xuất để giải toán gom cụm mờ Tuy nhiên thuật tốn gom cụm nhƣ gom cụm mờ số Chƣơng 1: Tổng quan đề tài cụm thƣờng đƣợc xác định ngẫu nhiên cho trƣớc nên làm giảm hiệu việc gom cụm Vì vậy, có nhiều phƣơng pháp xác định số cụm tối ƣu đƣợc đề xuất với ƣu điểm nhƣợc điểm khác Trên sở luận văn đề xuất phƣơng pháp xác định số cụm tối ƣu cho thuật toán gom cụm mờ dựa độ nén độ chồng liệu để tăng hiệu thuật toán gom cụm mờ tiến hành cài đặt sở liệu điểm trƣờng THPT Chuyên Long An Mục tiêu, đối tƣợng phạm vi nghiên cứu 1.2.1 Mục tiêu Nghiên cứu toán gom cụm mờ, thuật toán gom cụm mờ, phƣơng pháp xác định số cụm gom cụm mờ Đề xuất thuật toán xác định số cụm thuật toán gom cụm mờ dựa độ nén độ chồng liệu Xây dựng ứng dụng chọn lớp ôn luyện thi THPT quốc gia cho ban giám hiệu, phụ huynh học sinh, học sinh trƣờng THPT Chuyên Long An 1.2.2 Đối tƣợng Dữ liệu bao gồm: thông tin cá nhân, lớp chuyên đăng ký học kết điểm trung bình mơn học theo năm học sinh Lý thuyết: toán gom cụm mờ, thuật toán gom cụm mờ, phƣơng pháp xác định số cụm tối ƣu đƣợc nghiên cứu, thuật toán xác định số cụm tối ƣu đề xuất dựa độ nén độ chồng liệu Đối tƣợng phục vụ sản phẩm ứng dụng: Cung cấp cho nhà trƣờng, phụ huynh học sinh công cụ tƣ vấn lựa chọn lớp ôn thi THPT quốc gia phù hợp với lực học tập học sinh 1.2.3 Phạm vi Phạm vi nghiên cứu luận văn là: lý thuyết toán gom cụm mờ, thuật toán gom cụm mờ FCM, phƣơng pháp xác định số cụm tối ƣu đƣợc nghiên cứu, lý thuyết độ nén độ chồng liệu Dữ liệu điểm trƣờng THPT Chuyên Long An dùng để thực nghiệm phƣơng pháp xác định số cụm mờ cài đặt ứng dụng Các đóng góp từ kết nghiên cứu luận văn Chƣơng 3: Thuật toán xác định số cụm đề xuất BSS=  Ci (m  mi )2 (3.11) Ci kích thước nhóm thứ i 3.3 Thuật toán xác định số lƣợng cụm tối ƣu Việc ƣớc lƣợng số cụm tối ƣu thƣờng đƣợc thực nhờ xác định cực trị hàm số đánh giá chất lƣợng gom cụm (cluster validity index) chọn trƣớc 3.3.1 Quá trình tìm số lƣợng cụm tối ƣu Bƣớc 1: Thực lặp thuật toán gom cụm với số cụm c lần lƣợt nhận giá trị khoảng [cmin , cmax] cho trƣớc; Bƣớc 2: Tính toán giá trị số đánh giá gom cụm (validity index) cho kết gom cụm bƣớc 1; Bƣớc 3: Chọn số cụm tối ƣu c* ứng với kết gom cụm tốt theo tiêu chí số chọn; Bƣớc 4: So sánh c* với thơng tin ngồi có 3.3.2 Sơ đồ minh họa trình tìm số lƣợng cụm tối ƣu: Tập Tập liệu liệu Thuật toán phân Thuật toáncụm gom Giá trị số c minc, cmax ,c  c[c  max]  ChỉChỉ số đánhsốgiá đánh giá cụm Số cụm Hình 16Hình 3.8 Quá trình ƣớc lƣợng số cụm tối ƣu Trong đó, cmin cmax thƣờng chọn cmin = chọn cmax ≤ 34 n Chƣơng 3: Thuật toán xác định số cụm đề xuất 3.4 Thuật toán xác định số cụm tối ƣu thuật toán gom cụm mờ dựa hàm số đánh giá kết hợp độ chồng độ nén liệu 3.4.1 Sơ đồ thuật tốn Q trình xử lý Tính độ nén liệu (Compactness) input Cơ sở liệu Tính độ chồng liệu (Overlap) Tính số F= Compactness - Overlap Tìm giá trị F đạt cực đại Số cụm tối ƣu sử dụng trình gom cụm mờ (FCM) output Tìm giá trị c mà giá trị F đạt cực đại 3.4.2 Thuật toán dạng liệt kê Bƣớc 1: Xác định độ nén (Compactness) 𝐶𝑜𝑚𝑝𝑎𝑐𝑡𝑛𝑒𝑠𝑠 (𝑐, 𝑈)= i1  j1uij2 / uM , uM  max1ic  j1uij2 (3.12) c n n Bƣớc 2: Xác định mức độ chồng cụm mờ 𝑂𝑣𝑒𝑟𝑙𝑎𝑝(c, U)= c1 a1 ba1Oab (c,U ) Với O(a, b) (c,U )  c (3.13) n O (c,U ), a, b  1, c; a  b (3.14) n  j 1 abj 35 Chƣơng 3: Thuật toán xác định số cụm đề xuất Độ chồng Oab (c,U:Ca,Cb ) hai cụm Ca,và Cb đƣợc tính tốn từ mức độ chồng Oabj (c,U:Ca,Cb ) đối tƣợng liệu xj mà liên thuộc đủ mạnh tới hai cụm mờ Ca,và Cb Giá trị độ chồng Oab (c,U:Ca,Cb ) hai cụm Ca,và Cb nhỏ cho biết hai cụm chồng nhỏ hay độ phân tách chúng cao Giá trị T0 nhỏ cho phép số hiệu lực trƣờng hợp cụm chồng [17] Độ chồng hai cụm có tính giao hoán: Oab (c,U:Ca,Cb ) = Oba (c,U:Cb,Ca ) (3.15) Bƣớc 3: Xác định số đánh giá số cụm thuật toán gom cụm mờ dựa vào độ chồng độ nén liệu 𝐹 = 𝐶𝑜𝑚𝑝𝑎𝑐𝑡𝑛𝑒𝑠𝑠(𝑐, 𝑈) - 𝑂𝑣𝑒𝑟𝑙𝑎𝑝 (𝑐, 𝑈) (3.16) Bƣớc 4: Xác định số cụm c mà F đạt giá trị cực đại 3.4.3 Xác định độ phức tạp thuật toán với n liệu đầu vào Bảng 3.1 Bảng tính độ phức tạp thuật toán STT Các bƣớc thuật toán Độ phức tạp Bƣớc O(n2) Bƣớc O(n) Bƣớc O(1) Bƣớc O(n) Độ phức tạp thuật toán O(n2) 36 Chƣơng 3: Thuật toán xác định số cụm đề xuất 3.5 Đánh giá thuật toán Bảng 2Bảng 3.2 Đánh giá thuật toán đề xuất Thuật toán xác Các phƣơng pháp xác định định số cụm đề xuất số cụm phổ biến Tiêu chí xác định số Xác định dựa Xác định dựa tiêu chí cụm tiêu chí hình học: độ số liệu N thử sai nén độ chồng giá trị số cụm K Nội dung 37 Chƣơng 4: Cài đặt ứng dụng CHƢƠNG 4: CÀI ĐẶT ỨNG DỤNG 4.1 Mục đích chƣơng trình Dựa điểm trung bình mơn học, điểm trung bình học kỳ, năm học sinh, lớp, khối gom cụm liệu nhằm phân tích điểm số để đƣa nhìn đa dạng hơn, đa chiều hơn, nhiều góc độ khác điểm số giúp cho Ban giám hiệu, nhà quản lý giáo dục có thêm sở để đánh giá đắn nhất, xác tình hình học tập học sinh, hoạt động giảng dạy giáo viên từ đề định hƣớng, hoạch định cho nhà trƣờng việc nâng cao chất lƣợng giáo dục 4.2 Cơ sở liệu Hình 17 Hình 4.1 Cơ sở liệu điểm trƣờng THPT 38 Chƣơng 4: Cài đặt ứng dụng 4.3 Các chức chƣơng trình 4.3.1 Đặc tả chức Gom cụm theo môn học Phân cụm theo môn học Gom cụm theo ngành Phân cụm theo ngành học học Người dùng Gom theo cụm Phân cụm theocụm số lượng số lƣợng cụm Thốt chƣơng trình Thốt chương trình 39 Chƣơng 4: Cài đặt ứng dụng 4.3.2 Màn hình khởi động ỨNG DỤNG THUẬT TOÁN GOM CỤM MỜ VÀO KHAI THÁC CƠ SỞ DỮ LIỆU Hình 18 Hình 4.2 Màn hình khởi động 40 Chƣơng 4: Cài đặt ứng dụng 4.3.2.1 Gom cụm liệu : thực việc gom cụm liệu Hình 19 Hình 4.3 Hình minh họa chức gom cụm liệu Gồm chức chính: • Gom cụm theo điểm trung bình năm • Gom cụm theo điểm trung bình mơn học Trong cho phép chọn lại: Khối lớp cần phân tích số cụm cần phân tích • Trong phần Gom cụm theo điểm trung bình mơn học cho phép chọn mơn nhiều mơn • Hai mơn hai nhóm mơn lúc • Số cụng đƣợc tính theo phƣơng pháp truyền thống phƣơng pháp độ chồng nén liệu 41 Chƣơng 4: Cài đặt ứng dụng Hình 20 Hình 4.4 Hình minh họa kết gom cụm liệu với tùy chọn 01 Kết quả: - Số cụm: - Tâm cụm lớn nhất: ~7 - Trung bình lớn là: 8.5 - Trung bình nhỏ nhất: 42 Chƣơng 4: Cài đặt ứng dụng Hình 21Hình 4.5 Hình minh họa kết gom cụm liệu với tùy chọn 02 Kết quả: - Số cụm:7 - Tâm cụm lớn ~7.3 - Trung bình lớn là: 9.4 - Trung bình nhỏ nhất: 43 Chƣơng 4: Cài đặt ứng dụng Hình 22 Hình 4.6 Hình minh họa kết gom cụm liệu với tùy chọn 03 Kết quả: - Số cụm:7 - Tâm cụm lớn ~6.2 - Trung bình lớn là: 9.4 - Trung bình nhỏ nhất: 0.9 4.4 Kết luận Gom cụm liệu việc phân tích, đánh giá kết học tập học sinh dựa điểm trung bình mơn học, điểm trung bình học kỳ … bƣớc đầu nhiều giúp cho Ban giám hiệu nhà trƣờng, nhà quản lý giáo dục có đƣợc nhìn nhiều chiều hơn, đa dạng hơn, nhiều góc cạnh điểm số học sinh từ thu đƣợc số kết nhƣ : việc phân lớp, lựa chọn học sinh giỏi để bồi dƣỡng, phát học sinh yếu để phụ đạo … nhƣ đề kế hoạch giảng dạy, tăng tăng tiết, định hƣớng nghề nghiệp cho học sinh qua việc chọn ban khối thi Đại học v.v… 44 Chƣơng 5: Kết luận hƣớng phát triển CHƢƠNG 5: KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 5.1 Kết luận Để phát triển thuật toán xác định số cụm thuật toán gom cụm mờ cài đặt ứng dụng luận văn tiến hành nghiên cứu vấn đề về: tổng quan gom cụm liệu, phƣơng pháp xác định số cụm tối ƣu q trình gom cụm, tốn gom cụm mờ, thuật toán gom cụm mờ Từ kết nghiên cứu vấn đề liên quan luận văn đề xuất thuật toán xác định số cụm tối ƣu thuật toán gom cụm mờ dựa độ chồng độ nén liệu Dựa kết nghiên cứu luận văn tiến hành cài đặt ứng dụng sở liệu trƣờng THPT Ứng dụng cài đặt dựa sở liệu trƣờng THPT chƣơng trình tƣ vấn cho nhà trƣờng, phụ huynh, học sinh việc chọn lớp ôn thi THPT quốc gia hiệu 5.2 Hƣớng phát triển Luận văn phát triển thuật toán xác định số cụm thuật toán gom cụm mờ đƣợc nghiên cứu dựa thuật toán gom cụm mờ FCM Do cần nghiên cứu phát triển thuật toán xác định số cụm tối ƣu dựa thuật toán gom cụm mờ khác để đạt hiệu suất tốt Luận văn đề xuất phƣơng pháp đánh giá số cụm tối ƣu dựa kết hợp độ chồng độ nén liệu Trong luận văn có đề cập tới độ phân tách, tƣơng lai phát triển thuật tốn xác định số cụm tối ƣu dựa kết hợp độ chồng, độ nén, độ phân tách liệu Luận văn chƣa so sánh phƣơng pháp đánh giá đề xuất so với phƣơng pháp đánh giá số cụm tối ƣu khác nên tƣơng lai tiến hành thực nghiệm để so sánh phƣơng pháp xác định số cụm tối ƣu đề xuất với phƣơng pháp xác định số cụm tối ƣu khác 45 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Hoàng Thị Minh Châu (2010), Phân cụm mờ ngữ cảnh ứng dụng, Luận văn thạc sĩ Khoa học máy tính, Trường Đại học Khoa học Tự nhiên – ĐHQGHN, Hà Nội [2] Nguyễn Đình Thn, Đồn Huấn (2012), “Sử dụng thuật toán gom cụm mờ khai phá sở liệu ERP doanh nghiệp dƣợc phẩm”, Hội thảo Quốc gia lần thứ XIV, Cần Thơ, NXB Khoa học Kỹ thuật Hà Nội, 2012, trang 488-498 Tiếng Anh [3] Izakian and Abraham (2011), Fuzzy C-means and fuzzy swarm for fuzzy clustering problem, Expert System with applications, University of Maryland [4] Shah, J.Z and Salim (2005), FCM& G-K Clustering of Chemical Datasets using Topological Indices, International Symposium, Bio-Inspired, [5] Chunguang Bai, Dileep Dhavale, Joseph Sarkis (2015), Complex Investment Decisions Using Rough Set and Fuzzy C-Means: An Example of Investment in Green Supply Chains, European Journal of Operational Research, Europe [6] Dr.A.Joshi, Dr.V.Subedha, Vidhya.E, Vaishnavi.S (2016), “Clustering Data Using Fuzzy C-Means by Determining the Number of Clusters Using Gap Statistics”, Expert System with applications (34), pp 125-136 [7] Robert Tibshirani, Guenther Walther, Trevor Hastie (2001), “Estimate the number cluster in a data set via the gap statistic ” J R Sta [8] Chen Duo, Li Xue, Cui Du-Wu (2007), “An adaptive cluster validity index for the Fuzzy C-means”, IJCSNS International Journal of Computer Science and Network Security (Vol.7 No.2), pp 146-156 [9] D.W Kim, K.H Lee, D Lee (2004), “On cluster validity index for estimation of the optimal number of fuzzy clusters”, Pattern Recognition (37), pp 2009–2025 [10] G Grekousis, H Thomas (2012), “Comparison of two fuzzy algorithms in geodemographic segmentation analysis: The Fuzzy GustafsoneKessel methods”, Applied Geography (34), pp 125-136 46 C-Means and [11] J.C Bezdek, R Ehrlich, W Full (1984), FCM: “The fuzzy c-Means clustering algorithm”, Computers & Geosciences (Vol 10, No 2-3), pp 191-203 [12] János Abonyi, Balázs Feil (2007), “Cluster Analysis for Data Mining and system identification”, Birkhäuser Basel – Boston – Berlin, pp 17-28 [13] Jiawei Han, Micheline Kamber (2006), Data Mining : Concepts and Techniques, Morgan Kaufmann Publishers 2nd edition [14] Jiawei Han, Micheline Kamber, Jian Pei (2011), Data Mining : Concepts and Techniques, Morgan Kaufmann Publishers 3rd edition [15] Jianhua Yang (2002), Algorithmic engineering of clustering and cluster validity with applications to web usage mining, School of Electrical Engineering and Computer Science, Australia [16] K.L.Wu, M.S.Yang (2005), “A cluster validity index for fuzzy clustering, Pattern Recognition”, Lett (26), pp 1275–1291 [17] K.R Zalik (2010), “Cluster validity index for estimation of fuzzy clusters of different sizes and densities”, Pattern Recognition (43), pp 3374-3390 [18] M D Mahecha, A Martinez, H.Lange, Markus Reichstein, Erwin Beck (2009), “Identification of characteristic plant co-occurrences in neotropical secondary montane forests”, Journal of Plant Ecology (vol 2, no 1), pp 31-41 [19] M Halkidi, Y Batistakis, M Vazirgiannis (2001), “On clustering validation techniques”, Journal of Intelligent Information Systems (17), pp 107–145 [20] M Ramze Rezaee, B.P.F Lelieveldt, J.H.C Reiber (1998), “A new cluster validity index for the fuzzy c-mean”, Pattern Recognition Letters (19), pp 237–246 [21] N R Pal, J C Bezdek (1995), “On cluster valitidy for the fuzzy c-means model”, IEEE Transactions on fuzzy system (vol 3, no 3), pp 370-379 [22] Q Zhao (2012), Cluster validity in clustering methods, Publications of the University of Eastern Finland [23] Roburt Babuska (2004), “Fuzzy and neural control, DISC Course Lecture Notes”, Pattern Recognition (44), pp 59-72 [24] R.N Dave (1996), “Validating fuzzy partition obtained through cshells clustering”, Pattern Recognition Lett (17), pp 613–623 47 [25] R.Suganya, R.Shanthi (2012), “Fuzzy C-Means Algorithm- A Review”, International Journal of Scientific and Research Publications (Volume 2), pp 2250 – 3153 [26] S Ghosh, S.K Dubey (2013), “Comparative Analysis of K-Means and Fuzzy C- Means Algorithms”, International Journal of Advanced Computer Science and Applications (Vol 4, No.4), pp 35-39 [27] S.H Kwon (1998), “Cluster validity index for fuzzy clustering”, Electron Lett 34 (22), pp 2176–2177 [28] X.L Xie, G Beni (1991), “A validity measure for fuzzy clustering”, IEEE Trans Pattern Anal Mach Intell (13), pp 841–847 [29] Y.HUI, Ch Zuo, Y Yag, F Qu (2011), “A cluster validity index for fuzzy cmeans clustering”, Interational Conference on System Science, Engineering Design and Manufacturing Informatization, 2011 Int Conf (vol.2), pp 263 – 266 [30] W Wang, Y Zhang (2007), “On fuzzy cluster validity indices”, ScienceDirect (vol.158), pp 2095-2117 [31] Yanchi Liu, Zhongmou Li, Hui Xiong, Xuedong Gao, Junjie Wu (2010), “Understanding of Internal Clustering Validation Measures”, IEEE International Conference on Data Mining (vol.3), pp 321- 328 48 ... Nghiên cứu toán gom cụm mờ, thuật toán gom cụm mờ, phƣơng pháp xác định số cụm gom cụm mờ Đề xuất thuật toán xác định số cụm thuật toán gom cụm mờ dựa độ nén độ chồng liệu Xây dựng ứng dụng chọn... Gom cụm liệu mờ Chƣơng đề cập toán gom cụm mờ, thuật toán gom cụm mờ, phƣơng pháp xác định số cụm toán gom cụm mờ Chƣơng 3: Thuật toán xác định số cụm tối ƣu đề xuất Chƣơng đề cập tới thuật toán. .. toán gom cụm mờ, thuật toán gom cụm mờ, phƣơng pháp xác định số cụm tối ƣu đƣợc nghiên cứu, thuật toán xác định số cụm tối ƣu đề xuất dựa độ nén độ chồng liệu Đối tƣợng phục vụ sản phẩm ứng dụng:

Ngày đăng: 23/12/2018, 06:13

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan