Khảo sát ứng dụng các thuật toán K-Means, Fuzzy C-Means, và Rough Fuzzy C-Means vào phân đoạn hình ảnh y tế

47 3.3K 24
Khảo sát ứng dụng các thuật toán K-Means, Fuzzy C-Means, và Rough Fuzzy C-Means vào phân đoạn hình ảnh y tế

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN - CHƯƠNG TRÌNH ĐÀO TẠO THẠC SĨ CNTT QUA MẠNG MÔN KHAI PHÁ DỮ LIỆU VÀ KHO DỮ LIỆU ĐỀ TÀI: Giảng viên: PGS.TS Đỗ Phúc Học viên: Nguyễn Mai Thương - MSHV: CH1101124 Tp.HCM, Tháng 11/2012 Khai phá liệu kho liệu P PGS.TS Đỗ Phúc LỜI MỞ ĐẦU hân đoạn trình phân chia vùng khơng gian hình ảnh vào số khu vực khơng bị chồng chéo phải có đồng Sự thành công hệ thống phân tích hình ảnh phụ thuộc nhiều vào chất lượng phân đoạn hình ảnh Trong việc phân tích hình ảnh y tế cho máy tính hỗ trợ chẩn đốn điều trị, trình phân đoạn thường yêu cầu giai đoạn sơ Tuy nhiên, phân vùng hình ảnh y tế thực phức tạp nên việc phân đoạn xác quan trọng cho việc phát khối u, phù nề, mơ hoại tử để từ đề phương pháp điều trị thích hợp Trong cơng nghệ hình ảnh y tế, số cơng cụ phổ biến cho việc chẩn đốn gồm X-Ray, máy tính chụp cắt lớp (CT), chụp ảnh cộng hưởng từ (MRI), máy xa hình (PET)… Trong đó, MRI kỹ thuật quan trọng chẩn đốn hình ảnh nhằm phát sớm thay đổi bất thường mơ quan Nó có lợi độc đáo phương pháp khác cung cấp hình ảnh đa phổ mô với loạt tương phản dựa ba tham số MR ρ, T1, T2 Vì vậy, phần lớn nghiên cứu phân đoạn hình ảnh y tế tập trung chủ yếu vào hình ảnh máy MR Theo tiến khoa học nay, hình ảnh não người chụp máy MR thể trực quan chất lượng nhờ vào X-quang Tuy nhiên, nghiên cứu tiên tiến y tế địi hỏi hình ảnh phải có thơng tin định lượng, chẳng hạn kích thước não tâm thất sau chấn thương não khối lượng tương đối tâm thất đến não Các phương pháp chụp hay đánh giá cách tự động đơi thất bại, kết khơng xác địi hỏi phải có can thiệp đánh giá người Điều thường hay xảy hạn chế thu thập hình ảnh, biến đổi không ngừng bệnh lý học sinh học Vì vậy, điều quan trọng cần có phương pháp đáng tin cậy để đo cấu trúc khác não Một phương pháp phân đoạn hình ảnh để lập đối tượng khu vực hình ảnh cần quan tâm CH1101124 - Nguyễn Mai Thương Trang Khai phá liệu kho liệu PGS.TS Đỗ Phúc Trong phần thu hoạch em xin trình bày thuật tốn phân cụm hình ảnh sử dụng rộng rãi hiệu y tế K-means, Fuzzy C-Means (FCM) Rough Fuzzy C-Means (RFCM); so sánh thực nghiệm kết phân tích hình ảnh thuật tốn lược dịch dựa phân tích Rough-Fuzzy Clustering Algorithm for Segmentation of Brain MR tác giả Pradipta Maji Sankar K Pal thuộc Machine Intelligence Unit, Indian Statistical Random Versus Discriminant Analysis Based Institute, Kolkata, 700 108, India Trong phần cài đặt chương trình, em xin trình bày cài đặt thuật toán K-means Fuzzy C-Means để minh họa cho trình phân cụm Vì thời gian nghiên cứu có hạn nên khơng tránh khỏi sai sót, mong góp ý, phê bình từ thầy cô bạn Em xin chân thành cảm ơn: - Trường Đại Học Công Nghệ Thông Tin TP HCM phịng khoa học máy tính tạo điều kiện cho em nghiên cứu học tập - Thầy PGS.TS Đỗ Phúc tận tâm giảng dạy giúp đỡ em suốt trình học tập nghiên cứu lý thuyết phân cụm liệu - Các anh chị học viên lớp CH6 giúp đỡ em suốt trình học, trau đổi, thực đồ án hoàn thành tập Em xin chân thành cảm ơn ! CH1101124 - Nguyễn Mai Thương Trang Khai phá liệu kho liệu PGS.TS Đỗ Phúc CÁC THUẬT NGỮ DÙNG TRONG BÀI VIẾT Centroid: trọng tâm, trung tâm khối lượng Cluster: cụm Cluster analysis: phân tích cụm Fuzzy cluster: cụm mờ Pixel: điểm ảnh Membership: tính liên thuộc, độ liên thuộc Membership function: hàm liên thuộc Noisy data: liệu nhiễu Objective function: hàm mục tiêu Outliers: phần tử biên Segmentation: phân đoạn hóa Rough set: tập thơ Fuzzy factor: tham số mờ hóa Partition: phân hoạch Rough Fuzzy C-Means (RFCM) algorithm: thuật toán Rough Fuzzy C-Means cho việc gom cụm thơ mờ Fuzzy C-Means (FCM) algorithm: thuật tốn Fuzzy C-Means cho việc gom cụm mờ CH1101124 - Nguyễn Mai Thương Trang Khai phá liệu kho liệu PGS.TS Đỗ Phúc MỤC LỤC CH1101124 - Nguyễn Mai Thương Trang Khai phá liệu kho liệu PGS.TS Đỗ Phúc CHƯƠNG I: TỐNG QUAN VỀ PHÂN CỤM DỮ LIỆU I Phân cụm liệu Clustering Phân cụm (clustering) liệu phương pháp nhóm tập hợp liệu lớn thành tập nhỏ có liệu tương tự Ví dụ: Tập hợp bóng có nhiều màu sắc Hình 1.1 Hình 1.1 Khi đó, bóng có màu sắc phân cụm vào nhóm liệu nhỏ Kết quả: Hình 1.2 Kết sau phân cụm Hard clustering Phân cụm cứng phương pháp gán vector đặc trưng vào cụm với độ liên thuộc xác định rõ ranh giới cụm (sử dụng phân cụm rõ) Hình 2.1 Hard clustering Fuzzy Clustering CH1101124 - Nguyễn Mai Thương Trang Khai phá liệu kho liệu PGS.TS Đỗ Phúc Phân cụm mờ cho phép vector đặc trưng thuộc nhiều cụm với độ liên thuộc khác (có giá trị nằm 1) có mơ hồ mờ ranh giới cụm Hình 3.1 Phân cụm mờ Các yêu cầu phân cụm • Có khả mở rộng: Nhiều thuật toán phân cụm làm việc tốt với tập liệu nhỏ chứa 200 đối tượng, nhiên, sở liệu (CSDL) lớn chứa tới hàng triệu đối tượng Việc phân cụm với tập liệu lớn làm ảnh hưởng tới kết Vậy làm cách để phát triển • thuật tốn phân cụm có khả mở rộng cao CSDL lớn Khả thích nghi với kiểu thuộc tính khác nhau: Nhiều thuật toán thiết kế cho việc phân cụm liệu có kiểu khoảng (kiểu số) Tuy nhiên, nhiều ứng dụng địi hỏi việc phân cụm với nhiều kiểu liệu khác nhau, kiểu nhị phân, kiểu tường minh (định danh - không thứ tự), liệu có thứ tự hay dạng • hỗn hợp kiểu liệu Khám phá cụm với hình dạng bất kỳ: Nhiều thuật tốn phân cụm xác định cụm dựa phép đo khoảng cách Euclidean khoảng cách Manhattan Các thuật toán dựa phép đo hướng tới việc tìm kiếm cụm hình cầu với mật độ kích cỡ tương tự Tuy nhiên, cụm có hình dạng Do đó, việc phát triển thuật tốn khám phá cụm có hình dạng việc làm quan trọng CH1101124 - Nguyễn Mai Thương Trang Khai phá liệu kho liệu • PGS.TS Đỗ Phúc Tối thiểu lượng tri thức cần cho xác định tham số đầu vào: Nhiều thuật toán phân cụm yêu cầu người dùng đưa vào tham số định phân tích • phân cụm (như số lượng cụm mong muốn) Khả thích nghi với liệu nhiễu: Hầu hết CSDL thực chứa đựng liệu ngoại lai, liệu lỗi, liệu chưa biết liệu sai Một số thuật toán phân cụm nhạy cảm với liệu dẫn đến chất lượng phân cụm • thấp Ít nhạy cảm với thứ tự liệu vào: Một số thuật toán phân cụm nhạy cảm với thứ tự liệu vào, ví dụ với tập liệu, đưa với thứ tự khác với thuật tốn sinh cụm khác Do đó, việc quan trọng phát triển thuật tốn mà nhạy cảm với • thứ tự vào liệu Số chiều lớn: Một CSDL kho liệu chứa số chiều số thuộc tính Nhiều thuật tốn phân cụm áp dụng tốt cho liệu với số chiều thấp, bao gồm từ hai đến chiều Người ta đánh giá việc phân cụm có chất lượng tốt áp dụng cho liệu có từ chiều trở lên Nó thách thức với đối tượng liệu cụm không gian với số chiều lớn, đặc biệt • xét khơng gian với số chiều lớn thưa có độ nghiêng lớn Phân cụm ràng buộc: Nhiều ứng dụng thực tế cần thực phân cụm loại ràng buộc khác Một nhiệm vụ đặt tìm nhóm liệu • có trạng thái phân cụm tốt thỏa mãn ràng buộc Dễ hiểu dễ sử dụng: Người sử dụng chờ đợi kết phân cụm dễ hiểu, dễ lý giải dễ sử dụng Nghĩa là, phân cụm cần giải thích ý • • • • • • nghĩa ứng dụng rõ ràng Các kỹ thuật phân cụm Phương pháp phân cụm phân hoạch Phương pháp phân cụm phân cấp Phương pháp phân cụm dựa mật độ Phương pháp phân cụm dựa lưới Phương pháp phân cụm dựa mơ hình Phương pháp phân cụm có liệu ràng buộc Hiện nay, phương pháp phân cụm phát triển áp dụng nhiều lĩnh vực khác có số nhánh nghiên cứu phát triển sở phương pháp như: CH1101124 - Nguyễn Mai Thương Trang Khai phá liệu kho liệu PGS.TS Đỗ Phúc Phân cụm thống kê: Dựa khái niệm phân tích hệ thống, nhánh nghiên cứu sử dụng độ đo tương tự để phân hoạch đối tượng, chúng áp dụng cho liệu có thuộc tính số • Phân cụm khái niệm: Kỹ thuật phát triển áp dụng cho liệu hạng mục, chúng phân cụm đối tượng theo khái niệm mà chúng xử lí • Phân cụm mờ: Sử đụng kỹ thuật mờ để PCDL Các thuật toán thuộc loại lược đồ phân cụm thích hợp với tất hoạt động đời sống hang ngày, chúng xử lí liệu thực khơng chắn • Phân cụm mạng Kohonen: Loại phân cụm dựa khái niệm mạng • nơron Mạng Kohonen có tầng nơron vào tầng nơron Mỗi nơron tầng vào tương ứng với thuộc tính ghi, nơron vào kết nối với tất nơron tầng Mỗi liên kết gắn liền với trọng số nhằm xác định vị trí nơron tương ứng II Một số ứng dụng phân cụm liệu Biểu diễn liệu gene Phân cụm phân tích sử dụng thường xuyên biểu diễn liệu gene (Yeung et al., 2003; Eisen at al., 1998) Dữ liệu biểu diễn gene tâp hợp phép đo lấy từ DNA (còn gọi DNA chip hay gene chip) thủy tinh nhựa có gắn đoạn DNA thành hàng siêu nhỏ Các nhà nghiên cứu sử dụng chip để sàng lọc mẫu sinh học nhằm kiểm tra có mặt hàng loạt trình tự lúc Các đoạn DNA gắn chip gọi probe (mẫu dò) Trên điểm chip có hàng ngàn phân tử probe với trình tự giống Một tập hợp liệu biểu diễn gene biểu diễn thành ma trận giá trị thực: Trong đó: - n số lượng gen - d số lượng mẫu hay điều kiện thử - thước đo biểu diễn mức gen i mẫu j CH1101124 - Nguyễn Mai Thương Trang Khai phá liệu kho liệu PGS.TS Đỗ Phúc Bởi biểu ma trận gốc chứa nhiễu, giá trị sai lệch, hệ thống biến thể, tiền xử lý đòi hỏi cần thiết trước thực phân cụm Dữ liệu biểu diễn gen phân cụm theo hai cách Cách thứ nhóm các mẫu gen giống nhau, ví dụ gom dòng ma trận D Cách khác nhóm mẫu khác hồ sơ tương ứng, ví dụ gom cột ma trận D Phân cụm liệu sức khỏe tâm lý Phân cụm liệu áp dụng nhiều lĩnh vực sức khỏe tâm lý, bao gồm việc thúc đẩy trì sức khỏe, cải thiện cho hệ thống chăm sóc sức khỏe, cơng tác phịng chống bệnh tật người khuyết tật (Clatworthy et al., 2005) Trong phát triển hệ thống chăm sóc sức khỏe, phân cụm liệu sử dụng để xác định nhóm người dân mà hưởng lợi từ dịch vụ cụ thể (Hodges Wotring, 2000) Trong thúc đẩy y tế, nhóm phân tích sử dụng để lựa chọn nhắm mục tiêu vào nhóm có khả đem lại lợi ích cho sức khỏe cụ thể từ chiến dịch quảng bá tạo điều kiện thuận lợi cho phát triển quảng cáo Ngoài ra, phân cụm liệu sử dụng để xác định nhóm dân cư bị rủi ro phát triển y tế điều kiện người có nguy nghèo Phân cụm liệu hoạt động nghiên cứu thị trường Trong nghiên cứu thị trường, phân cụm liệu sử dụng để phân đoạn thị trường xác định mục tiêu thị trường (Chrisoppher, 1969; Saunders, 1980, Frank and Green, 1968) Trong phân đoạn thị trường, phân cụm liệu thường dùng để phân chia thị trường thành cụm mang ý nghĩa, chẳng hạn chia đối tượng nam giới từ 21-30 tuổi nam giới 51 tuổi, đối tượng nam giới 51 tuổi thường khơng có khuynh hướng mua sản phẩm Phân cụm liệu hoạt động Phân đoạn ảnh CH1101124 - Nguyễn Mai Thương Trang 10 Khai phá liệu kho liệu PGS.TS Đỗ Phúc e) Phương thức tính trọng tâm cụm public void CalculateClusterCentroids() { //Console.WriteLine("Cluster Centroid calculation:"); for (int j = 0; j < this.Clusters.Count; j++) { ClusterCentroid c = this.Clusters[j]; double l = 0.0; c.PixelCount = 1; c.RSum = 0; c.GSum = 0; c.BSum = 0; c.MembershipSum = 0; for (int i = 0; i < this.Points.Count; i++) { ClusterPoint p = this.Points[i]; l = Math.Pow(U[i, j], this.Fuzzyness); c.RSum += l * p.PixelColor.R; c.GSum += l * p.PixelColor.G; c.BSum += l * p.PixelColor.B; c.MembershipSum += l; if (U[i, j] == p.ClusterIndex) { c.PixelCount += 1; } } } c.PixelColor = Color.FromArgb((byte)(c.RSum / c.MembershipSum), (byte)(c.GSum / c.MembershipSum), (byte)(c.BSum / c.MembershipSum)); //update the original image Bitmap tempImage = new Bitmap(myImageWidth,myImageHeight, PixelFormat.Format32bppRgb); for (int j = 0; j < this.Points.Count; j++) { for (int i = 0; i < this.Clusters.Count; i++) { ClusterPoint p = this.Points[j]; if (U[j, i] == p.ClusterIndex) { tempImage.SetPixel((int)p.X, (int)p.Y, this.Clusters[i].PixelColor); } } } CH1101124 - Nguyễn Mai Thương Trang 33 Khai phá liệu kho liệu PGS.TS Đỗ Phúc processedImage = tempImage; } Giao diện chương trình Chương trình cho phép người dùng chọn thơng số (được đánh số hình bên dưới): - Phân cụm ảnh theo K-means (1) Phân cụm ảnh theo FCM (2) Số cụm cần phân đoạn (3) Số vòng lặp chạy tối đa (4) (trường hợp tập điểm ảnh có số lượng nhỏ phân cụm nhỏ, số vịng lặp xử lý thực tế nhỏ thơng số này) Độ xác (5) Sau số hình ảnh xử lý phân cụm mờ chương trình a) Kết phân cụm ảnh chụp não xử lý theo K-means: - CH1101124 - Nguyễn Mai Thương Trang 34 Khai phá liệu kho liệu PGS.TS Đỗ Phúc b) Kết phân cụm ảnh chụp não xử lý theo FCM CH1101124 - Nguyễn Mai Thương Trang 35 Khai phá liệu kho liệu PGS.TS Đỗ Phúc c) Kết phân cụm ảnh chụp màu xử lý theo K-means d) Kết phân cụm ảnh chụp màu xử lý theo FCM CH1101124 - Nguyễn Mai Thương Trang 36 Khai phá liệu kho liệu CH1101124 - Nguyễn Mai Thương PGS.TS Đỗ Phúc Trang 37 Khai phá liệu kho liệu II PGS.TS Đỗ Phúc Kết thực nghiệm Đánh giá kết phân cụm ảnh máy MR Kết nghiên cứu thực nghiệm dựa khảo sát tác giả Pradipta Maji Sankar K Pal thuộc đơn vị Machine Intelligence Unit, Indian Statistical Random Versus Discriminant Analysis Based Institute, Kolkata, 700 108, India Rough-Fuzzy Clustering Algorithm for Segmentation of Brain MR Trong hình 5.1 bên ảnh gốc chụp máy MR (I-20497774) ảnh phân đoạn sử dụng thuật toán C-Means khác Kích thước ảnh 256×180 with 16 bit gray levels Vì thế, số đối tượng tập liệu ảnh I-20497774 46080 Hình 5.1 Ảnh I-20497774: ảnh gốc ảnh phân cụm theo thuật toán K-means, FCM, RCM, RFCM Bảng so sánh hiệu thuật toán FCM RFCM ảnh I-20497774 theo số đánh sau: CH1101124 - Nguyễn Mai Thương Trang 38 Khai phá liệu kho liệu PGS.TS Đỗ Phúc Theo bảng đánh giá với giá trị cụ thể cụm c, hiệu suất RFCM cho kết tốt FCM Đánh giá kết phân cụm ảnh máy CT Kết nghiên cứu thực nghiệm dựa khảo sát tác giả Sushmita Mitra (Center for Soft Computing Research Indian Statistical Institute, Kolkata, INDIA) Bishal Barman (Electrical Engineering Department S V National Institute of Technology, Surat, INDIA) Rough-Fuzzy Clustering: An Application to Medical Imagery Ảnh chụp CT có điểm khác với MR, bao gồm khu vực: Vùng xám (gray matter), vùng trắng (white matter), infracted region, skull background a) Hình 5.2 ảnh phân tích bệnh nhân bị nhồi máu trước sau phân cụm RFCM Hình 5.2 Ảnh gốc ảnh phân cụm theo thuật toán RFCM Vùng nhồi máu hiển thị có màu xanh hình b) Hình 5.3 bên ảnh chụp não bệnh nhân có nồng độ cholesterol mạch máu não cao CH1101124 - Nguyễn Mai Thương Trang 39 Khai phá liệu kho liệu PGS.TS Đỗ Phúc Hình 5.3 Ảnh gốc ảnh phân cụm theo thuật toán Kmeans, FCM, RCM, and RFCM So sánh kết phân tích hình 5.3 bên dưới: Hình 5.3 So sánh kết phân tích hình ảnh thuật tốn K-means (cịn gọi HCM), RCM, FCM RFCM RFCM cho kết tốt thuật toán III Kết luận • Phương pháp phân cụm mờ công cụ hỗ trợ quan trọng cho chuyên gia y tế việc chẩn đoán định lượng quan não thơng qua hình ảnh CH1101124 - Nguyễn Mai Thương Trang 40 Khai phá liệu kho liệu • PGS.TS Đỗ Phúc Trong hệ thống chẩn đoán y tế, thuật toán Rough Fuzzy C-Means cho kết tốt so với thuật toán Fuzzy C-Means K-means • Các chun gia xử lý hình ảnh kiểm chứng đánh giá RFCM cho kết xử lý ảnh tốt Điều hứa hẹn xây dựng hệ thống tư vấn hình ảnh hữu ích thứ hai (sau tư vấn bác sĩ chuyên gia X-quang) sử dụng máy tính – trợ giúp chẩn đoán gọi Computer – Aided Diagnostic (CAD) CH1101124 - Nguyễn Mai Thương Trang 41 Khai phá liệu kho liệu PGS.TS Đỗ Phúc Tài liệu tham khảo [1] Tập Slide giảng môn học Khai phá liệu kho liệu – PGS.TS Đỗ Phúc [2] Giáo trình khai thác liệu – PGS.TS Đỗ Phúc Nhà xuất Đại học Quốc gia 2006 [2] http://medical.nema.org/ [3] Modified Fuzzy C-means Clustering Algorithm with Spatial Distance to Cluster Center of Gravity - 2010 IEEE International Symposium on Multimedia Christophe Gauge and Sreela Sasi Taichung, Taiwan, December 13-December 15, 2010, ISBN: 978-0-7695-4217-1 [4] Unsupervised Optimal Fuzzy Clustering I.Gath and A B Geva IEEE Transactions on Pattern Analysis and Machine Intelligence, 1989, 11(7), 773781 [5] Rough-Fuzzy Clustering: An Application to Medical Imagery Sushmita Mitra and Bishal Barman Electrical Engineering Department, S V National Institute of Technology, Surat, INDIA 2008 [6] Rough-Fuzzy Clustering Algorithm for Segmentation of Brain MR Images Pradipta Maji and Sankar K Pal Machine Intelligence Unit, Indian Statistical Institute, Kolkata, 700 108, India 2010 [7] http://wikipedia.org/ [8] Rough Set Based Generalized Fuzzy C –Means Algorithm and Quantitative Indices Pradipta Maji and Sankar K Pal,Fellow, IEEE, 2007 CH1101124 - Nguyễn Mai Thương Trang 42 Khai phá liệu kho liệu PGS.TS Đỗ Phúc [9] Bải giảng Chương 5: Gom cụm liệu TS Võ Thị Ngọc Châu Khoa Khoa học Kỹ thuật máy tính, trường ĐH Bách Khoa Tp.HCM [10] http://home.dei.polimi.it/matteucc/Clustering/tutorial_html/cmeans.html [11]http://www.codeproject.com/Articles/91675/Computer-Vision-Applications-withC-Fuzzy-C-means [12]https://sites.google.com/site/dataclusteringalgorithms/fuzzy-c-means-clusteringalgorithm CH1101124 - Nguyễn Mai Thương Trang 43 ... trình b? ?y thuật tốn phân cụm hình ảnh sử dụng rộng rãi hiệu y tế K-means, Fuzzy C-Means (FCM) Rough Fuzzy C-Means (RFCM); so sánh thực nghiệm kết phân tích hình ảnh thuật tốn lược dịch dựa phân. .. thơ Fuzzy factor: tham số mờ hóa Partition: phân hoạch Rough Fuzzy C-Means (RFCM) algorithm: thuật toán Rough Fuzzy C-Means cho việc gom cụm thơ mờ Fuzzy C-Means (FCM) algorithm: thuật tốn Fuzzy. .. Trong việc phân tích hình ảnh y tế cho m? ?y tính hỗ trợ chẩn đốn điều trị, trình phân đoạn thường y? ?u cầu giai đoạn sơ Tuy nhiên, phân vùng hình ảnh y tế thực phức tạp nên việc phân đoạn xác quan

Ngày đăng: 10/04/2015, 00:13

Từ khóa liên quan

Mục lục

  • CHƯƠNG I: TỐNG QUAN VỀ PHÂN CỤM DỮ LIỆU

    • I. Phân cụm dữ liệu

      • 1. Clustering

      • 2. Hard clustering

      • 3. Fuzzy Clustering

      • 4. Các yêu cầu đối với phân cụm

      • 5. Các kỹ thuật phân cụm

      • II. Một số ứng dụng của phân cụm dữ liệu

        • 1. Biểu diễn dữ liệu gene

        • 2. Phân cụm dữ liệu trong sức khỏe tâm lý

        • 3. Phân cụm dữ liệu đối với hoạt động nghiên cứu thị trường

        • 4. Phân cụm dữ liệu đối với hoạt động Phân đoạn ảnh

        • CHƯƠNG II: CÁC THUẬT TOÁN PHÂN CỤM DỮ LIỆU

          • I. Thuật toán K-means

            • 1. Khái niệm

            • 2. Các bước của thuật toán K-means

            • 3. Ưu và nhược điểm của thuật toán:

            • II. Thuật toán Fuzzy C-Means

              • 1. Hàm mục tiêu

              • 2. Các bước của thuật toán Fuzzy C-Means

              • 3. Ưu và nhược điểm của thuật toán

              • III. Thuật toán Rough-Fuzzy C-Means

                • 1. Tập thô (Rough Sets)

                • 2. Hàm mục tiêu

                • 3. Cluster Prototypes

                • 4. Các bước của thuật toán Rough Fuzzy C-Means

                • 5. Hiệu suất

Tài liệu cùng người dùng

Tài liệu liên quan