Trong phân cụm dữ liệu để có những hiểu biết về những trường hợp nên hay không nên gom cụm lại với nhau người ta có thể áp dụng phương pháp phân cụm dựa trên những ràng buộc. Phân cụm ràng buộc dựa trên sự thay đổi của thuật toán K-mean dựa vào tính toán những liên kết bắt buộc giữa hai điểm trong cùng một cụm và hạn chế những liên kết không thể thực hiện được giữa hai điểm trong một cụm. Những yêu cầu đó là bắt buộc trong khi phân cụm dữ liệu. Khi các ràng buộc không được đáp ứng các liên kết ràng buộc được gán bằng 0. Phân cụm ràng buộc dựa trên các
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www. lrc.tnu.edu.vn
liên kết liên quan nhưng sự khác biệt đến từ phân cụm bán giám sát khi có một số nhãn được biết trước.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www. lrc.tnu.edu.vn
Chương 2: PHÂN CỤM DỮ LIỆU SỬ DỤNG MẠNG SOM
Chương này giới thiệu một số thuật toán phân cụm dữ liệu. Nêu các bước thực hiện thuật toán trong phân cụm. Đưa ra được một số ưu nhược điểm của từng thuật toán trong phân cụm dữ liệu.
Phần chính của chương giới thiệu về mạng SOM trình bày cấu trúc của SOM, huấn luyện mạng SOM và một số hàm liên quan. Phần cuối của chương giới thiệu về sử dụng SOM trong phân cụm dữ liệu. Trong phần này trình bày các phương pháp sử dụng SOM trong bản đồ 1 chiều và 2 chiều và các phương pháp trực quan mạng.