Hiện nay, các phương pháp phân cụm trên đã và đang được phát triển và áp dụng nhiều trong các lĩnh vực khác nhau và đã có một số nhánh nghiên cứu được phát triển trên cơ sở của các phương pháp đó như:
Phân cụm thống kê: Dựa trên các khái niệm phân tích hệ thống, nhánh nghiên cứu này sử dụng các độ đo tương tự để phân hoạch các đối tượng, nhưng chúng chỉ áp dụng cho các dữ liệu có thuộc tính số.
Phân cụm khái niệm: Kỹ thuật này được phát triển áp dụng cho dữ liệu hạng mục, chúng phân cụm các đối tượng theo các khái niệm mà chúng xử lí.
Phân cụm mờ: Sử đụng kỹ thuật mờ để PCDL. Các thuật toán thuộc loại này chỉ ra lược đồ phân cụm thích hợp với tất cả các hoạt động đời sống hàng ngày, chúng chỉ xử lí các dữ liệu thực không chắc chắn.
Phân cụm mạng Kohonen: Loại phân cụm này dựa trên khái niệm của các mạng nơron. Mạng Kohonen có tầng nơron vào và các tầng nơron ra. Mỗi nơron của tầng vào tương ứng với mỗi thuộc tính của bản ghi, mỗi một nơron vào kết nối với tất cả các nơron của tầng ra. Mỗi liên kết được gắn liền với một trọng số nhằm xác định vị trí của nơron ra tương ứng. Các thuật toán
thuộc kỹ thuật phân cụm dữ liệu ràng buộc này gồm có: Thuật toán COD- CLARANS, thuật toán DBCluC.
2.4.1. Thuật toán phân cụm dữ liệu không gian
Trong các thuật toán được trình bày ở các phần trên đều chỉ tập trung vào tính hiệu quả của phân cụm dữ liệu. Tuy nhiên, không thuật toán nào xem xét các ràng buộc có thể có trong quá trình phân cụm dữ liệu.
Trong dữ liệu không gian thì phân cụm ràng buộc có nhiều ứng dụng, đặc biệt trong các hệ thống thông tin địa lý vì dữ liệu của hệ thống này như ảnh,… có các ràng buộc vật lý (có các đối tượng cản trở như dòng sông, đường cao tốc, dãy núi,.... và có các đối tượng cắt ngang như cây cầu) và các ràng buộc này có thể làm thay đổi quá trình phân cụm trong hệ thống thông tin địa lý. Hơn nữa, các các ràng buộc cản trở (dòng sông, đường cao tốc,…) có chức năng biểu diễn cho việc “không kết nối” để không kết nối các đối tượng dữ liệu gần nhau, trong khi các ràng buộc cắt ngang (cây cầu) có chức năng biểu diễn cho việc “Kết nối” để kết nối các đối tượng dữ liệu với nhau. Do vậy, chúng ta cần có các thuật toán xem xét các đối tượng cản trở và các đối tượng cắt ngang (cây cầu) để tăng tính hiệu quả và độ chính xác của cụm. Hình 2.6 trình bày phân cụm các đối tượng dữ liệu liên các xét đến các ràng buộc vật lý. Loại bỏ các ràng buộc dẫn đến không chính xác trong việc giải thích của sự tương quan giữa các đối tượng dữ liệu. Hình 2.6(b) trình bày ba cụm. Hình 2.6(c) phân cụm chính xác, tạo ra bốn cụm, ba cụm có các ràng buộc cao tốc và sông, và một cụm được nhóm bởi ràng buộc cây cầu).