CHƢƠNG 2 CÁC KỸ THUẬT PHÂN CỤM
2.3 PHƢƠNG PHÁP PHÂN CỤM DỮ LIỆU
2.3.6 PHƢƠNG PHÁP PHÂN CỤM Cể DỮ LIỆU RÀNG BUỘC
Sự phỏt triển của phõn cụm dữ liệu khụng gian trờn cơ sở dữ liệu lớn đó cung cấp nhiều cụng cụ tiện lợi cho việc phõn tớch thụng tin địa lý, tuy nhiờn hầu hết cỏc thuật toỏn này cung cấp rất ớt cỏch thức cho ngƣời dựng để xỏc định cỏc ràng buộc trong thế giới thực cần phải thoả món trong quỏ trỡnh phõn cụm. Để phõn cụm dữ liệu khụng gian hiệu quả hơn, cỏc nghiờn cứu bổ sung cần đƣợc thực hiện để cung cấp cho ngƣời dựng khả năng kết hợp cỏc ràng buộc trong thuật toỏn phõn cụm.
Hiện nay, cỏc phƣơng phỏp phõn cụm trờn đó và đang đƣợc phỏt triển, ỏp dụng nhiều trong cỏc lĩnh vực khỏc nhau và đó cú một số nhỏnh nghiờn cứu đƣợc phỏt triển trờn cơ sở cỏc phƣơng phỏp đú nhƣ:
Phõn cụm thống kờ: Dựa trờn cỏc khỏi niệm phõn tớch hệ thống, nhỏnh nghiờn cứu này sử dụng cỏc độ đo tƣơng tự để phõn hoạch cỏc đối tƣợng nhƣng chỳng chỉ ỏp dụng cho cỏc dữ liệu cú thuộc tớnh số.
Phõn cụm khỏi niệm: Cỏc kỹ thuật phõn cụm đƣợc phỏt triển ỏp dụng cho dữ liệu hạng mục, chỳng phõn cụm cỏc đối tƣợng theo cỏc khỏi niệm mà chỳng xử lý.
Phõn cụm mờ: Sử dụng kỹ thuật mờ để phõn cụm dữ liệu, trong đú một đối tƣợng dữ liệu cú thể thuộc vào nhiều cụm dữ liệu khỏc nhau. Cỏc thuật toỏn thuộc loại này chỉ ra lƣợc đồ phõn cụm thớch hợp với tất cả cỏc hoạt động đời sống hàng ngày, chỳng xử lý cỏc dữ liệu khụng chắc chắn. Thuật toỏn mờ quan trọng nhất là FCM (Fuzzy c-means).
Phõn cụm Kohonen: Loại phõn cụm này dựa trờn khỏi niệm của cỏc mạng nơron. Mạng Kohonen cú cỏc tầng nơron vào và cỏc tầng nơron ra. Mỗi nơron của tầng vào tƣơng ứng với mỗi thuộc tớnh của bản ghi, mỗi một nơron
vào kết nối với tất cả cỏc nơron của tầng ra. Mỗi liờn kết đƣợc gắn liền với một trọng số nhằm xỏc định vị trớ của nơron tầng ra tƣơng ứng [7][13].
Túm lại, cỏc kỹ thuật phõn cụm dữ liệu trỡnh bày ở trờn đó đƣợc sử dụng rộng rói trong thực tế, thế nhƣng hầu hết chỳng chỉ ỏp dụng cho tập dữ liệu với cựng một kiểu thuộc tớnh. Vỡ vậy, việc phõn cụm dữ liệu cú kiểu hỗn hợp là một vấn đề đặt ra trong khai phỏ dữ liệu.