Thuật toỏn Chameleon

Một phần của tài liệu phương pháp phân cụm và ứng dụng (Trang 35 - 36)

7 ij ijijZx Rank

1.6 Thuật toỏn Chameleon

Phương phỏp Chameleon một cỏch tiếp cận khỏc trong việc sử dụng mụ hỡnh động để xỏc định cỏc cụm nào được hỡnh thành. Bước đầu tiờn của Chameleon là xõy dựng một đồ thị mật độ thưa và sau đú ứng dụng một thuật toỏn phõn hoạch đồ thị để PCDL với số lớn của cỏc cụm con. Tiếp theo, Chameleon thực hiện tớch tụ phõn cụm phõn cấp, như AGNES, bằng hũa nhập cỏc cụm con nhỏ theo hai phộp đo, mối quan hệ liờn thụng và mối quan hệ gần nhau của cỏc nhúm con. Do đú, thuật toỏn khụng phụ thuộc vào người sử dụng cỏc tham số như K-means và cú thể thớch nghi.

Thuật toỏn này khảo sỏt mụ hỡnh động trong phõn cụm phõn cấp. Trong đú, hai cụm được hũa nhập nờu giữa hai cụm cú liờn quan mật thiết tới quan hệ kết và gần nhau của cỏc đối tượng trong cỏc cụm. Quỏ trỡnh hũa nhập dễ dàng khỏm phỏ cỏc cụm tự nhiờn và đồng nhất, ứng dụng cho tất cả cỏc kiểu dữ liệu miễn là hàm tương tự được xỏc định.

Nú khắc phục được nhược điểm cỏc phương phỏp CURE và ROCK. Lý do là CURE và lược đồ liờn quan lờ đi thụng tin về liờn kết của cỏc đối tượng trong hai cụm khỏc nhau, trong khi ROCK lược đồ liờn quan lờ đi thụng tin về gần nhau của hai cụm mà lại chỳ trọng quỏ về liờn kết.

CURE sử dụng thuật toỏn phõn hoạch đồ thị để phõn cụm cỏc đối tượng dữ liệu vào trong một số lớn một cỏch tương đối nhỏ của cỏc cụm con. Chameleon sử dụng thuật toỏn phõn cụm phõn cấp để tỡm cỏc cụm xỏc thực bằng cỏch lặp nhiều lần kết hợp hoặc hũa nhập cỏc cụm con. Để xỏc định cỏc cặp của nhiều cụm con tương tự, phải tớnh toỏn cả hai liờn kết và gần nhau của cỏc cụm, đặc biệt cỏc đặc trưng bờn trong của cỏc cụm đang được hũa nhập.

Như vậy, nú khụng phụ thuộc vào mụ hỡnh tĩnh và cú thể từ động thớch nghi với đặc trưng bờn trong của cỏc cụm đang được hũa nhập. Nú cú khả năng hơn để khỏm phỏ cỏc cụm cú hỡnh thự bất kỳ cú chất lượng cao hơn CURE và DBSCAN nhưng chi phớ xử lý dữ liệu đa chiều phụ thuộc vào O(n2

) thời gian cho n cỏc đối tượng trong trường hợp xấu nhất.

Một phần của tài liệu phương pháp phân cụm và ứng dụng (Trang 35 - 36)

Tải bản đầy đủ (PDF)

(100 trang)