Cỏc thức thực hiện của AGNES & DIANA

Một phần của tài liệu (LUẬN văn THẠC sĩ) một số vấn đề về phân cụm dữ liệu luận văn ths công nghệ thông tin 1 01 10 (Trang 61 - 62)

Agnes là kỹ thuật kiểu tớch tụ, cỏc đối tượng dữ liệu là cỏc cụm riờng lẻ, cỏc cụm được hũa nhập theo một số luật cơ sở, cho đến khi chỉ cú một cụm ở đỉnh của phõn cấp, hoặc gặp điều kiện dừng. Đõy là cỏch tiếp cận theo kiểu bottom - up.

Diana là kỹ thuật đối lập với Agnes. Diana bắt đầu với tất cả cỏc đối tượng dữ liệu chứa trong một cụm lớn. Cụm này được tỏch dần ra dựa trờn một số luật cơ sở. Quỏ trỡnh này dừng khi mỗi đối tượng dữ liệu của cụm lớn được chia tỏch hết. Đõy là kỹ thuật tiếp cận theo kiểu top-down.

Trong cả hai phương phỏp trờn, số cỏc cụm cú thể được dẫn tới cỏc mức khỏc nhau trong phõn cấp bằng cỏch duyệt lờn hoặc duyệt xuống cõy. Mỗi mức cú thể khỏc nhau ở số cỏc cụm và tất nhiờn kết quả cũng khỏc nhau.

Step 0 Step 1 Step 2 Step 3 Step 4

b d c e a a b d e c d e a b c d e

Step 4 Step 3 Step 2 Step 1 Step 0

agglomerative (AGNES)

divisive (DIANA)

Hai phương phỏp này đều cú một hạn chế là cỏc cụm được hũa nhập hoặc phõn chia một lần, nếu như sự phõn chia hay hũa nhập này khụng phự hợp ở bước đú thỡ cũng khụng được làm lại [7][15].

3.3.4. Thuật toỏn CHAMELEON

Phương phỏp Chameleon được đề xuất bởi (G. Karypis, E.H. Han, and V. Kumar, 1999) là một cỏch tiếp cận khỏc trong việc sử dụng mụ hỡnh động để xỏc định cỏc cụm nào được hỡnh thành. Thuật toỏn Chameleon chia thành hai bước, cụ thể như sau:

1. Bước đầu tiờn, Chameleon xõy dựng một đồ thị mật độ thưa và sau đú ứng dụng một thuật toỏn phõn hoạch đồ thị để PCDL với số lớn cỏc cụm con.

2. Bước tiếp theo Chamelon sử dụng thuật toỏn phõn cụm phõn cấp để hũa nhập cỏc cụm con.

Một phần của tài liệu (LUẬN văn THẠC sĩ) một số vấn đề về phân cụm dữ liệu luận văn ths công nghệ thông tin 1 01 10 (Trang 61 - 62)

Tải bản đầy đủ (PDF)

(118 trang)