Phương pháp phân cụm dựa trên lưới

Một phần của tài liệu Phân cụm các đối tượng phức tạp trong một lớp đối tượng (Trang 34 - 35)

Một tiếp cận dựa trên lưới dùng cấu trúc dữ liệu lưới đa phân giải. Trước tiên nó lượng tử hoá không gian vào trong một số hữu hạn các ô mà đã hình thành nên cấu trúc lưới, sau đó thực hiện tất cả các thao tác trong cấu trúc lưới đó.

Một số thuật toán điển hình: STING, CLIQUE, WAVECluster…

™ Thuật toán STING:

STING là kỹ thuật phân cụm đa phân giải dựa trên lưới, trong đó vùng không gian dữ liệu được phân rã thành số hữu hạn các ô chữ nhật, điều này có nghĩa là các ô lưới được hình thành từ các ô lưới con để thực hiện phân cụm. Có nhiều mức của các ô chữ nhật tương ứng với các mức khác nhau của phân giải trong cấu trúc lưới, và các ô này hình thành cấu trúc phân cấp: mỗi ô ở mức cao được phân hoạch thành số các ô nhỏ ở mức thấp hơn tiếp theo trong cấu trúc phân cấp. Các điểm dữ liệu

được nạp từ CSDL, giá trị của các tham số thống kê cho các thuộc tính của đối tượng dữ liệu trong mỗi ô lưới được tính toán từ dữ liệu và lưu trữ thông qua các

Phân cụm các đối tượng phức tạp trong một lớp đối tượng

tham số thống kê ở các ô mức thấp hơn. Các giá trị của các tham số thống kê gồm: số trung bình - mean, số tối đa - max, số tối thiểu - min, số đếm - count, độ lệch chuẩn - s, ...

Các bước chính của thuật toán như sau:

1) Các đối tượng dữ liệu ban đầu được đưa vào 1 ô;

2) Ô này được phân hoạch thành các ô thấp hơn. Trong mỗi ô phân hoạch đó lại được phân hoạch tiếp thành các ô thấp hơn nữa. Cứ phân hoạch như thế cho tới khi thu được các ô theo yêu cầu. Các ô này chính là các cụm cần.

Ưu điểm của thuật toán STING:

- Khám phá ra các cụm có hình thù bất kỳ (biên ngang, dọc theo biên của các ô).

- Có khả năng mở rộng cao, phụ thuộc chặt chẽ vào trọng tâm của mức thấp nhất.

Nhược điểm: Do sử dụng phương pháp đa phân giải nên nó phụ thuộc chặt chẽ vào trọng tâm của các mức thấp.

Một phần của tài liệu Phân cụm các đối tượng phức tạp trong một lớp đối tượng (Trang 34 - 35)

Tải bản đầy đủ (PDF)

(93 trang)