Phương phỏp phõn cụm phõn hoạch

Một phần của tài liệu (LUẬN văn THẠC sĩ) một số vấn đề về phân cụm dữ liệu luận văn ths công nghệ thông tin 1 01 10 (Trang 31 - 32)

CHƯƠNG 2 CÁC KỸ THUẬT PHÂN CỤM

2.3. NHỮNG KỸ THUẬT TIẾP CẬN TRONG PHÂN CỤM DỮ LIỆU

2.3.1. Phương phỏp phõn cụm phõn hoạch

Kỹ thuật này phõn hoạch một tập hợp dữ liệu cú n phần tử thành k nhúm cho đến khi xỏc định được số cụm được thiết lập. Số cỏc cụm được thiết lập là cỏc đặc trưng được lựa chọn trước, phương phỏp này tốt cho cỏc cụm hỡnh cầu trong khụng gian Euclidean. Ngoài ra, phương phỏp này cũn phụ thuộc vào khoảng cỏch cơ bản giữa cỏc điểm để lựa chọn cỏc điểm dữ liệu nào cú quan hệ là gần nhau, xa nhau so với mỗi điểm khỏc. Phương phỏp này khụng xử lý được cỏc điểm cú hỡnh thự kỳ quặc hay mật độ dày đặc. Do phải tỡm kiếm hết cỏc phõn hoạch cú thể được nờn cỏc thuật toỏn phõn hoạch dữ liệu cú độ phức tạp rất lớn khi xỏc định nghiệm toàn cục. Do vậy, trờn thực tế thường đi tỡm giải phỏp tối ưu cục bộ cho vấn đề này bằng cỏch sử dụng

một hàm tiờu chuẩn để đỏnh giỏ chất lượng của cụm cũng như để hướng dẫn cho quỏ trỡnh tỡm kiếm phõn hoạch dữ liệu.

Với chiến lược này, thụng thường khởi tạo một phõn hoạch ban đầu cho tập dữ liệu theo phộp ngẫu nhiờn hoặc heuristic và liờn tục tinh chỉnh cho đến khi thu được một phõn hoạch mong muốn thoả món cỏc ràng buộc cho trước. Cỏc thuật toỏn phõn cụm phõn hoạch cố gắng cải tiến tiờu chuẩn phõn cụm bằng cỏch tớnh cỏc giỏ trị độ đo tương tự giữa cỏc đối tượng dữ liệu và sắp xếp cỏc giỏ trị này. Sau đú, thuật toỏn lựa chọn một giỏ trị trong dóy sắp xếp sao cho hàm tiờu chuẩn đạt giỏ trị tối thiểu. í tưởng của thuật toỏn phõn hoạch tối ưu cục bộ là sử dụng chiến lược tham ăn (Greedy Method) để tỡm kiếm nghiệm.

Một phần của tài liệu (LUẬN văn THẠC sĩ) một số vấn đề về phân cụm dữ liệu luận văn ths công nghệ thông tin 1 01 10 (Trang 31 - 32)

Tải bản đầy đủ (PDF)

(118 trang)