Thuật toán đòi hỏi phải có kĩ thuật tiên nghiệm khoảng cách ngưỡng trong phạm vi cụm và giá trị nhỏ nhất của các phần tử trong cụm. Từ mỗi điểm dữ liệu tìm thấy tất cả các điểm dữ liệu đáp ứng được yêu cầu. Điểm dữ liệu đáp ứng được yêu cầu trong phạm vi ngưỡng từ tập hợp các điểm dữ liệu đã cho. Bằng cách này có thể tìm thấy các điểm dữ liệu yêu cầu và chọn ra 1 điểm trong tập hợp các điểm tạo tạo thành cụm. Sau đó các điểm dữ liệu thuộc nhóm này được loại bỏ và các thủ tục tương tự được lặp đi lặp lại với bộ giảm điểm dữ liệu cho đến khi nhóm không còn có thể được hình thành đáp ứng các tiêu chí kích thước tối thiểu.
Thuật toán phân cụm chất lượng ngưỡng
Bước 1: Khởi tạo khoảng cách ngưỡng cho phép cho các cụm và kích thước tối thiểu của cụm.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www. lrc.tnu.edu.vn
Bước 2: Xây dựng các cụm điểm dữ liệu đáp ứng yêu cầu: các điểm gần nhất, các điểm lân cận các điểm gần nhất. Tạo các cụm cho đến khi khoảng cách của các cụm vượt qua ngưỡng thì dừng.
Bước 3: Đáp ứng yêu cầu với điểm ở mức độ cao hình thành lên cụm đầu tiên và loại bỏ tất cả các điểm trong cụm không được xét đến.
Bước 4: Lặp lại với tập hợp các điểm còn lại cho đến khi không còn hình thành thêm các cụm có kích thước tối thiểu.
Ưu điểm của thuật toán:
Mỗi cụm chỉ vượt qua một ngưỡng chất lượng đã được xác định. Số cụm không cần xác định trước. Cụm đạt yêu cầu tiêu chuẩn tạo ra mối liên hệ với mỗi điểm dữ liệu và kiểm tra thứ tự dựa vào chất lượng kích thước tiêu chuẩn.
Nhược điểm của thuật toán:
Tăng kích thước cụm tối thiểu hoặc làm tăng số lượng các điểm dữ liệu có thể làm tăng đáng kể thời gian tính toán. Khoảng cách ngưỡng và số lượng tối thiểu của một phần tử trong cụm có thể được xác định tiên nghiệm.