Định nghĩa 5: Cụm
Giả sử D là một tập hợp cỏc điểm dữ liệu. Một tập con C khỏc rỗng của D được gọi là một cụm theo Eps và MinPts nếu thỏa món hai điều kiện:
1. Với mọi p, q ∈ D, nếu p ∈ C và q cú thể liờn lạc được từ p theo Eps và MinPts thỡ q ∈ C.
2. Với mọi p,q ∈ C, p liờn thụng với q theo Eps và MinPts
Định nghĩa 6: Nhiễu
Giả sử C1, C2, …, Ck là cỏc cụm trong tập dữ liệu D theo tham số Eps và MinPts, điểm dữ liệu nhiễu là điểm dữ liệu khụng phụ thuộc vào cụm nào trong cỏc cụm C1, C2, …,Ck, tức là N = {p| với mọi i=1ữk ∉Ci}
Với hai tham số Eps và MinPts cho trước, cú thể khỏm phỏ cỏc cụm theo hai bước:
o Bước 1: Chọn một điểm bất kỳ từ tập dữ liệu ban đầu thỏa món điều kiện nhõn.
o Bước 2: Lấy tất cả cỏc điểm liờn lạc với điểm nhõn đó chọn để tạo thành cụm.
Bổ đề 1: Giả sử p là một điểm trong D, ||NEps(p) ≥ MinPts, tập O={o | o
∈ D và o cú thể liờn lạc từ p theo Eps và MinPts}|| là một cụm theo Eps và MinPts.
Như vậy, cụm C khụng hoàn toàn là duy nhất. Mỗi điểm trong C liờn lạc từ bất kỳ điểm nhõn nào của C, vỡ vậy C chứa đỳng một số điểm liờn thụng với điểm nhõn tựy ý.
Bổ đề 2: Giả sử C là một cụm theo Eps và MinPts, p là một điểm bất kỳ
trong C với ||NEps(p)|| ≥ MinPts. Khi đú C trựng với tập O={o | o ∈ D và o cú thể liờn lạc từ p theo Eps và MinPts}