Mật độ liờn thụng

Một phần của tài liệu (LUẬN văn THẠC sĩ) một số vấn đề về phân cụm dữ liệu luận văn ths công nghệ thông tin 1 01 10 (Trang 66 - 67)

Định nghĩa 5: Cụm

Giả sử D là một tập hợp cỏc điểm dữ liệu. Một tập con C khỏc rỗng của D được gọi là một cụm theo Eps và MinPts nếu thỏa món hai điều kiện:

1. Với mọi p, q ∈ D, nếu p ∈ C và q cú thể liờn lạc được từ p theo Eps và MinPts thỡ q ∈ C.

2. Với mọi p,q ∈ C, p liờn thụng với q theo Eps và MinPts

Định nghĩa 6: Nhiễu

Giả sử C1, C2, …, Ck là cỏc cụm trong tập dữ liệu D theo tham số Eps và MinPts, điểm dữ liệu nhiễu là điểm dữ liệu khụng phụ thuộc vào cụm nào trong cỏc cụm C1, C2, …,Ck, tức là N = {p| với mọi i=1ữk ∉Ci}

Với hai tham số Eps và MinPts cho trước, cú thể khỏm phỏ cỏc cụm theo hai bước:

o Bước 1: Chọn một điểm bất kỳ từ tập dữ liệu ban đầu thỏa món điều kiện nhõn.

o Bước 2: Lấy tất cả cỏc điểm liờn lạc với điểm nhõn đó chọn để tạo thành cụm.

Bổ đề 1: Giả sử p là một điểm trong D, ||NEps(p) ≥ MinPts, tập O={o | o

∈ D và o cú thể liờn lạc từ p theo Eps và MinPts}|| là một cụm theo Eps và MinPts.

Như vậy, cụm C khụng hoàn toàn là duy nhất. Mỗi điểm trong C liờn lạc từ bất kỳ điểm nhõn nào của C, vỡ vậy C chứa đỳng một số điểm liờn thụng với điểm nhõn tựy ý.

Bổ đề 2: Giả sử C là một cụm theo Eps và MinPts, p là một điểm bất kỳ

trong C với ||NEps(p)|| ≥ MinPts. Khi đú C trựng với tập O={o | o ∈ D và o cú thể liờn lạc từ p theo Eps và MinPts}

Một phần của tài liệu (LUẬN văn THẠC sĩ) một số vấn đề về phân cụm dữ liệu luận văn ths công nghệ thông tin 1 01 10 (Trang 66 - 67)

Tải bản đầy đủ (PDF)

(118 trang)