DENSITY TRUYỀN THỐNG: CÁCH TIẾP CẬN DỰA TRÊN TRUNG TÂM

Một phần của tài liệu Tiểu luận môn tính toán lưới TÌM HIỂU CLUSTERING (Trang 36)

TRUNG TÂM

Các định nghĩa về độ trù mật giống nhau, có những phương pháp khác biệt. Trong bài này chúng ta dùng cách tiếp cận cơ sở cho những DBSCAN cơ bản. Nhưng định nghĩa khác sẽ được mô tả trong chương 9.

Theo cách tiếp cận cơ sở, độ trù mật được ước lượng cho một điểm đặc biệt trong tập dữ liệu bằng cách đếm số điểm trong một bán kính đặc trưng, Eps, của điểm này, và chính điểm đó. Kỹ thuật này được minh họa trong hình 8.20. Số điểm này nằm trong bán kính Eps của điểm A là 7, gồm cả điểm A

Phương pháp này thì đơn giản để thực hiện, nhưng độ trù mật của mỗi điểm sẽ phụ thuộc vào bán kính đặc trưng. Cụ thể, nếu bán kính đủ rộng, khi đó tất cả những điểm đó có một độ trù mật làm, là số điểm trong tập dữ liệu. Nếu bán kính quá nhỏ, khi đó tất cả các điểm có đọ trù mật là 1. Một cách tiếp cận để xác định bán kính xấp xỉ cho dữ liệu có số chiều thấp được cho trong trang sau, trang context của sự thảo luận về DBSCAN.

Phân loại các điểm theo mật độ Center-Based

Core point (Điểm nhân)

Những điểm này nằm trong một nhóm Density-Based.

Một điểm là Core point nếu số điểm trong một lân cận cho trước xung quanh điểm này (được xác dịnh bằng hàm khoảng cách và tham số khoảng cách, Eps) vượt quá một ngưỡng đặc biệt, gọi là MinPts (MinPts cũng là một tham số do người dùng xác định – user-specified paramater). Trong hình 8.21, điểm A là một Core point, với bán kính Eps, nếu MinPts ≤ 7.

Border point (Điểm biên)

Điểm Border point là điểm mà không phải là Core point nhưng lại rơi vào bên trong một lân cận của một Core point. Trong hình 8.21, điểm B là một Border point. Một Border point có thể ở bên trong các lân cận của vài Core point.

Một Noise point là một điểm mà không phải là Core point cũng không phải là một Border point. Trong hình 8.21, điểm C là một Noise point.

Một phần của tài liệu Tiểu luận môn tính toán lưới TÌM HIỂU CLUSTERING (Trang 36)

w