0
Tải bản đầy đủ (.pdf) (61 trang)

Các thuật toán phân cụm cơ bản

Một phần của tài liệu NGHIÊN CỨU GIẢI PHÁP NÂNG CAO TỐC ĐỘ HIỂN THỊ DỮ LIỆU TRÊN BẢN ĐỒ TRỰC TUYẾN (Trang 34 -36 )

 Thuật toán phân cấp: Thuật toán phân cấp tạo ra một chuỗi lồng nhau các nhóm con, phân rã tập dữ liệu/đối tượng có thứ tự phân cấp theo một tiêu chí nào đó. Mỗi mức phân rã là sự gộp (hay tách) hai cụm từ mức phân rã cao hơn hoặc thấp hơn. Có hai loại phân rã:

- Nhóm gộp có thứ bậc - bottom up: + Bắt đầu với những cụm chỉ là 1 phần tử

+ Ở mỗi bước, gộp 2 cụm gần nhau thành 1cụm.

+ Khoảng cách giữa 2 cụm: 2 điểm gần nhất từ 2 cụm, hoặc khoảng cách trung bình, vv...

- Nhóm phân chia có thứ bậc - top down: + Bắt đầu với 1 cụm bao gồm tất cả dữ liệu + Phân chia 2 cụm con

+ Tiếp tục phân chia trên 2 cụm con

+ Kết quả sinh ra là sơ đồ hình cây, thể hiện các mức phân rã.

Thuật toán phân cấp bottom up bắt đầu với mỗi đối tượng bằng việc coi nó là một cụm riêng biệt sau đó sáp nhập các cụm này theo phép đo khoảng cách. Quá trình

phân cụm dừng lại khi mọi đối tượng được gộp trong một nhóm duy nhất hoặc bất kỳ nhóm nào mà người dùng mong muốn. Thuật toán top down thì theo một quy trình ngược lại.

Hình minh họa dưới đây thể hiện các phương pháp khác nhau của thuật toán phân cấp. Hình 2.1a và 2.1b minh họa việc gộp 2 cụm thành một hoặc tách 1 cụm thành 2 cụm con. Hình 2.1c và 2.1d thể hiện sự khác nhau giữa việc nhóm p1 với p2 và nhóm p3 với p4 với các bước thao tác tương tự nhau.

Hình 2.1a. Thuật toán phân cụm phân cấp 1 ( L.Kaufman & P.J. Rousseeuw, 1990); hình 2.1b. Sơ đồ cây 1 (Periklis Andritsos, 2002)

Hình 2.1c. Thuật toán phân cụm phân cấp 2 ( L.Kaufman & P.J. Rousseeuw, 1990); hình 2.1d. Sơ đồ cây 2 (Periklis Andritsos, 2002)

 Thuật toán phân vùng: Thuật toán phân vùng (hình 2.2) phân chia các đối tượng dữ liệu thành các nhóm nhỏ hay cụm không chồng lấp nhau, tức là mỗi đối tượng dữ liệu nằm trong một cụm riêng. Vì thế thuật toán này trái ngược với thuật toán phân cấp. Phân chia Gộp Đối tượng Phân chia Gộp Đối tượng Phân rã Gộp

Hình 2.2: Thuật toán phân vùng (L.Kaufman & P.J. Rousseeuw, 1990) Hai thuật toán phân vùng và phân cấp có thể tích hợp với nhau. Có nghĩa là kết quả do thuật toán phân cấp tạo ra có thể được phát triển nhờ các bước phân vùng.

Một phần của tài liệu NGHIÊN CỨU GIẢI PHÁP NÂNG CAO TỐC ĐỘ HIỂN THỊ DỮ LIỆU TRÊN BẢN ĐỒ TRỰC TUYẾN (Trang 34 -36 )

×