Bài toán phân cụm theo tâm

Một phần của tài liệu Một số thuật toán phân cụm trong khai phá dữ liệu (Trang 94)

Bài toán đặt ra như sau: Cho một tập hợp m điểm {a1, a2, …, am

}  Rn, và số tự nhiên k, hãy xác định k điểm trong Rn (gọi là “tâm”) x1, x2, …, xk

sao cho tổng

“khoảng cách” từ mỗi ai

đến tâm gần nó nhất đạt cực tiểu.

Nếu ký hiệu khoảng cách từ a đến x d(a, x) thì bài toán có thể phát biểu:

1,..., 1 min min ( , ) ; 1,..., m i n k i d a x x R k               (P)

Khi đã chọn các tâm x1 , x2, …, xk thì tập {a1, a2, …, am} được chia thành k cụm

C1,…,Ck trong đó

i : ( , ) i ( , i h) 

j

Ca d a x  d a xh

 .

Nếu ta coi mỗi ai là trung tâm một khu dân cư còn mỗi xℓ là địa điểm xây dựng một cơ sở dịch vụ (bệnh viện, trường học, …) thì đây cũng là bài toán lựa chọn địa điểm xây dựng các cơ sở dịch vụ sao cho tổng độ dài các đường đi từ mỗi khu dân cư đến cơ sở dịch vụ gần nhất là ngắn nhất có thể được. Đó là những bài toán khó nhất của lý thuyết lựa chọn vị trí, mang tên bài toán Weber, mặc dù đã được biết đến từ lâu nhưng trong nhiều năm trước đây được phát biểu dưới dạng quy hoạch nguyên hỗn hợp nên không có cách giải hữu hiệu. Mãi gần đây mới có những phương pháp giải tổng quát dựa trên lý thuyết tối ưu d.c được trình bày dưới đây (xem [9]).

Cách giải quyết bài toán này phụ thuộc vào việc chọn chuẩn khoảng cách cho d(a, x). Sau đây sẽ trình bày một số trường hợp như vậy.

Một phần của tài liệu Một số thuật toán phân cụm trong khai phá dữ liệu (Trang 94)

Tải bản đầy đủ (PDF)

(131 trang)