Các phƣơng pháp phân cụm

Một phần của tài liệu mạng kohonen và ứng dụng trong quản lý trợ cấp xã hội của sinh viên trường cao đẳng sư phạm cao bằng (Trang 27)

Mục đích của phân cụm là làm giảm kích thƣớc dữ liệu bằng cách phân loại hoặc nhóm các thành phần dữ liệu giống nhaụ Tồn tại một số kỹ thuật phân cụm điển hình:

- Phân cụm theo phân cấp đƣợc thực hiện theo hai phƣơng pháp. Phƣơng pháp đầu tiên là hợp nhất các cụm dữ liệu nhỏ hơn thành các cụm lớn hơn theo một vài tiêu chuẩn (từ dƣới lên). Phƣơng pháp thứ hai đó là

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnụedụvn/

làm ngƣợc lại, chia các cụm lớn hơn thành các cụm nhỏ (từ trên xuống). Kết quả của cả hai phƣơng pháp là một cây phân cụm (đƣợc gọi là dendrogram) để chỉ ra các cụm có liên quan.

- Phân cụm bộ phận phân tích dữ liệu vào một tập các cụm rời rạc. Thuật toán phân cụm tối thiểu một hàm chuẩn. Độ chuẩn này thƣờng liên quan đến viêc tối thiểu một vài độ đo giống nhau trong tập ví dụ với mỗi cụm, trong khi đó việc tối đa các cụm là không giống nhaụ Đã tồn tại một vài phƣơng pháp phân cụm bộ phận, mà điển hình nhất là dùng thuật toán K thành phần chính.

- Phân cụm dựa trên mật độ (density-base) là các phƣơng pháp phân cụm dựa vào liên kết và các hàm mật độ.

- Phân cụm dựa trên lưới (grid-base) sử dụng cấu trúc nhân đa mức loang dần các cụm.

- Phân cụm dựa trên mô hình (model-base) đƣợc tiến hành bằng cách dựng lên một mô hình giả định cho mỗi cụm và ý tƣởng là chọn mô hình tốt nhất trong số các mô hình của các cụm.

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnụedụvn/

CHƢƠNG 2

SOM VÀ KĨ THUẬT PHÂN CỤM DỮ LIỆU DỰA VÀO SOM

Một phần của tài liệu mạng kohonen và ứng dụng trong quản lý trợ cấp xã hội của sinh viên trường cao đẳng sư phạm cao bằng (Trang 27)