Thuật toán Phân cấp

Một phần của tài liệu GIỚI THIỆU MỘT SỐ THUẬT TOÁN GOM CỤM MỜ. ỨNG DỤNG THUẬT TOÁN GOM CỤM MỜ (FUZZY CLUSTERING), MÔ HÌNH XICH MARKOV ĐỂ PHÂN LOẠI, DỰ BÁO, GIẢI QUYẾT CÁC TÌNH TRẠNG KẸT XE (Trang 30)

2. CÁC KHÁI NIỆM, LÝ THUYẾT CƠ SỞ LIÊN QUAN, PHƯƠNG PHÁP

2.1.2.4 Thuật toán Phân cấp

• Tạo phân cấp cụm, chứ không phải phân hoạch các đối

tượng.

• Đầu vào không cần số cụm k.

• Dùng ma trận khoảng cách làm tiêu chuẩn gom cụm.

• Số cụm sẽ do khoảng cách giữa các cụm hoặc điều kiện

dừng quyết định.

• Phân cấp cụm thường được biểu diễn dưới dạng đồ thị

dạng cây các cụm, và được gọi là dendrogram.

• Các lá của cây biểu diễn từng đối tượng riêng lẻ.

• Các nút trong biểu diễn các cụm.

• Các phương pháp tiếp cận để gom cụm phân cấp:

o Phương pháp gộp:

1. Xuất phát mỗi đối tượng và tạo cụm chứa nó. 2. Nếu hai cụm đủ gần nhau (dưới một ngưỡng

nào đó) sẽ được gộp lại thành một cụm duy nhất.

3. Lặp lại bước 2 cho đến khi chỉ còn một cụm duy nhất là toàn bộ không gian.

o Phương pháp tách:

1. Xuất phát từ một cụm duy nhất là toàn bộ không gian.

2. Chọn cụm có độ phân biệt cao nhất (ma trận phân biệt có phần tử lớn nhất) để tách đôi. Trong bước 2 này sẽ áp dụng các phương pháp phân hoạch đối với cụm đã chọn.

3. Lặp lại bước 2 cho đến khi mỗi đối tượng thuộc một cụm hoặc đủ điều kiện dừng (có nghĩa là đủ số cụm cần thiết hoặc khoảng cách giữa các cụm đạt ngưỡng đủ nhỏ).

• Các khoảng cách giữa các cụm thường dùng:

- Khoảng cách nhỏ nhất. - Khoảng cách lớn nhất. - Khoảng cách trung bình. - Khoảng cách trọng tâm.

• Ưu, nhược điểm của thuật toán phân cấp:

Ưu điểm:

- Đây là thuật toán có khái niệm đơn giản, dễ hiểu. - Có lý thuyết tốt.

- Khi cụm đuợc trộn, quyết định là vĩnh cữu. Số các phương án khác cần xem xét bị rút giảm. Khuyết điểm:

- Khi trộn các cụm là vĩnh cữu. Nếu quyết định sai thì không thể khắc phục.

- Các phương pháp phân chia phải cần thời gian cho việc tính toán.

- Các phương pháp khác không thể scalable cho tập dữ liệu lớn.

Hai loại kỹ thuật gom cụm phân lớp

Gộp-agglomerative(từ dưới lên)

Phân chia -divisive(từ trên xuống)

Một phần của tài liệu GIỚI THIỆU MỘT SỐ THUẬT TOÁN GOM CỤM MỜ. ỨNG DỤNG THUẬT TOÁN GOM CỤM MỜ (FUZZY CLUSTERING), MÔ HÌNH XICH MARKOV ĐỂ PHÂN LOẠI, DỰ BÁO, GIẢI QUYẾT CÁC TÌNH TRẠNG KẸT XE (Trang 30)

Tải bản đầy đủ (DOC)

(54 trang)
w