Tổng quan về phân cụm mờ

Một phần của tài liệu Sử dụng mạng noron cho phân cụm dữ liệu và ứng dụng (LV01137) (Trang 28 - 29)

Phân cụm dữ liệu hiện nay đã được áp dụng rất nhiều trong cuộc sống của chúng ta. Chẳng hạn, trong ngành bưu điện thường hay phân loại thư theo mã nước, trong nước lại phân theo mã tỉnh/thành phố, sau đó lại được phân theo quận/huyện tiếp theo là phân theo xã/phường để gửi thư. Đó chính là một ứng dụng của bài toán phân cụm rõ (phân cụm cứng). Vậy phân cụm rõ là gì? Phân cụm rõ là quá trình phân cụm mà trong đó mỗi điểm dữ liệu thuộc chính xác vào một cụm (hay nói cách khác: Một đối tượng khi đã thuộc cụm này thì không thuộc vào cụm khác)

Nhưng trong thực tế không phải lúc nào bài toán phân cụm rõ cũng áp dụng được. Chẳng hạn bài toán: Cho chiều cao của người có 3 nhóm như sau: Cao (từ 1m 6 trở lên), TB (từ 1 m 5 đến 1m59), Thấp (từ 1m49 trở xuống).

Hỏi: Một người cao vừa vừa ( theo ngôn ngữ tự nhiên ) thì khi đó họ thuộc nhóm người nào?

Vì vậy trong trường hợp này chúng ta nên áp dụng lý thuyết về tập Mờ trong phân cụm dữ liệu để giải quyết cho trường hợp này, cách thức này được gọi là Phân cụm Mờ.

Phân cụm Mờ là phương pháp phân cụm dữ liệu mà cho phép mỗi điểm dữ liệu có thể thuộc về hai hay nhiều cụm thông qua bậc thành viên.

Năm 1969, Ruspini đã giới thiệu khái niệm phân hoạch mờ để mô tả cấu trúc của cụm dữ liệu và đề xuất một thuật toán để tính toán tối ưu phân hoạch mờ. Và năm 1973, Dunn đã mở rộng phương pháp phân cụm và phát triển thuật toán phân cụm Mờ.

Ý tưởng của thuật toán là xây dựng một phương pháp phân cụm mờ dựa trên tối thiểu hóa hàm mục tiêu. Năm 1981, Bezdek đã cải tiến và tổng quát hóa hàm mục tiêu mờ bằng cách đưa ra trọng số mũ để xây dựng thuật toán phân cụm mờ và chứng minh độ hội tụ của các thuật toán là cực tiểu cục bộ, tối thiểu hóa hàm mục tiêu.

Một phần của tài liệu Sử dụng mạng noron cho phân cụm dữ liệu và ứng dụng (LV01137) (Trang 28 - 29)

Tải bản đầy đủ (PDF)

(77 trang)